近日,我校计算机与人工智能学院青年教师王晨博士在场景图像识别方面取得了重要的研究进展。相关成果以“Joint global metric learning and local manifold preservation for scene recognition”为题发表在计算机科学领域一区top期刊《Information Sciences》上。该论文的第一单位为武汉纺织大学,第一作者为武汉纺织大学计算机与人工智能学院王晨博士。
场景图像识别旨在根据图像的语义内容标记场景类别,其对图像理解和计算机视觉任务具有重要的研究意义。场景图像识别研究可以为高级任务提供有用的语义信息,例如基于内容的图像检索、智能机器人识别、安防监控应用等方向。
不同于一般目标图像,场景图像具有以下特性:类内高差异性,类间高相似性,光照不均匀,尺度多变性以及复杂的场景语义信息,这些给场景图像识别带来了巨大的挑战。为了应对这些挑战,基于预训练深度特征,首先,利用每个具体类的聚类中心设计一种新的全局度量学习方法,使得类内距离尽可能小而类间距离尽可能大,充分捕获全局判别信息。其次,为了利用局部流形结构,在新的度量空间中引入了自适应最近邻约束,以保持局部近邻结构。最后,联合全局度量学习和局部流形保持形成统一的学习框架(如下图),在场景图像数据集上的大量实验证明了所提出的算法提升了深度特征潜在的判别性和表达性,进而有效改善复杂场景图像识别性能。
论文链接:https://doi.org/10.1016/j.ins.2022.07.188
近年来,在学校的大力支持下,计算机与人工智能学院在人才规模、科研成果等方面均取得了突破性进展。学院一方面加大高水平人才引进力度,同时,更注重引进人才的后续培养,通过引导青年教师进团队、加强学术带头人、骨干教师对青年教师的传帮带作用、提供良好的科研条件、开展多样化的院内交流等手段,促进青年教师明确发展方向并快速成长。王晨博士为计算机与人工智能学院2022年度引进的优秀青年博士之一,7月份入职报到后,快速融入学院“跨模态智能计算与数字孪生”团队。