大学网 > 院校信息

Xi电子科技大学学生在CVPR 2022图像压缩挑战赛图像质量感知赛道中获得第三名

2022-07-05

最近,一年一度的计算机视觉学术盛宴CVPR(IEEE计算机视觉和模式识别会议)刚刚结束。在本次CVPR大会上,为了促进机器学习和计算机视觉技术在图像和视频压缩领域的发展,由谷歌、苹果、网飞等公司联合举办的第五届CVPR-clic2022(第五届学习图像压缩研讨会和挑战)大赛吸引了包括阿里巴巴在内的众多来自世界各地的团队,拜登尚堂等业内领先科技公司和清华大学北京大学、中国科技大学等顶尖大学。

经过两个多月的激烈竞争,来自Xi电子科技大学通信工程学院的何老师带领团队“杀王者”(组员:王勇、徐莉、张文莉)与北京桂科技有限公司合作,在感知质量赛道上获得世界第三名,该大学排名第二。何先生是通信工程学院图像传输与处理研究所(IIP)的关键成员。IIP隶属于isn国家重点实验室,负责人为李教授。

如今,图像和视频已经成为人们获取信息的最重要方式。然而,图像和视频在采集、压缩、存储到传输过程中可能会失真,导致接收到的视觉信息丢失。因此,评价图像和视频的质量起着重要的作用,被广泛应用于图像恢复、图像检索、图像质量监控系统等方面。同时,建立一个更准确、高效的客观质量评价模型,取代较为耗时、费力的主观质量评价已成为研究和发展的趋势。在今年举行的cvpr-clic2022图像压缩比赛中,图像质量感知跟踪旨在使参赛者能够设计更准确、高效的参考质量评估模型(fr iqa),以客观地评估压缩图像的质量。然而,由于许多图像压缩损伤的算法都是未知的,并且大多数不同的畸变图像与参考图像非常相似,差异不明显,甚至包含许多难以用人眼主观评价的畸变图像。因此,很难建立一个参考质量评估模型。

为了应对这项具有挑战性的任务,何先生带领kingslayer团队设计了一个用于图像质量评估的聚焦特征微分网络(ffdn)。在畸变地图与参考地图相似且差异不明显的情况下,该模型使用通道注意力关注畸变地图和参考地图的差异特征地图。同时,多尺度特征融合用于融合不同感受野下的特征,以最大限度地利用聚焦后的差异特征。此外,针对单个评价指标在质量评价中的局限性,采用多评价指标融合的方法来提高评价效果。最后,在竞赛测试集的准确率为79.6%,获得了第三名的优异成绩。前三名之间的差距很小,准确率高于79%,显著超过第四名。其他评价指标ELO SRCC和ELO PLCC得分分别为0.95和0.96,均排名第三。ELO SRCC和ELO PLCC指标用于反映模型评分和人类主观评分之间的相似性。从指标结果来看,ffdn质量评价模型非常接近人眼的主观评价水平。(记者:何,Xi电子科技大学)

相关标签: 图像 评价 质量 模型 差异化