网易伏羲获CVPR 2023 UG2+、VizWiz大赛第一名,相关论文入选TIP

发布:2023-08-30 09:56:32
阅读:22556
作者:网易伏羲
分享:复制链接

近日,CVPR 2023赛果揭晓。网易伏羲实验室在CVPR 2023 UG2+Object Detection in Haze Challenge(雾霾目标识别挑战赛)、CVPR 2023 VizWiz Few-Shot Object Recognition Challenge(少样本目标识别挑战赛)两项赛事中斩获第一,相关论文入选国际顶级期刊TIP。网易伏羲在计算机视觉领域展现出的顶尖技术创新能力,得到国际范围内的高度认可。

网易伏羲实验室在CVPR 2023 UG2+Object Detection in Haze Challenge获得第一

网易伏羲在CVPR 2023 VizWiz Few-Shot Object Recognition Challenge获得第一

2023年2月至6月,计算机视觉顶会IEEE/CVF Computer Vision and Pattern Recognition Conference(国际计算机视觉与模式识别会议,简称:CVPR)联合全球权威学术机构和众多知名企业,共同举办了多项挑战赛。吸引了来自AI相关研究团队的广泛参与,并于近日陆续公布了获奖结果并颁发了获奖证书。CVPR是由IEEE主办的世界顶级AI学术会议,具有极高的学术影响力和社会认可度。

计算机视觉顶会IEEE/CVF Computer Vision and Pattern Recognition Conference

本次比赛中,网易伏羲同中国科学技术大学於俊老师团队合作,在CVPR 2023 UG2+Object Detection in Haze Challenge(雾霾目标识别挑战赛),CVPR 2023 VizWiz Few-Shot Object Recognition Challenge(少样本目标识别挑战赛)两项赛事中获得第一名。主要涉及计算机视觉中目标检测领域和少样本目标识别领域,可以应用于各个领域的视觉任务,其中少样本目标检测在工业应用中,尤其是在数据获取和标注困难的场景下具有重要的价值和意义。

UG2+旨在通过应用图像恢复和增强算法来提高分析性能,从而推进“困难”图像的分析。参与者的任务是开发新的算法,以改进在问题条件下捕获的图像的分析。VizWiz旨在让更多的人了解视力障碍患者的技术需求和兴趣,同时鼓励人工智能(AI)研究人员开发有助于消除无障碍障碍的新算法。比赛通常包括识别图像中的物体、识别图像中的文本以及回答有关图像的问题等任务。以下是网易伏羲本次获奖论文概述:

用于无监督异常检测的全频通道选择表示方法
Omni-frequency Channel-selection Representations for Unsupervised Anomaly Detection
关键词:无监督图像异常检测

异常检测是视觉图像理解中的一项重要任务,用于区分给定图像是否偏离预定义常态,在新颖性检测、基于工业图像的产品质量监控、缺陷自动修复、人体健康监测、视频监控等领域广泛应用。目前主要有三类主流的无监督异常检测方法:基于密度的方法、基于分类的方法、基于重建的方法。

其中,基于重构的方法由于重构能力差、性能不高而很少被提及,但其不需要额外花费大量的训练样本进行无监督训练,在工业应用中更加实用。为此,本研究着重改进基于重构的方法,提出了一种全新的全频通道选择重建网络(OCR-GAN),首创从频率的角度处理感官异常检测任务。大量的实验证明了该方法相对于其他方法的有效性和优越性。例如,在没有额外训练数据的情况下,在MVTec AD数据集上实现了新SOTA表现,AUC达到98.3,显著超过了基于重建的方法基线38.1和当前SOTA方法0.3。

全频通道选择重建网络(OCR-GAN)

论文涉及的技术突破可被有效应用于智能游戏兼容性测试。游戏兼容性测试旨在检测游戏代码在不同终端上执行的结果与预期是否一致,以确定游戏软件在不同硬件和软件环境下的兼容性。在所有兼容性测试问题中,UI异常占比约40%,如花屏、局部高光、黑边、材质丢失、异性屏遮挡等。不同于其他兼容性测试问题,UI异常一般不会体现在终端运行的日志中。也就是说,即使出现了UI异常问题,软件并不会报错,而是需要有一定测试经验的专业人员人工判断,费时费力。

游戏兼容性测试

论文对智能游戏兼容性测试的UI异常问题提出了创新型解决方案,借助AI技术来自动化检测游戏运行时出现的UI异常问题,实现自动化的游戏兼容测试。通过图像异常检测技术,从计算机视觉的角度,对游戏兼容性测试过程中生成的大量游戏界面截图进行自动化检测,得到UI异常图片,并辅助游戏开发人员快速、准确定位问题原因,从而有效地节省游戏测试专家的人力成本。

论文对智能游戏兼容性测试的UI异常问题提出了创新型解决方案

本篇论文与浙江大学刘勇老师团队合作,入选IEEE Transactions on Image Processing(TIP)。TIP系IEEE旗下图像处理研究领域的顶级期刊,中科院SCI一区期刊,中国计算机学会推荐的计算机图形学与多媒体领域A类期刊(CCF A),2022-2023年影响因子11.041。

扫码进群
微信群
免费体验AI服务