爱莫科技与西电、重邮的联合论文在国际顶会 NeurIPS 上发表

2022-12-15


爱莫科技与西安电子科技大学,重庆邮电大学联合发表的论文 “Class-Dependent Label-Noise Learning with Cycle-Consistency Regularization” 被国际顶级期会 NeurIPS 录用。


NeurIPS 是人工智能领域顶级会议,是人工智能行业难度最大、理论水平最高的会议之一,CCF A类会议,Core Conference Ranking 推荐A*类会议,H5 index 高达198,2022 年谷歌学术总排名第 10。




该论文提出的理论框架,对深度学习对抗噪声干扰、提升模型鲁棒性具有至关重要的意义。


研究问题与背景


在实际应用场景中,场景模型的训练都离不开真实可靠的标签信息。由于人工标注误差(专业性不足等问题)、数据原始噪声,带噪声的数据不可避免,清洗数据的工作也是更加困难。而深度学习的算法严重依赖于大规模带注释的训练数据,因此噪声标签给深度训练模型带来了极大的负面影响。


为解决这一问题,爱莫科技与西安电子科技大学,重庆邮电大学联合展开《基于循环一致性正则化的类相关标签噪声学习》课题研究。


创新的研究成果


提出并证明了基于循环一致性正则化估计转移矩阵T的方法



在最小化转移矩阵的体积时,可以利用估计的噪声类后验来计算体积。由于标签噪声的随机性,噪声类后验的估计误差通常较大。这将导致在噪声训练样本有限的情况下,对转移矩阵的估计效果很差。通过我们提出的一种循环一致性正则化方法,可以极大减小转移矩阵T体积对估计噪声类后验的依赖性。


该论文证明了这种循环一致性正则化可以帮助最小化转移矩阵T的体积,而不直接利用估计的噪声类后验,这有利于估计的转移矩阵T收敛到最优解。在充分分散的假设下,最优转移矩阵T是包围训练样例的后验噪声类的体积最小的矩阵,我们提出的方法也在理论上保证了转移矩阵和分类器的一致性。此外,我们的方法有助于减少噪声类后验概率估计误差的副作用。


效果对比


表1:CLOTHING-1M数据集上的分类精度(%)


我们在CIFAR-10 、CIFAR-100、CLOTHING-1M和FOOD-101N数据集上对比了现有最好模型,我们的方法精度均达到了SOTA水平。本文方法在现有最好方法上有了明显提升,优于基线方法“CE”6.18%。


结语与展望


随着机器学习特别是深度学习的日趋广泛,噪声标签的学习成为AI领域的热门研究方向,爱莫科技坚持在人工智能最前沿方向投入大量研发,积极开展与高校等科研机构的产学研合作,从而保持公司在技术领域的国际领先水平,更好地为全球高端客户量体裁衣的定制AI解决方案。


文献下载
爱莫科技,助力企业数字化转型
*爱莫科技非常注重客户的隐私保护,阅读《隐私条款》了解我们的隐私政策,提交即代表您已阅读并同意《隐私条款》
隐私条款

一、接受条款 使用者(也称"您")在访问或使用本网站及其服务时,即已经表示同意并不加修改地接受本《用户协议》、本网站的《隐私声明》、《法律声明》以及其关或相链接的网页和网站的条件和条款的规定。我们强烈建议:在您阅读和接受本《用户协议》时,也应阅读并接受本《用户协议》中所提到《隐私声明》、《法律声明》及其相关或相链接网页或网站所包含的资料,因为《隐私声明》、《法律声明》及其它相关网页或网站可能包含对您适用的进一步规定。(请注意:点击划有底线的词句即可链接到上述《隐私声明》、《法律声明》及其它相关或相链接的网页和网站。 


二、使用者的资格要求 在本网站中"使用者"指的是浏览、阅读、使用本网站信息或服务的任何个人或组织。本网站的服务仅适用于根据相关法律的规定具有签订有约束力的合同的个人或组织并仅由其使用。本网站的服务不向18周岁以下的个人使用者提供,也不向临时被本网站中止或取消使用者资格的使用者提供。如果使用者不符合本条规定,请停止使用本网站或本网站的服务