云从科技图像识别技术入选AAAI 2020,引领技术前沿发展

2020-01-20
back

这几年,图像识别技术

得到了突飞猛进的发展,

在视频应用、自动驾驶和智能医疗

等领域也得到了深入应用,

这背后的有效推动力就是深度学习。


随着深度学习的飞速发展,复杂模型对设备计算能力的高要求、超分辨率操作花费大量计算成本等问题也随之而来,图像识别进一步广泛应用面临着许多新的挑战。


基于此,云从科技和中科院信工所联合提出了一种用于低分辨率图像识别的混合阶数关系知识蒸馏方法。


在多个任务上的实验结果表明,该方法在识别低分辨率图像方面表现出色。


且具有较低的内存占用量和更快的速度,可明显提升深度模型在图像识别任务中的效果。



1

被AAAI 2020录用


该论文被国际人工智能领域顶级学术会议AAAI 2020(The Thirty-Fourth AAAI Conference on Artificial Intelligence)成功录用。


并将于2020年2月7日-12日在美国纽约针对各前沿话题展开学术讨论。


▲全球人工智能领域权威会议AAAI 2020



2

问题背景


云从科技核心技术先后13次斩获国际智能感知领域桂冠及158次行业POC冠军,在计算机视觉识别、图像识别、音频检测等国际挑战赛中屡获冠军。


此次“用于跨分辨图像识别的混合阶数关系知识蒸馏方法”的提出,是对图像识别技术的再一次创新


图像识别涵盖图像匹配、图像分类、图像检索、人脸检测、行人检测等技术。



3

方法贡献


新方法的提出,可以提高图像识别技术在互联网搜索引擎、自动驾驶、医学分析、遥感分析等领域的广泛应用价值。


例如:


 在医学影像领域,可以提升检测数据的数量、质量、标注等,从而为患者提供更加精准的个性化诊治方案;


 在安防视频监测领域,可以广泛推广图像识别技术结合行业视频业务的应用,有效地提高了公安、交通、司法、零售等行业的效率;


 在历史文献领域,通过对图像进行处理、分析和理解,识别真伪难辨的历史图像,可以提高还原历史的准确性。



▲云从科技和中科院信工所发表论文


该方法主要贡献包括三个方面:


 提出了一种混合阶数关系知识蒸馏方法,该方法能够从预先训练的高分辨率模型中提炼出更丰富的知识,以促进低分辨率图像的识别; 


 提出了一个关系模块来提取多阶关系知识;


 进行了广泛的实验,以显示我们的方法在度量学习,低分辨率图像分类和低分辨率人脸识别任务中的出色表现。


▲如图所示,对于有相似的、对应的高分辨率图像的低分辨率图像是可以被有效识别的



4

方法框架


该方法主要包含三路:


 用高分辨率图像训练的、拥有很高识别准确率的复杂教师网络;


◆ 通过模仿教师的行为以识别低分辨率图像的简单学生网络;


◆ 引入额外的辅助网络作为桥梁以帮助教师网络到学生网络的知识转移。


为了在知识蒸馏过程中提取足够的知识,以解决低分辨率图像识别准确性降低的问题。


通过对学生的学习过程进行混合损失的监督,保留了混合关系结构中的相似性。


这样,可以有效地增强简单学生网络恢复低分辨率图像的丢失细节的能力,从而带来更好的知识转移。


▲方法框架图


我们通过考虑更高阶的关系来实现更好的知识转移。


通过重新定义损失函数,学生可以很好地学习老师提取的结构知识,并有效地弥补了分辨率降低带来的必要信息的不足,从而提高了其识别性能。



5

实验结果


低分辨率图像分类


在低分辨率图像分类的任务上,我们的方法实现了低分辨率图像的有效分类。



低分辨率人脸识别


我们用LFW作为验证数据集,结果发现,我们模型在32×32低分辨率时识别准确率为93.83%


比ArcFace和VGGFace2分别提升了5.99%或5.70%,我们的模型低分辨率模型有效性更强


此外,与目前最优的SKD进行了比较,我们的模型OUR-32-R和OUR-16-R准确度分别为93.83%和$90.03 %,分别超过SKD 4.11%和4.16%


这显示了我们的低分辨率人脸识别方法的出色稳定性和性能。



在更具有挑战性的UCCS数据集上,我们对两种低分辨率人脸识别任务的最新技术(VLRR和SKD)进行比较。


结果我们模型的错误率分别为22.19%@top-1和10.23%@top-5,较VLRR和SKD获得了更好结果。



跨分辨率度量学习


我们还评估了模型在度量学习任务上的表现。


在Cars196、CUB2011、SOP(斯坦福在线商品数据集)三个数据集上进行实验,结果表明:


在跨分辨率度量学习任务中,我们的模型有着良好的表现,学生比教师网络性能更优。



两步走的跨分辨率知识蒸馏


为了更好、更有效地迁移教师网络的关系知识,我们引入了辅助网络。


在保证使用更少参数地同时,实现更好地低分辨率图像识别效果。


经过两步走的跨分辨率知识蒸馏法后,在Cars196数据集上验证显示


我们的方法比一步蒸馏提升明显,甚至学生模型的识别准确率已经超过教师模型。



消融实验


我们进行了消融实验,以验证关系知识阶数对于实验结果的影响。


我们得出的结论是,尽管顺序的增加将有助于在转移知识的同时提高学生的学习成绩,但是并不确定。


尽管高阶意味着更多信息,但我们不能保证所有这些信息都将有助于改进模型。


这些信息的冗余可能会对模型产生负面影响。


因此,对于特定任务,找到最佳阶数对于知识蒸馏非常重要。



我们提出的新方法可以消除网络中的冗余和图像分辨率冗余,在辅助网络的帮助下有效地将丰富的知识

您可能感兴趣

全国热线电话

400-151-5992

周一到周五9:30-18:00(北京时间)

  • 商务合作:business@cloudwalk.com

  • 媒体合作:Media@cloudwalk.com

  • 渠道合作:business_partner@cloudwalk.com

  • 人才招聘:zhaopin@cloudwalk.com

Copyright©2024 粤公网安备 44011502001099号

粤ICP备15087156号 云从科技集团股份有限公司

AI开放平台/云从logo/使用条款/法律声明/防诈骗声明
关注我们

扫描二维码,关注云从科技
精彩一手掌握

留言咨询

请填写以下表格,我们的销售代表会尽快与您联系

  • 姓名 *
  • 工作邮箱
  • 电话 *
  • 城市 *
  • 公司名称 *
  • 行业
  • 职位
  • 产品/解决方案
    AI定义设备
    场景定义设备
    机场专用产品
    刷脸支付终端
    活体模组
    智慧金融
    智慧治理
    智慧交通
    智慧商业
  • 预算
  • 请输入需求描述 *

提交成功

我们的销售代表会尽快与您联系