AAAI 2020 | 云从科技DCMN+ 模型在多项数据集上获全球领先成绩

2020-01-19
back

在那些寒窗苦读的学生时代,

你一定碰见过阅读理解,

它需要融会贯通进行主观陈述和作答,

是让无数考生头疼的题目。

继智能系统在围棋、国际象棋、

游戏等领域超越人类后,

“阅读理解”也成为了机器的“苦恼”。


直到2019年3月8日,机器阅读终于打破“魔咒”。


云从科技与上海交通大学基于原创DCMN算法,提出了一种全新的模型。


在大型深层阅读理解任务数据集RACE数据集(ReAdingComprehension dataset collected from EnglishExaminations)登顶第一,人工智能系统首次在深度阅读理解超越人类。



1

机器阅读再突破


继在RACE取得最好成绩之后,云从科技和上海交通大学赵海教授团队继续发力。


针对RACE多项选择题提出增强的DCMN+模型,在RACE,SemEval-2018 Task11, ROCStories,MCTest以及COIN Task1不同数据集上均取得了最高成绩


在RACE上的结果比较,取得最高成绩


在SemEval-2018 Task11, ROCStories,MCTest以及COIN Task1上,也均获得最高成绩



2

论文被收录进AAAI-2020


最新发表的DCMN+论文被收录进AAAI-2020大会。


AAAI(Association for the Advancement of Artificial Intelligence)是国际人工智能领域最为权威与重要的协会之一,现在在全球有超过6000名会员。


AAAI 被中国计算机学会(CCF)推荐为人工智能的 A 类会议。


据了解,此次AAAT 2020大会共收到超过8800篇投稿,比去年收获的论文数量增长80%,其中7737篇论文进入评审环节,最终有1591篇论文被录用,录取率为20.6%


AAAI 2020大会将在美国纽约召开,到时将有三千名专家学者参加盛会,研读人工智能新趋势新方向。




3

DCMN+论文模型框架


DCMN+是年初我们提出的DCMN增强模型。


针对多项选择型机器阅读理解,以大规模预训练模型(如BERT等)作为前端编码器;


在多个多项选择型机器阅读理解任务(如卡耐基梅隆大学的RACE)上取得了最先进的水平,另外DCMN也适用于其他简单分类任务。


与其他技术相比,其显著特征是双向匹配策略,其他现有模型的匹配策略都是单向的。


比如在文章-问题(P-Q)建模时:


现有技术只有问题(Q)在文章(P)上的映射匹配,没有文章(P)在问题(Q)上的映射匹配。


而DCMN则集成了两个方向的匹配信息。


此外,还集成了文章中句子筛选-从文章(P)中筛选出与问题相关的句子用于推理,答案选项交互-引入选项之间比较信息两种阅读策略,进一步提升了模型的性能。



论文地址:https://arxiv.org/abs/1908.11511?context=cs.CL

复制上方地址粘贴到浏览器地址栏



内容摘要:本文主要聚焦多项选择型机器阅读理解,它的形式类似于英语考试中的阅读理解(选择题),给定一篇文章,通过阅读并理解文章(Passage),针对提出的问题(Question)从选项中选择正确的答案(Answers)。


一个典型的多项选择型机器阅读理解的例子


论文中提出了DCMN+主要包含的三个模块:

1

文章中句子筛选,从文章(Passage)中筛选出与问题相关的句子用于推理;

2

答案选项交互,引入选项之间比较信息;

3

双向匹配策略,充分利用Passage,Question与Answers之间的交互信息,作对称双向匹配。


三个模块:Sentence Selection, Option Interaction 和Bidirectional Matching



4

DCMN+论文具体模块分析


2.1 编码器


本文直接以预训练完的语言模型作为前端编码器,例如BERT以及XLNet,分别编码Passage,Question及Answers。



2.2 文章句子选择(Passage Sentence Selection)


为从文章中选择出与问题最相关的句子,我们分别计算了文章中每个句子与问题-选项对的相似度,选出最为相关的K(超参数)个句子,输入到模型的以后部分作为推理依据。


具体计算句子间相似度的方式有两种:余弦距离与双线性距离。


余弦距离:逐个计算文章中句子与问题-选项对中单词间的距离,取其平均值作为相似度分数:



双线性距离:通过计算文章句子与问题选项对的双线性匹配分数,然后通过线性降维来得到最后的分数:



2.3 答案选项交互(Answer Option Interaction)


通过引入答案选项之间的比较信息,使得每个答案融入了相对于其他答案的比较信息,从而每个答案选项不在是孤立的。


具体计算方式是引入每对选项之间的双线性比较信息,最后使用门控机制与原始的选项信息融合。


您可能感兴趣

全国热线电话

400-151-5992

周一到周五9:30-18:00(北京时间)

  • 商务合作:business@cloudwalk.com

  • 媒体合作:Media@cloudwalk.com

  • 渠道合作:business_partner@cloudwalk.com

  • 人才招聘:zhaopin@cloudwalk.com

Copyright©2024 粤公网安备 44011502001099号

粤ICP备15087156号 云从科技集团股份有限公司

AI开放平台/云从logo/使用条款/法律声明/防诈骗声明
关注我们

扫描二维码,关注云从科技
精彩一手掌握

留言咨询

请填写以下表格,我们的销售代表会尽快与您联系

  • 姓名 *
  • 工作邮箱
  • 电话 *
  • 城市 *
  • 公司名称 *
  • 行业
  • 职位
  • 产品/解决方案
    AI定义设备
    场景定义设备
    机场专用产品
    刷脸支付终端
    活体模组
    智慧金融
    智慧治理
    智慧交通
    智慧商业
  • 预算
  • 请输入需求描述 *

提交成功

我们的销售代表会尽快与您联系