GAIR
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
AI开发 正文
发私信给孔令双
发送

0

赶超百度微软登顶 MSMARCO,猿辅导机器阅读理解超过人类水平

本文作者:孔令双 2018-03-28 10:30
导语:AI 会成为未来教育应用的底层技术。
比赛
比赛名称:微软MARCO
年份:2018
企业:猿辅导
操作:竞赛
名次:1

雷锋网(公众号:雷锋网) AI 研习社消息,近日,猿辅导超过了百度、微软,登顶微软 MSMarco(Microsoft Machine Reading Comprehension)机器阅读理解测试排行。

据猿辅导透露,此次提交的 MARS(Multi-Attention ReaderS)模型,采用层叠式的注意力机制在多候选文档采样出多个候选答案区域,并在此基础上使用交叉投票模型,优化最终的答案。

赶超百度微软登顶 MSMARCO,猿辅导机器阅读理解超过人类水平

图:MSMarco 排名情况

MS MARCO 是微软发布的一套 10 万个问答组成的数据集,人工智能领域的研究人员可用它来构建能够与真人相媲美的问答系统。猿辅导 NLP 团队上传的 MARS 模型给出的答案,在官方评测指标(Bleu-1 和 Rouge-L)上测试得分为:49.72、48.02,而人类基准为 47、46,这不仅在 MSMARCO 排行榜上首次出现,在全球阅读理解任务上也是首次。

另外,猿辅导的模型在 semEval(国际语义评测)上的阅读理解 task 上获得了第二名,而此前猿辅导曾在 SQUAD 数据集上,单模型第三。

猿辅导应用研究团队成立于 2014 年年中,一直从事深度学习在教育领域的应用和研究工作。团队成员均毕业于北京大学、清华大学、上海交大、中科院、香港大学等知名高校,大多数拥有硕士或博士学位。

赶超百度微软登顶 MSMARCO,猿辅导机器阅读理解超过人类水平

图:MSMarco 官方推文

为什么要做机器阅读理解?猿辅导表示:「从公司组建起,我们就有自己的应用研究部,AI 做为教育未来应用的底层技术,我们公司也在着重打造自己在这方面的能力,包括猿辅导在线课程在内的公司各项业务,也都享受着 AI 技术带来的推动和变革。」

机器阅读理解、语音识别、手写识别、图像识别等技术,分别被应用在了猿辅导的在线辅导课程,小猿搜题、小猿口算、斑马英语等等产品中,诸如小猿搜题的搜题功能,英文作文的手写识别及打分,小猿口算的拍照批改,斑马英语的绘本朗读打分等等。

不过,机器阅读理解只是猿辅导众多 AI 技术方向中的一支,该公司一直在技术层面上做更多的尝试,研究方向涵盖了图像识别,语音识别、自然语言理解、数据挖掘、深度学习等领域。对于机器阅读理解的研究,猿辅导希望将其应用在教育行业中,例如高考作文的自动批改,阅读理解的自动出题等,语文题目的自动作答等。

雷锋网原创文章,未经授权禁止转载。详情见转载须知

赶超百度微软登顶 MSMARCO,猿辅导机器阅读理解超过人类水平
分享:
相关文章

文章点评:

表情
最新文章
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介