要闻 人事 政情 本网 旅游 图片
安徽频道 > > 正文

全球顶级机器阅读理解考试 科大讯飞联合团队夺冠

2017年08月01日 08:14:29 来源: 合肥晚报

    一场全球顶级机器阅读理解考试的最新成绩出炉。这项由斯坦福大学发起的挑战赛最新的榜单显示,科大讯飞与哈工大联合实验室(HFL)提交的系统模型夺得第一名,这也是中国本土研究机构首次荣登该赛事的榜首。

    机器考阅读理解 精确匹配率超过77%

    阅读理解是人类考试中必不可少的项目之一,对于机器,又该怎样去作答和评判呢?

    昨日记者从科大讯飞了解到,该挑战赛是通过众包的方式构建了一个大规模的机器阅读理解数据集。这个数据集有多大?大到包含了10万个问题。

    10万个问题怎么得来的?它的原文来自500多篇维基百科文章。每次挑出几百字左右的短文给人工标注者阅读,然后让标注人员提出最多5个基于文章内容的问题并提供正确答案。

    接下来就是机器阅读上场的时刻了。参赛者提交的系统模型在阅读完数据集中的一篇短文之后,回答若干个基于文章内容的问题,然后与人工标注的答案进行比对,得出精确匹配(Exact Match)和模糊匹配(F1-score)的结果。

    根据挑战赛最新的成绩榜单,科大讯飞与哈工大的联合实验室提交的系统模型取得了精确匹配77.845%和模糊匹配85.297%的成绩,位列世界第一。紧随其后,位居亚军的则是微软亚洲研究院,精确匹配为77.688%,模糊匹配为84.666%。

    会找文章关键点 科大讯飞联合团队考全球第一

    在SQuAD官网的成绩榜单上,可以看到科大讯飞与哈工大联合实验室提交的模型名为 “基于交互式层叠注意力模型”。正是这个与众不同的模型,让科大讯飞在全球自然语言理解研究领域脱颖而出跃居头名。

    “基于交互式层叠注意力模型”?啥意思?据科大讯飞技术人员透露,通俗来说,就是采用了端到端的神经网络模型,但把精力更多放在如何能够模拟人类在做阅读理解问题时的一些方法。

    此时,就像我们平时带着问题去看书一样,科大讯飞与哈工大联合实验室提交的模型也会根据给定的问题对篇章进行多次的过滤,同时根据已经被过滤的文章进一步筛选出问题中的关键提问点。

    “传统的自然语言处理方式是采用分拆任务的方法将其分成问题分析、篇章分析、关键句抽取等一些步骤,但这种方法容易造成级联误差的积累,很难得到很好的效果。”科大讯飞技术人员向记者解释说,他们的“交互式”模型能够逐步精确答案的范围,与其他参赛者的做法不太相同,因此最终收获了令人瞩目的成绩。

   1 2 下一页  

[责任编辑: 李东标 ]
敬请关注“新华网”微信公众号

集成阅读

  • 安徽淮北:献血迎“八一”

    安徽淮北:献血迎“八一”

  • 安徽肥东:抗旱小分队送来“幸福水”

    安徽肥东:抗旱小分队送来“幸福水”

  • “爸爸,女儿就是您的肩膀”

    “爸爸,女儿就是您的肩膀”

  • 水中机器人竞赛

    水中机器人竞赛

  • 皖南山区 欢乐瓜节

    皖南山区 欢乐瓜节

  • 暑期“环保小课堂”

    暑期“环保小课堂”

010070130010000000000000011112031121410763