NLP的华山论剑,中国队暂时领先
2018-12-06 09:15 文章来自:IFTNews 收藏(0) 阅读(2034) 评论(0)

最近朋友圈流行下面这个图。意思大致是人们认识自己是一个过程,有时候自信程度和认知能力成反比。人们需要不断学习和完善才能清楚的认识到自己的不足,逐步达到真正意义上的优秀。

最终人们是否能达到优秀,要看各自修行。“高考是很多人的智力巅峰”这个论断却获得了很多共鸣。然而在我们很多人一生的智力巅峰中,高考的阅读理解题目往往成为心中的痛。

那么阅读到底有多难理解?

子曰:“书不尽言,言不尽意。”

《人类理解论》的作者约翰洛克也说过类似的话:“人类的思想是无限的,文字的供给是稀少的。”

其中有一些天才试图通过歌谣破解阅读理解的密码。歌云:“三长一短选最短,三短一长选最长”

但是面对这样的题目“试阐述文章中‘晚安’的含义,作者鲁迅”,千言万语只能无语。

连庄子都感叹:“吾生也有涯,而知也无涯。以有涯随无涯,殆已!”

既然人类阅读理解不行,那么让机器试试?

这个可能么?!

可能的。这个就是目前顶级人工智能专家和学者们正在研究的任务。

NLP,Natural LanguageProcessing,自然语言处理是人工智能(AI)的一个子领域。

斯坦福大学在2016年的时候就打造了一个类似NLP领域高考的竞赛SQuAD,人类出题机器答题。


参与考试的考生都是学霸,比如谷歌、微软研究院、阿里达摩院、科大讯飞、平安金融壹账通GammaLab等等。

这个竞赛就可以看做NLP领域的华山论剑。

所谓“文无第一,武无第二”,是你的六脉神剑厉害,还是我的独孤九剑称雄,那么就看考试成绩了。考试成绩榜单是公开的,排名基本上每两周就要更新一次,竞争异常激烈。

从榜单格局来看,基本就是中美两国的竞争了。目前占据榜单第一的就是中国平安金融壹账通GammaLab。成绩是85.992%的准确率。排名前列的还是有阿里达摩院、微软研究院等。

这个竞赛的排名可以看做衡量中美各团队在机器阅读理解领域的水平的标尺。

机器阅读理解在搜索、问答等运用领域非常广泛,可以渗透到各行各业当中,成为一种信息世界的主流解决方案。机器阅读理解能力水平越高,越能承担更加专业更加复杂的搜索、问答任务,譬如处理金融、财务、医疗等专业领域的需求。

本次获得排名第一的金融壹账通GammaLab科学家介绍,金融壹账通已经把机器阅读理解技术运用到金融场景中。

比如在保险场景中,机器阅读理解技术已经在业务难点——孤儿单处理中有所运用。在保险场景,当有业务员流动时,客户也会转移给其他人,这种俗称孤儿单。由于孤儿单签订时间不同,签订时的保险条款也可能有所变化,所以当客户咨询问题时,业务员需要翻看历史保险条款才能回答,造成了巨大的工作量以及较高工作难度。而GammaLab的阅读理解技术可以在短时间内,理解出所有版本的保险条款,迅速提供判断的条款依据,有效降低业务员操作时间和难度。金融壹账通还在今年7月正式向行业发布了加马智能营销方案,在其帮助下,业务员在线下营销中遇到的问题均可在1秒之内获得正确解答,平均业务时间缩短了30%,工作效率和准确度获得了实质性提升。

现在机器阅读这样厉害的嘛?

实际上,斯坦福大学也给出了人类的准确度,89.452%。

在NLP的华山论剑,中国队暂时领先。

在阅读理解领域,人类暂时领先。