注册返回主站

科大讯飞荣获国际语义评测数学问答竞赛全部项目冠军

作者：骏马奔腾
2019-02-14 18:50:25
分享：

祝贺讯飞，技术顶天真功夫。

2019年2月6日，经过近半年的激烈角逐，在正式揭晓的国际语义评测数学问答竞赛任务(Math Question Answering，以下简称MQA)上，科大讯飞团队败全球100多个团队，夺得总分第一以及代数题、应用题、几何题三个子项目的全部冠军。
多年积淀创新思路，科大讯飞成功脱颖而出
本次评测由International Workshop on Semantic Evaluation发起，由艾伦人工智能研究所（Allen Institute for Artificial Intelligence）、华盛顿大学（University of Washington）以及里德学院（Reed College）共同组织。MQA面向美国高考的数学科目，覆盖了全部的美国高考（Scholastic Achievement Test，以下简称SAT）数学科目的所有类型的题目，难度与美国真实的高考水平一致。本次测评中，科大讯飞参测模型以45%的总准确率名列第一，还在代数子项目上获得了71%的高准确率。
Math Question Answering最终榜单
MQA训练集合来自历年的美国高考数学科目的真题，主要包括三种类型：
1、代数题（Closed-vocabulary algebra）
例："Suppose 3x y = 15, where x is apositive integer. What is the difference between the largest possible value of y and the smallest possible value of x, assuming that y is also a positiveinteger?"
2、应用题(Open-vocabulary algebra)
例："At a basketball tournament involving 8 teams, each team played 4 games with each of the other teams. Howmany games were played at this tournament?"
3、几何题(Geometry)
例："In the diagram at the right, circle O has a radius of 5, and CE = 2. Diameter AC is perpendicular to chord BD. What is the length of BD? "
机器答题的难在哪里？
首先，SAT考试的试题样本比较有限，因此赛事主办方所公布的包含历年美国高考数学科目真题的训练用数据集容量较小，数据不足对于参赛系统模型的训练与最终测试成果有着较大影响；其次，对于机器而言，虽然运算速度与效率远远胜于人类，但在理解试题方面却还是个“小学生”，十分依赖于图像识别技术将其转化为机器可以识别的计算机语言。
科大讯飞研究院与复旦大学张奇教授、上海脑科学与类脑研究中心/张江实验室周熠研究员等团队通力合作，在借鉴和吸收科大讯飞在认知智能和智慧教育领域多年经验的基础上，提出了相比于以往更加简单和易于使用的断言逻辑（Assertional Logic）表示方法，完成了从自然语言到计算机逻辑语言的跨越，在搭建的参测模型上实现了将常用的深度学习方法与专家系统的有机融合。参赛模型因此在具备强大学习能力的同时，也拥有了对于题目的解释、推理、迅速定位能力。
在数学上考出的好成绩，得益于科大讯飞深耕A.I.多年的丰富经验以及产学研用合作的深厚积淀。
从技术“顶天”到产品“立地”，用A.I.助力“因材施教”
2017年11月，科大讯飞医考机器人在2017临床执业医师综合笔试测试中取得了456分，超过了96.3%的人类考生，达到了全国考生中的中高级水平。MQA测试夺得冠军，再一次证明了科大讯飞在认知智能领域的实力。A.I.参与考试，并不是为了与莘莘学子争夺入学的门票，而是通过考试积累的能力帮助学生更好地学习。
基于在本次评测中所展现的对于试题的理解能力和多年深耕教育的大数据积累，科大讯飞已正式向外推出“个性化学习手册”。它可以根据学生的错题，在精准分析学情、定位知识的基础上判断学生对于教学内容的掌握情况，为每位学生构建知识与类型题图谱，从而实现针对每一位学生推荐不同的个性化学习资源，做到“千人千面”。
而通过对学情数据的采集和分析，对重、难、考、易错等进行详细分析，科大讯飞的智慧教育解决方案还可以帮助教师实现以学定教和精准教学，助力提升教学效率，从而在学生学习和学校教学两个层面实现因材施教，减负不减效的目标。
2019年不仅是科大讯飞成立的第20个年头，也是科大讯飞人工智能2.0战略的开端。而MQA评测冠军所展示的逻辑推理和解答能力，将更加助力科大讯飞智慧教育业务的发展与成熟。如何更好地融合包括自然语言理解、图像识别和逻辑推理等在内的各种能力实现应用落地，如何更好地用A.I.技术服务社会、建设美好世界，虽任重而道远，但科大讯飞和所有讯飞人一直在努力的路上，因为我们坚“你所清楚预见的、热切渴望的、真诚追求的，都将自然而然地实现”。