科技时报 全球最新科技资讯专业发布平台

高考人机大战:机器10分钟交卷,人类仅多考了1分

2017-06-09 09:28:02已围观次来源:新京报 马婧编辑:夏雪

 

  6月7日数学高考当天,两名特殊的“考生”参与了高考。其中一名北京的“考生”只用了不到十分钟就答完2017年北京卷文科数学题,完成包括客观题和主观题在内的整张试卷,成绩为134分。据称这还是该考生把做题速度放慢六倍的结果。在距离北京两千公里之外的成都,另一名“考生”则花了22分钟做完同样考题,成绩是105分。

  两名考生均是智能AI机器人,分别是学霸君开发的智能教育机器人Aidam和成都准星云学科技有限公司开发的人工智能系统AI-Maths。

  有观点认为,未来5-10年人工智能或将成为教育行业变革最重要的解决方案,推进智能化教育,构建以学习者为中心的教学模式,能够改进传统教育的不足,弥补传统教育的短板。

  智能AI为什么选择考数学?

  学霸君开发的智能教育机器人Aidam和成都准星云学科技有限公司开发的人工智能系统AI-Maths选择的都是2017高考数学考试。

  为什么智能机器人都热衷于比拼数学呢?

  学霸君创始人张凯磊表示,“一千个人心中有一千个哈姆雷特,但是世界上只有一个勾股定理”。数学、物理等理科类科目是强逻辑链路的,考点基本稳定,容易判定对错。同时,数学试卷中包括简单的选择题,也有复杂的需要解题过程的大题,非常适合测试AI。

  张凯磊透露,在实验阶段,Aidam的最好成绩是139分,平时的稳定成绩在120-130分。

  学霸君首席科学家陈锐锋在考试比赛现场表示,Aidam解题分为三大步骤:第一,把试卷题目变成机器可以理解的形式语言。第二,在用形式语言完整描述了一系列环境之后,计算机就会在知识网络里启动搜索,确认题目触发了哪些知识点,然后进行一系列的推理,找出最佳解题路径。第三,把解题的过程和答案,从形式语言转化为自然语言,完成解题过程。

  与Aidam不同,AI-MATHS是另一种思路。成都准星云学科技有限公司CEO、清华大学苏州研究院大数据中心主任林辉向媒体表示,AI-MATHS则是通过综合逻辑推理平台来解题,而非学习储存题库,因此在完全掐断题库、断网、无人干涉、仅有12台服务器、1.2万道题的小样本训练量的诸多限制下,AI-MATHS在今年2月份时取得了93分的成绩。

  任林辉透露,在今年2月之前,AI-MATHS仅有100套试题的训练量,从2月开始,为了训练AI-MATHS的答题速度,团队加大了题量,目前AI-MATHS有500套试题的积累。

  对比来说,可能AI-MATHS更接近人工智能复杂逻辑推理的自主学习方式。

  智能AI的“短板”在阅读理解

  尽管AI机器人能在数学领域进展迅速,但距离成为学霸仍有一段道路。

  智能教育机器人Aidam做高考数学题的同时,三组数学高考状元在和它同台PK。三组高考状元得分分别为146分、140分、119分,Aidam为134分。三组高考状元平均分135分,Aidam以一分之差惜败。

  AI-MATHS做2017年高考北京文科数学卷获得105分,用时22分钟;做2017年高考文科全国卷II则获得100分,用时10分钟。对于AI-MATHS的成绩,准星云学CEO林辉曾在接受媒体采访时表示,它失分的重要原因来源于“无法理解题意”。

  今年1月,日本国立情报学研究所(NII)的研究人员宣布,放弃让人工智能系统“Torobo-kun”参加东京大学入学考试的计划。NII的Noriko Arai教授解释道:“人工智能系统无法理解必要的信息,阅读和理解句子含义的能力存在局限。我们发现,现在还没有办法使这一系统获得足够的分数,使它通过东京大学的入学考试。”

  科大讯飞轮值总裁吴晓如认为,技术在不断进步的同时,高考命题也在不断进步。“现在高考的题目越来越灵活,越来越综合性,所以这些题目的处理对机器来说越来越困难。我们现在也和一些考试机构的专家在一起沟通,发现他们在出这个题目的过程中,很多的题目就必须包含你人都有很多的一些理解,你要做很多中间一些逻辑性的转换,才把一个题目能做得好。”

  不过,智能AI正在迅速提高在文科方面的学习能力。此前微软小冰在2017年5月19日出版的诗集《阳光失了玻璃窗》获得好评,被认为已经有了很大的进步。

  AI将会颠覆教育行业吗?

  吴晓如对媒体介绍,目前科大讯飞的智能阅卷产品,已经可以实现对主观题,甚至对语文、英文的这样一个作文题都可以实现自动的评分。AI会颠覆教育产业吗?

  有观点认为,未来5-10年人工智能或将成为教育行业变革最重要的解决方案,推进智能化教育,构建以学习者为中心的教学模式,能够改进传统教育的不足,弥补传统教育的短板。

  不过陈锐锋认为,AI还不能代替老师。因为,机器人没法代替老师讲解。比如,这道题为什么对,为什么错,解题思路为什么这么想不对,为什么那样想又是对的。但是,AI可以告诉老师,这个学生的哪些知识点有问题,哪些地方应该花更多的精力去训练,而不是把时间浪费在该学生已经掌握的知识上。

  张凯磊表示,中学期间大概有3529个考点、平均每个做3-4道题就够了,写1万道题目可以做完,但目前绝大部分学生面对的练习题有3万-4万,其中3/4的题目是不需要写的,75%的宝贵时间都被浪费掉了。

  在传统模式下,从学生写作业到老师批改,再到学生改错一般需要耗费2-3天的时间,引入AI后让当天作业当天批改成为了可能。

  据相关媒体报道,准星云学最早研发的产品“准星智能评测系统”,前端是一支智能笔,后端是人工智能系统。学生用这支笔答题的同时,系统将全程采集答题数据,一键传输到云端,后台系统对学生的学习力进行画像。这种智能评测的方式可以帮助学生及时找出知识缺陷并提示进行针对性补习。

  张凯磊接受媒体群访时表示,实现个性化学习,大幅度提升学习效率和成果是学霸君研发智能教育机器人的初衷。“中国980万的老师,差异性太大了,要让980万的老师整齐划一,太难了。有没有可能把这些能力移植到系统的层面,让系统完成老师70%或者80%的行为呢?”

  AI跨领域能力还不够强

  除了数学考试外,围棋是人工智能占领的另一个高地。国际围棋顶尖柯洁用“围棋上帝”来形容谷歌(微博)旗下的人工智能Alphago。Alphago用3:0完胜的表现,宣告自己成为了地球上围棋水平最高的人。

  从横空出世到被中国棋院颁发职业九段认证,Alphago只用了7年的时间。

  Aidam尽管没能打败昔日的高考数学状元,但在10分中内交出134分的答卷足以让人瞠目结舌。

  在垂直细分领域,AI已经展现出不容小视的实力,可以预见的是未来会涌现出各种各样的Alphago。海信的工厂里部分岗位就是用机器人来代替人工,提升效率的同时也降低了成本。不少行业的客服类业务已经引入了,基于深度学习、自然语言理解和情绪、情感识别技术的AI客服。

  不过,目前的AI只能在细分领域独当一面,创新工厂创始人李开复(微博)在接受媒体采访时表示,跨领域的、高深的、需要深度思考的内容,未来十年人工智能也无法达到。

  不少创业公司都将人工智能视为下一个风口,好像不管从事什么项目只要加上AI就能吸引投资。

  招商致远合伙人王盛指出,人工智能实际上是几十年前就发生了,最近几年比较热是一些投资机构炒起来的。但是,人工智能是一个大趋势的事情,短期内可能会有一些热度的波动,但是未来十到二十年潜力巨大,而且应用的场景会越来越多。

  据艾瑞咨询预计,2020年全球人工智能市场规模将达到1190亿元,年复合增速约19.7%;同期中国人工智能市场规模将达91亿元,年复合增速超50%。

  东方富海合伙人周绍军认为,投资机构不会投概念,而是投落地的场景。未来的技术一定是要落地的,包括服务机器人、自动驾驶、无人机等,都是人工智能有可能落地的场景。