五年前,西雅图亿万富翁 Paul Allen(现已故)提出一项人工智能计划,企图使 AI 经过八年级科学检验;现在,这项豪举现已宣告完结。
艾伦人工智能研讨所(AI2)在 9 月 4 日宣告,其 Aristo 软件应对八年级多选题考试正确率在 90% 以上,关于高年级考试正确率在 80% 以上。
该考试根据 New York Regents 的才能检验,扫除了解说图片或图表的问题,由于 Aristo 不具备视觉辨认技能。此外,Aristo 无法应对它没有练习过的科学范畴。
尽管如此,这次试验仍是阐明近 5 年来人工智能取得的巨大发展,当年艾伦 AI 科学应战的参赛程序作用都不抱负。
(来历:AI2)
“它在标准化检验问题上取得了明显打破,这需求必定程度的自然言语了解、推理和常识,”AI2 首席执行官 Oren Etzioni 表明,“即便在一年前,也没有人会预料到机器能处理 8 年级和 12 年级的科学问题!”
这项作业建立在一系列言语解说、问题答复才能,它使用了 AI2 的 ELMo 程序和西雅图 Google 研讨机构的 BERT 程序。Aristo 有八种类型的问题处理 agent:从数据库查找到相关概念查看(称为元组),到定性推理。
多种计划会为首选的多选题答案评分,而 Aristo 会对评分加权来确认终究答案。该程序经过屡次练习和校准来优化成果。
例如,有一个问题是:“当铁块熔化时,铁块中的原子怎么受到影响?A)原子质量添加;(B)原子热量削减;(C)原子移动加速;D)原子体积添加。”
Aristo 先确认相关常识,粒子热量添加会导致粒子移动加速,将问题中的“熔化”与“热量”联系起来,然后确认粒子移动加速,并将C选项作为正确答案。
为了处理八年级的检验,Aristo 结合不同的计划进行优化,正确率从 2016 年的大约 60% 进步到现在的 91.6%。在 12 年级检验中,该程序正确率为 83.5%。
图 | 该图表显现了Aristo多年间在纽约摄政学院八年级科学考试(只要多项挑选,无图表问题)的得分状况。多年来,程序剖析问题的办法越来越杂乱,这带来了功能的提高。(来历:AI2)
在一份关于该项意图研讨论文中,Etzioni 和其他 AI2 研讨人员(包含项目 Aristo的高档司理 Peter Clark)表明,“要完成 Paul Allen 关于 Digital Aristo 的想象,要创造出一个对科学有更深了解的机器,咱们仅仅走出了第一步。”
研讨人员的方针是让 Aristo 能处理图表问题和论文问题。他们期望该技能终究打破现有水平,关于八年级学生、乃至成年人难以答复的问题,Aristo 也能用自然言语做出答复。
Aristo 有或许成为一个比亚马逊 Alexa、微软 Cortana 和苹果 Siri 愈加智能的数字助理。研讨人员表明,Aristo 的长时间方针不仅仅是经过科学检验,而是创立一个对科学有更深入了解的体系,它有许多潜在的使用,特别体现在这样三个范畴:第一个是教育和个性化教育范畴,Aristo 能够教导孩子了解科学;第二是协助科学家,供给有关科学概念和从前作业的信息;最终,从长远来看,Aristo 或许有助于科学发现自身,在不同范畴做出相关,比方医学或工程学。当然,Aristo 还有很长的路要走。
-End-
修改:朱演瑞
参阅:
https:///2019/allen-institutes-aristo-ai-program-finally-passes-8th-grade-science-test/