11月15日-16日,“全球AI+智适应教育峰会”在北京嘉里中心大酒店盛大开幕,峰会由雷锋网联合乂学教育松鼠AI,以及IEEE(美国电气电子工程师学会)教育工程和自适应教育标准工作组共同举办,汇聚国内外顶尖阵容。
AI智适应学习是目前产学研三界关注度最高的话题之一。此次峰会,主办方邀请了美国三院院士、机器学习泰斗Michael Jordan,全球公认机器学习之父Tom Mitchell,斯坦福国际研究院(SRI)副总裁Robert Pearlstein、美国大学入学考试机构ACT学习方案组高级研究科学家Michael Yudelson等顶尖学者。
16日下午,松鼠AI首席架构师 Richard Tong 发表主题为“AI自适应教育的架构和策略”的精彩演讲。Richard Tong 介绍了松鼠AI智适应教育的架构和策略,详细阐释了平台架构的四个层面,并谈到自适应平台架构的愿景是为每一位同学打造超级AI导师,这将使学习变得有效、高效、吸引人。
以下为演讲实录(雷锋网做了不改变原意的编辑与整理):
松鼠AI的自适应架构
多谢大家能参加AIAED大会,刚才大家听到的都是商业、投资相关的,我回到技术,讲一讲我们自适应的架构。
我们讲架构,大家就要了解架构首先是为什么?我们在做自适应教育这样的领域,想了解架构这个事,我们建立整个愿景会提供一个依据,来告诉我们这个架构该怎么设计。
我们的愿景是什么呢?大家这几天可能听到了很多,我们要有一对一的智适应导师,让每个学生的学习更高效、有效、吸引人,和他能更贴近。我们想谈一谈我们是怎么走过来的,我们的愿景也是建立在美国一些先驱的实践基础上的,我们的企业从很多公司学到了很多,包括Dream Box这些公司。这和我们自己怎么来实现这个东西相关,有几个比较重要的,把我们长期的愿景转化成真正要提供实践的环节。
刚才我为什么要提到一些先驱,因为我们站在巨人的肩膀上。我们做AI教育的时候,我们要看到AI教育的本质是什么,要想做好的核心因素在哪里,而且之所以我们从以前这些公司里学到了东西,到底哪些东西给我们提供了帮助。
其实AI教育更多的是一种AI应用,AI应用跟传统技术应用有不一样的地方,有四个关键环节和关键因素:
· 商业模型。AI能不能成功或者能不能落,还不是由于技术决定的,而是由产生的产品能不能落地来决定。
·AI所要求的能力和做AI技术人的能力构成的。
·数据,尤其是先进AI相关的,比如说深度学习,即使传统机器学习对数据的量要求大,对质的要求也很大,所以AI要考虑数据的问题。
·AI要求很强的计算力。
在这四个方面实际上是缺一不可的,里面只要有一个地方有短板就成功不了。我们学习到了先驱的什么东西呢?一些传统的,在美国是可行或者是OK的东西,在中国是不行的,或者在中国会有相当大的障碍。
我之前在Kenwton帮很多中国企业讨论自适应的合作,但是很大的问题就是在中国这些东西都落不了地。为什么呢?因为B2B要求大家专业化的分工,专业化分工的前提是什么?要求要有相对的稳定性,接口要相对比较稳定。
但是AI这件事你会发现,尤其在目前的阶段来说,它对各环节的要求都很高,要把它结合起来做成一个产品,第一要不断迭代,第二在接口上的变化是非常大的,所以我们一开始智适应在中国落地的时候,Kenwton失败了,当时跟好未来等等做了很多项目,效果都不好。
不好在什么地方呢?不是技术不好,而是在中国落地的时候周期太长,一个产品在中国拿到好的智适应技术,去落地的时候对内容有很大的要求,对教学方式有很大的要求,对提供产品的方式也有很大的要求。在这些东西不成熟的情况下,一个周期过去了,试错还没试完,时间已经没有了。而且教育这个行业对整个学期的要求,对整个上线的要求有很多不可控性。
比如说每年春季、秋季开学的时候,产品没有准备好的话,上不了线的话,这次迭代的机会就错过了。本来9月1日要上线,如果9月16日你还没有上线,下次再想上线就是春节以后了,AI要求迭代非常快,而且结合性非常强,这样的公司在中国做B2B基本上是没有机会的。
在中国我们也学到了一些东西,在AI的情况下需要非常强的能力,也就是说要想把AI的项目做好,人员既要懂教育的整个场景,又需要有很强的AI本身的能力,很多时候需要有很强的工程能力,要有很多能力的结合。
中国的机器学习或者是AI学习,跟美国相比还有相当大的差距。中国一开始做的时候,栗总做松鼠AI的时候,要找到把四项能够都能够拼起来的东西。把好的商业模式,AI的能人,能够拿到数据的途径以及要结合强的计算力,把这些东西能够结合在一起才有成功的可能性。
所以我们自己设计的话,我们是从头到尾完整的AI连续的自适应,另外我们从数据角度来讲是全面、完整、快速增长的数据模型。
为什么我们要做这么一个东西?这也和一开始说的教育里面最大的智适应解决的痛点是什么相关。自适应最大的痛点来自于传统教育的低效或者是无效性,只要是老师一对多的情况下,我们觉得一定是无效或者低效的。也就是说学生在传统课堂里花的时间,和一个一对一相比有一个很大的效率差距。
我们为什么不认可像双师课堂,或者是课后人工智能作业,这是渐进性的提高,有一定的帮助,但是没有解决最根本的效率低下问题。最根本的效率低下问题,是一个老师哪怕给三个学生或者是十五个学生,还是四十个学生,教的时候,每个学生在学的过程里因为自己每个人的要求不一样,针对一个人好的东西,针对另外一个人不一定好。
人工智能就是要诊断他在学习过程中的问题,根据他的学习路径贴近。如果你没有这样一个完整的贴近机会的话,这个AI就实现不了。
崔博士那天讲到我们产品的时候大家也知道,AI就是要解决这七个问题,能够准确的诊断学生的学习状态、提供有效的学习路径、制定合理的学习目标、在教室里还有辅导老师给他提供一个合适的预警机会,以后能用主观因素的认知帮助小孩提供信心、态度、习惯,帮助家长给小孩提供更好的学环境,这是整个AI自适应平台的要求。
我们自己具体是怎么做的呢?给大家提供一个框架,我们讲一些产品和系统,这个东西是什么呢?这张是讲主要系统的模块,在这个模块之间我想专门提几个我们认为对我们来说,从设计角度比较重要的东西。因为AI里很重要的是数据,数据来自于两个方向,一个是能大量的积累,另外数据要有深度的关联。
这张图里有两块是和数据相关的,最右边的LRS,中间有一个MDS,这两个东西给我们提供的是把学习行为数据,和我们的知识图谱、题库、内容库和教学内容的东西连接起来,这样才能达到数据有效的长期使用。以前我们在实施过程中发现了一个很大的问题,很多企业的数据是单维度的,可能有学生所有做题的记录,可能有学生所有考试的记录,可能有学生所有英语阅读的东西,发音的数据,但是单个来看的话,数据有效性很受限制。
如果你想从里面找到数据的话,如果只有一个维度的数据的话,你能做的事情非常有限,而且需要大量的人工去建标签或者人工的做相应的反馈。如果你的数据是多维度的,是有相关联系的,如果一个学生不光有做题的数据,还有做题之后看视频的数据,还有做题的时候当时表情的数据,还有做题的时候脑电波的数据,这样我们可以在各个方面把这些数据结合起来,能够做到的东西比以前要多得多,它能提供的可能性大得多。
即使不说脑电波或者表情数据,哪怕把学习目标了解了,就是学生做一道题的时候,当时学习的目标是什么,想学的是什么知识点,这套题做之前已经了解了哪些知识点,不了解哪些知识点。
如果知道了这个信息以后,你的做题数据包括以后的其他学生行为数据,对你的机器学习和整个老师的诊断来说有非常大的作用,我们是通过MDS把数据结合起来,LRS把数据积累起来。
另外想谈一下自适应引擎,不管是刚才一起作业他们提到的东西,还是掌门一对一提到的,都提到了比较类似的东西。
我们的适应引擎提供了两个最基本的功能,它自己的大脑里需要有什么东西,第一个是了解一个学当时学习的状态,了解他对知识点了解的程度,和所有知识点之间的联系,互相之间的关联性是什么样的。第二个是推荐路径,我知道这个东西以后怎么给你好的推荐,这是我们的引擎最重要的核心部分。
这个机器需要知道什么呢?一方面需要知道学生长期的数据,越长时间越好,还有一个他需要了解学习它学的东西,像一个GPS导航一样,学生要去哪儿?这些地方之间的关联是什么?还有一个学生可以做的事情是什么,可以看的内容是什么,和我们导航的东西有什么联系,这样才好给他推荐。第三个就是学生自己的状态,包括他的学习目标是什么。
有了这些,自适应引擎就可以转起来了,后面还有很多其他相关的东西,因为时间的关系我们就不一一介绍了。
为未来打造超级AI导师
我想谈一谈我们以后要做的,未来要打造AI教室所需要的东西。
刚才由于三个层面所谓模型的信息,最顶上那一层是DKT还有Dan新开发的一个模型,可以很好的认知学生的状态,当然还有其他的模型,可以根据记忆的消减来给学生提供以后的学习机会。
第二层是多输入的,或者是通过不同的信号来输入,来了解学生的情感和注意力的状态,这样它主要的目的是为了给老师提供更好的预警,老师什么时候干预学生、提供学生,提供这样一个层级的作用。
第三层是我们比较新的开发的东西,通过对话的形式帮助学生做错因分析,帮助学生做一些具体的“诊断”,这个在开发的过程中,我们跟CMU在做一些新的东西。
我们为未来打造超级AI导师,在国际上有大量的合作,现在已经跟我们有合作关系的有SRI、UC Berkeley,中国社科院,澳大利亚UTC,现在马上要建立合作关系的包括CMU,孟菲斯大学,西班牙的IIA和MIT,我们都在谈判中。
我们希望通过跟顶尖机构建立合作关系,利用我们的标准和数据共享以及开放平台的优势,来提供更强的AI功能,为每一个小孩提供超级AI教师,多谢大家。
(新媒体责编:shang080503)
声明:
1、凡本网注明“人民交通杂志”/人民交通网,所有自采新闻(含图片),如需授权转载应在授权范围内使用,并注明来源。
2、部分内容转自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行。电话:010-67683008
人民交通24小时值班手机:17801261553 商务合作:010-67683008转602
Copyright 人民交通杂志 All Rights Reserved 版权所有 复制必究 百度统计 地址:北京市丰台区南三环东路6号A座四层
增值电信业务经营许可证号:京B2-20201704 本刊法律顾问:北京京师(兰州)律师事务所 李大伟
京公网安备 11010602130064号 京ICP备18014261号-2 广播电视节目制作经营许可证:(京)字第16597号