流利说联合创始人、首席科学家林晖:AI+教育创新的历史、现在和未来

7月10日,由世界人工智能大会组委会、上海市徐汇区人民政府指导,中国信息通信研究院、上海开放大学、上海西岸开发(集团)有限公司支持,中国互联网协会智慧教育工作委员会、上海教育软件发展有限公司、上海开放远程教育工程技术研究中心、上海市人工智能行业协会、上海市人工智能学会协办,亿欧EqualOcean在上海主办的2021世界人工智能大会“技术创新与人才培养论坛”顺利举办。

在论坛上,海内外知名专家、学者、企业家,以“推陈致新,乐育人才”为主题,从人工智能技术创新、人工智能与教育融合和人工智能人才培养三个方面展开,进行了多维度的研讨与对话。

流利说?(NYSE:LAIX)联合创始人、首席科学家林晖以《AI+教育创新的历史、现在和未来》为题发表演讲。

核心观点:

1. 优质的教育应该具备因材施教的特征。但传统教育和普惠的因材施教的教育,有巨大的鸿沟。那么,如何让优质教育更多的普惠化,即“可规模化的因材施教”,则需要在标准化和个性化教学之间,找到一个平衡点,用技术赋能教育规模个性化。

2. AI技术的发展在过去十年里发生了一系列的突破。深度学习的出现,特别是感知类技术与生成技术的逐步发展成型,使得 AI+教育有了本质的突破,实现了从不可用到可用的变迁。

3. 在教育领域,大部分AI+教育的创新与落地并没有在核心的教与学环节做到真正的个性化,离真正的规模个性化,还有很长的路要走。规模的个性化有两大核心要素:一、数字化的内容足够丰富;二、算法足够精准。而对于这俩方面,目前技术与实现阶段上都处于早期发展阶段。

4. 推动规模个性化的解决方法是在这两个核心要素维度上不断精进,一是用更精准的AI对学生做更好的评测;二是制作更多数字化的内容。

5. AI+教育的创新,因为各种限制,大多还未在核心的教和学的环节并没有发挥真正的作用,未来五年,政策的推动会成为行业技术创新的驱动力之一,尤其是在基础教育人群中的基础设施数字化发展。

以下为流利说?(NYSE:LAIX)联合创始人、首席科学家林晖演讲原文,亿欧EqualOcean在不改变嘉宾原意的基础上,进行了编辑,供行业人士参考。


大家下午好,很高兴有机会跟大家分享。流利说创立于2012年,于2018年在纽交所上市,是全球第一家AI+教育的上市公司。回首过去十年的创新,还是有一些感悟的,所以今天分享的主题希望在AI+教育的创新这件事情上,跟大家分享一下我们的观点。

今天在张总后面还是有意思的,张总提了一些关于AI教育的观点和看法,整体偏悲观,但我也想给在座的各位带来一些悲观中的乐观。

首先在开头跟各位分享的是大家比较容易认可的观点:优质的教育应该具备一个特征是因材施教的。孔子很早就提出这样的观点,要因材施教。这是一个关于偏定性的说法,我们知道要做个性化的学习,要根据每个学生,每个学员不同特点,给他相应的教育。

在所谓的教育科学领域,关于定性的看法有一个定量的分析,我给大家分享一下。在教育领域有非常著名的Two-Sigma的问题,是由美国教育学专家Benjimin Bloom在1984年提出来的,他做了大家都认可的因材施教这件事情的定量的分析,是否真正因材施教确实可以带来学习效果的提升。它的结果也是非常有意思的,如果我们能够对一个学生做到一对一的辅导,做到真正的因材施教,他可以从原来的50分达到98分,这里面一个巨大的鸿沟就是Two-Sigma,两个标准差的问题,传统教育和真正因材施教的教育,是有巨大的鸿沟。

在过去历史中,大家都在想我们能不能够把优质教育做更多的普惠化,就是所谓的“可规模化的因材施教”,这件事情能不能做到呢?教育的本质,其实我们还是认为它是偏服务的行业,服务就意味着我们需要有人、一对一,这里面的问题也是在于它的边际成本是高的,因为优质的教育资源,优质的老师还是比较稀缺的,时间有限,人数有限,我们中国有将近2亿学生,但其实在编老师不到千万,优秀老师更是凤毛麟角。

做到普惠的个性化,有一种思路就是做产品化。产品则意味着标准化,从最早印刷术出现到后面的书本,都是某种程度把我们的知识产品化,这样它可以更低边际成本的方式做更大范围的传播,从而实现可规模化的知识传递。

然而,今天我们看这件事情的时候,我们想的问题是,能否在所谓标准化和个性化之间,找到一个平衡点,用技术带来规模个性化。人工智能是大家想到的方向,因为人工智能本质是解决生产力的问题。

这样的思想在教育行业,一代代先驱们已经做了尝试,1960年就提出“教学机器”的概念,照片可以看到,简单的机器,根据学员做的题目,给到不同的反馈,当时甚至也有这样的预测,到1965年,超过一半的学校都有这样的教学机器。回顾历史,我们看到这样的思路,通过机器带来更好的教育,更好的教学,更个性化的教学一直是大家想做的。

那么今天我们在这件事情上做到什么程度了?有什么样的反思、复盘以及对我们未来发展方向,有什么指导思想?首先跟大家快速回顾一下教育科技的演进史,AI+教育可被认为是科技的子集。

我们按年代分,80年代个人计算机的出现,90年代互联网出现,2000年代移动互联网出现,再到2010年进入万物互联的阶段。随着技术的进展,教育科技这件事情上,这个图展示了美国教育科技的发展,也确实在是全球相对比较领先的,我们看到80年代有一些教育科技已经用在教育领域了,90年代教育科技作为补充,已经逐渐进入到教育体系里面,直到2000年代,教育进入到了更核心的教学流程,到现在,至少他们认为已经是更好的融合了。

?AI自身的演进:从50年代,所谓AI概念的提出,到专家系统提出,再到浅层机器学习算法的出现,直到2006年深度学习出现,经历了很大变化。深度学习的应用,技术层面上产生了质的改变,让很多不可能变成了可能。

对于AI技术实际突破方面是如何影响AI+教育的?我本人在90年代,进入AI机器学习领域,也算是科班出身,确实看到了在深度学习出现以后,AI+教育发生了非常本质的技术突破。一类是感知类的技术,在此技术突破前,我从事于语音识别领域。那个阶段,语音识别基本不可用,在实际使用场景中经常闹笑话。深度学习的出现推动语音识别技术在实际场景的应用中,达到足够高的准确率。在2010年到2015年左右,识别准确率已超过真人平均准确率。同样的感知技术,比如图片识别技术,也在此阶段,因为深度学习与数据的增加,有了较明显的突破。感知类技术的本质突破,给不同的行业带来了变化,包括教育行业。

另一类技术是关于生成的技术。这类技术大众接触或了解不一定多,我这边列了几个:如2016年的WaveNet技术,WaveNet出现之前,机器合成的声音,不自然不仿真。但WaveNet的出现让机器合成的声音能够以假乱真。类似技术我在不同的场合做过真实的图灵测试,让现场的同学们对比真人声音与机器声音,差异度不高。同样,这类技术还能生成人的样子,例如虚拟主播。在过去几年,我认为有比较大的突破,实现了从不可用到可用的变迁。

如果大家对AI领域比较了解,最近GPT-3的技术,在大量数据以及超多神经元基础上,已经能够生成人类自然语言文字系统。语言可以认为是智能的“皇冠上的明珠”,现在通过机器,可以写出逻辑通顺,没有明显问题的文章,这同样属于技术本质的变化,本质的变化确实能够影响行业。

另外, AI技术本身的突破离不开基础设施的变化。回看过去十年,很本质的变化是基础设施,移动互联网的出现,使得数字化变得更加可能,基于数据,我们才有可能在上面做更多的智能性的产品。

前面讲了我认为在过去十年里面创新的驱动力,我们再具体看看,在教育这件事情上,这些驱动力发生了什么变化?过去十年,我们把教育从核心到外围做了区分,外围更多是教学教务管理,核心的在于教学环节:课堂开展环节(如何教、如何学)与学生学习的整个流程。从时间线看,技术对一个场景的切入是外围到核心的过程,相对较简单的是外围做选课或排课,背后涉及到算法,便可以使其高效化。

在2010年前后这一关键时间点,随着移动互联网出现,感知技术发生变化,语音识别与图象处理更准确,技术赋能使得模拟世界和数字世界得到更好的连接,同时教育领域对此的应用也开始落地。

其中典型的代表:口语测评。在2012年以后,这一技术趋向成熟,并且开始普及应用。另一代表:拍照搜题。拍照搜题本质就是把一个图片里面的题识别出来,在海量题库里面做匹配,做相应的推送,近年来很大应用落地,我们都看到了实实在在的变化。比如现在很多拍照搜题应用,日活能做到百万甚至千万的级别,也佐证技术解决了用户的一部分需求,能带来实际价值。

时间线往前看,我们看到更多所谓AI+应用的创新,逐渐深入到核心环节:教和学的环节。尤其在2019年到2020年之间, AI课概念传播广泛。特别是在少儿领域,有AI课学英语,AI课学音乐等等。

在这一系列的创新过程中我们看到了很多应用落地,但应用落地是否带来本质的改变?这个本质改变又是否是我们想要的所谓规模的个性呢?规模个性化是否实现,是否真正有效果?这是我接下来想跟大家进一步分享的观点。

很多应用创新,也看到了落地,但是否规模个性化实现了?是否有效果?这里面我的观点也是比较悲观的,跟前面嘉宾分享的类似,今天我们看到比较热闹的切入到所谓核心教学环节的无论是AI伪直播还是AI课,本质上还是千人一面,并没有做到真正个性化。很多AI课,大多时候学员本质是在看动画片,只包含非常浅显与简单的交互。上课流程与教学环节并没有真正做到非常多的个性化,缺乏很有针对性的互动。实际效果上,虽然我们看到了很多创新,也有一些效果,但是离真正规模的个性化,还是有比较长的路要走的。

其中核心的问题是什么?为什么难?因为要做到规模的个性化,我认为有两个核心的要素,这两个核心要素在目前的技术以及目前的实现阶段上,都处在比较早期的阶段这两个核心要素是:一、数字化的内容足够丰富,数字化内容不是简单的一个视频或者音频,而是视频、音频背后的结构化信息,到底教了哪些知识点,是关于哪部分内容的讲解,内容要足够丰富,才有可能真的做到千人千面。二、算法足够精准,对学生的学习状况评估是否足够准确,它的推荐是否足够正确,这两者缺一不可。

如果没有足够内容,即使算法检测到学生的需求,也没有相应的内容给到学习者,从而提升相应的薄弱点。做出一个智能性很高,可用的数字化内容也很多的技术产品,才算真正做到个性化的学习。

关于解决方向,无外乎在这两个维度上不断精进,我们除了用更精准的AI对学生做更好的评测,还有怎样制作更多数字化的内容,前面提到在生成技术上的突破,是能够帮助我们生产更多数字化的内容,通过一些自动或者半自动内容生成,通过一些系统,通过技术,把一些模块化的东西固化成系统,像搭积木一样搭出新的内容。

我想给一些相对乐观的信息,虽然今天AI+教育的创新,因为各种限制在核心的教和学的环节,并没有发挥真正的作用,所谓的个性化是伪个性化,不一定有真实的效果,但流利说从将近10年前创业开始,就一直在相对限制的领域——成人学英语这件事情上,做了很多探索,我认为也取得了一些成绩,这个成绩能给我们对未来的展望,带来一些乐观的信息。

简单回顾,流利说2012年创立,2013年上线第一个产品就具备语音打分技术,是把技术产品化推向用户的开端和起点。今天市场上所有学英语的软件,这一项技术都已成为标配。

2016年流利说发布了懂你英语,帮助用户提升英语学习,懂你英语的课程本质上就是AI课互动课,用户跟背后系统的互动频率非常高,我们后端的结构化内容推荐算法也是实实在在给每个用户推荐不同的信息。

在此之前的系统迭代过程中,我们不断优化所谓的AI推荐方法。跟大家分享一个我们取得的实际成果,不单只是概念,我们做的是能够了解个性化推荐是否能在大量用户基础上,给用户相关行为带来改变。具体反映在用户留存,更直接反应在用户的复购。

流利说在商业链路上,通过对用户个性化学习体验的优化,复购率达到了30-40%的提升。通过更个性化的学习体验,促进用户续费。花钱为学习体验投票也是我们过去的成果部分之一,而要完成这个项目,需做到整个学习过程的数字化。

时间线再往前,懂你英语之后,流利说在个性化互动学习的产品上,做了更多的探索,包括我们发布了AI互动课2.0,涵盖更多模态的互动,以及最近发布的一对一实时互动直播课。

这边还是再稍微花一些时间讲一下到底有没有效果?关于效果的研究,我可以非常自信的在这边跟各位分享这个报告,这份报告的科学性和严谨性非常高。报告结果显示:我们测试的学生使用个性化课程,效率提升可能达到三倍。普通课程提升一个级别大概要100到500小时,我们使用的个性化平均提升时长30到40小时。这也是流利说个性化学习,AI+教育创新上,有实实在在效果的证据。

往前看,未来五年或者十年,AI+教育的创新动力来自哪里?首先,技术上肯定有更新的突破,同时技术突破会溢出到行业应用里。未来五年到十年依托于技术上更新的突破,进而产生像过去十年来一样强大的驱动力推动行业发展。

我认为在中国,未来五年很有可能发生的一个创新驱动力是来自于政策的推动。国家推动数字化转型,教育的数字化转型也是其中很重要的一部分。一些AI技术已经比较成熟了,比如感知技术。目前我认为缺的是基础教育人群里面的基础设施数字化,目前并没有做到很好的打通。

在未来五年,这件事情很有可能发生根本性的变化。数字化转型的政策和项目接下去会逐渐落地,我们也能够看到国家集中力量办大事的可能性,大家可以设想,如果数字化基座建立起来,数字化打通了以后,所有之前的智能化技术都能够在这样数字化基础上给学生做更好的评估。如果数字化内容建设更加丰富,也能够做更加个性化的教学,跟课堂做结合,这里面的可能性很大。

时间再往前看,如果计算平台本身发生变化,比如AR和VR的出现,也会带来一些变革。此外人工智能技术,在交互层面有更进一步的进展,也有可能带来更好的AI+教育的创新。

最后,跟大家简单分享一下我们在未来有可能出现的,真正涉及到教和学环节个性化的探索与进展。去年年底流利说推出了真正能够切入到核心教和学环节的AI老师,在直播课程中,学生可以跟AI老师实时互动。流利说的AI老师已经给超过百万学生上过课。

最初团队对于这个项目的开启,还是比较的忐忑。所有落地的AI课程中,可以与AI对话的时长都很短,比如简单询问天气。但今天我们可以做到AI老师和学员的对话时长,平均超过10分钟,这可能是世界上跟学员对话平均时长,最长的AI系统。同时这个系统得到了用户的肯定,在用户评价中,得到超过40%的满分,平均评分达到8-9分。我们AI也可以实时找出学生的问题,跟学生有针对性的互动,我认为这是在AI+教育创新切入到教和学核心环节中落地的好产品。

今天我的分享到这里,谢谢大家!