对话高途大学生业务负责人刘文勇:AI数字人是集团三大战略之一,未来或是千亿级市场

  界面新闻记者 | 查沁君

  界面新闻编辑 |

  1数字人的风吹到了教育领域。

  日前,高途(NYSE:GOTU)推出AI考研数字人——文勇老师;中公教育(002607.SZ)也首次公开其虚拟数字讲师小鹿,并发布首款AI课程,由小鹿全程授课。

  ChatGPT引发大模型浪潮,也为数字人的内容输出增添更多互动性和想象力。过去以CG动作捕捉技术为主的虚拟主播模式,正进入AI驱动的3.0时代。

  据前瞻产业研究院数据,中国虚拟数字人市场规模预计2030年达2700亿元,其中身份型虚拟人市场规模占比有望达2/3。但在教育领域,数字人的应用案例还比较稀缺。

  “从课程产品的角度来说,这是一个很大的进步。”高途大学生业务负责人刘文勇在接受界面教育专访时称。

  数字人背后的运行逻辑较简单,只要给到文字内容,就可通过技术转化成语音,再配合形象即时生成视频。

  相对难的是互动,不过如今在大模型的加持下,能通过机器自我学习,实时生成文字,互动效率也在大幅提升。

  目前大家对于通用大模型的使用仍比较谨慎,尤其是教育行业对准确性的要求较高,一般会输入专业内容、设置信息围栏,让回答更加精确。

  是选择自研大模型,还是基于市面已有大模型进行应用开发?高途选择的是后者。

  刘文勇认为,ChatGPT之所以火爆,正因为它是通用大模型,从技术逻辑上看,强者会越来越强,所有人都要在其身上生成专业化内容,而垂直的专业化模型可能在特定范围内的结果略优于通用模型,却无法在交互效率上胜出。

  腾讯教育企业总经理杨晖在接受界面教育采访时提到,教育企业最关心数据安全,尤其是题库等核心业务数据,“例如高途的数据不会出它的服务器,我们也不会去要他们的数据。”

  杨晖认为,行业大模型的未来趋势,应当是科技公司提供基础算力和工具,教育科技公司为数据提供方。

  降本增效是教育行业应用AI数字人的一大底层逻辑。

  教育行业重人力,尤其“双减”前,据北京师范大学2020年数据,仅K12头部十余家在线教育机构辅导老师的数量就有近十万。其承担的工作量多且杂,不仅包括协助主讲授课、课后答疑、批改作业,甚至承担销售角色,沟通课程续报等。

  据刘文勇透露,高途大学生业务线的辅导老师目前有100多人,70%硕士以上学历,但仍有较重的服务压力。

  以考研英语的作文批改为例,每年考前9-11月是忙碌高峰期,由于工作量大,高途前几年为辅导老师设置了帮“每位学生改十篇文章”的上限,如今有AIGC系统协助后,高途宣布删掉所有答疑限制。辅导老师的角色从单一内容创作者变成复合的内容审核者。

  在高途内部,AI也被提升至战略级高度。该公司今年九周年内部讲话中,创始人陈向东明确三大业务方向,分别是线上+线下+OMO、短视频直播(含抖音、视频号)、ChatGPT+教育。

  陈向东还提及,作为战略项目,将投入很大一笔资金深度探索GPT相关方向,内部会组建多个探索团队,不排除投资外部优秀团队。

  “老师都希望能彻底因材施教,但没有任何人真正做到过,因为劳动量完全不支持。”刘文勇称,“而AI似乎撕开了口子,这个事情好像变得有可能了。”

  高途大学生业务负责人刘文勇/受访者供图以下为部分对话内容,有删减。

  界面教育:AI考研数字人项目怎么启动的?其在高途内部的优先级如何?

  刘文勇:受李开复老师影响,我在ChatGPT3.0时代就已关注,在此拐点之前,你能明显感受到这不是真人,但如今GPT令人惊叹,给的答案既准确且能理解人的意思。

  于是,今年初我们开始产品化尝试,人物形象已调试完,还需大量教研人员研发好上课内容。只需文字稿,就能让数字人讲所有该讲的话,包括语气。

  数字人能单独教一些简单课程,如词汇课、晨读课,目前已上线,一天大概售卖数十单。这在互联网领域不算高,还在小范围试跑阶段。

  当然,AIGC远不能替代真实老师的情感与说服力,所以我们还是坚持以名师为核心、AI打配合。

  Larry(高途创始人陈向东)也强调,AI是我们三大战略目标之一,优先级非常高。

  大学生业务部正尝试拓展线下,包括北京、郑州、成都、沈阳,而且是AIGC协助下的新型线下OMO产品。不过我属于步调慢的,必须是一个(地区)盈利了,再做第二个。

  界面教育:相比文娱业的虚拟主播、虚拟偶像、金融业的数字员工,教育行业的AI数字人是否相对晚?

  刘文勇:李开复曾在《AI·未来》中描述AI的四波浪潮:第一波在数据最多的领域——互联网,涌现各种应用。

  第二波浪潮,金融、教育等行业崛起。第三波浪潮,AI更加智能,不仅能听、能看,还有触感。第四波浪潮,AI机器人、无人工厂、无人仓储、无人驾驶将逐渐普及。

  我想这个预测应该是正确的,那些反馈及时、离钱特别近、替代完人力后能出现巨大成本优势的行业,肯定是尽可能早的被替代,而相对传统的(行业)更难或更晚被替代。教育相对晚、也更谨慎。

  界面教育:相较其它行业,教育行业对内容的容错率更低,高途在应用大模型时如何保证这点?

  刘文勇:互动性、准确性对教育行业来说非常重要。只要内容生成速度足够快,就能部分解决互动性问题。目前国内外主流大模型生成速度都已基本达到正常人类应有的速度,甚至Bard的速度略胜一筹。

  大模型在英语上的表现更好;ChatGPT4.0增加插件系统后,数学的正确率也大幅提高。

  我们逐步做了整套跟GPT沟通的话术,譬如辅导老师会要求GPT回答某道题为何错,背后哪些知识点有问题,并因材施教出题,每五题一组,一共25题,难度逐级递增,每题附相应解析。

  辅导老师只需在此基础上进行审校,再辅导学生,学生会明显感觉“老师”对他更attentive(细致关心),也更有针对性。

  界面教育:成本方面,内部有没有算一笔账?AI数字人从生成到后期运营,对比请真人老师,会便宜很多吗?

  刘文勇:会便宜,但不会很多,现在需要很多技术和运营人员来操作。长期来看,我们自己算过,肯定是有机会颠覆某些事情,才会花这么多时间精力。

  随着技术成熟,算力价格也肉眼可见地往下掉,再过几年可能会非常便宜。很多素材第一次做的时候很贵,但都是可复用的,因此成本也在递减。

  我们现在的实验性产品就卖几十块钱,主要是为调优模型而做,肯定不挣钱,也不打算挣钱。这个模型如果跑通跑顺了,在别的地方放大,想象空间就太大了。

  例如教研端被AIGC放大,或将有十倍增速,这个市场是不是有可能成为一个千亿的生意?但就目前而言还有很长验证的路要走。

  界面教育:一个行业共识是,数字人技术本身没有太大差别,关键还是应用层,高途如果先跑通,其它教育公司跟进,未来会形成怎样的竞争格局?

  刘文勇:技术的应用本身没有难度,它就是一个苦力活儿。得有人愿意去吃螃蟹,愿意去做研发,把最新技术变成教学产品,包括若干琐碎的细节和环节。

  行业内拥有技术能力的公司挺多,后面就比谁的动作快,两年之内一定会形成最开始在线直播大课时的(竞争状态),拼运营效率和算力,谁能输出内容,谁愿意踏实做教研。

  界面教育:银行业预计,到2025年,80%的银行会部署数字员工,承担90%的客服和理财服务,教育行业何时能达到该程度?

  刘文勇:面向大学生的产品应该在这三年就会有变化,然后是中小学生,整个过程五年内一定会走完一个阶段。商业变化是很快的,一旦走通,大家都会慢慢接受这个东西。

  AI浪潮已经来了,躲不过去的,你的目标就是跑得更快一点。

  举报/反馈