科大讯飞2022年营收增长至188亿元 认知大模型“星火”将在教育、办公、车载等

  4月20日晚,科大讯飞在业绩发布会上首次对外披露了其正在研发的认知大模型“星火”相关消息。

  科大讯飞董事长刘庆峰透露,讯飞认知大模型“星火”将在5月6日正式对外发布,讯飞AI学习机、讯飞听见、讯飞智能办公本、讯飞智慧驾舱、讯飞开放平台等5项应用成果也将同步发布。

  当前,市场对科大讯飞研制通用大模型抱有较大期望。 ChatGPT所带火的对话式人工智能背后的技术支撑为自然语言理解能力。科大讯飞自1999年成立以来,一直从事智能语音、自然语言理解、计算机视觉等核心技术研究,在数据、人才、算法和算力上建立了深厚的优势。

  从二级市场股价来看,2023年开年以后,科大讯飞被纳入ChatGPT概念股之中,股价一度创历史新高70.1元/股,截至4月21日收盘,年内涨幅达到76.8%。

  科大讯飞自2022年Q4开启大模型攻关。从财务上看,讯飞对该大模型产品的投入力度十足。2022年,科大讯飞全年实现营业收入188.20亿元,较上年增长2.77%,实现毛利76.84亿元,较上年增长2.0%。2022年科大讯飞研发投入持续增长,达33.55亿元,同比增长14.28%,在认知智能及大模型技术方面持续积累。

  根据部分投资者的内部测试分享,讯飞星火大模型在解答数学题和长文本写作层面表现可称“惊喜”。测试过程从数学计算题到火星旅行,再到佛学理解、医学问诊、历史问题、脑筋急转弯和求职信写作等,星火模型表现非常稳定且有亮点。

  与当前市面上的大模型产品较为不同的是,科大讯飞预期在5月6日对外推出的大模型产品将以1+N的形态出现。其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公等多个领域的专用大模型版本。

  在5月的发布会中,讯飞将同步发布搭载了大模型能力的讯飞AI学习机、讯飞听见、讯飞智能办公本、讯飞智慧驾舱以及讯飞开放平台。

  教育、医疗、办公、车载等场景是科大讯飞一直以来的研发和商业化方向。多年来,科大讯飞推出了多个细分行业训练人工智能产品。比如,可以辅助基层医生的智医助理,可以帮助学生解答疑问的AI学习机、车载产品中的智能语音交互套件等。

  讯飞方面介绍称,在搭载了大模型之后,讯飞现有的产品使用体验将被显著提升:智医助理、智能客服、智慧家庭、智能汽车的人机交互体验将被提升,实现英语听说、AI学习机、讯飞听见、办公硬件等内容生成及批改辅导产品功能跃升,将使因材施教解决方案、个性化学习手册、慢病管理等个性化服务更加精准。同时,讯飞认知大模型将广泛赋能开放平台合作伙伴。

  相比于以往根据碎片化垂直场景的研发模式,搭载了通用大模型后,研发成本和门槛也将进一步降低。

  科大讯飞高级副总裁兼董事会秘书江涛举例称,比如在机器阅卷、智能助医、辅助判案等各种具体场景中,都需要单独收集大量数据,并且进行大量训单独练。

  如今,基于通用大模型,用AI解决场景碎片化的问题将拥有更高效的解决方案。“下一步模型更加泛化以后,产品的应用门槛就不再像以往一样需要许多定制资源,由此会推动更多的客户来使用相关的产品。”

  根据江涛介绍,科大讯飞正式开始攻坚大模型是从2022年年底开始。不过实质上,科大讯飞在2014年对外发布的讯飞超脑计划,是讯飞在认知智能上的起点。这项计划,可以让机器从能听会说到能理解会思考,解决机器的逻辑推理、阅读理解、归纳知识等问题。

  江涛认为,讯飞星火大模型是长期积累的重要结果。“就像是让你吃饱的最后一个包子,但其实你能饱,是因为前面已经吃了很多个。”

  从积累的角度看,科大讯飞十余年来在智能语音、自然语言理解方面的积累为此次大模型研发带来了巨大的优势。

  在技术上,科大讯飞总裁吴晓如介绍,仅2022年,科大讯飞在人工智能关键核心技术领域累计摘取16项国际人工智能大赛的冠军,其中包括13项常识阅读理解挑战赛OpenBookQA、QASC、ReClor等认知智能国际竞赛冠军。讯飞开源的预训练模型,推出三年多来成为业界星标数最高的中文预训练模型。

  作为人工智能国家队成员,科大讯飞承建认知智能全国重点实验室(首批 20 个标杆全国重点实验室之一)和语音及语言信息处理国家工程研究中心,多年来已经在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术、算力支撑等方面积累了大量成果。

  在数据上,科大讯飞多年来在教育、办公、医疗等领域训练垂直人工智能模型的过程中,累积了大量专业语料。刘庆峰称,这些行业的专业性强,过往训练都在独立的封闭环境中训练,因此可以避免所谓的一本正经胡说八道,从而使结果的保障性更强。

  另外,刘庆峰还透露,科大讯飞拥有语音及语言信息处理国家工程实验室,并且长期在中文语音相关的市场份额超过百分之七十,因此有大量优质合规的数据可以帮助大模型训练。

  在算力层面,科大讯飞自建有业界一流的AI数据中心,并与行业伙伴持续合作,为大模型训练平台建设奠定了很好的硬件基石。此外,在工程技术方面实现了百亿参数大模型推理效率的近千倍加速,为未来更大更多认知智能大模型技术经济实惠规模化应用提供了可能。

  “讯飞在认知领域有最好的算法,还有无比团结和年轻化的研发团队”,我们将在该投入的地方应投尽投,同时保证我们拥有国产化能力。

  刘庆峰还提到,5月6日正式发布之后,星火大模型将在三个方面继续提升:第一,通用更多用户的使用情况,提升多轮对话的理解能力;其次,快速提升各领域的代码训练;以及近一步扩大讯飞既有优势数理能力。

  刘庆峰谈道,“未来认知大模型将以生态赋能的方式,颠覆人机交互和信息生产的方式,带来互联网产业格局重塑的新机遇,达到商业价值和产业使命的双重实现。”

  他把做大模型比作踢球,踢球谁都能踢,但只有梅西能踢好,讯飞就有一群“梅西”这样的“球员”。他表示,“我们有信心达到国内认知大模型中技术领先,同时在教育、医疗等行业中率先深度应用。”