出门问问大模型和 CoPilot 产品矩阵来了,李志飞:未来十年 All in

  内测探索的伙伴包括教育企业,如 VIPKID。

  来源|多知网

  作者 |Penny

  图片来源 | 出门问问

  第一代 AI 创业公司出门问问继续加码 AI。

  4 月 20 日,出门问问宣布内测探索大模型「序列猴子」,出门问问创始人、CEO 李志飞看来,大模型的最好工作,是做人类的 CoPilot/ 助理,因此发布了 CoPilot 产品矩阵,包含了四款 AIGC 产品,分别为 AI 写作平台 " 奇妙文 "、AI 绘画平台 " 言之画 "、AI 配音平台 " 魔音工坊 "、数字人视频与直播平台 " 奇妙元 "。

  发布会上,李志飞提到,出门问问面向 C 端的升级版语音助手魔法小问,面向 B 端的企业专属大模型的内测探索。当前,内测的领域包括汽车、教育、律所等。

  出门问问成立于 2012 年,为全球的消费者、企业提供人工智能产品和服务。其中包括智能手表 TicWatch 系列、AI 真无线智能耳机 TicPods 系列等。在此次发布会之前,出门问问就已经探索大模型,且做了多个 AIGC 产品,如魔音工坊、奇妙元。

  李志飞为国内第一代 AI 创业选手,他是科班出身,可谓是 AGI ( 通用人工智能 ) 的 " 信徒 "。他是美国约翰霍普金斯大学计算机系博士,前 Google 总部科学家,自然语言处理及人工智能专家。

  在 ChatGPT 横空出世之后,李志飞第一时间拜访了美国的 OpenAI、Google 等公司,试图揭开大模型的奥秘。很快,全国处于言必谈 "ChatGPT",每天有密集的信息,所有企业几乎达成了共识——不能错过这波浪潮。

  这四五个月以来,李志飞的心态已经发生变化。李志飞接受腾讯科技等媒体采访时谈到,从最初要做中国的 OpenAI,到现在认为 " 完全复制 OpenAI 非常难 "。

  这一变化是因为李志飞看到国内的供给侧太多了,想法的转变直接决定了这次发布会的内容:在出门问问基础上,一方面做大模型底层能力,另一方面做基于大模型的各种应用,且连接公司已有业务。

  对于未来,李志飞称要坚持长期主义,他在朋友圈提到:" 未来十年,不忘初心,All in AGI。"

  01

  大模型 " 序列猴子 " 来了,内测领域包括教育

  出门问问大模型 " 序列猴子 " 是一款具备多模态生成能力的大语言模型,模型以语言为核心,涵盖 " 知识、对话、数学、逻辑、推理、规划 " 六个维度,能够同时支持文字生成、图片生成、3D 内容生成、语音生成和语音识别等不同任务。

  不过,当前的 " 序列猴子 " 大模型主要是文本形式,未来会实现多模态。

  2021 年 6 月,出门问问曾推出过大模型 UCLAI,但当时因为缺乏学术研究,且陷入商业模式的窘迫。2022 年 10 月,出门问问重拾大模型的研发。

  据李志飞介绍," 序列猴子 " 这个名字的灵感,来源于数学家埃米尔 · 波雷尔在 20 世纪初提出了 " 无限猴子 " 定理,即只要给予无限时间,一只猴子几乎必然能够打出任何文字,比如莎士比亚的《哈姆雷特》,而如果喂给机器猴子海量的文本序列,通过大规模算力去训练它,就能练就有智能的 " 序列猴子 ",而大模型是一个序列模型。

  李志飞称," 序列猴子 " 在训练过程中已经展现出了 " 涌现 " 能力,目前正处于 " 顿悟 " 阶段,未来提升的速度会越来越快。

  在针对个人应用方面,李志飞现场演示,比如回答 " 湖南和湖北哪一个省会的人口更多?"、" 天猫背后的公司的创始人本科毕业于哪个学校?" 等问题,可以应对自如。

  在 B 端,李志飞透露," 序列猴子 " 企业专属大模型已在首批汽车、教育、律所、金融、运营商、旅行、传媒、设计、智能硬件、医疗十大行业内测探索伙伴,企业方包括中国移动、中国工商银行、中国一汽红旗、春秋航空、VIPKID 等。

  发布会上,VIPKID 创始人米雯娟以视频的形式出现在发布会上,提到将会和出门问问一起探索 "AI+ 教育 " 的新可能。

  对于国内与海外大模型的差距,李志飞说," 国内模型水平大概处于 FLAN 阶段,比 GPT4 晚 16 个月。"FLAN 是谷歌在 2022 年 1 月发布的模型。

  对于自家的大模型,李志飞很有信心,他说:" 如果说 GPT-4 是 100 分,我们的目前是 50 分,市面上有的模型可能是 33 分。"

  (出门问问官网截图)

  02

  未来 CoPilot/ 助理将无处不在

  李志飞认为,未来,个人与企业专属的 CoPilot 将无处不在。为此,出门问问推出了 CoPilot 产品矩阵。

  1)奇妙文:AI 写作助理

  发布会上第一个亮相的 CoPilot 产品是 " 奇妙文 "AI 写作助理,AI 写作能力覆盖了职场办公、市场营销、新媒体和创意写作四大内容创作场景,可以帮助用户在撰写年终总结、客服话术、剧本、广告文案等内容时,提供灵感和创意方向。

  " 奇妙文 " 有八大 AI 编辑功能,分别为风格转化、要点提取、校对纠错、续写、改写、扩写、缩写、翻译," 奇妙文 " 还能在写作中自动生成图片。

  2)言之画:AI 绘画助理

  " 言之画 " 是 AI 绘画平台,服务于设计师、插画师。" 言之画 " 支持二次元、蒸汽朋克、插画等 8 种创作风格。用户只需输入文字," 言之画 " 就能一次性生成 8 张光影逼真、细节丰富的 2K 高分辨率图像。

  除了以文生图,它还拥有以图生图、动图生成、个性头像生成等 AI 绘图能力。对于企业用户," 言之画 " 还支持专属模型定制,能够根据企业风格定义模型风格,并且支持多人协作生产。

  3)魔音工坊:AI 配音助理

  面向 AI 配音场景,出门问问推出了新一代 AI 配音产品 " 魔音工坊 "。" 魔音工坊 " ( 海外版 DupDub ) 已经开放了超 1000 种音色、超 2000 种声音风格以及超 20 种方言和外语。

  " 魔音工坊 " 搭载了大模型 AI 写作功能,可以进行 AI 写作、AI 配音和剪辑等多个场景,在它的辅助下,用户可以完成影视解说、有声书、在线教育、新闻播报等集文案与配音于一体的内容创作。

  目前," 魔音工坊 " 已经与微信读书、少年得到、大众等多个行业的头部企业达成了合作。

  4)奇妙元:AI 数字分身

  在文字、图像、声音等生成能力基础上,出门问问还退出了 AI 数字形象创作及直播平台 " 奇妙元 "。

  据介绍," 奇妙元 " 平台现有超 100 款数字人、超 1000 款 3D 数字资产、超 1000 种声音。凭借多模态生成技术," 奇妙元 " 平台目前共支持图片建模(2D 数字人)、视频建模(2.5D 数字人 ) 、3D 建模 (3D 数字人)三种不同形式的数字人生成。

  形象克隆功能,仅需一段 5 分钟的真人视频素材,即可 1:1 复刻用户的形象神态,为用户打造声音一致、动作自然的数字人分身。

  此外,出门问问还升级语音助手,发布会上推出 " 魔法小问 ",李志飞称,这款智能语音助手可以理解为是 "Siri 与 ChatGPT 的综合体 "。

  根据介绍," 魔法小问 " 可以帮助用户查百科信息、查天气、查餐厅、查酒店,还能与用户对话聊天。在现场演示中,比如向 " 魔法小问 " 提问 " 这附近有哪些好吃的川菜馆 " 时,它能按照远近距离、评分星数列出附近推荐的川菜餐厅。

  出门问问早在 2014 年就发布了首款语音助手 " 小问助手 ";2015 年,更新 " 小问秘书 ";2017 年,推出了全场景 VPA,并在 2019 年进行升级,这一次的 " 魔法小问 " 可谓是更智能。

  随着新老选手加入 " 大模型 " 的竞赛,这个领域越来越卷了,但是,最后成功者可能是少数,各家未来的发展值得关注。