“百模大战”来了!|有洲科技

  

  一夜之间,AI大模型热得发烫。

  OpenAI为大家找到了产品落地之路,引发一众大厂一哄而上。

  本轮“狂飙”下的第一个玩家是百度,百度本身浸淫搜索领域、中文垂类知识多年,掌握大量高质量通识数据,而且早在2010年便成立了自然语言处理部,本就是大厂中最早探索AI的一批,如今也是最早推出了类GPT应用文心一言。

  

  百度最先挑起战事,阿里、商汤跟得最紧、跑得最猛,都已发布类ChatGPT产品。

  4月以来,大模型井喷,入场者接连发布大模型的新闻消息应接不暇。

  4月9日,360在2023数字安全与发展高峰论坛上发布类GPT大模型“360智脑”,周鸿祎亲切地称其为“刚生出来的孩子”。

  4月10日,自学术圈走进商界的AI独角兽商汤科技对外发布了“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力并提供实机演示。

  4月11日,阿里在2023云峰会上发布“通义千问”大模型并向社会企业开放使用,邀请企业参与共创自己的大模型。发布会上,张勇在宣布将阿里系应用接入大模型重做时,炫富式地展示了阿里系那令人眼花缭乱的商业应用,完善的APP矩阵与数字商业积累显然成为大模型训练的基石。

  

  紧随其后的腾讯“混元”大模型与华为的“盘古”大模型,一个把守着丰富的社交场景与信息流数据,另一个也手握智能硬件的高频流量,而且两者都通过云服务的市场地位获取了极富商业价值的数据资产。

  备受市场期待的选手,还有京东、昆仑万维、飞书、字节跳动,这几家虽然没有大张旗鼓发布基于大语言模型的新产品,但也找机会对外重新梳理大模型体系或透露新进展。

  除了这些大公司之外,根据民生证券相关研报统计,目前国内至少已经有30多家大模型亮相,其中不乏参数规模甚至超过ChatGPT规模的大模型。厂商涵盖了互联网巨头、AI上市公司、服务器龙头企业、科研院所与一级市场创业公司。

  大模型应接不暇,新产品层出不穷,ChatGPT风口上的诸神混战才刚刚开始。

  

  正如微软向OpenAI投资100亿美元,将GPT全面接入自家应用一样,让浩如江海的中小企业通过自己的大模型来打造属于相应的中小模型,是OpenAI昭示的商业落地路径。大模型的井喷是这条路径的复现,遵循着相同范式——花大钱做“费力不讨好”的大模型,争取市场地位。

  这一范式实际上也不新鲜。打个比方,在数字化时代下的应用需要一个操作系统,微软凭借Windows占据PC头把交椅,即使后来者创造了无数使用体验更好的产品,也难以动摇微软的地位,因为这些产品的开发都基于Windows这个操作系统。

  而智能化时代同样需要操作系统,在OpenAI进不了国门的前提下,市场自然会寻求替代品,如今的大模型之争本质上是下一代操作系统之争。面对当下国内大模型喷涌,APUS李涛认为,“所有人在争大模型的本质,实际上是争操作系统的话语权,一旦谁能控制,就会获得最大的商业回报”。

  在他看来,中小模型对应商业场景,因此中小企业应致力于此;大模型对应行业标准,获取话语权意味着主导未来生态。

  让子弹再飞一会儿

  “大厂们都是先来占位!”章容称,“因为大模型的能力还远未成熟落地,现在互联网大厂更像是在秀肌肉”。

  一位即将进行AIGC创业的AI从业者告诉小编,大模型就像是AI时代的操作系统,大厂抢先占位,不排除是为了抢客户、抢人才。毕竟,大佬们下场官宣创业,往往伴随着招人。

  但更值得注意的是,大模型的能力越强,API可以实现的应用端场景就越丰富,相当于大厂都在争AI时代的“App Store”。大模型并非一朝一夕就能够炼造的,现如今大厂选手大模型动态层出不穷,本质还是过去几年技术积累的产物。

  做大模型,必然伴随着重投入。在国外,微软投资OpenAI,先后投资了超100亿美元,而OpenAI对于GPT-3的训练费用已经超过1200万美元。这一点,从国内大厂的研发投入也可窥一斑。

  财报显示,2022年百度的核心研发费用为214.16亿元,占百度核心收入比例达到22.4%。过去10年,百度研发投入超1000亿元。根据商汤财报,过去四年,商汤总营收为149.8亿元,而研发开支则达到了114.3亿元,营收占比达到76.3%。

  

  或许也是因为如此重的投入,对于大模型领域内卷加剧,业界出现一种讨论,国外已经跑出了GPT-4,面对如此大的差距,国内新选手现在杀入战场做大模型,意义大不大,会不会造成人才和资源的浪费。

  2023年以来,多位大佬宣布下场进行大模型创业,但是一部分人的思路已经开始调整。出门问问创始人李志飞最近多次对外表示,做大模型不能过于乐观,贸然进入难度很大,而且竞争激烈。他的思路已经从开始的做通用型大模型,转向更注重结合自身业务场景,做垂直整合大模型。

  他认为,国内在1-2年之后,将会有50家以上的公司拥有自己的大模型。包括互联网大厂自研、中型互联网公司基于开源大模型微调、一些AI公司及垂直领域的甲方,都会有大模型,市场大模型的供给一定不会太少。

  也有很多业界人士认为,未来大模型的发展,将会是头部几家寡头之间的竞争。

  但是,中国必须做自己的大模型,已是共识。出现分歧,本质上还是因为,大模型的鏖战才刚刚开始。

  民生证券相关研报指出,目前表面上大模型百花齐放,不再稀缺,是因为开源基础以及大公司本身的算力储备与资金实力,单纯发布一个大模型门槛,没有市场想象那么高。但是能够拥有高质量数据场景,才能持续迭代,性能逐步逼近ChatGPT的大模型,预计最终仍是“凤毛麟角”。市场会逐步凝结共识:得数据者得天下,数据成为大模型差异化竞争的关键。

  算力、算法、数据是AI大模型研发的三大要素。大厂云们在算力上拥有一定优势。AI领域从业者贝科对小编表示,华为布局昇腾芯片、昇腾生态已经多年,而且在各地也投资了算力中心,现如今也已经有了一定量的算力储备。阿里整个集团在GPU算力上也有一定储备。但这并不意味着大模型能力一定能持续攀升。

  章容认为,大模型将带来生产力的变革,已经是毋庸置疑的事实,但是,即便是国外跑得最快的OpenAI以及微软,目前在商业化落地上已经有所进展,但也依然不能说成熟稳定。至于国内大厂的大模型,目前更是还处于非常早期的阶段。

  一方面,生成式人工智能的信息安全问题已经显现。4月11日,国家互联网信息办公室发布了《生成式人工智能服务管理办法(征求意见稿)》,强调了生成内容的真实性,并且提出了相应的容错率和惩罚措施。

  另一方面,当前国内市场上最新的大模型产品,无论是面向C端的体验产品,还是面向企业的接口,基本都处于内测阶段,还没有真正放开。

  按照目前的形势,章容认为,当前大模型从发布走向到企业端,摸索如何真正提升生产力,至少需要半年的时间。

  举报/反馈