商汤大模型来了 下一个入局者是谁?

  【亿邦原创】2023 年 4 月 10 日,商汤科技举办技术交流日活动,分享了以 " 大模型 + 大算力 " 推进 AGI(通用人工智能)发展的战略布局,发布 " 日日新 SenseNova" 大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

  商汤大模型效果如何?近期还有哪些企业将发布大模型?大模型的落地有哪些新进展?我们一探究竟。

  1、

  徐立现场演示日日新大模型

  商汤大模型名为 " 日日新 ",取自《礼记 · 大学》:" 汤之盘铭曰:苟日新,日日新,又日新。"

  商汤 CEO 徐立花大量时间演示日日新大模型下的自然语言模型 " 商量 " 如何编程、写广告词、写邀请函、创作故事、咨询财务知识 / 法务知识 / 金融知识。

  在对话场景,徐立展示了 " 商量 " 如何在医疗场景中,提供负责任的对话和引导。该应用已经在新华医院落地,徐立认为,随着大语言能力的逐步的迭代和演进的话,能够做更多随访、健康咨询、互联网问诊、辅助诊疗,商汤大语言能力也会进一步推动在瑞金医院、华西医院等。

  日日新研发始于 2019 年,目前包括五大 AI 应用:

  自然语言模型 " 商量 ",Slogan" 商量商量,都能解决。" 商量是一个 1800 亿参数的中文大语言模型,支持问答、理解和生成等中文语言能力,支持超长文本知识理解。

  文生图模型 " 秒画 ",定位 AI 内容创作平台,超 10 亿参数,支持二次元、三次元多种风格。2 秒生成一张图。

  AI 数字人生成平台 " 如影 ",由 " 商量 " 命名,取自如影随形。如影平台旨在帮助企业和个人快速高效地制作高质量的视频内容,只需要手机录制 5 分钟视频,消费者或企业就可以拥有一个属于自己的数字人。如影平台创作的每个数字人都经过认证,确保其不被盗用或篡改。

  场景 3D 生成平台 " 琼宇 ",可以实现高精度的场景生成,大场景实时渲染与互动。琼宇 2 天可以实现一万人一天的工作量。场景涵盖城市园区的数字孪生、建筑设计、影视创作、文旅和电商等。

  物体 3D 生成平台 " 格物 ",可以进行人、物、场便捷编辑创作。可以将物品生成的综合效率提升 400%,综合成本降低 95%,覆盖全品类室内物品。

  大模型的尽头是算力,商汤还推出智算中心 Sense Core,中文名 " 商汤 AI 大装置 "。大装置目前有 27,000 块 GPU,输出 5000p 总算力,500p 的国产化算力,是亚洲最大的智算中心之一,可以同步支持 20 个千亿规模参数量的大模型同时训练。2022 年商汤的 Sense Core AI 大装置已支持了超过 10 个大模型训练项目。

  基于 AI 大装置 SenseCore 和 " 日日新 SenseNova" 大模型体系,商汤面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型即服务(Model-as-a-Service)。

  商汤科技联合创始人、首席科学家王晓刚介绍,基于预训练大模型的自动化数据标注可实现相较于人工数据标注近百倍的效率提升。

  大模型并行训练和模型增量训练服务能够帮助客户快速利用自有数据训练模型,包括在预训练大模型之上进行垂域行业模型的开发,生产千行千面的自定义模型。

  模型推理部署服务可将大模型推理效率提高 100% 以上,降低用模型提供服务的成本。

  商汤也向行业开发人员开放大量预训练模型及 AI 开发工具链,全面赋能客户提升开发效率。

  2、

  继续亏损,继续投入

  值得注意的是,大模型需要的研发成本成为商汤亏损的根源。不久前,商汤发布 2022 年业绩,财报显示,商汤 2022 年实现营收 38.08 亿元,年度亏损 60.92 亿元。亏损主要用于 AI 模型研发。

  2022 年,商汤集团研发支出 40 亿元,同比增长 11%,集团研发人员 3466 人,占员工总数的 68%。截至 2022 年底累计商用模型数达到了 6.7 万个,较前年提高了 93%。

  同时,商汤在 2022 年也取得一系列成果,包括人工智能底层基础设施 SenseCore 通用大装置、320 亿参数量的全球最大的通用视觉模型、多个文生图大模型的训练,研发千亿参数量预训练大模型,研发一系列高效的决策智能模型,还研发了数款高性能、低功耗的 AI 推理芯片及 AI ISP 芯片。

  此外,大模型研发也让商汤实现业务结构出现调整——商汤四大业务板块包括智能汽车、智慧生活、智慧商业、智慧城市,2021 年,智慧商业 41.7%、智慧城市 45.6%、智慧生活 8.8%、智能汽车 3.9%,2022 年变为 38.4%、28.8%、25.1%、7.7%。

  3、

  大模型密集发布,AI+ 大时代到来

  在商汤发布日日新之前,阿里云刚开始邀请用户测试类 ChatGPT 产品 " 通义千问 "。

  在一天前的人工智能大模型技术高峰论坛上,华为介绍了盘古大模型的效果。华为云人工智能领域首席科学家田奇表示,华为云盘古大模型推动人工智能开发从 " 作坊式 " 到 " 工业化 " 升级。

  同在该论坛上,科大讯飞副总裁、研究院执行院长刘聪透露,科大讯飞 "1+N 认知智能大模型 " 将在 5 月 6 日发布。

  与商汤同一天发布 AI 应用的还有有赞。有赞发布类 ChatGPT 产品加我智能,这一产品可以帮助有赞商家快速制作朋友圈、微博、小红书平台图文种草内容。

  此外,各企业的大模型发布会也进入倒计时。4 月 11 日,阿里云大模型发布会;4 月 14 日,同花顺 AI 产品发布会;4 月 18 日,阿里云行业类模型发布……

  不难看出,大厂将在近期密集发布各自的大模型体系。有从业者开玩笑,模型比投资人还要多。只不过 AI 领域的投资逻辑一直都是 " 投资前置,收益后置 ",投资规模大,盈利周期长。

  大模型与具体行业的结合,才能形成确定性的商业模式,这也是长期投入带来的 " 高技术门槛,强竞争壁垒 ",大模型不停留在讲故事层面,如何落地更加任重道远。