AIGC——通往元宇宙无尽游戏之路

  摘要

  

  

  

  

  投资要点

  自我们2022年10月份首发深度报告《AIGC——Web3时代的生产力工具》后,科技板块因AGI的技术突破而成为市场焦点。经过了一季度的火热行情后,我们在思考:当前市场的预期到了什么位置?未来会如何演绎?或者说把时间再放长一点,还有哪些新应用、新爆款?

  未来的预期差:

  (1)市场皆知AIGC空间广阔,但低估了幅度和广度。经过一个季度的学习与体验,市场开始认识到ChatGPT、Midjourney等产品的爆发力,而微软的产品发布也让大家看到在工具型应用上的潜力。而我们认为,AGI的迭代速度会远超市场预期,至少对C端的赋能还未完全体现。当AIGC将内容创作壁垒大幅降低的时候,Z世代将真正成为数字世界的原住民。AIGC是一种生产力工具,更创造了一种生活方式,正如当年互联网所带给我们这代人的变化一样。正如近期同产业交流时所提及,专家担心社会是否真正为如此巨大的变化做好准备?

  (2)市场认可AIGC+游戏逻辑,却低估了元宇宙的愿景。路演中大家认可AIGC对游戏行业的降本,但忽略了玩法创新。AIGC因为有产品、有用户,市场都认为它比元宇宙靠谱,但我们认为,元宇宙本身就是长期愿景,这一愿景如今依然存在,而AIGC是连接这一数字愿景的良机。在AIGC的助力下,用户可以以“上帝视角”扮演不同角色穿越于各个场景中,而AIGC将是重要工具,这一理念已经在斯坦福大学和谷歌联合发表的一篇名叫《GeneartiveAgents: Interative Simulacra of Human Behavior》论文中被阐述,或许这正是开启元宇宙的另一重序曲。

  (3)市场皆知算力重要,但忽略了算力架构的变化。当下市场认为算力生意是“卖铲子”,市场聚焦了两条主线,一是和海外业务关联度较高的,如光模块、服务器等;另一个是国产化,如GPU芯片等,上述也当仁不让地成为了市场主线。未来,随着大模型基础设施的完善,应用会越来越丰富,算力将更多呈现为“中心——边缘——终端”的分层布局,这种架构的变化有望更多被挖掘。同时,涉及算力的新材料、新技术、新方案在此前看来尚未成熟,但在AI大算力的驱动下, 处于功耗比、通信容量的要求,也会凸显价值。

  投资策略:

  我们看到,随着DeepSpeed、AutoGPT、Dolly2.0的陆续面世,大模型的训练和应用正在逐步优化,对用户而言门槛在降低。算力+应用的“正循环”爆发即将来临,并为向元宇宙、Web3的进化奠定基础。算力层,我们持续推荐全球供应链程度较高的标的,并深挖边缘计算方向;应用层,我们强调游戏、元宇宙的价值,毕竟AIGC在数字世界的迭代速度是最快的。

  1)?游戏:Roblox、Unity、腾讯控股、动视暴雪、恺英网络、神州泰岳、三七互娱、吉比特、游族网络、富春股份;

  2)?算力:新易盛、天孚、中际旭创、德科立、太辰光、联特科技、锐捷网络、中兴通讯、紫光股份、寒武纪、工业富联、美格智能、移远通信、广和通、光环新网、中国电信、中国移动、中国联通;

  股价上涨的催化因素:

  (1)AIGC+游戏产品推出;

  (2)数据要素政策推进,数据估值逻辑更完备;

  AIGC+"游戏"——不仅仅是降本

  站在AIGC应用的角度,我们首先将目光投向“游戏”,之所以打引号,是因为我们讨论的游戏并不仅仅是娱乐,未来更将是融入学习、社交、创作、分享的元宇宙。登陆这一赛博空间,可能是一天工作、学习的开始。正如20多年前,我们提到“去上网”大概率是去网吧打游戏,而现在“去上网”却往往是一天工作的开始。之所以重视游戏,一是因为AIGC对数字世界的冲击和迭代更快;二是游戏这一模式更容易被Z世代接受,而AIGC对数字原住民的影响会更大。我们认为,AIGC通过全方位降本,将大幅降低用户在“游戏”世界中的创作壁垒,从来带来内容的大爆发。

  必须直面的挑战:游戏研发成本增速飞快

  传统游戏产业面临高效率、高质量和低成本的“不可能三角”,即在高效率完成一个高质量游戏的研发时,想要做到低成本是不可能的。首先,电子游戏自上世纪70年代出现以来,在短短50年间经历了街机、掌机、PC机、主机、VR等9代游戏机,发展出了动作游戏、角色扮演、模拟游戏、战略游戏、射击游戏等十多种游戏大类,近四十种游戏小类。游戏模式的迭代速度是一个极快的过程,只有极少数游戏能活跃2年以上,大部分游戏甚至是大部分爆款游戏也只能维持半年到一年的时间,2022年爆火的羊了个羊就是一个例子。所以,游戏企业需要保持对于游戏玩法的创新和对于市场消费者的感知,高效率开发游戏产品。

  其次,一个典型的游戏开发团队主要有三种职位:策划、美工和程序,这三大工种之下可以分为文案、数值、关卡、2D、3D、角色、场景、音频、测试等20个职能。游戏作为一个注重用户体验的产品,需要将目光聚焦在产品、内容的丰富程度,而在完善内容的丰富度、拓展游戏的开放性的过程中,需要策划、美工等职位的相互协调和在游戏质量上的大量投入。所以,对于传统游戏行业,在必须兼顾高效率与高质量的条件下,高成本也不可避免。

  

  高成本只是其一,成本上涨速度快才是关键。2010年发布的互动类电影游戏《暴雨(Heavy Rain)》引起了极大轰动,其制作成本约为2100万美元;而2020年发布的开放世界角色扮演游戏《原神》制作成本约为3-5亿美元。2018年,中国市值Top10游戏企业用于游戏研发的合计费用约为178.03亿元;2022年,这个数字预计将上涨至383.76亿元。在短短5年的时间里,Top10游戏企业用于游戏研发的费用提升了一倍有余,除了2022年,每年的费用增长率都在20%以上。

  

  如此高且增长迅速的游戏研发成本主要分为四大部分:游戏数值平衡设计、游戏素材设计、游戏剧情设计和程序设计。

  游戏数值平衡设计:数值体系的构建在游戏的战斗系统、经济系统等多个领域均有涉及,是游戏设计中的重要部分,是游戏体验的核心驱动力。站在玩家角度,一方面玩家希望能够通过游戏操作为自己带来优势,一方面也希望减小玩家间基本数值上的过大差距;一方面希望“氪金”能为自己带来更好得游戏体验,一方面也希望“肝”不会比“氪金”差多少。企业要想实现这些目标,就需要在游戏开发时或运营中对各种数值进行数值拆解、数值分析、数值设计、数值测试等多种数值调整流程。以游戏英雄联盟为例,游戏中有上百个英雄人物,上百种可使用的装备,每年平均有一个大版本的数值更新和十几个小版本的数值更新,无疑要花费大量人力资源。

  游戏素材设计:游戏素材包括音频音效,也包括UI、场景、角色、道具、特效等2D或3D素材,其效果是玩家对游戏的“第一印象”。以制作一个次世代3D游戏的角色为例,其制作流程通常分为六个步骤:概念设定、模型搭建、贴图烘焙、骨骼蒙皮、动画制作和引擎测试,不仅需要原画师设计角色原画,还需要模型师进行角色模型制作,并在模型的基础上完成贴图,最后由动画师按照游戏要求完成动画制作。这样繁琐的工作导致一个完整的3D角色的制作周期大概在30-45天左右。

  游戏剧情设计:游戏剧情是游戏的内核,也是游戏的“灵魂”。游戏剧本的创作流程通常划分为策划和剧本创作两个阶段。在策划阶段需要确定游戏主题、故事、角色、世界观等内容;在剧本创作阶段,需要编写剧本、制作剧情动画等。剧情设计的目标在于将游戏的故事情节、人物角色和场景等元素融合在一起,让玩家在游戏过程中感受到游戏故事的情感氛围,也正由于游戏剧情是基于玩家对于角色的操作和行动带来的,其带给玩家的代入感也远超其他艺术载体。一个好的游戏剧情能让玩家接受像素级的画面设计,而游戏剧情设计的难点也在于想象力与创造力——如何创造出一个引人入胜的故事。

  程序设计:程序设计是实现一个游戏的基础。程序设计的主要任务在于根据游戏策划的需求,编写游戏程序代码并实现游戏的各种功能。游戏程序开发的难点在于其涉及面十分广泛,每种游戏类型涉及到数据结构和基础算法等方面都有着大量差异。另外,游戏引擎的迭代速度相对于其他开发工具要快得多,往往每隔两三年就有较大的改进和性能提升,因此对于开发者的学习能力要求很高。

  总的来说,不论是哪方面,基本都有设计周期长、设计难度大、设计成本高等特点。

  AIGC赋能游戏,降本只是开始

  既然游戏这一内容创作本身壁垒、成本较高,那AIGC最直接的帮助就是降本。AIGC可以通过程序化和工业化任务场景美术和建模,帮助游戏开发者提高游戏生产效率。与此同时,还有望帮助缩短游戏开发周期,创造全新玩法和体验,使精品化游戏的供给大幅增长,并带来游戏内容质量的变革式提升。最重要的是,AIGC打破了传统游戏产业的“不可能三角”,使得高效率、高质量和低成本得以同时存在。

  AI赋能游戏数值平衡设计

  以多人在线战术竞技游戏(MOBA)为例,这是一种即时战略游戏。每个玩家会操纵一个具有一系列独特能力的角色,通过联合队友摧毁对手方主要建筑而获得胜利。基于其即时战略的特点,MOBA游戏玩法强调玩家的游戏操作,这也意味着游戏角色不能是游戏胜利的决定因素——每个角色的胜率尽可能稳定在50%,于是数值平衡就变得十分重要。但是,MOBA的游戏环境十分复杂,地图设计、游戏角色属性、游戏道具属性等众多因素都可能影响到最终的游戏平衡,这导致游戏数值的调整十分困难。

  早在2021年7月,腾讯“王者绝悟”就亮相2021年世界人工智能大会,该产品由腾讯AI Lab与《王者荣耀》联合推出,展示了人工智能在辅助游戏数值设计上的可能性。

  

  《王者荣耀》作为一款MOBA类型手游,复杂程度不低于PC机上的MOBA游戏,根据腾讯AI Lab,《王者荣耀》对局中面临策略规划、目标选择、技能应用、路径探索等大量即时选择,其操作可能性预计高达10的20000次方。面对这样的复杂游戏环境,绝悟AI使用了监督学习和强化学习的技术,通过监督学习模拟不同级别、不同水平的目标行为,做到了很好的拟人化;通过强化学习构建奖励和惩罚机制,优化AI行为逻辑,进而探索出新的游戏策略。

  

  AI赋能游戏素材设计

  2022年8月,Stability AI推出了用于文本生成图像的深度学习模型Stable Diffusion,这一模型和之前的生成对抗网络等不同,生成方式复刻了人类的思维模式。其大幅降低训练和采样阶段的计算复杂度,让文生图的任务能够在消费级GPU上快速完成,大大降低了落地门槛。另外,由于Stable Diffusion在Github平台上完全开源,企业完全可以根据Stable Diffusion训练部署适合企业自身的模型,满足长尾需求。2023年3月,Midjourney发布v5版本,不仅绘图更逼真,prompt更灵敏,更是解决了AI一直被诟病的“不会画手指”问题。可以想象,在类似AI绘图工具的帮助下,不论是角色的原画设计,还是场景概念图的设计,这些本需要一周甚至数周才能完成的工作可能会在数小时内完成,极大提升游戏素材设计效率。

  

  2023年3月,Epic在GDC(游戏开发者大会)上推出了新的面部动画工具MetaHuman Animator,可以仅通过Iphone拍摄的视频来创建逼真的面部动画。在大会的演示中,演员对着Iphone的前置摄像头进行一段10秒的讲话,配合对应的面部动作。开发人员当场演示通过MetaHuman Animator工具,在建模人脸上精准复现了这一段讲话视频,所有面部细节都被高度还原,语言发音与动作细节配合完美,而这花费的整体用时仅仅为2分钟。

  

  2023年3月,腾讯AI Lab在GDC上提出了3D虚拟场景自动生成解决方案,能够帮助游戏开发者以更低成本创造风格多样、贴近现实的虚拟城市,提升3D虚拟场景的生产效率。其中重点分享了城市布局生成、建筑外观生成和室内映射生成三大能力。整个路网生成和微调过程仅需要不到30分钟,相比手动设计效率提升近100倍;而单个独特建筑的制作时间也降低至17.5分钟,大大提升了场景制作的效率。

  

  除了画面,AIGC也能提供音频素材的生成。米哈游逆熵AI帮助游戏《未定事件簿》中的角色配音,可以通过分析文本语境进而完成对声音、语气的改变。昆仑万维旗下的StarXMusicX Lab实现了歌曲的AI生成,目前已在QQ音乐、Spotify等各大音乐平台发布了十余首音乐作品。

  AI赋能游戏剧情设计

  剧情设计的关键在于让玩家沉浸入游戏世界,并让玩家意识到游戏世界似乎存在于他们的行动之外。以《荒野大镖客2》为例,每个NPC都拥有属于自己的生活,NPC之间会进行对话和互动。但是,这需要游戏策划者付出大量时间,也需要极强的创造能力——以至于能创造一整个世界。AIGC技术能够帮助策划者解决部分问题,让开发者将更多精力放在剧情设计的重点——创造性工作上,进而提高游戏整体质量。

  育碧于GDC2023上发布了文案生成工具Ghostwriter,它可以帮助文案策划生成NPC对白的草稿版本。具体使用流程是设计师首先创造一个角色,输入角色要经历的“事件或情况”,选取人物性格、输出方式与输出风格后,Ghostwriter将按照选取的限制条件生成多个版本的对白文字,供设计师选择、修改和完善。显然,Ghostwriter能够帮助游戏策划更快地完成对话创作,提高创作效率。

  

  AIGC赋能程序设计

  AIGC可以帮助开发者以自动化的方式生成游戏程序。目前,基于OpenAI Codex的Github Copilot可以辅助代码编写,开发者只需要在代码编辑器中安装Github Copilot即可使用。另外,集成了OpenAI GPT-4的代码编辑器Cursor也已经发布,Cursor支持Python、Java、C/Cpp、JS等多种语言,可以之间使用自然语言生成代码,在极大程度上减轻了程序设计的负担并提升其效率。

  整体而言,AIGC带来的游戏制作降本只是第一步,如果一项技术只能用于降本,那想象力是有限的。最近在和产业交流中,我们发现降本的另一层理解是降低创作壁垒,赋能有创意的个人也能完成“大制作”。其中的一个案例是此前豆瓣评分高达9.3分的水墨国漫大作《雾山五行》,该制作团队仅6人,核心成员林魂身兼出品人、编剧、监督、作画监督、导演、上色、场景、演唱,这一方面反映出国漫的困境,另一方面也证明了团队出众的能力和构思。未来如果能有AIGC的相助,一人一部剧的时代或许不远了。

  部分投资者担心,AIGC的赋能会降低游戏创作壁垒,但我们认为,游戏本身是供给创造需求,有更多创意才能刺激用户消费,才能占据更多用户时间。这种变化正如当年从PGC到UGC的升级,在上一波短视频兴起之前,用户可能也很难想象视频行业能衍生出如此众多的商业模式。因此,我们可以简单归纳下逻辑:AIGC->创作壁垒降低->内容爆发->流量增长->新科技浪潮。

  

  AIGC——通往元宇宙无尽游戏之路

  高昂的开发成本给游戏创新带来了风险。这也是为何游戏产业大厂陷入了经典IP的“舒适区”,游戏同质化严重。例如,传统游戏大厂EA和育碧醉心于基于经典IP开发“年货”,每部作品大同小异,甚至看不出改进。

  EA旗下的FIFA系列游戏从1994年到2023年每年发布一个版本,但相邻两个版本之间的改进基本都很少,更多是画质的提升和球员数值的改变;

  育碧旗下的刺客信条系列游戏自2007年发布以来几乎每年更新一个版本,而玩法核心也几乎没有改动。

  曾以创新闻名的暴雪公司也已经多年没有开发新的IP。根据暴雪公司官网,其开发的最新的IP是2016年发布的《守望先锋》,距今也已经接近7年之久。

  与此同时,由于许多小型游戏开发工作室不想承担游戏失败的风险,游戏产业也存在“大厂创新+工作室模仿”的工作模式,这也使得游戏同质化的进一步加剧。

  在此背景下,游戏玩法上的创新就显得极为重要。一方面,从产品角度来看,只有差异化的产品才能提供超额收益;另一方面,从玩家体验角度来看,许多玩家已经出现了对同质化产品的“抵抗力”,甚至在游玩过程中会出现疲惫感,所以游戏玩法上的创新亟待出现。

  我们认为,作为目前主流游戏形式之一的开放世界游戏,依旧会是未来游戏形式的主要组成部分,并且其将在游戏玩法的创新上扮演十分重要的角色。这是因为开放世界中“自由”的体验更能让玩家沉浸于游戏世界,而开放世界的“包容性”也使得其能容纳更多游戏玩法,并承载游戏玩法的创新。

  AIGC赋能四大创新方向

  相比于AIGC对游戏的降本,我们更关心“游戏”的创新,这将是未来通往元宇宙之路。当下游戏创新目前存在两大主要困难:

  创新成本高,开发新游戏概念和新游戏机制需要投入大量时间和金钱

  用户接受度难以预料,新的游戏创意和机制是否会被用户接受和喜爱是个未知。

  若新游戏开发失败,会造成较大损失。随着AIGC时代的到来,游戏开发的成本有望被大幅度降低,也将进一步导致游戏厂商对新型游戏的试错风险大幅降低。不仅如此,NLP的迅速发展使得人机交互性提升,为游戏玩法提供新的创新方向。

  智能NPC——《失控玩家》不再遥远

  智能NPC指在游戏中由人工智能驱动的非玩家角色,它们会表现出一定的智能行为,例如:

  自主行动:不经过玩家控制而可以根据环境和情况自主选择行动;

  互动和对话:可以与玩家或其他NPC进行简单的互动和对话,通过其内置的人工智能模型完成恰当的响应;

  学习和适应:一些更高级的智能NPC可以根据与玩家或环境的互动完成学习和适应工作,可以学习玩家的喜好和行为习惯进而变换自己的行为,或根据环境变化调整自己的行为;

  个性和情感:智能NPC还可以表现出丰富的个性特征和情感反应。

  

  2023年1月,游戏公司Cyber Manufacture Co.发布了新型AIGC引擎Quantum Engine,用户可以使用自然语言随意与NPC互动,AI会根据用户的表达,实时生成剧情互动。想要使用Quantum Engine,首先需要提供一个剧本,这个剧本可以是真实存在的影视剧剧本,也可以是用户原创。在输入了剧本后,它会根据剧本内容来跟用户进行角色扮演,用户可以选择键入文字也可以选择直接语音交流,Quantum Engine的回答会随着用户表达方式和语气的不同而随机改变,这在剧本推进方面为用户带来了极强的沉浸感。

  目前,Quantum Engine支持中文、英文、日文等多种语言,在一定程度上已经具备了智能NPC的某些特征如能够实时互动与对话,具有自己的个性或情感。虽然Quantum Engine目前还无法支持自主生成智能NPC的动作,在使用时也可能出现一些错误,但它已经为智能NPC的出现打下了良好的基础。

  非线性游戏——自由世界、随机之美

  非线性游戏是一个相对于线性游戏的概念,区别主要在于游戏情节和体验的灵活性。

  对于线性游戏,其游戏情节和体验是固定的,玩家需要按照设定好的路线和步骤来推进游戏而不能自由选择不同路径,这导致游戏体验是高度统一的,所以玩家游玩的动力不足,游戏寿命也较短。

  非线性游戏的游戏情节和体验非常灵活开放,玩家可以自由选择不同的行动路径和选项,创造出自己独特的游戏体验。除此之外,非线性游戏通常是开放式结局或没有明确结局,玩家完全可以自由探索游戏世界,与各元素互动而没有固定的终点要达到。这导致了非线性游戏的可玩性更高,也更具沉浸感和自由感,让玩家可以体验属于自己的游戏世界和游戏故事。

  

  传统的非线性游戏开发往往需要设计大量的选项及其对应结果,工作量极为庞大。以《荒野大镖客2》为例,其在官网上公布的致谢名单中显示参与游戏制作的人数超过了3000人,是一个极其繁杂的工作。AIGC可以帮助解决这一点:

  通过先进的人工智能算法,智能NPC可以根据玩家的选择和互动作出随意的反应和决定,主动推进情节发展

  智能算法还可以动态分析玩家的行为,动态生成新的情节、选项及结果,让游戏可以实现真正的“非线性扩展”,真正实现“千人千面”的游戏效果。

  微软的《模拟飞行》,是一款高度真实的飞行模拟游戏,AI技术的应用主要体现在以下几个方面:

  地形和建筑物生成:游戏利用AI技术对全球15亿座建筑物进行高度还原,使游戏画面更加逼真。通过对卫星地图数据的处理和分析,AI算法可以自动生成地形和建筑物模型,为玩家提供一个丰富且真实的游戏环境。

  实时天气系统:游戏中还运用了AI技术来实现实时天气系统,使玩家能够体验到真实世界中的飞行条件。通过对大量气象数据的处理,AI算法能够模拟出各种气象现象,如云层、雨滴、雪花等,提高了游戏的真实感。

  

  用户创造内容(MOD)——我的世界我做主

  MOD是游戏修改(Modification)的缩写,也称作游戏模组,是由游戏玩家自行开发的游戏内容,主要有几种类型:

  角色和皮肤MOD:用于修改游戏角色模型,纹理、服装等外观。这类MOD不影响游戏机制,主要满足玩家美化游戏和个性化的需求;

  游戏机制MOD:用于修改和添加游戏机制、系统、物品、关卡等。这类MOD可以扩展和丰富游戏体验,增加游戏寿命;

  情节和任务MOD:用于修改和添加游戏剧情、任务、事件等。这类MOD可以给游戏带来全新的体验,但需要和游戏原有内容完美结合;

  重制MOD:用于完全重制游戏的某些方面如画面、界面、人物等。这类MOD可以让老游戏焕然一新,被许多玩家广泛运用。

  虽然MOD是玩家丰富游戏内容的一个主要工具,但是MOD制作给过程复杂且存在一定技术门槛。对于普通玩家来说有些遥不可及。但随着AIGC时代的到来,一个普通的游戏玩家也将有能力按照自己想法制作游戏MOD并丰富自己的游戏体验。

  AIGC不但可以帮助没有技术和美术背景的玩家快速生成角色与皮肤MOD。同时AIGC可以成为一种MOD智能开发工具,玩家可以通过人工智能技术,使用更易上手的语言甚至图形交互系统完成MOD的制作,这可以显著降低MOD开发的技术门槛。

  

  《Roblox》作为一款在全球拥有近一亿用户的沙盒游戏,同时也是目前世界上最大的多人在线游戏创作平台,包含了成千上万玩家创造的地图、玩法和模式。其平台由Roblox Client, Roblox Studio和Roblox云三部分构成,其中Roblox Studio提供了一套适用于新手到专业人员的工具,给予了开发者足够的创作空间和技术帮助。2023年3月21日,Roblox正式发布了两款新的AIGC工具,所有Roblox的开发者都可以选择使用AI为基础的材质生成和代码辅助工具。其中,Roblox的材质生成可以用来创作高品质纹理,并运用在游戏内物体上;而代码辅助工具可以让用户通过自然语言指令创造代码,也可以自动总结用户所写的代码并生成评论。可以预见,AIGC使得游戏的UGC时代即将来临,游戏内容与游戏体验将进一步获得提升。

  

  此外,还有一款名为《Arrowmancer》,运用了AI带来了全新的玩法。Arrowmancer是一款由WaifuLabs团队制作的全AI绘图游戏,主要运用了AI技术生成和融合独特的二次元角色。在这款游戏中,AI技术的应用主要表现在以下几个方面:

  角色生成:游戏利用WaifuLabs的AI技术生成各种不同风格的二次元角色形象,丰富了游戏角色的多样性。玩家可以根据自己的喜好在大量生成的角色中进行选择。

  角色融合:游戏允许玩家融合不同角色的卡面,创造出独一无二的角色。这种融合过程由AI算法驱动,保证了每个融合角色的独特性和可玩性。

  

  AutoGPT——更聪明的AGI

  2023年4月,一个名叫AutoGPT的开源项目在Github上发布了,截止至2023年4月16日,该项目已经获得70K+星。AutoGPT是一个由GPT-4驱动的可以自主实现用户设定的任何目标的开源应用程序。当用户提出一个需求或任务时,AutoGPT会自主分析问题,给出具体的执行计划并开始执行,直到完成用户提出的要求。可以发现,AutoGPT打破了机器只能执行人类命令的框架,实现了由机器主动提出问题和执行计划,并由机器自主完成的工作模式。

  

  可以想象,类AutoGPT产品可以在游戏中为玩家提供帮助。例如当玩家不知道如何通关游戏时,玩家可以通过AutoGPT浏览整个游戏并得到详细攻略;当玩家纠结于游戏装备或角色的选择时,可以在AutoGPT中输入自己的偏好而获得一个完整的建议;当玩家由于操作原因难以通关时,AutoGPT可以生成一个“外挂”应用帮助玩家完成游戏关卡;甚至当玩家需要一个队友时,AutoGPT可能可以生成一个AI队友。虽然这些设想看起来十分遥远,但AutoGPT的出现让我们看到了希望。

  GenerativeAgents——通往元宇宙的里程碑

  AutoGPT让大家看到AGI具备迭代推理的过程,在使用时为完成最初的任务,AI会不断“Add Task”,使答案不断完善。正如我们此前用ChatGPT写文章的时候,需要按提纲给出一系列提示词,让AI按序作答,提示词的质量直接关系到内容输出的好坏。而今AutoGPT把提示词工程师的工作给“抢”了,按此类推,如果呈现为多模态,那就是赛博朋克的《失控玩家》了。

  不论是智能NPC、非线性游戏还是用户创造内容和游戏助手,它们都能够从不同的角度提升由于的游戏体验,这一点在开放世界游戏中体现的尤为明显。例如,智能NPC可以为玩家带来更强的交互性和代入感,并带来更强的情感体验,这是因为智能NPC会根据玩家的选择和行为做出灵活的反应,使得玩家更容易投入到游戏世界中;而非线性游戏可以为玩家带来更深度的思考和真正个性化的体验,这是因为非线性的体验带来了更加复杂的游戏情景和游戏决策,可根据玩家喜好产生个性化的结果,实现游戏的“千人千面”。

  智能体虚拟小镇,不是游戏的游戏

  科学家们确实在向这个方向探索,《西部世界》是一部科幻类连续剧,讲述了一个由机器人组成的乐园中发生的故事。在那里的机器人能够像人类一样生活、工作、社交,甚至记得自己看到的东西、遇到的人、说过的话。《西部世界》如果作为一款游戏,无疑是一种体验极佳的开放世界游戏。但是,虽然这只是影视剧中的一个设想,生成性智能体已经在学术论文中实现了。

  在由斯坦福大学和谷歌联合发表的一篇名叫《GenerativeAgents:Interative Simulacra of Human Behavior》论文中,研究者们成功地构建了一个“虚拟小镇”,其中的25个智能体在小镇上生存。它们可以在咖啡厅喝咖啡,可以去上学,甚至可以举办派对,而研究者们也证明了它们能产生可信的个人或突发群体行为的模拟。

  

  这是个非常有趣的实验,其中的NPC具备了可信人类行为,并对周围环境变化做出适当的反应,使得可以用现实社会现象去填充赛博空间,并允许终端用户改变环境或用自然语言下达命令。例如,John早上7点起床,刷牙、洗澡、吃早饭、看新闻,8点John的儿子起床准备上学,临出门前会有一段契合语境的对话,并在后面的时间序列中遵循对话的逻辑和内容。也就是说,在这个虚拟环境中的每个决策都带有一定随机性,但又符合人类行为习惯。用论文中表述即:GenerativeAgents利用大模型强大的提示词功能,支持智能个体长期的一致性、管理动态演变的记忆能力,并递归产生更多的世代。

  此前,我们看到AIGC辅助的用户创造内容(MOD)能够帮助玩家提升开放世界游戏的游戏体验。一旦MOD的制作不再需要极强的技术能力以至于每个普通玩家都能设计属于自己的MOD并将其分享出去,游戏的内容将获得极大的提升,玩家能具有的游戏体验也将极大提升。未来,GenerativeAgents能在不毁坏游戏体验的前提下帮助玩家不再需要一个真人队友就能体验到随机性、社交性。

  为什么元宇宙需要AIGC?

  2021年时,我们试着在Decentraland中修建了首座元宇宙虚拟总部——“国盛区块链研究院”(坐标62、28),并尝试进行了几场线上路演,当时还吸引了圈内外不少朋友关注,但作为元宇宙早期产品,Decentraland做了大开脑洞的尝试,却无法真正构建数字空间,其原因在于:

  1)缺乏相应的内容生产工具

  Decentraland提出了虚拟土地概念,类似于门户网站的广告位,在有流量的情况下,虚拟土地NFT的价值有一定体现。但用户缺乏内容创作工具,作为普通用户无法在土地上构建差异化内容,必须依靠专业团队构建虚拟建筑,本质上还是PGC,门槛过高。而同期的Roblox虽然是体素方块,却为青少年提供了从云到游戏工具的一系列产品,易于上手,反而积累了用户。

  

  2)使用壁垒过高,长期门可罗雀

  Decentraland等元宇宙首批平台对终端配置要求过高,严重影响了用户体验,在经历了初期的火热之后变得门可罗雀。在2022年的一年时间里,Decentraland不论是销售额还是活跃钱包数量都发生了断崖式的下跌。销售额从2022年最高的约9百万美元下跌到现在约40万美元,下降了约95.7%,而活跃钱包数量从2022年最高的900多个下跌到目前的约250个,下降了约72.2%。这固然有NFT市场趋冷的影响,但本身产品的不足亦不容忽视。相比于成熟的Web2应用,这类平台的用户非常小众化。

  

  因此,当我们用NFT确认数字资产权属之后,实现了链上资产的可流转、可溯源,这是有创新意义的。而后的主要矛盾就变成如何构建真正非同质化的内容?早期在赛博空间中划分出的功能区域必须带入可信人类行为才能真正有意义,比如学校用来模拟学习场景、公园用以自由社交,而不是到处都是交易NFT的画廊。我们看到Web3世界的某些项目已经在这些领域做出了尝试,Decentraland社区近日也提交了最新提案,创建个性化人工智能NPC,下一轮的前沿创新正在路上。

  AIGC+元宇宙——代入上帝视角,每天24*N小时

  通常而言,我们会以各个APP的使用时长占比来表征业务的变化趋势,当然,除去吃饭睡觉,每个应用的时长都会有上限,例如手游APP的人均单日时长在2020年见顶145分钟后有所下降,基本保持100多分钟的平稳状态。而AIGC驱动下,用户将逐步具备上帝视角,即便不是本人实时操作,只要代入个人行为特征,数字人就可以完成大部分特定任务,玩家可以借助AI同时在N个虚拟世界执行任务。

  

  2018年,一款名为《旅行青蛙》的游戏火遍全网,主角小青蛙出不出门、什么时候出门、什么时候回来,全都是随机的,青蛙还会时不时写个信,但玩家还是时刻想了解青蛙的旅行情况。当时的游戏用随机性满足了用户的陪伴需求,实现了“陪玩”的功能,如果再加上AIGC的内容生成能力以及数字人呢?

  在此前的《数字人——GPT4下的杀手级应用》中,我们曾提到数字人将是未来AI的交互界面。当下流行的2D数字人成本较3D大幅降低,可以被运用在以下四个场景:

  服务业:在教育、银行、医疗领域提供服务,引入类似于ChatGPT的NLP大模型以后,交互性会变得更好。如医疗导诊,尤其针对一些老年病人可以更好地做到一对一的交互带领。教育领域,可以针对不同学生的进度提供定制化讲解。

  影视作品:在电影、电视剧和动画片里作为演员存在,不但可以根据需求和剧情定制形象,同时也能避免出现由于演员私人的一些行为导致整部作品无法按时上映的风险出现。

  虚拟UP主:娱乐直播、表演歌曲、舞蹈、游戏等,可以打造个性化的形象和风格,定制化满足粉丝的需求和喜好,且不会出现塌房事件。

  虚拟直播带货:利用2D数字人来制作营销推广、客户服务、产品介绍等视频,可以提高转化率、增强信任感和体验感。

  

  如上如是笔者自己生产的2D仿真数字人,口型、动作、声纹的合成技术已经相当成熟,在日常场景中已难辨真假,且具备了多种商业模式。在这些场景中,我们已经可以实现用GPU+电耗生产内容,未来随着垂直模型的训练成本降低、效率提高,互动性将大幅提升,针对游戏、直播、工作等不同场景的数字助理将应运而生,虽然看起来像一个大型游戏,但它真的还是游戏吗?代入上帝视角后,用户可以穿越于不同的赛博空间中,从内容参与的角度看,我们每天的时间或许会变成24*N,而元宇宙将成为无尽的游戏,无疑,这对下一轮TMT的意义是重大的!

  投资策略

  综上所述,我们看到GPT4变得更强;Deepspeed、Dolly2.0、AutoGPT等使大模型的应用、适配变得更快捷、高效;H100使算力更上一层楼;ChatGPT Plugins让AI as a service的时代日益临近。下一步,更大的机会在哪里?

  从投资角度看,我们总结如下:

  1)算力层

  一方面重视全球布局的行业领跑者,这类企业离本轮创新更近,更容易享受行业红利。与此前的5G行情有所不同,本来AIGC是完全由创新需求驱动的投资上行,因此,个股的订单上修、业绩释放是行业变化的结果而非起因。如果市场能接受AIGC逐渐成为工作、生活必不可少的工具,那么各种硬件加单将是必然结果,主要以光模块、交换路由设备、服务器、PCB为代表。另一方面,重视国产化趋势,AIGC是下一轮全球科技创新的焦点,国内提倡数字经济也将聚焦与此,我们已经着手建立“东数西算”算力网络,叠加5G、物联网的产业链优势,在AIGC时代大有可为。需要重视的是,AIGC对超算网络的算力、功耗比提出了更高要求,会把更多材料、网络架构技术的商用时点拉近,这一趋势将会越来越明显。

  2)模型层

  大模式层面的竞争将持续,当前OpenAI对模型层面除了参数的考虑外,更多聚焦于进一步训练、合规与伦理,防止歧视与偏见。而在垂直领域则百花齐放,开源生态甚至直接给出Dolly2.0,开源其代码、数据集和模型参数(120亿个),并开放商用。投资层面,我们将进一步聚焦大模型的边际变化,例如SAM增加了对图像的支持等。大模型仍是互联网巨头的兵家必争之地,具备搜索、云计算能力的企业具备先发优势。

  3)应用层

  看好工具型应用+游戏、电商方向。我们认为本轮AIGC最大的变化在于AI的通识化和显性化,让其服务于大众用户。工具型应用因其本身覆盖面广,例如搜索引擎、Office套件、视频会议系统等,上述也是微软与OpenAI首先拓展的领域,代表了主流玩家的策略。而游戏和电商则属于年轻人集中、变现能力较强且迭代迅速的领域,对于具备IP优势的企业将强化其变现能力,且向元宇宙的进化路径更为明确。

  4)数据层

  数据是AI训练的“粮食”,一来依靠数据的数量和质量,二来依靠AGI训练的方法论。年初我们就提出数据要素+AI的方向,认为数据要素的流转只是过程,而通过AI赋能千行百业才是更高效的方式。“风浪越大鱼越贵”,AIGC时代数据的价值将进一步彰显。同时,在此一并讨论的就是AI的安全、伦理与隐私,我们认为这将是贯穿AGI发展始终的问题,AGI越发达,这一问题就越凸显,如同面对一个赛博世界的新大陆,所有人都是摸着石头过河,但方向是明确的。

  综上所述,在算力、模型、应用、数据等维度,我们给出如下投资组合标的:

  

  

  

  风险提示

  伦理风险:AI驱动的人工智能交互过程中,可能出现伦理风险。

  技术发展不及预期:AIGC 的技术发展不及预期。以及底层硬件技术,如:超级计算机、算力的发展不及预期。

  政策法律监管风险:目前数字人和AIGC都处于发展初期,在知识版权等问题上还有许多尚不明确的地方。随着相关法律的逐步完善,或出现法律监管的问题。

  本文节选自国盛证券研究所于2023年4月20日发布的报告《AIGC——通往元宇宙无尽游戏之路》,具体内容请详见相关报告。

  宋嘉吉? S0680519010002? ?songjiaji@gszq.com

  金郁欣??S0680521070002? ?jinyuxin@gszq.com