元宇宙再添“新概念”,AIGC有何用武之地?

  

  11月16日,AIGC概念股视觉中国(000681.SZ)两连板,万兴科技(300624.SZ)、恒信东方(300081.SZ)跟涨。消息面上,近两日多支券商团队表示看好AIGC,称这是继UGC、PGC之后新型利用AI技术自动生成内容的生产方式。

  事实上,AIGC并非新鲜事物。在此前的2022百度世界大会上,百度首席技术官王海峰展示了利用AI“补全”《富春山居图》,让历史画作重现当代,风格与现存真迹的一致程度让专家大为震撼。

  AI补全《富春山居图》并题诗(上图红框处)

  AIGC全称为Artificial Inteligence Generated Content(人工智能生产的内容),是指AI通过海量现存数据(如文本、音频或图像)创建新内容的技术。不过,目前AIGC概念暂无统一规范的定义,国际上与之相类似的概念是合成式媒体(Synthetic Media),其定义为通过人工智能算法生产、操控与修改数据或媒体的技术,包括文本、代码、图像、语音、视频和3D内容等。

  AIGC能干什么?

  银柿财经了解到,内容生态从发展演变来看,一共可分为四个阶段,分别是专家生成内容(Professionally-Generated Content,PGC)、用户生成内容(User-Generated Content,UGC)、AI辅助生产内容(AI-assisted Generated Content)及AI生成内容(AI-Generated Content,AIGC)。

  PGC一般是指由专业化团队操刀、制作门槛较高、生产周期较长的内容,最终用于商业变现,如电视、电影和游戏等。为了保障生成内容的质量,PGC需要投入大量的技术、人力成本。在这一模式下,内容生产和变现的权力掌握在少数人手中,垄断效应强,但受限于供给侧的人力资源,PGC难以满足大规模的内容生产需求。

  而UGC则模糊了消费者与生产者之间的界限,平台将提供创作工具,生产者可为用户本身,这在降低生产门槛的同时提高了内容生态的繁荣度,如短视频。UGC模式在一定程度上降低了生产成本与中心化程度,满足了用户个性化或多样性的需求,同时也提高了产能天花板。虽然内容的生产规模得到了大幅提升,但由于其对生产者、创作工具和内容主题均未设限,其质量不可避免地遭到反噬。

  PGC、UGC分别被产能与质量所束缚,难以满足快速增长的内容需求,而AIGC则或将是内容生态在发展过程中的新一轮范式转移。

  虽然各大巨头的扎堆入局和投入,使得这一领域快速发展,涌现出了例如微软小冰等人工智能作诗、写作、创作歌曲的产品,但截至目前,始终没有出现大规模普及的标准化to C产品。

  浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林对银柿财经表示,AIGC行业公司所面临的难点主要是需求的差异化。单看写作,AIGC的确能够写作,但是不同领域对写作需求不同,有人要写政府通知,有人要写说明书,有人要写广告文案,有人要写高考作文,这些需求都基于不同的数据,AI功能针对性不同,训练AI的数据内容就不同,而这些细分太多,导致企业不得不多管线开发AIGC产品。

  “另一个难点就是数据污染。AIGC是基于数据的人工智能,而小规模的差异化数据,可能会误导AI,最终出来一个啼笑皆非的功能,解决不了内容创造的问题,沦为一个实实在在的娱乐工具。”盘和林补充道。

  版权归属问题

  在盘和林看来,当前AIGC的应用正在逐渐产生,很多领域早已成为工具,比如写作、画图、3D建模、剪辑、摄录等,很多领域都有AI的身影,能大大减少人力成本,但这些AI都达不到AIGC的程度,其所创作内容仍需要人工删选和优化,目前距离完全由AI主导的创作仍有差距。

  以最典型的AI作画举例,今年以来,disco diffusion、midjourney、dall·e2等AI绘画程序相继涌现,AI绘画技术实现了迅速更新迭代。

  当然,目前的技术水平并不支持关键词输入后可“一键生成”画作。在国内的AI绘画平台6pen上,输入“秋天”“落叶”“女孩”“背包”等关键词,生成的画作虽然元素具备,但禁不起细看。例如人像面部细节缺失、背景缺失。人物比例不协调等诸多问题。

  事实上,即便掌握了技巧,要想获得效果更佳的作品,光靠一键生成也远远不够,还需要大量的修改。譬如在今年8月份美国科罗拉多州博览会上获得一等奖的AI绘画作品《空间歌剧院》,就是作者在midjourney生成百张作品的基础上,经过了900多次调整、耗费近300个小时修改完善而成的。

  通过AI绘图工具Midjourney创作而成的获奖作品《空间歌剧院》

  随之而来的便是此起彼伏的争议,不少艺术家对此愤愤不平,认为这属于高科技对创意的“剽窃”,不过,大赛评委并未对该幅作品进行改判,并直言“即使它是AI生成的作品,也依旧配得上这样的成绩”。

  虽然画手圈因为AI引发了失业的担忧,但需要看到的是,AI作画首先面对的是法律层面的问题,即AI绘画作品的版权归属问题。

  一家知识产权保护公司的工作人员向银柿财经表示,由于AI工具的数据库选材自公域,以上述画作为例,AI作画可在内容上对所选取的素材进行溯源,但免不了部分素材具有版权限制,此外,就重组后的新画作而言,其版权归属问题也将是一大难题,目前业内并未有明确的界定方法。

  AIGC应用场景颇多,但商业模式并不清晰

  目前,AIGC在多个领域取得较多突破。例如在文本生成相关的AI工具方面,其在文本创作方面的应用包括代码编写、识别翻译和文章/新闻/报告的撰写等。

  代表作如微软出品的Github Copilot,用户文字输入代码逻辑,其能快速理解,根据海量的开源代码生成子模块供开发者使用。如今,在GitHub Copilot生成的程序中,将近40%的代码是由AI编写。

  虽然Web3行业中的SDK等模块化插件已经提高了开发者编程速度,但随着AIGC技术在未来的普及,加密协议的开发效率或将进一步得到提升。在理想状态下,AIGC可自动探查市场的需求或空缺,继而自主编程、拼接生成新协议。

  在人类语言的内容创作方面,AIGC也取得了可观的进展。目前,识别翻译领域的发展已经实现了较大的领先,Roblox通过机器学习将基于英语开发的游戏自动翻译为其它八种语言,包括中文、德语和法语;同样的,AIGC在Web3.0的文本创作领域亦将有许多可取之处。

  腾讯研发的Dreamwriter新闻写作系统可以在规定的22种场景中写作,平均发稿速度快至0.46秒;在红杉资本的《Generative AI: A Creative New World》一文中,部分内容是由GPT-3自然语言模型撰写,阅读体验却并不晦涩生硬,还兼顾了言辞流畅、条理清晰、逻辑通顺等写作要求。

  此外,AIGC在Web3.0的游戏领域也可能获得广泛应用。AI渲染技术将加速实现Web3游戏中大量建筑、环境的构建需求。目前,小型场景的搭建已经具备技术基础,但Web3游戏需要更快更好地建造更丰富宏大的场景。RCT Studio打造的Morpheus引擎,通过大量深度地机器学习,输入目标文字即可拓展出一个虚拟开放空间,AI将从文字内容中理解情节、内在逻辑与人物关系,进而渲染成3D动画。例如,程序可将“一个人坐在沙发上的文字指令变成一个虚拟人在3D空间中向沙发坐下的动画。”

  晨山资本是一家深耕产业互联网领域的风险投资基金,晨山资本副总裁吴文超告诉银柿财经,从内容生成的角度来讲,AIGC本质上还是一个富有创造力的行业,以前工业领域并没有这样一个诉求,大家普遍认为无论是做设计还是3D模型都需要人工,而不是工业界内生的需求。

  “但现在是倒过来拿着技术去找需求,有点类似拿着锤子去找钉子。这就意味着AIGC的发展比起原来CV领域的工业需求倒逼推动,更在于是人为推动,所以商业模式就会显得不够清晰。”吴文超进一步表示。

  对于目前可以明确的商业落地价值,吴文超认为,AI+CG的价值落地明确并且正在发生,“不论是2D还是3D,更多是为了视觉而服务,我们日常能够体验到的视觉场景大致包括视觉内容营销、线上的商业服务、行业仿真和新的交互方式带来的泛娱乐内容的需求。”

  吴文超指出,行业内每家公司虽然模型架构不同,但技术上却是大同小异,下一步,怎样产品化、怎样做好社区、如何将用户的反馈更好地落到模型上,以及同时做一些to B细分场景的落地,才是真正让竞争者之间产生区别的地方。

  举报/反馈