AI绘画大热 商业化落地难题待解

  作者: 吕倩 樊雪寒

  [ 今年10月,Stable Diffusion背后的公司Stability AI宣布获得1.01亿美元融资,估值达10亿美元。 ]

  今年夏天,并无绘画基础的游戏设计师杰森·艾伦(Jason Allen)通过AI绘图工具Midjourney,生成一幅AI画作《太空歌剧院》,并获得美国科罗拉多州新兴数字艺术家竞赛一等奖。同时,《太空歌剧院》及其背后一众类似的AI画作引发画家群体集体抗议维权。

  因AI绘画属于AIGC分支之一,热潮与争议之中,2022年也被称为“AIGC元年”。但在更早前,包括NVIDIA、Google等厂商均已发布相关技术成品。相较于AIGC在C端的热度,B端的具体落地与商业化应用场景更值得关注。目前来看,AI绘画仍面临版权与伦理、商业化变现等难题。

  技术拉低AIGC创作门槛

  所谓AIGC,既是一种内容分类方式、内容生产方式,也是用于内容自动化生成的一类技术集合。其全称为 Al-Generated Content,指基于生成对抗网络 GAN、大型预训练模型等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的生产方式。

  投资机构a16z将内容生态发展分为四个阶段:专家生成内容(ProfessionallyGenerated Content,PGC)、用户生成内容(User-Generated Content,UGC)、AI 辅助生产内容(AI-assisted Generated Content)及 AI生成内容(AI-Generated Content,AIGC)。目前行业主要处于一、二阶段为主,第三阶段为辅的状态。

  不论是AI绘画还是近期刚火的ChatGPT,都是AI技术在逐渐深化进入每个人的生活。在量子位MEET2023智能未来大会上,阿里巴巴集团副总裁贾扬清表示,今天行业讲AI,绕不过去的话题就是AIGC的大爆发,包括Stable Diffusion以及ChatGPT。前者是一个基于Latent Diffusion Models(潜在扩散模型,LDMs)的文图生成(text-to-image)模型,也正是如今被诸多画家批判版权问题,但同时又降低了无过滤图像生成门槛的平台。

  如果溯源的话,贾扬清称,用统计和AI方法实现内容的创作和生成这个方式,经历了很长的阶段。往回数到1999年,艾佛斯教授提出的基本逻辑是用一个简单的计算机视觉统计方式,就可以通过一个非常小的图片来学习纹理,生成内容,这可以说是AIGC的雏形。

  2015年前后,贾扬清称,行业很风靡的技术是神经风格迁移,能够从画作当中学习绘画风格,将一些原始图片合成为相应风格的作品,如将梵高的《星空》等,生成更加丰富的内容。从开始的1999年的计算机视觉统计方式,到今天更加强语意的AI创作,这些变化都在不断催生行业去考虑更有意思的领域。

  国际科技巨头逐渐在AIGC领域现身是在21世纪初。2012年,微软公开展示了一个全自动同声传译系统,基于深层神经网络(Deep Neural Network,DNN)可以自动将英文演讲者的内容通过语音识别、语言翻译、语音合成等技术生成中文语音。

  2019年,随着生成式对抗网络技术(Generative Adversarial Network,GAN)逐渐成熟,AIGC技术研究迎来关键拐点,DeepMind 发布了DVD-GAN模型用以生成连续视频。

  同时在2022年,所谓的行业元年,AIGC逐渐破圈,技术上,扩散生成模型得到广泛研究与应用,文本生成图像模型可准确把握文本信息进行创作。商业化基础也已初步具备,国内外互联网巨头和独角兽纷纷下场。

  国外如Open AI 更新了DALL-E-2,可创作出相应极高质量的卡通、写实,抽象等风格的绘画作品。今年9月,NVIDIA 推出AI绘画软件NVIDIA Canvas,通过GauGAN(生成性对抗网络),可将寥寥几笔的草图变为景观大片。近期,NVIDIA又推出一款低门槛文本生成3D模型Magic3D,无需建模经验、无需特殊培训,只需要40分钟左右,该模型就能生成一个带有色彩纹理的3D网格模型,经过调整后,模型未来可用于开发游戏或CGI艺术场景。

  据研究所分析认为,真正将AIGC 创作最终推向平民化的,是 Stability AI 推出的 Stable Diffusion,个人电脑即可驱动,且几个月内产出效果具有直观的改善。随后,AI 绘画迅速在微博、小红书、抖音等多平台上掀起传播声势。

  AI绘画版权争议何解

  除了《太空歌剧院》的意外获奖,AI绘画遭大批画师抵制的现象也成为外界关注、热议的重要原因。大批画师已将“禁止投放作品进入AI绘画系统”加入个人简介,全球知名视觉艺术网站ArtStation的上千名画师发起联合抵制,禁止用户将其画作投放AI绘画系统,ArtStation认为,任由系统学习模仿画作是在侵犯版权。

  对于AI绘画产生的画作版权问题,Forrest 分析师卢冠男对第一财经记者表示,目前海外针对GitHub Copilot代码生成服务的输出内容,出现了潜在集体诉讼。另外大型人工智能模型的训练过程会使用大量数据(包含代码,文本和图像)。由于很多数据是公开可访问的,如GitHub的开源代码,因此大模型的训练数据中常常会包含这类数据,且通常这类数据来源也标注了许可证规则,明确说明如何在互联网上二次传播或以商用为目的传播。

  但是,卢冠男称,在AI模型利用这些数据训练后,模型运行时所生成的所谓新数据,有可能出现和源数据具有高相似度的结果。对于这样的结果是否违背了源数据自身的license范畴,目前还无法确定。特别是如果AI模型是在商用环境下产出这样的具有争议的结果,极易引起纠纷。

  上海君悦律师事务所陈怡然律师对记者表示,关于AI作品是否构成对其他人类作品的侵权,鉴于著作权侵权的认定原则主要是接触+实质性相似,是否接触需要综合原始代码和学习的参考图进行判断,而是否符合实质性相似需要具体判定AI图和参考图之间的相似度。所以需要具体案例具体分析。

  在行为主体方面,假如张三对于图A拥有著作权,李四在未经允许的情况下将该图提供给AI训练,王五使用AI生成了一张类似的图片B并进行营利性使用。陈律师表示在上述情境中,李四和王五均或可构成侵权,若此款AI的开发公司对图片B声明版权,那么公司也或可构成侵权。

  不过据了解,目前多数AI作图工具倾向于提示用户,由AI生成的画作的版权属于AI公司。“关于AI作画的版权问题,其实已经完全超出了现有版权法的体系,如果真的有作者认为AI创作的作品对自己的作品构成侵权,由于AI学习的机制和逻辑不同,作者举证和维权难度可以预见会远高于一般侵权诉讼,业界普遍认为应当由AI公司承担不侵权的注意义务及举证责任,比如爬图和学习的画作仅限于公有领域的作品,如需学习版权保护期内的作品,应当向作者支付分成等。”陈怡然称。

  针对目前AI画作版权归属不明对行业的影响问题,卢冠男对记者表示,一方面会增加创新的门槛。企业如果想利用这类技术进行商业服务,就要在法务合规等方面做出额外的准备。这对于中小企业创新是一个潜在的隐性成本。另一方面会约束生成式AI的使用方式或场景。受制于To C提供服务时潜在的版权风险,企业可能更倾向于在To B场景中间接使用生成式AI的结果。比如通过其生成的图像结果辅助设计师构图,或通过其产出的代码为软件工程师提供代码设计建议,从而做到规避其结果的风险,这也能推动生成式AI的发展。但在To C这一侧的发展也许会受阻。

  B端商业化落地难题待解

  作为一项早期技术,AIGC的商业化、大规模扩展,以及伦理与法律等问题,仍是目前行业面临的限制性因素。

  贾扬清认为,AI普惠有两个重要支撑——一个是AI的工程化,一个是开源。著名教授RichardS. Sutton曾说过,此前七十年的AI研究,行业所得到的最大经验和教训是通过标准化的方式来使用大规模计算与通用算法。而大规模计算无论是通过原生方式还是通过更加高效的分布式计算方式等,都会让开发到迭代的路径变得更加简单。另一个方面就是让市场变得更大的开源。

  在这样的趋势下,贾扬清认为目前行业有几个明显的趋势方向——第一是原始AI工程化平台,第二是大规模端到端异构计算体系,以及通过算法与体系组合,实现更加智能的、贴近用户需求的产品,最后通过算法的开源,助力AI在产业垂直化落地。

  至于说规模化之后的商业化问题,以Stable Diffusion和 Midjourney 这两家代表性公司为例,二者都还未实现盈利。浙商证券研究所分析电影先生认为,AI绘画商业化方面仍处于摸索阶段,变现方式较为单一。用户多为生成数量或者使用时间付费,常见付费方式为订阅制或按次付费。

  比如Stable Diffusion 目前尚未形成明确的盈利模式,主要收费方式是首次注册DreamStudio beta 将获得价值2英镑的积分,约为200次单张图免费生成的额度。试用后可按10英镑的增量购买额外的积分。但 Stability AI CEO认为其未来商业模式将类似红帽和 MongoDB,将开源版本定位免费,通过商业版本实现盈利。今年10月,Stable Diffusion背后的公司Stability AI宣布获得1.01亿美元融资,估值达10亿美元。

  相对而言,Midjourney 采用了订阅制,新用户可免费生成25张,之后对于个人用户或公司年收入少于100万美元的企业员工用户,有两个档位的订阅套餐可选。对于大公司客户,单人一年收费约为600美元,生成的作品可以商用。

  整体而言,对于普通C端用户来说,应用场景商业化性价较低,付费意愿有待提升。浙商证券研究所认为,行业未来B端变现路径更为多元、成熟,若B端能挖掘出较为可行的商业模型,付费的可能性和水平相对更高。B端可能的收入方向包括:广告、设计、营销定制、动漫、游戏等行业。

  卢冠男也持有相似观点,他对记者表示,现在行业还很难预测一个成熟的商业模式,暂时仍处于一个探索的过程。目前的行业商业变现探索主要体现在模型服务提供方和模型服务使用方。对于公开数据提供方和模型服务提供方之前是否会产生新的商业模式,仍然不清晰。

  另外对于To C的AI作画服务,卢冠男认为,AI模型服务供应商需要确认其目前是基于哪些图片数据库实现的模型训练,这些图片是否能支持其商用范畴。服务商也应考虑设立投诉通道,在纠纷发生初期尽早控制损失;对于To B的AI作画服务,供应商应考虑如何利用企业客户自有版权的数据源,进行定制化训练服务;对于提供公开可访问的素材平台,平台方也要考虑更新线上作品的许可证条款,同时为平台上的创作者提供建议,比如注明是否接受其作品被用作训练数据等。