AI会抢走内容创作者的“饭碗”吗?
“谷歌要完蛋了!”这是ChatGPT“一夜爆红”之后,很多人的第一反应。
其实,很多谷歌员工也开始担心自家AI 敌不过 ChatGPT,但谷歌母公司Alphabet CEO 桑达尔·皮查伊(Sundar Pichai)和谷歌人工智能部门主管杰夫·迪恩(Jeff Dean)则回应称,谷歌拥有类似的能力,但如果出现问题,代价会非常高昂,导致人们不再信任谷歌提供的答案。
而更令人焦虑的是,ChatGPT以及其背后的AIGC是否会抢走内容创作者的“饭碗”?
今年以来,AIGC(全称:AI generated content,AI生成内容)迎来一股新风潮,被认为是继PGC(专业生产内容)、UGC(用户生成内容)之后的又一万亿风口。
一时间,诸如AI生成文字、绘画、视频、音频、代码等多模态内容,都被视作AIGC产业中的组成部分,吸引了极大的关注。
当然,ChatGPT也被认为是AIGC的一个分支,这与其同样基于大型语言模型(Large language model,简称:LLM)、GAN(Generative Adversarial Network,生成对抗网络)等AI相关技术密不可分。
那么,一系列问题就来了。AIGC是如何快速走红的?它如何迈向商业化?未来还有哪些想象力呢?
ChatGPT爆红的背后
提到ChatGPT,创新工场执行董事兼前沿科技基金总经理任博冰同时也想到了此前另一热门AI绘画的开源模型——Stable Diffusion。
他认为:“这些最新突破性的成果,都离不开Foundation Model(大模型或基础模型)等技术的发展。”去年,相关话题和讨论并不热烈,但自从Stable Diffusion和ChatGPT这两个热门大模型的出现,让普通用户能够真切感受到AIGC的魅力,从而加快了其传播的力度。目前,从效果来看,Diffusion(扩散模型)与GAN、ChatGPT与GPT3,这两类模型相比之下,在完成度和易用性都有大幅的提升。
“巧的是,在ChatGPT发布前两周,我们正在硅谷与OpenAI的高管进行了沟通,他们透露正在围绕InstructGPT(ChatGPT的姐妹模型)做更多优化,所以很快就看到了这一突破性的成果。” 任博冰说道。
从效果上,ChatGPT大幅提升了对用户意图的理解和结果的准确性,还可以针对质疑做出主动认错。这一技术正是基于InstructGPT,其核心是通过对人类反馈进行强化学习,再以数据重新微调,从而达到逼真的人机交互效果,也避免了以往GPT-3中出现的不少问题。
同时,ChatGPT在长文本及多轮对话中,相对原本的InstructGPT,有更好的表现。对比其他一些基于GPT-3或类似LLM的对话产品,也有更惊艳的表现。任博冰说,当然,如此快速传播速度,可能也得益于OpenAI本身的名声。
小冰公司CEO李笛有着不同的理解。他认为,严格意义上来说,ChatGPT并不完全属于AIGC范畴。本质上,ChatGPT只是一个语言模型,更贴近交流领域。与AIGC的区别在于,AIGC的content(内容)必须要由某种特定形式来呈现,例如一篇文章、一段语音、一张图片或者一支视频。
而实际上,交流不需要这些形式就能完成,ChatGPT呈现的效果,更像是Q&A问答,而非一篇文章。从技术角度来看,相较于GPT-3,ChatGPT使用的是一种全新的训练方法,能够提升对话的相关性、逻辑性。同时,这类方法也让对话的语言风格带有“训练人”的风格。
李笛认为,从小冰的角度来说,AIGC需要由某种特定形式来呈现,例如小冰能够实现写诗、绘画、作曲等等众多能力,并会产出具体的作品。如果只谈交流这个领域,按当前基于小冰框架的对话交互量计算,一天就达到了14个人类一辈子的对话交互量。若使用ChatGPT的方法,每天成本将高达3亿元,一年成本将超过1,000亿元,成本极其昂贵。“当然,这不影响ChatGPT给我们带来的启示,同时也能让我们分辨出实验室技术与产品化框架之间的巨大区别。”他说道。
任博冰也认为,虽然不能过度神话此次的技术突破,但ChatGPT确实在增长范式上,与此前的模型拉开了巨大的代差,其核心仍然基于大模型,而在巨大算力支撑下,实现了大幅的提升甚至飞跃,也为对话效果和训练方式带来了深刻的影响。
“最近,我们接连被OpenAI的ChatGPT和Meta的Cicero(具有谈判、说服和合作能力的AI机器人)深深吸引。” 任博冰说,这些年,AI发展过程中经过了一系列的迭代,例如GAN逐渐被Diffusion Model取代;以GPT-3为代表的LLM主导了目前NLP领域的发展;NeRF(神经辐射场)等技术被应用到如3D等多模态生成的任务中;还包括模型融合、算力主导等技术以及自然语言作为主要输入的产品等最新的发展趋势。
AIGC的商业化之路
对于AIGC行业的发展,任博冰认为,当前行业现状比较特殊。一方面,依托于大模型,text(文本)和image(图像)等相关AI技术正向着商业化落地迈进,且包含大量开源 ;另一方面,相关头部公司正在快速迭代,其算力门槛和研发能力都让绝大部分创业公司和科研机构望尘莫及。
“我们看到越来越多AI学者的大量创新研究被算力挡在门外,同时越来越多的AI创业公司团队因大模型而变得更轻盈,不再需要像之前一样需要组建一支庞大的AI团队。现在,我们还不确定,这将对整个生态带来哪些影响和改变,但毋庸置疑的是,AIGC的商业化还有很多‘宝藏’可供挖掘。但是,需要注意的是,包括对话、多模态等大量研发中的全新技术距商业化还很远。”他说道。
李笛也指出,与ChatGPT一样,今年AIGC的火爆主要源于多模态大模型的应用,让生成式AI得到了较为明显的进步,因而引发大众的关注。但本质上,AIGC仍处于蛮荒时代。
他表示,早在多年前,小冰就已经踏入AIGC领域并尝试了了商业化落地,期间大致经历了三个阶段。
第一阶段,小冰通过技术让人工智能实现了自动生成内容,并达到交付商用的标准;
第二阶段,小冰发现如果只依靠内容本身来变现(即出售内容的调用),是“不健康的”、“难以为继的”。因为人工智能具有的高并发性,注定了其创作的内容质量再高,但人们可能并不愿付费,长此以往会影响原本内容市场的秩序;
第三阶段,小冰找到了一种方法来解决上述问题——把AIGC作为能力赋予AI Being(数字人)。
“简单来说,小冰不再做‘画笔’,而是做‘执笔的人’。今后,我们可能还要经历第四、第五等更多的阶段。现在,大部分人讨论话题的仍属于第一阶段,即技术的商业化落地。”李笛说道。
目前,小冰在AIGC领域已形成完备的商业化,并覆盖金融、文化、纺织、旅游等多个垂直领域,且构成了文本、声音、图像的产品化阵列。例如,小冰与中国纺织信息中心、国家纺织产品开发中心合作推出的AI图案设计平台,已有超过400家企业注册并在生产中使用;小冰的金融文本生成产品已覆盖了国内约90%的机构投资人。“但我们认为,AIGC并不会完全取代人类工作,而是以它的高并发性等特点去承担一些耗费较大精力的重复性基础工作,或者成为人类的助手,帮人类创作者试错或提供思路。”
任博冰透露:“最近,我们走访了一些海外科学家、VC和创业者,也研究了近400家AIGC相关的公司。”目前,几位海外AI大牛都创立了AIGC公司,并成为引领行业的风向标,而更多的公司还是借助GPT、Diffusion等现有模型,立足于各自细分领域推出相关产品。现在,这两个代表性领域都已经有独角兽公司脱颖而出,相信今后还还更多的AIGC公司涌现。
“但海外VC对这一方向还是很谨慎的,因为行业中一批新兴公司的火爆,可能并不具备代表性,也无法做到以偏概全。同时,国内此类公司也在快速涌现,涉及2C(消费端)和2B(企业端)。但国内企业服务和2C工具的生态与海外有很大的差异,而且产品方向有扎堆的趋势,所以我们会谨慎布局,也可能会选择新方向来孵化一些公司。”
例如,创新工场在2021年孵化了澜舟科技,这是GPT-3问世后,全球第一批基于大语言模型的初创企业。之后,创新工场在多模态和生成式AI等方面也将投资一些新兴的公司,相信明年会有更多布局。
AIGC的想象力
AIGC的想象力不止如此,在任博冰看来,AIGC会渗透到人们日常工作和生活的方方面面,并且能让人通过自然语言或其他简单的交互就获得超高的生产力。从代码创作到2D/3D图的创作;从写论文到写PPT;从搜索到快速商业分析等等,都将在可预见的短期时间内就能实现。
“但我们不认为AIGC会对就业造成太大的影响,因为现在AI仍然只能完成人类的一部分工作,在很多环节还是充当偏辅助的角色,例如AI生成图像还需要精修、AI生成文本还需要润色等等。总之,AI生成的内容目前很难直接作为人类的专业内容进行发布。”他说道。
谈到AIGC的未来的想象力,任博冰说,在内容创作层面,让AI生成短视频、3D动画;在交互层面,让机器人具有更高的环境理解、任务理解及人机交互能力,都将充满想象力,但仍然有很长的路要走。即便在对话层面,目前ChatGPT的效果也远不够完美,而且在很多细分场景上,还缺少相应的产品。
AIGC会与元宇宙、Web3等擦出怎样的火花?李笛说,目前,元宇宙、Web3的定义仍然很模糊。如果只将其视为一个空间,AIGC和AI数字人不需要非得与元宇宙捆绑在一起,因为其在元宇宙和物理世界中都能得到很好的应用。小冰认为,未来人类会被AI Being所环绕。这句话的含义是,人工智能可以身处音箱中、在汽车中、在社交网络平台上……在任何场景,而元宇宙只是这些众多场景中的一个而已。
对于AIGC的投资策略,启明创投的合伙人周志峰与启明创投投资经理胡奇有着独到的见解,他们将未来AIGC产业的格局比喻为“两种世界”。
一种世界是多个大模型基础公司为上游应用提供API和模型服务,上游应用公司只需专注于开发产品逻辑和上层算法;而另一种世界则如同今天的AI公司一样,每家公司都根据自身需求研发底层大模型,为自身应用提供技术支持。同时,这两种世界也可能并存,并形成互相交织的过渡形态。
所以,他们既会关注提供API接口的基础设施公司(例如国外的OpenAI、Cohere等以及国内的智谱华章),也不会错过杀手级应用(例如NLP)。此外,他们还会专注于垂直领域的应用公司,以及在两个世界过渡的过程中,能够拿到高额融资的垂直一体AI公司,但会更加谨慎。
高光之下的隐忧
对ChatGPT火爆,创新工场人工智能工程院执行院长王咏刚撰文表达了担忧,并阐述了自己的观点。
首先,AI创作在知识教育领域争议很大。ChatGPT的模仿能力和文笔越好,这个未来风险就值得重视且需要提前应对。今天的AI生成理论,还没办法保证生成内容的逻辑正确与合理,建立人类领域专家参与的AI训练过程,发展与正确性相关的增强学习算法可能会是未来的一个AI科研热点。
其次,AI/CS(Computer Science,计算机科学)专业人要保持冷静。面对大幅提升多轮对话能力的ChatGPT,越是AI/CS 的从业者越是不能一味地顶礼膜拜;最起码,应该有测试和验证的精神,不断探索新模型的能力上限,甄别模型生成答案时真正的“记忆认知”和基于特征相似性的“模仿游戏”。
最后,AIGC大发展,“跟风”要有道德底线。他期望所有跟风者在AIGC这个大舞台上,不要过于头脑发热,还是要多判断一下,自己构建的所谓“产品”,到底是有益于人类进步,还是向已经碎片化的内容世界继续灌水或倾倒垃圾。
王咏刚还分享了一件令他诧异的小故事:此前,他与OpenAI的两位联合创始人一起喝咖啡时,两位科学工程大牛用非常技术化、务实的心态谈他们的工作计划和技术思考。但他却发现两位创始人竟然不知道AIGC是什么意思!
不可否认的是,人类史上从没有一个发明或技术,像AI这样,在给人的生活和工作带来前所未有的变革的同时,也对人类既有知识秩序和精神生活提出了多重的挑战。
无论是AIGC,还是ChatGPT,背后都离不开大模型、算力及数据等要素和相关技术的不断进步和迭代。简单而言,AIGC是人类在AI领域取得的又一里程碑式的突破。所以,AIGC仍然是一件工具,以便将人类从重复性工作中解放出来,或者成为人类的助手,起到降本增效的作用。
更令人欣喜的是,AIGC的兴起,也意味着人类又距离AGI (Artificial General Intelligence, 通用人工智能),也就是强人工智能又近了一步。