当AI开始画画和“摄影”：不仅娱乐人，还会愚弄人

时间：2023-03-25

　　人工智能势不可挡。

　　本周，包括微软、谷歌、英伟达、Adobe在内的全球多家科技巨头公司都不约而同地发布或开放生成式AI新技术，其中微软和Adobe发布了与图像生成相关的新应用。

　　然而，AI不仅可以帮助人类，也会被利用来戏弄人类。

　　例如，近日互联网上流传着美国前总统特朗普被捕的照片，实际上这些照片都是由人工智能生成，并不是真实发生的事件。

　　3月18日，特朗普曾在社交媒体上表示，他将在当地时间21日被逮捕，并多次呼吁支持者举行大规模抗议。但是由于法律程序问题，特朗普并未如期“被捕”，但从当天开始，互联网上就出现了各种使用人工智能合成的特朗普被捕画面，“以假乱真”。

　　微软、Adobe推出AI画笔

　　以ChatGPT为代表的“高智商”AI，正在掀起新一轮的AI革新。英伟达创始人CEO黄仁勋将这一轮技术革新称为“AI的iPhone时刻”。他认为，AI可以帮助人类创建初稿、建立初步的设计，帮助人类打开“脑洞”，激发人类的创造力，提升生产效率。

　　谷歌当地时间21日也正式在英国和美国开放对其AI聊天机器人Bard的访问权限，用户可以加入等候名单以访问Bard。Bard称将能帮助用户概述和撰写论文草稿，以及根据冰箱里的食材制作创意午餐等。

　　谷歌、微软、脸书母公司Meta和其他科技公司正在竞相开发和部署人工智能工具。上周，在谷歌宣布将人工智能引入包括Gmail、表格和文档等生产工具之后，微软也加强了人工智能辅助搜索功能，并宣布将其生成式人工智能技术添加到办公自动化应用程序中，包括Word、PowerPoint和Excel。

　　微软21日发布的最新工具命名为“Bing Image Creator”，将允许必应（Bing）和Microsoft Edge浏览器的用户使用OpenAI的DALL-E创建文本提示图像，用户可以通过语言文字生成图像，例如要求画一张“宇航员穿过向日葵星系”的图片。

　　微软的这一新功能将以预览版的形式提供给用户。微软表示，将首先在Bing搜索引擎的“创意模式”中推出，并最终完全集成到Bing的聊天体验中；在MicrosoftEdge上，图像生成器将在浏览器的搜索栏中可用。

　　另一家最新进军生成式AI领域的科技公司是Adobe。同样在21日，该公司推出了一个名为Firefly（“萤火虫”）的应用，专注于创建图像和文本效果，用户可以通过输入命令快速修改图像，该应用将被整合至现有的产品套件中。

　　在一个示例中，Adobe展示了如何将一张夏日场景的照片更改为冬日场景，用户只需要输入“将场景更改为冬日”，无需进行任何编辑就可以将图片完成更改。

　　去年Adobe斥资200亿美元收购了设计工具Figma，未来将会向更广泛的AI进行转型。

　　上周，百度在发布类ChatGPT的AI聊天机器人文心一言时，现场演示了AI作画功能，不过此后网友测试文心一言的图像生成功能后发现AI对于一些特定名词的理解还不准确，这导致千奇百怪的图片在网上广泛流传。

　　所有画师都会被AI替代？

　　但AI的能力已经让人类惊叹。最近有一张情侣照在网上引起了轩然大波。一对穿着90年代服装的年轻人坐在屋顶上，背景是北京的老旧楼房，这张看起来与真人没有任何差异的图片，竟然是由AI一键生成！让网友大呼“人类画师要失业”了。

　　这张图片在网上迅速走红后，背后的AI绘画工具Midjourney V5也引起巨大关注。该软件不仅可以生成现代风格的图像，还可以模拟不同年代和地域的场景。比如，“一个穿着汉服、手持扇子、坐在亭子里看书的女子”，或者“一个穿着牛仔裤、背着吉他、走在纽约街头的男孩”；它还可以根据用户指定的风格参数来调整图像效果。

　　“我们觉得结合语言的生成模型代替的是传统的各类资产库，就好像大语言模型（LLM）之于搜索引擎、文本转图片（texttoimage）之于‘视觉中国’。”影眸科技首席技术官张启煊对第一财经记者表示，“ChatGPT已经把搜索搅了个底朝天，Stable Diffusion之类的技术也在冲击传统图库；接下来就是3D资产库，从传统的关键词匹配的‘搜索’，转换为‘生成’。”

　　Stable Diffusion和OpenAI的DALL-E一样，都提供生成式AI图像产品，Midjourney就是基于Diffusion技术。

　　张启煊表示，他们正在进行文本转3D的下一代技术研发，现在已经可以实现直接将文本生成3D数字人资产，预计于本月底上线，可以用于影视游戏当中。

　　他认为，尽管最近一波生成式AI的发展都具有颠覆性，但Adobe这类工具仍然有存在的必要性，因为纯文本的隐式控制的可控性不足；但是需要结合生成模型进行革新。

　　资深游戏行业人士、丰厚资本创始合伙人谭群钊对第一财经记者表示：“产业正在发生剧变。我们认为生成式AI的出现一定会全面改变创意文化产业，美术制作的工具链、工作流程、人员配置都会发生变化。我们投资的公司也在研发AI作画的平台。”

　　不过谭群钊认为，虽然生成式AI将极大地提升作画的效率，但是并不意味着未来所有的画师都会被AI替代。“首先需要高级的画师做出更有风格的作品，其次是需要普通画师去使用AI工具，得到更实用的作品。”他对第一财经记者表示，“甚至还需要初级画师去修改AI作品，让它看起来更接近于人的作品。”

　　欧盟AI立法难度陡增

　　和ChatGPT一样，生成式AI图像背后也一直存在伦理方面的隐忧，这些担忧涉及模型倾向于“产生幻觉”的看似合理但不准确的信息；此外，人们还担心大模型会窃取艺术家内容、重新生成并在未经创作者授权或许可的情况下进行展示。

　　生成式AI的突然火爆也令欧盟正在草拟的人工智能法案难度陡增。虽然行业预计年底前欧盟有望就人工智能法案达成协议，但有人担心该立法可能因其复杂性和意见不统一延迟到明年推出。

　　据透露，为了解决像ChatGPT这样无穷无尽的应用程序的监管问题，预计欧盟立法者将会引入一个新的类别，即“通用人工智能系统”(GPAIS)，以描述可以适应执行多种功能的AI工具。但目前尚不清楚是否所有的GPAIS工具都将被视为“高风险”。

　　技术的发展与监管始终是一对矛盾体，欧盟立法讨论也引起了从小型初创公司到大型科技公司的担忧。他们认为，监管在立法的同时也应避免对技术发展的束缚。行业机构appliedAI最近的一项调查显示，51%的受访者预计人工智能法案一旦推出，将导致AI开发活动放缓。

　　音频流媒体平台Spotify（声田）的首席执行官丹尼尔·艾克（DanielEk）认为，生成式AI的技术是一把双刃剑。Spotify最近推出了自己的AIDJ，能够管理个性化音乐播放列表。“我们必须考虑很多事情。”艾克说道，“我们的团队正在与监管机构积极合作，努力确保这项技术尽可能多地受益，并尽可能安全。”

　　在中国，今年1月10日起，首次针对深度合成技术的监管规定——《互联网信息服务深度合成管理规定》已正式实施。清华大学国强教授、智能产业研究院首席研究员聂再清对第一财经记者表示：“如果相关法规针对生成式AI在文字内容生成方面没有明确的规定，那么随着ChatGPT这类技术的应用更加广泛，未来可能需要重新审视在包括文章、论文、广告等生成内容方面的审核。”

　　小米前副总裁、安全与隐私委员会主席崔宝秋也对第一财经记者表示：“技术监管是一场永恒的攻防对抗博弈。深度合成技术的服务方在提供服务的同时，会产生多方面的风险，除了深度伪造的风险外，还包括自动生成内容文本、图像或者视频带来的版权和著作权的侵权风险，信息安全和隐私泄露风险以及敏感内容的风险。”

　　崔宝秋建议，未来出台的相关法规中，应该强制要求服务提供方对于哪些内容是深度合成的进行标注；对于技术提供方而言，则应从底层技术开始推进相关标准的建立，在算法上保证计算模型的公平性。