用AI当了一回艺术家之后,空虚感袭击了我

  

  来源:BIE别的

  原标题:《好消息:你也能成为艺术家 —— 在 AI 的帮助下》

  在一个数字环境中按照自己的意念自动生成内容可能是所有内容创造者的梦。

  有个 2009 年出品的 NDS 游戏叫《涂鸦冒险家》(Scribblenauts),这个游戏就像一个策略版的马里奥,你面对关卡中的各种障碍,靠的不是吃增粗增大蘑菇和超级弹跳能力,而是需要用裤兜里那支神笔。在游戏中写出一个物体的名字,不管是工具还是角色或者怪物,系统就会给你生成这个物体用来解决难题。当然这些物体都是事先做好的,你没法让系统无中生有。尽管如此,这种神笔马良式的新颖的玩法还是让其好评如潮、多次获奖。

  10 多年后的今天,AI 图像生成(Text-to-image machine learning model)工具如雨后春笋一样冒出,把游戏中没有的“无中生有”带到现实的图像创作当中。现在你只要写一段描述性的语句(text prompt),把它喂给 AI 生图工具,AI 就能根据它在一分钟内生成一幅图像(txt2img)。如果觉得光打字有点太不着边际,还可以自己随便画几笔,帮 AI 打个草稿,再辅以描述性文字一起投喂(img2img)。你看这篇文章的题图,就是一句话生成的,用了不到两分钟。

  对于一个不怎么会画画却又想成为流行文化创造者的我来说,AI 生图工具好像给我带来了新生。现在流行的 AI 图像生成工具有 Midjourney,DALL-E,Stable Diffusion 等等。SD 对关键词的限制少,而且还是开源的,所以除了他们官方的网页端入口(可免费试用一阵),在网上可以找到很多免费使用的入口。

  开始 AI 艺术修炼

  光说不练还是不行,AI 艺术修炼就从使用 SD 开始了。我先手动在像素画软件 Aseprite 里涂了一个简单的像素头像:

  然后把它投喂给 AI,并辅以描述性 prompt:“A beautiful girl with a sad face” 。半分钟后,AI 给我生成了这张:

  AI 生成的图片既保证了使用原图的大框架,又有自己的“创新”。不过,这狂草又随性的画风怎么跟之前在网上看到的各种高端大气上档次的 AI 生成图截然相反呢,感觉还不如自己涂的。于是我去 SD 生成图片搜索引擎 Lexica 上看了看别人的生成作品和他们用的 prompt,这才发现自己太天真。

  在lexica.art 上可以看到其他人都在用 SD 生成什么鬼东西

  原来,想生成符合主流审美特点的图像,你描写得再细致都没用,有时反而会添乱,最重要的是在 prompt 中添加描述画面风格的后缀。如果你玩过《暗黑破环神2》,肯定还记得那些超长的装备名称。《暗黑》用一个前、后缀系统来为有限的武器模型和种类创造近乎无限的效果组合:哪怕是一拖布,只要它名字前后挂着“举世无双的”,“大杀特杀的”,“宇宙超级无敌的”这些形容词,你也可以拿着它大开杀戒。

  AI 生图也是同理,想用 AI 生成出“高级范儿十足的,如科幻大片般的,能在 ArtStation 上点赞上万的”的图像需要怎么办?很简单,你只要把这些形容词以后缀的形式加在句子里就可以了。

  于是我重新输入:“a beautiful girl with sad face, detailed face, trending on ArtStation, HD, realistic”:

  虽然头发还是有点乱,但感觉比之前的结果要上档次很多了。再次实验,在 prompt 中加了“由阿尔丰斯·穆夏绘制”和“高清写实”后缀的结果:

  换成“由古斯塔夫·克里姆特绘制”并去掉“高清写实”后缀的结果:

  再换成“达芬奇画的”:

  可以看出这些描述性后缀会对画风起决定性作用,只要用相应的后缀,就会让画作带有对应的风格。

  不仅限于知名艺术家的名字,还有“氛围感”,“电影感”,“高清”,“4K”,“冷/暖光”,“红/黄/蓝/绿色调”……等等等等这些词汇都可以拿来用。同时这些形容词之间还会互相拉扯互相制约,使 AI 生成出混合了几种风格之间的作品,比如“穆夏绘制”的那张,明显可以看到在手绘的基础上加挂了一层“高清写实”感。

  这样看来,如此方便快捷灵活高效,人类艺术的结晶唾手可得,AI 真的可以圆一个不会画画的人的艺术家之梦了!我撸起袖子,准备加劲大开画戒。这次没有给 AI 喂草图,直接输入:“Darth Vader 拿着光剑一样的闪着红光的超级无敌拖布”。

  见鬼了。虽然似乎得到了想要的内容,但不仅取景太随便了,人怎么还给长出三只手来?又试了半天后,我渐渐明白了,AI 生成根本不懂人体解剖结构,也分不清层和前后左右的关系。它把从数据包图片中学习到的内容与输入 prompt 中的关键词加以对应,将结果直接呈现,真的是在“生成”,而不是在“画画”。于是头上接头、肢体错乱、搞错近大远小等等人类审美中的错误在AI生成结果中就太常见了。

  虽然这样的结果可能也挺酷的,用一个“超现实”就全都能给自洽了,但是在大多数场景中人们还是希望能得到看起来比较正常的结果吧。生成结果的随机性再大也不用怕,AI 生成的特点就是快速量大,在尽量调整好参数后只要不断让程序运行就好了,总会瞎猫碰上死耗子的。一个 prompt 可以轻松生成无数张结果,完事后只要把能看的挑出来就可以了。

  “由 Greg Rutkowski 画的一条波涛汹涌的河,电影感,ArtStation 顶流作品”:

  “Greg Rutkowski 和 HR Giger 风格的灰色荒原,ArtStation 顶流作品,油画”:

  “灯塔将光芒照耀在汹涌的血海中,由 Greg Rutkowski 和 Thomas Kinkade 创作,ArtStation 顶流作品,高清”:

  “噩梦一样的外星上的废弃飞船,高清,8K,氛围感,黑暗艺术”:

  “一家叫 BIEDE 的媒体的办公室,照片写实风格”:

  审图员还是创作者?我的还是它的?

  玩了几天后,我对基础的 AI 生图设置我已经大概熟悉,网盘文件夹里也已经差不多塞了好几千张 AI 生成的图片。筛选这些图片一开始令人兴奋,但不久后就很让我腻烦了。对着屏幕发了会呆后,我直接把它们全删除了,反正生成很快很方便,大不了到需要时再重搞呗。是的,这些图片虽然挺好看的,个个 ArtStation 顶流气质,但对我来说一文不值。我打开存着那些自己手动画的小破图的文件夹,看着完成的和未完成的作品,我会把它们删除吗?打死也不会,哪怕它们质量不咋地,哪怕它们发到 tumblr 上只能得到 2,3 个赞。

  AI 生成的图对我来说感觉廉价,是因为我在使用它时完全没有那种自己执笔画图的成就感。我感觉自己不是一个创造者,反而更像是一个策展人在干活:输入描述性字句就像给屏幕里面关着的一个艺术电子脑发命题作画的要求,然后我在它提交的无数种画稿中挑出对我来说好看的那些。更重要的一个问题是,我真的能把这些生成的结果算作自己的作品吗?

  在人肉艺术创作过程中,画笔和鼠标完全遵循我的每一次输入,我说一它不敢二。而对 AI 生图的输入却不是这样的。AI 并不懂我要什么,它懂的是一种从成千上万的由其他人创作的图像中分析总结出来的一种对它自己来讲完全自洽、对我来说宛如天书的逻辑。AI 的每一次图像生成都是对它而言没有“错误”的,然而血肉之躯在创作过程中总是无时无刻在躲避难又却难逃差错,这些难以避免的差错应该就是人肉艺术的最珍贵之处。

  在艺术家已经很难用“风格独特”来标榜自己作品的今天,在 AI 生成中混合出一种风格快速“据为己有”可以算是新自由主义经济下的必然产物。在一切的一切都追求快速、质量只在保质期内不出问题的解决方式的大环境下,这样的作法甚至是合情合理的,也难免近几个月艺术家和设计师们纷纷感叹自己要失业了。现在 Steam 上已经有一些游戏用 AI 生图的结果直接作为游戏内的图像内容了。AI 采用了成百上千包括很多健在的艺术家的作品作为训练数据包,要知道不少 AI 生图 app 都是要付费的,而作品在不知情的情况下被拿去训练AI的艺术家们却不会得到一毛钱。

  因为 AI 生图在经济上受益的人怎么看呢?在 AI 生图颇受欢迎的艺术 NFT 界,我洞察到一种态度,那就是“AI 艺术家”的圈子中既要将 AI 生图常态化为一种日常的普通创作工具,同时又不想让其完全去神秘化。

  在 AI 生图工具向着开源和免费前进的大趋势下,这是一种十分尴尬的态度。在 Google 随便一搜就能找到一把一把可以免费薅羊毛的 AI 工具的前提下,AI 生图工具从需要用户会点编程才能使用的计算机深度使用者/极客工具到变成移动设备中的一个个免费 APP 已经是在快速进行中的了(写下这行字的当天,facebook 母公司 Meta 刚刚推出了自家的 AI 视频生成服务)。

  当“AI 艺术”其中的噱头完全褪去后,那些曾经卖出高价的 AI 生成作品会如何呢?也许它们会因为“触手可及”和“人人可做”从而伴随正在下行的经济而一落千丈;但也许投入的资本已然太大,让投入的人不得不去继续维护它们曾经被套上的“独特犀利”、“引领潮流”、“科技创新”等等誉美的前后缀,类似的情况已经在各行各业中上演过无数次了。

  AI 图像生成作为一种艺术创作方式让我感到一言难尽。它非常有趣味性,生成图像的灵活和便捷会让人满足好奇心,我建议每个对艺术和设计感兴趣的人都去玩玩。同时它的商业化还没完全跟得上新版本迭代的速度,就使其可以在深度使用层面很有值得探索的地方。但如果用它作为艺术创作的核心,还是让我感觉缺了点什么。用 AI 生成作画,就像玩一个 JRPG,想打通这个游戏也需要努力,需要各种试错,不仅是一路只按A键那么简单;你会在结尾处获得一个炫目的、充满高质量 CG 播片的结局,也会有一点成就感。

  但这终究是别人的冒险,你穿着他们的鞋走了他们的路,而不是自己的路;这是一场感情移入的经历,一场血肉之躯对机器算法热脸贴冷屁股的一厢情愿,结束后能多让人感到满足,就能多让人感到空虚。

  举报/反馈