AI技术的又一亮眼表现,AI绘画!AI作画是如何做到的?

  不得不说,科学技术的发展日新月异。AI技术的发展也花样百出,继语音助手、AI写作、智能驾驶等技术之后,AI绘画接着出来大放异彩。2022年8月,Genel用《太空歌剧院》这幅画作在一场艺术博览会上获得冠军,而这幅《太空歌剧院》就是使用AI工具绘制,再经过该插画色的润色而出的。

  可以看到这幅画,构图完整、色彩舒服、内容丰富、故事性极强。如果不知道它的来历,很难想象这幅画大部分是AI程序绘制而来。目前,AI绘图除了创作以外,还可以进行画作修复。此外,AI绘画在有些科技公司手中,已经开始尝试进行视频制作。

  

  AI作画如此神奇,那么它是怎么做到的呢?就是机器学习。首先我们要理解这个学习的过程。一张图被打上标签,如太空、歌剧院、人群、大厅、单人等,交给AI程序。

  AI程序知道了这张图具有以上元素之后,记录一遍像素点分布,给这张图打上一层高斯噪声,再记录一遍像素点分布,再打一层高斯噪声,如此循环,直到完全变成一张高斯噪声图。这里简单解释一下高斯噪声,高斯噪声是数字图像里呈高斯分布的均匀噪点。

  在这个学习循环到结束的过程中得到的数据就是根据这一张学习的内容,当有很多张图片的学习数据都储存进来后,同一个标签内容在一张图里的像素点的分布概率就形成了一个算法,所有标签的算法的集合就是这个AI绘图程序的绘制模型。

  

  学习过程之后,并不是绘制过程,而是训练。绘制过程和训练原理是一致的,区别就在绘制过程使用的是AI以确认过算法可行性之后的模型,而训练就是确认算法可行性的生成过程。

  生成时,生成器首先根据标签在模型内提取一系列算法,然后拿出一张高斯噪声图,根据算法来一步一步去除噪点得出画作。但这里的问题是,如何确认画出来的图是一张合理的图而不是其他什么诡异的东西?

  这首先要了解一个概念生成对抗网络(GAN)。这个网络由两个部分构成,一个生成器,一个鉴别器。生成器根据标签黄昏、多个城堡、阳光穿过树林、丁达尔效应等来生成图片,鉴别器根据已有图片来识别这是不是一幅画。如果不是,则打回给生成器;如果是,则证明生成器这种生成概率可行。

  这就像下棋AI,两个程序不停博弈,收集数据。最后,当生成器能够近乎每次都通过鉴别器的识别之后,绘画模型就算完成了。

  

  这之后,就可以愉快地使用AI程序来进行绘画啦。不过由于训练过程数据量太庞大,不可能让人来进行鉴别这个过程,所以鉴别器有时候的结果对人而言也不一定准确,AI绘制出的结果也并不是一定符合人的理解。这就需要人来进行一些后期的润色,以让整个画作显得更加合理。

  所以说,AI作画并不是有些人口中的缝合怪,拼图软件,其实它是带有一定创作色彩的。AI作画最早在1970年被AARON设计,虽然到最后也没有开发完成。自2014年以来,GAN就被一些AI艺术家使用。但在2022年之前,AI绘画收获的关注度其实相对较低,直到现在技术大进步才收获大量目光。

  

  不过,一些超出一般的内容出现也不一定是坏事。这些奇异的构图也许可以激发画师的灵感,从而创作出一些超出一般认知的超现实主义作品,比如上面那张。但是由于是随机生成的,所以很难形成一系列的内容,比方说同一个人物的不同场景不同动作,虽说可以在一定程度上解决这个问题,但并不完善。

  未来,AI作画技术更加完善之后,也许可以绘制出更多有着更好细节的画作,可以让不会画画的人通过画作来实现自己的想法;也可以让小说家通过AI绘画将自己的内容变为可视的内容;可以帮画师做创意展示、减少画师的一些机械劳动等。技术进步,让不可能变得可能。

  举报/反馈