5个你现在就可以使用的“AI作图”工具，体验一下吧

时间：2022-11-22

　　有趣、好玩、新奇。

　　编者按：AI 作图工具最近大火，但在哪里能够体验这种新奇的工具呢？本文提供了五种选择。本文来自编译，希望对您有所启发。

　　DALL-E 2 的首页展示了一些 AI 模型的最佳作品。图片来源：OPEN AI

　　2022 年可能会作为“人工智能艺术成为主流的一年”而载入史册。

　　随着多个高质量 AI 作图工具的爆炸式增长，任何拥有智能手机和互联网连接的人都可以接触到 AI 艺术。这些工具使用人工智能模型将文本输入（即“提示”）转换为图像。

　　“提示”是关键，添加或删除单个单词会导致截然不同的结果。人工智能驱动的社交媒体市场 GenerAI 的首席技术官普冉奈·韦迪雅那桑（Pranav Vaidhyanathan）表示：“‘提示工程’正迅速成为一种有价值的技能，在相同的数据上训练的模型，加上正确的提示，应该会产生相同的结果。”甚至还有一个不断增长的“提示”市场，可以创造特定的结果。

　　这里有五个AI做图工具可以帮助你开始。为了进行比较，我给它们输入了同样的提示：“一个人类和一个机器人站在山上的一棵大橡树旁，天空中飘着云。”

　　“一个人类和一个机器人站在山上的一棵大橡树旁，天空中飘着云。”的图像，由 DALL-E2 人工智能模型创建。马修·史密斯（MATTHEW S. SMITH）/ IEEE SPECTRUM

　　成立于 2015 年的 OpenAI 在 2020 年发布了自然语言模型 GPT-3，成为头条新闻。2021 年 1 月又推出了 DALL-E 数字图像模型，之后演变为 DALL-E 2。OpenAI 的模型提供了各种风格的优秀图像。特定的提示可以导致特定的结果，或者你可以输入一个模糊的提示，然后欣赏几个截然不同的结果。

　　DALL-E 2 现在通过 OpenAI 的网站向所有人开放，对于那些好奇炒作的人来说是最好的工具。DALL-E 2 速度很快，明显超过了我尝试过的其他工具，网站也很容易浏览。它一次提供四个结果，通常风格迥异，这减少了你需要重新运行提示的频率。DALL-E 2 的结果也很好，它是唯一一个同时描绘了人和机器人的人工智能模型。

　　这是一个商业工具，注册后可获得 50 个免费点数，每月可额外获得 15 个免费点数。再额外的点数可以以 15 美元的价格购买 115 个点数。

　　“一个人类和一个机器人站在山上的一棵大橡树旁，天空中飘着云。”的图像，由 Stable Diffusion 人工智能模型创建。马修·史密斯（MATTHEW S. SMITH）/ IEEE SPECTRUM

　　来自 Stability AI 的 Stable Diffusion 工具受欢迎的原因与 DALL-E 2 相同：它快速、有效，并且可以从各种各样的提示中生成可用的图像。

　　任何人都可以通过 Stable Diffusion 的演示页面免费使用这款 AI 作图工具。它虽然没有 DALL-E 2 那么快，但通常在 30 秒或更短的时间内也能得到结果。它也像 DALL-E 2 一样，一次提供四种图像。

　　Stable Diffusion 的模型是开源的，所以想要钻研的用户可以彻底调整它的工作方式。这大大增加了它的受欢迎程度，爱好者们纷纷涌向这款工具。范德安腾（Vaidhyanathan）说：“我们确实看到了一种趋势，艺术家和其他用户被 Stable Diffusion 等开源模型所吸引了，而不是像 OpenAI 的 DALL-E 2 这样的闭源和受控模型。”

　　Stability AI 有一个建立在 Stable Diffusion 基础上的商业工具 Dream Studio。它提供了一个试用版，之后出售积分来生成新图像。

　　“一个人类和一个机器人站在山上的一棵大橡树旁，天空中飘着云。”的图像，由 Midjourney 人工智能模型创建。马修·史密斯（MATTHEW S. SMITH）/ IEEE SPECTRUM

　　在一位参赛者用它赢得科罗拉多州博览会的数字艺术奖后，Midjourney 在质量上赢得了声誉，并引起了争议，因为它没有披露图像的创作方法。Midjourney 擅长生成生动、空灵、超现实的图像，而且用户群已经接受了它的风格。

　　该工具只能通过流行的即时通讯平台 Discord 访问。“提示”可以直接输入到聊天中，聊天是公开的，所以频道中的每个人都可以查看你输入的提示和结果。这肯定会让不了解 Discord 工作原理的读者感到困惑，这可能被认为是一个功能，而不是一个 bug。

　　Midjourney 是一款商业产品，并像其他商业 AI 艺术生成工具一样能够盈利。每个用户一开始都有 25 个积分，但要想获得更多积分，必须按月支付会员费。

　　“一个人类和一个机器人站在山上的一棵大橡树旁，天空中飘着云。”的图像，由 Craiyon 人工智能模型创建。马修·史密斯（MATTHEW S. SMITH）/ IEEE SPECTRUM

　　Craiyon 最初被称为 DALL-E Mini，但它与 OpenAI 的模型没有直接联系，而且其创造者免费提供该工具。结果生成可能需要 2 分钟的时间，而且分辨率低，但可以同时显示 9 个结果。

　　Craiyon 的不同之处在于，它使用的是未经过滤的数据，并且没有特别努力去改进、训练或更正结果。与其他工具相比，Craiyon 的结果通常是乏善可陈的，而且它难以处理精细的细节。例如，有时候人脸看起来简直不忍直视。

　　这个工具有其新奇之处。原始地提供结果暴露了人工智能图像生成的一般优势和弱点，以及创造可用结果的困难程度。这也突出了伦理问题，因为 Craiyon 并不过滤提示，所以如果输入一个带有攻击性的提示，那么人工智能图像可能会被恶意利用。

　　“一个人类和一个机器人站在山上的一棵大橡树旁，天空中飘着云。”的图像，由 VQGAN+CLIP 人工智能模型创建。马修·史密斯（MATTHEW S. SMITH）/ IEEE SPECTRUM

　　人工智能图像生成器近期的流行激发了数以百计的工具，这些工具将先进的人工智能模型与光秃秃的界面结合起来。VQGAN+CLIP 就是这样一个工具，它完全在 Google Colaboratory 笔记本中运行。

　　VQGAN+CLIP 之所以被提及，是因为它（在某种程度上）很容易使用，且提供了一个窥视模型内部工作原理的机会。你可以看到该工具实时地迭代新的变化。虽然是在 Colaboratory 笔记本中访问，但该模型在你的本地机器上运行。每个提示开始时都是一个斑点，但慢慢地会演变成一个可用的图像。

　　不过，VQGAN+CLIP 的生成结果通常并不好。它速度很慢，一次只提供一个图像，并且会消耗大量的视频内存。不过，从好的方面来说，它是完全免费的，没有广告，所以如果你有时间的话，它是一个不错的选择。

　　译者：Jane

　　举报/反馈