有想对着AI说一句话就让AI把所有工作做完的,也有把AI生成的内容抢注版权的,但说到底也是人类在不同的领域找捷径。
1、源于ChatGPT 的 DALL·E 3
得益于 ChatGPT 的语义理解,DALL·E 3 是目前市面上学习成本最低的图片生成工具。几乎支持所有语言的理解,只要使用清晰详尽的描述就能生成比较符合预期的图:
在“说人话”之后,看的就是 DALL·E 3 的绘图技术了,虽然输出的图片成品本身并不是目前“AI生图领域最高质量的作品”。但在初级赛场上基本无出其右。
基于 ChatGPT 的DALL·E 3技术上代表着人机交互的最高水平,支持多种语言输入以生成图片,目前在针对英语文本的创作也具有很高的实用性。只需要陈述要画出来的文本,就能得到不错的反馈。
2、最出圈的Midjourney
Midjourney目前在性能、实用性甚至商业价值上Midjourney是综合评分最高的工具。在生成图片方面,Midjourney提供了丰富的模型和功能。包括目前市面上最高逼真度的 V6,二次元风格的Niji 模型。
在市面上,Midjourney也因它能生成最接近真实摄影水平的图像而出圈。让大众最直观的感受到AI绘画的能力。
在使用Midjourney生成图片的过程中,可根据调整prompt(关键词)来控制生成的图片内容,并在图片生成后进一步使用Midjourney提供的功能,包括提高分辨率等进一步的提高图片质量。
目前Midjourney是全球范围内最具实用价值的AI生图工具,但操作门槛和直接付费成本也相对较高。
3、用户基数最大的Dreamina
Dreamina生出的图片以2024年的眼光来看,少有质量上惊艳的内容。但依托剪映的背景,Dreamina吸附了大量拥有日常创作习性的用户,这让创意汇集有了极大的提升。
通过Dreamina生成的作品可以进行二次创作,包括局部的重绘和AI扩图。这些功能需要大量的尝试,或许一两个使用者的创意并不能带来太多的作品喷涌,但极可能汇集用户,在平台上分享就能让用户之间传播更多的可能对另一个用户有用的价值。
4、养眼的天工AI图片生成
天工的AI生图基于自然语义的理解,在风格上可以按照自己的想法进行陈述。现在市面上大部分风格都可以通过天工AI图片生成。
但在天工AI图片生成上,并不支持对图片的更多修改。并在细节理解上有很多歧义,比如区分不开“纯白背景”和“雪白背景”。而与之相对的是,天工生成的图片少有鬼畜,大部分图片都有“好看”这个加分项。
5、Stable Diffusion
AI生图开源技术的代表,也是目前为止可供本地部署解放AI创作封印的最优工具。
因为布置在本地,Stable Diffusion 的性能受到使用设备的限制,虽然设计的边界更自由,但效率与成本比较低。
相较于部署于公共网络的各个AI工具,Stable Diffusion可供使用者部署在自己的专属设备上,并且解除一些没有必要的(或者是有必要的)限制。
一口气碎碎念:“文生图”是一个以偏概全的理想。
用一段Prompt就生成一个满意的作品就像是理想者的乌托邦,只要是人类还在不断追求审美,那么最好的视觉盛宴就离不开人类的创造,美好之上,总有更美。
AI目前已经是一个很好的工具,它拥有的价值无需质疑。但在工具的价值上,最重要的仍然是使用它的人类。
AI暂且成功,总之还需努力。