技术突飞猛进。
伴随着讨论热度的消退,AI绘画的话题在最近一段时间似乎也逐渐停止了兴风作浪,但不少游戏公司已经悄然将AI绘画加入到了他们的工作流程中在探索AI绘画工具的浪潮中,作为一群绘画方面的业余爱好者,触乐也已经迈出了第一步——在朱佳音老师的指导下,我们正在尝试使用AI绘画工具生成文章所需的插画
画风,付费,本地化。
为了生成具有相应风格的插图,第一步当然是选择合适的模型AI绘画的模型进化进度在最近半年有了突飞猛进的发展国内外主流车型五六款,各种风格化车型百花齐放可是,找到一个适合生成文章插图的模型并不容易
无论哪种方式,你都必须尝试一下最终我们选择了四个模型作为备选:稳定扩散,,开源后支持本地部署,曾被称为最强绘画AI,DALL E,,老牌AI研究团队OpenAI旗下最早的图像生成AI之一,设置不和谐频道,中途持续更新,的模型,最后是支持日式画风的NovelAI本地部署版本
但是,天下没有免费的午餐——开源行为虽然接近于往你嘴里送午餐,但也需要足够的计算能力来运行程序几年前配置还不错的GeForce RTX 2060显卡,现在已经有些力不从心了有人曾经用稳定扩散模型统计过不同显卡生成512×512大小图像的时间2060显卡需要17秒,3080显卡需要7秒——不一定足够准确,但也有参考价值
3080耗时不到2060的一半。
一般来说,用一组关键词生成四个512×512的图,大概需要1个积分
描述关键字
其他用户共享的案例可以在Lexica上搜索。
要生成平面图像,需要更多的尝试。
这一整段描述直接给了稳定扩散之后,表现出了前所未有的混乱。
与付费的dalle E和Midjourney模型相比,经过不断的迭代和调整,产生无法使用的废像的概率要低得多在Midjourney中使用同一套关键词,只需要一个简单的关键词by清水裕子来指定画风,就可以得到相当不错的效果
可见,Midjourney对外卖盒子的理解是正确的,但对痛苦的理解有些奇怪。
dalle E对画风的理解不到位,但对描写的内容理解正确在几个模型中,DALL所描绘的情感是生动的
DALL将疼痛与双手抱头联系在一起
美国漫画和故事板风格版权,还有下一个麻烦。
确定内容是否合法,最终还是要落在具体的作品上如果是不再受著作权法保护的画家作品,模仿他们的风格进行再创作当然没问题如果你想模仿仍然受著作权法保护的现代画家,你得慎重考虑尺度
稳定扩散生成的梵高风格绘画
无论如何,目前的AI绘画模型还不成熟,但你可以直观地感受到技术的飞速进步——也许用不了多久,我们就会真正用AI生成插图,会更逼真,更像人画的插图届时,不知读者能否找到
Midjourney的教皇配柯基和蘸酱薯片看起来真的很不错。
。