最近AI大火,很多AI工具都进入了国内。但AI本身是依赖算力的,比如ChatGPT、文心一言这种大语言模型,普通的PC就跑不了,只能用他们提供的算力。绘画的AI其实也差不多,比如最火的Midjourney,就是付费的,进入国内之后月费有68、198和398三个档位。我们今天讨论的是很火的Stable Diffusion,它在单机可以运行,并且效果也不错。
微星(MSI)RTX 4080丨4090 超龙白色魔龙电竞游戏直播专业设计智能学习台式电脑独立显卡 RTX4090 魔龙X 24G
(资料图片)
进入购买
需要什么样的硬件环境
当然是越快越好!这显然是废话。这里简单说一下吧,16GB内存容量是入门标准,如果要运行融合模型,得64G或是更大。另外一个则是GPU,如果有钱买专门的大显存计算卡当然更好,不过3060 12G显存版本也可以。这里要注意的是,跑Stable Diffusion,显存容量要比GPU核心重要,GPU只是快慢,显存多寡决定了能玩起来。
显卡一定要N卡,A卡也能用,但限制多。
CPU?其实看内存需求,就可以知道支持128G的PC都是很新的,如果你要训练模型,比如用你家的猫,你的孩子的照片训练,其实对CPU也有点要求,12代i7及以上显然会更快一点。
对于安装的位置,个人强烈建议安装在一个单独的SSD上,这东西非常非常占地方,尤其是各种模型,好几GB一个比比皆是。
软件环境
先不说安装Stable Diffusion,起码的运行环境你需要安装Python 3.10和Git,后者安装需要用cmd指令。当然这个过程现在简化了,有了整合包。装好之后会自动运行WebUI,浏览器打开即可。
但很多时候,运行的时候需要管你要Pytorch,这是一个开源的机器学习库。如果你要自己训练,还需要去英伟达官网注册一个开发者账号(免费),下载安装CUDNN,是英伟达的机器学习组件,用CUDA加速。要注意的是,如果玩Stable Diffusion,显卡的驱动记得安装WHQL版,不要装测试版。
整合包哪里下载?
Stable Diffusion的整合包网上到处都是,自己找个百度网盘下载吧,文件不小最好是会员,不行找人借个会员也行。不过笔者建议最好是用一个比较纯粹的系统来运行,因为这种东西的可靠性不是特别高,一个纯净的系统更容易排除故障。好在现在固态便宜,双系统也容易弄。
让人头晕的界面
安装好之后,有好几个选项,我们常用的就是文字生图或是图生图。
如上面的的图。这就是Stable Diffusion的WebUI。上面你会发现有两个对话框。第一个里面,你要输入的是各种你想要的。第二个则是告诉它你不要什么。这个叫做Prompt。这是一个庞大的词库,不同的词对于生成图像的内容都有影响,这不是一朝一夕能掌握的。
另外一方面,则是下面的参数选择。比如图像大小,强烈建议别超过512X512,更大容易一张图里出现好几个主体,这背后的原因是Stable Diffusion本身就是512X512训练的,啥时候它用更高分辨率训练再说。如果想要更高清的,可以通过一些办法进行后续的处理,比如一些GAN模型可以提升分辨率。
下方则是很多参数的选择。比如采样方法,啥都不会就选Euler,随着操作的熟练度和对Stable Diffusion理解更深入,可以选择其它的办法。这些参数选择需要长期的积累。
模型选择上,ckpt是基础,LORA对画人表现更好,如果风景,可以考虑Embedding。不过这个也是要玩的很熟练才能掌握模型的组合。
模型、参数这些可以死记硬背或是反复试错,结果出来大差不差。但关键的Prompt怎么办?可以写一段你想要的图片的内容描述,翻译成英文,然后再交给很多提示词工具,它们会帮你生成,再输入到Stable Diffusion里面,会有很好的效果。
总体来说,Stable Diffusion从安装到使用,再到熟练掌握,不是一朝一夕的事情,尤其是Prompt,非常考验出图的效率,这也是为何未来Prompt工程师会成为吃香的热门方向。AI时代,多掌握一门手艺,总是不错的。
标签: