嘘~ 小破站正在拼命加载中 . . .

来体验了下AI绘图


2023年真的是AI大爆发的一年,当我们还沉浸在chatGPT的时候。AI绘图也随之火爆出圈,

不管是在朋友圈、B站、抖音都能刷到各种“AI小姐姐”。

微信图片_20230401162143 微信图片_20230401162204 微信图片_20230401162212

AI绘图真的可以这么逼真了么,这不得亲自去体验下

AI绘图工具也挺多,今天我们使用的是Stable Diffusion 这一绘图工具。

Stable Diffusion被认为是目前最强的 AI 绘画工具,而且已经完全开源,可以支持本地部署。

最近火出圈的AI绘图,大多也是出自于Stable Diffusion

github地址

github地址:https://github.com/AUTOMATIC1111/stable-diffusion-webui

看到这,不少小伙伴可能望而止步了,得自己部署,我也没学过python,这么麻烦,不玩了。

继续往下看,其实网上不少大佬已经把各种资源、所需插件都打包好了。

只需下载整合包,一键启动就可以开始绘图,小白也可以轻松上手

整合 包下载

这里可以跳转到 秋葉大佬得整合包进行下载

https://www.bilibili.com/video/BV17d4y1C73R

下载完后是如下一个压缩包(大小9.98G),压缩包中包含了启动器

image-20230401171447589

启动使用

①启动

解压上面得压缩包,进到文件中找到,A启动器.exe文件,双击即可启动

image-20230401171640706

image-20230401171927617

②界面简介

点击上面中【一键启动】,即可开启一个web页面(http://127.0.0.1:7861/)

image-20230401173832259

在上图中,我们只要输入正向咒语、反向咒语 然后点击右边的【生成】,等上一会就会在图片区生成图片。

AI绘图是不是很简单呢

当你看到第一次生成图片的时候很大可能都不太满意,这跟自己想象的怎么不一样呢。这差距也太大了。。。

这是因为你还没学咒语呢,接着往下看,我们一起来学一学基本咒语

咒语和魔法学习

说明:在这里个人喜欢把各种模型当作是魔法,正向提示语反向提示词当作是咒语。

想要使用一个高超的魔术,魔法和咒语都是必不可少而且非常重要的

1 、咒语

① 正向咒语

正向咒语是我们想要图片中出现的内容

1 girl ,best quality 这样的描述词(需要发挥你的想象了)

② 反向咒语

反向咒语是我们图片上不想出现的内容,如果不加可能会出现三头六臂的情况

lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

咒语简单语法说明,我们以girl 这个tag为例进行说明

  • 不管是正向咒语还是反向咒语,每个tag之间用“,”号分割
  • 小括号用于加权重,(girl) 表示加1.1倍权重 ((girl)) 表示加1.1*1.1=1.21 倍权重
  • 中括号用于减权重,[girl] 表示减1.1倍权重
  • :+倍数用于加权重,(girl:1.5) 表示加1.5倍权重

2、魔法

①常见的模型可以分为三大类

  • 大模型:标准的 latent-diffusion 模型。拥有完整的 TextEncoder、U-Net、VAE 。

  • 小模型:用于微调大模型的小模型。常见的小模型可以分为:Textual inversion (常说的Embedding模型)Hypernetwork模型LoRA

  • VAE 模型:类似于滤镜的东西。会影响画面的色彩及一些小细节

注:对于新手来说,区分好这三种模型非常重要,要不然你可能和我刚刚绘图是一样,一头雾水

②各种模型所在地(下面所说的路径都是基于webui根路径下的相对路径)

  • 大模型

    常见格式为 ckpt ,大小在GB级别,随便一个大模型都是2G、4G 或者更大,放在了models\Stable-diffusion 路径下面

    image-20230401183155450

    使用方法:在web页面左上角选择大模型

    image-20230401183801712

  • 小模型

    ① embedding 模型

    常见格式为 pt、png图片、webp图片。大小一般在 KB 级别,放在embeddings路径下面

    image-20230401183631258

​ 使用方法:

​ 生成图片的时候需要带上 文件名 作为 tag。例如:我们在正向咒语中加上这样的tag yaguru magiku

② Hypernetwork 模型

​ 常见格式为 pt。大小一般在几十兆到几百兆不等 也有更大的。放在了models\hypernetworks 路径下面

image-20230401190315316

使用方法:

image-20230401195946688

③ LoRA模型

​ 常见格式为 pt、ckpt。大小一般在MB级别,也有更大的。放在了models\Lora 路径下面

image-20230401184521354

使用方法:

点击一个模型以后会向提示词列表添加类似这么一个tag, lora:模型名:权重 也可以直接用这个tag调用lora模型。

image-20230401185045863

  • VAE模型

    常见格式为 .pt 、ckpt ,大小在MB级别。放在了models\VAE 路径下面

    image-20230401185246966

使用方法:

image-20230401190119045

上面提到了各种路径,其实在启动器的这个模块我们可以快随找到

image-20230401203253781

借鉴模仿咒语

通过上面的一波学习后,不知道你有没有学废了呢

反正通过我自己写出来的咒语,然后会生成各种“进化的人类” 😅

这怎么能行呢,我们能不能去抄袭(模仿)一下别人的咒语呢,当然可以了。

只有你想不到的,没有网友做不到的。大佬们训练好的很多模型。还有很多咒语、魔法

https://civitai.com

image-20230401201242891

我们找个国风的模型下载并使用

image-20230401201522002

体验一下

各种魔法、咒语都准备好之后,我们就来试试魔法效果

正向咒语

best quality, masterpiece, highres, 1girl,china dress,hair ornament,necklace, jewelry,Beautiful face,upon_body, tyndall effect,photorealistic, dark studio, rim lighting, two tone lighting,(high detailed skin:1.2), 8k uhd, dslr, soft lighting, high quality, volumetric lighting, candid, Photograph, high resolution, 4k, 8k, Bokeh <lora:GuoFeng3.2_Lora:1>

反向咒语

(((simple background))),monochrome ,lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, lowres, bad anatomy, bad hands, text, error, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, ugly,pregnant,vore,duplicate,morbid,mut ilated,tran nsexual, hermaphrodite,long neck,mutated hands,poorly drawn hands,poorly drawn face,mutation,deformed,blurry,bad anatomy,bad proportions,malformed limbs,extra limbs,cloned face,disfigured,gross proportions, (((missing arms))),(((missing legs))), (((extra arms))),(((extra legs))),pubic hair, plump,bad legs,error legs,username,blurry,bad feet

image-20230401202243928

又找了几段咒语试了下,生成的图片如下,是你想要的结果么?

00001-740346198 001
00003-336154301 00000-3023078233

AI模型训练

如果之前的模型都没有自己想要的,也可以自己去训练模型。

我是没训练过了😂,也是刚开始探索这新大陆。

这里必须得说勿用技术做恶 ,别把AI技术用错了方向

请勿用该技术从事诈骗等违法行为,请遵守《互联网信息服务深度合成管理规定》等法律法规。

前几天看到这样一则新闻就是活生生得例子

image-20230401214423518

本来前面的示例中想画一个汉服小姐姐的。

也好不容易找到有作者训练出了模型,结果可能就是因为上述这些侵权违法行为,作者闭训练好的模型和其他lora模型的下载

image-20230401215913303

最后

本期内容到此就结束了,感谢各位小伙伴的阅读。

自己也是刚开始研究学习AI绘图,如果有什么说错的地方欢迎大家指正。

如果大家发现什么好玩的也希望能一起分享出来

勿用技术做恶 ,别把AI技术用错了方向


文章作者: xiezhr
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 xiezhr !
评论
  目录