【パソコン初心者向け】AI画像生成 Stable Diffusion web UIの使い方/画面説明【完全版】

Stable Diffusionのインストールは終わりましたか?
まだインストールが済んでいない方はコチラの記事から!

画面の説明なんてどうでもいいんや!!!
はやく美女を作成させてくれいっっっっ!!!!!!!

。。。OKりょーかいです。
実際に画像を生成してみましょう!

画面が黒い方がいいなと思う方は起動後コチラをクリックしてください。
http://127.0.0.1:7860/?__theme=dark

画像を生成してみよう

まずは3つの箇所を画像の通りにしてください。


chilled_re-gneric_V2-test04.safetensors
クリックしてセットしてください。

②③は以下をコピペしてください。

②positive prompt
(8k, best quality, masterpiece:1.3), (realistic, photo-realistic:1.37), (intricate details:1.2),ultra-detailed,(portrait photography:1.23),
1girl,(full body:1.3),
(bikini:1.2),high heal,
day,poolside,
(light from front:1.5),
(smile:1.5),(grin:1.2),
(huge brests:1.4),(cleavage:1.4),
blondehair and blown eyes,(wavy hair:1.2),(mezzy hair),
white skin,nsfw)

③negative prompt
EasyNegativepaintings, sketches, (worst quality:2), (low quality:2), (normal quality:2)

上記を入力して右上のオレンジボタン④Generateをクリックしてください。

1番初めは少し時間がかかります。
環境によっては10分程度。

はいおめでとうございます
美女が完成しましたね。
↓私が生成した画像はこれ(アイキャッチ画像も同じプロンプトで生成しています)

では実際の画面の説明をしていきます。

①Stable Diffusion checkpoint

モデル(checkpointとも言います)を設置する場所です。
stable diffusionは様々なモデルがあり、ダウンロードしたモデルは
C:\sd\stable-diffusion-webui\models\Stable-diffusion
ここのフォルダに格納したと思います。

Stable Diffusionを起動中に新しいモデルをここに追加したい場合
すぐ隣にあるリフレッシュボタンを押すと新しく入れたモデルを読み込む事ができます。

実際にやってみましょう。

Civitaiに飛んでChilloutMixのchackpointをダウンロードしてください。
civitai.com


ダウンロードしたらchilloutmix_.safetensorsのデータを以下のフォルダに格納してください。
C:\sd\stable-diffusion-webui\models\Stable-diffusion

そしてモデルと一緒にそこにある画像もダウンロードして名前をsafetensorsデータと同じにしてください。(拡張子は.pngのまま)
画像の名前を一致させないと
大量にモデルを入れた際にわけわからなくなります!

今回で言うと
画像の名前はchilloutmix_.png
モデルの名前はchilloutmix_.safetensors

画面をStable Diffusionに戻しまして、リフレッシュボタンを押すとchilloutmixのモデルが選択できるようになるはずです。

※余談だけど必読※
generateの下にある赤い花札みたいなやつをクリックして
checkpointsタブにいくと登録されているcheckpointの画像を確認することができます。

また、モデル名の変更絶対NGです!
どのモデルをダウンロードしたかわからなくなるのです。
なので画像を登録して覚えるようにしましょう。

ここのウィンドウはもう一度赤い花札を押すと閉じれます。

また、モデルによってはバージョンがあります。2023/4/5現在ではこの箇所です。

今回ダウンロードしたChilloutMixも様々なバージョンがあるのですが
モデルは最新版だから良い!というわけではありません。

今の段階ではモデルというのは国籍や顔、体型、ポーズ等が違うものみたいな認識をしてもらえればと思います。
なので、例えばchilloutmix-Niというモデルを使ったら同じChilloutMixという名前でも違う顔やクオリティのものが出てきます。
そして最新版だからクオリティが高い!というわけではないということです。あくまでバージョンは好みです

②Prompt(Positive Promptと呼ぶ方も多いです)


こちらに描きたい内容を入力していきます。
■Positive promptの基本的なルール(絶対読み飛ばさないでください)
・呪文と呪文の間は,(カンマ)で区切る。

・強調したいものは(○○:数字)みたいな形でかっこと(コロン)をつける。
 実際にはこんな風に書きます→(beautiful face:1.2),(detailed eyes:1.3)みたいな感じです。
 数値のデフォルトは1です。ですのでなにもつけなければ1という認識で大丈夫です。
 コロン後の値は0.1~2位のが良いと思われます。2以上はおすすめしません。
 コロンで強調したものはctrl+↑or↓で値を上下できる(0.1)ずつ。
 0.1の変化でも出力画像はかなり変わります!

・改行OK!なので自分のルールで見やすいように改行しまくりましょう!

・半角スペースOK!カンマの後の半角スペースは良い意味で無視してくれるみたいです。
 ただ、おそらく若干?影響がありますので基本的には全部詰めた状態での記載をおすすめします。

・前方に書いてあるものほど重要視してくれる。

・あまり長い文章は理解されにくい

・andはものとものを分けるのに使える
 具体的な使い方としては、色を分けれる確率があがります。(あくまで確率が上がるだけです)
 例)blue hair and red bikini
 こんな感じで書くと赤い髪の人が青いビキニを着てくれます。
 使うとわかるのですが色の指定が難しく画面上の色んな所に色が飛び散ってしまいます。
 そういう時はandを使って指定してみましょう!

上記を基本の例として色々作成してみてください!
その他さまざまなポーズや視線、カメラアングルを作りたい方は以下のブログがとっても参考になります!
gamedev65535.com
blogcake.net
note.com

③negative prompt

Promptの下にある入力項目です。こちらは表示させたくない内容をいれます。
リアル系ですと、以下のものは固定で入れてしまっても大丈夫です。
EasyNegativepaintings, sketches, (worst quality:2), (low quality:2), (normal quality:2),

要するにイラストっぽいものや、品質が悪いものは描かないでねということです!

AIが画像生成していますので意図しない画像がでてきたりします。
例えばサンプルのプロンプトを何回か回すとたまにサングラスをかけた女性がでてしまうのですが
サングラスが邪魔だな~と思った場合にnegative promptにsunglassを入れるとサングラスを描かなくなります。

使い方の一つとして覚えておいてください。

④sampling method

AIの画像生成の方法です。リアル系ではほとんど固定されていまして、
おおよそ下記の3種類で作られることが多いです。
Euler a
DPM++ 2M Karras
DPM++ SDE Karras

他のものはあまり良い画像が出力されず、、、実際にご自身でためしてみてください。

⑤sampling Steps(サンプリングステップス)

AIが画像を生成するまでに何回書き直すかということです。
現在配布されているほとんどのモデルは20~40の間にすればおおよそ問題ないです。
数値を変化させて好きな絵柄に近づけてみてください。

サンプリングステップ数は生成時間に直結します!
少なければ早く生成できますし、多ければ生成に時間がかかります。

⑥Restore faces(リストアフェイスズ)

顔だけキレイに書き直してくれる機能です。
しかし、、、、あのスマホアプリのビューティープラスを使った感といいますか、、、、リアル感がなくなってしまいます。
ですので、できれば使わないほうがいいと思いますが、これは好みの世界ですね。

⑦tilling(タイリング)

画像をタイル状に出してくれます。
使わないので基本チェックは入れません。

⑧Hires. fix(ハイレゾフィックス)

画面の解像度を上げる事ができます。

チェックを入れると右側にリサイズされた際の完成サイズが表示されます。
この場合だと512px*512pxを1024px*1024pxに変換しますよという事です、

・Upscaler(アップスケーラー)
拡大手法です。基本的にはlatentでよいのですが変更すると絵柄が変わるので
好みの絵柄を探してみてください。
またモデルをダウンロードするページにおすすめのUpscalerが書いてあることがあります。

・Hires steps(ハイレゾステップス)
拡大する際に何回描くかという事です。
サンプリングステップ20でHires steps20ですと合計40回書き直してイラストを生成しているという事です。
こちらも基本的にはサンプリングステップと同じ値でよいのですが、半分に下げても結果が変わらなかったりするので
下げてみて変わらないようでしたら下げてしまっても良いです。

・Denoising strength(ディノイジングストレングス)
アップスケール前の下絵をどれだけ尊重して描くかという事です。
一般的には0.45~0.75位の値が実用的です。お試しください。

⑨Width(ウィズ)

画像の横幅です。単位はpx(ピクセル)です。

⑩Height(ハイ)

画像の縦幅です。単位はpx(ピクセル)です。

画像の横幅と縦幅はすごく重要でして例えば5girl’sとプロンプトに書いたとしたとき
横幅が長い画像は5人の女性が出やすいが、縦幅が長い画像は出にくいです。
意外と盲点ですので画像サイズはかなり気をつけましょう!

また学習モデルは全て512px*512pxのサイズで学んでいますのでそこから離れすぎている
画像の生成はうまくいかないことがおおいです。
例えば1920px×1080px等、、、
最初に512px×512pxで作成してHires. fixで2倍((1024px×1024px)に拡大するという形だとうまくいきます。

⑪CFG Scale(シーエフジースケール)

どれだけプロンプトを読み込んでくれるかという事です。
この数値を上げれば上げるほど自分の書いた指示を読み込むのですが、数値が高いとうまくいかないことが多いです。
推奨は3.5~10程度でして、モデルによっては15位でも良い画像がでたりします。
これも好みのものがでるまでご自身で検証してみてください。

⑫Batch count(バッチカウント

画像を何枚出力してくれるかです。
僕は寝る前に100に設定して朝起きた時、画像が100枚できているのでほくほくしています。

⑬Batch size(バッチサイズ)

1枚の画像に何枚のイラストを生成するかです。
いいグラボを使っていない限り1推奨です。

⑭Seed(シード)

ー1はランダムに画像生成してくださいという意味です。

ここで試してほしいことがあります。
一度画像生成をした後、サイコロの横のグーグルドライブみたいなマークを押します。
その後同じ呪文でもう一度画像生成をしてみてください。
同じような画像が出力されましたね!

シードの値というのはその画像の背景や人物、表情、ポーズなどを管理する番号という事です。
ランダムに戻したいときはサイコロマークを押します。

余談:シードは0以上4294967296未満の整数です。

⑮Script(スクリプト)

色々できる拡張機能です。
色々できすぎてしまうので今は割愛します。そのうち記述します!

以上となります。
次はお顔を日本人にしてみようです!
皆様お疲れ様でした!