現代機械学習の学習記録 #1

Stable Diffusion Web UI をつかって絵を生成して遊んだ

参考: Stable Diffusion Stable Diffusion + Automatic1111 Stable Diffusion Web UI + Counterfeit-V3.0 を導入してAIで画像生成する | iPentec

モデルなどのファイル共有手段として Hugging Face というのが主流のポータルになっているらしい( Misreading Chat – CS の論文読んで話をしよう! でも話題に上がってた)

huggingface.co

Stable Diffucion Web UI 単体のDL後、別の絵を生成するには "Model" "VAE" という2種類のファイルをとってきた。つまりこのへんがインタフェースの区切りになっている。

モデルはこれまでの知識から「大量のニューロン=重みの集合」と考えておく。 VAEはなんとなく、「モデルから複数パターンのアウトプットを得たあと、それらをうまくマージして単一のアウトプットにする」みたいなもの、認識しておく。 qiita.com

モデルをDLするときも "Stable Diffusion 用" "ほげほげ用" といった、UI画像のある別の生成ツールにそれぞれモデルが用意されていた。 つまり

  • 生成を実行するUI
  • VAE(入出力の変換)
  • モデル

という階層構造になってそう。

後、大事なことだけど、画像生成で好みの美少女を生み出すのはめっちゃ楽しかった。