Stable Diffusion Web UIをGoogle ColabにインストールしてAIイラストの生成を試してみたので、その方法を備忘録代わりにメモしておきます。正直、もう一度やってみて、と言われて同じことができる自信がありませんので、しっかりと書き留めておきたいと思います(笑)
「Stable Diffusion」とは
「Stable Diffusion」というのは昨年から話題になっている画像生成AI(AIによるイラスト生成プログラム)のことで、それを使うことにより、イメージを記述した文字列をイラストに変換することができます。
例えば、こんな感じ。
これは「天の川が見える真夜中の森」みたいな文字列、通称「呪文」によって生成したイラストです。実際は英語の羅列になりますし、品質に関する呪文の入るので、もう少し複雑な文字列になります。
これは、「高層ビルが並ぶ通りに立っているセーラー服の少女」みたいな文字列で生成したイラストです。アニメのキービジュアルみたいですよね(笑)
一般的にAIというのは最初は頭が空っぽなので、教育というか訓練というか、「教える」という作業が必要になるのですが、この画像生成AI「Stable Diffusion」は、様々なところ(個人や団体)から訓練済みデータが配布されており、プログラムと一緒に、そのデータ(「モデルデータ」と言われています)をインストールすることで、いきなり高度な絵が描けるようになります。
「Stable Diffusion」はフリーで使用できるもなのですが、これ自体はただのプログラムコード群なので、一般的なアプリのようにパッケージ化されておらず、簡単にインストールできるものではありません。正直、私にはワケワカメでした。
でも、これをWebのユーザーインターフェースから操作できるツールを作成してくださった方がいて、そのおかげで導入のハードルがグッと下がっています。それが、AUTOMATIC1111さんが作成した「Stable Diffusion Web UI」です。
今回ここで説明するのは自分のパソコンで「Stable Diffusion WebUI」をインストールし、Stable Diffusionで画像生成できるようにするための方法です。
Stable Diffusion Web UIをGoogle Colabにインストールする
「Stable Diffusion Web UI」のインストールには、自分のパソコンにインストールする方法と、クラウドにインストールする方法があります。
家庭用のWindowsパソコンにインストールしても動くものではあるのですが、結構ハイスペックなパソコンが必要で、私のパソコンにインストールしても動きませんでした。グラフィック系のスペックが重要で、最低でもVRAMが10GB必要だということで、ちょっとしたゲーミングPCレベルのスペックが要求されます。
そこで、自分のパソコンにインストールするのはあきらめ、クラウドにインストールする方法を選びました。クラウドは無料でも使える「Google Colab」を選びました。無料は15GBまでしか使えないのですが、大容量のモデルデータを入れなければギリギリ間に合います。
Google Colabについてと、Google ColabへのStable Diffusion WebUIのインストール方法については、こちらのサイト様を参考にさせていただきました。
細かい技術的なことは解らない私ですが、ここに書いてある手順通りにやればインストールが完了します。執筆者のじょじおさんにはマジメに感謝です。神と呼ばせていただきます!
簡単に手順を書き留めておきます。
1.Google DriveとGoogle Colabを使えるようにする
Googleにログインした状態で、Google DriveとGoogle Colabにアクセスするだけ。
2.Automatic1111 WebUI公式ページに行って、Google Colab用のノートブックを自分のColabにコピーする
こちらから→【Automatic1111 WebUI公式ページ】
3.モデルデータをダウンロードして、自分のGoogle Driveにアップロードする。
とりあえず「Anything V4.0」がオススメ。
あまり大きなデータだとDriveの容量が足りなくなるので2GB程度のモデルが推奨。
4.ノートブックの各セルを実行する
5.最後に出てきたURLを開くと窓が開いて「Stable Diffusion WebUI」がスタート
以上です。
ほとんど上記サイトの書いてある通りにやればできますので、興味のある方は挑戦してみてください。
ちなみに、無料版のGoogle Colabは、GPU(グラフィックの生成に使用するプロセッサ)の使用量に制限があって、ある程度画像を生成すると、その日はもう使えなくなります。有料版にすれば、その制限が緩くなるみたいです。
モデルデータについて
上では代表的なモデルを紹介しましたが、世界には無数のモデルデータが存在しています。まだ歴史が浅いシステムなのに、この勢いはすごいですね。
モデルデータを変えると、生成される画像のイメージが変わりますので、いろいろ試してみて好みのモデルを探すと良いと思います。ただし、Google Driveにアップする関係上、
・複数のモデルと同時にアップしておく
・容量の大きなモデルを使用する
というのが難しいのでご承知置きください。新しいモデルを試す場合は、置き換えながらやる必要があります。
それではモデルデータを列挙します。
■アニメ系
・anything v4.0
・7th_Layer
・yden V2
・PastelMix
・waifu-diffusion v1.4
・SukiyakiMix v1.0
■実写系
・ChilloutMix
・basil mix
・Realism Engine 1.0
・DreamShaper
・LOFI(V2)
とりあえずこんな感じで。
後ほど追記するかもしれませんが、
ダウンロード先はググって調べてみてください。
こちらのサイトも参考に。
呪文詠唱
何にしてもキーワードを入れないと希望する画像が生成されません。
基本は英語なので、少しハードルが高いです。
最初は他の方が作成したサンプルの呪文をコピペして、少しずつアレンジしながら試してみると良いと思います。
私が参考にしたサイトを列挙しておきます。
まったく同じ呪文でも全然違う画像が生成されたりで、なかなか奥が深いです。
最初は「偶然好みの画像が出てくるのを待つ」しかないような気がしますね。
例えばこれとかも、20回ぐらい試行錯誤して、ようやくイメージに近い画像が出ました。
私もこれからいろいろと勉強しながらレベルアップしていきたいと思います。
【追記2023/4/19】Stable Diffusionの良いマニュアル本を見つけた
Amazonで良いマニュアル本を見つけました。
柳井政和さん(著)「低VRAMではじめるStable Diffusion – 画像生成AIでゲーム素材を作ろう」です。
これを読んで一気に氷解しました。
この本には、Google ColabにStable Diffusion Web UIをインストールする方法が上記とほぼ同じ方法で書かれており、さらに画像を生成するためのパラメーターの設定方法も書かれているので、私が今まで解らないながらに試行錯誤していた部分の意味がようやく理解できました。
あと、呪文の構成についても基本が詳しく書かれているので、一読することでいろんなことができるようになります。パソコン系の技術って日進月歩なので、書籍を買ってもすぐに使えなくなることが多いのですが、この書籍は当たりでした。まさにバイブルです。
ちなみにこの本、Kindle版なのですが「Kindle Unlimited」対応なので、メンバーの私は無料で読めました。Kindle Unlimitedは加入しても30日は無料なので、すぐに読んで退会すれば、無料で読めますね(笑)
↓こちらから無料登録ができます↓