愛紗です。
これまで、画像生成AIはStable Diffusionを中心にやってきましたが、最近はComfyUIをローカルに入れて、いろんなモデルを試しています。それぞれ個性があって面白いですね〜
そこで、今回は昨日入れてみた新しい画像生成AIモデル「Krea 2 Turbo」をレポートしてみたいと思います。
このモデルは、VRAM16GB以上推奨となっており、私の愛機(RTX3060 12GB搭載)で動くのか?というのが最大の焦点だったのですが、結論から書くと、ちゃんと動きました。しかも、1024×1024の画像1枚生成するのに45秒ぐらいなので、十分実用の範囲ですね!
とりあえず、その成果品の1枚を。
Krea 2 Turboとは?
Krea 2 Turboは、アメリカのAI関連企業であるKrea AIが2026/6/22に公開したオープンウェイトの画像生成AIモデルです。
KreaシリーズはKrea AIが運営している独自のプラットホームで使えるモデルだったようですが、この度オープンウェイト化され、誰もが無料でローカルのPCに導入できるようになりました。
他にもKrea 2 RAWというモデルも公開されましたが、このTurbo版は蒸留(性能を維持したままサイズダウン)した上に、わずか8 STEPで生成できるTurbo化が施されているので、ある程度低スペックのローカルPCでも使用できるようになっています。
商用利用については一応条件があって、「年商100万ドル以上の企業は別途ライセンスが必要」ということです。まあ、個人で使う分には問題ないですね(笑)
Krea 2 TurboはRTX3060(12GB)で動くのか?
冒頭で書いた通り動きました(笑)
最近いろんなAIモデルを無理やり動かすのがマイブーム(死語)なんですけど、これはComfyUIの公式ワークフローそのままで普通に動きました。
Qwen-image2512のときは愛機が悲鳴を上げてましたが、これは普通に動いてます。
「VRAM16GB以上推奨」となっていても、意外と無茶が効くもんです(笑)
有志の方が、量子化版とかいろいろ開発されているようですが、RTX3060(12GB)をお使いの皆さんは、公式ワークフローがそのまま動きますのでご安心ください。
生成の所要時間は、1024×1024の画像1枚生成するのに、
・(プロンプトを変更して)最初の1枚 → 60〜100秒
・2枚目以降 → 45秒前後
です。SDXL系よりも時間がかかりますが、実用の範囲内ですね。
むしろ、失敗が少ないですし、品質は比べ物にならないぐらい素晴らしいので、結果的にこちらの方が早く欲しい成果品にたどり着けると思います。
また、公式ワークフローでは、ユーザーが入力したプロンプトをLLMを使ってAIが理解しやすいプロンプトに翻訳するらしいので、最初の1枚は時間がかかります。早くて15秒ぐらい。長いと30秒以上かかるケースもありました。
この時間がネックといえばネックなんですけど、実はこれがこのモデルの最大の特徴なんです。
ユーザーの指示をLLMが一度考察して画像生成用のプロンプトを生成・・・
これは対話型AIであるChatGTPやGeminiと同じ仕組みです。要するに、意図さえ伝われば、ユーザーの指示がザックリでも絵が描けるというということなのです。後ほどその効果を紹介しますね。
参考までに、私の愛機のスペックは以下になります。
CPU:AMD Ryzen 5 5600X
メモリ:DDR4-3200 32GB
グラボ:RTX3060 12GB
OS:Ubuntu
2年半前にStable Diffusion 1.5系がやりたい一心で、よくわからないまま見様見真似で自作したパソコン…。その中で今ではこんな最新のAIモデルが動いてるとか考えたら胸熱です(涙)
Krea 2 Turboのインストール方法と注意点
ComfyUIがすでにインストールされていることが前提ですが…
こちらのサイトに書いてある通りにやったらできましたので、こちらを参照してください。(えらい手抜き💦)

でも注意点をひとつだけ。
ComfyUIを必ず最新版にアップデートしてください!
専門的なことはよくわかりませんが、Krea2はかなり特殊らしく、ComfyUIの標準ノードもKrea2対応のためにアップデートされています。先月までのComfyUIではまったく動きませんので注意してください。
ちなみに、
・ComfyUIのインストール方法がわからない
・ComfyUIのアップデート方法がわからない
という方は、その旨をChatGPTに伝えてください。手取り足取り教えてくれますよ〜
Krea 2 Turboのサンプル画像
それでは、Krea 2 Turboで生成した成果品をお見せしますね〜
まだまだ使いこなせてないのでさわりだけですが、その素晴らしさは伝わると思います。
■実写系
キレイですよね。SDXL系と比べると別世界です。成果品だけを見ると、私が普段使っているGrok Imagineにも十分匹敵するクオリティだと感じました。
プロンプトは以下。日本語です。「実写系」とか「photorealistic」と入れなくても実写系になりました。
※GIGAZINE様のプロンプトを参考にさせていただきました
ロリータファッションの女性。ポートレート構図。カメラ目線。日本人。ロングヘアー。ヘッドドレス。パステルカラーのリビング
■イラスト系(アニメ調)
アニメ系も素晴らしい。
プロンプトはほとんど同じですがイラストであること、アニメ調であることを追加しています。
ロリータファッションの女性。ポートレート構図のイラスト。カメラ目線。日本人。ロングヘアー。ヘッドドレス。パステルカラーのリビング。アニメ調
■イラスト系(水彩画)
味があるイラストになりましたね。上の「アニメ調」の部分を「水彩画」に置き換えただけです。
■イラスト系(ゴッホ風)
ゴッホ風にしてみました。一気にアート作品になりましたね。
アニメ調のプロンプトの「アニメ調」を「ゴッホ風」に変えただけです。
■イラスト系(LoRA適用)
アニメ調のプロンプトをそのままに公式ワークフロー標準のLoRAを適用しました。
これはマジで素晴らしい。公式からLoRAがたくさん出ているのでいろいろ試してみたいですね。
■ポスター
ポスター風のを描いてみました。これがすごいんです。何がすごいのかっていうと、プロンプトがこれだけなんです。
「世界牛乳の日」(6月1日)のポスターを描いて。kawaiiアニメ調の女の子で。
これが前述した「LLMで一度翻訳する」効果ですね〜
ユーザーの意図を汲んでそれらしいプロンプトをAIが生成する・・・。
ChatGPTで慣れてはいますが、ローカルPCでこれができるというのは本当に感動しました。
従来の「呪文を唱える画像生成AI」というより、AIにお願いして一緒に作品を作る感覚に近いモデルですね。
まとめ
遅い時刻となりましたので、後日追記します💦







