Stable Diffusion

Stable Diffusionで生成された男性(実写)画像

▼使用プロンプト

Reluctant man driving a sports car, wearing sunglasses

▼プロンプトの意味・内容
スポーツカーを運転中の渋い男性,サングラス着用

画像生成AIサービスのパイオニアとも言えるStable Diffusionの『Stable』とは『安定』という意味です。プロンプトの反映具合を見ても”安定的”な仕上がりと言えるでしょう。短めのプロンプトでネガティブプロンプトや他設定等なしでこの仕上がりはプロンプトの意図を充分に汲み取っているかと思います。

ほかの生成例

▼使用プロンプト

(((masterpiece))),((best quality)),Japanese adult male,work clothes,helmet, factory worker

▼プロンプトの意味・内容
(((傑作))),((最高品質)),日本の成人男性,作業服,ヘルメット,工場勤務

こちらは工場で働く日本人男性をイメージして生成した一例になります。Stable Diffusionに限らず、日本人=アジア人、つまり韓国や中国も含まれている仕上がりになるケースが多いです。また、↑の場合プロンプトにマスクとは入れていませんが、「作業服」「工場勤務」あたりのワードから連想された仕上がりかと思われます。

ほかの生成例

▼使用プロンプト

(((masterpiece))),elderly man, sitting on sofa, gray hair, glasses, high quality, super high resolution, large capacity, full color, high quality, super high resolution, large capacity, beautiful brightness in detail

▼プロンプトの意味・内容
(((傑作))),老人男性,ソファに座る,白髪,眼鏡,高画質,超高解像度,大容量,フルカラー,高画質,超高解像度,大容量,細部まで美しい輝き

プロンプトがしっかり反映された仕上がりになっているかと思います。髭や皺(しわ)、服装に関するプロンプトは一切入れていませんが、「老人男性」や「白髪」といったワードから見事に補助されている出力結果だと言えるでしょう。

逆にうんと若くしてみた生成例がこちらです↓

▼使用プロンプト

(((Masterpiece))),Cute little girl playing the piano, short bob haircut, high image quality, super high resolution, large volume, full colour, high quality, super high resolution, large volume, beautiful shine in every detail

▼プロンプトの意味・内容
(((傑作))),ピアノを弾くかわいい女の子,ショートボブの髪型,高画質,超高解像度,大容量,フルカラー,高画質,超高解像度,大容量,細部まで美しい輝き

ドラムセットの配置等、細かな点を除けば充分にプロンプトが反映された出力結果だと思います。

また、Stable Diffusionはオープンソースで公開されているため、自身のPCに環境構築(ローカル環境)することでモデルファイルを活用することができます。

モデルファイルを使用した生成例

▼使用プロンプト

(((Masterpiece))),((realistic)),Male,High quality,Ultra-high resolution,Large capacity,Full color,High quality,Ultra-high resolution,Large capacity,Beautiful brilliance in every detail

▼プロンプトの意味・内容
(((傑作))),((リアルな)),男性,高画質,超高解像度,大容量,フルカラー,高画質,超高解像度,大容量,細部まで美しい輝き

使用モデルファイル:SDXL Unstable Diffusers

基本的にモデルファイルは女性に特化しています。そのため、よりクオリティにこだわる場合はネガティブプロンプト(出力してほしくない要素)に「girl」など、女性的なワードを入れてあげると良いかもしれません。

また、Stable Diffusionでのプロンプト入力は基本的には英語です。
日本語でのプロンプトに全く対応していないわけではありませんが、プロンプト自体がある程度長いものだったりすると、上手く反映されないケースがあります。

 

Stable Diffusionの料金体系

Stable Diffusionはオープンソースで公開されているため、無料で利用することができます。

また、Stable Diffusion自体は商用利用可能となっていますが、下線モデルファイルを使用する場合、そのモデルファイル毎に規約を確認するようにしないといけません。(モデルファイルによっては商用利用不可の場合もあり)

Stable Diffusionでの画像生成のやり方・手順などは、以下よりご参照下さい

Stable Diffusionでの画像生成詳細へ