Stable Diffusionで生成された神社画像
▼使用プロンプト
A fantastic scene at the shrine on the night of the traditional Japanese event "Tanabata", when the bamboo branches in the grounds are decorated with strips of paper with wishes written on them and fireworks are shot up into the night sky
▼プロンプトの意味・内容
日本の伝統行事「七夕」の夜、境内の笹に願い事を書いた短冊が飾られ、夜空に花火が打ち上がる幻想的な神社の光景
↑プロンプトに対して、おそらく「七夕」「笹」「夜空」「花火」「幻想的」「神社」と、全てをバランス良く描写しようと試みたのではないかと感じました。Stable Diffusionは忠実にテキストプロンプトを汲み取ってくれるとされていますが、少しプロンプト的には”日本びいき”感があったかもしれません。
日本人からすれば、「七夕」のイメージはすぐ頭に浮かぶものかと思われますが、Stable Diffusionが・AIがどこまで「七夕」を把握しているか、つまりどのように学習され、認識しているかというのがポイントだとは言えるかと思います。
Stable Diffusionをはじめ、画像生成AIは必ずしも100%プロンプト通りの画像が生成されるとは限らないものですが、それがAI画像の面白さとも言えるかと思います。
ほかの生成例
▼使用プロンプト
(Masterpiece,high resolution,detailed),Beautiful appearance Japanese shrine, mysterious, fantastic
▼プロンプトの意味・内容
美しい外観の日本の神社、神秘的、幻想的
↑の画像は、1枚目の画像のような細かなシチュエーションがあるプロンプトではなく、「神社」を被写体としてフィーチュアしたプロンプトでの生成画像です。お寺のようにも見えますが、画質UP系のプロンプト(最高傑作,高解像度,詳細)の効果もあってか、クオリティとしては悪くないと言えます。
ちなみに、Stable Diffusionはオープンソースで公開されているため、自身のPCに環境構築(ローカル環境)することでモデルファイルを活用することができます。
モデルファイルを使用した生成例
▼使用プロンプト
(((masterpiece))), ((best quality)), ((high resolution)),Exterior view of a Japanese shrine taken from a distance with a high-performance telephoto camera with built-in high-power zoom lens, mysterious and fantastic even from a distance
▼プロンプトの意味・内容
(((傑作))), (((最高品質))), (((高解像度)),少し離れた距離から高倍率ズームレンズ内臓の高性能望遠カメラで撮影した日本の神社の外観写真,遠くから見ても神秘的で幻想的
使用モデルファイル:DreamShaper XL1.0
↑で使用したモデルは基本的には美少女・綺麗な女性系の肖像画等に適したモデルファイルになります。
構図的にはちゃんとプロンプトの意図を汲んでくれている描写だとは思いますが、「神秘的で幻想的」部分が少し弱いでしょうか。それでもネガティブプロンプト(出力したくない・描いてほしくない要素)や細かなパラメータの設定等を調整せずの生成結果であることを踏まえると、良い感じの描画だとは思います。
※Stable Diffusionでのプロンプト入力は基本的には英語です。
日本語でのプロンプトに全く対応していないわけではありません。ただ、プロンプト自体がある程度長いものだったりすると、上手く反映されないケースがあります。
Stable Diffusionの料金体系
Stable Diffusionはオープンソースで公開されているため、無料で利用することができます。
また、Stable Diffusion自体は商用利用可能となっていますが、下線モデルファイルを使用する場合、そのモデルファイル毎に規約を確認するようにしないといけません。(モデルファイルによっては商用利用不可の場合もあり)
Stable Diffusionでの画像生成のやり方・手順などは、以下よりご参照下さい