Scribble Diffusion

Scribble Diffusionで生成された猫画像

▼使用プロンプト

Photo of a cat sleeping in a hammock with Grand Canyon in the background

▼プロンプトの意味・内容
グランドキャニオンをバックにハンモックで寝ている猫の写真

↑の画像ですが、正直Scribble Diffusionにおける画像生成としてはだいぶ成功例かと思います。
Scribble Diffusionで求めるイメージに近い描画を期待して画像生成というのは、相当なハードルを要するためです。Scribble Diffusionは、特に人物描写(いわゆるグラビア系美少女だったり、明確に女性・男性)をさせる画像生成AIとしては適していないと言えるかと思います。

その理由として、Scribble Diffusionの画像生成の仕組みが、↓の左側のようにPC上で自身でラフ画(PCのペイントアプリと同様)を描く+プロンプトの入力での画像生成となります。

ラフ画だけ、プロンプトだけ、どちらかだけでは画像は生成されない仕様となっているため、必ずラフ画+プロンプト入力からの画像生成となります。もちろん、抜群に絵心がある方はクオリティのほうも少し期待は出来るかと思いますが、初心者には高いハードルと言えます。(↑のラフ画は20秒程度で描いたものです)

仮に絵心がある・絵を描くことに自信があっても、Scribble DiffusionはPCのペイントソフトで絵を描くのと同様なため、ある程度時間をかけてラフ画を完成させても、求めるイメージと異なる画像が生成されるケースも十分考えられます。ラフ画に時間をかけるなら他の画像生成AIサービスを利用して生成するほうが賢明でしょう。

ただ、思わぬ発見や、意図しない画像生成に期待をして、などの理由で画像生成してみる面白さがあるかとも思います。

ちなみに、同じプロンプト・ラフ画で何度も画像生成可能ですが、求めるイメージに近い画像が出るかどうかは運と言えるでしょう。
↓の画像は1枚目とプロンプトは同じですが、ラフ画を少し変えてみたものです。

背景はプロンプトの通りグランドキャニオンっぽくはありますが、なぜだか監視カメラのようなものが岩に付いています。

↓もプロンプトは同一ですが、スライムのような得体のしれない描画があります。

「まさかこのラフ画がこんな仕上がりになるなんて!」という、狙っては作れないものの、そういった楽しみ方が可能な点は、Scribble Diffusionの魅力とも言えるでしょうか。

※Scribble Diffusionでのプロンプト入力は基本的には英語です。

 

Scribble Diffusionの料金体系

Scribble Diffusionは無料で利用することができます。

また、Scribble Diffusionで生成した画像の商用利用に関しては、github内に記載のMITライセンスを見る限り可能と思われます。(ライセンスと著作権表示が条件のようです)

Scribble Diffusionでの画像生成のやり方・手順などは、以下よりご参照下さい

Scribble Diffusionでの画像生成詳細へ