画像生成AI

ChatGPTの画像生成AI「DALL·E 3」の使い方や活用、プロンプトのポイントを徹底解説!

DALL·E 3とは

DALL·E 3とは、OpenAIが開発した最新の画像生成技術を持つAIモデルのことです。このモデルは、テキストの記述を基にして、具体的な画像を生成することが特徴です。具体的には、ユーザーが「夕日の中で飛ぶドラゴン」といった説明を入力すると、その説明に基づいた画像が生成されます。

DALL·E 3の特徴は、その高いクオリティと多様性にあります。テキストの説明を非常に高い精度で理解し、1つの説明からさまざまな画像を生成することができるため、ユーザーは自分のイメージに近いものを選び出すことができます。

この技術は、デザインやアート、エンターテインメントなど、さまざまな分野での応用が期待されています。DALL·E 3は、人々が持つクリエイティブなアイディアを形にする手助けをすることができるツールとして、非常に注目されています。

要するに、DALL·E 3はテキストの説明をもとに高品質な画像を生成するAI技術であり、その可能性は非常に広いと言えます。

ChatGPTの画像生成AI「DALL·E 3」の使い方

まずはじめにChatGPTの画像生成AI「DALL·E 3」の使い方を簡単に説明します。
なお、ChatGPTで「DALL·E 3」を使うためには、有料版の「ChatGPT Plus」が必要となります。

  1. 「GPT-4」を選択します
  2. 機能一覧から「DALL·E 3 Beta」を選択します
  3. 画像生成プロンプトを入力します

この3ステップで、誰でも簡単にChatGPT上で画像生成を行うことができます。

以下、プロンプトの例を紹介します。

例)中央の大きなオークの木の下で、白と黒の縞模様の猫が横たわっている。その猫の目の前には、小さな赤いボールが転がっている。

画像生成プロンプトは、画像の説明をテキストで入力するだけでOKです。
画像の説明はできるだけ詳細に入力してあげるのがポイントです。
DALL·E 3はテキストを理解する能力が高いので、詳しく説明してあげると期待に近い画像が仕上がります。

例えば、先ほどのプロンプトは「物や生物の位置や特徴」を詳細に記述したものです。
「中央の大きなオークの木の下で、白と黒の縞模様の猫が横たわっている。」を見るとわかるように、木の位置、大きさ、種類、猫の模様やどこにどのような状態であるかを具体的に示しています。

このように具体的に何処に何があり、誰がどのような事をしているのか、また背景や周りの状況はどうなっているのか等を示すと、より理想に近い画像を生成することができます。

これらの説明を基に4つの異なるプロンプトを生成し、4枚の画像を生成してくれます。

【図解】ChatGPTでDALL·E 3を導入して使うまでの流れ

実際にChatGPTの画面を見ながら導入から使うまでの流れを紹介していきます。

「DALL·E 3」を選択する

▼はじめにChatGPTにアクセスして“GPT-4”を選択し、メニューから“DALL·E 3 [Beta]”を選択します。

画像生成のプロンプトを入力する

▼“DALL·E 3 [Beta]”を選択したら画像生成のプロンプトを入力します。

画像生成AIのプロンプトと言えば、単語の羅列のようなイメージがありますが、ChatGPTのDALL·E 3ではテキストで画像の説明をするだけでOKです。

説明は具体的な情報を入力するほど期待に近いの画像を生成してくれます。

以下、参考情報となります。

▼具体的な情報の例1
物や生物の位置や特徴を詳細に記述する
例)中央の大きなオークの木の下で、白と黒の縞模様の猫が横たわっている。その猫の目の前には、小さな赤いボールが転がっている。

▼具体的な情報の例2
環境や背景を詳しく記述する
例)夕暮れ時の浜辺に、波がゆっくりと打ち寄せる様子。遠くには赤く染まった空と沈む太陽が見える。

▼具体的な情報の例3
色や質感を具体的に指定する
例)光沢のある赤いリンゴが、古びた木製のテーブルの上に置かれている。その周りには黄色と緑の葉がちらばっている。

▼具体的な情報の例4
感情やアクションを具体的に記述する
例)緑の公園のベンチに座る若い女性が、手に持った青い本を読んでいる。彼女の顔には微笑みが浮かんでおり、隣にはカップに入ったコーヒーが置かれている

ここに記載したものはあくまで一例であり、もっとシンプルに説明しても質の良い画像を生成してくれます。

ChatGPTとの対話を通じて画像生成

ChatGPTの「DALL·E 3」は、ChatGPTとの対話を通じて画像生成することもできるので、最初は簡単な説明からスタートし、修正を重ねて期待に近い画像を生成することも可能です。

簡単なワードからスタートして画像生成

例えば、最初に「ChatGPTをイメージした画像を作ってください」と入力します。

▼入力:ChatGPTをイメージした画像を作ってください

この時点でそれなりの画像が生成されていますが、もう少し近未来風にしたいのでさらにプロンプトを入力します。

▼入力:いい感じです。今の画像をもう少し近未来風にすることはできますか?

そうすると先ほどの画像を近未来風にした画像が生成されます。

対話を通じて背景や要素の追加

他にも背景や要素を追加することもできます。
まずは生成したい画像の説明をします。

▼入力:中央の大きなオークの木の下で、白と黒の縞模様の猫が横たわっている。その猫の目の前には、小さな赤いボールが転がっている。

いい感じに画像が生成されましたが、背景が物足りない感じなので夕暮れ時の赤く染まった空を追加してもらいます。

▼入力:背景に夕暮れ時の赤く染まった空を追加してください

このようにChatGPTとの対話を通じて画像生成を行うことができます。更に何かを加えたい場合や画風を変更した場合は続けて対話を行っていけばOKです。

画像サイズの変更も可能

ChatGPTの「DALL·E 3」は、デフォルトでは正方形の画像が生成されますが、対話を通じて画像サイズを変更することもできます。

▼入力:画像を横長に変更してください

いい感じですが、やっぱり縦長が良いので、それをChatGPTに入力していきます。

▼入力:やっぱり縦長のサイズがいいかもしれません。変更していただけますか?

このように対話を通じてあらゆる画像を生成したり、修正・加工したりすることができます。

以上が“ChatGPTの「DALL·E 3」”を導入してから使うまでの流れとなります。

DALL·E 3は、非常に高い解像度と品質の画像を生成することができ、実際の写真のようなリアルな画像やアートワークのような画像などを手に入れることができます。

さらに、DALL·E 3はテキストの説明を非常に高い精度で理解する能力を持っており、具体的なものから抽象的なものまで、さまざまな説明を元に画像を生成することができます。同じテキスト説明に対しても、多様なバリエーションの画像を生成することができるので、ユーザーは多くの選択肢の中から、自分の求めるイメージに最も近いものを選ぶことができます。

従来の画像生成AIでは複雑なプロンプトを必要としていましたが、ChatGPTの「DALL·E 3」ではそれも不要になります。画像の説明とChatGPTとの対話を通じて理想に近い画像を生成できるので、画像生成に興味がある方は是非ご活用くださいませ。

関連記事