※この記事は2025年1月30日に作成したものです(当記事掲載の画像は、ツール・サービスのものを除き全てAI生成の画像です)
アリババクラウド(Alibaba/中国)が提供する最新AIモデル『Qwen2.5-Max』は、DeepSeekを凌ぐ性能を持つ注目のLLMです。本記事では、最先端のAIを使って無料で動画生成を行う具体的な手順を解説します。
さらに、画像生成の方法やQwen2.5-Maxの特徴についても紹介します。AI初心者~AIを活用して効率的にクリエイティブ制作を行いたい方、新しいテクノロジーに興味がある方は必見の内容となっています。
Qwen2.5-Maxとは
Qwen2.5-Maxは、中国のアリババクラウドが開発した最新のマルチモーダルAIモデルです。
「マルチモーダルAI」とは、テキストだけでなく画像や動画など、さまざまな形式のデータを理解し、生成できるAIのことです。Qwen2.5-Maxはこの特性を活かして、次のようなことができます
・テキストベースの質問に答える
・指示(テキストプロンプト)に基づいて高品質な画像を生成する
・動画コンテンツを作成する
など、Qwen2.5-Maxは、「Qwen」シリーズの最上位モデルとして、高度な自然言語処理能力に加え、動画生成や画像生成といったクリエイティブ機能を備えており、文章作成から動画制作まで、さまざまなタスクをこなせるオールインワン型のAIといえます。
ちなみに、Qwenの読み方ですが、英語読みでは「キューウェン」、日本語では「つうぎせんもん(通義千問)」と読みます。Qwen(通義千問)という名前には、「どんな質問にも答えられるAI」という理念が込められているそうです。
また、Qwen2.5-Maxは、無料で使うことができます。(2025年1月現在)
そのため、AIを使った動画制作やデザインに興味がある初心者の方でも気軽に試すことが可能となっています。
AIツールというと、まだまだ現状は、「難しい」「専門知識が必要」というイメージを持つ人が多いですが、『無料で簡単に使える』というポイントは、特に新規ユーザーにとって非常に魅力的です。
Qwen2.5-Maxで動画生成の方法
Qwen2.5-Maxで動画生成するやり方ですが、Googleアカウント(Gmailアドレス)があればスムーズなので、以下、Googleアカウントを使った手順で図解しています。
Qwen2.5-Maxで(Qwen)にアクセスすると、↓のように表示されます。
画面右上の「Log in」をクリックします。(「Sign up」がありますが、「Log in」で問題ありません)
「Log in」をクリックすると、↓のように表示されます。
画面内「Continue with Google」をクリックします。
「Continue with Google」をクリックすると、↓のように表示されます。
自身のGメールアドレスが表示されます。これは、「このメールアドレスでログインしますね」という意味なので、Qwenの利用規約とプライバシーポリシーに目を通し、「Confirm」をクリックします。
「Confirm」をクリックすると、↓のように表示されます。
![](https://generativeai-hikaku.com/wp-content/uploads/2025/01/動画4.jpg)
ポップアップ表示されているAccess Verification=アクセス認証です。その下の英文は「あなたがロボットでないことを確認するためにスライドしてください」ということなので、オレンジの「≫」のところを右側へスライドしましょう。
アクセス認証のスライド後、↓のように表示されます。
中央にテキストプロンプト入力フォームがあり、フォーム下に動画生成モードのメニュー「Video Generation」があります。
![](https://generativeai-hikaku.com/wp-content/uploads/2025/01/動画6.jpg)
「Video Generation」をクリックします。
「Video Generation」をクリックすると、↓のように表示されます。
![](https://generativeai-hikaku.com/wp-content/uploads/2025/01/動画7.jpg)
この状態が、Qwen2.5-Maxで動画生成できる状態です。
テキストプロンプト入力フォーム下にある画はQwen2.5-Maxで生成された動画なので、参考に作成することが可能です↓
↑「Video Generation」をクリックするごとに動画内容は変わるので、「この動画みたいな感じで作りたい」あるいは「どんな感じで動画ができるのか試してみたい」といった際、プロンプトを考えずに手っ取り早く動画を作ることができます。最初はお試しで参考にしてみるのも言いでしょう。
以下、テキストプロンプトを入力して動画生成するやり方を紹介します。
入力したプロンプトは英語ですが、日本語でも動画生成可能です。
▼使用プロンプト
The scene is rendered in high-quality imagery, with a high dynamic range that accentuates the dramatic contrast between light and shadow. The camera sweeps smoothly over the grand exterior of a modern luxury mansion, standing tall against the backdrop of the city skyline at night. Its sleek architecture, adorned with marble and glass, glows under the reflection of urban lights. The dynamic motion glides through the vast entrance, past the meticulously landscaped gardens, leading the viewer toward the grand glass doors.As the camera moves inside, an opulent interior unfolds. The spacious living room boasts towering ceilings and panoramic windows that offer a breathtaking view of the cityscape. Soft ambient lighting enhances the warmth of the space, accentuated by sophisticated modern art and mid-century furniture. The shimmer of a grand chandelier reflects on the polished marble floors, exuding a serene yet overwhelming sense of luxury. The camera fluidly transitions toward the fireplace, where the gentle flicker of flames breathes life into the scene. A smooth jazz melody drifts through the air, adding a refined, atmospheric touch to the moment.
▼プロンプトの日本語意味・内容
このシーンは、光と影のドラマチックなコントラストを際立たせるハイダイナミックレンジの高品質映像で表現されている。カメラは、夜の街並みを背景にそびえ立つモダンな高級邸宅の壮大な外観を滑らかにスイープする。大理石とガラスで飾られたその洗練された建築は、都会の光の反射を受けて輝いている。ダイナミックな動きは、広大なエントランスを通り抜け、丹念に手入れされた庭園を通り過ぎ、見る者を壮大なガラスのドアへと導く。
カメラが中に入ると、豪奢な室内が広がる。広々としたリビングルームは、そびえ立つ天井とパノラマの窓が自慢で、息をのむような街並みの眺めが楽しめる。洗練されたモダンアートとミッドセンチュリーの家具がアクセントとなり、柔らかなアンビエント照明が空間の温かみを引き立てる。壮大なシャンデリアの煌めきが磨き上げられた大理石の床に反射し、静謐でありながら圧倒的な高級感を醸し出している。カメラは流れるように暖炉へと移り、穏やかな炎の揺らぎがシーンに生命を吹き込む。滑らかなジャズのメロディが漂い、この瞬間に洗練された雰囲気のタッチを加えている。
では、上記の英語プロンプトを入力フォームに入力します。
![](https://generativeai-hikaku.com/wp-content/uploads/2025/01/動画10.jpg)
プロンプトを入力したら「↑」で送信します。
「↑」でテキストプロンプトを送信すると、動画生成が開始されます。
動画生成完了まで少し待ちます。(環境にもよりけりだと思いますが、私の場合、20分前後待ちました)
動画生成が完了すると、↓のように表示されます。
![](https://generativeai-hikaku.com/wp-content/uploads/2025/01/動画12.jpg)
生成された動画はダウンロード可能です。ほか、再生成も簡単に可能です。
ちなみに、Qwen2.5-Maxはリリース間もない(2025年1月30日現在)こともあってか、アクセス過多によるエラーが起こる場合もあります。
例えば、↑の画面は、動画生成用のプロンプトを入力し、送信した直後のエラー画面です。このようなアクセス過多によるエラーが出た場合は、少し時間を置くようにしましょう。
Qwen2.5-Maxで画像生成の方法
Qwen2.5-Maxでの画像生成は、動画生成同様にテキストメッセージ下のメニューにある「Image Generation」を選択します。
「Image Generation」を選択>生成する画像のアスペクト比を選んでテキストプロンプトを入力する流れです。
画像生成も「Image Generation」を選択した時点で、生成画像例が表示されるので、動画生成時同様に「まずこれで試してみたい」といった画像があれば、チェックしてみると良いでしょう。
自分で考えたプロンプトだったりを入力した例だと、↓のような感じです。
丁度↑の挿絵にも使用した画像ですが、わりとシンプルな日本語のテキストプロンプトからの生成です。
まとめ
アリババクラウドのQwen2.5-Maxについて、概要的なところからAI初心者の方にもわかりやすいよう、ピンポイントで動画生成・画像生成のやり方を解説しました。
ChatGPT以降、直近ではDeepSeekと、LLM/マルチモーダルAIモデルは次々と登場しています。ですが、「何をもって比較すればいいのか」、「何をもって良し悪しの判断や優劣をつけるのか」わからない方は多いのではないでしょうか。
もっとも、一番多いのは「LLMなんて全然触ったことない」という方かも知れませんが、LLMの優劣を完全に決めるのは難しいです。そのため、「自分が求めるタスク(用途)に最も適したツールは何か」という具体的な用途に焦点を当てて選ぶのが現実的です。