【速報】Geminiの新機能「音楽を作成」|音楽生成AI「Lyria 3」が神すぎる!

2026年2月18日、Google DeepMindは音楽生成AIモデルの最新版「Lyria 3」を発表しました。
このモデルはGoogleのAIチャットボット「Gemini」に統合され、テキスト、画像、動画といった多様な入力から、高品質な音楽トラックを誰でも簡単に生成できる機能を提供します。

本記事では、Lyria 3の技術的背景、具体的な使い方、話題のプロンプト例、そして音楽業界への潜在的な影響について詳しく解説します。

1. Lyria 3とは?:DeepMind音楽AIの集大成

Lyria 3は、Google DeepMindが開発してきた音楽生成モデルファミリーの第3世代であり、これまでの研究の集大成とも言える存在です。Geminiアプリを通じて提供され、専門知識がなくても直感的に扱える点が大きな特徴です。

マルチモーダル統合による進化

前世代までのモデルが主にテキスト入力中心だったのに対し、Lyria 3はGeminiのマルチモーダル機能をフルに活用します。テキストでの指示はもちろん、アップロードした画像や動画の内容をAIが解析し、そのムードやナラティブ(物語性)に合致した音楽を生成することが可能になりました。

高品質な出力と柔軟性

生成される音楽は48kHzステレオの高忠実度オーディオで、最大30秒のトラックとして出力されます。特筆すべきは、インストゥルメンタル(楽器のみ)だけでなく、明瞭なボーカルや自然な歌詞の生成も可能な点です。ジャンル(ポップ、R&B、トラップ、lo-fiなど)、テンポ、ボーカルの性別など、詳細なカスタマイズに対応しています。

倫理的配慮とSynthID

AI生成コンテンツの透明性を確保するため、Lyria 3で生成されたすべての出力には、人間には聞こえない電子透かし「SynthID」が埋め込まれています。これにより、その楽曲がAIによって生成されたものであることを識別可能にし、著作権侵害やなりすましのリスクを低減させる設計となっています。

2. Lyria 3で実現する多様なクリエイション

Lyria 3は、単に「テキストを音にする」だけではありません。多様な入力方法を組み合わせることで、クリエイターのインスピレーションを多角的に刺激します。

テキストプロンプトによる詳細な指示

「明るいポップソング」のような抽象的な指示から、「テンポ140BPMで、Cマイナーのキー、女性ラッパーによる疾走感のあるトラップ」のように音楽的な詳細を指定した指示まで幅広く対応します。歌詞を自分で指定することも、AIに自動生成させることも可能です。

画像・動画からのインスピレーション

思い出の写真や、撮影した動画の風景をGeminiにアップロードするだけで、AIがその視覚情報から雰囲気を読み取り、最適なBGMを生成します。例えば、夕焼けの写真から「切ないアンビエント曲」を作ったり、アクション動画に合わせて「緊迫感のあるサウンドトラック」を生成したりできます。

既存トラックのリミックスと調整

ゼロからの生成だけでなく、既存のアイデアをベースにした調整も得意とします。生成されたトラックのテンポを変更したり、インストゥルメンタル曲に後からボーカルを追加したりといった「リミックス」的な使い方が可能です。

3. Lyria 3の使い方:初心者でも3分で作曲デビュー!

Lyria 3は、特別な知識や機材は一切不要。GoogleのAIチャット「Gemini」を使って、誰でも簡単に30秒のオリジナル曲(歌詞+ボーカル入りもOK)を作成できます。

ステップ1:Geminiを開く(無料でOK!)

まずは、お使いのデバイスでGeminiにアクセスします。18歳以上でGoogleアカウントがあれば、誰でも無料で利用可能です。

  • パソコン: ブラウザで gemini.google.com にアクセス。

  • スマホ: Googleアプリ、またはGemini専用アプリを起動。

現在ベータ版として順次提供中のため、まだ機能が表示されない場合は、少し時間を置いてから再度アクセスしてみてください。

ステップ2:「音楽を作成」モードを開始

Geminiのチャット画面で、以下のいずれかの方法で音楽作成をスタートします。

  • 簡単スタート: チャット欄に直接「音楽を作って!」や「アニソン風の曲を生成して」などと入力するだけで、自動的に音楽作成モードに切り替わります。

  • メニューから選択:ツールメニューに表示される「音楽を作成」ボタンをクリックすると、専用の作成画面に移動します。

ステップ3:曲を作る(3つの簡単な方法)

A. テキストだけで作る(一番おすすめ!)

どんな曲が欲しいか、日本語で具体的に入力するだけでOKです。

  • プロンプト例: 「元気なJ-POPで、春の出会いをテーマにしたラブソング。女性ボーカルで」

  • 詳細指定: ジャンル(ロック、lo-fi、アニソン風など)、ボーカル(男性/女性/インスト)、テンポ(速め/ゆったり)、ムード(楽しい/切ない)などを細かく指定すると、よりイメージに近い曲が生成されます。

「生成」ボタンを押すと、30秒以内に曲が完成します。歌詞もAIが自動で生成してくれます。

B. 写真や動画から作る

チャット欄の画像アップロードアイコンから、写真や短い動画をアップロードしてみましょう。Geminiが画像の内容を解析し、その雰囲気に合った曲を自動で提案・生成してくれます。愛犬の写真から「ほのぼのとしたお散歩曲」を作る、といった使い方が人気です。

C. 提案プロンプトから選ぶ

画像をアップロードすると、Geminiがいくつかのプロンプト例を提案してくれることがあります。気に入ったものをタップするだけで、すぐに生成を開始できます。

ステップ4:完成した曲の活用

生成された曲は、その場で再生して確認できます。気に入った曲はMP3形式でダウンロードしたり、自動生成されるカバーアートと共にSNSで共有したりすることが可能です。

もし仕上がりがイメージと違う場合は、「もっとテンポを速くして」「ボーカルを男性に変更して」といった追加指示を出すことで、何度でもリミックス(再生成)が可能です。

4. すぐに使える!話題のプロンプト例

Lyria 3のリリース直後から、X(旧Twitter)などのSNS上では、ユーザーによる実験的な投稿が相次ぎトレンドとなっています。特に反響の大きい、具体的なプロンプトのパターンをいくつか紹介します。

パターンA:熱血&エモーショナルな「アニソン風」

日本国内で特に人気が高いのが、アニメソング風の楽曲生成です。具体的なシチュエーションや感情を指定することで、クオリティの高い楽曲が生成されやすい傾向にあります。

プロンプト例:

「熱血ロボットアニメのオープニング曲風。疾走感のあるロックサウンドで、男性ボーカル。歌詞は『未来を切り拓け!』のような熱いメッセージで、日本語でお願いします。」

パターンB:日常のワンシーンを切り取る「コミカルR&B」

日常の些細な出来事を、あえて本格的な音楽ジャンルに乗せる「ネタ系」の投稿もバズりやすい傾向です。歌詞と曲調のギャップが面白さを生み出します。

プロンプト例:

「洗濯機の中から靴下の片割れが見つかった時の、小さな喜びを歌ったコミカルなR&Bスロージャム。渋い男性ボーカルで。」

パターンC:視覚情報と組み合わせる「画像+テキスト」

マルチモーダル性能を活かし、画像とテキストを組み合わせることで、より具体的なイメージを楽曲に落とし込むことができます。

使用法:

飼っているペットの写真をアップロードし、以下のテキストを追加する。

プロンプト例:

「この子が天気の良い公園をのんびり散歩している時の、ほのぼのとしたアコースティック曲。女性ボーカルで、優しい雰囲気で。」

5. Lyria 3がもたらす影響と未来

Lyria 3の登場は、「音楽制作の民主化」をさらに加速させる一方で、新たな議論も呼んでいます。

クリエイティブ産業へのポジティブな影響

動画クリエイターやポッドキャスターにとって、著作権フリーの高品質なBGMやジングルを低コストで即座に作成できることは大きなメリットです。また、ミュージシャンにとっても、アイデア出しの補助ツールとして活用することで、制作プロセスが効率化される可能性があります。

懸念される課題と議論

一方、誰でも簡単に音楽が作れるようになることで、低品質なAI音楽が市場に氾濫する懸念(スロップ問題)や、プロのミュージシャンや作曲家の仕事が奪われるのではないかという不安の声も上がっています。既存のアーティストのスタイル模倣に関する著作権的な議論も、今後さらに活発化するでしょう。

まとめ

Lyria 3は、Geminiという身近なインターフェースを通じて、誰もが音楽クリエイターになれる可能性を示しました。テキスト、画像、動画から生まれる30秒のサウンドトラックは、私たちのデジタル表現をより豊かに彩ってくれるでしょう。ぜひGeminiアプリを開き、「音楽を作成」と話しかけて、あなただけのトラックを生み出してみてください。

関連記事:【徹底比較】Claude 4.6 vs GPT-5.2 vs Gemini 3 Pro|ビジネスを変える最強AIはどれだ?