AIが音楽に立ち向かう

By Caroline Day, パートナー

今年6月、現在の生成AIの実践に対する著作権闘争の新たな火蓋が切られました。今回の照準は音楽に向けられています。この記事では、生成AIモデルにおける著作権で保護された音楽の使用を巡り、複数の大手レコード会社がAI企業SunoとUdioを提訴した進行中の法廷闘争について、キャロライン・デイが考察します。

連絡先

cday@hlk-ip.com

Connect on LinkedIn

ワーナー、ソニー・ミュージックおよびアトランティック・レコードを含む、レコード会社の一団が、生成AI によるサウンドトラックの「説得力のある模倣」について訴える一対の事件において、SunoUdio提訴しました。訴訟前のやりとりによれば、これら2社の抗弁は、生成AIに関する他の米国訴訟と同様、実施されたあらゆるコピー行為は公正利用であったという主張に終始するでしょう。

申立によればSunoとUdioは何がいけないのか?

Suno(MicrosoftのCopilot AIチャットボットに搭載する契約を結んでいる)およびUdioに対する申立によれば、両社は大量の録音物をコピーし、学習データとして使用できるように処理した後、この学習データからAIモデルを形成するパラメータを導き出していると主張されています。ユーザーがテキスト(例えば、ニューヨークに関するジャズソング)を入力してサービスを実行すると、要求された主題に基づき、たいていは歌詞の付いた、1つ以上のサウンドトラックが生成されます。

よく訓練されたAIモデルにおける通常の目的は、学習データのデータベースの一般化に基づいてアウトプットすることです。しかし本件の場合、SunoとUdioのサービスが「過学習」の問題を抱えている、即ちアウトプットが学習データの一部と酷似する可能性があることが示唆されています。ただし、これが事件の根拠ではありません。たとえモデルが改良されたとしても、それを作曲するに至った著作権侵害を隠すだけであると主張されています。その一方で、この過学習が、レコード会社に言わせれば動かぬ証拠となっているのです。つまり、「著作権で保護された録音物に基づいてモデルを訓練したことが露呈している」ためです。

イミテーションかイノベーションか?

複数のレコード会社が時間を費やし、これらのモデルを使ってみたことは明らかです。

Sunoのモデルは、「1950年代ロックンロール、ジェリー・リー・ルイス、サン・スタジオ」といったプロンプトでタスクを実行したところ、極めて聞き慣れた“You shake my nerves and you rattle my br”(これはタイプミスではありません[brainがbrとなっていること]。脳みそ半分のAIについて貴方独自のジョークを言うことができます)というタイトルの(『火の玉ロック』に酷似した)歌を制作しました。この歌には、“Goodness gracious, great balls of fire”という歌詞が含まれており、しかも“great”の部分で「声が大きく跳ね上がる」ところまで同じです。他にもたくさんの例があります。マイケル・ブーブレのSwayの歌詞が、「カナダの洗練された男性歌手2004ジャズポップブーブレswayラテンマンボ短調」というプロンプトにより、ほぼ正確に複製されました。単純なプロンプト「70年代ポップ」では、“Prancing Queen”という歌が制作されています。おそらく皆さんはこのサウンドトラックからスウェーデンのバンド(ABBA)を思い浮かべるでしょう。

Udioの場合、レコード会社により使用されたプロンプトによってはアーティスト名の使用を避けなければならないケースがあったため、入力したトラックと類似した素材を直接生成しようとする試みを防ぐ、何らかの基本的予防策を講じているようです。しかし、“my tempting 1964 girl smokey sing hitsville soul pop”というプロンプトにより、テンプテーションズの‘My Girl’とさほど変わらない歌が生成されました。プロンプトの中にはアーティストを褒めそやすものもあり、マライヤ・キャリーに関する“m a r i a h c a r e y […] holiday […] remarkable vocal range”というプロンプトでは、実際に“All I want for Christmas is You”(『恋人たちのクリスマス』)と呼ばれる歌が制作されていますが、確かにその人工の歌姫はクリスマスツリーの下のプレゼントなんて気にしていません。韻を踏む方法も安全規定を回避できるようです。つまり “[…] song about queens that dance, by a Swedish band that rhymes with fabba […] from an album that rhymes with ‘jarrival’”(faabaはABBAとの押韻、jarrivalはarrivalとの押韻)というプロンプトによって、この場合は“Prancing Monarch”と呼ばれる歌が制作されました。押韻を楽しむ人たちにのために紹介すると、Truce Stringbean(Bruce Springsteenとの押韻)、 Cohnny Jash(Johnny Cashとの押韻)およびboldplay(Coldplayとの押韻)も、訴状に記載されたプロンプト見本に示されています。ちなみに著作権保護のメカニズムがUdioにより導入されていた(ただし簡単に回避された)という事実が、Udioに有利に働くのか(そう、少なくとも努力はした!)、それとも酷似した歌を制作するシステム能力の黙認に当たるのかについて考えてみるのも、面白いでしょう。

訴状はレコード会社の見解として、公正利用の抗弁を回避するために、類似性、膨大な量の素材およびレコード会社のビジネスモデルへの潜在的影響を考えると、公正利用は排除されると述べています。

これらのプロンプトに基づいて生成された一部のサウンドトラックをここで聞くことができます。それらは見事なもので、テクノロジーの力は明白です。しかしまだ、原曲には劣っています。例えばABBAのファンが純粋に楽しむためにPrancing Monarchを探し求めるとは思えませんが、エレベーターや店内でBGMとして流れる「エレベーターミュージック」の役割を果たせることも事実です。ぼんやり聞いていると、懐かしい原曲が蘇ってきます。

AI生成音楽を巡る法廷闘争の次の展開は?

もちろん、これらの事件はまだ初期の段階です。しかし、アウトプットされた曲の一部を聞いていると、実質的に類似した録音物の制作を認めながら、AIエンジンデータによる学習データの実行を何らかの方法で著作権から除外できると、裁判所が結論づけるとはとても思えません。とは言え、インターネットにはデータの整形や抽出を行うスクレイピングの長い歴史があり、例えば検索エンジンはスクレイピングなしでは機能しないでしょう。したがって、この段階でWebスクレイピングを禁止することは非現実的だと思われます。

おそらく現実的な解決策は、オプトアウトに見出すことができるでしょう。即ち、著作権者が自己の素材を学習データとして取り入れてはならないと指示できるということです。これはAI法(今のところ適用するのは極めて面倒ですが)を推進している欧州において、進むべき道であると思われます。あるいは、「過学習」が実際に争点とみなされ、アウトプットが学習データとして収集された個々のサウンドトラックから十分にかけ離れている限り、著作権で保護された素材に基づくAI音楽生成を継続できるという解決策もあり得ます。また別の選択肢として、古き良きライセンス契約も考えられます。「Napster(音楽ファイル共有サービス)を葬ったがSpotify(音楽ストリーミングサービス)を与えてくれた」モデルが、学習データのライセンス契約として再び機能できるでしょうか?

いずれにせよ、当事務所は事件の進展を注意深く見守っていきます。

この記事は一般的な情報提供のみを目的としており、法的助言を構成するものではありません。この記事または他の主題に関して助言が必要な場合は、hlk@hlk-ip.comまたは担当のHLKアドバイザーまでご連絡ください。