AI が人間の真似をいかに上手にこなすかで私たちを驚かせるにつれ、AI は私たちが何世紀にもわたって形作ってきた創造のプロセスを再定義し始めています。アーティストの権利と知的財産権の保護に関する法律を完全に見直すまで、アーティストは苦しむことになるようです。
今回は声優だ。先月、OpenAIは、同社のChatGPTで使用されていた、ハリウッド女優のスカーレット・ヨハンソンに不気味なほど似ている声を削除した。女優が同社を訴えると脅したため、このボット大手は、その声の使用を中止した。そもそもその声を入手した経緯について、同社は別の女優を使ったと説明している。
AI を社会全体の創造プロセスの一部として受け入れるには時間がかかるでしょう。一方で、大手テクノロジー企業は AI が競争を続け、数秒以内に人間の創造性を模倣することを保証しています。この新しい現実を再定義し、アーティストを保護する時間はどこにあるのでしょうか?
AI 企業はどこからこうした声を得ているのでしょうか? 情報源は重要ではないでしょうか?
「私たち全員がディープフェイクや、私たち自身の肖像、私たち自身の作品、私たち自身のアイデンティティの保護に取り組んでいる今、これらの質問は完全に明確にされるべきだと私は信じています」とNPRはヨハンソン氏の言葉を引用した。
私たち全員がディープフェイクと格闘し、私たち自身の肖像、私たち自身の作品、私たち自身のアイデンティティを保護している今、これらは絶対的に明確にされるべき質問だと私は信じています。
スカーレット・ヨハンソン
彼女の言うことはもっともだ。自分の声を貸していない人から自分の声を聞いてショックを受けた声優は他にもいる。こうした事件は、AIツールを支援する創作物の使用に関して、法的保護が欠如していることを示している。
人間の音声動作を模倣する AI が人間社会にどのような影響を与えるかは、私たちがそれを当然のことと考える傾向があるため、想像しにくいように思えるかもしれない。しかし、テクノロジー大手が、よりリアルな音声アシスタントの提供を競うにつれて、すぐにわかるようになるかもしれない。
AI音声技術を研究するアリゾナ州立大学の教授、ヴィサール・ベリシャ氏はNPRに次のように語っている。「音声によるコミュニケーションは、非常に親密で、非常に影響力があります。音声によってAIは微妙なニュアンス、誠実さ、緊急性、喜び、懸念などを表現することができます。そして、これらすべてがユーザーとマシンのより深いつながりを育むのに役立ちます。こうしたやり取りが中毒性を持つ可能性があることがわかります。」
映画「 her 」も当然この議論の一部となっている。映画の中で、主人公が、偶然にもスカーレット・ヨハンソンの声を担当している、色っぽい AI オペレーティング システムに夢中になるとき、彼の心の琴線に触れるのはその声だけであり、なぜそうなるのかは理解できる。だから、間違いなく、その声には何かがあるのだ。
音声が人間社会に影響を与えることは、企業にとっての投資としての魅力を見れば明らかです。アメリカの起業家で投資家のナバル・ラビカント氏は最近、音声中心のソーシャルメディアアプリ「Airchat」を立ち上げました。AIによる顧客対応が市場にあふれています。
Hume AI などの AI 企業は、AI がユーザーの口調に応じて応答を変える EVI (Empathic Voice Interface ) の導入を開始しています。
AI は音声分野、特に音楽業界で大きな変化をもたらしています。歌手が AI によって実際の声にエフェクトを加えながら歌っているのを目にするのは驚くことではありません。
AI はすでに、最大かつ最も人気のある音声エンターテインメントの分野の 1 つであるヒップホップとラップ音楽を変えつつあります。ケンドリック・ラマーとドレイクの間で進行中のディストラック ラップ バトルでは、ソーシャル プラットフォームでの厳選リリースや AI 生成の曲によって、テクノロジーがヒップホップに与える影響が明らかになりました。
声だけの問題ではない。クリエイティブな人たちは着実に AI に負けつつある。最近、サイケデリック ロック バンドのピンク フロイドは、映画「狂気」50 周年記念コンテストで、人間が作ったすべての作品を抑えて AI が生成したビデオを優勝作品として選んだことで、ファンから非難を浴びた。
2022年にミッドジャーニーが初めて登場したとき、私たちは皆「ああ、かわいい」と笑いました。今ではミッドジャーニーのせいで仕事を失う人が出ています
ミシガン州のアーティストがニューヨークタイムズに語った
ミシガン州の映画コンセプトアーティストはニューヨークタイムズ紙にこう語った。「2022年に『ミッドジャーニー』が初めて公開されたとき、私たちは皆、『ああ、かわいい』と笑いました。今では『ミッドジャーニー』のせいで仕事を失っている人たちがいるのです。」
避けられないと思われる AI のタブーがなくなると、何が起こるのでしょうか?
Wiredの記事では、「テクノロジーがすでにラップの論争を変えてしまったことから、次はどこに向かうのかという疑問が湧いてきます。ある日、ヒップホップにおける AI に関するタブーはなくなり、個々のアーティストのラップについて訓練を受けた LLM ラッパーによって、バトル全体が仕組まれるようになるでしょう。」と述べられています。
クオンツは勝者を決める指標を開発するだろう。家族の一員についての歌詞に腹を立てたら、機械のせいにするだろう。SFの世界の話のように聞こえるかもしれないが、この未来の現実と2024年の間のギャップは、カニバス対LLクールJ(1998年)やケンドリック対ドレイクの間のギャップよりも(時間と方法の面で)小さいかもしれない。」
先月、数百の新聞を所有するアメリカのメディア企業ガネットは、自社の記事にAIが生成した要約を追加した。今年のピューリッツァー賞受賞者のうち5人は、調査にAIを活用した。
まるで AI が忍び込むために裏口を開けたままにしているような感じですが、最終的には AI が玄関にたどり着くことは間違いありません。
こうした事件が既存の著作権法を書き換えるのは避けられないように思われる。最近、著作権で保護された数万冊の書籍を生成型 AI システムのトレーニングに利用している企業に対して、著作権侵害訴訟が数多く起こされている。そのうちの 1 社はこれを「大規模な組織的窃盗」と呼んでいるが、これは真実からそれほどかけ離れていない。
しかし、すべてが悪というわけではありません。AI 音声クローン技術は、一部の人にとっては役に立つこともあります。発声障害を患った人々は、AI 音声クローン技術を使って発声障害を取り戻しています。米国の21 歳の女性は、10 代の頃の 15 秒間の声をトレーニングし、人工的でありながら本物そっくりの AI 音声を楽しんでいます。カントリー シンガーのランディ トラヴィスは、2013 年に脳卒中で発声障害を患った後、AI の助けを借りて最新曲をリリースすることができました。
こうした事件の栄光も無視できない。
研究者たちは、人間と機械が相互作用して共同創造する共同創造、つまり「人間中心の AI」や「ハイブリッド インテリジェンス」に傾倒すべきだと言っている。研究者たちは、これが「AI と人間の制御による高度な自動化の両方を保証し」、そして「お互いを最適に強化する関係」をサポートすると主張している。
それでも、そんなに簡単なのでしょうか? 記事、物語、画像、動画、音楽を「共同制作」するために AI を創作プロセスに組み込むと、物事は便利になるかもしれませんが、気持ちは落ち着かないでしょう。純粋主義者はそれを永遠に不正行為と見なすかもしれません。
AI を社会全体の創造プロセスの一部として受け入れるには時間がかかるでしょう。一方で、大手テクノロジー企業は AI が競争を続け、数秒以内に人間の創造性を模倣することを保証しています。この新しい現実を再定義し、アーティストを保護する時間はどこにあるのでしょうか?
パニック的な側面としては、AIへの依存が高まるにつれて、私たちは自主的に創造する能力を失ってしまうのではないか、というものがあります。暗闇の中で手探りしながら基本的な文章を考え出したり、簡単な絵を描いたりするアナログの世界を想像してみてください。すでにAIの使用は、創造的な作品においてAIを適切に評価することを要求しています。
ナヴァンウィタ・ボラ・サッチデフ、The Tech Panda編集者