AI가 우리를 얼마나 잘 모방하는지에 대해 우리를 놀라게 함에 따라 AI는 우리가 수세기에 걸쳐 형성해 온 창의적인 프로세스를 재정의하기 시작했습니다. 아티스트 권리와 지적재산권 보호법을 전면 개편하기 전까지는 아티스트들이 어려움을 겪을 것으로 보입니다.
이번에는 성우입니다. 지난 달 OpenAI는 헐리우드 여배우 스칼렛 요한슨(Scarlet Johansson) 과 놀랍도록 비슷한 ChatGPT의 목소리를 삭제했습니다. 여배우가 회사를 고소하겠다고 위협하자 봇 거인은 음성 사용을 중단했습니다 . 애초에 목소리를 어떻게 얻었는지 에 대한 설명은 다른 배우를 기용했다는 것이다.
우리가 AI를 사회의 창의적 과정의 일부로 받아들이는 데는 시간이 걸릴 것입니다. 한편, 빅 테크는 AI가 단 몇 초 만에 인간의 창의성을 모방할 수 있도록 보장합니다. 이 새로운 현실을 재정의하고 예술가를 보호해야 할 때는 언제입니까?
이러한 AI 회사들은 어디에서 이러한 목소리를 얻고 있습니까? 출처가 중요한거 아닌가요?
NPR은 요한슨의 말을 인용해 “우리 모두가 딥페이크와 자신의 초상, 작업, 정체성을 보호하기 위해 고군분투하고 있는 시대에 이러한 질문은 절대적으로 명확해야 한다고 믿습니다.”라고 말했습니다.
우리 모두가 딥페이크 문제와 자신의 초상, 작업, 정체성을 보호하기 위해 고군분투하고 있는 이 시대에 저는 이러한 문제가 절대적으로 명확해야 한다고 믿습니다.
스칼렛 요한슨
그녀는 요점이 있습니다. 자신이 빌려주지 않은 소스에서 자신의 목소리를 듣고 충격을 받은 다른 성우들도 있습니다. 이러한 사건은 AI 도구를 지원하는 창의적인 작업을 사용할 때 법적 보호 장치가 부족함을 보여줍니다.
인간의 음성 행동을 모방하는 AI가 인간 사회에 어떤 영향을 미칠지 상상하기 어려워 보일 수도 있습니다. 왜냐하면 우리는 이를 당연하게 여기기 때문입니다. 그러나 거대 기술 기업들이 훨씬 더 생생한 음성 비서를 제공하기 위해 경쟁함에 따라 우리는 곧 알게 될 것입니다.
AI 음성 기술을 연구하는 애리조나 주립대학교 교수인 Visar Berisha는 NPR과 의 인터뷰에서 이렇게 말했습니다. “음성을 통한 의사소통은 정말 친밀하고 영향력이 큽니다. 이를 통해 AI는 미묘함, 진실함, 긴급함, 기쁨, 관심으로 인식되는 것들을 표현할 수 있습니다. 그리고 이 모든 것들은 사용자와 기계 사이의 더 깊은 연결을 촉진하는 데 도움이 됩니다. 이러한 상호작용이 어떻게 잠재적으로 중독성이 될 수 있는지 알 수 있습니다.”
영화 ' 그녀 '도 자연스럽게 이런 논의의 일부가 됐다. 영화에서 주인공이 우연히 스칼렛 요한슨의 목소리를 내는 시시한 AI 운영체제에 반했을 때, 그 목소리가 그의 가슴을 울리는 것 뿐이고, 우리는 왜 그런 일이 일어나는지 이해합니다. 그러므로 목소리에는 뭔가가 있다는 것은 의심할 여지가 없습니다.
그 목소리가 인간 사회에 영향을 미친다는 것은 그것이 기업에 대한 투자로서 얼마나 매력적인지 보면 분명합니다. 미국 기업가이자 투자자인 Naval Ravikant는 최근 음성 중심 소셜 미디어 앱인 Airchat을 출시했습니다. AI 고객 담당자가 시장을 채우고 있습니다.
Hume AI와 같은 AI 회사는 AI가 사용자의 말투에 따라 반응을 바꾸는 EVI(Empathic Voice Interface)를 도입하기 시작했습니다 .
AI는 음성 영역, 즉 음악 산업에서 더욱 변화하고 있다. AI가 실제 목소리에 효과를 추가하는 동안 가수가 웅얼거리는 모습을 보는 것은 놀라운 일이 아닙니다.
이미 AI는 가장 크고 인기 있는 음성 엔터테인먼트 분야 중 하나인 힙합, 랩 음악을 변화시키고 있습니다. Kendrick Lamar와 Drake 사이에서 진행 중인 디스 트랙 랩 배틀은 소셜 플랫폼과 AI 생성 노래의 엄선된 릴리스를 통해 기술이 힙합에 미치는 영향을 가져왔습니다.
단순한 목소리가 아닙니다. 창의적인 사람들은 꾸준히 AI에게 지고 있습니다. 최근 사이키델릭 록 밴드 핑크 플로이드(Pink Floyd)가 인간이 만든 모든 출품작을 제치고 AI가 생성한 비디오를 The Dark Side of The Moon 50주년 기념 대회의 우승자로 선택하여 팬들로부터 비난을 받았습니다.
2022년 미드저니가 처음 나왔을 때 '아, 귀엽구나'라며 우리 모두 웃었습니다. 이제 사람들은 Midjourney로 인해 일자리를 잃고 있습니다.
미시간의 예술가가 New York Times에 말했습니다.
미시간의 한 영화 콘셉트 아티스트는 뉴욕타임스와 의 인터뷰에서 “2022년 미드저니가 처음 나왔을 때 우리 모두는 '아, 그거 귀엽다'고 웃었다. 이제 사람들은 Midjourney로 인해 일자리를 잃고 있습니다.”
불가피해 보이는 AI의 금기가 무너지면 어떤 일이 벌어질까?
Wired 의 기사에 따르면 “기술이 이미 랩 쇠고기를 변화시킨 방식은 그것이 다음에 어디로 갈 것인지에 대한 질문을 불러일으킵니다. 언젠가는 힙합에서 AI에 대한 금기가 사라지고, 개별 아티스트의 랩을 훈련받은 LLM 래퍼들이 전체 전투를 지휘하게 될 것입니다.
Quants는 승자가 누구인지에 대한 측정 기준을 개발할 것입니다. 우리 가족 구성원에 관한 가사 때문에 기분이 상했다면 우리는 기계를 비난할 것입니다. 공상과학 소설처럼 들릴지 모르지만, 이 미래 현실과 2024년 사이의 격차는 Canibus 대 LL Cool J(1998), Kendrick 대 Drake 간의 격차보다 (시간과 방식에서) 더 작을 수 있습니다.”
지난 달 수백 개의 신문을 소유한 미국 미디어 회사인 Gannett은 AI가 생성한 요약을 기사에 추가했습니다. 올해 퓰리처 수상자 중 5명이 연구에 AI를 사용했습니다 .
AI가 몰래 들어올 수 있도록 뒷문을 열어 두는 것과 조금 비슷하지만 결국 현관에 도달할 것이라고 확신할 수 있습니다.
이런 종류의 사건으로 인해 기존 저작권법이 다시 쓰여지는 것은 불가피해 보입니다. 최근에는 수만 권의 저작권 도서를 활용하여 생성 AI 시스템을 교육하는 기업을 상대로 저작권 침해 소송이 많이 제기되었습니다. 그 중 한 사람은 이를 “대규모의 조직적인 절도”라고 불렀는데, 사실과 크게 다르지 않습니다.
그렇다고 모두 악한 것은 아닙니다. AI 음성 복제 기술은 일부 사람들에게도 도움이 될 수 있습니다. 말을 잃은 사람들이 AI 음성복제를 이용해 말을 되찾고 있다. 10대 목소리의 15초 타임캡슐 훈련을 받은 미국의 21세 여성은 합성되었지만 실제처럼 들리는 AI 목소리를 즐깁니다. 컨트리 가수 랜디 트래비스(Randy Travis)는 2013년 뇌졸중으로 연설을 할 수 없게 된 후 AI의 도움으로 최신 노래를 발표 할 수 있었습니다.
우리도 이러한 사건의 영광을 무시할 수 없습니다.
연구자들은 인간과 기계가 상호작용하여 공동 창조하는 공동창작, 즉 '인간 중심의 AI'와 '하이브리드 지능'으로 기울어야 한다고 말하고 있습니다 . 그들은 이것이 “AI와 인간의 통제를 통해 높은 수준의 자동화를 보장”하고 “서로에게 최적의 권한을 부여하는 관계”를 지원할 것이라고 주장합니다.
그래도 그게 그렇게 쉽나요? 기사, 이야기, 이미지, 비디오 및 음악을 '공동 생성'하기 위해 AI를 창의적인 프로세스에 도입하면 작업이 더 편리해질 수 있지만 느낌은 불안합니다. 순수주의자들은 그것을 부정행위로 영원히 볼 수 있습니다.
우리가 AI를 사회의 창의적 과정의 일부로 받아들이는 데는 시간이 걸릴 것입니다. 한편, 빅 테크는 AI가 단 몇 초 만에 인간의 창의성을 모방할 수 있도록 보장합니다. 이 새로운 현실을 재정의하고 예술가를 보호해야 할 때는 언제입니까?
당황스러운 측면에서는 AI에 대한 의존도가 높아짐에 따라 독립적으로 창작할 수 있는 능력을 잃게 될까요? 우리가 어둠 속에서 더듬으며 기본적인 문장을 떠올리거나 간단한 그림을 그리는 아날로그 세계를 상상해 보세요. 이미 AI의 사용은 창의적인 작업에서 AI를 적절히 인정할 것을 요구하고 있습니다.
Navanwita Bora Sachdev , 편집자, The Tech Panda