paint-brush
AI 회사, 현대의 Luddites 등에 대한 집단 소송~에 의해@futuristiclawyer
186 판독값

AI 회사, 현대의 Luddites 등에 대한 집단 소송

~에 의해 Futuristic Lawyer9m2023/06/23
Read on Terminal Reader
Read this story w/o Javascript

너무 오래; 읽다

Pessimistic Archive는 오래된 신문의 스크랩을 기반으로 한 뉴스레터입니다. 과거 세대는 미래와 신기술에 대한 우려를 표명합니다. 독립 시각 예술가 3명이 Stable Diffusion을 상대로 집단 소송을 제기했습니다. 소송은 본질적으로 저작권이 있는 데이터에 대해 훈련된 모든 생성 AI 모델을 대상으로 합니다.
featured image - AI 회사, 현대의 Luddites 등에 대한 집단 소송
Futuristic Lawyer HackerNoon profile picture

소개

비관적 아카이브 는 과거 세대가 미래와 신기술에 대한 우려를 표현하는 오래된 신문 스크랩을 기반으로 한 뉴스레터입니다.


1859년 프랑스 시인 샤를 보들레르(Charles Baudelaire)가 사진에 대해 설명했습니다. * "모든 화가 지망생, 모든 화가가 자신의 연구를 완료하기에는 너무 가난하거나 너무 게으른 화가의 피난처"*로서 그것을 받아들이는 것은 "맹목""저능함"의 표시였습니다.


1906년에는 타자기로 쓴 연애편지라는 작가 가장 “ 상상할 수 없을 정도로 냉혹하고, 기계적이고, 비낭만적인 연출 ”, 또 다른 작가는 “ 타자기로 쓴 러브레터를 참는 소녀는 뭐든 참는다 ”고 평했다.


지난 세기에는 주목을 끄는 신문 헤드라인 침대에서 책을 읽는 것에 대해 경고했으며, 롤러 스케이트의 해악, "자전거 얼굴"은 " 기수가 균형을 유지하는 데 가해지는 신경 긴장" 으로 인한 것이며 미국 작곡가, 작가 및 출판사 협회는 차트를 통해 어떻게 증명했는지 보여주었습니다. " 말하는 사진, 라디오, 축음기 "는 " 음악을 죽였습니다. " ”


2023년에는 소위 인공지능이 등장합니다. 텍스트 프롬프트에서 원활하게 몇 초 안에 텍스트, 이미지, 비디오 및 음악을 생성할 수 있습니다. 많은 예술가들이 우려하고 있다.


세 명의 독립 시각 예술가(Sarah Andersen, Kelly Mckernan, Karla Ortiz)가 지금까지 서류를 제출했습니다. Stable Diffusion을 상대로 한 집단소송 변호사 Matthew Butterick과 Joseph Saveri 법률 사무소의 소송 변호사의 도움을 받았습니다.


매튜 버터릭은 이미 'AI와의 법적 저작권 싸움'에서 유명한 인물이다. Github의 CoPilot에 대한 또 다른 집단 소송 , 코드 생성을 위한 생성 AI 도구입니다.

집단소송

내 최근 게시물에서 , 오픈소스 AI 이미지 생성기인 Stable Diffusion에 대해 글을 썼습니다. 이번 집단소송은 스테이블 디퓨전(Stable Diffusion)의 오너인 스태빌리티 AI(Stability AI)와 또 다른 유명 AI 이미지 기업 미드저니(Midjourney), 온라인 아트 커뮤니티 데비안아트(DevianArt)를 대상으로 한다.


그러나 원고의 불만은 광범위한 범위로 공식화되었으며 본질적으로 저작권이 있는 데이터에 대해 훈련된 모든 생성 AI 모델을 사용하고 있습니다. 이는 모두 대규모이며 엄청난 양입니다.


실제로 샌프란시스코 연방법원이 7월 19일에 사건을 심리하기로 결정하면, 피고인의 기각 신청 , 법원의 결정은 다음과 같은 상황에 막대한 영향을 미칠 수 있습니다. 수조 달러 규모의 산업 .


전반적으로, 집단 소송 뒤에 있는 예술가 3인조는 생성 AI 모델이 제기하는 두 가지 어려운 저작권 질문(입력과 관련된 질문과 출력과 관련된 질문)에 "예"를 강요하려고 노력하고 있습니다.


  1. 입력 질문 : 개발자는 AI 훈련 과정에서 자신의 저작권 자료를 사용하기 위해 권리 보유자에게 허가를 받거나 라이선스를 지불해야 합니까?


  1. 출력 질문 : 생성 AI 제품이 인간 예술가가 만든 작품과 유사한 출력을 생성하는 경우 권리 보유자가 제공자를 상대로 침해 소송을 제기할 수 있습니까?


나는 미국 저작권법 전문가가 아니며, 문제에 대해 중립적인 입장을 취하는 관찰자일 뿐입니다. 내 연구에 따르면 첫 번째 질문에 대한 대답은 "아니요"라고 생각합니다. 반면 두 번째 질문은 대답하기가 더 문제가 많으며 사례별 평가에 따라 달라질 수 있습니다.


이번 집단소송이 우리에게 어떤 답을 줄 수 있을지 매우 의심스럽습니다.


Stable Diffusion의 이미지 사용 및 배포에 관한 또 다른 저작권 소송이 계류 중입니다. 스톡 이미지 거대 게티 이미지(Getty Images)에 의해 제출되었습니다. 올해 2월에.


내 생각에는 Getty Images의 소송이 법정에 가서 저작권과 생성 AI에 대한 법적 이해에 기여할 가능성이 훨씬 더 높습니다.


한 문장의 주요 차이점은 Getty Images 소송이 더 잘 문서화되어 있다는 것입니다. Getty Images는 자신의 권리를 증명하고 구체적인 권리 침해를 지적할 수 있지만, 집단 소송을 제기한 아티스트는 그럴 수 없습니다.


예술가들의 집단 소송 불만 사항은 불행하게도 Stable Diffusion이 훈련된 방식과 모델이 이미지를 생성하는 방식에 대한 기본적인 실수와 잘못된 가정으로 가득 차 있습니다.


기술 애호가 그룹은 불만 사항의 기술적 부정확성을 지적하는 웹사이트 http://www.stablediffusionfrivolous.com/을 만들었습니다.


여기서는 위에서 언급한 두 가지 법적 문제를 아티스트가 어떻게 해결하는지, 아니면 어떻게 해결하지 못하는지에 중점을 둘 것입니다.

입력 질문

다음은 아티스트가 입력 질문에 대한 자신의 견해를 제공하는 불만 사항(¶57-58)의 인용문입니다.


“Stability는 Stable Diffusion의 교육 데이터로 사용되는 교육 이미지로 웹사이트에서 50억 개가 넘는 이미지를 스크랩하여 복사했습니다.


Stability는 교육 이미지 작성자나 이미지를 스크랩한 해당 이미지를 호스팅한 웹사이트의 동의를 구하지 않았습니다.


Stability는 교육 이미지에 대한 라이센스 협상을 시도하지 않았습니다. 안정성은 단순히 그들을 가져갔습니다. Stability는 Stable Diffusion 내에 훈련 이미지의 압축 사본을 내장하고 저장했습니다.”


Stable Diffusion의 첫 번째 버전은 “ CLIP 필터링됨 ” 공개 데이터베이스 LAION-5B의 이미지-텍스트 쌍입니다.


LAION-5B는 58억 5천만 개의 이미지에 대한 정보를 담고 있으며 동종 최대 규모의 데이터베이스입니다. 독일 비영리단체 LAION(Large-scale Artificial Intelligence Open Network의 약어)이 개발했으며 Stability AI가 개발 자금을 지원했습니다.


LAION-5B에는 실제 이미지가 저장되어 있지 않다는 점에 유의하는 것이 중요합니다. 대신 각 이미지에 대한 정보가 저장되고 다음으로 구성됩니다.


  • 이미지 웹사이트의 URL 링크
  • 이미지가 묘사하는 내용에 대한 간단한 텍스트 설명
  • 이미지의 높이와 너비
  • 다른 이미지와의 인지된 유사성
  • 이미지가 "안전하지" 않을 가능성에 대한 확률 점수(포르노/NSFW)
  • 이미지에 워터마크가 있을 가능성에 대한 확률 점수


따라서 Stable Diffusion이 자신의 예술 작품을 "압축된 복사본으로 저장"한다는 예술가들의 주장은 잘못된 것입니다. 실제로 Stable Diffusion의 학습 데이터 세트는 일부 아티스트 이미지에 대한 메타데이터로 구성되어 있으며 해당 메타데이터 자체는 저작권으로 보호되지 않습니다.


마찬가지로 Spotify의 노래는 저작권으로 보호되지만 아티스트 이름, 노래 제목, 제작자, 출시일, 장르, 트랙 재생 시간과 같은 관련 메타데이터는 보호되지 않습니다. 이는 이 데이터를 검색하는 것이 창의적인 노력이 필요하지 않은 순전히 기계적인 프로세스이기 때문입니다.


공개 데이터 세트인 LAION-5B는 관심 있는 사람이라면 누구나 검사할 수 있습니다. 그 회사 산란 검색 도구를 만들었습니다 haveibeentrained.com 사람들은 LAION-5B를 검색하여 자신의 이미지가 데이터 세트에 포함되어 있는지 확인할 수 있습니다.


이것이 세 명의 예술가 Sarah Andersen, Kelly McKernan, Karla Ortiz가 한 일이며, 그들은 각각 200개 이상, 30개 이상, 12개 이상의 작품 표현을 발견했습니다.


특히, Stable Diffusion은 초기에 23억 개의 이미지로 훈련됨 영어로 된 텍스트 설명이 있는 이미지만 포함하는 LAION-2B-EN이라는 LAION-5B의 하위 집합입니다.


Stable Diffusions 훈련 데이터의 크기를 고려하면, 세 명의 아티스트가 무의식적으로 기여한 것은 넓은 바다의 작은 물방울입니다.


이에 비해 Stability AI를 상대로 한 Getty Images 소송은 관련이 있습니다. 1,200만 개 이상의 사진 컬렉션 이는 여전히 전체 데이터 세트에서 아주 작은 부분입니다.


모든 아티스트의 작품 중 Sarah Andersen이 미국 저작권 사무소에 등록한 이미지는 16개뿐입니다.


17 USC § 411(a)에 따르면 " 모든 미국 저작물의 저작권 침해에 대한 민사소송은 사전등록 또는 저작권 주장 등록이 완료될 때까지 제기될 수 없습니다 (..)".


즉, 미국 저작권청에 저작물이 등록되지 않은 경우 권리자는 일반적으로 민사소송에서 침해 주장을 할 수 없습니다. 즉, 아티스트는 Sarah Andersen이 소유하고 등록한 16개 작품에 대해서만 소유권을 주장할 수 있습니다.


아티스트만이 Stable Diffusion이 때때로 이러한 16개의 이미지 중 하나와 유사한 출력을 생성할 수 있다는 것을 증명할 수 있다면 아티스트는 아마도 "출력 질문"에 관한 사례를 만들 수 있을 것입니다. 그러나 앞으로 살펴보겠지만 그들은 그렇게 할 수 없습니다.

출력 질문

출력 질문과 관련하여 아티스트는 Stable Diffusion이 생성하는 모든 출력이 본질적으로 교육 데이터에서 파생되므로 저작권 침해라고 제안합니다(¶94-95 참조). 이 법률 이론은 매우 무리한 것입니다.


아래는 법학 교수 Matthew Sag의 논문 “ 생성 AI에 대한 저작권 안전 . 왼쪽에 있는 15개 이미지는 '흰색', '커피', '컵' 태그가 포함된 Stable Diffusions 교육 데이터에서 가져온 것입니다.


오른쪽 이미지는 "흰색 배경에 커피 컵"이라는 텍스트 프롬프트를 사용하여 Stable Diffusion에서 생성한 것입니다. 아티스트의 논리에 따르면 오른쪽 이미지는 모두 왼쪽 이미지의 저작권을 침해하게 됩니다.


이미지가 실질적으로 유사해 보이지는 않지만.

특정 드문 조건에서 실제로 Stable Diffusion이 훈련 데이터 세트의 이미지와 매우 유사한 출력 이미지를 생성할 수 있다는 것이 입증되었습니다.


이는 특히 입력 훈련 이미지가 인터넷에 널리 배포되고 Stable Diffusion의 훈련 데이터에서 반복적으로 반복되는 경우 발생할 가능성이 높습니다.


라는 제목의 최근 논문에서 확산 모델에서 훈련 데이터 추출, Nicholas Carlini와 그의 공동 저자는 Stable Diffusions 교육 데이터에서 가장 많이 중복된 이미지 350,000개를 식별했습니다.


이후에는 Stable Diffusion을 통해 각 훈련 데이터 이미지와 관련된 텍스트 설명과 동일한 텍스트 프롬프트를 사용하여 500개의 새로운 이미지를 생성했습니다.


결과적으로 1억 7,500만 개의 이미지(350,000*500) 중 109개(0.03%)만 합리적으로 "근사본"으로 간주될 수 있었습니다.


이로 인해 저작권 침해가 발생할 수 있지만 아티스트는 Stable Diffusion이 자신의 작업을 어떻게 복사했는지에 대한 예를 제시하지 않습니다. 반대로 그들은 고소장 ¶93에 다음과 같이 적고 있습니다.


일반적으로 특정 텍스트 프롬프트에 대한 응답으로 제공되는 Stable Diffusion 출력 이미지는 훈련 데이터의 특정 이미지와 거의 일치하지 않을 수 있습니다.


예술가들은 Stable Diffusion이 그들의 개인적인 예술적 스타일을 모방할 수 있다고 주장합니다. 일반적으로 “예술적 스타일”은 저작권 보호를 받을 수 없습니다. 침해 주장은 항상 특정 저작물의 침해와 연관되어야 합니다.


그러나 여기에는 합법적인 문제가 있습니다. 상당한 대중의 관심. 생성적 AI 모델은 유명한 아티스트의 독특한 스타일을 몇 초 만에 무기한으로 거의 무료로 복사할 수 있습니다.


이 문제를 해결하기 위해 Stability AI는 데이터 세트의 레이블에서 유명 아티스트의 이름을 제거했습니다. 작년 11월 업그레이드의 일환으로 . 이는 Stable Diffusion이 더 이상 사람들의 예술적 스타일을 모방할 수 없음을 의미합니다.


예를 들어 Stable Diffusion에 Picasso나 Rembrandt 스타일의 이미지를 생성해 달라고 요청하면 더 이상 그렇게 할 수 없습니다. 이러한 변경은 집단 소송이 제기되기 두 달 전에 시작되었습니다.


전반적으로 아티스트가 Stable Diffusion이 자신의 작업을 복사한다고 믿는 방법과 이유가 불분명합니다. 예술가들은 Stable Diffusion이 미래에 자신의 직업을 어떻게 위협할 있는지에 대해 더 관심을 갖고 있으며 현재 Stable Diffusion이 실제로 어떻게 작동하는지에 대해서는 덜 관심을 갖고 있는 것 같습니다.


세 명의 예술가 중 한 명인 사라 안데르센(Sarah Andersen)은 다음과 같이 썼습니다. NY Times 기사 작년 12월부터:


"나는 여러 발전기를 가지고 놀았지만 지금까지 내 경력을 직접적으로 위협할 수 있는 방식으로 내 스타일을 흉내낸 사람은 아무도 없었습니다. AI가 지속적으로 개선됨에 따라 이러한 사실은 거의 확실히 바뀔 것입니다."


아래에는 기사에 나온 두 가지 삽화가 있습니다. 하나는 Sarah Andersen이, 다른 하나는 Stable Diffusion이 쓴 것입니다. 누가 만든 것인지 짐작할 수 있을 것입니다.

마무리 생각

2022년 12월, 안정성 AI 발표 그들은 뒤에 있는 회사인 Spawning과 파트너십을 맺었다고 합니다. haveibeentrained.com , 이제 아티스트에게 자신의 작품이 Stable Diffusion의 다음 버전에 대한 교육 자료로 사용되는 것을 선택하거나 선택 해제할 수 있는 옵션을 제공합니다.


비록 이니셔티브 완벽하지 않을 수도 있다 , 이는 자신의 작업을 대형 기초 모델에 적용하는 데 관심이 있는 모든 아티스트에게 올바른 방향으로 나아가는 단계로 간주될 수 있습니다.


집단소송에 앞서, Karla Ortiz는 MIT Technology Review와 대화했습니다. 그녀는 새로운 옵트아웃 기능에 대해 이야기했고 Stability AI가 충분히 발전하지 못했다고 생각했습니다.


"Stability.AI가 할 수 있는 유일한 일은 데이터베이스를 완전히 파괴하고 모든 데이터가 포함된 모든 모델을 완전히 파괴하는 알고리즘 분해입니다."


이 진술은 매우 시사적입니다. 집단소송법의 배후에 있는 세 예술가는 매튜 버터릭 및 나머지 법적 대리인과 함께 예술가의 권리를 옹호하는 척하지만 사실 그들은 현대의 러다이트 .