paint-brush
Yapay Zeka Şirketlerine, Günümüzün Luddite'lerine ve Daha Fazlasına Karşı Toplu Davalarile@futuristiclawyer
165 okumalar

Yapay Zeka Şirketlerine, Günümüzün Luddite'lerine ve Daha Fazlasına Karşı Toplu Davalar

ile Futuristic Lawyer9m2023/06/23
Read on Terminal Reader
Read this story w/o Javascript

Çok uzun; Okumak

Pesimist Arşivi eski gazetelerden kupürlere dayanan bir haber bültenidir. Geçmiş nesiller geleceğe ve yeni teknolojilere dair kaygılarını dile getiriyorlar. Üç bağımsız görsel sanatçı, Stable Diffusion'a karşı toplu dava açacak kadar ileri gitti. Dava esasen telif hakkıyla korunan verilerle eğitilen her üretken yapay zeka modelini ele alıyor.
featured image - Yapay Zeka Şirketlerine, Günümüzün Luddite'lerine ve Daha Fazlasına Karşı Toplu Davalar
Futuristic Lawyer HackerNoon profile picture

giriiş

Karamsar Arşiv geçmiş kuşakların geleceğe ve yeni teknolojilere dair kaygılarını dile getirdiği, eski gazetelerden kupürlere dayanan bir haber bültenidir.


1859'da Fransız şair Charles Baudelaire fotoğrafçılığı anlattı *“her ressam adayının, eğitimini tamamlayamayacak kadar yoksul ya da tembel her ressamın sığınağı”* olarak görmek ve bunu benimsemek “körlüğün” ve “aptallığın” işaretiydi.


1906'da daktiloyla yazılan aşk mektupları adlı yazar " akla gelebilecek en soğukkanlı, mekanik, romantik olmayan yapım " derken bir başka yazar da " Daktiloyla yazılmış bir aşk mektubuna katlanan kız her şeye katlanır ."


Geçtiğimiz yüzyılda, dikkat çekici gazete manşetleri Yatakta kitap okumaya karşı uyarıda bulunuldu, tekerlekli patenin kötülükleri, "bisiklet suratı" olarak adlandırılan ve " binicinin dengesini korurken yaşadığı sinirsel gerilime" atfedildi ve Amerikan Besteciler, Yazarlar ve Yayıncılar Derneği bunun nasıl olduğunu çizelgelerle kanıtladı. " Konuşan resimler, radyo ve fonograf " müziği "öldürmüştü. " ”


2023'e doğru hızla ilerleyince, sözde yapay zekaya sahibiz. Sorunsuz bir şekilde ve saniyeler içinde metin istemlerinden metin, resim, video ve müzik oluşturabilir. Pek çok sanatçı endişeli.


Üç bağımsız görsel sanatçı - Sarah Andersen, Kelly Mcckernan ve Karla Ortiz - başvuruda bulunacak kadar ileri gittiler Kararlı Difüzyona karşı toplu dava avukat Matthew Butterick ve Joseph Saveri Hukuk Bürosu'ndan davacıların yardımıyla.


Matthew Butterrick zaten "AI'ya karşı yasal telif hakkı savaşında" bilinen bir figür. Github'un CoPilot'una karşı başka bir toplu dava , kod oluşturmaya yönelik üretken bir yapay zeka aracı.

Toplu Dava Davası

Son yazımda , açık kaynaklı AI görüntü oluşturucu Stable Diffusion hakkında yazdım. Toplu dava, Stable Diffusion, Stability AI, bir başka ünlü AI görüntü şirketi Midjourney ve çevrimiçi sanat topluluğu DevianArt'ın sahibini hedef alıyor.


Bununla birlikte, davacının şikayeti geniş bir kapsamda formüle edilmiş ve esas olarak telif hakkıyla korunan veriler üzerinde eğitilmiş her üretken yapay zeka modelini (ki bunların hepsi büyük verilerdir) ve devasa miktarlarda ele almaktadır.


Aslında, eğer San Francisco federal mahkemesi davayı 19 Temmuz'da görmeye karar verirse, sanıkların reddi talepleri mahkemenin kararı büyük bir etki yaratabilir trilyonlarca dolarlık endüstri .


Genel olarak toplu davanın arkasındaki sanatçı üçlüsü, üretken yapay zeka modellerinin ortaya çıkardığı iki zor telif hakkı sorusuna "evet" cevabını vermeye çalışıyor: biri girdilerle, diğeri çıktılarla ilgili:


  1. Giriş sorusu : Geliştiriciler, telif hakkıyla korunan materyallerini bir yapay zekanın eğitim sürecinde kullanmak için hak sahiplerine izin almalı ve/veya lisans ödemeli mi?


  1. Çıkış sorusu : Bir üretken yapay zeka ürünü, bir insan sanatçının yarattığı bir esere benzeyen bir çıktı üretiyorsa, hak sahibi, sağlayıcıya karşı ihlal iddiasında bulunabilir mi?


ABD telif hakkı yasası konusunda uzman değilim, yalnızca sorulara tarafsız bir duruş sergileyen bir gözlemciyim. Araştırmama dayanarak, ilk sorunun cevabının "hayır" olduğunu, ikinci sorunun ise cevaplanmasının daha sorunlu olduğunu ve duruma göre değerlendirmeye bağlı olabileceğini düşünüyorum.


Bu toplu davanın bize herhangi bir cevap sağlayacağından oldukça şüpheliyim.


Stable Diffusion'ın görsellerin kullanımı ve dağıtımıyla ilgili bekleyen bir başka telif hakkı davası Stok görsel devi Getty Images tarafından dosyalandı bu yılın şubat ayında.


Bana göre Getty Images'ın açtığı davanın mahkemeye gitme ve telif hakları ile üretken yapay zeka arasındaki hukuki anlayışa katkıda bulunma şansı çok daha yüksek.


Tek cümledeki temel fark: Getty Images davası daha iyi belgelenmiştir. Getty Images haklarını kanıtlayabilir ve belirli hak ihlallerine işaret edebilir, oysa toplu davanın arkasındaki sanatçılar bunu yapamaz.


Sanatçıların toplu dava şikayeti ne yazık ki Stabil Difüzyonun nasıl eğitildiğine ve modelin nasıl görüntü ürettiğine dair ilkel hatalarla ve yanlış varsayımlarla dolu.


Bir grup teknoloji meraklısı http://www.stablediffusionfrivolous.com/ adresinde bir web sitesi oluşturdular ve burada şikayetteki bazı teknik yanlışlıklara dikkat çektiler.


Burada sanatçıların yukarıda belirtilen iki hukuki soruyu nasıl ele aldıklarına veya daha doğrusu ele almadıklarına odaklanacağım.

Giriş Sorusu

Sanatçıların girdi sorusuyla ilgili görüşlerini sundukları şikayetten (¶57-58) bir alıntı:


"Stabilite kazındı ve böylece Eğitim Görselleri Stabil Yayılma için eğitim verileri olarak kullanılırken web sitelerinden beş milyardan fazla görsel kopyalandı.


Stabilite, Eğitim Görüntülerinin yaratıcılarından veya bu görüntülerin alındığı web sitelerinden izin istemedi.


Stabilite, Eğitim Görüntülerinin herhangi biri için lisans pazarlığı yapmaya çalışmadı. İstikrar onları aldı. Stabilite, Eğitim Görüntülerinin sıkıştırılmış kopyalarını Stabil Difüzyon içerisine yerleştirdi ve sakladı."


Kararlı Difüzyonun ilk versiyonu “ CLIP filtreli ” LAION-5B genel veritabanından resim-metin çiftleri.


LAION-5B, 5,85 milyar görüntü hakkında bilgi içerir ve türünün en büyük veritabanıdır. Alman kar amacı gütmeyen kuruluş LAION (Büyük Ölçekli Yapay Zeka Açık Ağı'nın kısaltması) tarafından geliştirildi ve Stability AI, gelişiminin finansmanına yardımcı oldu.


LAION-5B'de saklanan herhangi bir gerçek görüntünün bulunmadığına dikkat etmek önemlidir. Bunun yerine, her görüntüyle ilgili bilgiler saklanır ve şunlardan oluşur:


  • Resmin web sitesine yönlendiren bir URL bağlantısı
  • Resmin neyi tasvir ettiğine dair kısa bir metin açıklaması
  • Resmin yüksekliği ve genişliği
  • Diğer görsellerle algılanan benzerlik
  • görüntünün "güvensiz" olma ihtimalinin ne kadar yüksek olduğuna ilişkin bir olasılık puanı (pornografik/NSFW)
  • görüntünün filigran içerme olasılığının ne kadar yüksek olduğuna ilişkin olasılık puanı


Sanatçıların Stable Diffusion'ın sanat eserlerinin "sıkıştırılmış kopyalarını sakladığı" iddiası bu nedenle yanlış bir adlandırmadır. Gerçekte, Stable Diffusion'ın eğitim veri seti bazı sanatçıların görselleriyle ilgili meta verilerden oluşuyor ve bu meta veriler kendi başına telif hakkıyla korunmuyor.


Aynı şekilde Spotify'daki bir şarkı da telif hakkıyla korunur ancak sanatçı adı, şarkı adı, yapımcı, çıkış tarihi, tür ve parça süresi gibi şarkı hakkındaki meta veriler koruma altındadır. Bunun nedeni, bu verilere ulaşmanın herhangi bir yaratıcı çaba gerektirmeyen, tamamen mekanik bir süreç olmasıdır.


Herkese açık bir veri seti olan LAION-5B, ilgilenen herkes tarafından incelenebilir. Şirket Yumurtlama bir arama aracı oluşturdu haveibeentrained.com İnsanların, görsellerinin veri setine dahil olup olmadığını görmek için LAION-5B'de arama yapabilecekleri yer.


Sarah Andersen, Kelly McKernan ve Karla Ortiz adlı üç sanatçının yaptığı da buydu ve çalışmalarının sırasıyla 200'den fazla, 30'dan fazla ve 12'den fazla temsilini buldular.


Spesifik olarak, Kararlı Difüzyon başlangıçta 2,3 milyar görüntüyle eğitildi LAION-5B'nin LAION-2B-EN adı verilen ve yalnızca İngilizce metin açıklamalarına sahip görselleri içeren bir alt kümesinden.


Stabil Difüzyon eğitim verilerinin boyutu göz önüne alındığında, üç sanatçının farkında olmadan yaptığı katkılar uçsuz bucaksız bir okyanustaki küçük damlalardır.


Buna karşılık, Getty Images'ın Stabilite Yapay Zekasına karşı açtığı dava Koleksiyonlarından 12 milyondan fazla fotoğraf bu hala tüm veri kümesinin çok küçük bir parçası.


Sanatçıların tüm çalışmalarından yalnızca 16 görsel ABD telif hakkı bürosuna Sarah Andersen tarafından tescil ettirildi.


17 USC § 411(a)'dan şu sonuç çıkmaktadır: " Telif hakkı iddiasının ön kaydı veya tescili yapılana kadar Amerika Birleşik Devletleri'ndeki herhangi bir eserde telif hakkının ihlaline ilişkin hiçbir hukuk davası açılmayacaktır (..)".


Başka bir deyişle, bir eser ABD telif hakkı bürosuna kayıtlı değilse, hak sahibi genellikle bir hukuk davasında ihlal iddiasında bulunamaz. Bu, sanatçıların yalnızca Sarah Andersen'ın sahibi olduğu ve tescil ettiği 16 eser adına hak talebinde bulunabileceği anlamına geliyor.


Keşke sanatçılar Stabil Difüzyonun bazen bu 16 görüntüden herhangi birine benzeyen çıktılar üretebildiğini kanıtlasalardı, sanatçılar belki de "çıktı sorusu" ile ilgili bir iddiada bulunabilirlerdi. Ancak göreceğimiz gibi bunu başaramıyorlar.

Çıktı Sorusu

Çıktı sorusuyla ilgili olarak sanatçılar, Stable Diffusion'ın ürettiği her çıktının esasen eğitim verilerinden türetildiğini ve dolayısıyla telif hakkı ihlaline yol açtığını öne sürüyorlar (bkz. ¶94-95). Bu hukuk teorisi son derece zorlamadır.


Aşağıda hukuk profesörü Matthew Sag'ın makalesinden bir örnek yer alıyor: “ Üretken Yapay Zeka için Telif Hakkı Güvenliği . ” Soldaki 15 resim, “beyaz”, “kahve” ve “fincan” etiketlerini taşıyan Stabil Difüzyon eğitim verilerindendir.


Sağdaki görseller, "beyaz arka plan üzerinde kahve fincanları" metin istemiyle Stable Diffusion tarafından oluşturuldu. Sanatçının mantığına göre, sağdaki görsellerin tümü soldaki görsellerin telif hakkını ihlal edecektir.


Her ne kadar görüntüler açıkça büyük ölçüde benzer görünmüyor olsa da.

Bazı nadir koşullar altında, Stabil Difüzyonun aslında eğitim veri kümesindeki görüntülere çok benzeyen çıktı görüntüleri oluşturabildiği kanıtlanmıştır.


Bu, özellikle girdi eğitim görüntüsü internette geniş çapta dağıtıldığında ve Stable Diffusion'ın eğitim verilerinde tekrar tekrar ortaya çıktığında meydana gelebilir.


başlıklı yeni bir makalede Difüzyon Modellerinden Eğitim Verilerinin Çıkarılması, Nicholas Carlini ve ortak yazarları, Stabil Difüzyon eğitim verilerinde en çok kopyalanan 350.000 görüntüyü belirledi.


Bundan sonra, her bir eğitim verisi görüntüsüyle ilişkili metin açıklamalarıyla aynı metin istemlerini içeren Stabil Difüzyon aracılığıyla 500 yeni görüntü oluşturdular.


175 milyon görüntüden (350.000*500) yalnızca 109'unun (%0,03) makul bir şekilde "kopyaya yakın" olarak değerlendirilebileceği ortaya çıktı.


Dolayısıyla telif hakkı ihlalleri olabiliyor ancak sanatçılar Stable Diffusion'ın eserlerini nasıl kopyaladığına dair herhangi bir örnek ortaya koymuyor. Tam tersine şikayette yazıyorlar ¶ 93:


“ Genel olarak, belirli bir Metin İstemine yanıt olarak sağlanan Stabil Difüzyon çıktı görüntülerinden hiçbirinin, eğitim verilerindeki herhangi bir belirli görüntüyle yakın eşleşme olması muhtemel değildir.


Sanatçılar, Stable Diffusion'ın kişisel sanatsal tarzlarını taklit edebildiğini iddia ediyor. Normalde bir “sanatsal tarz” telif hakkı korumasına tabi olamaz. İhlal iddialarının her zaman belirli eserlerin ihlaliyle bağlantılı olması gerekir.


Ancak burada kabul edilen meşru bir sorun var. makul miktarda kamuoyunun ilgisi. Üretken yapay zeka modelleri, ünlü sanatçıların kendine özgü tarzlarını saniyeler içinde, süresiz olarak ve sıfıra yakın maliyetle kopyalayabilir.


Bu sorunu çözmek için Stability AI, ünlü sanatçıların adlarını veri kümesindeki etiketlerden kaldırdı geçen yıl Kasım ayında yapılan yükseltmenin bir parçası olarak . Bu, Stable Diffusion'ın artık insanların sanatsal tarzlarını taklit edemeyeceği anlamına geliyor.


Örneğin Stable Diffusion'dan Picasso veya Rembrandt tarzında bir görüntü yaratmasını isterseniz, artık bunu yapamaz. Değişiklik, toplu dava şikâyetinden iki ay önce başlatılmıştı.


Genel olarak sanatçıların Stable Diffusion'ın çalışmalarını nasıl ve neden kopyaladığına inandıkları belli değil. Sanatçılar, Stabil Difüzyonun gelecekte işlerini nasıl tehdit edebileceğiyle daha çok ilgileniyor ve Stabil Difüzyonun şu anda gerçekte nasıl çalıştığıyla daha az ilgileniyor gibi görünüyor.


Üç sanatçıdan biri olan Sarah Andersen şunları yazdı: bir NY Times makalesi geçen yılın Aralık ayından itibaren:


"Birçok jeneratörle oynadım ve şu ana kadar hiçbiri kariyerimi doğrudan tehdit edecek şekilde benim tarzımı taklit etmedi; yapay zeka gelişmeye devam ettikçe bu durumun değişeceği neredeyse kesin."


Aşağıda makaleden biri Sarah Andersen'a, diğeri ise Stable Diffusion'a ait iki illüstrasyon bulunmaktadır. Hangisinin kim tarafından yaratıldığını muhtemelen tahmin edebilirsiniz.

Kapanış Düşüncesi

Aralık 2022'de, Stabilite yapay zekası duyuruldu arkasındaki şirket olan Spawning ile ortaklık kurduklarını haveibeentrained.com ve artık sanatçılara, Stable Diffusion'ın bir sonraki sürümü için eserlerinin eğitim materyali olarak kullanılmasına katılma veya vazgeçme seçeneği sunacak.


Her ne kadar girişim mükemmel olmayabilir çalışmalarını büyük temel modellere beslemek isteyen her sanatçı için doğru yönde atılmış bir adım olarak değerlendirilebilir.


Toplu dava davası öncesinde, Karla Ortiz MIT Technology Review'a konuştu yeni devre dışı bırakma işlevi hakkında konuştu ve Stabilite Yapay Zekasının yeterince ileri gitmediğini düşündü:


"Stability.AI'nin yapabileceği tek şey, veritabanlarını tamamen yok ettikleri ve içinde tüm verilerimizin bulunduğu tüm modelleri tamamen yok ettikleri algoritmik bozulmadır"


Bu açıklama çok anlamlıdır. Toplu dava yasasının arkasındaki üç sanatçı, Matthew Butterick ve diğer yasal temsilcilerle birlikte, sanatçının haklarını savunuyormuş gibi görünüyor, ancak aslında onlar günümüzün modern sanatçıları. Ludditler .