Geçen hafta, Open AI (ChatGPT'nin yapımcısı) resmi olarak web tarayıcısını duyurdu; bu, internetteki tüm web sitelerinden içerik çıkaran ve daha sonra AI model eğitimi için kullanılan bir yazılım parçasıdır.
Tarayıcının varlığı şaşırtıcı değildir ve Google'ın tüm interneti dizine ekleyen tarayıcısı da dahil olmak üzere bugün birçok meşru web tarayıcısı mevcuttur.
Ancak bu, OpenAI'nin varlığını ilk kez açıkça duyurması ve aynı zamanda web sitelerinin silinmekten vazgeçmesi için bir mekanizma sağlamasıdır.
Tarayıcının varsayılan olarak etkinleştirildiğini unutmayın; yani, tarayıcıdan verilerinizi kazımamasını istemek için web sitenizdeki bir kod parçasını açıkça değiştirmeniz gerekir. Etkinleştirme/devre dışı bırakma varsayılanları yapışkandır ve çoğu insan varsayılanları değiştirme çabası göstermediğinden çoğu zaman çoğunluk davranışının ne olduğunu belirler.
Apple'ın iOS14 gizlilik değişikliklerinin dijital reklamcılık sektörü üzerinde büyük bir etki yaratmasının nedeni de budur.
Peki neden vazgeçme seçeneğini sunuyorsunuz? Bu muhtemelen, içerik sahiplerinin telif haklarının ihlal edildiği iddiasıyla şirkete karşı açılan son davalara yanıt olarak OpenAI'nin önleyici bir hamlesidir (daha fazla bilgi edinmek istiyorsanız veri kazıma hakkında daha derin bir makale).
ChatGPT rakibi Google Bard da benzer bir zorlukla karşı karşıya, ancak Google henüz eşdeğer bir çözüm duyurmadı; bu sorunu çözmek için robots.txt dosyasının nasıl yükseltileceğine ilişkin yorum talebinde bulundular (biraz düzgün PR yazısıyla yazılmış).
Bu yazıda şunları ele alacağız:
Duyuru, reklamverenlere OpenAI tarayıcısının verilerini toplamasını engelleme seçeneği sunsa da, birkaç şey pek iyi değil:
Varsayılan olarak katılıma açıktır; bu, OpenAI'nin siteler açıkça bunu yapmamasını söyleyene kadar kazımaya devam edebileceği anlamına gelir
Verileri model eğitimi için izinsiz olarak çıkarıldığında içerik sahiplerinin haklarına ilişkin şu veya bu şekilde net bir yasal karar bulunmamaktadır (bu, esasen varsayılan bir katılıma zorlanan herkes için geçerli olacaktır)
Günümüzde dil modellerinin tüm bu verileri izinsiz almasının uygun olup olmadığını belirleyen iki yasal yapı vardır: Telif Hakkı ve Adil Kullanım .
Telif hakkı, belirli içerik türlerine koruma sağlar ancak aynı zamanda ayrıntılara/istisnalara da sahiptir:
Telif hakkı koruması, bu başlığa uygun olarak, şu anda bilinen veya daha sonra geliştirilen, algılanabilecek, çoğaltılabilecek veya doğrudan veya başka bir şekilde iletilebilecek herhangi bir somut ifade aracına sabitlenmiş orijinal yazarlık eserlerinde mevcuttur. makine veya cihaz.
Yazarlık eserleri aşağıdaki kategorileri içerir: (1) edebi eserler; (2) eşlik eden kelimeler de dahil olmak üzere müzik eserleri; (3) eşlik eden müzikler de dahil olmak üzere dramatik eserler; (4) pantomimler ve koreografik çalışmalar; (5) resimsel, grafik ve heykel çalışmaları; (6) sinema filmleri ve diğer görsel-işitsel eserler; (7) ses kayıtları; ve (8) mimari işler.
(b) Orijinal bir yazarlık eserine ilişkin telif hakkı koruması hiçbir durumda, tanımlandığı, açıklandığı, gösterildiği biçim ne olursa olsun, herhangi bir fikri, prosedürü, süreci, sistemi, çalışma yöntemini, kavramı, prensibi veya keşfi kapsamaz. , veya bu tür bir işte somutlaşan
Örneğin, telif hakkı orijinal çalışmaların çoğunu korur (örneğin, bir konu hakkında orijinal bir blog makalesi veya kitap yazdıysanız) ancak genel fikirleri korumaz (örneğin, yapay zekanın veri haklarını nasıl etkilediği hakkında yazan ilk kişi olduğunuzu iddia edemezsiniz) ve bu nedenle fikir size aittir).
Telif hakkı korumasının bir başka ayrıntısı/istisnası Adil Kullanımdır:
Telif hakkıyla korunan bir çalışmanın, eleştiri, yorum, haber sunma, öğretim (sınıfta kullanım için birden fazla kopya dahil), burs, veya araştırma, telif hakkı ihlali değildir.
Belirli bir durumda bir eserin kullanımının adil kullanım olup olmadığının belirlenmesinde dikkate alınacak faktörler şunları içerecektir: (1) kullanımın amacı ve niteliği, bu kullanımın ticari nitelikte olup olmadığı veya kar amacı gütmeyen eğitim amaçlı olup olmadığı dahil ; (2) telif hakkıyla korunan çalışmanın niteliği; (3) bir bütün olarak telif hakkıyla korunan eserle ilgili olarak kullanılan kısmın miktarı ve önemliliği; ve (4) kullanımın, telif hakkıyla korunan eserin potansiyel pazarı veya değeri üzerindeki etkisi.
Örneğin, bir araştırma makalesinden içerik aldıysanız ve onun hakkında bir eleştiri yazdıysanız bunda bir sakınca yoktur ve içerik sahibinin telif hakkını ihlal etmiyorsunuz demektir. Bu sayfadan başka bir makaleye bağlantı verdiğimde ve o makaleden alıntılanan metni eklediğimde de aynı durum oluyor.
Bu kavramların her ikisi de içerik sahiplerinin haklarını korumak ve aynı zamanda özellikle eğitim, araştırma ve eleştiri bağlamında bilginin serbest akışına izin vermek için oluşturulmuştur.
Hukuk uzmanı değilim, ancak yukarıdaki dille ilgili araştırmama/anlayışıma dayanarak, eğitim içeriğini kazıyan AI modelleriyle bu durumun bulanıklaştığı yer :
Henüz bu konuyla ilgili bir mahkeme kararı yok, dolayısıyla bunun nereye varacağını tahmin etmek zor. Avukat olmayan görüşüm, ikincisinin muhtemelen daha kolay olduğu yönünde: OpenAI verileri kazıdı ve ticari bir ürün oluşturmak için kullandı ve bu nedenle Adil Kullanım kapsamında bir istisna alamıyorlar.
İlkinin (model bir “fikir” üzerinde mi yoksa sadece orijinal metin üzerinde mi eğitildiğini) herkesin tahmini olduğunu tahmin ediyorum.
Kazanmaları için her iki maddenin de içerik sahiplerinin lehine olması gerektiğini unutmayın; yani içerik sahipleri yalnızca yukarıdaki istisnaların her ikisinin de (“fikir” istisnası veya Adil Kullanım istisnası) OpenAI için geçerli olmaması durumunda kazanır.
Bu nüansı gündeme getiriyorum çünkü AI riskleri yelpazesinde (kapsamlı değil), içerik sahiplerinin haklarından artan sahtekarlığa, işlerin otomatikleştirilmesine ve AGI'ye / insanlığın yok edilmesine kadar - yakın vadede en acil sorun içerik sahiplerinin haklarıdır . dava telaşı ve içerik platformları üzerindeki etki (örn. StackOverflow hikayesi ) bunu kanıtlıyor.
FTC gibi düzenleyiciler, gerçekten uzun vadeli sorunlar üzerinde düşünebilir ve bu riskleri ele almak için varsayımsal/yaratıcı yollar bulabilirken, onların gerçek kısa vadeli potansiyelleri, 5-10 yıl içinde bizi etkileyecek risklerin üstesinden gelebilmekte yatmaktadır. ufuk. Telif hakkı ihlali gibi.
Bu da bizi FTC'nin bu konuda ne yaptığına getiriyor.
Temmuz ortasında FTC, OpenAI'yi araştırdığını duyurdu. Bunu ilginç (ve sinir bozucu) kılan şey , FTC'nin bunları .
ChatGPT'nin yapımcısı, şirketin kişisel itibarı ve verileri riske atarak herhangi bir tüketici koruma yasasını ihlal edip etmediğini değerlendirmek üzere araştırılıyor.
Mantıklı değil mi? Yalnız değilsin. Bunun nasıl ortaya çıktığına dair biraz daha arka plan ortaya koyalım.
FTC'nin AI düzenlemesine ilişkin en sesli duruşu Nisan ayında ortaya çıktı: "Kitaplardaki yasalarda AI muafiyeti yoktur ve FTC, adil olmayan veya aldatıcı uygulamalarla veya adil olmayan rekabet yöntemleriyle mücadele etmek için yasayı güçlü bir şekilde uygulayacaktır."
Ardından iftirayla ilgili birkaç sorun geldi: Radyo sunucusu Mark Walters , ChatGPT'nin kendisini kar amacı gütmeyen bir kuruluşu dolandırmakla suçlaması ve bir hukuk profesörünün ChatGPT tarafından haksız yere cinsel tacizle suçlanmasının ardından OpenAI'ye dava açtı.
Bu senaryoların her ikisi de ilgili insanlar için berbat ve ben bununla empati kuruyorum. Ancak dil modellerinin (GPT gibi) ve bunların üzerine inşa edilen ürünlerin (ChatGPT gibi) “halüsinasyon” yarattığı ve çoğu zaman hatalı olduğu bilinen bir gerçektir.
FTC'nin soruşturmaya ilişkin önermesinin ilk yarısı şu : ChatGPT halüsinasyon görüyor ve dolayısıyla itibara zarar veriyor.
Hararetli bir Kongre duruşmasında, bir temsilci (haklı olarak) FTC'ye neden genellikle eyalet yasalarıyla ele alınan hakaret ve iftira peşinde olduklarını sordu . FTC Başkanı Lina Khan karmaşık bir argüman sunuyor:
Khan, iftira ve iftiranın FTC yaptırımlarının odak noktası olmadığını, ancak insanların özel bilgilerinin AI eğitiminde kötüye kullanılmasının FTC Yasası uyarınca bir tür dolandırıcılık veya aldatma olabileceğini söyledi.
“'İnsanlarda ciddi bir yaralanma var mı?' konusuna odaklandık. Yaralanma her türlü şeye benzeyebilir" dedi Khan.
Tartışmanın tamamını özetlemek gerekirse FTC , ChatGPT'nin halüsinasyonunun yanlış bilgi (iftira dahil) ürettiğini ve bunun da bir tür tüketici aldatmacası olabileceğini söylüyor.
Ek olarak, hassas kullanıcı özel bilgileri kullanılmış/sızdırılmış olabilir (OpenAI'nin hızlı bir şekilde düzelttiği bir hataya dayanarak).
Soruşturmanın bir parçası olarak FTC, OpenAI'den modellerinin nasıl eğitildiğine ilişkin ayrıntılardan hangi veri kaynaklarını kullandıklarına, ürünlerini müşterilere nasıl konumlandırdıklarına ve model sürümlerinin duraklatıldığı durumlara kadar OpenAI'den uzun bir liste istedi. belirlenen risklerden
Soru şu: FTC'nin, özellikle mevcut yasal manzara göz önüne alındığında, muhtemelen en büyük yapay zeka şirketlerinden biri olacağını düzenlemesi için en iyi yaklaşım bu mudur?
FTC'nin OpenAI stratejisini eleştirmek için bugün faaliyet gösterdiğimiz yasal ortamı anlamak faydalı olacaktır. Çok fazla ayrıntıya girmeyeceğiz, ancak anti-tröstün tarihçesini örnek olarak vererek bunu kısaca yapalım:
Bundan çıkarılacak sonuç şu; davaların ağırlıklı olarak "yasanın ruhuna" değil "yasanın lafzına" göre görüldüğü bir ortamda bugün faaliyet göstermeye devam ediyoruz. Bu, ABD Yüksek Mahkemesinin bugünkü yapısıyla birlikte, yasanın oldukça muhafazakar yorumlanmasına yol açtı.
Bunun FTC için anlamı, bu ortamın gerçekliğini benimsemek ve davaları kazanmanın bir yolunu bulmaktır . FTC ve DOJ'un (haklı olarak) çalışma modeli, bir avuç büyük davanın peşine düşmek ve sert yaptırımlar uygulayarak şirketlerin uzun kuyruğunun yasaları çiğnemeden önce iki kez düşünmesini sağlamaktır.
Bunu gerçekleştirmek için FTC'nin birkaç konuda büyük başarı elde etmesi ve mevcut yasal çerçevenin kısıtlamaları dahilinde bir kazanma stratejisine ihtiyacı var.
FTC, Big Tech'e karşı bir dizi kayıp yaşadı ve ben bu kayıpların hepsinin, bu şirketleri ele geçirmeye yönelik başarısız "büyük teknoloji olan her şeyden nefret ediyoruz", neşter değil çekiç stratejisine atfedilebileceğini iddia ediyorum.
Örneğin FTC, 69 milyar dolarlık Microsoft Activision satın alımını durdurmak için kaba kuvvet yaklaşımını benimsedi ve kaybetti (oldukça kötü diyebilirim). FTC, Microsoft'un Activision'ı satın almasının oyun pazarındaki rekabeti ortadan kaldıracağını savundu.
Yargıç, FTC'nin tüm iddialarını çürüten oldukça açık sözlü bir karar yazdı; işte yargıcın yorumlarından biri:
Microsoft'un Call of Duty'yi Xbox konsollarına özel kılmama yönündeki beyanıyla çelişen herhangi bir dahili belge, e-posta veya sohbet bulunmamaktadır. Yaklaşık 1 milyon belgenin ve 30 ifadenin üretilmesi de dahil olmak üzere, FTC idari soruşturmasında kapsamlı keşiflerin tamamlanmasına rağmen, FTC, Microsoft'un Call of Duty'yi PlayStation'da (ve Nintendo Switch'te) kullanılabilir hale getirme konusundaki kamuya açıklanmış taahhüdüyle çelişen tek bir belge tespit etmedi. ).
Bir başka kaba kuvvet vakası da FTC'nin Meta'nın Within'deki bir VR şirketini satın almasını engelleme girişimiydi ve kaybettiler . Neden bunun peşine düştüler? Belirli bir pazar büyümeden önce satın almaları engelleme isteği olup olmadığını görmek için durumu denemek istediler ve mevcut yasal manzara göz önüne alındığında, şaşırtıcı olmayan bir şekilde reddedildi.
FTC'nin OpenAI araştırmasındaki sorun da benzer:
Onlar (benim görüşüme göre) oldukça önemsiz bir meselenin ve dil modellerinin bilinen bir sınırlamasının, yani halüsinasyonların peşindeler; bunun yerine Telif Hakkı gibi 5-10 yıllık ufukta önemli olan gerçek yapay zeka sorunlarına odaklanmaları gerekiyor.
Mevcut hukuki ortamda çok sayıda “yaratıcı” hukuki yaklaşımın ortaya atılmasına rağmen, başka bir yaratıcı argüman denemeye çalışıyorlar: halüsinasyon → iftira → tüketiciyi aldatma.
Eylemlerinin cömert yorumu, "Yapay zeka mevcut yasalardan muaf değildir" duruşları için bir emsal oluşturmak istedikleri ve bu çılgın kaz kovalamacasının onlara OpenAI'den kendileri tarafından bildirilen büyük miktarda veri kazandırdığı yönündedir (FTC, 20 sayfa yayınlıyor). diye sorar ).
Bununla birlikte, sürekli olarak kaba kuvvet/büyük teknoloji içeren herhangi bir şeyin rekabetçi olmayan yaklaşımını takip etme ve bunları mahkemelerde defalarca reddedilen yaratıcı argümanlarla birleştirme konusundaki geçmiş performansları göz önüne alındığında, FTC'nin bu davada şüpheden faydalanmadığını düşünüyorum.
Kesinlikle OpenAI'nin düzenlenmesi gerektiğini düşünüyorum. Yüksek Lisans'ları halüsinasyon gördüğü için değil (tabii ki öyle), yaratıcıların içeriğini izinsiz olarak bariz bir şekilde kullandıkları için. Geçmişi değiştireceği için değil, içerik sahiplerine, telif haklarının açıkça ihlal edilemeyeceği sağlıklı bir gelecek kurmalarına yardımcı olacağı için.
Ancak FTC, neşter değil çekiç yaklaşımıyla yanlış adımlarını tekrarlıyor. Büyük teknolojiye karşı neşter yaklaşımıyla elde edilen başarıların açık bir örneği var; bunlardan en dikkate değer olanı Birleşik Krallık Rekabet ve Piyasalar Otoritesi'dir.
Google'a karşı kazandıkları iki büyük dava, belirli rekabet karşıtı mekanizmalara odaklandı: Google'ın AdTech yığınında kendi ürününe ayrıcalıklı muamele sunmasının durdurulması ve diğer ödeme sağlayıcılarının uygulama içi ödemeler yapmasına izin verilmesi.
FTC mevcut yoluna devam ederse, kayıp serisi teknoloji şirketlerini mahkemede kazanabileceklerini bildikleri için istedikleri her şeyi yapmaya devam etmeleri konusunda cesaretlendirecek. Artık FTC'nin başarısızlıkları üzerine düşünmesinin, diğer düzenleyicilerin başarılarından ders alması ve rotasını düzeltmesinin zamanı geldi.
🚀 Bu yazıyı beğendiyseniz haftalık bültenime abone olmayı düşünün. Her hafta güncel bir teknoloji konusu/ürün stratejisi hakkında 10 dakikalık okuma şeklinde derinlemesine bir analiz yayınlıyorum.
En iyisi Viggy.
Burada da yayınlandı