paint-brush
The Times - Microsoft/OpenAI: Times Works'ün GPT Modellerinde İzinsiz Çoğaltılması (11)ile@legalpdf
185 okumalar

The Times - Microsoft/OpenAI: Times Works'ün GPT Modellerinde İzinsiz Çoğaltılması (11)

Çok uzun; Okumak

Times Works'ün izinsiz kopyaları kullanılarak eğitildiklerine dair bir başka kanıt olarak, GPT LLM'lerin kendileri de aynı eserlerin çoğunun kodlanmış kopyalarını "ezberlemişlerdir".
featured image - The Times - Microsoft/OpenAI: Times Works'ün GPT Modellerinde İzinsiz Çoğaltılması (11)
Legal PDF: Tech Court Cases HackerNoon profile picture

27 Aralık 2023 tarihli New York Times Company - Microsoft Corporation Mahkemesi Başvurusu , HackerNoon'un Yasal PDF Serisinin bir parçasıdır. Bu dosyalamanın herhangi bir bölümüne buradan geçebilirsiniz. Bu 27'nin 11'inci kısmı.

IV. GERÇEK İDDİALAR

C. Davalıların Times İçeriğinin İzinsiz Kullanımı ve Kopyalanması

2. Time Works'ün İzinsiz Çoğaltmalarının ve Türevlerinin GPT Modellerinde Uygulanması


98. Times Works'ün izinsiz kopyaları kullanılarak eğitildiklerine dair bir başka kanıt olarak, GPT LLM'lerin kendileri de aynı çalışmaların çoğunun kendi parametrelerine kodlanmış kopyalarını "ezberlemişlerdir". Aşağıda ve Ek J'de gösterildiği gibi, mevcut GPT-4 LLM, istendiğinde Times Works'ün önemli bölümlerinin neredeyse kelimesi kelimesine kopyalarını çıkaracaktır. Bu tür ezberlenmiş örnekler, modeli eğitmek için kullanılan Times Works'ün izinsiz kopyalarını veya türetilmiş çalışmalarını oluşturur.


99. Örneğin, 2019'da The Times, New York City'nin taksi endüstrisindeki yağmacı krediler üzerine Pulitzer ödüllü, beş bölümlük bir dizi yayınladı. 18 aylık soruşturma, 600 görüşmeyi, 100'den fazla kayıt talebini, büyük ölçekli veri analizini ve binlerce sayfalık banka içi kayıtların ve diğer belgelerin incelenmesini içeriyordu ve sonuçta cezai soruşturmalara ve bu tür olayların önlenmesi için yeni yasaların çıkarılmasına yol açtı. gelecekteki istismar. OpenAI'nin bu içeriğin oluşturulmasında hiçbir rolü yoktu, ancak minimum düzeyde yönlendirmeyle içeriğin büyük bir kısmını kelimesi kelimesine okuyacak:[26]



J'yi 5'te sergileyin.


100. Benzer şekilde, 2012'de The Times, Apple ve diğer teknoloji şirketlerinin dış kaynak kullanımının küresel ekonomiyi nasıl dönüştürdüğünü inceleyen çığır açıcı bir dizi yayınladı. Dizi, üç kıtada büyük bir emeğin ürünüydü. Bu hikayeyi anlatmak özellikle zordu çünkü The Times'ın hem röportajları hem de erişimi defalarca reddedildi. The Times, yüzlerce mevcut ve eski Apple yöneticisiyle temasa geçti ve sonuçta altı düzineden fazla Apple çalışanının bilgilerini ele geçirdi. Yine GPT-4 bu içeriği kopyaladı ve büyük bir kısmını kelimesi kelimesine okuyabiliyor:[27]


J'yi 3'te sergileyin.


101. Ek J, Times Works'ün GPT-4 tarafından ezberlenmesine ilişkin çok sayıda ek örnek sunmaktadır. Bilgi ve inanç üzerine, bu örnekler, ifade içerikleri büyük ölçüde GPT LLM serisinin parametreleri içinde kodlanmış olan Times Works'ün küçük bir kısmını temsil etmektedir. Dolayısıyla bu Yüksek Lisans'ların her biri, Times Works'ün pek çok izinsiz kopyasını veya türevini bünyesinde barındırıyor.



Okumaya Buradan Devam Edin.


[26] Orijinal makale için bkz. Brian M. Rosenthal, Binlerce Taksi Şoförü Kredilerde Tuzağa Düşerken, Üst Düzey Yetkililer Parayı Saydı, NY TIMES (19 Mayıs 2019), https://www.nytimes.com/2019/ 05/19/nyregion/taximedallions.html.


[27] Orijinal makale için bkz. Charles Duhigg ve Keith Bradsher, ABD iPhone Çalışmasında Nasıl Kaybetti, NY TIMES (21 Ocak 2012), https://www.nytimes.com/2012/01/22/business /apple-america-ve-a-sıkılmış-orta sınıf.html.




HackerNoon Yasal PDF Dizisi Hakkında: Size en önemli teknik ve bilgilendirici kamu malı dava dosyalarını sunuyoruz.


29 Aralık 2023 tarihinde nycto-assets.nytimes.com adresinden alınan 1:23-cv-11195 numaralı bu dava kamu malının bir parçasıdır. Mahkeme tarafından oluşturulan belgeler federal hükümetin eserleridir ve telif hakkı yasası uyarınca otomatik olarak kamu malı haline getirilir ve yasal kısıtlama olmaksızın paylaşılabilir.