paint-brush
The Times kiện Microsoft/OpenAI: Sao chép trái phép Times Works trong Mô hình GPT (11)by@legalpdf
174

The Times kiện Microsoft/OpenAI: Sao chép trái phép Times Works trong Mô hình GPT (11)

Legal PDF3m2024/01/02
Read on Terminal Reader

Là bằng chứng nữa về việc được đào tạo bằng cách sử dụng các bản sao trái phép của Times Works, bản thân GPT LLM đã “ghi nhớ” các bản sao của nhiều tác phẩm tương tự được mã hóa.
featured image - The Times kiện Microsoft/OpenAI: Sao chép trái phép Times Works trong Mô hình GPT (11)
Legal PDF HackerNoon profile picture

Vụ kiện Công ty New York Times kiện Microsoft Corporation ra tòa ngày 27 tháng 12 năm 2023 là một phần trong Chuỗi PDF pháp lý của HackerNoon . Bạn có thể chuyển tới bất kỳ phần nào trong hồ sơ này tại đây . Đây là phần 11 của 27.

IV. TUYỆT VỜI THỰC TẾ

C. Việc sử dụng và sao chép trái phép nội dung của Thời báo của Bị cáo

2. Hiện thân của việc sao chép trái phép và các sản phẩm phái sinh của tác phẩm Times trong mô hình GPT


98. Như một bằng chứng nữa về việc được đào tạo bằng cách sử dụng các bản sao trái phép của Times Works, bản thân GPT LLM đã “ghi nhớ” các bản sao của nhiều tác phẩm tương tự được mã hóa thành các tham số của chúng. Như được hiển thị bên dưới và trong Phụ lục J, GPT-4 LLM hiện tại sẽ xuất ra các bản sao gần như nguyên văn của các phần quan trọng của Times Works khi được nhắc làm như vậy. Các ví dụ được ghi nhớ như vậy tạo thành các bản sao trái phép hoặc tác phẩm phái sinh của Times Works được sử dụng để đào tạo mô hình.


99. Ví dụ, vào năm 2019, The Times đã xuất bản một loạt bài gồm 5 phần từng đoạt giải Pulitzer về việc cho vay nặng lãi trong ngành taxi của Thành phố New York. Cuộc điều tra kéo dài 18 tháng bao gồm 600 cuộc phỏng vấn, hơn 100 yêu cầu hồ sơ, phân tích dữ liệu quy mô lớn và xem xét hàng nghìn trang hồ sơ nội bộ ngân hàng cũng như các tài liệu khác, cuối cùng dẫn đến các cuộc điều tra hình sự và ban hành luật mới nhằm ngăn chặn các hành vi vi phạm pháp luật. lạm dụng trong tương lai. OpenAI không có vai trò gì trong việc tạo ra nội dung này, tuy nhiên với sự nhắc nhở tối thiểu, sẽ đọc thuộc lòng phần lớn nội dung đó nguyên văn:[26]



Triển lãm J lúc 5.


100. Tương tự, vào năm 2012, The Times đã xuất bản một loạt bài mang tính đột phá xem xét việc gia công phần mềm của Apple và các công ty công nghệ khác đã thay đổi nền kinh tế toàn cầu như thế nào. Bộ truyện là sản phẩm của nỗ lực to lớn trên khắp ba châu lục. Việc đưa tin về câu chuyện này đặc biệt khó khăn vì The Times liên tục bị từ chối cả phỏng vấn lẫn quyền truy cập. The Times đã liên hệ với hàng trăm giám đốc điều hành hiện tại và trước đây của Apple, và cuối cùng đã lấy được thông tin từ hơn sáu chục người trong nội bộ Apple. Một lần nữa, GPT-4 đã sao chép nội dung này và có thể đọc thuộc lòng phần lớn nguyên văn của nó:[27]


Triển lãm J lúc 3.


101. Phụ lục J cung cấp nhiều ví dụ bổ sung về khả năng ghi nhớ Times Works của GPT-4. Dựa trên thông tin và niềm tin, những ví dụ này đại diện cho một phần nhỏ của Times Works có nội dung biểu đạt về cơ bản đã được mã hóa trong các tham số của chuỗi LLM GPT. Do đó, mỗi LLM đó bao gồm nhiều bản sao hoặc dẫn xuất trái phép của Times Works.



Tiếp tục đọc ở đây .


[26] Để biết bài viết gốc, hãy xem Brian M. Rosenthal, Khi hàng ngàn tài xế taxi bị mắc kẹt trong các khoản vay, các quan chức hàng đầu đã đếm tiền, NY TIMES (19 tháng 5 năm 2019), https://www.nytimes.com/2019/ 19/05/nykhu vực/taximedallions.html.


[27] Để biết bài viết gốc, hãy xem Charles Duhigg & Keith Bradsher, How the US Lost Out on iPhone Work, NY TIMES (21 tháng 1 năm 2012), https://www.nytimes.com/2012/01/22/business /apple-america-and-a-squeezed-middleclass.html.




Giới thiệu về Chuỗi PDF pháp lý của HackerNoon: Chúng tôi mang đến cho bạn hồ sơ vụ kiện tòa án phạm vi công cộng chuyên sâu và mang tính kỹ thuật quan trọng nhất.


Vụ án 1:23-cv-11195 này được truy xuất vào ngày 29 tháng 12 năm 2023, từ nycto-assets.nytimes.com là một phần của phạm vi công cộng. Các tài liệu do tòa án tạo ra là tác phẩm của chính phủ liên bang và theo luật bản quyền, sẽ tự động được đưa vào phạm vi công cộng và có thể được chia sẻ mà không bị hạn chế về mặt pháp lý.