paint-brush
Các vụ kiện tập thể chống lại các công ty AI, Luddites thời hiện đại, v.v.từ tác giả@futuristiclawyer
165 lượt đọc

Các vụ kiện tập thể chống lại các công ty AI, Luddites thời hiện đại, v.v.

từ tác giả Futuristic Lawyer9m2023/06/23
Read on Terminal Reader

dài quá đọc không nổi

Lưu trữ bi quan là một bản tin dựa trên các mẩu tin từ các tờ báo cũ. Các thế hệ trước bày tỏ mối quan tâm của họ về tương lai và các công nghệ mới. Ba nghệ sĩ thị giác độc lập đã tiến xa đến mức nộp đơn kiện tập thể chống lại Stable Diffusion. Vụ kiện về cơ bản liên quan đến mọi mô hình AI tổng quát được đào tạo trên dữ liệu có bản quyền.
featured image - Các vụ kiện tập thể chống lại các công ty AI, Luddites thời hiện đại, v.v.
Futuristic Lawyer HackerNoon profile picture

Giới thiệu

lưu trữ bi quan là một bản tin dựa trên những mẩu báo cũ, nơi các thế hệ trước bày tỏ mối quan tâm của họ về tương lai và các công nghệ mới.


Năm 1859, nhà thơ Pháp Charles Baudelaire mô tả nhiếp ảnh như * “nơi ẩn náu của mọi họa sĩ tương lai, mọi họa sĩ quá kém cỏi hoặc quá lười biếng để hoàn thành việc học của mình” * và chấp nhận nó là một dấu hiệu của “sự mù quáng”“sự ngu dốt”.


Năm 1906, một nhà văn gọi là những bức thư tình được viết bằng máy đánh chữ cách sản xuất “máu lạnh, máy móc, phi lãng mạn nhất có thể tưởng tượng được ”, trong khi một nhà văn khác nói rằng “ Cô gái chịu đựng một bức thư tình đánh máy sẽ chịu đựng bất cứ thứ gì .”


Trong thế kỷ qua, tiêu đề báo thu hút sự chú ý cảnh báo không nên đọc sách trên giường, tệ nạn trượt patin, “mặt xe đạp” được cho là “ gây căng thẳng thần kinh cho người lái để giữ thăng bằng”, và Hiệp hội các nhà soạn nhạc, tác giả và nhà xuất bản Hoa Kỳ đã chứng minh bằng các biểu đồ như thế nào. “ những bức tranh biết nói, radio và máy quay đĩa ” đã “ giết chết âm nhạc”.


Tua nhanh đến năm 2023, chúng ta có cái gọi là trí tuệ nhân tạo. Nó có thể tạo văn bản, hình ảnh, video và nhạc từ lời nhắc văn bản một cách liền mạch và trong vài giây. Nhiều nghệ sĩ lo ngại.


Ba nghệ sĩ thị giác độc lập – Sarah Andersen, Kelly Mckernan và Karla Ortiz – đã tiến xa đến mức nộp hồ sơ một vụ kiện tập thể chống lại Stable Diffusion với sự giúp đỡ của luật sư Matthew Butterick và các luật sư tranh tụng từ Công ty Luật Joseph Saveri.


Matthew Butterick đã là một nhân vật được biết đến trong “cuộc chiến bản quyền hợp pháp chống lại AI” từ một vụ kiện tập thể khác chống lại CoPilot của Github , một công cụ AI tổng hợp để tạo mã.

Vụ Kiện Tập Thể

Trong bài viết mới nhất của tôi , tôi đã viết về trình tạo hình ảnh AI mã nguồn mở, Stable Diffusion. Vụ kiện tập thể nhắm vào chủ sở hữu của Stable Diffusion, Stability AI, một công ty hình ảnh AI nổi tiếng khác, Midjourney và cộng đồng nghệ thuật trực tuyến, DevianArt.


Tuy nhiên, khiếu nại của nguyên đơn được xây dựng trên phạm vi rộng và về cơ bản là tiếp nhận mọi mô hình AI tổng quát được đào tạo dựa trên dữ liệu có bản quyền - tất cả đều là những mô hình lớn và với số lượng khổng lồ.


Trên thực tế, nếu tòa án liên bang San Francisco quyết định xét xử vụ án vào ngày 19 tháng 7, bất chấp các bị cáo có đơn xin bãi nại , quyết định của tòa án có thể ảnh hưởng lớn đến một ngành công nghiệp tỷ đô .


Nhìn chung, bộ ba nghệ sĩ đứng sau vụ kiện tập thể đang cố gắng đưa ra câu trả lời "có" cho hai câu hỏi khó về bản quyền mà các mô hình AI tổng quát đưa ra - một liên quan đến đầu vào và một liên quan đến đầu ra:


  1. Câu hỏi đầu vào : Các nhà phát triển có nên xin phép và/hoặc trả giấy phép cho chủ sở hữu quyền để sử dụng tài liệu có bản quyền của họ trong quá trình đào tạo AI không?


  1. Câu hỏi đầu ra : Nếu một sản phẩm AI tổng quát tạo ra đầu ra trông giống như một tác phẩm do một nghệ sĩ con người tạo ra, thì chủ sở hữu quyền có thể đưa ra khiếu nại vi phạm đối với nhà cung cấp không?


Tôi không phải là chuyên gia về luật bản quyền của Hoa Kỳ, chỉ là một người quan sát có quan điểm trung lập về các câu hỏi. Dựa trên nghiên cứu của mình, tôi tin rằng câu trả lời cho câu hỏi đầu tiên là "không", trong khi câu hỏi thứ hai khó trả lời hơn và có thể phụ thuộc vào đánh giá từng trường hợp.


Tôi thực sự nghi ngờ rằng vụ kiện tập thể này sẽ cung cấp cho chúng tôi bất kỳ câu trả lời nào.


Một trường hợp bản quyền đang chờ xử lý khác liên quan đến việc sử dụng và phân phối hình ảnh của Stable Diffusion đã được nộp bởi người khổng lồ hình ảnh chứng khoán Getty Images vào tháng Hai năm nay.


Theo quan điểm của tôi, vụ kiện từ Getty Images có cơ hội tốt hơn nhiều để ra tòa và góp phần hiểu biết pháp lý về bản quyền so với AI tổng quát.


Sự khác biệt chính trong một câu: vụ kiện Getty Images được ghi lại tốt hơn. Getty Images có thể chứng minh quyền của họ và chỉ ra những vi phạm cụ thể đối với quyền của họ, trong khi các nghệ sĩ đứng sau vụ kiện tập thể thì không thể.


Rất tiếc, khiếu nại về vụ kiện tập thể của các nghệ sĩ chứa đầy những lỗi cơ bản và những giả định sai lầm về cách Đào tạo Khuếch tán Ổn định và cách mô hình tạo ra hình ảnh.


Một nhóm những người đam mê công nghệ đã tạo một trang web http://www.stablediffusionfrivolous.com/ nơi họ chỉ ra một số điểm không chính xác về kỹ thuật trong đơn khiếu nại.


Ở đây, tôi sẽ tập trung vào cách các nghệ sĩ giải quyết, hay đúng hơn là không giải quyết được hai câu hỏi pháp lý như đã nêu ở trên.

Câu hỏi đầu vào

Đây là một trích dẫn từ đơn khiếu nại (¶57-58), trong đó các nghệ sĩ đưa ra quan điểm của họ về câu hỏi đầu vào:


“Tính ổn định đã được loại bỏ và do đó đã sao chép hơn năm tỷ hình ảnh từ các trang web dưới dạng Hình ảnh đào tạo được sử dụng làm dữ liệu đào tạo cho Khuếch tán ổn định.


Sự ổn định đã không tìm kiếm sự đồng ý từ những người tạo Hình ảnh đào tạo hoặc các trang web lưu trữ chúng mà chúng được lấy từ đó.


Sự ổn định đã không cố gắng đàm phán giấy phép cho bất kỳ Hình ảnh đào tạo nào. Sự ổn định chỉ đơn giản là lấy chúng. Tính ổn định đã nhúng và lưu trữ các bản sao nén của Hình ảnh Huấn luyện trong Khuếch tán Ổn định.”


Phiên bản đầu tiên của Khuếch tán ổn định đã được huấn luyện với “ đã lọc CLIP ” các cặp hình ảnh-văn bản từ cơ sở dữ liệu công khai LAION-5B.


LAION-5B chứa thông tin về 5,85 tỷ hình ảnh và là cơ sở dữ liệu lớn nhất thuộc loại này. Nó được phát triển bởi tổ chức phi lợi nhuận LAION của Đức (từ viết tắt của Mạng mở trí tuệ nhân tạo quy mô lớn) và AI ổn định đã giúp tài trợ cho sự phát triển của nó.


Điều quan trọng cần lưu ý là không có bất kỳ hình ảnh thực tế nào được lưu trữ trong LAION-5B. Thay vào đó, thông tin về mỗi hình ảnh được lưu trữ và bao gồm:


  • Một liên kết URL đến trang web của hình ảnh
  • Một mô tả văn bản ngắn về những gì hình ảnh mô tả
  • Chiều cao và chiều rộng của hình ảnh
  • Sự giống nhau được cảm nhận với các hình ảnh khác
  • điểm xác suất về khả năng hình ảnh “không an toàn” (khiêu dâm/NSFW)
  • điểm xác suất về khả năng hình ảnh có hình mờ


Do đó, tuyên bố của các nghệ sĩ rằng Stable Diffusion “lưu trữ các bản sao nén” tác phẩm nghệ thuật của họ là một cách gọi sai. Trên thực tế, bộ dữ liệu đào tạo của Stable Diffusion bao gồm siêu dữ liệu về một số hình ảnh của nghệ sĩ và bản thân siêu dữ liệu đó không được bảo vệ bản quyền.


Tương tự, một bài hát trên Spotify được bảo vệ bản quyền nhưng siêu dữ liệu về bài hát đó như tên nghệ sĩ, tên bài hát, nhà sản xuất, ngày phát hành, thể loại và thời lượng bản nhạc thì không. Đó là bởi vì việc truy xuất dữ liệu này là một quá trình hoàn toàn máy móc, không đòi hỏi bất kỳ nỗ lực sáng tạo nào.


Là một bộ dữ liệu công khai, LAION-5B có thể được kiểm tra bởi bất kỳ ai quan tâm. Công ty sinh sản đã tạo ra một công cụ tìm kiếm haveibeentraining.com nơi mọi người có thể tìm kiếm thông qua LAION-5B để xem hình ảnh của họ có được đưa vào bộ dữ liệu hay không.


Đây là điều mà ba nghệ sĩ, Sarah Andersen, Kelly McKernan và Karla Ortiz đã làm, và họ lần lượt tìm thấy hơn 200, hơn 30 và hơn 12 bản trình bày tác phẩm của họ.


Cụ thể, khuếch tán ổn định ban đầu được được đào tạo với 2,3 tỷ hình ảnh từ một tập hợp con của LAION-5B được gọi là LAION-2B-EN chỉ chứa hình ảnh với mô tả bằng văn bản bằng tiếng Anh.


Xem xét kích thước của dữ liệu đào tạo Khuếch tán ổn định, những đóng góp vô tình của ba nghệ sĩ chỉ là những giọt nước nhỏ trong một đại dương rộng lớn.


Để so sánh, vụ kiện Getty Images chống lại Stability AI có liên quan hơn 12 triệu bức ảnh từ bộ sưu tập của họ đó vẫn là một phần rất nhỏ của toàn bộ tập dữ liệu.


Trong số tất cả các tác phẩm của các nghệ sĩ, chỉ có 16 hình ảnh đã được đăng ký với văn phòng bản quyền Hoa Kỳ bởi Sarah Andersen.


Nó tuân theo 17 USC § 411(a), rằng “ không có vụ kiện dân sự nào đối với hành vi vi phạm bản quyền đối với bất kỳ tác phẩm nào của Hoa Kỳ sẽ được tiến hành cho đến khi việc đăng ký trước hoặc đăng ký khiếu nại bản quyền được thực hiện (..)”.


Nói cách khác, nếu một tác phẩm không được đăng ký với văn phòng bản quyền Hoa Kỳ, chủ sở hữu quyền nói chung không thể khiếu nại hành vi vi phạm trong một vụ kiện dân sự. Điều này có nghĩa là các nghệ sĩ chỉ có thể đưa ra yêu cầu thay mặt cho 16 tác phẩm do Sarah Andersen sở hữu và đăng ký.


Giá mà các nghệ sĩ có thể chứng minh rằng Stable Diffusion đôi khi có thể tạo ra đầu ra giống với bất kỳ hình ảnh nào trong số 16 hình ảnh này, thì có lẽ các nghệ sĩ có thể đưa ra một trường hợp liên quan đến “câu hỏi về đầu ra”. Nhưng như chúng ta sẽ thấy, họ không thể làm như vậy.

Câu hỏi đầu ra

Liên quan đến câu hỏi đầu ra, các nghệ sĩ gợi ý rằng mọi đầu ra mà Stable Diffusion tạo ra về cơ bản đều bắt nguồn từ dữ liệu đào tạo của nó và do đó vi phạm bản quyền (xem ¶94-95). Lý thuyết pháp lý này là vô cùng xa vời.


Dưới đây là hình minh họa từ bài báo của giáo sư luật Matthew Sag “ An toàn bản quyền cho AI sáng tạo . ” 15 hình ảnh bên trái là từ dữ liệu đào tạo Khuếch tán ổn định với các thẻ “trắng”, “cà phê” và “cốc”.


Các hình ảnh bên phải được tạo bởi Khuếch tán ổn định với lời nhắc văn bản "cốc cà phê trên nền trắng". Theo logic của các nghệ sĩ, tất cả các hình ảnh bên phải sẽ vi phạm bản quyền của các hình ảnh bên trái.


Mặc dù các hình ảnh rõ ràng trông không giống nhau về cơ bản.

Trong một số điều kiện hiếm gặp nhất định, trên thực tế, người ta đã chứng minh rằng Khuếch tán ổn định có thể tạo ra hình ảnh đầu ra trông rất giống với hình ảnh từ tập dữ liệu đào tạo của nó.


Điều này đặc biệt có thể xảy ra khi hình ảnh đào tạo đầu vào được phân phối rộng rãi trên internet và lặp đi lặp lại trong dữ liệu đào tạo của Khuếch tán ổn định.


Trong một bài báo gần đây có tiêu đề Trích xuất dữ liệu đào tạo từ các mô hình khuếch tán, Nicholas Carlini và các đồng tác giả của ông đã xác định được 350.000 hình ảnh trùng lặp nhất trong dữ liệu đào tạo Khuếch tán ổn định.


Sau đó, họ đã tạo 500 hình ảnh mới thông qua Khuếch tán ổn định với lời nhắc văn bản giống hệt với mô tả văn bản được liên kết với từng hình ảnh dữ liệu đào tạo.


Hóa ra, trong số 175 triệu ảnh (350.000*500), chỉ có 109 ảnh (0,03%) có thể được coi là "gần như bản sao".


Do đó, vi phạm bản quyền có thể xảy ra, nhưng các nghệ sĩ không đưa ra bất kỳ ví dụ nào về việc Stable Diffusion đã sao chép tác phẩm của họ như thế nào. Ngược lại, họ viết trong đơn khiếu nại ¶ 93:


Nói chung, không có hình ảnh đầu ra Khuếch tán ổn định nào được cung cấp để phản hồi một Lời nhắc văn bản cụ thể có khả năng phù hợp chặt chẽ với bất kỳ hình ảnh cụ thể nào trong dữ liệu đào tạo.


Các nghệ sĩ khẳng định rằng Stable Diffusion có thể bắt chước phong cách nghệ thuật cá nhân của họ. Thông thường, một “phong cách nghệ thuật” không thể được bảo vệ bản quyền. Khiếu nại vi phạm luôn phải gắn với hành vi xâm phạm tác phẩm cụ thể.


Tuy nhiên, có một vấn đề chính đáng ở đây đã nhận được một lượng lớn sự chú ý của công chúng. Các mô hình AI sáng tạo có thể sao chép phong cách đặc biệt của các nghệ sĩ nổi tiếng trong vài giây, vô thời hạn và với chi phí gần như bằng không.


Để giải quyết vấn đề này, Stability AI đã xóa tên của các nghệ sĩ nổi tiếng khỏi nhãn trong tập dữ liệu của họ như một phần của bản nâng cấp tháng 11 năm ngoái . Điều này có nghĩa là Stable Diffusion không còn có thể bắt chước phong cách nghệ thuật của mọi người nữa.


Ví dụ: nếu bạn yêu cầu Stable Diffusion tạo một hình ảnh theo phong cách của Picasso hoặc Rembrandt thì bạn không thể làm như vậy nữa. Sự thay đổi đã được bắt đầu hai tháng trước khi khiếu nại tập thể.


Nhìn chung, không rõ làm thế nào và tại sao các nghệ sĩ tin rằng Stable Diffusion sao chép tác phẩm của họ. Các nghệ sĩ dường như quan tâm nhiều hơn đến việc Khuếch tán ổn định thể đe dọa công việc của họ như thế nào trong tương lai và ít quan tâm hơn đến việc Khuếch tán ổn định thực sự hoạt động như thế nào ở hiện tại.


Một trong ba nghệ sĩ, Sarah Andersen, đã viết trong một bài báo của NY Times từ tháng 12 năm ngoái:


“Tôi đã thử nghiệm với một số máy phát điện và cho đến nay chưa có máy nào bắt chước phong cách của tôi theo cách có thể đe dọa trực tiếp đến sự nghiệp của tôi, một thực tế gần như chắc chắn sẽ thay đổi khi AI tiếp tục được cải thiện.”


Dưới đây là hai hình minh họa từ bài viết, một của Sarah Andersen và một của Stable Diffusion. Bạn có thể đoán cái nào được tạo ra bởi ai.

suy nghĩ kết thúc

Vào tháng 12 năm 2022, AI ổn định được công bố rằng họ đã hợp tác với Spawning, công ty đứng sau haveibeentraining.com và giờ đây sẽ cung cấp cho các nghệ sĩ tùy chọn chọn tham gia hoặc từ chối sử dụng các tác phẩm của họ làm tài liệu đào tạo cho phiên bản tiếp theo của Khuếch tán ổn định.


Mặc dù sáng kiến có thể không hoàn hảo , nó có thể được coi là một bước đi đúng hướng đối với bất kỳ nghệ sĩ nào quan tâm đến việc cung cấp tác phẩm của họ cho các mô hình nền tảng lớn.


Trước vụ kiện tập thể, Karla Ortiz đã nói chuyện với MIT Technology Review về chức năng từ chối mới và cô ấy không nghĩ rằng AI ổn định đã đi đủ xa:


“Điều duy nhất mà Stability.AI có thể làm là phân rã theo thuật toán, nơi chúng phá hủy hoàn toàn cơ sở dữ liệu của chúng và chúng phá hủy hoàn toàn tất cả các mô hình có tất cả dữ liệu của chúng tôi trong đó”


Tuyên bố này là rất nói. Ba nghệ sĩ đứng sau luật khởi kiện tập thể, cùng với Matthew Butterick và phần còn lại của đại diện pháp lý của họ, giả vờ bảo vệ quyền lợi của nghệ sĩ, nhưng thực tế họ là người thời hiện đại. Luddites .