paint-brush
Cuộc chiến bản quyền chống lại AI: AI đóng so với nguồn mởtừ tác giả@futuristiclawyer
1,191 lượt đọc
1,191 lượt đọc

Cuộc chiến bản quyền chống lại AI: AI đóng so với nguồn mở

từ tác giả Futuristic Lawyer6m2023/06/12
Read on Terminal Reader

dài quá đọc không nổi

Luật sư Chris Mammen có trụ sở tại Vương quốc Anh giải thích trong một cuộc phỏng vấn gần đây với Vice về âm nhạc do AI tạo ra, rằng luật này được áp dụng từ từ và phát triển theo phương pháp tương tự. “Một cái gì đó mới xuất hiện, và chúng tôi tìm ra nó tương tự như thế nào, và sau đó điều đó dần dần trở thành luật cố định”. Vấn đề chúng ta đang gặp phải hiện nay với AI tổng quát – các mô hình AI có thể tạo ra đầu ra sáng tạo như văn bản, hình ảnh, âm nhạc hoặc video – là khó khăn trong việc đưa ra các phép loại suy. Nói cách khác, liên kết AI tổng quát với thứ mà chúng ta đã biết và hiểu. Công nghệ cơ bản phức tạp đến mức để hiểu cách nó hoạt động ở cấp độ khái niệm và cách nó nên được điều chỉnh, đòi hỏi một số mở rộng tâm trí nghiêm túc.
featured image - Cuộc chiến bản quyền chống lại AI: AI đóng so với nguồn mở
Futuristic Lawyer HackerNoon profile picture
0-item
1-item

Luật sư Chris Mammen có trụ sở tại Vương quốc Anh giải thích trong một cuộc phỏng vấn gần đây với Vice về âm nhạc do AI tạo ra , rằng luật di chuyển chậm và phát triển bằng cách loại suy. “ Một cái gì đó mới xuất hiện, và chúng tôi tìm ra nó tương tự như thế nào, và sau đó điều đó dần trở thành luật cố định ”.

Vấn đề chúng ta đang gặp phải hiện nay với AI tổng quát – các mô hình AI có thể tạo ra đầu ra sáng tạo như văn bản, hình ảnh, âm nhạc hoặc video – là khó khăn trong việc đưa ra các phép loại suy. Nói cách khác, liên kết AI tổng quát với thứ mà chúng ta đã biết và hiểu. Công nghệ cơ bản phức tạp đến mức để hiểu cách nó hoạt động ở cấp độ khái niệm và cách nó nên được điều chỉnh, đòi hỏi một số mở rộng tâm trí nghiêm túc.

Cũng như mạng xã hội và internet, các mô hình AI như ChatGPT của OpenAI hoặc mô hình chuyển văn bản thành hình ảnh DALL-E 2 của chúng, rất dễ sử dụng. Tuy nhiên, rõ ràng là có rất nhiều thứ đang diễn ra bên trong mà chúng ta không hiểu chút nào. Khoảng cách giữa trải nghiệm người dùng và tất cả những thứ phức tạp, kỹ thuật bên dưới nó, là nơi mà những thứ tội phạm và phi đạo đức có thể không được chú ý.

Hiệu ứng hộp đen trong tiền điện tử

Chúng ta đã thấy rõ “hiệu ứng hộp đen” này trong thế giới tài chính, gần đây là trong lĩnh vực tiền điện tử. Rất ít người ủng hộ tiền điện tử, bao gồm cả tôi, có hiểu biết kỹ thuật sâu sắc về cách thức hoạt động của tiền điện tử và chúng tôi không biết cách thức hoạt động của các sàn giao dịch tập trung. Trong tài chính truyền thống, đây là nơi chúng ta thường dựa vào sự chứng minh và giám sát của chính phủ. Nhưng trong một ngành mới và phức tạp như tiền điện tử, hầu như không có. Việc áp dụng tương đối rộng rãi, kỹ thuật phức tạp, thiếu giám sát và lỗ hổng kiến thức giữa nhà phát triển và người dùng, đã tạo ra những điều kiện hoàn hảo cho tội phạm và bóc lột hàng loạt. Năm ngoái, các sàn giao dịch tiền điện tử đã sụp đổ hàng loạt, hơn 3 tỷ đô la đã bị đánh cắp khỏi các nền tảng DeFi vào năm 2022 và hàng trăm nghìn người đã rơi vào cảnh điêu đứng về tài chính.

Tất nhiên, ngành công nghiệp AI rất khác so với ngành công nghiệp tiền điện tử, nhưng các điều kiện phạm tội và bóc lột cũng giống nhau. Các mô hình AI được áp dụng rộng rãi, dễ sử dụng hơn tiền điện tử, phức tạp hơn về mặt kỹ thuật, không có nhiều sự giám sát và khoảng cách kiến thức giữa người dùng và nhà phát triển thậm chí còn rộng hơn so với tiền điện tử. May mắn thay, có rất nhiều chiến dịch nâng cao nhận thức về sự nguy hiểm và rủi ro của AI, trong đó các chiến dịch tương tự về tiền điện tử chìm trong ồn ào.

Vấn đề bản quyền

Việc sử dụng tài liệu có bản quyền trong các mô hình AI tổng quát là một lĩnh vực thách thức các luật và khuôn khổ hiện hành. Trong bài đăng của tôi từ tuần trước, tôi đã viết về cách giải thích của EU về các mô hình nền tảng . Tuần này tôi sẽ tập trung vào sự khác biệt giữa các mô hình AI mã nguồn đóng và mã nguồn mở và giới thiệu Stable Diffusion, một mô hình hình ảnh AI mã nguồn mở phổ biến đã bị kiện bản quyền vào đầu năm nay từ hai góc độ khác nhau. Tôi dự định xuất bản một bài đăng khác về các vụ kiện và tác động đối với luật bản quyền trong vài tuần tới.

Nguồn mở so với Nguồn đóng

Đào tạo các mô hình nền tảng là một công việc tốn kém về thời gian, tiền bạc và tài nguyên tính toán. Nhìn chung, chỉ những công ty BigTech có hầu bao rủng rỉnh mới đủ khả năng chi trả khoản đầu tư ban đầu. Tương tự như vậy, các công ty đứng sau các mô hình nền tảng thường quan tâm đến AI nguồn đóng. Chi phí phát triển và đào tạo trị giá hàng triệu đô la khó có thể bù đắp nếu các đối thủ cạnh tranh có thể tiếp cận tất cả các nguyên liệu và sử dụng nước sốt bí mật của họ.

Một ngoại lệ quan trọng là LLaMA của Meta mà Mark Zuckerberg và nhóm nghiên cứu AI của Meta đã quyết định công khai một cách gây tranh cãi . LLaMA là một mô hình ngôn ngữ lớn (LLM) được phát hành ở các kích cỡ khác nhau từ tham số 7B đến 65B. Ngay cả phiên bản có kích thước từ nhỏ đến trung bình, LLaMA-13B, cũng có thể hoạt động tốt hơn GPT-3 của OpenAI - mặc dù nhỏ hơn 10 lần. GPT-3 đã đột phá và dẫn đầu thị trường chỉ ba lần trước.

Nhà khoa học AI trưởng của Meta, Yann LeCun, nói rằng “nền tảng giành chiến thắng sẽ được mở”. Ông lập luận rằng tiến bộ trong AI sẽ nhanh hơn theo cách này và người tiêu dùng cũng như chính phủ sẽ từ chối chấp nhận AI trừ khi nó nằm ngoài tầm kiểm soát của các công ty như Google và Meta.

Lập luận ngược lại đối với AI nguồn mở (có nghĩa là cung cấp mã nguồn) là những kẻ xấu có thể sử dụng mã để xây dựng các ứng dụng bất chính, truyền bá thông tin sai lệch, lừa đảo, tội phạm mạng và nhiều nội dung xấu khác. Mark Zuckerberg gần đây đã nhận được một lá thư từ hai thượng nghị sĩ Hoa Kỳ chỉ trích quyết định cung cấp LLaMA cho công chúng. Các Thượng nghị sĩ đã kết luận trong bức thư, rằng việc Meta “ thiếu cân nhắc kỹ lưỡng, công khai về các phân nhánh của việc phổ biến rộng rãi có thể thấy trước của nó ” cuối cùng là một “ sự bất lợi cho công chúng.”

Lực kéo hướng tới nguồn mở

Ngày nay, chưa đầy ba tháng sau khi phát hành , một loạt các mô hình nguồn mở đã đứng trên vai của LLaMa. Ví dụ, Vicuna-13B là một chatbot mã nguồn mở được đào tạo bằng cách tinh chỉnh LLaMA dựa trên các cuộc hội thoại do người dùng chia sẻ được thu thập từ ShareGPT (một tiện ích mở rộng của Chrome cho phép người dùng chia sẻ các cuộc hội thoại của họ với ChatGPT). Theo đánh giá của GPT-4, Vicuna-13B đạt hơn 90% chất lượng so với ChatGPT của OpenAI và Bard của Google với chi phí đào tạo khoảng 300 USD!

Bất kể những lo ngại về cạnh tranh và an toàn, có một sức hút mạnh mẽ đối với AI nguồn mở. Các mô hình mới và cải tiến được phát hành thường xuyên. Trên Bảng xếp hạng LLM mở của HuggingFace , mô hình hoạt động tốt nhất hiện tại là Falcon 40B , gần đây đã truất ngôi LLaMA của Meta. Falcon 40B được phát triển bởi Viện Đổi mới Công nghệ của Abu Dhabi với sự giúp đỡ của Amazon .

Ban giám khảo vẫn chưa biết liệu sự phát triển nguồn mở có khả năng chi phối việc sử dụng AI tổng quát trong tương lai hay không. Trong một tài liệu nội bộ của Google bị rò rỉ do SemiAnalysis xuất bản, một kỹ sư cấp cao của Google đã lập luận rằng Google và OpenAI “không có lợi thế” và cuối cùng sẽ bị AI nguồn mở vượt mặt. Anh ấy viết rằng “ Các mô hình nguồn mở nhanh hơn, có thể tùy chỉnh nhiều hơn, riêng tư hơn và có nhiều khả năng hơn ”.

AI ổn định và khuếch tán ổn định

Một trong những công ty đi đầu trong AI mã nguồn mở là Stability AI . Công ty được thành lập bởi cựu quản lý quỹ phòng hộ Emad Mostaque. Theo trang web của mình, Stability AI kể từ khi ra mắt vào năm 2021 đã thu hút được một đội quân gồm hơn 140.000 nhà phát triển và bảy trung tâm nghiên cứu trên khắp thế giới. Cộng đồng nghiên cứu phát triển các mô hình AI cho các mục đích khác nhau, chẳng hạn như hình ảnh, ngôn ngữ, mã, âm thanh, video, nội dung 3D, thiết kế, công nghệ sinh học và nghiên cứu khoa học khác.

Sản phẩm Ổn định AI được biết đến nhiều nhất cho đến nay là mô hình hình ảnh Khuếch tán ổn định. Khuếch tán ổn định là một mô hình hình ảnh AI có thể tạo hoặc chỉnh sửa hình ảnh từ lời nhắc văn bản. Nó được phát hành vào tháng 8 năm 2022 , không lâu sau khi DALL-E 2 gây sốt trên internet của OpenAI được phát hành riêng cho 1 triệu người dùng trong danh sách chờ. Nhiều người trong cộng đồng AI coi Ổn định khuếch tán là một cột mốc mang tính cách mạng . Nó không chỉ phù hợp, hoặc thậm chí vượt quá khả năng của các mô hình chuyển văn bản thành hình ảnh hiện đại, lớn và khép kín như DALL-E 2 hoặc Imagen của Google mà nó còn là mã nguồn mở.

Theo giấy phép Stable Diffusions , bất kỳ ai cũng có thể sử dụng mô hình này để tạo các ứng dụng thương mại, nghiên cứu kiến trúc, xây dựng trên mô hình và sửa đổi thiết kế của mô hình trong phạm vi luật pháp, đạo đức và lẽ thường. Khác với các mô hình hình ảnh có nguồn đóng, Khuếch tán ổn định có thể được tải xuống và chạy cục bộ trên một PC chơi game trung bình. Đối với người dùng thông thường không có kỹ năng mã hóa, cũng có thể truy cập Stable Diffusion thông qua ứng dụng web DreamStudio hoặc ứng dụng web mã nguồn mở mới StableStudio .

Như một câu chuyện bên lề, Sự khuếch tán ổn định trên thực tế được phát triển bởi một nhóm các nhà nghiên cứu tại Ludwig-Maximilians-Universität ở Münich, trong khi Ổn định AI tài trợ tài nguyên máy tính để huấn luyện mô hình. Sự ổn định đã bị chỉ trích vì nhận quá nhiều tín nhiệm không đáng có vì Đại học ở Münich đã thực hiện tất cả những công việc nặng nhọc dẫn đến Sự khuếch tán ổn định. Trong một bài báo của Forbes xuất bản vào Chủ nhật tuần trước , người sáng lập Ổn định Nhà thờ Hồi giáo Emad được miêu tả là một kẻ phóng đại bệnh hoạn và có xu hướng nói dối. Giáo sư Tiến sĩ Björn Ommer, người đứng đầu nhóm nghiên cứu về Khuếch tán ổn định, nói với Forbes rằng ông hy vọng sẽ công bố công trình nghiên cứu trong phòng thí nghiệm của mình, nhưng toàn bộ khoa báo chí của trường đại học của ông đang trong kỳ nghỉ (những điều như vậy chỉ có thể xảy ra ở các trường đại học công lập).

Sự phổ biến ổn định & Cơn bão bản quyền

Tính mở của Stable Diffusion là một món quà dành cho các nhà nghiên cứu, cũng như cho các chính phủ, đối thủ cạnh tranh, cơ quan quản lý và những người ủng hộ bản quyền khát máu. Trong danh mục cuối cùng, chúng tôi tìm thấy Matthew Butterick và nhóm pháp lý của anh ấy, người đại diện cho ba nghệ sĩ độc lập trong một vụ kiện tập thể chống lại Stability AI, MidJourney và DeviantArt .

Theo luật sư Matthew Butterick: “ [Stable Diffusion] là một loại ký sinh trùng, nếu được phép sinh sôi nảy nở, sẽ gây ra tác hại không thể khắc phục được cho các nghệ sĩ, hiện tại và trong tương lai.”

Tôi cho rằng Butterick theo một nghĩa nào đó đã đúng về đặc điểm của anh ấy về Khuếch tán ổn định và các mô hình hình ảnh AI hiện đại. Họ loại bỏ sự sáng tạo ra khỏi tác phẩm gốc, kết hợp tất cả lại với nhau trên quy mô lớn và đe dọa sinh kế của những nghệ sĩ đã vô tình và vô tình giúp đào tạo người mẫu bằng những đóng góp vi mô.

Tuy nhiên, vụ kiện tập thể có quá nhiều điểm không chính xác về mặt pháp lý và kỹ thuật, sự hiểu lầm và thiếu sót đến mức tôi chỉ có thể tự hỏi liệu nhóm pháp lý có mất trí khi họ viết bản thảo đầu tiên của trát đòi hầu tòa hay không. Một giả thuyết khác là Butterick và đồng nghiệp đang cố tình xuyên tạc cách thức hoạt động của công nghệ để gây nhầm lẫn cho công chúng hoặc ban giám khảo. Khó nói.

Trong bài đăng tiếp theo của tôi, chúng ta sẽ xem xét kỹ hơn vụ kiện phù phiếm và giải thích lý do tại sao nó không gãi đúng chỗ ngứa về bản quyền.

Cũng được xuất bản ở đây .