Vụ kiện Công ty New York Times kiện Microsoft Corporation ra tòa ngày 27 tháng 12 năm 2023 là một phần trong Chuỗi PDF pháp lý của HackerNoon . Bạn có thể chuyển tới bất kỳ phần nào trong hồ sơ này tại đây . Đây là phần 8 của 27.
1. Mô hình kinh doanh dựa trên vi phạm bản quyền hàng loạt
55. OpenAI được thành lập vào tháng 12 năm 2015 với tư cách là một “công ty nghiên cứu trí tuệ nhân tạo phi lợi nhuận”. OpenAI bắt đầu với 1 tỷ USD tiền ban đầu từ những người sáng lập, một nhóm gồm một số doanh nhân, nhà đầu tư và công ty công nghệ giàu có nhất như Amazon Web Services và InfoSys. Nhóm này bao gồm Elon Musk, CEO của Tesla và X Corp. (trước đây gọi là Twitter); Reid Hoffman, người đồng sáng lập LinkedIn; Sam Altman, cựu chủ tịch của Y Combinator; và Greg Brockman, cựu Giám đốc Công nghệ của Stripe.
56. Mặc dù chấp nhận các khoản đầu tư rất lớn từ các công ty và cá nhân vô cùng giàu có khi mới thành lập, OpenAI ban đầu vẫn khẳng định rằng hoạt động nghiên cứu và công việc của họ sẽ hoàn toàn không bị thúc đẩy bởi lợi nhuận. Trong thông cáo báo chí ngày 11 tháng 12 năm 2015, Brockman và đồng sáng lập lya Sutskever (nay là Chủ tịch và Nhà khoa học trưởng của OpenAI) đã viết: “Mục tiêu của chúng tôi là phát triển trí tuệ kỹ thuật số theo cách có nhiều khả năng mang lại lợi ích nhất cho nhân loại nói chung”. , không bị ràng buộc bởi nhu cầu tạo ra lợi nhuận tài chính. Vì nghiên cứu của chúng tôi không có nghĩa vụ tài chính nên chúng tôi có thể tập trung tốt hơn vào tác động tích cực của con người.” Theo sứ mệnh đó, OpenAI đã hứa rằng công việc và tài sản trí tuệ của họ sẽ được mở và có sẵn cho công chúng, rằng “các nhà nghiên cứu của [r] sẽ được khuyến khích mạnh mẽ xuất bản tác phẩm của họ, cho dù dưới dạng bài báo, bài đăng trên blog hoặc mã” và rằng “bằng sáng chế (nếu có) của nó sẽ được chia sẻ với thế giới.”
57. Bất chấp những hứa hẹn ban đầu về lòng vị tha, OpenAI đã nhanh chóng trở thành một doanh nghiệp vì lợi nhuận trị giá hàng tỷ đô la, phần lớn dựa trên việc khai thác trái phép các tác phẩm có bản quyền của The Times và những người khác. Chỉ ba năm sau khi thành lập, OpenAI đã rũ bỏ tư cách phi lợi nhuận độc quyền. Nó đã tạo ra OpenAI LP vào tháng 3 năm 2019, một công ty vì lợi nhuận chuyên thực hiện phần lớn các hoạt động của OpenAI — bao gồm phát triển sản phẩm — và huy động vốn từ các nhà đầu tư đang tìm kiếm lợi nhuận. Cấu trúc công ty của OpenAI đã phát triển thành một mạng lưới phức tạp gồm các công ty nắm giữ, điều hành và vỏ bọc vì lợi nhuận quản lý các hoạt động hàng ngày của OpenAI và cấp cho các nhà đầu tư của OpenAI (nổi bật nhất là Microsoft) quyền và ảnh hưởng đối với các hoạt động của OpenAI, đồng thời huy động được hàng tỷ USD vốn từ các nhà đầu tư. Kết quả: OpenAI ngày nay là một doanh nghiệp thương mại có giá trị lên tới 90 tỷ USD, với doanh thu dự kiến là hơn 1 tỷ USD vào năm 2024.
58. Với việc chuyển sang trạng thái vì lợi nhuận, một thay đổi khác đã xảy ra: OpenAI cũng kết thúc
cam kết cởi mở. OpenAI đã phát hành hai phiên bản đầu tiên của mẫu GenAI hàng đầu của mình,
GPT-1 và GPT-2, trên cơ sở nguồn mở, lần lượt vào năm 2018 và 2019. Nhưng OpenAI đã thay đổi
khóa học vào năm 2020, bắt đầu bằng việc phát hành GPT-3 ngay sau OpenAI LP và các tổ chức vì lợi nhuận khác
Các thực thể OpenAI được thành lập và nắm quyền kiểm soát việc thiết kế và phát triển sản phẩm.
59. GPT-3.5 và GPT-4 đều mạnh hơn hai thế hệ trước, tuy nhiên Bị cáo đã hoàn toàn giữ bí mật về thiết kế và đào tạo của mình. Đối với các thế hệ trước, OpenAI có rất nhiều báo cáo chi tiết về nội dung của tập huấn luyện, thiết kế và phần cứng của LLM. Không như vậy đối với GPT-3.5 hoặc GPT-4. Ví dụ: đối với GPT-4, “báo cáo kỹ thuật” mà OpenAI phát hành cho biết: “báo cáo này không chứa thêm thông tin chi tiết nào về kiến trúc (bao gồm kích thước mô hình), phần cứng, tính toán đào tạo, xây dựng tập dữ liệu, phương pháp đào tạo hoặc tương tự.”[ 3]
60. Nhà khoa học trưởng Sutskever của OpenAI biện minh cho bí mật này vì lý do thương mại: “Ngoài kia có tính cạnh tranh…. Và có nhiều công ty muốn làm điều tương tự, vì vậy từ khía cạnh cạnh tranh, bạn có thể coi đây là sự trưởng thành của lĩnh vực này.”[4] Nhưng tác dụng của nó là che giấu danh tính của dữ liệu mà OpenAI đã sao chép để đào tạo phiên bản mới nhất của nó. mô hình từ các chủ bản quyền như The Times.
61. OpenAI đã trở thành một cái tên quen thuộc khi phát hành ChatGPT vào tháng 11 năm 2022. ChatGPT là một chatbot tạo văn bản, với những lời nhắc do người dùng tạo, có thể bắt chước các phản hồi bằng ngôn ngữ tự nhiên giống như con người. ChatGPT đã gây sốt ngay lập tức, tiếp cận một triệu người dùng trong vòng một tháng kể từ khi phát hành và thu hút hơn 100 triệu người dùng trong vòng ba tháng.
62. OpenAI, thông qua OpenAI OpCo LLC và dưới sự chỉ đạo của OpenAI Inc., OpenAI LP và các tổ chức OpenAI khác, cung cấp một bộ dịch vụ được cung cấp bởi LLM của nó, nhắm đến cả người tiêu dùng thông thường và doanh nghiệp. Phiên bản ChatGPT được cung cấp bởi GPT-3.5 có sẵn miễn phí cho người dùng. OpenAI cũng cung cấp một dịch vụ cao cấp, được cung cấp bởi “mẫu có khả năng nhất” GPT-4 của OpenAI, cho người tiêu dùng với giá 20 USD mỗi tháng. Các dịch vụ tập trung vào doanh nghiệp của OpenAI bao gồm các công cụ ChatGPT Enterprise và ChatGPT API được thiết kế để cho phép các nhà phát triển kết hợp ChatGPT vào các ứng dụng riêng biệt. OpenAI cũng cấp phép công nghệ của mình cho khách hàng doanh nghiệp với phí cấp phép.
63. Những dịch vụ thương mại này có giá trị vô cùng lớn đối với OpenAI. Hơn 80% công ty Fortune 500 đang sử dụng ChatGPT.[5] Theo các báo cáo gần đây, OpenAI đang tạo ra doanh thu 80 triệu USD mỗi tháng và đang trên đà vượt qua hơn 1 tỷ USD trong vòng 12 tháng tới.[6]
64. Thành công thương mại này phần lớn được xây dựng nhờ hành vi vi phạm bản quyền quy mô lớn của OpenAI. Một trong những tính năng trọng tâm thúc đẩy việc sử dụng và bán ChatGPT cũng như các sản phẩm liên quan của nó là khả năng tạo văn bản bằng ngôn ngữ tự nhiên theo nhiều phong cách khác nhau của LLM. Để đạt được kết quả này, OpenAI đã sao chép rất nhiều tác phẩm có bản quyền thuộc sở hữu của The Times trong quá trình “đào tạo” LLM.
65. Dựa trên thông tin và niềm tin, tất cả các Bị cáo OpenAI đều trực tiếp tham gia hoặc đã chỉ đạo, kiểm soát và thu lợi từ hành vi xâm phạm rộng rãi và khai thác thương mại Times Works của OpenAI. OpenAI Inc., cùng với Microsoft, đã kiểm soát và chỉ đạo việc sao chép, phân phối và sử dụng thương mại rộng rãi tài liệu của The Times do OpenAI LP và OpenAI Global LLC thực hiện, thông qua một loạt công ty mẹ và công ty vỏ bọc bao gồm OpenAI Holdings LLC, OpenAI GP LLC, và Công ty TNHH OAI. OpenAI LP và OpenAI Global LLC đã trực tiếp tham gia vào việc thiết kế, phát triển và thương mại hóa các sản phẩm dựa trên GPT của OpenAI và trực tiếp tham gia vào việc tái sản xuất, phân phối và sử dụng rộng rãi cho mục đích thương mại của Times Works. OpenAI LP và OpenAI Global LLC cũng kiểm soát và chỉ đạo OpenAI, LLC và OpenAI OpCo LLC, những công ty tham gia phân phối, bán và cấp phép cho các sản phẩm dựa trên GPT của OpenAI, từ đó kiếm tiền từ việc tái sản xuất, phân phối và sử dụng thương mại của Times Works.
66. Ít nhất kể từ năm 2019, Microsoft đã và đang tiếp tục tham gia mật thiết vào việc đào tạo, phát triển và thương mại hóa các sản phẩm GPT của OpenAI. Trong một cuộc phỏng vấn với Wall Street Journal tại Diễn đàn Kinh tế Thế giới 2023, Giám đốc điều hành Microsoft Satya Nadella nói rằng “Dòng mô hình ChatGPT và GPT… là thứ mà chúng tôi đã hợp tác sâu sắc với OpenAI trong nhiều năm”. Thông qua quan hệ đối tác này, Microsoft đã tham gia vào việc tạo và thương mại hóa GPT LLM cũng như các sản phẩm dựa trên chúng theo ít nhất hai cách.
67. Đầu tiên, Microsoft đã tạo và vận hành các hệ thống máy tính riêng biệt để thực hiện hành vi vi phạm bản quyền hàng loạt được nêu chi tiết ở đây. Các hệ thống này được sử dụng để tạo ra nhiều bản sao chép tài sản trí tuệ của The Times nhằm mục đích tạo ra các mô hình GPT khai thác và, trong nhiều trường hợp, giữ lại phần lớn biểu hiện có bản quyền có trong các tác phẩm đó.
68. Microsoft là nhà cung cấp điện toán đám mây duy nhất cho OpenAI. Microsoft và OpenAI đã hợp tác để thiết kế các hệ thống siêu máy tính được cung cấp bởi nền tảng máy tính đám mây Azure của Microsoft, được sử dụng để đào tạo tất cả các mô hình GPT của OpenAI sau GPT-1. Trong bài phát biểu quan trọng vào tháng 7 năm 2023 tại hội nghị Microsoft Inspire, ông Nadella cho biết: “Chúng tôi đã xây dựng cơ sở hạ tầng để đào tạo các mô hình của họ. Họ đang đổi mới các thuật toán và đào tạo những mô hình tiên phong này.”
69. Cơ sở hạ tầng đó không chỉ là các hệ thống máy tính có mục đích chung để OpenAI sử dụng khi thấy phù hợp. Microsoft đã thiết kế nó đặc biệt cho mục đích sử dụng về cơ bản toàn bộ Internet—được quản lý để cung cấp tính năng Times Works một cách không cân xứng—để đào tạo LLM có năng lực nhất trong lịch sử. Trong một cuộc phỏng vấn vào tháng 2 năm 2023, ông Nadella nói:
Nhưng bên dưới những gì OpenAI đưa ra dưới dạng mô hình lớn, hãy nhớ rằng,
công việc nặng nhọc đã được nhóm [Microsoft] Azure thực hiện để xây dựng
cơ sở hạ tầng máy tính. Bởi vì những khối lượng công việc này rất
khác với bất cứ điều gì có trước đó. Vì vậy chúng tôi cần phải
suy nghĩ lại hoàn toàn ngay cả trung tâm dữ liệu cho đến cơ sở hạ tầng
lần đầu tiên đã cho chúng tôi cơ hội xây dựng mô hình. Và bây giờ chúng tôi đang
chuyển các mô hình thành sản phẩm.[7]
70. Microsoft đã chế tạo siêu máy tính này “với sự cộng tác và dành riêng cho OpenAI” và “được thiết kế [nó] đặc biệt để đào tạo các mô hình AI của công ty đó”.[8] Ngay cả theo tiêu chuẩn siêu máy tính, nó vẫn phức tạp một cách bất thường. Theo Microsoft, nó hoạt động như “một hệ thống duy nhất với hơn 285.000 lõi CPU, 10.000 GPU và tốc độ kết nối mạng 400 gigabit mỗi giây cho mỗi máy chủ GPU”. Hệ thống này được xếp hạng trong năm hệ thống siêu máy tính mạnh nhất được công chúng biết đến trên thế giới.
71. Để đảm bảo hệ thống siêu máy tính phù hợp với nhu cầu của OpenAI, Microsoft cần thử nghiệm hệ thống một cách độc lập và phối hợp với các kỹ sư phần mềm OpenAI. Theo ông Nadella, đối với OpenAI: “Họ thực hiện các mô hình nền tảng và chúng tôi [Microsoft] thực hiện rất nhiều công việc xung quanh chúng, bao gồm cả công cụ xoay quanh AI có trách nhiệm và an toàn AI”. Dựa trên thông tin và niềm tin, “công cụ xoay quanh AI và sự an toàn của AI” như vậy liên quan đến việc tinh chỉnh và hiệu chỉnh các sản phẩm dựa trên GPT trước khi chúng được phát hành ra công chúng.[9]
72. Phối hợp với OpenAI, Microsoft cũng đã thương mại hóa công nghệ dựa trên GPT của OpenAI và kết hợp nó với chỉ mục tìm kiếm Bing của riêng mình. Vào tháng 2 năm 2023, Microsoft đã ra mắt Bing Chat, một tính năng chatbot AI tổng quát trên công cụ tìm kiếm được cung cấp bởi GPT-4. Vào tháng 5 năm 2023, Microsoft và OpenAI đã ra mắt “Duyệt bằng Bing”, một plugin cho ChatGPT cho phép ChatGPT truy cập nội dung mới nhất trên Internet thông qua công cụ tìm kiếm Microsoft Bing. Trò chuyện trên Bing và Duyệt bằng Bing kết hợp khả năng bắt chước biểu hiện của con người của GPT-4—bao gồm cả biểu hiện của The Times—với khả năng tạo các bản tóm tắt bằng ngôn ngữ tự nhiên của nội dung kết quả tìm kiếm, bao gồm cả các lượt truy cập trên Times Works, giúp loại bỏ nhu cầu truy cập các trang web riêng của The Times . Các kết quả tìm kiếm “tổng hợp” này nhằm mục đích trả lời trực tiếp các truy vấn của người dùng và có thể bao gồm các diễn giải mở rộng và trích dẫn trực tiếp của báo cáo của Times. Việc sao chép như vậy duy trì sự tương tác với các trang web và ứng dụng của Bị đơn thay vì giới thiệu người dùng đến The Times giống như cách liệt kê các kết quả tìm kiếm không phải trả tiền.
73. Trong một cuộc phỏng vấn gần đây, ông Nadella thừa nhận sự tham gia sâu sắc của Microsoft vào các hoạt động của OpenAI và do đó, vi phạm bản quyền của nó:
[W]e rất tự tin vào khả năng của chính mình. Chúng tôi có tất cả các quyền sở hữu trí tuệ và tất cả khả năng. Nếu OpenAI biến mất vào ngày mai, tôi thực sự không muốn bất kỳ khách hàng nào của chúng tôi phải lo lắng về điều đó, bởi vì chúng tôi có tất cả các quyền để tiếp tục đổi mới. Không chỉ để phục vụ sản phẩm, mà chúng tôi còn có thể tự mình đi và làm những gì chúng tôi đang làm trong mối quan hệ đối tác. Chúng tôi có con người, chúng tôi có máy tính, chúng tôi có dữ liệu, chúng tôi có mọi thứ.
74. Thông qua sự hợp tác của họ trong cả việc tạo ra và thương mại hóa các mô hình GPT, Bị cáo đã thu được lợi từ việc vi phạm bản quyền trên diện rộng, khai thác thương mại và chiếm dụng tài sản trí tuệ của The Times. Như ông Nadella gần đây đã nói, “[OpenAI] đặt cược vào chúng tôi, chúng tôi đặt cược vào họ”. Ông tiếp tục mô tả tác động của khoản đầu tư 13 tỷ USD của Microsoft:
Và điều đó mang lại cho chúng tôi những quyền quan trọng như tôi đã nói. Và còn chuyện này nữa, nó không phải là ngoài tầm tay, phải không? Chúng tôi đang ở trong đó. Chúng ta ở dưới họ, ở trên họ, ở xung quanh họ. Chúng tôi thực hiện tối ưu hóa hạt nhân, xây dựng công cụ, xây dựng cơ sở hạ tầng. Vì vậy, đó là lý do tại sao tôi nghĩ nhiều nhà phân tích công nghiệp đang nói, 'Ồ, đây thực sự là một dự án chung giữa Microsoft và OpenAI.' Thực tế là, như tôi đã nói, chúng tôi rất tự chủ trong tất cả những điều này.
Tiếp tục đọc ở đây .
[3] OPENAI, BÁO CÁO KỸ THUẬT GPT-4 (2023), https://cdn.openai.com/papers/gpt-4.pdf.
[4] James Vincent, Người đồng sáng lập OpenAI về Phương pháp tiếp cận nghiên cứu chia sẻ công khai trước đây của công ty: 'Chúng tôi đã sai', THE VERGE (15 tháng 3 năm 2023), https://www.theverge.com/2023/3/15 /23640180/openai-gpt-4-launch-closedresearch-ilya-sutskever-interview.
[5] OpenAI, Giới thiệu ChatGPT Enterprise, OPENAI (28 tháng 8 năm 2023), https://openai.com/blog/introducing-chatgpt-enterprise.
[6] Chris Morris, OpenAI được báo cáo là đạt gần 1 tỷ đô la doanh thu hàng năm, CÔNG TY NHANH CHÓNG (30 tháng 8 năm 2023), https://www.fastcompany.com/90946849/openai-chatgpt-reportedly-nears-1-billion-annual -việc bán hàng.
[7] Đầu tiên trên CNBC: Bản ghi của CNBC: Giám đốc điều hành Microsoft Satya Nadella nói chuyện với Jon Fortt của CNBC về
“Bữa trưa quyền lực” Hôm nay, CNBC (ngày 7 tháng 2 năm 2023), https://www.cnbc.com/2023/02/07/first-on-cnbc-cnbc-transcriptmicrosoft-ceo-satya-nadella-speaks-with -cnbcs-jon-fortt-on-power-lunch-today.html.
[8] Jennifer Langston, Microsoft công bố siêu máy tính mới, đưa ra tầm nhìn cho công việc AI trong tương lai, MICROSOFT (19 tháng 5 năm 2020), https://news.microsoft.com/source/features/ai/openai-azure-supercomputer/. 9 SÉBASTIEN BUBECK VÀ CỘNG ĐỒNG, TAY LẠI CỦA TRÍ TUỆ TỔNG HỢP NHÂN TẠO: THỬ NGHIỆM SỚM VỚI GPT-4 (2023), https://arxiv.org/pdf/2303.12712.pdf
Giới thiệu về Chuỗi PDF pháp lý của HackerNoon: Chúng tôi mang đến cho bạn hồ sơ vụ kiện tòa án phạm vi công cộng chuyên sâu và mang tính kỹ thuật quan trọng nhất.
Vụ án 1:23-cv-11195 này được truy xuất vào ngày 29 tháng 12 năm 2023, từ nycto-assets.nytimes.com là một phần của phạm vi công cộng. Các tài liệu do tòa án tạo ra là tác phẩm của chính phủ liên bang và theo luật bản quyền, sẽ tự động được đưa vào phạm vi công cộng và có thể được chia sẻ mà không bị hạn chế về mặt pháp lý.