Tại sao AI nguồn mở lại tốt cho nhà phát triển, Meta và thế giới

AI nguồn mở là con đường phía trước Tái xuất bản với sự cho phép của Meta. Trong những ngày đầu của điện toán hiệu năng cao, các công ty công nghệ lớn thời đó đều đầu tư rất nhiều vào việc phát triển các phiên bản Unix nguồn đóng của riêng họ. Vào thời điểm đó, thật khó để tưởng tượng rằng có bất kỳ phương pháp tiếp cận nào khác có thể phát triển được phần mềm tiên tiến như vậy. Tuy nhiên, cuối cùng, Linux nguồn mở đã trở nên phổ biến - ban đầu vì nó cho phép các nhà phát triển sửa đổi mã theo cách họ muốn và giá cả phải chăng hơn, và theo thời gian vì nó trở nên tiên tiến hơn, an toàn hơn và có hệ sinh thái rộng hơn hỗ trợ nhiều khả năng hơn bất kỳ Unix đóng nào. . Ngày nay, Linux là nền tảng tiêu chuẩn công nghiệp cho cả điện toán đám mây và hệ điều hành chạy hầu hết các thiết bị di động - và tất cả chúng ta đều được hưởng lợi từ các sản phẩm ưu việt nhờ nó. Tôi tin rằng AI sẽ phát triển theo cách tương tự. Ngày nay, một số công ty công nghệ đang phát triển các mô hình khép kín hàng đầu. Nhưng nguồn mở đang nhanh chóng thu hẹp khoảng cách. Năm ngoái, Llama 2 chỉ được so sánh với thế hệ mẫu xe đằng sau biên giới cũ. Năm nay, Llama 3 cạnh tranh với những mẫu xe cao cấp nhất và dẫn đầu ở một số lĩnh vực. Bắt đầu từ năm tới, chúng tôi kỳ vọng các mẫu xe Llama trong tương lai sẽ trở thành mẫu xe tiên tiến nhất trong ngành. Nhưng ngay cả trước đó, Llama đã dẫn đầu về tính cởi mở, khả năng sửa đổi và hiệu quả chi phí. Hôm nay, chúng tôi đang thực hiện các bước tiếp theo để AI nguồn mở trở thành tiêu chuẩn của ngành. Chúng tôi đang phát hành Llama 3.1 405B, mô hình AI nguồn mở cấp biên giới đầu tiên, cũng như các mô hình Llama 3.1 70B và 8B mới và được cải tiến. Ngoài việc có chi phí/hiệu suất tốt hơn đáng kể so với các mẫu đóng, thực tế là mẫu 405B mở sẽ khiến nó trở thành lựa chọn tốt nhất để tinh chỉnh và chắt lọc các mẫu nhỏ hơn. Ngoài việc phát hành những mô hình này, chúng tôi còn hợp tác với nhiều công ty để phát triển hệ sinh thái rộng lớn hơn. Amazon, Databricks và NVIDIA đang tung ra các bộ dịch vụ đầy đủ để hỗ trợ các nhà phát triển tinh chỉnh và chắt lọc các mô hình của riêng họ. Các nhà đổi mới như Groq đã xây dựng dịch vụ suy luận có độ trễ thấp, chi phí thấp cho tất cả các mô hình mới. Các mô hình sẽ có sẵn trên tất cả các đám mây lớn bao gồm AWS, Azure, Google, Oracle, v.v. Các công ty như Quy mô. AI, Dell, Deloitte và những công ty khác sẵn sàng giúp các doanh nghiệp áp dụng Llama và đào tạo các mô hình tùy chỉnh bằng dữ liệu của riêng họ. Khi cộng đồng phát triển và ngày càng có nhiều công ty phát triển các dịch vụ mới, chúng ta có thể cùng nhau biến Llama trở thành tiêu chuẩn của ngành và mang lại lợi ích của AI cho mọi người. Meta cam kết về AI nguồn mở. Tôi sẽ phác thảo lý do tại sao tôi tin rằng nguồn mở là nền tảng phát triển tốt nhất cho bạn, tại sao nguồn mở Llama lại tốt cho Meta và tại sao AI nguồn mở lại tốt cho thế giới và do đó là một nền tảng sẽ tồn tại lâu dài. Tại sao AI nguồn mở lại tốt cho nhà phát triển Khi nói chuyện với các nhà phát triển, CEO và quan chức chính phủ trên khắp thế giới, tôi thường nghe thấy một số chủ đề sau: Mỗi tổ chức đều có những nhu cầu khác nhau được đáp ứng tốt nhất bằng các mô hình có quy mô khác nhau được đào tạo hoặc tinh chỉnh với dữ liệu cụ thể của họ. Nhiệm vụ trên thiết bị và nhiệm vụ phân loại yêu cầu mô hình nhỏ, trong khi nhiệm vụ phức tạp hơn yêu cầu mô hình lớn hơn. Giờ đây, bạn sẽ có thể sử dụng các mô hình Llama tiên tiến nhất, tiếp tục đào tạo chúng bằng dữ liệu của riêng bạn và sau đó chắt lọc chúng thành mô hình có kích thước tối ưu mà không cần chúng tôi hoặc bất kỳ ai khác nhìn thấy dữ liệu của bạn. Chúng ta cần đào tạo, tinh chỉnh và chắt lọc các mô hình của riêng mình. Nhiều tổ chức không muốn phụ thuộc vào những mô hình mà họ không thể tự vận hành và kiểm soát. Họ không muốn các nhà cung cấp mô hình khép kín có thể thay đổi mô hình của họ, thay đổi điều khoản sử dụng hoặc thậm chí ngừng phục vụ họ hoàn toàn. Họ cũng không muốn bị khóa vào một đám mây duy nhất có độc quyền đối với một mô hình. Nguồn mở hỗ trợ một hệ sinh thái rộng lớn gồm các công ty có chuỗi công cụ tương thích mà bạn có thể di chuyển dễ dàng. Chúng ta cần kiểm soát vận mệnh của chính mình và không bị nhốt vào một nhà cung cấp đã đóng cửa. Nhiều tổ chức xử lý dữ liệu nhạy cảm mà họ cần bảo mật và không thể gửi tới các mô hình đóng qua API đám mây. Các tổ chức khác đơn giản là không tin tưởng giao dữ liệu của họ cho các nhà cung cấp mô hình khép kín. Nguồn mở giải quyết những vấn đề này bằng cách cho phép bạn chạy các mô hình ở bất cứ đâu bạn muốn. Người ta chấp nhận rộng rãi rằng phần mềm nguồn mở có xu hướng an toàn hơn vì nó được phát triển minh bạch hơn. Chúng ta cần bảo vệ dữ liệu của mình. Các nhà phát triển có thể chạy suy luận trên Llama 3.1 405B trên cơ sở hạ tầng của riêng họ với chi phí khoảng 50% khi sử dụng các mô hình đóng như GPT-4o, cho cả tác vụ suy luận ngoại tuyến và trực tiếp với người dùng. Chúng ta cần một mô hình hoạt động hiệu quả và giá cả phải chăng. Nhiều người nhận thấy rằng nguồn mở đang phát triển với tốc độ nhanh hơn các mô hình đóng và họ muốn xây dựng hệ thống của mình trên kiến trúc sẽ mang lại cho họ lợi thế lớn nhất về lâu dài. Chúng tôi muốn đầu tư vào hệ sinh thái sẽ trở thành tiêu chuẩn lâu dài. Tại sao AI nguồn mở lại tốt cho Meta Mô hình kinh doanh của Meta hướng tới việc xây dựng những trải nghiệm và dịch vụ tốt nhất cho mọi người. Để làm được điều này, chúng tôi phải đảm bảo rằng chúng tôi luôn có quyền truy cập vào công nghệ tốt nhất và chúng tôi không bị ràng buộc vào hệ sinh thái khép kín của đối thủ cạnh tranh, nơi họ có thể hạn chế những gì chúng tôi xây dựng. Một trong những kinh nghiệm hình thành của tôi là xây dựng các dịch vụ của chúng tôi bị ràng buộc bởi những gì Apple sẽ cho phép chúng tôi xây dựng trên nền tảng của họ. Giữa cách họ đánh thuế các nhà phát triển, các quy tắc tùy tiện mà họ áp dụng và tất cả những cải tiến sản phẩm mà họ chặn vận chuyển, rõ ràng là Meta và nhiều công ty khác sẽ được tự do xây dựng các dịch vụ tốt hơn nhiều cho mọi người nếu chúng tôi có thể xây dựng các phiên bản tốt nhất của sản phẩm của chúng tôi và đối thủ cạnh tranh không thể hạn chế những gì chúng tôi có thể xây dựng. Ở cấp độ triết học, đây là lý do chính khiến tôi tin tưởng mạnh mẽ vào việc xây dựng hệ sinh thái mở về AI và AR/VR cho thế hệ điện toán tiếp theo. Mọi người thường hỏi liệu tôi có lo lắng về việc từ bỏ lợi thế kỹ thuật bằng cách cung cấp nguồn mở cho Llama hay không, nhưng tôi nghĩ điều này đã bỏ lỡ bức tranh tổng thể vì một vài lý do: Đầu tiên, để đảm bảo rằng chúng ta có quyền truy cập vào công nghệ tốt nhất và không bị ràng buộc trong một hệ sinh thái khép kín về lâu dài, Llama cần phát triển thành một hệ sinh thái đầy đủ các công cụ, cải tiến hiệu quả, tối ưu hóa silicon và các tích hợp khác. Nếu chúng tôi là công ty duy nhất sử dụng Llama, hệ sinh thái này sẽ không phát triển và chúng tôi sẽ không khá hơn gì so với các biến thể đóng của Unix. Thứ hai, tôi kỳ vọng việc phát triển AI sẽ tiếp tục mang tính cạnh tranh cao, điều đó có nghĩa là việc cung cấp nguồn mở cho bất kỳ mô hình cụ thể nào sẽ không mang lại lợi thế lớn so với các mô hình tốt nhất tiếp theo tại thời điểm đó. Con đường để Llama trở thành tiêu chuẩn của ngành là phải luôn cạnh tranh, hiệu quả và cởi mở từ thế hệ này sang thế hệ khác. Thứ ba, điểm khác biệt chính giữa Meta và các nhà cung cấp mô hình đóng là việc bán quyền truy cập vào các mô hình AI không phải là mô hình kinh doanh của chúng tôi. Điều đó có nghĩa là việc phát hành công khai Llama không làm giảm doanh thu, tính bền vững hoặc khả năng đầu tư vào nghiên cứu của chúng tôi giống như đối với các nhà cung cấp đóng cửa. (Đây là một lý do khiến nhiều nhà cung cấp đóng liên tục vận động các chính phủ chống lại nguồn mở.) Cuối cùng, Meta có lịch sử lâu dài về các dự án nguồn mở và thành công. Chúng tôi đã tiết kiệm hàng tỷ đô la bằng cách phát hành các thiết kế máy chủ, mạng và trung tâm dữ liệu với Dự án Điện toán Mở và chuẩn hóa chuỗi cung ứng trên các thiết kế của chúng tôi. Chúng tôi được hưởng lợi từ những đổi mới của hệ sinh thái nhờ các công cụ hàng đầu về nguồn mở như PyTorch, React và nhiều công cụ khác. Cách tiếp cận này luôn có hiệu quả với chúng tôi khi chúng tôi gắn bó lâu dài. Tại sao AI nguồn mở lại tốt cho thế giới Tôi tin rằng nguồn mở là cần thiết cho một tương lai AI tích cực. AI có nhiều tiềm năng hơn bất kỳ công nghệ hiện đại nào khác để tăng năng suất, khả năng sáng tạo và chất lượng cuộc sống của con người - đồng thời thúc đẩy tăng trưởng kinh tế đồng thời mở ra những tiến bộ trong nghiên cứu y học và khoa học. Nguồn mở sẽ đảm bảo rằng nhiều người hơn trên thế giới có thể tiếp cận các lợi ích và cơ hội của AI, sức mạnh đó không tập trung vào tay một số ít công ty và công nghệ có thể được triển khai đồng đều và an toàn hơn trên toàn xã hội. Có một cuộc tranh luận đang diễn ra về tính an toàn của các mô hình AI nguồn mở và quan điểm của tôi là AI nguồn mở sẽ an toàn hơn các giải pháp thay thế. Tôi nghĩ các chính phủ sẽ kết luận rằng việc hỗ trợ nguồn mở là vì lợi ích của họ vì nó sẽ làm cho thế giới thịnh vượng hơn và an toàn hơn. Khuôn khổ hiểu biết về an toàn của tôi là chúng ta cần bảo vệ khỏi hai loại tổn hại: vô ý và cố ý. Tác hại không chủ ý là khi một hệ thống AI có thể gây ra tác hại ngay cả khi những người vận hành nó không có ý định làm như vậy. Ví dụ, các mô hình AI hiện đại có thể vô tình đưa ra những lời khuyên không tốt cho sức khỏe. Hoặc, trong các kịch bản tương lai hơn, một số lo lắng rằng các mô hình có thể vô tình tự sao chép hoặc siêu tối ưu hóa các mục tiêu gây bất lợi cho nhân loại. Cố ý gây hại là khi kẻ xấu sử dụng mô hình AI với mục đích gây hại. Điều đáng chú ý là tác hại vô ý bao gồm phần lớn mối quan tâm của mọi người xung quanh AI - từ mức độ ảnh hưởng của hệ thống AI đối với hàng tỷ người sẽ sử dụng chúng cho đến hầu hết các kịch bản khoa học viễn tưởng thực sự thảm khốc đối với nhân loại. Về mặt này, nguồn mở sẽ an toàn hơn đáng kể vì các hệ thống minh bạch hơn và có thể được xem xét kỹ lưỡng một cách rộng rãi. Trong lịch sử, phần mềm nguồn mở an toàn hơn vì lý do này. Tương tự, sử dụng Llama với các hệ thống an toàn như Llama Guard có thể sẽ an toàn và bảo mật hơn so với các mẫu xe đóng. Vì lý do này, hầu hết các cuộc thảo luận xung quanh vấn đề an toàn AI nguồn mở đều tập trung vào hành vi gây hại có chủ ý. Quy trình an toàn của chúng tôi bao gồm thử nghiệm nghiêm ngặt và lập nhóm đỏ để đánh giá xem liệu các mô hình của chúng tôi có khả năng gây hại đáng kể hay không, nhằm mục tiêu giảm thiểu rủi ro trước khi phát hành. Vì các mô hình là mở nên bất kỳ ai cũng có thể tự mình thử nghiệm. Chúng ta phải lưu ý rằng những mô hình này được đào tạo dựa trên thông tin đã có trên Internet. Vì vậy, điểm khởi đầu khi xem xét tác hại phải là liệu mô hình có thể tạo điều kiện cho nhiều tác hại hơn thông tin có thể nhanh chóng được truy xuất từ Google hoặc các kết quả tìm kiếm khác hay không. Khi lý luận về hành vi gây tổn hại có chủ ý, sẽ rất hữu ích khi phân biệt giữa những gì các chủ thể cá nhân hoặc quy mô nhỏ có thể làm và những gì các chủ thể quy mô lớn như các quốc gia có nguồn tài nguyên dồi dào có thể làm. Tại một thời điểm nào đó trong tương lai, từng kẻ xấu có thể sử dụng trí thông minh của các mô hình AI để tạo ra những tác hại hoàn toàn mới từ thông tin có sẵn trên internet. Tại thời điểm này, sự cân bằng quyền lực sẽ rất quan trọng đối với sự an toàn của AI. Tôi nghĩ sẽ tốt hơn nếu sống trong một thế giới nơi AI được triển khai rộng rãi để những tác nhân lớn hơn có thể kiểm tra sức mạnh của những tác nhân xấu nhỏ hơn. Đây là cách chúng tôi quản lý bảo mật trên mạng xã hội của mình – hệ thống AI mạnh mẽ hơn của chúng tôi xác định và ngăn chặn các mối đe dọa từ những tác nhân ít phức tạp hơn, những người thường sử dụng hệ thống AI quy mô nhỏ hơn. Nhìn rộng hơn, các tổ chức lớn hơn triển khai AI trên quy mô lớn sẽ thúc đẩy an ninh và ổn định trên toàn xã hội. Miễn là mọi người đều có quyền truy cập vào các thế hệ mô hình tương tự - được nguồn mở thúc đẩy - thì các chính phủ và tổ chức có nhiều tài nguyên điện toán hơn sẽ có thể kiểm tra các tác nhân xấu với ít điện toán hơn. Câu hỏi tiếp theo là Mỹ và các quốc gia dân chủ nên xử lý mối đe dọa từ các quốc gia có nguồn tài nguyên khổng lồ như Trung Quốc như thế nào. Lợi thế của Hoa Kỳ là sự đổi mới phi tập trung và cởi mở. Một số người cho rằng chúng ta phải đóng cửa các mô hình của mình để ngăn Trung Quốc tiếp cận, nhưng quan điểm của tôi là điều này sẽ không hiệu quả và chỉ gây bất lợi cho Mỹ và các đồng minh. Đối thủ của chúng ta rất giỏi trong hoạt động gián điệp, việc đánh cắp các mô hình vừa với ổ USB là tương đối dễ dàng và hầu hết các công ty công nghệ đều không hoạt động theo cách khiến điều này trở nên khó khăn hơn. Có vẻ như rất có thể một thế giới chỉ có các mô hình đóng dẫn đến việc một số ít công ty lớn cộng với các đối thủ địa chính trị của chúng ta có quyền tiếp cận các mô hình hàng đầu, trong khi các công ty khởi nghiệp, trường đại học và doanh nghiệp nhỏ bỏ lỡ cơ hội. Thêm vào đó, việc hạn chế sự đổi mới của Mỹ trong phạm vi phát triển khép kín sẽ làm tăng nguy cơ chúng ta không dẫn đầu được nữa. Thay vào đó, tôi nghĩ chiến lược tốt nhất của chúng tôi là xây dựng một hệ sinh thái mở mạnh mẽ và yêu cầu các công ty hàng đầu của chúng tôi hợp tác chặt chẽ với chính phủ và các đồng minh của chúng tôi để đảm bảo họ có thể tận dụng tốt nhất những tiến bộ mới nhất và đạt được lợi thế bền vững của người đi đầu trong thời gian dài. Khi bạn xem xét các cơ hội phía trước, hãy nhớ rằng hầu hết các công ty công nghệ và nghiên cứu khoa học hàng đầu hiện nay đều được xây dựng trên phần mềm nguồn mở. Thế hệ công ty và nghiên cứu tiếp theo sẽ sử dụng AI nguồn mở nếu chúng ta cùng nhau đầu tư vào nó. Điều đó bao gồm các công ty khởi nghiệp mới thành lập cũng như những người ở các trường đại học và các quốc gia có thể không có đủ nguồn lực để phát triển AI tiên tiến của riêng họ ngay từ đầu. Điểm mấu chốt là AI nguồn mở đại diện cho nỗ lực tốt nhất của thế giới trong việc khai thác công nghệ này nhằm tạo ra cơ hội kinh tế và an ninh lớn nhất cho mọi người. Hãy cùng nhau xây dựng điều này Với các mô hình Llama trước đây, Meta đã phát triển chúng cho chính chúng tôi và sau đó phát hành chúng, nhưng không tập trung nhiều vào việc xây dựng một hệ sinh thái rộng lớn hơn. Chúng tôi đang thực hiện một cách tiếp cận khác với phiên bản này. Chúng tôi đang xây dựng các nhóm nội bộ để cho phép nhiều nhà phát triển và đối tác sử dụng Llama nhất có thể, đồng thời chúng tôi đang tích cực xây dựng quan hệ đối tác để nhiều công ty hơn trong hệ sinh thái cũng có thể cung cấp chức năng độc đáo cho khách hàng của họ. Tôi tin rằng bản phát hành Llama 3.1 sẽ là một bước ngoặt trong ngành nơi hầu hết các nhà phát triển bắt đầu chủ yếu sử dụng nguồn mở và tôi hy vọng cách tiếp cận đó sẽ chỉ phát triển từ đây. Tôi hy vọng bạn sẽ tham gia cùng chúng tôi trên hành trình này để mang lại lợi ích của AI cho mọi người trên thế giới. Bạn có thể truy cập các mô hình ngay bây giờ tại . llama.meta.com 💪, MZ