paint-brush
Почему ИИ с открытым исходным кодом хорош для разработчиков, мета и всего мирак@zuck
8,567 чтения
8,567 чтения

Почему ИИ с открытым исходным кодом хорош для разработчиков, мета и всего мира

к Mark Zuckerberg9m2024/07/29
Read on Terminal Reader

Слишком долго; Читать

Что касается прошлых моделей Llama, Meta разработала их для себя, а затем выпустила, но не уделяла особого внимания созданию более широкой экосистемы. В этом выпуске мы применяем другой подход. Мы создаем внутренние команды, чтобы позволить как можно большему количеству разработчиков и партнеров использовать Llama, и мы активно строим партнерские отношения, чтобы больше компаний в экосистеме также могли предлагать уникальные функции своим клиентам. Я считаю, что выпуск Llama 3.1 станет переломным моментом в отрасли, когда большинство разработчиков начнут в основном использовать открытый исходный код, и я ожидаю, что с этого момента этот подход будет только развиваться. Я надеюсь, что вы присоединитесь к нам в этом путешествии, чтобы донести преимущества ИИ до каждого человека в мире.
featured image - Почему ИИ с открытым исходным кодом хорош для разработчиков, мета и всего мира
Mark Zuckerberg HackerNoon profile picture
0-item
1-item

ИИ с открытым исходным кодом — это путь вперед. Переиздано с разрешения Meta.


На заре высокопроизводительных вычислений каждая из крупнейших технологических компаний того времени инвестировала значительные средства в разработку собственных версий Unix с закрытым исходным кодом. В то время было трудно представить, что какой-либо другой подход позволит разработать такое продвинутое программное обеспечение. Однако со временем Linux с открытым исходным кодом приобрел популярность – сначала потому, что он позволял разработчикам модифицировать его код по своему усмотрению и был более доступным, а со временем потому, что он стал более продвинутым, более безопасным и имел более широкую экосистему, поддерживающую больше возможностей, чем любой закрытый Unix. . Сегодня Linux является отраслевым стандартом как для облачных вычислений, так и для операционных систем, на которых работает большинство мобильных устройств, и благодаря этому мы все получаем выгоду от превосходных продуктов.


Я верю, что ИИ будет развиваться аналогичным образом. Сегодня несколько технологических компаний разрабатывают ведущие закрытые модели. Но открытый исходный код быстро сокращает этот разрыв. В прошлом году Llama 2 можно было сравнить только с моделями старшего поколения. В этом году Llama 3 конкурирует с самыми продвинутыми моделями и лидирует в некоторых областях. Мы ожидаем, что начиная со следующего года будущие модели Llama станут самыми передовыми в отрасли. Но даже до этого Llama уже лидирует по открытости, модифицируемости и экономической эффективности.


Сегодня мы делаем следующие шаги к тому, чтобы искусственный интеллект с открытым исходным кодом стал отраслевым стандартом. Мы выпускаем Llama 3.1 405B, первую модель искусственного интеллекта с открытым исходным кодом, а также новые и улучшенные модели Llama 3.1 70B и 8B. Помимо значительно лучшего соотношения цены и производительности по сравнению с закрытыми моделями, тот факт, что модель 405B является открытой, делает ее лучшим выбором для точной настройки и усовершенствования моделей меньшего размера.


Помимо выпуска этих моделей, мы работаем с рядом компаний над развитием более широкой экосистемы. Amazon, Databricks и NVIDIA запускают полный набор услуг для поддержки разработчиков в точной настройке и усовершенствовании своих собственных моделей. Такие новаторы, как Groq, создали недорогой и малозатратный логический вывод, обслуживающий все новые модели. Модели будут доступны во всех основных облаках, включая AWS, Azure, Google, Oracle и других. Такие компании, как Scale. AI, Dell, Deloitte и другие готовы помочь предприятиям внедрить Llama и обучить индивидуальные модели на собственных данных. По мере того, как сообщество растет и все больше компаний разрабатывают новые услуги, мы можем коллективно сделать Llama отраслевым стандартом и предоставить преимущества ИИ всем.


Meta стремится использовать ИИ с открытым исходным кодом. Я объясню, почему я считаю, что открытый исходный код — лучший стек разработки для вас, почему Llama с открытым исходным кодом хорош для Meta и почему ИИ с открытым исходным кодом хорош для мира и, следовательно, является платформой, которая будет существовать в долгосрочной перспективе.

Почему ИИ с открытым исходным кодом хорош для разработчиков

Когда я разговариваю с разработчиками, генеральными директорами и государственными чиновниками по всему миру, я обычно слышу несколько тем:


  • Нам необходимо обучать, настраивать и совершенствовать наши собственные модели. Каждая организация имеет разные потребности, которые лучше всего удовлетворить с помощью моделей разных размеров, которые обучены или точно настроены с учетом конкретных данных. Для задач на устройстве и задач классификации требуются небольшие модели, а для более сложных задач — модели большего размера. Теперь вы сможете взять самые совершенные модели Llama, продолжить их обучение на собственных данных, а затем преобразовать их до модели оптимального размера — без того, чтобы мы или кто-либо еще видел ваши данные.
  • Нам нужно самим управлять своей судьбой и не замыкаться на закрытом вендоре. Многие организации не хотят зависеть от моделей, которые они не могут запустить и контролировать самостоятельно. Они не хотят, чтобы поставщики закрытых моделей могли изменить свою модель, условия использования или даже полностью прекратить их обслуживание. Они также не хотят замыкаться в одном облаке, имеющем эксклюзивные права на модель. Открытый исходный код обеспечивает широкую экосистему компаний с совместимыми цепочками инструментов, между которыми вы можете легко перемещаться.
  • Нам необходимо защитить наши данные. Многие организации обрабатывают конфиденциальные данные, которые им необходимо защитить, и которые они не могут отправлять в закрытые модели через облачные API. Другие организации просто не доверяют поставщикам закрытых моделей свои данные. Открытый исходный код решает эти проблемы, позволяя запускать модели где угодно. Общепризнано, что программное обеспечение с открытым исходным кодом имеет тенденцию быть более безопасным, поскольку оно разрабатывается более прозрачно.
  • Нам нужна модель, которая будет эффективной и доступной в эксплуатации. Разработчики могут запускать логический вывод на Llama 3.1 405B на собственной инфраструктуре примерно за 50 % стоимости использования закрытых моделей, таких как GPT-4o, как для задач вывода, ориентированных на пользователя, так и для автономных задач.
  • Мы хотим инвестировать в экосистему, которая станет стандартом в долгосрочной перспективе. Многие люди видят, что открытый исходный код развивается быстрее, чем закрытые модели, и хотят строить свои системы на архитектуре, которая даст им наибольшее преимущество в долгосрочной перспективе.

Почему ИИ с открытым исходным кодом хорош для мета

Бизнес-модель Meta направлена на создание лучшего опыта и услуг для людей. Для этого мы должны гарантировать, что у нас всегда есть доступ к лучшим технологиям и что мы не замыкаемся в закрытой экосистеме конкурентов, где они могут ограничивать то, что мы создаем.


Одним из моих формирующих опытов было создание наших сервисов, ограниченное тем, что Apple позволит нам создавать на своих платформах. Учитывая то, как они облагают налогом разработчиков, произвольные правила, которые они применяют, и все инновации в продуктах, которые они блокируют для поставки, ясно, что Meta и многие другие компании получили бы свободу создавать гораздо более качественные услуги для людей, если бы мы могли создавать лучшие версии наши продукты и конкуренты не могли ограничить то, что мы могли создать. На философском уровне это основная причина, почему я так твердо верю в создание открытых экосистем в области искусственного интеллекта и дополненной и виртуальной реальности для следующего поколения вычислений.


Люди часто спрашивают, не боюсь ли я отказаться от технического преимущества из-за открытого исходного кода Llama, но я думаю, что это упускает из виду общую картину по нескольким причинам:


Во-первых, чтобы гарантировать, что у нас есть доступ к лучшим технологиям и мы не заперты в закрытой экосистеме в долгосрочной перспективе, Llama необходимо превратиться в полноценную экосистему инструментов, улучшений эффективности, оптимизации микросхем и других интеграций. Если бы мы были единственной компанией, использующей Llama, эта экосистема не развивалась бы, и наши дела были бы не лучше, чем у закрытых вариантов Unix.


Во-вторых, я ожидаю, что разработка ИИ по-прежнему будет очень конкурентоспособной, а это означает, что открытый исходный код любой конкретной модели не дает огромного преимущества перед следующими лучшими моделями на данный момент. Путь к тому, чтобы Llama стала отраслевым стандартом, — это быть последовательно конкурентоспособными, эффективными и открытыми из поколения в поколение.


В-третьих, ключевое различие между поставщиками мета- и закрытых моделей заключается в том, что продажа доступа к моделям ИИ не является нашей бизнес-моделью. Это означает, что открытый выпуск Llama не подрывает наши доходы, устойчивость или способность инвестировать в исследования, как это происходит с закрытыми поставщиками. (Это одна из причин, по которой несколько закрытых провайдеров последовательно лоббируют правительства против открытого исходного кода.)


Наконец, Meta имеет долгую историю успешных проектов с открытым исходным кодом. Мы сэкономили миллиарды долларов, выпустив проекты наших серверов, сетей и центров обработки данных с помощью Open Compute Project и обеспечив стандартизацию цепочек поставок на основе наших проектов. Мы извлекли выгоду из инноваций экосистемы, открыв исходный код ведущих инструментов, таких как PyTorch, React и многих других инструментов. Этот подход неизменно работает для нас, если мы придерживаемся его в долгосрочной перспективе.

Почему ИИ с открытым исходным кодом полезен для мира

Я считаю, что открытый исходный код необходим для позитивного будущего ИИ. ИИ имеет больший потенциал, чем любая другая современная технология, для повышения производительности, творческих способностей и качества жизни человека, а также для ускорения экономического роста и одновременного достижения прогресса в медицинских и научных исследованиях. Открытый исходный код гарантирует, что больше людей во всем мире получат доступ к преимуществам и возможностям ИИ, что власть не будет сосредоточена в руках небольшого числа компаний, и что технология может быть развернута более равномерно и безопасно в обществе.


Продолжаются споры о безопасности моделей ИИ с открытым исходным кодом, и я считаю, что ИИ с открытым исходным кодом будет безопаснее, чем альтернативы. Я думаю, что правительства придут к выводу, что поддержка открытого исходного кода в их интересах, потому что это сделает мир более процветающим и безопасным.


Моя концепция безопасности заключается в том, что нам необходимо защищаться от двух категорий вреда: непреднамеренного и преднамеренного. Непреднамеренный вред — это когда система искусственного интеллекта может причинить вред, даже если это не входило в намерения тех, кто ею управляет. Например, современные модели искусственного интеллекта могут непреднамеренно давать вредные советы по поводу здоровья. Или, в более футуристических сценариях, некоторые опасаются, что модели могут непреднамеренно самовоспроизводиться или гипероптимизировать цели в ущерб человечеству. Умышленный вред — это когда злоумышленник использует модель ИИ с целью причинения вреда.


Стоит отметить, что непреднамеренный вред охватывает большинство проблем, которые возникают у людей в отношении ИИ — от того, какое влияние системы ИИ окажут на миллиарды людей, которые будут их использовать, до большинства поистине катастрофических научно-фантастических сценариев для человечества. На этом фронте открытый исходный код должен быть значительно безопаснее, поскольку системы более прозрачны и могут быть тщательно изучены. Исторически по этой причине программное обеспечение с открытым исходным кодом было более безопасным. Аналогичным образом, использование Llama с ее системами безопасности, такими как Llama Guard, вероятно, будет безопаснее и надежнее, чем закрытые модели. По этой причине большинство разговоров о безопасности ИИ с открытым исходным кодом сосредоточено на умышленном причинении вреда.


Наш процесс обеспечения безопасности включает в себя тщательное тестирование и совместную работу «красных команд» для оценки того, способны ли наши модели нанести значимый вред, с целью снижения рисков перед выпуском. Поскольку модели открыты, каждый может протестировать их самостоятельно. Мы должны помнить, что эти модели обучаются на основе информации, которая уже есть в Интернете, поэтому отправной точкой при рассмотрении вреда должно быть то, может ли модель причинить больший вред, чем информация, которую можно быстро получить из Google или других результатов поиска.


Рассуждая о намеренном вреде, полезно различать то, что могут сделать отдельные или мелкие субъекты, и то, что могут сделать крупномасштабные субъекты, такие как национальные государства с огромными ресурсами.


В какой-то момент в будущем отдельные злоумышленники смогут использовать интеллект моделей искусственного интеллекта для создания совершенно новых видов вреда на основе информации, доступной в Интернете. На этом этапе баланс сил будет иметь решающее значение для безопасности ИИ. Я думаю, что будет лучше жить в мире, где широко будет использоваться ИИ, чтобы более крупные игроки могли сдерживать мощь мелких плохих игроков. Именно так мы обеспечиваем безопасность в наших социальных сетях: наши более надежные системы искусственного интеллекта выявляют и останавливают угрозы со стороны менее опытных субъектов, которые часто используют системы искусственного интеллекта меньшего масштаба. В более широком смысле, более крупные учреждения, внедряющие ИИ в больших масштабах, будут способствовать безопасности и стабильности во всем обществе. Пока у каждого есть доступ к моделям одного и того же поколения, которые продвигаются с открытым исходным кодом, правительства и учреждения, обладающие большим количеством вычислительных ресурсов, смогут проверять злоумышленников с меньшими вычислительными ресурсами.


Следующий вопрос заключается в том, как США и демократические страны должны справиться с угрозой со стороны государств с огромными ресурсами, таких как Китай. Преимущество Соединенных Штатов – децентрализация и открытые инновации. Некоторые утверждают, что мы должны закрыть наши модели, чтобы не дать Китаю получить к ним доступ, но я считаю, что это не сработает и только поставит в невыгодное положение США и их союзников. Наши противники хороши в шпионаже, украсть модели, помещающиеся на флэш-накопителе, относительно легко, и большинство технологических компаний далеки от того, чтобы усложнить эту задачу. Кажется наиболее вероятным, что в мире только закрытых моделей небольшое количество крупных компаний плюс наши геополитические противники имеют доступ к ведущим моделям, в то время как стартапы, университеты и малый бизнес упускают возможности. Кроме того, ограничение американских инноваций закрытой разработкой увеличивает вероятность того, что мы вообще не будем лидерами. Вместо этого я считаю, что наша лучшая стратегия — построить надежную открытую экосистему и заставить наши ведущие компании тесно сотрудничать с нашим правительством и союзниками, чтобы они могли наилучшим образом воспользоваться преимуществами последних достижений и добиться устойчивого преимущества первопроходца в долгосрочной перспективе.


Рассматривая предстоящие возможности, помните, что большинство сегодняшних ведущих технологических компаний и научных исследований основаны на программном обеспечении с открытым исходным кодом. Следующее поколение компаний и исследований будет использовать ИИ с открытым исходным кодом, если мы коллективно инвестируем в него. Сюда входят как только начинающие стартапы, так и люди в университетах и странах, у которых может не хватить ресурсов для разработки собственного современного искусственного интеллекта с нуля.


Суть в том, что ИИ с открытым исходным кодом представляет собой лучший в мире шанс использовать эту технологию для создания величайших экономических возможностей и безопасности для всех.

Давайте построим это вместе

Что касается прошлых моделей Llama, Meta разработала их для себя, а затем выпустила, но не уделяла особого внимания созданию более широкой экосистемы. В этом выпуске мы применяем другой подход. Мы создаем внутренние команды, чтобы позволить как можно большему количеству разработчиков и партнеров использовать Llama, и мы активно строим партнерские отношения, чтобы больше компаний в экосистеме также могли предлагать уникальные функции своим клиентам.


Я считаю, что выпуск Llama 3.1 станет переломным моментом в отрасли, когда большинство разработчиков начнут в основном использовать открытый исходный код, и я ожидаю, что с этого момента этот подход будет только развиваться. Я надеюсь, что вы присоединитесь к нам в этом путешествии, чтобы донести преимущества ИИ до каждого человека в мире.


Вы можете получить доступ к моделям сейчас на llama.meta.com .


💪,

МЗ