Представьте себе будущее, в котором искусственный интеллект не будет заперт в корпоративных хранилищах, а будет построен под открытым небом, кирпичик за кирпичиком, глобальным сообществом новаторов. Где сотрудничество, а не конкуренция способствует прогрессу, а этические соображения имеют равный вес с чистой производительностью. Это не научная фантастика, это революция открытого исходного кода , назревающая в самом сердце разработки ИИ. Но у больших технологий есть своя собственная программа, маскирующая ограниченные модели под открытый исходный код и одновременно пытающаяся воспользоваться преимуществами по-настоящему открытого сообщества.
Давайте откроем слои кода и раскроем правду, стоящую за этими усилиями. Это исследование будущего искусственного интеллекта с открытым исходным кодом позволит проанализировать «претендентов» и поддержать «настоящих» в разработке искусственного интеллекта, чтобы раскрыть инновационный двигатель, который представляет собой программное обеспечение с открытым исходным кодом, которое гудит под всем этим. Суть в том, что ИИ с открытым исходным кодом породит стек данных с открытым исходным кодом.
Необходимость
Недавняя статья Маттео Вонга в The Atlantic: Никогда не было такого понятия, как «открытый» ИИ описывает растущую тенденцию в академических кругах и программном сообществе к использованию искусственного интеллекта с открытым исходным кодом. «Идея состоит в том, чтобы создать относительно прозрачные модели, которые общественность сможет легче и дешевле использовать, изучать и воспроизводить, пытаясь демократизировать высококонцентрированную технологию, которая может потенциально изменить работу, полицию, досуг и даже религию». Тот же Atlantic предполагает, что крупные технологические компании, такие как Meta, пытаются удовлетворить эту потребность рынка, «открывая» свою продукцию. Они перенимают качества и положительную репутацию сообщества открытого исходного кода, не открывая по-настоящему открытый исходный код своего продукта. Но ничто не заменит настоящую вещь. Это связано с тем, что истинное программное обеспечение с открытым исходным кодом стимулирует инновации и сотрудничество: два качества, которые крайне необходимы для ответственного продвижения вперед в области ИИ.
Претенденты
LLaMA 2 — это большая языковая модель, созданная Meta , которую можно бесплатно использовать как для исследовательских, так и для коммерческих целей. Некоторые считают, что LLaMA 2 имеет открытый исходный код. Однако Meta ввела некоторые строгие ограничения на использование своей модели. Например, LLaMA 2 нельзя использовать для улучшения какой-либо другой модели большого языка. Позиция, противоречащая традиционной частная коллективная инновационная модель открытого программного обеспечения, которое способствует свободному и открытому раскрытию инноваций на благо всех членов сообщества программного обеспечения.
Meta еще больше затруднила использование своей модели, не разрешив интеграцию LLaMA 2 с продуктами, которые имеют 700 миллионов пользователей в месяц, и не раскрыв, на каких данных обучается их модель, или код, который они использовали для ее построения. Не раскрывая информации, Мета открывает себя для вопросов, связанных с присущей им предвзятостью и случайной дискриминацией. Модель, обученная на дискриминационных данных, будет подавать дискриминационные ответы . Поскольку сообщество разработчиков программного обеспечения в целом не имеет возможности просмотреть либо код, использованный для построения модели, чтобы увидеть, были ли встроены какие-либо средства защиты, либо данные, использованные для ее обучения, мы остаемся в неведении по этим моральным вопросам. В то время, когда опубликованное исследование по ИИ больше озабочен производительностью, чем справедливостью, и уважение, это запутывание особенно беспокоит.
Настоящие
Мистраль ИИ получила признание благодаря своим большим языковым моделям с открытым исходным кодом, в частности Mistral 7B и Mixtral 8x7B. Компания стремится обеспечить широкую доступность своих моделей искусственного интеллекта, поощряя их проверку, модификацию и повторное использование сообществом открытого программного обеспечения.
vLLM означает «обслуживание векторизованной модели с малой задержкой» и представляет собой библиотеку с открытым исходным кодом, специально разработанную для ускорения и оптимизации больших языковых моделей (LLM). Это мощный инструмент, который может значительно улучшить производительность и удобство использования LLM. Это делает его ценным активом для разработчиков, работающих над различными приложениями искусственного интеллекта, от чат-ботов и виртуальных помощников до создания контента и генерации кода. Настолько, что Mistral рекомендует использовать vLLM в качестве сервера вывода для моделей 7B и 8x7B.
ЭлеутерAI — это некоммерческая исследовательская лаборатория искусственного интеллекта, которая выросла из сервера Discord для обсуждения GPT-3 в ведущую некоммерческую исследовательскую организацию. Группа известна своей работой по обучению и продвижению норм открытой науки в области обработки естественного языка. Они выпустили различные модели больших языков с открытым исходным кодом и участвуют в исследовательских проектах, связанных с согласованием и интерпретируемостью ИИ. Их LM-Ремень Вероятно, это ведущий инструмент оценки языковых моделей с открытым исходным кодом.
Фи-2 — это LLM от Microsoft, который выходит за рамки своего веса. Эта небольшая, но мощная модель, обученная на сочетании синтетических текстов и отфильтрованных веб-сайтов, превосходно справляется с такими задачами, как ответы на вопросы, подведение итогов и перевод. Что действительно отличает Phi-2, так это его ориентация на рассуждение и понимание языка, что приводит к впечатляющим результатам даже без использования передовых методов выравнивания.
Многие компетентные модели внедрения с открытым исходным кодом укрепляют общее пространство генеративного ИИ с открытым исходным кодом. Это современный уровень развития открытого исходного кода, который включает в себя ОАЭ-Большой-V1 и многоязычный-e5-большой .
В этой постоянно растущей области есть еще много других. Этот ограниченный список — это только начало.
Открытый исходный код стимулирует инновации
Принимая философию предельно открытых инноваций, компании, которые действительно участвуют в разработке программного обеспечения с открытым исходным кодом, бросают вызов традиционным представлениям о конкурентных преимуществах, признавая, что не весь хороший код или отличные идеи находятся внутри их организации. . Этот сдвиг поддерживает аргумент что совместные инновации в экосистеме с открытым исходным кодом приводят к более быстрому росту рынка, предоставляя даже более мелким фирмам-разработчикам программного обеспечения более ограниченные средства на исследования и разработки. возможность извлечь выгоду от побочных эффектов НИОКР, присутствующих в программном обеспечении с открытым исходным кодом. Это связано с тем, что, в отличие от традиционного аутсорсинга, открытые инновации увеличивает внутренние ресурсы за счет использования коллективного разума сообщества, не уменьшая при этом внутренние усилия в области исследований и разработок. Это означает, что компаниям, занимающимся программным обеспечением с открытым исходным кодом, не придется жертвовать своим бюджетом, чтобы добиться лидерства в области мысли и разработки кода за пределами своей организации.
Кроме того, компании-разработчики программного обеспечения с открытым исходным кодом стратегически стимулируют инновации путем выпускать код раньше и чаще признавая совокупный характер инновационного процесса в сообществе программного обеспечения. Все это говорит о том, что многие уже понимают: программное обеспечение с открытым исходным кодом стимулирует инновации.
Открытый исходный код способствует сотрудничеству
Через сеть В сообществе программного обеспечения с открытым исходным кодом предприниматели могут достигать как краткосрочных, так и долгосрочных целей. Краткосрочные цели по прибыли создают компании, а долгосрочные цели по прибыли поддерживают их. В то же время эти сетевые усилия способствуют сохранению самой сети, расширяя ее для следующего предпринимателя. Хорошо известно, что платформы с открытым исходным кодом предоставляют доступ к исходному коду, что позволяет разработчикам создавать обновления, плагины и другие части программного обеспечения и использовать их в соответствии со своими требованиями. Этот особый вид сотрудничества пережил бум с широким распространением Kubernetes среди более широкого сообщества разработчиков программного обеспечения. Сегодня, более чем когда-либо, современные технологии работают вместе с минимальными трениями и могут быть объединены за считанные минуты практически где угодно.
Крупные технологические компании признают это глубокое сотрудничество, присущее сообществу открытого исходного кода, когда они свободно выпускают фреймворки, библиотеки и языки, созданные ими для поддержки и разработки внутренних инструментов. Это расширяет круг разработчиков, способных работать над своими продуктами, и начинает устанавливать стандарты того, как должны работать подобные технологии. В той же статье Atlantic цитируется основатель Meta Марк Цукерберг, который сказал, что «для нас было очень ценно обеспечить это, потому что теперь все лучшие разработчики в отрасли используют инструменты, которые мы также используем внутри компании».
Открытый исходный код порождает открытый исходный код
Это факторы, объясняющие, почему мы очень часто видим синергию между компаниями с открытым исходным кодом. Компании, занимающиеся искусственным интеллектом и машинным обучением с открытым исходным кодом, естественно, будут разрабатывать решения вместе с другими продуктами с открытым исходным кодом, от базовых продуктов, таких как объектное хранилище, до инструментов визуализации. Когда одна компания с открытым исходным кодом делает шаг вперед, мы все делаем это. Этот целостный и смешанный подход, вероятно, является нашим лучшим выбором для разработки ИИ, ориентированного на человека. Эти естественные силы, присущие потребности рынка в искусственном интеллекте с открытым исходным кодом, в сочетании с качествами программного обеспечения с открытым исходным кодом, отличающимися инновациями и сотрудничеством, будут способствовать развитию стека данных ИИ с открытым исходным кодом.
Пожалуйста, присоединяйтесь и внесите свой вклад в этот разговор и в наше сообщество, написав нам по адресу электронной почты. привет@min.io или отправив нам сообщение на нашем канале Slack .
Также опубликовано здесь .