paint-brush
Отворен код: Следващата стъпка в AI революциятаот@minio
109,861 показания
109,861 показания

Отворен код: Следващата стъпка в AI революцията

от MinIO6m2024/01/25
Read on Terminal Reader
Read this story w/o Javascript

Твърде дълго; Чета

Това изследване на бъдещето на AI с отворен код ще анализира „претендентите“ и ще защити „истинските“ в развитието на AI, за да разкрие иновационния двигател, който е софтуерът с отворен код, който бръмчи под всичко това. Изводът е, че AI с отворен код ще създаде стек от данни с отворен код.

People Mentioned

Mention Thumbnail
featured image - Отворен код: Следващата стъпка в AI революцията
MinIO HackerNoon profile picture
0-item
1-item


Представете си бъдеще, в което AI не е затворен в корпоративни трезори, а изграден на открито, тухла по тухла, от глобална общност от иноватори. Където сътрудничеството, а не конкуренцията, подхранва напредъка и етичните съображения имат еднаква тежест със суровото представяне. Това не е научна фантастика, това е революцията на отворения код, която назрява в сърцето на развитието на ИИ. Но Big Tech има своя собствена програма, маскирайки ограничените модели като отворен код, докато се опитва да извлече предимствата на една наистина отворена общност.


Нека отлепим слоевете код и разкрием истината зад тези усилия. Това изследване на бъдещето на AI с отворен код ще направи дисекция на „претендентите“ и ще защити „истинските“ в развитието на AI, за да разкрие иновационния двигател, който е софтуерът с отворен код, който бръмчи под всичко това. Изводът е, че AI с отворен код ще създаде стек от данни с отворен код.


Нуждата

Скорошна статия от Матео Уонг в The Atlantic, ' Никога не е имало такова нещо като „отворен“ AI “ описва нарастваща тенденция в академичните среди и софтуерната общност за истински AI с отворен код. „Идеята е да се създадат относително прозрачни модели, които обществеността да може по-лесно и евтино да използва, изучава и възпроизвежда, опитвайки се да демократизира силно концентрирана технология, която може да има потенциала да трансформира работата, полицията, свободното време и дори религията.“ Същият Atlantic предполага, че големи технологични компании като Meta се опитват да задоволят тази нужда на пазара чрез „открито измиване“ на своите продукти. Те приемат качествата и положителната репутация на общността с отворен код, без наистина да използват продукта си с отворен код. Но няма заместител на истинското нещо. Това е така, защото истинският софтуер с отворен код стимулира иновациите и сътрудничеството: две качества, които са отчаяно необходими, за да продължим напред с AI отговорно.


Претендентите

LLaMA 2 е голям езиков модел, създаден от Meta , който е безплатен за използване както за изследователски, така и за търговски цели. Това кара някои да предполагат, че LLaMA 2 е с отворен код. Meta обаче въведе някои строги ограничения върху използването на техния модел. Например, LLaMA 2 не може да се използва за подобряване на друг голям езиков модел. Позиция, която противоречи на традиционното модел на частна колективна иновация на отворен софтуер, който насърчава свободното и открито разкриване на иновации в полза на всеки в софтуерната общност.


Meta допълнително осакати използването на техния модел, като не позволи интегрирането на LLaMA 2 с продукти, които имат 700 милиона месечни потребители и като не разкри на какви данни е обучен техният модел или кода, който са използвали за изграждането му. Като не разкрива, Мета се отваря към въпроси за присъщи пристрастия и случайна дискриминация. Модел, обучен на дискриминиращи данни, ще сервират дискриминационни отговори . Без софтуерната общност като цяло да може да види или кода, използван за изграждане на модела, за да види дали са вградени някакви предпазни мерки, или данните, използвани за обучението му, ние оставаме в неведение по тези морални въпроси. Във време, когато публикувано изследване на AI е по-загрижен за представянето, отколкото за справедливостта и уважава това объркване е особено обезпокоително.


Истинските

Мистрал AI получи признание за своите големи езикови модели с отворен код, по-специално Mistral 7B и Mixtral 8x7B. Компанията се стреми да осигури широк достъп до своите AI модели, като насърчава прегледа, модификацията и повторната употреба от общността на отворения софтуер.


vLLM означава „обслужване на векторизирани модели с ниска латентност“ и е библиотека с отворен код, специално проектирана да ускорява и оптимизира големи езикови модели (LLM). Това е мощен инструмент, който може значително да подобри производителността и използваемостта на LLM. Това го прави ценен актив за разработчиците, работещи върху различни AI приложения, от чатботове и виртуални асистенти до създаване на съдържание и генериране на код. Дотолкова, че Mistral препоръчва използването на vLLM като сървър за изводи за моделите 7B и 8x7B.


EleutherAI е изследователска лаборатория за изкуствен интелект с нестопанска цел, която се разрасна от сървър на Discord за обсъждане на GPT-3 до водеща изследователска организация с нестопанска цел. Групата е известна с работата си в обучението и насърчаването на отворени научни норми в обработката на естествен език. Те пуснаха различни големи езикови модели с отворен код и участват в изследователски проекти, свързани с подравняването и интерпретируемостта на AI. Тяхната LM-Сбруя project е вероятно водещият инструмент за оценка с отворен код за езикови модели.


Фи-2 е LLM на Microsoft, който надхвърля теглото си. Обучен на комбинация от синтетични текстове и филтрирани уебсайтове, този малък, но мощен модел се справя отлично със задачи като отговаряне на въпроси, обобщаване и превод. Това, което наистина отличава Phi-2, е неговият фокус върху разсъжденията и разбирането на езика, което води до впечатляващо представяне дори без усъвършенствани техники за подравняване.


Много компетентни модели за вграждане с отворен код укрепват цялостното генеративно AI пространство с отворен код. Това са текущото състояние на изкуството за отворен код и включват ОАЕ-Голям-V1 и многоезичен-e5-голям .


Има много повече в тази непрекъснато разрастваща се област. Този ограничен списък е само началото.


Отвореният код стимулира иновациите

Възприемайки философия за изключително отворени иновации, компаниите, които наистина участват в разработката на софтуер с отворен код, предизвикват традиционните представи за конкурентно предимство, като признават, че не всички добри кодове или страхотни идеи се намират в тяхната организация . Тази промяна подкрепя аргумент че споделените иновации в рамките на екосистемата с отворен код водят до по-бърз пазарен растеж, предоставяйки дори на по-малките софтуерни фирми по-ограничени средства за научноизследователска и развойна дейност. възможност да се възползвате от разпространението на R&D в софтуера с отворен код. Това е така, защото, за разлика от традиционния аутсорсинг, отворените иновации подобрява вътрешните ресурси чрез използване на колективния интелект на общността, без да намалява вътрешните усилия за научноизследователска и развойна дейност. Това означава, че компаниите за софтуер с отворен код не трябва да жертват бюджетите си, за да преследват мисловно лидерство и програмиране извън своята организация.


Освен това компаниите за софтуер с отворен код стратегически стимулират иновациите чрез пускане на код рано и често , признавайки кумулативния характер на иновационния процес в софтуерната общност. Всичко това, за да кажем нещо, което мнозина вече признават: софтуерът с отворен код стимулира иновациите.


Отвореният код насърчава сътрудничеството

Чрез работа в мрежа в общността на софтуера с отворен код предприемачите са в състояние да изпълнят както краткосрочни, така и дългосрочни цели. Краткосрочните цели за печалба изграждат компаниите, а дългосрочните цели за печалба ги поддържат. В същото време, това усилие за изграждане на мрежа самоувековечава самата мрежа - разраствайки я за следващия предприемач. Добре известно е, че платформите с отворен код предоставят достъп до изходния код, което позволява на разработчиците да създават надстройки, плъгини и други софтуерни части и да ги използват според изискванията си. Този конкретен вид сътрудничество преживя бум с широкото приемане на Kubernetes от по-широката софтуерна общност. Сега повече от всякога съвременните технологии работят заедно с много малко триене и могат да бъдат заедно почти навсякъде за минути.


Големите технологични компании признават това дълбоко сътрудничество, присъщо на общността с отворен код, когато свободно пускат рамки, библиотеки и езици, които са създали, за да поддържат и развиват вътрешни инструменти. По този начин се задълбочава наборът от разработчици, способни да работят върху техните продукти, и започва да определя стандарта за това как подобни технологии трябва да работят. Същата статия на Atlantic цитира основателя на Meta Марк Зукърбърг, който казва, че е „много ценно за нас да предоставим това, защото сега всички най-добри разработчици в индустрията използват инструменти, които ние също използваме вътрешно“.


Отвореният код поражда отворен код

Това са фактори, поради които много често виждаме синергии между компании с отворен код. Компаниите с отворен код AI и ML естествено ще разработват решения с други продукти с отворен код от основни продукти като съхранение на обекти до целия стек до инструменти за визуализация. Когато една компания с отворен код пристъпи напред, всички го правим. Този сплотен и смесен подход вероятно е най-добрият ни залог за разработване на AI, който възприема подход, ориентиран към човека. Тези естествени сили, присъщи на пазарната нужда от AI с отворен код, съчетани с качествата на софтуера с отворен код на иновация и сътрудничество, ще движат пакета данни с AI с отворен код.


Моля, присъединете се и допринесете за този разговор и нашата общност, като ни изпратите имейл на здравей@min.io или като ни изпратите съобщение в нашия Slack канал .


Публикувано и тук .


L O A D I N G
. . . comments & more!

About Author

MinIO HackerNoon profile picture
MinIO@minio
MinIO is a high-performance, cloud-native object store that runs anywhere (public cloud, private cloud, colo, onprem).

ЗАКАЧВАЙТЕ ЕТИКЕТИ

ТАЗИ СТАТИЯ Е ПРЕДСТАВЕНА В...