Уявіце сабе будучыню, дзе штучны інтэлект не будзе зачыненым у карпаратыўных сховішчах, а пабудаваны адкрыта, па цаглінках, сусветнай супольнасцю наватараў. Дзе супрацоўніцтва, а не канкурэнцыя, спрыяе прагрэсу, і этычныя меркаванні маюць аднолькавую вагу з сырой прадукцыйнасцю. Гэта не навуковая фантастыка, гэта рэвалюцыя з адкрытым зыходным кодам , якая наспявае ў самым цэнтры развіцця штучнага інтэлекту. Але Big Tech мае свой уласны парадак дня, маскіруючы абмежаваныя мадэлі пад адкрытым зыходным кодам, адначасова спрабуючы скарыстацца перавагамі сапраўды адкрытай супольнасці.
Давайце ачысцім пласты кода і раскрыем праўду за гэтымі намаганнямі. Гэта даследаванне будучыні штучнага інтэлекту з адкрытым зыходным кодам прааналізуе «прэтэндэнтаў» і адстойвае «сапраўдных» у распрацоўцы штучнага інтэлекту, каб выявіць механізм інавацый, якім з'яўляецца праграмнае забеспячэнне з адкрытым зыходным кодам, якое гудзе пад усім гэтым. Сутнасць у тым, што штучны інтэлект з адкрытым зыходным кодам спародзіць стэк дадзеных з адкрытым зыходным кодам.
Патрэба
Нядаўні артыкул Матэа Вонга ў The Atlantic, ' Такога, як «адкрыты» штучны інтэлект, ніколі не было ' апісвае рост тэндэнцыі ў акадэмічных колах і супольнасці праграмнага забеспячэння для сапраўды адкрытага зыходнага кода AI. «Ідэя складаецца ў тым, каб стварыць адносна празрыстыя мадэлі, якія грамадскасць магла б лягчэй і танней выкарыстоўваць, вывучаць і прайграваць, спрабуючы дэмакратызаваць высокаканцэнтраваную тэхналогію, якая можа мець патэнцыял для трансфармацыі працы, паліцыі, адпачынку і нават рэлігіі». Тая ж Atlantic сведчыць аб тым, што буйныя тэхналагічныя кампаніі, такія як Meta, спрабуюць задаволіць гэтую патрэбу на рынку шляхам «адкрытай мыцця» сваёй прадукцыі. Яны бяруць на сябе якасці і станоўчую рэпутацыю супольнасці з адкрытым зыходным кодам без таго, каб іх прадукт сапраўды быў адкрытым. Але сапраўднае няма замены. Гэта адбываецца таму, што сапраўднае праграмнае забеспячэнне з адкрытым зыходным кодам спрыяе інавацыям і супрацоўніцтву: дзве якасці, якія вельмі неабходныя, каб адказна рухацца наперад з ІІ.
Прэтэндэнты
LLaMA 2 - гэта вялікая моўная мадэль, створаная Meta , якую можна бясплатна выкарыстоўваць як для даследаванняў, так і для камерцыйных мэтаў. Некаторыя прымушаюць меркаваць, што LLaMA 2 з'яўляецца адкрытым зыходным кодам. Тым не менш, Meta ўвяла некаторыя жорсткія абмежаванні на выкарыстанне сваёй мадэлі. Напрыклад, LLaMA 2 нельга выкарыстоўваць для паляпшэння любой іншай вялікай моўнай мадэлі. Пазыцыя, якая супярэчыць традыцыйнаму прыватная калектыўная мадэль інавацый адкрытага праграмнага забеспячэння, якое спрыяе свабоднаму і адкрытаму раскрыццю інавацый на карысць кожнага ў праграмнай супольнасці.
Meta яшчэ больш паразіла выкарыстанне сваёй мадэлі, не дазваляючы інтэграцыю LLaMA 2 з прадуктамі, якія маюць 700 мільёнаў карыстальнікаў штомесяц, і не раскрываючы, на якіх дадзеных навучаецца іх мадэль і код, які яны выкарыстоўвалі для яе стварэння. Не раскрываючы, Meta адкрывае сябе для пытанняў унутранай прадузятасці і выпадковай дыскрымінацыі. Мадэль, навучаная на дыскрымінацыйных дадзеных, будзе даваць дыскрымінацыйныя адказы . Калі супольнасць праграмнага забеспячэння ў цэлым не можа праглядаць ні код, які выкарыстоўваўся для стварэння мадэлі, каб убачыць, ці былі ўбудаваны якія-небудзь меры абароны, ні дадзеныя, якія выкарыстоўваюцца для яе навучання, мы не ведаем гэтых маральных пытанняў. У той час, калі апублікаваў даследаванні па ІІ больш занепакоены прадукцыйнасцю, чым справядлівасцю, і паважайце, што гэтая заблытанасць асабліва трывожная.
Сапраўдныя
Містраль А.І атрымала прызнанне сваімі мадэлямі вялікай мовы з адкрытым зыходным кодам, у прыватнасці Mistral 7B і Mixtral 8x7B. Кампанія імкнецца забяспечыць шырокую даступнасць сваіх мадэляў штучнага інтэлекту, заахвочваючы агляд, мадыфікацыю і паўторнае выкарыстанне супольнасцю адкрытага праграмнага забеспячэння.
vLLM расшыфроўваецца як "вектарызаванае абслугоўванне мадэлі з нізкай затрымкай" і з'яўляецца бібліятэкай з адкрытым зыходным кодам, спецыяльна распрацаванай для паскарэння і аптымізацыі вялікіх моўных мадэляў (LLM). Гэта магутны інструмент, які можа значна палепшыць прадукцыйнасць і зручнасць выкарыстання LLM. Гэта робіць яго каштоўным актывам для распрацоўшчыкаў, якія працуюць над рознымі праграмамі AI, ад чат-ботаў і віртуальных памочнікаў да стварэння кантэнту і генерацыі кода. Настолькі, што Mistral рэкамендуе выкарыстоўваць vLLM у якасці сервера вываду для мадэляў 7B і 8x7B.
Элеўтэр А.І гэта некамерцыйная даследчая лабараторыя штучнага інтэлекту, якая ператварылася з сервера Discord для абмеркавання GPT-3 у вядучую некамерцыйную даследчую арганізацыю. Група вядомая сваёй працай па навучанні і прапагандзе адкрытых навуковых норм у апрацоўцы натуральнай мовы. Яны выпусцілі розныя вялікія моўныя мадэлі з адкрытым зыходным кодам і ўдзельнічаюць у навукова-даследчых праектах, звязаных з выраўноўваннем і інтэрпрэтацыяй штучнага інтэлекту. Іх LM-Жгут праект, верагодна, з'яўляецца вядучым інструментам ацэнкі моўных мадэляў з адкрытым зыходным кодам.
Фі-2 гэта ступень магістра права Microsoft, якая пераўзыходзіць сваю вагу. Гэтая невялікая, але магутная мадэль, заснаваная на сумесі сінтэтычных тэкстаў і адфільтраваных вэб-сайтаў, выдатна спраўляецца з такімі задачамі, як адказы на пытанні, рэзюмаванне і пераклад. Што па-сапраўднаму вылучае Phi-2, так гэта яго арыентацыя на развагі і разуменне мовы, што прыводзіць да ўражлівай прадукцыйнасці нават без перадавых метадаў выраўноўвання.
Многія кампетэнтныя мадэлі ўбудавання з адкрытым зыходным кодам умацоўваюць агульную генератыўную прастору штучнага інтэлекту з адкрытым зыходным кодам. Гэта сучасны стан для адкрытага зыходнага кода і ўключаюць у сябе ААЭ-Вялікая-V1 і шматмоўны-e5-вялікі .
Ёсць шмат іншых у гэтай пастаянна расце вобласці. Гэты абмежаваны спіс - толькі пачатак.
Адкрыты зыходны код стымулюе інавацыі
Прытрымліваючыся філасофіі экстрэмальных адкрытых інавацый, кампаніі, якія сапраўды ўдзельнічаюць у распрацоўцы праграмнага забеспячэння з адкрытым зыходным кодам, кідаюць выклік традыцыйным уяўленням аб канкурэнтнай перавазе, прызнаючы, што не ўвесь добры код або выдатныя ідэі знаходзяцца ў іх арганізацыі . Гэты зрух падтрымлівае аргумент што агульныя інавацыі ў экасістэме з адкрытым зыходным кодам прыводзяць да больш хуткага росту рынку, забяспечваючы нават меншым фірмам праграмнага забеспячэння больш абмежаваныя сродкі на даследаванні і распрацоўкі. магчымасць атрымаць выгаду ад дадатковых эфектаў даследаванняў і распрацовак, якія прысутнічаюць у праграмным забеспячэнні з адкрытым зыходным кодам. Гэта таму, што, у адрозненне ад традыцыйнага аўтсорсінгу, адкрытыя інавацыі павялічвае ўнутраныя рэсурсы шляхам выкарыстання калектыўнага інтэлекту супольнасці, не змяншаючы ўнутраныя намаганні ў галіне даследаванняў і распрацовак. Гэта азначае, што кампаніям, якія распрацоўваюць праграмнае забеспячэнне з адкрытым зыходным кодам, не трэба ахвяраваць сваімі бюджэтамі, каб пераследваць ідэйнае лідэрства і кадзіраваць за межамі сваёй арганізацыі.
Акрамя таго, кампаніі з адкрытым зыходным кодам стратэгічна прасоўваюць інавацыі рана і часта выпускаць код , прызнаючы кумулятыўны характар інавацыйнага працэсу ў супольнасці праграмнага забеспячэння. Усё гэта азначае тое, што многія ўжо ведаюць: праграмнае забеспячэнне з адкрытым зыходным кодам спрыяе інавацыям.
Адкрыты зыходны код спрыяе супрацоўніцтву
Праз стварэнне сетак у супольнасці праграмнага забеспячэння з адкрытым зыходным кодам прадпрымальнікі здольныя выконваць як кароткатэрміновыя, так і доўгатэрміновыя мэты. Кароткатэрміновыя мэты прыбытку будуюць кампаніі, а доўгатэрміновыя мэты прыбытку падтрымліваюць іх. У той жа час гэтыя сеткавыя намаганні самастойна ўвекавечваюць саму сетку - павялічваючы яе для наступнага прадпрымальніка. Добра вядома, што платформы з адкрытым зыходным кодам забяспечваюць доступ да зыходнага кода, дазваляючы распрацоўнікам ствараць абнаўленні, плагіны і іншыя часткі праграмнага забеспячэння і выкарыстоўваць іх у адпаведнасці са сваімі патрабаваннямі. Гэты канкрэтны від супрацоўніцтва перажыў бум з шырокім прыняццем Kubernetes шырокай супольнасцю праграмнага забеспячэння. Цяпер, як ніколі, сучасныя тэхналогіі працуюць разам з вельмі невялікім трэннем і могуць быць разам практычна ў любым месцы за лічаныя хвіліны.
Вялікія тэхналагічныя кампаніі прызнаюць гэта глыбокае супрацоўніцтва, уласцівае супольнасці з адкрытым зыходным кодам, калі яны свабодна выпускаюць фрэймворкі, бібліятэкі і мовы, створаныя імі для падтрымання і развіцця ўнутраных інструментаў. Гэта паглыбляе пул распрацоўшчыкаў, здольных працаваць над сваімі прадуктамі, і пачынае ўсталёўваць стандарт таго, як павінны працаваць падобныя тэхналогіі. У тым жа артыкуле Atlantic цытуюцца словы заснавальніка Meta Марка Цукерберга, які «быў вельмі каштоўным для нас, таму што цяпер усе лепшыя распрацоўшчыкі ў галіны выкарыстоўваюць інструменты, якія мы таксама выкарыстоўваем унутры».
Адкрыты зыходны код нараджае адкрыты зыходны код
Гэта фактары, чаму мы вельмі часта бачым сінэргію паміж кампаніямі з адкрытым зыходным кодам. Кампаніі з адкрытым зыходным кодам AI і ML, натуральна, будуць распрацоўваць рашэнні з іншымі прадуктамі з адкрытым зыходным кодам, пачынаючы ад асноўных прадуктаў, такіх як сховішча аб'ектаў, і заканчваючы ўсім стэкам і заканчваючы інструментамі візуалізацыі. Калі адна кампанія з адкрытым зыходным кодам робіць крок наперад, мы ўсе гэта робім. Гэты згуртаваны і змешаны падыход, верагодна, з'яўляецца лепшым выбарам для распрацоўкі штучнага інтэлекту, арыентаванага на чалавека. Гэтыя прыродныя сілы, уласцівыя патрэбе рынку ў штучным інтэлекте з адкрытым зыходным кодам, у спалучэнні з такімі якасцямі праграмнага забеспячэння з адкрытым зыходным кодам, як інавацыі і супрацоўніцтва, будуць стымуляваць стэк дадзеных штучнага інтэлекту з адкрытым зыходным кодам.
Калі ласка, далучайцеся і ўнясіце свой уклад у гэтую размову і нашу суполку, напісаўшы нам па электроннай пошце прывітанне@min.io або даслаўшы нам паведамленне на нашым канале Slack .
Таксама апублікавана тут .