Įsivaizduokite ateitį, kai dirbtinis intelektas nebus uždarytas įmonių saugyklose, o atviras, plyta po plytos, pasaulinės novatorių bendruomenės kuriamas. Kai bendradarbiavimas, o ne konkurencija, skatina pažangą, o etiniai sumetimai turi tokį patį svorį kaip neapdorotas našumas. Tai ne mokslinė fantastika, o atvirojo kodo revoliucija, besivystanti dirbtinio intelekto kūrimo širdyje. Tačiau „Big Tech“ turi savo darbotvarkę, užmaskuojančius ribotus modelius kaip atvirojo kodo, bandydami pasinaudoti tikrai atviros bendruomenės pranašumais.
Nulupkime kodo sluoksnius ir atskleisime tiesą, slypinčią už šių pastangų. Šis atvirojo kodo AI ateities tyrinėjimas išskirs „apsimetiklius“ ir palaikys „tikruosius“ dirbtinio intelekto kūrimo srityje, kad atskleistų naujovių variklį, kuris slypi atvirojo kodo programinėje įrangoje. Esmė ta, kad atvirojo kodo AI sukurs atvirojo kodo duomenų krūvą.
Poreikis
Naujausias Matteo Wong straipsnis žurnale „The Atlantic“ Niekada nebuvo tokio dalyko kaip „atviras“ AI “, aprašoma auganti tendencija akademinėje bendruomenėje ir programinės įrangos bendruomenėje sukurti tikrai atvirojo kodo AI. „Idėja yra sukurti santykinai skaidrius modelius, kuriuos visuomenė galėtų lengviau ir pigiau naudoti, studijuoti ir atgaminti, bandant demokratizuoti labai koncentruotą technologiją, kuri gali pakeisti darbą, policiją, laisvalaikį ir net religiją. Tas pats „Atlantic“ rodo, kad „Big Tech“ įmonės, tokios kaip „Meta“, bando patenkinti šį poreikį rinkoje „plaudamos“ savo produktus. Jie prisiima atvirojo kodo bendruomenės savybes ir teigiamą reputaciją, iš tikrųjų negaudami atviro šaltinio savo produkto. Tačiau tikro daikto pakaitalo nėra. Taip yra todėl, kad tikroji atvirojo kodo programinė įranga skatina naujoves ir bendradarbiavimą: dvi savybės, kurių labai reikia norint atsakingai judėti pirmyn su AI.
Pretendentai
„LLaMA 2“ yra didelis „Meta“ sukurtas kalbos modelis, kurį galima nemokamai naudoti tiek moksliniams tyrimams, tiek komerciniams tikslams. Kai kurie mano, kad LLaMA 2 yra atvirojo kodo. Tačiau „Meta“ įdiegė kai kuriuos griežtus jų modelio naudojimo apribojimus. Pavyzdžiui, LLaMA 2 negalima naudoti jokiam kitam dideliam kalbos modeliui tobulinti. Pozicija, kuri prieštarauja tradicinei privatus kolektyvinis inovacijų modelis atviros programinės įrangos, kuri skatina laisvą ir atvirą naujovių atskleidimą, kad būtų naudinga visiems programinės įrangos bendruomenės nariams.
„Meta“ dar labiau sužlugdė jų modelio naudojimą, neleisdama integruoti LLaMA 2 su produktais, kurie turi 700 milijonų vartotojų per mėnesį, ir neatskleisdama, kokius duomenis jie naudoja modeliui, ar kodo, kurį jie naudojo kurdami. Neatskleisdama, Meta atveria klausimus apie prigimtinį šališkumą ir atsitiktinę diskriminaciją. Modelis, apmokytas remiantis diskriminaciniais duomenimis pateikti diskriminacinius atsakymus . Jei visa programinės įrangos bendruomenė negalės peržiūrėti nei kodo, naudoto modeliui sukurti, kad pamatytų, ar buvo įdiegta kokių nors apsaugos priemonių, nei duomenų, naudojamų jam išmokyti, mes liekame nežinioje dėl šių moralinių klausimų. Tuo metu, kai paskelbė AI tyrimą labiau rūpinasi veiklos rezultatais, o ne teisingumu, o pagarba šis užmaskavimas ypač trikdo.
Tikrieji
Mistral AI sulaukė pripažinimo dėl savo atvirojo kodo didelių kalbų modelių, ypač Mistral 7B ir Mixtral 8x7B. Bendrovė stengiasi užtikrinti plačią prieigą prie savo AI modelių, skatindama atviros programinės įrangos bendruomenę peržiūrėti, modifikuoti ir pakartotinai naudoti.
vLLM reiškia „vektorių mažos delsos modelių aptarnavimą“ ir yra atvirojo kodo biblioteka, specialiai sukurta pagreitinti ir optimizuoti didelių kalbų modelius (LLM). Tai galingas įrankis, galintis žymiai pagerinti LLM našumą ir naudojimą. Dėl to jis yra vertingas turtas kūrėjams, dirbantiems su įvairiomis AI programomis – nuo pokalbių robotų ir virtualių asistentų iki turinio kūrimo ir kodo generavimo. Tiek daug, kad „Mistral“ rekomenduoja naudoti vLLM kaip išvadų serverį 7B ir 8x7B modeliams.
EleutherAI yra ne pelno siekianti dirbtinio intelekto tyrimų laboratorija, kuri iš „Discord“ serverio, skirto aptarti GPT-3, išaugo į pirmaujančią ne pelno tyrimų organizaciją. Grupė žinoma dėl savo darbo mokant ir propaguojant atviro mokslo normas natūralios kalbos apdorojimo srityje. Jie išleido įvairius atvirojo kodo didelių kalbų modelius ir dalyvauja mokslinių tyrimų projektuose, susijusiuose su AI suderinimu ir aiškinamumu. Jų LM diržai projektas tikriausiai yra pirmaujanti atvirojo kodo kalbos modelių vertinimo priemonė.
Phi-2 yra „Microsoft“ LLM, viršijanti savo svorį. Šis mažas, bet galingas modelis, išmokytas dirbti su sintetinių tekstų ir filtruotų svetainių mišiniu, puikiai atlieka tokias užduotis kaip atsakymas į klausimus, apibendrinimas ir vertimas. „Phi-2“ iš tikrųjų išsiskiria tuo, kad dėmesys sutelkiamas į samprotavimus ir kalbos supratimą, todėl našumas yra įspūdingas net ir be pažangių derinimo metodų.
Daugelis kompetentingų atvirojo kodo įterpimo modelių stiprina bendrą atvirojo kodo generuojamąją AI erdvę. Tai yra dabartinė atvirojo kodo naujausia technologija ir apima JAE-didelis-V1 ir daugiakalbis-e5-didelis .
Šioje nuolat augančioje srityje yra daug daugiau. Šis ribotas sąrašas yra tik pradžia.
Atvirojo kodo diskų naujovės
Atsižvelgdamos į itin atvirų inovacijų filosofiją, įmonės, kurios tikrai dalyvauja atvirojo kodo programinės įrangos kūrime, meta iššūkį tradicinėms konkurencinio pranašumo sampratoms pripažindamos, kad ne visas geras kodas ar puikios idėjos yra jų organizacijoje . Ši pamaina palaiko argumentas kad bendros naujovės atvirojo kodo ekosistemoje skatina spartesnį rinkos augimą, suteikdamos net mažesnėms programinės įrangos įmonėms ribotas MTTP lėšas. galimybė gauti naudos nuo atvirojo kodo programinėje įrangoje esančių MTTP pasekmių. Taip yra todėl, kad, priešingai nei tradicinis užsakomųjų paslaugų teikimas, atviros naujovės didina vidinius resursus pasitelkiant kolektyvinį bendruomenės intelektą, nesumažinant vidinių mokslinių tyrimų ir plėtros pastangų. Tai reiškia, kad atvirojo kodo programinės įrangos įmonėms nereikia aukoti savo biudžetų, kad galėtų vadovautis mintimis ir koduoti už savo organizacijos ribų.
Be to, atvirojo kodo programinės įrangos įmonės strategiškai skatina naujoves išleisdami kodą anksti ir dažnai , pripažįstant kumuliacinį inovacijų proceso pobūdį programinės įrangos bendruomenėje. Visa tai gali pasakyti tai, ką daugelis jau atpažįsta: atvirojo kodo programinė įranga skatina naujoves.
Atvirasis šaltinis skatina bendradarbiavimą
Per tinklų kūrimas atvirojo kodo programinės įrangos bendruomenėje verslininkai gali įgyvendinti tiek trumpalaikius, tiek ilgalaikius tikslus. Trumpalaikiai pelno tikslai kuria įmones, o ilgalaikiai pelno tikslai jas palaiko. Tuo pačiu metu šios tinklų pastangos išlaiko patį tinklą – augina jį kitam verslininkui. Gerai žinoma, kad atvirojo kodo platformos suteikia prieigą prie šaltinio kodo, todėl kūrėjai gali kurti naujinimus, papildinius ir kitas programinės įrangos dalis ir naudoti jas pagal savo poreikius. Šis konkretus bendradarbiavimo tipas patyrė bumą, kai platesnė programinės įrangos bendruomenė pradėjo naudoti Kubernetes. Dabar labiau nei bet kada šiuolaikinės technologijos veikia kartu su labai maža trintis ir gali būti beveik bet kur per kelias minutes.
Didelės technologijų įmonės pripažįsta šį gilų bendradarbiavimą, būdingą atvirojo kodo bendruomenei, kai jos laisvai išleidžia sistemas, bibliotekas ir kalbas, kurias sukūrė vidinių įrankių priežiūrai ir plėtrai. Tai darant pagilėja kūrėjų, galinčių dirbti su savo produktais, būrys ir pradedama nustatyti standartus, kaip panašios technologijos turėtų veikti. Tame pačiame „Atlantic“ straipsnyje cituojamas „Meta“ įkūrėjas Markas Zuckerbergas, sakęs, kad „mums buvo labai naudinga tai suteikti, nes dabar visi geriausi pramonės kūrėjai naudoja įrankius, kuriuos naudojame ir viduje“.
Atvirasis šaltinis sukuria atvirąjį kodą
Tai yra veiksniai, kodėl labai dažnai matome atvirojo kodo įmonių sinergiją. Atvirojo kodo AI ir ML įmonės natūraliai kurs sprendimus su kitais atvirojo kodo produktais nuo pagrindinių produktų, pvz., objektų saugojimo, iki visiško krūvos iki vizualizacijos įrankių. Kai viena atvirojo kodo įmonė žengia į priekį, mes visi tai darome. Šis darnus ir mišrus metodas tikriausiai yra geriausias mūsų pasirinkimas kuriant dirbtinį intelektą, kurio požiūris į žmogų yra orientuotas. Šios natūralios jėgos, būdingos atvirojo kodo AI poreikiui rinkoje, kartu su atvirojo kodo programinės įrangos naujovių ir bendradarbiavimo savybėmis paskatins dirbtinio intelekto duomenų krūvą atvirojo kodo.
Prisijunkite ir prisidėkite prie šio pokalbio bei mūsų bendruomenės parašydami mums el [email protected] arba siųsdami mums žinutę mūsų Slack kanale .