paint-brush
Open-Source: Sljedeći korak u AI revolucijipo@minio
109,673 čitanja
109,673 čitanja

Open-Source: Sljedeći korak u AI revoluciji

po MinIO6m2024/01/25
Read on Terminal Reader
Read this story w/o Javascript

Predugo; Čitati

Ovo istraživanje budućnosti umjetne inteligencije otvorenog izvornog koda će secirati "pretendente" i podržati one "prave" u razvoju umjetne inteligencije kako bi se otkrio pokretač inovacija koji je softver otvorenog koda koji bruji ispod svega toga. Suština je da će umjetna inteligencija otvorenog koda stvoriti hrpu podataka otvorenog koda.

People Mentioned

Mention Thumbnail
featured image - Open-Source: Sljedeći korak u AI revoluciji
MinIO HackerNoon profile picture
0-item
1-item


Zamislite budućnost u kojoj umjetna inteligencija nije zaključana u korporativnim trezorima, već izgrađena na otvorenom, ciglu po ciglu, od strane globalne zajednice inovatora. Tamo gdje suradnja, a ne konkurencija, potiče napredak, a etička razmatranja imaju jednaku težinu kao i sirovi učinak. Ovo nije znanstvena fantastika, to je revolucija otvorenog koda koja se sprema u srcu razvoja umjetne inteligencije. Ali Big Tech ima vlastitu agendu, maskirajući ograničene modele kao otvorene kode dok pokušava iskoristiti prednosti istinski otvorene zajednice.


Ogulimo slojeve koda i otkrijmo istinu iza ovih nastojanja. Ovo istraživanje budućnosti umjetne inteligencije otvorenog koda će secirati "pretendente" i podržati one "prave" u razvoju umjetne inteligencije kako bi se otkrio pokretač inovacija koji je softver otvorenog koda koji bruji ispod svega toga. Suština je da će umjetna inteligencija otvorenog koda stvoriti hrpu podataka otvorenog koda.


Potreba

Nedavni članak Mattea Wonga u The Atlantic, ' Nikada nije postojala 'otvorena' AI ' opisuje rastući trend u akademskoj i softverskoj zajednici za AI istinski otvorenog koda. "Ideja je stvoriti relativno transparentne modele koje javnost može lakše i jeftinije koristiti, proučavati i reproducirati, pokušavajući demokratizirati visoko koncentriranu tehnologiju koja bi mogla imati potencijal transformirati posao, policiju, slobodno vrijeme, pa čak i religiju." Taj isti Atlantic sugerira da velike tehnološke tvrtke poput Mete pokušavaju ispuniti ovu potrebu na tržištu 'otvorenim pranjem' svojih proizvoda. Oni preuzimaju kvalitete i pozitivnu reputaciju zajednice otvorenog izvornog koda, a da svoj proizvod uistinu ne koriste otvorenim izvornim kodom. Ali, ne postoji zamjena za pravu stvar. To je zato što pravi softver otvorenog izvornog koda pokreće inovacije i suradnju: dvije kvalitete koje su očajnički potrebne za odgovoran napredak s umjetnom inteligencijom.


Pretenderi

LLaMA 2 je veliki jezični model koji je stvorila Meta i koji se može besplatno koristiti i za istraživanje i za komercijalne svrhe. Neki su naveli da sugeriraju da je LLaMA 2 otvorenog koda. Međutim, Meta je uvela neka stroga ograničenja na korištenje svog modela. Na primjer, LLaMA 2 se ne može koristiti za poboljšanje bilo kojeg drugog velikog jezičnog modela. Stav koji se protivi tradicionalnom model privatne kolektivne inovacije otvorenog softvera koji promiče slobodno i otvoreno otkrivanje inovacija za dobrobit svih u softverskoj zajednici.


Meta je dodatno osakatila korištenje svog modela ne dopuštajući integraciju LLaMA 2 s proizvodima koji imaju 700 milijuna mjesečnih korisnika i ne otkrivajući na kojim podacima se obučava njihov model ili kod koji su koristili za njegovu izradu. Neotkrivanjem, Meta se otvara pitanjima inherentne pristranosti i slučajne diskriminacije. Model uvježban na diskriminirajućim podacima će servirati diskriminirajuće odgovore . Bez softverske zajednice u cjelini u mogućnosti pregledati kod korišten za izradu modela kako bi vidjeli jesu li ugrađene ikakve zaštite ili podatke korištene za njegovo treniranje, ostavljeni smo u mraku po pitanju ovih moralnih pitanja. U vremenu kada objavljeno istraživanje o umjetnoj inteligenciji više se bavi učinkom nego pravdom i poštuje ovo zamagljivanje je posebno uznemirujuće.


Oni Pravi

Mistral AI je stekao priznanje za svoje open-source velike jezične modele, posebice Mistral 7B i Mixtral 8x7B. Tvrtka nastoji osigurati široku dostupnost svojih AI modela, potičući pregled, modificiranje i ponovnu upotrebu od strane zajednice otvorenog softvera.


vLLM označava "vektorizirano posluživanje modela niske latencije" i knjižnica je otvorenog koda posebno dizajnirana za ubrzavanje i optimizaciju velikih jezičnih modela (LLM). To je moćan alat koji može značajno poboljšati izvedbu i upotrebljivost LLM-a. To ga čini vrijednim sredstvom za programere koji rade na raznim AI aplikacijama, od chatbota i virtualnih pomoćnika do stvaranja sadržaja i generiranja koda. Toliko da Mistral preporučuje korištenje vLLM-a kao poslužitelja za zaključivanje za modele 7B i 8x7B.


EleutherAI je neprofitni istraživački laboratorij za umjetnu inteligenciju koji je iz Discord poslužitelja za raspravu o GPT-3 izrastao u vodeću neprofitnu istraživačku organizaciju. Grupa je poznata po svom radu na obuci i promicanju otvorenih znanstvenih normi u obradi prirodnog jezika. Izdali su različite modele velikih jezika otvorenog koda i uključeni su u istraživačke projekte koji se odnose na usklađivanje i interpretabilnost umjetne inteligencije. Njihovo LM-uprtač projekt je vjerojatno vodeći alat otvorenog koda za procjenu jezičnih modela.


Phi-2 je Microsoftov LLM koji nadmašuje svoju težinu. Uvježban na mješavini sintetičkih tekstova i filtriranih web stranica, ovaj mali, ali moćni model izvrstan je u zadacima poput odgovaranja na pitanja, sažimanja i prijevoda. Ono što doista izdvaja Phi-2 je njegov fokus na razmišljanje i razumijevanje jezika, što dovodi do impresivnih performansi čak i bez naprednih tehnika usklađivanja.


Mnogi kompetentni modeli ugradnje otvorenog koda jačaju cjelokupni generativni AI prostor otvorenog koda. Ovo su trenutno stanje umjetnosti za otvoreni kod i uključuju UAE-Veliki-V1 i višejezični-e5-veliki .


Mnogo ih je više u ovom stalno rastućem području. Ovaj ograničeni popis samo je početak.


Otvoreni kod pokreće inovacije

Prihvaćajući filozofiju ekstremne otvorene inovacije, tvrtke koje istinski sudjeluju u razvoju softvera otvorenog koda dovode u pitanje tradicionalne predodžbe o konkurentskoj prednosti priznajući da ne nalaze se svi dobri kodovi ili sjajne ideje unutar njihove organizacije . Ovaj pomak podupire argument da zajedničke inovacije unutar ekosustava otvorenog koda dovode do bržeg rasta tržišta, osiguravajući čak i manjim softverskim tvrtkama ograničenija sredstva za istraživanje i razvoj. prilika za korist od prelijevanja istraživanja i razvoja prisutnih u softveru otvorenog koda. To je zato što, za razliku od tradicionalnog outsourcinga, otvorene inovacije povećava unutarnje resurse iskorištavanjem kolektivne inteligencije zajednice, bez umanjivanja internih napora u istraživanju i razvoju. Što znači da softverske tvrtke otvorenog izvornog koda ne moraju žrtvovati svoje proračune kako bi nastavile s misaonim vodstvom i kodiranjem izvan svoje organizacije.


Osim toga, softverske tvrtke otvorenog koda strateški potiču inovacije rano i često objavljivanje koda , prepoznajući kumulativnu prirodu procesa inovacija u softverskoj zajednici. Sve to da kažem nešto što mnogi već prepoznaju: softver otvorenog koda pokreće inovacije.


Otvoreni izvor potiče suradnju

Kroz umrežavanje u zajednici softvera otvorenog koda, poduzetnici mogu ispuniti i kratkoročne i dugoročne ciljeve. Kratkoročni profitni ciljevi grade tvrtke, a dugoročni ih održavaju. U isto vrijeme, ovaj napor umrežavanja samoodržava samu mrežu - razvijajući je za sljedećeg poduzetnika. Dobro je poznato da platforme otvorenog koda omogućuju pristup izvornom kodu, omogućujući programerima da kreiraju nadogradnje, dodatke i druge dijelove softvera te da ih koriste prema svojim zahtjevima. Ova posebna vrsta suradnje doživjela je procvat sa širokim prihvaćanjem Kubernetesa od strane šire softverske zajednice. Sada više nego ikad, moderne tehnologije rade zajedno uz vrlo malo trenja i mogu biti zajedno gotovo svugdje za nekoliko minuta.


Velike tehnološke tvrtke priznaju ovu duboku suradnju koja je svojstvena zajednici otvorenog izvornog koda kada slobodno izdaju okvire, biblioteke i jezike koje su stvorili za održavanje i razvoj internih alata. Na taj način produbljuje se skup programera sposobnih za rad na njihovim proizvodima i počinje postavljati standard za rad sličnih tehnologija. Taj isti Atlanticov članak citira osnivača Mete Marka Zuckerberga koji je rekao da je "za nas bilo vrlo dragocjeno pružiti to jer sada svi najbolji programeri u cijeloj industriji koriste alate koje i mi koristimo interno".


Open Source rađa Open Source

To su čimbenici zbog kojih vrlo često vidimo sinergije među tvrtkama otvorenog koda. Tvrtke otvorenog izvornog koda AI i ML prirodno će razvijati rješenja s drugim proizvodima otvorenog koda, od temeljnih proizvoda kao što je pohrana objekata do kompletnog skupa do alata za vizualizaciju. Kad jedna open-source tvrtka zakorači naprijed, svi to učinimo. Ovaj kohezivni i mješoviti pristup vjerojatno je naš najbolji izbor za razvoj umjetne inteligencije koja ima pristup usmjeren na čovjeka. Ove prirodne sile svojstvene tržišnoj potrebi za AI otvorenog koda u kombinaciji s kvalitetama softvera otvorenog koda inovacija i suradnje potaknut će otvoreni izvor podataka AI skupa.


Pridružite se i doprinesite ovom razgovoru i našoj zajednici slanjem e-pošte na adresu [email protected] ili nam pošaljete poruku na našem Slack kanalu .


Također objavljeno ovdje .