paint-brush
Atvērtais pirmkoda: nākamais solis AI revolūcijāautors@minio
109,673 lasījumi
109,673 lasījumi

Atvērtais pirmkoda: nākamais solis AI revolūcijā

autors MinIO6m2024/01/25
Read on Terminal Reader
Read this story w/o Javascript

Pārāk ilgi; Lasīt

Šī atvērtā pirmkoda mākslīgā intelekta nākotnes izpēte noskaidros mākslīgā intelekta izstrādē “pretendentus” un cīnīsies par “īstajiem”, lai atklātu inovāciju dzinēju, kas ir atvērtā pirmkoda programmatūra. Apakšējā līnija ir tāda, ka atvērtā pirmkoda AI radīs atvērtā koda datu steku.

People Mentioned

Mention Thumbnail
featured image - Atvērtais pirmkoda: nākamais solis AI revolūcijā
MinIO HackerNoon profile picture
0-item
1-item


Iedomājieties nākotni, kurā mākslīgais intelekts nav ieslodzīts korporatīvajās glabātuvēs, bet gan globāla novatoru kopiena, kas ķieģelis pa ķieģelim tiek būvēts atklātā telpā. Ja sadarbība, nevis konkurence, veicina progresu, un ētiski apsvērumi ir vienādi ar neapstrādātu sniegumu. Šī nav zinātniskā fantastika, tā ir atvērtā pirmkoda revolūcija, kas top AI attīstības centrā. Taču Big Tech ir sava darba kārtība, maskējot ierobežotus modeļus kā atvērtā koda avotus, vienlaikus mēģinot gūt labumu no patiesi atvērtas kopienas.


Atbrīvosim koda slāņus un atklāsim patiesību, kas slēpjas aiz šiem centieniem. Šī atvērtā pirmkoda mākslīgā intelekta nākotnes izpēte noskaidros mākslīgā intelekta attīstības “pretendējus” un cīnīsies par “īstajiem”, lai atklātu inovāciju dzinēju, kas ir atvērtā pirmkoda programmatūra. Apakšējā līnija ir tāda, ka atvērtā koda AI radīs atvērtā koda datu steku.


Vajadzība

Nesenais Matteo Wong raksts žurnālā The Atlantic, Nekad nav bijis tādas lietas kā “atvērtais” AI ' apraksta pieaugošo tendenci akadēmiskajā vidē un programmatūras kopienā pēc patiesi atvērtā pirmkoda AI. "Ideja ir izveidot salīdzinoši caurspīdīgus modeļus, kurus sabiedrība var vieglāk un lētāk izmantot, pētīt un reproducēt, mēģinot demokratizēt ļoti koncentrētu tehnoloģiju, kas var pārveidot darbu, policiju, atpūtu un pat reliģiju." Tas pats Atlantic liek domāt, ka Big Tech uzņēmumi, piemēram, Meta, cenšas apmierināt šo vajadzību tirgū, "mazgājot" savus produktus. Viņi uzņemas atvērtā pirmkoda kopienas īpašības un pozitīvo reputāciju, patiesi neizmantojot savu produktu. Taču īsto nevar aizstāt nekas. Tas ir tāpēc, ka patiesa atvērtā pirmkoda programmatūra veicina inovāciju un sadarbību: divas īpašības, kas ir ļoti nepieciešamas, lai atbildīgi virzītos uz priekšu ar AI.


Izlikties

LLaMA 2 ir liels Meta izveidots valodas modelis, ko var brīvi izmantot gan pētniecībai, gan komerciāliem nolūkiem. Daži liek domāt, ka LLaMA 2 ir atvērtā koda avots. Tomēr Meta ir ieviesusi dažus nopietnus ierobežojumus sava modeļa izmantošanai. Piemēram, LLaMA 2 nevar izmantot neviena cita liela valodas modeļa uzlabošanai. Nostāja, kas ir pretrunā ar tradicionālo privātās kolektīvās inovācijas modelis atvērta programmatūra, kas veicina bezmaksas un atklātu inovāciju atklāšanu, kas ir noderīga ikvienam programmatūras kopienas dalībniekam.


Meta vēl vairāk kropļoja viņu modeļa izmantošanu, neļaujot integrēt LLaMA 2 ar produktiem, kuriem mēnesī ir 700 miljoni lietotāju, un neatklājot, uz kādiem datiem viņu modelis ir apmācīts vai kādu kodu viņi izmantoja tā izveidošanai. Neizpaužot informāciju, Meta atklāj jautājumus par iedzimtu aizspriedumu un nejaušu diskrimināciju. Modelis, kas apmācīts par diskriminējošiem datiem sniegt diskriminējošas atbildes . Ja programmatūras kopiena kopumā nevar skatīt modeļa izveidošanai izmantoto kodu, lai redzētu, vai ir iebūvēti drošības pasākumi, vai tā apmācīšanai izmantotos datus, mēs esam palikuši tumsā par šiem morāles jautājumiem. Laikā, kad publicēja pētījumu par AI ir vairāk norūpējies par sniegumu nekā taisnīgumu, un cieņa pret šo apmulsumu ir īpaši satraucoša.


Īstie

Mistral AI ir guvis atzinību ar saviem atvērtā pirmkoda lielo valodu modeļiem, īpaši Mistral 7B un Mixtral 8x7B. Uzņēmums cenšas nodrošināt plašu piekļuvi saviem AI modeļiem, mudinot pārskatīt, modificēt un atkārtoti izmantot atvērtās programmatūras kopienu.


vLLM apzīmē "vektorizētu zema latentuma modeļu apkalpošanu" un ir atvērtā pirmkoda bibliotēka, kas īpaši izstrādāta, lai paātrinātu un optimizētu lielo valodu modeļus (LLM). Tas ir spēcīgs rīks, kas var ievērojami uzlabot LLM veiktspēju un lietojamību. Tas padara to par vērtīgu līdzekli izstrādātājiem, kuri strādā ar dažādām AI lietojumprogrammām, sākot no tērzēšanas robotiem un virtuālajiem palīgiem līdz satura izveidei un koda ģenerēšanai. Tik daudz, ka Mistral iesaka izmantot vLLM kā secinājumu serveri 7B un 8x7B modeļiem.


EleutherAI ir bezpeļņas AI pētniecības laboratorija, kas no Discord servera GPT-3 diskusijām ir kļuvusi par vadošo bezpeļņas pētniecības organizāciju. Grupa ir pazīstama ar savu darbu, apmācot un veicinot atvērtās zinātnes normas dabiskās valodas apstrādē. Viņi ir izlaiduši dažādus atvērtā koda lielu valodu modeļus un ir iesaistīti pētniecības projektos, kas saistīti ar AI pielīdzināšanu un interpretējamību. Viņu LM-uzkabes projekts, iespējams, ir vadošais atvērtā koda vērtēšanas rīks valodu modeļiem.


Phi-2 ir Microsoft LLM, kas pārspēj savu svaru. Šis mazais, bet jaudīgais modelis ir apmācīts sintētisku tekstu un filtrētu vietņu sajaukšanai, un tas ir izcils tādos uzdevumos kā atbildes uz jautājumiem, apkopošana un tulkošana. Tas, kas patiešām atšķir Phi-2, ir tā koncentrēšanās uz argumentāciju un valodas izpratni, kas nodrošina iespaidīgu veiktspēju pat bez uzlabotām izlīdzināšanas metodēm.


Daudzi kompetenti atvērtā pirmkoda iegulšanas modeļi stiprina kopējo atvērtā koda ģeneratīvo AI telpu. Tie ir pašreizējie jaunākie atvērtā pirmkoda sasniegumi un ietver AAE-Lielais-V1 un daudzvalodu-e5-largel .


Šajā arvien augošajā jomā ir daudz vairāk. Šis ierobežotais saraksts ir tikai sākums.


Atvērtā koda disku inovācijas

Aptverot ārkārtīgi atvērtas inovācijas filozofiju, uzņēmumi, kas patiesi piedalās atvērtā pirmkoda programmatūras izstrādē, izaicina tradicionālos priekšstatus par konkurences priekšrocībām, atzīstot, ka ne visi labie kodi vai lieliskās idejas atrodas viņu organizācijā . Šī maiņa atbalsta arguments ka kopīgas inovācijas atvērtā pirmkoda ekosistēmā nodrošina ātrāku tirgus izaugsmi, nodrošinot pat mazākām programmatūras firmām ierobežotākus pētniecības un attīstības līdzekļus. iespēja gūt labumu atklātā pirmkoda programmatūrā. Tas ir tāpēc, ka atšķirībā no tradicionālajiem ārpakalpojumiem ir atvērta inovācija palielina iekšējos resursus izmantojot kopienas kolektīvo inteliģenci, nemazinot iekšējos pētniecības un attīstības centienus. Tas nozīmē, ka atvērtā pirmkoda programmatūras uzņēmumiem nav jāupurē savi budžeti, lai īstenotu domu vadību un kodētu ārpus savas organizācijas.


Turklāt atvērtā pirmkoda programmatūras uzņēmumi stratēģiski virza inovācijas koda izlaišana agri un bieži , atzīstot inovācijas procesa kumulatīvo raksturu programmatūras kopienā. Tas viss liecina par to, ko daudzi jau atpazīst: atvērtā pirmkoda programmatūra veicina inovāciju.


Atvērtā pirmkoda veicina sadarbību

Caur tīklu veidošana atvērtā pirmkoda programmatūras kopienā uzņēmēji spēj izpildīt gan īstermiņa, gan ilgtermiņa mērķus. Īstermiņa peļņas mērķi veido uzņēmumus, un ilgtermiņa peļņas mērķi tos uztur. Tajā pašā laikā šie tīkla centieni stiprina pašu tīklu, attīstot to nākamajam uzņēmējam. Ir labi zināms, ka atvērtā pirmkoda platformas nodrošina piekļuvi avota kodam, ļaujot izstrādātājiem izveidot jauninājumus, spraudņus un citas programmatūras daļas un izmantot tās atbilstoši savām prasībām. Šis konkrētais sadarbības veids piedzīvoja uzplaukumu, jo plašāka programmatūras kopiena plaši pieņēma Kubernetes. Tagad vairāk nekā jebkad agrāk modernās tehnoloģijas darbojas kopā ar ļoti mazu berzi un var būt dažu minūšu laikā kopā gandrīz jebkur.


Lielie tehnoloģiju uzņēmumi atzīst šo dziļo sadarbību, kas raksturīga atvērtā pirmkoda kopienai, brīvi izlaižot ietvarus, bibliotēkas un valodas, kuras tie izveidojuši, lai uzturētu un izstrādātu iekšējos rīkus. Tādējādi tiek padziļināts izstrādātāju kopums, kas spēj strādāt pie saviem produktiem, un tiek sākts noteikt standartu tam, kā vajadzētu darboties līdzīgām tehnoloģijām. Tajā pašā Atlantijas rakstā citēts Meta dibinātājs Marks Cukerbergs, kurš teica, ka “mums ir bijis ļoti vērtīgi to nodrošināt, jo tagad visi labākie izstrādātāji visā nozarē izmanto rīkus, kurus mēs izmantojam arī iekšēji”.


Atvērtais avots rada atvērto avotu

Šie ir faktori, kāpēc mēs ļoti bieži redzam sinerģiju starp atvērtā pirmkoda uzņēmumiem. Atvērtā pirmkoda AI un ML uzņēmumi, protams, izstrādās risinājumus ar citiem atvērtā pirmkoda produktiem, sākot no pamata produktiem, piemēram, objektu glabāšanas, līdz pat vizualizācijas rīkiem. Kad viens atvērtā pirmkoda uzņēmums virzās uz priekšu, mēs visi to darām. Šī vienotā un jauktā pieeja, iespējams, ir mūsu labākā izvēle, lai izstrādātu AI, kas izmanto uz cilvēku vērstu pieeju. Šie dabiskie spēki, kas raksturīgi tirgus nepieciešamībai pēc atvērtā pirmkoda AI, apvienojumā ar atvērtā pirmkoda programmatūras inovāciju un sadarbības īpašībām, virzīs AI datu kopu atvērtā pirmkoda.


Lūdzu, pievienojieties šai sarunai un mūsu kopienai un sniedziet savu ieguldījumu, nosūtot mums e-pastu uz [email protected] vai nosūtot mums ziņojumu mūsu Slack kanālā .


Publicēts arī šeit .