paint-brush
Oopbron: Die volgende stap in KI-revolusiedeur@minio
109,673 lesings
109,673 lesings

Oopbron: Die volgende stap in KI-revolusie

deur MinIO6m2024/01/25
Read on Terminal Reader
Read this story w/o Javascript

Te lank; Om te lees

Hierdie verkenning van die toekoms van oopbron-KI sal die "pretenders" dissekteer en die "regte" in KI-ontwikkeling verdedig om die innovasie-enjin te ontbloot wat oopbronsagteware is wat onder dit alles neurie. Die slotsom is dat oopbron-KI 'n oopbrondatastapel sal verwek.

People Mentioned

Mention Thumbnail
featured image - Oopbron: Die volgende stap in KI-revolusie
MinIO HackerNoon profile picture
0-item
1-item


Stel jou 'n toekoms voor waar KI nie in korporatiewe kluise opgesluit word nie, maar in die oopte gebou word, steen vir steen, deur 'n globale gemeenskap van innoveerders. Waar samewerking, nie mededinging nie, vooruitgang aanwakker, en etiese oorwegings gelyke gewig dra as rou prestasie. Dit is nie wetenskapfiksie nie, dit is die oopbron- revolusie wat in die hart van KI-ontwikkeling broei. Maar Big Tech het sy eie agenda, wat beperkte modelle as oopbron masker terwyl hulle probeer om die voordele van 'n werklik oop gemeenskap te pluk.


Kom ons trek die lae kode terug en onthul die waarheid agter hierdie pogings. Hierdie verkenning van die toekoms van oopbron-KI sal die "pretenders" dissekteer en die "regte" in KI-ontwikkeling bekamp om die innovasie-enjin te ontbloot wat oopbronsagteware is wat onder dit alles neurie. Die slotsom is dat oopbron-KI 'n oopbrondatastapel sal verwek.


Die Behoefte

'n Onlangse artikel deur Matteo Wong in The Atlantic, ' Daar was nog nooit so iets soos 'oop' KI nie ' beskryf 'n groeiende neiging in die akademie en die sagtewaregemeenskap vir werklik oopbron KI. "Die idee is om relatief deursigtige modelle te skep wat die publiek makliker en goedkoper kan gebruik, bestudeer en reproduseer, en probeer om 'n hoogs gekonsentreerde tegnologie te demokratiseer wat die potensiaal kan hê om werk, polisie, ontspanning en selfs godsdiens te transformeer." Dieselfde Atlantic stel voor dat Big Tech-maatskappye soos Meta hierdie behoefte in die mark probeer vul deur hul produkte 'oop te was'. Hulle aanvaar die kwaliteite en positiewe reputasie van die oopbrongemeenskap sonder om werklik hul produk oop te verkry. Maar daar is geen plaasvervanger vir die regte ding nie. Dit is omdat ware oopbronsagteware innovasie en samewerking dryf: twee eienskappe wat desperaat nodig is om met KI verantwoordelik vorentoe te beweeg.


Die Pretenders

LLaMA 2, is 'n groot taalmodel geskep deur Meta wat gratis is om te gebruik vir beide navorsing en kommersiële gebruike. Sommige lei om voor te stel dat LLaMA 2 oopbron is. Meta het egter 'n paar ernstige beperkings op die gebruik van hul model geïmplementeer. LLaMA 2 kan byvoorbeeld nie gebruik word om enige ander groot taalmodel te verbeter nie. 'n Posisie wat teen die tradisionele ingaan private kollektiewe innovasiemodel van oop sagteware wat die vrye en oop openbaring van innovasie bevorder tot voordeel van almal in die sagteware gemeenskap.


Meta het die gebruik van hul model verder lamgelê deur nie integrasie van LLaMA 2 toe te laat met produkte wat 700 miljoen maandelikse gebruikers het nie en deur nie bekend te maak op watter data hul model opgelei is of die kode wat hulle gebruik het om dit te bou nie. Deur dit nie bekend te maak nie, stel Meta homself oop vir vrae van inherente vooroordeel en toevallige diskriminasie. 'n Model wat op diskriminerende data opgelei is, sal diskriminerende reaksies lewer . Sonder dat die sagtewaregemeenskap in die algemeen die kode kan sien wat gebruik is om die model te bou om te sien of enige beveiligingsmaatreëls ingebou is of die data wat gebruik is om dit op te lei, word ons in die duister gelaat oor hierdie morele vrae. In 'n tyd wanneer gepubliseerde navorsing oor KI is meer gemoeid met prestasie as geregtigheid en respek is hierdie verduistering besonder ontstellend.


Die Regte

Mistral AI het erkenning gekry vir sy oopbron-groottaalmodelle, veral Mistral 7B en Mixtral 8x7B. Die maatskappy streef daarna om breë toeganklikheid tot sy KI-modelle te verseker, en moedig hersiening, wysiging en hergebruik deur die oop sagtewaregemeenskap aan.


vLLM staan vir "vectorized low-latency model serving" en is 'n oopbron-biblioteek wat spesifiek ontwerp is om groot taalmodelle (LLM's) te bespoedig en te optimaliseer. Dit is 'n kragtige instrument wat die werkverrigting en bruikbaarheid van LLM's aansienlik kan verbeter. Dit maak dit 'n waardevolle bate vir ontwikkelaars wat aan 'n verskeidenheid KI-toepassings werk, van kletsbotte en virtuele assistente tot inhoudskepping en kodegenerering. Soveel so dat Mistral aanbeveel om vLLM as die afleidingsbediener vir die 7B- en 8x7B-modelle te gebruik.


EleutherAI is 'n nie-winsgewende KI-navorsingslaboratorium wat gegroei het van 'n Discord-bediener vir die bespreking van GPT-3 tot 'n toonaangewende nie-winsgewende navorsingsorganisasie. Die groep is bekend vir sy werk in die opleiding en bevordering van oop wetenskapnorme in Natuurlike Taalverwerking. Hulle het verskeie oopbron-groottaalmodelle vrygestel en is betrokke by navorsingsprojekte wat verband hou met KI-belyning en interpreteerbaarheid. Hulle LM-Harness projek is waarskynlik die toonaangewende oopbron-evalueringsinstrument vir taalmodelle.


Phi-2 is Microsoft se LLM wat bo sy gewig slaan. Hierdie klein, maar kragtige model, wat opgelei is op 'n mengsel van sintetiese tekste en gefiltreerde webwerwe, blink uit by take soos die beantwoording van vrae, opsomming en vertaling. Wat Phi-2 werklik onderskei, is sy fokus op redenering en taalbegrip, wat lei tot indrukwekkende prestasie selfs sonder gevorderde belyningstegnieke.


Baie bekwame oopbron-inbeddingsmodelle versterk die algehele oopbron generatiewe KI-ruimte. Dit is die huidige state-of-the-art vir oopbron en sluit in VAE-Groot-V1 en meertalige-e5-groot .


Daar is baie meer in hierdie steeds groeiende veld. Hierdie beperkte lys is net 'n begin.


Oopbron dryf innovasie aan

Met 'n filosofie van uiterste oop innovasie, daag maatskappye wat werklik deelneem aan oopbronsagteware-ontwikkeling tradisionele idees van mededingende voordeel uit deur te erken dat nie alle goeie kodes of goeie idees is in hul organisasie geleë nie . Hierdie verskuiwing ondersteun die argument dat gedeelde innovasies binne die oopbron-ekosisteem lei tot vinniger markgroei, wat selfs kleiner sagtewarefirmas met meer beperkte R&D-fondse die geleentheid om voordeel te trek van R&D-oorvloeisels wat in oopbronsagteware voorkom. Dit is omdat, in teenstelling met tradisionele uitkontraktering, oop innovasie verbeter interne hulpbronne deur die kollektiewe intelligensie van die gemeenskap te benut, sonder om interne R&D-pogings te verminder. Dit beteken dat oopbronsagtewaremaatskappye nie hul begrotings hoef op te offer om denkleierskap en kode buite hul organisasie na te streef nie.


Boonop dryf oopbronsagtewaremaatskappye strategies innovasie deur kode vroeg en gereeld vrystel , met die erkenning van die kumulatiewe aard van die innovasieproses in die sagtewaregemeenskap. Dit alles om iets te sê wat baie reeds erken: oopbronsagteware dryf innovasie.


Oopbron bevorder samewerking

Deur netwerk in die oopbronsagtewaregemeenskap is entrepreneurs in staat om beide korttermyn- en langtermyndoelwitte te bereik. Korttermyn winsdoelwitte bou maatskappye en langtermyn winsdoelwitte handhaaf dit. Terselfdertyd hou hierdie netwerkpoging die netwerk self voort – dit laat groei vir die volgende entrepreneur. Dit is welbekend dat oopbronplatforms toegang tot die bronkode bied, wat ontwikkelaars in staat stel om opgraderings, inproppe en ander stukke sagteware te skep en dit volgens hul vereistes te gebruik. Hierdie spesifieke soort samewerking het 'n oplewing beleef met die wye aanvaarding van Kubernetes deur die breër sagtewaregemeenskap. Moderne tegnologieë werk nou meer as ooit saam met baie min wrywing en kan amper enige plek binne minute saam wees.


Big Tech-maatskappye erken hierdie diepgaande samewerking wat inherent is aan die oopbrongemeenskap wanneer hulle vryelik raamwerke, biblioteke en tale vrystel wat hulle geskep het om interne gereedskap te onderhou en te ontwikkel. Deur dit te doen, verdiep die poel ontwikkelaars wat in staat is om aan hul produkte te werk en begin die standaard stel vir hoe soortgelyke tegnologieë moet werk. Dieselfde Atlantic-artikel haal Meta-stigter Mark Zuckerberg aan wat sê dit was "baie waardevol vir ons om dit te voorsien, want nou gebruik al die beste ontwikkelaars regoor die bedryf nutsgoed wat ons ook intern gebruik".


Oopbron verwek Oopbron

Dit is faktore waarom ons baie dikwels sinergieë tussen oopbronmaatskappye sien. Oopbron KI- en ML-maatskappye sal natuurlik oplossings met ander oopbronprodukte ontwikkel, van grondprodukte soos objekberging tot die hele stapel tot visualiseringsinstrumente. Wanneer een oopbronmaatskappy vorentoe tree, doen ons almal dit. Hierdie samehangende en gemengde benadering is waarskynlik ons beste opsie vir die ontwikkeling van KI wat 'n mensgesentreerde benadering volg. Hierdie natuurlike kragte wat inherent is aan die markbehoefte aan oopbron-KI, gekombineer met die eienskappe van oopbronsagteware van innovasie en samewerking, sal die KI-datastapel oopbron aandryf.


Sluit asseblief aan en dra by tot hierdie gesprek en ons gemeenskap deur ons te e-pos by [email protected] of stuur vir ons 'n boodskap op ons Slack-kanaal .


Ook hier gepubliseer.