paint-brush
Nyílt forráskódú: Az AI forradalom következő lépéseáltal@minio
109,684 olvasmányok
109,684 olvasmányok

Nyílt forráskódú: Az AI forradalom következő lépése

által MinIO6m2024/01/25
Read on Terminal Reader
Read this story w/o Javascript

Túl hosszú; Olvasni

A nyílt forráskódú mesterséges intelligencia jövőjének ez a feltárása a mesterséges intelligencia fejlesztésének „színlelőit” boncolgatja, és a „valódiakat” védi, hogy feltárja az innovációs motort, amely a nyílt forráskódú szoftverek mögött dübörög. A lényeg az, hogy a nyílt forráskódú mesterséges intelligencia nyílt forráskódú adathalmazt fog szülni.

People Mentioned

Mention Thumbnail
featured image - Nyílt forráskódú: Az AI forradalom következő lépése
MinIO HackerNoon profile picture
0-item
1-item


Képzeljen el egy olyan jövőt, ahol a mesterséges intelligencia nincs bezárva a vállalati trezorokba, hanem a szabadban, tégláról téglára építi fel az újítók globális közössége. Ahol az együttműködés, nem a versengés ösztönzi a fejlődést, és az etikai megfontolások egyenlő súllyal bírnak a nyers teljesítménnyel. Ez nem sci-fi, hanem a nyílt forráskódú forradalom, amely a mesterséges intelligencia fejlesztésének szívében készül. A Big Technek azonban megvan a maga célja, amely a korlátozott modelleket nyílt forráskódként maszkolja, miközben megpróbálja kihasználni a valóban nyitott közösség előnyeit.


Hámozzuk le a kódrétegeket, és fedjük fel az igazságot ezen erőfeszítések mögött. A nyílt forráskódú mesterséges intelligencia jövőjének ez a feltárása a mesterséges intelligencia fejlesztésének „színlelőit” boncolgatja, és a „valódiakat” védi, hogy feltárja az innovációs motort, amely a nyílt forráskódú szoftverek mögött dübörög. A lényeg az, hogy a nyílt forráskódú mesterséges intelligencia nyílt forráskódú adathalmazt fog szülni.


A Szükség

Matteo Wong legutóbbi cikke az Atlanti-óceánban, Soha nem volt olyan, mint a „nyílt” AI ' írja le a valóban nyílt forráskódú mesterséges intelligencia iránti növekvő tendenciát az akadémiában és a szoftverközösségben. „Az ötlet az, hogy viszonylag átlátható modelleket hozzunk létre, amelyeket a közvélemény könnyebben és olcsóbban használhat, tanulmányozhat és reprodukálhat, megkísérelve demokratizálni egy nagyon koncentrált technológiát, amely képes átalakítani a munkát, a rendőrséget, a szabadidőt és még a vallást is.” Ugyanez az Atlantic azt sugallja, hogy a Big Tech cégek, mint a Meta, termékeik „nyílt mosásával” próbálják kielégíteni ezt az igényt a piacon. Felvállalják a nyílt forráskódú közösség tulajdonságait és pozitív hírnevét anélkül, hogy valóban nyílt forrású terméküket vásárolnák. Az igazit azonban semmi sem helyettesítheti. Ennek az az oka, hogy a valódi nyílt forráskódú szoftver ösztönzi az innovációt és az együttműködést: két olyan tulajdonságra, amelyekre égető szükség van a mesterséges intelligencia felelősségteljes előrehaladásához.


A tettesek

A LLaMA 2 a Meta által létrehozott nagy nyelvi modell, amely kutatási és kereskedelmi célokra egyaránt ingyenesen használható. Egyesek azt sugallják, hogy a LLaMA 2 nyílt forráskódú. A Meta azonban szigorú korlátozásokat vezetett be a modelljük használatára vonatkozóan. Például a LLaMA 2 nem használható semmilyen más nagy nyelvi modell fejlesztésére. Olyan álláspont, amely szembemegy a hagyományossal magán-kollektív innovációs modell nyílt szoftver, amely elősegíti az innováció szabad és nyílt feltárását a szoftverközösségben mindenki javára.


A Meta tovább bénította modelljük használatát, mivel nem engedélyezte a LLaMA 2 integrálását olyan termékekkel, amelyeknek havi 700 millió felhasználója van, és nem fedte fel, hogy a modellje milyen adatokra van kiképezve, illetve milyen kódot használtak felépítéséhez. A nyilvánosság elmulasztásával a Meta megnyílik az eredendő elfogultság és a véletlen diszkrimináció kérdései előtt. A diszkriminatív adatokra képzett modell diszkriminatív válaszokat szolgáltasson . Anélkül, hogy a teljes szoftverközösség megtekinthetné akár a modell felépítéséhez használt kódot, hogy lássák, beépítettek-e valamilyen biztosítékot, sem pedig a betanításhoz használt adatokat, homályban maradunk ezekkel az erkölcsi kérdésekkel kapcsolatban. Abban az időben, amikor publikált kutatást az AI-ról jobban foglalkozik a teljesítménnyel, mint az igazságossággal, és ez az elhomályosítás különösen zavaró.


Az Igaziak

Mistral AI elismerést szerzett nyílt forráskódú nagy nyelvi modelljeivel, nevezetesen a Mistral 7B-vel és a Mixtral 8x7B-vel. A vállalat arra törekszik, hogy széleskörű hozzáférést biztosítson mesterségesintelligencia-modelljeihez, ösztönözve a nyílt szoftverek közösségének felülvizsgálatát, módosítását és újrafelhasználását.


vLLM A "vektorizált alacsony késleltetésű modellszolgáltatás" rövidítése, és egy nyílt forráskódú könyvtár, amelyet kifejezetten a nagy nyelvi modellek (LLM) felgyorsítására és optimalizálására terveztek. Ez egy hatékony eszköz, amely jelentősen javíthatja az LLM-ek teljesítményét és használhatóságát. Ez értékes eszközzé teszi a különféle mesterségesintelligencia-alkalmazásokon dolgozó fejlesztők számára, a chatbotoktól és a virtuális asszisztensektől a tartalomkészítésig és a kódgenerálásig. Olyannyira, hogy a Mistral a vLLM használatát javasolja következtetési szerverként a 7B és 8x7B modellekhez.


EleutherAI egy non-profit mesterséges intelligencia kutatólaboratórium, amely a GPT-3 megvitatására szolgáló Discord szerverből vezető non-profit kutatószervezetté nőtte ki magát. A csoport a természetes nyelvi feldolgozás területén végzett nyílt tudományos normák képzésében és népszerűsítésében végzett munkájáról ismert. Különféle nyílt forráskódú nagy nyelvi modelleket adtak ki, és részt vesznek a mesterséges intelligencia igazításával és értelmezhetőségével kapcsolatos kutatási projektekben. Az övék LM-hám A projekt valószínűleg a vezető nyílt forráskódú értékelési eszköz a nyelvi modellekhez.


Phi-2 a Microsoft LLM-je, amely a súlya fölé üt. A szintetikus szövegek és a szűrt webhelyek keverékére kiképzett, kicsi, de erőteljes modell kiválóan teljesít az olyan feladatokban, mint a kérdések megválaszolása, az összegzés és a fordítás. Ami igazán megkülönbözteti a Phi-2-t, az az érvelésre és a nyelvi megértésre összpontosít, amely lenyűgöző teljesítményt eredményez még fejlett igazítási technikák nélkül is.


Számos hozzáértő nyílt forráskódú beágyazási modell erősíti az általános nyílt forráskódú generatív mesterséges intelligencia teret. Ezek a jelenlegi legkorszerűbbek a nyílt forráskódhoz, és magukban foglalják Egyesült Arab Emírségek-Nagy-V1 és többnyelvű-e5-nagy .


Sokkal több van ezen a folyamatosan növekvő területen. Ez a korlátozott lista csak a kezdet.


Nyílt forráskódú meghajtók innovációja

Az extrém nyitott innováció filozófiáját felkaroló vállalatok, amelyek valóban részt vesznek a nyílt forráskódú szoftverfejlesztésben, megkérdőjelezik a versenyelőny hagyományos fogalmait, elismerve, hogy nem minden jó kód vagy nagyszerű ötlet található a szervezetükön belül . Ez a váltás támogatja a érv hogy a nyílt forráskódú ökoszisztémán belüli megosztott innovációk gyorsabb piacnövekedéshez vezetnek, még a kisebb szoftvercégek számára is korlátozottabb kutatási és fejlesztési forrásokat biztosítanak. haszonszerzési lehetőség a nyílt forráskódú szoftverekben jelenlévő K+F tovagyűrűző hatásokból. Ennek az az oka, hogy a hagyományos outsourcinggel szemben a nyitott innováció növeli a belső erőforrásokat a közösség kollektív intelligenciájának kihasználásával a belső K+F erőfeszítések csökkentése nélkül. Ez azt jelenti, hogy a nyílt forráskódú szoftvercégeknek nem kell feláldozniuk a költségvetésüket azért, hogy szervezetükön kívül gondolkodjanak és kódoljanak.


Ezenkívül a nyílt forráskódú szoftvercégek stratégiailag ösztönzik az innovációt a kód korai és gyakori kiadása , felismerve az innovációs folyamat kumulatív jellegét a szoftverközösségben. Mindez azt jelenti, hogy sokan már felismerték: a nyílt forráskódú szoftver ösztönzi az innovációt.


A nyílt forráskód elősegíti az együttműködést

Keresztül hálózatépítés a nyílt forráskódú szoftverek közösségében a vállalkozók képesek rövid és hosszú távú célokat is teljesíteni. A rövid távú profitcélok vállalatokat építenek, a hosszú távú profitcélok pedig fenntartják azokat. Ugyanakkor ez a hálózatépítési erőfeszítés önmagában állandósítja magát a hálózatot – a következő vállalkozó számára fejleszti azt. Köztudott, hogy a nyílt forráskódú platformok hozzáférést biztosítanak a forráskódhoz, lehetővé téve a fejlesztők számára, hogy frissítéseket, beépülő modulokat és egyéb szoftvereket hozzanak létre, és ezeket igényeiknek megfelelően használják. Ez a fajta együttműködés a Kubernetes szélesebb körű szoftverközösség általi széles körű elterjedésével fellendülésnek indult. Most még jobban, mint valaha, a modern technológiák nagyon csekély súrlódás mellett működnek együtt, és percek alatt együtt lehetnek szinte bárhol.


A nagy technológiai vállalatok elismerik ezt a nyílt forráskódú közösségben rejlő mély együttműködést, amikor szabadon bocsátanak ki keretrendszereket, könyvtárakat és nyelveket, amelyeket belső eszközök karbantartására és fejlesztésére hoztak létre. Ezzel elmélyül azon fejlesztők köre, akik képesek dolgozni a termékeiken, és elkezdődik a hasonló technológiák működésének mércéje. Ugyanez az Atlantic cikk idézi a Meta alapítóját, Mark Zuckerberget, aki azt mondta, hogy „nagyon értékes volt számunkra ezt biztosítani, mert most az iparág legjobb fejlesztői olyan eszközöket használnak, amelyeket belsőleg is használunk”.


A nyílt forrás nyílt forráskódot szül

Ezek azok a tényezők, amelyek miatt nagyon gyakran látunk szinergiákat a nyílt forráskódú vállalatok között. A nyílt forráskódú AI- és ML-vállalatok természetesen más nyílt forráskódú termékekkel is fejlesztenek megoldásokat, az alaptermékektől, például az objektumtárolástól a veremben egészen a vizualizációs eszközökig. Amikor egy nyílt forráskódú vállalat előrelép, mindannyian megtesszük. Ez az összefüggő és vegyes megközelítés valószínűleg a legjobb megoldásunk az emberközpontú megközelítést alkalmazó mesterséges intelligencia fejlesztésére. A nyílt forráskódú mesterséges intelligencia iránti piaci igényben rejlő természetes erők, valamint a nyílt forráskódú szoftverek innovációs és együttműködési tulajdonságai együttesen vezetik majd a nyílt forráskódú mesterséges intelligencia-adathalmazt.


Kérjük, csatlakozzon és járuljon hozzá ehhez a beszélgetéshez és közösségünkhöz a következő e-mail címen keresztül [email protected] vagy küldjön nekünk üzenetet a Slack csatornánkon .


Itt is megjelent.