paint-brush
Open-Source: il prossimo passo nella rivoluzione dell'intelligenza artificialedi@minio
109,846 letture
109,846 letture

Open-Source: il prossimo passo nella rivoluzione dell'intelligenza artificiale

di MinIO6m2024/01/25
Read on Terminal Reader
Read this story w/o Javascript

Troppo lungo; Leggere

Questa esplorazione del futuro dell'IA open source analizzerà i "pretendenti" e sosterrà quelli "veri" nello sviluppo dell'IA per scoprire il motore dell'innovazione che è il software open source che ronza sotto tutto questo. La conclusione è che l'IA open source genererà uno stack di dati open source.

People Mentioned

Mention Thumbnail
featured image - Open-Source: il prossimo passo nella rivoluzione dell'intelligenza artificiale
MinIO HackerNoon profile picture
0-item
1-item


Immagina un futuro in cui l'IA non è chiusa nei caveau aziendali, ma costruita all'aperto, mattone dopo mattone, da una comunità globale di innovatori. Dove la collaborazione, non la competizione, alimenta i progressi e le considerazioni etiche hanno lo stesso peso delle prestazioni grezze. Questa non è fantascienza, è la rivoluzione open source che fermenta nel cuore dello sviluppo dell'IA. Ma Big Tech ha la sua agenda, mascherando modelli limitati come open source mentre tenta di raccogliere i benefici di una comunità veramente aperta.


Sbucciamo gli strati di codice e sveliamo la verità dietro questi sforzi. Questa esplorazione del futuro dell'IA open source analizzerà i "pretendenti" e sosterrà quelli "veri" nello sviluppo dell'IA per scoprire il motore dell'innovazione che è il software open source che ronza sotto tutto questo. La conclusione è che l'IA open source genererà uno stack di dati open source.


La necessità

Un recente articolo di Matteo Wong su The Atlantic, ' Non è mai esistita un'intelligenza artificiale "aperta" ' descrive una tendenza crescente nel mondo accademico e nella comunità del software per un'intelligenza artificiale veramente open source. "L'idea è di creare modelli relativamente trasparenti che il pubblico possa usare, studiare e riprodurre più facilmente ed economicamente, tentando di democratizzare una tecnologia altamente concentrata che potrebbe avere il potenziale di trasformare il lavoro, la polizia, il tempo libero e persino la religione". Lo stesso Atlantic suggerisce che le grandi aziende tecnologiche come Meta stanno cercando di soddisfare questa esigenza nel mercato "open-washing" dei loro prodotti. Stanno assumendo le qualità e la reputazione positiva della comunità open source senza rendere veramente open source il loro prodotto. Ma non esiste un sostituto per la cosa reale. Questo perché il vero software open source guida l'innovazione e la collaborazione: due qualità di cui c'è disperatamente bisogno per andare avanti con l'intelligenza artificiale in modo responsabile.


I Pretendenti

LLaMA 2 è un modello linguistico di grandi dimensioni creato da Meta , che è gratuito da usare sia per scopi di ricerca che commerciali. Ciò ha portato alcuni a suggerire che LLaMA 2 sia open source. Tuttavia, Meta ha implementato alcune severe restrizioni sull'uso del suo modello. Ad esempio, LLaMA 2 non può essere utilizzato per migliorare nessun altro modello linguistico di grandi dimensioni. Una posizione che va contro la tradizionale modello di innovazione collettiva privata del software aperto che promuove la divulgazione libera e aperta dell'innovazione a vantaggio di tutti nella comunità del software.


Meta ha ulteriormente paralizzato l'uso del suo modello non consentendo l'integrazione di LLaMA 2 con prodotti che hanno 700 milioni di utenti mensili e non divulgando su quali dati è stato addestrato il suo modello o il codice che ha utilizzato per costruirlo. Non divulgando, Meta si sta esponendo a questioni di pregiudizio intrinseco e discriminazione accidentale. Un modello addestrato su dati discriminatori sarà fornire risposte discriminatorie . Senza che la comunità software in generale possa visualizzare il codice utilizzato per costruire il modello per vedere se sono state integrate delle misure di sicurezza o i dati utilizzati per addestrarlo, rimaniamo all'oscuro di queste questioni morali. In un'epoca in cui ricerca pubblicata sull'intelligenza artificiale è più interessato alle prestazioni che alla giustizia e al rispetto; questa confusione è particolarmente inquietante.


Quelli veri

Mistral AI ha ottenuto riconoscimenti per i suoi modelli di linguaggio di grandi dimensioni open source, in particolare Mistral 7B e Mixtral 8x7B. L'azienda si impegna a garantire un'ampia accessibilità ai suoi modelli di intelligenza artificiale, incoraggiando la revisione, la modifica e il riutilizzo da parte della comunità del software aperto.


Laurea triennale in giurisprudenza sta per "vectorized low-latency model serving" ed è una libreria open source specificamente progettata per velocizzare e ottimizzare i large language models (LLM). È uno strumento potente che può migliorare significativamente le prestazioni e l'usabilità degli LLM. Ciò lo rende una risorsa preziosa per gli sviluppatori che lavorano su una varietà di applicazioni AI, dai chatbot e assistenti virtuali alla creazione di contenuti e alla generazione di codice. Tanto che Mistral consiglia di utilizzare vLLM come server di inferenza per i modelli 7B e 8x7B.


EleutherAI è un laboratorio di ricerca AI senza scopo di lucro che è cresciuto da un server Discord per discutere di GPT-3 a un'organizzazione di ricerca leader senza scopo di lucro. Il gruppo è noto per il suo lavoro nella formazione e nella promozione di norme di scienza aperta nell'elaborazione del linguaggio naturale. Hanno rilasciato vari modelli di linguaggio di grandi dimensioni open source e sono coinvolti in progetti di ricerca correlati all'allineamento e all'interpretabilità dell'AI. Il loro LM-Imbracatura Il progetto è probabilmente il principale strumento di valutazione open source per i modelli linguistici.


Phi-2 è l'LLM di Microsoft che colpisce più del dovuto. Addestrato su una miscela di testi sintetici e siti Web filtrati, questo piccolo ma potente modello eccelle in attività come la risposta alle domande, la sintesi e la traduzione. Ciò che distingue davvero Phi-2 è la sua attenzione al ragionamento e alla comprensione del linguaggio, che porta a prestazioni impressionanti anche senza tecniche di allineamento avanzate.


Molti modelli di embedding open source competenti stanno rafforzando lo spazio AI generativo open source complessivo. Questi sono lo stato dell'arte attuale per l'open source e includono Emirati Arabi Uniti-Grande-V1 E multilingue-e5-largel .


Ce ne sono molti altri in questo campo in continua crescita. Questa lista limitata è solo un inizio.


L'open source guida l'innovazione

Abbracciando una filosofia di innovazione aperta estrema, le aziende che partecipano realmente allo sviluppo di software open source sfidano le nozioni tradizionali di vantaggio competitivo riconoscendo che non tutto il buon codice o le grandi idee risiedono all'interno della loro organizzazione Questo spostamento supporta il discussione che le innovazioni condivise all'interno dell'ecosistema open source portano a una crescita più rapida del mercato, fornendo anche alle aziende di software più piccole fondi di ricerca e sviluppo più limitati opportunità di beneficio dagli spillover di R&S presenti nel software open source. Questo perché, a differenza dell'outsourcing tradizionale, l'innovazione aperta potenzia le risorse interne sfruttando l'intelligenza collettiva della comunità, senza diminuire gli sforzi interni di R&S. Ciò significa che le aziende di software open source non devono sacrificare i loro budget per perseguire la leadership di pensiero e il codice al di fuori della loro organizzazione.


Inoltre, le aziende di software open source guidano strategicamente l’innovazione rilasciare il codice in anticipo e spesso , riconoscendo la natura cumulativa del processo di innovazione nella comunità del software. Tutto ciò per dire qualcosa che molti già riconoscono: il software Open Source guida l'innovazione.


L'open source promuove la collaborazione

Attraverso messa in rete nella comunità del software open source, gli imprenditori sono in grado di soddisfare obiettivi sia a breve che a lungo termine. Gli obiettivi di profitto a breve termine creano aziende e gli obiettivi di profitto a lungo termine le sostengono. Allo stesso tempo, questo sforzo di networking autoperpetua la rete stessa, facendola crescere per il prossimo imprenditore. È risaputo che le piattaforme open source forniscono accesso al codice sorgente, consentendo agli sviluppatori di creare aggiornamenti, plug-in e altri software e di utilizzarli in base alle proprie esigenze. Questo particolare tipo di collaborazione ha sperimentato un boom con l'ampia adozione di Kubernetes da parte della più ampia comunità del software. Ora più che mai, le tecnologie moderne lavorano insieme con pochissimi attriti e possono essere insieme in pochi minuti quasi ovunque.


Le grandi aziende tecnologiche riconoscono questa profonda collaborazione insita nella comunità open source quando rilasciano liberamente framework, librerie e linguaggi che hanno creato per mantenere e sviluppare strumenti interni. Ciò amplia il bacino di sviluppatori in grado di lavorare sui loro prodotti e inizia a stabilire lo standard per il funzionamento di tecnologie simili. Lo stesso articolo dell'Atlantic cita il fondatore di Meta Mark Zuckerberg che afferma che "è stato molto prezioso per noi fornire ciò perché ora tutti i migliori sviluppatori del settore utilizzano strumenti che utilizziamo anche internamente".


L'Open Source genera l'Open Source

Questi sono i fattori per cui vediamo molto spesso sinergie tra aziende open source. Le aziende di IA e ML open source svilupperanno naturalmente soluzioni con altri prodotti open source, da prodotti fondamentali come l'archiviazione di oggetti fino a tutti gli strumenti di visualizzazione. Quando un'azienda open source si fa avanti, lo facciamo tutti. Questo approccio coeso e combinato è probabilmente la nostra scommessa migliore per sviluppare un'IA che adotti un approccio incentrato sull'uomo. Queste forze naturali inerenti alla necessità del mercato per l'IA open source, combinate con le qualità del software open source di innovazione e collaborazione, guideranno lo stack di dati dell'IA open source.


Vi preghiamo di unirvi e contribuire a questa conversazione e alla nostra comunità inviandoci un'e-mail a ciao@min.io oppure inviandoci un messaggio sul nostro canale Slack .


Pubblicato anche qui .