paint-brush
Sumber Terbuka: Langkah Seterusnya dalam Revolusi AIoleh@minio
109,673 bacaan
109,673 bacaan

Sumber Terbuka: Langkah Seterusnya dalam Revolusi AI

oleh MinIO6m2024/01/25
Read on Terminal Reader
Read this story w/o Javascript

Terlalu panjang; Untuk membaca

Penerokaan masa depan AI sumber terbuka ini akan membedah "berpura-pura" dan memperjuangkan "yang sebenar" dalam pembangunan AI untuk mendedahkan enjin inovasi yang perisian sumber terbuka bersenandung di bawah semua itu. Intinya ialah AI sumber terbuka akan menghasilkan timbunan data sumber terbuka.

People Mentioned

Mention Thumbnail
featured image - Sumber Terbuka: Langkah Seterusnya dalam Revolusi AI
MinIO HackerNoon profile picture
0-item
1-item


Bayangkan masa depan di mana AI tidak terkunci dalam bilik kebal korporat, tetapi dibina di tempat terbuka, bata demi bata, oleh komuniti inovator global. Di mana kerjasama, bukan persaingan, memacu kemajuan, dan pertimbangan etika mempunyai berat yang sama dengan prestasi mentah. Ini bukan fiksyen sains, ia adalah revolusi sumber terbuka yang berkembang di tengah-tengah pembangunan AI. Tetapi Big Tech mempunyai agendanya sendiri, menyembunyikan model terhad sebagai sumber terbuka sambil cuba meraih faedah komuniti yang benar-benar terbuka.


Mari kita kupas lapisan kod dan dedahkan kebenaran di sebalik usaha ini. Penerokaan masa depan AI sumber terbuka ini akan membedah "berpura-pura" dan memperjuangkan "yang sebenar" dalam pembangunan AI untuk mendedahkan enjin inovasi yang merupakan perisian sumber terbuka yang bersenandung di bawah semua itu. Intinya ialah AI sumber terbuka akan menghasilkan timbunan data sumber terbuka.


Keperluan

Artikel terbaru oleh Matteo Wong dalam The Atlantic, ' Tidak Pernah Ada Perkara Seperti 'Terbuka' AI ' menerangkan trend yang semakin meningkat dalam akademik dan komuniti perisian untuk AI sumber terbuka yang benar-benar. "Ideanya adalah untuk mencipta model yang agak telus yang boleh digunakan oleh orang ramai dengan lebih mudah dan murah, mengkaji dan menghasilkan semula, cuba untuk mendemokrasikan teknologi yang sangat tertumpu yang mungkin berpotensi untuk mengubah kerja, polis, masa lapang dan juga agama." Atlantik yang sama menunjukkan bahawa syarikat Big Tech seperti Meta cuba memenuhi keperluan ini dalam pasaran dengan 'mencuci terbuka' produk mereka. Mereka menganggap kualiti dan reputasi positif komuniti sumber terbuka tanpa benar-benar membuka sumber produk mereka. Tetapi, tiada pengganti untuk perkara sebenar. Ini kerana perisian sumber terbuka sebenar memacu inovasi dan kerjasama: dua kualiti yang sangat diperlukan untuk bergerak ke hadapan dengan AI secara bertanggungjawab.


The Pretenders

LLaMA 2, ialah model bahasa besar yang dicipta oleh Meta yang percuma untuk digunakan untuk kegunaan penyelidikan dan komersial. Mengetuai beberapa orang untuk mencadangkan LLaMA 2 ialah sumber terbuka. Walau bagaimanapun, Meta telah melaksanakan beberapa sekatan yang teruk pada penggunaan model mereka. Contohnya, LLaMA 2 tidak boleh digunakan untuk menambah baik mana-mana model bahasa besar yang lain. Kedudukan yang bertentangan dengan tradisi model inovasi kolektif swasta perisian terbuka yang mempromosikan pendedahan inovasi yang bebas dan terbuka untuk manfaat semua orang dalam komuniti perisian.


Meta melumpuhkan lagi penggunaan model mereka dengan tidak membenarkan penyepaduan LLaMA 2 dengan produk yang mempunyai 700 juta pengguna bulanan dan dengan tidak mendedahkan data yang model mereka dilatih atau kod yang mereka gunakan untuk membinanya. Dengan tidak mendedahkan, Meta membuka dirinya kepada persoalan berat sebelah yang wujud dan diskriminasi tidak sengaja. Model yang dilatih mengenai data diskriminasi akan memberikan respons yang diskriminasi . Tanpa komuniti perisian pada umumnya dapat melihat sama ada kod yang digunakan untuk membina model untuk melihat sama ada sebarang perlindungan telah dibina atau data yang digunakan untuk melatihnya, kita dibiarkan dalam kegelapan mengenai persoalan moral ini. Dalam masa yang menerbitkan penyelidikan mengenai AI lebih mementingkan prestasi daripada keadilan dan menghormati kekeliruan ini amat mengganggu.


Yang Sebenar

Mistral AI telah mendapat pengiktirafan untuk model bahasa besar sumber terbukanya, terutamanya Mistral 7B dan Mixtral 8x7B. Syarikat itu berusaha untuk memastikan kebolehcapaian yang luas kepada model AInya, menggalakkan semakan, pengubahsuaian dan penggunaan semula oleh komuniti perisian terbuka.


vLLM bermaksud "penyajian model kependaman rendah vektor" dan merupakan perpustakaan sumber terbuka yang direka khusus untuk mempercepat dan mengoptimumkan model bahasa besar (LLM). Ia adalah alat berkuasa yang boleh meningkatkan prestasi dan kebolehgunaan LLM dengan ketara. Ini menjadikannya aset berharga untuk pembangun yang bekerja pada pelbagai aplikasi AI, daripada chatbots dan pembantu maya kepada penciptaan kandungan dan penjanaan kod. Sehinggakan, Mistral mengesyorkan menggunakan vLLM sebagai pelayan inferens untuk model 7B dan 8x7B.


EleutherAI ialah makmal penyelidikan AI bukan untung yang telah berkembang daripada pelayan Discord untuk membincangkan GPT-3 kepada organisasi penyelidikan bukan untung terkemuka. Kumpulan ini terkenal dengan kerjanya dalam melatih dan mempromosikan norma sains terbuka dalam Pemprosesan Bahasa Semulajadi. Mereka telah mengeluarkan pelbagai model bahasa besar sumber terbuka dan terlibat dalam projek penyelidikan yang berkaitan dengan penjajaran dan kebolehtafsiran AI. mereka LM-Abah-abah projek mungkin merupakan alat penilaian sumber terbuka terkemuka untuk model bahasa.


Phi-2 ialah LLM Microsoft yang menumbuk melebihi beratnya. Dilatih pada gabungan teks sintetik dan tapak web yang ditapis, model kecil tetapi berkuasa ini cemerlang dalam tugas seperti menjawab soalan, meringkaskan dan terjemahan. Apa yang benar-benar membezakan Phi-2 ialah tumpuannya pada penaakulan dan pemahaman bahasa, yang membawa kepada prestasi yang mengagumkan walaupun tanpa teknik penjajaran lanjutan.


Banyak model pembenaman sumber terbuka yang kompeten sedang mengukuhkan keseluruhan ruang AI generatif sumber terbuka. Ini adalah terkini terkini untuk sumber terbuka dan termasuk UAE-Besar-V1 dan berbilang bahasa-e5-large .


Terdapat banyak lagi dalam bidang yang semakin berkembang ini. Senarai terhad ini hanyalah permulaan.


Sumber Terbuka Memacu Inovasi

Menerima falsafah inovasi terbuka yang melampau, syarikat yang benar-benar mengambil bahagian dalam pembangunan perisian sumber terbuka mencabar tanggapan tradisional kelebihan daya saing dengan mengakui bahawa tidak semua kod yang baik atau idea yang bagus berada dalam organisasi mereka . Anjakan ini menyokong hujah bahawa perkongsian inovasi dalam ekosistem sumber terbuka membawa kepada pertumbuhan pasaran yang lebih pantas, menyediakan firma perisian yang lebih kecil dengan dana R&D yang lebih terhad. peluang untuk mendapat manfaat daripada limpahan R&D yang terdapat dalam perisian sumber terbuka. Ini kerana, berbeza dengan penyumberan luar tradisional, inovasi terbuka meningkatkan sumber dalaman dengan memanfaatkan kecerdasan kolektif masyarakat, tanpa mengurangkan usaha R&D dalaman. Bermaksud bahawa syarikat perisian sumber terbuka tidak perlu mengorbankan belanjawan mereka untuk mengejar kepimpinan pemikiran dan kod di luar organisasi mereka.


Selain itu, syarikat perisian sumber terbuka secara strategik memacu inovasi dengan mengeluarkan kod awal dan kerap , mengiktiraf sifat kumulatif proses inovasi dalam komuniti perisian. Semuanya untuk mengatakan sesuatu yang sudah dikenali ramai: Perisian Sumber Terbuka memacu inovasi.


Sumber Terbuka Memupuk Kerjasama

Melalui rangkaian dalam komuniti perisian sumber terbuka, usahawan dapat memenuhi kedua-dua matlamat jangka pendek dan jangka panjang. Matlamat keuntungan jangka pendek membina syarikat dan matlamat keuntungan jangka panjang mengekalkannya. Pada masa yang sama, usaha rangkaian ini mengekalkan rangkaian itu sendiri - mengembangkannya untuk usahawan seterusnya. Umum mengetahui bahawa platform sumber terbuka menyediakan akses kepada kod sumber, membolehkan pembangun membuat peningkatan, pemalam dan perisian lain dan menggunakannya mengikut keperluan mereka. Kerjasama jenis khusus ini mengalami ledakan dengan penggunaan meluas Kubernetes oleh komuniti perisian yang lebih luas. Kini lebih daripada sebelumnya, teknologi moden berfungsi bersama-sama dengan geseran yang sangat sedikit dan boleh bersama-sama hampir di mana-mana sahaja dalam beberapa minit.


Syarikat Big Tech mengiktiraf kerjasama mendalam ini yang wujud dalam komuniti sumber terbuka apabila mereka bebas mengeluarkan rangka kerja, perpustakaan dan bahasa yang mereka cipta untuk mengekalkan dan membangunkan alatan dalaman. Melakukannya memperdalam kumpulan pembangun yang mampu mengusahakan produk mereka dan mula menetapkan piawaian untuk cara teknologi serupa seharusnya beroperasi. Artikel Atlantik yang sama itu memetik pengasas Meta Mark Zuckerberg sebagai berkata ia "sangat berharga bagi kami untuk menyediakannya kerana kini semua pembangun terbaik di seluruh industri menggunakan alat yang kami juga gunakan secara dalaman".


Sumber Terbuka Melahirkan Sumber Terbuka

Ini adalah faktor mengapa kita sering melihat sinergi antara syarikat sumber terbuka. Syarikat AI dan ML sumber terbuka secara semula jadi akan membangunkan penyelesaian dengan produk sumber terbuka lain daripada produk asas seperti penyimpanan objek sehinggalah ke atas timbunan kepada alat visualisasi. Apabila satu syarikat sumber terbuka melangkah ke hadapan, kita semua melakukannya. Pendekatan padu dan bercampur ini mungkin merupakan pertaruhan terbaik kami untuk membangunkan AI yang mengambil pendekatan berpusatkan manusia. Daya semula jadi yang wujud dalam pasaran ini memerlukan AI sumber terbuka digabungkan dengan kualiti perisian sumber terbuka inovasi dan kerjasama akan memacu timbunan data AI sumber terbuka.


Sila sertai dan menyumbang kepada perbualan ini dan komuniti kami dengan menghantar e-mel kepada kami di [email protected] atau menghantar mesej kepada kami di saluran Slack kami.


Juga diterbitkan di sini .