paint-brush
Open-Source: Langkah Berikutnya dalam Revolusi AIoleh@minio
109,673 bacaan
109,673 bacaan

Open-Source: Langkah Berikutnya dalam Revolusi AI

oleh MinIO6m2024/01/25
Read on Terminal Reader
Read this story w/o Javascript

Terlalu panjang; Untuk membaca

Eksplorasi masa depan AI sumber terbuka ini akan membedah "para penipu" dan memperjuangkan "para penipu sejati" dalam pengembangan AI untuk mengungkap mesin inovasi yang merupakan perangkat lunak sumber terbuka yang menggema di balik semuanya. Intinya adalah bahwa AI sumber terbuka akan menghasilkan tumpukan data sumber terbuka.

People Mentioned

Mention Thumbnail
featured image - Open-Source: Langkah Berikutnya dalam Revolusi AI
MinIO HackerNoon profile picture
0-item
1-item


Bayangkan masa depan di mana AI tidak lagi terkunci dalam brankas perusahaan, tetapi dibangun di tempat terbuka, bata demi bata, oleh komunitas inovator global. Di mana kolaborasi, bukan kompetisi, mendorong kemajuan, dan pertimbangan etika memiliki bobot yang sama dengan kinerja mentah. Ini bukan fiksi ilmiah, ini adalah revolusi sumber terbuka yang sedang berkembang di jantung pengembangan AI. Namun, Big Tech memiliki agendanya sendiri, menutupi model terbatas sebagai sumber terbuka sambil mencoba meraup manfaat dari komunitas yang benar-benar terbuka.


Mari kita kupas lapisan kode dan ungkap kebenaran di balik upaya ini. Eksplorasi masa depan AI sumber terbuka ini akan membedah "para penipu" dan memperjuangkan "para penipu sejati" dalam pengembangan AI untuk mengungkap mesin inovasi yang merupakan perangkat lunak sumber terbuka yang berdengung di balik semuanya. Intinya adalah bahwa AI sumber terbuka akan menghasilkan tumpukan data sumber terbuka.


Kebutuhan

Sebuah artikel baru-baru ini oleh Matteo Wong di The Atlantic, ' Tidak Pernah Ada yang Namanya AI 'Terbuka' ' menggambarkan tren yang berkembang di dunia akademis dan komunitas perangkat lunak untuk AI sumber terbuka yang sesungguhnya. “Idenya adalah untuk menciptakan model yang relatif transparan yang dapat digunakan, dipelajari, dan direproduksi oleh masyarakat dengan lebih mudah dan murah, dengan mencoba untuk mendemokratisasi teknologi yang sangat terkonsentrasi yang mungkin memiliki potensi untuk mengubah pekerjaan, polisi, waktu luang, dan bahkan agama.” Atlantic yang sama menunjukkan bahwa perusahaan Big Tech seperti Meta mencoba untuk memenuhi kebutuhan ini di pasar dengan 'mencuci secara terbuka' produk mereka. Mereka mengasumsikan kualitas dan reputasi positif komunitas sumber terbuka tanpa benar-benar membuka sumber produk mereka. Namun, tidak ada pengganti untuk hal yang nyata. Ini karena perangkat lunak sumber terbuka yang sebenarnya mendorong inovasi dan kolaborasi: dua kualitas yang sangat dibutuhkan untuk bergerak maju dengan AI secara bertanggung jawab.


Para Penipu

LLaMA 2, adalah model bahasa besar yang dibuat oleh Meta yang bebas digunakan untuk keperluan penelitian dan komersial. Hal ini menyebabkan beberapa orang menyarankan LLaMA 2 adalah sumber terbuka. Namun, Meta telah menerapkan beberapa pembatasan ketat pada penggunaan model mereka. Misalnya, LLaMA 2 tidak dapat digunakan untuk meningkatkan model bahasa besar lainnya. Sebuah posisi yang bertentangan dengan model tradisional model inovasi kolektif swasta perangkat lunak terbuka yang mempromosikan pengungkapan inovasi secara bebas dan terbuka demi manfaat setiap orang dalam komunitas perangkat lunak.


Meta semakin menghambat penggunaan model mereka dengan tidak mengizinkan integrasi LLaMA 2 dengan produk yang memiliki 700 juta pengguna bulanan dan dengan tidak mengungkapkan data apa yang digunakan untuk melatih model mereka atau kode yang mereka gunakan untuk membangunnya. Dengan tidak mengungkapkannya, Meta membuka dirinya terhadap pertanyaan tentang bias bawaan dan diskriminasi yang tidak disengaja. Model yang dilatih pada data diskriminatif akan memberikan tanggapan diskriminatif . Tanpa komunitas perangkat lunak pada umumnya yang mampu melihat kode yang digunakan untuk membangun model tersebut untuk melihat apakah ada perlindungan yang telah dibangun atau data yang digunakan untuk melatihnya, kita dibiarkan dalam kegelapan mengenai pertanyaan-pertanyaan moral ini. Di saat penelitian yang dipublikasikan tentang AI lebih mementingkan kinerja daripada keadilan dan rasa hormat, pengaburan ini sangat mengganggu.


Yang Asli

Mistral AI telah memperoleh pengakuan atas model bahasa besar sumber terbuka, khususnya Mistral 7B dan Mixtral 8x7B. Perusahaan ini berupaya keras untuk memastikan aksesibilitas yang luas terhadap model AI-nya, dengan mendorong peninjauan, modifikasi, dan penggunaan ulang oleh komunitas perangkat lunak terbuka.


vLLM singkatan dari "vectorized low-latency model serving" dan merupakan pustaka sumber terbuka yang secara khusus dirancang untuk mempercepat dan mengoptimalkan model bahasa besar (LLM). Ini adalah alat yang ampuh yang dapat meningkatkan kinerja dan kegunaan LLM secara signifikan. Hal ini menjadikannya aset berharga bagi pengembang yang mengerjakan berbagai aplikasi AI, mulai dari chatbot dan asisten virtual hingga pembuatan konten dan pembuatan kode. Sedemikian rupa sehingga, Mistral merekomendasikan penggunaan vLLM sebagai server inferensi untuk model 7B dan 8x7B.


Bahasa Indonesia: EleutherAI adalah laboratorium penelitian AI nirlaba yang telah berkembang dari server Discord untuk membahas GPT-3 menjadi organisasi penelitian nirlaba terkemuka. Kelompok ini dikenal karena pekerjaannya dalam melatih dan mempromosikan norma sains terbuka dalam Pemrosesan Bahasa Alami. Mereka telah merilis berbagai model bahasa besar sumber terbuka dan terlibat dalam proyek penelitian yang terkait dengan penyelarasan dan interpretabilitas AI. LM-Memanfaatkan Proyek ini mungkin merupakan alat evaluasi sumber terbuka terkemuka untuk model bahasa.


Phi-2 adalah LLM Microsoft yang melampaui ekspektasi. Dilatih pada campuran teks sintetis dan situs web yang difilter, model yang kecil namun canggih ini unggul dalam tugas-tugas seperti menjawab pertanyaan, meringkas, dan menerjemahkan. Yang benar-benar membedakan Phi-2 adalah fokusnya pada penalaran dan pemahaman bahasa, yang menghasilkan kinerja yang mengesankan bahkan tanpa teknik penyelarasan tingkat lanjut.


Banyak model penyematan sumber terbuka yang kompeten memperkuat ruang AI generatif sumber terbuka secara keseluruhan. Ini adalah keadaan terkini untuk sumber terbuka dan mencakup UAE-Besar-V1 Dan multibahasa-e5-largel .


Masih banyak lagi di bidang yang terus berkembang ini. Daftar terbatas ini hanyalah permulaan.


Open Source Mendorong Inovasi

Menganut filosofi inovasi terbuka yang ekstrem, perusahaan yang benar-benar berpartisipasi dalam pengembangan perangkat lunak sumber terbuka menantang gagasan tradisional tentang keunggulan kompetitif dengan mengakui bahwa tidak semua kode bagus atau ide hebat berada di dalam organisasi mereka Pergeseran ini mendukung argumen bahwa inovasi bersama dalam ekosistem sumber terbuka menghasilkan pertumbuhan pasar yang lebih cepat, sehingga menyediakan dana R&D yang lebih terbatas bahkan bagi perusahaan perangkat lunak yang lebih kecil. kesempatan untuk mendapatkan manfaat dari spillover R&D yang ada dalam perangkat lunak sumber terbuka. Hal ini karena, berbeda dengan outsourcing tradisional, inovasi terbuka meningkatkan sumber daya internal dengan memanfaatkan kecerdasan kolektif masyarakat, tanpa mengurangi upaya R&D internal. Artinya, perusahaan perangkat lunak sumber terbuka tidak perlu mengorbankan anggaran mereka untuk mengejar kepemimpinan pemikiran dan kode di luar organisasi mereka.


Selain itu, perusahaan perangkat lunak sumber terbuka secara strategis mendorong inovasi dengan merilis kode lebih awal dan sering , mengakui sifat kumulatif dari proses inovasi dalam komunitas perangkat lunak. Semua itu untuk mengatakan sesuatu yang sudah diakui banyak orang: Perangkat Lunak Sumber Terbuka mendorong inovasi.


Open Source Mendorong Kolaborasi

Melalui jaringan dalam komunitas perangkat lunak sumber terbuka, para pengusaha mampu memenuhi tujuan jangka pendek dan jangka panjang. Tujuan laba jangka pendek membangun perusahaan dan tujuan laba jangka panjang menopangnya. Pada saat yang sama, upaya jaringan ini mengabadikan jaringan itu sendiri - mengembangkannya untuk pengusaha berikutnya. Sudah diketahui umum bahwa platform sumber terbuka menyediakan akses ke kode sumber, yang memungkinkan pengembang untuk membuat pemutakhiran, plug-in, dan perangkat lunak lainnya serta menggunakannya sesuai dengan kebutuhan mereka. Jenis kolaborasi khusus ini mengalami peningkatan dengan adopsi Kubernetes yang luas oleh komunitas perangkat lunak yang lebih luas. Sekarang lebih dari sebelumnya, teknologi modern bekerja sama dengan sangat sedikit gesekan dan dapat bersama-sama dalam hitungan menit hampir di mana saja.


Perusahaan-perusahaan Big Tech mengakui kolaborasi mendalam yang melekat pada komunitas open-source ini ketika mereka merilis kerangka kerja, pustaka, dan bahasa yang mereka buat secara bebas untuk memelihara dan mengembangkan alat-alat internal. Dengan melakukan hal itu, kelompok pengembang yang mampu mengerjakan produk mereka akan semakin banyak dan mulai menetapkan standar tentang bagaimana teknologi serupa seharusnya beroperasi. Artikel Atlantic yang sama mengutip pernyataan pendiri Meta Mark Zuckerberg yang mengatakan bahwa "sangat berharga bagi kami untuk menyediakannya karena sekarang semua pengembang terbaik di seluruh industri menggunakan alat-alat yang juga kami gunakan secara internal".


Sumber Terbuka Melahirkan Sumber Terbuka

Ini adalah faktor-faktor yang membuat kita sangat sering melihat sinergi antara perusahaan-perusahaan open source. Perusahaan-perusahaan AI dan ML open source secara alami akan mengembangkan solusi dengan produk-produk open source lainnya dari produk-produk dasar seperti penyimpanan objek hingga ke seluruh tumpukan hingga alat-alat visualisasi. Ketika satu perusahaan open source melangkah maju, kita semua akan melakukannya. Pendekatan yang kohesif dan terpadu ini mungkin merupakan taruhan terbaik kita untuk mengembangkan AI yang mengambil pendekatan yang berpusat pada manusia. Kekuatan-kekuatan alami yang melekat dalam kebutuhan pasar untuk AI open source yang dikombinasikan dengan kualitas-kualitas perangkat lunak open source berupa inovasi dan kolaborasi akan mendorong tumpukan data AI open source.


Silakan bergabung dan berkontribusi pada percakapan ini dan komunitas kami dengan mengirim email kepada kami di [email protected] atau mengirimi kami pesan di saluran Slack kami.


Juga diterbitkan di sini .