Di HackerNoon, kami menghargai cerita tentang membangun teknologi inovatif. Pertanyaan-pertanyaan ini bukan hanya tentang mekanisme AI—pertanyaan-pertanyaan ini tentang inovasi, tantangan, dan kreativitas dalam mewujudkan alat-alat canggih, yang sangat cocok untuk komunitas kami yang terdiri dari para pemimpin teknologi, pembangun, dan pembaca yang berwawasan ke depan.
Nama saya Aniruth . Saya bekerja di tim penyimpanan di Databricks , tempat kami berupaya memungkinkan pelanggan menyimpan data dalam jumlah besar dalam format terbuka dan terukur dengan Platform Kecerdasan Data kami. Secara khusus, saya bekerja pada upaya interoperabilitas kami dengan Delta Lake dan Apache Iceberg.
Aniruth : Databricks menyatukan data dan AI untuk memberikan pelanggan intelijen yang dapat ditindaklanjuti—yang kami sebut intelijen data. Ini termasuk penyerapan data dalam jumlah besar, ETL, penyimpanan skala besar, kueri intelijen bisnis, dan beban kerja AI. Teknik yang digunakan dalam pembelajaran mesin dalam dekade terakhir telah ada sejak tahun 1980-an; munculnya big data memungkinkan untuk menjalankan algoritme dalam skala besar.
Teknik seperti few shot prompting atau RAG bergantung pada data berkualitas tinggi. Model yang memiliki data lebih baik akan menang melawan model dengan arsitektur lebih baik. Databricks telah melakukan investasi signifikan dalam upaya terdepan di ruang data, memelopori arsitektur lakehouse dengan format data terbuka dan tata kelola terbuka, tempat pelanggan dapat memperoleh wawasan terbaik dengan kinerja terbaik dari data lake.
Kami menggunakan model AI dalam sejumlah cara dalam produk - seperti Llama 3 untuk Asisten AI. Kami percaya pada ekosistem data dan AI terbuka dan mendorong pelanggan kami untuk menggunakan model apa pun sesuai pilihan mereka. Kami membantu memastikan pelanggan memiliki tata kelola menyeluruh di seluruh siklus hidup AI, apa pun model yang mereka gunakan, sehingga mereka dapat fokus untuk membuat model yang dibuat khusus untuk kasus penggunaan mereka.
Kami telah menghabiskan upaya dan investasi yang signifikan untuk memprioritaskan keakuratan dan jawaban yang tidak bias untuk penggunaan AI dalam produk kami, dan terus melakukan pengujian secara berkala.
Ruang data dan AI berkembang dengan cepat, jadi sangat penting untuk selalu mengikuti perkembangan. Kegiatan saya sehari-hari meliputi berbicara dengan pelanggan, menganalisis pasar, menyusun dokumen persyaratan produk, atau menyiapkan materi pemasaran. Bagian favorit saya adalah membuat diagram yang mengilustrasikan cara kerja berbagai hal, karena mengubah ide menjadi visual merupakan hal yang sangat menyenangkan.
Akan ada banyak terobosan besar yang akan segera hadir. Salah satu yang sangat menarik bagi saya adalah hiperpersonalisasi konten. Selama satu dekade terakhir, iklan telah disesuaikan dengan pemirsa tertentu. Beberapa elemen konten telah disesuaikan, seperti gambar mini yang ditampilkan Netflix kepada pengguna, tetapi konten sebenarnya (video itu sendiri) belum disesuaikan. Akan menarik untuk melihat bagaimana sutradara/produser menyeimbangkan penyampaian cerita yang mereka inginkan dan minat pengguna.
Saya menangani penyimpanan data berskala besar, yang bisa sangat membingungkan untuk dipahami. Kami memiliki berbagai pengoptimalan AI pada data, tetapi sering kali ada pertanyaan tentang kapan pengoptimalan ini dijalankan, bagaimana cara kerjanya, apa yang tidak tercakup, dll. Dengan pertanyaan semacam ini, penting untuk memastikan kami memiliki pesan yang jelas dan konsisten tentang apa yang kami bangun dan mengapa. Saya menemukan bahwa menjelaskan penyebab keterbatasan sangat sesuai dengan pelanggan.
Model multimoda akan menjadi jauh lebih baik dalam beberapa tahun mendatang, yang akan mengubah cara utama kita berinteraksi dengan AI. Memahami emosi manusia jauh lebih mudah melalui informasi visual atau audio dibandingkan dengan teks. Saya pikir ada peluang untuk menciptakan interaksi yang lebih alami dalam berbagai skenario.
Kami biasanya ingin melihat umpan balik dan penggunaan yang baik. Saya cukup sering berbicara dengan pelanggan untuk mengetahui bagaimana dan mengapa mereka berpikir tentang produk kami, yang merupakan kunci untuk menjelaskan mengapa kami melihat tren tertentu dalam metrik.
Produk data berskala besar terkenal sulit digunakan. Contoh sederhana mudah disiapkan, tetapi beban kerja produksi biasanya melibatkan konfigurasi dan kode yang membingungkan. Merupakan prioritas tinggi bagi saya untuk membangun fungsionalitas yang dibutuhkan pelanggan, sekaligus membuat produk sangat mudah digunakan.
Masa depan adalah masa di mana bisnis apa pun dapat memperoleh wawasan dari data mereka dengan mudah. Di dunia saat ini, wawasan bisnis berbasis data biasanya terbatas pada perusahaan-perusahaan besar - tetapi mereka pun lebih menyukai pengalaman yang lebih sederhana.
Untuk perorangan, saya sangat antusias dengan integrasi AI ke dalam perangkat keras. Hingga saat ini, kita banyak melihat AI dalam aplikasi perangkat lunak seperti situs web. Ada banyak aplikasi yang lebih besar untuk membangun perangkat yang memanfaatkan AI, dan kita sudah mulai melihat beberapa implikasinya pada mobil dan ponsel.
Databricks sedang dalam perjalanan untuk menjadi semakin sederhana dan lebih canggih di saat yang bersamaan. Ada banyak upaya yang sedang kami lakukan secara menyeluruh, mulai dari membuat data dan komputasi berskala besar mudah digunakan hingga meningkatkan kinerja pada kueri dan alur kerja. Secara pribadi, saya pikir kami akan segera menghadirkan beberapa fitur menarik di seluruh produk yang membuat alur kerja jauh lebih mudah dengan AI. Contohnya termasuk komentar yang dihasilkan AI pada data, saran kode AI di editor buku catatan, dan antarmuka AI untuk mengobrol dengan data (misalnya, Databricks AI/BI Genie).
Ada kekhawatiran mengenai apakah AI akan mengurangi jumlah pekerjaan. Produk kami dirancang untuk meningkatkan wawasan berharga, yang sering kali muncul bersamaan dengan pengguna. Misalnya, dengan AI/BI Genie, pengguna dapat membuat antarmuka pada data mereka sendiri. Ini adalah pengalaman ajaib, di mana pengguna dapat mengajukan pertanyaan dan mendapatkan jawaban yang spesifik untuk mereka. Bahkan, pengguna dapat memeriksa SQL yang digunakan untuk mengonfirmasi apakah itu yang mereka cari. Ini merupakan kolaborasi dengan analis, sehingga mengurangi waktu yang mereka perlukan untuk beralih dari ide ke wawasan.
Satu kejutan besar bagi saya adalah kompleksitas yang dimiliki beberapa perusahaan besar. Hal ini menimbulkan persyaratan ke dalam produk yang tidak akan saya pertimbangkan sendiri. Contoh umum adalah memikirkan strategi migrasi saat memperkenalkan produk baru. Biasanya, perusahaan besar akan menyusun teknologi yang sudah ada (biasanya perangkat lunak sumber terbuka) atau membuat perangkat lunak khusus untuk memecahkan masalah yang ditangani oleh penawaran produk baru kami. Biasanya dibutuhkan sedikit waktu untuk memahami mengapa dan bagaimana hal ini disusun untuk memastikan kami memiliki solusi yang mencakup semua kemungkinan.
Apakah Anda ingin mencoba menjawab beberapa pertanyaan ini?