Saya menghabiskan hari-hari saya membangun aplikasi AI yang mengubah kekacauan menjadi struktur. berikan saya dataset yang kacau, beberapa logika bisnis, dan model yang cukup kuat, dan saya dapat mengekstrak sinyal dari kebisingan. Jadi ketika saya ingin memahami apa model bahasa besar benar-benar memahami, saya melakukan apa yang akan dilakukan oleh setiap insinyur: saya menjalankan eksperimen. masuk ke dalam LLM dan meminta untuk menganalisis apa yang mereka maksudkan. Puisi Hasilnya secara teknis sempurna. model ini mengidentifikasi skema rima, menjelaskan metafora, memetakan ketegangan struktural antara konsep-konsep yang berlawanan. Tapi melihat itu bekerja, saya menyadari saya telah membuat kesalahan kategori. saya menggunakan sekrup untuk mengukur suhu. Apa yang Model Tidak Bisa Lihat Ambil baris seperti "Growth of the Dark Pillar / Shadow Lack." Sebuah LLM dapat memberi tahu Anda kata-kata ini menciptakan persamaan kehadiran dan ketidakhadiran, pertumbuhan dan kerugian. Ia tidak dapat duduk dengan ketidaknyamanan yang tenang frasa ini menciptakan dalam sistem saraf manusia. makna tidak dalam kata-kata itu sendiri. What it cannot do is feel the specific weight of growth that is shadowed by loss Puisi-puisi itu tidak meminta untuk dikodekan; mereka meminta untuk mengalami. Masalah yang sebenarnya penting Ini bukan hanya tentang puisi.Ini tentang produk yang kami bangun di dunia hari ini dari integrasi llm yang meluas. Berapa kali saya telah mendekati masalah pengguna dengan cara yang sama persis seperti saya mendekati puisi itu? Mencari apa yang dapat diekstrak, diukur, dicatat, dan dimasukkan ke dalam dashboard. Kita menjadi terobsesi dengan mendekodasi perilaku pengguna. dan dalam prosesnya, kita menjadi gelisah dengan pengalaman pengguna. Kebenaran yang paling penting tentang produk tidak ditemukan dalam hasil tes A / B. Mereka ditemukan dalam hal-hal yang menahan pengukuran: frustrasi halus dari menavigasi antarmuka yang membingungkan. kesenangan yang tak terduga ketika sesuatu bekerja lebih intuitif dari yang diharapkan. kepercayaan yang dibangun oleh satu pesan kesalahan jujur. Ini bukan titik data. mereka adalah pengalaman manusia. dan alat terbaik kami sering buta terhadap mereka. Apa artinya untuk apa yang kita bangun Sistem AI yang kami bangun akan menjadi lebih baik secara eksponensial dalam pengenalan dan analisis pola. mereka akan mendominasi setiap tugas yang dapat dibagi menjadi proses yang logis dan didorong oleh data. Tetapi hal-hal yang menentang pengurangan ini: intuisi, makna, rasa percaya diri yang dirasakan; mereka tetap sangat manusiawi. Tugas kami bukan hanya untuk membangun decoder yang lebih kuat. itu adalah untuk memiliki kebijaksanaan untuk mengenali apa yang ada di luar data. untuk membangun sistem yang meninggalkan ruang untuk pengalaman yang membingungkan, tak terukur yang membuat teknologi layak digunakan. Tidak semua yang penting dapat didekodkan. beberapa hal harus hidup. Dan itu termasuk produk yang kita minta orang untuk hidup dengan.