Her makine öğrenimi mühendisi, modelinin ilk kez hayata geçirdiği anı hatırlıyor.Metrikler iyi görünüyor, tahminler istikrarlı... ve sonra, neredeyse fark edilemez şekilde, gecikme zirveleri, doğruluk dalgaları veya bağımlılıklar kırılıyor. Büyük bir çok uluslu perakendecilik şirketinde üst düzey bir yazılım mühendisi olan Saurabh Kumar’a göre, “işe yarıyor” ve “şekillendiriyor” arasındaki kırılgan an, araştırma ve üretim arasındaki farkı belirler. “Üretim ML, modelin kendisi hakkında değil,” diyor Saurabh. “Bu modelin vahşi, yük altında, değişim altında ve ölçekte nasıl davrandığını anlatıyor. Saurabh, puanlama motoru yeniden yapılandırması ve perakendecinin reklamcılık hizmetleri için MLOps platformunu temelden inşa etmesinde kapsamlı çalıştı. Bununla birlikte, yaklaşımını ayırt eden şey sadece teknik sofistike değil, aynı zamanda metodolojik bir disiplin, üretim sistemlerini hızlı, istikrarlı ve hatalı tutmak için bir çalışma kitabı olarak adlandırıyor. Deneyden idareye kadar Saurabh’ın görüşüne göre, eğitimli bir modelden üretime hazır bir sisteme giden yolculuk sanki endüstriyel bir dönüşüm süreci gibidir. “Bir model bir prototip motoru gibidir,” diyor. “Test bankasında güzel çalışabilir, ancak bir arabanın içine düştüğünde her şey değişir.” Bu gerçeklik, Production ML Playbook olarak adlandırdığı şeylere ilham verdi, yıllarca deneme, başarısızlık ve hassasiyetten kaynaklanan bir çalışma ilkelerinin bir dizi. İlk, gecikme testi, ölçekteki görünmez sürtünme ile ilgilidir. “Ortalamadığınız şeyi optimize edemezsiniz,” Saurabh not ediyor. “Milyonlarca isteği kullandığınızda her ek milisekunde bileşikler oluşur.” Ekibi, serbest bırakmadan önce gerçek dünya talebini yansıtan dağıtılmış yük simülasyonlarını kullanır, stres testi altyapısını. Regresyon Validasyonu: ince kırıklara karşı koruma Bir kez gecikme kontrol altında olduğunda, Saurabh üretim sistemlerinin sessiz saboteciye döner: regresyon. “regresyon hataları alçakgönüllü,” diyor. “Onlar sisteminizi kırmazlar; zamanla zekasını bozarlar.” Saurabh, bu bozulmayı engellemek için, performans ve davranışları izleyen otomatik bir regresyon doğrulama boru hattı inşa etmeye yardımcı oldu.Her model iterasyonu sadece doğruluk ölçütleri için değil, aynı zamanda veritabanları ve zaman pencereleri arasındaki çıkış tutarlılığı için de test edilir. Yaklaşımından büyük ölçüde yazılım mühendisliğinin test yönlendirilmiş gelişim etosundan borçlanıyor, ML deneyleri üretim düzeyinde titizlikle birleştiriyor. “Sadece sezgiye güvenemezsiniz,” Saurabh vurguluyor. “Senin deneylerinizi savunabilir ve sistemlerinizi öngörülebilir hale getirebilecek türün tekrarlanabilirliğine ihtiyacın var.” Bu tutarlılık ve esneklik dengesi, ekibinin operasyonel sürprizleri azaltırken daha hızlı ulaşmasını sağlar: ML operasyonlarında olgunluğun bir işaretidir. Otomatik zorunluluk Saurabh’ın oyun kitabında, otomasyon sadece bir rahatlık değil, bir koruma aracıdır. ”İnsan müdahalesi istisna olmalı, norm değil,” diyor. ”Her manuel adım potansiyel bir başarısızlık noktasıdır.” Saurabh'ın büyük çok uluslu perakendeci rolünde, ekibi sürekli doğrulama, geri dönüş korumaları ve dinamik ölçeklendirme tetikleyicileri entegre eden otomatik dağıtım borularını kullanır. Saurabh, “Otomatikleştirme size özgürlük verir. “Stratejiye, daha büyük mimari sorunlara odaklanmanızı sağlar, aynı dağıtım sorunlarına tekrar tekrar karşı savaşmamanızı sağlar.” Verimliliğin ötesinde, otomasyon da güvenilirliği güçlendirir. her yeni model, canlı trafiğe tanıtılmadan önce, sentetik veri testleri ve gölge modu doğrulaması da dahil olmak üzere bir dizi ön dağıtım kontrolüne girer. “Her dağıtımı bir deneydir” diyor. “Bu zihniyet, sistemin tasarımla kendisini geliştirmesini sağlar.” Ölçme Felsefesi: Süreçte Güvenme, Hunt Değil Saurabh için, üretim başarısı sezgiden gelmez, süreçlere olan güvenden gelir. “Bir kişinin içgüdüsünü ölçemezsiniz,” diyor. “Sadece sistemli hale getirilmiş olanı ölçebilirsiniz.” Onun daha geniş felsefesi, araştırmanın bilimsel sıkıntısını mühendislikteki operasyonel pragmatizmle birleştirir.Onun liderliğinde, AI ekipleri sürekli bir geri bildirim döngüsü geliştirdiler, modeller canlı verilerden öğreniyor, altyapı model davranışlarından öğreniyor ve mühendisler her ikisinden de öğreniyorlar. “Üretim deneyimin sonu değildir” diyor, “Bu deneyin sorumluluğu olduğu yerdir.” Bağımsız Güvenilirlik İleriye bakarak, Saurabh, kendilerini gözlemleyebilecek ve kendilerini düzeltebilecek ML borular üretmeyi hayal ediyor, otonom olarak gecikme zirvelerini veya regresyonları algılayabiliyor ve gerçek zamanlı olarak kaynakları dengelemeye devam ediyor. “Bilgi olmadan otomatikleştirme sadece daha hızlı kaos demektir,” diyor. “Hedef insan yargısını ortadan kaldırmak değil, onu yükseltmektir.” Bu zihniyet, üretim sistemlerinin, onları inşa eden insanlar gibi, geri bildirim, şeffaflık ve sürekli iyileştirme yoluyla gelişmeleri gerektiğine inanmasıyla Kuzey yıldızı haline gelmiştir. “En iyi sistemler,” sonuçta, “sadece verimli çalışmazlar. This story was published by Steve Beyatte under HackerNoon's Blog İşletme Programı . Bu hikaye, Steve Beyatte tarafından HackerNoon tarafından yayınlandı Blog İşletme Programı Blog İşletme Programı .