paint-brush
Nakliye Maliyeti Tahmininde Kişisel Dikkatin Gücünü Ortaya Çıkarma: Özet ve Girişby@convolution

Nakliye Maliyeti Tahmininde Kişisel Dikkatin Gücünü Ortaya Çıkarma: Özet ve Giriş

Yeni AI modeli (Ücret Listesi Transformatörü), nakliye maliyetlerini daha doğru tahmin etmek için paket ayrıntılarını (boyut, taşıyıcı vb.) analiz eder.
featured image - Nakliye Maliyeti Tahmininde Kişisel Dikkatin Gücünü Ortaya Çıkarma: Özet ve Giriş
Convolution: Leading Authority on Signal Processing HackerNoon profile picture
0-item

Yazarlar:

(1) P Aditya Sreekar, Amazon ve bu yazarlar bu çalışmaya eşit katkıda bulunmuştur {[email protected]};

(2) Sahil Verm, Amazon ve bu yazarlar bu çalışmaya eşit katkıda bulunmuştur {[email protected];}

(3) Varun Madhavan, Hindistan Teknoloji Enstitüsü, Kharagpur. Amazon'da staj sırasında yapılan çalışmalar {[email protected]};

(4) Abhishek Persad, Amazon {[email protected]}.

Bağlantı Tablosu

Soyut

Amazon, Amerika Birleşik Devletleri'ndeki müşterilerine her yıl milyarlarca paket gönderiyor. Bu paketlerin nakliye maliyeti, satışların karlılığını tahmin etmek için nakliye gününde (0. gün) kullanılır. Satış sonrası sistemler, fiyatlandırma stratejileri ve zarar eden ürünlerin listeden çıkarılması gibi finansal kararlar alırken günümüzün 0 kârlılık tahminlerini kullanıyor. Ancak, taşıyıcı faturalandırmadaki gecikme veya sabit maliyet bileşenlerinin aylık aralıklarla kaydedilmesi gibi nedenlerden dolayı 0. günde doğru nakliye maliyeti tahminlerinin elde edilmesi karmaşıktır. Yanlış nakliye maliyeti tahminleri, öğelerin çok düşük veya yüksek fiyatlandırılması veya müşterilere yanlış ürünün tanıtılması gibi kötü kararlara yol açabilir. 0. günde nakliye maliyetlerini tahmin etmeye yönelik mevcut çözümler, kapsamlı manuel mühendislik çalışmaları gerektiren ağaç tabanlı modellere dayanmaktadır. Bu çalışmada, paket özellikleri, taşıyıcı bilgileri ve rota planı gibi tüm paket nakliye bilgilerini kodlamak için kişisel dikkati kullanan, Ücret Kartı Transformatörü (RCT) adı verilen yeni bir mimari öneriyoruz. Diğer transformatör tabanlı tablo modellerinden farklı olarak RCT, bir gönderinin birden çoğa ilişkilerinin değişken listesini kodlama yeteneğine sahip olup, bir gönderi hakkında daha fazla bilgi yakalamasına olanak tanır. Örneğin RCT, bir paketteki tüm ürünlerin özelliklerini kodlayabilir. Sonuçlarımız, RCT tarafından yapılan maliyet tahminlerinin, ağaç tabanlı GBDT modeline kıyasla %28,82 daha az hataya sahip olduğunu göstermektedir. Üstelik RCT, son teknoloji ürünü transformatör tabanlı tablo modeli FTTransformer'ı %6,08 oranında geride bırakıyor. Ayrıca RCT'nin, ağaç tabanlı modellerin performansını iyileştirebilecek genelleştirilmiş bir ücret listesi manifoldunu öğrendiğini de gösteriyoruz.

1. Giriş

Amazon, yalnızca Amerika Birleşik Devletleri'ndeki müşterilerine yılda milyarlarca paket gönderiyor. Bu paketler için rota planlaması sevkiyat günü, yani 0. günde yapılır. Bu planın bir parçası olarak, her paketin nakliye maliyeti, paket yolculuğunun daha küçük parçalara bölünmesi ve her bir ayağın maliyetinin bir hesaplama yöntemi kullanılarak hesaplanması yoluyla tahmin edilir. ücret listesi. Gün maliyeti tahminleri, muhasebe amacıyla ilk kârlılık tahminlerini hesaplamak için kullanılır; örneğin, bir müşteriye yapılan belirli bir satışın sonucu olarak her kalem için kâr/zarar tahmini. Bu karlılık tahminleri, karar verme ve planlama için çeşitli alt hizmetler tarafından kullanılır.


Ancak, 0. gün tahminleri, uygun olmayan ücret listesi yapılandırması, yanlış paket boyutları, yanlış teslimat adresi vb. faktörlerden dolayı gerçek maliyetten farklı olabilir. Hatalı maliyet tahminleri, çarpık kârlılık tahminlerine neden olur ve bu da alt kesimlerin optimal olmayan finansal kararlara yol açmasına neden olur. sistemler. Örneğin, bir ürünün nakliye maliyeti sürekli olarak fazla tahmin ediliyorsa, ürün katalogdan kaldırılabilir. Öte yandan, maliyetin hafife alınması, fiyatlandırma sistemlerinin ürünün fiyatını düşürmesine ve dolayısıyla kayıplara yol açmasına neden olabilir. Ayrıca yanlış tahmin, müşteriye yanlış ürünleri tanıtmamıza da yol açarak kötü müşteri deneyimine neden olur. Bu nakliye maliyeti tahminlerini iyileştirmek için, 0. günde nakliye maliyetini doğru bir şekilde tahmin eden Transformer tabanlı bir derin öğrenme modeli öneriyoruz.


Nakliye bağlamında bir paket fiziksel boyutları, ağırlığı ve içeriğiyle karakterize edilir. Ayrıca, onu taşımaktan sorumlu taşıyıcı ve amaçlanan rota hakkındaki ayrıntıları da içerir. Ek olarak, bir paket, içindeki öğeyi/öğeleri ve gönderiyle ilgili çeşitli ücretleri tanımlayan değişken sayıda nitelikle ilişkilendirilir. Bu özelliklere toplu olarak paketle ilişkili ücret listesi adını veriyoruz. Paket ücret kartları gibi tablolu veri kümeleri için Gradient Boosted Decision Trees (GBDT), XGBoost (Chen ve Guestrin, 2016) vb. gibi ağaç tabanlı modeller, son teknoloji (SOTA) modeller olarak kabul edilir. Ancak bunların etkinliği büyük ölçüde, kapsamlı özellik mühendisliği gerektirebilen yüksek kaliteli girdi özelliklerine (Arik ve diğerleri, 2019) bağlıdır. Kullanım durumumuz açısından bu sorun, hedef kavramının ücret listesi özellikleri arasındaki yüksek dereceli kombinatoryal etkileşimlere bağlı olması gerçeğiyle daha da vurgulanmaktadır. Örneğin, ücret listesi ABC taşıyıcısı tarafından Washington DC'den New York'a gönderilen yanıcı maddelerin bulunduğu büyük kaplar için uygun şekilde yapılandırılmamışsa modelin < boyut = büyük, öğe = yanıcı, kaynak = W ashington özellik kombinasyonunu ilişkilendirmeyi öğrenmesi gerekir. , hedef = New Y ork, taşıyıcı = ABC > tahmini ve fiili maliyetler arasında yüksek sapma ile. Özellik kombinasyonları ile uğraşırken, paket özellikleri arasındaki olası tüm yüksek dereceli etkileşimleri dikkate almak, etkileşim sayısındaki üstel artış nedeniyle, sırayla her artışla birlikte boyutsallığın lanetine yol açacak şekilde pratik olmayabilir (Bishop, 2006). Ağaç tabanlı modellerin bir başka eksikliği de değişken uzunluktaki özellik listesini yönetememeleridir. Bir paket birden fazla öğe içerebilir ve nakliye maliyeti birden fazla ücret türüne bölünebilir. Önceki deneyler, birden fazla öğe ve ücretten tasarlanan özelliklerin eklenmesinin GBDT'nin performansını artırdığını gösterdi. Ancak ağaç tabanlı modellerin değişken özellik listesini işleyememesi nedeniyle onlardan tam bilgi öğrenilemedi.


Bu yazıda, transformatörlerin tablo alanındaki son zamanlardaki başarısından ilham alarak (Huang ve diğerleri, 2020; Somepalli ve diğerleri, 2021; Gorishniy ve diğerleri, 2021), Hız Kartı Transformatörü (RCT) adı verilen yeni bir mimari öneriyoruz. 0. günde gemi maliyetini tahmin etmek için. Önerilen model, özellikle bir paketle ilişkili ücret listesinin yerleştirilmesini öğrenmek için tasarlanmıştır. RCT, giriş özellikleri arasındaki etkileşimleri öğrenerek bir ücret listesindeki çeşitli bileşenler arasındaki karşılıklı bağımlılıkları etkili bir şekilde yakalamak için öz dikkat mekanizmalarından yararlanır. Bu çalışmadaki katkılarımız özellikle şunları içermektedir:


• 0. Günde nakliye maliyetini tahmin etmek amacıyla ücret listesinin bir manifoldunu öğrenmek için transformatör mimarisinden yararlanan yeni bir mimari olan Ücret Kartı Transformatörü (RCT) önerin. Ayrıca, RCT'nin hem GBDT'lerden hem de mevcut durumdan daha iyi performans gösterdiği gösterilmiştir. nakliye maliyeti tahmininde sanat tablolu transformatör, FT-Transformer, (Gorishniy ve diğerleri, 2021).


• Öğrenilen yerleştirmelerin ücret listesi manifoldunun yeterli bir temsili olduğunu ve öz dikkat katmanlarının etkili özellik etkileşimi öğrenenleri olduğunu göstermek için kapsamlı deneyler gerçekleştirilir. Transformatör katmanlarının ve dikkat kafalarının sayısının model performansı üzerindeki etkisini analiz etmek için ablasyon çalışmaları yapılır.