Yazarlar:
(1) P Aditya Sreekar, Amazon ve bu yazarlar bu çalışmaya eşit katkıda bulunmuştur {[email protected]};
(2) Sahil Verm, Amazon ve bu yazarlar bu çalışmaya eşit katkıda bulunmuştur {[email protected];}
(3) Varun Madhavan, Hindistan Teknoloji Enstitüsü, Kharagpur. Amazon'da staj sırasında yapılan çalışmalar {[email protected]};
(4) Abhishek Persad, Amazon {[email protected]}.
Bu yazıda, 0. günde nakliye maliyetlerini tahmin etmek için Transformer mimarisini temel alan yeni bir çerçeve sunduk. Önerilen çerçevemiz, bir paketin nakliye özelliklerini, yani paket ücret listesini, tek tip bir yerleştirme alanına kodlar. Bu yerleştirmeler daha sonra, karmaşık üst düzey etkileşimleri modelleyen ve nakliye maliyetlerini tahmin etmek için paket ücret listesinin etkili bir temsilini öğrenen bir Transformer katmanı aracılığıyla beslenir. Deneysel sonuçlarımız, RCT olarak adlandırılan önerilen modelin GBDT modelinden %28,8 daha iyi performans gösterdiğini göstermektedir. Ayrıca problem açıklamamız için RCT'nin SOTA model FT-Transformer'dan daha iyi performans gösterdiğini gösterin. Ayrıca RCT tarafından öğrenilen ücret listesi temsilinin GBDT modeline eklendiğinde performansının %12,51 oranında arttığını da gösterdik. Bu, RCT'nin ücret listesi bilgilerinin yeterli temsil temsillerini öğrenebildiğinin altını çizmektedir.
Bu çalışmada kullanılan rota bilgisi yalnızca başlangıç ve bitiş düğümleriyle sınırlıydı. Gelecekteki çalışmalar, rotanın tamamı hakkındaki bilgileri kodlamak için Grafik Sinir Ağlarının kullanımını araştırabilir. Ayrıca, RCT'nin performansı, dahili olarak mevcut olan öğe yerleştirmelerin kullanılması gibi, öğe kimliğini bir özellik olarak eklemenin yolları araştırılarak geliştirilebilir.
Ayrıca, RCT yalnızca gemi maliyetini tahmin edecek şekilde eğitilmiş olsa da, bir Transformer kod çözücü katmanı eklenerek faturanın tüm özelliklerini tahmin edecek şekilde değiştirilebilir. Bu, faturada anormallik tespiti gibi diğer uygulamaların etkinleştirilmesini sağlayacaktır. Ek olarak, gelecekteki araştırmalar, RCT tarafından öğrenilen paket temsillerinin diğer ilgili görevlerin performansını iyileştirmek için kullanılıp kullanılamayacağını veya Amini ve ark.'da önerilen yaklaşımlar aracılığıyla her tahmindeki model belirsizliğini ölçmek için kullanılıp kullanılamayacağını araştırabilir. (2019).