लेखक:
(1) पी आदित्य श्रीकर, अमेज़न और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया {[email protected]};
(2) साहिल वर्म, अमेज़न और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया {[email protected];}
(3) वरुण माधवन, भारतीय प्रौद्योगिकी संस्थान, खड़गपुर। अमेज़न में इंटर्नशिप के दौरान किया गया कार्य {[email protected]};
(4) अभिषेक प्रसाद, अमेज़न {[email protected]}.
Amazon संयुक्त राज्य अमेरिका में अपने ग्राहकों को सालाना अरबों पैकेज भेजता है। इन पैकेजों की शिपिंग लागत का उपयोग बिक्री की लाभप्रदता का अनुमान लगाने के लिए शिपिंग के दिन (दिन 0) पर किया जाता है। डाउनस्ट्रीम सिस्टम इन दिनों 0 लाभप्रदता अनुमानों का उपयोग वित्तीय निर्णय लेने के लिए करते हैं, जैसे कि मूल्य निर्धारण रणनीतियाँ और घाटे में चल रहे उत्पादों को हटाना। हालाँकि, वाहक चालान में देरी या मासिक ताल पर दर्ज होने वाले निश्चित लागत घटकों जैसे कारणों से दिन 0 पर सटीक शिपिंग लागत अनुमान प्राप्त करना जटिल है। गलत शिपिंग लागत अनुमान गलत निर्णय ले सकते हैं, जैसे कि आइटम की कीमत बहुत कम या अधिक रखना, या ग्राहकों को गलत उत्पाद का प्रचार करना। दिन 0 पर शिपिंग लागत का अनुमान लगाने के लिए वर्तमान समाधान ट्री-आधारित मॉडल पर निर्भर करते हैं जिनके लिए व्यापक मैनुअल इंजीनियरिंग प्रयासों की आवश्यकता होती है। इस अध्ययन में, हम रेट कार्ड ट्रांसफॉर्मर (RCT) नामक एक नई वास्तुकला का प्रस्ताव करते हैं जो पैकेज विशेषताओं, वाहक जानकारी और रूट प्लान जैसी सभी पैकेज शिपिंग जानकारी को एनकोड करने के लिए स्व-ध्यान का उपयोग करता है। अन्य ट्रांसफॉर्मर-आधारित सारणीबद्ध मॉडल के विपरीत, RCT में शिपमेंट के एक-से-कई संबंधों की एक चर सूची को एनकोड करने की क्षमता है, जिससे यह शिपमेंट के बारे में अधिक जानकारी प्राप्त कर सकता है। उदाहरण के लिए, RCT एक पैकेज में सभी उत्पादों के गुणों को एनकोड कर सकता है। हमारे परिणाम दर्शाते हैं कि RCT द्वारा किए गए लागत पूर्वानुमानों में ट्री-आधारित GBDT मॉडल की तुलना में 28.82% कम त्रुटि है। इसके अलावा, RCT अत्याधुनिक ट्रांसफॉर्मर-आधारित सारणीबद्ध मॉडल, FTTransformer से 6.08% बेहतर प्रदर्शन करता है। हम यह भी दर्शाते हैं कि RCT रेट कार्ड का एक सामान्यीकृत मैनिफोल्ड सीखता है जो ट्री-आधारित मॉडल के प्रदर्शन को बेहतर बना सकता है।
अमेज़ॅन अकेले संयुक्त राज्य अमेरिका में अपने ग्राहकों को सालाना अरबों के क्रम में पैकेज भेजता है। इन पैकेजों के लिए मार्ग नियोजन शिपिंग के दिन, दिन 0 पर किया जाता है। इस योजना के हिस्से के रूप में, प्रत्येक पैकेज के लिए शिपिंग लागत का अनुमान पैकेज की यात्रा को छोटे-छोटे चरणों में विभाजित करके और रेट कार्ड का उपयोग करके प्रत्येक चरण की लागत की गणना करके लगाया जाता है। दिन की लागत अनुमानों का उपयोग लेखांकन उद्देश्यों के लिए प्रारंभिक लाभप्रदता अनुमानों की गणना करने के लिए किया जाता है, उदाहरण के लिए किसी ग्राहक को किसी विशिष्ट बिक्री के परिणामस्वरूप प्रत्येक आइटम के लिए लाभ/हानि का अनुमान। इन लाभप्रदता अनुमानों का उपयोग निर्णय लेने और योजना बनाने के लिए कई डाउनस्ट्रीम सेवाओं द्वारा किया जाता है।
हालांकि, अनुचित रेट-कार्ड कॉन्फ़िगरेशन, गलत पैकेज आयाम, गलत डिलीवरी पता आदि जैसे कारकों के कारण दिन 0 अनुमान वास्तविक लागत से भिन्न हो सकते हैं। गलत लागत अनुमानों के कारण लाभप्रदता अनुमान गलत हो जाते हैं, जो बदले में डाउनस्ट्रीम सिस्टम द्वारा उप-इष्टतम वित्तीय निर्णयों की ओर ले जाता है। उदाहरण के लिए, यदि किसी आइटम की शिपिंग लागत लगातार अधिक आंकी जाती है, तो आइटम को कैटलॉग से हटाया जा सकता है। दूसरी ओर, कम आंकी गई लागत मूल्य निर्धारण प्रणालियों को आइटम की कीमत कम करने के लिए प्रेरित कर सकती है, जिससे नुकसान हो सकता है। इसके अलावा, गलत अनुमान हमें ग्राहक को गलत उत्पादों को बढ़ावा देने की ओर भी ले जाता है, जिससे खराब ग्राहक अनुभव होता है। इन शिपिंग लागत अनुमानों को बेहतर बनाने के लिए, हम एक ट्रांसफॉर्मर आधारित डीप लर्निंग मॉडल का प्रस्ताव करते हैं
शिपिंग के संदर्भ में, एक पैकेज को उसके भौतिक आयाम, वजन और सामग्री द्वारा पहचाना जाता है। इसमें इसे ले जाने के लिए जिम्मेदार वाहक और इच्छित मार्ग के बारे में विवरण भी शामिल है। इसके अतिरिक्त, एक पैकेज कई चर विशेषताओं से जुड़ा होता है जो अंदर मौजूद आइटम और उसके शिपमेंट से संबंधित विभिन्न शुल्कों का वर्णन करते हैं। सामूहिक रूप से, हम इन विशेषताओं को पैकेज से जुड़े रेट कार्ड के रूप में संदर्भित करते हैं। पैकेज रेट कार्ड जैसे सारणीबद्ध डेटासेट के लिए, ग्रेडिएंट बूस्टेड डिसीजन ट्रीज़ (GBDT), XGBoost (चेन और गेस्ट्रिन, 2016) जैसे ट्री आधारित मॉडल आदि को अत्याधुनिक (SOTA) मॉडल माना जाता है। हालांकि, उनकी प्रभावशीलता उच्च-गुणवत्ता वाले इनपुट फीचर्स (एरिक एट अल।, 2019) पर बहुत अधिक निर्भर करती है, जिसके लिए व्यापक फीचर इंजीनियरिंग की आवश्यकता हो सकती है। हमारे उपयोग के मामले में, यह समस्या इस तथ्य से और बढ़ जाती है कि लक्ष्य अवधारणा रेट कार्ड विशेषताओं के बीच उच्च क्रम के संयोजन संबंधी इंटरैक्शन पर निर्भर करती है। उदाहरण के लिए, यदि एबीसी वाहक द्वारा वाशिंगटन डीसी से न्यूयॉर्क भेजे जाने वाले ज्वलनशील पदार्थों वाले बड़े कंटेनरों के लिए रेट कार्ड अनुचित तरीके से कॉन्फ़िगर किया गया है, तो मॉडल को संपत्ति संयोजन <आकार = बड़ा, आइटम = ज्वलनशील, स्रोत = वाशिंगटन, गंतव्य = न्यूयॉर्क, वाहक = एबीसी> को अनुमानित और वास्तविक लागतों के बीच उच्च विचलन के साथ जोड़ना सीखना होगा। फीचर संयोजनों से निपटते समय, पैकेज गुणों के बीच सभी संभावित उच्च-क्रम इंटरैक्शन पर विचार करना अव्यावहारिक हो सकता है क्योंकि क्रम में प्रत्येक वृद्धि के साथ इंटरैक्शन की संख्या में घातीय वृद्धि होती है, जिससे आयामीता का अभिशाप होता है (बिशप, 2006)। पेड़ आधारित मॉडल की एक और कमी सुविधाओं की एक परिवर्तनीय लंबाई सूची को संभालने में उनकी असमर्थता है। एक पैकेज में कई आइटम हो सकते हैं
इस पेपर में, टैबुलर डोमेन में ट्रांसफॉर्मर की हाल की सफलता से प्रेरित होकर (हुआंग एट अल., 2020; सोमपल्ली एट अल., 2021; गोरिशनी एट अल., 2021), हम 0 दिन पर शिप लागत की भविष्यवाणी करने के लिए रेट कार्ड ट्रांसफॉर्मर (RCT) नामक एक नई वास्तुकला का प्रस्ताव करते हैं। प्रस्तावित मॉडल विशेष रूप से पैकेज से जुड़े रेट कार्ड के एम्बेडिंग को सीखने के लिए डिज़ाइन किया गया है। RCT इनपुट सुविधाओं के बीच बातचीत सीखकर रेट कार्ड में विभिन्न घटकों के बीच अंतर-निर्भरता को प्रभावी ढंग से पकड़ने के लिए स्व-ध्यान तंत्र का लाभ उठाता है। विशेष रूप से, इस कार्य में हमारे योगदान में शामिल हैं:
• एक नई वास्तुकला, रेट कार्ड ट्रांसफॉर्मर (RCT) का प्रस्ताव करें, जो दिन 0 पर शिपिंग लागत की भविष्यवाणी करने के लिए रेट कार्ड के मैनिफोल्ड को सीखने के लिए ट्रांसफॉर्मर आर्किटेक्चर का लाभ उठाता है। इसके अलावा, यह प्रदर्शित किया गया है कि शिपिंग लागत की भविष्यवाणी में RCT, GBDTs और अत्याधुनिक टेबुलर ट्रांसफॉर्मर, FT-ट्रांसफॉर्मर, (गोरिश्नी एट अल., 2021) दोनों से बेहतर प्रदर्शन करता है।
• यह दिखाने के लिए व्यापक प्रयोग किए जाते हैं कि सीखी गई एम्बेडिंग रेट कार्ड मैनिफोल्ड का पर्याप्त प्रतिनिधित्व करती है, और स्व-ध्यान परतें प्रभावी फीचर इंटरैक्शन सीखने वाले हैं। मॉडल प्रदर्शन पर ट्रांसफॉर्मर परतों और ध्यान प्रमुखों की संख्या के प्रभाव का विश्लेषण करने के लिए एब्लेशन अध्ययन किए जाते हैं।