लेखक:  (1) पी आदित्य श्रीकर, अमेज़न और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया {sreekarp@amazon.com};  (2) साहिल वर्म, अमेज़न और इन लेखकों ने इस कार्य में समान रूप से योगदान दिया {vrsahil@amazon.com;}  (3) वरुण माधवन, भारतीय प्रौद्योगिकी संस्थान, खड़गपुर। अमेज़न में इंटर्नशिप के दौरान किया गया कार्य {varunmadhavan@iitkgp.ac.in};  (4) अभिषेक प्रसाद, अमेज़न {persadap@amazon.com}.  लिंक की तालिका   सार और परिचय   संबंधित काम   क्रियाविधि   प्रयोग   निष्कर्ष एवं भविष्य का काम   संदर्भ  अमूर्त  Amazon संयुक्त राज्य अमेरिका में अपने ग्राहकों को सालाना अरबों पैकेज भेजता है। इन पैकेजों की शिपिंग लागत का उपयोग बिक्री की लाभप्रदता का अनुमान लगाने के लिए शिपिंग के दिन (दिन 0) पर किया जाता है। डाउनस्ट्रीम सिस्टम इन दिनों 0 लाभप्रदता अनुमानों का उपयोग वित्तीय निर्णय लेने के लिए करते हैं, जैसे कि मूल्य निर्धारण रणनीतियाँ और घाटे में चल रहे उत्पादों को हटाना। हालाँकि, वाहक चालान में देरी या मासिक ताल पर दर्ज होने वाले निश्चित लागत घटकों जैसे कारणों से दिन 0 पर सटीक शिपिंग लागत अनुमान प्राप्त करना जटिल है। गलत शिपिंग लागत अनुमान गलत निर्णय ले सकते हैं, जैसे कि आइटम की कीमत बहुत कम या अधिक रखना, या ग्राहकों को गलत उत्पाद का प्रचार करना। दिन 0 पर शिपिंग लागत का अनुमान लगाने के लिए वर्तमान समाधान ट्री-आधारित मॉडल पर निर्भर करते हैं जिनके लिए व्यापक मैनुअल इंजीनियरिंग प्रयासों की आवश्यकता होती है। इस अध्ययन में, हम रेट कार्ड ट्रांसफॉर्मर (RCT) नामक एक नई वास्तुकला का प्रस्ताव करते हैं जो पैकेज विशेषताओं, वाहक जानकारी और रूट प्लान जैसी सभी पैकेज शिपिंग जानकारी को एनकोड करने के लिए स्व-ध्यान का उपयोग करता है। अन्य ट्रांसफॉर्मर-आधारित सारणीबद्ध मॉडल के विपरीत, RCT में शिपमेंट के एक-से-कई संबंधों की एक चर सूची को एनकोड करने की क्षमता है, जिससे यह शिपमेंट के बारे में अधिक जानकारी प्राप्त कर सकता है। उदाहरण के लिए, RCT एक पैकेज में सभी उत्पादों के गुणों को एनकोड कर सकता है। हमारे परिणाम दर्शाते हैं कि RCT द्वारा किए गए लागत पूर्वानुमानों में ट्री-आधारित GBDT मॉडल की तुलना में 28.82% कम त्रुटि है। इसके अलावा, RCT अत्याधुनिक ट्रांसफॉर्मर-आधारित सारणीबद्ध मॉडल, FTTransformer से 6.08% बेहतर प्रदर्शन करता है। हम यह भी दर्शाते हैं कि RCT रेट कार्ड का एक सामान्यीकृत मैनिफोल्ड सीखता है जो ट्री-आधारित मॉडल के प्रदर्शन को बेहतर बना सकता है।  1 परिचय  अमेज़ॅन अकेले संयुक्त राज्य अमेरिका में अपने ग्राहकों को सालाना अरबों के क्रम में पैकेज भेजता है। इन पैकेजों के लिए मार्ग नियोजन शिपिंग के दिन, दिन 0 पर किया जाता है। इस योजना के हिस्से के रूप में, प्रत्येक पैकेज के लिए शिपिंग लागत का अनुमान पैकेज की यात्रा को छोटे-छोटे चरणों में विभाजित करके और रेट कार्ड का उपयोग करके प्रत्येक चरण की लागत की गणना करके लगाया जाता है। दिन की लागत अनुमानों का उपयोग लेखांकन उद्देश्यों के लिए प्रारंभिक लाभप्रदता अनुमानों की गणना करने के लिए किया जाता है, उदाहरण के लिए किसी ग्राहक को किसी विशिष्ट बिक्री के परिणामस्वरूप प्रत्येक आइटम के लिए लाभ/हानि का अनुमान। इन लाभप्रदता अनुमानों का उपयोग निर्णय लेने और योजना बनाने के लिए कई डाउनस्ट्रीम सेवाओं द्वारा किया जाता है।  हालांकि, अनुचित रेट-कार्ड कॉन्फ़िगरेशन, गलत पैकेज आयाम, गलत डिलीवरी पता आदि जैसे कारकों के कारण दिन 0 अनुमान वास्तविक लागत से भिन्न हो सकते हैं। गलत लागत अनुमानों के कारण लाभप्रदता अनुमान गलत हो जाते हैं, जो बदले में डाउनस्ट्रीम सिस्टम द्वारा उप-इष्टतम वित्तीय निर्णयों की ओर ले जाता है। उदाहरण के लिए, यदि किसी आइटम की शिपिंग लागत लगातार अधिक आंकी जाती है, तो आइटम को कैटलॉग से हटाया जा सकता है। दूसरी ओर, कम आंकी गई लागत मूल्य निर्धारण प्रणालियों को आइटम की कीमत कम करने के लिए प्रेरित कर सकती है, जिससे नुकसान हो सकता है। इसके अलावा, गलत अनुमान हमें ग्राहक को गलत उत्पादों को बढ़ावा देने की ओर भी ले जाता है, जिससे खराब ग्राहक अनुभव होता है। इन शिपिंग लागत अनुमानों को बेहतर बनाने के लिए, हम एक ट्रांसफॉर्मर आधारित डीप लर्निंग मॉडल का प्रस्ताव करते हैं  शिपिंग के संदर्भ में, एक पैकेज को उसके भौतिक आयाम, वजन और सामग्री द्वारा पहचाना जाता है। इसमें इसे ले जाने के लिए जिम्मेदार वाहक और इच्छित मार्ग के बारे में विवरण भी शामिल है। इसके अतिरिक्त, एक पैकेज कई चर विशेषताओं से जुड़ा होता है जो अंदर मौजूद आइटम और उसके शिपमेंट से संबंधित विभिन्न शुल्कों का वर्णन करते हैं। सामूहिक रूप से, हम इन विशेषताओं को पैकेज से जुड़े रेट कार्ड के रूप में संदर्भित करते हैं। पैकेज रेट कार्ड जैसे सारणीबद्ध डेटासेट के लिए, ग्रेडिएंट बूस्टेड डिसीजन ट्रीज़ (GBDT), XGBoost (चेन और गेस्ट्रिन, 2016) जैसे ट्री आधारित मॉडल आदि को अत्याधुनिक (SOTA) मॉडल माना जाता है। हालांकि, उनकी प्रभावशीलता उच्च-गुणवत्ता वाले इनपुट फीचर्स (एरिक एट अल।, 2019) पर बहुत अधिक निर्भर करती है, जिसके लिए व्यापक फीचर इंजीनियरिंग की आवश्यकता हो सकती है। हमारे उपयोग के मामले में, यह समस्या इस तथ्य से और बढ़ जाती है कि लक्ष्य अवधारणा रेट कार्ड विशेषताओं के बीच उच्च क्रम के संयोजन संबंधी इंटरैक्शन पर निर्भर करती है। उदाहरण के लिए, यदि एबीसी वाहक द्वारा वाशिंगटन डीसी से न्यूयॉर्क भेजे जाने वाले ज्वलनशील पदार्थों वाले बड़े कंटेनरों के लिए रेट कार्ड अनुचित तरीके से कॉन्फ़िगर किया गया है, तो मॉडल को संपत्ति संयोजन <आकार = बड़ा, आइटम = ज्वलनशील, स्रोत = वाशिंगटन, गंतव्य = न्यूयॉर्क, वाहक = एबीसी> को अनुमानित और वास्तविक लागतों के बीच उच्च विचलन के साथ जोड़ना सीखना होगा। फीचर संयोजनों से निपटते समय, पैकेज गुणों के बीच सभी संभावित उच्च-क्रम इंटरैक्शन पर विचार करना अव्यावहारिक हो सकता है क्योंकि क्रम में प्रत्येक वृद्धि के साथ इंटरैक्शन की संख्या में घातीय वृद्धि होती है, जिससे आयामीता का अभिशाप होता है (बिशप, 2006)। पेड़ आधारित मॉडल की एक और कमी सुविधाओं की एक परिवर्तनीय लंबाई सूची को संभालने में उनकी असमर्थता है। एक पैकेज में कई आइटम हो सकते हैं  इस पेपर में, टैबुलर डोमेन में ट्रांसफॉर्मर की हाल की सफलता से प्रेरित होकर (हुआंग एट अल., 2020; सोमपल्ली एट अल., 2021; गोरिशनी एट अल., 2021), हम 0 दिन पर शिप लागत की भविष्यवाणी करने के लिए रेट कार्ड ट्रांसफॉर्मर (RCT) नामक एक नई वास्तुकला का प्रस्ताव करते हैं। प्रस्तावित मॉडल विशेष रूप से पैकेज से जुड़े रेट कार्ड के एम्बेडिंग को सीखने के लिए डिज़ाइन किया गया है। RCT इनपुट सुविधाओं के बीच बातचीत सीखकर रेट कार्ड में विभिन्न घटकों के बीच अंतर-निर्भरता को प्रभावी ढंग से पकड़ने के लिए स्व-ध्यान तंत्र का लाभ उठाता है। विशेष रूप से, इस कार्य में हमारे योगदान में शामिल हैं:  • एक नई वास्तुकला, रेट कार्ड ट्रांसफॉर्मर (RCT) का प्रस्ताव करें, जो दिन 0 पर शिपिंग लागत की भविष्यवाणी करने के लिए रेट कार्ड के मैनिफोल्ड को सीखने के लिए ट्रांसफॉर्मर आर्किटेक्चर का लाभ उठाता है। इसके अलावा, यह प्रदर्शित किया गया है कि शिपिंग लागत की भविष्यवाणी में RCT, GBDTs और अत्याधुनिक टेबुलर ट्रांसफॉर्मर, FT-ट्रांसफॉर्मर, (गोरिश्नी एट अल., 2021) दोनों से बेहतर प्रदर्शन करता है।  • यह दिखाने के लिए व्यापक प्रयोग किए जाते हैं कि सीखी गई एम्बेडिंग रेट कार्ड मैनिफोल्ड का पर्याप्त प्रतिनिधित्व करती है, और स्व-ध्यान परतें प्रभावी फीचर इंटरैक्शन सीखने वाले हैं। मॉडल प्रदर्शन पर ट्रांसफॉर्मर परतों और ध्यान प्रमुखों की संख्या के प्रभाव का विश्लेषण करने के लिए एब्लेशन अध्ययन किए जाते हैं।  यह पेपर   है। arxiv पर CC BY-NC-ND 4.0 DEED लाइसेंस के अंतर्गत उपलब्ध

Part of HackerNoon's growing list of open-source research papers, promoting free access to academic material.

Read My Stories

Publications in convolution, driving breakthroughs in signal processing and artificial intelligence.

Convolution's blog

यह ऑडियो कहानी की मूल भाषा में निर्मित है!

शिपिंग लागत की भविष्यवाणी के लिए स्व-ध्यान की शक्ति का अनावरण: सार और परिचय

About Author

टिप्पणियाँ

लेबल

इस लेख में चित्रित किया गया था

Related Stories

HackerNoon एक बहुभाषी प्लेटफ़ॉर्म है: सभी शीर्ष कहानियाँ अब 13 भाषाओं में उपलब्ध हैं

उपयोगकर्ता-केंद्रित क्रिप्टो उत्पाद बनाना: ग्राहक प्रतिक्रिया का महत्व

क्लाउड सॉनेट 3.5 सिस्टम प्रॉम्प्ट लीक: एक फोरेंसिक विश्लेषण

डिजिटल खानाबदोशों सुनो: थाईलैंड के नए डीटीवी वीज़ा के बारे में आपको क्या जानना चाहिए

HackerNoon एक बहुभाषी प्लेटफ़ॉर्म है: सभी शीर्ष कहानियाँ अब 13 भाषाओं में उपलब्ध हैं

उपयोगकर्ता-केंद्रित क्रिप्टो उत्पाद बनाना: ग्राहक प्रतिक्रिया का महत्व

क्लाउड सॉनेट 3.5 सिस्टम प्रॉम्प्ट लीक: एक फोरेंसिक विश्लेषण

डिजिटल खानाबदोशों सुनो: थाईलैंड के नए डीटीवी वीज़ा के बारे में आपको क्या जानना चाहिए

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps