লেখক:
(1) পি আদিত্য শ্রীকর, আমাজন এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন {[email protected]};
(2) সাহিল ভার্ম, আমাজন এবং এই লেখকরা এই কাজে সমানভাবে অবদান রেখেছেন {[email protected];}
(3) বরুণ মাধবন, ইন্ডিয়ান ইনস্টিটিউট অফ টেকনোলজি, খড়গপুর। অ্যামাজন {[email protected]} এ ইন্টার্নশিপের সময় কাজ করা হয়েছে;
(4) অভিষেক প্রসাদ, আমাজন {[email protected]}।
অ্যামাজন মার্কিন যুক্তরাষ্ট্রের মধ্যে বার্ষিক তার গ্রাহকদের বিলিয়ন প্যাকেজ পাঠায়। এই প্যাকেজগুলির শিপিং খরচ শিপিংয়ের দিনে (0 দিন) বিক্রয়ের লাভের অনুমান করতে ব্যবহৃত হয়। ডাউনস্ট্রীম সিস্টেমগুলি আজকাল 0 লাভের অনুমান ব্যবহার করে আর্থিক সিদ্ধান্ত নিতে, যেমন মূল্য নির্ধারণের কৌশল এবং লোকসানকারী পণ্যগুলিকে তালিকাভুক্ত করা। যাইহোক, 0 দিনে সঠিক শিপিং খরচের অনুমান প্রাপ্ত করা ক্যারিয়ারের ইনভয়েসিং বা নির্দিষ্ট খরচের উপাদানগুলি মাসিক ক্যাডেন্সে রেকর্ড করার মতো কারণগুলির জন্য জটিল। ভুল শিপিং খরচ অনুমান খারাপ সিদ্ধান্তের দিকে নিয়ে যেতে পারে, যেমন আইটেমের দাম খুব কম বা বেশি, বা গ্রাহকদের কাছে ভুল পণ্য প্রচার করা। 0 দিনে শিপিং খরচ অনুমান করার জন্য বর্তমান সমাধানগুলি গাছ-ভিত্তিক মডেলগুলির উপর নির্ভর করে যার জন্য ব্যাপক ম্যানুয়াল ইঞ্জিনিয়ারিং প্রচেষ্টা প্রয়োজন। এই গবেষণায়, আমরা রেট কার্ড ট্রান্সফরমার (RCT) নামে একটি অভিনব স্থাপত্যের প্রস্তাব করি যা প্যাকেজ বৈশিষ্ট্য, ক্যারিয়ার তথ্য এবং রুট প্ল্যানের মতো সমস্ত প্যাকেজ শিপিং তথ্য এনকোড করতে স্ব-মনোযোগ ব্যবহার করে। অন্যান্য ট্রান্সফরমার-ভিত্তিক ট্যাবুলার মডেলের বিপরীতে, আরসিটি একটি চালানের এক থেকে একাধিক সম্পর্কের পরিবর্তনশীল তালিকা এনকোড করার ক্ষমতা রাখে, এটি একটি চালান সম্পর্কে আরও তথ্য ক্যাপচার করতে দেয়। উদাহরণস্বরূপ, RCT একটি প্যাকেজে সমস্ত পণ্যের বৈশিষ্ট্য এনকোড করতে পারে। আমাদের ফলাফলগুলি দেখায় যে RCT দ্বারা করা খরচের পূর্বাভাসে গাছ-ভিত্তিক GBDT মডেলের তুলনায় 28.82% কম ত্রুটি রয়েছে। অধিকন্তু, RCT অত্যাধুনিক ট্রান্সফরমার-ভিত্তিক ট্যাবুলার মডেল, FTT ট্রান্সফরমারকে 6.08% ছাড়িয়েছে। আমরা আরও ব্যাখ্যা করি যে RCT রেট কার্ডের একটি সাধারণীকৃত বহুগুণ শিখে যা গাছ-ভিত্তিক মডেলগুলির কার্যকারিতা উন্নত করতে পারে।
Amazon শুধুমাত্র মার্কিন যুক্তরাষ্ট্রে তার গ্রাহকদের জন্য বার্ষিক বিলিয়ন ক্রমে প্যাকেজ পাঠায়। এই প্যাকেজগুলির জন্য রুট পরিকল্পনাটি শিপিংয়ের দিন, 0 তে করা হয়। এই পরিকল্পনার অংশ হিসাবে, প্রতিটি প্যাকেজের জন্য শিপিং খরচ অনুমান করা হয় প্যাকেজ ভ্রমণকে ছোট পায়ে ভাগ করে, এবং একটি ব্যবহার করে প্রতিটি পায়ের খরচ গণনা করে। রেট কার্ড। দিনের খরচ অনুমান অ্যাকাউন্টিং উদ্দেশ্যে প্রাথমিক লাভের অনুমান গণনা করতে ব্যবহৃত হয়, যেমন একটি গ্রাহকের কাছে একটি নির্দিষ্ট বিক্রয়ের ফলে প্রতিটি আইটেমের জন্য লাভ/ক্ষতির অনুমান। এই লাভের অনুমানগুলি সিদ্ধান্ত গ্রহণ এবং পরিকল্পনার জন্য বেশ কয়েকটি ডাউনস্ট্রিম পরিষেবা দ্বারা ব্যবহৃত হয়।
যাইহোক, অনুপযুক্ত রেট-কার্ড কনফিগারেশন, ভুল প্যাকেজ মাত্রা, ভুল ডেলিভারি ঠিকানা, ইত্যাদি কারণের কারণে ০ দিনের অনুমান প্রকৃত খরচ থেকে আলাদা হতে পারে। ভুল খরচ অনুমান তির্যক লাভের অনুমান সৃষ্টি করে, যার ফলস্বরূপ নিম্নধারায় সাবঅপ্টিমাল আর্থিক সিদ্ধান্ত নেওয়া হয়। সিস্টেম উদাহরণস্বরূপ, যদি একটি আইটেমের শিপিং খরচ ধারাবাহিকভাবে overestimated হয়, তাহলে আইটেমটি ক্যাটালগ থেকে সরানো যেতে পারে। অন্যদিকে, কম মূল্যের মূল্য নির্ধারণের সিস্টেমগুলিকে আইটেমের দাম কমাতে পারে, যার ফলে ক্ষতি হতে পারে। অধিকন্তু, ভুল অনুমান আমাদেরকে গ্রাহকের কাছে ভুল পণ্য প্রচার করতে পরিচালিত করে, যার ফলে গ্রাহকের অভিজ্ঞতা খারাপ হয়। এই শিপিং খরচ অনুমান উন্নত করতে, আমরা একটি ট্রান্সফর্মার ভিত্তিক গভীর শিক্ষার মডেল প্রস্তাব করি যা 0 দিনে শিপিং খরচের সঠিকভাবে পূর্বাভাস দেয়।
শিপিংয়ের প্রসঙ্গে, একটি প্যাকেজ তার শারীরিক মাত্রা, ওজন এবং বিষয়বস্তু দ্বারা চিহ্নিত করা হয়। এটি পরিবহনের জন্য দায়ী বাহক এবং উদ্দিষ্ট রুট সম্পর্কে বিশদও অন্তর্ভুক্ত করে। উপরন্তু, একটি প্যাকেজ একটি পরিবর্তনশীল সংখ্যক বৈশিষ্ট্যের সাথে যুক্ত থাকে যা ভিতরের আইটেম(গুলি) এবং এর চালানের সাথে সম্পর্কিত বিভিন্ন চার্জ বর্ণনা করে। সমষ্টিগতভাবে, আমরা এই বৈশিষ্ট্যগুলিকে প্যাকেজের সাথে যুক্ত রেট কার্ড হিসাবে উল্লেখ করি। প্যাকেজ রেট কার্ডের মতো ট্যাবুলার ডেটাসেটের জন্য, গ্রেডিয়েন্ট বুস্টেড ডিসিশন ট্রিস (GBDT), XGBoost (Chen and Guestrin, 2016) ইত্যাদির মতো ট্রি ভিত্তিক মডেলগুলিকে অত্যাধুনিক (SOTA) মডেল হিসাবে বিবেচনা করা হয়। যাইহোক, তাদের কার্যকারিতা উচ্চ-মানের ইনপুট বৈশিষ্ট্যগুলির উপর অনেক বেশি নির্ভর করে (Arik et al., 2019) যার জন্য ব্যাপক বৈশিষ্ট্য প্রকৌশল প্রয়োজন হতে পারে। আমাদের ব্যবহারের ক্ষেত্রে, এই সমস্যাটি আরও জোরদার করা হয়েছে যে লক্ষ্য ধারণাটি রেট কার্ডের বৈশিষ্ট্যগুলির মধ্যে উচ্চ ক্রম সমন্বয়মূলক মিথস্ক্রিয়াগুলির উপর নির্ভর করে। উদাহরণ স্বরূপ, যদি ABC ক্যারিয়ার দ্বারা ওয়াশিংটন ডিসি থেকে নিউ ইয়র্কে পাঠানো দাহ্য পদার্থ সহ বড় কন্টেইনারগুলির জন্য রেট কার্ডটি ভুলভাবে কনফিগার করা হয়, তাহলে মডেলটিকে সম্পত্তি সংমিশ্রণ < আকার = বড়, আইটেম = দাহ্য, উত্স = W ashington এর সাথে সংযুক্ত করতে শিখতে হবে , গন্তব্য = New Y ork, ক্যারিয়ার = ABC > আনুমানিক এবং প্রকৃত খরচের মধ্যে উচ্চ বিচ্যুতি সহ। বৈশিষ্ট্য সংমিশ্রণ নিয়ে কাজ করার সময়, প্যাকেজ বৈশিষ্ট্যগুলির মধ্যে সমস্ত সম্ভাব্য উচ্চ-ক্রম মিথস্ক্রিয়া বিবেচনা করা অব্যবহারিক হতে পারে কারণ প্রতিটি বৃদ্ধির সাথে ক্রমানুসারে মিথস্ক্রিয়া সংখ্যার সূচকীয় বৃদ্ধির কারণে, মাত্রার অভিশাপ (বিশপ, 2006)। গাছ ভিত্তিক মডেলগুলির আরেকটি ত্রুটি হল বৈশিষ্ট্যগুলির একটি পরিবর্তনশীল দৈর্ঘ্যের তালিকা পরিচালনা করতে তাদের অক্ষমতা। একটি প্যাকেজে একাধিক আইটেম থাকতে পারে এবং এর জাহাজের খরচ একাধিক চার্জ প্রকারে বিভক্ত করা যেতে পারে। পূর্ববর্তী পরীক্ষাগুলি প্রমাণ করেছে যে একাধিক আইটেম এবং চার্জ থেকে প্রকৌশলী বৈশিষ্ট্যগুলি যোগ করার ফলে GBDT-এর কর্মক্ষমতা উন্নত হয়েছে৷ যাইহোক, বৈশিষ্ট্যগুলির পরিবর্তনশীল তালিকা পরিচালনা করতে গাছ ভিত্তিক মডেলগুলির অক্ষমতার কারণে, তাদের থেকে সম্পূর্ণ তথ্য শেখা যায়নি।
এই কাগজে, টেবুলার ডোমেনে ট্রান্সফরমারগুলির সাম্প্রতিক সাফল্যের দ্বারা অনুপ্রাণিত হয়ে (Huang et al., 2020; Somepalli et al., 2021; Gorishniy et al., 2021), আমরা রেট কার্ড ট্রান্সফরমার (RCT) নামে একটি অভিনব স্থাপত্যের প্রস্তাব করি৷ 0 দিনে জাহাজের খরচের পূর্বাভাস দিতে। প্রস্তাবিত মডেলটি বিশেষভাবে প্যাকেজের সাথে যুক্ত রেট কার্ডের এমবেডিং শেখার জন্য ডিজাইন করা হয়েছে। RCT ইনপুট বৈশিষ্ট্যগুলির মধ্যে মিথস্ক্রিয়া শেখার মাধ্যমে একটি রেট কার্ডে বিভিন্ন উপাদানের মধ্যে আন্তঃনির্ভরতাগুলিকে কার্যকরভাবে ক্যাপচার করার জন্য স্ব-মনোযোগের প্রক্রিয়াগুলিকে কাজে লাগায়। বিশেষত, এই কাজে আমাদের অবদানের মধ্যে রয়েছে:
• একটি অভিনব স্থাপত্যের প্রস্তাব করুন, রেট কার্ড ট্রান্সফরমার (RCT), যা ট্রান্সফরমার আর্কিটেকচারকে রেট কার্ডের বহুগুণ শিখতে, 0 দিনে শিপিং খরচের পূর্বাভাস দেওয়ার জন্য ব্যবহার করে। আরও, এটি প্রদর্শিত হয় যে RCT GBDTs এবং স্থিতিশীলতা উভয়কেই ছাড়িয়ে যায়। আর্ট ট্যাবুলার ট্রান্সফরমার, FT-ট্রান্সফরমার, (Gorishniy et al., 2021) শিপিং খরচের পূর্বাভাস।
• বিস্তৃত পরীক্ষা-নিরীক্ষা করা হয় তা দেখানোর জন্য যে শেখা এমবেডিংগুলি রেট কার্ডের বহুগুণে একটি পর্যাপ্ত উপস্থাপনা, এবং স্ব-মনোযোগ স্তরগুলি কার্যকর বৈশিষ্ট্য ইন্টারঅ্যাকশন শিক্ষার্থী। মডেল পারফরম্যান্সের উপর ট্রান্সফরমার স্তর এবং মনোযোগের মাথার সংখ্যার প্রভাব বিশ্লেষণ করতে অ্যাবলেশন স্টাডি করা হয়।
এই কাগজটি CC BY-NC-ND 4.0 DEED লাইসেন্সের অধীনে arxiv-এ উপলব্ধ ।