paint-brush
Khám phá sức mạnh của sự chú ý trong việc dự đoán chi phí vận chuyển: Tóm tắt và giới thiệuby@convolution

Khám phá sức mạnh của sự chú ý trong việc dự đoán chi phí vận chuyển: Tóm tắt và giới thiệu

Mô hình AI mới (Rate Card Transformer) phân tích chi tiết gói hàng (kích thước, hãng vận chuyển, v.v.) để dự đoán chi phí vận chuyển chính xác hơn.
featured image - Khám phá sức mạnh của sự chú ý trong việc dự đoán chi phí vận chuyển: Tóm tắt và giới thiệu
Convolution: Leading Authority on Signal Processing HackerNoon profile picture
0-item

tác giả:

(1) P Aditya Sreekar, Amazon và các tác giả này đã đóng góp như nhau cho tác phẩm này {[email protected]};

(2) Sahil Verm, Amazon và các tác giả này đã đóng góp như nhau cho tác phẩm này {[email protected];}

(3) Varun Madhavan, Viện Công nghệ Ấn Độ, Kharagpur. Công việc được thực hiện trong thời gian thực tập tại Amazon {[email protected]};

(4) Abhishek Persad, Amazon {[email protected]}.

Bảng liên kết

trừu tượng

Amazon vận chuyển hàng tỷ gói hàng cho khách hàng của mình hàng năm tại Hoa Kỳ. Chi phí vận chuyển của các gói hàng này được sử dụng vào ngày vận chuyển (ngày 0) để ước tính lợi nhuận bán hàng. Các hệ thống hạ nguồn sử dụng ước tính lợi nhuận 0 ngày nay để đưa ra các quyết định tài chính, chẳng hạn như chiến lược định giá và hủy niêm yết các sản phẩm thua lỗ. Tuy nhiên, việc có được ước tính chi phí vận chuyển chính xác vào ngày 0 rất phức tạp vì những lý do như sự chậm trễ trong việc lập hóa đơn của hãng vận chuyển hoặc các thành phần chi phí cố định được ghi lại theo nhịp hàng tháng. Ước tính chi phí vận chuyển không chính xác có thể dẫn đến quyết định sai lầm, chẳng hạn như định giá các mặt hàng quá thấp hoặc quá cao hoặc quảng cáo sai sản phẩm cho khách hàng. Các giải pháp hiện tại để ước tính chi phí vận chuyển vào ngày 0 dựa vào các mô hình dựa trên cây đòi hỏi nhiều nỗ lực kỹ thuật thủ công. Trong nghiên cứu này, chúng tôi đề xuất một kiến trúc mới có tên là Biến áp thẻ giá (RCT) sử dụng tính năng tự chú ý để mã hóa tất cả thông tin vận chuyển gói hàng như thuộc tính gói hàng, thông tin hãng vận chuyển và sơ đồ tuyến đường. Không giống như các mô hình dạng bảng dựa trên máy biến áp khác, RCT có khả năng mã hóa danh sách biến đổi các mối quan hệ một-nhiều của một lô hàng, cho phép nó nắm bắt thêm thông tin về lô hàng. Ví dụ: RCT có thể mã hóa thuộc tính của tất cả sản phẩm trong một gói. Kết quả của chúng tôi chứng minh rằng các dự đoán chi phí do RCT đưa ra có sai số ít hơn 28,82% so với mô hình GBDT dựa trên cây. Hơn nữa, RCT vượt trội hơn mô hình bảng dựa trên máy biến áp tiên tiến nhất, FTTransformer, tới 6,08%. Chúng tôi cũng minh họa rằng RCT học được nhiều loại thẻ giá tổng quát có thể cải thiện hiệu suất của các mô hình dựa trên cây.

1. Giới thiệu

Amazon vận chuyển các gói hàng theo thứ tự hàng tỷ USD mỗi năm cho khách hàng của mình chỉ riêng ở Hoa Kỳ. Việc lập kế hoạch lộ trình cho các gói hàng này được thực hiện vào ngày vận chuyển, ngày 0. Là một phần của kế hoạch này, chi phí vận chuyển cho mỗi gói hàng được ước tính bằng cách chia hành trình của gói hàng thành các chặng nhỏ hơn và tính chi phí cho mỗi chặng bằng cách sử dụng một thẻ giá. Ước tính chi phí hàng ngày được sử dụng để tính toán ước tính lợi nhuận ban đầu cho mục đích kế toán, ví dụ: ước tính lãi/lỗ cho từng mặt hàng do bán hàng cụ thể cho khách hàng. Những ước tính lợi nhuận này được một số dịch vụ hạ nguồn sử dụng để ra quyết định và lập kế hoạch.


Tuy nhiên, ước tính ngày 0 có thể khác với chi phí thực tế do các yếu tố như cấu hình thẻ giá không đúng, kích thước gói hàng không chính xác, địa chỉ giao hàng sai, v.v. Ước tính chi phí không chính xác gây ra ước tính lợi nhuận sai lệch, từ đó dẫn đến các quyết định tài chính dưới mức tối ưu ở cấp dưới hệ thống. Ví dụ: nếu chi phí vận chuyển của một mặt hàng liên tục được ước tính quá cao thì mặt hàng đó có thể bị xóa khỏi danh mục. Mặt khác, chi phí bị đánh giá thấp có thể khiến hệ thống định giá hạ giá mặt hàng, dẫn đến thua lỗ. Hơn nữa, việc ước tính không chính xác còn khiến chúng ta quảng cáo sai sản phẩm cho khách hàng, gây ra trải nghiệm không tốt cho khách hàng. Để cải thiện các ước tính chi phí vận chuyển này, chúng tôi đề xuất mô hình học sâu dựa trên Transformer để dự đoán chính xác chi phí vận chuyển vào ngày 0.


Trong bối cảnh vận chuyển, một gói hàng được đặc trưng bởi kích thước, trọng lượng và nội dung vật lý của nó. Nó cũng bao gồm thông tin chi tiết về người vận chuyển chịu trách nhiệm vận chuyển và tuyến đường dự định. Ngoài ra, một gói hàng được liên kết với một số thuộc tính khác nhau mô tả (các) mặt hàng bên trong và các khoản phí khác nhau liên quan đến lô hàng của nó. Nói chung, chúng tôi gọi các thuộc tính này là thẻ giá được liên kết với gói. Đối với các tập dữ liệu dạng bảng như thẻ giá gói, các mô hình dựa trên cây như Cây quyết định tăng cường độ dốc (GBDT), XGBoost (Chen và Guestrin, 2016), v.v., được coi là mô hình hiện đại (SOTA). Tuy nhiên, tính hiệu quả của chúng phụ thuộc rất nhiều vào các tính năng đầu vào chất lượng cao (Arik và cộng sự, 2019) có thể yêu cầu kỹ thuật tính năng mở rộng. Đối với trường hợp sử dụng của chúng tôi, vấn đề này càng được nhấn mạnh hơn bởi thực tế là khái niệm mục tiêu phụ thuộc vào sự tương tác tổ hợp bậc cao giữa các thuộc tính thẻ giá. Ví dụ: nếu thẻ giá được định cấu hình không đúng cho các thùng chứa lớn chứa chất dễ cháy được vận chuyển từ Washington DC đến New York bởi hãng vận chuyển ABC thì mô hình phải học cách liên kết tổ hợp thuộc tính < size = lớn, item = dễ cháy, nguồn = Washington , điểm đến = New York ork, hãng vận chuyển = ABC > với độ lệch cao giữa chi phí ước tính và chi phí thực tế. Khi xử lý các kết hợp tính năng, việc xem xét tất cả các tương tác bậc cao hơn có thể có giữa các thuộc tính gói có thể không thực tế do số lượng tương tác tăng theo cấp số nhân với mỗi lần tăng thứ tự, dẫn đến lời nguyền về chiều (Bishop, 2006). Một thiếu sót khác của các mô hình dựa trên cây là chúng không có khả năng xử lý danh sách các tính năng có độ dài thay đổi. Một gói hàng có thể chứa nhiều mặt hàng và chi phí vận chuyển của nó có thể được chia thành nhiều loại phí. Các thử nghiệm trước đây đã chứng minh rằng việc bổ sung các tính năng được thiết kế từ nhiều vật phẩm và khoản phí đã cải thiện hiệu suất của GBDT. Tuy nhiên, do các mô hình dựa trên cây không có khả năng xử lý danh sách các tính năng có thể thay đổi nên không thể học được thông tin đầy đủ từ chúng.


Trong bài báo này, lấy cảm hứng từ sự thành công gần đây của máy biến áp trong miền dạng bảng (Huang và cộng sự, 2020; Somepalli và cộng sự, 2021; Gorishniy và cộng sự, 2021), chúng tôi đề xuất một kiến trúc mới gọi là Máy biến áp thẻ giá (RCT) để dự đoán chi phí vận chuyển vào ngày 0. Mô hình đề xuất được thiết kế đặc biệt để tìm hiểu cách nhúng thẻ giá liên quan đến gói hàng. RCT tận dụng các cơ chế tự chú ý để nắm bắt một cách hiệu quả sự phụ thuộc lẫn nhau giữa các thành phần khác nhau trong thẻ giá bằng cách tìm hiểu các tương tác giữa các tính năng đầu vào. Cụ thể những đóng góp của chúng tôi trong công việc này bao gồm:


• Đề xuất một kiến trúc mới, Biến áp thẻ giá (RCT), tận dụng kiến trúc biến áp để tìm hiểu nhiều loại thẻ giá, nhằm dự đoán chi phí vận chuyển vào Ngày 0. Hơn nữa, người ta chứng minh rằng RCT vượt trội hơn cả GBDT và trạng thái hiện tại máy biến áp dạng bảng nghệ thuật, FT-Transformer, (Gorishniy và cộng sự, 2021) trong dự đoán chi phí vận chuyển.


• Các thử nghiệm mở rộng được thực hiện để chỉ ra rằng các phần nhúng đã học là đại diện đầy đủ cho đa dạng thẻ xếp hạng và các lớp tự chú ý là những tính năng tương tác hiệu quả của người học. Các nghiên cứu cắt bỏ được thực hiện để phân tích tác động của số lớp máy biến áp và đầu chú ý đến hiệu suất của mô hình.


Bài viết này có sẵn trên arxiv theo giấy phép CC BY-NC-ND 4.0 DEED.