paint-brush
Die Macht der Selbstaufmerksamkeit zur Vorhersage von Versandkosten enthüllen: Fazit und zukünftige Arbeitby@convolution

Die Macht der Selbstaufmerksamkeit zur Vorhersage von Versandkosten enthüllen: Fazit und zukünftige Arbeit

Das neue KI-Modell (Rate Card Transformer) analysiert Paketdetails (Größe, Spediteur usw.), um die Versandkosten genauer vorherzusagen.
featured image - Die Macht der Selbstaufmerksamkeit zur Vorhersage von Versandkosten enthüllen: Fazit und zukünftige Arbeit
Convolution: Leading Authority on Signal Processing HackerNoon profile picture
0-item

Autoren:

(1) P Aditya Sreekar, Amazon und diese Autoren haben zu gleichen Teilen zu dieser Arbeit beigetragen {[email protected]};

(2) Sahil Verm, Amazon und diese Autoren haben zu gleichen Teilen zu dieser Arbeit beigetragen {[email protected];}

(3) Varun Madhavan, Indian Institute of Technology, Kharagpur. Arbeit, die während des Praktikums bei Amazon erledigt wurde {[email protected]};

(4) Abhishek Persad, Amazon {[email protected]}.

Linktabelle

5. Schlussfolgerung und zukünftige Arbeit

In diesem Artikel haben wir ein neuartiges Framework auf Basis der Transformer-Architektur zur Vorhersage von Versandkosten am Tag 0 vorgestellt. Unser vorgeschlagenes Framework kodiert Versandattribute eines Pakets, d. h. die Paketpreisliste, in einen einheitlichen Einbettungsraum. Diese Einbettungen werden dann durch eine Transformer-Schicht geleitet, die komplexe Interaktionen höherer Ordnung modelliert und eine effektive Darstellung der Paketpreisliste zur Vorhersage von Versandkosten lernt. Unsere experimentellen Ergebnisse zeigen, dass das vorgeschlagene Modell namens RCT das GBDT-Modell um 28,8 % übertrifft. Darüber hinaus zeigen wir, dass RCT für unsere Problemstellung eine bessere Leistung erbringt als das SOTA-Modell FT-Transformer. Wir zeigen auch, dass sich die Leistung des GBDT-Modells um 12,51 % verbessert, wenn die von RCT erlernte Preiskartendarstellung zum GBDT-Modell hinzugefügt wird. Dies unterstreicht die Tatsache, dass RCT in der Lage ist, ausreichende Darstellungen von Preiskarteninformationen zu erlernen.


In dieser Arbeit beschränkten sich die verwendeten Routeninformationen auf die Start- und Endknoten. Zukünftige Arbeiten könnten die Verwendung von Graph Neural Networks zur Kodierung von Informationen über die gesamte Route untersuchen. Darüber hinaus könnte die Leistung des RCT verbessert werden, indem Möglichkeiten untersucht werden, die Artikel-ID als Funktion einzubinden, z. B. durch die Verwendung von Artikeleinbettungen, die intern verfügbar sind.


Während das RCT darauf trainiert wurde, nur die Versandkosten vorherzusagen, kann es durch Hinzufügen einer Transformer-Decoderschicht so modifiziert werden, dass es alle Attribute der Rechnung vorhersagt. Dies würde andere Anwendungen wie die Erkennung von Rechnungsanomalien ermöglichen. Darüber hinaus könnte in zukünftigen Forschungsarbeiten untersucht werden, ob die vom RCT erlernten Paketdarstellungen verwendet werden können, um die Leistung anderer verwandter Aufgaben zu verbessern oder die Modellunsicherheit bei jeder Vorhersage über Ansätze wie den von Amini et al. (2019) vorgeschlagenen zu quantifizieren.