paint-brush
Cara Carian Vektor Memecahkan Kod pada Analitis Kontrak oleh@datastax
597 bacaan
597 bacaan

Cara Carian Vektor Memecahkan Kod pada Analitis Kontrak

oleh DataStax4m2024/12/09
Read on Terminal Reader

Terlalu panjang; Untuk membaca

Lihat pada seni bina aplikasi wealthAPI, penyedia analisis data untuk sektor kewangan yang telah mencipta cara yang sangat tepat untuk mengenal pasti kemasukan pembayaran berulang.
featured image - Cara Carian Vektor Memecahkan Kod pada Analitis Kontrak
DataStax HackerNoon profile picture

Lihat pada seni bina aplikasi wealthAPI, penyedia analisis data untuk sektor kewangan yang telah mencipta cara yang sangat tepat untuk mengenal pasti kemasukan pembayaran berulang.


Di wealthAPI , kami sentiasa percaya analitik kewangan harus lebih bijak dan lebih pantas, terutamanya apabila mengenal pasti pembayaran berulang yang tersembunyi dalam data transaksi. Kami telah membina penyelesaian yang mengubah data transaksi mentah menjadi cerapan yang boleh diambil tindakan dengan memanfaatkan AI. Sistem kami menggunakan pembenaman vektor untuk mengumpulkan urus niaga ke dalam corak pembayaran berulang, memastikan ketepatan walaupun apabila entri pembayaran berulang mengandungi perbezaan perkataan yang halus.


Daripada langganan kepada pembayaran insurans, platform kami memberikan hasil yang boleh dipercayai sambil mengekalkan kelajuan dan kebolehskalaan yang diperlukan oleh syarikat kewangan.


Di sini, kami akan menunjukkan cara kami mereka bentuk seni bina kami untuk menyelesaikan cabaran ini, daripada pengingesan data dan pembenaman vektor kepada pengelompokan transaksi ke dalam kumpulan yang bermakna. Kami juga akan meneroka cara AI memperkasakan ciri lanjutan seperti carian semantik, membolehkan pengguna mencari dan menganalisis data kewangan dengan mudah.

Apa yang Dilakukan oleh Aplikasi

wealthAPI menangani masalah biasa tetapi mencabar untuk syarikat kewangan: mengenal pasti pembayaran berulang, seperti langganan, dalam sejarah transaksi bank. Kaedah tradisional bergelut dengan penskalaan dan sering bergantung pada padanan tepat, kehilangan perbezaan yang ketara (cth, "Spotify" lwn. "Spotify AB").


wealthAPI menangani masalah ini dengan pendekatan dipacu AI yang memberikan ketepatan dan kelajuan. Di tengah-tengah penyelesaian ini terletak DataStax Astra DB , platform pangkalan data yang dibina khas untuk aliran kerja moden, berskala dan bersepadu AI.

Seni bina

Sistem wealthAPI mengambil transaksi bank mentah, memprosesnya menjadi pembenaman dan mengumpulkannya ke dalam corak pembayaran berulang — semuanya dikuasakan oleh keupayaan carian persamaan vektor Astra DB. Seni bina memastikan kebolehskalaan dan responsif pada setiap peringkat, walaupun di bawah volum data yang tinggi.


Berikut ialah aliran proses yang dipermudahkan:

  1. Pengingesan data - Apabila transaksi bank diterima, bahagian belakang wealthAPI menerbitkannya pada baris gilir mesej untuk pemprosesan tak segerak.


  2. Penciptaan benam - Setiap transaksi (cth, “Spotify, -10€, 22.10.24”) diubah menjadi vektor berangka (cth, [0.12, 0.65, 0.78, ..., 0.23]) menggunakan ciri vektorisasi Astra DB.


  3. Penyimpanan dan carian vektor dalam Astra DB - Pembenaman disimpan dalam Astra DB, di mana carian persamaan vektor sepantas kilat membolehkan sistem mencari dan mengumpulkan transaksi yang serupa.


  4. Analisis keteraturan - Kelompok dianalisis untuk mengenal pasti pembayaran berulang, mengkategorikannya sebagai kontrak seperti "Spotify - perkhidmatan muzik - bulanan" atau "Insurans kesihatan - Kesihatan - tahunan."


Astra DB memastikan keseluruhan proses adalah berskala dan responsif, walaupun dengan volum data yang tinggi. Proses ini juga mematuhi langkah keselamatan data yang ketat untuk memastikan pengguna akhir dan transaksi mereka kekal tanpa nama dan dilindungi daripada akses luaran.



Pelaksanaan Teknikal

Mengelompokkan urus niaga ke dalam kontrak

Urus niaga pengelompokan sentiasa menjadi cabaran utama. Alat sebelumnya bergantung pada padanan tepat (cth, nama vendor atau jumlah pembayaran), yang sering gagal menangkap variasi dan lambat untuk skala.


Di wealthAPI, kami cuba mencari corak antara berjuta-juta transaksi dengan pangkalan data tradisional pada masa lalu, yang lambat dan terdedah kepada ralat. Malah variasi kecil dalam butiran transaksi memecahkan logik pengelompokan.


Oleh kerana kami menggunakan Astra DB, kami boleh menyimpan pembenaman dan mencari urus niaga serupa dengan cekap, walaupun dengan variasi kecil dalam butiran.


Berikut ialah contoh: Pembayaran berlabel "Spotify AB" untuk €10 pada satu hari dan "Spotify" untuk €10 seterusnya dikumpulkan dengan betul sebagai pembayaran berulang yang sama.

Mengendalikan Volum Data Besar

Dengan beribu-ribu transaksi yang diproses setiap hari, wealthAPI memerlukan pangkalan data yang boleh skala dengan lancar sambil mengekalkan kelajuan dan ketepatan.


Asas Astra DB ialah Apache Cassandra, jadi ia dibina untuk kebolehskalaan. Ia juga disepadukan dengan aliran kerja AI, membolehkan wealthAPI mengekalkan pertanyaan pantas tanpa menjejaskan ketepatan.

Enjin Carian Transaksi

Oleh kerana pembenaman menangkap makna asas transaksi, wealthAPI juga boleh melaksanakan ciri carian. Pengguna boleh menaip kata kunci seperti "kesihatan" untuk mendapatkan semula semua transaksi berkaitan kesihatan tanpa bergantung pada teg atau kategori yang dipratakrifkan.


Sistem menjana pembenaman daripada pertanyaan pengguna dan menjalankan carian persamaan mudah menggunakan Astra DB; keupayaan carian vektornya menjadikan carian semantik jenis ini pantas dan tepat.


Sebagai contoh, pengguna yang menaip "kesihatan", akan melihat semua pembayaran untuk perkhidmatan berkaitan kesihatan, seperti insurans atau keahlian gim, walaupun nama vendor berbeza.

Membungkus

Penggunaan Astra DB oleh wealthAPI menunjukkan bagaimana teknologi pangkalan data canggih boleh memacu inovasi dalam analisis kewangan. Daripada pengelompokan transaksi yang tepat kepada mendayakan enjin carian semantik yang canggih, carian vektor dan skalabiliti Astra DB memperkasakan wealthAPI untuk menyampaikan penyelesaian yang lebih pantas dan lebih bijak kepada pelanggannya.


Dengan menyepadukan aliran kerja AI terus ke dalam seni bina Astra DB, wealthAPI telah meningkatkan pemprosesan data kewangan dan memperkenalkan keupayaan baharu yang berharga untuk analisis kontrak.


Oleh Belkacem Berchiche, jurutera pembelajaran mesin, wealthAPI, dan Dieter Flick, jurutera penyelesaian, DataStax


Ketahui lebih lanjut tentang Astra DB dan wealthAPI .