paint-brush
Vector Search が契約分析のコード解読に成功@datastax
263 測定値

Vector Search が契約分析のコード解読に成功

DataStax4m2024/12/09
Read on Terminal Reader

長すぎる; 読むには

定期的な支払いエントリを識別するための非常に正確な方法を開発した金融セクター向けデータ分析プロバイダーである、wealthAPI のアプリケーション アーキテクチャを紹介します。
featured image - Vector Search が契約分析のコード解読に成功
DataStax HackerNoon profile picture

定期的な支払いエントリを識別するための非常に正確な方法を開発した金融セクター向けデータ分析プロバイダーである、wealthAPI のアプリケーション アーキテクチャを紹介します。


私たちwealthAPIは、特に取引データに隠れた定期支払いを識別する際に、財務分析はよりスマートかつ高速であるべきだと常に信じてきました。私たちは、AIを活用して生の取引データを実用的な洞察に変換するソリューションを構築しました。私たちのシステムは、ベクトル埋め込みを使用して取引を定期支払いパターンにグループ化し、定期支払いエントリに微妙な文言の違いがある場合でも正確性を保証します。


サブスクリプションから保険金の支払いまで、当社のプラットフォームは金融会社が必要とするスピードと拡張性を維持しながら、信頼性の高い結果を提供します。


ここでは、データの取り込みやベクトルの埋め込みから、トランザクションを意味のあるグループにクラスタリングするまで、これらの課題を解決するためにアーキテクチャをどのように設計したかを紹介します。また、AI がセマンティック検索などの高度な機能を強化し、ユーザーが金融データを簡単に見つけて分析できるようにする方法についても説明します。

アプリケーションの機能

ウェルスAPI は、銀行取引履歴における定期支払い(サブスクリプションなど)の識別という、金融会社にとって一般的でありながら難しい問題に取り組んでいます。従来の方法ではスケーリングが難しく、多くの場合、完全一致に依存していたため、微妙な違いが見逃されていました(例:「Spotify」と「Spotify AB」)。


richAPI は、精度とスピードを実現する AI 主導のアプローチでこの問題に対処します。このソリューションの中心となるのは、最新のスケーラブルな AI 統合ワークフロー向けに特別に構築されたデータベース プラットフォームであるDataStax Astra DBです。

建築

wellsAPI のシステムは、生の銀行取引を取得し、それを埋め込みに処理し、定期的な支払いパターンにグループ化します。これらはすべて、Astra DB のベクトル類似性検索機能によって実現されています。このアーキテクチャにより、データ量が多い場合でも、各段階でスケーラビリティと応答性が確保されます。


プロセスの簡略化されたフローは次のとおりです。

  1. データの取り込み -銀行取引が受信されると、wealthAPI バックエンドはそれを非同期処理のためにメッセージ キューに公開します。


  2. 埋め込みの作成 -各トランザクション (例: 「Spotify、-10€、22.10.24」) は、Astra DB のベクトル化機能を使用して数値ベクトル (例: [0.12、0.65、0.78、...、0.23]) に変換されます。


  3. Astra DB でのベクトルの保存と検索 -埋め込みは Astra DB に保存され、超高速のベクトル類似性検索により、システムは類似のトランザクションを見つけてクラスター化できます。


  4. 規則性分析 -クラスターを分析して定期的な支払いを識別し、「Spotify - 音楽サービス - 月額」や「健康保険 - 健康 - 年額」などの契約として分類します。


Astra DB は、大量のデータを扱う場合でも、プロセス全体がスケーラブルで応答性があることを保証します。また、このプロセスは厳格なデータ セキュリティ対策に準拠しており、エンド ユーザーとそのトランザクションが匿名のまま外部からのアクセスから保護されます。



技術的実装

トランザクションを契約にまとめる

トランザクションのグループ化は常に主要な課題でした。以前のツールは、ベンダー名や支払い金額などの完全一致に依存していたため、バリエーションを捉えることができず、拡張に時間がかかることが多かったのです。


過去にwealthAPIでは、従来のデータベースを使用して何百万ものトランザクションのパターンを検索しようとしましたが、これは時間がかかり、エラーが発生しやすかったです。トランザクションの詳細にわずかな違いがあっただけでも、クラスタリング ロジックが破綻しました。


Astra DB を使用しているため、埋め込みを保存し、詳細がわずかに異なる場合でも、類似のトランザクションを効率的に検索できます。


次に例を示します。ある日に「Spotify AB」というラベルの付いた 10 ユーロの支払いと、次の日に「Spotify」というラベルの付いた 10 ユーロの支払いは、同じ定期支払いとして正しくグループ化されます。

大量のデータの処理

毎日何千ものトランザクションが処理されるため、wealthAPI では、速度と精度を維持しながらシームレスに拡張できるデータベースが必要でした。


Astra DB の基盤は Apache Cassandra であるため、スケーラビリティを考慮して構築されています。また、AI ワークフローと統合されているため、wealthAPI は精度を損なうことなく高速クエリを維持できます。

取引検索エンジン

埋め込みによってトランザクションの根本的な意味が捕捉されるため、wealthAPI は検索機能も実装できます。ユーザーは「健康」などのキーワードを入力するだけで、定義済みのタグやカテゴリに頼ることなく、健康関連のトランザクションをすべて取得できます。


システムはユーザークエリから埋め込みを生成し、Astra DB を使用して単純な類似性検索を実行します。ベクトル検索機能により、この種のセマンティック検索が高速かつ正確になります。


たとえば、ユーザーが「健康」と入力すると、ベンダー名が異なっていても、保険やジムの会員権など、健康関連サービスの支払いがすべて表示されます。

まとめ

ウェルスAPI による Astra DB の使用は、高度なデータベース テクノロジーが金融分析の革新をどのように推進できるかを示しています。正確なトランザクション クラスタリングから最先端のセマンティック検索エンジンの有効化まで、Astra DB のベクトル検索とスケーラビリティにより、ウェルスAPI はより高速でスマートなソリューションを顧客に提供できます。


AI ワークフローを Astra DB のアーキテクチャに直接統合することで、wealthAPI は財務データ処理を強化し、契約分析のための貴重な新機能を導入しました。


Belkacem Berchiche wealthAPI の機械学習エンジニア)、Dieter Flick(DataStax のソリューション エンジニア)


詳細はこちらアストラDBそして富API