人工知能が世界に比較的最近現れたにもかかわらず、ほとんどの人々や企業は依然としてチャットGPTで質問と答えの形で使用しています。多くの場合、これは「AIを使用する」という概念と関連付けられています。 したがって、ChatGPTは、質問に答え、テキストを編集し、画像を生成するために作成された多数のAIサービスの1つに過ぎません。 世界の多くの大手企業は、実用的なアプリケーションのために独自のAIモデルや製品を開発し始めた。これにより、企業は人工知能をプロセスに統合し、運用効率を高める機会を与えました。 企業のリクエストは異なる場合があります。AIチャットボットは顧客に24時間7時間対応し、通常のリクエストの80%までカバーし、質問があまりにも具体的な場合にのみオペレーターに会話を転送する必要があります。IBMの統計によると、AIチャットボットを実装した企業はオペレーターのワークロードを最大70%削減し、顧客の待機時間を90%減らしました。 ユーザー認証を定期的に実施する必要がある金融機関もありますが、完全な認証モジュールは複雑なテクノロジーソリューションですが、企業はその個々の部分を実装することができます。例えば、文書認証は、金融サービスだけでなく、ドメイン名登録者やユーティリティサービスプロバイダーの仕事にも統合できます。KYC(Know Your Customer)ソリューション市場は2024年に124億ドルに達し、予測によると年間22%増加します。 現在、アクションが文書の検証を必要とする場合は、ファイルをアップロードするだけでなく、それから情報を抽出し、データをクライアントのプロフィールと会社のデータベースに保存することも必要です。以前は、ユーザーにすべてのデータを手動で入力し、さらに文書をアップロードするように要求する必要がありました。今では、このプロセスは自動化することができます:システムはクライアントに追加の要請なしに必要な情報を独自に抽出します。OCRテクノロジーとAIアナリティクスは、文書検証の時間を5〜10分から数秒に短縮し、エラーの数を80%減らします。 公式のGoogleドキュメントAIサービスからのスクリーンショット: https://cloud.google.com/document-ai https://cloud.google.com/document-ai 次に、Google Cloudを使用して、Vertex AIおよびDocument AIサービスを使用して、同様のソリューションを実装する方法を検討します。 Let’s break it down step by step using the example of Google Cloud: Vertex AI and Document AI. 以下は、各サービスの目的をよりよく理解するための語彙です。 — ドキュメント(ID、パスポート、請求書)からのデータを自動的に読み取り、認識するために使用されます。 手動入力なしでJSON形式の構造化データを取得することを可能にします。 主な目的は、KYC/KYBの自動化、請求書処理、文書検証です。 Document AI API 人工知能のモデルを作成、訓練、展開するために設計され、分析、スコアリング、異常検出、予測のためのMLの使用を可能にします。 Vertex AI API Integration of Document AI and Vertex AI in your project: step by step 1)Google Cloudプロジェクトの作成 プロジェクトがまだ作成されていない場合は、Google Cloud に追加し、請求を設定し、必要なサービスへのアクセス権を持つサービスアカウントを作成します。 リンク: cloud.google.com/document-ai cloud.google.com/ドキュメンタリー 主な2つのサービスを提供する: タイトル: API Vertex AI API 次に、システムがドキュメントを正しく読み取るようにドキュメントAIを構成する必要があります。 ID ドキュメント プロセッサ (パスポートおよび運転免許の処理に適している) あなたが活動している地域(米国またはEU)を選択します。 作成後、あなたはプロセッサ ID を受け取ります。コピー - API を介してリクエストを作成するために必要になります。 次に、あなたのウェブサイトは、ユーザーが文書をアップロードする自分のインターフェイスを持っている可能性があります。 JPEG, PNG, PDF. 作業メカニズムはこのように見えます: あなたのウェブサイトのバックエンドは、ユーザーからファイルを受け取ります。 その後、このファイルを Document AI API に送信します。 リクエストの体では、ファイルはBase64形式で送信されます。 要請の例: POST https://documentai.googleapis.com/v1/projects/{project_id}/locations/{location}/processors/{processor_id}:process Document AI はこのデータを処理し、JSON 形式で返します。 OCR テキスト(文書から認識されたテキスト) 構造化されたデータ:ファーストネーム、ファーストネーム、出生日、書類番号、有効期限日 Document AI からの JSON 応答の例 + Entities: ! First Name: John (confidence 0.99) ! Last Name: Doe (confidence 0.98) ! Date of Birth: 1990-01-01 (confidence 0.97) ! Document Number: X1234567 (confidence 0.96) ! Expiry Date: 2030-12-31 (confidence 0.95) JSON で何が得られたのか? First Name: John Last Name: Doe Date of Birth: 1990-01-01 Document No: X1234567 Expiry: 2030-12-31 得られたデータで、すでに作業してデータベースに追加することができます. たとえば、クライアントのプロフィールに保存して、これらの情報を入力するように依頼する必要がなくなります。 公式のGoogleドキュメントAIサービスからのスクリーンショット: https://cloud.google.com/document-ai https://cloud.google.com/document-ai 私たちはこれらのデータをさらに処理し、検証を実行することができます。実践では、AIが特定の要素を認識しない場合があります。例えば、Document AIからの応答には、文書に存在しているにもかかわらず、姓名が含まれていません。 すべてが完了しているように見える状況を避けるために、実際にデータが欠けている場合、すべてのキーフィールドが記入されているかどうかを確認する必要があります。Document AIからエンティティティ(ファーストネーム、ファーストネーム、誕生日、ドキュメント番号、到着日)を受け取った後、いずれも空ではないことを確認してください。 - required_fields = ["first_name", "last_name", "date_of_birth", "document_number"] + for field in required_fields: ! if field not in extracted_data or not extracted_data[field]: # raise ValueError(f"Missing required field: {field}") または、お客様のサービスに関しては、ユーザーが18歳以上であることが重要で、その場合、お客様はサービスへのアクセスを許可することはできません。 たとえば、生年月日(YYYY-MM-DD形式)を確認し、年齢が > 18 歳であることを確認できます(または他の確定値)。 - from datetime import datetime + dob = datetime.strptime(extracted_data["date_of_birth"], "%Y-%m-%d") ! age = (datetime.now() - dob).days // 365 # if age < 18: # raise ValueError("Client must be over 18.") この段階まで、AIを使用して得られた静的データを主に検証してきました。 2) Using Vertex AI しかし、Vertex AI モジュールを使用してさらに進み、この時点までドキュメント AI を使用して文書のスキャンと認識を行っています。 公式のVertex AIサービスからのスクリーンショット: https://cloud.google.com/vertex-ai/generative-ai/docs/learn/overview https://cloud.google.com/vertex-ai/generative-ai/docs/learn/overview たとえば、次のステップは、パラメータに基づいてクライアントを評価することです。IPアドレスや、内部ポリシーや規制上の制限によりユーザーを登録できない国など、追加のデータを持っている可能性があります。 Vertex AI にデータを送信してスコアを取得する: - from google.cloud import aiplatform endpoint = aiplatform. + Endpoint(endpoint_name="projects/your-project/locations/us-central1/endpoints/123456789") ! response = endpoint.predict(instances=[{ ! "document_number": "X1234567", ! "age": 32, ! "country": "UK", ! "upload_time": 2.5 }]) # print(response) この段階では、Vertex AIはすでにDocument AIから得られたすべてのデータを持っています。 Data from the document (Document AI Output) ファーストネームとファーストネーム(異常検出、複数のアカウント) 出生日(年齢制限およびリスクプロフィール) ドキュメント番号(ユニーク性とパターン) 期限切れ(有効性チェック) 発行国(高リスク国) しかし、あなたはまた、あなたのシステムがクライアントについて収集する情報を提供します。以下は限られた量の情報です。 File metadata アップロード時間(疑わしい時間、例えば夜間) ファイル形式(JPEG、PNG、PDF) アップロードの試み数(詐欺の兆し) User behavioral data Form filling speed (too fast → bot suspension) IPアドレスと地理位置(ドキュメントの国と一致) VPNまたはプロキシ(隠蔽の兆候) Vertex AI Endpoint システムは、ML/AI モデルとして展開され、データを分析し、予測を返します。これはハードコードされた論理ではなく、データ、アルゴリズム、トレーニングに基づいて結果を生成する統計モデルの組み合わせです。 たとえば、答えはこんな感じかもしれません: risk_score = 0.12. 意思決定のルール: If risk_score < 0.2 → approve. If 0.2 ≤ risk_score < 0.5 → review. If risk_score ≥ 0.5 → reject. 次に、あなたのウェブサイトまたはアプリケーションの設定に応じて、あなたはクライアントに結果を表示し、構造化されたデータは会社のデータベース(PostgreSQL、MySQL、Firestore、または他の何か)に記録されます。 あなたもできる: お客様のプロフィールの状態を変更します。 プッシュまたはメール通知を送信します。 これは、単一のAIモデルがビジネスタスクを解決し、企業と顧客の両方にとってプロセスを加速させるためにどのように使用されるかを示す例です。 AI モデルはまだすべての現実的なシナリオをカバーしていないが、毎月新しいソリューションが登場する。アップデートのためのアナウンスを保持してください。すでに利用可能なものは、仕事で効果的に使用できます。 Below are examples of AI models and ways to use them: OpenAI (ChatGPT, GPT-4/4o) ChatGPT API – AI チャットのアプリケーションへの統合(サポート、自動化) アシスタント API - ビジネスタスクのためのカスタムアシスタント。 Code Interpreter - データ分析とPythonスクリプト(財務分析、ダッシュボード) Google Cloud AI (Vertex AI) 文書AI - 文書解析(KYC、契約、声明) AutoML - コードなしのモデル構築(スコア、予測) AIハブ – 準備済みのモデル(詐欺検出、クレジットスコアリング) AWS AI Services Textract - PDF(請求書、財務文書)からのOCR。 理解 - テキスト分析(レビュー、感情) SageMaker – トレーニングカスタムモデル(リスク管理、予測) Microsoft Azure AI (Copilot) ドキュメントインテリジェンス - フォームとレポートの認識。 Azure OpenAI Service – エンタープライズソリューションのためのクラウド内のGPT。 Anthropic (Claude) Claude API – チャット、テキスト生成、データ分析(法的文書、コンプライアンス) Fireblocks AIアナリティクス - トランザクションモニタリング、AML、暗号化の詐欺保護。 DocuSign AI インテリジェントな洞察 - 契約とリスクの分析 Salesforce Einstein AI アインシュタイン GPT - 販売予測、CRM自動化 人工知能は単なるトレンドでなくなり、ビジネス最適化のための真のツールとなりました。顧客の検証を自動化し、リスク予測やサービスのパーソナライゼーションに至るまで、AIは企業に時間を節約し、コストを削減し、精度を向上させる機会を提供しています。Google Cloudのような例では、Vertex AIとDocument AIサービスにより、このようなソリューションの実装はもはやテクノロジー大手の特権ではなく、あらゆる規模や業界の企業に利用可能であることを示しています。 イゴール・ニコラエフ、FintechとAIの技術製品リーダー