paint-brush
Apache Cassandra: Uber と Apple の AI プロジェクトのリスク回避に役立つデータベース@datastax
1,207 測定値
1,207 測定値

Apache Cassandra: Uber と Apple の AI プロジェクトのリスク回避に役立つデータベース

DataStax4m2023/08/07
Read on Terminal Reader

長すぎる; 読むには

Uber や Apple などの Cassandra の大規模ユーザーは、このデータベース システムが AI/ML プロジェクトのリスクを効果的に軽減できることを実証しています。
featured image - Apache Cassandra: Uber と Apple の AI プロジェクトのリスク回避に役立つデータベース
DataStax HackerNoon profile picture
0-item
1-item


最近の人工知能の津波により、遅れを取り戻すために迅速に行動しなければならないという大きなプレッシャーが生じています。最先端のツールをすぐに使い始めるために、安定性と品質を犠牲にする傾向がある人もいるかもしれません。幸いなことに、そうである必要はありません。


AI と機械学習 (AI/ML) の世界では、データベースの選択がプロジェクトの成功に大きく影響します。考慮すべき重要な要素の 1 つは、データベース システムのスケーラビリティと信頼性に関連するリスクです。 Apache Cassandra は、拡張性とパフォーマンスに優れた分散データベースであり、この点で業界のリーダーであることが証明されています。 AI/ML プロジェクトに関連するリスクを大幅に軽減する機能を提供するため、多くの組織にとって好ましい選択肢となっています。


UberAppleなど、Cassandra の大規模ユーザーは、このデータベース システムが AI/ML プロジェクトのリスクを効果的に軽減できることを実証しています。 Uber はリアルタイムのデータ処理とデータ保持に Cassandra を使用しています機能ストアCassandra で直接予測を行います。小規模から始めて必要に応じてスケールアップできる機能と高い信頼性により、Uber はシステム障害やパフォーマンス低下のリスクを冒さずに膨大な量のデータを管理できます。 AI ワークロード用に構築された多くの新しいシステムは、特定の機能を中心にスケーラビリティを構築しようとしていますが、AI を大規模に実行するユーザーは何年も Cassandra を使用しています。


スケーラビリティとパフォーマンス

AI/ML アプリケーションは膨大な量のデータを扱うことが多く、高速な処理が必要です。いつ容量が必要になるかを計画するのは難しい作業です。最高のプラン?ただ避けてください。代わりに、必要なときに迅速に拡張でき、過剰なキャパシティを残さないデータベースを使用してください。


Cassandra の核となる水平方向の拡張機能は、依然として他の多くのデータベースとは一線を画しています。データが増加するにつれて、Cassandra クラスターにノードを追加して、増加したトラフィックとデータを処理できます。それはとても簡単です。この機能は、ますます増大するデータセットを扱う AI/ML アプリケーションにとって特に重要です。


Uber はハイパースケーラーであり、新製品が導入されるたびに、スケール要件がさらに押し上げられ続けています。 Cassandra の最大のユーザーの 1 つである同社は、このスケーラビリティを活用して、増え続ける変化するデータ ニーズに対応しています。 Cassandra は書き込みおよび読み取りスループットが高いため、AI および ML アプリケーションで必要なリアルタイム データ処理に最適です。


リアルタイム処理

リアルタイム データ処理は、最新のアプリケーションにとって重要な要件です。ユーザーが最高のエクスペリエンスを求めるときはミリ秒が重要です。 AI/ML アプリケーションでは、リアルタイムのレコメンデーション、予測分析、動的価格設定モデルなど、データの到着時に分析して対応する必要があることがよくあります。 Cassandra は、高い書き込みおよび読み取りスループットを備えており、このようなリアルタイム処理要件に最適です。 Cassandra のアーキテクチャにより、多くの汎用サーバーにわたる大量のデータを処理できるようになり、単一障害点のない高可用性が実現します。これは、データベースへのデータの書き込みとデータベースからのデータの読み取りをほぼ即座に実行できることを意味し、リアルタイムの応答が必要なアプリケーションにとって優れた選択肢となります。


ウーバーイーツはその具体的な例です。アプリケーションは、食品の推奨と配達予定時間を提供するために、データをリアルタイムで処理する必要があります。このリアルタイム処理は Cassandra の高いパフォーマンスによって可能になります。それだけでなく、デフォルトのレプリケーションによりインフラストラクチャの障害がエンド ユーザーに透過的に行われるため、エンド ユーザーは満足してアプリケーションを使用し続けることができます。変化するデータの絶え間ない流入と使用の激しいサイクルこそ、Cassandra が輝くところです。 Cassandra を使用する組織は、適切なアプリケーション機能について心配することに多くの時間を費やし、それをサポートするデータベースについてはあまり心配しません。


データで世界へ

Cassandra を使用すると、データが複数のノードに自動的にレプリケートされ、これらのレプリカによって冗長性が提供されます。 1 つのノードに障害が発生した場合でも、レプリカからデータにアクセスできます。この機能により、ハードウェア障害やネットワークの問題が発生した場合でも、AI/ML アプリケーションが稼働し続けることが保証されます。


しかし、Cassandra の分散アーキテクチャは、高いフォールト トレランスに貢献するだけでなく、ユーザーとの距離を保つことにも役立ちます。一部のユーザーは、デフォルトのグローバル データ レプリケーションをほとんど当然のことと考えています。


Apple や Netflix などの企業は、世界中の複数の地域にまたがるアクティブ/アクティブ アーキテクチャについて、珍しいことではないほど長い間語ってきました。耐障害性に加えて、この驚くべき機能のユーザー中心の側面はデータの局所性です。北米、アジア、ヨーロッパにユーザーがいる場合、データを 1 か所に集中させると、ユーザーの一部に苦痛を与える遅延が発生します。解決策は、データを各場所にレプリケートし、全員にデータの待ち時間を短くすることです。


プロジェクトのリスクを軽減する

適切なテクノロジー スタックを選択することは、プロジェクトのリスクを軽減する上で重要です。 Cassandra を使用すると、小規模から始めて必要に応じてスケールアップでき、プロジェクトに費用対効果の高いソリューションを提供できます。 Cassandra は時間の経過とともにその信頼性が証明されており、一部の企業は Cassandra クラスターを 10 年以上停止せずに実行しています。新しいテクノロジーを備えたAI専用に開発された機能が追加されていますが、最も重い AI/ML ワークロードの一部は、かなり長い間 Cassandra を使用して静かに一貫して管理されてきました。とはいえ、今日では AI/ML ワークロードにとって、より適切な選択肢になりつつあります。


Cassandra は、スケーラビリティ、パフォーマンス、リアルタイム処理能力、および寿命の長いことから、AI/ML アプリケーションにとって優れた選択肢となっています。 AI アプリケーションが進化し続け、ビジネス運営にますます不可欠になるにつれて、Cassandra のような堅牢で信頼性が高く、効率的なデータベースに対するニーズは高まる一方です。 Cassandra を選択することは、単にデータベースを選択するだけではありません。 AI/ML アプリケーションを将来にわたって保証することになります。


Cassandra や DataStax Astra DB などのベクトル データベースが大規模な生成 AI プロジェクトを可能にする方法を学びましょう


DataStaxの Patrick McFadin 著。