ビデオコンテンツの大規模なカタログを含むストリーミングサービスや、分析に関する情報を提供するデータサービスを含むさまざまな重要なデジタルサービスは、分散コンピューティングの傘下で複数の依存型システムやクラスターとして行動するマシンを活用しています。 しかし、その能力にはコストが伴う - 分散型システムがリソースを消費するか、単に過剰に設計されているか - 実際には非常に効率が低い可能性があります。 これが機械学習の入り口です。機械学習は単なるファンタジーなバズボードではなく、機械学習は需要を予測し、既存のビジネスプロセスを改善し、最終的に機能するだけでなく働く分散システムを開発するための有用なツールです。 The Data Deluge: Too Much Information, Too Little Time データの洪水:あまりにも多くの情報、あまりにも少ない時間 過去10年間で、私たちが生成するデジタルデータの量は劇的に増加しました。毎日、私たちはデータの2500万バイトを超える量を生成しています! 私たちはもはやデータを分析、ストレージ、またはこの規模で同じ方法で理解することはできません。このサイズと構造でデータを考え、作業し、理解することは、長期的に考慮しなければならない技術的な問題の数を提示し、私たちはそれを積極的にモデルを訓練するために使用できるソリューションを開発する必要があります。 Breaking Down Data Silos Breaking Down Data Silosについて データシロスは、データがそのシステムの外で何ができるか、あるいはできないかを制御するあるいは別のシステムに保管されているデータです。すべてのソースからのデータポイントは、確かに非常に不一致なベースラインの品質や製品の違いを持っている可能性があります。(伝統的な)分析方法に対する圧力は、データ分析プラットフォームと努力にかなりの課題を提示し、最終的にあなたが「良い」または良いデータのみがアクセスされることを保証する潜在的なリスクにログインすることを余儀なくされます! この種のデータは、通常の単一機械学習アプローチに挑戦する場合があります。このデータについて考える方法の1つは、分散型機械学習を介して行うことです。この問題はより複雑な問題ですが、考慮に値する可能性があります。 Smarter Data Centers: Intelligent Decisions Drive Sustainability データセンターは接続された世界の重要な構成要素であり、リソースとエネルギー消費の増加を通じてアプリケーションやサービスへのグローバルアクセスの増加を可能にします。歴史的に、オペレーションマネジメントはオープンタイムに焦点を当てており、今ではより持続可能なオペレーションマネジメントモデルへの移行を目撃しています。エッジコンピューティング - 定義によって作成のエッジに近い処理 - リソースの利用、最適化、およびレジリエンス/持続可能性の効率化のためのより大きな機会を提供します。エッジコンピューティングはエッジでデータの処理と解釈を可能にし、作成のポイントに近づき、それほど多くのデータをクラウドデータセンターに移 Optimizing Resource Allocation 資源配分の最適化 ML モデルは、CPU 処理に必要なワークロードを予測することができ、さらに、CPU 利用率と温度プロファイルに関する歴史的データを適切に分析することができ、熱負荷需要の使用予測に基づいて、熱負荷需要に基づいて使用を予測することができる。 Final Thoughts: From Science Fiction to Engineering Reality Final Thoughts: From Science Fiction to Engineering Reality シニアフィクション 私たちはかつてこれらのことが起きるだろうと想像していました - サイエンスフィクションで 未来は実際に今です; 機械学習とギガビット分散コンピューティングは現実です 私たちは推測と超越の経験があります アルゴリズムはリアルタイムで学び、適応し、最適化しています - どこにでもあります。 実際、機械学習は、コンピュータについて考える方法を変えています。機械学習は、分散型システムにより大きなスピード、インテリジェンス、そして思いやりをもたらしています。 未来は今、今、今、今、今、今、今、今、今、今、今、今、今、今、今、今、今、今、今、今、今、今、今、今、今、今、今、今。