今日の急速なデジタル世界では、物事が順調に行わなければなりません。サービスの1つの停止はすべてのオペレーションを停止させ、財務的損失、顧客の不満、および圧倒されたITチームを引き起こします。それゆえに、自動化は、SplunkとPagerDutyを組み合わせることにより、イベント管理のゲームをまったく新しいレベルに引き上げました。ここでは、企業はシステムの故障を検出し、拡大し、解決する方法を変革し、故障時間を削減し、ITチームにとって容易にします。 Vidushi Sharma はこれらの自動化駆動ソリューションをリードし、組織が古い手動プロセスから移行するのを助けました。 彼女は Splunk の強力なログ分析を使用して、異常がリアルタイムでキャプチャされ、継続的な手動モニタリングの必要性を排除するシステムを構築するのに役立ちました。 PagerDuty の警告およびエスカレーションツールと統合すると、インシデントがすぐに適切なチームに割り当てられます。 結果は? 40% 速い応答時間と MTTR の 30 % の改善です。 それをさらに進めると、彼女は機械学習モデルを使用してインシデントをスマートに分類します。 緊急なものは必要な注意を得ますが、低優先度のアラート そこで、Splunk で高度な検索機能を作成することに大きな違いがありました。日記を掘り下げるのに時間を費やすのではなく、チームは現在、問題の根本原因をほぼすぐに特定できるようになりました、と Vidushi は言います。 これらの変更により、組織はマニュアル解像度が60%減少し、ITチームがより大きな課題に対処できるようになりました。別の転換点は、インシデント管理へのデータベースのアプローチです。Vidushiと彼女のチームが構築したSplunkのリアルタイムダッシュボードで、チームは、MTTR、MTTA、SLAの遵守、エスカレーションのトレンドなどの主要なパフォーマンスメトリクスの明確でリアルなイメージを持っています。 この可視性により、リーダーシップはより良い意思決定を下し、より深刻な問題を解決することができるようになりました。同時に、PagerDutyの自動化されたエスカレーションポリシーは、重要な事件が割れ間には決して落ちないことを保証し、遅いエスカレーションを最大50%まで防止し、SLAの遵守を25%向上させました。 この分野のトレンドについて尋ねると、インシデントマネジメントの将来はすべてAI駆動の予測分析と適応型自動化にかかっていると彼女は言います。何かが壊れるのを待つ代わりに、機械学習モデルはすぐに失敗を予測することができ、チームが潜在的な問題を積極的に解決できるようにします。 IT インフラストラクチャが複雑化するにつれて、インテリジェントで自動化されたシステムを搭載して事故を予測し、予防し、解決する能力は、障害を予測するために不可欠です。Vidushi Sharma が Splunk と PagerDuty を統合することに携わることで、組織が事件対応を処理する方法をすでに変え、結果はより速く、よりスマートで、より効率的になりました。 このストーリーは、HackerNoonのビジネスブログプログラムの下で、Kashvi Pandeyによってリリースされたものです。 このストーリーは、HackerNoonのビジネスブログプログラムの下で、Kashvi Pandeyによってリリースされたものです。