Grafana Labs の第 2 回年次観測可能性調査によると、事業を展開している業界や従業員の数に関係なく、成熟した可観測性プラクティスを備えた企業はインシデントにより迅速に対応でき、そのプロセスにかかる時間と費用を節約できます。
組織は、最新のアプリケーションの複雑さに取り組む中で、可観測性をソフトウェア開発ライフサイクルの重要な部分に据えています。しかし、今年の調査では、誰もが導入の同じ段階にいるわけではなく、さらに遅れているチームは今日のユーザーの常時接続の要求に対応するのに苦労していることが明らかになりました。
300 人を超える可観測性の専門家が調査に参加しました。彼らは、さまざまな成熟度、使用されている膨大な量のツール、費用に関する根深い懸念、この新興市場におけるオープンソース ツールの普及など、幅広いトピックについて意見を共有しました。
調査の全文を読んで、これらのトピックなどについて回答者が何を言ったかを知ることができますが、可観測性の状態を簡単に評価するために、調査から得られた 5 つの重要なポイントを以下に示します。
私たちは、可観測性にどのようにアプローチしたかを尋ねることによって、回答者がジャーニーのどの段階にいるかを評価しました。半数強が、自分の組織が積極的なアプローチをとっていると回答しており、これはこの分野での成長を示しています。しかし、組織は依然として組織的というよりも事後対応する可能性が高く、つまり、ユーザーが気づく前に問題に対処するシステムを導入するのではなく、顧客から問題について聞くことが多いのです。
(これらの指定の詳細については、可観測性ジャーニー成熟度モデルを確認してください。)
そして、アプローチが異なれば、結果も大きく異なる可能性があり、体系的なアプローチを採用した企業の 65% が、一元的な可観測性によって時間とコストを節約したのに対し、事後対応型のアプローチを採用した企業では、わずか 35% でした。
チームの 3 分の 2 以上が少なくとも 4 つの可観測性テクノロジーを使用しており、回答者は現在使用されているテクノロジーを合わせて 60 以上挙げています。さらに、Grafana ユーザーの半数は、少なくとも 6 つの異なるデータ ソースが設定されており、Grafana でアクティブに使用されていると述べています。
これにより、かなりの複雑さとオーバーヘッドが生じる可能性があり、企業が大きくなるほど、より多くのツールとデータ ソースが必要になります。一元化された可観測性を導入しているチームの 79% が、結果として時間やお金が節約できたと回答しているのも不思議ではありません。
私たちは Grafana Labs の活気に満ちたオープンソース コミュニティに対応しています。それが私たちの調査の結果を歪める可能性がありますが、OSS の影響を否定することはできません。私たちの調査で挙げられた最も人気のあるテクノロジー 10 個のうち 8 個はオープンソースですが、回答者の圧倒的多数が Prometheus (89%) または OpenTelemetry (85%) に投資しています。
興味深いことに、 PrometheusコミュニティとOpenTelemetryコミュニティの間にはかなりの重複があります。回答者のほぼ 40% が業務で両方を使用しており、50% 以上が過去 1 年間で各プロジェクトの使用量を増加させました。
AI は最近大きな注目を集めていますが、可観測性における AI の役割は今日では主に願望的なものです。それでも、可観測性の専門家は、インシデント対応を加速し、可観測性の導入を簡素化するその可能性に依然として興奮しています。
異常検出は回答者が希望する AI 対応機能として最も多く挙げられており、4 分の 3 以上がこれを挙げています。 AI に関するその他の上位のウィッシュリスト項目には、予測分析やダッシュボード生成などがあります。
回答者の半数以上が、可観測性に関する最大の懸念事項はコストであると述べていますが、カーディナリティ、予測不可能な請求書、ベンダー ロックインなど、他の関連トピックも挙げられています。