曾经发生过,它相当于在一个不怀疑的邻居系统中间谍。你会访问几个服务器,检查CPU或内存,并决定在一天结束时没有什么不对劲。那些日子已经过去了。云原生系统的新环境更具动态性和不可预测性。在容器移动前花了几秒钟。云间跨度微服务集群。虚拟网络通过扭曲和扭转流量模式创建的网络有一个旅程。被适应在更稳定和被动环境中运作的经典监控只是无法跟上这个新速度。 云原生世界所证明的是,一切都在移动,成长,生活和死亡,以一种不能适合古代使用的小仪表板的方式。 这些不是要检查理解这样的系统的唯一原因。 From Watching to Understanding 从观察到理解 有经典的监控,让你知道你的服务器中的一个没有响应,或者你的应用程序正在使用过多的内存。 它在已知事情发生错误的可能性的情况下是有效的。 云原生应用程序在新的波长上运行。 它们在容器、虚拟机和编排系统中产生大量的远程测量。 在服务中,这种交互更为可变,因此无法预测故障模式。 Observability enters and makes the unknown visible. Observability tools do not simply collect superficial symptoms but instead collect logs, metrics and traces that can be used to see the flow of a request through the system, and how every single part of the system is handling it. Not only do you start to realize that something has gone wrong but also how the issue has spread to other parts of the network. This is an understanding that a world that is enormously changing needs to have. The Heartbeat of a Distributed Network 分布式网络的心跳 想象一下,在一个完整的房间里,有人在任何时候都会中断,人们正在互相交谈,听到人们是多么困难。 看起来像是后台的云原生网络。 可观测工具收集分散的信息片段并重建对话。 指标用于确定服务在特定时间的表现有多好。 有关系统动态的信息被记录在日志中。 痕迹显示了任何请求的整体路径,因为它已经到达系统,并且完全形成。 A combination of these signals means that observability is a living map of the system. You are able to see the dependencies of services, how latency within the network is potentially compromising performance, and how the performance of one region is affecting the rest. That is not the case in conventional monitoring. It was not intended to capture high-speed behavior or encode the relationships among hundreds of interacting services. When Automation Joins the Conversation When Automation Joins the Conversation 云本土的可观察性超越信息收集,智能功能在当代平台上被覆盖,以便在团队甚至知道某些东西不正常之前能够检测到不正常的模式。 放缓或错误以及不同来源的指标和事件之间的差距可以由这些系统自动比较,这就是为什么它被称为反馈循环,这在概念上与始终观察系统的第二双眼睛相同。 这种自动化情报在大型环境中非常有益,团队可能会被远程测量量量压倒,工程师有机会专注于最重要的实际问题,而不是扫描巨大的日志。 The Reality of Modern Complexity 现代复杂的现实 当然,它不会便宜的维护。云环境正在产生大量的数据,选择存储和采样哪些数据是一个交易。某些监控工具可以给你一个零件的图像,除非它都位于一个可观察层内。 然而,这些足以计算可观测性同样重要。基于云的网络并不变得更容易。工作负载将转移到其他平台。 将有额外的自动化。 对计算机系统的压力将增加。 A New Era of Insight 新时代的洞察力 The new thinking and strategy of operating with software is cloud-native network observability. It is not only focused on the failures of individuals but the whole dynamism of a dynamical system. Observability enables the teams to bask in the view that they need to be able to develop resilient applications in the turbulent environment, to know what is occurring and why. The existence of the old system of monitoring does not vanish, it only becomes insufficient. The future lies in systems that are self-explanatory. Listening is observability.