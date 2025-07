Програм хангамжийн систем нь илүү комплексан байхдаа, микросервизүүд нь масштабируулсан, хүчирхэг, хадгалах илүү хялбар аппүүд үүсгэх арга юм. Гэсэн хэдий ч энэ хялбар байдал нь компромисс идэвхжүүлэхийн тулд: зүйлс харьцуулахад хэцүү байдаг. Хөгжлийн бүрэлдэхүүн хэсэгүүд нь дистрибуирован системд хэрхэн мэдэгдэх нь хялбар биш бөгөөд энэ нь хэзээ ч харахын тулд маш сайн биш юм.





Нарийвчлал нь уламжлалт мониторингээс гадна ихэнх системийн дотоодын нөхцөлд гүнзгий мэдрэмжийг олгодог. Нарийвчлал нь ямар нэгэн зүйлгүй үед мэдэгддэг боловч нарийвчлал нь хэрэглэгчид асуудал мэдэгдэж байгаа өмнө - энэ нь ямар нэгэн зүйлгүй шалтгааны талаар мэдэгддэг.





Ажлын гурван хавтгай





1. Metrics: Quantitative System Behaviour

Метрик нь систем, бизнесийн гүйцэтгэлийн дундаж нумерик хувилбар олгодог. Энэ нь ихэвчлэн хялбар, өндөр бүтэцтэй өгөгдлийн жагсаалттай бөгөөд энэ нь бүтэцэд тэндэлгээ, аномалийг олж боломжийг олгодог.





Key Metrics Types:

Системийн метрик: CPU, Хэмжээ, диск хэрэглээ, сүлжээний дамжуулалт

Хэрэглээний метрик: Хэрэглээний түвшин, алдааны түвшин, хариу хугацаа

Бизнесийн метрик: Хэрэглэгчийн оролцох, конвертын түвшин, транзакцийн хэмжээ

Custom metrics: Тавтай морилно уу, Тавтай морилно уу





Advantages of Metrics:

Хэвлэх, хадгалах нь бага overhead

Хялбар солих, статистик арга хэрэгсэл ашиглан анализ

Зөвлөмж: Зөвлөмж нь Зөвлөмж нь Зөвлөмж

Тавтай морилно уу Тавтай морилно уу Тавтай морилно уу





Эффективын метрикийн имплементац нь нормалан үйл явцыг зориулсан эх үүсвэрийг бий болгох, харахын тулд тохиромжтой хязгаарлалт тохируулна. RED (Rate, Errors, Duration) болон USE (Usilization, Saturation, Errors) арга хэрэгсэл нь метрикуудыг эх үүсвэрийг олгодог.





2. Logs: Detailed Event Records

Логилүүд програмууд болон инфраструктур бүрэлдэхүүн хэсгүүдийн дотор үйл явдлыг харуулдаг. Тэд тусгай үйл ажиллагаа, алдаа, статусын өөрчлөлтийн талаарх контексттай мэдээллийг хангах.





Хамгийн сайн арга хэрэгсэл:

Хадгаламжийн форматтай структурын бүртгэлийн гүйцэтгэл (JSON нь алдартай)

Контекстуал мэдээллийг агуулдаг (ургамал нэр, хувилбар, байгаль орчинд)

Алдартай ID-ийг нэмж үйлчилгээний хооронд хүсэлтийг харах

Хамгийн тохиромжтой лог түвшин ашиглах (DEBUG, INFO, WARN, ERROR)

Лог ротация, хадгалах бодлого практик





Log удирдлагын асуултууд:

Өнгөрсөн системд өндөр хэмжээ

Хөнгөн цагааны зардал, гүйцэтгэлийн нөлөө

Шуудангийн өгөгдлийн зөв сигналыг олж авах

Үйлчилгээний үр дүнг харьцуулахад





Modern log management solutions centralize logs from all services, хайлтын, шүүлтүүр, систем хооронд анализ боломжийг олгодог. Тэд ихэвчлэн шинж чанарыг дэмждэг.





3. Traces: Request Journeys

Дистрибьюторын Tracking нь микросервисын дамжуулан санал болгож буй асуултуудыг дагаж, асуултын амьдралын цикл нь нийтлэг үзүүлэлт үүсгэдэг. Бүх асуултууд нь хоорондын хоорондын хоорондын тусгай үйл ажиллагаа (Specific operations within services) -ийг бүрддэг.





Tracing Components:

Trace IDs: End-to-end хүсэлтийг нэгтгэсэн IDs

Түлхүүр үг: Spans: Individual operations within a trace

Span контекст: үйлчилгээний хязгаарлалыг хооронд гарын авлагатай метадан

Аннотации / Tags: Spans-д нэмэлт мэдээлэл





Tracing Benefits:

Комплекс архитекторын хоорондын хэрэглээний дамжуулах

Pinpoint performance bottlenecks болон латенцийн асуудал

Үйлчилгээний түншүүд, интеракцийн загварууд мэддэг

Debug Complex дистрибутированные транзакции





Service Mesh

Istio, Linkerd, Consul гэх мэт үйлчилгээний Mesh нь сүлжээний түвшинд service-to-service холболт харахын тулд хайрцаг дээрх харах боломжийг олгодог.





Key Features:

Автомат метрикийн цуглуулгыг олж авах: Request Volumes, Latencies, Error Rates

Distributed Tracking Integration: Trace headers-ийн хуваалцах

Traffic Visualization: Service dependency газрын зураг

Албан ёсны менежмент: Circuit breaking, retries, traffic splitting





Service mesh нь Kubernetes орчинд маш их үнэ цэнэтэй байдаг. Энэ орчинд та өөрийн үйлчилгээг кодыг өөрчилжгүйгээр sidecar proxies болгон суулгах боломжтой.





Open Telemetry: The Unified Standard

Open Telemetry нь тоног төхөөрөмжийн салбарт стандарт гэж нэрлэдэг бөгөөд telemetry өгөгдлийг цуглуулах, экспортын нь нийлүүлэгчтэй арга замыг санал болгож байна.





Components:

API: Телеметрийн өгөгдлийг үүсгэхийн тулд хэрхэн тодорхойлох

SDK: Конфигурацийн сонголттай API-г гүйцэтгэдэг

Коллектор: Телеметрийн өгөгдлийн хүлээн авах, боловсруулах, экспортын

Экспортлогч: Дээрх өгөгдлийг янз бүрийн backend руу илгээх





Open Telemetry-ийг хүлээн зөвшөөрч, аж ахуйн нэгж нь ханган нийлүүлэгчийн лок-ийг хангахын тулд хэрэгцээний дагуу өөр observability backend хооронд өөрчлөх боломжтой.





Monitoring Platforms





Ажлын өгөгдлийн хадгалах, анализ, визуализийг зориулсан янз бүрийн шийдэл байдаг:





Popular Combinations:

Prometheus + Grafana: Open-source метрикийн хяналт, визуализаци

ELK Stack (Elasticsearch, Logstash, Kibana): Лог суулгах, анализ

Jaeger/Zipkin: Open-source дистрибутирован Tracking

Арилжааны платформ: Datadog, New Relic, Dynatrace, Honeycomb





Олон аж ахуйн нэгж нь арга хэрэгслүүдийн холимог хэрэглэж байна, харин нэгтгэсэн харах платформ нь метрик, лог, шугам хооронд харьцуулахад чадвартай байдаг.





Microservices-д үзүүлэлттэй асуултууд





Data Volume and Cardinality

Microservices өндөр кардиналцтай телеметрийн өгөгдлийн их тооны үүсгэдэг (хэмжээний олон тусгай компиляци). Энэ нь:

Хөнгөн цагааны зардал: Бюджетны хязгаарлалттай өгөгдлийн хадгалах баланс

Query гүйцэтгэл: өгөгдлийн хэмжээ нэмэгдэж буй хурд хадгалах

Сигнал шугам харьцуулалт: Өндөр өгөгдлийн багтаамжтай мэдээллийг олж авах





Context Propagation

Үйлчилгээний хязгаарлалыг хооронд контекст хадгалахын тулд давуу талтай асуултууд хэрэгтэй:

Хамгийн сүүлийн үеийн бичлэгүүд: Trace IDs болон контекст нь стандартизирован форматинг

Asynchronous Operations: Тавтай морилно уу

Гуравдын үйлчилгээ: Төгсгөлтийн механизмыг дэмждэг гарын авлага системтэй ажиллуулах





Tool Proliferation

Нарийвчлалтай пейзаж нь олон мэргэшсэн хэрэгслүүдтэй байдаг бөгөөд энэ нь:

Integration Complexity: Тавтай морилно уу хэрэгсэл хамтран ажиллах

Зөвлөмж фрагментаци: олон системийг суралцахын тулд багц шаарддаг

Хязгаарлалт менежмент: олон борлуулагчдын хооронд зардал хянах





Microservices-ийн харахын тулд хамгийн сайн практик





Instrumentation стратегийн

Хадгаламжийн тохиргоо: Хадгаламжийн стандарт шинж чанарыг хийх, дараах санаа биш

Автомат инструменталтыг ашиглах боломжтой тохиолдолд хөгжилтийн ачааллыг багасгах

Үйлчилгээний болон багц хооронд харьцангуй библиотек дээр стандартын

API-д харахын тулд харахын тулд загвар хийх





Эрүүл мэндийн хяналт, SLIs / SLOs

Үйлчилгээний эрүүл мэндийн хяналтын үндсэн хангамжийн хяналт хийх

Service Level Indicators (SLIs) -ийг хэрэглэгчийн туршлагаг харуулах

Service Level Objectives (SLOs) -ийг баталгаажуулах зорилгоор тохируулах

Үйл ажиллагааны хурдтай найдвартай болгохын тулд алдааны зардал үүсгэхийн тулд





Ангилааны философи

Симптомыг харах, шалтгаан биш: хэрэглэгчийн үр нөлөө дээр анхаарлаа хандуулах

Аюулгүй байдлын алдааг багасгах: шулуун эсвэл хязгаарлагдмал бүртгэлийг элсүүлэх

Ямар ч байтугай оюутнуудыг үүсгэхийн тулд: Route alerts to the right teams

Ажлын алармах үүсгэхийн тулд: контекст, үр дүнтэй эмчилгээний үйл явдлыг агуулдаг





Культур гэж үзэх

Shift left: Ажлын үйл явцыг хөгжүүлэх үйл явцыг нэгтгэхийн тулд

Нарийвчлалтай шалгалт хийх код шалгалт гадна

Хаос инженерийн туршилтын үйл явцыг шалгана уу

Хэрэглээний өгөгдлийг ашиглан идентичлэгдсэн нийтлэг сценариудын playbooks үүсгэх





New Relic’s Comprehensive Approach to Microservice Observability

New Relic-ийг өөр өөрчлөн болгодог нь харахын тулд нэгтгэсэн платформ арга зам юм. Олон мэргэжилтнүүдийн хэрэгслүүдийг нэгтгэхийн тулд New Relic нь нэг ширээний хавтан дамжуулан таны бүх микросервисын экосистем дээр эцэст-аас эцэст харах боломжийг олгодог. New Relic нь шулуун тохиргооны асуудлуудыг буцаж туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах туслах. Энэ нь NerdGraph API-ийг





Service Architecture Intelligence

New Relic-ийн микросервисын харах чадвар нь Service Architecture Intelligence юм. Энэ хүчин чадал нь автоматаар үйлчилгээний хоорондын харилцааг олж, картчийг хангах, таны үйлчилгээний бодисоогийн бодисуулын бодит цаг хугацааны визуализацийг хангах. Инженерүүд нь бодисуулын бооцоо, алдааны шийдэл, нэг үйлчилгээний өөрчлөлтийг хэрхэн хэрхэн нөлөөлж болохыг мэддэг. үйлчилгээний архитектур газрын зураг нь статик диаграмм биш, таны системийн үр дүнтэй ач холбогдолтой динамик визуализаци юм. Тэд таны архитектурын шинэчлэхэд автоматаар шинэчлэгддэг бөгөөд таны баг нь гарын авлагагүйгээр үйлчилгээний харилцааны үр дүнтэй мэдлэгтэй байх болно.





Queues & Streams Monitoring

Шинэ microservice архитектур нь асинхрон харилцаа холбооны дараах дараах дараах дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараагийн дараа





Fleet and Agent Control

Шинэ Relic-ийн Флот хяналтын болон Агент хяналтын систем нь дэлхий даяар бүх Instrumentation амьдралын цикл үйл явцыг төвлөрөгдөг. Эдгээр хэрэгсэлүүд нь: Машинист үйл явцыг төвлөрөгдөг. Машинист хувилбарууд нь зөвхөн хэд хэдэн даяар татаж авах. Kubernetes clusters-ийн telemetry blind spots эвдэх.





Enhanced Application Performance Monitoring (eAPM)

New Relic-ийн eAPM нь eBPF технологийг ашигладаг. програм хангамжийн гүйцэтгэл нь кодыг өөрчилж, үйлчилгээг шинэчлэхгүйгээр гүнзгий мэдрэмжийг хангахын тулд. Энэ нь уламжлалт тоног төхөөрөмжийн арга хэмжээтэй микросервисын орчинд чухал юм.





eAPM чадвар санал болгож байна:

AI-тай дэмжлэгтэй мэдлэг, хэрэглээний болон Kubernetes clusters хооронд метрик автомат харьцуулахад

Зохиогчийн эрх хуулиар хамгаалагдсан

Тээвэртэй APM-ийн агентлаас шилдэг мэдрэмжийг шаарддаг үед зөөлөн переход





Энэ нь екип нь ихэвчлэн инструментацийн ажилгүйгээр microservice-ийн үзэсгэлэнт хооронд хурдан үзэсгэлэнт хийх боломжтой.





Cloud Cost Intelligence

Шинэ Relic-ийн Cloud Cost Intelligence хүчин чадал нь хөнгөн цагааны эрчим хүчний зардал дээр үнэгүй, дэлгэрэнгүй үзүүлэлт үзүүлэх боломжийг олгодог, багдад: Хөнгөн цагааны зардал үзнэ үү, аж ахуйн нэгжийн хооронд удирдах болно Хөнгөн цагааны эрчим хүчний зардал үр нөлөө үнэлгээ авахад өмнө хэрэглэдэг Автомат тавтай морилно уу тавтай морилно уу үнэгүй даатгалын өгөгдөл нь дэлгэрэнгүй зардал үзнэ үү Инженерийн, санхүүгийн, бүтээгдэхүүний баг, зардал, бизнесийн зорилгоор харьцуулах боломжийг олгодог. Хөнгөн цагааны өгөгдлийн үр дүнг гүйцэтгэлийн үр дүнгтэй нэгтгэх баг нь үйлчилгээг сайжруулах, эрчим хүчний хуваалцах талаар мэдэгд





Real-Time Collaboration and Knowledge Sharing

Шинэ Relic нь Public Dashboards дамжуулан энэ нь боломжийг олгодог бөгөөд энэ нь екипүүд нь корпорацид дотор болон гадаадын оролцогчидтай чухал мэдрэмжийг хуваалцах боломжийг олгодог.





Эдгээр dashboards нь багд

New Relic-ийн нэгтгэсэн мэдээллийн сан болон асуултын хэл ашиглан амархан үзүүлэлт үүсгэх, хуваалцах

New Relic-ийн бүртгүүлэлтийг шаарддаггүйгээр тавтай морилно уу.

Security-д rol-based access controls ашиглах





Энэ хүчин чадал нь хөгжүүлэх баг, үйл ажиллагаа, бизнесийн оролцогчид хооронд силоос буцаж, үйлчилгээний найдвартай байдлыг нэгтгэсэн аргаар дэмждэг.





Microservices-ийн идэвхжүүлэх

Ажлын газар нь хэд хэдэн шинэчлэгдсэн тэндэлгээтэй боловсруулсан байна:

AI-тай дэмжлэгтэй анализ: Машины суралцах нь аномалийг олж, эх үүсвэрийг санал болгож

eBPF технологи: Minimal overhead нь kernel түвшин тоног төхөөрөмж

Open Telemetry Convergence: Телеметрийн цуглуулгын үргэлжлэх стандартизаци

Насанд хүрэгчдэд зориулалт: Насанд хүрэгчдэд зориулалтын шаардлага





Баримтлал

Эффектив харахын тулд микросервизүүд нь хэт ягаан туяаны хайрцагтай системийг транспарент, debuggable системийг өөрчилж болно. Метрик, лог, шугам агуулсан өргөн хүрээтэй стратегийг гүйцэтгэхийн тулд аж ахуйн нэгжүүд дистрибуирован архитектурд итгэл бий болгох, илүү найдвартай хэрэглэгчийн туршлагаг санал болгож болно.





Нарийвчлалтай хөрөнгө оруулалт нь хязгаарлагдмал цаг хугацаа, хурдан буцаан хугацааг багасгахын тулд зүгээр л хуваалцдаггүй боловч багтаамжтай шинэчлэхэд боломжийг олгодог.