Երկու տարիների ընթացքում microservices- ի հետ աշխատում է, մեկ ճշմարտությունը պակասապես հուսալի է: արտադրության խնդիրների debugging- ը ներգրավված համակարգերի մեջ կարող է զգալ, թե ինչ է դիտակային աշխատանքը սեւում:





Դուք ունեք ծառայություններ, որոնք զանգահարում են ծառայություններ, երբեմն դիզայններ: Մարդը կտրում է մի կոճակը UI- ում, եւ 15 microservices- ը գործում է: Եթե ինչ-որ բան կտրում է - կամ ավելի վատ, պարզապես կտրում է - տեսնել, թե որտեղ եւ ինչու կարող է կտրել ժամեր:





Եթե դուք 2024 թ. ստեղծում եք կամ պահպանում եք microservices- ը, OpenTelemetry- ը այն գործիք է, որը դուք ցանկանում եք ձեր գծում:





Ո՞վ է ճշմարտությունը, իսկապես.

Պահպանելիությունը շատ ավելի է, քան պարզապես գրասենյակներ: Այն մասին է, որ գիտեք, թե ինչու ձեր համակարգը գործում է որոշակի ձեւով, ոչ միայն այն, ինչ է գործում: Հիմնականում, մենք խոսում ենք երեք փուլների մասին:





Լոգեր – Raw events, հեշտ է debugging համար.

Metrics - Նկարներ, որոնք դուք կարող եք հետազոտել ժամանակի ընթացքում (հարկե, պահանջի քանակը, CPU).

Traces - End-to-end պահանջների թռիչքները ծառայությունների միջեւ (հարկվում է ձեր թռիչքի "կաղադրիչը").





Հիմնական վերահսկողության գործիքները հիմնականում կենտրոնանում են մետրիկների եւ օրինակների վրա, բայց tracking- ը ճիշտ խաղային փոխանակիչ է microservices- ի համար:





Ինչու ենք ընտրել OpenTelemetry

Մենք փորձել ենք մի քանի observability բաղադրիչների - Datadog, New Relic, Prometheus, Jaeger, Zipkin - բայց նրանք բոլոր ունի մի խնդիր: կամ նրանք են մատակարարը բեռնել, կամ ոչ մի համոզվածություն ամբողջ լեզուներում.





OpenTelemetry (OTel) ստուգել է մեր բոլոր սեղանները:

Open-source, ներքեւ CNCF

Աշխատում է տարբեր լեզուներում (Մենք օգտագործում ենք Node.js, Go եւ Python)

Մատակարար-neutral — արտահանման Grafana, Jaeger, New Relic, եւ այլն

Արդյունաբերության բոլորը աջակցում են (լուսանկարներ: AWS, GCP, Microsoft, եւ այլն)





Ինչպես օգտագործել OpenTelemetry Node.js Microservices- ում

Տեսեք, որ մենք ունենք պարզ օգտագործող ծառայություն, որը կառուցված է Node.js- ում, օգտագործելով Express- ը: Այն բացահայտում է `/users- ի վերջը, որը վերցնում է օգտագործողների տվյալները.

Step 1: Install Dependencies

npm install @opentelemetry/api \ @opentelemetry/sdk-node \ @opentelemetry/auto-instrumentations-node \ @opentelemetry/exporter-trace-otlp-http

Մենք պետք է արտահանել traces միջոցով OTLP- ի վրա տեղական Jaeger- ի տեղադրման.





Step 2: Create tracing.js to Initialize OpenTelemetry

JavaScript: tracing.js

const { NodeSDK } = require('@opentelemetry/sdk-node'); const { getNodeAutoInstrumentations } = require('@opentelemetry/auto-instrumentations-node'); const { OTLPTraceExporter } = require('@opentelemetry/exporter-trace-otlp-http'); const { SemanticResourceAttributes } = require('@opentelemetry/semantic-conventions'); const { Resource } = require('@opentelemetry/resources'); const traceExporter = new OTLPTraceExporter({ url: 'http://localhost:4318/v1/traces', }); const sdk = new NodeSDK({ traceExporter, instrumentations: [getNodeAutoInstrumentations()], resource: new Resource({ [SemanticResourceAttributes.SERVICE_NAME]: 'user-service',}) }); sdk.start();





Step 3: Add It to Your Entry File





JavaScript: Index.js require('./tracing'); // Always load this first const express = require('express'); const app = express(); app.get('/users', (req, res) => { res.json([{ id: 1, name: "Alice" }, { id: 2, name: "Bob" }]); }); app.listen(3000, () => console.log("User service running on port 3000"));





Մեր ծառայությունը այժմ արտահանում է մանրամասներ.





Step 4: Spin Up Jaeger Locally (or Use Grafana Tempo)





Այսպիսին է, թե ինչպես մենք փորձում ենք տեղական:

docker run -d --name jaeger \ -e COLLECTOR_OTLP_ENABLED=true \ -p 4318:4318 -p 16686:16686 \ jaegertracing/all-in-one:latest





Տեսեք http://localhost:16686 համար տեսնել ձեր ուղեցույցները.

Տեղադրել Traces Over Services

Այժմ ասում ենք, որ դուք ունեք այլ ծառայություն - order-service- ը, որը կոչվում է user-service- ը: Եթե բոլորը OpenTelemetry- ի հետ սարքավորվում են, դուք կարող եք ստանալ ամբողջ տեսակը, որ օգտվողի պահանջը փոխանցում է նրանց միջեւ:





OpenTelemetry- ը ավտոմատորեն վերահսկում է trace context- ի փոխանցման միջոցով HTTP- ի տպագրերի միջոցով: Դուք չեք պետք մանրաձայնորեն փոխանցել trace ID- ները ծառայությունների միջեւ:





Ավելացնել Custom Spans համար Business Logic

Նշում է, եթե դուք ցանկանում եք հետազոտել DB փոստի կամ արտաքին API call- ը:





const { trace } = require('@opentelemetry/api'); const tracer = trace.getTracer('user-service'); app.get('/users', async (req, res) => { const span = tracer.startSpan('fetch-user-data'); try { const users = await fetchUsersFromDB(); res.json(users); } catch (err) { span.recordException(err); throw err; } finally { span.end(); } });





Սա շատ օգտակար է, երբ դուք ցանկանում եք հետազոտել մասնավոր բիզնես լոգիաների կատարումը:





Best Practices We've Learned the Hard Way





1. Use Semantic Conventions

Արդյոք, այնպես էլ, եթե դուք ցանկանում եք ստեղծել ձեր սեփական սերտիֆիկի անունները, փնտրեք OpenTelemetry- ի սերտիֆիկը: Այսպիսով ձեր սերտիֆիկը հեշտ է հասկանալ եւ համատեղելի է գործիքների, ինչպիսիք են Grafana, Tempo եւ այլն:





Նշում է:

JavaScript span.setAttribute("http.method", req.method); span.setAttribute("http.route", req.path);





2. Sample Wisely

Եթե դուք փնտրում եք յուրաքանչյուր պահանջը, ձեր համակարգը փնտրում է տվյալների մեջ: Օգտագործեք trace sampling- ում (հարկե 10% կամ միայն սխալներ):

JavaScript- ը

const sdk = new NodeSDK ({ sampler: new TraceIdRatioBasedSampler (0.1), // 10% sampling });





3. Use OpenTelemetry Collector in Production

Չեք արտահանել telemetry տվյալները ուղղակիորեն ձեր ծառայություններից ձեր backend. Routing այն միջոցով OpenTelemetry Collector - այն կարող է տալիս ձեզ buffering, batching, retries, եւ ձեւավորման փոխանակման.





4. Don't Log PII in Spans

Արդյոք, դուք պետք է վախենալ, որ օգտագործողների անուններ, էլեկտրոնային փոստեր, բջջային քարտերի տեղեկություններ, եւ այլն, վախենում է մանրամասներ եւ մանրամասներ.





Ինչպե՞ս է մեզ ավելի շատ օգնել

Debugging լարման խնդիրներ: Տեսելով ամբողջական փաթեթներ 4–5 microservices- ում, մենք օգնվել ենք identify լարման մի քանի րոպեում.

Տեղադրել retry ծառները: Մենք տեսել ենք մի ծառայություն, որը զանգահարում է մեկ այլը retries- ի հետ, ինչը մենք չենք ստացել logs- ի միջոցով:

Մուտքագրման վերահսկողություն: Երբ համեմատել է մի տարբերակից մի այլ տարբերակը, մենք տեսնում ենք, թե ինչ է փոխվել:





Բոնուս: Tracking է Multi-Language Stack

Մենք օգտագործում ենք Node.js- ը որոշ ծառայությունների համար, Go- ը այլ ծառայությունների համար: OpenTelemetry- ը հեշտեցնում է այն, որ բոլոր տվյալները ուղարկել են մեկ տեղում: Jaeger- ը dev- ի համար, Grafana Cloud- ը staging- ի համար/prod- ի համար:





Ոչ մի մատակարարը բեռնում է. Ոչ մի ճշգրտություն trace format- ում. պարզապես ճշգրտություն.





Conclusion: If You're Building Microservices, Start with Observability

Microservices- ը մեզ ապահովում է ծախսերը եւ հարմարավետությունը, բայց այն նաեւ մատակարարում է հարմարավետությունը: Չնայած ճշգրիտ վերահսկողությունը, դուք փնտրում եք աչքերով:

OpenTelemetry- ը դարձել է մեր դիզայնի հիմնական մասը, ոչ միայն debugging- ի համար, այլեւ կատարման, հավասարության եւ վերջապես օգտագործող փորձի optimization- ի համար:





Եթե որեւէ մեկը դեռ չի օգտագործում այն, ես հզորապես առաջարկում եմ, որ այն ստացեք: Մինչեւ Jaeger- ի բնական տեղադրումը եւ մի քանի ծառայություններ կստանաք հարցնել, թե ինչպե՞ս դուք երբեք ապրում եք առանց այն: