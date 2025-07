Som backend-udvikler, der har arbejdet med microservices i de sidste par år, er en sandhed blevet smertefuldt indlysende: Debugging produktionsproblemer på tværs af distribuerede systemer kan føles som detektivarbejde i mørket.





Du har tjenester, der kalder tjenester, nogle gange snesevis dyb. En bruger klikker på en knap på brugergrænsefladen, og 15 microservices spin i aktion.





Og hvis du bygger eller vedligeholder microservices i 2024, er OpenTelemetry det værktøj, du vil have i dit hjørne.





Hvad er observerbarhed egentlig?

Observabilitet er mere end blot logs. Det handler om at forstå, hvorfor dit system opfører sig på en bestemt måde, ikke bare hvad det gør.





Logs – Raw events, nyttigt til debugging.

Metrik – tal, du kan spore over tid (f.eks. anmodningstal, CPU).

Spor – End-to-end-forespørgselsstrømme på tværs af tjenester (aka din distribuerede "opkaldsstack").





Traditionelle overvågningsværktøjer fokuserer hovedsageligt på målinger og logs, men sporing er den virkelige spilændrer for microservices.





Hvorfor vi valgte OpenTelemetry

Vi eksperimenterede med flere observabilitetsstacks - Datadog, New Relic, Prometheus, Jaeger, Zipkin - men de havde alle et problem: enten var de leverandør-låst eller manglede konsistens på tværs af sprog.





OpenTelemetry (OTel) tjekkede alle vores kasser:

Open-source under CNCF

Arbejder på tværs af sprog (vi bruger Node.js, Go og Python)

Leverandørneutral – eksport til Grafana, Jaeger, New Relic osv.

Støttet af alle i branchen (bogstaveligt talt: AWS, GCP, Microsoft osv.)





Sådan bruger vi OpenTelemetry i Node.js Microservices

Lad mig gå dig igennem, hvordan vi rent faktisk instrumenterede en reel tjeneste. Lad os sige, at vi har en simpel brugerservice bygget i Node.js ved hjælp af Express. Det udsætter et endpoint `/brugere`, der henter brugerdata.

Step 1: Install Dependencies

npm install @opentelemetry/api \ @opentelemetry/sdk-node \ @opentelemetry/auto-instrumentations-node \ @opentelemetry/exporter-trace-otlp-http

Vi vil eksportere spor via OTLP til en lokal Jaeger-instans.





Step 2: Create tracing.js to Initialize OpenTelemetry

JavaScript: tracing.js

const { NodeSDK } = require('@opentelemetry/sdk-node'); const { getNodeAutoInstrumentations } = require('@opentelemetry/auto-instrumentations-node'); const { OTLPTraceExporter } = require('@opentelemetry/exporter-trace-otlp-http'); const { SemanticResourceAttributes } = require('@opentelemetry/semantic-conventions'); const { Resource } = require('@opentelemetry/resources'); const traceExporter = new OTLPTraceExporter({ url: 'http://localhost:4318/v1/traces', }); const sdk = new NodeSDK({ traceExporter, instrumentations: [getNodeAutoInstrumentations()], resource: new Resource({ [SemanticResourceAttributes.SERVICE_NAME]: 'user-service',}) }); sdk.start();





Step 3: Add It to Your Entry File





JavaScript: Index.js require('./tracing'); // Always load this first const express = require('express'); const app = express(); app.get('/users', (req, res) => { res.json([{ id: 1, name: "Alice" }, { id: 2, name: "Bob" }]); }); app.listen(3000, () => console.log("User service running on port 3000"));





Vores service eksporterer nu spor.





Step 4: Spin Up Jaeger Locally (or Use Grafana Tempo)





Her er hvordan vi tester lokalt:

docker run -d --name jaeger \ -e COLLECTOR_OTLP_ENABLED=true \ -p 4318:4318 -p 16686:16686 \ jaegertracing/all-in-one:latest





Besøg http://localhost:16686 for at se dine spor.

Besøg http://localhost:16686 for at se dine spor.





Chaining spor på tværs af tjenester

Lad os nu sige, at du har en anden tjeneste - ordre-service - som kalder bruger-service. Hvis begge er instrumenteret med OpenTelemetry, får du et fuldt spor af brugerens anmodning hopper mellem dem.





Og det bedste? OpenTelemetry håndterer sporkontekstspredning via HTTP-overskrifter automatisk.





Tilføj brugerdefinerede intervaller til forretningslogik

Nogle gange er automatisk instrumentering ikke nok. Hvis du f.eks. vil spore en DB-forespørgsel eller et eksternt API-opkald:





const { trace } = require('@opentelemetry/api'); const tracer = trace.getTracer('user-service'); app.get('/users', async (req, res) => { const span = tracer.startSpan('fetch-user-data'); try { const users = await fetchUsersFromDB(); res.json(users); } catch (err) { span.recordException(err); throw err; } finally { span.end(); } });





Dette er super nyttigt, når du vil spore ydeevnen af specifik forretningslogik.





Best Practices We've Learned the Hard Way





1. Use Semantic Conventions

I stedet for at opfinde dine egne attributnavne, skal du holde dig til OpenTelemetry semantiske konventioner. Disse gør dine spor lettere at forstå og kompatible med værktøjer som Grafana, Tempo osv.





Eksempler på:

JavaScript span.setAttribute("http.method", req.method); span.setAttribute("http.route", req.path);





2. Sample Wisely

Hvis du sporer hver enkelt anmodning, vil dit system drukne i data. Brug sporprøveudtagning (f.eks.

af JavaScript

const sdk = new NodeSDK ({ sampler: new TraceIdRatioBasedSampler (0.1), // 10% sampling });





3. Use OpenTelemetry Collector in Production

Eksporter ikke telemetri data direkte fra dine tjenester til din backend. Rute det gennem OpenTelemetry Collector - det giver dig buffering, batching, retries og formatkonvertering.





4. Don't Log PII in Spans

Vær super forsigtig med ikke at gemme brugernavne, e-mails, kreditkortoplysninger osv. i span attributter eller logs.





Hvor dette har hjulpet os mest

Debugging af latensproblemer: At se fulde spor på tværs af 4-5 microservices hjalp os med at identificere flaskehalse på minutter.

Identificering af retry storme: Vi opdagede en tjeneste, der kaldte en anden i en loop med retries, noget vi ikke ville have fanget via logs.

Sammenligning af spor fra den ene version til den næste viste os præcis, hvad der ændrede sig.





Bonus: Sporing i en multi-language stack

Vi bruger Node.js til nogle tjenester, Go til andre. OpenTelemetry gjorde det nemt at instrumentere begge dele og sende alle dataene til ét sted - Jaeger til dev, Grafana Cloud i staging/prod.





Ingen vendor lock-in. ingen mismatch i sporformater. Kun ren synlighed.





Conclusion: If You're Building Microservices, Start with Observability

Mikroservices giver os skala og fleksibilitet, men de bringer også kompleksitet.

OpenTelemetry er blevet en central del af vores arkitektur, ikke kun til debugging, men til optimering af ydeevne, pålidelighed og i sidste ende – brugeroplevelsen.





Hvis nogen ikke bruger det endnu, anbefaler jeg stærkt at give det et skud. Selv en grundlæggende opsætning med Jaeger og et par tjenester vil få dig til at spekulere på, hvordan du nogensinde levede uden det.