AJI KOUNYE A! ÒF LIMITE TAN! OPERATÈ YO KANPE! Mwen pare pou pwochen avanti mwen kòm yon defansè DevRel / Technical Evangelist / IT Talespinner. Si sa son tankou yon bagay ou bezwen, lage m 'yon liy nan imèl oswa sou LinkedIn Mwen espesyalize nan siveyans ak obsèvabilite pou 27 ane kounye a, epi mwen te wè yon anpil nan zouti ak teknik vini ak ale (RMon, nenpòt moun?); ak plis pase kèk vini epi rete (Rimè sou lanmò SNMP yo te - e yo kontinye ap - anpil ekzajere.). Dènyèman, mwen te eksplore youn nan amelyorasyon ki pi resan yo nan espas sa a - OpenTelemetry (ki m ap abreje "OTel" pou rès blog sa a). . Mwen te ekri sou desizyon mwen te plonje nan OTel dènyèman Pou pi fò, mwen ap jwi vwayaj la. Men, gen yon pwoblèm ki egziste ak obsèvasyon pou yon ti tan kounye a, epi li se yon bagay OTel pa ede. Tit pòs sa a sijesyon sou pwoblèm nan, men mwen vle yo pi klè. Ann kòmanse ak kèk fè makèt konparezon. Anvan mwen deranje chak machann nan vil la, mwen vle klè ke sa yo se nimewo gwo, ki graj, wo nivo. Mwen te lye nan paj prix yo si ou vle tcheke detay yo, epi mwen rekonèt sa ou wè anba a pa nesesèman endike pri a ou ta ka aktyèlman peye apre yo fin resevwa yon quote sou yon anviwònman pwodiksyon reyèl. Nouvo relik chaj 35¢ pa GB pou nenpòt done ou voye yo. …byenke pa fè sa patikilyèman klè paj pri a Datadog gen yon veritab lis opsyon lesiv, men nan yon wo nivo, yo : chaje $15-$34 pou chak lame 60¢ - $1.22 pou chak milyon dosye netflow $1.06-$3.75 pou chak milyon dosye boutèy demi lit $1.27-$3.75 pa milyon spans Dynatrace a espò yon lis prèske osi lontan ke Datadog a men kèk atik kle: Paj pri 15¢ pou chak 100,00 metrik plis .07¢ pa Gig pa jou pou retansyon 2¢ pou chak gig pou mòso bwa plis .07¢- pou chak gig pa jou pou kenbe yo plis .035¢ pou chak gig mande Evènman yo gen menm pousantaj ak mòso bwa .014¢ pou chak 1,000 span Grafana, ki - li dwe remake - se sous louvri epi efektivman ba ou tout bagay gratis si ou vle fè gwo leve nan enstale ak hosting. Men, : pri yo ka rezime kòm $8.00 pou 1k mezi, (jiska 1/minit) 50 ¢ pou chak gig pou mòso bwa ak tras yo, ak retansyon 30 jou Lis sa a pa ni konplè, ni konplè. Mwen te kite yon anpil nan fournisseurs, pa paske yo menm tou yo pa gen konsomasyon ki baze sou prix men paske li ta jis plis nan menm bagay la. Menm ak sa ki anwo yo, detay yo isit la yo pa konplè. Gen kèk konpayi pa sèlman chaje pou konsomasyon (ingest), yo menm tou yo chaje nan magazen done yo, epi chaje ankò nan rechèch done yo (ap gade ou, New Relic). Gen kèk konpayi ki pouse ou chwazi yon nivo sèvis, epi si ou pa fè sa, yo pral fè w peye yon pousantaj estime ki baze sou 99yèm percentile itilizasyon pou mwa a ( ). ap gade ou, Datadog Li ta dwe sipriz pèsonn ke sa ki parèt sou paj prix yo se pa menm mo final la. Gen kèk nan konpayi sa yo, menm kounye a, ap gade nan redefini entèpretasyon yo nan "konsomasyon ki baze sou pri" konsèp ki ta ka fè bagay sa yo menm plis opak (ap gade ou ANKO, New Relic). Menm ak tout sa yo te di, mwen pral soti sou yon manm epi ki deklare pou dosye a ke chak ak chak pwen sa yo pri yo tèlman ba ke menm mo "trivial" la twò gwo. Sa vle di, jiskaske kantite travay pwodiksyon yo satisfè fèy pri a. Nan pwen sa a nimewo itty bitty sa yo ajoute jiska lajan reyèl, epi byen vit. Pliryèl nan Anekdot Mwen te poze kesyon sa a bay kèk zanmi, mande si yo te gen eksperyans nan mond reyèl la fichye-chòk. Kòm toujou, zanmi m yo pa t desevwa. "Mwen te fè yon konparezon pri detaye nan New Relic ak Datadog yon koup ane de sa ak Fargate kòm itilizasyon prensipal la. New Relic te siyifikativman pi bon mache jiskaske ou te kòmanse anbake mòso bwa ak Lè sa a, Datadog te toudenkou 30-40% pi bon mache menm ak apm. [Men] pri pou chak lame yo tou faktè nan ak fè APM olye désagréable sof si w ap fè yon bagay san sèvè. Nou te vle sèvi ak li sou kubernetes men li te tèlman chè, jesyon te refize kwè depans yo ak sèvis sou Fargate, kidonk mwen te anjeneral montre nimewo mwen chak 2-3 mwa."__– Evelyn Osman, Head of Platform at enmacc "Tout sa mwen te genyen se memwa figi CFO yo lè li te wè bòdwo a."__– yon moun ki prefere rete anonim, menm si quote sa a se yon sezon freaking. Ak nan kou gen nan (kounye a trist, nan ti sèk obsèvasyon) whodunit mistè nan a. $ 65 milyon dola Datadog bòdwo Premye etap la se admèt ou gen yon pwoblèm Yon fwa (ki mwen vle di kòmansman ane 2000 yo), defi a ak siveyans (observabilite pa t 'yon tèm nou te itilize ankò) se kòman yo idantifye done yo nou te bezwen, ak Lè sa a, fè sistèm yo abandone done sa yo, ak Lè sa a, estoke done sa yo nan yon fason ki te fè li posib (se pou kont li efikas) yo itilize nan demann, ekspozisyon, alèt, ak sa yo. Sa se kote prèske tout pri a repoze. Sistèm yo tèt yo te sou lokal epi, yon fwa ke pyès ki nan konpitè yo te achte, efektivman "gratis". Rezilta a se te ke pratik aksepte la te kolekte otank posib epi kenbe li pou tout tan. Ak malgre chanjman nan teknoloji, anpil òganizasyon rezònman te rete menm jan an. Grafana Solutions Architect Alec Isaacson fè remake ke konvèsasyon li yo ak kliyan yo pafwa ale tankou sa a: "Mwen kolekte mezi CDM nan sistèm ki pi enpòtan mwen yo chak 5 segonn paske yon fwa, yon bon bout tan de sa, yon moun te resevwa rele lè sistèm nan te ralanti epi mezi yo pa t 'di yo poukisa." Jodi a, kolekte done siveyans ak obsèvabilite ("telemetri") se konparativman fasil, men - tou de kòm moun ak òganizasyon - nou pa te chanje ankadreman nou nan pwoblèm nan. Se konsa, nou kontinye pwan chak moso nan done ki disponib pou nou. Nou enstriman kòd nou an ak chak tag ak span nou ka panse a; si gen yon mesaj boutèy demi lit, nou bato li; mezi pyès ki nan konpitè? Pi bon pwan li paske li pral bay kontèks; Si gen rezo telemetri (NetFlow, VPC Flow mòso bwa, Streaming Telemetry) nou souse sa tou. Men, nou pa janm pran tan pou nou reflechi sou sa nou pral fè ak li. Eksperyans Madam Osman montre rezilta a: "[Yo] pa t gen okenn lide ki sa yo t ap fè ak siveyans [...] tout enstriman ak anrejistreman yo te pèmèt Lè sa a, te gen retansyon long "jis nan ka". Se konsa, yo te jis boule yon kantite lajan ridikil" Pou konekte li nan yon lòt move konpòtman ke nou te (plis oswa mwens) kraze tèt nou nan: Retounen nan premye jou yo nan "lift and shift" (souvan dekri plis presizyon kòm "lift and shit") nan nwaj la, nou pa sèlman deplase aplikasyon an gwo; nou te deplase li sou pi gwo sistèm platfòm la ofri. Poukisa? Paske nan kontèks ansyen an premye ou te kapab sèlman mande pou yon sèvè yon fwa, ak Se poutèt sa ou te mande pou pi gwo bagay ou te kapab jwenn, yo nan lòd lavni prèv envestisman ou. Desizyon sa a te tounen soti non sèlman yo te amizan nayif, li te terib chè epi li te pran tout moun kèk ane pou konprann ki jan "konpitè elastik" te travay ak restructuration aplikasyon yo pou nouvo paradigm la. Menm jan an tou, li lè pou nou rekonèt ak rekonèt ke nou pa gen mwayen pou kolekte tout moso done telemetrik disponib pou nou, epi anplis, ke nou pa gen yon plan pou done sa yo menm si lajan pa t 'objè. Admèt li: Pwoblèm ou a gen yon pwoblèm tou Kite m 'pivote nan Otel pou yon moman. Youn nan rezon kle yo - pètèt rezon prensipal la - pou w ale nan li se retire, pou tout tan ak toujou, doulè nan lock-in machann. Sa a se yon bagay mwen eksplore epi li te repete pa yon zanmi m 'dènyèman: nan dènye pòs blog mwen an - Matt Macdonald-Wallace, Achitek solisyon, Grafana Labs OTel rezoud anpil pwoblèm ki genyen nan "Oh gwo! kounye a nou kwense ak machann x epi li pral koute nou dè milyon de refactor tout kòd sa a" kòm opoze a "Oh, nou ap chanje fournisseurs? Cool, kite m 'jis mete ajou pwen final mwen an ..." Pou yo ka trè klè, OTel fè yon travay etonan nan rezoud pwoblèm sa a, ki se enkwayab nan pwòp dwa li yo. MEN... gen yon dezavantaj nan OTel ke moun pa remake touswit, si yo remake li ditou. Pwoblèm sa a fè pwoblèm anvan an vin pi mal. OTel pran tout done ou yo (mestik, mòso bwa, tras, ak rès la), kolekte yo, epi voye li kote ou vle li ale. Men, OTel pa toujou fè l yon fason ki efikas. Egzanp 1: boutèy demi lit mesaj Ann pran mesaj boutèy la anba a, ki soti tou dwat nan syslog. Wi, bon fin vye granmoun RFC 5424. Li te fèt nan ane 80 yo, estandadize an 2009, ak enkonteste "chatty kathy" nan pwotokòl mesaj rezo a. Mwen te wè rezo modès-gwosè jenere plis pase 4 milyon mesaj syslog pou chak èdtan. Pifò nan li te absoliman initil kondwit, lide ou. Men, mesaj sa yo te oblije ale yon kote epi yo dwe trete (oswa tonbe) pa kèk sistèm sou wout la. Li se youn nan rezon ki fè mwen te sijere yon syslog ak pèlen "sistèm filtraj" . depi fondamantalman pou tout tan Nit davwa sou volim mesaj sou kote, gen nan valè nan kèk nan mesaj sa yo, nan kèk pratik IT, kèk nan tan an. Se konsa, nou dwe konsidere (ak kolekte) yo tou. <134>1 2018-12-13T14:17:40.000Z myserver myapp 10 - [http_method="GET"; http_uri="/example"; http_version="1.1"; http_status="200"; client_addr="127.0.0.1"; http_user_agent="my.service/1.0.0"] HTTP request processed successfully Kòm-se, mesaj boutèy la se 228 bytes - apèn menm yon gout nan bokit la nan telemetrik ou kolekte chak minit, se pou kont li chak jou. Men, pou sa mwen pral fè, mwen vle yon reyèl konparezon pòm-a-pòm, kidonk men sa li ta sanble si mwen JSON-ify li: { "pri": 134, "version": 1, "timestamp": "2018-12-13T14:17:40.000Z", "hostname": "myserver", "appname": "myapp", "procid": 10, "msgid": "-", "structuredData": { "http_method": "GET", "http_uri": "/example", "http_version": "1.1", "http_status": "200", "client_addr": "127.0.0.1", "http_user_agent": "my.service/1.0.0" }, "message": "HTTP request processed successfully" } Sa monte chaj la jiska 336 octets san espas blan, oswa 415 bytes avèk. Koulye a, pou konparezon, isit la nan yon echantiyon OTLP Log mesaj: { "resource": { "service.name": "myapp", "service.instance.id": "10", "host.name": "myserver" }, "instrumentationLibrary": { "name": "myapp", "version": "1.0.0" }, "severityText": "INFO", "timestamp": "2018-12-13T14:17:40.000Z", "body": { "text": "HTTP request processed successfully" }, "attributes": { "http_method": "GET", "http_uri": "/example", "http_version": "1.1", "http_status": "200", "client_addr": "127.0.0.1", "http_user_agent": "my.service/1.0.0" } } Mesaj sa a (jenerik, minim) peze 420 bytes (san espas blan; li se 520 bytes tout enklizif). Li toujou piti, men menm si vèsyon an OTel ak espas blan an se 25% pi gwo pase mesaj JSON-ified (ak espas blan), ak plis pase de fwa pi gwo ke mesaj orijinal la. Yon fwa nou kòmanse aplike done mond reyèl la, bagay sa yo balon menm plis. Pwen mwen isit la se sa a: Si OTel fè sa nan chak mesaj boutèy demi lit, ti depans sa yo ajoute byen vit. Egzanp 2: Prometheus Li sanble ke metòd modèn nan jesyon metrik yo menm jan sansib a enflasyon. Yon metrik prometheus tipik, fòma nan JSON, se 291 byte. Men, menm metrik sa a konvèti nan fòma metrik OTLP peze nan 751 bytes. Se vre, OTLP gen yon fonksyon par ki diminye sa a, men sa sèlman ede ak transfè sou fil la. Yon fwa li rive nan destinasyon an, anpil (pa tout, men pifò) machann debatch anvan estoke, kidonk li tounen nan yo te 2.5 fwa pi gwo pase mesaj orijinal la. Jan zanmi mwen Josh Biggley te di, "2.5x mezi yo enjere pi byen gen yon istwa mèrdik etonan pou rakonte sou kontèks pou jistifye pri sa a." Se Pa Ou, Otel, Se Nou. (Men se ou menm tou) Si tout bagay sa yo santi yon ti kras hyper-kritik nan OTel, Lè sa a, tanpri ban m 'yon chans eksplike. Mwen onètman kwè ke OTel se yon avansman etonan ak nenpòt moun ki serye sou siveyans ak obsèvasyon bezwen adopte li kòm yon estanda - ki ale pou itilizatè yo kòm byen ke machann. Kapasite nan emèt galon nan mòso bwa, mezi, tras pandan w ap kenbe kontèks li yo, kèlkeswa destinasyon an, se anpil valè. (Men…) OTel te fèt pa (ak pou) enjenyè lojisyèl. Li soti nan epòk tan lontan sa a (ki mwen vle di "2016") lè nou te toujou plis konsène sou difikilte pou jwenn done yo pase pri pou deplase, trete, ak estoke li. OTel se, pa konsepsyon, partial nan volim. Blag nan tit seksyon sa a malgre, pwoblèm nan vrèman se pa OTel. Nou vreman fot. Espesyalman relasyon malsen nou an ak telemetri. Si nou ensiste pou kolekte epi transmèt chak pwen done, nou pa gen pèsonn ki blame eksepte tèt nou pou bòdwo syèl-wo nou resevwa nan fen mwa a. Èske done sa yo pote kè kontan? Li fasil pou w kite solisyon obsèvabilite w la fè gwo levée ak shunt chak octet nan done nan yon koòdone inifye. Li fasil fè si ou se yon enjenyè lojisyèl ki (nominalman omwen) posede solisyon siveyans ak obsèvabilite yo. Li pi fasil menm si ou se yon senp konsomatè sèvis sa yo, yon moun ki inosan. Moun ki tonbe nan kategori sa a gen ladan moun ki byen mare nan yon silo patikilye (baz done, depo, rezo, elatriye); oswa ekip asistans ak ekip NOC ki resevwa tikè yo epi ki bay sipò men ki pa patisipe nan enstrimantasyon an ni zouti enstriman an konekte ak yo; oswa ekip ki gen plis bezwen espesyalize ki poutan sipèpoze ak siveyans ak obsèvasyon, tankou sekirite enfòmasyon. Men, an n onèt, si ou se yon enjenyè sekirite, ki jan ou ka jistifye peye de fwa pri pou enjere mòso bwa oswa mezi, kont estanda yo parfe bon ki deja egziste e ki te sèvi byen pou ane? Èske sa vle di ou ta ka itilize plis pase yon zouti? Wi. Men, jan mwen te fè remake ( ak ak ak ak ak ankò) pa gen (e pa janm te, epi pa janm pral genyen) yon sèl-gwosè-adapte-tout solisyon. Ak nan pifò sitiyasyon pa gen menm yon sèl-gwosè-adapte-PLUS solisyon. Siveyans ak obsèvabilite te toujou sou aplikasyon etewojèn. Pi bonè ou anbrase ideyal sa a, pi bonè ou pral kòmanse bati ekosistèm obsèvabilite ki sèvi ak bezwen ou menm, ekip ou a ak biznis ou. tan tan tan tan tan tan Pou sa fini, gen yon diskisyon serye ROI yo dwe genyen anvan ou ale nan tout sou OTel oswa nenpòt solisyon observability. <EOF> (pou kounye a) Nou te wè mouvman nan pri pou chak chèz (oswa koòdone, oswa chasi, oswa CPU) nan yon modèl konsomasyon nan mache a nan tan lontan an. Epi nou te wè tou teknoloji deplase tounen (tankou fason sèvis selilè te deplase soti nan pou chak minit oswa pou chak tèks nan done san limit ak yon chaj pou chak mwa). Mwen sispèk nou ka wè yon pandil menm jan an balanse tounen ak siveyans ak obsèvabilite nan kèk tan nan tan kap vini an. Men, pou kounye a, nou dwe fè fas ak tou de sistèm nan pri dominan jan li egziste jodi a; ak pwòp fòs nou - ki fèt nan yon pwen diferan nan istwa a nan siveyans - kolekte, transmèt, ak estoke chak ti (ak byte) nan telemetrik ki pase anba nen nou an. Natirèlman, pri a se pa faktè a sèlman. Pèfòmans, risk, (ak plis ankò) bezwen konsidere. Men, nan kè a nan tout sa a se bezwen an trè reyèl pou nou kòmanse mande tèt nou: Kisa mwen pral fè ak done sa yo? Ki moun ki pral sèvi ak li? Konbyen tan mwen bezwen estoke li? Ak nan kou, ki moun ki lanfè a pral peye pou li?