paint-brush
Torolàlana ho an'ny Architect ho an'ny fiasan'ny fianarana milina sy fotodrafitrasa angon-drakitra ilainany@minio
141 HENOINA Tantara vaovao

Torolàlana ho an'ny Architect ho an'ny fiasan'ny fianarana milina sy fotodrafitrasa angon-drakitra ilaina

ny MinIO10m2024/09/05
Read on Terminal Reader

Lava loatra; Mamaky

MLOps dia fomba fanao sy fitaovana mikendry ny hamaly ny filana manokana ataon'ny injeniera amin'ny fananganana modely sy hampiroborobo azy ireo amin'ny famokarana. Ny fikambanana sasany dia manomboka amin'ny fitaovana an-trano vitsivitsy izay mamoaka ny angon-drakitra aorian'ny andrana tsirairay sy ny maodely fisavana aorian'ny vanim-potoanan'ny fiofanana. Fikambanana maro no nisafidy ny hampiasa fitaovana ara-dalàna izay manana fanaraha-maso andrana, endri-javatra fiaraha-miasa, fahaiza-manao modely amin'ny serivisy, ary na dia ny endri-tsolika aza.
featured image - Torolàlana ho an'ny Architect ho an'ny fiasan'ny fianarana milina sy fotodrafitrasa angon-drakitra ilaina
MinIO HackerNoon profile picture


MLOps, fanafohezana ny Machine Learning Operations, dia fomba fanao sy fitaovana mikendry ny hamaly ny filana manokana ataon'ny injeniera amin'ny fananganana modely sy mamindra azy ireo amin'ny famokarana. Ny fikambanana sasany dia manomboka amin'ny fitaovana an-trano vitsivitsy izay mamoaka angon-drakitra aorian'ny andrana tsirairay sy ny maodely fisavana isaky ny vanim-potoanan'ny fiofanana. Amin'ny lafiny iray, fikambanana maro no nisafidy ny hampiasa fitaovana ara-dalàna izay manana fanaraha-maso andrana, endri-javatra fiaraha-miasa, fahaiza-manao modely amin'ny serivisy, ary eny fa na dia ireo endri-tsofina amin'ny fanodinana angon-drakitra sy modely fanofanana aza.


Mba hanaovana safidy tsara indrindra ho an'ny fikambananao dia tokony ho azonao ny fahaiza-manao rehetra azo avy amin'ny fitaovana MLOps malaza amin'ny indostria. Raha mandeha amin'ny lalana an-trano ianao, dia tokony ho azonao ny fahaiza-manao avelanao. Ny fomba fanao an-trano dia tsara ho an'ny ekipa kely mila mihetsika haingana ary mety tsy manam-potoana hanombanana fitaovana vaovao. Raha misafidy ny hampihatra fitaovana avy amin'ny antoko fahatelo ianao dia mila mifidy ny fitaovana mifanaraka indrindra amin'ny fizotran'ny injenieran'ny fikambananao. Mety ho sarotra izany satria ny fitaovana ambony amin'izao fotoana izao dia miovaova be amin'ny fomba fiasa sy ny fahaizany. Na inona na inona safidinao, mila fotodrafitrasa angon-drakitra ianao izay afaka mitantana angon-drakitra be dia be ary manolotra andiana fiofanana amin'ny fomba mahomby. Ny maodely fanaraha-maso sy ny famoahana angon-drakitra lehibe dia mitaky fahaiza-manao azo ovaina, ary raha mampiasa GPU lafo ianao dia mila fotodrafitrasa mahomby hahazoana tombony betsaka amin'ny fampiasam-bola.


Amin'ity lahatsoratra ity dia hanolotra lisitry ny endri-javatra izay tokony hodinihin'ny architects aho na inona na inona fomba fiasa na fitaovana nofidiny. Ity lisitry ny endri-javatra ity dia avy amin'ny fikarohana nataoko sy ny fanandramana nataoko tamin'ny telo amin'ireo mpivarotra MLOps ambony indrindra ankehitriny - KubeFlow , MLflow , ary MLRun . Ho an'ny fikambanana izay nisafidy ny hanomboka amin'ny vahaolana an-trano dia hanolotra fotodrafitrasa angon-drakitra aho izay afaka mirefy sy manatanteraka. (Spoiler fanairana - ny hany ilainao eto dia MiniIO.) Raha ny momba ny fitaovana avy amin'ny antoko fahatelo, dia nahatsikaritra lamina miaraka amin'ireo mpivarotra nokarohiko. Ho an'ireo fikambanana izay misafidy ny hampiasa fitaovana MLOps, dia hanolotra ity lamina ity aho ary hamatotra azy amin'ny anay Modern Datalake Reference Architecture .


Alohan'ny hidirana amin'ny endri-javatra sy ny fepetra takian'ny fotodrafitrasa, andeha hojerentsika bebe kokoa ny maha-zava-dehibe ny MLOps. Mba hanaovana izany, tsara ny mampitaha ny famoronana modely amin'ny fampivoarana fampiharana mahazatra.

Ny maha samy hafa ny modely sy ny fampiharana

Ny fampivoarana fampiharana mahazatra, toy ny fampiharana microservice vaovao izay manampy endri-javatra vaovao amin'ny rindranasa iray, dia manomboka amin'ny famerenana famaritana iray. Ny rafitra angon-drakitra vaovao na ny fanovana amin'ny rafitra data efa misy dia natao voalohany. Tsy tokony hiova ny famolavolan'ny angona rehefa manomboka ny kaody. Ny serivisy dia ampiharina avy eo, ary ny fanodinana no asa lehibe indrindra amin'ity dingana ity. Misy kaody ihany koa ny fitsapana unit sy ny fitsapana faran'ny farany. Ireo fitsapana ireo dia manaporofo fa tsy diso ny kaody ary mampihatra tsara ny fepetra. Afaka mandeha ho azy amin'ny alàlan'ny fantsona CI/CD izy ireo alohan'ny hametrahana ny fampiharana manontolo.


Ny famoronana modely sy ny fampiofanana azy dia hafa. Ny dingana voalohany dia ny fahatakarana ny angona manta sy ny faminaniana ilaina. Ny injeniera ML dia tsy maintsy manoratra kaody sasany mba hampiharana ny tambajotran'izy ireo na hanangana algorithm, fa ny kaody dia tsy ny asa lehibe indrindra. Ny tena asa dia andrana miverimberina. Mandritra ny andrana dia hiova avokoa ny famolavolana ny angon-drakitra, ny famolavolana ny maodely ary ny mari-pamantarana ampiasaina. Aorian'ny andrana tsirairay, dia noforonina ny metrika izay mampiseho ny fomba fiasan'ilay modely rehefa nampiofanina. Ny metrika dia amboarina ihany koa mba hamaritana ny fahombiazan'ny maodely amin'ny andiany fanamarinana sy andiany fitsapana. Ireo metrika ireo dia ampiasaina hanaporofoana ny kalitaon'ny modely. Tokony hotehirizinao ny modely aorian'ny fanandramana rehetra, ary isaky ny manova ny angonao ianao dia tokony hotehirizinao koa izy ireo. Rehefa vonona ny hampidirina ao anaty fampiharana ny modely iray, dia tsy maintsy amboarina sy apetraka.


Raha fintinina, ny MLOps dia ny fianarana milina ny atao hoe DevOps amin'ny fampivoarana rindrambaiko nentim-paharazana. Samy andiana fanao sy fitsipika mikendry ny fanatsarana ny fiaraha-miasa eo amin'ny ekipa injeniera (ny Dev na ML) sy ny ekipan'ny IT operations (Ops). Ny tanjona dia ny hanamafisana ny tsingerin'ny fampandrosoana, manomboka amin'ny drafitra sy ny fampandrosoana ka hatramin'ny fametrahana sy ny fampandehanana, amin'ny fampiasana automatique. Iray amin'ireo tombontsoa voalohany amin'ireo fomba fiasa ireo ny fanatsarana mitohy.


Andao hiroso lalindalina kokoa amin'ny MLOps ary hijery ireo endri-javatra manokana hodinihina.

Endri-javatra 10 MLOps hodinihina

Ny fanaraha-maso sy ny fiaraha-miasa andrana no endri-javatra mifandray indrindra amin'ny MLOps, fa ny fitaovana MLOps maoderina kokoa ankehitriny dia afaka manao zavatra bebe kokoa. Ohatra, ny sasany dia afaka manome tontolo iainana ho an'ny fanandramanao. Ny hafa dia afaka mametaka sy mametraka modely rehefa vonona ny hampidirina ao anaty fampiharana.


Ity ambany ity ny superset amin'ny endri-javatra hita ao amin'ny fitaovana MLOps ankehitriny. Ity lisitra ity koa dia misy zavatra hafa tokony hodinihina, toy ny fanohanana sy fampidirana data.


  1. Fanohanana avy amin'ny mpilalao lehibe iray - Mivoatra hatrany ny teknika sy ny endri-javatra MLOps. Mila fitaovana tohanan'ny mpilalao lehibe ianao (Google, Databricks, na McKinsey ary Company back Kubeflow, MLflow, ary MLRun, tsirairay avy), miantoka ny fivoarana sy fanatsarana tsy tapaka. Ohatra mivaingana, fitaovana malaza maro ankehitriny no noforonina talohan'ny modely amin'ny fiteny lehibe (LLM); noho izany, maro no manampy endri-javatra vaovao hanohanana AI generative.


  2. Modern Datalake Integration - Ny andrana dia miteraka angona voarafitra sy tsy voarafitra. Ny fitaovana MLOps izay mitambatra tanteraka amin'ny Modern Datalake (na Data Lakehouse) dia mitahiry angona tsy voarindra ao amin'ny Farihy Data (MinIO mivantana izany), ary ny angona voarindra dia hiditra ao amin'ny Data Warehouse. Indrisy anefa fa fitaovana MLOps maro no teo alohan'ny Open Table Formats izay niteraka ny Modern Datalake, ka ny ankamaroany dia hanana vahaolana mitokana ho an'ny angon-drakitra voarafitra. Matetika izy io dia angon-drakitra mifandraika amin'ny loharano misokatra izay ilain'ny fotodrafitrasa angonao hanohanana. Mikasika ny angon-drakitra tsy voarafitra (datasets sy toeram-pisavana modely), ny fitaovana lehibe rehetra ao amin'ny indostria dia mampiasa MiniIO hatramin'ny nisiantsika hatramin'ny taona 2014.


  3. Fanaraha-maso ny andrana - Ny singa manan-danja indrindra amin'ny fitaovana MLOps dia ny fitazonana ny angon-drakitra, ny maodely, ny hyperparameter ary ny metrika isaky ny andrana. Ny fanaraha-maso ny andrana dia tokony hanamora ny fiverimberenana ihany koa - raha nahazo vokatra tsara ianao tamin'ny andrana dimy lasa izay ary nanimba ny fahombiazan'ny maodely ny andrana taorian'izay, dia tokony ho afaka mampiasa ny fitaovana MLOps ianao mba hiverenanao haka ireo hyperparameter marina, sy ireo endri-javatra ampiasaina. izay mamokatra vokatra irina.


  4. Manamora ny fiaraha-miasa — singa manan-danja amin'ny fitaovana MLOps ny vavahadin-tserasera na UI ampiasaina hanehoana ny valin'ny andrana tsirairay. Ity vavahadin-tserasera ity dia tokony ho azon'ny mpikambana rehetra ao amin'ny ekipa mba hahafahan'izy ireo mifankahita ny andrana sy manome soso-kevitra. Ny fitaovana MLOps sasany dia manana endri-tsary manaitra izay ahafahana mamorona kisary manokana mampitaha ny valin'ny andrana.


  5. Model Packaging - Ity fahaiza-manao ity dia mametaka modely izay azo idirana amin'ny tontolo fandaharana hafa - matetika amin'ny serivisy micro. Ity dia endri-javatra mahafinaritra ananana. Ny modely voaofana dia tsy inona fa zavatra serialized. Betsaka ny fikambanana mety efa nahalala izany.


  6. Model Serving - Raha vao voafono ho serivisy ny maodely, ity endri-javatra ity dia mamela ny fametrahana ho azy ny serivisy misy ny maodely amin'ny tontolo ara-dalànan'ny fikambanana. Tsy mila an'io endri-javatra io ianao raha manana a fantsona CI/CD matotra afaka mitantana ny fananana rindrambaiko rehetra manerana ny tontolo iainana.


  7. Rejistra Modely - Rejistra maodely dia manome fijery ny maodely rehetra eo ambany fitantanan'ny MLOps anao amin'izao fotoana izao. Rehefa dinihina tokoa, ny famoronana maodely kilasy famokarana no tanjon'ny MLOps rehetra. Ity fomba fijery ity dia tokony hampiseho ireo modely napetraka amin'ny famokarana ary koa ireo modely izay tsy nahatonga azy ho famokarana. Ireo modely nahatonga azy ho famokarana dia tokony hasiana marika amin'ny fomba ahafahanao mamaritra ny dikan'ny fampiharana na serivisy nametrahana azy ireo.


  8. Fampiasa tsy misy mpizara - Ny fitaovana sasany dia manome endri-javatra ahafahan'ny kaody atao an-tsoratra mba hahafahan'ny asa na maody azo apetraka ho serivisy voatahiry amin'ny fampandehanana andrana ao anaty cluster. Raha manapa-kevitra ny hampiasa an'io endri-javatra io ianao, dia ataovy izay hahazoana antoka fa mahazo aina amin'ity teknika ity ny injenieranao rehetra. Mety ho fomba fianarana kely izany - ny injeniera manana fiaviana DevOps dia hanana fotoana mora kokoa, raha toa kosa ireo injeniera izay nianatra tamin'ny masinina taloha izay manana traikefa kely amin'ny kaody dia hiady.


  9. Data Pipeline Capabilities - Ny fitaovana MLOps sasany dia mikendry ny hanome fahaiza-manao farany amin'ny farany ary manana endri-javatra manokana amin'ny fananganana fantsona angon-drakitra mba hakana ny angona manta, ny fanodinana azy ary ny fitehirizana angona madio. Pipelines dia matetika voatondro ho Directed Acyclic Graphs (DAGs) - Ny fitaovana sasany koa dia manana fahaiza-manao fandaharam-potoana. Rehefa ampiasaina miaraka amin'ny asa tsy misy mpizara dia mety ho vahaolana ambany-code mahery vaika amin'ny fampivoarana sy fampandehanana ny fantsona data. Tsy mila an'izany ianao raha efa mampiasa fantsona na fitaovana fiasana.


  10. Fampiofanana Pipeline Capabilities - Mitovitovy amin'ny fantsona angon-drakitra izany, fa ny fantsona fanofanana dia maka ny toerana hialana amin'ny fantsona data. Ny fantsona fanofanana dia ahafahanao miantso ny kaody fidirana amin'ny angonao, mandefa angona amin'ny lojika fanofananao, ary manisy sora-baventy angona sy maodely mba ho voatahiry ho azy ireo. Mitovy amin'ny fantsona angon-drakitra, ity endri-javatra ity dia azo ampiasaina miaraka amin'ireo fiasa tsy misy mpizara mba hamoronana DAG sy hanomanana andrana. Raha efa mampiasa fitaovana fanofanana zaraina ianao dia mety tsy mila an'io endri-javatra io. Azo atao ny manomboka fiofanana zaraina amin'ny fantsona fanofanana, saingy mety ho sarotra loatra izany.

MLOps sy fitahirizana

Rehefa avy nijery ny fahasamihafana misy eo amin'ny fampivoarana fampiharana nentim-paharazana sy ny fianarana milina, dia tokony hazava fa raha te hahomby amin'ny fianarana milina ianao dia mila endrika MLOps sy fotodrafitrasa angon-drakitra afaka manatanteraka sy mivelatra.


Tsara ny vahaolana homegrown raha mila manomboka tetikasa haingana ianao ary tsy manam-potoana hanombanana fitaovana MLOps ofisialy. Raha mandray an'io fomba io ianao, ny vaovao tsara dia ny hany ilainao amin'ny fotodrafitrasa angon-drakitrao dia MiniIO. Mifanaraka amin'ny S3 ny MiniIO ka raha nanomboka tamin'ny fitaovana hafa ianao ary nampiasa interface tsara S3 mba hidirana amin'ny angon-drakitrao, dia handeha fotsiny ny kaodinao. Raha vao manomboka ianao dia afaka mampiasa ny anay Python SDK , izay mifanaraka amin'ny S3 ihany koa. Eritrereto ny fampiasana ny dikan-tenin'ny orinasan'ny MiniIO, izay manana fahaiza-manao caching izay afaka manafaingana be ny fidirana angon-drakitra ho an'ny andiana fiofanana. Zahao hoe Ny tena antony mahatonga ny AI naorina amin'ny fitahirizana zavatra aiza no hidirantsika amin'ny fomba sy ny antony ampiasana ny MiniIO hanohanana ny MLOps. Ny fikambanana izay misafidy vahaolana ho an'ny firenena dia tokony mbola zatra amin'ireo endri-javatra folo voalaza etsy ambony. Mety hihoatra ny vahaolana an-trano ianao amin'ny farany, ary ny fomba mahomby indrindra dia ny fampiasana fitaovana MLOps.


Ny fampiasana fitaovana MLOps avy amin'ny antoko fahatelo no fomba tsara indrindra ho an'ny fikambanana lehibe miaraka amin'ny ekipa AI/ML maromaro mamorona modely amin'ny karazana samihafa. Ny fitaovana MLOps manana endri-javatra betsaka indrindra dia tsy voatery ho fitaovana tsara indrindra. Jereo ireo endri-javatra etsy ambony ary mariho ireo endri-javatra ilainao, ireo endri-javatra anananao amin'izao fotoana izao ao anatin'ny fantsona CI/CD misy anao, ary farany, ireo endri-javatra tsy tianao, izany dia hanampy anao hahita ny mety indrindra. Ny fitaovana MLOps dia manana faniriana mafy amin'ny petabytes lehibe amin'ny fitahirizana zavatra. Maro amin'izy ireo no mamadika ho azy ny angon-drakitrao isaky ny andrana ary manamarina ho azy ny maodely aorian'ny vanim-potoana tsirairay. Eto indray dia afaka manampy ny MiniIO satria tsy olana ny fahaiza-manao. Mitovy amin'ny vahaolana homegrown, diniho ny fampiasana ny fanontana orinasa an'ny MiniIO. Ny endri-javatra caching dia mandeha ho azy indray mandeha natokana ho an'ny siny ka na dia tsy mangataka ny fampiasana ny cache aza ny fitaovana MLOps - ny MiniIO dia hanao cache ho azy ireo zavatra idirana matetika toy ny seta fiofanana.

Lisitra ho an'ny ho avy

Maro amin'ireo fitaovana MLOps eny an-tsena amin'izao fotoana izao no mampiasa angon-drakitra mifandraika amin'ny loharano misokatra hitahiry ny angon-drakitra voarafitra mandritra ny fiofanana modely izay matetika metrika sy hyperparameters. Indrisy anefa fa angona vaovao mila tohanan'ny fikambananao ity. Fanampin'izany, raha misy fikambanana iray mandroso mankany amin'ny Modern Datalake (na Data Lakehouse) dia tsy ilaina ny angon-drakitra mifandraika fanampiny. Ny mety ho tsara ho an'ny mpivarotra MLOps lehibe hodinihina dia ny fampiasana trano fanatobiana angon-drakitra miorina amin'ny OTF hitahiry ny angon-drakitr'izy ireo.


Ny mpivarotra MLOps lehibe rehetra dia mampiasa MiniIO eo ambanin'ny saron-tava mba hitahiry angona tsy voarindra. Indrisy anefa fa amin'ny ankapobeny dia apetraka ho ohatra kely misaraka izay napetraka ho ampahany amin'ny fametrahana ny fitaovana MLOps amin'ny ankapobeny. Fanampin'izany, matetika dia dikan-teny taloha an'ny MiniIO izy io, izay mifanohitra amin'ny etosintsika amin'ny fampandehanana foana ny farany sy lehibe indrindra . Ho an'ny mpanjifa MiniIO efa misy, tsara ny mamela ny fitaovana MLOps hampiasa siny ao anatin'ny fametrahana efa misy. Ho an'ny mpanjifa vaovao amin'ny MiniIO, ny fitaovana MLOps dia tokony hanohana ny kinova farany an'ny MiniIO. Rehefa tafapetraka dia azo ampiasaina amin'ny tanjona ao anatin'ny fikambananao ankoatra ny loharanon'ny MLOps ny MiniIO, izany hoe na aiza na aiza ilaina ny tanjaky ny fitahirizana zavatra.

Famaranana

Ao amin'ity lahatsoratra ity, nanolotra torolalana ho an'ny mpanao mari-trano ho an'ny MLOps aho tamin'ny alalan'ny fanadihadiana ny endri-javatra MLOps sy ny fotodrafitrasa angon-drakitra ilaina hanohanana ireo endri-javatra ireo. Amin'ny ambaratonga ambony, ny fikambanana dia afaka manangana vahaolana an-trano, na afaka mametraka vahaolana avy amin'ny antoko fahatelo. Na inona na inona lalana nofidiana, zava-dehibe ny mahatakatra ny endri-javatra rehetra misy amin'ny indostria ankehitriny. Ny vahaolana homegrown dia ahafahanao manomboka tetikasa haingana, saingy mety tsy ho ela dia hihoatra ny vahaolanao ianao. Zava-dehibe ihany koa ny mahatakatra ny filanao manokana sy ny fomba fiasan'ny MLOps amin'ny fantsona CI/CD efa misy. Betsaka ny fitaovana MLOps no manankarena ary misy endri-javatra izay mety tsy ho ampiasainao mihitsy na efa anananao ao anatin'ny fantsona CI/CD anao.


Mba hampiharana am-pahombiazana ny MLOps dia mila fotodrafitrasa angon-drakitra afaka manohana azy ianao. Ato amin'ity lahatsoratra ity dia nanolotra vahaolana tsotra ho an'ireo izay nisafidy vahaolana an-trano aho ary nanoritsoritra ny zavatra andrasana amin'ny fitaovana an'ny antoko fahatelo sy ny loharano ilainy.


Nofaranako tamin'ny lisitry ny faniriana ho fampandrosoana bebe kokoa ny fitaovana MLOps izay hanampy azy ireo hifandray tsara kokoa amin'ny Modern Datalake.


Raha mila fanazavana fanampiny momba ny fampiasana ny Modern Datalake hanohanana ny entan'ny AI/ML dia jereo AI/ML ao anatin'ny Datalake maoderina .


Raha manana fanontaniana ianao dia aza misalasala mifandray aminay miraviravy !