paint-brush
არქიტექტორის გზამკვლევი მანქანათმცოდნეობის ოპერაციებისა და საჭირო მონაცემთა ინფრასტრუქტურისთვისმიერ@minio
2,460 საკითხავი
2,460 საკითხავი

არქიტექტორის გზამკვლევი მანქანათმცოდნეობის ოპერაციებისა და საჭირო მონაცემთა ინფრასტრუქტურისთვის

მიერ MinIO10m2024/09/05
Read on Terminal Reader

Ძალიან გრძელი; Წაკითხვა

MLOps არის პრაქტიკისა და ხელსაწყოების ერთობლიობა, რომელიც მიზნად ისახავს ინჟინრების სპეციფიკურ საჭიროებებს, რომლებიც ქმნიან მოდელებს და გადაიტანენ მათ წარმოებაში. ზოგიერთი ორგანიზაცია იწყებს რამდენიმე საშინაო ინსტრუმენტს, რომელიც ვერსიებს მონაცემთა ნაკრების ყოველი ექსპერიმენტის შემდეგ და გამშვები პუნქტის მოდელებს სწავლების ყოველი ეპოქის შემდეგ. ბევრმა ორგანიზაციამ აირჩია ფორმალური ინსტრუმენტის მიღება, რომელსაც აქვს ექსპერიმენტის თვალყურის დევნება, თანამშრომლობის მახასიათებლები, მოდელის მომსახურების შესაძლებლობები და მილსადენის მახასიათებლებიც კი.
featured image - არქიტექტორის გზამკვლევი მანქანათმცოდნეობის ოპერაციებისა და საჭირო მონაცემთა ინფრასტრუქტურისთვის
MinIO HackerNoon profile picture


MLOps, შემოკლებით Machine Learning Operations, არის პრაქტიკისა და ხელსაწყოების ერთობლიობა, რომელიც მიზნად ისახავს ინჟინრების სპეციფიკურ საჭიროებებს, რომლებიც ქმნიან მოდელებს და გადაიყვანენ მათ წარმოებაში. ზოგიერთი ორგანიზაცია იწყებს რამდენიმე საშინაო ინსტრუმენტს, რომელიც ვერსიებს მონაცემთა ნაკრების ყოველი ექსპერიმენტის შემდეგ და საკონტროლო პუნქტის მოდელებს სწავლების ყოველი ეპოქის შემდეგ. მეორეს მხრივ, ბევრმა ორგანიზაციამ აირჩია ფორმალური ინსტრუმენტის მიღება, რომელსაც აქვს ექსპერიმენტის თვალყურის დევნება, თანამშრომლობის მახასიათებლები, მოდელის სერვისის შესაძლებლობები და მილსადენის მახასიათებლებიც კი მონაცემთა დამუშავებისა და ტრენინგის მოდელებისთვის.


თქვენი ორგანიზაციისთვის საუკეთესო არჩევანის გასაკეთებლად, თქვენ უნდა გესმოდეთ ინდუსტრიის წამყვანი MLOps ინსტრუმენტების ყველა შესაძლებლობა. თუ თქვენ მიდიხართ მშობლიურ გზაზე, უნდა გესმოდეთ იმ შესაძლებლობებზე, რომლებსაც უარს ამბობთ. საშინაო მიდგომა კარგია მცირე გუნდებისთვის, რომლებსაც სჭირდებათ სწრაფად გადაადგილება და შესაძლოა არ ჰქონდეთ დრო ახალი ინსტრუმენტის შესაფასებლად. თუ აირჩევთ მესამე მხარის ხელსაწყოს დანერგვას, მაშინ უნდა აირჩიოთ ინსტრუმენტი, რომელიც საუკეთესოდ შეესაბამება თქვენი ორგანიზაციის საინჟინრო სამუშაო პროცესს. ეს შეიძლება იყოს სახიფათო, რადგან დღეს საუკეთესო ინსტრუმენტები მნიშვნელოვნად განსხვავდება მათი მიდგომით და შესაძლებლობებით. თქვენი არჩევანის მიუხედავად, დაგჭირდებათ მონაცემთა ინფრასტრუქტურა, რომელსაც შეუძლია დიდი მოცულობის მონაცემების დამუშავება და სავარჯიშო კომპლექტების შესრულება. გამშვები წერტილების მოდელები და დიდი მონაცემთა ნაკრების ვერსიირება მოითხოვს მასშტაბირებად სიმძლავრეს და თუ იყენებთ ძვირადღირებულ GPU-ს, დაგჭირდებათ ეფექტური ინფრასტრუქტურა, რომ მიიღოთ მაქსიმალური სარგებლობა თქვენი ინვესტიციიდან.


ამ პოსტში მე წარმოგიდგენთ ფუნქციების ჩამონათვალს, რომელიც არქიტექტორებმა უნდა განიხილონ, მიუხედავად მათი არჩეული მიდგომისა და ხელსაწყოებისა. ეს ფუნქციების სია მომდინარეობს ჩემი კვლევისა და ექსპერიმენტებიდან დღეს MLOps-ის სამ საუკეთესო მომწოდებელთან - KubeFlow , MLflow , და MLRun . ორგანიზაციებისთვის, რომლებმაც აირჩიეს დაიწყონ საშინაო გადაწყვეტილებით, მე წარმოგიდგენთ მონაცემთა ინფრასტრუქტურას, რომელსაც შეუძლია მასშტაბირება და შესრულება. (სპოილერის გაფრთხილება - ყველაფერი რაც თქვენ გჭირდებათ აქ არის MinIO.) რაც შეეხება მესამე მხარის ინსტრუმენტებს, მე შევამჩნიე ნიმუში მომწოდებლებთან, რომლებიც გამოვიკვლიე. ორგანიზაციებისთვის, რომლებიც აირჩევენ MLOps-ის ინსტრუმენტების გამოყენებას, მე წარმოგიდგენთ ამ შაბლონს და დავუკავშირებ მას ჩვენთან თანამედროვე Datalake Reference Architecture .


სანამ ჩავუღრმავდებით ფუნქციებსა და ინფრასტრუქტურის მოთხოვნებს, უკეთ გავიგოთ MLOps-ის მნიშვნელობა. ამისათვის სასარგებლოა მოდელის შექმნის შედარება ჩვეულებრივი აპლიკაციის შემუშავებასთან.

განსხვავება მოდელებსა და აპლიკაციებს შორის

ჩვეულებრივი აპლიკაციის შემუშავება, ისევე როგორც ახალი მიკროსერვისის დანერგვა, რომელიც ამატებს ახალ ფუნქციას აპლიკაციას, იწყება სპეციფიკაციის განხილვით. თავდაპირველად შექმნილია მონაცემთა ახალი სტრუქტურები ან ცვლილებები არსებული მონაცემთა სტრუქტურებში. მონაცემთა დიზაინი არ უნდა შეიცვალოს კოდირების დაწყებისთანავე. შემდეგ სერვისი დანერგილია და კოდირება არის მთავარი აქტივობა ამ პროცესში. ერთეული ტესტები და ბოლოდან ბოლომდე ტესტები ასევე კოდირებულია. ეს ტესტები ადასტურებს, რომ კოდი არ არის გაუმართავი და სწორად ახორციელებს სპეციფიკაციას. მათი ავტომატური გაშვება შესაძლებელია CI/CD მილსადენით მთელი აპლიკაციის განთავსებამდე.


მოდელის შექმნა და მისი სწავლება განსხვავებულია. პირველი ნაბიჯი არის ნედლეული მონაცემების გაგება და საჭირო პროგნოზი. ML ინჟინრებს უნდა დაწერონ გარკვეული კოდი, რათა განახორციელონ თავიანთი ნერვული ქსელები ან დააყენონ ალგორითმი, მაგრამ კოდირება არ არის დომინანტური აქტივობა. ძირითადი აქტივობა არის განმეორებითი ექსპერიმენტი. ექსპერიმენტების დროს შეიცვლება მონაცემების დიზაინი, მოდელის დიზაინი და გამოყენებული პარამეტრები. ყოველი ექსპერიმენტის შემდეგ იქმნება მეტრიკა, რომელიც აჩვენებს, თუ როგორ ასრულებდა მოდელმა ვარჯიში. მეტრიკა ასევე იქმნება მოდელის მუშაობის დასადგენად ვალიდაციის ნაკრებისა და ტესტის ნაკრების მიმართ. ეს მეტრიკა გამოიყენება მოდელის ხარისხის დასამტკიცებლად. თქვენ უნდა შეინახოთ მოდელი ყოველი ექსპერიმენტის შემდეგ და ყოველ ჯერზე, როდესაც შეცვლით თქვენს მონაცემთა ნაკრებებს, უნდა შეინახოთ ისინიც. მას შემდეგ, რაც მოდელი მზად იქნება აპლიკაციაში ჩასართავად, ის უნდა იყოს შეფუთული და განლაგებული.


რომ შევაჯამოთ, MLOps არის მანქანური სწავლება, თუ რა არის DevOps ტრადიციული პროგრამული უზრუნველყოფის შემუშავებისთვის. ორივე არის პრაქტიკისა და პრინციპების ერთობლიობა, რომელიც მიზნად ისახავს საინჟინრო გუნდებს (Dev ან ML) და IT ოპერაციების (Ops) გუნდებს შორის თანამშრომლობის გაუმჯობესებას. მიზანია განვითარების სასიცოცხლო ციკლის გამარტივება, დაგეგმვისა და განვითარებისგან განლაგებამდე და ოპერაციებამდე, ავტომატიზაციის გამოყენებით. ამ მიდგომების ერთ-ერთი მთავარი უპირატესობა მუდმივი გაუმჯობესებაა.


მოდით, ცოტა უფრო ღრმად შევიდეთ MLO-ებში და გადავხედოთ კონკრეტულ მახასიათებლებს, რომლებიც გასათვალისწინებელია.

10 MLOps თვისება გასათვალისწინებელია

ექსპერიმენტების თვალყურის დევნება და თანამშრომლობა არის ის ფუნქციები, რომლებიც ყველაზე მეტად ასოცირდება MLOps-თან, მაგრამ დღევანდელი უფრო თანამედროვე MLOps ინსტრუმენტებს ბევრად მეტის გაკეთება შეუძლიათ. მაგალითად, ზოგიერთს შეუძლია უზრუნველყოს გაშვების გარემო თქვენი ექსპერიმენტებისთვის. სხვებს შეუძლიათ შეფუთონ და განათავსონ მოდელები, როდესაც ისინი მზად იქნებიან აპლიკაციაში ინტეგრირებისთვის.


ქვემოთ მოცემულია ფუნქციების სუპერკომპლექტი, რომლებიც დღეს გვხვდება MLOps ინსტრუმენტებში. ეს სია ასევე შეიცავს გასათვალისწინებელ სხვა საკითხებს, როგორიცაა მხარდაჭერა და მონაცემთა ინტეგრაცია.


  1. ძირითადი მოთამაშის მხარდაჭერა - MLOps-ის ტექნიკა და ფუნქციები მუდმივად ვითარდება. თქვენ გჭირდებათ ინსტრუმენტი, რომელსაც მხარს უჭერს ძირითადი მოთამაშე (Google, Databricks, ან McKinsey და Company მხარს უჭერს Kubeflow, MLflow და MLRun, შესაბამისად), რაც უზრუნველყოფს მუდმივ განვითარებას და გაუმჯობესებას. როგორც კონკრეტული მაგალითი, დღეს ბევრი პოპულარული ინსტრუმენტი შეიქმნა დიდი ენის მოდელებამდე (LLM); შესაბამისად, ბევრი ამატებს ახალ ფუნქციებს გენერაციული AI-ს მხარდასაჭერად.


  2. თანამედროვე Datalake ინტეგრაცია - ექსპერიმენტები წარმოქმნის უამრავ სტრუქტურირებულ და არასტრუქტურირებულ მონაცემს. MLOps ინსტრუმენტი, რომელიც სრულყოფილად არის ინტეგრირებული თანამედროვე Datalake-თან (ან Data Lakehouse) ინახავს არასტრუქტურირებულ მონაცემებს მონაცემთა ტბაში (ეს არის უშუალოდ MinIO) და სტრუქტურირებული მონაცემები შევა მონაცემთა საწყობში. სამწუხაროდ, MLOps-ის მრავალი ინსტრუმენტი არსებობდა ღია ცხრილის ფორმატებამდე, რამაც გამოიწვია თანამედროვე Datalake, ამიტომ უმეტესობას ექნება ცალკე გადაწყვეტა მათი სტრუქტურირებული მონაცემებისთვის. ეს არის, როგორც წესი, ღია წყაროს ურთიერთობითი მონაცემთა ბაზა, რომლის მხარდაჭერაც თქვენს მონაცემთა ინფრასტრუქტურას დასჭირდება. არასტრუქტურირებულ მონაცემებთან დაკავშირებით (მონაცემთა ნაკრები და მოდელის გამშვები პუნქტები), ინდუსტრიის ყველა ძირითადი ინსტრუმენტი იყენებს MinIO-ს, რადგან ჩვენ 2014 წლიდან ვართ.


  3. ექსპერიმენტის თვალყურის დევნება - MLOps ხელსაწყოს ალბათ ყველაზე მნიშვნელოვანი მახასიათებელია მონაცემთა ნაკრების, მოდელების, ჰიპერპარამეტრების და მეტრიკის თვალყურის დევნება თითოეული ექსპერიმენტისთვის. ექსპერიმენტის თვალყურის დევნება ასევე უნდა გააადვილოს განმეორებადობა - თუ თქვენ მიიღე სასურველი შედეგი ხუთი ექსპერიმენტის წინ და შემდგომმა ექსპერიმენტებმა შეამცირა თქვენი მოდელის შესრულება, მაშინ თქვენ უნდა შეგეძლოთ გამოიყენოთ თქვენი MLOps ინსტრუმენტი უკან დასაბრუნებლად და მიიღოთ ზუსტი ჰიპერპარამეტრები და გამოყენებული მონაცემთა ფუნქციები. რაც სასურველ შედეგს იძლევა.


  4. თანამშრომლობის ხელშეწყობა — MLOps ინსტრუმენტის მნიშვნელოვანი კომპონენტია პორტალი ან ინტერფეისი, რომელიც გამოიყენება თითოეული ექსპერიმენტის შედეგების წარმოსაჩენად. ეს პორტალი ხელმისაწვდომი უნდა იყოს გუნდის ყველა წევრისთვის, რათა მათ ნახონ ერთმანეთის ექსპერიმენტები და გაუკეთონ რეკომენდაციები. MLOps-ის ზოგიერთ ინსტრუმენტს აქვს ლამაზი გრაფიკული ფუნქციები, რომლებიც საშუალებას გაძლევთ შექმნათ ინდივიდუალური გრაფიკები ექსპერიმენტების შედეგების შედარების მიზნით.


  5. მოდელის შეფუთვა - ეს შესაძლებლობა აერთიანებს მოდელს ისე, რომ იგი ხელმისაწვდომი იყოს სხვა პროგრამირების გარემოდან - როგორც წესი, მიკროსერვისის სახით. ეს კარგი თვისებაა. გაწვრთნილი მოდელი სხვა არაფერია, თუ არა სერიული ობიექტი. ბევრ ორგანიზაციას შეიძლება ეს უკვე გაერკვია.


  6. მოდელის სერვისი - როგორც კი მოდელი შეფუთულია სერვისად, ეს ფუნქცია საშუალებას მისცემს მოდელის შემცველი სერვისის ავტომატიზირებულ განთავსებას ორგანიზაციის ფორმალურ გარემოში. თქვენ არ დაგჭირდებათ ეს ფუნქცია, თუ გაქვთ მწიფე CI/CD მილსადენი შეუძლია მართოს ყველა პროგრამული აქტივი სხვადასხვა გარემოში.


  7. მოდელის რეესტრი - მოდელის რეესტრი უზრუნველყოფს ხედვას ყველა იმ მოდელის შესახებ, რომელიც ამჟამად მართულია თქვენი MLOps ინსტრუმენტის მიერ. ყოველივე ამის შემდეგ, წარმოების კლასის მოდელების შექმნა ყველა MLO-ის მიზანია. ეს ხედვა უნდა აჩვენოს მოდელებს, რომლებიც გამოიყენეს წარმოებაში, ისევე როგორც მოდელები, რომლებიც არასოდეს გამოსულა წარმოებაში. მოდელები, რომლებიც წარმოებაში შევიდა, უნდა იყოს მონიშნული ისე, რომ თქვენ ასევე შეგიძლიათ განსაზღვროთ აპლიკაციის ან სერვისის ვერსია, რომელშიც ისინი განლაგებულია.


  8. სერვერის გარეშე ფუნქციები - ზოგიერთი ინსტრუმენტი იძლევა ფუნქციებს, რომლებიც საშუალებას აძლევს კოდის ანოტაციას ისე, რომ ფუნქცია ან მოდული შეიძლება განთავსდეს კონტეინერულ სერვისად ექსპერიმენტების კლასტერში გასაშვებად. თუ გადაწყვეტთ ამ ფუნქციის გამოყენებას, მაშინ დარწმუნდით, რომ თქვენი ყველა ინჟინერი კომფორტულია ამ ტექნიკით. ეს შეიძლება იყოს ცოტა სწავლის მრუდი - DevOps-ის ფონის ინჟინრებს გაუადვილდებათ დრო, ხოლო ინჟინრები, რომლებიც ადრე სწავლობდნენ მანქანურ სწავლებას მცირე კოდირების გამოცდილებით, გაუჭირდებათ.


  9. მონაცემთა მილსადენის შესაძლებლობები - ზოგიერთი MLOps ინსტრუმენტები მიზნად ისახავს უზრუნველყოს სრული შესაძლებლობების მიწოდება და აქვს ფუნქციები, რომლებიც სპეციფიკურია მონაცემთა მილსადენების მშენებლობისთვის, ნედლეული მონაცემების მოსაპოვებლად, დამუშავებისა და სუფთა მონაცემების შესანახად. მილსადენები ჩვეულებრივ მითითებულია როგორც მიმართული აციკლური გრაფიკები (DAGs) - ზოგიერთ ინსტრუმენტს ასევე აქვს დაგეგმვის შესაძლებლობები. სერვერის გარეშე ფუნქციებთან ერთად გამოყენებისას, ეს შეიძლება იყოს ძლიერი დაბალი კოდის გადაწყვეტა მონაცემთა მილსადენების შემუშავებისა და გაშვებისთვის. ეს არ დაგჭირდებათ, თუ უკვე იყენებთ მილსადენს ან სამუშაო პროცესის ხელსაწყოს.


  10. ტრენინგის მილსადენის შესაძლებლობები - ეს მონაცემთა მილსადენების მსგავსია, მაგრამ სასწავლო მილსადენი იწყება იქ, სადაც მონაცემთა მილსადენები ჩერდება. სასწავლო მილსადენი საშუალებას გაძლევთ გამოძახოთ თქვენი მონაცემების წვდომის კოდი, გაგზავნოთ მონაცემები თქვენს სასწავლო ლოგიკაში და დაწეროთ მონაცემების არტეფაქტები და მოდელები ისე, რომ ისინი ავტომატურად შეინახონ. მონაცემთა მილსადენების მსგავსად, ეს ფუნქცია შეიძლება გამოყენებულ იქნას სერვერის გარეშე ფუნქციებთან ერთად DAG-ების შესაქმნელად და ექსპერიმენტების დაგეგმვისთვის. თუ თქვენ უკვე იყენებთ განაწილებულ სასწავლო ხელსაწყოს, მაშინ ეს ფუნქცია შეიძლება არ დაგჭირდეთ. შესაძლებელია განაწილებული ტრენინგის დაწყება სასწავლო მილსადენიდან, მაგრამ ეს შეიძლება იყოს ძალიან რთული.

MLOps და საცავი

ტრადიციული აპლიკაციების შემუშავებასა და მანქანათმცოდნეობას შორის განსხვავებების გადახედვის შემდეგ, ცხადი უნდა იყოს, რომ მანქანური სწავლებისას წარმატებული იყოთ, გჭირდებათ MLOps-ის გარკვეული ფორმა და მონაცემთა ინფრასტრუქტურა, რომელსაც შეუძლია შესრულება და მასშტაბირებადი სიმძლავრე.


საშინაო გადაწყვეტილებები კარგია, თუ გჭირდებათ პროექტის სწრაფად დაწყება და არ გაქვთ დრო, რომ შეაფასოთ ოფიციალური MLOps ინსტრუმენტი. თუ თქვენ მიიღებთ ამ მიდგომას, კარგი ამბავი ის არის, რომ ყველაფერი რაც თქვენ გჭირდებათ თქვენი მონაცემთა ინფრასტრუქტურისთვის არის MinIO. MinIO არის S3 თავსებადი, ასე რომ, თუ დაიწყეთ სხვა ხელსაწყოთი და გამოიყენეთ S3 ინტერფეისი თქვენს მონაცემთა ნაკრებებში წვდომისთვის, მაშინ თქვენი კოდი იმუშავებს. თუ თქვენ იწყებთ, შეგიძლიათ გამოიყენოთ ჩვენი პითონის SDK , რომელიც ასევე თავსებადია S3-თან. იფიქრეთ MinIO-ს საწარმოს ვერსიის გამოყენებაზე, რომელსაც აქვს ქეშირების შესაძლებლობები, რომელსაც შეუძლია მნიშვნელოვნად დააჩქაროს მონაცემთა წვდომა სასწავლო კომპლექტებზე. შეამოწმეთ რეალური მიზეზები, რის გამოც AI აგებულია ობიექტების შენახვაზე სადაც ჩვენ ვისაუბრებთ იმაზე, თუ როგორ და რატომ გამოიყენება MinIO MLO-ების მხარდასაჭერად. ორგანიზაციები, რომლებიც ირჩევენ საშინაო გადაწყვეტას, ჯერ კიდევ უნდა გაეცნონ ზემოთ აღწერილი ათი მახასიათებლებს. თქვენ შეიძლება საბოლოოდ გაიზარდოთ თქვენი სახლის გადაწყვეტა და ყველაზე ეფექტური გზაა MLOps ინსტრუმენტის მიღება.


მესამე მხარის MLOps ინსტრუმენტის მიღება საუკეთესო გზაა მსხვილი ორგანიზაციებისთვის, სადაც რამდენიმე AI/ML გუნდი ქმნის სხვადასხვა ტიპის მოდელებს. MLOps ინსტრუმენტი, რომელსაც აქვს ყველაზე მეტი ფუნქცია, სულაც არ არის საუკეთესო ინსტრუმენტი. შეხედეთ ზემოთ მოცემულ მახასიათებლებს და გაითვალისწინეთ თქვენთვის საჭირო ფუნქციები, ფუნქციები, რომლებიც ამჟამად გაქვთ, როგორც თქვენი არსებული CI/CD მილსადენის ნაწილი, და ბოლოს, ის ფუნქციები, რომლებიც არ გსურთ, ეს დაგეხმარებათ იპოვოთ საუკეთესო მორგება. MLOps ინსტრუმენტებს აქვთ დიდი მადა ობიექტების შენახვის დიდი პეტაბაიტისთვის. ბევრი მათგანი ავტომატურად ახდენს თქვენი მონაცემთა ნაკრების ვერსიებს ყოველ ექსპერიმენტთან ერთად და ავტომატურად აკონტროლებს თქვენს მოდელებს ყოველი ეპოქის შემდეგ. აქ კიდევ ერთხელ, MinIO დაგეხმარებათ, რადგან სიმძლავრე არ არის პრობლემა. საშინაო გადაწყვეტის მსგავსად, გამოიყენეთ MinIO-ს საწარმოს გამოცემა. ქეშირების ფუნქციები ავტომატურად მუშაობს თაიგულისთვის კონფიგურაციის შემდეგ, ასე რომ, მიუხედავად იმისა, რომ MLOps ინსტრუმენტი არ ითხოვს ქეშის გამოყენებას - MinIO ავტომატურად ჩაატარებს ხშირად წვდომას ობიექტებს, როგორიცაა სასწავლო ნაკრები.

სურვილების სია მომავლისთვის

დღეს ბაზარზე არსებული MLOps-ის მრავალი ინსტრუმენტი იყენებს ღია კოდის ურთიერთობით მონაცემთა ბაზას მოდელის ტრენინგის დროს წარმოქმნილი სტრუქტურირებული მონაცემების შესანახად, რომელიც ჩვეულებრივ არის მეტრიკა და ჰიპერპარამეტრები. სამწუხაროდ, ეს იქნება ახალი მონაცემთა ბაზა, რომელსაც თქვენი ორგანიზაციის მხარდაჭერა სჭირდება. გარდა ამისა, თუ ორგანიზაცია მოძრაობს თანამედროვე Datalake-ის (ან Data Lakehouse)კენ, მაშინ დამატებითი რელაციური მონაცემთა ბაზა არ არის საჭირო. რაც კარგი იქნება MLOps-ის ძირითადი მომწოდებლებისთვის განიხილონ, არის OTF-ზე დაფუძნებული მონაცემთა საწყობის გამოყენება მათი სტრუქტურირებული მონაცემების შესანახად.


MLOps-ის ყველა მთავარი გამყიდველი იყენებს MinIO-ს ქუდის ქვეშ არასტრუქტურირებული მონაცემების შესანახად. სამწუხაროდ, ეს ჩვეულებრივ განლაგებულია, როგორც ცალკეული მცირე ინსტანცია, რომელიც დაინსტალირებულია, როგორც MLOps ინსტრუმენტის საერთო უფრო დიდი ინსტალაციის ნაწილი. გარდა ამისა, ეს არის, როგორც წესი, MinIO-ს ძველი ვერსია, რომელიც ეწინააღმდეგება ჩვენს ეთიკას, რომ ყოველთვის ვმართოთ უახლესი და უდიდესი . არსებული MinIO მომხმარებლებისთვის კარგი იქნებოდა MLOps ინსტრუმენტს მიეცეთ საშუალება, გამოიყენოს bucket არსებული ინსტალაციის ფარგლებში. MinIO-ს ახალი მომხმარებლებისთვის, MLOps ხელსაწყოს მხარდაჭერა უნდა ჰქონდეს MinIO-ს უახლეს ვერსიას. ინსტალაციის შემდეგ, MinIO ასევე შეიძლება გამოყენებულ იქნას თქვენი ორგანიზაციის მიზნებისთვის MLOps რესურსების მიღმა, კერძოდ ყველგან, სადაც საჭიროა ობიექტების შენახვის სიძლიერე.

დასკვნა

ამ პოსტში მე წარმოვადგინე MLOps-ის არქიტექტორის სახელმძღვანელო, როგორც MLOps-ის მახასიათებლების, ასევე მონაცემთა ინფრასტრუქტურის გამოკვლევით, რომელიც საჭიროა ამ მახასიათებლების მხარდასაჭერად. მაღალ დონეზე, ორგანიზაციებს შეუძლიათ შექმნან შიდა გადაწყვეტა, ან მათ შეუძლიათ განათავსონ მესამე მხარის გადაწყვეტა. არჩეული მიმართულების მიუხედავად, მნიშვნელოვანია გვესმოდეს დღეს ინდუსტრიაში არსებული ყველა მახასიათებელი. საშინაო გადაწყვეტილებები საშუალებას გაძლევთ სწრაფად დაიწყოთ პროექტი, მაგრამ შესაძლოა მალე გადააჭარბოთ თქვენს გადაწყვეტილებას. ასევე მნიშვნელოვანია თქვენი კონკრეტული საჭიროებების გაგება და როგორ იმუშავებს MLOps არსებულ CI/CD მილსადენთან. MLOps-ის მრავალი ინსტრუმენტი მდიდარია ფუნქციებით და შეიცავს ფუნქციებს, რომლებიც შეიძლება არასოდეს გამოიყენოთ ან რომლებიც უკვე გაქვთ, როგორც თქვენი CI/CD მილსადენის ნაწილი.


MLOps-ის წარმატებით განსახორციელებლად, გჭირდებათ მონაცემთა ინფრასტრუქტურა, რომელსაც შეუძლია მისი მხარდაჭერა. ამ პოსტში მე წარმოვადგინე მარტივი გამოსავალი მათთვის, ვინც აირჩია საშინაო გადაწყვეტა და აღვწერე თუ რას უნდა ველოდოთ მესამე მხარის ხელსაწყოებისგან და მათ საჭირო რესურსებისგან.


მე დავასრულე MLOps-ის ინსტრუმენტების შემდგომი განვითარების სურვილების სიით, რომელიც დაეხმარება მათ თანამედროვე Datalake-თან უკეთ ინტეგრირებაში.


დამატებითი ინფორმაციისთვის თანამედროვე Datalake-ის გამოყენების შესახებ AI/ML დატვირთვის მხარდასაჭერად, იხილეთ AI/ML თანამედროვე დატალაკში .


თუ თქვენ გაქვთ რაიმე შეკითხვები, აუცილებლად დაგვიკავშირდით სუსტი !

L O A D I N G
. . . comments & more!

About Author

MinIO HackerNoon profile picture
MinIO@minio
MinIO is a high-performance, cloud-native object store that runs anywhere (public cloud, private cloud, colo, onprem).

დაკიდეთ ტეგები

ეს სტატია იყო წარმოდგენილი...