paint-brush
Энгийн эхлэл: Машины сургалтын үндсэн загваруудын стратегийн давуу талby@kustarev
68,754 уншилтууд
68,754 уншилтууд

Энгийн эхлэл: Машины сургалтын үндсэн загваруудын стратегийн давуу тал

by Andrey Kustarev7m2024/05/01
Read on Terminal Reader
Read this story w/o Javascript

Хэтэрхий урт; Унших

Энгийн суурь загварыг нэвтрүүлэх замаар машин сургалтын төслүүдээ эхлүүлэх нь зөвхөн урьдчилсан алхам биш юм. Энэ бол стратеги юм. Үр ашиг, үр дүнтэй байдал, дасан зохицох чадварыг дэмждэг Agile арга зүйд нийцсэн стратеги. Энэ нь жишиг үзүүлэлтүүдийг тогтоох, үр дүнгээ нэмэгдүүлэхийн зэрэгцээ үргүй зардал гаргахад тусалдаг ба загварын цаадах логикийн энгийн тайлбарыг өгч, үе шаттайгаар турших, баталгаажуулах боломжийг олгодог.

Coin Mentioned

Mention Thumbnail
featured image - Энгийн эхлэл: Машины сургалтын үндсэн загваруудын стратегийн давуу тал
Andrey Kustarev HackerNoon profile picture

Машин сургалтын шинэ төслийг эхлүүлэх нь урам зоригийг авчирдаг бөгөөд энэ нь шууд гүнзгий төгсгөл рүү үсрэх сонирхолтой байж магадгүй юм. Таны уншсан байж болох хамгийн сүүлийн үеийн загварууд эсвэл нарийн төвөгтэй алгоритмууд олон байна. Тэд шинэ үр дүнг амлаж байгаа бөгөөд тэдэнтэй шууд туршилт хийх уруу таталтаас зайлсхийх нь хэцүү ажил юм.


Орчин үеийн аливаа бизнес эрхлэгч хамгийн сүүлийн үеийн техникийг туршиж, олон нийтэд боловсронгуй (болон амжилттай) төслүүдээ харуулахыг хүсдэг. Гэсэн хэдий ч энэхүү урам зориг нь сайн хэдий ч заримдаа гиперпараметрийг нарийн тохируулах, нарийн төвөгтэй загваруудыг хэрэгжүүлэхэд бэрхшээлтэй тулгарах үед ихээхэн цаг зарцуулдаг.


Энэ үйл явцад асуух ёстой нэг гол асуулт байна: Бид загварынхаа үр нөлөөг бодитоор хэрхэн хэмжих вэ?


Манай загварын нарийн төвөгтэй байдал үндэслэлтэй эсэх, эсвэл гүйцэтгэл нь үнэхээр давуу эсэхийг олж мэдэх нь хэцүү байж болно. Энэ нь илүү энгийн лавлах цэг байхгүй үед тохиолддог. Энд суурь загвартай байх нь маш чухал болж байна. Суурь шугам нь энэ чухал лавлах цэгийг өгдөг - энэ нь энгийн, хурдан бүтээх, мөн угаасаа тайлбарлах боломжтой. Гайхалтай нь ихэвчлэн хөгжүүлэлтийн нийт хүчин чармайлтын 10%-ийг л зарцуулдаг суурь загвар нь хүссэн гүйцэтгэлийн 90%-д хүрч, боломжийн үр дүнд хүрэх өндөр үр ашигтай замыг бий болгодог.


Энгийнээс эхлэх санаа нь зөвхөн эхлэгчдэд зориулсан хялбар арга биш бөгөөд энэ нь өгөгдлийн шинжлэх ухааны карьерын бүх үе шатанд хамааралтай хэвээр байх үндсэн практик юм. Энэ нь ойлгомжтой, ойлгоход хялбар, удирдах боломжтой шийдлүүдийн практик талуудтай нарийн төвөгтэй байдлын хүсэл тэмүүллийг тэнцвэржүүлэх үндсэн механизм бөгөөд агуу сануулга юм.

Суурь загваруудыг ойлгох

Үндсэн загвар нь асуудлыг шийдвэрлэхэд ашигладаг хамгийн энгийн хувилбар юм. Ихэвчлэн эдгээр загварууд нь тасралтгүй үр дүнгийн шугаман регресс эсвэл категорийн үр дүнгийн логистик регрессийг агуулдаг. Жишээлбэл, шугаман регресс нь үнийн түүхэн мэдээлэлд үндэслэн хувьцааны өгөөжийг урьдчилан таамаглах боломжтой бол логистик регресс нь зээл хүсэгчийг өндөр эсвэл бага эрсдэлтэй гэж ангилж болно.


Энэ арга нь мэдрэлийн сүлжээ эсвэл ансамблийн аргууд гэх мэт илүү төвөгтэй загваруудаас ялгаатай бөгөөд энэ нь хүчирхэг хэдий ч нарийн төвөгтэй байдал, тооцооллын ихээхэн нөөцийн улмаас асуудлыг ойлгоход хэцүү болгож, боловсруулахад шаардагдах хугацааг нэмэгдүүлдэг.

Суурь загвараас эхлэхийн ашиг тус

Бенчмаркинг

Бенчмаркинг нь аливаа ML загварыг хөгжүүлэх маш чухал эхний алхам юм. Суурь загварыг бий болгохдоо та дараа нь гарч ирэх бүх загварууд (ихэвчлэн илүү төвөгтэй байдаг) тэдгээрийн нарийн төвөгтэй байдал, нөөцийн зарцуулалтыг зөвтгөхийн тулд давж гарах ёстой гүйцэтгэлийн үндсэн хэмжүүрийг бий болгодог. Энэ үйл явц нь эрүүл саруул байдлын маш сайн шалгалт төдийгүй таны хүлээлтийг үндэслэж, ахиц дэвшлийн тодорхой хэмжүүрийг өгдөг.


Жишээлбэл, энгийн хөдөлгөөнт дундажийг (SMA) суурь үзүүлэлт болгон ашиглан санхүүгийн зах зээлийн чиг хандлагыг урьдчилан таамаглах загвар боловсруулж байна гэж төсөөлөөд үз дээ. Энэхүү SMA нь зах зээлийн хөдөлгөөнийг зөв таамаглахад 60% -ийн анхны нарийвчлалд хүрч ирээдүйн хувьцааны үнийг урьдчилан таамаглахад богино хугацааны түүхэн өгөгдлийг ашиглаж болно. Дараа нь энэ загвар нь дараагийн дэвшилтэт загваруудын жишиг үзүүлэлтийг тогтоодог. Хэрэв урт богино хугацааны санах ой (LSTM) сүлжээ гэх мэт нарийн төвөгтэй загварыг хожим хөгжүүлж, 65% -ийн нарийвчлалд хүрвэл гүйцэтгэлийн өсөлтийг эхний 60% суурьтай харьцуулан нарийн хэмжиж болно.


Энэхүү харьцуулалт нь нарийвчлалын 5% сайжирсан нь LSTM-ийн нэмэлт нарийн төвөгтэй байдал, тооцооллын шаардлагыг зөвтгөж байгаа эсэхийг тодорхойлоход маш чухал юм. Ийм суурь мэдээлэлгүй бол илүү төвөгтэй загваруудыг өргөжүүлэх, практикт ашиглах талаар мэдээлэлтэй шийдвэр гаргах нь хэцүү болно.


Энэхүү жишиг үнэлгээний арга нь загварын нарийн төвөгтэй байдлыг сайжруулах нь үндэслэлтэй бөгөөд бодит сайжруулалтыг бий болгохын зэрэгцээ хөгжлийн үйл явцыг үр дүнтэй үр дүнтэй уялдуулах боломжийг олгодог.

Зардлын үр ашиг

ML-д хэмнэлттэй хандлагыг баримтлах нь чухал юм. Ялангуяа та хог хаягдлыг багасгахын зэрэгцээ үнэ цэнийг нэмэгдүүлэх зарчмуудтай үйл явцаа уялдуулах зорилго тавьсан бол. Суурь загвараас эхлэхэд та анхны загвар боловсруулах, туршихад шаардагдах нөөц, цаг хугацааг багасгадаг. Энэ нь хурдан прототип хийх гэсэн үг бөгөөд энэ нь шуурхай санал хүсэлт, давталттай сайжруулалт хийхэд зайлшгүй шаардлагатай.


Энэхүү суурь үзүүлэлтээр таны нэмсэн аливаа нарийн төвөгтэй байдлыг одоо анхааралтай үнэлэх боломжтой.


Жишээлбэл, хэрэв та вектор авторегресс (VAR) гэх мэт илүү төвөгтэй алгоритм руу шилжихийг хүсч байгаа бөгөөд энэ нь зөвхөн таамаглалын нарийвчлалыг бага зэрэг нэмэгдүүлдэг болохыг олж мэдэхийг хүсвэл энэхүү бага зэрэг сайжруулалт нь тооцооллын нэмэлт шаардлага, нарийн төвөгтэй байдлыг зөвтгөдөг эсэхийг дахин бодох хэрэгтэй. Хариулт нь үгүй байж магадгүй. Дараа нь энгийн загвар нь илүү хэмнэлттэй сонголт хэвээр байна.


Зардлын үр ашигт анхаарлаа хандуулснаар та нөөцийг үр ашигтай ашиглаж, зөвхөн техникийн сайжруулалтаас илүү үр дүнд хүрч чадна. Түүнчлэн, энэ нь гүйцэтгэлийг сайжруулах, нөөцийн хуваарилалтын хувьд үндэслэлтэй, практик, нэмүү өртөг шингэсэн шийдлүүдийг өгдөг. Ингэснээр загварын нарийн төвөгтэй байдалд оруулсан хөрөнгө оруулалт бүр баталгаатай бөгөөд энэ нь төслийн ерөнхий зорилгод хэт их зардал гаргахгүйгээр хувь нэмэр оруулах болно.

Ил тод байдал ба тайлбарлах чадвар

Шийдвэр нь зохицуулалтын хатуу стандартыг дагаж мөрдөх ёстой санхүүгийн салбаруудад загваруудын ил тод байдал нь зөвхөн бизнесийн давуу тал биш юм. Энэ нь дүрэм журамтай танилцахад чухал ач холбогдолтой стратегийн арга бөгөөд техникийн мэдлэггүй (гүнзгий) оролцогч талуудтай харилцахад хялбар болгодог.


Манай SMA загварыг авч үзье. Гаралт нь оролтын өгөгдөлтэй шууд холбоотой тул үүнийг хялбархан тайлбарлаж болно. Энэ нь оролт бүр урьдчилан таамагласан үр дүнд хэрхэн нөлөөлж байгааг тайлбарлахад хялбар болгодог. Загварын таамаглал дээр үндэслэсэн шийдвэрийг гадны зохицуулагчид эсвэл дотооддоо техникийн бус багийн гишүүдэд зөвтгөх шаардлагатай бол энэхүү энгийн байдал нь таны үйл явцын гол түлхүүр юм.


Хэрэв SMA загварын урьдчилсан таамаглалд үндэслэсэн шийдвэр эргэлзэж байвал загварын ил тод байдал нь түүний ажлын цаадах логикийг хурдан бөгөөд энгийн байдлаар тайлбарлах боломжийг олгодог. Энэ нь зохицуулалтын хяналт, аудит хийхэд тусалж, хэрэглэгчид болон шийдвэр гаргагчдын дунд итгэлцэл, үрчлэлтийг сайжруулж чадна. Түүнчлэн, загварын нарийн төвөгтэй байдал нэмэгдэхийн хэрээр, жишээлбэл, илүү нарийн таамаглал гаргахын тулд ARIMA эсвэл VAR загварууд гэх мэт илүү төвөгтэй алгоритмууд руу шилжих үед SMA-ийн анхны суурь үзүүлэлтийг тайлбарлах чадвар нь танд ямар түвшний тайлбар өгөх шаардлагатай байгааг тодорхойлох шалгуур болдог.


Онцлогын ач холбогдлын оноо эсвэл SHAP утгууд зэрэг регрессийг илүү төвөгтэй загваруудтай хослуулан ашигласнаар цаашдын загварын гүйцэтгэлийн явц ил тод байх болно. Энэ нь аюулгүй байдлын процедурын зорилгыг илүү дэвшилтэт загваруудад хаяхгүй байхад тусалдаг. Энгийн суурь загварын гол санаа нь нарийн төвөгтэй байдлын түвшин нэмэгдэх тусам ерөнхий бүтэц, ач холбогдлыг хадгалах нөхцөлийг үргэлж хэрэгжүүлэх явдал юм. Энэ нь үр дүнтэй байх нийцлийн заалтууд болон харилцаа холбоог баталгаажуулдаг.

Эрсдэлийн удирдлага

Эрсдэлийн удирдлага нь машин сургалтын загваруудыг хөгжүүлэх бас нэг чухал тал юм, ялангуяа үнэн зөв, найдвартай таамаглал нь шийдвэр гаргахад нөлөөлдөг санхүүгийн салбарт. Энгийн суурь загвартай байх нь эдгээр эрсдлийг удирдах маш сайн стратеги юм.


Шууд үндсэн шугам нь ойлгомжтой эхлэлийн цэгийг өгдөг бөгөөд энэ нь танд загварчлалын нарийн төвөгтэй байдлыг аажмаар (мөн аюулгүйгээр) сайжруулах боломжийг олгодог.


Жишээлбэл, SMA загвар (үндсэн боловч) нь хувьцааны үнийн хөдөлгөөний үндсэн хэв маяг, болзошгүй гажуудлыг олох найдвартай суурийг бүрдүүлдэг. Үүнийг ашиглах нь зах зээлийн тогтворгүй байдал эсвэл хэвийн бус зан үйлийн анхны шинж тэмдгийг тодорхойлоход тусалдаг. Үүнийг хийх нь илүү төвөгтэй урьдчилан таамаглах алгоритмуудыг ашиглахаас өмнө санхүүгийн томоохон эрсдэлээс зайлсхийх нь маш чухал юм.


Түүнээс гадна суурь загварыг ашиглах нь хэт их таарах эрсдлийг бууруулдаг. Энэ нь санхүүгийн загварчлалын нийтлэг алдаа юм. Загвар нь түүхэн өгөгдөлд хэт нарийн тааруулж, үндсэн загвараас илүү чимээ шуугиантай байх үед хэт тохируулга үүсдэг. Үүнээс болж та төөрөгдүүлсэн таамаглалыг авч, үр дүнд нь найдваргүй худалдааны стратегийг олж авах боломжтой. Цөөн параметр бүхий энгийн загвар нь энэ асуудалд бага өртөмтгий байдаг тул түүний санал болгож буй таамаглал нь үл үзэгдэх өгөгдөлд ерөнхийдөө хэрэгжих боломжийг олгодог.


SMA нь ARIMA болон VAR гэх мэт жижиг хөдөлгөөнт дундаж загвар дээр ахих тусам нарийн төвөгтэй байдал нэмэгдэж, SMA-ийн энгийн бүтэц нь нэмэлт төвөгтэй байдал бүрийн үр нөлөөг системтэйгээр авч үзэхэд тусалдаг. Энэхүү нарийн төвөгтэй байдлын шат дараалсан сайжруулалт нь загварын гүйцэтгэлийг хянахад тусалдаг бөгөөд нэмэлт төвөгтэй байдлын давхарга бүр тодорхой ашиг тусыг өгч, үндэслэлгүй эрсдэл авчрахгүй байх боломжийг олгодог.


Загварын нарийн төвөгтэй байдлыг нэмэгдүүлэх энэхүү системчилсэн арга нь загварт гарсан өөрчлөлт нь түүний зан төлөв, найдвартай байдалд хэрхэн нөлөөлж байгааг ойлгоход тусалдаг. Энэ нь эрсдэлийг үргэлж сайн удирдаж байхыг баталгаажуулдаг. Энгийн суурь үзүүлэлтээс эхэлж, хөгжлийн үе шат бүрийг сайтар хянаж чадвал та урьдчилан таамаглах загварууд нь санхүүгийн шийдвэр гаргахад дэмжлэг үзүүлж, хүчирхэг, аюулгүй хэвээр байх болно.

Суурь загваруудыг хэрэгжүүлэхэд анхаарах гол зүйлүүд

Хамгийн тохиромжтой суурь загварыг сонгохын тулд та бизнесийн асуудал, өгөгдлийн шинж чанарыг ойлгох хэрэгтэй. Жишээлбэл, санхүүгийн зах зээлийн цаг хугацааны цуврал таамаглал нь ARIMA загвараас эхэлж, цаг хугацааны динамикийг энгийн аргаар олж авах боломжтой. Мэдээллийн чанар, урьдчилсан боловсруулалт нь мөн гол үүрэг гүйцэтгэдэг; Тэр ч байтугай хамгийн энгийн загвар нь хангалтгүй эсвэл урьдчилан боловсруулсан өгөгдөл муутай байвал муу ажиллах боломжтой.


Эцэст нь хэлэхэд, суурь загвараас илүү төвөгтэй загвар руу хэзээ шилжихээ мэдэх нь чухал юм. Энэхүү шийдвэрийг Agile-ийн давталтын арга барилын дагуу нэмэлт шалгалт, баталгаажуулалтаар удирдан чиглүүлэх ёстой.

Дүгнэж хэлэхэд

Энгийн суурь загварыг нэвтрүүлэх замаар машин сургалтын төслүүдээ эхлүүлэх нь зөвхөн урьдчилсан алхам биш юм. Энэ бол стратеги юм. Үр ашиг, үр дүнтэй байдал, дасан зохицох чадварыг дэмждэг Agile арга зүйд нийцсэн стратеги. Төсөлдөө ийм байдлаар хандах нь нарийн төвөгтэй байдлын өсөлт бүрийг үндэслэлтэй болгож, бодит үнэ цэнийг нэмэгдүүлэх замаар төслийн үр дүнг мэдэгдэхүйц сайжруулж чадна. Энгийн байдлыг хүлээн авах нь хүчирхэг зүйл юм. Энэ бол шийдвэр хурдан гарах ёстой санхүү зэрэг салбарт маш сайн стратеги юм.