Ang iba't-ibang mga pangunahing digital na serbisyo - kabilang ang mga streaming na serbisyo na may mabigat na malaking mga catalog ng video na nilalaman, o ang data na serbisyo na nagbibigay ng impormasyon tungkol sa kanyang analytics - gumagamit ng higit sa mga dependent na mga sistema o mga makinarya na gumaganap bilang mga cluster sa ilalim ng umaga ng distributed computing. Gayunpaman, kasama ang kapasidad na ito ay may gastos - ang distributed systems ay resource hogs o lamang simpleng overengineered - sila ay, sa katunayan, maaaring maging napaka-efficient. Ang machine learning ay hindi lamang isang fancy buzzword; machine learning ay isang useful tool sa pag-aaralan ng demand, pagbutihin ang mga kasalukuyang mga proseso ng negosyo, at sa katapusan ay bumuo ng distributed systems na hindi lamang gumagana, ngunit gumagana. The Data Deluge: Too Much Information, Too Little Time Ang Data Flood: Higit pa ng impormasyon, higit pa ng oras Sa katapusan ng nakaraang dekada, ang halaga ng digital na data na gumaganap namin ay lumaki nangangahulugan. Sa bawat araw gumaganap namin ang higit sa 2.5 quintillion bytes ng data! Hindi kami maaaring mag-analysate, i-storage, o makikita ang data sa parehong paraan na ginagamit namin sa o sa katapusan na ito. Pag-iisip, magtrabaho, at makinig ng data sa ito size at struktural ay nagpapakita sa amin ng isang bilang ng mga teknikal na mga problema na kailangan nating i-consider para sa isang mahabang panahon, at kailangan nating bumuo ng mga solusyon na magbibigay-daan sa amin upang gamitin ang mga ito upang mapagkukunan ang aming mga modelo. Nagtrabaho sa mga distributed na mga sistema ay nagkakahalaga ang aming mga pagsusuri sa relasyon Breaking Down Data Silos Tungkol sa Data Silos Ang mga data silos, kung saan ang data ay itinatag sa isa o iba pang sistema na gumagamit kung ano ang isang sistema ay maaaring o hindi gawin sa labas ng sistema na ito. Data points mula sa lahat ng mga source ay maaaring siguradong magkaroon ng mataas na incoherent baseline kalidad o produkto mga pagkakaiba. Ang mga presyon sa (traditional) mga paraan ng pag-analysis ay magbubuo ng malaking mga problema sa iyong data analytics platform at mga pagsusuri, sa katapusan ay nagdadala sa iyo upang i-login sa potensyal na risk ng paghahatid lamang 'good' o mahusay na data ay na-access! Ang uri ng data na ito ay karaniwang nag-aayos sa mga conventional single-machine learning approaches. Isang paraan ng pag-iisip tungkol sa data na ito ay sa pamamagitan ng distributed machine learning. I-imagine na ibahagi ng kaalaman sa isang grupo ng mga estudyante - o posibleng maraming - sa isang klase, hindi sa bawat estudyante isa sa isang oras. Smarter Data Centers: Intelligent Decisions Drive Sustainability Ang mga data center ay isang pangunahing bahagi ng konektado na mundo, na nagbibigay-daan para sa isang pagtaas sa global access sa mga application at serbisyo sa pamamagitan ng mas mataas na mga resource at enerhiya consumption. Historically, ang operations management ay nangangahulugan sa isang focus sa uptime, at kami ngayon ay makikita ng isang pagbabago sa isang mas malalim na modelo ng operations management. Edge computing - na kung saan sa pamamagitan ng definisyon ay pagproseso mas malapit sa edge ng pag-uugali - ay nagpapakita ng mas mahusay na pagkakataon para sa efficiency sa pagitan ng resource utilization, optimization, at resilience / sustainability. Edge computing ay nagbibigay-daan para sa pagproseso at pag-interpretasyon ng data sa edge, mas malapit sa punto ng pag-uugali, kaya Optimizing Resource Allocation Optimize ang resource allocation Ito ay kung saan ang machine learning ay magkaroon ng isang kapaki-pakinabang! mga modelo ng ML ay maaaring i-predict ang workloads na kinakailangan para sa CPU processing; higit pa, sila ay maaaring i-recommend placement ng workloads upang i-minimize ang paggamit ng enerhiya at i-optimize ang pangkalahatang pag-usapan - sa halip ng pag-operate sa mga kondisyon ng 'blindness' at i-add extra resources na hindi kinakailangan, lahat sa CPU processing. Sa karagdagang, halimbawa, ang mga modelo ay maaaring adekvata na i-analysate ang historical data relating sa CPU utilization at temperature profiles, batay sa predictions ng paggamit para sa thermal load demand. Final Thoughts: From Science Fiction to Engineering Reality Final Thoughts: mula sa science fiction sa engineering reality Nag-imagine lamang natin na ang mga bagay na ito ay magaganap - sa science fiction. Ang kabuuan ay ngayon; machine learning at gigabit distributed computing ay real. Kami ay napaka-experienced sa pag-aralan at overreach. Algorithms ay pag-aaral, adaptasyon, at optimization sa real-time - sa lahat ng lugar. Ang machine learning ay higit sa lamang ang efficiency. Sa katunayan, ang machine learning ay nagbabago ang paraan natin ay nag-iisip tungkol sa computing. Machine learning ay nagbibigay ng mas mataas na speed, intelligence, at pag-iisip na mga sistema. Ang dimensiyon ng intelligence ay magiging ang determinante ng kung ano ang magbabago o mag-struggle kapag nagsimula namin upang bumuo ng mga digital ecosystems na may iba't ibang intelligent, multidimensional na mga elemento. Ang future ay nangyayari - ngayon, sa kasalukuyang. One guess at a time.