Kaip paprastai atsitinka su sparčiai besivystančiomis technologijomis, AI įkvėpė didžiulius , ir Kai kurie iš jų yra nusipelnę, Nuo slaptos techninės įrangos startuolių iki fintech milžinų iki viešųjų institucijų, komandos su karščiavimu dirba dėl savo AI strategijos. Fomo FUD Feodų Kai kurie iš jų nėra ‘How do we use AI and machine learning to get better at what we do?’ Kaip mes naudojame AI ir mašininį mokymąsi, kad galėtume tobulėti tuo, ką darome? Dažniau nei ne, įmonės Galbūt jie yra pasiruošę AI. Galbūt jie samdė savo mažiau nei žvaigždžių rezultatus, arba galbūt Tačiau labiausiai paplitęs scenarijus yra tas, kad jie dar nėra sukūrę infrastruktūros, kad įgyvendintų (ir gautų naudos iš) pačių pagrindinių technologijų. algoritmai ir operacijos, daug mažiau . not Pirmasis duomenų mokslininkas Duomenų raštingumas Duomenų mokslas Mašinos mokymasis Kaip duomenų mokslo / AI patarėjas, aš turėjau pristatyti šį pranešimą daugybę kartų, ypač per pastaruosius dvejus metus. Sunku būti drėgna antklodė tarp viso to jaudulio aplink savo sritį, ypač jei jūs dalijatės tuo jauduliu.Ir kaip jūs pasakysite kompanijoms, kad jie nėra pasirengę AI be skambėjimo (arba būties) elitistas - savarankiškai paskirtas vartų sargas? sutinka Štai paaiškinimas, kuris labiausiai rezonavo: Think of AI as the top of a Reikalų piramidė . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). Reikalų piramidė Pagrindiniai poreikiai: ar galite suskaičiuoti? Piramidės apačioje mes turime Kokie duomenys jums reikalingi ir kas yra prieinama? Jei tai vartotojo požiūriu orientuotas produktas, ar registruojate visas atitinkamas vartotojo sąveikas? Jei tai yra jutiklis, kokius duomenis gaunate ir kaip? Kaip lengva registruoti sąveiką, kuri dar nėra instrumentuojama? Tai yra tai, kas padarė naujausius pažangą mašinos mokymosi įmanoma. data collection Duomenų Toliau, kaip tai veikia per sistemą? Ar turite patikimų srautų / ETL ? Kur jį saugote ir kaip lengva jį pasiekti ir analizuoti? Jis teigia (apie dešimtmetį), kad patikimas duomenų srautas yra raktas į tai, ką daryti su duomenimis. data flow Jay Krepsas [Be to: aš ieškojau tikslios citatos ir radau ją joje] Mėgstu logotipus Tada pastebėjau, kad vienoje pastraipoje jis atlieka šį tikslų Maslow poreikių hierarchijos palyginimą, o „verta atkreipti dėmesį į tai, kas akivaizdu“, įmestas ten už gerą priemonę (ačiū Jay!). Postą Apie tai, ką daro duomenų mokslininkas. prieš keletą dienų, Sean Taylor Neaptikta savo duomenų mokslo poreikių piramidę (ironiškai vadinamą nesusijusiu duomenų mokslo trikampiu), kuris, žinoma, yra visiškai kitoks. Mėgstu logotipus Postą Neaptikta Tik kai duomenys yra prieinami, galite Tai apima žinomą „duomenų valymą“, nepakankamai įvertintą duomenų mokslo pusę, kuri bus kito pranešimo tema.Tai yra tada, kai sužinosite, kad praleidžiate duomenų krūvą, jūsų jutikliai yra nepatikimi, versijos pasikeitimas reiškė, kad jūsų įvykiai nukrenta, klaidingai interpretuojate vėliavą - ir grįžtate, kad įsitikintumėte, jog piramidės pagrindas yra tvirtas. explore and transform Kai galėsite patikimai ištirti ir išvalyti duomenis, galite pradėti kurti tai, kas tradiciškai laikoma BI arba BI. : apibrėžti rodiklius, kuriuos reikia sekti, jų sezoniškumą ir jautrumą įvairiems veiksniams. Galbūt atlikite tam tikrą grubų vartotojų segmentaciją ir pamatysite, ar kas nors išeina. tačiau, kadangi jūsų tikslas yra AI, dabar kuriate tai, ką vėliau manote kaip Šiame etape jūs taip pat žinote, ką norėtumėte numatyti ar išmokti, ir galite pradėti rengti savo generuojant etiketes, automatiškai (kurie klientai sukrėtė?) arba su žmonėmis grandinėje. analytics features training data Tai taip pat, kai rasite savo labiausiai jaudinantis ir įtikinantis – Bet tai taip pat yra kito vidutinio straipsnio tema. data stories Aš galiu suskaičiuoti, o kas dabar? Mes turime mokymo duomenis – tikrai, dabar mes galime atlikti mašininį mokymąsi? Galbūt, jei bandote numatyti vidinį skaičiavimą; ne, jei rezultatas bus klientų požiūriu. sistemą, kad galėtume palaipsniui diegti, kad išvengtume nelaimių ir gautume apytikrį pokyčių poveikio įvertinimą, kol jie paveiks visus. (rekomendatorių sistemoms tai būtų, pavyzdžiui, „populiariausias“, tada „populiariausias jūsų vartotojų segmentui“ – labai erzina, bet veiksminga „stereotipas prieš personalizavimą“). experimentation simple baseline Paprastas heuristikos yra stebėtinai sunku įveikti, ir jie leis jums ištaisyti sistemą nuo galo iki galo be paslaptingų ML juodųjų dėžių su hipertonizuotais hiperparametrais viduryje. Šiuo metu galite įdiegti labai paprastą ML algoritmą (pavyzdžiui, logistinę regresiją arba, taip, padalijimą), tada pagalvokite apie naujus signalus ir funkcijas, kurios gali turėti įtakos jūsų rezultatams. Orai ir surašymo duomenys yra mano go-tos. Ir ne - kaip galingas, gilus mokymasis ne automatiškai tai daro už jus. Naujų signalų įvedimas (funkcijų kūrimas, o ne funkcijų inžinerija) yra tai, kas gali pagerinti jūsų našumą per šuolius ir ribas. Atneškite į AI! Jūs tai padarėte. Jūs esate įrankiai. Jūsų ETL yra humming. Jūsų duomenys yra organizuoti ir išvalyti. Jūs turite valdymo skydus, etiketes ir geras funkcijas. Jūs matuojate tinkamus dalykus. Jūs galite eksperimentuoti kasdien. Jūs turite bazinį algoritmą, kuris yra ištaisytas nuo galo iki galo ir veikia gamyboje - ir jūs jį pakeitėte dešimt kartų. Jūs esate pasiruošę. Eikite į priekį ir išbandykite visus naujausius ir geriausius ten - nuo savo pačių paleidimo iki naudojant į mašinų mokymąsi specializuojančias įmones. Galite gauti didelių gamybos patobulinimų, arba jūs negalite. Blogiausiu atveju, jūs išmoksite naujus metodus, sukursite nuomones ir praktinę pat O kaip su MVP, lanksčiu, liesu ir visa tai? Kaip ir kuriant tradicinį MVP (mažiausiai gyvybingą produktą), jūs pradedate nuo nedidelės, vertikalios jūsų produkto dalies ir padarote jį gerai veikiančią nuo galo iki galo. Galite pastatyti savo piramidę, tada augti horizontaliai. Pavyzdžiui, „Jawbone“ mes pradėjome nuo miego duomenų ir pastatėme savo piramidę: instrumentų, ETL, valymo ir organizavimo, etiketės užfiksuojimo ir apibrėžimų, rodiklių (koks yra vidutinis # valandų, per kurias žmonės miega kiekvieną naktį? ir mašininio mokymosi pagrįsti duomenų produktai (automatinis miego aptikimas). Tada maistas, oras, treniruotės, socialiniai tinklai ir bendravimas – vienas po kito. The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. Duomenų istorijos Išplėstinė Užduoti teisingus klausimus ir kurti tinkamus produktus Tai tik apie tai, kaip jūs Ne, jei jūs (dėl etinių ar pragmatiškų priežasčių) could should Mašininio mokymosi įrankių pažadas ‘ ’ Palaukite, ką apie tą "Amazon API" ar "TensorFlow" ar kitą atviro kodo biblioteką? Visa tai yra nuostabi ir labai naudinga. (Kai kurios įmonės baigiasi kruopščiai pritaikydamos visą jūsų piramidę, kad jie galėtų parodyti savo darbą. Jie yra didvyriai.) Tačiau, esant stipriam dabartinio AI hype poveikiui, žmonės bando prijungti duomenis, kurie yra nešvarūs ir pilni spragų, kurie ištisus metus keičia formatą ir prasmę, tai dar nesuprantama, tai yra struktūrizuota taip, kad nėra prasmės, ir tikisi, kad tie įrankiai tai stebuklingai tvarkys.