Kuten tavallisesti tapahtuu nopeasti kehittyvien teknologioiden kanssa, AI on inspiroinut massiivisia ja ja Osa niistä on ansaittu. – mutta teollisuus kiinnittää huomiota. Piilotetusta laitteistosta aloittavista fintech-jättilöistä julkisiin laitoksiin, tiimit työskentelevät kuumeisesti AI-strategiansa parissa. Fomoa FUOT Feijonia Osa niistä ei ”Miten käytämme tekoälyä ja koneoppimista parantaaksemme sitä, mitä teemme?” ”Miten käytämme tekoälyä ja koneoppimista parantaaksemme sitä, mitä teemme?” Useimmiten yritykset ovat Ehkä he ovat palkanneet heidät. vähemmän kuin tähtiä, tai ehkä Mutta yleisin skenaario on, että he eivät ole vielä rakentaneet infrastruktuuria, jotta he voisivat toteuttaa (ja hyödyntää) perustavanlaatuisimpia algoritmeja ja toimintoja, paljon vähemmän . not Ensimmäinen tiedemies Tietojen lukutaito Tietojen tiede Koneoppiminen Tietojenkäsittelytieteen / tekoälyn neuvonantajana minun piti toimittaa tämä viesti lukemattomia kertoja, varsinkin viimeisten kahden vuoden aikana. On vaikea olla märkä peite kaikkien tämän jännityksen keskuudessa omalla alallasi, varsinkin jos jaat sen jännityksen.Ja miten voit kertoa yrityksille, että he eivät ole valmiita AI: lle ilman, että kuulostavat (tai ovat) eliitti - itse nimetty portinvartija? Samaa mieltä Tässä on selitys, joka resonoi eniten: Think of AI as the top of a Tarpeiden pyramidi . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). Tarpeiden pyramidi Perusvaatimukset: Osaatko laskea? Pyramidin pohjassa on Mitä tietoja tarvitset ja mitä on saatavilla?Jos kyseessä on käyttäjäkohtainen tuote, kirjaudutko kaikki asiaankuuluvat käyttäjän vuorovaikutukset?Jos kyseessä on anturi, mitkä tiedot tulevat läpi ja miten?Kuinka helppoa on kirjautua vuorovaikutukseen, jota ei ole vielä instrumentoitu? Tämä on se, mikä on mahdollistanut koneen oppimisen viimeaikaiset edistysaskeleet. data collection datanäyttö Seuraavaksi, miten se järjestelmän kautta? Onko sinulla luotettavia virtoja / ETL ? Missä tallennat sen ja kuinka helppoa se on käyttää ja analysoida? on sanonut (noin vuosikymmenen ajan), että luotettava tiedonkulku on avain tekemään mitä tahansa tietojen kanssa. data flow Jaakko Kreps [Sivu: Etsin tarkkaa lainausta ja löysin sen hänen ' Rakastan lehtiä ’ mestariteos. huomasin sitten, että yhden kappaleen yläpuolella hän tekee tämän tarkan Maslowin tarpeiden hierarkian vertailun, jossa "on syytä huomata ilmeinen" heitetään sinne hyvään toimenpiteeseen (kiitos Jay!). postaus Tietoa siitä, mitä tiedemies tekee. – Sean Taylor paljastettu hänen oma tietojenkäsittelytieteen pyramidi tarpeisiin (ironisesti nimeltään Unconjoined Triangle of Data Science), joka, tietenkin, on täysin erilainen. Rakastan lehtiä postaus paljastettu Kun tiedot ovat käytettävissä, voit Tämä sisältää pahamaineisen "tietojen puhdistamisen", datatieteen aliarvostetun puolen, joka on toisen viestin aihe.Tämä on, kun huomaat, että menetät joukon tietoja, anturit ovat epäluotettavia, versioiden muutos merkitsi tapahtumien pudottamista, tulkitset väärin lippua - ja palaat varmistaaksesi, että pyramidin perusta on vankka. explore and transform Kun pystyt luotettavasti tutkimaan ja puhdistamaan tietoja, voit alkaa rakentaa sitä, mitä perinteisesti pidetään BI: ksi. : määrittele mittaukset seurata, niiden kausiluonteisuus ja herkkyys eri tekijöille. Ehkä tehdä joitakin karkea käyttäjän segmentointi ja nähdä, jos jotain hyppää ulos. Tässä vaiheessa tiedät myös, mitä haluat ennustaa tai oppia, ja voit alkaa valmistautua luomalla etikettejä, joko automaattisesti (mitä asiakkaat huijaavat?) tai ihmisten kanssa. analytics features training data Tämä on myös silloin, kun löydät jännittävimmän ja vakuuttavan – Mutta se on myös toisen Medium-postin aihe. data stories Okei, voin laskea ja mitä nyt? Meillä on koulutustietoja – varmasti, nyt voimme tehdä koneoppimista? Ehkä, jos yrität ennustaa churn sisäisesti; ei, jos tulos on asiakaslähtöinen. kehystä, jotta voimme ottaa ne käyttöön asteittain katastrofien välttämiseksi ja saada karkean arvion muutosten vaikutuksista ennen kuin ne vaikuttavat kaikkiin. paikan päällä (suosittelijan järjestelmissä tämä olisi esim. ”suosituin”, sitten ”suosituin käyttäjäsegmentillesi” – erittäin ärsyttävä mutta tehokas ”stereotyyppi ennen personointia”). experimentation simple baseline Yksinkertainen heuristiikka on yllättävän vaikea voittaa, ja ne antavat sinulle mahdollisuuden poistaa järjestelmän loppuun ilman salaperäisiä ML-musta laatikot hypertuned hyperparametreja keskellä. Tässä vaiheessa voit ottaa käyttöön hyvin yksinkertaisen ML-algoritmin (kuten logistinen regressio tai, kyllä, jakautuminen), sitten ajatella uusia signaaleja ja ominaisuuksia, jotka voivat vaikuttaa tuloksiisi. Sää- ja väestölaskennatiedot ovat minun go-tosi. Ja ei - niin voimakas kuin se on, syvä oppiminen ei automaattisesti tee tätä puolestasi. Uusien signaalien tuominen (ominaisuuksien luominen, ei ominaisuuksien suunnittelu) on se, mikä voi parantaa suorituskykyäsi hyppyillä ja rajoilla. Ota mukaan AI! Sinä teit sen. Sinä olet instrumentoitu. ETL:si on humming. Tietosi on järjestetty ja puhdistettu. Sinulla on ohjauspaneeleja, merkintöjä ja hyviä ominaisuuksia. Sinä mittaat oikeita asioita. Voit kokeilla päivittäin. Sinulla on peruslinja-algoritmi, joka on debugged loppuun ja on käynnissä tuotannossa - ja olet muuttanut sitä kymmeniä kertoja. Olet valmis. Mene eteenpäin ja kokeile kaikkia uusimpia ja suurimpia siellä - rullaamalla omasi käyttäen yrityksiä, jotka ovat erikoistuneet koneen oppimiseen. Saatat saada joitakin suuria parannuksia tuotannossa, tai et voi. Pahimmassa tapauksessa, opit uusia menetelmiä, kehität mielipiteitä ja käytännön kokemuksia heidän kanssaan ja saat kertoa asiakka Entä MVP: t, agile, lean ja kaikki tämä? Aivan kuten perinteisen MVP:n (vähintään elinkelpoisen tuotteen) rakentamisessa, aloitat tuotteesi pienestä pystysuorasta osasta ja saat sen toimimaan hyvin loppuun asti. Voit rakentaa pyramidin ja kasvattaa sen horisontaalisesti. Esimerkiksi Jawbone'ssa aloitimme unitietojen ja rakensimme pyramidin: instrumentointi, ETL, puhdistus & organisaatio, etikettien tallentaminen ja määritelmät, mittarit (mikä on keskimääräinen # tuntia ihmiset nukkuvat joka yö? ja koneoppimiseen perustuvia tietotuotteita (automaattinen unen havaitseminen). Tämä askel askeleelta, sitten ruoka, sää, harjoitukset, sosiaaliset verkostot ja viestintä – yksi kerrallaan. The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. Tietojen tarinoita Laajennettu Oikeiden kysymysten esittäminen ja oikeiden tuotteiden rakentaminen Kyse on vain siitä, miten sinä Ei ole, jos sinä (Praktisista tai eettisistä syistä) could should Koneen oppimisen työkalut ‘ ’ Mitä tapahtuu Amazon API:lle tai TensorFlowille tai muille avoimen lähdekoodin kirjastoille? Kaikki tämä on hämmästyttävää ja erittäin hyödyllistä. (Jotkut yritykset päättävät huolellisesti räätälöidä koko pyramidisi, jotta he voivat esittää työnsä. He ovat sankareita.) Kuitenkin nykyisen AI-hypeen voimakkaan vaikutuksen alaisena ihmiset yrittävät liittää tietoja, jotka ovat likaisia ja täynnä aukkoja, jotka ulottuvat vuosia muuttamalla muotoa ja merkitystä, jota ei vielä ymmärretä, joka on jäsennelty tavalla, joka ei ole järkevää, ja odottaa, että nämä työkalut käsittelevät sitä maagisesti.