Siç ndodh zakonisht me teknologjitë me përparim të shpejtë, AI ka frymëzuar të dhe Disa prej tyre meritojnë, Nga start-up-et e pajisjeve të fshehura deri te gjigantët e fintech-it deri te institucionet publike, ekipet janë duke punuar me ethe në strategjinë e tyre të AI-së. FOMO Fjalë Feudë Disa prej tyre nuk “Si mund të përdorim AI dhe machine learning për t’u bërë më të mirë në atë që bëjmë?” “Si mund të përdorim AI dhe machine learning për t’u bërë më të mirë në atë që bëjmë?” Shpesh herë, kompanitë janë I gatshëm për AI. ndoshta ata kanë punësuar për rezultate më pak të ndritshme, ose ndoshta Por skenari më i zakonshëm është se ata ende nuk kanë ndërtuar infrastrukturën për të zbatuar (dhe korrur përfitimet e) më themelore algoritmeve dhe operacioneve, shumë më pak . not Shkencëtari i parë i të dhënave Letërsia e të dhënave Data Shkencë Mësimi i Makinës Si një këshilltar i shkencës së të dhënave / AI, unë kam pasur për të dorëzuar këtë mesazh një numër të panumërta herë, sidomos gjatë dy viteve të fundit. Është e vështirë të jesh një mbulesë e lagur në mesin e gjithë kësaj eksitim rreth fushës suaj, veçanërisht nëse e ndani atë eksitim. pajtohem Këtu është një shpjegim që rezonoi më së shumti: Think of AI as the top of a Piramida e nevojave . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). Piramida e nevojave Kërkesat themelore: A mund të llogarisni? Në fund të piramidës që kemi Çfarë të dhënash keni nevojë, dhe çfarë është në dispozicion?Nëse është një produkt i orientuar ndaj përdoruesit, a po regjistroni të gjitha ndërveprimet relevante të përdoruesit?Nëse është një sensor, cilat të dhëna po kalojnë dhe si?Sa e lehtë është të regjistroheni një ndërveprim që nuk është ende i instrumentuar? Kjo është ajo që e ka bërë të mundur përparimin e kohëve të fundit në mësimin e makinave. data collection Të dhënat Tjetra, si do të nëpërmjet sistemit? A keni rrjedha të besueshme / ETL ? Ku e ruani atë, dhe sa e lehtë është për të hyrë dhe analizuar? ka thënë (për rreth një dekadë) se rrjedha e besueshme e të dhënave është çelësi për të bërë gjithçka me të dhënat. data flow Jay Kreps në [Bashkë: Unë isha duke kërkuar për një citim të saktë dhe e gjeti atë në të tij ' Më pëlqejnë logot Pastaj vura re se, një paragraf më sipër, ai po bën këtë krahasim të saktë të hierarkisë së nevojave të Maslow, me një “vlen të theksohet e qartë” e hedhur atje për masë të mirë (faleminderit Jay!). Postë Çfarë bën një shkencëtar i të dhënave Ditë më parë, Sean Taylor zbuluar piramida e vet e nevojave të shkencës së të dhënave (ironikisht e quajtur trekëndëshi i panjohur i shkencës së të dhënave) i cili, natyrisht, është krejtësisht i ndryshëm. Më pëlqejnë logot Postë zbuluar Vetëm kur të dhënat janë të disponueshme, ju mund të Kjo përfshin ‘pastrimin e të dhënave’, një anë e nënvlerësuar e shkencës së të dhënave që do të jetë subjekt i një postimi tjetër.Kjo është kur ju zbuloni se po humbni një grumbull të të dhënave, sensorët tuaj janë të besueshëm, një ndryshim i versionit do të thotë se ngjarjet tuaja janë hedhur poshtë, ju jeni duke keqinterpretuar një flamur - dhe ju ktheheni për të siguruar që baza e piramidës është e fortë. explore and transform Kur të jeni në gjendje të eksploroni dhe pastroni të dhënat në mënyrë të besueshme, mund të filloni të ndërtoni atë që tradicionalisht mendohet si BI ose BI. : përcaktoni metrikat për të ndjekur, sezonalitetin e tyre dhe ndjeshmërinë ndaj faktorëve të ndryshëm. Ndoshta duke bërë disa segmentim të papërshtatshëm të përdoruesit dhe duke parë nëse diçka del jashtë. megjithatë, pasi qëllimi juaj është AI, tani jeni duke ndërtuar atë që më vonë do të mendoni si Në këtë fazë, ju gjithashtu e dini se çfarë dëshironi të parashikoni ose të mësoni, dhe ju mund të filloni të përgatitni duke gjeneruar etiketime, ose automatikisht (cilat konsumatorë u ngatërruan?) ose me njerëz në rrymë. analytics features training data Kjo është edhe kur ju gjeni tuaj më emocionuese dhe bindëse Por kjo është edhe tema e një mesazhi tjetër. data stories Unë mund të numëroj, tani çfarë? Ne kemi të dhëna të trajnimit – sigurisht, tani ne mund të bëjmë të mësuarit automatik? Ndoshta, nëse ju jeni duke u përpjekur për të parashikuar në mënyrë të brendshme churn; jo, në qoftë se rezultati do të jetë klient-facing. kuadri në vend, kështu që ne mund të vendosim gradualisht për të shmangur fatkeqësitë dhe për të marrë një vlerësim të përafërt të efekteve të ndryshimeve para se të ndikojnë të gjithë. në vend (për sistemet e rekomandimit, kjo do të ishte p.sh. ‘më e popullarizuara’, pastaj ‘më e popullarizuara për segmentin tuaj të përdoruesve’ – shumë e bezdisshme por efektive ‘stereotipi para personalizimit’). experimentation simple baseline Heuristikat e thjeshta janë çuditërisht të vështira për t'u mposhtur, dhe ato do t'ju lejojnë të debugoni sistemin nga fundi në fund pa kutitë e zeza misterioze ML me hiperparametrat e hypertuned në mes. Në këtë pikë, ju mund të vendosni një algoritëm shumë të thjeshtë ML (si regresioni logjik ose, po, ndarja), pastaj mendoni për sinjale dhe karakteristika të reja që mund të ndikojnë në rezultatet tuaja. Të dhënat e motit dhe të regjistrimit janë go-tos e mia. Dhe jo - aq i fuqishëm sa është, mësimi i thellë nuk e bën këtë automatikisht për ju. sjellja e sinjaleve të reja (krijimi i karakteristikave, jo inxhinieria e karakteristikave) është ajo që mund të përmirësojë performancën tuaj me kërcime dhe kufij. Vlen të kaloni disa kohë këtu, edhe nëse si shkencëtarë të të dhënave ne jemi të emocionuar për të lëvizur në nivelin e ardhshëm në piramidë. Merrni në AI! Ju e keni bërë atë. Ju jeni të pajisur. ETL-ja juaj është në humming. Të dhënat tuaja janë të organizuara dhe të pastra. Ju keni bordet, etiketat dhe karakteristikat e mira. Ju jeni duke matur gjërat e duhura. Ju mund të eksperimentoni çdo ditë. Ju keni një algoritëm bazë që është debugged nga fundi në fund dhe është duke shkuar në prodhim - dhe ju e keni ndryshuar atë një duzinë herë. Ju jeni gati. Shko përpara dhe provoni të gjitha të fundit dhe më të mëdha atje - nga rolling tuaj për të përdorur kompani që janë të specializuara në të mësuarit e makinave. Ju mund të merrni disa përmirësime të mëdha në prodhim, ose ju mund të mos. Në rastin më të keq, ju të mësojnë metoda të reja, të zhvillojnë mendime dhe Prisni, çfarë për MVPs, agile, lean dhe të gjitha këto? Ashtu si kur ndërtoni një MVP tradicionale (produkt minimalisht i mundshëm), ju filloni me një seksion të vogël vertikal të produktit tuaj dhe e bëni atë të funksionojë mirë nga fundi në fund. Ju mund të ndërtoni piramidën e tij, pastaj ta rritni atë horizontalisht. Për shembull, në Jawbone, ne filluam me të dhënat e gjumit dhe ndërtuam piramidën e tij: instrumentimi, ETL, pastrimi & organizimi, kapja e etiketave dhe përkufizimet, metrikat (çfarë është mesatarja # e orëve që njerëzit flenë çdo natë? dhe produktet e të dhënave të drejtuara nga mësimi i makinës (detektimi automatik i gjumit). Kjo në hapa, pastaj ushqimi, moti, stërvitja, rrjeti social dhe komunikimi – një në një kohë.Ne nuk ndërtuam një infrastrukturë gjithëpërfshirëse pa e vënë atë në punë nga fundi në fund. The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. Historia e të dhënave zgjeruar Bëni pyetjet e duhura dhe ndërtoni produktet e duhura Bëhet fjalë vetëm për mënyrën se si Jo nëse ju (Për arsye etike dhe pragmatike) could should Premtimet e mjeteve të mësimit automatik ‘ ’ Prisni, çfarë për atë API Amazon ose TensorFlow ose atë bibliotekë tjetër me burim të hapur? Çfarë për kompanitë që shesin mjete ML, ose që nxjerrin automatikisht njohuri dhe karakteristika? E gjithë kjo është e mahnitshme dhe shumë e dobishme. (Disa kompani përfundojnë duke ndërtuar me vëmendje të gjithë piramidën tuaj në mënyrë që ata të mund të tregojnë punën e tyre. Ata janë heronj.) Megjithatë, nën ndikimin e fuqishëm të hype aktuale të AI, njerëzit përpiqen të lidhin të dhëna që janë të pista dhe plot boshllëqe, që zgjasin vite duke ndryshuar formatin dhe kuptimin, kjo nuk është kuptuar ende, kjo është e strukturuar në mënyra që nuk kanë kuptim, dhe presin që ato mjete të trajtojnë magjikisht atë.