Som vanligt är fallet med snabbt utvecklade tekniker, har AI inspirerat massiva och och Några av dem är välförtjänta, Från stealth hardware startups till fintech jättar till offentliga institutioner, team arbetar febrilt på sin AI-strategi. Fomo Fud Födelse Några av dem inte ”Hur använder vi AI och maskininlärning för att bli bättre på det vi gör?” ”Hur använder vi AI och maskininlärning för att bli bättre på det vi gör?” Ofta är det så att företagen är redo för AI. Kanske de anställde sina till mindre än stjärnors resultat, eller kanske Men det vanligaste scenariot är att de ännu inte har byggt upp infrastrukturen för att genomföra (och skörda fördelarna med) de mest grundläggande Algoritmer och operationer, mycket mindre . not Den första datavetenskaparen Data läskunnighet Data vetenskap maskininlärning Som datavetenskap / AI-rådgivare var jag tvungen att leverera detta meddelande otaliga gånger, särskilt under de senaste två åren. Det är svårt att vara en våt filt bland all denna spänning runt ditt eget område, speciellt om du delar den spänningen.Och hur berättar du för företag att de inte är redo för AI utan att låta (eller vara) elitist - en självutnämnd gate keeper? Håller med Här är en förklaring som resonerade mest: Think of AI as the top of a Pyramid av behov . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). Pyramid av behov Grundläggande behov: Kan du räkna? På botten av pyramiden har vi Vilka data behöver du, och vad är tillgängligt? Om det är en användarvänlig produkt loggar du alla relevanta användarinteraktioner? Om det är en sensor, vilka data kommer igenom och hur? Hur lätt är det att logga en interaktion som inte är instrumenterad ännu? Det är det som gjort de senaste framstegen inom maskininlärning möjliga. data collection Datasätt Därefter, hur gör den via systemet? Har du tillförlitliga strömmar / ETL ? Var lagrar du det, och hur lätt är det att komma åt och analysera? har sagt (i ungefär ett decennium) att tillförlitligt dataflöde är nyckeln till att göra någonting med data. data flow Jay Kreps [Bortsett från: Jag letade efter ett exakt citat och hittade det i hans ' Jag älskar loggar ’ mästerverk. jag märkte sedan att, ett stycke över, han gör denna exakta Maslow hierarki av behov jämförelse, med en "det är värt att notera det uppenbara" kastas in där för bra mått (tack Jay!). Posten om vad en datavetenskapare gör. för några dagar sedan, Sean Taylor Avslöjat hans egen datavetenskap pyramid av behov (ironi kallas den Oförenade Triangeln för datavetenskap) som, naturligtvis, är helt annorlunda. Jag älskar loggar Posten Avslöjat Endast när data är tillgängliga kan du Det här är när du upptäcker att du saknar en massa data, dina sensorer är opålitliga, en versionskifte innebar att dina händelser faller, du missförstår en flagga - och du går tillbaka för att se till att basen av pyramiden är solid. explore and transform När du på ett tillförlitligt sätt kan utforska och rengöra data kan du börja bygga vad som traditionellt anses vara BI eller BI. : definiera mätvärden för att spåra, deras årstid och känslighet för olika faktorer. Kanske göra lite grov användarsegmentering och se om något hoppar ut. I det här skedet vet du också vad du vill förutsäga eller lära dig, och du kan börja förbereda din genom att generera etiketter, antingen automatiskt (vilka kunder grävde?) eller med människor i slingan. analytics features training data Detta är också när du finner din mest spännande och övertygande – men det är också ämnet för en annan Medium-post. data stories Jag kan räkna, nu vad? Vi har utbildningsdata – säkert, nu kan vi göra maskininlärning? Kanske om du försöker förutsäga churn internt; nej, om resultatet kommer att vara kundvänligt. ramverk på plats, så att vi kan distribuera stegvis för att undvika katastrofer och få en grov uppskattning av effekterna av förändringarna innan de påverkar alla. på plats (för rekommendationssystem skulle detta vara t.ex. ”den mest populära”, sedan ”den mest populära för ditt användarsegment” – den mycket irriterande men effektiva ”stereotypen före personalisering”). experimentation simple baseline Enkla heuristiker är förvånansvärt svåra att slå, och de låter dig debugga systemet end-to-end utan mystiska ML svarta lådor med hypertuned hyperparametrar i mitten. Vid denna tidpunkt kan du distribuera en mycket enkel ML-algoritm (som logistisk regression eller, ja, uppdelning), och sedan tänka på nya signaler och funktioner som kan påverka dina resultat. Väder & folkräkningsdata är mina go-tos. Och nej - så kraftfull som det är, gör djup inlärning inte automatiskt detta för dig. Att ta in nya signaler (funktionskapande, inte funktionsteknik) är vad som kan förbättra din prestanda med hopp och gränser. Hämta på AI! Du gjorde det. Du är instrumenterad. Din ETL är humming. Dina data är organiserade och rengjorda. Du har instrumentpaneler, etiketter och bra funktioner. Du mäter rätt saker. Du kan experimentera dagligen. Du har en baslinjealgoritm som debuggas ända till slut och körs i produktion - och du har ändrat det ett dussin gånger. Du är redo. Gå vidare och prova alla de senaste och bästa där ute - från att rulla din egen till att använda företag som specialiserar sig på maskininlärning. Du kan få några stora förbättringar i produktion, eller du kanske inte. I värsta fall lär du dig nya metoder, utvecklar åsikter och praktiska erfarenheter med dem och får berätta för dina kunder och dina AI-insatser utan att känna sig som en bedragare. I bästa fall gör du en Vänta, vad sägs om MVPs, agile, lean och allt det där? Precis som när du bygger en traditionell MVP (minimalt livskraftig produkt) börjar du med en liten, vertikal del av din produkt och du får den att fungera bra från slutet till slutet. Du kan bygga sin pyramid och sedan växa den horisontellt. Till exempel på Jawbone började vi med sömndata och byggde sin pyramid: instrumentering, ETL, rengöring & organisation, taggning och definitioner, mätvärden (vad är genomsnittet # av timmar människor sover varje natt? och dataprodukter som drivs av maskininlärning (automatisk sömndetektering). Detta steg för steg, sedan mat, väder, träning, sociala nätverk och kommunikation – en i taget. The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. Data berättelser Förlängd Ställa rätt frågor och bygga rätt produkter Det handlar bara om hur du Inte om du (av etiska och pragmatiska skäl) could should Löftet om maskininlärningsverktyg ‘ ’ Vänta, vad sägs om det Amazon API eller TensorFlow eller det andra öppen källkodsbiblioteket? Allt detta är fantastiskt och mycket användbart. (Vissa företag hamnar hårt på att anpassa hela din pyramid så att de kan visa upp sitt arbete. De är hjältar.) Men under starkt inflytande av den nuvarande AI-hypen försöker människor att ansluta data som är smutsiga och fulla av luckor, som sträcker sig år medan du ändrar format och mening, det är inte förstått ännu, det är strukturerat på sätt som inte är meningsfulla, och förväntar sig att de verktygen magiskt hanterar det. Och kanske någon dag snart kommer det att vara fallet; Jag ser och applåderar ansträngningar i den riktningen.