Kao što je to obično slučaj s brzo napredujućim tehnologijama, AI je inspirirao masivne , i Neki od njih su zasluženi, Od stealth hardverskih startupa do fintech divova do javnih institucija, timovi s groznicom rade na svojoj AI strategiji. FOMO FUD Feudalizam Neki od njih nisu "Kako koristimo AI i strojno učenje kako bismo postali bolji u onome što radimo?" "Kako koristimo AI i strojno učenje kako bismo postali bolji u onome što radimo?" U većini slučajeva, tvrtke su Pripremljen za AI. možda su zaposlili svoje za manje od zvijezda rezultata, ili možda Ali najčešći scenarij je da još nisu izgradili infrastrukturu za provedbu (i žetvu prednosti) najosnovnijih algoritmi i operacije, mnogo manje . not Prvi znanstvenici podataka podatkovna pismenost Data znanost strojno učenje Kao savjetnik za znanost podataka / AI, morala sam isporučiti ovu poruku bezbroj puta, osobito tijekom posljednje dvije godine. Teško je biti vlažna deka među svim ovim uzbuđenjem oko vlastitog polja, pogotovo ako dijelite to uzbuđenje.I kako kažete tvrtkama da nisu spremne za AI bez zvučanja (ili biti) elitista - samostalno imenovanog čuvara vrata? Slažem se Ovdje je objašnjenje koje je najviše rezoniralo: Think of AI as the top of a Piramida potreba . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). Piramida potreba Osnovne potrebe: možete li računati? Na dnu piramide imamo Koji su vam podaci potrebni i što je dostupno? Ako je to proizvod usmjeren na korisnike, prijavljujete li sve relevantne interakcije korisnika? Ako je to senzor, koji su podaci koji dolaze i kako? Koliko je lako prijaviti interakciju koja još nije instrumentirana? To je ono što je nedavni napredak u strojnom učenju učinilo mogućim. data collection Podatke Sljedeći: Kako to učiniti preko sustava? Imate li pouzdane tokove / ETL ? Gdje ga pohranjujete, i koliko je lako pristupiti i analizirati? već desetljećima tvrdi da je pouzdan protok podataka ključ za sve što se radi s podacima. data flow Jay Kreps [Bez obzira: Tražio sam točan citat i našao ga u njegovu ' Volim logove Zatim sam primijetio da, jedan od stavaka, on pravi točno Maslowovu hijerarhiju poređenja potreba, s "vrijedno je primijetiti očito" bačeno tamo za dobru mjeru (hvala Jay!). Postovi o tome što znanstvenici o podacima rade. prije nekoliko dana, Sean Taylor Otkriveno njegova vlastita piramida potreba za znanjem podataka (ironski nazvan Unconjoined Triangle of Data Science) koja je, naravno, potpuno drugačija. Volim logove Postovi Otkriveno Samo kada su podaci dostupni, možete To uključuje zloglasno "čišćenje podataka", potcenjenu stranu znanosti o podacima koja će biti predmet drugog posta.To je kada otkrijete da vam nedostaje gomila podataka, vaši senzori su nepouzdani, promjena verzije znači da su vaši događaji odbačeni, pogrešno tumačite zastavu - i vratite se kako biste bili sigurni da je baza piramide čvrsta. explore and transform Kada možete pouzdano istražiti i očistiti podatke, možete početi graditi ono što se tradicionalno smatra kao BI ili BI. : definirati mjerila za praćenje, njihovu sezonskost i osjetljivost na različite čimbenike. Možda napraviti neku grubu korisničku segmentaciju i vidjeti da li nešto izlazi. U ovoj fazi, također znate što biste željeli predvidjeti ili naučiti, i možete početi pripremati svoje generiranjem oznaka, ili automatski (koji su kupci škrgutali?) ili s ljudima u krugu. analytics features training data To je također kada nađete svoje najzanimljivije i uvjerljivije No, to je i tema drugog medija. data stories Može li se brojati, sad što? Imamo podatke o osposobljavanju – sigurno, sada možemo raditi strojno učenje? Možda, ako pokušavate interne predviđanja; ne, ako će rezultat biti usmjeren na kupca. okvir na mjestu, tako da možemo razmjestiti postupno kako bi se izbjegle katastrofe i dobiti grubu procjenu učinaka promjena prije nego što one utječu na sve. na mjestu (za preporučujuće sustave, to bi bilo npr. ‘najpopularnije’, a zatim ‘najpopularnije za vaš korisnički segment’ – vrlo uznemirujuće, ali učinkovito ‘stereotip prije personaliziranja’). experimentation simple baseline Jednostavne heuristike su iznenađujuće teško pobijediti, a oni će vam omogućiti da debug sistem od kraja do kraja bez tajanstvenih ML crnih kutija s hipertuned hiperparametara u sredini. U ovom trenutku možete implementirati vrlo jednostavan ML algoritam (kao što je logistička regresija ili, da, podjela), a zatim razmisliti o novim signalima i značajkama koje bi mogle utjecati na vaše rezultate. Vrijeme i podaci o popisu stanovništva su moj go-tos. I ne – koliko god to bilo moćno, duboko učenje to ne čini automatski za vas. Uvođenje novih signala (stvaranje značajki, a ne inženjerstvo značajki) je ono što može poboljšati vašu izvedbu skokovima i granicama. Donesite na AI! Vi ste to napravili. Vi ste instrumentirani. Vaš ETL je humming. Vaši podaci su organizirani i očišćeni. Imate nadzorne ploče, oznake i dobre značajke. Mjerite prave stvari. Možete eksperimentirati svakodnevno. Imate osnovni algoritam koji je debugiran od kraja do kraja i radi u proizvodnji - i promijenili ste ga desetak puta. Spremni ste. Idite naprijed i isprobajte sve najnovije i najveće tamo - od valjanja vlastite do korištenja tvrtki koje se specijaliziraju za strojno učenje. Možete dobiti neka velika poboljšanja u proizvodnji, ili možda ne. U najgorem slučaju, učite nove metode, razvijate mišljenja i praktično iskustvo s njima i pričajte svojim klijentima i svojim naporima AI-a bez osjećaja prevara. U najboljem slučaju Čekajte, što je s MVP-ovima, agilnim, vitkim i svim tim? Baš kao i kod izgradnje tradicionalnog MVP-a (minimalno održivog proizvoda), počinjete s malim, vertikalnim dijelom vašeg proizvoda i učinite da dobro funkcionira od kraja do kraja. Možete izgraditi njegovu piramidu, a zatim ga uzgojiti horizontalno. Na primjer, u Jawboneu smo počeli s podacima o spavanju i izgradili njegovu piramidu: instrumentacija, ETL, čišćenje i organizacija, snimanje oznaka i definicije, mjerila (što je prosjek sati spavanja svake noći? i strojno učenje (automatsko otkrivanje sna). To je korak po korak, a zatim hrana, vrijeme, vježbanje, društvene mreže i komunikacija – jedan po jedan. The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. Povijest podataka Proširenje Postavljanje pravih pitanja i izgradnja pravih proizvoda Riječ je samo o tome kako Ne da li si ti (iz pragmatičnih ili etičkih razloga) could should Obećanje alata za strojno učenje ‘ ’ Čekajte, što je s tom Amazon API-jem ili TensorFlow-om ili s tom drugom knjižnicom otvorenog koda? Sve je to sjajno i vrlo korisno. (Neke tvrtke na kraju naporno prilagođavaju cijelu vašu piramidu kako bi mogli pokazati svoj rad. Oni su heroji.) Međutim, pod snažnim utjecajem trenutnog AI-a, ljudi pokušavaju priključiti podatke koji su prljavi i puni praznina, koji se protežu godinama dok se mijenja format i značenje, to još nije razumljivo, to je strukturirano na načine koji nemaju smisla, i očekuju da će ti alati čarobno upravljati tim.