Kā tas parasti notiek ar strauji progresējošām tehnoloģijām, AI ir iedvesmojis masveida , un Daļa no tā ir pelnījusi, No slēptās aparatūras jaunuzņēmumiem līdz fintech gigantiem līdz publiskajām iestādēm komandas karsti strādā pie savas AI stratēģijas. FOMO FUD Fēlikss Dažas no tām nav “Kā mēs izmantojam AI un mašīntulkošanu, lai kļūtu labāki tajā, ko darām?” “Kā mēs izmantojam AI un mašīntulkošanu, lai kļūtu labāki tajā, ko darām?” Biežāk nekā ne, uzņēmumi ir Iespējams, viņi ir gatavi viņu pieņemt darbā mazāk nekā zvaigžņu rezultātus, vai varbūt Bet visizplatītākais scenārijs ir tāds, ka viņi vēl nav izveidojuši infrastruktūru, lai īstenotu (un gūtu labumu no) visvienkāršākajiem algoritmi un operācijas, daudz mazāk . not Pirmais datu zinātnieks Datu analīze Datu zinātne Mašīnu mācīšanās Kā datu zinātnes / AI konsultants man bija jānodod šis ziņojums neskaitāmas reizes, it īpaši pēdējos divos gados. Ir grūti būt mitram segumam starp visu šo satraukumu ap savu lauku, it īpaši, ja jūs dalāties ar šo satraukumu.Un kā jūs sakāt uzņēmumiem, ka viņi nav gatavi AI bez skaņas (vai būt) elitārs - paša iecelts vārtu turētājs? piekrīt Šeit ir izskaidrojums, kas rezonēja visvairāk: Think of AI as the top of a Nepieciešamības piramīda . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). Nepieciešamības piramīda Pamatvajadzības: vai jūs varat skaitīt? Piramīdas apakšā mums ir Kādi dati jums ir nepieciešami un kas ir pieejams? Ja tas ir lietotāja orientēts produkts, vai jūs reģistrējat visas attiecīgās lietotāju mijiedarbības? Ja tas ir sensors, kādi dati nāk cauri un kā? Cik viegli ir reģistrēt mijiedarbību, kas vēl nav instrumentēta? Tas ir tas, kas ir padarījis jaunākos sasniegumus mašīnu mācīšanās iespējams. data collection Datori Tālāk, kā tas notiek izmantojot sistēmu? Vai jums ir uzticamas plūsmas / ETL ? Kur jūs to glabājat, un cik viegli ir piekļūt un analizēt? ir teicis (aptuveni desmit gadus), ka uzticama datu plūsma ir atslēga, lai darītu jebko ar datiem. data flow Džejs Kreps [Lai gan: es meklēju precīzu citātu un atradu to viņa ' Es mīlu logus Pēc tam es pamanīju, ka, viens punkts virs, viņš dara šo precīzu Maslova vajadzību hierarhijas salīdzinājumu, ar "tas ir vērts atzīmēt acīmredzamo", kas tiek iemests tur par labu pasākumu (paldies Jay!). Postā par to, ko dara datu zinātnieks.Dažas dienas atpakaļ, Sean Taylor Atklāts viņa paša datu zinātnes vajadzību piramīda (ironiski nosaukta par datu zinātnes nesavienoto trijstūri), kas, protams, ir pilnīgi atšķirīga. Es mīlu logus Postā Atklāts Tikai tad, kad dati ir pieejami, varat Tas ietver slaveno "datu tīrīšanu", nepietiekami novērtētu datu zinātnes pusi, kas būs citas publikācijas priekšmets.Tas ir tad, kad jūs atklājat, ka esat zaudējis daudz datu, jūsu sensori ir neuzticami, versijas maiņa nozīmēja, ka jūsu notikumi tiek izlaisti, jūs nepareizi interpretējat karogu - un jūs atgriežaties, lai pārliecinātos, ka piramīdas pamats ir stabils. explore and transform Kad jūs varat droši izpētīt un notīrīt datus, jūs varat sākt veidot to, kas tradicionāli tiek uzskatīts par BI vai : definējiet rādītājus, lai izsekotu, to sezonalitāti un jutīgumu pret dažādiem faktoriem.Varbūt, veicot kādu rupju lietotāju segmentāciju un redzot, vai kaut kas iziet.Tomēr, tā kā jūsu mērķis ir AI, jūs tagad veidojat to, ko vēlāk domājat kā Šajā posmā jūs arī zināt, ko vēlaties prognozēt vai iemācīties, un jūs varat sākt sagatavot savu ģenerējot etiķetes, vai nu automātiski (kurš klients satricināja?) vai ar cilvēkiem lokā. analytics features training data Tas ir arī tad, kad jūs atradīsiet savu visvairāk aizraujošu un pārliecinošu - bet tas ir arī cita Medium posta priekšmets. data stories Es varu skaitīt, un kas tagad? Mums ir apmācības dati – droši vien, tagad mēs varam veikt mašīntulkošanu? Varbūt, ja jūs mēģināt prognozēt iekšēji; nē, ja rezultāts būs klientu apmierinošs. sistēmu, lai mēs varētu ieviest pakāpeniski, lai izvairītos no katastrofām un iegūtu rupju novērtējumu par izmaiņu ietekmi, pirms tie ietekmē ikvienu. uz vietas (ieteicamajām sistēmām tas būtu, piemēram, “vispopulārākais”, tad “vispopulārākais jūsu lietotāju segmentam” – ļoti kaitinošs, bet efektīvs “stereotips pirms personalizācijas”). experimentation simple baseline Vienkāršas heuristikas ir pārsteidzoši grūti pārspēt, un tās ļaus jums labot sistēmu no gala līdz gala bez noslēpumainiem ML melnajiem lodziņiem ar hipertonizētiem hiperparametriem vidū. Šajā brīdī jūs varat ieviest ļoti vienkāršu ML algoritmu (piemēram, loģistikas regresiju vai, jā, sadalījumu), tad padomājiet par jauniem signāliem un funkcijām, kas varētu ietekmēt jūsu rezultātus. Laika apstākļi un pārskata dati ir mani go-tos. Un nē - tikpat spēcīgs kā tas ir, dziļa mācīšanās automātiski to nedara jums. Nāc uz AI! Jūs to izdarījāt. Jūs esat instrumentēts. Jūsu ETL ir satriecošs. Jūsu dati ir organizēti un tīri. Jums ir instrumentu plāksnes, etiķetes un labas funkcijas. Jūs mēra pareizās lietas. Jūs varat eksperimentēt katru dienu. Jums ir bāzes līnijas algoritms, kas tiek pārveidots no gala līdz galam un darbojas ražošanā - un jūs to esat mainījis desmit reizes. Jūs esat gatavs. Ejiet uz priekšu un izmēģiniet visus jaunākos un lielākos tur - no sava rādītāja, lai izmantotu uzņēmumus, kas specializējas mašīntulkošanā. Jūs varētu iegūt dažus lielus uzlabojumus ražošanā, vai arī jūs nevarat. Sliktākajā gadījumā, jūs mācāties jaunas metodes, izstrādājat viedokļus un praktisko pieredzi ar Gaidiet, ko par MVP, ātru, lielu un visu to? Tāpat kā, veidojot tradicionālu MVP (minimāli dzīvotspējīgu produktu), jūs sākat ar nelielu, vertikālu jūsu produkta daļu un padarāt to labi funkcionējošu no gala līdz gala. Jūs varat veidot tās piramīdu, pēc tam to augt horizontāli. Piemēram, Jawbone mēs sākām ar miega datiem un izveidojām tās piramīdu: instrumentācija, ETL, tīrīšana un organizācija, etiķetes uzņemšana un definīcijas, metrika (kas ir vidējais # stundas cilvēki guļ katru nakti? automātiskās miega detekcijas (automātiskās miega detekcijas) datus; mēs vēlāk Pēc tam ēdiens, laika apstākļi, treniņi, sociālie tīkli un komunikācija – viens pēc otra. The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. Datu stāsti Paplašināts Uzdot pareizos jautājumus un izveidot pareizos produktus Tas ir tikai par to, kā jūs Ne jau tad, ja tu (Pragmatisku vai ētisku iemeslu dēļ) could should Mašīntulkošanas rīku solījums ‘ ’ Gaidiet, ko par šo Amazon API vai TensorFlow vai citu atvērtā koda bibliotēku? Tas viss ir pārsteidzošs un ļoti noderīgs. (Daži uzņēmumi galu galā rūpīgi pielāgo savu visu piramīdu, lai viņi varētu parādīt savu darbu. viņi ir varoņi.) Tomēr, spēcīgas pašreizējās AI hype ietekmē, cilvēki mēģina pieslēgt datus, kas ir netīri un pilni ar nepilnībām, kas ilgst gadus, mainot formātu un nozīmi, tas vēl nav saprotams, tas ir strukturēts tā, ka nav jēgas, un sagaida, ka šie rīki to maģiski risinās.