Mint általában a gyorsan fejlődő technológiák esetében, a mesterséges intelligencia hatalmas az , és Egy részük megérdemli, A titkos hardver startupoktól a fintech óriásokig a közintézményekig a csapatok lázasan dolgoznak az AI stratégiájukon. A FOMO Fúró Feudális Néhány közülük nem „Hogyan használjuk az AI-t és a gépi tanulást, hogy jobbak legyünk abban, amit csinálunk?” „Hogyan használjuk az AI-t és a gépi tanulást, hogy jobbak legyünk abban, amit csinálunk?” Gyakran előfordul, hogy a vállalatok Elkészült az AI. Talán bérelték őket Csillagászati eredmények, vagy talán De a leggyakoribb forgatókönyv az, hogy még nem építették fel az infrastruktúrát, hogy végrehajtsák (és megszerezzék a legalapvetőbb előnyöket). algoritmusok és műveletek, sokkal kevesebb . not Az első adatkutató Adatolvasás Data tudomány gépi tanulás Adat tudomány / AI tanácsadóként számtalan alkalommal kellett átadnom ezt az üzenetet, különösen az elmúlt két évben. Nehéz nedves takaró lenni a saját mezőn belüli izgalom között, különösen, ha megosztja ezt az izgalomot.És hogyan mondja el a vállalatoknak, hogy nem állnak készen az AI-ra anélkül, hogy elitistának (vagy elitistának) hangoznának - egy önkéntes kapu őrző? Egyetértek Íme egy magyarázat, ami a leginkább rezonált: Think of AI as the top of a Az igények piramisai . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). Az igények piramisai Alapvető szükségletek: tudsz számolni? A piramis alján a Milyen adatokra van szükséged, és mi áll rendelkezésre? Ha egy felhasználó-orientált termékről van szó, akkor az összes releváns felhasználói interakciót naplózod? Ha érzékelőről van szó, milyen adatok kerülnek át, és hogyan? Mennyire könnyű naplózni egy még nem műszeres interakciót? Ez az, ami lehetővé tette a gépi tanulás legújabb fejlődését. data collection adatbázis Következő: Hogyan működik a Van-e megbízható áramlása / ETL ? Hol tárolja, és mennyire könnyű hozzáférni és elemezni? Azt mondja (kb. egy évtizede), hogy a megbízható adatáramlás kulcsfontosságú ahhoz, hogy bármit megtegyünk az adatokkal. data flow György Kreps [Másrészt: Pontos idézetet kerestem, és megtaláltam az ő ' Szeretem a logókat ’ remekmű. Aztán észrevettem, hogy egy bekezdés fölött, ő teszi ezt a Maslow szükségletek hierarchiájának pontos összehasonlítását, egy „érdemes megjegyezni a nyilvánvalót” dobott ott jó mértékben (köszönöm Jay!). poszt Mi az, amit egy adatkutató csinál? – Sean Taylor Kiderült saját adat-tudományi szükségletek piramisát (iróniában az Unconjoined Triangle of Data Science-t) nevezte el, ami természetesen teljesen más. Szeretem a logókat poszt Kiderült Csak akkor, ha az adatok elérhetők, akkor Ez magában foglalja a hírhedt „adattisztítást”, az adattudomány alábecsült oldalát, amely egy másik poszt tárgya lesz.Ez az, amikor felfedezed, hogy hiányzik egy csomó adat, az érzékelőid megbízhatatlanok, a verzióváltozás azt jelentette, hogy az események leesnek, tévesen értelmezed a zászlót - és visszatérsz, hogy megbizonyosodjon arról, hogy a piramis alapja szilárd. explore and transform Amikor megbízhatóan feltárhatja és megtisztíthatja az adatokat, elkezdheti építeni azt, amit hagyományosan BI-ként vagy BI-ként tartanak számon. : határozza meg a nyomon követendő mutatókat, azok szezonalitását és érzékenységét a különböző tényezőkre. Talán néhány durva felhasználói szegmentációt végez, és nézze meg, ha valami kiugrik. Ebben a szakaszban azt is tudod, hogy mit szeretnél megjósolni vagy megtanulni, és elkezdheted előkészíteni a címkék generálásával, vagy automatikusan (mely ügyfelek csavartak?) vagy emberekkel a csavarban. analytics features training data Ez az, amikor megtalálod a legizgalmasabb és legmeggyőzőbb De ez egy másik médium témája is. data stories Meg tudom számolni, most mi lesz? Van képzési adatunk – biztosan, most már meg tudjuk csinálni a gépi tanulást? Talán, ha megpróbálod belsőleg megjósolni a churn-t; nem, ha az eredmény ügyfélközpontú lesz. A keretrendszer létezik, így fokozatosan telepíthetjük a katasztrófák elkerülése érdekében, és megkapjuk a változások hatásainak durva becslését, mielőtt mindenkire hatással lennének. helyben (az ajánló rendszerek esetében ez lenne például a „legnépszerűbb”, majd a „legnépszerűbb a felhasználói szegmens számára” – a nagyon bosszantó, de hatékony „sztereotípia a személyre szabás előtt”). experimentation simple baseline Az egyszerű heurisztikákat meglepően nehéz legyőzni, és lehetővé teszik a rendszer végétől végéig történő hibakeresését rejtélyes ML fekete dobozok nélkül, középen hiperparaméterekkel. Ebben a pillanatban egy nagyon egyszerű ML algoritmust telepíthet (például logisztikai regressziót vagy, igen, megosztást), majd új jeleket és funkciókat gondolhat, amelyek befolyásolhatják az eredményeket. Időjárás és népszámlálási adatok az én go-tosom. És nem - bármilyen erős is, a mélytanulás nem automatikusan teszi ezt az Ön számára. Az új jelek bevezetése (funkciók létrehozása, nem a funkciófejlesztés) az, ami javíthatja a teljesítményét ugrásokkal és határokkal. Érdemes itt időt tölteni, még akkor is, ha adatkutatóként izgatottak vagyunk a következő szintre lépésről a piramisban. Vigye magával az AI-t! Te csináltad. Önnek van eszköze. Az ETL-je rohan. Az adataid szerveződnek és megtisztulnak. Önnek eszköztárai, címkék és jó funkciói vannak. Ön a megfelelő dolgokat mérik. Naponta kísérletezhet. Önnek van egy alapvető algoritmusa, amely végső soron hibázik, és a termelésben fut – és tucatnyi alkalommal változtattad meg. Készen állsz. Menj előre, és próbáld ki a legújabb és legnagyobb dolgokat ott – a sajátodból a gépi tanulásra szakosodott cégek használatára. Lehet, hogy néhány nagy fejlesztést kapsz a termelésben, vagy talán nem. A legrosszabb esetben új módszereket tanulsz, véleményeket és gyakorlati tapasztalatokat fejlesztesz velük, és elmeséled Mi a helyzet az MVP-kkel, az agilis, a lean és mindezekkel? Csakúgy, mint amikor egy hagyományos MVP-t (minimálisan életképes terméket) építesz, egy kis, függőleges szakaszból indulsz a termékeddel, és jól működteted a végétől a végéig. Építheted a piramisát, majd vízszintesen növekedhetsz. Például a Jawbone-nál az alvási adatokkal kezdtünk, és építettük a piramisát: eszközök, ETL, takarítás és szervezet, címkék rögzítése és definíciók, mutatók (mi az emberek éjszakai alvásának átlagos száma? és gépi tanulás által vezérelt adattermékek (automatikus alvásérzékelés). Ez lépésről lépésre, majd az élelmiszer, az időjárás, az edzések, a közösségi hálózatok és a kommunikáció – egyenként. The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. adat történetek kiterjesztett A megfelelő kérdések felvetése és a megfelelő termékek létrehozása Ez csak arról szól, hogy hogyan Nem az, hogy te (Egészséges és etikai okok miatt) could should A gépi tanulási eszközök ígérete ‘ ’ Mi a helyzet az Amazon API-val vagy a TensorFlow-val vagy más nyílt forráskódú könyvtárral? Mindez fantasztikus és nagyon hasznos. (Néhány vállalat keményen testreszabja az egész piramisot, hogy bemutathassa munkáját. hősök.) Azonban a jelenlegi AI hype erős hatása alatt az emberek megpróbálják csatlakoztatni az adatokat, amelyek piszkosak és tele vannak hiányosságokkal, amelyek évekig terjednek, miközben megváltoztatják a formátumot és a jelentést, ez még nem érthető, ez olyan módon van felépítve, hogy nincs értelme, és elvárja, hogy ezek az eszközök varázslatosan kezeljék.