Ինչպես սովորաբար նման է արագ առաջատար տեխնոլոգիաների հետ, AI- ը ինտեգրել է մեծ մասը Հիմա եւ Մինչեւ մի մասը արժանի է, — բայց արդյունաբերությունը համոզված է, որ: Չինաստանում սեղմված սարքավորումների Startups- ից Fintech- ի խոշորների մինչեւ մասնագիտացված կազմակերպությունների համար, թիմերը աշխատում են իրենց AI ռեժիմի վրա: Այն բոլորը մի կարեւոր, բարձր բաղադրիչների հարցն է: FOMO-ն Ֆիլմ Ֆիլմեր Նրանք մի քանի ոչ «Ինչպես մենք օգտագործում ենք AI- ը եւ մեքենայի ուսուցում, որպեսզի ավելի լավ ենք այն մասին, ինչ մենք անում ենք?» «Ինչպես մենք օգտագործում ենք AI- ը եւ մեքենայի ուսուցում, որպեսզի ավելի լավ ենք այն մասին, ինչ մենք անում ենք?» Ավելի հաճախ, քան ոչ, ընկերություններ են Արդյոք, կարող է, որ նրանք աշխատել իրենց Հաջորդը Հաջորդը Հաջորդը Հաջորդը Հաջորդը Հաջորդը Հաջորդը Հաջորդը Բայց ամենամեծ բաղադրիչը այն է, որ նրանք դեռ չեն կառուցել բաղադրիչները, որոնք կարող են իրականացնել ( եւ գնել) ամենամեծ բաղադրիչները: Algorithms եւ գործառույթներ, շատ ավելի շատ . not Առաջին Data Scientist Data գրասենյակներ Data գիտություն մեքենա ուսուցում Որպես տվյալների գիտության / AI advisor, ես պետք է տվել այս հաղորդագրությունը բազմաթիվ անգամ, հատկապես վերջին երկու տարիների ընթացքում. Արդյոք, ինչպե՞ս կարող եք ասել ընկերությունների համար, որ նրանք չեն պատրաստ AI- ի համար, եթե նրանք անում են ( կամ անում են) elitist- ը: Միացեք Ահա մի բացահայտություն, որը ամենաերջել է: Think of AI as the top of a Հեղինակ՝ Need Piramide . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). Հեղինակ՝ Need Piramide Հիմնական պահանջները: Դուք կարող եք փոխել: Հիմնական հոդված՝ Հիմնական հոդված՝ The bottom of the pyramid we have -Ի՞նչ տվյալներ պետք է ունեք, եւ ինչն է հասանելի: Եթե դա օգտագործող-մասնավոր արտադրանքը, ապա դուք գրում եք բոլոր relevant օգտագործող-մասնավորությունները: Եթե դա սենզոր, թե ինչ տվյալներ են հասանելի եւ թե ինչպես է: Ինչպե՞ս հեշտ է գրել մի ինտեգրման, որը այժմ չի սարքավորվում: Իհարկե, ճիշտ է Դա այն է, ինչը կարող է լինել մեքենայի ուսուցման վերջին առաջադեմները. data collection Տեսակներ Հաջորդը, թե ինչպես է Արդյոք դուք ունեք ճշգրիտ ռեժիմներ / ETL- ը: Ինչպե՞ս սեղմեք այն, եւ թե ինչպես հեշտ է ստանալ եւ վերլուծել այն: Մինչեւ մի քանի տարի առաջ, մենք ասում ենք, որ հավասար data flow- ը կարեւոր է, որ ինչ-որ բան կարող եք անել տվյալների հետ: data flow Jay Kreps- ը [Արդյոք: Ես փնտրում եմ ճշգրիտ թարգմանություն եւ գտնել եմ այն իր ` Ես սիրում եմ թերթիկները «Ես հետո նստել եմ, որ, մեկ փետրվարի առաջ, նա կատարում է այս ճշգրիտ Maslow- ի պահանջների հիերֆիկայի համեմատություն, հետ `հավատում է, որ հստակ է` թռվում է այնտեղ լավ չափի համար (լուսանկարներ: Jay! Հաջորդ «Այս օրվա մասին, թե ինչ է անում data scientist»: Sean Taylor Արդյոք Նրա սեփական տվյալների գիտության կարիքների պրեմայթը (մարոնիկորեն կոչվում է Unconjoined Triangle of Data Science- ը), որը, իհարկե, ամբողջապես տարբեր է: Խնդրում ենք սկսել tumblr.] Ես սիրում եմ թերթիկները Հաջորդ Արդյոք Երբ տվյալները հասանելի են, դուք կարող եք Դա այն ժամանակ է, երբ դուք հասկանում եք, որ դուք վախենում եք մի քիչ տվյալներ, ձեր սենզորները չժանգարելի են, տարբերակային փոխանակումը նշանակում է, որ ձեր գործերը կանգնած են, դուք վախենում եք մի թագավորություն - եւ դուք վերադարձեք, որպեսզի ապահովեք, որ սենզորը խոշոր է: explore and transform Երբ դուք կարող եք ապահովել եւ մաքրել տվյալները, դուք կարող եք սկսել կառուցել այն, ինչ սովորաբար կարծում է BI-ի կամ BI-ի համար: Տեղադրեք մետրիկները, որոնք պետք է հետազոտել, իրենց սերտիֆիկությունը եւ զգալիությունը տարբեր գործիքների համար: Հիմա կարող եք անել մի քանի խոշոր օգտվողի սերտիֆիկացման եւ տեսնել, թե ինչ-որ բան կանգնած է: Սակայն, քանի որ ձեր նպատակը AI- ը է, դուք այժմ կառուցում եք այն, ինչ դուք հետո կարծում եք, որ Ավելացնել ձեր մեքենայի ուսուցման մոդելը: Այս քայլում դուք նաեւ գիտեք, թե ինչ ցանկանում եք նախընտրել կամ սովորել, եւ կարող եք սկսել պատրաստել ձեր մեքենայի ուսուցման մոդել: Արդյոք, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ, այնպես էլ: analytics features training data Սա նույնիսկ այն ժամանակ է, երբ դուք տեսնում եք ձեր ամենամեծ եւ խոշորագույն — բայց դա նաեւ մի այլ Medium գրքի մասին է: data stories Արդյոք, ես կարող եմ փոխել, թե ինչ է դա: Մենք ունենք դասընթացային տվյալներ — իհարկե, այժմ մենք կարող ենք անել մեքենայի ուսուցում: Հիմա, եթե դուք փորձում եք ինտեգրել churn- ը, ոչ, եթե արդյունքը կունենա հաճախորդների համար: Մենք պետք է ունենք (կամ առաջին) A / B փորձարկման կամ Արդյոք, մենք կարող ենք տեղադրել պրակտիկորեն, որպեսզի փնտրել սխալները եւ ստանալ խոշոր արժեքը ազդեցության փոխանցման, երբ նրանք ազդում են բոլորին: Սա նաեւ ճիշտ ժամանակ է տալիս շատ Տեղադրիչ համակարգերի համար, դա պետք է, ինչպիսիք են `լավագույնը`, ապա `լավագույնը ձեր օգտվողի մասի համար` - շատ բախված, բայց արդյունավետ `սրթերոֆը, նախքան անձնականությունը`: experimentation simple baseline Հեշտ heuristics շատ դժվար է հաղթել, եւ նրանք թույլ են տալիս Ձեզ վերահսկել համակարգը end-to-end առանց վատ ML black boxes հետ hypertuned hyperparameters կենտրոնում. Սա նաեւ, թե ինչու իմ սիրելի տվյալների գիտության ալբորմատոմս է բաժանման. Այս ժամանակ, դուք կարող եք տեղադրել շատ հեշտ ML ալբորմատոմսը (հարկե logistic regression- ը կամ, ոչ, բաժանման), ապա կարծես նոր սխալներ եւ առանձնահատկություններ, որոնք կարող են ազդել ձեր արդյունքների վրա: Թագավորություն & census տվյալները իմ go-tos- ը են: Եվ ոչ, քանի որ հզոր է, Deep Learning- ը ավտոմատորեն դա չի կատարում ձեզ համար: Նոր սխալներ (պատեգորիաների ստեղծում, ոչ թե feature engineering- ը) այն է, ինչը կարող է բարելավել ձեր կատարումը փուլների եւ գծերի միջոցով: Դա արժեք է մի քանի ժամանակ անցնել այստեղ, նույնիսկ եթե տվյալների գիտականները մենք վախենում ենք, որ թվային գիտականները վերցնում են հաջորդ մակարդակը պր Արդյո՞ր է AI-ը Դուք կատարում եք այն. Դուք սարքավորվում եք. Ձեր ETL- ը սեղմվում է. Ձեր տվյալները տեղադրված են եւ մաքրվում են. Դուք ունեք բաղադրիչներ, բաղադրիչներ եւ լավ առանձնահատկություններ: Դուք ճիշտ բաները կտրում եք. Դուք կարող եք ամեն օր փորձել: Դուք ունեք բաղադրիչ բաղադրիչը, որը սեղմվում է end-to-end եւ աշխատում է արտադրանքում - եւ դուք փոխել եք այն մի քանի անգամ: Դուք պատրաստ եք: Ավելացնել եւ փորձել բոլոր վերջին եւ ամենամեծ բաները այնտեղ - օգտագործելով ձեր սեփական ընկերությունները, որոնք մասնագիտացած են մեքենայի ուսուցում: Դուք կարող եք ստանալ մի քանի մեծ բարելավություններ արտադրության մեջ, կամ դուք կարող եք չեք: Հավատագույն դեպքում, դուք գիտեք նոր մեթոդներ Ինչպե՞ս են MVPs, Agile, Lean եւ այլն: Որպես այնպես, երբ կառուցում եք նորմալ MVP-ը (լուսանկարներ: minimally viable product), դուք սկսում եք ձեր արտադրանքի փոքր, հագավոր մասի հետ, եւ կարող եք այն լավ աշխատել end-to-end- ում: Դուք կարող եք կառուցել իր պրեմինդը, ապա բարձրացնել այն horizontally: Օրինակ, Jawbone- ում, մենք սկսել ենք սննդի տվյալների հետ եւ կառուցել ենք իր պրեմինդը: սարքավորումներ, ETL- ը, մաքուրություն եւ կազմակերպություն, նամակագրություն եւ սահմանափակումներ, մետրիկներ (կա է ամեն գիշերը: Ինչ է սնունդը: Ինչ է սնունդը?), սնունդը վերլուծվում է ամբողջ ճանապարհին: եւ մեքենայի ուսուցման վրա հիմնված տվյալների արտադրանքը (automatic sleep detection). Հիմա սննդի, ջերմաստիճանի, դասընթացների, սոցիալական ցանցերի եւ հաղորդագրության - մեկ անգամ: Մենք չենք կառուցել ամբողջական ինտեգրտությունը, երբ երբեք չենք օգտագործում այն end-to-end աշխատելու համար: The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. Data պատմություններ Բարձրվել է Կարդալ ճիշտ հարցեր եւ ստեղծել ճիշտ արտադրանքը Սա միայն այն մասին, թե ինչպես դուք Ոչ, եթե դուք (Անհարկե, թե ինչու է այն, թե ինչ է այն, թե ինչ է այն, թե ինչ է այն, թե ինչ է այն) could should Մեքենաների ուսուցման գործիքներ ‘ ’ Ո՞վ է Amazon API-ը, TensorFlow-ը կամ այլ open source գրասենյակը: Ինչպե՞ս են ընկերություններ, որոնք վաճառում են ML գործիքներ, կամ ավտոմատորեն արտադրում են տեսքներ եւ գործիքներ: Այս ամենը մեծ է եւ շատ օգտակար է: (Այոք որոշ ընկերություններ կատարում են ձեր ամբողջ պրեմայթը հարմարեցնել, որպեսզի նրանք կարող են ցույց տալ իրենց աշխատանքը: Նրանք հերոսներ են): Սակայն, ժամանակակից AI hype- ի ուժեղ ազդեցության տակ, մարդիկ փորձում են մտնել տվյալները, որոնք խոշոր են եւ խոշոր են, որոնք տեւում են տարիների ընթացքում, իսկ փոխանցում են ձեւաչափը եւ նշանակությունը, ինչը դեռ չգիտվում է, այն կառուցված է այնպես, որ չի նշանակում, եւ կարծում են, որ այդ գործիքները կասկածեն այն.