لکه څنګه چې معمولا د چټک پرمختللي ټکنالوژۍ په صورت کې، د AI د لویو د او د هغه څه دي چې دا په لټه کې دي، - خو د صنعت په احتياط کې دي. له stealth هارډویر پیل څخه د فینټیک ګانګانو ته د عمومي ادارو ته، ټیمونه د خپل AI ستراتیژۍ په لټه کې کار کوي. دا ټول د یو مهم، لوړ شرط پوهیږي: د FOMO فورمه د فورمه ځینې د دې نه "چې موږ د AI او ماشین زده کړې کاروئ ترڅو په هغه څه کې ښه وي چې موږ کار کوو؟" "چې موږ د AI او ماشین زده کړې کاروئ ترڅو په هغه څه کې ښه وي چې موږ کار کوو؟" په اغیزمنه توګه، شرکتونه د AI لپاره چمتو دي. شاید دوی د هغوی لپاره کار واخلئ تر لږه ستوري پایلې، یا شاید د دوی د ثقافت په مرکز کې نه ده. مګر تر ټولو عام scenario دا ده چې دوی تر اوسه هم د زیربنا جوړ نه کوي چې د تر ټولو بنسټیز (و د ګټور ګټورانو د لګولو لپاره) جوړ کړي. algorithms او عملیاتونه، ډیر لږ . not د لومړي معلوماتو څیړونکي د معلوماتو لیکنه د معلوماتو علوم ماشین زده کړې لکه څنګه چې د معلوماتو علومو / AI مشورې، زه باید د دې پیغام لخوا ډیری وختونه وړاندې کړي، په ځانګړي ډول په وروستیو دوو کلونو کې. دا سخت دی چې په خپل ځان کې د ټولو هیجانونو په منځ کې د تودوخې لرې وي، په ځانګړې توګه که تاسو د دې هیجان شریک کړئ. او څنګه تاسو شرکتونو ته چمتو کړئ چې دوی د AI لپاره نه چمتو شوي دي پرته چې (یا) elitist سمه وي - یو ځان د ګاټا ساتونکي؟ موافق دلته یو تفسیر دی چې ترټولو ډیری رسیږي: Think of AI as the top of a د اړتیاوو پیرامیډ . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). د اړتیاوو پیرامیډ د بنسټیز اړتیاوې: تاسو کولی شئ حساب کړئ؟ په پای کې د پیراميډ موږ لري . هغه معلومات چې تاسو اړتیا لرئ، او څه شتون لري؟ که دا د کاروونکي په غاړه محصول دی، نو تاسو ټول اړین کاروونکي تعاملونه ژورئ؟ که دا د سینسر دی، هغه معلوماتو چې د دې څخه راټول کیږي او څنګه؟ دا څومره آسانه ده چې د تعاملونه ژورئ چې اوس هم نندارتون شوي دي؟ په پایله کې، دا حق دی دا هغه څه دی چې په ماشین زده کړې کې د وروستیو پرمختګونه امکان دی. data collection د معلوماتو بل، څنګه د د سیسټم له لارې؟ آیا تاسو د باور وړ جریانونه / ETL لري؟ که تاسو دا ذخیره کړئ، او دا څومره آسان دی چې د لاس رسی او تحلیل وکړئ؟ په اړه د ده کلونو لپاره) چې د ډاټا د باور وړ جریان د ډاټا سره هر څه لپاره مهم دی. data flow ډیزاین Kreps [په بل کې: زه د دقیق quote په لټه کې وه او دا په خپل ' زه د لوستلو څخه خوښم ’ masterpiece. زه وروسته په یاد ولرئ چې، یو پارامتر په اړه، هغه دا د اړتياوو د توازن د توازن د توازن جوړوي، سره یو "په ارزښت دی چې د ښکلا په پام کې ونیسئ" چې د ښه اندازه لپاره (د جیو سپارښتنه)! د تړاو کار په اړه خبرې کول، زه هم وروسته (د دانيلي Tunkelang) د هیلاری میسن او کرس ویګینس په غوره کې راځي. پته په اړه چې د معلوماتو څیړونکي کار کوي. ورځو مخکې، Sean Taylor نندارې د معلوماتو علومو د اړتیاوو د خپل د معلوماتو علومو پیرامیډ (د معلوماتو علومو Unconjoined Triangle) چې، البته، په بشپړه توګه مختلف دی. شاید موږ باید یو tumblr پیل کړي.] زه د لوستلو څخه خوښم پته نندارې یوازې کله چې د معلوماتو ته لاس رسیږي، تاسو کولی شئ دا شامل دي د معلوماتو د پاکولو، د معلوماتو علومو د کمېسيک برخه چې به د بل پست موضوع وي. دا کله چې تاسو پوه شئ چې تاسو د معلوماتو ټوټه له لاسه ورکړئ، ستاسو سینسرونه غیر قابل اعتماد دي، د نسخه بدلون معنی لري چې ستاسو د واقعاتو له لاسه ورکړئ، تاسو د بیلګې په غلطو تفاهم کوي - او تاسو به د پیراميډ بډی ډاډ ډاټا ورکړئ. explore and transform کله چې تاسو کولی شئ د ډاټا په اعتبار سره څیړئ او پاک کړئ، تاسو کولی شئ هغه څه جوړ کړئ چې په معمولي توګه د BI یا BI په توګه فکر کیږي. : د پیژندنې معیارونه، دوی د موسمیت او د مختلفو عواملو ته حساسیت مشخص کړئ. شاید ځینې روژه کاروونکي segmentation ترسره کړئ او وګورئ که څه هم ځي. په هرصورت، ځکه چې ستاسو هدف AI دی، تاسو اوس د هغه څه جوړ کړئ چې تاسو به وروسته په توګه فکر وکړئ ستاسو د ماشین زده کړې ماډل کې شامل کړئ. په دې مرحله کې، تاسو هم پوه شئ چې تاسو غواړئ څه مخنیوی یا زده کړئ، او تاسو کولی شئ ستاسو د زده کړې لپاره چمتو کړئ. له ځانګړنو د توليد، په اتوماتيک ډول (که مشتریانو چمتو شوي دي؟) یا د انسان په چڼاسکه کې. analytics features training data دا هم کله چې تاسو د خپل ترټولو هیجان زده کړې او حیرانتیا لرئ - مګر دا هم د نورو Medium پست موضوع دی. data stories ایا تاسو کولی شئ حساب وکړئ؟ اوس څه؟ موږ د روزنې ډاټا لري - البته، اوس موږ کولی شو ماشين زده کړې وکړي؟ شاید، که تاسو په داخلي ډول چیرې چمتو کړئ؛ نه، که د پایلې به د مشتریانو لپاره وي. موږ باید د A / B ازموینې یا په ځای کې، نو موږ کولی شو د تشناب څخه مخنیوی او د بدلونونو اغیزو په اړه د ګرځنده اندازې ترلاسه کړي مخکې چې دوی هرڅه ته اغیزه کړي. دا هم د مناسب وخت ده چې په ډیری وختونو کې د تشناب څخه مخنیوي. په ځای کې (د سپارښتنه سیسټمونو لپاره، دا به د مثال په توګه د "د مشهور ترین" وي، او بیا "د ستاسو د کاروونکي ټولګیټ لپاره ترټولو مشهور" وي - د ډیر ناقانونه خو اغیزمن "د شخصي کولو مخکې"). experimentation simple baseline ساده heuristics په حیرانتیا سره سخت دي، او دوی به تاسو ته اجازه ورکوي چې د سیسټم په پای کې د مخکښ ML تور بکسونه سره په منځ کې hypertuned hyperparameters له لاسه ورکړي. دا هم د دې لپاره چې زما د معلوماتو علومو algorithm برخه ده. په دې وخت کې، تاسو کولی شئ یو خورا ساده ML algorithm (چې لوژستیک ریګریشن یا، بله، تقسیم) جوړ کړئ، بیا د نوي سیگنالونو او ځانګړتیاوو په اړه فکر وکړئ چې ممکن ستاسو د پایلو اغیزه کړي. د هوايي او د کلکاتو معلوماتو زما ګوتو دي. او نه - لکه څنګه چې دا قوي دی، عمیق زده کړې به په اتوماتيک ډول ستاسو لپاره دا نه کوي. د نوي سیگنالونو (د ځانګړتیاو جوړولو، نه د ځانګړتیاو انجینريشن) له لارې ستاسو د کړنو ښه کړي. دا د دې لپاره ارزانه ده چې دلته ځینې وخت ورکړئ، حتی که موږ د معلوماتو څیړونکي په توګه د پیراميډ کې د بل کچه ته لاړ شئ. په AI کې راځي! تاسو یې جوړ کړئ. تاسو وسایلو لري. ستاسو ETL هومنگ دی. ستاسو ډاټا سازمان شوي او پاک دی. تاسو د ډیزاین بورډونه، لیبلونه او ښه ځانګړتیاوې لري. تاسو د مناسب چیزونو اندازه کولو کې دی. تاسو کولی شئ ورځني تجربې وکړئ. تاسو د بیلابیلو algorithm لري چې د پای ته ورسیږي او په تولید کې چمتو کیږي - او تاسو دا د ډیرو وختونو کې بدل کړئ. تاسو چمتو یاست. د دې لپاره چمتو کړئ او د ټولو وروستیو او غوره ځانګړتیاوې هڅه وکړئ - د خپل ځان په کارولو څخه د ماشین یادولو په تخصص کې کارولو لپاره. تاسو کولی شئ د تولید په اړه ځینې لوی پرمختګونه ترلاسه کړئ، یا تاسو کولی شئ نه. بدترین صورت کې، تاسو د نوي طریقې زده کړئ، د دوی سره انتظار، د MVPs، د چټک، لیان او داسې څه؟ لکه څنګه چې کله چې تاسو د روښانه MVP (د لږ تر لږه د ژوند وړ محصول) جوړ کړئ، تاسو د خپل محصول د کوچني، بډایه برخه څخه پیل کړئ او تاسو کولی شئ دا په پایله کې ښه کار وکړي. تاسو کولی شئ د پیرامیډ جوړ کړئ، بیا دا په نړيوال کې وده ورکړئ. د مثال په توګه، په Jawbone، موږ د خواب د معلوماتو سره پیل کړ او د پیرامیډ جوړ کړ: وسایلو، ETL، پاکول او سازمان، نښلیدنې او تعریفونه، مټريکونه (په هر رات کې د خلکو د ساعتونو په منځنۍ توګه څه ده؟ د نومونو په اړه څه؟ د نومونو په اړه څه دی؟)، د مختلفو برخو تحلیل کوي. او د ماشین زده کړې له خوا د ډاټا محصولاتو (اوتوماتيک نوم تشخیص). موږ وروسته دا د ګامونو، وروسته د خوړو، د هوا، روزنې، ټولنیز شبکې او اړیکو - یو په هر وخت کې. موږ د ټولو پوښونو د انټرنېټ د جوړولو پرته له دې چې هیڅکله دا په پای کې کار وکړي. The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. د معلوماتو تاریخ پراختیا د مناسب پوښتنو پوهیږو او د مناسب محصولات جوړ کړئ دا یوازې د هغه څه په اړه چې تاسو نه که تاسو (د pragmatic یا اخلاقي دلیلونو له امله). could should د ماشين زده کړې وسایلو د وعده ‘ ’ انتظار، د Amazon API یا TensorFlow یا د نورو د عادي سرچینه کتابتون په اړه څه؟ د شرکتونو په اړه څه چې د ML وسایلو خرڅلاو کوي، یا چې په اتوماتيک ډول د معلوماتو او ځانګړتیاوې اخلي؟ ټول دا حیرانتیا او ډیر ګټور دی. (د ځینې شرکتونه په پایله کې ستاسو د ټول پیرامیډ جوړوي ترڅو دوی خپل کار ښودل کړي. دوی ګروپونه دي.) په هرصورت، د اوسني AI hype قوي اغیزه لاندې، خلک هڅه کوي چې د ډاټا ته وښيي چې بریښنا او بشپړ کچې لري، کوم چې د فورمه او معنی بدلون په داسې حال کې د کلونو کې پراخ دی، کوم چې هیڅکله درک نه کوي، کوم چې په سمه توګه جوړ شوی دی، او انتظار کوي چې دا وسایلو جادو سره کار وکړي. او شاید يو ورځ به دا وي؛ زه وګورئ او د دې سمت کې هڅو پرته. تر هغه وخت ته، دا د اړتیاو ستاسو د AI پیرامیډ لپاره یو پیاوړتیا جوړښت ارزښت لري.