সাধারণত দ্রুত অগ্রগতিশীল প্রযুক্তিগুলির ক্ষেত্রে, এআই একটি বিশাল অনুপ্রাণিত করেছে , এবং এর কিছু অংশই প্রাপ্য। - কিন্তু শিল্প মনোযোগ দেয়. গোপন হার্ডওয়্যার স্টার্টআপ থেকে ফিনটেক গাইড থেকে পাবলিক প্রতিষ্ঠানগুলিতে, টিমগুলি তাদের আইটি কৌশল নিয়ে তীব্রভাবে কাজ করছে। ফোমো ফুড ফেভার এর কয়েকটি না ‘আমরা যা করি তা উন্নত করার জন্য আমরা কিভাবে এআই এবং মেশিন শিখা ব্যবহার করি? ‘আমরা যা করি তা উন্নত করার জন্য আমরা কিভাবে এআই এবং মেশিন শিখা ব্যবহার করি? সাধারণত কোম্পানিগুলোর চেয়ে তারা হয়তো চাকরির জন্য প্রস্তুত। নক্ষত্রের চেয়েও কম ফলাফল, অথবা কিন্তু সবচেয়ে সাধারণ পরিস্থিতি হল যে তারা এখনও সর্বাধিক মৌলিক অবকাঠামো বাস্তবায়নের জন্য অবকাঠামো তৈরি করেনি (এবং এর সুবিধাগুলি উপভোগ করতে পারে) অ্যালগরিদম এবং অপারেশন, অনেক কম . not প্রথম ডাটা বিজ্ঞানী ডাটা সাহিত্য ডাটা বিজ্ঞান মেশিন শিক্ষা ডাটা বিজ্ঞান / আইআই পরামর্শদাতা হিসাবে, আমার এই বার্তাটি অসংখ্যবার প্রেরণ করতে হয়েছিল, বিশেষ করে গত দুই বছরে। আপনার নিজের ক্ষেত্রের সমস্ত উত্তেজনাগুলির মধ্যে একটি নোংরা কাপড় হওয়া কঠিন, বিশেষ করে যদি আপনি সেই উত্তেজনাটি ভাগ করেন। একমত এখানে একটি ব্যাখ্যা যা সবচেয়ে বেশি সংশ্লিষ্ট: Think of AI as the top of a চাহিদা পিরামিড . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). চাহিদা পিরামিড মৌলিক চাহিদা: আপনি হিসাব করতে পারেন? পিরামিডের নীচে আমরা . আপনার কোন ডেটা দরকার, এবং কি উপলব্ধ? যদি এটি একটি ব্যবহারকারীর উদ্দেশ্য পণ্য, আপনি সমস্ত প্রাসঙ্গিক ব্যবহারকারীর ইন্টারেক্টিভেশন লগ করছেন? যদি এটি একটি সেন্সর, কোন ডেটা আসে এবং কিভাবে? এখনও যন্ত্রপাতি না করা ইন্টারেক্টিভেশন লগ করা কতটা সহজ? যা মেশিন শেখার সাম্প্রতিক অগ্রগতিগুলি সম্ভব করেছে। data collection ডাটাবেস তারপর, কিভাবে এটি সিস্টেমের মাধ্যমে? আপনার কি নির্ভরযোগ্য স্ট্রিম / ETL আছে? আপনি এটি কোথায় সংরক্ষণ করেন, এবং এটি অ্যাক্সেস এবং বিশ্লেষণ করা কতটা সহজ? প্রায় এক দশক ধরে আমরা বলেছি যে, ডেটা নিয়ে যেকোনো কাজ করার জন্য নির্ভরযোগ্য ডেটা প্রবাহই চাবিকাঠি। data flow জে ক্রিপস [পাশাপাশি: আমি একটি সঠিক উদ্ধৃতি খুঁজছিলাম এবং এটি তার মধ্যে খুঁজে পেয়েছিলাম। লগইন ভালোবাসি ’ যাদুকরী. আমি তারপর লক্ষ্য করেছি যে, এক অনুচ্ছেদে, তিনি এই সঠিক ম্যাসলো এর প্রয়োজনীয়তা তুলনা তালিকা তৈরি করছেন, একটি "এটা স্পষ্টভাবে উল্লেখ করা দরকার" ভাল পরিমাপের জন্য সেখানে ফেলে দেওয়া হয় (জে ধন্যবাদ!). সম্পর্কিত কাজের কথা বলতে, আমি পরে হিলারি মেসন এবং ক্রিস উইগিনসের চমৎকার কাজে (ড্যানিয়েল টনক্যাঙ্গ) প্রবেশ করেছি। পোস্ট ডাটা বিজ্ঞানী কি করে সে সম্পর্কে কিছুদিন আগে, শোন টেইলর আবিষ্কার তার নিজস্ব ডাটা বিজ্ঞান চাহিদা পিরামিড (আরোনিকভাবে ডাটা বিজ্ঞানের অসম্পূর্ণ ট্রায়াংক নামে পরিচিত) যা, অবশ্যই, সম্পূর্ণ ভিন্ন। লগইন ভালোবাসি পোস্ট আবিষ্কার শুধুমাত্র যখন তথ্য অ্যাক্সেসযোগ্য, আপনি এটি একটি বিখ্যাত "ডাটা পরিষ্কার" অন্তর্ভুক্ত করে, ডাটা বিজ্ঞানের একটি নিম্নমানের দিক যা অন্য পোস্টের বিষয় হবে. এটি যখন আপনি আবিষ্কার করেন যে আপনি ডেটা একটু মিস করছেন, আপনার সেন্সরগুলি নির্ভরযোগ্য নয়, একটি সংস্করণ পরিবর্তন আপনার ঘটনাগুলি ছাড়িয়ে যায়, আপনি একটি পতাকা ভুল ব্যাখ্যা করছেন - এবং আপনি পিরামিডের ভিত্তি নিশ্চিত করার জন্য ফিরে যান। explore and transform যখন আপনি নির্ভরযোগ্যভাবে ডেটা অনুসন্ধান এবং পরিষ্কার করতে সক্ষম হন, তখন আপনি যা ঐতিহ্যগতভাবে বিআই বা বিআই হিসাবে বিবেচনা করা হয় তা নির্মাণ করতে শুরু করতে পারেন। : ট্র্যাক করার জন্য মেট্রিক্স নির্ধারণ করুন, তাদের মৌসুমীতা এবং বিভিন্ন কারণগুলির প্রতি সংবেদনশীলতা। হয়তো কিছু কঠোর ব্যবহারকারীর সেগমেন্টিং করুন এবং দেখুন যদি কোনও জিনিস বেরিয়ে আসে। এই পর্যায়ে, আপনি জানেন কি আপনি পূর্বাভাস বা শিখতে চান, এবং আপনি আপনার প্রস্তুতি শুরু করতে পারেন লেবেলগুলি উত্পাদন করে, অথবা স্বয়ংক্রিয়ভাবে (কোন গ্রাহকগুলি চুরি করেছে? analytics features training data এটি এমনকি যখন আপনি আপনার সবচেয়ে উত্তেজনাপূর্ণ এবং বিশ্বাসযোগ্য খুঁজে পেতে তবে এটাই আরেকটি মিডিয়ার বিষয়। data stories আমি বলতে পারি, এখন কী হবে? আমরা প্রশিক্ষণ ডেটা আছে - অবশ্যই, এখন আমরা মেশিন শিখতে পারি? সম্ভবত, যদি আপনি অভ্যন্তরীণভাবে churn পূর্বাভাস করার চেষ্টা করছেন; না, যদি ফলাফল গ্রাহক দৃষ্টিভঙ্গি হবে। ফ্রেমওয়ার্ক স্থাপন করা হয়েছে, যাতে আমরা দুর্যোগ এড়ানোর জন্য ক্রমবর্ধমানভাবে সেবা প্রদান করতে পারি এবং পরিবর্তনগুলির প্রভাবগুলি প্রভাবিত হওয়ার পূর্বে তাদের প্রভাবিত হওয়ার একটি গভীর অনুমান পেতে পারি। জায়গা (নির্দেশক সিস্টেমগুলির জন্য, এটি উদাহরণস্বরূপ "সেরা জনপ্রিয়", তারপর "আপনার ব্যবহারকারীর সেগমেন্টের জন্য সবচেয়ে জনপ্রিয়" - খুব বিরক্তিকর কিন্তু কার্যকরী "ব্যক্তিগতকরণের আগে স্টেরয়েটাইপ")। experimentation simple baseline সহজ heuristics আশ্চর্যজনকভাবে আঘাত করা কঠিন, এবং তারা আপনাকে সিস্টেম এন্ড-টোয়েন্টি ডাবগিং ছাড়া রহস্যময় ML ব্ল্যাক বক্স সঙ্গে হাইপারটনড হাইপারপ্যারামিটার মাঝখানে. এছাড়াও কারণ আমার প্রিয় ডেটা বিজ্ঞান অ্যালগরিদম বিভাজন. এই মুহূর্তে, আপনি একটি খুব সহজ এমএল অ্যালগরিদম (যেমন লজিস্টিক প্রত্যাবর্তন বা, হ্যাঁ, বিভাজন) ব্যবহার করতে পারেন, তারপর নতুন সংকেত এবং বৈশিষ্ট্যগুলি চিন্তা করতে পারেন যা আপনার ফলাফলগুলি প্রভাবিত করতে পারে। আবহাওয়া এবং সংখ্যালঘু ডেটা আমার গুটো। এবং না - যতটা শক্তিশালী যে, গভীর শিক্ষা আপনার জন্য এটি স্বয়ংক্রিয়ভাবে করে না। একে একে নিয়ে যান! আপনি এটি তৈরি করেছেন. আপনি যন্ত্রপাতি আছে. আপনার ইটিএল হামিং হচ্ছে. আপনার ডেটা সংগঠিত এবং পরিষ্কার করা হয়. আপনার ড্যাশবোর্ড, লেবেল এবং ভাল বৈশিষ্ট্য আছে. আপনি সঠিক জিনিসগুলি পরিমাপ করছেন. আপনি প্রতিদিন পরীক্ষা করতে পারেন. আপনার একটি মৌলিক অ্যালগরিদম আছে যা শেষ-শেষে ডাবগিং করা হয়েছে এবং উত্পাদনে চলছে - এবং আপনি এটি দশ বার পরিবর্তন করেছেন। আপনি প্রস্তুত আছেন। এখানে সবচেয়ে সাম্প্রতিক এবং সবচেয়ে বড় চেষ্টা করুন - আপনার নিজের রোলিং থেকে মেশিন শিখতে বিশেষ কোম্পানিগুলি ব্যবহার করতে। আপনি উৎপাদনে কিছু বড় উন্নতি পেতে পারেন, অথবা আপনি হয়তো না। খারাপ ক্ষেত্রে, আপনি নতুন অপেক্ষা করুন, MVPs, এজিল, লেইন এবং সবকিছু সম্পর্কে কি? একইভাবে যখন আপনি একটি ঐতিহ্যগত MVP (মিনিমাত্রা বাস্তবায়নযোগ্য পণ্য) তৈরি করেন, তখন আপনি আপনার পণ্যের একটি ছোট, স্থিতিশীল বিভাগ দিয়ে শুরু করেন এবং আপনি এটি শেষ পর্যন্ত ভাল কাজ করতে পারেন. আপনি তার পিরামিড তৈরি করতে পারেন, তারপর পৃথকভাবে এটি বৃদ্ধি করতে পারেন. উদাহরণস্বরূপ, জ্যাভোনে, আমরা ঘুমের ডেটা দিয়ে শুরু করেছি এবং তার পিরামিড তৈরি করেছি: যন্ত্রপাতি, ইটিএল, পরিষ্কার এবং সংগঠন, লেবেল ক্যাপচার এবং সংজ্ঞাগুলি, মেট্রিক্স (যারা প্রতি রাতে ঘুমিয়ে থাকে তার গড় # কি? এবং মেশিন শেখার ডেটা পণ্য (অটোমেটিক ঘুম সনাক্তকরণ) আমরা পরে এটি ধাপে ধাপে, তারপর খাদ্য, আবহাওয়া, workouts, সামাজিক নেটওয়ার্ক এবং যোগাযোগ - এক এক। The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. ডাটা ইতিহাস প্রসারিত সঠিক প্রশ্ন জিজ্ঞাসা এবং সঠিক পণ্য নির্মাণ এটা শুধু কিভাবে আপনি আপনি কি না (অর্থাৎ নৈতিক ও নৈতিক কারণে) could should মেশিন শেখার সরঞ্জামগুলির প্রতিশ্রুতি ‘ ’ অপেক্ষা করুন, এই অ্যামাজন এপিআই বা TensorFlow বা অন্য ওপেন সোর্স লাইব্রেরি সম্পর্কে কি? (কিছু কোম্পানি আপনার পুরো পিরামিডটি কঠোরভাবে কাস্টমাইজ করতে শেষ করে যাতে তারা তাদের কাজটি প্রদর্শন করতে পারে। তারা নায়ক) তবে, বর্তমান আইটি হাইপের শক্তিশালী প্রভাবের অধীনে, লোকেরা এমন ডেটা সংযোগ করার চেষ্টা করে যা নোংরা এবং ঘাটতিগুলি পূর্ণ করে, যা ফরম্যাট এবং অর্থ পরিবর্তন করে, যা এখনও বোঝা যায় না, যা যুক্তিযুক্ত উপায়ে গঠিত হয়, এবং সেই সরঞ্জামগুলি যাদুকরিকভাবে এটি পরিচালনা করতে আশা করে।