වේගයෙන් දියුණු තාක්ෂණය සමඟ සාමාන් යයෙන් සිදු වන පරිදි, AI විශාල ප්රමාණයක් ආකර්ෂණය කර ඇත. , සහ සමහරක් ඒකට සුදුසුයි, — නමුත් කර්මාන්තය අවධානය යොමු කරයි. stealth hardware startups සිට fintech gigs දක්වා රාජ්ය ආයතන, කණ්ඩායම් ඔවුන්ගේ AI උපාය මාර්ගයේ දැඩි ලෙස වැඩ කරයි. ෆෝම ෆුඩ් ෆෙඩොස් සමහර ඒවා නොවෙයි ‘අපි කරන දේවල්වලට වඩා හොඳ වීමට අපි AI සහ යන්ත්ර ඉගෙනීම භාවිතා කරන්නේ කෙසේද?’ ‘අපි කරන දේවල්වලට වඩා හොඳ වීමට අපි AI සහ යන්ත්ර ඉගෙනීම භාවිතා කරන්නේ කෙසේද?’ බොහෝ විට, සමාගම් කට්ටියම ලෑස්ති වෙන්න ඇති.ඔයාට කට්ටියම තරු වලට වඩා අඩු ප් රතිඵල සඳහා, හෝ සමහර විට ඔවුන්ගේ සංස්කෘතිය සඳහා මධ් යම නොවේ.ඒත්, වඩාත් පොදු තත්ත්වය වන්නේ ඔවුන් තවමත් ප්රමුඛතම ප්රතිලාභ ක්රියාත්මක කිරීමට (ඔබගේ ප්රතිලාභ භුක්ති විඳීමට) ආයුධ ගොඩනැගීම නොලැබීමයි. වැඩපිළිවෙළ සහ වැඩපිළිවෙළ, ඉතා අඩු . not පළමු දත්ත විද් යාඥයා දත්ත ලිංගිකත්වය දත්ත විද් යාව මැෂින් ඉගෙනීම දත්ත විද්යාව / AI උපදේශකයෙකු ලෙස, මම මේ පණිවිඩය අළුත් වතාවක් ලබා ගත යුතු විය, විශේෂයෙන් පසුගිය වසර දෙක තුළ. ඔබේම ක්ෂේත් රය වටා ඇති සියලුම උනන්දුව අතර හිස් වළක්වා ගැනීම අමාරුයි, විශේෂයෙන් ඔබ එම උනන්දුව බෙදා ගන්නේ නම්. එකඟයි මෙන්න වැඩිම ප් රතිචාරයක් ලැබූ පැහැදිලි කිරීම්: Think of AI as the top of a අවශ් යතා පිරමීඩය . Yes, self-actualization (AI) is great, but you first need food, water and shelter (data literacy, collection and infrastructure). අවශ් යතා පිරමීඩය මූලික අවශ්යතා: ඔබ ගණනය කළ හැකිද? පිරමීඩයේ පහළින් අපි ඔබට අවශ් ය දත්ත මොනවාද, සහ ලබා ගත හැකි දත්ත මොනවාද? එය පරිශීලකයාගේ නිෂ්පාදනයක් නම්, ඔබ සියලුම අදාළ පරිශීලක සන්නිවේදන ලියාපදිංචි කරන්නේද? එය සංඥාවක් නම්, මොන ආකාරයෙන් දත්ත හරහා පැමිණෙන්නේද? තවමත් උපකරණයක් නොමැති සන්නිවේදනය ලියාපදිංචි කිරීම කොතරම් පහසුද? මෑතකදී යන්ත්ර ඉගෙනීමේ දියුණුව සිදුවූ දේ මෙයයි. data collection දත්ත ඊළඟට කොහොමද කරන්නේ පද්ධතිය හරහා? ඔබ විශ්වාසදායක ප්රවාහ / ETL තිබේද ? ඔබ එය ගබඩා කරන්නේ කොතැනද, එය ප්රවේශ කිරීම හා විශ්ලේෂණය කිරීම කොතරම් පහසුද? දශකයක් තිස්සේ විශ්වාසදායක දත්ත ප් රවාහනය දත්ත සමඟ ඕනෑම දෙයක් කිරීමට ප්රධාන බව පවසයි. data flow ජේ Kreps [සමහර විට: මම නිවැරදි ප්රකාශයක් සොයමින් එය ඔහුගේ ' මම Logs වලට ආදරෙයි ’ මාස්ලෝගේ අවශ්යතා අනුකූලතාවය සමාලෝචනය කිරීම සඳහා ඔහු මෙම නිවැරදි මාස්ලෝගේ අවශ්යතා අනුකූලතාවය සිදු කරන බව මම පසුව අවබෝධ කරගත්තා, එහි හොඳ ප්රමාණයට (ජේ ස්තුතියි!). Post එක දත්ත විද් යාඥයා කරන්නේ කුමක්ද යන්න ගැන දිනකට පෙර, ෂොන් ටේලර් අනාවැකි ඔහුගේම දත්ත විද්යාව අවශ්යතා පිරමීඩය (අරෝනීයව දත්ත විද්යාවේ Unconjoined Triangle ලෙස හඳුන්වනු ලැබේ) එය, ඇත්ත වශයෙන්ම, සම්පූර්ණයෙන්ම වෙනස් වේ. මම Logs වලට ආදරෙයි Post එක අනාවැකි දත්ත ලබා ගත හැකි නම්, ඔබ මෙය දත්ත විද්යාව පිළිබඳ අසාමාන්ය "Data Cleaning" ඇතුළත් වන අතර එය වෙනත් තැපැල්වල මාතෘකාවක් වනු ඇත.මෙය ඔබ දත්ත ගොඩාක් අහිමි වන බව සොයා ගන්නේ නම්, ඔබේ සංඥාවන්ට විශ්වාසභංගයක් නැත, සංස්කරණය වෙනස් කිරීම ඔබේ සිදුවීම් අහිමි වන අතර, ඔබ පුවරුව වැරදි ලෙස තේරුම් ගනිමින් සිටී - සහ ඔබ පිරමීඩයේ පදනම ශක්තිමත් බව සහතික කිරීම සඳහා නැවත යන්න. explore and transform ඔබ දත්ත විශ්වාසදායකව පර්යේෂණ හා පිරිසිදු කළ හැකි විට, ඔබ සම්ප්රදායිකව BI හෝ BI ලෙස සැලකෙන දේ ගොඩනැගීමට ආරම්භ කළ හැකිය. : නිරීක්ෂණය කිරීමට ප්රමාණයන්, ඔවුන්ගේ කාලගුණය සහ විවිධ සාධක වලට සංවේදීතාවය සකස් කරන්න. සමහර විට අපහසු පරිශීලක සංසන්දනය කිරීම සහ කිසිවක් එළියට එන්නේ නම් බලන්න. කෙසේ වෙතත්, ඔබේ ඉලක්කය AI වන නිසා, ඔබ දැන් ඔබට පසුව සිතෙන දේ ගොඩනැගීම ඔබේ යන්ත්ර ඉගෙනුම් ආකෘතිය ඇතුළත් කිරීම සඳහා.මේ තත්වයේදී, ඔබ අනාවැකි කිරීමට හෝ ඉගෙන ගැනීමට අවශ්ය දේ දන්නේය, ඔබ ඔබේ යන්ත්ර ඉගෙනුම් ආකෘතිය සූදානම් කිරීම ආරම්භ කළ හැකිය. ලයිබල් නිර්මාණය කිරීමෙන්, ස්වයංක්රීයව (කවුද පාරිභෝගිකයන්ට කුමක්ද?) හෝ මනුෂ් යයන් සමඟ. analytics features training data මෙය ඔබගේ වඩාත්ම ආකර්ෂණීය හා ආකර්ෂණීය බව සොයා ගන්නා විටත් වේ. ඒත් ඒකත් තවත් මැදපෙරදිග ලිපියේ ප් රශ්නය. data stories දැන් මට ගණන් කරන්න පුළුවන්.කොහොමද? අපි පුහුණු දත්ත ඇත – අනිවාර්යයෙන්ම, දැන් අපි යන්ත්ර අධ්යයනය කළ හැකි? සමහර විට, ඔබ අභ්යන්තරව CHURN අනාවැකි කිරීමට උත්සාහ කරන්නේ නම්; නැහැ, ප්රතිඵල පාරිභෝගික ප්රවේශම් වනු ඇත නම්. එමගින් අපි අනතුරක් වළක්වා ගැනීමට සහ වෙනස්වීම් සියල්ලන්ට බලපෑම් කිරීමට පෙර වෙනස්වීම්වල බලපෑම පිළිබඳ සාපේක්ෂව අවදානමක් ලබා ගත හැකිය. ස්ථාපිත වේ (අපේ නිර්දේශක පද්ධති සඳහා, මෙය උදාහරණයක් ලෙස ‘අපේ ජනප්රියතම’, පසුව ‘ඔබේ පරිශීලක සංකේතය සඳහා වඩාත් ජනප්රිය’ – ඉතා කරදරකාරී නමුත් ඵලදායී ‘පෞද්ගලිකත්වයට පෙර ස්ටෙරොයිප්’). experimentation simple baseline සරල heuristics පුදුමාකාරව පරාජය කිරීමට අපහසු වන අතර, ඔවුන් ඔබට මධ්යස්ථානයේ hypertuned hyperparameters සමග රහසිගත ML කළු පෙට්ටිය නොමැතිව පද්ධති end-to-end debug කිරීමට ඉඩ දෙනු ඇත. මේ මොහොතේ, ඔබ ඉතා සරල ML ආකෘතිය (ලොජිස්ටික් ප්රවාහන හෝ ඔව්, බෙදා හැරීම වැනි) ස්ථාපනය කළ හැකි අතර, පසුව ඔබේ ප්රතිඵලවලට බලපෑම් කළ හැකි නව සංඥා සහ විශේෂාංග ගැන සිතන්න. කාලගුණය සහ සංඛ්යාත දත්ත මගේ ප්රතිඵල වේ. සහ නැහැ - එය ශක්තිමත් වුවහොත්, ගැඹුරු ඉගෙනීම ඔබ වෙනුවෙන් ස්වයංක්රීයව මෙය නොකරයි. නව සංඥා (විශේෂ නිර්මාණ, විශේෂාංග ඉංජිනේරු කිරීම නොවේ) ගෙන යාම ඔබේ කාර්ය සාධනය වැඩි දියුණු කළ හැකිය. එහෙනම් අර AI එක දාපන්! ඔබ එය කර ඇත. ඔබ මෙවලම් කර ඇත. ඔබේ ETL අවුල් කර ඇත. ඔබගේ දත්ත සංවිධානය කර ඇත & පිරිසිදු කර ඇත. ඔබ ආකෘති, ලැයිස්තු සහ හොඳ විශේෂාංග ඇත. ඔබ නිවැරදි දේවල් මිනුම් කර ඇත. ඔබ දිනපතා අත්හදා බැලිය හැකිය. ඔබ අවසානයෙන් අවසානය දක්වා බාගත කර ඇති මූලික ඇල්ගාටීරයක් ඇති අතර නිෂ්පාදනය තුළ ක් රියාත්මක වන අතර ඔබ දස වරක් එය වෙනස් කර ඇත. ඔබ සූදානම් වේ. එහි ඇති නවතම හා විශිෂ්ටතම සියල්ල උත්සාහ කරන්න - ඔබගේම සමාගම් භාවිතා කිරීමෙන් යන්ත්ර ඉගෙනීම සඳහා විශේෂඥ වේ. ඔබ නිෂ්පාදනය තුළ විශාල වැඩි දියුණු කිරීම් ලබා ගත හැකිය, හෝ ඔබට නොහැකි විය හැකිය. නරකම අවස්ථාවකදී, ඔබ නව ක්රම ඉගෙන, ඔවුන් සමඟ අදහස් හා අත්දැක බලමු, MVPs, Agile, Lean සහ ඒ සියල්ල ගැන කුමක්ද? උදාහරණයක් ලෙස, සාමාන් ය MVP (මිළ වශයෙන් සාර්ථක නිෂ්පාදන) ගොඩනඟන විට, ඔබ ඔබේ නිෂ්පාදනයේ කුඩා, සදාචාරාත්මක කොටසක් සමඟ ආරම්භ වන අතර, ඔබ එය හොඳින් ක්රියාත්මක කළ හැක. ඔබ එහි පිරමීඩය ගොඩනඟා, පසුව එය අවම වශයෙන් වර්ධනය කළ හැක. උදාහරණයක් ලෙස, Jawbone හි, අපි නිදි දත්ත සමඟ ආරම්භ කර, එහි පිරමීඩය ගොඩනඟා: උපකරණ, ETL, පිරිසිදු කිරීම සහ සංවිධානය, ලයිබර් ගබඩා කිරීම සහ අර්ථකථන, මාතෘකාව (සෑම රාත්රී කාලයේ මිනිසුන් නිදි කරන පැය ගණන කුමක්ද? පරිගණක උගන්වන දත්ත නිෂ්පාදන (automatic sleep detection) මෙම පියවර, පසුව ආහාර, කාලගුණය, පුහුණුව, සමාජ ජාල සහ සන්නිවේදන - එක් වරක්. The data science hierarchy of needs is not an excuse to build disconnected, over-engineered infrastructure for a year. දත්ත ඉතිහාසය පුළුල් කිරීම නිවැරදි ප්රශ්න ඇසීම සහ නිවැරදි නිෂ්පාදන නිර්මාණය කිරීම මෙය ඔබගේ ආකාරය ගැන පමණක් නැත්නම් ඔබ (පාර්ශනික හෝ සදාචාරාත්මක හේතු නිසා) could should යන්ත්ර ඉගෙනීමේ මෙවලම් පිළිබඳ පොරොන්දුව ‘ ’ බලා, ඒ Amazon API හෝ TensorFlow හෝ ඒ වෙනත් විවෘත මූලාශ්ර පුස්තකාල ගැන කුමක්ද? මේ සියල්ල පුදුමාකාර හා ඉතා ප්රයෝජනවත් වේ. (මෙම සමාගම් සමහර සමාගම් ඔබේ මුළු පිරමීඩය නිශ්චිතව ගොඩනැගීමට අවසන් වන අතර, ඔවුන් ඔවුන්ගේ වැඩ පෙන්වන්න පුළුවන්. ඔවුන් වීරයන් වේ.) කෙසේ වෙතත්, වර්තමානයේ AI හයිප්ගේ ශක්තිමත් බලපෑම යටතේ, මිනිසුන් දත්ත ඇතුළත් කිරීමට උත්සාහ කරයි, එය මෝඩ හා දෝෂ සහිත, වර්තමානය හා තේරුම වෙනස් වන අතර, එය තවමත් තේරුම් ගත නොහැකි අතර, එය තේරුම් නොලැබෙන ආකාරයෙන් ව්යුහය කරන අතර, එම මෙවලම් එය මැජික් ලෙස කටයුතු කිරීමට බලාපොරොත්තු වේ.