من اخیراً کلاسی را در مورد استفاده از علم داده برای امنیت سایبری برگزار کردم، با تمرکز بر تجزیه و تحلیل داده های جمع آوری بسته ها - موضوعی تا حدی فنی و به طور سنتی خشک. رویکردی که من به اشتراک گذاشتم از تجربه من در امنیت سایبری در موسسات مالی نشأت میگرفت که مراحل اصلی مانند تجزیه و تحلیل دادههای اکتشافی، پیش پردازش و تبدیل دادههای گزارش و شناسایی ناهنجاریها را از طریق ترکیبی از خوشهبندی و تجزیه و تحلیل شبکه نموداری پوشش میداد.
یکی از جنبه های شگفت انگیز زمانی بود که برای آماده شدن برای این جلسه صرف کردم - کسری از چیزی که معمولاً سرمایه گذاری می کردم. هوش مصنوعی نقش مهمی در سادهسازی این فرآیند ایفا کرد. من از Claude برای کمک به کدنویسی، توسعه طرح کلی و حتی ایجاد اسلایدها استفاده کردم. در مجموع، کل دوره در عرض 48 ساعت آماده شد.
جلسه جذاب بود. شرکتکنندگان، عمدتاً CISOهایی که معمولاً کدنویسی نمیکنند، تمرینها را که با کمک هوش مصنوعی ساخته شدهاند، بصری و عملی میدانند. هدف من غوطه ور کردن آنها در کار مستقیم با داده ها و کدها بود. آنها به ویژه از فرصت کشف دستی آنچه که سیستمهای نظارت تهدیدات سایبری مدرن و SIEM معمولاً خودکار میکنند، قدردانی کردند و بینشی در مورد فرآیندهایی که "زیر سرپوش" اتفاق میافتند به دست آوردند.
نکته کلیدی من از کلاس بهطور شگفتآوری غیرمعمول بود: علم داده، همانطور که میدانیم، در نهایت با هوش مصنوعی جایگزین خواهد شد . این دیدگاه ممکن است زودرس - یا شاید جلوتر از زمان خود - به نظر برسد، اما این دیدگاهی است که نیاز به بحث دارد.
هشدار: برخی از این موارد ممکن است باعث تحریک افراد شود.
برای بیش از یک دهه، علم داده به عنوان "جنس ترین شغل قرن بیست و یکم" شناخته می شود. با این حال، با پیشرفت سریع هوش مصنوعی، نادیده گرفتن چالشهای اساسی این حوزه سختتر میشود. ظهور هوش مصنوعی مولد قدرتمند به خوبی می تواند نقطه عطفی برای رشته ای باشد که در نگاهی به گذشته، ممکن است بیش از آنچه در ابتدا به رسمیت شناخته شده بود، ضعیف تر تعریف شده باشد و بیش از حد تبلیغات شده باشد.
در اصل، علم داده علم کامپیوتر، آمار و هوش تجاری را با هم ترکیب میکند و به سازمانها نوید بینشهای عملی از حجم وسیع داده را میدهد. این مجموعه مهارت در دنیای داده محور امروزی غیرقابل انکار ارزشمند است. با این حال، در زیر تصویر صیقلی خود، این رشته با مسائل مهمی مواجه است. چیزی که اغلب به عنوان علم داده برچسب گذاری می شود، اغلب مشخص می شود که تکه تکه ای از وظایف مرتبط با هم است که همیشه به طور منظم در یک راستا نیستند، و بسیاری از متخصصان در این زمینه با وسعت و پیچیدگی کاملی که این رشته می طلبد، دست و پنجه نرم می کنند.
ظهور ابزارهای مبتنی بر هوش مصنوعی که قادر به مدیریت تجزیه و تحلیل دادهها، مدلسازی و تولید بینش هستند، میتواند باعث تغییر در نحوه نگاه ما به نقش و آینده علم داده شود. از آنجایی که هوش مصنوعی به سادهسازی و خودکارسازی بسیاری از وظایف اساسی در علم داده ادامه میدهد، این حوزه ممکن است با حسابرسی در مورد معنای واقعی دانشمند داده بودن در عصر اتوماسیون هوشمند مواجه شود.
بسیاری از دانشمندان داده، علیرغم استفاده از مهارتهای پیچیده کدنویسی و ابزارهای دیجیتال، به کارهایی دست میزنند که بهطور شگفتانگیزی دستی و مستعد خطا هستند. آماده سازی، پاکسازی و تجزیه و تحلیل داده ها شامل کارهای خسته کننده و وقت گیر است که تکراری و مکانیکی هستند. در واقع، مقدار قابل توجهی از کار علم داده صرف آمادهسازی مجموعههای داده میشود – کاری که اغلب بیشتر شبیه کار سختی است تا علمی هیجانانگیز و مبتنی بر کشف. این مشکل با این واقعیت تشدید می شود که بسیاری از کسانی که وارد این عرصه می شوند، در بهترین حالت، آماتور هستند. پس از گذراندن چند دوره آنلاین در پایتون یا R، این "دانشمندان داده" اغلب برای سختی های نقش آماده نیستند . علم داده فقط کدنویسی نیست. این شامل تجزیه و تحلیل عمیق، درک زمینه، و توانایی ارائه بینش به مخاطبان غیر فنی است. در حقیقت، این بیشتر یک کار تحقیقاتی است و به ترکیبی از خلاقیت و تفکر تحلیلی نیاز دارد که بسیاری در این زمینه به سادگی از آن برخوردار نیستند.
بهعلاوه، بسیاری از دانشمندان دادهها حس استحقاق را توسعه دادهاند، و انتظار حقوقهای بالا و بستههای پرسود را فقط بر اساس عنوان خود دارند. این نگرش شرکتها را بهویژه در بخشهایی که بهرهوری هزینه در آنها مهم است، خاموش میکند. من با شرکت هایی ملاقات کرده ام که زمانی برای استخدام دانشمندان داده عجله داشتند اما اکنون در حال بررسی مجدد هستند. چرا به کسی که بیشتر وقت خود را صرف مبارزه با پاکسازی داده ها می کند، دستمزدهای بالایی بپردازید، در حالی که هوش مصنوعی می تواند این کار را سریع تر، بهتر و با کسری از هزینه انجام دهد؟
همانطور که من شخصاً نوشتن کلاس را تجربه کردم، هوش مصنوعی مولد به یک نیروی قدرتمند در مناطقی که علم داده ضعیفترین است، تبدیل شده است. کارهایی مانند آمادهسازی دادهها، پاکسازی، و حتی تجزیه و تحلیل کیفی اولیه - فعالیتهایی که بیشتر وقت یک دانشمند داده را میگیرد - اکنون به راحتی توسط سیستمهای هوش مصنوعی خودکار میشوند. بدتر (یا بهتر، بسته به جایی که ایستادهاید) این است که هوش مصنوعی سریعتر، دقیقتر و کمتر مستعد خطا یا خستگی انسانی است.
برای بسیاری از دانشمندان داده، این می تواند وحشتناک باشد. به هر حال، این وظایف نشان دهنده بخش عمده ای از کار روزانه آنهاست. به عنوان مثال، پاکسازی داده ها بسیار وقت گیر و مستعد اشتباه است، اما هوش مصنوعی اکنون می تواند آن را با چند کلیک و دقت تقریباً کامل انجام دهد. دانشمندان داده اغلب از این وظایف غرغرو شکایت می کنند، با این حال آنها برای نقش آنها اساسی هستند. با پیشرفت سیستم های هوش مصنوعی، نیاز انسان به انجام این مشاغل کاهش می یابد. تعجب آور نیست که بسیاری از انتقادات صریح علیه هوش مصنوعی از سوی خود دانشمندان داده می آید . آنها نوشته های روی دیوار را می بینند و از شغل خود می ترسند.
برای بدتر شدن اوضاع برای دانشمندان داده، این رشته در سال های اخیر پیشرفت چشمگیری نداشته است. علیرغم افزایش محبوبیت آن، علم داده همچنان با ناکارآمدی ها، خطاها و عدم شفافیت در مورد اینکه دقیقاً چه چیزی باید به دنبال داشته باشد گرفتار است. زمانی اعتقاد بر این بود که ابزارهای پیشرفتهتر و آموزش بهتر این رشته را تکامل میبخشد، اما این امر در حد انتظار محقق نشد. در مقابل، هوش مصنوعی به طور پیوسته بهبود یافته است. الگوریتم های یادگیری ماشینی، پردازش زبان طبیعی و مدل های مولد به سرعت در حال تکامل هستند و علم داده سنتی را در گرد و غبار رها می کنند.
باز هم، انتظارات بالای دستمزد دانشمندان داده موضوع را تشدید می کند . شرکتهایی که ممکن است زمانی ناکارآمدیها را تحمل میکردند، اکنون متوجه شدهاند که هوش مصنوعی میتواند جایگزین بسیاری از کارهای ناخوشایند بدون برچسب قیمت سنگین کار انسانی شود. با مهارت بیشتر هوش مصنوعی در انجام وظایف کلیدی مانند تجزیه و تحلیل، پیش بینی و حتی ارائه، ماهیت دستی علم داده به طور فزاینده ای زائد می شود. بسیاری از شرکتها متوجه خواهند شد که آنچه در گذشته به تیمی از دانشمندان داده نیاز داشت، اکنون میتواند با استفاده از ابزارهای مبتنی بر هوش مصنوعی کارآمدتر مدیریت شود.
واقعیت این است که علم داده، همانطور که به طور سنتی تعریف می شود، در آستانه منسوخ شدن است. با پیشرفت هوش مصنوعی مولد با سرعت خیره کننده، تقاضا برای دانشمندان داده های انسانی به شکل فعلی آنها احتمالا کاهش خواهد یافت . این بدان معنا نیست که انسان ها هیچ نقشی در تصمیم گیری مبتنی بر داده ندارند، اما نقش کلاسیک "دانشمند داده" ممکن است به زودی مفهومی از گذشته شود. آنچه در حال حاضر مورد نیاز است، متخصصان ماهر در همکاری با هوش مصنوعی، بهره گیری از قابلیت های آن و در عین حال تمرکز بر تفکر استراتژیک و حل مشکلات پیچیده در سطح بالاتر است.
هوش مصنوعی پایان تجزیه و تحلیل، بینش یا تصمیم گیری نیست، بلکه نشان دهنده تکامل آنهاست . حوزه کنونی علم داده در صورتی که به صورت گام به گام توسعه پیدا نکند، خطر منسوخ شدن را دارد. هوش مصنوعی در حال حاضر صنایع را متحول کرده است و علم داده باید خود را با آن سازگار کند و یا در خطر غلبه بر این موج باشد. در نهایت، این سوال ممکن است این نباشد که آیا هوش مصنوعی علم داده را حذف خواهد کرد یا خیر، بلکه سوال این باشد که آیا علم داده تا به حال به طور کامل به وعده های خود عمل کرده است یا خیر.
یا شاید تمایز حتی مهم نباشد اگر ما در نهایت از هیاهوی «علم داده» فراتر برویم و هوش مصنوعی را به عنوان پیشرفت منطقی بعدی بپذیریم.
درباره من: کهنه سرباز 25 ساله فناوری اطلاعات، ترکیبی از داده ها، هوش مصنوعی، مدیریت ریسک، استراتژی و آموزش. برنده 4 برابر هکاتون و تأثیر اجتماعی از طرف مدافع داده. در حال حاضر برای راه اندازی نیروی کار هوش مصنوعی در فیلیپین کار می کنیم. در اینجا درباره من بیشتر بیاموزید: https://docligot.com