เมื่อไม่นานมานี้ ฉันได้จัดชั้นเรียนเกี่ยวกับการใช้วิทยาศาสตร์ข้อมูลสำหรับการรักษาความปลอดภัยทางไซเบอร์ โดยเน้นที่การวิเคราะห์ข้อมูลการจับแพ็คเก็ต ซึ่งเป็นหัวข้อที่ค่อนข้างเป็นเทคนิคและค่อนข้างน่าเบื่อ แนวทางที่ฉันแบ่งปันนั้นดึงมาจากประสบการณ์ของฉันในการรักษาความปลอดภัยทางไซเบอร์ภายในสถาบันทางการเงิน ซึ่งครอบคลุมถึงขั้นตอนหลักๆ เช่น การวิเคราะห์ข้อมูลเชิงสำรวจ การประมวลผลล่วงหน้าและการแปลงข้อมูลบันทึก และการระบุความผิดปกติผ่านการผสมผสานของการวิเคราะห์คลัสเตอร์และเครือข่ายกราฟ
สิ่งที่น่าแปลกใจอย่างหนึ่งคือเวลาที่ฉันใช้เตรียมตัวสำหรับเซสชันนี้ ซึ่งใช้เวลาเพียงเศษเสี้ยวของเวลาปกติ AI มีบทบาทสำคัญในการปรับกระบวนการให้มีประสิทธิภาพมากขึ้น ฉันใช้ Claude ช่วยในการเขียนโค้ด พัฒนาโครงร่าง และแม้แต่สร้างสไลด์ โดยรวมแล้ว หลักสูตรทั้งหมดเสร็จภายใน 48 ชั่วโมง
เซสชันนี้กลายเป็นเซสชันที่น่าสนใจ ผู้เข้าร่วมส่วนใหญ่มักจะเป็น CISO ที่ไม่ค่อยเขียนโค้ด พบว่าแบบฝึกหัดที่จัดทำขึ้นด้วยความช่วยเหลือของ AI นั้นใช้งานง่ายและเน้นการปฏิบัติจริง เป้าหมายของฉันคือการให้พวกเขาได้สัมผัสกับการทำงานโดยตรงกับข้อมูลและโค้ด พวกเขารู้สึกขอบคุณเป็นอย่างยิ่งที่ได้มีโอกาสสำรวจด้วยตนเองว่าระบบเฝ้าระวังภัยคุกคามทางไซเบอร์และแพลตฟอร์ม SIEM ในปัจจุบันทำอะไรโดยอัตโนมัติบ้าง โดยได้รับข้อมูลเชิงลึกเกี่ยวกับกระบวนการต่างๆ ที่เกิดขึ้น "เบื้องหลัง"
บทเรียนสำคัญที่ผมได้รับจากชั้นเรียนนี้เป็นสิ่งที่ขัดกับสามัญสำนึกอย่างน่าประหลาดใจ นั่นคือ วิทยาศาสตร์ข้อมูลตามที่เรารู้จักนั้น จะถูกแทนที่ด้วย AI ในที่สุด มุมมองนี้อาจดูเร็วเกินไปหรืออาจจะเกินยุคสมัยไปสักหน่อย แต่ก็เป็นมุมมองที่ควรค่าแก่การพูดคุย
คำเตือน: บางส่วนนี้อาจก่อให้เกิดผลกระทบต่อผู้คนได้
ตลอดกว่าทศวรรษที่ผ่านมา วิทยาศาสตร์ข้อมูลได้รับการยกย่องว่าเป็น "งานที่เซ็กซี่ที่สุดในศตวรรษที่ 21" อย่างไรก็ตาม ในขณะที่ปัญญาประดิษฐ์มีความก้าวหน้าอย่างรวดเร็ว ก็เริ่มชัดเจนว่าความท้าทายพื้นฐานของสาขานี้ยากที่จะมองข้าม การถือกำเนิดของปัญญาประดิษฐ์ที่ทรงพลังอาจเป็นจุดเปลี่ยนสำหรับสาขาที่เมื่อมองย้อนกลับไป อาจถูกกำหนดไว้อย่างคลุมเครือและได้รับการโปรโมตเกินจริงมากกว่าที่ยอมรับในตอนแรก
โดยพื้นฐานแล้ว วิทยาศาสตร์ข้อมูลเป็นการผสมผสานระหว่างวิทยาการคอมพิวเตอร์ สถิติ และไหวพริบทางธุรกิจ ทำให้องค์กรต่างๆ มีโอกาสได้รับข้อมูลเชิงลึกที่นำไปปฏิบัติได้จากข้อมูลจำนวนมหาศาล ชุดทักษะนี้มีค่าอย่างปฏิเสธไม่ได้ในโลกปัจจุบันที่ขับเคลื่อนด้วยข้อมูล อย่างไรก็ตาม ภายใต้ภาพลักษณ์ที่ดูดี สาขานี้ยังคงเผชิญกับปัญหาสำคัญ สิ่งที่มักเรียกกันว่าวิทยาศาสตร์ข้อมูลนั้น มักกลายเป็นงานปะติดปะต่อกันที่ไม่เกี่ยวข้องกันและไม่ได้สอดคล้องกันเสมอไป และผู้เชี่ยวชาญหลายคนในสาขานี้ต้องดิ้นรนกับขอบเขตและความซับซ้อนทั้งหมดที่สาขานี้ต้องการ
การเพิ่มขึ้นของเครื่องมือที่ขับเคลื่อนด้วย AI ที่สามารถจัดการการวิเคราะห์ข้อมูล การสร้างแบบจำลอง และการสร้างข้อมูลเชิงลึก อาจบังคับให้เกิดการเปลี่ยนแปลงในมุมมองของเราเกี่ยวกับบทบาทและอนาคตของวิทยาศาสตร์ข้อมูลเอง ในขณะที่ AI ยังคงลดความซับซ้อนและทำให้การทำงานพื้นฐานหลายอย่างในวิทยาศาสตร์ข้อมูลเป็นระบบอัตโนมัติ สาขานี้อาจต้องเผชิญกับการตัดสินว่าการเป็นนักวิทยาศาสตร์ข้อมูลในยุคของระบบอัตโนมัติอัจฉริยะนั้นมีความหมายอย่างไรกันแน่
นักวิทยาศาสตร์ข้อมูลจำนวนมากแม้จะมีทักษะการเขียนโค้ดที่ซับซ้อนและเครื่องมือดิจิทัล แต่กลับทำงาน ด้วยมือและมีแนวโน้มเกิดข้อผิดพลาด ได้ง่าย การเตรียมข้อมูล การล้างข้อมูล และการวิเคราะห์ข้อมูลเกี่ยวข้องกับงานที่น่าเบื่อและใช้เวลานาน ซึ่งซ้ำซากและเป็นกลไก ในความเป็นจริง การเตรียมชุดข้อมูลต้องใช้แรงงานด้านวิทยาศาสตร์ข้อมูลจำนวนมาก ซึ่งมักจะดูเหมือนเป็นงานที่น่าเบื่อหน่ายมากกว่าจะเป็นงานวิทยาศาสตร์ที่น่าตื่นเต้นและขับเคลื่อนด้วยการค้นพบ ปัญหานี้ซับซ้อนขึ้นเนื่องจากผู้ที่เข้าสู่สาขานี้หลายคนเป็นมือสมัครเล่น เนื่องจากพวกเขาเรียนหลักสูตรออนไลน์เกี่ยวกับ Python หรือ R มาบ้างแล้ว "นักวิทยาศาสตร์ข้อมูล" เหล่านี้มัก ไม่พร้อมสำหรับบทบาทที่เคร่งครัด วิทยาศาสตร์ข้อมูลไม่ได้เป็นเพียงการเขียนโค้ดเท่านั้น แต่ยังเกี่ยวข้องกับการวิเคราะห์เชิงลึก ความเข้าใจในบริบท และความสามารถในการนำเสนอข้อมูลเชิงลึกต่อผู้ฟังที่ไม่ใช่นักเทคนิค ในความเป็นจริงแล้ว วิทยาศาสตร์ข้อมูลเป็นงานที่ต้องอาศัยความคิดสร้างสรรค์และการคิดวิเคราะห์ผสมผสานกัน ซึ่งผู้ที่ทำงานด้านนี้หลายคนไม่มี
นอกจากนี้ นักวิทยาศาสตร์ข้อมูลจำนวนมากยังพัฒนาความรู้สึกว่าตนมีสิทธิ์ คาดหวังเงินเดือนสูงและค่าตอบแทนที่คุ้มค่า เพียงเพราะตำแหน่งหน้าที่ของตน ทัศนคติเช่นนี้ทำให้บริษัทต่างๆ เลิกจ้าง โดยเฉพาะในภาคส่วนที่ประสิทธิภาพด้านต้นทุนเป็นสิ่งสำคัญที่สุด ฉันเคยพบกับบริษัทที่เคยรีบจ้างนักวิทยาศาสตร์ข้อมูลแต่ตอนนี้กำลังพิจารณาใหม่ ทำไมต้องจ่ายค่าจ้างสูงให้กับคนที่ใช้เวลาส่วนใหญ่ไปกับการจัดการข้อมูล ในขณะที่ AI สามารถทำได้เร็วกว่า ดีกว่า และมีค่าใช้จ่ายเพียงเศษเสี้ยวเดียว
จากประสบการณ์ส่วนตัวของฉันในการเขียนคลาสนี้ พบว่า Generative AI ได้พัฒนาจนกลายเป็นพลังสำคัญในด้านที่ Data Science อ่อนแอที่สุด งานต่างๆ เช่น การเตรียมข้อมูล การล้างข้อมูล และแม้แต่การวิเคราะห์เชิงคุณภาพพื้นฐาน ซึ่งเป็นกิจกรรมที่กินเวลาของนักวิทยาศาสตร์ข้อมูลไปมาก ปัจจุบัน ระบบ AI สามารถทำงานอัตโนมัติ ได้อย่างง่ายดาย สิ่งที่แย่กว่า (หรือดีกว่า ขึ้นอยู่กับว่าคุณยืนอยู่ตรงไหน) ก็คือ AI นั้นเร็วกว่า แม่นยำกว่า และมีแนวโน้มเกิดข้อผิดพลาดจากมนุษย์หรือความเหนื่อยล้าน้อยกว่า
สำหรับนักวิทยาศาสตร์ข้อมูลหลายๆ คน เรื่องนี้ถือเป็นเรื่องที่น่ากลัว เพราะงานเหล่านี้เป็นงานหลักที่พวกเขาต้องทำในแต่ละวัน ตัวอย่างเช่น การล้างข้อมูลนั้นขึ้นชื่อว่าใช้เวลานานและมักเกิดข้อผิดพลาด แต่ปัจจุบัน AI สามารถทำสำเร็จได้ด้วยการคลิกเพียงไม่กี่ครั้งและมีความแม่นยำเกือบสมบูรณ์แบบ นักวิทยาศาสตร์ข้อมูลมักบ่นเกี่ยวกับงานที่น่าเบื่อเหล่านี้ แต่จริงๆ แล้วงานเหล่านี้มีความสำคัญต่อบทบาทของพวกเขา เมื่อระบบ AI พัฒนาขึ้น ความจำเป็นที่มนุษย์จะต้องทำหน้าที่เหล่านี้ก็ลดน้อยลง ไม่น่าแปลกใจเลยที่คำวิจารณ์ที่ออกมาต่อต้าน AI ส่วนใหญ่ มาจากนักวิทยาศาสตร์ข้อมูลเอง พวกเขาเห็นลางร้ายและกลัวว่างานของพวกเขาจะเสียหาย
สิ่งที่ทำให้ปัญหาของนักวิทยาศาสตร์ข้อมูลแย่ลงไปอีกก็คือในช่วงไม่กี่ปีที่ผ่านมานี้ สาขานี้ไม่ได้มีความก้าวหน้ามากนัก แม้ว่าจะมีความนิยมเพิ่มขึ้นอย่างรวดเร็ว แต่สาขาวิทยาศาสตร์ข้อมูลยังคงประสบปัญหาด้านประสิทธิภาพ ข้อผิดพลาด และ การขาดความชัดเจนว่าสาขานี้ควรครอบคลุมถึงอะไรกันแน่ ครั้งหนึ่งเคยเชื่อกันว่าเครื่องมือที่ซับซ้อนยิ่งขึ้นและการฝึกอบรมที่ดีขึ้นจะทำให้สาขานี้พัฒนาขึ้น แต่ความจริงแล้วไม่ได้เกิดขึ้นจริงในระดับที่คาดหวัง ในทางกลับกัน AI ได้รับการพัฒนาอย่างต่อเนื่อง อัลกอริทึมการเรียนรู้ของเครื่อง การประมวลผลภาษาธรรมชาติ และโมเดลเชิงสร้างสรรค์กำลังพัฒนาอย่างรวดเร็ว ทำให้สาขาวิทยาศาสตร์ข้อมูลแบบดั้งเดิมกลายเป็นเพียงฝุ่นผง
ความคาดหวังเงินเดือนที่สูงของนักวิทยาศาสตร์ข้อมูล ทำให้ปัญหาทวี ความรุนแรงขึ้น บริษัทต่างๆ ที่เคยยอมให้มีการไม่มีประสิทธิภาพได้เริ่มตระหนักแล้วว่า AI สามารถแทนที่งานหนักๆ ได้โดยไม่ต้องเสียค่าใช้จ่ายมหาศาลกับแรงงานมนุษย์ เมื่อ AI มีความเชี่ยวชาญมากขึ้นใน การทำงานสำคัญๆ เช่น การวิเคราะห์ การคาดการณ์ และแม้แต่การนำเสนอ ลักษณะการทำงานด้วยมือของวิทยาศาสตร์ข้อมูลก็เริ่มไม่จำเป็นอีกต่อไป บริษัทหลายแห่งจะตระหนักได้ว่าสิ่งที่เคยต้องใช้ทีมนักวิทยาศาสตร์ข้อมูลนั้น ปัจจุบันสามารถจัดการได้อย่างมีประสิทธิภาพมากขึ้นด้วยเครื่องมือที่ขับเคลื่อนด้วย AI
ความเป็นจริงก็คือ วิทยาศาสตร์ข้อมูลตามคำจำกัดความโดยทั่วไปนั้นกำลังใกล้จะล้าสมัย เมื่อปัญญาประดิษฐ์ก้าวหน้าอย่างรวดเร็ว ความต้องการ นักวิทยาศาสตร์ข้อมูลในรูปแบบปัจจุบันก็มีแนวโน้มว่าจะลดลง ซึ่งไม่ได้หมายความว่ามนุษย์ไม่มีบทบาทในการตัดสินใจโดยใช้ข้อมูล แต่ในไม่ช้า บทบาทของ "นักวิทยาศาสตร์ข้อมูล" แบบคลาสสิกอาจกลายเป็นแนวคิดของอดีต สิ่งที่จำเป็นในตอนนี้คือผู้เชี่ยวชาญที่มีทักษะในการทำงานร่วมกับปัญญาประดิษฐ์ โดยใช้ประโยชน์จากความสามารถของมันในขณะที่มุ่งเน้นไปที่การคิดเชิงกลยุทธ์และการแก้ปัญหาที่ซับซ้อนในระดับที่สูงขึ้น
AI ไม่ใช่จุดสิ้นสุดของการวิเคราะห์ ข้อมูลเชิงลึก หรือการตัดสินใจ แต่เป็นการแสดงถึงวิวัฒนาการของสิ่งเหล่านี้ สาขาปัจจุบันของวิทยาศาสตร์ข้อมูลเสี่ยงที่จะล้าสมัยหากไม่พัฒนาไปในทิศทางเดียวกัน AI กำลังปฏิวัติอุตสาหกรรมต่างๆ และวิทยาศาสตร์ข้อมูลต้องปรับตัว มิฉะนั้นจะถูกแทนที่ด้วยคลื่นลูกนี้ ในท้ายที่สุด คำถามอาจไม่ใช่ว่า AI จะเข้ามาแทนที่วิทยาศาสตร์ข้อมูลหรือไม่ แต่เป็นว่าวิทยาศาสตร์ข้อมูลจะสามารถบรรลุคำมั่นสัญญาได้อย่างเต็มที่หรือไม่
หรือบางทีความแตกต่างอาจไม่มีความสำคัญเลยหากในที่สุดแล้วเราก้าวข้ามกระแส "วิทยาศาสตร์ข้อมูล" และยอมรับ AI ในฐานะความก้าวหน้าเชิงตรรกะขั้นต่อไป
เกี่ยวกับฉัน: ผู้มีประสบการณ์ด้านไอทีมากกว่า 25 ปี ในด้านข้อมูล ปัญญาประดิษฐ์ การจัดการความเสี่ยง กลยุทธ์ และการศึกษา ผู้ชนะการแข่งขันแฮ็กกาธอน 4 สมัยและผู้สนับสนุนด้านข้อมูลที่สร้างผลกระทบต่อสังคม ปัจจุบันทำงานเพื่อกระตุ้นกำลังคนด้านปัญญาประดิษฐ์ในฟิลิปปินส์ เรียนรู้เพิ่มเติมเกี่ยวกับฉันได้ที่นี่: https://docligot.com