paint-brush
Đã qua rồi những ngày của AIby@aibites
1,535
1,535

Đã qua rồi những ngày của AI

AI đã thực sự phát triển trong thập kỷ qua - từ một đứa trẻ thành một con quái vật. Ở đây tôi tóm tắt nhanh những gì đã thay đổi
featured image - Đã qua rồi những ngày của AI
Shrinivasan Sankar HackerNoon profile picture

Tuần này, tôi sẽ đi chệch hướng một chút so với các bài viết thông thường giải thích các Khái niệm AI hoặc hướng dẫn viết mã. Vâng, đó là một chuyến du hành đầy hoài niệm và đầy triết lý về con đường mà tôi đã may mắn được bước đi suốt chặng đường đó.


Một trong những đặc quyền hiếm hoi khi bắt đầu một lĩnh vực nào đó từ khá sớm là bạn được nhìn thấy lĩnh vực đó phát triển như đứa con cưng của mình. Khi tôi bắt đầu học Thạc sĩ về Thị giác Máy tính cách đây một thập kỷ, một người bạn tốt nghiệp CS của tôi đã hỏi: “Thị giác máy tính có nghĩa là gì?” Ngày nay, đó là một câu hỏi tầm thường với đủ video về các nhiệm vụ thị giác máy tính như phân đoạn (xem bên dưới) trôi nổi trên internet.

Kết quả của việc phân đoạn hình ảnh - một nhiệm vụ Thị giác Máy tính đã có trên internet khi học sâu bắt đầu cách đây một thập kỷ.

Vậy điều gì đã thay đổi trong thập kỷ qua? Luôn có hai mặt của một đồng xu. Ngoài ra, tăng trưởng có thể vừa tốt vừa xấu.

Cộng đồng khép kín - Nhỏ thật đẹp

Người ta nói rằng mọi người ở Iceland bằng cách nào đó có quan hệ họ hàng với nhau và nếu ai đó không phải là anh họ thứ hai của bạn, bạn nên kết hôn với họ.


Tương tự như vậy, cộng đồng AI rất gắn bó. Đã qua rồi những cảm giác của một cộng đồng gắn kết chặt chẽ. Khi tương tác với bất kỳ ai trong nghiên cứu, bạn thường biết họ thuộc nhóm nào. Bằng cách nào đó, bạn sẽ liên tưởng và tôn trọng công việc của họ khi đọc và đánh giá cao tác động của họ đối với lĩnh vực này.


Khi lĩnh vực này đang bùng nổ không ngừng, việc nói rằng bạn biết công việc của ai đó mà quên họ đi ngày càng trở nên khó khăn hơn. Có quá nhiều cái tên mới và các nhánh mới mà thậm chí còn khó theo dõi.


Một ví dụ khác, PyTorch đang ở giai đoạn sơ khai. Cộng đồng Slack nhỏ bé và hữu ích đến mức các nhà phát triển PyTorch đã trực tiếp trả lời các câu hỏi của chúng tôi về việc sử dụng thư viện. Điều này khuyến khích việc tìm hiểu ngày càng nhiều về nó. Ngày nay, khuôn khổ này đã quá hoàn thiện và các khuôn khổ mới như LangChain và Llamaindex đã được hỗ trợ. Trọng tâm là LLM hơn bất kỳ nhánh AI nào khác.

Phần cứng sang trọng

Ngày đó, chúng tôi thường đào tạo một mạng lưới thần kinh sâu trên một GPU duy nhất để tạo ra thứ gì đó có tác động mạnh mẽ. Hầu hết công việc được xuất bản trong các hội nghị hàng đầu như CVPR, NeurIPS và ICML đều có thể được đào tạo và sao chép trên một máy GPU 8 GB hoặc trong trường hợp xấu nhất là một máy có 4 GPU trong một số trường hợp hiếm hoi.

Hình ảnh cụm GPU mới nhất được Tesla sử dụng cho AI (nguồn: https://www.hpcwire.com/off-the-wire/tesla-to-roll-out-advanced-supercomputer )


Tôi nhớ rất rõ mình đã hạnh phúc như thế nào khi mua một GPU thông thường chỉ với 8 GB RAM để tham gia các cuộc thi Kaggle. Một số giải pháp chiến thắng từ Kaggle Grandmasters đã đào tạo các mô hình deep learning trên một máy GPU duy nhất tại nhà.


Thế giới AI ngày nay cần một cụm GPU để đào tạo các mô hình nền tảng. Ngay cả việc tinh chỉnh các mô hình này cũng cần GPU 24GB, đây là những con quái vật, đắt tiền và giá cả phải chăng chỉ dành cho các doanh nghiệp có “ngân sách AI”.

Nhu cầu kỹ năng

Đó là những ngày mà lĩnh vực này vẫn chưa có lớp bọc AI xung quanh nó. Các nhà tuyển dụng được giao nhiệm vụ xa lạ này là săn lùng các kỹ sư “học sâu”. Các nhà tuyển dụng và người sáng lập công ty khởi nghiệp đang săn lùng các chuyên gia về deep learning qua tất cả các kênh. Việc nhận được tin nhắn thường xuyên trên LinkedIn mời tôi tham gia nhóm của họ với tư cách là kỹ sư deep learning là điều bình thường.

Ảnh chụp màn hình quảng cáo tuyển dụng Kỹ sư máy học chỉ được đăng 5 ngày trước đã nhận được hơn 100 ứng viên!


Tình hình hiện tại là các vị trí tuyển dụng “Kỹ sư máy học” nhận được hơn 100 đơn đăng ký trên LinkedIn chỉ trong vòng một ngày kể từ khi quảng cáo. Hãy nhìn vào ảnh chụp màn hình ở trên nếu bạn cảm thấy khó tin. Câu hỏi vẫn là kỹ năng của ứng viên phù hợp như thế nào với đặc điểm công việc. Nhưng thị trường đang bão hòa về kỹ năng – khá nhanh chóng!

Kỹ năng phụ - Vận hành và Kiến trúc

Tăng trưởng có nghĩa là đa dạng hơn và có nhiều cơ hội hơn. Có những vai trò mới như ML-op, LLM-op và ML-architects đang xuất hiện. Đã qua rồi cái thời của các tệp mô hình đơn, nhỏ (<1 GB). Sự phát triển của các mô hình cả về quy mô và khả năng đã tạo ra những kỹ năng mới trong việc triển khai và duy trì chúng.


Hơn nữa, việc đào tạo và triển khai các mô hình đang được tự động hóa bằng các công cụ như MLFlow. Cơ sở hạ tầng đám mây dành cho đào tạo cần phải đủ phức tạp. Tất cả điều này đã tạo ra những vai trò toàn thời gian với trách nhiệm tận tâm.

Tạm biệt kỹ sư ML, xin chào kỹ sư AI

Điều thú vị nhất khi làm việc trong lĩnh vực AI là viết kiến trúc mô hình và đào tạo mô hình từ đầu bằng dữ liệu nội bộ của chúng tôi. Mặc dù điều này liên quan đến việc xử lý trước dữ liệu rất nhiều, nhưng các mô hình đào tạo và trực quan hóa kết quả đào tạo từng rất thú vị. Đã có/vẫn có một vai trò chuyên biệt cho công việc này được gọi là Kỹ sư học máy (ML).


Sự phát triển của các mô hình nền tảng từ những gã khổng lồ công nghệ đang xác định lại vai trò này. Khi quy mô mô hình tăng lên, ngân sách đào tạo sẽ rất lớn. Trên thực tế, chi phí đào tạo mô hình LLama 2 cho Meta là 20 triệu USD. Rõ ràng các công ty khởi nghiệp hoặc các tổ chức đang cố gắng áp dụng AI không muốn vứt bỏ số tiền này. Hiện tại, người ta đã xác định rằng các mô hình nền tảng là dành cho những gã khổng lồ công nghệ phát triển, ngoại trừ một số công ty như Mistral và Anthropic.


Đáng buồn thay, điều này có nghĩa là vai trò Kỹ sư ML sẽ được chuyển sang vai trò Kỹ sư AI. Vai trò của Kỹ sư ML hoàn toàn là phát triển kiến trúc mô hình, đào tạo và đánh giá chúng. Vai trò Kỹ sư AI mới chủ yếu liên quan đến việc phát triển API hoặc gọi API do những gã khổng lồ Công nghệ (OpenAI, Meta và Google) cung cấp để thúc đẩy các mô hình nền tảng.


Trong một số trường hợp hiếm hoi, nó liên quan đến việc tinh chỉnh các mô hình nền tảng này. Tuy nhiên, các công ty có quyền lựa chọn xây dựng đường ống RAG hoặc sử dụng các mô hình nền tảng “nguyên trạng” để tinh chỉnh chúng.

Phần kết luận

Để kết luận, tôi coi đây là sự kết hợp chậm rãi giữa vai trò Kỹ thuật phần mềm và Học máy. Ranh giới giữa kỹ sư phần mềm và chuyên gia deep learning đang mờ dần. Vì vậy, trong những năm tới, kỹ sư phần mềm sẽ là kỹ sư AI làm việc cùng với các mô hình nền tảng, vừa để viết mã vừa giải quyết nhu cầu của khách hàng.


Hơn nữa, trong những năm tới, các công ty sẽ được nhóm thành hai loại – công ty sản phẩm AI và công ty dịch vụ AI. Các công ty sản phẩm AI sẽ lại là OpenAI, Meta và Google để phát triển các mô hình nền tảng. Các công ty dịch vụ AI sẽ cung cấp dịch vụ API bằng cách tinh chỉnh hoặc phát triển các quy trình kiểu RAG xung quanh các mô hình nền tảng AI để phục vụ khách hàng của họ.


Cuối cùng, liệu số đơn xin việc tăng đột biến có phải là dấu hiệu cho thấy bong bóng sắp vỡ giống như bong bóng dot com không? Tôi cảm thấy như vậy, CÓ. Nhưng chúng ta hãy chờ xem…

La lên

Hy vọng điều đó hữu ích.


Nếu bạn thích bài viết này, tại sao không theo dõi tôi Twitter để biết thông tin cập nhật về nghiên cứu, liên kết video hướng dẫn và các công cụ AI mới từ các phòng thí nghiệm AI hàng đầu?


Ngoài ra, hãy đăng ký theo dõi của tôi Kênh Youtube nơi tôi giải thích các khái niệm và bài viết về AI một cách trực quan.