Bạn đã từng nghe câu nói nổi tiếng: "Trò lừa đảo lớn nhất mà Ác quỷ từng thực hiện là thuyết phục thế giới rằng hắn không tồn tại".
Các tài liệu tham khảo thần học có liên quan ở đây vì hơn bất kỳ tiến bộ công nghệ nào trong thời gian gần đây, sự cuồng nhiệt xung quanh Trí tuệ nhân tạo tạo ra mang tính tôn giáo hơn là khoa học hoặc kỹ thuật.
Mục đích của blog này không phải là để chống lại cơn sốt cường điệu (tôi đề xuất Gary Marcus ) để làm đối trọng. Đây là một phân tích quan trọng về dầu rắn được bán cho người tiêu dùng không nghi ngờ. Tôi có một luận điểm đơn giản. Các khuôn khổ AI Agentic là những khái niệm trừu tượng không đáng tin cậy và về cơ bản là không thực tế. Để xây dựng các luồng phức tạp, có chuỗi và có thể lặp lại bằng LLM đòi hỏi kiến thức, kỹ năng và sự chăm chỉ.
Thật hấp dẫn khi tìm kiếm một lối tắt, một giải pháp thần kỳ; nhưng bạn có thể hoặc là cứ tiếp tục cho đến khi đường ray sụp đổ hoặc xây dựng nền móng cho chặng đường dài.
Phân biệt giữa lúa mì và trấu
“AI Agentic là một bước tiến đột phá trong trí tuệ nhân tạo. Sự kết hợp của các kỹ thuật, mô hình và phương pháp AI khác nhau, nó trao quyền cho một thế hệ tác nhân tự động mới có thể phân tích dữ liệu, đặt mục tiêu và hành động để đạt được chúng—tất cả đều với sự giám sát tối thiểu của con người. AI Agentic cho phép các tác nhân tự động này đạt được nhận thức gần như con người trong nhiều lĩnh vực, biến chúng thành những cỗ máy giải quyết vấn đề phát triển mạnh trong môi trường năng động và liên tục học hỏi và cải thiện với mọi tương tác.
Wow. Thật tuyệt vời. Thật không thể tin nổi.
Cũng hoàn toàn vô lý... Để tôi thử xem,
Agentic AI là việc sử dụng Generative AI trong các quy trình làm việc phức tạp. Các đầu ra do LLM tạo ra có thể hoặc không liên quan đến nhiệm vụ được giao. Agentic AI kế thừa sự tinh vi, thông minh và độ tin cậy của đầu ra từ các hướng dẫn hệ thống và lập trình, phần lớn trong số đó được trừu tượng hóa cao, do người mới viết và sẽ dẫn đến một hệ thống hầu như không hoạt động.
Agentic AI rất tuyệt vời để tạo bản demo cho người tiêu dùng không chuyên nghiệp, nhưng nhìn chung lại không hiệu quả khi triển khai trong bất kỳ trường hợp sử dụng nào mà kết quả thực sự quan trọng. Nó sẽ không hoạt động trừ khi bạn là chuyên gia, nhưng chắc chắn là bạn không phải chuyên gia.
Tôi xin nói rõ, tôi không hề hoài nghi về Gen AI, tôi nghĩ nếu sử dụng một cách chuyên nghiệp và với các công cụ chưa có, chúng ta có thể triển khai các quy trình làm việc sẽ thay đổi cách chúng ta thực hiện nhiệm vụ. Có lẽ không đến mức mà những người bi quan về AI nói đến, nhưng chắc chắn là đến mức thay đổi mô hình cho nhiều cách làm việc.
Không phải ngẫu nhiên mà trường hợp sử dụng sát thủ đầu tiên cho Gen AI là lập trình vì lập trình sẽ luôn là lĩnh vực đầu tiên có được công cụ và cơ sở hạ tầng phù hợp. Lý do cho điều này rất đơn giản. Chúng ta xây dựng công cụ và cơ sở hạ tầng cho các công cụ lập trình bằng, ừm, lập trình. Lập trình là mối quan tâm cấp thấp, trường hợp sử dụng đầu tiên hoàn hảo. Nhân tiện, đây cũng là một kỹ năng mà vẫn là (nếu không muốn nói là 'là') khả năng có liên quan và được thèm muốn nhất trong nhiều ngày, nhiều tuần, nhiều tháng, nhiều năm và có thể là nhiều thế hệ sau này.
Các công cụ mã hóa đã chứng minh được tiềm năng của Gen AI. Tôi có hai công cụ LLM riêng biệt mà tôi (trả tiền và) sử dụng hàng ngày để mã hóa vì chúng thường bị chặn bởi nhu cầu quá lớn và cơ sở hạ tầng xanh. Tôi sử dụng chúng đồng thời trong các cửa sổ IDE khác nhau. Điều này là do chúng mới, do đó chậm và đôi khi không ổn định.
Ngay cả như thế này, họ đã cách mạng hóa quy trình làm việc của tôi. Tôi đang có một ngày tồi tệ khi khởi động máy tính và Claude đang bận nên tôi đang nói chuyện với o1-mini thay thế. Và đây là khởi đầu cho những cách thay đổi mà Gen AI sẽ thay đổi cách bạn làm việc…
Những công cụ này đang được xây dựng từ đầu; chúng hoàn toàn mới và chưa đáng tin cậy. Điều này thật thú vị vì đây là sự khởi đầu. Chúng ta đang ở giữa một làn sóng mới. Điều đó đưa tôi đến chủ đề của blog này. Lời nói dối và sự vượt quá giới hạn của Agentic AI.
Một bản tóm tắt đơn giản của một API phức tạp và không đáng tin cậy.
Nhiều năm trước, tôi điều hành một công ty phát triển và chúng tôi có một lập trình viên mới tốt nghiệp tham gia nhóm. Tôi giao cho họ một nhiệm vụ khá đơn giản (xây dựng một biểu mẫu web bằng PHP). Tôi thường xuyên kiểm tra.
“Mọi việc thế nào rồi?
“Tốt lắm!
Nhiều ngày và nhiều tuần trôi qua, và bàn phím gõ gõ liên tục. Mất quá nhiều thời gian, vì vậy tôi đã đến gặp lập trình viên và yêu cầu họ cho tôi xem đoạn mã mà họ đã làm. Đó là một lớp vòng lặp forEach lồng nhau, trải dài tới hàng nghìn dòng mã.
Bụng tôi chùng xuống (khách hàng đang chờ đợi điều này…), và tôi không nói nên lời. Đó là một cú sốc về thể chất, mọi thứ đã sáng tỏ. Có phải lỗi của tôi vì đã không cung cấp hướng dẫn? Có phải lập trình viên là một nguyên nhân vô vọng không? Tôi sẽ nói với khách hàng rằng ai là người phải trả tiền cho việc này? (Chúng tôi tính phí thời gian, không phải kết quả…)
Lý do tôi lạc đề là vì đây chính xác là cảm giác mà tôi có khi đọc tài liệu về bất kỳ Agentic Framework nào mà tôi từng gặp. Tôi không phải là người duy nhất như vậy.
Tôi không muốn đề cập đến bất kỳ khuôn khổ cụ thể nào (tôi vẫn chưa tìm thấy bất kỳ khuôn khổ Python Agentic nào mà tôi không thể áp dụng điều này), nhưng khi tài liệu của bạn bắt đầu nói về vai trò, công nhân, ông chủ và câu chuyện đằng sau, toàn bộ khái niệm bắt đầu giống như một cuốn tiểu thuyết giả tưởng.
Lý do là, toàn bộ là một tiểu thuyết giả tưởng. Đó là một công cụ mang tính cách mạng và tinh vi được xây dựng trên công nghệ tiên phong, hoạt động ngay lập tức, dành cho người mới bắt đầu. Và mọi thứ đều phức tạp và mâu thuẫn như những gì nghe có vẻ.
Tôi không nói rằng quy trình làm việc LLM phức tạp không thể hoạt động; ý tôi là yêu cầu về chuyên môn và mức độ kiểm soát sắc thái là cực kỳ cao, và việc tạo ra các khuôn khổ "đơn giản và dễ tiếp cận" là điều không thể cho đến khi công cụ hoàn thiện hơn và nền tảng vững chắc hơn.
Hiện tại, có rất ít người trên thế giới (mặc dù họ vẫn tồn tại giữa chúng ta!) có chuyên môn để tạo ra và duy trì các quy trình làm việc lặp đi lặp lại phức tạp, đáng tin cậy (dựa trên Gen AI hay không!) hoạt động và đúng với định nghĩa về quy trình làm việc của Agentic đang được bán rộng rãi.
Nhưng đây là điều khiến tôi khó chịu; một số ít người tiên phong này đang làm việc trên các trường hợp sử dụng tiên tiến mà chúng ta có thể không biết đến. Họ không xây dựng công khai trên Twitter, cũng không viết blog và hướng dẫn cách thực hiện. Họ không tập trung vào việc tạo ra một khuôn khổ để bạn có thể dễ dàng tự động hóa các bài đăng trên LinkedIn của mình. Họ đang tiến hành mọi thứ một cách lặng lẽ và sau cánh cửa đóng kín.
Tôi hiểu rồi, tôi thực sự hiểu rồi.
Mọi người muốn một khuôn khổ dễ sử dụng, dễ tiếp cận cho phép họ xây dựng các quy trình làm việc đáng tin cậy và phức tạp với kết quả kinh doanh thực tế. Tôi muốn nhiều thứ. Thuốc trường sinh. Cao thêm vài cm. Trở thành nhà vô địch quần vợt trong câu lạc bộ thể thao của tôi. Có nhiều khả năng tôi sẽ trở thành nhà vô địch quần vợt địa phương cao lớn với tuổi trẻ vĩnh cửu hơn là bất kỳ khuôn khổ tác nhân nào trong số này hoạt động cho người dùng trung bình và hãy tin tôi và bất kỳ ai đã từng thấy tôi chơi quần vợt khi tôi nói rằng điều này cực kỳ khó xảy ra.
Các khuôn khổ Agentic là nỗ lực xây dựng trình xây dựng trang web WYSIWYG trước khi chúng ta thống nhất về một tiêu chuẩn thống nhất duy nhất cho HTML. Chúng còn quá sớm.
Đây không phải là trường hợp xe ngựa chạy trước ngựa; đây là cố gắng chế tạo một tên lửa trước khi chúng ta phát hiện ra điện. Một vụ chiếm đất cơ hội đã thành công.
Một công cụ bị hỏng.
Vấn đề với việc cung cấp một công cụ hoặc khuôn khổ cho phép bạn trừu tượng hóa chức năng là nó đi kèm với một tập hợp các giả định. Khi tôi mua một cái búa, tôi cho rằng nó sẽ hoạt động. Khi tôi mua một máy rửa áp lực, tôi cho rằng nó sẽ hoạt động.
Vấn đề là khi tôi sử dụng một khuôn khổ, tôi cho rằng nó sẽ hoạt động. Nhưng điều này thực sự không thể thực hiện được vì công nghệ cơ bản đã quá trưởng thành. Thay vì tăng cường áp dụng, Agentic Frameworks đang bán một ảo tưởng trên các bản demo được kiểm soát chặt chẽ và các trường hợp sử dụng hữu hạn mà thực tế sẽ không bao giờ hoạt động trong tay người dùng thông thường (và có hàng triệu người dùng…).
Thiệt hại mà chúng gây ra là rất lớn. Cũng giống như các nhà phát triển ngày nay học React trước khi học javascript, hoặc áp dụng các khuôn khổ trước khi học về các nguyên tắc lập trình. Một thế hệ các nhà công nghệ nhiệt tình đang nhảy lên chuyến tàu cường điệu để học khuôn khổ 'x'. Vấn đề là; nó sẽ không hoạt động (theo bất kỳ tiêu chuẩn hợp lý nào), trên thực tế, việc xây dựng bản demo hoặc nguyên mẫu tự nó đã là một thành tựu khá lớn.
Nhưng điều đó không có nghĩa là Gen AI hoặc LLM "không" hoạt động, mặc dù điều đó sẽ trở thành giả định trong ngắn hạn. Nó chỉ có nghĩa là chúng ta chưa đạt đến mức độ trưởng thành của công nghệ cơ bản để có thể xây dựng các trừu tượng vững chắc một cách an toàn trên đó. Có quá nhiều vấn đề cần giải quyết trước. Một số vấn đề cơ bản cần được các nhà cung cấp LLM giải quyết ở cấp độ sâu bao gồm nhưng không giới hạn ở:
Độ trễ
Khả dụng
Sự an toàn
Đầu ra đáng tin cậy
Tỉ lệ
Vâng, ý tôi là các API cơ bản thường bị quá tải do sử dụng; chúng chậm, dễ bị hack (đặc biệt là hack nhanh) và đưa ra những thay đổi đột phá hàng tuần. Những người đổi mới thực sự đang làm việc chăm chỉ sau cánh cửa đóng kín để giải quyết những vấn đề này. Nhưng cho đến khi chúng ta có nhiều tiến bộ hơn, chúc may mắn trong việc xây dựng một hệ thống sản xuất đáng tin cậy, chứ chưa nói đến một khuôn khổ.
Nếu bạn không hiểu về các API cơ bản (mà nhân tiện, đây là bước đột phá có giá trị thực sự mà tất cả chúng ta đang cùng thực hiện), làm sao bạn có thể xây dựng một hệ thống dựa trên API? Một số API không yêu cầu chúng ta phải hiểu những hạn chế của chúng chủ yếu vì chúng là một hộp đen chỉ hoạt động. Sẽ mất nhiều năm nếu không muốn nói là cả một thế hệ để LLM đạt đến mức độ trưởng thành này, cho đến lúc đó, nó sẽ đi kèm với một dấu hiệu cảnh báo "Chỉ dành cho Chuyên gia sử dụng trong sản xuất".
Không thể xây dựng một sự trừu tượng đáng tin cậy trên nền cát lún. Trên thực tế, điều này phá vỡ nguyên lý cơ bản của lập trình máy tính. Sự trừu tượng trong khoa học máy tính là quá trình loại bỏ các yếu tố làm sao lãng các yếu tố quan trọng hơn. Chúng ta không thể tập trung vào các chi tiết cấp cao khi hệ thống cấp thấp không đáng tin cậy; chúng ta cần hiểu sắc thái và sử dụng trong một mô hình tinh vi. Không phải là một khuôn khổ ma thuật ít/không cần mã (với các sự trừu tượng kỳ ảo).
Điều này đang đẩy chúng ta vào vực thẳm của sự vỡ mộng. Mặc dù bản thân nó không phải là vấn đề vì nó tạo không gian để xây dựng những thứ có giá trị thực sự, nhưng vẫn đáng thất vọng khi chứng kiến.
Phát minh ra bánh xe vào kỷ Jura.
Chiêu trò lớn nhất mà các khuôn khổ AI của Agentic từng thực hiện là thuyết phục bạn rằng chúng là cần thiết. Chúng là ác quỷ của bối cảnh LLM.
Bạn không cần đoàn làm phim, điệp viên, câu chuyện hậu trường và giao diện đồ họa đẹp mắt cho bạn thấy những điều không bao giờ hiệu quả.
Bạn cần hiểu rằng LLM là những công cụ mạnh mẽ mà bạn nên hiểu mà không cần những câu chuyện từ một cuốn tiểu thuyết giả tưởng. Ứng dụng Hello World và demo của bạn nên được xây dựng bằng tay, bằng mã. Khi bạn hiểu cách thức, lý do và cái gì và có thể kiểm soát các đầu vào và đầu ra của các mô hình Gen AI, thì bạn sẽ có nền tảng để bước ra thế giới và xây dựng một cái gì đó hữu ích. Và có lẽ sẽ mất một thời gian.
Không phải với các pháp sư, nhà quản lý, điệp viên và rồng, mà với cách sử dụng mang tính quyết định chính xác của một bước đột phá trong AI.
Xuất bản lần đầu: https://tyingshoelaces.com/blog/agentic-framework-lie