Năm 2025 là năm AI ngừng cảm thấy như một “công cụ bạn thử” và bắt đầu được đối xử như một cái gì đó mà các nhóm kỹ thuật phải hoạt động. Vào tháng Giêng, hầu hết các nhóm kỹ thuật đã trải nghiệm AI thông qua copilots và trợ lý trò chuyện.Họ hữu ích, đôi khi ấn tượng, nhưng vẫn dễ dàng giữ ở chiều dài cánh tay: một tab trong IDE của bạn, một cửa sổ nhắc bên cạnh, một trợ lý giúp tăng tốc các phần của công việc bạn đã hiểu. Đến tháng 12, trung tâm trọng lực đã thay đổi. AI xuất hiện ít hơn như một giao diện độc lập và nhiều hơn như một lớp được kết nối thông qua các công cụ mà các kỹ sư đã sống trong: IDEs, xem xét mã, theo dõi vấn đề, phản ứng sự cố và tài liệu nội bộ. Chat trở thành một bề mặt phối hợp, trong khi tích hợp cho phép các mô hình rút ra bối cảnh trực tiếp từ các hệ thống sản xuất và các hệ thống hồ sơ - và đẩy các thay đổi trở lại chúng. Sự thay đổi đó giải thích tại sao năm 2025 sẽ được ghi nhớ là năm AI vượt qua khoảng cách để được nhúng vào kỹ thuật.Không phải vì các đội đã đẩy các đại lý tự trị vào sản xuất, mà bởi vì hoạt động AI ở quy mô lớn đã đặt ra một câu hỏi khó khăn hơn: làm thế nào để bạn chạy an toàn mã được tạo ra bởi AI trong sản xuất khi tốc độ viết các dòng mã mới không còn là hạn chế? Ngay khi sản xuất mã tăng tốc, các vấn đề khó khăn đã đi xuống - ý định, khả năng xem xét, khả năng kiểm tra, khả năng theo dõi, quyền sở hữu và khả năng phục hồi. How 2025 Started: Widespread Experimentation, Shallow Integration Làm thế nào 2025 bắt đầu: Thử nghiệm rộng rãi, Tích hợp chậm Vào đầu năm 2025, việc sử dụng AI trong phát triển phần mềm đã không còn là suy đoán. Nó đã là chủ yếu. Hơn 80% các nhà phát triển báo cáo sử dụng các công cụ AI trong quy trình phát triển của họ, với các mô hình ngôn ngữ lớn được nhúng vững chắc vào công việc kỹ thuật hàng ngày. Tải Overflow Những gì đa dạng rộng rãi là Những công cụ đó đã được sử dụng. Làm sao Hầu hết các nhóm đã áp dụng AI theo cách họ áp dụng bất kỳ trợ giúp năng suất mới nào: cá nhân, cơ hội và với sự phối hợp hạn chế trên toàn tổ chức. Copilots đã giúp các kỹ sư soạn thảo boilerplate, dịch mã giữa các ngôn ngữ, giải thích các API không quen thuộc hoặc phác thảo các bài kiểm tra. Các nhà phát triển cá nhân di chuyển nhanh hơn, trong khi hệ thống rộng hơn về cách thức hoạt động của phần mềm hầu như không thay đổi. AI sống ở rìa của quá trình phát triển thay vì ở các điểm kiểm soát của nó. Nó không được tích hợp sâu vào các dòng công việc xem xét mã, đường ống CI, cổng phát hành hoặc viễn thông sản xuất. đầu ra do AI tạo ra chảy vào các quy trình tương tự như mã được viết bởi con người, không có bối cảnh bổ sung về ý định, rủi ro hoặc hành vi dự kiến. Kết quả là, thử nghiệm, QA, phân loại lỗi và phản ứng sự cố chủ yếu vẫn là thủ công - và ngày càng căng thẳng khi khối lượng và tốc độ thay đổi tăng lên. Sự không phù hợp đó đã tạo ra một căng thẳng quen thuộc.Tốc độ mã tăng lên, nhưng các nhóm vẫn phải vật lộn để tự tin xem xét, xác nhận và vận chuyển những gì họ sản xuất.Khi AI tăng tốc công việc lên, áp lực tập trung ở các giai đoạn xuống chịu trách nhiệm về chất lượng và độ tin cậy. Một trong những tín hiệu rõ ràng nhất rằng đây không chỉ là một chu kỳ hype đến từ tình cảm.Mặc dù việc sử dụng AI tiếp tục tăng, tình cảm tích cực đối với các công cụ AI năm 2025, giảm từ hơn 70% trong hai năm trước. sự thay đổi đó không phản ánh sự từ chối; nó phản ánh sự bình thường hóa. tuần trăng mật AI đã kết thúc, nhưng cuộc hôn nhân vẫn tồn tại. giảm xuống khoảng 60% Khi một công nghệ là mới, các nhóm đánh giá nó dựa trên tiềm năng. một khi nó trở thành tiêu chuẩn, họ đánh giá nó dựa trên chi phí: độ tin cậy, độ chính xác, tiếp xúc bảo mật, bảo trì và nỗ lực cần thiết để tin tưởng vào sản lượng của nó.Vào đầu năm 2025, nhiều tổ chức kỹ thuật đã đạt đến điểm đó. AI đã ở trong vòng tròn, và câu hỏi trung tâm đã chuyển từ việc sử dụng nó sang làm thế nào để vận hành nó có trách nhiệm ở quy mô lớn. The Milestones That Pushed AI Into Engineering Operational Rhythm Những cột mốc đẩy AI vào nhịp điệu hoạt động kỹ thuật Nếu bạn nhìn lại chu kỳ tin tức AI của năm 2025, những cột mốc quan trọng nhất không phải là các bản demo lớn nhất hoặc những bước nhảy điểm chuẩn lớn nhất. Major Model Releases: From Impressive to Operable Các bản phát hành mô hình chính: Từ ấn tượng đến khả năng vận hành Trên khắp các nhà cung cấp, các phiên bản mô hình 2025 đã hội tụ trên một chủ đề tương tự: ít nhấn mạnh vào việc tăng năng lực thô và tập trung nhiều hơn vào cách các mô hình cư xử bên trong các hệ thống kỹ thuật thực tế. Với , OpenAI nhấn mạnh tính nhất quán của lý luận, khả năng kiểm soát và sự sẵn sàng của doanh nghiệp. sự thay đổi thực sự không chỉ là câu trả lời tốt hơn; nó là nhiều hơn Các sản phẩm đã trở nên dễ dàng hơn để lý luận, tích hợp vào các dòng công việc hiện có và hạn chế trong các hàng rào bảo vệ của tổ chức.Điều đó quan trọng khi các mô hình không còn là trợ lý bên cạnh, mà là những người đóng góp bên trong các đường ống sản xuất. GPT-5.1 và GPT-5.1 Pro hoạt động Các bản cập nhật tăng cường cùng một hướng từ góc độ công cụ đầu tiên.Bằng cách tập trung vào hành vi bản địa của mã hóa và tích hợp IDE sâu hơn, Claude Code đã giảm độ co giật giữa đầu ra AI và dòng công việc của nhà phát triển.Khi các mô hình sống nơi công việc kỹ thuật đã xảy ra - thay vì trong cửa sổ trò chuyện tách biệt - chúng bắt đầu hoạt động như cơ sở hạ tầng chứ không phải là phụ kiện. Mã Claude của Anthropic Lý luận đa phương tiện kết hợp với sự tích hợp chặt chẽ hơn trên toàn hệ sinh thái nhà phát triển của Google củng cố ý tưởng rằng AI không phải là một giao diện duy nhất, mà là một khả năng được nhúng trên toàn chuỗi cung ứng phần mềm. Đánh giá Google Gemini 3 Trong khi đó, các phát hành như và tiếp tục hạ thấp rào cản cho các nhóm muốn kiểm soát nhiều hơn - tự lưu trữ kết luận, triển khai riêng tư và tùy chỉnh hiệu quả chi phí. những mô hình này ít quan trọng đối với hiệu suất thô của họ và nhiều hơn cho những gì họ cho phép: thử nghiệm với AI như là một phần của cơ sở hạ tầng nội bộ, không chỉ là một API được quản lý. Đánh giá DeepSeek V3.2 Lời bài hát 4 Cùng nhau, những bản phát hành này đánh dấu một sự chuyển đổi rõ ràng. các mô hình ngày càng được thiết kế để cư xử đáng tin cậy trong môi trường sản xuất, không chỉ hoạt động tốt trong sự cô lập. Emerging Categories: Quality, Validation, and Confidence Became the Battleground Các thể loại mới nổi: Chất lượng, Xác nhận và Niềm tin trở thành chiến trường Sự thay đổi lớn thứ hai vào năm 2025 không được thúc đẩy bởi bất kỳ bản phát hành mô hình duy nhất nào. Khi tạo mã tăng tốc, những hạn chế mới xuất hiện gần như ngay lập tức.Sự thay đổi bắt đầu vượt quá tốc độ xem xét, các khiếm khuyết tinh tế xuất hiện muộn hơn dự kiến của các nhóm, và sự phức tạp ngày càng tăng khiến hành vi của hệ thống khó dự đoán hơn.Mã được viết bởi các công cụ AI khó khắc phục và hỗ trợ hơn bởi vì không ai trong tổ chức hiểu sâu hơn, bao gồm cả các công cụ AI đã viết mã. Đáp lại, các danh mục mới tập trung vào chất lượng, xác nhận và sự tự tin đã đạt được sự hấp dẫn.Đó không phải là nâng cấp năng suất gia tăng.Đó là những nỗ lực để cân bằng lại một hệ thống nơi tốc độ đã bắt đầu vượt qua sự chắc chắn. Một tín hiệu rõ ràng đến từ sự tiến hóa của chính công cụ đại lý. tại GitHub Universe 2025, Thay vì thay thế đầy hứa hẹn, Agent HQ đã đối xử với sự phát triển của đại lý như một vấn đề orchestration, cung cấp cho các nhóm sự hiển thị về những gì các đại lý đang làm trên các nhà cung cấp và nơi giám sát của con người vẫn còn quan trọng. GitHub giới thiệu Agent HQ Một sự thay đổi tương tự đã xuất hiện trong thử nghiệm và xác nhận. , ra mắt tại re:Invent 2025, đã định vị tự động hóa UI như là một vấn đề cơ sở hạ tầng chứ không phải là một bài tập kịch bản. trên quy mô – nó báo hiệu rằng bản thân thử nghiệm cần phải phát triển để theo kịp tốc độ phát triển do AI thúc đẩy. Luật mới của AWS Xuất bản các tuyên bố độ tin cậy Đồng thời, một làn sóng mới của sự chú ý đã hạ cánh trên , dự đoán sự thất bại, và phản ứng nhanh hơn một khi các hệ thống đã chạy trong sản xuất. AI SRE—các công cụ được thiết kế để phát hiện sự bất thường Một số tích hợp với các nền tảng quan sát hiện có, thu thập nhật ký, số liệu và dấu vết từ các hệ thống như , hoặc Mặc dù cách tiếp cận này dễ dàng hơn để áp dụng, nó thừa hưởng những hạn chế của khả năng quan sát phân mảnh. Nhiều tổ chức thiếu các công cụ nhất quán, hệ thống cổ truyền phát ra các nhật ký không có cấu trúc và các tín hiệu quan trọng vẫn vô hình. Trong các môi trường này, AI chỉ có thể lý luận về dữ liệu một phần - và phát hiện vẫn cơ bản phản ứng.Vào thời điểm bất thường bề mặt, mã lỗi đã được sản xuất và khách hàng có thể đã bị ảnh hưởng. dữ liệu Splunk Prometheus Những người khác có một cách tiếp cận sâu hơn, trong dòng, thu thập viễn thông trực tiếp từ cơ sở hạ tầng, môi trường chạy thời gian, hoặc lưu lượng mạng. Trong khi điều này cho phép tín hiệu phong phú hơn và phát hiện sớm hơn, nó đòi hỏi sự tích hợp cơ sở hạ tầng rộng rãi: triển khai các đại lý trên các dịch vụ, truy cập API của nhà cung cấp đám mây, và xử lý khối lượng lớn viễn thông thô. Đối với nhiều tổ chức, đặc biệt là những người không có thực tiễn quan sát trưởng thành, điều này tạo ra các đánh giá bảo mật dài, hoạt động vượt trội và áp dụng ma sát. Cả hai phương pháp tiếp cận chia sẻ một giới hạn cơ bản hơn: dữ liệu quan sát cho thấy các triệu chứng, không phải nguyên nhân. Phát hiện tăng độ trễ hoặc áp lực bộ nhớ có thể mua thời gian để giảm bớt một sự cố, nhưng hiếm khi giúp các nhóm xác định các con đường mã cụ thể, lỗi logic, hoặc trường hợp cạnh chịu trách nhiệm cho sự thất bại - chưa kể là ngăn chặn các vấn đề tương tự được giới thiệu trở lại. Kết quả là, các công cụ AI SRE giải quyết độ tin cậy sau khi các khiếm khuyết đạt đến sản xuất. Điều ngày càng trở nên rõ ràng vào năm 2025 là những vấn đề khó khăn nhất nằm ở trên. Khoảng cách giữa “thử nghiệm vượt qua” và “mã này an toàn trong sản xuất” vẫn còn lớn. các vấn đề được báo cáo bởi khách hàng vẫn đến thông qua các kênh hỗ trợ, tách khỏi bối cảnh mã. Cơ hội mới nổi không phải là phản ứng tình huống tốt hơn - nó ngăn chặn các sự cố xảy ra ở nơi đầu tiên. điều đó có nghĩa là chuyển thông tin tình báo gần hơn với nơi mã được viết, xem xét và sáp nhập, và kết nối các tín hiệu thất bại trong thế giới thực trở lại với những thay đổi cụ thể trước khi chúng đạt đến sản xuất. Cùng với nhau, các thể loại mới nổi này chỉ ra cùng một kết luận: rào cản trong kỹ thuật hiện đại đã chuyển từ viết mã sang xác nhận và vận chuyển nó một cách an toàn. Funding and Partnerships: Capital Followed Developer Platforms and Measurement Tài trợ và quan hệ đối tác: Capital Followed Developer Platforms and Measurement Xu hướng tài trợ vào năm 2025 đã củng cố sự thay đổi đó. , , và các nền tảng chất lượng dự đoán. , được hỗ trợ bởi các nhà sáng lập từ các công ty như Vercel và Figma, phản ánh niềm tin ngày càng tăng rằng chất lượng phần mềm dự đoán sẽ trở thành một lớp cốt lõi trong các đống kỹ thuật hiện đại. Theo báo cáo cuối năm của Crunchbase, Tuy nhiên, đối với các nhà lãnh đạo kỹ thuật, tín hiệu quan trọng hơn không phải là khối lượng vốn - đó là nơi vốn tập trung khi việc áp dụng AI không còn là vấn đề nữa. Tự động kiểm tra, QA data generation Tự động Test Automation Series A của PlayerZero (20 triệu USD) AI chiếm khoảng 50% vốn đầu tư mạo hiểm toàn cầu vào năm 2025 Hai động thái minh họa rõ ràng điều này. phản ánh sự tự tin vào các nền tảng nhà phát triển hỗ trợ phát triển AI-native ở quy mô lớn: lặp lại nhanh, hiệu suất sản xuất, đường ống triển khai và sự phức tạp hoạt động của việc vận chuyển phần mềm hiện đại một cách nhanh chóng. $300M Series F của Vercel Khi AI tăng sản lượng, các nhà lãnh đạo cần những cách tốt hơn để hiểu liệu sản lượng đó có cải thiện việc cung cấp hay không.DX nằm trong danh mục kỹ thuật thông minh, đo lường năng suất, chướng ngại vật và kết quả, và Atlassian rõ ràng khung hình việc mua lại xung quanh việc giúp các tổ chức đánh giá ROI khi việc áp dụng AI tăng tốc. Atlassian mua lại DX với giá 1 tỷ USD Capital chảy vào các nền tảng và các lớp đo lường giúp các tổ chức vận hành AI trong các hệ thống kỹ thuật thực tế. Chất lượng hoạt động, không phải thử nghiệm, đã trở thành ưu tiên hàng đầu. Why Agents Haven’t Crossed the Chasm (Yet) Tại sao các nhân viên không vượt qua khoảng cách (Nhưng) Nếu năm 2025 là năm AI trở nên phổ biến trong kỹ thuật, một câu hỏi tự nhiên sau đó là: tại sao các đại lý tự động không đi với nó? Các dữ liệu thông qua đưa ra câu trả lời rõ ràng, theo Khoảng một nửa các nhà phát triển hoặc không sử dụng các đại lý hoặc chỉ dựa vào các công cụ AI đơn giản hơn, và nhiều người báo cáo không có kế hoạch ngắn hạn để áp dụng quyền tự chủ đầy đủ. Khảo sát Stack Overflow 2025 Các tác nhân tự trị đòi hỏi bối cảnh mà hầu hết các tổ chức kỹ thuật vẫn chưa có trong một hình thức đáng tin cậy, có thể đọc bằng máy. Trước khi các đại lý có thể có hiệu quả, họ cần phải hiểu nhiều hơn mã. Làm thế nào hệ thống cư xử dưới tải và những gì "bình thường" trông như thế nào trong sản xuất Chủ sở hữu dịch vụ, phụ thuộc và ranh giới trách nhiệm Những thất bại nào quan trọng nhất, và nơi có hàng rào và chính sách Lịch sử đằng sau các sự cố, quyết định kiến trúc và các quy trình phát hành quản lý vận chuyển an toàn Trong nhiều tổ chức, bối cảnh đó vẫn tồn tại trong các mảnh vỡ - tài liệu bị phân tán, kiến thức thể chế, bảng điều khiển không kết nối, và postmortems khó thực hiện.Khi bối cảnh đó không đầy đủ hoặc không nhất quán, tự chủ không tạo ra đòn bẩy. Kết quả là, nhiều nhóm đã đưa ra một lựa chọn có chủ ý vào năm 2025. thay vì đẩy các đại lý vào vai trò hoàn toàn tự trị, họ tập trung vào copilots, giao diện trò chuyện và các lớp tổ chức hỗ trợ các kỹ sư trong khi giữ con người vững chắc trong vòng lặp. Trước khi trách nhiệm có thể được giao cho các đại lý phần mềm, các nhà lãnh đạo nhận ra sự cần thiết phải có nền tảng vững chắc hơn: tín hiệu chất lượng đáng tin cậy, khả năng quan sát giải thích Các hệ thống cư xử theo cách họ làm, và các vòng đánh giá dựa trên rủi ro sản xuất thực sự.Khi AI tiến gần hơn đến sản xuất, những khoảng trống đó trở nên khó bỏ qua và khẩn trương hơn để đóng cửa. Tại sao From Shipping Code to Shipping Quality: The Leadership Shift That Defined 2025 Từ mã vận chuyển đến chất lượng vận chuyển: Sự thay đổi lãnh đạo đã xác định 2025 Đến cuối năm 2025, việc tạo ra mã AI không còn là vấn đề khó khăn nữa.Copilots, trợ lý dựa trên trò chuyện và các ứng dụng được điều khiển bởi đại lý là những phần bình thường của sự phát triển, nhưng việc triển khai sản xuất đã trở thành rào cản.Thách thức lãnh đạo đã thay đổi từ “chúng ta có thể tạo mã nhanh như thế nào?” sang “làm thế nào để chúng ta gửi mã chất lượng một cách nhất quán khi tốc độ thay đổi tăng lên?” Sự đổi mới này phù hợp chặt chẽ với cách các nhà đầu tư và nhà khai thác mô tả thị trường vào năm 2025. mô tả một sự chuyển đổi từ “hệ thống hồ sơ”, lưu trữ thông tin, sang “hệ thống hành động”, tổ chức và xác nhận kết quả. Đối với các tổ chức kỹ thuật, ý nghĩa là rõ ràng: tạo ra các hiện vật nhanh chóng không đủ. Báo cáo tình trạng AI của Bessemer Venture Partners Sự nhận thức đó xuất hiện trong ba ưu tiên lãnh đạo đã chứng minh là thách thức hơn - và có giá trị hơn - so với bản thân việc tạo ra mã. Preventing Defects Before They Reach Production Ngăn chặn các khiếm khuyết trước khi chúng đạt đến sản xuất Khi tốc độ tăng lên, các sửa chữa tiếp theo trở nên đắt hơn và gây rối hơn. Các nhóm đã học được rằng chỉ dựa vào giám sát sau khi triển khai không còn đủ. Các nhà lãnh đạo bắt đầu đầu đầu tư vào kiểm tra trước khi sáp nhập phản ánh các chế độ thất bại thực tế, đánh giá liên tục so với các kịch bản tương tự như sản xuất, và phát hiện hồi quy mà bề mặt rủi ro trước khi phát hành. báo cáo của Bessemer rõ ràng nhấn mạnh “đánh giá liên tục tư nhân” như là cơ sở hạ tầng quan trọng cho nhiệm vụ, vì các tiêu chuẩn công khai không nắm bắt được rủi ro cụ thể cho doanh nghiệp. Measuring AI by Operational Outcomes, Not Usage Đo AI bằng kết quả hoạt động, không phải sử dụng Cuộc trò chuyện đã chuyển từ “Chúng tôi đang sử dụng AI?” sang “Có phải AI cải thiện kết quả mà chúng tôi có thể bảo vệ không?” đầu tư AI ngày càng phải gắn liền với các chỉ số mà các nhà lãnh đạo đã quan tâm: MTTR, tái phát lỗi, tần suất sự cố và khả năng kỹ thuật được phục hồi. Trong khi chỉ có một số ít các tổ chức báo cáo tác động EBIT có ý nghĩa từ AI, những tổ chức có xu hướng kết hợp việc áp dụng với việc theo dõi KPI nghiêm ngặt, thiết kế lại quy trình làm việc và kỷ luật xác nhận. McKinsey’s 2025 State of AI (Tình trạng AI năm 2025) Coordinating AI Across the Engineering System Điều phối AI trên toàn hệ thống kỹ thuật Khi AI xuất hiện ở khắp mọi nơi, trong trò chuyện, trong IDE, trong đánh giá mã, và trong QA, các nhà lãnh đạo phải đảm bảo các hệ thống này làm việc cùng nhau thay vì hình thành một bộ sưu tập các công cụ “hữu ích”. Đối với các nhà lãnh đạo kỹ thuật, những ưu tiên này đã làm nổi bật sự thay đổi thực sự của năm 2025: AI đã không còn là một cách để viết nhiều mã hơn và trở thành một bài kiểm tra về cách các tổ chức của họ có thể quản lý chất lượng, phối hợp và đo lường ở quy mô. Turning Mainstream Adoption Into a Durable Advantage Biến việc áp dụng chủ yếu thành một lợi thế bền vững Đến cuối năm 2025, AI đã không còn là thứ mà các nhóm kỹ thuật đã thử nghiệm bên cạnh. Nó đã trở thành thứ mà họ phải vận hành. Copilots, trợ lý trò chuyện và các công cụ được hỗ trợ bởi AI đã được nhúng vào sự phát triển, xem xét và thử nghiệm, làm cho AI trở thành một phần vĩnh viễn của cách phần mềm được xây dựng và vận chuyển. Những gì tách sự tiến bộ khỏi nỗi đau không phải là truy cập vào các mô hình tốt hơn, mà là sự trưởng thành hoạt động. Các nhóm tập trung vào việc ngăn chặn các khiếm khuyết trước khi phát hành, đo lường tác động của AI thông qua các số liệu kỹ thuật thực tế và phối hợp AI trên các hệ thống có thể di chuyển nhanh hơn mà không mất niềm tin. Điều này không đòi hỏi sự trưởng thành để đi trước việc thông qua - nhiều nhóm có hiệu suất cao đã xây dựng các khả năng này bởi vì thông qua AI buộc vấn đề. Các nhóm đối xử với AI như một lớp mỏng được thêm vào các dòng công việc hiện có đã phải vật lộn với sự mệt mỏi, suy thoái và rủi ro hoạt động ngày càng tăng. Nhìn về phía trước, nền tảng này là những gì sẽ làm cho làn sóng tự chủ tiếp theo có thể thực hiện được.Các đại lý sẽ chỉ mang lại đòn bẩy thực sự khi các đội có bối cảnh đáng tin cậy, tín hiệu chất lượng và vòng đánh giá. Đối với các nhà lãnh đạo kỹ thuật, cơ hội bây giờ rõ ràng: biến AI từ một bộ sưu tập các công cụ hữu ích thành một điểm đòn bẩy chiến lược - một điểm tăng cường chất lượng, cải thiện việc ra quyết định và chuẩn bị cho tổ chức cho những gì sắp tới.