Các chuyên gia phát hiện ảo tưởng về hiệu suất của coder khi dùng AI y hệt chứng 'điên dữ liệu' mà các hệ thống máy học thường mắc phải.
Nghiên cứu đột phá từ METR vừa công bố một nghịch lý đáng kinh ngạc: thay vì tăng 24% hiệu suất như kỳ vọng, các công cụ AI coding thực chất làm giảm 19% tốc độ làm việc, đồng thời tạo ra ảo giác về năng suất trong tâm trí lập trình viên.
Điều gây sốc không nằm ở con số thống kê, mà ở khoảng cách khổng lồ giữa nhận thức chủ quan và thực tế khách quan. Dù kết quả đo lường rõ ràng, đa số developer vẫn khăng khăng tin rằng AI giúp họ tiết kiệm 20% thời gian - hiện tượng 'ảo tưởng tập thể' tương đồng kỳ lạ với lỗi hallucination của chính các thuật toán AI.

Trái ngược hoàn toàn với dự đoán của giới chuyên môn, thực nghiệm chứng minh AI khiến tốc độ coding sụt giảm tới 19%
Cuộc thử nghiệm quy mô được tiến hành với 16 senior developer dày dạn kinh nghiệm trong các dự án open-source. Họ được giao 246 task thực tế bao gồm debug và phát triển tính năng mới, sau đó ước lượng thời gian hoàn thành. Các nhiệm vụ được phân ngẫu nhiên thành hai nhóm: có và không sử dụng AI (chủ yếu là Cursor Pro tích hợp Claude /3.7 Sonnet).
Kết quả thu được từ tháng 2 đến tháng 6/2025 đảo ngược hoàn toàn mọi giả thuyết ban đầu. Thay vì tăng hiệu suất, AI trở thành 'cục gạch' kéo chậm quá trình phát triển phần mềm. Nhưng điều đáng nói nhất là các developer hoàn toàn không nhận ra sự trì trệ này, thậm chí còn lạc quan thái quá về hiệu quả công việc.
Nghiên cứu chỉ ra 5 yếu tố then chốt gây ra hiện tượng này. Khởi nguồn từ niềm tin thái quá vào AI, khi các coder đặt kỳ vọng vượt xa khả năng thực tế của công cụ. Đáng chú ý, với những developer đã thành thạo repository, AI gần như không mang lại giá trị gia tăng đáng kể nào.
Nguyên nhân thứ ba đến từ quy mô dự án - AI tỏ ra kém hiệu quả rõ rệt khi xử lý hệ thống trên 1 triệu dòng code. Độ tin cậy thấp cũng là vấn đề khi chỉ dưới 44% gợi ý từ AI được chấp nhận, buộc developer phải tốn thời gian kiểm tra kỹ lưỡng. Điểm yếu cuối cùng nằm ở khả năng nắm bắt ngữ cảnh cụ thể của từng repository.

Kết quả cho thấy nhóm không dùng AI có nhiều thời gian coding hơn, trong khi nhóm sử dụng AI lại mất nhiều thời gian cho việc tạo prompt, chờ phản hồi và đánh giá kết quả từ hệ thống
Nghiên cứu ghi nhận sự thay đổi căn bản trong quy trình làm việc khi có AI. Thay vì tập trung viết code và tra cứu thông tin, developer phải phân bổ thời gian cho việc tương tác với AI - từ tạo prompt, chờ xử lý đến kiểm tra output. Kết quả là thời gian coding thực tế giảm nhưng tổng thời gian hoàn thành task lại tăng lên.
Hiện tượng này không phải cá biệt. Nghiên cứu từ Qodo cho thấy lợi ích của AI bị giảm thiểu do nhu cầu kiểm tra bổ sung. Khảo sát tại Đan Mạch ghi nhận AI tạo sinh không ảnh hưởng đáng kể đến việc làm hay thu nhập. Trong khi đó, Intel công bố kết quả cho thấy máy tính AI thực sự làm giảm năng suất người dùng.

Nhiều developer chia sẻ trải nghiệm tương tự: dù AI hữu ích cho việc test scenario nhanh trong môi trường ít rủi ro và tự động hóa task thường xuyên, nhưng không tiết kiệm được tổng thời gian do yêu cầu verify code nghiêm ngặt. Khác với thực tập sinh thực thụ, AI không có khả năng học hỏi và tiến bộ.
Tuy nhiên, nhóm nghiên cứu lưu ý cần đặt kết quả trong bối cảnh cụ thể. Sự chậm trễ quan sát được không đồng nghĩa AI hoàn toàn vô dụng. Các yếu tố như độ quen thuộc với repository, quy mô và độ phức tạp dự án đóng vai trò quan trọng, và không phải môi trường phát triển nào cũng chịu ảnh hưởng tương tự.
Nhóm nghiên cứu nhấn mạnh rằng kết quả này không phủ nhận giá trị của AI hiện tại hay tiềm năng cải tiến trong tương lai. Đây chỉ là khảo sát tại một thời điểm nhất định với bộ công cụ và điều kiện thử nghiệm cụ thể. Phát hiện này đặt ra vấn đề đáng quan tâm: khoảng cách giữa cảm nhận chủ quan và hiệu quả thực tế khi ứng dụng AI, đặc biệt là hội chứng 'ảo tưởng hiệu suất' mà nhiều người dùng vô tình mắc phải.
Nguyễn Hải (Theo Register)
