Tuy nhiên, Microsoft vẫn tin tưởng rằng AI hoàn toàn có thể cải thiện nếu được đào tạo chuyên sâu hơn
Trong bối cảnh nhiều người cho rằng AI có thể thay thế lập trình viên trong tương lai gần, một nghiên cứu từ Microsoft đã đưa ra cái nhìn thực tế hơn. Dù các công cụ như GitHub Copilot hay nhiều startup AI đang chứng tỏ khả năng sinh mã nhanh chóng và đưa ra gợi ý thông minh, nhưng khi đến giai đoạn xử lý lỗi – một phần quan trọng trong phát triển phần mềm – AI lại bộc lộ rõ sự hạn chế.
Nghiên cứu của Microsoft chỉ ra rằng các công cụ AI hiện nay chủ yếu đưa ra ví dụ hoặc mã mẫu, nhưng chúng không thực sự có khả năng tương tác với quá trình thực thi mã hay tự động tìm kiếm thông tin mới khi mọi thứ không hoạt động như dự kiến. Trong khi đó, lập trình viên con người lại có thể làm điều này một cách tự nhiên, đặc biệt khi phải tìm kiếm và xử lý lỗi trong các hệ thống phức tạp.

Để đánh giá rõ hơn, Microsoft đã phát triển một nền tảng thử nghiệm mang tên debug-gym, cho phép các mô hình ngôn ngữ lớn tham gia vào quá trình gỡ lỗi với môi trường và công cụ giống như những gì con người sử dụng. Các thử nghiệm với một AI agent đơn giản dựa trên mô hình ngôn ngữ hiện tại cho thấy kết quả khả quan ở một vài điểm, nhưng vẫn còn nhiều hạn chế: ngay cả khi được cấp quyền truy cập vào công cụ gỡ lỗi tương tác, các AI này hiếm khi giải quyết được quá nửa số bài test trong bộ benchmark.
Theo nhóm nghiên cứu, nguyên nhân chính là do các mô hình ngôn ngữ hiện tại chưa được huấn luyện với đủ dữ liệu mô phỏng hành vi xử lý lỗi theo chuỗi – tức là cách mà con người tiếp cận, thử nghiệm, quan sát, điều chỉnh và khắc phục từng bước. Thêm vào đó, các mô hình này cũng chưa thực sự biết cách sử dụng công cụ gỡ lỗi một cách linh hoạt và hiệu quả như con người.
Dù vậy, Microsoft vẫn tin tưởng rằng AI có thể hoàn thiện nếu được đào tạo theo hướng chuyên sâu hơn. Họ đề xuất phát triển một mô hình có khả năng “tìm kiếm thông tin” – tự động thu thập dữ liệu liên quan đến lỗi và chuyển thông tin này cho một mô hình sinh mã mạnh mẽ hơn để xử lý. Đây là hướng tiếp cận đầy hứa hẹn giúp AI tiến gần hơn đến khả năng giải quyết vấn đề như con người.
Tổng thể, nghiên cứu này lại một lần nữa khẳng định rằng dù AI có thể viết mã, nhưng nó vẫn chưa thể đảm nhận những nhiệm vụ quan trọng nhất trong nghề lập trình – như xử lý lỗi, bảo mật và đưa ra quyết định trong những tình huống không hoàn hảo. Cho đến khi làm được điều này, AI vẫn chỉ là công cụ hỗ trợ và chưa thể thay thế hoàn toàn con người.
