Theo OpenAI, GPT-4.1 vượt trội hơn GPT-4 ở "hầu hết mọi khía cạnh", đặc biệt là về khả năng lập trình và tuân theo các chỉ dẫn.
OpenAI đã chính thức giới thiệu GPT-4.1, phiên bản kế nhiệm của mô hình đa phương thức GPT-4 ra mắt năm ngoái. Động thái này được coi là phản ứng trực tiếp đối với sự cạnh tranh gay gắt từ các đối thủ, đặc biệt là DeepSeek của Trung Quốc với mô hình AI siêu hiệu quả về chi phí mới được công bố gần đây.
Trong một buổi livestream hôm thứ Hai, OpenAI tuyên bố GPT-4.1 đã vượt trội hơn GPT-4 ở "hầu hết mọi khía cạnh", với các cải tiến rõ rệt về khả năng lập trình và tuân thủ các yêu cầu hướng dẫn. Đặc biệt, GPT-4.1 có giá rẻ hơn 26% so với phiên bản trước, một yếu tố quan trọng trong bối cảnh cạnh tranh về giá ngày càng mạnh mẽ trong ngành AI.
Ngoài phiên bản tiêu chuẩn, OpenAI còn giới thiệu thêm hai phiên bản nhỏ gọn hơn là GPT-4.1 Mini và GPT-4.1 Nano. Theo OpenAI, GPT-4.1 Mini có giá thành thấp, phù hợp cho những nhà phát triển muốn thử nghiệm, trong khi GPT-4.1 Nano được quảng cáo là mô hình "nhỏ nhất, nhanh nhất và rẻ nhất" mà công ty từng phát triển.

Điểm nổi bật nhất của dòng GPT-4.1, và cũng là một sự tiến bộ vượt bậc so với GPT-4, là khả năng xử lý lên tới 1 triệu token ngữ cảnh - bao gồm văn bản, hình ảnh và video trong cùng một prompt. Đây là một bước đột phá so với giới hạn 128.000 token của GPT-4, tương đương với khoảng 750.000 từ, dài hơn cả tiểu thuyết "Chiến tranh và Hòa bình".
"Chúng tôi đã huấn luyện GPT-4.1 để xử lý thông tin một cách chính xác trong toàn bộ độ dài ngữ cảnh 1 triệu token," OpenAI chia sẻ trong bài đăng công bố mô hình. "Chúng tôi cũng đã cải thiện độ tin cậy của mô hình trong việc nhận diện văn bản liên quan và loại bỏ yếu tố gây nhiễu, cho dù đó là ngữ cảnh ngắn hay dài."
Theo Sarah Friar, Giám đốc tài chính của OpenAI, mô hình mới này đánh dấu một bước tiến quan trọng trong nỗ lực của công ty để xây dựng một "kỹ sư phần mềm tự động". OpenAI khẳng định rằng các mô hình trong tương lai sẽ có khả năng lập trình toàn bộ ứng dụng từ đầu đến cuối, bao gồm các yếu tố như đảm bảo chất lượng, kiểm tra lỗi và viết tài liệu.
"Chúng tôi đã tối ưu hóa GPT-4.1 để phù hợp với môi trường thực tế dựa trên phản hồi từ người dùng, cải thiện các lĩnh vực mà các nhà phát triển quan tâm nhất: lập trình giao diện người dùng, giảm thiểu những sửa đổi không cần thiết, đảm bảo tính chính xác trong việc tuân thủ định dạng, cấu trúc và thứ tự phản hồi, sử dụng công cụ nhất quán, và nhiều hơn thế," người phát ngôn của OpenAI chia sẻ qua email.

Về mặt hiệu suất, OpenAI cho biết GPT-4.1 vượt trội hơn so với các mô hình GPT-4 và GPT-4 mini trong các tiêu chuẩn lập trình, bao gồm cả SWE-bench. Tuy nhiên, theo các kiểm tra nội bộ, GPT-4.1 chỉ đạt từ 52% đến 54,6% trên tiêu chuẩn SWE-bench Verified, thấp hơn một chút so với Gemini 2.5 Pro của Google (63,8%) và Claude 3.7 Sonnet của Anthropic (62,3%) trong cùng một bài kiểm tra.
Về giá cả, GPT-4.1 có mức phí $2 cho mỗi triệu token đầu vào và $8 cho mỗi triệu token đầu ra. GPT-4.1 mini có giá $0,40/triệu token đầu vào và $1,60/triệu token đầu ra, trong khi GPT-4.1 nano có mức giá rẻ hơn, chỉ $0,10/triệu token đầu vào và $0,40/triệu token đầu ra.
Mặc dù GPT-4.1 đã đạt được những tiến bộ ấn tượng, OpenAI thừa nhận mô hình này vẫn tồn tại một số hạn chế. Độ tin cậy của mô hình giảm khi phải xử lý số lượng lớn token đầu vào. Trong một bài kiểm tra nội bộ của OpenAI, độ chính xác giảm từ khoảng 84% với 8.000 token xuống còn 50% khi xử lý 1 triệu token. Hơn nữa, GPT-4.1 có xu hướng "hiểu theo nghĩa đen" nhiều hơn so với GPT-4, đôi khi yêu cầu các prompt cần phải cụ thể và rõ ràng hơn.
Sự ra mắt của GPT-4.1 cũng đánh dấu một bước ngoặt quan trọng trong lịch trình phát triển của OpenAI. CEO Sam Altman đã thông báo trên nền tảng X rằng việc ra mắt GPT-5 sẽ bị trì hoãn và dự kiến sẽ diễn ra "trong vài tháng tới", muộn hơn so với thời hạn tháng 5 mà trước đó đã được kỳ vọng. Altman cho biết sự chậm trễ là do OpenAI "đã gặp khó khăn hơn dự kiến trong việc tích hợp mọi thứ một cách suôn sẻ".
Hiện tại, GPT-4.1 đã có sẵn cho các nhà phát triển thông qua API của OpenAI, nhưng chưa được tích hợp vào , điều này cho thấy OpenAI đang tập trung vào việc phục vụ cộng đồng lập trình viên với mô hình mới nhất của mình.
