Mặc dù có khả năng suy luận vượt trội so với các mô hình trước, GPT-4.5 lại tỏ ra kém hơn các đối thủ như DeepSeek R1 và Claude 3.7 Sonnet khi phải đối mặt với các bài toán phức tạp.

Vào ngày thứ Năm, OpenAI đã chính thức công bố GPT-4.5, hay còn được gọi là "Orion". Đây là mô hình AI mạnh mẽ nhất mà công ty phát triển, với dữ liệu khổng lồ và khả năng tính toán vượt trội so với các phiên bản trước đó. Tuy nhiên, OpenAI không coi GPT-4.5 là một bước đột phá trong nghiên cứu AI.
Những người đăng ký gói Pro (200 USD/tháng) của OpenAI sẽ là những người đầu tiên trải nghiệm GPT-4.5 dưới dạng bản xem trước nghiên cứu từ hôm nay. Các nhà phát triển trên các gói trả phí của API OpenAI cũng sẽ có quyền truy cập vào mô hình mới này. OpenAI cho biết GPT-4.5 sẽ được mở rộng tới người dùng Plus và Team vào tuần tới.

Giới công nghệ đang rất kỳ vọng vào Orion, vì nó được xem là minh chứng cho tính khả thi của các phương pháp huấn luyện AI truyền thống. GPT-4.5 được phát triển dựa trên kỹ thuật tương tự các thế hệ GPT trước đó, với sự gia tăng mạnh mẽ về dữ liệu và sức mạnh tính toán trong giai đoạn "tiền huấn luyện" gọi là học không giám sát.
Dù quy mô lớn giúp GPT-4.5 có "kiến thức thế giới sâu rộng" và "trí tuệ cảm xúc cao", nhưng có dấu hiệu cho thấy việc mở rộng dữ liệu và tính toán đang đến giới hạn. Trong một số bài kiểm tra chuẩn AI, GPT-4.5 không thể vượt qua các mô hình "lý luận" mới hơn từ DeepSeek, Anthropic và chính OpenAI.

GPT-4.5 mang lại độ chính xác cao hơn và giảm thiểu mức độ ảo giác so với các mô hình AI trước đây.
Việc vận hành GPT-4.5 tiêu tốn rất nhiều chi phí, đến mức OpenAI đang xem xét khả năng tiếp tục cung cấp mô hình này trong API của mình trong tương lai. Để truy cập API GPT-4.5, OpenAI tính phí các nhà phát triển 75 USD cho mỗi triệu token đầu vào và 150 USD cho mỗi triệu token đầu ra, cao gấp nhiều lần so với mức phí 2,5 USD và 10 USD của GPT-.
Trong bài kiểm tra chuẩn SimpleQA của OpenAI, GPT-4.5 thể hiện vượt trội hơn GPT- và các mô hình lý luận o1, o3-mini về độ chính xác. Mô hình này cũng ít bị ảo giác hơn hầu hết các đối thủ. Tuy nhiên, GPT-4.5 lại thua kém các đối thủ như DeepSeek R1 và Claude 3.7 Sonnet trong các bài kiểm tra học thuật khó như AIME và GPQA.

GPT-4.5 thể hiện khả năng sáng tạo khi tạo ra các hình ảnh hợp lý chỉ từ những đoạn mã code.
OpenAI cho rằng GPT-4.5 vượt trội hơn trong những khía cạnh mà các bài kiểm tra chuẩn không thể đánh giá tốt, như khả năng hiểu ý định của con người, phản ứng với giọng điệu tự nhiên và ấm áp hơn, cùng khả năng thực hiện các tác vụ sáng tạo như viết lách và thiết kế. Trong một bài kiểm tra không chính thức, GPT-4.5 là mô hình AI duy nhất tạo ra hình ảnh kỳ lân bằng SVG giống thật.

GPT-4.5 thể hiện khả năng trí tuệ cảm xúc xuất sắc khi đáp ứng yêu cầu từ người dùng.
Những hạn chế của GPT-4.5 dường như xác nhận các dự đoán rằng các quy luật mở rộng tiền huấn luyện sẽ không còn chính xác trong tương lai. Ilya Sutskever, đồng sáng lập OpenAI, cũng đã từng nói rằng "chúng ta đã đạt đỉnh dữ liệu" và "tiền huấn luyện như chúng ta biết sẽ kết thúc". Điều này đã thúc đẩy ngành công nghiệp, bao gồm cả OpenAI, chuyển hướng sang các mô hình lý luận.
OpenAI dự định kết hợp dòng mô hình GPT với dòng mô hình lý luận "o", bắt đầu với GPT-5 vào cuối năm nay. Mặc dù GPT-4.5 không thể giành chiến thắng trong các bài kiểm tra chuẩn AI, nhưng OpenAI hy vọng nó sẽ là bước đệm quan trọng để phát triển một mô hình mạnh mẽ hơn trong tương lai.
