GPT-4o là một mô hình AI mới từ OpenAI, được phát hành miễn phí cho mọi người, tuy nhiên với một số hạn chế. Trong bài viết này, tôi muốn chia sẻ với mọi người về GPT-4o và những điểm khác biệt so với GPT-4 trước đây. [Liên kết tại đây.](https://Mytour.vn)
[Link để tải ứng dụng ChatGPT cho macOS.](https://Mytour.vn)Tính năng phân tích hình ảnh
Đầu tiên, tôi thử sử dụng một bức ảnh chụp bằng điện thoại và yêu cầu ChatGPT nhận diện đối tượng trong ảnh đó. Kết quả cho thấy GPT-4o phân tích rất chính xác và đặc biệt là tốc độ tạo ra câu trả lời của GPT-4o nhanh hơn nhiều so với GPT-4, điều này rất quan trọng đối với người dùng.
Tiếp theo, tôi thử với một bức ảnh khác về chip Intel Lunar Lake, GPT-4o có khả năng đọc nội dung trong bài thuyết trình của CEO Intel Pat Gelsinger một cách rõ ràng, và tất nhiên là vẫn rất nhanh chóng.
Tôi tiếp tục thử sử dụng một hình ảnh biểu đồ Gantt, mặc dù không rõ nét, nhưng GPT-4o vẫn tạo ra một tổng kết hoàn toàn chính xác, rõ ràng và chi tiết. Khi thử với Gemini 1.5 Pro của Google, model AI này cũng trả lời được, nhưng không chi tiết như GPT-4o, điều này cũng đúng với GPT-4.
Tiếp tục với một bảng khác, dù chữ không rõ ràng, có cả watermark nhưng GPT-4o vẫn có thể đọc và cung cấp cho tôi một bảng tóm tắt cực kì chi tiết.Bên trái là GPT-4, bên phải là GPT-4o.
Tiếp theo, tôi thử với một bức ảnh có người, vật, khung cảnh và cả chữ. GPT-4 mô tả khá chi tiết, nhưng GPT-4o mô tả thậm chí còn chi tiết hơn, biết người trong ảnh có đeo kính, những người ngồi phía sau đang thư giãn hoặc sử dụng điện thoại, và cả dòng chữ trên bảng hiệu. Khung cảnh xung quanh được GPT-4o dự đoán khá chính xác. Quan trọng là tốc độ tạo ra văn bản vẫn nhanh hơn GPT-4 nhiều.
Tuy nhiên, điều tuyệt vời nhất về GPT-4o so với GPT-4 là khả năng hiểu ngôn ngữ tự nhiên, giao tiếp với con người như chính chúng ta đang nói chuyện với bạn, đó là tương lai của trí tuệ nhân tạo mà nhiều người đang mơ tưởng cũng như các nhà phát triển AI như Google đang hướng tới. Thậm chí, trong tương lai, GPT-4o có thể đọc nội dung trên màn hình máy tính, điện thoại theo thời gian thực, trả lời mọi câu hỏi bạn đặt ra và nhiều hơn nữa.
Trò chuyện với GPT-4o thử xem
Với ứng dụng cho macOS và Android cũng như iOS, GPT-4o có thể giao tiếp với chúng ta, theo ngôn ngữ mà chúng ta đang nói, hoặc dịch câu nói của bạn sang ngôn ngữ khác.
Cuộc trò chuyện giữa tôi và GPT-4o đã được chuyển thành văn bản. Theo đánh giá của tôi, khả năng hiểu và trò chuyện của nó rất tuyệt vời. Trước đây, tôi chưa thử trên GPT-4 nên không biết liệu nó có tốt như GPT-4o hay không, nhưng tôi cảm nhận rằng nó trò chuyện với tôi rất tự nhiên.
Tốc độ phản hồi, đặc biệt là bằng tiếng Việt, phụ thuộc vào số lượng kết nối và tình trạng internet tại khu vực của bạn. Tôi đã thử và kết nối ban đầu khá lâu và trong quá trình sử dụng, thường bị gián đoạn và không rõ ràng. Tôi nghĩ đó là do tình trạng mạng và có quá nhiều người truy cập vào GPT-4o cùng một lúc.
GPT-4o thú vị và thông minh hơn GPT-4, nhưng...
Đó là cảm nhận của tôi khi sử dụng GPT-4o. Trước đây, tôi ít sử dụng ChatGPT vì có Gemini và Copilot, nhưng từ khi có GPT-4o, tôi sẽ sử dụng nhiều hơn (chủ yếu là vì đã mua bản Plus với giá 500k😁).
Với tôi, GPT-4o thông minh hơn GPT-4, đa năng hơn vì nó là AI đa phương tiện, làm việc hiệu quả hơn GPT-4, thời gian sinh ra câu trả lời cũng nhanh hơn GPT-4 rất nhiều, tôi ước lượng cũng nhanh gấp đôi, tiết kiệm thời gian đợi chờ.
Tất nhiên, nó vẫn còn một số hạn chế, ví dụ như khả năng trò chuyện chưa thực sự tốt, kết nối không ổn định, khi giao tiếp nếu đường truyền không tốt, giọng nói sẽ khá khó nghe, hoặc khả năng phân tích video online hoặc offline vẫn chưa bằng Gemini. Nhưng GPT-4o nói tiếng Việt rất chính xác, giọng nói tự nhiên, có chút giống người thật.
Hiện tại, tính năng stream trực tiếp hình ảnh từ camera điện thoại (ứng dụng di động) hoặc màn hình máy tính (ứng dụng desktop) vẫn chưa được OpenAI hỗ trợ, nhưng sẽ sớm được cập nhật, lúc đó tôi sẽ thử và chia sẻ kết quả với mọi người sau.