Hiện tại, Gemini 1.5 Pro đang dẫn đầu trong thế giới đánh giá trí tuệ nhân tạo (AI).
Vào ngày 1 tháng 8, - của OpenAI đã chính thức mất vị trí dẫn đầu khi Google âm thầm ra mắt phiên bản thử nghiệm của mô hình AI mới nhất.
Tuy nhiên, mô hình này đã nhanh chóng thu hút sự chú ý của cộng đồng AI trên các nền tảng truyền thông xã hội, khi các báo cáo cho thấy nó đang vượt trội so với các đối thủ về điểm số chuẩn.
Tiêu chuẩn AI
Kể từ khi GPT-3 ra mắt, của OpenAI đã trở thành tiêu chuẩn cho AI tạo sinh. Mô hình mới nhất của họ, GPT-, cùng với đối thủ cạnh tranh gần nhất là Claude-3 của Anthropic, đã chiếm ưu thế trong hầu hết các điểm chuẩn phổ biến trong khoảng một năm qua, với rất ít sự cạnh tranh.
Nguồn: Tổ chức Hệ thống Mô hình Lớn.
Một trong những tiêu chuẩn đánh giá phổ biến nhất là LMSYS Chatbot Arena. Tiêu chuẩn này đánh giá các mô hình dựa trên nhiều nhiệm vụ khác nhau và cấp điểm năng lực tổng thể. GPT- đạt 1.286 điểm, trong khi Claude-3 đạt 1.271 điểm.
Phiên bản trước của Gemini 1.5 Pro đạt 1.261 điểm. Tuy nhiên, phiên bản thử nghiệm mới (Gemini 1.5 Pro 0801) phát hành ngày 1 tháng 8 đã đạt tới 1.300 điểm.
Điều này cho thấy rằng về tổng thể, Gemini 1.5 Pro có vẻ vượt trội hơn các đối thủ, nhưng điểm chuẩn không phải lúc nào cũng phản ánh chính xác khả năng thực sự của mô hình AI.
Những phản ứng từ cộng đồng
Chúng ta dường như đang bước vào một kỷ nguyên mới, nơi thị trường chatbot AI đã trưởng thành đủ để cung cấp nhiều sự lựa chọn. Cuối cùng, người dùng sẽ chọn mô hình AI phù hợp nhất với nhu cầu của họ.
Có một làn sóng hứng khởi xung quanh phiên bản mới nhất của Gemini, với người dùng trên mạng xã hội khen ngợi nó là “cực kỳ ấn tượng”. Một người dùng Reddit thậm chí đã viết rằng nó “hoàn toàn vượt trội hơn GPT-”.
Hiện tại chưa rõ liệu phiên bản thử nghiệm của Gemini 1.5 Pro có trở thành phiên bản chính thức trong tương lai hay không. Mặc dù phiên bản này vẫn đang được cung cấp, nhưng việc nó đang trong giai đoạn thử nghiệm có thể dẫn đến việc bị hủy bỏ hoặc điều chỉnh vì lý do an toàn hoặc tinh chỉnh.
Tham gia Telegram tại: https://t.me/Mytourvn
Dựa trên thông tin từ Cointelegraph
