Apple Tiết Lộ Bước Tiến Mới Trong Trí Tuệ Nhân Tạo Để Huấn Luyện LLM Về Hình Ảnh Và Văn Bản

Buzz

Các câu hỏi thường gặp

1.

Mô hình ngôn ngữ MM1 của Apple có khả năng gì nổi bật?

MM1 có khả năng nhận diện và đếm các đối tượng trong hình ảnh mà không cần huấn luyện trước. Nó kết hợp thông tin văn bản và hình ảnh để tạo ra kết quả văn bản chính xác.
2.

MM1 của Apple hoạt động dựa trên những dữ liệu nào?

MM1 sử dụng dữ liệu bao gồm cặp chú thích hình ảnh, tài liệu văn bản-hình ảnh xen kẽ và dữ liệu chỉ có văn bản, với tới 30 tỷ tham số trong mô hình.
3.

Mô hình ngôn ngữ đa phương thức của Apple có gì đặc biệt?

Mô hình ngôn ngữ đa phương thức (MLLM) của Apple có khả năng học trong ngữ cảnh, cho phép nó hiểu truy vấn mà không cần điều chỉnh lại cho từng truy vấn riêng lẻ.
4.

Apple có kế hoạch gì cho các mô hình AI trong tương lai?

Có, Apple đang trong quá trình phát triển mô hình tiếp theo sau MM1 và có thể tích hợp công nghệ AI Gemini của Google vào các tính năng của điện thoại thế hệ tiếp theo.