Một thuật toán AI tiên tiến mới đã xuất hiện, có khả năng tạo ra mô hình 3D từ hình ảnh thật trong vòng chỉ 5 giây.

Buzz

Ngày cập nhật gần nhất: 15/7/2026

Nội dung bài viết

Một thuật toán mới được ra đời, được gọi là Mô hình Tái tạo Lớn (LRM), có khả năng tạo mô hình 3D từ hình ảnh thực chỉ trong một nháy mắt.

Xem thêm

Đọc tóm tắt

- Mô hình Tái tạo Lớn (LRM) mới có khả năng tạo mô hình 3D từ hình ảnh chỉ trong 5 giây.
- Sử dụng dữ liệu lớn và kiến trúc máy biến áp với 500 triệu tham số, LRM tạo ra các mô hình 3D chất lượng cao từ hình ảnh thực tế và đầu vào từ các dịch vụ AI. Thuật toán này có tiềm năng ứng dụng rộng trong thiết kế, giải trí và nhiều ngành công nghiệp khác.

Một thuật toán mới được ra đời, được gọi là Mô hình Tái tạo Lớn (LRM), có khả năng tạo mô hình 3D từ hình ảnh thực chỉ trong một nháy mắt.

Sử dụng một tập dữ liệu lớn để huấn luyện thuật toán học máy, các nhà nghiên cứu từ Adobe và Đại học Quốc gia Úc đã tạo ra một công nghệ độc đáo có thể làm nên điều kỳ diệu trong việc tạo ra mô hình 3D. Họ đã phát triển Mô hình Tái tạo Lớn (LRM), có khả năng dự đoán hình dạng của mô hình 3D từ một hình ảnh hai chiều duy nhất và có thể thực hiện điều này chỉ trong vòng 5 giây.

Thuật toán AI mới có thể tạo ra mô hình 3D từ hình ảnh thật trong vòng chỉ 5 giây.

Các nhà nghiên cứu đã giải thích trong bài báo của họ rằng các mô hình 3D trước đây thường được huấn luyện trên các bộ dữ liệu nhỏ hơn, chủ yếu tập trung vào một loại hình ảnh duy nhất. Ngược lại, Mô hình LRM của họ có kiến trúc dựa trên máy biến áp, có khả năng mở rộng lớn với 500 triệu tham số có thể học được và đã được huấn luyện trên khoảng 1 triệu đối tượng 3D từ bộ dữ liệu Objaverse và MVImgNet.

Các nhà nghiên cứu đã giải thích rằng, sự kết hợp giữa mô hình dung lượng cao và dữ liệu đào tạo quy mô lớn này mang lại cho thuật toán LRM khả năng tạo ra nội dung 'có độ tổng quát cao'. Báo cáo cũng nêu rõ rằng mô hình này có thể tạo ra các bản tái tạo 3D 'chất lượng cao' từ nhiều hình ảnh thử nghiệm khác nhau, kể cả ảnh thực tế. Hơn nữa, LRM có thể sử dụng cả hình ảnh 'bình thường' và các bản vá hình ảnh được tạo ra bởi các dịch vụ AI như DALL-E và Stable Diffusion làm đầu vào cho mô hình 2D.

Một thuật toán AI mới đã xuất hiện, có khả năng tạo ra mô hình 3D từ hình ảnh thật trong vòng chỉ 5 giây.

Theo tác giả chính của nghiên cứu, Yicong Hong, LRM đánh dấu một bước tiến quan trọng trong việc tái tạo 3D từ một hình ảnh. Thuật toán AI có thể tạo ra hình dạng chi tiết từ video hoặc hình ảnh, bảo toàn các cấu trúc phức tạp như vân gỗ.

Các nhà nghiên cứu cho biết LRM có khả năng 'biến đổi' tiềm năng vì nó có thể được áp dụng trong nhiều ngành công nghiệp khác nhau bao gồm thiết kế, giải trí và trò chơi điện tử. Các nhà thiết kế hoặc nghệ sĩ 3D có thể tối ưu hóa quá trình tạo mô hình 3D, giảm thiểu đáng kể thời gian cần thiết để tạo nội dung cho trò chơi điện tử hoặc hoạt hình. Việc tạo nội dung 3D trong một ngành đang phát triển nhanh chóng đã trở thành một thách thức và các công ty AI đang nỗ lực cung cấp các giải pháp tiềm năng như dịch vụ Stable 3D mà Stability AI gần đây giới thiệu.

LRM cũng có thể đem lại sự dân chủ hóa cho việc tạo mô hình 3D, vì người dùng 'bình thường' có thể tạo ra các mô hình có độ chi tiết cao từ những bức ảnh chụp bằng điện thoại thông minh. Mặc dù LRM vẫn phải đối mặt với những thách thức như cấu trúc mờ trong những phần ẩn của hình ảnh, nhưng nó mở ra một thế giới đầy cơ hội sáng tạo và thương mại.

Các câu hỏi thường gặp

Mô hình Tái tạo Lớn (LRM) là gì và hoạt động như thế nào?

Mô hình Tái tạo Lớn (LRM) là một thuật toán AI có khả năng tạo mô hình 3D từ hình ảnh 2D chỉ trong vòng 5 giây. Được huấn luyện trên dữ liệu lớn, LRM sử dụng cấu trúc máy biến áp để dự đoán hình dạng chi tiết của các mô hình 3D từ hình ảnh thực tế.

LRM có thể tạo ra mô hình 3D từ những loại hình ảnh nào?

LRM có thể sử dụng cả hình ảnh 'bình thường' và các bản vá hình ảnh được tạo bởi dịch vụ AI như DALL-E và Stable Diffusion. Điều này giúp LRM có khả năng tạo ra mô hình 3D từ nhiều loại hình ảnh thử nghiệm khác nhau.

Mô hình Tái tạo Lớn (LRM) có thể được áp dụng trong những ngành công nghiệp nào?

Mô hình LRM có thể được áp dụng trong nhiều ngành công nghiệp, bao gồm thiết kế, giải trí và trò chơi điện tử. Nó giúp các nhà thiết kế và nghệ sĩ 3D tối ưu hóa quá trình tạo mô hình, giảm thiểu thời gian và công sức trong việc phát triển nội dung cho các trò chơi và phim hoạt hình.

LRM có thể giúp những người dùng bình thường tạo mô hình 3D từ ảnh như thế nào?

LRM giúp người dùng bình thường tạo mô hình 3D có độ chi tiết cao từ những bức ảnh chụp bằng điện thoại thông minh. Điều này mở ra cơ hội cho nhiều người tham gia vào việc tạo ra nội dung 3D mà không cần kỹ năng chuyên môn.

Những thách thức mà Mô hình Tái tạo Lớn (LRM) phải đối mặt là gì?

Mặc dù LRM có khả năng tạo mô hình 3D chất lượng cao, nhưng nó vẫn phải đối mặt với những thách thức, đặc biệt là trong việc xử lý cấu trúc mờ của các phần ẩn trong hình ảnh. Điều này có thể ảnh hưởng đến độ chính xác của mô hình tạo ra.

Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.

Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua Zalo: 0978812412 hoặc Email: [email protected]