Các nhà khoa học tại Thâm Quyến và Phúc Kiến của Trung Quốc công bố một hệ thống dữ liệu 3D và mô hình AI tiên tiến, giúp robot biểu cảm một cách tự nhiên và xóa nhòa ranh giới với con người.
Trong cuộc chạy đua chế tạo robot humanoid, khả năng tương tác và biểu cảm chân thực luôn là mục tiêu tối thượng, nhưng robot thường gặp khó khăn trong việc tái tạo các chi tiết phức tạp trên khuôn mặt con người.
Một nghiên cứu mới từ Viện Công nghệ Tiên tiến Thâm Quyến (SIAT) thuộc Học viện Khoa học Trung Quốc và Đại học Công nghệ Phúc Kiến đang mở ra hướng đi đột phá, hứa hẹn thay đổi toàn diện lĩnh vực này.

Từ bỏ phương pháp 2D, chuyển sang dữ liệu đám mây điểm 3D
Trước đây, hầu hết hệ thống nhận diện và điều khiển khuôn mặt robot dựa trên việc ánh xạ hình ảnh 2D lên mô hình 3D có sẵn, nhưng cách làm này dễ gây sai lệch và không bắt kịp các biến đổi tinh tế khi khuôn mặt chuyển động.
Để giải quyết vấn đề này, nhóm nghiên cứu do Giáo sư Tống Triển dẫn đầu đã áp dụng cách tiếp cận mới: làm việc trực tiếp với dữ liệu hình học thô dưới dạng đám mây điểm, mô tả chính xác từng lồi lõm trên khuôn mặt mà không cần đến màu sắc hay hình ảnh phủ ngoài.
Điểm đặc sắc của nghiên cứu là mô hình AI mang tên Mạng lưới chú ý đồ thị kết hợp độ cong (CF-GAT). Thay vì dựa vào màu da hay màu mắt, CF-GAT tập trung vào hình dạng cong của các đặc điểm khuôn mặt. AI có khả năng tự nhận diện các điểm mốc quan trọng như khóe mắt, vành môi hay gò má chỉ dựa trên dữ liệu không gian, giúp robot không bị ảnh hưởng bởi ánh sáng hay các mẫu kỹ thuật số thiếu cá nhân hóa.

Kho dữ liệu khổng lồ hỗ trợ trí tuệ nhân tạo
Một thuật toán thông minh luôn cần lượng dữ liệu lớn để học hỏi. Nhóm nghiên cứu đã tạo ra hệ thống thu thập dữ liệu 3D và 4D tùy chỉnh, ghi lại khoảng 200.000 bản quét khuôn mặt thật với độ chính xác cao. Đây là một trong những kho dữ liệu sinh trắc học 3D có cấu trúc lớn nhất thế giới.
Cơ sở dữ liệu không chỉ chứa khuôn mặt tĩnh mà còn bao gồm dữ liệu 4D, ghi lại biểu cảm động giúp AI nhận biết cách các cơ mặt co giãn khi cười, khóc hay ngạc nhiên. Nhờ kho tài nguyên phong phú này, CF-GAT hoạt động ổn định trước nhiễu và thích nghi với mọi dạng khuôn mặt trong đời thực.

Tương lai của robot trong đời sống con người
Những tiến bộ này mang ý nghĩa quan trọng cho thế hệ robot nhân dạng tiếp theo. Khi robot phát hiện trực tiếp các điểm mốc khuôn mặt từ hình học, chúng có thể theo dõi cử động con người chính xác và phản hồi bằng biểu cảm tự nhiên. Điều này đặc biệt hữu ích trong chăm sóc sức khỏe, nơi nét mặt truyền cảm xúc hỗ trợ tâm lý bệnh nhân, hay ngành dịch vụ khách hàng cần tương tác niềm nở.
Ngoài robot vật lý, công nghệ còn mở ra khả năng cho các avatar ảo trong vũ trụ số trở nên sống động hơn. Người dùng sẽ thấy nhân vật kỹ thuật số nheo mắt và cử động môi khớp hoàn toàn với thực tế, loại bỏ cảm giác cứng nhắc của các mô hình máy tính trước đây.
Sự kết hợp giữa lượng dữ liệu khổng lồ và thuật toán định hướng hình học do các nhà khoa học Trung Quốc phát triển đã tạo ra một chuẩn mực mới cho trí tuệ nhân tạo. Khi robot ngày càng mang hình dáng giống con người, chúng không chỉ là những cỗ máy vô tri mà đang dần trở thành những người bạn đồng hành, có khả năng giao tiếp phi ngôn ngữ một cách tinh tế.
