Khả năng của Siri trong việc đọc được biểu hiện của môi có thể giúp công cụ này nhận diện chính xác hơn các lệnh từ người dùng.
Apple vừa gửi đơn xin cấp bằng sáng chế mang tên 'Phát hiện từ khóa thông qua cảm biến chuyển động”, có khả năng phát hiện chuyển động của miệng và đầu, đồng thời cung cấp cho các trợ lý ảo khả năng đọc chuyển động của miệng.
Trong đơn xin cấp bằng sáng chế, giải thích rằng: Khi người dùng nói một câu nào đó, cảm biến chuyển động sẽ nhận diện và phân tích. Dữ liệu này sau đó được so sánh với một tham số bao gồm nhiều tập hợp từ và cụm từ, nếu chúng khớp với nhau thì hệ thống xem như đã nhận diện được giọng nói chỉ qua chuyển động của môi người dùng.
Phát hiện này có thể tăng thêm độ chính xác cho việc ra lệnh bằng giọng nói như hiện nay, khi cả hai phương pháp được kết hợp. Theo Apple, nếu chỉ dựa vào giọng nói, những tiếng ồn xung quanh có thể làm ảnh hưởng đến độ chính xác của đầu vào.
Trong đơn xin cấp bằng sáng chế, hình ảnh minh họa cách hệ thống hoạt động: Nó so sánh tính năng phát hiện chuyển động với dữ liệu đã có để xác định người nói đang nói gì.
Tuy nhiên, bằng sáng chế mới này không chỉ để cải thiện Siri. Theo Apple, việc micro của thiết bị luôn ở trạng thái chờ để lắng nghe xem người dùng có nói “Siri”, “Hey Siri” hay không sẽ tiêu tốn năng lượng. Do đó, nếu chỉ sử dụng cảm biến chuyển động hay gia tốc kế để phát hiện khi một người chuẩn bị nói gì thì sẽ tiết kiệm pin hơn. Bởi khi ai đó chuẩn bị nói, đầu, mặt, cổ, miệng của họ sẽ di chuyển.
Tuy nhiên, tính năng phát hiện chuyển động môi có lẽ chỉ hữu ích trong một số trường hợp. Ví dụ, nó sẽ được đào tạo để nhận biết khi người dùng bắt đầu nói: Hey Siri, Siri, hoặc “Siri, next song”. Nghĩa là các câu lệnh đơn giản, dễ huấn luyện. Trong khi những câu khác dài và phức tạp hơn có thể không được nhận diện.
Tóm lại, khả năng đọc môi và phát hiện tiếng nói chỉ áp dụng ngay lần đầu khi người dùng muốn thực hiện một lệnh gì đó. Sau đó, micro sẽ được kích hoạt để sử dụng.
Trong đơn xin cấp bằng sáng chế, Apple nhấn mạnh về các cảm biến chuyển động mà không đề cập đến camera. Do đó, việc phát hiện chuyển động của môi có thể chỉ dựa vào các cảm biến mà không sử dụng camera. Về lý thuyết, tính năng này có thể hoạt động trên các thiết bị như AirPods, Apple Vision Pro khi kết hợp với iPhone.
Bằng sáng chế của Apple được đề xuất bởi hai nhà phát minh, trong đó có cả Madhu Chinthakunta. Trong quá khứ, Chinthakunta đã thực hiện các bằng sáng chế cho phép Siri tự động thực hiện cuộc gọi và sắp xếp các cuộc hẹn thay vì bạn.