Sau nhiều lần chứng kiến những hậu quả từ việc lái xe mất tập trung, ông Cooper nhận ra sự cần thiết của việc tối ưu hóa công nghệ kích hoạt bằng giọng nói của SYNC®, bằng cách giản lược thông tin đầu vào xuống chỉ một câu lệnh.
“Tôi đã gặp nhiều tai nạn do tài xế mất tập trung khi lái xe, điều đó đã thúc đẩy tôi nghiên cứu và phát triển công nghệ này”, ông Cooper chia sẻ. “Bằng cách giảm thiểu sự phân tâm và dễ dàng vận hành, hệ thống kích hoạt bằng giọng nói sẽ đảm bảo tài xế tập trung điều khiển xe an toàn.”
Công nghệ kích hoạt bằng giọng nói đã trở thành một phần của hệ thống SYNC® từ những phiên bản đầu tiên cách đây 13 năm. Ra mắt chính thức vào năm 2014, SYNC® 3 đang liên tục được cải tiến. Với khả năng hỗ trợ lên tới 25 ngôn ngữ, hệ thống này mang lại trải nghiệm rộng lớn cho người dùng trên toàn thế giới.
Là trang bị tiêu chuẩn trên nhiều dòng xe của Ford, SYNC® đã phát triển mạnh mẽ - trở thành một trong những hệ thống kích hoạt bằng giọng nói tiên tiến nhất hiện nay.
Hệ thống cốt lõi của SYNC® là việc nhận diện và thực hiện lệnh bằng giọng nói - hoạt động như một bộ não nhận diện giọng nói. Dữ liệu ngôn ngữ kết hợp với phần mềm giải mã để phân tích và hiểu từng câu lệnh của người dùng.
Dữ liệu ngôn ngữ là một danh sách lớn các từ hoặc câu lệnh được lập trình để thực hiện một nhiệm vụ cụ thể. Ví dụ như câu lệnh “Gọi John Doe” được ghi nhận bằng hơn 25 ngôn ngữ trên hệ thống SYNC®. Ngoài ra, nhiều câu lệnh khác tương ứng với các tính năng trên xe cũng được lưu trữ trong dữ liệu ngôn ngữ của SYNC®.
Phần mềm giải mã giọng nói sẽ lọc ra đặc tính âm thanh của từng câu lệnh để khớp với danh sách từ trong dữ liệu ngôn ngữ. Ví dụ, khi nói “Gọi John Doe”, phần mềm giải mã sẽ phân tích âm thanh thu được, sau đó tìm kiếm trong dữ liệu ngôn ngữ để tìm ra mệnh lệnh tương tự, giúp hệ thống SYNC® hiểu yêu cầu từ người dùng.
Giọng nói từ các vùng miền khác nhau trên cùng một quốc gia cũng được chú ý. Trong các ngôn ngữ như tiếng Anh, tiếng Trung, tiếng Thái… có nhiều phương ngữ và giọng khác nhau, nên dữ liệu ngôn ngữ được cập nhật để nâng cao khả năng nhận diện câu lệnh của hệ thống.
Sự tiến bộ liên tục trên thế giới đã thúc đẩy các kỹ sư trong nhóm nỗ lực tinh chỉnh và mở rộng tính năng của SYNC®. Phân tích hành vi sử dụng SYNC® của khách hàng giúp các kỹ sư phát triển hệ thống trở nên trực quan và thân thiện hơn, ví dụ như tinh giản tác vụ hoặc đơn giản hóa truy cập. Nhờ đó, hơn 80% các câu lệnh của SYNC® có thể thực hiện chỉ với một bước.
Dựa vào nghiên cứu và phân tích sâu rộng thông qua mạng không dây của SYNC® 3, các kỹ sư có thể thu thập dữ liệu âm thanh đều đặn về cách sử dụng SYNC® 3 của khách hàng cho các mục đích khác nhau. Từ đó, họ có thể phát hiện và cải tiến các tác vụ phù hợp hơn, thay vì để người dùng tự xoay sở. Tất cả dữ liệu được thu thập đều phải có sự đồng ý của người dùng.