
Ảnh nghĩa là gì?
Những chiếc điện thoại trang bị Snapdragon vận hành một loạt các mạng nơ-ron, bộ não của thiết bị giúp các chức năng điện thoại thực hiện theo cách tiên tiến.
Hãy xem những chiếc điện thoại có ba camera, mà đang nhanh chóng trở thành xu hướng mới: Đến cuối năm 2021, một số nghiên cứu gợi ý rằng hơn một nửa số điện thoại mới sẽ có ba camera. Ở nền nằm bên dưới, khi ảnh và video được chụp bằng những chiếc camera này, bộ máy trí tuệ nhân tạo của Qualcomm đang áp dụng các kỹ thuật trí tuệ nhân tạo cho phép tạo hiệu ứng chụp hình bokeh mà mọi người yêu thích—nó giúp quay video vào buổi tối và thậm chí giúp bộ lọc trên mạng xã hội hoạt động tốt hơn trong nền.
“Chúng tôi cộng tác với ứng dụng mạng xã hội để tăng cường một số bộ lọc trí tuệ nhân tạo của họ vì camera của chúng tôi biết nơi mắt, mũi, tai và mái tóc của bạn đặt ở đâu, và đặt hiệu ứng đúng lên khuôn mặt của bạn,” Asghar nói.
Trí tuệ nhân tạo (AI) đang chăm chỉ làm việc để chụp ảnh và video nhờ vào nền tảng di động Snapdragon, giúp tối ưu hóa khả năng tạo ra những bức ảnh chuyên nghiệp.
Công nghệ trí tuệ nhân tạo không chỉ dừng lại ở việc sử dụng bộ lọc, nó còn cho phép người dùng tập trung camera vào một chủ đề cụ thể và theo dõi họ như một nhà làm phim. Có nhiều động tác kỹ thuật sống động xảy ra khi động cơ chuyển từ camera này sang camera khác để giữ chủ thể được lấy nét. Sự mượt mà của quá trình này có thể được quy cho công nghệ xử lý mạnh mẽ trên nền tảng Snapdragon.
Giao tiếp rõ ràng—bằng mọi ngôn ngữ
Việc chụp ảnh hoặc quay video chất lượng chuyên nghiệp không phải là cách duy nhất mà khả năng trí tuệ nhân tạo trên Snapdragon tham gia vào điện thoại thông minh ngày nay. Trong cuộc gọi video, có nhiều mạng nơ-ron hoạt động đồng thời để làm cho cuộc gọi trở nên sắc nét nhất có thể. Một mạng nơ-ron tinh chỉnh giọng nói của người nói đến độ rõ ràng tinh khiết, trong khi mạng khác chạy chức năng kìm tiếng ồn nền. Cuối cùng, ai muốn con chó sủa từ căn hộ trên lầu trên làm gián đoạn cuộc trò chuyện quan trọng với sếp của bạn chứ?
Vì thuật toán chống nhiễu hoạt động trên một mạng nơ-ron được trang bị trí tuệ nhân tạo, nó có thể được đào tạo theo thời gian để hiểu rõ các loại âm thanh khác nhau và 'lọc nhiễu' ngày càng tốt hơn — hiệu quả tách (và hủy) tiếng ồn từ giọng của người nói trong cuộc gọi điện thoại. Chất lượng âm thanh như vậy là quan trọng trong các cuộc gọi xa, đặc biệt khi người gọi nói các ngôn ngữ khác nhau. Trong những trường hợp này, thông thường cần một phiên dịch viên: Công nghệ trước đó đơn giản không thể thực hiện phiên dịch ngôn ngữ trực tuyến.
Bộ xử lý Snapdragon, ví dụ, bắt đầu dịch lời nói ngay khi nó đi vào micro. Bên trong thiết bị, mạng nơ-ron thực hiện ba công việc quan trọng: nhận dạng lời nói tự động; dịch ngôn ngữ (mạng Transformer hoặc BERT); và chuyển văn bản thành lời nói. Giả sử hai người đang nói chuyện, nhưng một người nói tiếng Quan Thoại và người kia nói tiếng Anh. Mà không cần biết, lời nói tiếng Anh của người đó được chuyển thành văn bản, sau đó được dịch ở cấp độ xây dựng để bắt kịp các ý nghĩa khác nhau của các từ qua các ngôn ngữ, đảm bảo nguyên bản của bối cảnh được giữ nguyên. Cuối cùng, văn bản đó được chuyển đổi thành lời nói tiếng Quan Thoại. Voila: giao tiếp vượt biên dễ dàng.
Phiên dịch ngôn ngữ thời gian thực của Snapdragon là cận cảnh. Nó phức tạp nhưng tuân theo ba bước chung được kích hoạt bởi trí tuệ nhân tạo — và tất cả đều xảy ra trên thiết bị.
“Mọi thứ đều được thực hiện trên thiết bị. Không chỉ nhanh hơn mà còn an toàn hơn, vì chữ ký giọng của bạn ở lại trên điện thoại,” Asghar nói.
Cung cấp ngữ cảnh cần thiết
Tất nhiên, những lợi ích thực sự của điện thoại thông minh có kích thước trí tuệ nhân tạo chỉ thực sự hiểu khi trí tuệ máy đang chạy liên tục. Với vô số cách mà mọi người sử dụng điện thoại của họ, mạng nơ-ron phải sẵn sàng hoạt động bất cứ lúc nào. Chiếc điện thoại mới không chỉ cung cấp nguồn năng lượng cho các mạng nơ-ron mạnh mẽ giúp kích hoạt các chức năng như phiên dịch thời gian thực. Nó còn chạy cái được gọi là trí tuệ nhân tạo nhỏ, các mạng nơ-ron nhỏ hơn luôn hoạt động, chạy ở công suất thấp.
“Chúng tôi gọi đó là nhận thức bối cảnh,” Asghar nói. “Nó là cảm nhận thế giới xung quanh bạn bằng cách sử dụng âm thanh, và điều này diễn ra liên tục 24/7. Nó có thể mở ra nhiều trường hợp sử dụng thú vị.”
Những trường hợp sử dụng của trí tuệ nhân tạo nhỏ này được kích hoạt trên nền tảng Qualcomm® Sensing Hub bên trong nền tảng Snapdragon, có khả năng chạy các thuật toán trí tuệ nhân tạo luôn hoạt động này. Nó có thể cảm nhận âm nhạc đang phát trong nền khi bạn bước vào một quán cà phê, tự động thông báo cho bạn là đang phát bài hát gì, và sau đó thậm chí điều chỉnh âm lượng chuông của điện thoại theo môi trường của bạn, phụ thuộc vào mức độ ồn của môi trường. Nó cũng có thể được kích hoạt để thực hiện các nhiệm vụ điều kiện khác, như biến điện thoại thành máy giám sát trẻ sơ sinh. Với Qualcomm® Sensing Hub, một người cha hoặc mẹ mới có thể thiết lập điện thoại của họ để tự động bật đèn hoặc phát nhạc khi bé bắt đầu khóc sau khi thức dậy từ giấc ngủ trưa.
Bất kể môi trường xung quanh, người gọi hiện có thể tận hưởng cuộc gọi rõ ràng mà không bị gián đoạn bởi tiếng ồn nền. Các thuật toán được trang bị trí tuệ nhân tạo trên nền tảng đào tạo mạng nơ-ron để hiểu rõ tất cả các loại tiếng ồn (từ gõ phím đến tiếng sủa chó đến còi hú) đồng thời theo dõi và chống nhiễu chúng.
Đến cuối năm 2021, các nhà phân tích dự đoán số lượng điện thoại thông minh trên thế giới sẽ bằng một nửa dân số hiện tại của thế giới. Nhưng những chiếc điện thoại mới từ dây chuyền sản xuất chỉ có ý nghĩa với người tiêu dùng nếu chúng tốt hơn trong việc hiểu cách chúng ta sử dụng điện thoại hiện nay và những gì chúng ta cần điện thoại của chúng ta làm. Hướng tiến là bằng cách kích hoạt trí tuệ nhân tạo đến đầy đủ tiềm năng của nó - và khiến trải nghiệm điện thoại thông minh của chúng ta cuối cùng đáp ứng đúng với cái tên của chúng.
Truyện này được sản xuất bởi MYTOUR Brand Lab cho Qualcomm Technologies Inc.
Snapdragon, Qualcomm AI Engine và Qualcomm Sensing Hub là sản phẩm của Qualcomm Technologies, Inc. và/hoặc các công ty con của nó.
