Sau khi kết thúc WWDC24, Apple đã chính thức giới thiệu AI trên các nền tảng của họ với tên gọi là 'Apple Intelligence'. Tên gọi này không chỉ đơn thuần là sự đổi mới mà Apple mang đến, mà thực sự là một bước tiến lớn so với các nền tảng Galaxy AI hay Copilot.
Sau khi ngày đầu tiên của WWDC24 kết thúc, tôi đã được mời xem trực tiếp demo của Apple Intelligence để hiểu rõ hơn về khả năng mà AI này mang lại.
Trước hết, chúng ta hãy tóm tắt về Apple Intelligence và những điểm khác biệt so với các loại AI khác. Apple Intelligence là một mô hình AI được Apple tự phát triển, huấn luyện và điều chỉnh, không phải là dựa trên Google Gemini hay OpenAI ChatGPT như Galaxy AI và Copilot.
Vì vậy, Apple có thể tích hợp Apple Intelligence một cách sâu sắc vào các nền tảng như iOS, iPadOS và macOS. Họ cũng xây dựng Private Cloud Compute để xử lý các tác vụ AI trên máy chủ một cách an toàn. Tất cả những điều này nhằm tạo ra một trí tuệ nhân tạo vừa đáp ứng yêu cầu cá nhân hóa, vừa bảo vệ quyền riêng tư. Điều này làm cho Apple Intelligence trở nên độc đáo và thực sự, các công ty khác sẽ không dễ dàng thực hiện một loại AI tương tự nếu không kiểm soát được cả phần mềm và phần cứng như Apple.
Apple Intelligence có thể làm những việc gì?
Quay lại với demo tôi được xem tại WWDC, Apple đã giới thiệu về ứng dụng của Apple Intelligence trong việc chỉnh sửa ảnh, đặc biệt là công cụ Clean Up mới có khả năng phát hiện và loại bỏ các đối tượng không mong muốn trong phông chụp mà không làm thay đổi chủ thể. Thật công bằng khi nói rằng các loại AI khác như Galaxy AI cũng đã hỗ trợ tính năng loại bỏ các vật thể không mong muốn khỏi ảnh, nhưng những gì mà Apple làm vẫn khiến tôi phải ngạc nhiên.
Có hai trường hợp mà tôi đã thấy: Bức ảnh đầu tiên là một nhóm 4 người chụp cùng và có một người đứng ngoài quay lưng ở phía sau, sau khi sử dụng tính năng Clean Up, máy tự động phát hiện và loại bỏ đối tượng cần 'dọn dẹp', chỉ cần nhấn Apply và chưa đến 1 giây là xong, nhanh hơn nhiều so với Generative Edit trên Galaxy AI. Tôi rất ngạc nhiên vì dự đoán rằng nó sẽ hiển thị thông báo xử lý hay ít nhất là hiển thị vòng tròn tải, nhưng không, chỉ cần nhấn Apply là xong! Đó là lần đầu tiên tôi và các phóng viên từ các quốc gia khác phải há hốc mồm khi thấy demo này.
Bức ảnh thứ hai là tôi dùng tay vẽ một vòng tròn xung quanh đối tượng cần xoá trong ảnh, và ngay khi thả tay ra khỏi màn hình, ảnh đã được xoá xong... Một lần nữa, tốc độ xử lý của AI này thực sự rất nhanh. Thật sự là tôi và những người xem demo cùng tôi đều có cảm giác như: Khi xem giới thiệu trên sân khấu, chúng tôi nghĩ rằng nó cũng phải mất vài giây như các thiết bị khác (như Galaxy AI chẳng hạn), nhưng với Apple thì không mất bao nhiêu thời gian. Liệu rằng AI của Apple đã được cải thiện để xử lý nhanh hơn trong trường hợp này, hay nó thực sự có thể xử lý mọi ảnh như vậy mà không cần đến thời gian?
Từ lúc xem demo này, tôi bỗng nghĩ liệu rằng việc Apple chỉ hỗ trợ từ iPhone 15 Pro/ProMax mà không hỗ trợ phiên bản thường có phải là để Apple Intelligence của họ có thể xử lý nhanh nhất có thể và để người dùng có trải nghiệm tối ưu nhất?
Bỏ qua suy nghĩ đó một chút, người biểu diễn tiếp tục giới thiệu tính năng tạo Memory Movie trong Photos cho chúng tôi. Người biểu diễn ra lệnh cho Apple Intelligence với những yêu cầu như: 'Tạo video với những bức ảnh tôi leo núi cùng bạn A trong những năm qua, đặc biệt thêm những ảnh selfie ở cuối', hoặc trong WWDC là 'Tạo video về việc câu cá và bắt được con cá lớn'. Chỉ trong một thời gian ngắn, AI của Apple đã tổng hợp mọi ảnh và tạo ra video với các bố cục rất hài hòa.
Ban đầu, tính năng này đã có sẵn trên Photos, nó tự học và tổng hợp thông tin để đề xuất những video kỷ niệm. Nhưng giờ đây, Apple Intelligence đã đưa nó lên một tầm cao mới, người dùng có thể yêu cầu những điều mà họ muốn, với những người cụ thể trong ảnh. Tất nhiên, khuôn mặt của những người này đã được gắn thẻ từ trước và các ảnh sau này trong Photos trên iOS cũng sẽ tự nhận diện.
Nhờ tích hợp sâu vào hệ điều hành, Apple Intelligence có thể sử dụng dữ liệu này để tạo ra các video cá nhân chỉ với những lệnh rất tự nhiên.
Những nhiệm vụ như vậy sẽ được xử lý trên thiết bị, người dùng không cần lo lắng về việc thông tin bị rò rỉ.
Tại WWDC24, Apple cũng thông báo sẽ nâng cấp SDK cho nhà phát triển để dễ dàng tích hợp Apple Intelligence vào các sản phẩm của họ. Điều này mở ra những ứng dụng AI rất thú vị ngay cả trong các ứng dụng bên thứ ba. Một ví dụ là ứng dụng chỉnh sửa ảnh Darkroom, sau khi tích hợp Apple Intelligence, người dùng chỉ cần nói với Siri như 'Áp filter kiểu phim ảnh cho bức ảnh tôi chụp bạn Ian ngày hôm qua', và ứng dụng sẽ tự động thực hiện từ chọn ảnh đến chỉnh sửa.
Genmoji là tính năng mà các nhà phát triển bên thứ ba có thể tích hợp vào ứng dụng của họ thông qua API đặc biệt. Genmoji là tính năng tạo emoji độc đáo từ câu lệnh, nằm trong khu tìm kiếm emoji, rất tiện lợi, bạn chỉ cần tìm và đưa ra lệnh theo ý muốn, nó sẽ tự động tạo cho bạn.
Image Playground cũng có API, tính năng này cho phép tạo hình ảnh vui nhộn chỉ trong vài giây, bạn có thể chọn từ các phong cách như hoạt hình, minh hoạ, hoặc phác thảo. Người dùng có thể tạo hình ảnh từ mô tả và tùy chỉnh theo sở thích cá nhân. Image Playground có giao diện dễ sử dụng, dễ hiểu để người dùng chỉ cần tập trung vào việc sáng tạo câu lệnh, vui chơi thoải mái, rất phù hợp với các bạn trẻ. Lịch sử tạo ảnh vẫn được lưu lại để bạn có thể quay lại bước trước.
Một tính năng đáng chú ý khác là Image Wand, nếu Google và Samsung có tính năng Circle to Search, bạn có thể khoanh vùng để tìm kiếm dựa trên hình ảnh trên màn hình, thì Image Wand là bản nâng cấp, bạn có thể khoanh vùng để tạo ra một hình ảnh đẹp từ các nét vẽ hoặc thậm chí từ nội dung văn bản trong ứng dụng Notes. Apple cho biết tính năng này sẽ hỗ trợ đáng kể cho các nhà thiết kế và sáng tạo nội dung, giúp họ nhanh chóng thấy được ý tưởng của mình sẽ như thế nào chỉ bằng cách mô tả hoặc vẽ phác thảo.
Siri 'tái sinh'
Mặc dù Apple đã dẫn đầu trong việc tích hợp trợ lý ảo vào smartphone, nhưng trong vài năm qua, Siri đã bị các đối thủ bỏ xa. Apple Intelligence đã mang đến sự đột phá mới cho trợ lý này và giúp nó trở nên hữu ích hơn rất nhiều.
Trong buổi demo mà tôi tham dự, Siri đã có khả năng hiểu ý người dùng như một trợ lý thực sự, ví dụ như bạn có thể ra lệnh 'đặt báo thức cho tôi vào 6 giờ, nhưng không, 5:45 đi. Và nó đã hiểu và thực hiện ngay lập tức.' Bây giờ bạn có thể ra lệnh cho Siri một cách phức tạp hơn, có nhiều câu hơn mà không cần phải chia thành nhiều lệnh đơn giản.
Nhờ tích hợp sâu vào hệ điều hành, người dùng có thể hỏi Siri về cách sử dụng máy, điều này rất hữu ích đối với những người không quen với công nghệ, đặc biệt là người cao tuổi. Ví dụ, bạn có thể hỏi Siri cách đặt hẹn giờ gửi tin nhắn hoặc gửi tin nhắn ẩn, và nó sẽ cung cấp hướng dẫn trong vòng chưa đầy 1 giây.
Apple Intelligence có khả năng lọc qua email và tin nhắn trên thiết bị (và sau này là từ nhiều ứng dụng bên thứ ba thông qua các API) để tìm kiếm câu trả lời phù hợp. Apple có thể truy cập vào một lượng thông tin khổng lồ để tạo ra câu trả lời cá nhân hóa mà các AI khác không thể.
Người dùng có thể hỏi Siri về bộ phim bạn A đã gợi ý xem khi trò chuyện trước đó cách đây 1 tháng. Siri có thể lục thông tin từ các tin nhắn và email để cung cấp kết quả.
Trong buổi WWDC, Kelsey Peterson, giám đốc Machine Learning và AI tại Apple, đã demo về tính năng của Siri liên quan đến chuyến bay. Peterson hỏi 'Siri, khi nào chuyến bay của mẹ đáp' và Siri không chỉ đơn giản cung cấp câu trả lời, mà còn tự động kiểm tra thông tin chuyến bay từ email và theo dõi tình trạng chuyến bay để cập nhật lịch trình nếu có sự trì hoãn. Sau đó, khi hỏi về kế hoạch ăn trưa, dù Peterson không thêm ghi chú nào vào ứng dụng, Siri vẫn tìm được địa điểm mà người mẹ đã đề cập trong tin nhắn. Cuối cùng, khi hỏi 'Mất bao lâu để đến từ sân bay?' Siri hiển thị bản đồ với thông tin giao thông.
Giờ đây bạn có thể sử dụng Siri bằng văn bản thay vì giọng nói, phù hợp trong những tình huống cần đảm bảo sự riêng tư hoặc tránh làm phiền người khác vì tiếng ồn. Người dùng chỉ cần chạm hai lần vào vùng cuối màn hình chính hoặc màn hình khóa, hoặc cả trong ứng dụng khác, để mở Siri với tính năng gõ văn bản.
Khi những yêu cầu vượt quá khả năng của Siri (thường là các câu hỏi yêu cầu tổng hợp thông tin từ Internet), nó sẽ kết nối đến ChatGPT và hỏi người dùng có muốn gửi yêu cầu này đến ChatGPT hay không. Chúng ta có thể nghĩ đến Siri không chỉ là một trợ lý đơn giản mà còn là người đưa thư, chuyển dữ liệu sang GPT ngay lập tức với sự cho phép của người dùng.
Liệu Apple Intelligence có là yếu tố làm thay đổi trò chơi AI?
Các sự kiện như CES và Computex đã chứng kiến sự xuất hiện của nhiều máy tính AI, và các smartphone Samsung, Google cũng không ngoại lệ. Tuy nhiên, với hệ sinh thái phần cứng và phần mềm riêng biệt, Apple Intelligence tích hợp toàn diện trên hệ điều hành và ứng dụng của Apple, tạo ra lợi thế rất lớn so với các đối thủ.
Ngoài ra, Apple cũng rõ ràng thể hiện sự sẵn sàng hỗ trợ các nhà phát triển bên thứ ba tích hợp Apple Intelligence vào sản phẩm của họ. Không chỉ là phần cứng mà phần mềm và ứng dụng cũng rất quan trọng trong cuộc đua AI, vì đó là những gì người dùng trực tiếp tương tác.
Dẫu vậy, chúng ta sẽ cần phải đợi để thấy khả năng thực sự của Apple Intelligence khi nó chính thức ra mắt. Tuy nhiên, nếu Apple tiếp tục duy trì cam kết về bảo mật và cá nhân hóa như đã được giới thiệu tại WWDC24, thì cuộc đua AI sẽ chứng kiến những biến động đáng kể.