Trên iOS 18, iPad 18 và macOS Sequoia mới, nền tảng chủ chốt cho hầu hết các tính năng mới chính là AI (Apple gọi đây là Apple Intelligence chứ không phải Artificial Intelligence như trước đây. Vậy Apple AI có thể làm những gì? Mình sẽ tổng hợp tất cả những khả năng của Apple AI trong bài viết này để các bạn dễ hình dung.Tóm lại:
- AI của Apple hoạt động dựa trên mô hình ngôn ngữ.
- Có thể chia thành 3 nhánh chính: từ văn bản sang văn bản, từ văn bản sang hình ảnh và AI nhận diện hình ảnh/âm thanh.
- Nhờ vào Siri và nền tảng hiện có, AI có thể thực hiện nhiều hành động hơn, tương tác giữa các ứng dụng và hiểu ngữ cảnh của người dùng để thực hiện lệnh hoặc tự động hóa hiệu quả hơn.
- Phần lớn người dùng vẫn sẽ sử dụng Prompt để điều khiển, một số tính năng được Apple đơn giản hóa cách nhập prompt.
- Apple kết nối người dùng với dịch vụ của OpenAI.
AI hỗ trợ soạn thảo văn bản

Hiển thị các thông báo quan trọng

AI của Apple sẽ lựa chọn những thông báo mà nó cho là quan trọng trong tổng số thông báo, sau đó trình bày chúng dưới dạng một danh sách ở phía trên cùng để người dùng có thể nhanh chóng đọc, tránh phải tìm kiếm trong một danh sách thông báo theo thứ tự thời gian như trước. Đồng thời, mỗi thông báo cũng được tóm tắt lại những điểm chính để người dùng dễ dàng lướt qua.
Ví dụ từ Apple cho thấy những thông báo được AI nhận định là quan trọng và được tóm tắt bao gồm: thông tin từ tin nhắn iMessage về cuộc hẹn ăn tối với một người bạn tên Sandy và bạn trai của cô ấy; thông báo về giao hàng vào khoảng 10 giờ sáng; có cuộc họp lúc 10h30 với một thực tập sinh. Tóm lại, các thông tin sẽ bao gồm giao hàng, cuộc hẹn và cuộc họp.
Hiển thị các email quan trọng

Tóm tắt nội dung các email dài

Tính năng này được tích hợp trực tiếp trong ứng dụng Mail. Người dùng chỉ cần nhấn một nút, nội dung của toàn bộ email đang mở sẽ được tóm tắt. Ngoài ra, AI cũng có khả năng tóm tắt ngắn gọn nội dung của từng email ngay trong giao diện duyệt email chính.
AI hỗ trợ trả lời email nhanh chóng

Một tính năng khác trong ứng dụng mail sử dụng AI là khả năng trả lời nhanh. Tính năng này cho phép AI đọc nội dung email và xác định những câu hỏi cần người dùng phản hồi như có hoặc không, chọn phương án nào,... Sau đó, AI sẽ hiện các tùy chọn bên dưới để người dùng dễ dàng chọn lựa. Dựa vào lựa chọn này, AI sẽ tự động soạn thảo email và gửi phản hồi cho người nhận. Hiện chưa rõ nội dung phản hồi sẽ đơn giản hay có thêm chi tiết văn bản.
Tóm tắt nội dung cuộc gọi

Tính năng AI này thật sự thú vị. Như Apple mô tả, người dùng chỉ cần 'nhấn nút ghi âm trong ứng dụng Notes hoặc Phone để ghi lại âm cuộc gọi và chuyển đổi nội dung cuộc trò chuyện thành văn bản (transcript). AI của Apple sẽ tóm tắt đoạn văn bản này, giúp người dùng nhanh chóng nắm bắt nội dung quan trọng của cuộc gọi.
Về cơ bản, tính năng này giúp chúng ta ghi lại những thông tin thiết yếu trong một cuộc điện thoại mà không cần phải ghi chú thủ công như trước đây. Tuy nhiên, vẫn chưa rõ cách lưu trữ đoạn tóm tắt này, liệu đoạn ghi âm và nội dung cuộc gọi dưới dạng văn bản có được lưu lại hay không. Nếu có, đây có thể là lần đầu tiên trong lịch sử, Apple 'chính thức' cho phép ghi âm cuộc gọi thoại.
AI lọc thông báo khi tập trung, chỉ hiện những thông báo thật sự quan trọng

Apple gọi đây là tính năng AI giúp Giảm gián đoạn (Reduce Interruptions). Đây thực chất là một chế độ Focus hiện có, nhưng được nâng cao nhờ AI. AI sẽ phân tích nội dung của các thông báo và chỉ hiện lên những gì nó cho rằng người dùng cần chú ý ngay, chẳng hạn như tin nhắn nhắc nhở đi đón con,...
AI tạo hình - Image Playground

Đây là một lĩnh vực quan trọng thứ hai và cũng là một ứng dụng cực kỳ phổ biến của AI tạo sinh. Về cơ bản, nó hoạt động theo cơ chế từ văn bản sang hình ảnh (text to image). Apple đã phát triển tính năng này để người dùng dễ sử dụng hơn rất nhiều. Thay vì phải nhập toàn bộ văn bản, Apple sẽ gợi ý cho người dùng một số chủ đề như phong cảnh núi non, bãi biển, mùa đông, đồ vật, tình yêu, phong cách hình ảnh,... Người dùng chỉ cần chọn và tạo ra hình ảnh theo ý muốn để gửi cho bạn bè trong các cuộc trò chuyện, sử dụng làm hình minh họa trong slide Keynote, văn bản Pages hoặc bảng tính Numbers.

Ngoài ra, người dùng cũng có thể tự viết một prompt để mô tả hình ảnh mà mình muốn AI tạo ra, và cũng có thể sử dụng một bức hình có sẵn trong thư viện ảnh để yêu cầu AI sáng tạo một hình ảnh mới dựa trên đó.
Apple cho biết người dùng có thể lựa chọn từ nhiều concept và phong cách hình ảnh khác nhau, từ hình hoạt họa, hình đồ họa minh họa, phác thảo, đến hình siêu thực,... để AI tạo ra cho đến khi đạt được ý tưởng mong muốn.
Tạo Emoji bằng AI - Genmoji

Apple gọi tính năng này là Genmoji. Người dùng có thể tự tạo một bộ emoji mới bằng AI để sử dụng trong các cuộc trò chuyện. Chỉ cần nhập từ khóa mô tả cho emoji mong muốn, AI sẽ tạo ra nó (thực chất là từ văn bản thành hình ảnh). Ngoài ra, người dùng cũng có thể lấy ảnh chân dung của một người trong thư viện để tạo ra emoji giống như người đó.
Image Wand - biến phác thảo thành hình ảnh bằng AI

Tính năng này sẽ được tích hợp trong ứng dụng Notes. Bên cạnh các công cụ vẽ như bút chì, bút lông, và bút mực, sẽ có thêm công cụ gọi là Image Wand. Người dùng chỉ cần phác thảo một hình ảnh, có thể là nguệch ngoạc, sau đó dùng cây đũa phép này để khoanh tròn. Lúc này, AI sẽ nhận diện các nét vẽ và tạo ra hình ảnh 'thực tế hơn' dựa trên những đường nét ban đầu.
Ngoài ra, người dùng cũng có thể sử dụng Image Wand để khoanh một vùng trống, và AI sẽ dựa vào các ngữ cảnh xung quanh để tạo ra một bức ảnh trong khu vực đó. Hiện tại, khái niệm 'ngữ cảnh' ở đây vẫn chưa rõ ràng, liệu có phải là văn bản hay hình ảnh hay không.
AI nhanh chóng tạo đoạn video theo chủ đề từ hình ảnh/video trong thư viện

Apple gọi tính năng này là tạo một đoạn video ký ức (memory movie). Người dùng sẽ có một khung để nhập câu lệnh, ví dụ như 'những món tráng miệng tôi đã thưởng thức vào mùa hè năm ngoái, kèm theo một bài hát nhạc pop'. AI sẽ tìm toàn bộ video và hình ảnh liên quan đến món ăn tráng miệng trong mùa hè năm ngoái và ghép chúng thành một đoạn video.

Tương tự, trong một ví dụ khác, người dùng có thể sử dụng AI để tìm kiếm hình ảnh dựa trên nội dung trong ảnh. Apple đưa ra một ví dụ với câu tìm kiếm 'các bức ảnh của Katie khi đang dán sticker lên mặt'. Họ chọn ví dụ này để thể hiện khả năng của AI trong việc nhận diện thông tin tinh tế, như các sticker trên mặt Katie, không phải của ai khác. Thuật toán của họ thực sự rất ấn tượng. Thêm vào đó, Apple cũng cho biết AI của họ có khả năng tìm kiếm những khoảnh khắc trong video; chỉ cần người dùng nhập tìm kiếm một cách tự nhiên, AI sẽ đưa ra kết quả.
AI loại bỏ vật thể không mong muốn khỏi bức ảnh

Cuối cùng, Apple đã chính thức tích hợp tính năng này vào ứng dụng chỉnh sửa ảnh mặc định của họ. AI của Apple cho phép người dùng xóa bỏ các vật thể không cần thiết trong một bức ảnh. Người dùng chỉ cần khoanh tròn quanh vật thể muốn xóa, và nó sẽ được loại bỏ cùng với việc tự động lấp đầy khoảng trống một cách tự nhiên. Mặc dù tính năng này không hoàn toàn mới, nhưng sự kết hợp trong một ứng dụng sẽ rất tiện lợi cho người dùng.
AI cải tiến Siri

AI giờ đây đã có một diện mạo hoàn toàn mới với biểu tượng được thiết kế lại. Khi hoạt động, Siri không còn xuất hiện dưới dạng biểu tượng tròn ở phía dưới màn hình nữa, mà thay vào đó là một viền bồng bềnh bao quanh màn hình, tạo cảm giác hiện đại và đẹp mắt.

Bây giờ, chúng ta không chỉ có thể tương tác với Siri qua giọng nói mà còn có thể chạm hai lần vào cạnh dưới của màn hình iPhone hoặc iPad để nhập văn bản và giao tiếp với Siri.

Người dùng có thể hỏi Siri về cách sử dụng một tính năng hoặc cách cài đặt trên iPhone, iPad, hoặc Mac. Siri sẽ cung cấp hướng dẫn chi tiết từng bước để thực hiện tính năng đó. Chẳng hạn như trong ví dụ trước, khi người ta hỏi về cách hẹn giờ gửi tin nhắn, Siri sẽ hướng dẫn từng bước một. Nếu có hỗ trợ tiếng Việt thì tuyệt vời, nhưng có lẽ phải chờ khá lâu mới có (không hy vọng).

Apple thông báo rằng Siri giờ đã có khả năng hiểu ngôn ngữ tự nhiên và các câu lệnh phức tạp của người dùng. Siri cũng đã có thể giao tiếp liên tục, cho phép người dùng đặt câu hỏi dựa trên thông tin đã hỏi trước đó, ví dụ như về địa điểm hoặc sự kiện đã tạo. Người dùng có thể hỏi các câu kiểu như 'Thời tiết ở đó thế nào?'. Trong ví dụ trên, người dùng yêu cầu đặt báo thức, rồi đổi ý sang đặt hẹn giờ 10 phút, sau đó lại giảm xuống còn 5 phút. Tất cả đều trong một câu lệnh, và Apple cho biết Siri vẫn hiểu rõ ý muốn của người dùng để thực hiện.

Nhờ vào AI, Siri có khả năng nhận diện nội dung mà người dùng đang xem trên màn hình. Do đó, người dùng có thể đưa ra các lệnh như 'Lưu địa chỉ này lại' khi nhận được địa chỉ mới từ một người bạn qua tin nhắn.

Siri có khả năng hoạt động trên nhiều ứng dụng khác nhau. Chẳng hạn, nếu người dùng ra lệnh như 'Gửi email đã soạn cho Lily và April', Siri sẽ tự động nhận diện 'email đã soạn' và gửi đến đúng người. Trong một ví dụ khác, người dùng có thể yêu cầu 'làm cho bức ảnh này nổi bật hơn', sau đó 'thả bức ảnh đó vào ghi chú',... Nói chung, Siri có thể hiểu các khái niệm như 'này', 'kia' theo cách gọi tự nhiên của người dùng.

Nhờ việc Siri nhận diện nội dung trên màn hình, người dùng có thể tạo ra nhiều kịch bản để yêu cầu Siri tìm kiếm thông tin cần thiết bằng ngôn ngữ tự nhiên, như một công thức nấu ăn đã đọc, nội dung của một ghi chú nào đó, hay một email nào đó, hoặc cần tra cứu số hộ chiếu để đặt vé máy bay,... Apple khẳng định Siri có khả năng trả lời nhiều câu hỏi mà không xâm phạm quyền riêng tư của người dùng.
Điều này khiến mình nhớ đến tính năng Rewind mà Microsoft đã giới thiệu trên Windows 11 Colipot+ cách đây không lâu. Microsoft cũng tuyên bố rằng tính năng này không ảnh hưởng đến quyền riêng tư hay bảo mật, nhưng sau đó đã thừa nhận một số lỗ hổng và sẽ sửa đổi. Còn với Siri, vẫn còn câu hỏi về việc liệu tiếng Việt có được hỗ trợ hay không.
đã được tích hợp vào Siri

Đây thực sự là một thông tin thú vị. Apple thông báo sẽ tích hợp của OpenAI vào Siri cùng với các công cụ hỗ trợ viết. Siri sẽ có khả năng sử dụng nguồn lực từ để hỗ trợ người dùng, chẳng hạn như trả lời câu hỏi về một văn bản hoặc bức ảnh nào đó, thậm chí có thể yêu cầu tạo hình ảnh minh họa cho một đoạn văn bản hay tự động viết một nội dung liên quan đến chủ đề mà người dùng mong muốn.
Về cách thức hoạt động, người dùng sẽ có quyền quyết định khi nào muốn sử dụng . Lúc đó, Siri sẽ hỏi người dùng có muốn dùng hay không, và nếu đồng ý, người dùng có thể tương tác trực tiếp với model của để tìm kiếm thông tin và hỗ trợ. Apple cho biết mọi người đều có thể sử dụng miễn phí mà không cần đăng ký tài khoản, nhưng cũng có tùy chọn kết nối tài khoản cá nhân để tận hưởng các tính năng cao cấp hơn.
Hiện tại, OpenAI cho phép người dùng sử dụng miễn phí mà không cần phải đăng ký tài khoản. Tài khoản đã đăng ký sẽ lưu giữ các cuộc trò chuyện với chatbot, trong khi tài khoản trả phí sẽ có quyền truy cập vào marketplace với các model đã được xây dựng sẵn, đồng thời sử dụng tập dữ liệu mới nhất của -. Nói cách khác, theo cách diễn giải của Apple, Siri sẽ đóng vai trò như một cầu nối, hay một lớp giao diện, để người dùng sử dụng . Phương pháp này thực chất tương tự như Copilot hiện tại.
AI hỗ trợ viết tay trên iPad

Ứng dụng Notes trên iPad sẽ được bổ sung một tính năng mới gọi là Smart Script. Tính năng này sử dụng công nghệ machine learning để chuyển đổi chữ viết tay của người dùng thành chữ in rõ ràng. Nếu có lỗi chính tả, AI sẽ tự động sửa giúp người dùng. Thêm vào đó, sẽ có một thao tác mới là gạch chéo qua các chữ cần xóa để xóa nhanh chóng.
Nói một cách đơn giản, khi người dùng viết chữ, AI sẽ 'chỉnh sửa chữ' của họ thành phông chữ viết tay dễ đọc và dễ nhìn hơn. Tuy nhiên, điều này có chút mơ hồ vì người dùng phải viết đủ rõ ràng để AI có thể nhận diện chính xác, và nếu chữ viết quá khó đọc thì AI sẽ gặp khó khăn. Hơn nữa, vẫn chưa rõ tính năng này sẽ hoạt động ra sao với chữ tiếng Việt có nhiều dấu phức tạp hơn so với tiếng Anh.
Khi người dùng viết tay và muốn dán một đoạn văn bản vào, AI sẽ tự động chuyển đổi phông chữ thành chữ viết tay để đồng bộ với các đoạn chữ 'viết tay' đã được AI sửa trước đó.
Chức năng ghi âm và chuyển đổi sang văn bản

Chức năng này cho phép người dùng ghi âm và tự động chuyển đổi thành văn bản. Nhờ đó, người dùng có thể tóm tắt, ghi chú, hoặc tạo danh sách kiểm tra,...
Ghi chú toán học thông minh với AI

Chức năng này thật sự ấn tượng. Người dùng chỉ cần viết tay các biểu thức, hàm số, và biến,... AI sẽ nhận diện và hỗ trợ người dùng vẽ đồ thị để phân tích hàm, thay đổi giá trị của các biến và tham số,... Tất nhiên, người dùng cũng có thể thực hiện các phép toán: chỉ cần sắp xếp các con số và gạch ngang để tính tổng, thêm phân số, AI sẽ hiểu là phép chia và đưa ra kết quả. Nếu người dùng thêm log, sin, cos, máy cũng tự động nhận diện và tính toán cho ra kết quả.
Safari cập nhật AI: tóm tắt và làm nổi bật nội dung

AI sẽ bổ sung cho Safari hai tính năng mới. Đầu tiên, người dùng chỉ cần nhấn một nút, AI sẽ hiển thị tóm tắt toàn bộ nội dung bài viết trên trang web đó. Người dùng cũng có thể nghe đọc hoặc chuyển sang chế độ đọc dễ dàng. Bên cạnh đó, AI có khả năng quét toàn bộ nội dung của trang web để nhanh chóng lọc ra những thông tin quan trọng, gọi là highlight, như địa chỉ, bản đồ, thông tin liên lạc,...
