
Đó là sự thoả thuận đơn giản đã biến các công ty như Google và Facebook thành đại gia: để đổi lấy sự tiện lợi khi quản lý cuộc sống từ chiếc điện thoại thông minh, bạn đưa cho họ biết về mọi hoạt động của bạn. Thông tin này được gửi lên đám mây nơi mà thuật toán... có lẽ khó để chính xác, nhưng mọi người đều tham gia. Oh, ngoại trừ Apple.
Tim Cook đã đặt vị thế của công ty một cách quyết liệt là không quan tâm đến việc thu thập dữ liệu người dùng và tự hào rằng điều này làm cho Apple nổi bật. “Họ đang hấp thụ mọi thông tin mà họ có thể biết về bạn và cố gắng kiếm tiền từ nó,” ông nói trong bài diễn thuyết năm 2015. “Chúng tôi nghĩ rằng điều đó là sai.”
“Họ,” tất nhiên, chủ yếu là Google và Facebook, những công ty phụ thuộc mạnh mẽ vào máy chủ đám mây cho tìm kiếm và gợi ý cũng như các tính năng khác. Apple, ngược lại, hứa sẽ thực hiện các tính năng sử dụng trí tuệ nhân tạo trực tiếp trên điện thoại thông minh hoặc máy tính bảng của bạn như tìm kiếm ảnh và dự đoán biểu tượng cảm xúc bạn muốn ngay lập tức.
Bạn có thể thấy đúng lý do ở đây. Apple kiếm tiền bằng cách bán các thiết bị, không phải làm mục tiêu cho quảng cáo. Và việc gièm pha đối thủ vì lợi nhuận từ dữ liệu của bạn là một công cụ tiếp thị và PR tiện lợi. Ai trong chúng ta không muốn giảm rủi ro về quyền riêng tư của mình?
Nhưng sự ngần ngại kiên định của Cook đối với đám mây tạo ra một thách thức khi Apple cố gắng xây dựng các tính năng mới được cung cấp bởi trí tuệ nhân tạo và máy học. Để xây dựng và chạy các dịch vụ máy học, bạn cần sức mạnh tính toán và dữ liệu, và càng nhiều bạn có cả hai, phần mềm của bạn càng mạnh mẽ. iPhone có sức mạnh đáng kể cho một thiết bị di động, và đó là một đảm bảo tốt rằng Apple sẽ thêm phần cứng chuyên dụng để hỗ trợ máy học. Nhưng việc đặt bất cứ thứ gì vào tay bạn để cạnh tranh với một máy chủ—đặc biệt là một sử dụng vi xử lý máy học tùy chỉnh của Google—là khó khăn.

So sánh ứng dụng quản lý ảnh từ Apple và Google để thấy cách điều này có thể diễn ra. Cả hai đều sử dụng mạng nơ-ron để phân tích ảnh của bạn để bạn có thể tìm kiếm cho chó, cây cỏ và người bạn thân nhất của bạn. Ứng dụng Photos của Apple thực hiện điều này hoàn toàn trên iPhone của bạn. Google Photos thực hiện tất cả trong đám mây.
Trong số đó, chỉ có ứng dụng của Apple sẽ cho phép bạn tìm kiếm ảnh chụp trên iPhone của mình với từ khóa “chó” trong chế độ máy bay ở độ cao 30,000 feet, và không phải đợi khi truy vấn và phản hồi di chuyển qua internet có thể làm cho việc tìm kiếm trở nên nhanh chóng hơn lý thuyết. Nhưng Google Photos thường được ưa chuộng bởi các nhà đánh giá (bao gồm cả chúng tôi) ấn tượng bởi sức mạnh của các thuật toán phân tích hình ảnh của công ty tìm kiếm. Xử lý cục bộ hoạt động tốt cho nhiều thứ, nhưng nếu bạn muốn đẩy giới hạn, việc cho một thiết bị di động thông minh vượt qua trí tuệ nhân tạo đám mây là khó khăn, theo Eugenio Culurciello, một giáo sư tại Đại học Purdue nghiên cứu về phần cứng để tăng tốc máy học. “Trong một máy chủ, bạn có thể thực hiện nhiều công việc hơn trong mỗi giây,” ông nói.
Các công ty không cam kết tình trạng độc thân đám mây cũng dễ dàng hơn trong việc làm cho trí tuệ nhân tạo của họ trở nên, hm, thông minh hơn. Cách trực tiếp nhất để xây dựng một sản phẩm thông minh mới để làm việc trên dữ liệu của khách hàng của bạn là sử dụng rất nhiều dữ liệu đó để huấn luyện nó, theo Chris Nicholson, CEO của Skymind, một công ty khởi nghiệp giúp các công ty sử dụng máy học. “Bạn có càng nhiều dữ liệu, sản phẩm của bạn càng có giá trị,” ông nói. “Google, Amazon và những người khác đều hưởng lợi từ điều đó và Apple không.” Việc liên tục cập nhật mạng nơ-ron trên đám mây cũng dễ dàng hơn, để chúng luôn luôn được cải thiện, so với việc đẩy cập nhật đến những người ở trong túi của mọi người, theo Nicholson. Apple đã bắt đầu sử dụng một công nghệ gọi là quyền riêng tư khác biệt để thu thập một số dữ liệu ẩn danh về cách người ta sử dụng điện thoại của họ, như biểu tượng cảm xúc yêu thích của bạn, nhưng không rõ nó có thể được áp dụng rộng rãi như thế nào.
Để công bằng, mạng nơ-ron ở trong túi đã được cải thiện rất nhiều gần đây và đối với một số trường hợp sử dụng, chúng có ý nghĩa lớn. Nhận diện hình ảnh trên thiết bị di động đặc biệt tốt, theo Song Han, một sinh viên cao học Đại học Stanford đang làm việc về việc nén mạng nơ-ron. Anh ta đã phát triển một hệ thống như vậy giúp nền tảng thực tế ảo của Facebook theo dõi đối tượng. Đối với các ứng dụng như vậy, nơi zombie ảo của trò chơi cần đồng bộ chính xác với bàn cà phê của bạn, việc chạy mọi thứ cục bộ có thể là một sự cần thiết.
Apple hiện có công nghệ riêng để tối ưu hóa trí tuệ nhân tạo cho iDevices, trong nền tảng CoreML mà họ phát hành vào tháng trước (họ cũng tung ra bộ công cụ thực tế ảo của riêng mình). Và có lý là mong đợi các mẫu iPhone tương lai sẽ sở hữu phần cứng mới để kích thích máy học, nhưng điều đó có thể không mang lại lợi thế rất độc đáo cho Apple. Nếu nó kết nối vào nền tảng CoreML mới thì Google, Facebook và bất kỳ ai có ứng dụng iPhone đều có thể tận dụng nó. Và Qualcomm, công ty chế tạo chip hàng đầu cho thiết bị Android, đã làm việc để tăng tốc mạng nơ-ron trên thiết bị di động từ một thời gian.
Han nói rằng nhiều người nghĩ về tương lai của trí tuệ nhân tạo có thể đặt trong túi đang xem xét một cách tiếp cận kết hợp tốc độ và tiện lợi của thuật toán di động và sức mạnh và sự tinh tế của thuật toán trên đám mây. Google đã thực hiện điều này với việc nhận dạng giọng nói, sử dụng thuật toán cục bộ để gần như ngay lập tức tạo ra một bản ghi âm tạm thời trước khi một trung tâm dữ liệu xa cung cấp một câu trả lời chính xác hơn chỉ trong vài phân giây sau đó. Sự kiên quyết của Apple về việc giữ dữ liệu trên thiết bị của bạn dường như loại trừ một cách tiếp cận như vậy. Việc hứa rằng dữ liệu của bạn sẽ được bảo mật giúp công ty duy trì chiến tranh PR của mình đối với những người ăn số liệu và sẽ không gây tổn thương cho một số ứng dụng của trí tuệ nhân tạo. Nhưng khi máy học trở nên quan trọng hơn đối với tất cả các công ty công nghệ tiêu dùng, thiết bị của Apple có thể nghĩ khác, nhưng không sâu sắc.