Facebook Không Nghe Qua Điện Thoại Của Bạn. Nó Không Cần Phải

Trong sự hồn nhiên đầy hứng thú của những tuần đầu tiên khi tôi làm trưởng nhóm định rõ mục tiêu quảng cáo cho Facebook, tôi luôn hăng hái đối mặt với mỗi lý thuyết âm mưu mới.
"Liệu Facebook có quét ảnh của tôi và sử dụng nó để định rõ mục tiêu quảng cáo không?" là một trong những câu hỏi từ một phóng viên Los Angeles Times. "Cô em họ tôi đã tải lên một bức ảnh của bạn trai trong chiếc áo San Francisco 49ers, và bây giờ tôi đang thấy quảng cáo 49ers. Làm sao mà lại như vậy?"
Và tiếp tục như vậy.
Tôi cũng nhận ý kiến mới về ý tưởng định rõ mục tiêu từ chính những nhân viên của Facebook, họ sẽ xây dựng câu chuyện xung quanh một phần nhỏ của hành vi người dùng, và cách đó có thể thay đổi Facebook's doanh thu quảng cáo đã tăng chói lọi rồi (ví dụ: 'hiển thị quảng cáo burger cho những người check-in In-N-Out').
Không tránh khỏi, những lý thuyết âm mưu và ý tưởng mới sẽ chết trên những tảng đá của ba tiêu chí tôi cuối cùng đặt ra để bác bỏ hoặc loại bỏ (hầu hết) tất cả chúng.
Có khả năng không?
Có phổ biến không?
Có hiệu quả không?
Khả thi, phổ biến và hiệu quả: Những bộ lọc này phá hủy gần như mọi lý thuyết âm mưu về Facebook mà bạn từng nghe.
Một trong những điều mà bạn có thể đã nghe gần đây: Facebook nghe trộm bạn qua microphone của điện thoại di động. Như với tất cả các lý thuyết như vậy — người tin vào chân lý 9/11, những người nghi ngờ chân lý về Obama, người ủng hộ 'đồi cỏ' — chỉ có đủ bằng chứng hóa ra thành một câu chuyện. Dưới đây là một video lan truyền rộng cho thấy hiện tượng này.
Nhưng tất cả đều là lời nói láo.
Hãy đặt chiếc áo hoodie của quản lý sản phẩm Facebook có nhãn hiệu của chúng tôi để kiểm tra cận cảnh. Ngay cả nếu bạn chưa xóa ứng dụng Facebook khỏi điện thoại hoặc đặt điện thoại của bạn vào một hộp cách âm, một buổi thăm quan nhanh về sự nghiên cứu lý thuyết mới nhất này sẽ chứng minh cách Facebook nghĩ về cách chúng tôi kiếm tiền từ bạn và tại sao microphone của bạn không quan trọng.
Để thực hiện điều này, Facebook sẽ cần ghi lại mọi thứ điện thoại của bạn nghe được khi nó đang bật. Điều này tương đương với cuộc gọi liên tục từ bạn đến Facebook. Cuộc gọi thông thường qua internet mất khoảng 24 kbps một chiều, tương đương với khoảng 3 kB dữ liệu mỗi giây. Giả sử bạn để điện thoại bật một nửa ngày, đó là khoảng 130 MB mỗi ngày, mỗi người dùng. Có khoảng 150 triệu người dùng hàng ngày ở Hoa Kỳ, vì vậy đó là khoảng 20 petabyte mỗi ngày, chỉ ở Hoa Kỳ.
Để có cái nhìn tổng quan, toàn bộ lưu trữ dữ liệu của Facebook chỉ là khoảng 'chỉ' 300 petabyte, với tỷ lệ hấp thụ hàng ngày khoảng 600 terabyte. Nói cách khác, giám sát âm thanh liên tục sẽ tạo ra khoảng 33 lần nhiều dữ liệu hơn hàng ngày so với Facebook hiện tại tiêu thụ.
Hơn nữa, việc nghe trộm như vậy sẽ dễ dàng phát hiện, tạo ra lượng dữ liệu đáng kể trên điện thoại thông minh của bạn khi Facebook duy trì cuộc gọi liên tục của bạn đến Zuckerberg. Bạn đã từng tìm kiếm điều gì đó trên điện thoại trong khi đang gọi điện chưa? Bạn có thấy nó chậm lại không? Nếu Facebook đang lắng nghe, điện thoại của bạn sẽ như vậy suốt thời gian.
Tất nhiên, còn cách thông minh hơn để làm điều này. Trợ lý cá nhân có thể điều khiển bằng giọng nói Amazon Echo (và tương đương của Google, Google Home), đặt một thiết bị nghe có vẻ hơi Orwellian trong nhiều gia đình ở Mỹ. Echo chỉ có đủ phần cứng để phát hiện một bộ từ 'kích thích' rất nhỏ, khiến nó bắt đầu lắng nghe. Khi nó phát hiện ra từ kích thích đó, nó cũng đủ thông minh để ghi lại lệnh tiếp theo và gửi nó đến tàu con thoi Amazon, nơi công việc chuyển đổi văn bản nói và xử lý ngôn ngữ tự nhiên thực sự diễn ra. Dữ liệu hoặc yêu cầu thêm chi tiết sau đó được truyền lại, và cuộc trò chuyện của bạn với 'Alexa' tiếp tục. Echo chỉ hoạt động như một microphone, loa và máy tính yếu làm một nhiệm vụ nhận dạng giọng nói nhỏ.
Ứng dụng Facebook có thể làm điều tương tự, chỉ nghe cho các từ khóa cụ thể kích hoạt quảng cáo không?
Không chính xác. Hệ thống định rõ mục tiêu của Facebook có khoảng một triệu từ khóa có thể định rõ khi tôi rời bỏ, và có khả năng đã giữ vững hoặc tăng nhẹ. Nhưng khác với Amazon Echo, chỉ nghe một trong bốn từ kích thích, hàng triệu hoặc có lẽ tỷ tỷ từ và cụm từ có thể đưa bạn vào một đoạn địa chỉ định rõ mục tiêu của Facebook.
Ví dụ, việc nói 'golf,' 'Tiger Woods,' 'The Masters,' hoặc 'Augusta National Golf Course' đều nên đưa bạn vào đoạn địa chỉ định rõ mục tiêu 'Golf,' và điện thoại của bạn sẽ cần phải phát hiện từng cái một. Vì nó không có từ kích thích cụ thể cho Facebook, điện thoại của bạn sẽ cần phải lắng nghe mọi từ khóa có thể định rõ mục tiêu. Điều đó có nghĩa là mã chuyển đổi giọng thành văn bản chỉ có thể chạy trên điện thoại của bạn, là một yêu cầu đòi hỏi ngay cả đối với các máy chủ đám mây mạnh mẽ thường xuyên xử lý những nhiệm vụ đó.
Bạn có thể có thể hack xung quanh vấn đề bằng cách giới hạn danh sách từ khóa, hoặc thu hẹp ánh xạ từ từ nói thành từ khóa định rõ mục tiêu để giảm không gian tìm kiếm (chỉ từ 'golf' thay vì 'Tiger Woods'), nhưng vẫn là một thách thức khó khăn trên mọi điện thoại thông minh tồn tại, từ những chiếc điện thoại chậm và cũ đến những chiếc đầu đàn nhanh như iPhone X. Định rõ mục tiêu cho một loại điện thoại cụ thể sẽ giảm bớt gánh nặng đó một chút, nhưng quy mô đáng kể nào cũng mang lại một thách thức đặc biệt.
Hơn nữa, giống như trong cách tiếp cận ngây thơ ở trên, điều này sẽ dễ dàng nhận thấy như một sự suy giảm hiệu suất trên điện thoại của bạn, vì quá trình suy luận nền sẽ nhanh chóng tiêu thụ toàn bộ CPU và pin của điện thoại của bạn, điều bạn có thể kiểm tra dễ dàng thông qua các công cụ giám sát của thiết bị. Điều đó có thể thay đổi khi điện thoại thông minh trở nên mạnh mẽ hơn, và các nhà phát triển di động thông minh hơn trong việc chạy tính toán thực sự tại chỗ, nhưng động cơ định rõ mục tiêu của Facebook sẽ không chạy trên điện thoại của bạn trong thời gian sớm.
Nói ngắn gọn, những thách thức kỹ thuật của kịch bản Big Brother theo phong cách của Zuck đều overwhelming và không có khả năng được sửa chữa trong thời gian rất sớm. Điều này không thể xảy ra trên quy mô.
Nhưng nếu những hiện thực kỹ thuật đó biến mất?
Hãy giả sử bạn có thể tạo ra một bản ghi âm kỹ thuật số hoàn hảo của mọi cuộc trò chuyện nói chung được nghe lén bởi một điện thoại thông minh có khả năng Facebook. Không làm tốn băng thông, không làm chết CPU, chỉ là một việc ghi chép trung thành mỗi lời nói của bạn.
Một phần nhỏ của bản ghi đó sẽ chứa bất cứ điều gì có ý nghĩa thương mại đối với một nhà quảng cáo không?
Không nhiều lắm, như thế đấy.
Chúng tôi đã thực hiện một bài kiểm tra như vậy trong năm đầu tiên tại Facebook. Mã tên 'Dự án Chorizo', nó liên quan đến việc đẩy mọi dữ liệu người dùng Facebook có sẵn - bài viết, chia sẻ liên kết, đăng ký - vào máy xay mục tiêu và xem xét xem nó có cải thiện hiệu suất quảng cáo không. Trước khi chúng tôi đến phía hiệu suất (và chúng tôi sẽ bàn về điều đó sớm), chúng tôi ngay lập tức bị ấn tượng bởi tỷ lệ nào đó nhỏ của nội dung Facebook thậm chí kích thích sự quan tâm từ máy mục tiêu. Trên thứ tự của các phần trăm số một chữ số của bài viết Facebook dẫn đến bất kỳ đọc nào từ máy mục tiêu. Đó giống như đẩy một đàn gia súc vào máy xay xúc xích và nhận được một chiếc xúc xích nóng như kết quả. Và người dùng Facebook là một bầy đàn rất lớn.
Đây là một trong những hiểu lầm chính về Facebook, mà tôi thích gọi là Sai Lầm Tự Tình. Chúng ta đều là trung tâm của thế giới riêng của mình, và giả định cuộc sống của chúng ta rất quan trọng hoặc thú vị đối với người ngoại vi. Do đó, chúng ta đặt vào mức chúng ta muốn ít nhất là phải tiết lộ với những gì người quảng cáo (hoặc Facebook) muốn biết nhất. Nhưng đó là một tương đương hoàn toàn sai lầm; người quảng cáo không quan tâm đến đa số ngay cả dữ liệu cá nhân nhất của bạn.
Nói một cách khác: Chỉ vì tôi có một bức ảnh trần trụi của bạn trên internet không có nghĩa là ai đó sẽ trả tiền để xem nó.
Điều tương tự cũng đúng với hầu hết dữ liệu Facebook của bạn, bao gồm cả cuộc trò chuyện của bạn. Mặc dù có lẽ có một vài đoạn trò chuyện có thể tiết lộ điều gì đó thú vị về mặt thương mại, những dữ liệu mà người quảng cáo thực sự muốn sử dụng để định rõ mục tiêu không nằm trên Facebook. Không, dữ liệu đó thay vào đó tồn tại trong giỏ hàng mua sắm Amazon của bạn, hoặc đại lý xe của bạn, hoặc Target địa phương của bạn, hoặc mọi nơi khác bạn để lộ ý muốn và mong muốn của mình về vốn làm ăn.
Quên đi khả năng thực hiện hay sự phổ biến. Hãy tưởng tượng Facebook đã nghe lén tất cả những cuộc trò chuyện phong cách đó. Nó làm gì với chúng?
“Tôi cần bay từ New York đến Boston vào ngày 21 tháng 12, với giá dưới $300.”
Bắt đầu chạy quảng cáo du lịch, Kayak!
“Trump là một thiên tài thực sự, phải không? #kháng cự”
Hey Đảng Cộng hòa...ờ đợi chút, không. Hey Đảng Dân chủ. Hoặc có phải là người ủng hộ Stein không?
“Người đó Mark ở công ty thì thực sự là một tên đàn ông đáng ghét. Mời tôi hẹn hò mặc dù tôi đã nói về bạn trai.”
Purina! Đợi đã. OkCupid! Chờ chút... để tôi chạy công việc trí tuệ nhân tạo đó lại một lần nữa.
Ngôn ngữ con người đầy mèo méo, nói giả bộ, nói giữa dòng, và sự làm rối. Cho rằng trí tuệ nhân tạo ở quy mô của Facebook sẽ có thể hiểu, thậm chí ở cấp độ may mắn của quảng cáo trên internet, điều bạn mong muốn dựa trên bất kỳ tuyên bố nào đó là đánh giá quá cao (hoặc nỗi lo) cho những công nghệ này.
Hãy xem xét lại 'Dự án Chorizo'. Sau tất cả những công đoạn xay lạc, sự tăng cao về tỷ lệ nhấp chuột nhờ đưa bài viết của người dùng vào hệ thống định hướng là tối thiểu. Không phải là không có, bạn hiểu rồi, nhưng ít hơn nhiều so với mức giá mà nhà quảng cáo sẽ trả.
Vậy làm thế nào để giải thích tất cả những câu chuyện kỳ quái này và video YouTube lan truyền?
Phần lớn lý giải dường như là do thiên lệch xác nhận, tương đương với việc tự hỏi tại sao mọi khi bạn rửa xe thì trời lại mưa. Bạn đang xem video của người dùng Facebook duy nhất trải qua một sự kiện không tưởng, và bỏ qua hàng triệu người dùng khác không gặp phải sự trùng hợp kỳ quặc đó.
Không phải mọi trùng hợp như vậy đều là giả mạo. Một số là sự nhầm lẫn giữa tương quan và nguyên nhân. Hãy quay lại với bức ảnh chiếc áo 49ers được tải lên. Điều gì đã xảy ra thực sự: 49ers đã thi đấu vào cuối tuần đó, giải thích cả chiếc áo đang được mặc, và một chiến dịch quảng cáo đồng thời được hướng vào Khu vực vịnh SF. Một cái không gây ra cái kia; cả hai đều được gây ra bởi một yếu tố bên ngoại mà phóng viên đã phớt lờ.
Sự thật khắc nghiệt là Facebook không cần thực hiện các kỳ tích kỹ thuật để định hướng bạn thông qua các tín hiệu yếu. Nó đã có cách tốt hơn để làm điều đó rồi. Không phải mọi quảng cáo chính xác đến đáng sợ bạn thấy là chỉ là một ảo tưởng thuần túy từ định kiến nhận thức của bạn. Hãy nhớ, Facebook có thể tìm thấy bạn trên bất kỳ thiết bị nào bạn từng kiểm tra Facebook. Nó có thể tận dụng mọi thông tin mà các nhà bán lẻ biết về bạn, và đôi khi theo dõi các giao dịch mua sắm của bạn tại cửa hàng, chỉ có thanh toán bằng tiền mặt; thẻ giảm giá trung thành đó được liên kết với một số điện thoại hoặc email vì một lý do.
Trước khi kích động sự tức giận của bạn đối với Facebook quá nhiều, hãy biết rằng Twitter và LinkedIn cũng làm điều này, và Facebook đã sao chép khái niệm 'onboarding dữ liệu' từ thế giới quảng cáo công nghệ lớn hơn, thậm chí còn bắt chước theo nhiều thập kỷ tiếp thị trực tiếp tiêu dùng. Thật khó tránh khỏi Phức tạp Công nghiệp Quảng cáo hiện đại.
Phiên bản rút gọn cho tất cả những lý thuyết với mũ bảo hiểm nhôm: Không có cách nào Facebook đang nghe trộm bạn ngay bây giờ. Nhưng nó đang theo dõi bạn theo các cách khác—không kém phần xâm phạm—mà bạn không nhận thức được. Như câu ngạn ngữ của lính, luôn luôn là viên đạn bạn không nghe thấy cuối cùng sẽ làm bạn chết.
Ý KIẾN MYTOUR đăng các bài viết được viết bởi các đồng sự đóng góp bên ngoài và đại diện cho nhiều quan điểm khác nhau. Đọc thêm ý kiến ở đây.
