Việc Phức Tạp Của Elon Musk Truy Cập Twitter Fire-Hose

Nỗ Lực không ngừng của Elon Musk để chiếm đoạt Twitter đã có một bước ngoặt kỳ lạ khác khi trang web truyền thông xã hội này dường như đã chấp nhận yêu cầu của doanh nhân này để truy cập dữ liệu nội bộ của công ty được gọi là "fire hose".
Trong suốt vài tuần, Musk đã thúc đẩy Twitter cung cấp dữ liệu để cho phép doanh nhân người Nam Phi kiểm tra xem một phần đáng kể của người dùng trên nền tảng có phải là tài khoản bot giả mạo hay không - điều mà ông tin rằng sẽ làm giảm giá ông sẵn sàng trả cho công ty. Musk cho rằng tài khoản bot chiếm hơn 5% trong số người dùng Twitter - điều mà thậm chí những người chỉ trích Musk cũng tin là đúng - và muốn công ty chứng minh ngược lại.
Twitter đã báo cáo số lượng tài khoản giả mạo thấp hơn trong kết quả tài chính của mình, và theo The Washington Post, nó sẵn lòng cung cấp quyền truy cập của Musk vào mỗi tweet được đăng hàng ngày, cùng với thông tin người dùng chi tiết, để cho phép ông tìm kiếm hành vi giả mạo. (Tính chất phi chính thức, dữ liệu này được gọi là "fire hose." Twitter từ chối yêu cầu của MYTOUR để xác nhận hoặc phủ nhận báo cáo của Post.) Sự sẵn lòng dường như của Twitter để cấp quyền truy cập cho Musk vào dòng dữ liệu đến vài ngày sau khi các luật sư của ông gửi một lá thư đến công ty nói rằng nó đang "chống đối và ngăn chặn quyền thông tin của [Musk]" và đe doạ sẽ rút khỏi thương vụ.
Sự chuyển động được báo cáo để cấp quyền truy cập dữ liệu cho Musk là quan trọng và đặt ra hai câu hỏi quan trọng: Một, Musk có nhận được những gì ông muốn từ dữ liệu ông đã nhận không? Và hai: Việc ông có quyền truy cập có ý nghĩa gì đối với quyền riêng tư và an ninh hàng ngày của người dùng thông thường?
Đối với Axel Bruns, giáo sư tại Đại học Công nghệ Queensland, bước đi này là Twitter đang thách thức Musk. “Bằng cách cấp quyền truy cập vào fire hose, Twitter có thể nói, ‘Chứng minh những khẳng định của bạn về sự phong phú của bot, rồi hãy,’” ông nói. Bruns tin rằng Musk và những người ông thuê để theo dõi bot sẽ gặp khó khăn. Nhưng ngay cả đối với ai có kỹ năng cần thiết để xử lý mức độ dữ liệu đó, đó không chắc đã là phương pháp đúng để trả lời câu hỏi. Không chắc liệu việc truy cập vào fire hose của 500 triệu tweet được đăng lên nền tảng truyền thông xã hội mỗi ngày có thực sự giúp Musk trả lời câu hỏi quan trọng ông cho là làm trễ quá trình mua lại Twitter của ông: Tỷ lệ người dùng là bot hay không. “Dường như có vẻ là một diễn trình,” Paddy Leerssen, một nhà nghiên cứu về luật thông tin tại Đại học Amsterdam, nói. “Quan điểm của tôi là dữ liệu này không phải là dữ liệu bạn cần để xác định ai là bot hay không.”
Việc xác định điều gì tạo nên một bot đã là một chủ đề gây tranh cãi nảy lửa trong lĩnh vực học thuật, một lĩnh vực mà các chuyên gia đã dành phần lớn cuộc đời làm việc - đó là lý do họ hoài nghi rằng việc truy cập vào tất cả các tweet được đăng lên Twitter sẽ không đủ để trả lời câu hỏi về bot một cách xác định đủ để thuyết phục Musk tiếp tục mua lại. “Ấn tượng của tôi là mọi người có xu hướng đánh giá quá mức về việc phát hiện ra bot,” Leerssen nói. “Một công cụ như thế này [fire hose] sẽ không giúp bạn làm điều đó, trừ khi bạn kết hợp nó với tất cả các phương pháp nghiên cứu khác. Tôi không nghĩ rằng điều đó là điều mà trong một khung thời gian như vậy, Elon Musk sẽ có thời gian để thực hiện.” Người có thể trả lời câu hỏi làm thế nào dữ liệu đó sẽ giúp ông xác định bot, chính là Musk chính mình, không phản hồi lại yêu cầu gửi qua email.
Việc cung cấp quyền truy cập cho Musk vào dòng tweet là một bước di chuyển tương đối vô hại, theo Christopher Bouzy, người sáng lập Bot Sentinel, một dịch vụ theo dõi hành vi giả mạo trên Twitter. “Nó không tiếp xúc với dữ liệu cá nhân của người dùng,” ông nói. “Nó chỉ là một dòng tweet.” Từ dòng tweet đó, Musk có thể phân tích dữ liệu để xem liệu các tài khoản có spam cùng một tin nhắn hay không, hoặc liệu một số ít tài khoản có chịu trách nhiệm cho hầu hết các tweet trên nền tảng hay không - cả hai đều có thể là tín hiệu cảnh báo tiềm ẩn về hành vi bot. Khi được hỏi liệu chúng ta có nên lo lắng về việc Musk có quyền truy cập vào dữ liệu fire hose hay không, Bouzy nói không. “Chỉ là một lượng lớn tweet,” ông nói. Và nó cũng là một lượng tweet không thể quản lý được cho hầu hết mọi người ngoại trừ Twitter: Bruns chỉ ra rằng Thư viện Quốc gia Hoa Kỳ đã từng có quyền truy cập vào fire hose trong một nỗ lực lưu trữ mọi tweet từng được đăng và từ bỏ dự án.
Sự quan tâm của Musk đối với dữ liệu fire hose là mỉa mai, khi ông báo cáo từ chối một đề nghị để xem phòng dữ liệu của Twitter - một bộ sưu tập thông tin và tài liệu được tổ chức bởi các công ty khi quảng bá doanh nghiệp của họ cho người mua tiềm năng - khi lần đầu tiên ông đưa ra thỏa thuận mua lại vào tháng 4. Người phát ngôn của Twitter, Jasmine Basi, từ chối trả lời các câu hỏi, bao gồm cả việc liệu Musk trước đây có yêu cầu truy cập vào phòng dữ liệu hay không. Basi cũng từ chối trả lời trực tiếp về việc bao nhiêu người ngoài Twitter, ngoại trừ Musk, có quyền truy cập vào dữ liệu fire hose, và liệu Musk có phải ký một thỏa thuận không tiết lộ hoặc sử dụng để truy cập nó hay không. Điều đó làm nảy sinh lo ngại. “Mặc dù tôi hiểu những gì Twitter đang làm ở đây, nhưng nó vẫn rất không bình thường,” Bruns nói, so sánh đó là “việc tặng đi những viên ngọc quý”.
Tuy nhiên, viên ngọc quý đó đang được bán: Khoảng hai chục công ty đã có quyền truy cập vào fire hose của dữ liệu mà Twitter đã cấp cho Musk. Jasmine Basi của Twitter từ chối tiết lộ tên của những công ty đó, nhưng xử lý dữ liệu của họ cho đến nay có vẻ không gây ra vấn đề nào được biết đến trong số những công ty đó. Trước đây, Twitter đã cung cấp quyền truy cập fire hose rộng lớn, với vấn đề: Công ty nhận thức được rằng nó để mất tiền bằng cách cung cấp quyền truy cập cho các nhà cung cấp dữ liệu bán lại bên ngoài, trong khi các cơ quan tình báo trước đây đã có quyền truy cập vào dữ liệu người dùng thông qua Dataminr, một công ty đã mua quyền truy cập fire hose. Google và các nhà nghiên cứu tại Viện Công nghệ Massachusetts trước đây đã có quyền truy cập vào cùng dữ liệu mà Musk đang được cấp quyền truy cập. “Việc chia sẻ thông tin nhạy cảm là một phần quan trọng của các quy trình mua lại,” Leerssen nói, người trước khi theo đuổi sự nghiệp học thuật đã làm việc về các vấn đề bảo vệ dữ liệu xung quanh phòng dữ liệu để kiểm tra độ chặt chẽ.
Tuy nhiên, điều lớn không biết là chính Musk - một người đã cho thấy trong quá trình thử nghiệm mua lại của mình rằng ông sẵn lòng phớt lờ các thỏa thuận pháp lý. Nhiều người cũng nhìn nhận rằng quan tâm rõ ràng của ông về số lượng tài khoản bot như một bản đồ để rút lui khỏi thỏa thuận, mặc dù điều khoản của thỏa thuận mà ông đã đạt được với Twitter ngăn cản điều đó mà không phải trả phạt khổng lồ.
“Nó thực sự trở nên nhiều hơn là cố gắng phân tích tâm lý Elon Musk hơn là về dữ liệu Twitter, gần như là vậy,” nói Midas Nouwens, giáo sư trợ giảng về quyền số tại Đại học Aarhus. Nouwens luôn lo ngại về quy mô thông tin có sẵn cho nhân viên tại Twitter - một công ty công nghệ duy nhất ở một lãnh thổ duy nhất trên thế giới. “Tôi thấy khá khó khăn khi phải phân biệt cách mà các nền tảng truyền thông xã hội như Twitter hoạt động, và sau đó là yếu tố độc lập của Elon Musk ở đó,” ông nói. “Nhanh chóng trở nên cố gắng tìm hiểu Elon Musk sẽ làm gì, và hành vi của ông đôi khi khá thất thường.”
Nouwens là một trong những người có quyền truy cập vào dữ liệu Twitter thông qua một API có sẵn cho các nhà nghiên cứu, cho phép ông truy vấn 10 triệu tweet mỗi tháng. Việc có quyền truy cập vào dòng dữ liệu, ông nói, dễ dàng hơn so với dự kiến, đặc biệt là khi có quá nhiều dữ liệu ông có quyền truy cập. Ông phải viết mô tả về dự án ông dự định sử dụng dữ liệu cho, cùng với việc cung cấp chứng minh rằng ông là một học giả hoạt động. “Dù đó là Elon Musk hay một đối tác khác, tôi luôn có lo ngại,” Nouwens nói. “Bây giờ đối với ông ta, yếu tố bổ sung là hành vi quá khứ của ông, đúng, nhưng cũng là lợi ích kinh doanh của ông.” Lo lắng là ngay cả khi Musk rút lui khỏi thỏa thuận mua lại Twitter, thông tin mà ông được cấp quyền truy cập thông qua việc nhìn thấy miễn phí dòng tweet của Twitter có thể được sử dụng bởi ông hoặc các công ty của ông trong tương lai. Bruns nói rằng bộ dữ liệu fire hose có thể tạo ra cái nhìn mới về người dùng Twitter và lý do họ sử dụng, cách mẫu sử dụng thay đổi theo thời gian dài, và hành vi vấn đề mà người dùng tham gia - cùng với việc tạo ra các hồ sơ chi tiết về sở thích và mạng lưới của người dùng. “Trừ khi có điều gì đó trong báo cáo mà tôi đã bỏ lỡ về thời gian Musk có quyền truy cập vào fire hose, tôi giả định Twitter đang đánh cược vào việc ông và đội của ông sẽ nhanh chóng từ bỏ nó,” Bruns nói. “Đặc biệt nếu ông ta có fire hose trong vài tháng hoặc lâu hơn, điều này thực sự trở thành một vấn đề về quyền riêng tư và đạo đức người dùng.”
Bất kể Musk có được quyền truy cập vào dữ liệu hay không, điều đó không thể giúp ông vượt qua khó khăn chính mà ông đối mặt trong quá trình mua lại Twitter. “Tôi không biết liệu có câu trả lời cho câu hỏi mà ông ta đang đặt ra cho Twitter hay không,” Nouwens nói. “Có lẽ Twitter biết nhiều hơn những nhà nghiên cứu bên ngoài hiện nay có thể biết hoặc làm được. Nhưng đó là một câu hỏi thực sự khó khăn.”
