Cách Bots Làm Hỏng Hệ Thống Bình Luận Công Khai của FCC

Vào một ngày cuối tháng Năm, hàng trăm nghìn bình luận công khai tràn vào Ủy Ban Truyền Thông Liên Bang về kế hoạch hủy bỏ các biện pháp bảo vệ net neutrality. Một tuần rưỡi sau đó, vào ngày 3 tháng 6, hàng trăm nghìn bình luận nữa tiếp tục đổ vào. Những đợt tăng đột ngột không phải là tiếng nói của những người ủng hộ net neutrality, lo lắng về việc FCC cho phép các nhà cung cấp dịch vụ internet chặn và làm chậm nội dung bất cứ khi nào chúng muốn. Trong thực tế, chúng thậm chí không phải là tiếng nói.
Theo nhiều nhà nghiên cứu, hơn một triệu trong số 22 triệu bình luận mà FCC nhận được là của các bot sử dụng công nghệ sinh ngôn ngữ để nhân rộng giọng gọi hủy bỏ các biện pháp bảo vệ net neutrality. Con số đó có thể chỉ đại diện cho một phần nhỏ của số bài nộp từ bot thực sự. Văn phòng Tổng Công Tố New York hiện đang điều tra nguồn gốc của chúng.
Nhưng trong khi các báo cáo cho đến nay đã tập trung vào những người chơi xấu làm tràn vào FCC nội dung giả mạo, một số kỹ thuật giống nhau cũng cho phép các nhóm hợp pháp, như Electronic Frontier Foundation, kêu gọi thành viên của họ nhấp vào một nút và gửi một bình luận tự động—mặc dù chân thành—đến FCC, tạo ra một làn sóng hoạt động trong cộng đồng người dùng thực sự. Kết quả: Một giai đoạn bình luận về net neutrality thu hút nhiều đóng góp từ cộng đồng hơn cả tất cả các giai đoạn bình luận trước đó trên tất cả các cơ quan chính phủ—tổng hợp.
“Nó làm cho việc mọi người phát biểu dễ dàng hơn, nhưng khó khăn hơn để họ được lắng nghe,” nói Zach Schloss, một quản lý tài khoản tại FiscalNote, một công ty quản lý mối quan hệ với chính phủ đã phân tích bình luận của FCC.
Khi Ủy ban cố gắng lọc qua lượng bình luận đầy chưa từng có này, việc phân biệt giữa những bình luận hợp lệ và bots có thể là một nhiệm vụ không thể vượt qua.
Vụ lộ bình luận về net neutrality là minh họa cho một thách thức lớn trong việc quản lý các nền tảng mở trong thời đại tự động hóa. Bots đang chiếm đóng hệ thống mà nên mang lại quyền lợi cho người tiêu dùng trong quy tắc quản lý họ, nhưng loại bỏ chúng có thể đặt vào nguy cơ bình luận hợp lệ.
Đây là một mâu thuẫn mà các nền tảng như Facebook và Twitter cũng phải đối mặt, khi họ cố gắng loại bỏ hoạt động giả mạo hoặc gây làm phiền trên các nền tảng của họ. Ngoại trừ những công ty đó, FCC và các cơ quan chính phủ khác bị ràng buộc bởi luật pháp để mang lại cơ hội cho công dân tham gia vào quy trình lập quy tắc. Họ cũng phải xem xét “vấn đề liên quan được trình bày” trong những bình luận công khai đó. Khi bots chiếm đóng hệ thống, chúng làm im lặng những bình luận quan trọng đó. Và khi công cụ tạo ngôn ngữ trở nên phức tạp hơn, chúng trở nên khó nhận diện. Đối với một chính phủ bị buộc pháp phải lắng nghe ý kiến của công dân, sự nhầm lẫn này là một khủng hoảng đang nảy nổ.
“Trạng thái hiện tại của nghệ thuật sinh ngôn ngữ tự nhiên khá mạnh mẽ và âm thanh chân thực,” nói Vlad Eidelman, phó chủ tịch nghiên cứu của FiscalNote. Công ty phân tích toàn bộ lịch sử bình luận công khai để giúp khách hàng doanh nghiệp dự đoán những thay đổi mới về quy định chính phủ. “Bạn có thể tạo ra nhiều bình luận có vẻ hợp lệ, cảm thấy hợp lệ và đến từ các địa chỉ email hợp lệ, nhưng không phản ánh ý kiến của cộng đồng.”
FiscalNote đã phân tích tất cả 22 triệu bình luận về net neutrality và phát hiện ra một số mẫu nghi ngờ xuất hiện giữa chúng. Đầu tiên, có lịch sử về lượng lớn. Còn có thực tế là rất nhiều bình luận đến trong chỉ hai ngày: ngày 23 tháng 5 và ngày 3 tháng 6.
Những không bình thường đó một mình không đủ để kết luận rằng những bình luận đó là giả mạo. Để xác định điều đó, các nhà nghiên cứu của FiscalNote đã sử dụng các kỹ thuật xử lý ngôn ngữ tự nhiên để nhóm các bình luận thành các nhóm. Họ chia chúng theo tâm trạng—là ủng hộ hay phản đối net neutrality. Họ tách ra các bình luận giống nhau hoặc gần giống nhau, đánh giá chúng là những bức thư mẫu, mà các nhóm chủ trì thường khuyến khích thành viên của họ gửi. Họ cũng phân tích các bình luận nói về các đề tài giống nhau mà không sao chép chính xác văn bản, để tìm ra sự tương đồng trong cấu trúc và sử dụng từ ngữ.
Những gì họ tìm thấy là hàng trăm nghìn bình luận với cấu trúc câu và đoạn văn giống nhau mà sử dụng từ ngữ khác nhau để truyền đạt cùng một thông điệp. Hãy tưởng tượng nó như một hướng dẫn Mad Libs để ảnh hưởng đến môi trường quy định. Mỗi bình luận có thể được tạo ra bằng cách chọn một từ hoặc cụm từ từ vài chục lựa chọn, và kết hợp chúng lại để tạo ra một đoạn văn.
Ví dụ: Đổi từ “quản lý” thành “kiểm soát” trong câu này, và bạn sẽ có hai câu duy nhất.
Tôi ủng hộ Ajit Pai hủy bỏ kế hoạch của chính quyền trước đó để kiểm soát mạng.
Tôi ủng hộ Ajit Pai hủy bỏ kế hoạch của chính quyền trước đó để quản lý mạng.
Thay đổi “mạng” thành “Internet,” và bạn sẽ có một cái khác.
Tôi ủng hộ Ajit Pai hủy bỏ kế hoạch của chính quyền trước đó để kiểm soát Internet.
Nhóm bots đứng sau cuộc tấn công bình luận đã gói gọn những biến thể câu này để tạo thành những bình luận ngắn. Mỗi cái là duy nhất, nhưng tất cả đều bao gồm 35 cụm từ được sắp xếp theo thứ tự giống nhau, với tới 25 từ và cụm từ tương đồng điền vào mỗi chỗ trống. FiscalNote phát hiện ra hàng trăm nghìn bình luận phù hợp với mẫu này, nhưng có 4.5 septillion sự kết hợp từ khả năng từ và cụm từ mà bot có thể chọn để soạn thảo những bình luận đó.
Và đó chỉ là một trong những mẫu mà FiscalNote phát hiện. Các nhà nghiên cứu còn phát hiện ra một loạt bình luận ủng hộ net neutrality theo các mẫu tương tự. Lần này, tuy nhiên, chúng được liên kết với tổ chức Electronic Frontier Foundation, tạo ra một trang web mang tên dearfcc.org. Nó yêu cầu mọi người gửi bình luận phản đối việc hủy bỏ đến FCC, và tạo tự động một thông điệp cho họ. Những bình luận tự động này thay đổi từ người dùng này sang người dùng khác.
Ví dụ, chỉ một đoạn trong bình luận đó chứa các lựa chọn có thể như sau, theo nghiên cứu của FiscalNote:
FCC nên [từ chối|hủy bỏ] kế hoạch của Chủ tịch Ajit Pai để [cho|giao] chính phủ tài trợ [đại gia viễn thông|độc quyền ISP] như [Comcast, AT&T và Verizon|AT&T, Comcast và Verizon|Comcast, Verizon và AT&T|AT&T, Verizon và Comcast|Verizon, AT&T và Comcast|Verizon, Comcast và AT&T] [tự do|quyền lực|lý lẽ pháp lý] [thực hiện phân biệt dữ liệu|làm chậm bất cứ điều gì họ muốn|tạo ra làn sóng Internet] tước [người tiêu dùng|người dùng|người dùng Internet] của [quyền truy cập và quyền riêng tư cần thiết|quyền riêng tư và quyền truy cập ý nghĩa|quyền truy cập và quyền riêng tư cần thiết] [bảo vệ|quy tắc|biện pháp bảo vệ] mà [chúng tôi đã [chiến đấu cho|đòi hỏi|làm việc cho] và [chiến thắng chỉ hai năm trước|vừa mới chiến thắng|vừa chiến thắng gần đây].
"Giả định của chúng tôi là các cơ quan chú ý đến những ý kiến này nhiều hơn nhiều so với bất kỳ người gửi cá nhân nào," Eidelman nói. Tạo ra một loại hệ thống tầng lớp ít nhất cũng giúp cơ quan lọc qua 22 triệu ý kiến—một con số khiến cho FCC không thể thực sự duyệt qua mỗi ý kiến.
Tất nhiên, một hệ thống như vậy sẽ đặt ra những vấn đề riêng của nó. Đầu tiên, sẽ dễ dàng đối với những tác nhân xấu để lợi dụng, khi họ hiểu rõ những gì cần để thu hút sự chú ý của FCC. Nhưng có một vấn đề cơ bản hơn đang diễn ra. Có thể đúng là FCC đánh giá cao các ý kiến dài do các luật sư và doanh nghiệp nộp hơn là các ý kiến ngắn của công dân, nhưng đó không phải là cách mà hệ thống được thiết kế để hoạt động, Sohn nói.
"Vậy nếu nó không được viết bởi những luật sư đắt tiền, nó không đáng giá gì cả?" cô nói. "Chỉ vì một điều gì đó ngắn không có nghĩa là nó không có giá trị."
Không chỉ phương pháp này hạn chế tác động mà công dân thông thường có thể gây ra, mà còn vì chính phủ có trách nhiệm xem xét tất cả "vấn đề liên quan," Sohn nói, nó đặt Chủ tịch Pai trên bước nền pháp lý rủi ro khi ông tiến hành lập luật. "Bỏ qua hoàn toàn các ý kiến ngắn khiến cho vụ án của ông trở nên yếu đuối hơn", cô nói. "Có những câu hỏi thực sự về tính toàn vẹn của hồ sơ mà có thể và sẽ được sử dụng chống lại ông trong tòa án."
Khi Đạo luật Thủ tục Hành chính được ban hành vào năm 1946, yêu cầu các cơ quan chính phủ chấp nhận ý kiến của công dân, một thế giới trong đó bot làm hỏng cho quy tắc pháp luật là đề tài của khoa học viễn tưởng. Hôm nay, đó là hiện thực mà FCC không thể phớt lờ nữa.
