Drag Queen vs. David Duke: Tweet Nào 'Độc Hại' Hơn?

Các nền tảng truyền thông xã hội như Facebook, Twitter và YouTube đã đầu tư đáng kể vào việc phát triển trí tuệ nhân tạo để kiểm soát nội dung và tự động loại bỏ các bài đăng có hại. Những công nghệ đưa ra quyết định này thường phụ thuộc vào kỹ thuật học máy và đặc biệt cho từng loại nội dung như hình ảnh, video, âm thanh và văn bản. Một số hệ thống trí tuệ nhân tạo này, được phát triển để đo lường "độ độc hại" của nội dung dựa trên văn bản, sử dụng xử lý ngôn ngữ tự nhiên và đánh giá tâm trạng để phát hiện văn bản có hại.
Mặc dù những công nghệ này có vẻ đại diện cho một bước ngoặt trong cuộc tranh luận về bài phát biểu thù địch trên internet, nghiên cứu gần đây đã chỉ ra rằng chúng vẫn còn xa lạc khỏi khả năng phân biệt bối cảnh hoặc ý định. Nếu những công cụ trí tuệ nhân tạo như vậy được ủy quyền quyền lực để kiểm soát nội dung trực tuyến, chúng có khả năng đàn áp bài phát biểu hợp lệ và kiểm duyệt việc sử dụng từ ngữ cụ thể, đặc biệt là từ các nhóm nhạy cảm.
Tại InternetLab, chúng tôi gần đây đã tiến hành một nghiên cứu tập trung vào Perspective, một công nghệ trí tuệ nhân tạo được phát triển bởi Jigsaw (thuộc sở hữu của Google, Alphabet). Trí tuệ nhân tạo này đo lường mức độ 'độc hại' được cảm nhận của nội dung dựa trên văn bản. Perspective xác định 'độc hại' là 'một bình luận thô lỗ, không tôn trọng hoặc không hợp lý có khả năng khiến bạn rời khỏi một cuộc thảo luận.' Do đó, mô hình trí tuệ nhân tạo đã được huấn luyện bằng cách yêu cầu người đánh giá xếp hạng bình luận trên internet trên một thang điểm từ 'rất lành mạnh' đến 'rất độc hại.' Mức độ độc hại được cảm nhận cho biết khả năng một bình luận cụ thể sẽ được coi là độc hại.
Chúng tôi đã sử dụng API của Perspective để so sánh mức độ độc hại được cảm nhận của các nghệ sĩ drag queen nổi tiếng và các nhân vật chính trị cánh hữu cực. Nghiên cứu so sánh tài khoản Twitter của tất cả những người tham gia trước đó của RuPaul's Drag Race với những nhà lãnh đạo cánh hữu cực như David Duke, Richard Spencer, Stefan Molyneux và Faith Goldy. Ngoài ra, chúng tôi bao gồm các người dùng Twitter không thuộc cộng đồng LGBTQ nổi tiếng khác, bao gồm Donald Trump và Michelle Obama. Chúng tôi đã phân tích hơn 114.000 tweet được đăng bằng tiếng Anh với phiên bản mới nhất của Perspective.
Kết quả của chúng tôi chỉ ra rằng một số lượng đáng kể tài khoản Twitter của nghệ sĩ drag queen được tính toán có mức độ độc hại cao hơn so với những nhà lãnh đạo quốc tế cực. Trung bình, mức độ độc hại của tài khoản của drag queen dao động từ 16,68% đến 37,81%, trong khi trung bình của những người quốc tế cực nằm trong khoảng từ 21,30% đến 28,87%. Mức độ độc hại của tài khoản Twitter của Tổng thống Trump là 21,84%.
Chúng tôi cũng thực hiện các bài kiểm tra đo lường mức độ độc hại của những từ thường xuất hiện trong các tweet của nghệ sĩ drag queen. Những từ này có mức độ độc hại cao đáng kể: đồng tính (76,10%), lesbian (60,79%), queer (51,03%) và travesti (44,48%). Điều đó có nghĩa là, ngay cả khi sử dụng trong bối cảnh trung lập, những từ này vẫn được xếp hạng là độc hại đáng kể bởi trí tuệ nhân tạo của Perspective. Điều này chỉ ra sự chệch lệch quan trọng trong công cụ của Perspective.
Ngoài ra, những từ như đồng tính (91,94%), sissy (83,20%) và bitch (98,18%) đăng ký mức độ độc hại cao. Mặc dù những từ đó có thể thường được coi là có hại, nhưng việc sử dụng chúng bởi các thành viên của cộng đồng LGBTQ thường phục vụ một mục đích khác.
Nghệ sĩ drag queen có thể nói nhanh nhẹn. Từ 'đọc'—một hình thức cụ thể của lời châm biếm làm nổi bật nhược điểm của ai đó—đến những trò đùa và phản đòn khắc nghiệt, drag queen thường tái chiếm lại những từ truyền thống được sử dụng như những từ phỉ báng để xây dựng một phong cách giao tiếp đặc biệt.
Trong tình huống trực tiếp, việc hiểu bối cảnh và nhìn nhận điều này như một hình thức tự biểu hiện dễ dàng hơn. Nhưng khi đọc những thông điệp như vậy trực tuyến, việc phân biệt giữa lời nói có hại và hợp lệ là đáng kể khó khăn hơn—đặc biệt là khi đánh giá đó được thực hiện bởi máy móc. Các sử dụng nội dung nhóm cũng được tìm thấy trong nhiều tweet chúng tôi phân tích. Nhưng trong nhiều trường hợp đó, Perspective vẫn coi bài đăng là cực kỳ độc hại:
Nội dung X
Nội dung này cũng có thể được xem trên trang web nguồn gốc.
Mức độ độc hại: 95.98 phần trăm
Nội dung X
Nội dung này cũng có thể được xem trên trang web nguồn gốc.
Mức độ độc hại: 91.16 phần trăm
Thường xuyên, những tương tác 'khắc nghiệt' này đề cập đến các chủ đề nhạy cảm như vai trò tình dục trong mối quan hệ, sự hiển thị của đồng tính và tình dục không ràng buộc—những chủ đề thường được khám phá bởi những người muốn tấn công bằng lời người thuộc cộng đồng LGBTQ.
Nhưng khi được hướng vào nhau bởi các thành viên trong cộng đồng LGBTQ, những bình luận này có thể đến từ tinh thần đoàn kết, không phải ác ý. Những thông điệp tiềm ẩn không thúc đẩy sự căm ghét, đặc phối và phân biệt đối xử. Ngược lại, chúng thường gợi lên niềm tự hào và sự chấp nhận bản thân, giúp người LGBTQ đối mặt với sự thù địch từ bên ngoài.
Lời nói chống đối thường được đặt trên những thông điệp tiềm ẩn. Khi văn bản phổ biến ý kiến gây thù địch hoặc phân biệt đối xử, nó đại diện cho mối đe dọa đối với các nhóm bị tách biệt và yếu đuối. Bằng cách đào tạo thuật toán của mình để học được nội dung có khả năng được xem xét là độc hại, công cụ của Perspective dường như đang tăng cường sự ưu tiên cho từ ngữ, chứ không phải thông điệp tiềm ẩn của chúng.
Mặc dù các ý kiến được thúc đẩy bởi những tweet của những người ủng hộ quốc tế cực có thể nhắm mục tiêu vào nhóm yếu đuối, trí tuệ nhân tạo của Perspective thường xếp chúng ít độc hại hơn nhiều so với tweet của nghệ sĩ drag queen:
Nội dung X
Nội dung này cũng có thể được xem trên trang web nguồn gốc.
Mức độ độc hại: 7.17 phần trăm
Nội dung X
Nội dung này cũng có thể được xem trên trang web nguồn gốc.
Mức độ độc hại: 6.78 phần trăm
Nội dung X
Nội dung này cũng có thể được xem trên trang web nguồn gốc.
Mức độ độc hại: 21.7 phần trăm
Nếu công cụ trí tuệ nhân tạo này được ủy quyền quyết định những tweet nào nên bị gỡ bỏ, nhiều bài đăng của nghệ sĩ drag queen sẽ bị kiềm chế. Trên thực tế, Perspective đã đang đưa ra những quyết định như vậy.
Tháng 3, Jigsaw đã ra mắt Tune, một tiện ích trình duyệt thử nghiệm sử dụng Perspective để cho phép người dùng đặt 'âm lượng' của nội dung trực tuyến trên các nền tảng bao gồm Facebook, Twitter, YouTube và Reddit. Người dùng có thể quay nút lên để xem tất cả các bài đăng, hoặc quay xuống để ẩn tất cả các bình luận độc hại. Những bài đăng đó được thay thế bằng những chấm màu nhỏ. Tune quảng cáo xung quanh ý tưởng rằng “lạm dụng và quấy rối làm mất tập trung khỏi các cuộc thảo luận trực tuyến." Tune khẳng định rằng bằng cách sử dụng Perspective, nó "[giúp] bạn tập trung vào những điều quan trọng."
Vấn đề: Các công cụ trí tuệ nhân tạo như vậy có thể được phát triển bằng cách sử dụng dữ liệu đào tạo thiên vị, đe dọa đến tự biểu đạt và sự hiển thị của nhóm yếu đuối. Riêng lẻ, 3,925 tweet từ những nghệ sĩ drag queen—khoảng 3.7 phần trăm tổng số tweet được phân tích—sẽ bị ẩn đi khỏi người dùng Tune ở chế độ "Keep it low", theo nghiên cứu của chúng tôi.
Việc sử dụng Perspective và các công nghệ tương tự khác có thể bị lạc quan sử dụng để kiểm soát và kiềm chế lời nói hợp pháp của cộng đồng LGBTQ trên các nền tảng trực tuyến. Nếu các công cụ trí tuệ nhân tạo tập trung vào tín hiệu đánh lừa—như việc sử dụng từ ngữ cụ thể, thay vì ý định của thông điệp—các mô hình đó sẽ tiến triển ít trong việc loại bỏ lời nói chống đối.
Công cụ trí tuệ nhân tạo có tiềm năng định hình cách chúng ta giao tiếp. Nếu máy tính quyết định một cách chọn lọc về điều gì là 'độc hại,' công nghệ có sức mạnh ảnh hưởng đến cách chúng ta thể hiện ý kiến trực tuyến và giới hạn sự bao hàm của internet.
Quan điểm của MYTOUR đăng bài viết của các độc giả bên ngoài, đại diện cho nhiều quan điểm khác nhau. Đọc thêm ý kiến tại đây. Gửi bài viết tại [email protected]
- Bên trong phòng tập gym mới của chàng trai Bulletproof Coffee
- Vô hiệu hóa bom mìn và bom chưa nổ ở Mosul
- Cái chết của một bệnh nhân và tương lai của việc ghép phân
- Giải thích 'khoảng trống dữ liệu giới tính,' từ điện thoại đến giao thông công cộng
- Làm thế nào chín người xây dựng một đế chế Airbnb bất hợp pháp 5 triệu đô la
- 🎧 Âm thanh không đúng? Kiểm tra tai nghe không dây, loa thanh và loa bluetooth yêu thích của chúng tôi
- 📩 Muốn nhiều hơn? Đăng ký nhận bản tin hàng ngày của chúng tôi và không bao giờ bỏ lỡ những câu chuyện mới và tuyệt vời nhất của chúng tôi
