Trí tuệ nhân tạo của Facebook trong việc xử lý Bài viết Ghê tởm được cải thiện. Mức độ cải thiện còn mơ hồ

Thuật toán của Facebook phát hiện bài viết ghê tởm đang hoạt động chăm chỉ hơn bao giờ hết. Chỉ có điều chúng ta không biết chính xác chúng hoạt động tốt đến mức nào.
Thứ ba, mạng xã hội này đã báo cáo một bước nhảy vọt trong số lượng mục bị gỡ bỏ vì vi phạm quy tắc về bài viết ghê tởm. Sự tăng này đến từ việc phát hiện tốt hơn bởi các công cụ phát hiện bài viết ghê tởm tự động được phát triển bởi các chuyên gia trí tuệ nhân tạo của Facebook.
Độ chính xác của những hệ thống đó vẫn là một bí ẩn. Facebook không công bố, và cho biết họ không thể ước lượng, tổng số lượng bài viết ghê tởm được đăng bởi 1.7 tỷ người dùng hàng ngày của họ.
Từ tháng 5 năm 2018, Facebook đã công bố các báo cáo hàng quý về cách họ thực thi các tiêu chuẩn cho cuộc trò chuyện chấp nhận được. Báo cáo mới nhất cho biết công ty đã gỡ bỏ 9.6 triệu mục nội dung được coi là bài viết ghê tởm trong quý đầu tiên của năm 2020, tăng từ 5.7 triệu mục trong quý tư năm 2019. Tổng số này là kỷ lục, vượt qua con số 7 triệu bài viết bị gỡ bỏ trong quý ba năm 2019.
Trong số 9.6 triệu bài viết bị gỡ bỏ trong quý đầu tiên, Facebook cho biết phần mềm của họ phát hiện 88.8 phần trăm trước khi người dùng báo cáo chúng. Điều này cho thấy thuật toán đã gắn cờ cho 8.5 triệu bài viết với nội dung ghê tởm trong quý, tăng 86 phần trăm so với tổng số 4.6 triệu bài viết trong quý trước.
Trong cuộc gọi với các phóng viên, giám đốc công nghệ của Facebook, Mike Schroepfer, giới thiệu những tiến bộ trong công nghệ học máy của công ty trong việc phân tích ngôn ngữ. “Mô hình ngôn ngữ của chúng tôi đã trở nên lớn hơn và chính xác hơn cũng như tinh tế hơn,” ông nói. “Chúng có khả năng bắt được những điều không rõ ràng hơn.”
Schroepfer không muốn chỉ rõ về độ chính xác của những hệ thống đó hiện tại, chỉ nói rằng Facebook kiểm tra các hệ thống một cách cẩn thận trước khi triển khai, một phần để tránh việc xử phạt sai cho nội dung vô tội.
Anh ấy trích dẫn các con số trong báo cáo mới cho thấy mặc dù người dùng đã kháng cáo quyết định gỡ bỏ nội dung về lời lẽ căm thù nhiều hơn trong quý gần đây nhất - 1,3 triệu lần - nhưng ít bài viết sau đó được khôi phục. Facebook cũng cho biết vào thứ Ba rằng họ đã thay đổi quy trình kháng cáo vào cuối tháng Ba, giảm số lượng kháng cáo đăng nhập, vì các hạn chế về Covid-19 đã đóng cửa một số văn phòng kiểm duyệt.
Các con số của Facebook không cho thấy có bao nhiêu lời lẽ căm thù trượt qua mạng lưới thuật toán của họ. Các báo cáo hàng quý của công ty ước tính tỷ lệ phát sinh của một số loại nội dung bị cấm theo quy tắc của Facebook, nhưng không phải là lời lẽ căm thù. Bản phát hành vào thứ Ba cho thấy số bài viết bạo lực giảm đi kể từ mùa hè trước đó. Phần về lời lẽ căm thù nói rằng Facebook “vẫn đang phát triển một chỉ số toàn cầu.”
Các con số thiếu sót che khuất kích thước thực sự của vấn đề lời lẽ căm tục trên mạng xã hội. Caitlin Carlson, giáo sư cùng hợp tác tại Đại học Seattle, nói rằng 9,6 triệu bài viết bị gỡ bỏ vì lời lẽ căm tục trông có vẻ quá nhỏ so với mạng lưới người dùng rộng lớn của Facebook và quan sát của người dùng về nội dung đáng lo ngại. “Không khó để tìm thấy,” Carlson nói.
Carlson công bố kết quả vào tháng 1 từ một thử nghiệm mà cô và một đồng nghiệp thu thập hơn 300 bài viết trên Facebook mà có vẻ vi phạm quy tắc lời lẽ căm tục của nền tảng và báo cáo chúng qua các công cụ dịch vụ. Chỉ có khoảng một nửa số bài viết cuối cùng bị gỡ bỏ; các nhà kiểm duyệt của công ty có vẻ nghiêm ngặt hơn trong việc thực hiện các trường hợp mạng lưới từ ngôn từ phân biệt chủng tộc và dân tộc hơn là sự phân biệt đối xử giới tính.
Facebook nói rằng nội dung được đánh dấu bởi thuật toán của họ sẽ được xem xét theo cùng cách mà các bài đăng được người dùng báo cáo. Quá trình này quyết định liệu có gỡ bỏ nội dung hay thêm cảnh báo và có thể liên quan đến nhà kiểm duyệt con người hoặc phần mềm một mình. Thứ Sáu, Facebook đã đồng ý giải quyết 52 triệu đô la với các nhà kiểm duyệt cho rằng việc xem xét nội dung cho công ty khiến họ phát triển PTSD. Tin về việc giải quyết này trước đó đã được báo cáo bởi The Verge.
Báo cáo về việc kiểm duyệt của Facebook là một phần của nỗ lực minh bạch gần đây cũng bao gồm một bảng các chuyên gia bên ngoài mới có quyền lật ngược quyết định kiểm duyệt của công ty. Công ty đã thành lập những dự án đó sau những scandal như thông tin sai lệch do Nga điều hành trong cuộc bầu cử đã thúc đẩy các nhà lập pháp ở Mỹ và nơi khác xem xét các ràng buộc chính phủ mới đối với các nền tảng xã hội.
Carlson cho biết các thông tin tiết lộ của Facebook dường như được dự định để cho thấy công ty có thể tự quản lý, nhưng các báo cáo này là không đầy đủ. “Để có thể có cuộc trò chuyện về điều này, chúng ta cần có các con số,” cô nói. Khi được hỏi tại sao công ty không báo cáo sự phổ biến của lời lẽ căm tục, người phát ngôn của công ty trỏ vào một ghi chú trong báo cáo nói rằng phương pháp đo của họ đang “dần mở rộng để bao gồm nhiều ngôn ngữ và vùng lãnh thổ hơn, để tính đến bối cảnh văn hóa và sự tinh tế cho từng ngôn ngữ cụ thể.”
Định nghĩa và phát hiện lời lẽ căm tục là một trong những thách thức chính trị và kỹ thuật lớn nhất đối với Facebook và các nền tảng khác. Ngay cả đối với con người, việc ra quyết định này khó hơn so với nội dung tình dục hoặc khủng bố và có thể liên quan đến các vấn đề về nhạy cảm văn hóa. Việc tự động hóa điều đó là rắc rối, vì trí tuệ nhân tạo cách xa hiểu biết của con người về văn bản; công việc trên các thuật toán hiểu ý nghĩa tinh tế được truyền đạt bằng văn bản và ảnh cùng nhau chỉ mới bắt đầu.
Schroepfer cho biết vào thứ Ba rằng Facebook đã nâng cấp các thuật toán phát hiện lời lẽ căm tục của mình với sự giúp đỡ từ nghiên cứu gần đây về việc áp dụng phần mềm học máy vào ngôn ngữ. Nhiều công ty công nghệ đều đang làm việc lại các hệ thống xử lý ngôn ngữ của họ, như công cụ tìm kiếm của Google, để tích hợp các cải tiến đáng kể trong khả năng của thuật toán giải quyết các vấn đề ngôn ngữ như trả lời câu hỏi hoặc làm rõ cách diễn đạt mơ hồ.
Ông cũng cho biết những cải tiến đó không khiến công nghệ trở nên gần như hoàn hảo. “Tôi không ngây thơ,” Schroepfer nói. “Tôi nghĩ con người sẽ luôn có vai trò quan trọng trong tương lai không xác định.”
Để tăng cường việc trợ giúp của trí tuệ nhân tạo cho những con người bị rơi vào vòng lặp đó, Facebook cho biết vào thứ Ba rằng họ đã tạo ra một bộ sưu tập hơn 10.000 meme về lời lẽ căm tục kết hợp hình ảnh và văn bản để thúc đẩy nghiên cứu mới. Công ty sẽ trao giải thưởng trị giá 100.000 đô la cho các nhóm nghiên cứu tạo ra phần mềm mã nguồn mở tốt nhất có khả năng phát hiện các meme gây căm ghét khi chúng được kết hợp với các ví dụ vô hại.
- Làm thế nào vũ trụ cố gắng giết bạn và làm bạn xấu đi
- 22 mẹo Animal Crossing để nâng cao trò chơi trên hòn đảo của bạn
- Toán học đảng phái kỳ lạ của phiếu bầu qua thư
- Máy bay vẫn đang bay, nhưng việc phục hồi sau Covid-19 sẽ khó khăn
- Ngôn ngữ hình ảnh chung của đại dịch năm 1918 và 2020
- 👁 Trí tuệ nhân tạo phát hiện một phương pháp điều trị tiềm năng cho Covid-19. Ngoài ra: Nhận tin tức trí tuệ nhân tạo mới nhất
- ✨ Tối ưu hóa cuộc sống tại nhà của bạn với các sản phẩm tốt nhất từ đội ngũ Gear của chúng tôi, từ robot hút bụi đến nệm giá cả phải chăng đến loa thông minh
