Làm thế nào Hệ thống phúc lợi của Đan Mạch đã trở thành một ác mộng theo dõi

Trong một góc văn phòng trang trí ít ỏi của Cơ quan Lợi ích Công cộng Đan Mạch, ngồi một trong những người ảnh hưởng mạnh mẽ nhất mà ít người biết đến. Annika Jacobsen là trưởng đơn vị khai thác dữ liệu của cơ quan, mà trong suốt 8 năm qua, đã tiến hành một cuộc thử nghiệm rộng lớn về tự động hóa hành chính. Cô blunt và thường kết thúc câu nói của người khác, Jacobsen rõ ràng về nhiệm vụ của mình: “Tôi ở đây để bắt gian lận.”
Cơ quan Lợi ích Công cộng của Đan Mạch có hàng trăm người làm việc giám sát một trong những hệ thống phúc lợi có nguồn lực tốt nhất thế giới. Đất nước chi tiêu 26% GDP của mình cho các chương trình lợi ích — nhiều hơn cả Thụy Điển, Hoa Kỳ và Vương quốc Anh. Được đánh giá là một ví dụ hàng đầu về cách các chính phủ có thể hỗ trợ công dân yếu đuối nhất của họ. Bernie Sanders, thượng nghị sĩ Hoa Kỳ, gọi nước Bắc Âu với 6 triệu dân là một mô hình cho cách các quốc gia nên tiếp cận phúc lợi.
Nhưng trong thập kỷ qua, quy mô chi tiêu cho lợi ích của Đan Mạch đã bị đặt dưới sự quan sát chặt chẽ, và tình trạng gian lận lợi ích được xem là ưu tiên hàng đầu của chính trị nước này. Với dữ liệu đáng ngờ về lượng gian lận lợi ích diễn ra, các chính trị gia bảo thủ đã biến mạng lưới an sinh nổi tiếng của Đan Mạch thành một chiến trường chính trị gây tranh cãi.
Trong đám đông chính trị hữu bề trái của đất nước, đã trở thành một niềm tin tuyên thệ rằng Đan Mạch mỗi năm mất hàng trăm triệu euro do gian lận trợ cấp. Năm 2011, KMD, một trong những công ty IT lớn nhất của Đan Mạch, ước tính rằng tới 5% số tiền trợ cấp xã hội tại đất nước này là gian lận. Các ước tính của KMD sẽ làm cho quốc gia Bắc Âu này trở nên nổi bật, và các kết quả của nó đã bị chỉ trích bởi một số học giả. Ở Pháp, ước tính là gian lận chiếm 0,39% tổng số tiền trợ cấp được trả. Một ước tính tương tự được thực hiện ở Hà Lan vào năm 2016 bởi đài truyền hình RTL cho thấy số tiền gian lận trung bình mỗi lần trả tiền trợ cấp là €17 ($18), hoặc chỉ 0,2% tổng số tiền trợ cấp đã trả.
Quan điểm về sự gian lận trợ cấp rộng rãi đã giúp Jacobsen xây dựng một trong những hệ thống phát hiện gian lận phức tạp và có phạm vi rộng lớn nhất thế giới. Cô đã tăng ba lần số cơ sở dữ liệu của cơ quan mà cô có thể truy cập từ ba lên chín, tập hợp thông tin về thuế, nhà ở, ô tô, mối quan hệ, nhà tuyển dụng, du lịch và quốc tịch của mọi người. Cơ quan của cô đã phát triển một loạt mô hình học máy để phân tích dữ liệu này và dự đoán ai có thể đang gian lận hệ thống.
Các tài liệu được Lighthouse Reports và MYTOUR thu thập thông qua yêu cầu tự do thông tin cho thấy cách Đan Mạch đang xây dựng các thuật toán để phân loại người nhận trợ cấp dựa trên mọi thứ từ quốc tịch đến người họ có thể ngủ cùng vào ban đêm. Chúng bóc lột một hệ thống nơi công nghệ và chính trị đã liên kết, với những hậu quả có thể nguy hiểm.
Các nhóm nhân quyền Đan Mạch như Justitia mô tả sự mở rộng của cơ quan này là “giám sát có hệ thống” và không cân xứng với quy mô của gian lận trợ cấp. Hệ thống của Đan Mạch vẫn chưa gặp khó khăn dưới luật EU. Việc các thí nghiệm với học máy của đất nước có vượt quá ranh giới pháp lý là một câu hỏi có thể được trả lời bởi Đạo luật Trí tuệ Nhân tạo tiêu biểu của Liên minh châu Âu, dự luật mà nhằm bảo vệ quyền con người trước các công nghệ mới nổi.
Cuộc tranh luận về phúc lợi ở Đan Mạch thay đổi vào tháng 10 năm 2012, khi các quan chức yêu cầu cư dân gửi hình ảnh của những kẻ lừa đảo trợ cấp nghi ngờ trong khu vực địa phương của họ. Lời kêu gọi đã khiến một số nhà bình luận thuận trái thông báo về một “chiến tranh với phúc lợi,” và đến khi Đảng Nhân dân Đan Mạch cực hữu—mà phê phán chính phủ vì “kéo” người nhập cư bằng các quyền lợi trợ cấp—tăng động trong các cuộc thăm dò ý kiến.
Trong vòng một năm, công ty tư vấn Deloitte phát hành một bảng kiểm tra về kiểm soát gian lận trợ cấp ở Đan Mạch, phát hiện chúng không đủ để phát hiện gian lận trong một hệ thống phúc lợi ngày càng số hóa. Các kiểm toán viên, được ủy quyền bởi bộ tài chính Đan Mạch, ước tính “tiết kiệm ngắn hạn” của một “cơ sở hạ tầng xác định rủi ro mới” là 126 triệu euro.
Tầm nhìn của Deloitte được hiện thực hóa vào tháng 2 năm 2015 với một dự luật cải cách hệ thống phúc lợi Đan Mạch. Nó đề xuất một sự mở rộng lớn của quyền lực của Cơ quan Lợi ích Công cộng, bao gồm khả năng lưu trữ và thu thập dữ liệu về hàng triệu người, truy cập vào cơ sở dữ liệu của các cơ quan khác, và thậm chí yêu cầu dữ liệu từ các chính phủ nước ngoài. Ở thời điểm đó, nó hầu như không được chú ý, nó cũng kêu gọi việc tạo ra một “đơn vị khai thác dữ liệu” để “kiểm soát gian lận trợ cấp xã hội.”
Dự luật được ủng hộ bởi tất cả các đảng chính ở Đan Mạch và trở thành luật vào tháng 4 năm 2015. Tháng đó, Jacobsen rời công việc IT trong lĩnh vực tài chính để trở thành người đầu tiên của Đan Mạch đứng đầu đơn vị khai thác dữ liệu và phát hiện gian lận.
Khi Jacobsen bắt đầu làm việc, chính trị gia bảo thủ Troels Lund Poulsen lên nắm quyền vào tháng 6 năm 2015 làm Bộ trưởng lao động mới của Đan Mạch. Ông thực hiện kiểm tra sân bay ngẫu nhiên để bắt kẻ lừa đảo trợ cấp đi nghỉ mà không thông báo, và đề xuất cho đơn vị khai thác dữ liệu mới quyền truy cập vào hóa đơn điện và nước của người nhận trợ cấp để phát hiện nơi họ đang sống. Ông được sự ủng hộ ngày càng lớn, với một thành phố đã yêu cầu dữ liệu từ các trạm điện thoại di động để theo dõi nơi người nhận trợ cấp đang ở. “Đó là về chính trị,” Poulsen nói vào tháng 3 năm 2018. “Đối với tôi, quan trọng là gửi một tín hiệu rõ ràng rằng chúng tôi sẽ không chấp nhận sự lừa đảo và gian lận xã hội.”
Những người chỉ trích Jacobsen đã buộc tội đơn vị của cô thực hiện giám sát hàng loạt, nhưng cô khẳng định rằng có những biện pháp bảo vệ rõ ràng ngăn chặn việc vượt quá quyền lực. Jacobsen nói rằng thuật toán của cô thực sự không hủy bỏ các quyền lợi—chúng chỉ đánh dấu những người nghi ngờ. Cuối cùng, quyết định cuối cùng là do một nhà điều tra gian lận con người quyết định, và công dân có quyền khiếu nại quyết định của họ. “Bạn không bị tội chỉ vì chúng tôi chỉ ra bạn. Luôn có một người sẽ xem xét dữ liệu của bạn,” cô nói.
Hầu hết cư dân Đan Mạch bị đánh dấu để điều tra đều được xác định vô tội. Trong gần 50,000 trường hợp được chọn bởi đơn vị khai thác dữ liệu vào năm 2022, 4,000, hoặc 8%, dẫn đến một hình phạt nào đó. Trong những trường hợp phát hiện có sai phạm, đơn vị khai thác dữ liệu đã thu hồi được 23,1 triệu euro—một lợi nhuận đáng kể so với ngân sách hàng năm là 3,1 triệu euro.
Tuy nhiên, quy mô và phạm vi của việc thu thập dữ liệu ở Đan Mạch đã bị Viện Nhân quyền Đan Mạch, một tổ chức giám sát độc lập về nhân quyền, và Cơ quan Bảo vệ Dữ liệu Đan Mạch, một cơ quan công cộng thực thi các quy định về quyền riêng tư, chỉ trích. Justitia đã so sánh Cơ quan Lợi ích Công cộng với Cơ quan An ninh Quốc gia ở Hoa Kỳ, và cho rằng việc theo dõi số hóa hàng triệu cư dân Đan Mạch của nó là vi phạm quyền riêng tư của họ.
Jacobsen cho biết việc sử dụng dữ liệu của cơ quan là tương xứng theo luật bảo vệ dữ liệu châu Âu, và ngăn chặn sai sót và gian lận là quan trọng để duy trì niềm tin vào hệ thống phúc lợi. Cơ quan Lợi ích Công cộng cũng đang tìm cách để thuật toán của họ kiểm tra công dân từ sớm hơn trong quy trình, khi họ đầu tiên đăng ký nhận trợ cấp, để tránh tình huống phải trả lại số tiền lớn. “Hầu hết công dân đều trung thực; tuy nhiên, luôn có một số công dân cố gắng lấy trợ cấp mà họ không được phép,” Jacobsen nói.
Jacobsen cũng khẳng định rằng học máy công bằng hơn so với các phương pháp analog. Những gợi ý nặc danh về những kẻ lừa đảo trợ cấp tiềm ẩn là không đáng tin cậy, cô khẳng định. Năm 2017, chúng chiếm 14% trong số các trường hợp được chọn để điều tra bởi các quan chức gian lận địa phương, trong khi các trường hợp từ đơn vị dữ liệu của cô chiếm 26%. Điều đó có nghĩa là đơn vị của cô hiệu quả hơn so với gợi ý nặc danh, nhưng gần một nửa các trường hợp mà các nhà điều tra địa phương quyết định tiếp tục đến từ những dẫn dắt của họ. Việc chọn ngẫu nhiên cũng là không công bằng, cô khẳng định, vì điều này đồng nghĩa với việc đặt gánh nặng lên người dân khi không có cơ sở nghi ngờ. “[Những người phê phán] nói rằng khi máy móc đang nhìn vào dữ liệu, nó đang xâm phạm công dân, [trong khi] tôi có thể nghĩ đó là sự xâm phạm lớn khi nhìn vào công dân ngẫu nhiên,” Jacobsen nói. “Việc xâm phạm công dân là gì thực sự? Có phải là xâm phạm khi bạn ở trong bụng máy móc, chạy quanh trong đó không?”
Đan Mạch không phải là nơi duy nhất chuyển sang thuật toán dưới áp lực chính trị để chống lại gian lận trợ cấp. Pháp đã áp dụng công nghệ này vào năm 2010, Hà Lan vào năm 2013, Ireland vào năm 2016, Tây Ban Nha vào năm 2018, Ba Lan vào năm 2021, và Ý vào năm 2022. Nhưng Hà Lan đã cảnh báo rõ nhất về sự vượt quá về mặt công nghệ. Năm 2021, một vụ bê bối trợ cấp chăm sóc trẻ em, trong đó 20,000 gia đình bị buộc tội sai lầm, dẫn đến việc toàn bộ chính phủ Hà Lan từ chức. Điều này xảy ra sau khi các quan chức hiểu lầm nhỏ, như mất chữ ký, làm chứng cứ của gian lận, và buộc người nhận trợ cấp phải trả lại hàng nghìn euro họ đã nhận làm trợ cấp.
Khi chi tiết về vụ scandal ở Hà Lan xuất hiện, phát hiện rằng một thuật toán đã chọn hàng ngàn phụ huynh—gần 70% trong số họ là người nhập cư thế hệ đầu hoặc thứ hai—để điều tra. Hệ thống đã bị bỏ qua sau khi Cơ quan Bảo vệ Dữ liệu Hà Lan phát hiện rằng nó đã sử dụng quốc tịch một cách bất hợp pháp, điều mà Tổ chức Quốc tế Amnesty sau này so sánh với “phân loại dân tộc số bằng phương tiện số.”
Dự luật AI của EU sẽ cấm bất kỳ hệ thống nào thuộc phạm vi của luật lệ đó “tận dụng nhược điểm của một nhóm cụ thể,” bao gồm những người yếu đuối về tình hình tài chính của họ. Các hệ thống như của Jacobsen, ảnh hưởng đến quyền truy cập của công dân vào các dịch vụ công cộng cần thiết, cũng có thể được đặt nhãn là “rủi ro cao” và phải tuân thủ các yêu cầu nghiêm ngặt, bao gồm các nghĩa vụ minh bạch và yêu cầu “mức độ chính xác cao.”
Các tài liệu thu được bởi Lighthouse Reports và MYTOUR có vẻ chỉ ra rằng hệ thống của Đan Mạch đi xa hơn so với hệ thống làm sụp đổ chính phủ Hà Lan. Chúng tiết lộ cách thuật toán của Đan Mạch sử dụng các biến số như quốc tịch, việc sử dụng đã được đặt bằng công bằng với phân loại dân tộc.
Một trong những thuật toán phát hiện gian lận của Đan Mạch cố gắng xác định cách mà ai đó có thể liên kết với một quốc gia không thuộc EU. Các tài liệu được che đậy mạnh mẽ cho thấy rằng, để thực hiện điều này, hệ thống theo dõi xem người nhận trợ cấp hay “quan hệ gia đình” của họ đã từng di cư từ Đan Mạch chưa. Hai biến số khác ghi lại quốc tịch của họ và liệu họ đã từng là công dân của bất kỳ quốc gia nào khác ngoài Đan Mạch hay không.
Jacobsen khẳng định quốc tịch chỉ là một trong nhiều biến số được thuật toán sử dụng, và người nhận trợ cấp sẽ không được đánh dấu trừ khi họ sống ở một “địa chỉ đáng nghi” và hệ thống không thể tìm thấy mối liên kết với Đan Mạch.
Các tài liệu cũng cho thấy rằng đơn vị khai thác dữ liệu của Đan Mạch theo dõi tình trạng hôn nhân, thời gian kết hôn, người họ sống chung với, kích thước nhà, thu nhập, liệu họ đã từng sống ở ngoài Đan Mạch, lịch sử cuộc gọi với Cơ quan Phúc lợi Công cộng và liệu con cái của họ có phải là cư dân Đan Mạch hay không.
Một biến số khác, “đối tác giả định,” được sử dụng để xác định liệu ai đó có mối quan hệ che giấu hay không, vì người độc thân nhận nhiều trợ cấp hơn. Điều này liên quan đến việc tìm kiếm dữ liệu về mối liên kết giữa người nhận trợ cấp và người cư trú ở Đan Mạch khác, chẳng hạn như liệu họ có sống chung ở cùng một địa chỉ hay có nuôi dưỡng con cái cùng nhau hay không.
“Hệ thống thuật toán này, và sự giám sát và theo dõi rất xâm lấn của những người nhận trợ cấp, dựa trên một nghi ngờ sâu sắc về người nghèo,” phát ngôn của Victoria Adelmant, Giám đốc Dự án Phúc lợi Số và Nhân quyền.
Dù mô hình học máy phức tạp và tất cả dữ liệu được tích lũy và xử lý, vẫn có một người phải đưa ra quyết định ở phần cuối cùng của các biện pháp kiểm soát gian lận. Đây là hệ thống an toàn, Jacobsen khẳng định, nhưng đây cũng là nơi đầu tiên mà những hệ thống này va chạm với thực tế.
Morten Bruun Jonassen là một trong những biện pháp an toàn này. Là một cựu cảnh sát, anh là người đứng đầu nhóm kiểm soát của Copenhagen, một nhóm các quan chức được giao nhiệm vụ đảm bảo rằng cư dân của thành phố được đăng ký đúng địa chỉ và nhận đúng trợ cấp. Anh đã làm việc cho bộ phận dịch vụ xã hội của thành phố trong 14 năm, đủ lâu để nhớ về thời kỳ trước khi thuật toán trở nên quan trọng như vậy—và đủ lâu để quan sát sự thay đổi trong cuộc trò chuyện quốc gia về phúc lợi.
Trong khi cuộc chiến chống gian lận trợ cấp vẫn được ưa chuộng chính trị tại Đan Mạch, Jonassen nói chỉ có “một số rất nhỏ” các trường hợp mà anh gặp phải liên quan đến gian lận thực sự. Dù đã đầu tư nhiều vào đó, đơn vị khai thác dữ liệu không phải là nguồn thông tin tốt nhất cho anh, và các trường hợp được đánh dấu bởi hệ thống của Jacobsen chỉ chiếm 13% trong số các trường hợp mà nhóm của anh điều tra—đúng một nửa so với trung bình quốc gia. Kể từ năm 2018, Jonassen và đơn vị của anh đã làm dịu dàng hơn so với các đơn vị khác ở Đan Mạch, mà thường khắt khe hơn với gian lận, anh nói. Trong một trường hợp được ghi lại vào năm 2019 bởi DR, đài truyền hình công cộng của Đan Mạch, một người nhận trợ cấp nói rằng nhà điều tra đã lục lọi trang mạng xã hội của cô để xem liệu cô có quan hệ tình cảm trước khi bị buộc tội sai trái về gian lận trợ cấp.
Mặc dù anh công nhận đơn vị khai thác dữ liệu của Jacobsen đã cố gắng cải thiện thuật toán, Jonassen vẫn chưa thấy sự cải thiện đáng kể đối với các trường hợp anh xử lý. “Cơ bản là không tốt hơn,” anh nói. Trong một cuộc khảo sát năm 2022 với các thành phố và thị trấn của Đan Mạch được thực hiện bởi đơn vị, các quan chức đánh giá sự hài lòng của họ với nó, trung bình, giữa 4 và 5 trên tổng số 7.
Jonassen cho biết những người đăng ký nhận trợ cấp nên nhận được những gì họ đang đủ điều kiện—không nhiều hơn, không ít hơn. Mặc dù quy mô của hệ thống tự động hóa của Jacobsen, anh bắt đầu nhiều cuộc điều tra dựa trên gợi ý từ các trường học và công nhân xã hội hơn là các trường hợp được đánh dấu bởi máy tính. Quan trọng nhất, anh nói, là anh làm việc chăm chỉ để hiểu rõ những người đăng ký nhận trợ cấp và những tình huống khó khăn mà họ đang phải đối mặt. “Nếu bạn chỉ nhìn vào thống kê và chỉ nhìn vào màn hình,” anh nói, “bạn không thấy rằng có những con người đằng sau đó.”
Báo cáo bổ sung của Daniel Howden, Soizic Penicaud, Pablo Jiménez Arandia và Htet Aung. Báo cáo được hỗ trợ bởi Học bổng Trách nhiệm Trí tuệ nhân tạo của Trung tâm Pulitzer và Trung tâm Nghiên cứu và Báo cáo Nghệ thuật.
