Người Làm Việc Dưới Tuổi Đang Huấn Luyện Trí Tuệ Nhân Tạo

Như hầu hết các em nhỏ cùng tuổi, Hassan, 15 tuổi, đã dành rất nhiều thời gian trực tuyến. Trước đại dịch, anh ấy thích chơi bóng đá với các em nhỏ địa phương ở quê nhà Burewala, ở vùng Punjab của Pakistan. Nhưng lockdown Covid khiến anh trở thành một người hẻo lánh, gắn bó với điện thoại di động của mình. “Tôi chỉ ra khỏi phòng khi cần ăn cái gì đó,” Hassan, nay đã 18 tuổi, nói và yêu cầu được xác định dưới một bí danh vì sợ bị kiện pháp lý. Nhưng khác với hầu hết các thanh thiếu niên, anh ấy không lướt TikTok hoặc chơi game. Từ phòng ngủ thơ ấu của mình, học sinh trung học này đang làm việc trong chuỗi cung ứng trí tuệ nhân tạo toàn cầu, tải lên và đánh dấu dữ liệu để huấn luyện thuật toán cho một số công ty trí tuệ nhân tạo lớn nhất thế giới.
Dữ liệu thô được sử dụng để huấn luyện thuật toán học máy được đánh dấu trước bởi con người, và cần cả sự xác nhận của con người để đánh giá độ chính xác của chúng. Việc đánh dấu dữ liệu này có thể từ những nhiệm vụ đơn giản - như xác định hình ảnh đèn đường, ví dụ, hoặc so sánh các sản phẩm thương mại điện tử tương tự - đến những nhiệm vụ phức tạp, chẳng hạn như kiểm duyệt nội dung, nơi người lao động phân loại nội dung có hại trong dữ liệu được thu thập từ mọi ngóc ngách của internet. Những nhiệm vụ này thường được giao cho các công nhân tự do, qua các nền tảng thu thập đám đông trực tuyến như Toloka, nơi Hassan bắt đầu sự nghiệp của mình.
Một người bạn giới thiệu anh đến trang web, hứa hẹn công việc bất cứ lúc nào, ở bất cứ đâu. Anh phát hiện rằng một giờ lao động sẽ đem lại cho anh khoảng 1 đến 2 đô la, nói anh, nhiều hơn cả mức lương tối thiểu quốc gia, vào thời điểm đó là khoảng 0,26 đô la. Mẹ anh là người nội trợ và bố anh là một công nhân cơ khí. “Bạn có thể nói rằng tôi thuộc một gia đình nghèo,” anh nói. Khi đại dịch bùng phát, anh cần việc làm hơn bao giờ hết. Bị hạn chế trong nhà, trực tuyến và nổi loạn, anh đã tìm hiểu và phát hiện ra rằng Toloka chỉ là cái băng dưới đỉnh tảng.
“Trí tuệ nhân tạo được trình bày như một hộp ma thuật có thể làm mọi thứ,” nói Saiph Savage, giám đốc Civic AI Lab của Đại học Northeastern. “Người ta đơn giản không biết rằng có những người lao động con người đằng sau màn hình.”
Ít nhất một số người lao động con người đó là trẻ em. Các nền tảng yêu cầu người lao động phải trên 18 tuổi, nhưng Hassan đơn giản chỉ nhập chi tiết của một người thân và sử dụng phương thức thanh toán tương ứng để tránh kiểm tra - và anh không phải là người duy nhất làm như vậy. MYTOUR nói chuyện với ba người lao động khác ở Pakistan và Kenya, họ nói họ cũng tham gia các nền tảng khi còn nhỏ tuổi, và tìm thấy bằng chứng cho thấy hành vi này là phổ biến.
“Khi tôi vẫn còn ở trung học, rất nhiều thanh thiếu niên thảo luận về công việc trực tuyến và cách họ tham gia bằng ID của cha mẹ,” nói một người lao động ở Kenya, tham gia Appen khi mới 16 tuổi, người yêu cầu giữ thông tin ẩn danh. Sau giờ học, anh và bạn bè sẽ đăng nhập để hoàn thành các nhiệm vụ chú thích vào giờ khuya, thường là tám giờ trở lên.
Appen từ chối cung cấp bình luận có thể liên kết.
“Nếu chúng tôi nghi ngờ một người dùng đã vi phạm Thỏa thuận Người dùng, Toloka sẽ thực hiện kiểm tra danh tính và yêu cầu một chứng minh nhân dân và một bức ảnh người dùng cầm giữ chứng minh nhân dân,” Geo Dzhikaev, trưởng phòng hoạt động Toloka, nói.
Do sức hút toàn cầu vào trí tuệ nhân tạo, dự kiến ngành công nghiệp gán nhãn và thu thập dữ liệu toàn cầu sẽ phát triển lên trên 17,1 tỷ đô la vào năm 2030, theo Grand View Research, một công ty nghiên cứu thị trường và tư vấn. Các nền tảng thu thập đám đông như Toloka, Appen, Clickworker, Teemwork.AI và OneForma kết nối hàng triệu công nhân tự do ở khu vực nam toàn cầu với các công ty công nghệ đặt tại Silicon Valley. Các nền tảng đăng nhiệm vụ siêu nhỏ từ khách hàng công nghệ của họ, trong đó có Amazon, Microsoft Azure, Salesforce, Google, Nvidia, Boeing và Adobe. Nhiều nền tảng cũng hợp tác với nền tảng dịch vụ dữ liệu riêng của Microsoft, Hệ thống Tính nhân văn Toàn cầu (UHRS).
Những người lao động này chủ yếu đặt tại Đông Phi, Venezuela, Pakistan, Ấn Độ và Philippines—mặc dù cũng có những người lao động ở các trại tị nạn, họ gán nhãn, đánh giá và tạo dữ liệu. Người lao động được trả tiền theo nhiệm vụ, với mức thù lao dao động từ một xu đến vài đô la—mặc dù phần trên được coi là một viên ngọc quý hiếm, người lao động nói. “Bản chất của công việc thường cảm thấy như nô lệ kỹ thuật số—nhưng đó là một điều cần thiết để kiếm sống,” Hassan nói, người cũng đang làm việc cho Clickworker và Appen.
Đôi khi, người lao động được yêu cầu tải lên âm thanh, hình ảnh và video, góp phần vào các bộ dữ liệu được sử dụng để huấn luyện trí tuệ nhân tạo. Người lao động thường không biết chính xác cách nộp của họ sẽ được xử lý, nhưng những cái này có thể khá cá nhân: Trên tab công việc của người lao động Clickworker, một nhiệm vụ nói: “Hãy cho chúng tôi xem em bé / trẻ của bạn! Hãy giúp đào tạo trí tuệ nhân tạo bằng cách chụp 5 bức ảnh của em bé / trẻ của bạn!” giá 2 euro (2,15 đô la). Nhiệm vụ kế tiếp nói: “Hãy để thanh thiếu niên của bạn (từ 13-17 tuổi) tham gia dự án tự sướng thú vị!”
Anh làm việc trên trang mỗi ngày, chủ yếu hoàn thành nhiệm vụ “Phần mở rộng Kiểm thử Kịch bản Tổng quát của Microsoft”. Điều này liên quan đến việc kiểm thử độ chính xác của trang chủ và công cụ tìm kiếm. Nói cách khác, việc chọn “ưu đãi ô tô” trên trang chủ MSN có đưa ra hình ảnh ô tô không? Việc tìm kiếm “mèo” trên Bing có hiển thị hình ảnh mèo không? Anh kiếm được từ $1 đến $3 mỗi ngày, nhưng anh thấy công việc không chỉ nhàm chán mà còn khiến anh tức giận. Đôi khi anh phải làm việc 10 giờ chỉ để kiếm $1, vì anh phải thực hiện đào tạo không lương để truy cập vào một số nhiệm vụ. Ngay cả khi anh vượt qua bài tập, có thể không có nhiệm vụ để hoàn thành; hoặc nếu anh vi phạm thời gian, họ sẽ đình chỉ tài khoản của anh, anh nói. Sau đó, một cách bất ngờ, anh bị cấm thực hiện nhiệm vụ có thu nhập cao nhất của mình - điều mà những người lao động nói xảy ra thường xuyên. Cấm có thể xảy ra vì nhiều lý do, như cung cấp câu trả lời sai, trả lời quá nhanh, hoặc trả lời không giống như mẫu trung bình của những người lao động khác. Anh đã kiếm được tổng cộng $70. Gần như đủ để dẫn cô bạn gái của anh đi du lịch, vì vậy Awais đã đăng xuất vĩnh viễn.
Clickworker không phản hồi các yêu cầu ý kiến. Microsoft từ chối bình luận.
“Trong một số trường hợp, sau khi người dùng hoàn thành đào tạo, lượng phản hồi đã đạt đến cho dự án đó và nhiệm vụ không còn khả dụng nữa,” Dzhikaev nói. “Tuy nhiên, nếu có các nhiệm vụ tương tự khác trở nên khả dụng, họ sẽ có thể tham gia mà không cần đào tạo thêm.”
Những nghiên cứu cho biết họ đã tìm thấy bằng chứng về những người lao động dưới 18 tuổi trong ngành công nghiệp trí tuệ nhân tạo ở những nơi khác trên thế giới. Julian Posada, giáo sư trợ giảng của Khoa Nghiên cứu Mỹ tại Đại học Yale, nghiên cứu về lao động con người và sản xuất dữ liệu trong ngành công nghiệp trí tuệ nhân tạo, nói rằng ông đã gặp những người lao động ở Venezuela gia nhập các nền tảng khi còn là người vị thành niên.
Vượt qua kiểm tra tuổi có thể khá đơn giản. Các nền tảng linh hoạt nhất như Clickworker và Toloka chỉ đơn giản yêu cầu người làm công việc khai báo họ đã trên 18 tuổi; những nền tảng an toàn nhất như Remotasks sử dụng công nghệ nhận diện khuôn mặt để so khớp với chứng minh nhân dân. Nhưng thậm chí điều đó cũng có thể bị lừa, theo Posada, đề cập đến một người làm công việc cho biết anh ta chỉ cần đưa điện thoại vào mặt bà để vượt qua kiểm tra. Chia sẻ một tài khoản duy nhất trong các gia đình là một cách khác mà người vị thành niên tiếp cận công việc, theo Posada. Anh phát hiện ra rằng ở một số gia đình Venezuela, khi bố mẹ nấu ăn hoặc chạy việc, trẻ em đăng nhập để hoàn thành các nhiệm vụ. Anh nói rằng một gia đình gồm 6 người mà anh gặp, với trẻ em chỉ 13 tuổi, tất cả khẳng định họ chia sẻ một tài khoản. Họ quản lý ngôi nhà của họ như một nhà máy, Posada nói, để hai thành viên gia đình ngồi tại máy tính làm việc trên việc đánh dấu dữ liệu tại bất kỳ điểm nào. “Lưng họ sẽ đau vì họ đã ngồi lâu quá. Vì vậy, họ sẽ nghỉ ngơi, và sau đó, trẻ em sẽ thay thế,” anh nói.
Khoảng cách về mặt vật lý giữa những người đào tạo trí tuệ nhân tạo và những công ty công nghệ ở cuối chuỗi cung ứng - “sự mất vị trí của internet,” Posada mô tả nó - tạo ra một tình huống trong đó toàn bộ lực lượng lao động thực sự trở nên vô hình, được quản lý theo một bộ quy tắc khác nhau hoặc không có quy tắc nào.
Thiếu sự giám sát đối với người lao động thậm chí có thể ngăn chặn khách hàng biết liệu họ có giữ thu nhập hay không. Một người dùng Clickworker ở Ấn Độ, yêu cầu giữ danh tính không được tiết lộ để tránh bị cấm truy cập trang web, cho biết anh ta “tuyển dụng” 17 người làm việc trên UHRS tại một văn phòng, cung cấp cho họ máy tính, điện thoại di động và internet, đổi lại là một nửa thu nhập của họ. Mặc dù người làm việc của anh ta có độ tuổi từ 18 đến 20, nhưng do Clickworker không yêu cầu xác nhận tuổi, anh ta biết có người trẻ dùng nền tảng.
Ở những góc tối của ngành công nghiệp đám đông, việc sử dụng lao động trẻ em trở nên rõ ràng.
Dịch vụ giải mã Captcha (Completely Automated Public Turing test to tell Computers and Humans Apart), nơi các nền tảng đám đông trả tiền cho con người để giải quyết captchas, là một phần ít được hiểu trong hệ sinh thái trí tuệ nhân tạo. Captchas được thiết kế để phân biệt giữa bot và con người - ví dụ đáng chú ý nhất là reCaptcha của Google, yêu cầu người dùng nhận diện đối tượng trong hình ảnh để vào trang web. Mục đích chính xác của các dịch vụ trả tiền cho người giải quyết captchas vẫn là một bí mật đối với các nhà nghiên cứu, theo Posada. “Nhưng điều tôi có thể xác nhận là nhiều công ty, bao gồm cả reCaptcha của Google, sử dụng những dịch vụ này để huấn luyện mô hình trí tuệ nhân tạo,” anh ta nói. “Do đó, những người làm việc này gián tiếp đóng góp vào sự tiến bộ của trí tuệ nhân tạo.”
Google không phản hồi đến yêu cầu bình luận đúng thời điểm xuất bản.
Có ít nhất 152 dịch vụ hoạt động, chủ yếu đặt ở Trung Quốc, với hơn nửa triệu người làm việc trong thị trường reCaptcha ngầm, theo một nghiên cứu năm 2019 của các nhà nghiên cứu từ Đại học Zhejiang ở Hangzhou.
“Công việc ổn định cho mọi người. Mọi nơi,” một dịch vụ, Kolotibablo, nói trên trang web của mình. Công ty có một trang web quảng bá dành cho việc giới thiệu các đánh giá từ người làm việc, bao gồm hình ảnh của trẻ em từ khắp nơi trên thế giới. Trong một trường hợp, một bé trai Indonesia mỉm cười và cho thấy chiếc bánh sinh nhật thứ 11 của mình trước camera. “Tôi rất vui vì có thể tăng tiết kiệm cho tương lai,” một người viết, không quá 7 hoặc 8 tuổi. Một cô gái 14 tuổi trong chiếc váy Hello Kitty dài chia sẻ hình ảnh về bàn làm việc của mình: một laptop trên một bàn học hồng, có chủ đề Barbie.
Không phải mọi người làm việc mà MYTOUR phỏng vấn đều cảm thấy bất mãn với các nền tảng. Ở tuổi 17, hầu hết bạn bè của Younis Hamdeen đang làm công việc phục vụ. Nhưng thiếu niên người Pakistan quyết định tham gia UHRS qua Appen, sử dụng nền tảng này từ ba đến bốn giờ mỗi ngày, cùng với việc học trung học, kiếm được tới $100 mỗi tháng. So sánh sản phẩm được liệt kê trên Amazon là nhiệm vụ có lợi nhuận cao nhất mà anh gặp phải. “Tôi thích làm việc cho nền tảng này,” Hamdeen, nay đã 18 tuổi, nói, vì anh được thanh toán bằng đô la Mỹ - điều hiếm có ở Pakistan - và do đó hưởng lợi từ tỷ giá hối đoái thuận lợi.
Nhưng sự thực là tiền lương cho công việc này rất thấp so với mức lương của nhân viên nội trú của các công ty công nghệ, và rằng các lợi ích của công việc này chảy theo một hướng - từ miền Nam toàn cầu đến miền Bắc toàn cầu, dẫn đến những sự tương đồng không thoải mái. “Chúng ta phải xem xét loại chủ nghĩa đế quốc đang được thúc đẩy với loại công việc này,” Savage từ Civic AI Lab nói.
Hassan gần đây đã được chấp nhận vào chương trình đại học về công nghệ phòng thí nghiệm y khoa. Các ứng dụng vẫn là nguồn thu nhập duy nhất của anh, làm việc từ 8 giờ sáng đến 6 giờ chiều, tiếp theo là từ 2 giờ sáng đến 6 giờ sáng. Tuy nhiên, thu nhập của anh chỉ còn $100 mỗi tháng, vì nhu cầu về nhiệm vụ vượt quá cung ứng, khi có nhiều người lao động tham gia kể từ đợt dịch.
Anh than phiền rằng nhiệm vụ UHRS có thể chỉ trả 1 xu. Ngay cả đối với những công việc có thu nhập cao, như một số nhiệm vụ truyền thông xã hội đôi khi trên Appen, lượng thời gian anh cần phải bỏ ra để làm nghiên cứu không lương có nghĩa là anh phải làm việc năm hoặc sáu giờ để hoàn thành một giờ làm việc thực tế, tất cả để kiếm $2, anh nói.
“Đó là nô lệ số,” nói Hassan.