
Trong vòng hai năm qua, các nhà nghiên cứu tại Đại học Northwestern đã phân tích thói quen của hàng ngàn nhà khoa học, sử dụng Dropbox. Nhìn vào dữ liệu về thói quen chia sẻ thư mục của các nhà học thuật, họ phát hiện ra những hành vi hợp tác chung của các nhà khoa học thành công. Và vào thứ Sáu, họ công bố kết quả trong một bài viết cho Harvard Business Review.
Nghiên cứu nhanh chóng thu hút sự chú ý của giới học thuật, nhưng không phải vì lý do mà Dropbox và các nhà nghiên cứu đã hy vọng. Một câu đặc biệt thu hút sự chú ý của độc giả: “Dropbox cung cấp cho chúng tôi quyền truy cập vào dữ liệu liên quan đến thư mục dự án, chúng tôi đã tổng hợp và ẩn danh, của tất cả các nhà khoa học sử dụng nền tảng của nó trong giai đoạn từ tháng 5 năm 2015 đến tháng 5 năm 2017—một nhóm đại diện cho 1,000 trường đại học.” Viết bởi giáo sư Viện Nghiên cứu về Hệ thống Phức tạp Đại học Northwestern Adam Pah và Brian Uzzi và Quản lý Công nghiệp của Dropbox Rebecca Hinds, cách diễn đạt đó ngụ ý rằng Dropbox đã chuyển giao thông tin cá nhân có thể xác định được về hàng trăm nghìn khách hàng.
Đến thứ Ba, Harvard Business Review đã sửa phần đó của bài viết để nói rằng dữ liệu đã được ẩn danh và tổng hợp trước khi được chuyển giao cho các nhà nghiên cứu. “Trước khi cung cấp bất kỳ dữ liệu người dùng Dropbox nào cho các nhà nghiên cứu, Dropbox đã ẩn danh vĩnh viễn dữ liệu bằng cách làm cho mọi thông tin người dùng xác định không thể đọc được, bao gồm cả email cá nhân và ID thư mục được chia sẻ,” một người phát ngôn của Dropbox cho biết với Mytour. Nhưng trong khi hơn nửa tỷ người dùng của Dropbox có thể yên tâm rằng dữ liệu không ẩn danh của họ không dễ dàng được chia sẻ với các nhà nghiên cứu, sự đồng ý duy nhất mà Dropbox nhận được từ khách hàng tham gia nghiên cứu là sự đồng ý với chính sách bảo mật và điều khoản dịch vụ của nó, theo đại diện của Dropbox.
"Trước khi chia sẻ dữ liệu hoạt động với NICO, chúng tôi đã ngẫu nhiên hoặc băm dữ liệu và nhóm nó thành các phạm vi rộng để đảm bảo rằng không có thông tin xác định nào có thể được suy ra," Dropbox mô tả thêm. "Ngoài ra, đối tác nghiên cứu của chúng tôi tại NICO phải tuân thủ các nghĩa vụ bảo mật nghiêm túc." Pah của Northwestern ủng hộ tuyên bố đó, nói với Mytour rằng anh và đội của anh không bao giờ có thể thấy bất kỳ thông tin cá nhân nào hoặc nội dung của bất kỳ thư mục hoặc tệp Dropbox nào. Đội của anh đã gửi thông tin trích dẫn từ Web of Science—một chỉ số xếp hạng các nhà nghiên cứu theo tần suất công việc của họ được trích dẫn—mà Dropbox sau đó ghép với dữ liệu thư mục, đã được ẩn danh và tổng hợp, và gửi lại để phân tích.
Ngay cả khi tên cá nhân bị loại bỏ, tiêu đề thư mục và cấu trúc tệp vẫn có thể được sử dụng để xác định cá nhân, theo giáo sư Casey Fiesler của Đại học Colorado Boulder, dạy tại Bộ môn Khoa học Thông tin. Trong một bài đăng trên blog mà Hinds của Dropbox đã đăng vào thứ Sáu, cô dường như trực tiếp đề cập đến lo ngại đó, viết rằng "thông tin như xếp hạng đại học và số trích dẫn đã được nhóm thành các phạm vi," và đại diện của Dropbox nói rằng các kỹ thuật họ sử dụng để ẩn danh và tổng hợp dữ liệu sẽ làm cho việc nhận diện ngược trở nên không thể, tuy nhiên họ không thể chia sẻ chi tiết về cách quy trình đó hoạt động.
Tuy nhiên, dường như nghiên cứu này đã được thực hiện mà không có sự đồng ý rõ ràng của hàng nghìn khách hàng mà Dropbox và các nhà nghiên cứu đã truy cập (bài viết HBR ban đầu gợi ý rằng dữ liệu của 400,000 người dùng đã được phân tích, trong khi Dropbox nói rằng nghiên cứu xử lý dữ liệu từ 16,000 khách hàng). Vào cuối thứ Ba, HBR thêm một ghi chú biên tập thứ hai, cho biết các nhà nghiên cứu bắt đầu với thông tin về 400,000 "người dùng duy nhất" nhưng thu gọn bộ dữ liệu xuống còn 16,000 sau khi tích hợp dữ liệu từ Web of Science. Biên tập viên HBR cũng cập nhật bài viết để cho biết không phải là 1,000 trường đại học đã được bao gồm, mà thay vào đó là 1,000 bộ môn riêng lẻ.
Sự đồng ý có thông tin, một trong những nền tảng quan trọng của nghiên cứu học thuật, là một trong những điều khiến Facebook gặp rắc rối nhiều năm trước khi công bố kết quả từ "Nghiên cứu Lan Truyền Cảm Xúc" gây tranh cãi của mình vào năm 2014. Nghiên cứu đó không bao giờ được chấp thuận bởi một hội đồng xem xét nội bộ, có nhiệm vụ duy trì các tiêu chuẩn đạo đức trong nghiên cứu; vì dữ liệu đã được Facebook thu thập và không thể xác định được, trường đại học nơi nó được thực hiện thông báo rằng nó được xem xét không cần IRB. Đại diện của Dropbox nói rằng điều này cũng đúng đối với nghiên cứu này, vì dữ liệu đã được chuyển giao cho các nhà nghiên cứu đã được loại bỏ thông tin xác định.
Nhưng vấn đề về sự đồng ý làm phiền Fiesler và sinh viên sau đại học Frederik Brudy của Đại học College London, người cũng đã bày tỏ quan ngại của mình trên Twitter. "Dựa trên những gì tôi thấy trong điều khoản dịch vụ và chính sách bảo mật của họ, cũng như phản ứng của công chúng mà tôi thấy từ các nhà nghiên cứu khác có thể đã có dữ liệu của họ được bao gồm trong nghiên cứu này, quyết định cung cấp dữ liệu cho các nhà nghiên cứu bên ngoài mà không có sự đồng ý của người dùng là một vấn đề," Fiesler nói.
Đại diện của Dropbox nói với Mytour rằng người dùng đã đồng ý khi họ đồng ý với các điều khoản bảo mật của công ty, và chỉ đến một phần của chính sách đó về cách dữ liệu sẽ được sử dụng để cải thiện dịch vụ Dropbox. Phần đó nói: "Chúng tôi thu thập thông tin liên quan đến cách bạn sử dụng Dịch vụ, bao gồm các hành động bạn thực hiện trong tài khoản của mình (như chia sẻ, chỉnh sửa, xem và di chuyển tệp hoặc thư mục). Chúng tôi sử dụng thông tin này để cải thiện Dịch vụ của mình, phát triển các dịch vụ và tính năng mới và bảo vệ người dùng Dropbox." Họ cũng chỉ đến ngôn ngữ về việc chia sẻ dữ liệu với bên thứ ba, nói rằng "Dropbox sử dụng một số bên thứ ba đáng tin cậy (ví dụ, nhà cung cấp hỗ trợ khách hàng và dịch vụ IT) để giúp chúng tôi cung cấp, cải thiện, bảo vệ và quảng bá Dịch vụ của mình."
Cụ thể làm thế nào nghiên cứu này cải thiện dịch vụ Dropbox không rõ từ bài viết HBR hoặc bài đăng trên blog của Dropbox, mặc dù đại diện của Dropbox nói với Mytour rằng những hiểu biết về cách các nhóm hợp tác sẽ giúp công ty thiết kế tính năng tốt hơn.
Thường thì, nghiên cứu loại này sẽ được công bố trong một tạp chí học thuật được đồng nghiệp đánh giá và bao gồm thông tin rõ ràng về tác giả và nguồn gốc của dữ liệu. Do nghiên cứu này được trình bày trong một tạp chí không được đồng nghiệp đánh giá, điều này làm cho việc đánh giá trở nên rất khó khăn. Hinds không phản hồi yêu cầu bình luận từ Mytour, và vào thứ Ba, trang Twitter và LinkedIn của cô đã bị xóa. Đại diện của Dropbox không muốn kết nối Mytour trực tiếp với Hinds.
“Bí quyết để có một đội ngũ hoạt động hiệu quả là gì? Một cầu thủ xuất sắc? Kinh nghiệm của người chơi? Trong một nghiên cứu chung của Dropbox và Viện Nghiên cứu về Hệ thống Phức tạp Northwestern (NICO), chúng tôi đã cố gắng trả lời những câu hỏi như vậy,” Hinds viết trong bài đăng trên blog của Dropbox vào thứ Sáu. Nhưng các nhà học như Fiesler và Brudy đặt ra những câu hỏi khác. Họ muốn biết ai có quyền truy cập vào dữ liệu này và trong bao lâu. Loại tài khoản Dropbox nào bị ảnh hưởng—tài khoản trả phí hay miễn phí? Có những nghiên cứu khác đang diễn ra như thế này không? Liệu nghiên cứu này có được đệ trình để đánh giá đồng nghiệp không? Những câu trả lời đó quan trọng đối với các nhà khoa học tại hơn 6,000 trường đại học sử dụng Dropbox.
Những Điều Tuyệt Vời Hơn từ Mytour
- Gặp người phá án số về tin tức giả mạo
- Đam mê tuyệt vời của một cậu bé với quạt
- Chính phủ Mỹ đã bán “điện thoại gián điệp” cho các nghi phạm
- Cái làm thịt là gì? Thực phẩm nuôi cấy gây ra cuộc tranh cãi
- Câu chuyện sai lệch về Amazon, bá chủ ngành công nghiệp
- Muốn tìm hiểu thêm? Đăng ký nhận bản tin hàng ngày của chúng tôi và không bao giờ bỏ lỡ những câu chuyện mới nhất và tuyệt vời nhất của chúng tôi
