
Các nghiên cứu cụ thể đòi hỏi bộ dữ liệu nhạy cảm: mối quan hệ giữa bữa trưa trường học dinh dưỡng và sức khỏe học sinh, hiệu quả của các sáng kiến về công bằng lương, và nhiều nội dung khác. Các hiểu biết quý giá đòi hỏi phải điều hướng qua một mê cung thông tin cá nhân riêng tư. Ngày nay, sau nhiều năm nỗ lực, các chuyên gia mật mã và nhà khoa học dữ liệu tại Google đã phát triển một kỹ thuật để kích thích quá trình "tính toán đa bên" này mà không tiết lộ thông tin cho bất kỳ ai chưa sở hữu nó.
Hôm nay, Google sẽ phát hành một công cụ mật mã nguồn mở được biết đến là Private Join and Compute. Nó giúp quá trình kết hợp các cột số từ các bộ dữ liệu khác nhau để tính tổng, đếm, hoặc trung bình trên dữ liệu đã được mã hóa và không đọc được trong suốt hành trình toán học của nó. Chỉ có kết quả của phép tính có thể được giải mã và xem bởi tất cả các bên—điều đó có nghĩa là bạn chỉ nhận được kết quả, không phải là dữ liệu bạn chưa sở hữu. Những nguyên tắc mật mã cơ bản của công cụ này có nguồn gốc từ những năm 1970 và 1990, nhưng Google đã tái chế và cập nhật chúng để làm việc với các bộ xử lý mạnh mẽ và linh hoạt hơn hiện nay.
"Kết quả cuối cùng là chúng ta có thể thực hiện phép tính này mà không tiết lộ bất kỳ dữ liệu cá nhân nào và chỉ nhận kết quả tổng cộng," nói Amanda Walker, giám đốc công cụ bảo mật và kỹ thuật cơ sở hạ tại Google. "Cách ngây thơ để thực hiện điều này sẽ là lấy hai bộ dữ liệu nhạy cảm, đổ chúng vào một cơ sở dữ liệu duy nhất và thực hiện kết hợp và tổng, nhưng sau đó bạn đã có tất cả mọi thứ cùng nhau và có rủi ro mất dữ liệu."
Lấy ví dụ về bữa trưa trường học. Trường có thông tin về tất cả học sinh và thực phẩm đã phục vụ khi nào. Nhưng nó sẽ cần dữ liệu từ các nhà cung cấp chăm sóc sức khỏe qua thời gian để theo dõi xem những thay đổi trong thực đơn có tiềm ẩn tác động tích cực đối với sức khỏe của học sinh không. Private Join and Compute sẽ cho phép những bên này, tất cả đều giữ thông tin rất nhạy cảm, so sánh ghi chú của họ mà không tiết lộ thông tin nhạy cảm cho nhau.
Private Join and Compute sử dụng một phương pháp được biết đến từ những năm 1970 gọi là "mã hóa giao hoán" để cho phép dữ liệu trong các bộ dữ liệu được mã hóa bằng nhiều khóa, mà không cần quan trọng thứ tự khóa được sử dụng như thế nào. Điều này hữu ích cho tính toán đa bên, nơi bạn cần áp dụng và sau đó bóc tách nhiều lớp mã hóa mà không ảnh hưởng đến các phép tính được thực hiện trên dữ liệu đã được mã hóa. Quan trọng là, Private Join and Compute cũng sử dụng các phương pháp được phát triển lần đầu trong những năm 90 cho phép một hệ thống kết hợp hai bộ dữ liệu được mã hóa, xác định những gì chúng có chung, và sau đó thực hiện phép tính toán toán học trực tiếp trên dữ liệu này được mã hóa và không đọc được thông qua một kỹ thuật gọi là mã hóa homomorphic.
"Chúng tôi nói 'OK, các hệ thống ban đầu rất hạn chế và chỉ thực hiện một số phép tính," Walker nói. "Những phép tính đó chúng ta có thể sử dụng không?' Và câu trả lời hóa ra là có."
Google đã phổ biến một bản nghiên cứu kỹ thuật mô tả Private Join and Compute cho các chuyên gia mật mã học trong ngành công nghiệp và học thuật. Và vì công ty đang công bố mã nguồn mở cho công cụ này, nhiều cơ hội hơn sẽ xuất hiện để đánh giá tính bảo mật và quyền riêng tư của phương pháp. Tal Malkin, một chuyên gia mật mã học tại Đại học Columbia, đã xem trước bản báo cáo và nói rằng công cụ mới này đại diện cho một bước quan trọng - đặc biệt vì nó đến từ Google và sẽ được công bố mã nguồn mở. Điều này có thể thúc đẩy sự chấp nhận của nó trong các doanh nghiệp đầy dữ liệu người dùng và muốn quản lý nó một cách riêng tư hơn.
"Tính toán an toàn đã là một lĩnh vực nổi bật trong nghiên cứu mật mã từ những năm 1980, nhưng cho đến gần đây vẫn được coi là quá lý thuyết để thực hành," Malkin nói. "Tôi nghĩ dự án này là một bước tiến hứng thú đối với việc mở rộng công nghệ quyền riêng tư quan trọng này cho việc sử dụng chung."

Google nhấn mạnh vào tiềm năng sử dụng kỹ thuật trong chính sách công cộng và các ứng dụng nhân quyền, và Joseph Lorenzo Hall, chuyên gia công nghệ hàng đầu cho Trung tâm Dân chủ và Công nghệ, nói rằng những ứng dụng tiềm năng này rất thú vị. Nhưng giống như Malkin, Hall cũng lưu ý rằng các doanh nghiệp, kể cả Google, có khả năng sẽ ưa chuộng Private Join and Compute để nghiên cứu dữ liệu người dùng mà không vi phạm ranh giới quyền riêng tư. Ví dụ, Walker của Google nói rằng công ty đã triển khai một bản beta thử nghiệm tại Hoa Kỳ sử dụng công cụ này cho đo lường quảng cáo.
"Điều này có phần như Thánh Gra của nhiều điều," Hall của CDT nói. "Google đang sử dụng toán học để cho phép hai bên không tin tưởng nhau, nhưng muốn có một thống kê tổng hợp chỉ có thể bằng cách kết hợp dữ liệu của họ, làm điều đó mà không có ai có thông tin về cá nhân liên quan."
Mặc dù Private Join and Compute giúp thực hiện các tính toán riêng tư mà trước đây không thực tế, nó vẫn đòi hỏi công năng máy tính cao và có thể không khả thi để sử dụng trong mọi tình huống. Hall của CDT cũng chỉ ra rằng luôn có khả năng công cụ này được sử dụng để tìm câu trả lời cho những câu hỏi mà xã hội không nên biết, hoặc là những câu hỏi xâm phạm một cách nào đó. "Như nhà mật mã học Phil Rogaway nói, giữ quyền riêng tư vẫn là giám sát," ông nói.
Nhưng những tiến bộ về mật mã cũng có thể tạo ra nhiều lợi ích công cộng. "Trước đây thì đúng là không có gì bạn có thể làm để trả lời những câu hỏi này một cách riêng tư," Hall thêm. "Thật tuyệt, có rất nhiều cách chúng ta có thể sử dụng điều này."
More Great Mytour Stories
- Jigsaw bought a Russian troll campaign as an experiment
- You could live forever with this sci-fi time hack
- A very fast spin through the hills in a hybrid Porsche 911
- A search for San Francisco's lost authenticity
- The quest to make a bot that can smell as well as a dog
- 💻 Upgrade your work game with our Gear team’s favorite laptops, keyboards, typing alternatives, and noise-canceling headphones
- 📩 Want more? Sign up for our daily newsletter and never miss our latest and greatest stories
