Nhóm Hacker Đang Chia Sẻ Một Megaleak Gồm 2.2 Tỷ Bản Ghi
Khi nhóm hacker xâm nhập vào các công ty như Dropbox và LinkedIn trong những năm gần đây—ăn cắp lần lượt 71 triệu và 117 triệu mật khẩu—ít nhất họ đã có tư cách tận dụng những thông tin đăng nhập đó một cách bí mật hoặc bán chúng với giá hàng nghìn đô la trên dark web. Bây giờ, có vẻ như ai đó đã ghép lại những cơ sở dữ liệu bị xâm phạm đó và nhiều hơn nữa thành một bộ sưu tập khổng lồ, chưa từng có, gồm 2.2 tỷ tên người dùng và mật khẩu duy nhất và đang phổ biến miễn phí trên các diễn đàn hacker và torrents, ném ra dữ liệu riêng tư của một phần đáng kể của loài người như cuốn danh bạ điện thoại năm ngoái.
Trước đây trong tháng này, nhà nghiên cứu an ninh Troy Hunt xác định phần đầu của mega-dump đó, được tên là Collection #1 do người tạo ẩn danh, một bộ sưu tập ghép lại của các cơ sở dữ liệu bị xâm phạm mà Hunt nói đại diện cho 773 triệu tên người dùng và mật khẩu duy nhất. Bây giờ các nhà nghiên cứu khác đã thu được và phân tích thêm một cơ sở dữ liệu lớn khác được gọi là Collections #2–5, với tổng cộng 845 gigabyte dữ liệu bị đánh cắp và 25 tỷ bản ghi. Sau khi tính toán loại bỏ bản sao, các nhà phân tích tại Hasso Plattner Institute ở Potsdam, Đức, phát hiện rằng tổng lượng thu được gần ba lần bộ sưu tập #1.
"Đây là bộ sưu tập vụ xâm nhập lớn nhất chúng tôi từng thấy," nói Chris Rouland, một nhà nghiên cứu an ninh mạng và người sáng lập công ty an ninh IoT Phosphorus.io, người đã tải xuống Collections #1–5 trong những ngày gần đây từ các tệp torrent. Anh ta nói rằng bộ sưu tập này đã lan rộng rãi trong cộng đồng hacker: Anh ta có thể thấy rằng tệp theo dõi anh ta tải xuống đang được "seed" bởi hơn 130 người sở hữu bộ dữ liệu và nó đã được tải xuống hơn 1.000 lần. "Đây là một lượng thông tin và thông tin đăng nhập chưa từng thấy và cuối cùng sẽ rơi vào miền công cộng," Rouland nói.
Mặc dù có kích thước không thể tưởng, được báo cáo đầu tiên bởi trang tin Heise.de của Đức, hầu hết dữ liệu bị đánh cắp dường như đến từ những vụ trộm trước đó, như vụ đột nhập vào Yahoo, LinkedIn và Dropbox. MYTOUR kiểm tra một mẫu dữ liệu và xác nhận rằng các thông tin đăng nhập thực sự hợp lệ, nhưng chủ yếu là mật khẩu từ những vụ rò rỉ cách đây nhiều năm.
Nhưng vụ rò rỉ vẫn đáng chú ý vì số lượng vi phạm quyền riêng tư, nếu không phải là chất lượng. MYTOUR đã yêu cầu Rouland tìm kiếm hơn một chục địa chỉ email của người; tất cả trừ vài cái đều xuất hiện ít nhất một mật khẩu mà họ đã sử dụng cho một dịch vụ trực tuyến đã bị đánh cắp trong những năm gần đây.
Là một biểu hiện khác về sự quan trọng của dữ liệu, các nhà nghiên cứu của Hasso Plattner Institute phát hiện rằng 750 triệu thông tin đăng nhập trước đó không được bao gồm trong cơ sở dữ liệu của họ về tên người dùng và mật khẩu bị rò rỉ, Info Leak Checker, và rằng 611 triệu thông tin đăng nhập trong Collections #2–5 không được bao gồm trong dữ liệu của Collection #1. Nhà nghiên cứu của Hasso Plattner Institute, David Jaeger, cho rằng một số phần của bộ sưu tập có thể đến từ việc hack tự động của các trang web nhỏ, không rõ để đánh cắp cơ sở dữ liệu mật khẩu của họ, điều này có nghĩa là một phần đáng kể của mật khẩu đang bị rò rỉ lần đầu tiên.
Với kích thước khổng lồ của bộ sưu tập, nó cũng có thể cung cấp một công cụ mạnh mẽ cho những hacker không có kỹ năng để đơn giản thử những tên người dùng và mật khẩu trước đó đã bị rò rỉ trên bất kỳ trang web công cộng nào với hy vọng rằng người ta đã tái sử dụng mật khẩu—một kỹ thuật được biết đến là credential stuffing. "Đối với internet như một tổng thể, điều này vẫn có ảnh hưởng rất lớn," Rouland nói.
Rouland lưu ý rằng anh đang liên lạc với các công ty bị ảnh hưởng và cũng sẽ chia sẻ dữ liệu với bất kỳ quản trị an ninh thông tin chính nào liên lạc với anh để bảo vệ nhân viên hoặc người dùng.
Bạn có thể kiểm tra tên người dùng của mình trong vụ rò rỉ bằng cách sử dụng công cụ của Hasso Plattner Institute tại đây và nên thay đổi mật khẩu cho bất kỳ trang web bị rò rỉ mà công cụ đánh dấu và bạn chưa thay đổi trước đó. Như mọi khi, đừng tái sử dụng mật khẩu và sử dụng một quản lý mật khẩu. (Dịch vụ HaveIBeenPwned của Troy Hunt cung cấp một cách kiểm tra hữu ích khác để xem liệu mật khẩu của bạn có bị rò rỉ không, tuy nhiên, đến thời điểm viết bài này, nó vẫn chưa bao gồm Collections #2-5.)
Rouland đặt giả thuyết rằng dữ liệu có thể đã được ghép từ những vụ rò rỉ cũ hơn và đưa ra để bán, nhưng sau đó bị đánh cắp hoặc mua bởi một hacker nào đó, có lẽ để làm giảm giá trị sản phẩm của đối thủ, đã rò rỉ nó rộng rãi hơn. Tệp theo dõi torrent mà anh ấy đã sử dụng để tải xuống bộ sưu tập bao gồm một "readme" yêu cầu người tải xuống "hãy giữ hạt càng lâu càng tốt," Rouland chú ý. "Có ai đó muốn nó xuất hiện," anh ấy nói. ("Readme" cũng lưu ý rằng một bộ dữ liệu khác thiếu từ bộ sưu tập torrent hiện tại có thể sắp xuất hiện.)
Tuy nhiên, các nhà nghiên cứu khác cho rằng một cơ sở dữ liệu lớn như vậy được chia sẻ miễn phí đại diện cho điều gì đó khác: đó là đủ nhiều vụ rò rỉ lớn về thông tin cá nhân đã tích lũy trong thế giới hacker qua nhiều năm nên chúng có thể chiếm một lượng lớn thông tin cá nhân rộng lớn và vẫn thực sự không có giá trị.
"Có lẽ những hacker tài năng, những người thực sự quan tâm đến việc kiếm tiền từ đây, đã có nó từ nhiều năm trước," nói David Jaeger, một nghiên cứu viên tại Hasso Plattner Institute đã phân tích các bộ sưu tập. "Sau một thời gian, họ đã thử nghiệm tất cả những cái này trên các dịch vụ lớn, nên không có lý do gì giữ chúng lâu hơn, họ bán chúng với một số tiền nhỏ."
Dưới một mức giá nhất định, Jaeger thêm vào, những hacker thường trao đổi thông tin đó cho dữ liệu khác, lan truyền nó rộng rãi và làm giảm giá trị nó cho đến khi nó gần như miễn phí. Nhưng nó vẫn có thể được sử dụng cho hacking quy mô nhỏ, như đột nhập vào tài khoản truyền thông xã hội hoặc crack các trang web ít người biết đến. "Có lẽ nó vô giá trị đối với những người đã tạo ra những bộ dữ liệu này ban đầu, nhưng đối với những hacker ngẫu nhiên, nó vẫn có thể được sử dụng cho nhiều dịch vụ," Jaeger thêm.
Hunt, sau khi công bố bộ sưu tập ban đầu Collection #1 vào đầu tháng này, nói rằng anh ấy đã ngạc nhiên khi phát hiện có nhiều người ngay lập tức đề xuất gửi cho anh ấy các liên kết đến Collections #2-5. "Điều độc đáo mà điều này đại diện là khối lượng dữ liệu và sự lan truyền mạnh mẽ của nó trong các kênh công cộng lớn," Hunt nói. "Đó không phải là vụ hack lớn nhất thế giới, mà là việc nó lan truyền với một dạng chảy chưa từng có trước đây."
Trong ý nghĩa đó, Collections #1-5 đại diện cho một loại cột mốc mới: Rằng những mảnh vụn thối rữa của những vi phạm quyền riêng tư trên internet đã trở nên quá nhiều và giá trị giảm sút đến mức nó trở nên gần như miễn phí và do đó là công cộng, làm giảm chất lượng thông tin cá nhân cuối cùng mà nó có thể giữ. "Khi đủ nhiều người có dữ liệu bí mật, ai đó sẽ chia sẻ nó," Rouland nói. "Đó là hiện tượng entropy. Khi dữ liệu đã xuất hiện, nó sẽ rò rỉ."
- Tại sao điện thoại của bạn (và các thiết bị khác) bị hỏng khi trời lạnh
- Đối mặt với quy tắc của Apple, Facebook chứng tỏ nó không bao giờ học được
- Google bắt đầu tiến vào việc loại bỏ URL
- Đeo Focals khiến tôi suy nghĩ lại về kính thông minh
- Hành trình hùng vĩ của một người đàn ông để tìm dữ liệu của mình từ Cambridge Analytica
- 👀 Đang tìm kiếm những thiết bị công nghệ mới nhất? Hãy xem những lựa chọn của chúng tôi, hướng dẫn mua sắm và những ưu đãi tốt nhất trong suốt cả năm
- 📩 Nhận thêm nhiều thông tin cực kỳ hữu ích từ bản tin hàng tuần Backchannel của chúng tôi
