Cybernews phát hiện vụ vi phạm dữ liệu chấn động với thông tin từ 30 tập dữ liệu khác nhau, tạo “bản thiết kế cho khai thác đại trà”.
Một vụ rò rỉ dữ liệu khổng lồ phơi bày tới 16 tỷ thông tin đăng nhập đang làm dấy lên làn sóng lo ngại trên toàn cầu về an ninh mạng, khi các nhóm tội phạm mạng có được quyền truy cập chưa từng có vào tài khoản cá nhân, hệ thống doanh nghiệp và mạng lưới chính phủ.
Các nhà nghiên cứu an ninh mạng tại Cybernews đã công bố vào ngày 19 tháng 6 năm 2025 rằng họ vừa phát hiện một trong những vụ rò rỉ dữ liệu lớn nhất từng được ghi nhận. Kho dữ liệu khổng lồ này có khả năng bắt nguồn từ nhiều đợt tấn công bằng phần mềm đánh cắp thông tin, thu thập thông tin đăng nhập từ nhiều nền tảng trực tuyến khác nhau.
Nhóm nghiên cứu cho biết đã giám sát sát sao không gian mạng từ đầu năm đến nay và phát hiện 30 tập dữ liệu bị lộ, mỗi tập chứa từ vài chục triệu đến hơn 3,5 tỷ bản ghi. Dữ liệu bao phủ các nền tảng từ mạng xã hội, hệ thống doanh nghiệp, dịch vụ VPN, cổng lập trình viên đến cả hệ thống chính phủ.
Các tập dữ liệu đã từng được truy cập tạm thời thông qua các cơ sở dữ liệu Elasticsearch và kho lưu trữ đối tượng không được bảo mật, cho phép Cybernews tiếp cận và phân tích trước khi chúng được khóa hoặc xóa bỏ. Cấu trúc dữ liệu tuân theo định dạng tiêu chuẩn của phần mềm đánh cắp thông tin hiện đại với URL, thông tin đăng nhập và mật khẩu.
Nguồn gốc đa dạng với rủi ro mở rộng
Các nhà nghiên cứu nhấn mạnh đây không chỉ là một vụ rò rỉ mà là “một bản thiết kế cho khai thác đại trà”. Với hơn 16 tỷ bản ghi thông tin đăng nhập, tội phạm mạng hiện đang nắm trong tay khả năng truy cập vào vô số thông tin nhạy cảm, phục vụ cho chiếm quyền tài khoản, đánh cắp danh tính và tấn công lừa đảo tinh vi.
Cấu trúc và tính mới của dữ liệu cho thấy đây không phải là dữ liệu tái sử dụng mà là thông tin mới và có thể khai thác ngay lập tức. Thông tin trong các tập dữ liệu có thể mở khóa hầu như mọi dịch vụ trực tuyến từ Apple, Facebook, Google đến GitHub, Telegram và nhiều dịch vụ chính phủ.
Các tập dữ liệu có kích thước và tên gọi khác nhau. Một số được gán nhãn chung như “logins” hoặc “credentials”, trong khi số khác hé lộ nguồn gốc cụ thể. Đáng chú ý, một tập dữ liệu liên quan đến Liên bang Nga chứa hơn 455 triệu bản ghi, và một tập khác liên quan đến Telegram có hơn 60 triệu bản ghi.
Mặc dù có các bản ghi trùng lặp, nhóm nghiên cứu không thể xác định chính xác số cá nhân bị ảnh hưởng. Tuy nhiên, họ cảnh báo rằng việc có thêm token, cookie và metadata trong dữ liệu làm tăng rủi ro cho những tổ chức không triển khai xác thực đa yếu tố (MFA) hoặc quản lý thông tin đăng nhập kém.
Nguồn gốc cụ thể của vụ rò rỉ vẫn chưa được xác minh, nhưng các chuyên gia cảnh báo rằng tội phạm mạng có thể khai thác kho dữ liệu khổng lồ này để tăng cường các hành vi đánh cắp danh tính, lừa đảo phishing tinh vi và xâm nhập hệ thống doanh nghiệp cũng như cơ quan chính phủ.