Trong một khoảng thời gian ngắn, đây là lần thứ hai Cloudflare gặp sự cố làm gián đoạn truy cập web của hàng triệu người dùng trên toàn cầu.
Vào ngày thứ Sáu vừa qua, hàng triệu người dùng internet trên toàn thế giới bất ngờ không thể truy cập vào các trang web yêu thích của mình, khi lỗi 500 Internal Server Error xuất hiện trên màn hình. Điều đáng ngạc nhiên là nguyên nhân không phải từ cuộc tấn công của tin tặc hay sự cố hạ tầng mà lại là từ Cloudflare – công ty chuyên cung cấp dịch vụ bảo mật và tăng tốc cho hàng triệu website trên toàn cầu.
Trong một thông báo trên blog chính thức, CTO Dane Knecht của Cloudflare đã xác nhận rằng sự cố này không liên quan đến bất kỳ cuộc tấn công mạng nào. Thay vào đó, vấn đề phát sinh từ nỗ lực của đội ngũ kỹ thuật Cloudflare khi cố gắng vá một lỗ hổng bảo mật nghiêm trọng đang thu hút sự chú ý trong tuần này. Ông Knecht giải thích rằng khi thực hiện các thay đổi với logic xử lý HTTP request nhằm phát hiện và giảm thiểu lỗ hổng trong React Server Components, đội ngũ kỹ thuật đã vô tình tạo ra một sự cố khiến hệ thống của nhiều khách hàng ngừng hoạt động.

Cloudflare lại gặp sự cố vào thứ Sáu tuần trước
Thiệt hại từ sự cố này không hề nhỏ. Theo thông tin từ Cloudflare, khoảng 28% tổng lưu lượng HTTP mà công ty phục vụ đã bị ảnh hưởng trong suốt thời gian xảy ra sự cố. Điều này đồng nghĩa với việc hàng triệu website trên khắp thế giới đã tạm thời 'ngủ sớm', bao gồm cả chính dashboard quản trị của Cloudflare.
Người dùng cố gắng truy cập các trang web này chỉ nhận được thông báo lỗi 500, một loại lỗi phía server thường chỉ ra vấn đề nghiêm trọng trong việc xử lý yêu cầu. May mắn là Cloudflare đã nhanh chóng triển khai bản sửa lỗi và phục hồi hoàn toàn dịch vụ vào lúc 8 giờ sáng theo giờ miền Đông nước Mỹ.
Vậy lỗ hổng mà Cloudflare đang cố gắng vá là gì mà lại gây ra hậu quả nghiêm trọng đến vậy? Đó chính là React2Shell, được theo dõi dưới mã CVE-2025-55182 và được xem là lỗ hổng bảo mật nghiêm trọng nhất trong năm nay trong React Server Components.
Lỗ hổng này ảnh hưởng đến các phiên bản React từ 19.0 đến 19.2.0 – những phiên bản được phát hành trong năm qua. Vấn đề của React2Shell nằm ở giao thức 'Flight' trong React Server Components, cho phép kẻ tấn công chưa được xác thực có thể gửi các HTTP request độc hại đến các React Server Function endpoints và từ đó chiếm quyền điều khiển hoàn toàn các ứng dụng React và Next.js.
Mức độ nguy hiểm của lỗ hổng này đã được xác nhận bởi nhiều tổ chức an ninh mạng uy tín. NHS Anh đã phát đi cảnh báo vào thứ Năm rằng nhiều bản proof-of-concept exploit cho lỗ hổng này đã được công khai trên internet. Cơ quan này nhấn mạnh rằng 'việc khai thác thành công trong thực tế là điều gần như chắc chắn', khiến các tổ chức sử dụng React phiên bản bị ảnh hưởng phải nhanh chóng cập nhật lên các phiên bản đã được vá lỗi.

Nguyên nhân bắt nguồn từ một bản vá lỗi nhằm ngăn chặn lỗ hổng bảo mật React2Shell của Cloudflare
Tuy nhiên, đây không phải là lần đầu tiên Cloudflare gặp sự cố lớn gây ảnh hưởng toàn cầu. Chỉ một tháng trước đó, công ty này đã gặp phải một sự cố toàn cầu khác kéo dài gần 6 tiếng đồng hồ, khiến mạng lưới của họ ngừng hoạt động trên toàn thế giới.
CEO Matthew Prince đã phải công khai nhận định đây là 'sự cố tồi tệ nhất kể từ năm 2019'. Trước đó vào tháng 6, Cloudflare cũng gặp phải một sự cố nghiêm trọng liên quan đến Zero Trust WARP, gây ra các vấn đề về xác thực Access và kết nối WARP ở nhiều khu vực, thậm chí còn ảnh hưởng đến cả hạ tầng của Google Cloud.
Chuỗi sự cố liên tiếp này đã dấy lên câu hỏi về độ tin cậy của các dịch vụ hạ tầng internet quy mô lớn. Dù nỗ lực vá lỗi bảo mật kịp thời là điều đáng ghi nhận, nhưng một bản vá được triển khai vội vàng mà không kiểm tra kỹ lưỡng lại có thể gây ra thiệt hại lớn hơn rất nhiều so với chính lỗ hổng mà nó cố gắng sửa chữa.
Đối với hàng triệu website phụ thuộc vào Cloudflare, sự cố lần này là lời cảnh tỉnh rằng ngay cả những 'người khổng lồ' cũng có thể thất bại, và đôi khi những nỗ lực đầy thiện chí lại có thể dẫn đến kết quả không như mong muốn.
