Cách Một Công Ty Khó Hiểu Làm Sập Một Phần Lớn Của Internet

Vào sáng sớm thứ Ba, một phần lớn của web giật mình tắt trong khoảng một giờ. Các trang web bị sập không có chủ đề hoặc địa lý rõ ràng nào; sự cố là toàn cầu và ảnh hưởng đến mọi thứ từ Reddit đến Spotify và The New York Times. (Và đúng, cũng là MYTOUR.) Trên thực tế, duy nhất điều họ có chung là Fastly, một nhà cung cấp mạng phân phối nội dung (CDN) mà giọt nước đầu tiên của họ đã lan rộng trên toàn Internet.
Có thể bạn chưa từng nghe về Fastly, nhưng có lẽ bạn đã tương tác với nó mỗi khi bạn trực tuyến. Cùng với Cloudflare và Akamai, đó là một trong những nhà cung cấp CDN lớn nhất thế giới. Và trong khi Fastly giải quyết sự cố trên toàn cầu vào thứ Ba với tốc độ tương đối nhanh chóng, sự kiện này là một lời nhắc rõ ràng về cách hạ cấp và liên kết hệ thống hạ tầng internet có thể, đặc biệt là khi nhiều phần lớn nó phụ thuộc vào một số công ty ít người biết đến công khai.
Giao Hàng Đặc Biệt
Để hiểu cách vấn đề của Fastly có thể nhanh chóng trở thành vấn đề của mọi người, hãy nhanh chóng xem xét vai trò mà CDN đóng trong hệ sinh thái internet. Mặc dù thường có khuynh hướng nghĩ về internet như là một khối không hình dạng—họ thậm chí gọi nó là “đám mây”—những bài viết bạn đọc, những bộ phim và bài hát bạn xem trực tuyến, những bức ảnh bạn đăng, tất cả chúng sống trên máy chủ vật lý. Và trong khi nội dung đó có thể được lưu trữ chủ yếu bởi một nhà cung cấp đám mây, bạn vẫn cần một cách để đưa nó đến cho mọi người một cách nhanh chóng và hiệu quả.
Đó là nơi mà CDN xuất hiện. Bằng cách vận hành máy chủ trên khắp thế giới, CDN có thể giảm bớt khoảng cách giữa điện thoại thông minh của bạn và trải nghiệm internet bạn chọn. Hãy tưởng tượng nó như là phiên bản internet của một người truyền bóng trong bóng chày: Thay vì cố gắng ném bóng đến bảo tàng một mình, một người chơi ngoại ô sẽ thay vào đó ném nó cho một người chơi nội ô, người sau đó bắn nó cho người bắt. Điều này nhanh chóng và hiệu quả hơn.
“Nó đơn giản là tạo ra hiệu suất rất cao cho nội dung, cho dù đó là video trực tuyến hay tất cả những hình ảnh nhỏ xuất hiện khi bạn truy cập một trang web thương mại điện tử,” Angelique Medina, giám đốc tiếp thị sản phẩm tại công ty giám sát mạng Cisco ThousandEyes nói. “Dịch vụ nó gần với người dùng giảm bớt rất nhiều thời gian tải và cho phép mọi người có trải nghiệm tuyệt vời khi lướt web.”
Hãy xem bài viết mà bạn đang đọc ngay bây giờ. Có khả năng bạn đang đọc một bản sao của nó được giữ trong bộ nhớ đệm của điểm hiện diện được biết đến là một “điểm xuất hiện,” một máy chủ ở đâu đó trong khu vực của bạn. Bản đồ mạng Fastly chỉ ra rằng công ty vận hành điểm xuất hiện tại ít nhất 58 thành phố trên thế giới, bao gồm nhiều thành phố đông dân như Los Angeles, London và Singapore. Nó liệt kê công suất toàn cầu kết hợp của họ lên đến 130 terabits mỗi giây.

Và đó không phải là tất cả! CDN không chỉ lưu trữ nội dung gần các thiết bị muốn nó. Chúng cũng giúp định hình nó trên khắp internet. “Đó giống như điều hòa luồng giao thông trên một hệ thống đường lớn,” Ramesh Sitaraman, một nhà khoa học máy tính tại Đại học Massachusetts ở Amherst, người đã giúp tạo ra CDN lớn đầu tiên như một kiến trúc sư chính tại Akamai, nói. “Nếu một liên kết trên internet gặp sự cố hoặc bị quá tải, các thuật toán CDN nhanh chóng tìm ra một tuyến đường thay thế đến điểm đích.”
Vì vậy, bạn có thể bắt đầu nhìn thấy rằng khi một CDN bị sập, nó có thể mang theo một phần lớn của internet. Mặc dù điều đó không giải thích được tại sao ảnh hưởng vào thứ Ba lan rộng đến vậy, đặc biệt khi có nhiều sự dự phòng được tích hợp vào những hệ thống này. Hoặc ít nhất là nên có.
Tổng Hợp CDN
Trong phần lớn ngày thứ Ba, không rõ chính xác đã diễn ra gì tại Fastly. “Chúng tôi xác định một cấu hình dịch vụ đã gây ra sự cố trên toàn bộ các điểm xuất hiện của chúng tôi trên toàn cầu và đã tắt cấu hình đó,” một người phát ngôn của công ty nói trong một tuyên bố vào buổi sáng. “Mạng toàn cầu của chúng tôi đang trở lại trực tuyến.”
Vào thứ Ba muộn, công ty đã cung cấp thêm thông tin chi tiết trong một bài đăng trên blog mô tả sự cố. Nguyên nhân chính thực sự xuất phát từ ngày 12 tháng 5, khi Fastly vô tình giới thiệu một lỗi trong quá trình triển khai phần mềm rộng lớn. Giống như một chiếc bùa chỉ mở khóa sức mạnh ác khi có một lời chú, lỗi này là vô hại cho đến khi một khách hàng của Fastly cấu hình hệ thống của họ theo một cách cụ thể. Đến gần một tháng sau đó, một trong số họ đã làm.
Cuộc gián đoạn toàn cầu bắt đầu vào lúc 5:47 sáng giờ Đông ET; Fastly phát hiện ra nó trong vòng một phút. Mất thêm một chút thời gian—đến lúc 6:27 sáng giờ Đông ET—để xác định cấu hình gây ra lỗi. Tại thời điểm này, 85% mạng của Fastly đang trả về lỗi; mọi châu lục ngoại trừ châu Antarctica đều cảm nhận tác động. Chúng bắt đầu trở lại vào lúc 6:36 sáng giờ Đông ET, và mọi thứ đã trở lại bình thường chủ yếu vào đầu giờ.
Ngay cả sau khi Fastly đã sửa vấn đề cơ bản, công ty cảnh báo rằng người dùng vẫn có thể thấy tỷ lệ "đánh đồng" thấp hơn—nghĩa là bạn có thể tìm thấy nội dung bạn đang tìm kiếm đã được lưu trữ sẵn trong một máy chủ gần đây—và "tăng tải nguồn gốc," là quá trình quay lại nguồn để những thứ không có trong bộ nhớ đệm. Nói cách khác, tủ quần áo vẫn khá trống trơn. Và cho đến khi chúng được nạp lại toàn cầu, Fastly mới giải quyết vấn đề cơ bản này. Họ cuối cùng đã đưa ra một "sửa lỗi vĩnh viễn" vài giờ sau đó, vào giờ trưa trên bờ Đông.
Việc xảy ra một sự cố là điều đáng kinh ngạc, bởi vì các mạng CDN thường được thiết kế để chịu đựng những cơn bão như thế này. "Về nguyên tắc, có sự dự phòng khổng lồ," Sitaraman nói về CDN nói chung. "Nếu một máy chủ gặp sự cố, các máy chủ khác có thể tiếp quản công việc. Nếu một trung tâm dữ liệu đầy đủ gặp sự cố, tải có thể được chuyển đến trung tâm dữ liệu khác. Nếu mọi thứ hoạt động hoàn hảo, bạn có thể gặp nhiều sự cố mạng, vấn đề trung tâm dữ liệu và lỗi máy chủ; các cơ chế đàn an của CDN sẽ đảm bảo rằng người dùng không bao giờ thấy sự suy giảm."
Khi mọi thứ gặp sự cố, Sitaraman cho biết, thường liên quan đến một lỗi phần mềm hoặc sai sót cấu hình được đẩy đến nhiều máy chủ cùng một lúc.
Thậm chí trong trường hợp đó, các trang web và dịch vụ sử dụng CDN thường có sự dự phòng riêng của họ. Hoặc ít nhất, họ nên có. Trên thực tế, bạn có thể thấy dấu hiệu về sự đa dạng của các dịch vụ khác nhau trong tốc độ phản ứng của họ sáng nay, theo Medina. Mất khoảng 20 phút cho Amazon để lên lại và hoạt động, vì nó có thể chuyển hướng lưu lượng đến các nhà cung cấp CDN khác. Bất kỳ ai chỉ tin tưởng vào Fastly, hoặc ai không có hệ thống tự động hóa để đối phó với sự gián đoạn, đã phải chờ đợi.
“Sự cố là kết quả của sự đồng nhất,” nói Roland Dobbins, kỹ sư chính của công ty an ninh Netscout. Anh ấy đề xuất rằng mọi tổ chức có sự hiện diện trực tuyến đáng kể nên có nhiều nhà cung cấp CDN để tránh chính xác loại tình huống như vậy.
Tuy nhiên, các lựa chọn của họ ngày càng bị hạn chế. Giống như đám mây chủ yếu đã được hấp thụ bởi Amazon, Google và Microsoft, ba nhà cung cấp CDN—Cloudflare, Akamai và Fastly—điều trị nhiều nội dung trực tuyến. “Có rất nhiều sự tập trung sử dụng trong rất ít nhà cung cấp dịch vụ,” Medina nói. “Khi bất kỳ một trong ba nhà cung cấp đó gặp vấn đề, thường đó không phải là điều kéo dài trong thời gian dài, nhưng nó có ảnh hưởng lớn trên Internet.”
Đó là một phần quan trọng, Medina nói, là lý do tại sao những sự cố như thế này ngày càng trở nên phổ biến gần đây, và tại sao chúng sẽ chỉ tiếp tục trở nên tồi tệ hơn. Bóng chày cần có người chặn; giao lộ cần có cảnh sát giao thông. Càng ít cái để dựa vào, càng nhiều kết nối bị bỏ lỡ, và tai nạn càng lớn.
Câu chuyện này đã được cập nhật để bao gồm thêm chi tiết từ Fastly về nguyên nhân gây ra sự cố vào thứ Ba.
Những điều tuyệt vời khác từ MYTOUR
- 📩 Thông tin mới nhất về công nghệ, khoa học và nhiều hơn nữa: Nhận bản tin của chúng tôi!
- Hành trình tuyệt vời của một người đàn ông đến trung tâm quả cầu bowling
- Cuộc sống kỳ lạ và dài của con chuột chù naked lớn tuổi nhất thế giới
- Tôi không phải là robot! Vậy tại sao captchas không tin tôi?
- Gặp nhà đầu tư thiên thần tiếp theo của bạn. Họ mới 19 tuổi
- Cách dễ dàng để bán, quyên góp hoặc tái chế đồ của bạn
- 👁️ Khám phá trí tuệ nhân tạo như chưa bao giờ với cơ sở dữ liệu mới của chúng tôi
- 🎮 MYTOUR Games: Nhận những mẹo mới nhất, đánh giá và nhiều hơn nữa
- 🏃🏽♀️ Muốn có những công cụ tốt nhất để trở nên khỏe mạnh? Kiểm tra lựa chọn của đội Gear chúng tôi cho những chiếc đồng hồ theo dõi sức khỏe tốt nhất, đồ dùng chạy bộ (bao gồm giày dép và tất), và tai nghe tốt nhất
