Mất kết nối dịch vụ web và CDN toàn cầu do Fastly, ảnh hưởng thế nào?

Các trang web và ứng dụng trên khắp thế giới đã mất kết nối, ngừng hoạt động trong ngày 8/6 sau khi Fastly, một mạng phân phối nội dung lớn, báo cáo có sự cố trên diện rộng.

VH-LP
11:47 AM 09/06/2021
In bài viết này
Mất kết nối dịch vụ web và CDN toàn cầu do Fastly, ảnh hưởng thế nào?

Chia sẻ bài viết này

Sự cố mất kết nối ảnh hưởng đến hàng chục quốc gia trên khắp châu Mỹ, châu Âu, châu Á và Nam Phi. Các trang web, ứng dụng CNN, Guardian, New York Times và các trang web thương mại điện tử Amazon, Target hay trang web của Chính phủ Anh Gov.uk đã ngừng hoạt động. Fastly cũng cung cấp phân phối nội dung cho Twitter, Pinterest, HBO Max, Hulu, Reddit, Spotify và các dịch vụ khác.

Cụ thể, vào khoảng 2h58 theo giờ PT (múi giờ Thái Bình Dương), Fastly ghi nhận một lỗi và thông báo trên trang cập nhật trạng thái: "Chúng tôi hiện đang điều tra tác động tiềm ẩn đến hiệu suất của các dịch vụ web và CDN (mạng phân phối nội dung) của chúng tôi".

Mất kết nối dịch vụ web và CDN toàn cầu do Fastly, ảnh hưởng thế nào - Ảnh 1.

Ngay sau đó, các thông tin về sự cố mất kết nối xuất hiện trên Twitter về các tờ báo, trang mạng lớn bao gồm BBC, CNN và The New York Times đang ngoại tuyến. Bản thân Twitter vẫn chạy, mặc dù máy chủ lưu trữ các biểu tượng cảm xúc của nó đã bị lỗi, dẫn đến một số tweet trông không bình thường.

Nhiều người nghĩ đây là một sự cố đơn lẻ chỉ ảnh hưởng đến các trang web riêng lẻ nhưng hóa ra đây là một sự cố mất kết nối dịch vụ Internet của Fastly trên diện rộng đã khiến người sử dụng dịch vụ không thể truy cập được. Mọi người trên toàn cầu, đã nhận được thông báo "Lỗi mất dịch vụ 503" (Error 503 Service Unavailable) khi họ cố gắng truy cập các trang web, bao gồm một số dịch vụ quan trọng, chẳng hạn như các trang web gov.uk của chính phủ Vương quốc Anh.

Mất kết nối dịch vụ web và CDN toàn cầu do Fastly, ảnh hưởng thế nào - Ảnh 2.

Gần một giờ sau, lúc 6h44 theo giờ ET (múi giờ miền Đông của Tây Bán Cầu), vào buổi trưa ở Vương quốc Anh - Fastly đã nhanh chóng cập nhật lại trang trạng thái của mình để thông báo sự cố đã được xác định và đang triển khai bản sửa lỗi.

Vào lúc 4h10 theo giờ PT, công ty này đã có dòng tweet: "Chúng tôi đã xác định cấu hình dịch vụ gây ra gián đoạn trên các POP của chúng tôi trên Internet và đã vô hiệu hóa cấu hình đó. Mạng Internet của chúng tôi sẽ trực tuyến trở lại". Thông điệp tương tự đã được gửi đến CNET dưới dạng bình luận của người phát ngôn của Fastly.

Fastly là gì?

Fastly là một nhà cung cấp dịch vụ điện toán đám mây, có trụ sở chính tại San Francisco, Mỹ hoạt động từ năm 2011. Vào năm 2017, họ đã đưa ra một nền tảng đám mây cạnh (edge cloud) được thiết kế để đưa các trang web đến gần hơn với những người sử dụng chúng. Về mặt hiệu quả, điều này có nghĩa là nếu bạn đang truy cập một trang web được lưu trữ ở một quốc gia khác, nó sẽ lưu trữ một số trang web đó gần bạn hơn để không cần lãng phí băng thông bằng cách tìm nạp tất cả nội dung của trang web đó từ xa mỗi khi bạn cần nó.

Điều này giúp thời gian tải trang web nhanh hơn và tối ưu hóa hình ảnh, video và các nội dung video có kích thước file lớn khác cho phép hiển thị nhanh và mượt mỗi khi bạn truy cập vào một trang web. Theo như trên trang web của công ty này cho biết nền tảng giúp tải các trang trên Buzzfeed nhanh hơn 50% và cho phép The New York Times xử lý đồng thời 2 triệu độc giả trong đêm bầu cử Tổng thống Mỹ vừa qua. Điện toán biên cũng thực hiện các chức năng an ninh mạng quan trọng, bảo vệ các trang web khỏi các cuộc tấn công DDoS và botnet, cũng như cung cấp tường lửa cho ứng dụng web.

Do dịch vụ của Fastly nằm giữa các máy chủ web phía back-end (mặt sau) và Internet ở phía front end (mặt ngoài), nên theo lý giải của một chuyên gia CNTT, bất kỳ lỗi nào ở đây đều có thể khiến toàn bộ trang web không khả dụng. Do tính chất nội địa hóa của thuộc tính biên trên nền tảng đám mây, điều đó cũng có nghĩa là các lỗi không ảnh hưởng đến tất cả các khu vực trong cùng thời điểm (mặc dù mọi người trên khắp thế giới đã báo cáo sự cố đã gặp phải vào 8/6).

Lỗi 503 là gì?

"Lỗi 503" là cách nói của máy tính để nói rằng điểm đến trực tuyến hiện không khả dụng. Tất cả các trang web và dịch vụ được lưu trữ trên máy tính được gọi là máy chủ. Lỗi 503 xảy ra khi kết nối đó bị chặn do máy chủ ngừng hoạt động để bảo trì hoặc do có lỗi ngẫu nhiên.

Lỗi cũng có thể là do máy chủ bị quá tải do lưu lượng truy cập quá nhiều. Trong một số trường hợp, lỗi có thể do phía người dùng, và được khắc phục bằng cách làm mới trang hoặc khởi động lại máy tính.

Tuy nhiên, nếu đó là một vấn đề lớn hơn, thì cần phải đợi máy chủ lưu trữ và xác nhận lại - việc đó Fastly đang làm.

Tại sao Fastly xảy ra lỗi?

Sự cố ngắt kết nối Internet 8/6 là do "cấu hình dịch vụ", nhưng chỉ một phần bị mất kết nối dịch vụ. Chỉ đến khi Fastly điều tra đầy đủ, mọi người mới biết được nguyên nhân gốc rễ của sự mất kết nối này. Điều quan trọng là sự cố không phải là một cuộc tấn công an ninh mạng, như nhiều người đã suy đoán trên Twitter. Có nhiều lý do về kỹ thuật khiến CDN có thể lỗi và các cuộc tấn công mạng chỉ là một trong số đó.

Tại sao rất nhiều trang web bị ảnh hưởng bởi sự cố mất kết nối dịch vụ của Fastly?

Dịch vụ của Fastly được sử dụng rộng rãi bởi các nhà xuất bản và dịch vụ web. Lý do rất phổ biến là Fastly có thể cung cấp được nhiều dịch vụ web và CDN mà không có nhiều công ty khác có thể cung cấp các dịch vụ như của họ. Do đó, vẫn có một số công ty được cài đặt các nền tảng online thiết yếu vẫn có thể tiếp tục hoạt động. Các vấn đề tương tự cũng đã xảy ra khi Cloudflare gặp sự cố ngừng hoạt động vào tháng 7 năm ngoái và khi dịch vụ web của Amazon ngừng hoạt động vào tháng 11 năm ngoái.

Theo CNET, như Corinne Cath-Speth, tiến sỹ tại Viện Internet Oxford và Viện Alan Turing đã chỉ ra trên Twitter, điều này có nghĩa là "một trục trặc kỹ thuật trong một công ty có thể gây ra những phân nhánh rất lớn".

Qua sự cố này, từ bây giờ sẽ có nhiều câu hỏi liên quan đến mức độ ảnh hưởng trong trường hợp cung cấp dịch vụ web và CDN mất kết nối dịch vụ trong thời gian dài, và nhiều nghi vấn không có lời giải khi mà một trục trặc kỹ thuật trong một công ty có thể gây ra tổn thất lớn cho khách hàng sử dụng dịch vụ CDN./.