Giải pháp nào cho độ tin cậy của dịch vụ điện toán đám mây

Diễn đàn - Ngày đăng : 07:21, 04/11/2015

Chỉ cần hỏi Jeff Malek, đồng sáng lập của BigDoor, một công ty Seattle có phần mềm trò chơi được lưu trữ trên các máy chủ công cộng của Amazon. Tháng Tư năm ngoái, các vấn đề trong một trung tâm dữ liệu ở Northern Virginia đã làm tê liệt các hoạt động ở vùng đông bắc của Amazon, gây ảnh hưởng đến nhiều doanh nghiệp dựa trên điện toán đám mây. Dịch vụ đã mất ổn định trong vòng bốn ngày đã khiến BigDoor phải vật lộn để tìm các giải pháp kỹ thuật và gửi xin lỗi chính thức đến 250 khách hàng.

Mặc dù điện toán đám mây khả năng mở rộng và tiện lợi chưa từng có, nhưng nó có một vấn đề đó là: độ tin cậy.

Chỉ cần hỏi Jeff Malek, đồng sáng lập của BigDoor, một công ty Seattle có phần mềm trò chơi được lưu trữ trên các máy chủ công cộng của Amazon. Tháng Tư năm ngoái, các vấn đề trong một trung tâm dữ liệu ở Northern Virginia đã làm tê liệt các hoạt động ở vùng đông bắc của Amazon, gây ảnh hưởng đến nhiều doanh nghiệp dựa trên điện toán đám mây. Dịch vụ đã mất ổn địnhtrong vòng bốn ngày đã khiến BigDoor phải vật lộn để tìm các giải pháp kỹ thuật và gửi xin lỗi chính thức đến 250 khách hàng.

Kể từ đó, BigDoor đã tham gia vào một số lượng ngày càng tăng của các công ty đang tìm kiếm cách thức mới để xây dựng hệ thống chống mất điện trong các đám mây, thường phải bổ sung thêm chi phí và có nhiều sự bất tiện.

Các nhà cung cấp dịch vụ điện toán đám mây lớn như Salesforce.com, Microsoft, và Google tất cả đều đã từng bị cúp điện. Ví dụ, trong một khoảng thời gian 30 ngày trong tháng Tám và tháng Chín, các ứng dụng dựa trên đám mây của Google đã bị ngắt điện sáu lần, theo Bảng điều khiển trạng thái các ứng dụng của công ty, bao gồm cả lần ngắt điện trong vòng một tiếng đã chặn vài triệu người sử dụng Google Docs vào ngày 7/9. Mất một trường hợp ngắt điện bị gây ra bởi những sự kiện không thể đoán trước như sét đánh, nhưng những lần cập nhật phần mềm thường là thủ phạm. Google cho biết những thay đổi đối với phần mềm của họ đã khiến cho Google Docs ngừng hoạt động, và một nỗ lực để chạy mã cập nhật cũng là lý do của trường hợp ngắt điện e-mail lớn, gây ảnh hưởng đến người sử dụng điện thoại BlackBerry ở châu Âu trong tháng này.

Mặc dù những sự cố ngắt điện thường phát sinh nhiều rủi ro lớn cho các doanh nghiệp, nhưng các nhà cung cấp dịch vụ điện toán đám mây công cộng vẫn không cung cấp một sự bảo đảm chắc chắn. Một số người trong ngành công nghiệp tin rằng các nhà cung cấp đám mây công cộng như Amazon nên nhằm mục đích sẵn sàng 99,999%, hoặc thời gian chết chỉ khoảng năm phút một năm.

Cho đến lúc đó, các doanh nghiệp vẫn phải đối phó với thực tế của dịch vụ không hoàn hảo. "Đối với tôi, thỏa thuận dịch vụ được tạo ra bởi các quan chức và luật sư", Malek nói. "Những gì tôi quan tâm là mức độ đáng tin cậy của các dịch vụ đám mây, và những việc mà một nhà cung cấp thực hiện để chuẩn bị cho sự cố ngắt điện."

Amazon có các trung tâm dữ liệu điện toán tại năm khu vực trên thế giới. Các công ty có thể lựa chọn để chạy các ứng dụng ở nhiều vùng như là một biện pháp phòng ngừa theo cùng một cách bạn muốn sao lưu máy tính của bạn vào một ổ đĩa cứng gắn ngoài. Ngay sau khi xảy ra sự cố mất điện lớn trong tháng Tư, BigDoor đã nâng cấp các máy chủ dịch vụ của mình trong nhiều khu vực của Amazon. Tuy nhiên, điều này đã dẫn đến một sự gia tăng 5% chi phí hàng tháng của công ty.

Netflix, một công ty khác cũng sử dụng điện toán đám mây của Amazon để truyền phát video trực tuyến, đang có những nỗ lực mang tính kỹ thuật để bảo vệ điện toán đám mây. Sau khi xảy ra vấn đề ở Amazon, công ty này đã phát triển Chaos Gorilla, phần mềm nội bộ cho phép các kỹ sư của họ mô phỏng cách để các hệ thống của Netflix có thể định tuyến lại dữ liệu một cách hiệu quả khi một vùng mạng bị ngắt điện.

Một công ty nói rằng mình không bị ảnh hưởng bởi các vấn đề điện toán đám mây gần đây là SimpleGeo, một công ty có trụ sở tại San Francisco và sử dụng Amazon để phục vụ các công cụ nhận biết về vị trí củacác khách hàng. SimpleGeo không bị ảnh hưởng bởi sự cố ngắt điện của Amazon nhờ sử dụng một kỹ thuật gọi là “back-pressure routing” (định tuyến áp lực trở lại). Mặc dù SimpleGeo có thể tránh mất mạng, nhưng họ lại phải mất một khoản chi phí đáng kể. "Chúng tôi có ba kỹ sư dành toàn bộ thời gian của mình để xây dựng các công cụ nội bộ để quản lý cơ sở hạ tầng của chúng tôi", người đồng sáng lập và Giám đốc công nghệ Joe Stump, cho biết.

Minh Phượng