Hiệu quả sử dụng năng lượng của Trung tâm dữ liệu tăng lên có thể gây ra ngừng hoạt động tạm thời

Chính phủ số - Ngày đăng : 23:11, 20/08/2018

Một cuộc khảo sát của Viện Uptime cho thấy hiệu quả sử dụng năng lượng của các trung tâm dữ liệu là tốt hơn bao giờ hết. Tuy nhiên, tỷ lệ ngừng hoạt động tạm thời đã tăng đáng kể.

Data center power efficiency and power outages both increase

Một cuộc khảo sát từ Viện Uptime đã phát hiện ra rằng trong khi các trung tâm dữ liệu đang ngày càng quản lý tốt hơn bao giờ hết, tỷ lệ thất bại cũng tăng lên - và đây là mối quan hệ nhân quả.

Báo cáo Khảo sát Trung tâm Dữ liệu Toàn cầu của Viện Uptime thu thập phản hồi từ gần 900 nhà điều hành trung tâm dữ liệu và các học viên CNTT, cả từ các nhà cung cấp trung tâm dữ liệu lớn và từ các trung tâm dữ liệu do tư nhân sở hữu.

Nó nhận thấy rằng hiệu quả sử dụng năng lượng (PUE) của các trung tâm dữ liệu đã đạt mức thấp nhất mọi thời đại là 1,58. Ngược lại, chỉ số PUE trung bình trong năm 2007 là 2,5, sau đó giảm xuống 1,98 năm 2011 và xuống còn 1,65 trong cuộc khảo sát năm 2013.

PUE là thước đo năng lượng cần thiết để vận hành và làm mát một trung tâm dữ liệu. “PUE of 2” có nghĩa là cho mỗi watt điện để chạy trung tâm dữ liệu, một watt là cần thiết để làm mát nó. “PUE of 1.5” có nghĩa là cho mỗi watt vào hệ thống CNTT, một nửa của một watt là cần thiết để làm mát. Vì vậy, việc giảm PUE là điều ám ảnh giữa các nhà khai thác trung tâm dữ liệu.

Tuy nhiên, thời gian hoạt động cũng cho thấy xu hướng tiêu cực: Số lần ngừng cơ sở hạ tầng và sự cố “xuống cấp dịch vụ nghiêm trọng” tăng lên 31% trong số những người được khảo sát, tăng 6 điểm phần trăm so với 25% của năm ngoái. Trong ba năm qua, gần một nửa đã trải qua một sự cố ngừng hoạt động tại trang web của riêng họ hoặc trang web của nhà cung cấp dịch vụ.

Điều gì gây ra việc ngừng hoạt động của trung tâm dữ liệu?

Nguyên nhân hàng đầu của việc ngừng hoạt động của trung tâm dữ liệu là mất điện (33%), lỗi mạng (30%), nhân viên CNTT hoặc lỗi phần mềm (28%), thất bại tại chỗ (12%) và nhà cung cấp dịch vụ bên thứ ba cúp điện (31%).

Sai lầm là con người, và cuộc khảo sát này cho thấy nó. Gần 80% cho biết sự cố ngừng hoạt động gần đây nhất của họ có thể đã bị ngăn chặn. Và lỗi của con người kéo dài đến các quyết định quản lý, Ascierto nói.

Thông thường, mọi người nói về lỗi của con người là nguyên nhân gây cúp điện, nhưng nó có thể bao gồm các lỗi quản lý, như thiết bị được bảo trì kém hoặc có nguồn gốc có thể không phù hợp với yêu cầu thời gian chạy. Lỗi của con người là do trách nhiệm quản lý.

Một nguyên nhân khác của thất bại là có một xu hướng hướng tới việc hợp nhất trung tâm dữ liệu, với các công ty di chuyển khối lượng công việc từ trung tâm dữ liệu thứ cấp sang trung tâm dữ liệu chính. Điều này cần có thời gian và kể từ khi trung tâm dữ liệu phụ được ngừng hoạt động, chủ sở hữu không đầu tư vào nó nữa. Vì vậy, việc khối lượng dữ liệu khổng lồ giữa hai trung tâm làm cho nó nhiều khả năng thất bại.

Một nguyên nhân khác cho các vấn đề là hiệu ứng xếp tầng của một trung tâm dữ liệu lấy xuống các trung tâm dữ liệu khác. Đó có thể là hai trung tâm dữ liệu riêng biệt hoặc một tình huống tại nơi một trung tâm tại chỗ được kết nối với một nhà cung cấp bên thứ ba như Amazon hoặc Microsoft. Thời gian hoạt động cho thấy 24% những người được khảo sát cho biết họ bị ảnh hưởng bởi sự cố ngừng hoạt động trên nhiều trung tâm dữ liệu. Năm năm trước, nó là con số thấp hơn nhiều, hy vọng rằng sự gia tăng việc tạm ngừng hoạt động gây ra bởi sự thất bại giữa nhiều trang web, vì ngày càng có nhiều công ty đang áp dụng nhiều chiến lược dịch vụ đám mây, cũng như sự phụ thuộc lẫn nhau ngày càng tăng của nhiều dịch vụ CNTT.

Có niềm tin rằng việc sử dụng kiến trúc lai giúp bạn linh hoạt hơn, nhưng khả năng hiển thị và trách nhiệm giải trình thì khó khăn hơn và tỷ lệ bị ngừng chạy cao hơn.

Nguyễn Thùy Linh, Mai Linh, Lâm Thị Nguyệt