Khôi phục thảm họa đảm bảo tính hoạt động liên tục của doanh nghiệp

04:42 PM 17/07/2018 In bài viết

disaster recovery plan tsThiên tai có nhiều hình thức và quy mô khác nhau. Thảm họa không chỉ là thiên tai như bão, động đất và lốc xoáy mà còn cả các sự cố như tấn công mạng, thiết bị hỏng và thậm chí cả khủng bố.

Các công ty và tổ chức chuẩn bị đối phó bằng cách tạo ra các kế hoạch khôi phục thảm họa bao gồm các hành động cụ thể và quy trình cần tuân theo để tiếp tục các chức năng quan trọng một cách nhanh chóng và không gây tổn thất lớn về doanh thu hoặc công việc kinh doanh.

Khôi phục thảm họa là gì?

Trong không gian CNTT, khắc phục thảm họa tập trung vào các hệ thống CNTT giúp hỗ trợ các chức năng kinh doanh quan trọng. Thuật ngữ "kinh doanh liên tục" thường liên quan đến khắc phục thảm họa, nhưng hai thuật ngữ này không hoàn toàn thay thế được nhau. Khôi phục thảm họa là một phần của tính liên tục trong kinh doanh, tập trung nhiều hơn vào việc duy trì hoạt động của một doanh nghiệp bất chấp thảm họa. Bởi vì hệ thống CNTT trong thời gian này là rất quan trọng cho sự thành công của doanh nghiệp, khắc phục thảm họa là một bộ phận chính trong quá trình kinh doanh liên tục.

Chi phí do thảm họa gây ra

Thảm họa có thể gây ra những thổn thất về mặt kinh tế và hoạt động của doanh nghiệp, đặc biệt những doanh nghiệp không có sự chuẩn bị.  Theo một báo cáo năm 2015 của Hội đồng Chuẩn bị khắc phục Thiên tai (DRP), một giờ ngừng kinh doanh có thể gây tổn thất 8.000 đôla với các công ty nhỏ, 74,000 đôla với các công ty vừa và có thể lên đến 700.000 đôla với các công ty quy mô lớn.

Một cuộc khảo sát khác từ nhà cung cấp dịch vụ khắc phục thảm họa Zetta cho thấy hơn một nửa số công ty được khảo sát (54%) đã trải qua quãng thời gian ngừng kinh doanh kéo dài hơn tám giờ trong năm năm qua. Hai phần ba số người được khảo sát cho biết doanh nghiệp của họ mất hơn 20.000 đô la cho mỗi ngày ngừng hoạt động.

Đánh giá rủi ro xác định các lỗ hổng

Ngay cả khi công ty của bạn đã có một số kế hoạch khôi phục thảm họa, cũng cần thời gian để cập nhật. Nếu công ty của bạn không có, và bạn được giao nhiệm vụ xây dựng kế hoạch, đừng làm gì mà không đánh giá rủi ro. Xác định các lỗ hổng của cơ sở hạ tầng CNTT công ty và những khu vực chứa lỗ hổng. Điều kiện tiên quyết là biết được cơ sở hạ tầng CNTT như thế nào.

Biết được sai sót không có nghĩa là bạn bắt đầu tạo ra kế hoạch cho kịch bản xấu nhất. Trong một bài blog gần đây trên tạp chí Disaster Recovery Journal, các tác giả Tom Roepke và Steven Goldman đề nghị đặt tên kịch bản xấu nhất trong lập kế hoạch kinh doanh liên tục có thể nguy hiểm bằng cách thu hút sự chú ý từ các mối đe dọa quan trọng khác:

“Xu hướng tự nhiên là cố gắng đặt tên hoặc xác định kịch bản trường hợp xấu nhất. Điều này là sai lầm chết người bởi vì nó định hình toàn bộ nỗ lực lập kế hoạch sau đó, ngay cả khi nó chỉ đang ở mức tiềm thức. Vì vậy, khi chúng tôi chèn một kịch bản có tên - đại dịch, động đất, tấn công mạng, v.v. - chúng tôi tự động bắt đầu suy nghĩ và lập kế hoạch đối phó/phục hồi cho sự cố cụ thể  hoặc được xác định trong tiềm thức. Khi thảm họa xảy ra, chúng ta không chỉ có xu hướng hướng hạn chế tầm nhìn xây dựng kế hoạch, mà còn bộc lộ các rủi ro. Điều này là bởi vì chúng ta chỉ tập trung vào một hoặc hai khu vực mà chúng ta nghĩ xảy ra trường hợp xấu nhất mà không phải là thực tế diễn ra. ”

Theo Roepke và Goldman, chìa khóa của vấn đề là tập trung vào "quản lý khủng hoảng, khôi phục các chức năng quan trọng của doanh nghiệp và phục hồi, liên lạc với các bên liên quan."

Chương trình phục hồi thảm họa

Gõ từ khóa "mẫu kế hoạch khôi phục thảm họa" trên Google, bạn sẽ thấy hàng chục thậm chí hàng trăm mẫu xuất hiện. Hãy sử dụng chúng và sửa đổi cho phù hợp với công ty của bạn.

Kế hoạch phục hồi thảm họa cần gồm những nội dung sau đây:

•             Tuyên bố, tổng quan và mục tiêu chính của kế hoạch.

•             Thông tin liên lạc của các nhân viên chủ chốt và các thành viên nhóm khôi phục thảm họa.

•             Mô tả các hành động ứng phó khẩn cấp ngay sau thảm họa.

•             Sơ đồ của toàn bộ mạng IT và trang web phục hồi. Đừng quên hướng dẫn nhân viên về cách tiếp cận trang web khôi phục khi cần.

•             Xác định các tài sản CNTT quan trọng nhất và xác định thời gian ngừng hoạt động tối đa. Tìm hiểu thuật ngữ mục tiêu điểm phục hồi (RPO) và Mục tiêu thời gian phục hồi (RTO). RPO cho biết thời gian tối đa khôi phục các tệp dữ liệu từ bộ nhớ sao lưu để tiếp tục các hoạt động bình thường sau khi xảy ra thảm họa. Nếu bạn chọn RPO trong năm giờ, thì hệ thống phải sao lưu ít nhất 5 giờ một lần. RTO là khoảng thời gian tối đa, sau thảm họa, để doanh nghiệp khôi phục các tệp của nó từ bộ nhớ sao lưu và tiếp tục các hoạt động bình thường. Nếu RTO của bạn là ba giờ, thì RTO không thể hoạt động lâu hơn.

•             Danh sách các phần mềm, mã bản quyền và hệ thống sẽ được sử dụng để khôi phục.

•             Tài liệu kỹ thuật của các nhà cung cấp trên phần mềm hệ thống công nghệ phục hồi.

•             Tóm tắt hợp đồng bảo hiểm.

•             Đề xuất để giải quyết các vấn đề tài chính và pháp lý, cũng như tiếp cận phương tiện truyền thông.

Lập nhóm phục hồi thảm họa

Các thành viên nhóm CNTT chịu trách nhiệm về cơ sở hạ tầng CNTT quan trọng của công ty cần phối hợp thực hiện kế hoạch. Những người khác cần biết kế hoạch bao gồm các giám đốc điều hành hoặc giám đốc, lãnh đạo bộ phận, bộ phận nhân sự và quan hệ công chúng.

Ngoài ra cũng cần thu thập thông tin của các nhà cung cấp liên quan đến thảm họa (ví dụ phần mềm và sao lưu dữ liệu) và thông tin liên lạc của họ. Ngoài ra cần liệt kê thông tin của chủ tòa nhà, người quản lý tài sản, người phụ trách pháp lý và người ứng cứu khẩn cấp (và được cập nhật thường xuyên dưới dạng tên hoặc số điện thoại thay đổi).

Khi kế hoạch được lập và được ban lãnh đạo phê duyệt, hãy kiểm tra kế hoạch và cập nhật nếu cần. Hãy lên chương trình cho đợt soát xét  sắp tới và / hoặc kiểm tra các chức năng khôi phục thảm họa. Liên tục cập nhật dưới dạng sự kiện dù lớn hay nhỏ. Đừng chỉ cất kế hoạch trong ngăn kéo và nghĩ rằng thảm họa sẽ không xảy ra.

Khi thảm họa xảy ra

Nếu một thảm họa xảy ra, cần bắt đầu thực hiện công tác ứng phó. Đảm bảo rằng nhóm phản ứng sự cố (nếu khác với nhóm lập kế hoạch khắc phục thảm họa) có bản sao của kế hoạch khôi phục thảm họa.

Phản ứng sự cố liên quan đến việc đánh giá tình hình (nhận biết thảm họa ảnh hưởng đến phần cứng, phần mềm, hệ thống nào), khôi phục hệ thống và theo dõi (những phần đã hoạt động, những phần không hiệu quả, những phần cần được cải thiện).

Tiếp theo hãy sử dụng công nghệ đám mây hay kế hoạch khôi phục

Giống như nhiều hệ thống CNTT khác của doanh nghiệp, khôi phục thảm họa cũng cần chuyển sang công nghệ đám mây. Lợi ích của đám mây bao gồm chi phí thấp hơn, triển khai dễ dàng hơn và khả năng kiểm tra kế hoạch thường xuyên. Tuy nhiên, điều này làm tăng nhu cầu băng thông rộng hoặc làm suy giảm hiệu suất mạng của công ty vì các hệ thống phức tạp hơn.

Hồng Phương