Tại sao cần phải phân biệt sao lưu và lưu trữ dữ liệu

Trương Khánh Hợp| 25/07/2018 15:29
Theo dõi ICTVietnam trên

Sao lưu (back up) và lưu trữ (archive) dữ liệu có các chức năng riêng biệt và nếu người dùng có cả 2 chức năng trên, có thể dẫn đến các vấn đề về truy cập và thậm chí cả các vấn đề pháp lý. Tin tốt là sự khác biệt giữa sao lưu và lưu trữ khá rõ ràng và dễ hiểu

Backup vs. archive: Why it’s important to know the difference

Sao lưu – Back up là gì?

Back up là bản sao dữ liệu được tạo để khôi phục dữ liệu đã đề cập trong trường hợp có thiệt hại hoặc mất mát. Dữ liệu gốc sẽ không bị xóa sau khi sao lưu được thực hiện.

Ví dụ về các bản sao lưu bao gồm bản sao lưu hàng đêm của tất cả các tệp trên máy tính xách tay hoặc máy tính để bàn của người dùng hoặc tất cả ảnh trên iPhone được sao chép sang iCloud trong trường hợp người dùng đánh rơi điện thoại. Người dùng cũng sao lưu các tệp máy chủ (dữ liệu phi cấu trúc) và cơ sở dữ liệu (dữ liệu có cấu trúc). Một bản sao lưu có thể tập trung vào dữ liệu, như trong một kho chứa cơ sở dữ liệu, hệ điều hành của máy chủ, hoặc trên cả hai như với bản sao lưu của các tệp VMware .VMDK files.

Định nghĩa của back up thực sự chính là mục đích của back up, và mục đích của một bản sao lưu luôn giống nhau: để khôi phục dữ liệu nếu có vấn đề gì xảy ra với nó. Ví dụ, một khối RAID 6 (Redundant Arrays of Inexpensive Disks - là hình thức ghép nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa cứng có chức gia tăng tốc độ đọc/ghi dữ liệu hoặc nhằm tăng thêm sự an toàn của dữ liệu chứa trên hệ thống đĩa hoặc kết hợp cả hai yếu tố trên) có thể bị hỏng ba đĩa, và tất cả dữ liệu của nó sẽ cần được khôi phục. Ai đó có thể vô tình hoặc cố ý xóa một hoặc nhiều máy ảo trong cấu hình VMware, Hyper-V hoặc AWS EC2 của người dùng và chúng sẽ cần được khôi phục. Người dùng có thể một ngày nào đó sẽ nhận ra mọi tệp trong tổ chức của bạn đã được mã hóa bởi gói phần mềm ransomware. Nếu không có một hệ thống sao lưu tốt, lựa chọn của người dùng sẽ là trả tiền chuộc. Với một hệ thống sao lưu tốt, người dùng có thể tìm ra nguồn gốc của phần mềm ransomware để ngăn chặn, sau đó khôi phục tất cả dữ liệu và không phải trả tiền cho tin tặc.

Lưu trữ - Archive là gì?

Archive là bản sao dữ liệu được tạo cho mục đích tham chiếu. Mặc dù không bắt buộc, bản gốc thường bị xóa sau khi bản archive được tạo ra.

Mục đích của một bản back up là khôi phục một cái gì đó trở lại như bình thường (thông thường) như ngày hôm qua, tuy nhiên, archive có thể phục vụ nhiều mục đích. Mục đích phổ biến nhất là giúp người dùng tìm thấy một số dữ liệu từ một thời gian dài trước đây. Nó có thể là một tập tin duy nhất có một chứ thông tin thực sự quan trọng trong đó, chẳng hạn như một hợp đồng mà một khách hàng đã ký vài năm trước đây. Nó có thể là một nhóm dữ liệu liên quan, chẳng hạn như tất cả các bản vẽ cấu trúc của tòa nhà vừa bị sập. Hoặc nó có thể là tất cả các bản vẽ CAD của tiện ích mà công ty của bạn đã từng sử dụng và giờ đây bạn muốn tìm lại.

Một tập dữ liệu liên quan khác có thể là tất cả các email và / hoặc các tệp có thể chứng minh một vấn đề nhất định. Ví dụ một nhân viên cho rằng họ đã được phép thực hiện một nhiệm vụ, và sau đó bị sa thải vì đã làm như vậy. Vụ kiện này có thể đưa ra một yêu cầu điều tra điện tử để xem lại tất cả các email đến và đi có chứa các từ khóa liên quan đến nhiệm vụ. Trường hợp khác, một người có thể đang cố gắng chứng minh một môi trường làm việc thù địch và muốn xem tất cả các email từ một nhóm người quản lý cụ thể, trong đó có chứa một danh sách các từ nhất định.

Bản lưu trữ là những gì sẽ giúp người dùng hoàn thành tất cả các tác vụ này. Bạn có thể có một kho lưu trữ của toàn bộ đơn đặt hàng, báo giá hoặc hợp đồng mà doanh nghiệp bạn đã từng đưa ra. Người dùng có thể lưu trữ các hợp đồng và đơn đặt hàng hiện tại trực tuyến, nhưng nếu người dùng giữ tất cả các hợp đồng và đơn đặt hàng trong kho lưu trữ, và người dùng chỉ cần đặt chỉ mục để có thể dễ dàng truy xuất đơn đặt hàng và hợp đồng thông qua nội dung của các đơn đặt hàng đó. Bạn cũng có thể lưu trữ tất cả các email mà công ty của bạn đã gửi hoặc nhận.

Một số hệ thống lưu trữ email có thể lọc từ email máy chủ những email đã được lưu trữ có kích thước lớn hơn một kích thước nhất định và/hoặc chưa được truy cập trong hơn “n” ngày. Điều này giúp giữ cho hệ thống email gọn gàng, tiết kiệm không gian trên máy tính và tài nguyên lưu trữ, và làm cho nó dễ dàng hơn để sao lưu.

Khôi phục – restore và truy hồi – retrieval

Ngay cả khi mục đích của một kho lưu trữ là để tiết kiệm không gian trên kho lưu trữ chính, nó cần có khả năng thực truy hồi và khôi phục nếu nó được gọi là lưu trữ. Sao lưu khôi phục hệ thống và lưu trữ truy hồi hệ thống (Backup systems restore and archive systems retrieve).

Khi người dùng khôi phục lại một cái gì đó, nó thường là một tập tin duy nhất, máy chủ hoặc cơ sở dữ liệu. Khi người dùng truy hồi nội dung nào đó, đó thường là tập hợp các dữ liệu có liên quan, có thể được hoặc không được lưu trữ trên cùng một máy chủ hoặc thậm chí ở cùng một định dạng. Khôi phục cũng được thực hiện vào một thời điểm duy nhất, chẳng hạn như khôi phục cơ sở dữ liệu tại thời điểm hôm trước. Việc truy hồi được sử dụng một khoảng thời gian, chẳng hạn như tất cả các email trong ba năm qua.

Khôi phục yêu cầu người dùng phải biết về nơi mà các tập tin hoặc dữ liệu được lưu trữ khi nó được sao lưu; nếu không, người dùng không thể tìm thấy nó. Người dùng cũng cần phải biết tên của máy chủ, cơ sở dữ liệu hoặc thư mục mà tập tin được lưu trữ, tên của tệp hoặc bảng mà người dùng muốn sử dụng và ngày nó được nhìn tạo lần cuối. Truy hồi không cần có bất cứ thông tin nào trong số đó; người dùng chỉ biết rằng họ cần tất cả các tệp hoặc bản ghi khớp với một tập hợp các tham số. Truy hồi có thể cung cấp cho người dùng tất cả các tệp hoặc email đã được tạo trong ba năm qua có chứa một cụm từ cụ thể hoặc được tạo bởi một người cụ thể.

Tại sao sự khác biệt lại quan trọng?

Nhiều người cố gắng sử dụng hệ thống sao lưu của họ như một hệ thống lưu trữ, có nghĩa là họ giữ bản sao lưu của họ trong nhiều năm - hoặc thậm chí là mãi mãi. Lần đầu tiên người dùng nhận được yêu cầu truy hồi sẽ thấy rất khó khi thực hiện truy hồi một nội dung được đáng lẽ phải sử dụng khôi phục. Điều này sẽ làm cho quá trình truy hồi mất nhiều thời gian, nhiều khả năng mất tới cả tháng thay vì vài phút và tốn hàng triệu thay vì vài đô la.

Nếu việc truy hồi là yêu cầu điều tra điện tử từ một vụ kiện, và bạn không thể đáp ứng nó một cách kịp thời, bạn sẽ gặp nguy cơ thẩm phán đưa ra một hướng suy luận bất lợi. Bạn có thể đã dành sáu tháng để thỏa mãn những gì họ cho là đơn giản và bạn không biết bao giờ sẽ hoàn thành. Thẩm phán sẽ có thể cho rằng bạn đang cố che giấu điều gì đó, và họ nói với bồi thẩm đoàn. Bạn sẽ thua kiện. Ví dụ nổi tiếng nhất về vấn đề này là vụ kiện Morgan Stanley, họ đã bị mất hàng tỷ đô y hệt như những giả định vừa đặt ra.

Đừng sử dụng bản sao lưu của bạn làm lưu trữ. Nếu bạn có nhu cầu lưu trữ lâu dài, hãy sử dụng một hệ thống lưu trữ thực sự. Sẽ mất một chút chi phí, nhưng nó sẽ có giá trị trong thời gian dài.

Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
  • Khai thác dữ liệu phục vụ chỉ đạo, điều hành tại trung tâm IOC: Kinh nghiệm của Bình Phước
    Xác định dữ liệu là nguồn tài nguyên quý trong kỷ nguyên số - một trong những yếu tố quan trọng quyết định sự thành công của quá trình chuyển đổi số (CĐS), tỉnh Bình Phước đã sớm tập trung quan tâm tạo lập, khai thác, sử dụng, tăng cường chia sẻ, kết nối dữ liệu số cùng với việc thành lập IOC và những kết quả bước đầu thu được rất đáng ghi nhận.
  • Những người làm báo từ rừng về phố
    Ngày 30/4/1975, trong những cánh Giải phóng quân từ khắp nẻo tiến về Sài Gòn, có cả một đội quân nhà báo xuất phát từ các chiến khu hoặc hành quân theo các binh chủng, đã kịp thời có mặt, chứng kiến giây phút trọng đại: Giải phóng hoàn toàn miền nam, thống nhất đất nước.
  • Háo hức khám phá di tích lịch sử theo một cách mới
    Ứng dụng công nghệ số giúp nhiều du khách gia tăng trải nghiệm thú vị khi tới thăm các di tích lịch sử như Địa đạo Củ Chi, Dinh Độc Lập…
  • Mỹ phạt nhà mạng vì chia sẻ vị trí của người dùng
    Chính phủ Mỹ đã đưa ra mức phạt hàng triệu USD đối với các nhà mạng AT&T, Sprint, T-Mobile và Verizon sau một cuộc điều tra cho thấy các nhà mạng lớn của nước này đã chia sẻ bất hợp pháp dữ liệu cá nhân của thuê bao mà không có sự đồng ý của họ.
  • Các công cụ bảo mật đám mây dựa trên AI
    Ngày nay, AI tiên tiến đang được đưa vào sử dụng ở mọi loại hình doanh nghiệp (AI). Một loạt các nhà cung cấp bảo mật bên thứ ba đã phát hành các công cụ bảo mật đám mây dưới sự hỗ trợ của AI. Dường như đây là một trong những xu hướng nóng nhất trong ngành.
  • Oracle đầu tư mạnh vào AI tạo sinh, đáp ứng xu hướng "chủ quyền dữ liệu"
    Nhà cung cấp dịch vụ cơ sở hạ tầng đám mây của Hoa Kỳ Oracle đang tăng cường các tính năng trí tuệ nhân tạo (AI) tạo sinh của mình khi cạnh tranh trên thị trường điện toán đám mây (ĐTĐM) ngày càng khốc liệt và ngày càng có nhiều công ty nhảy vào lĩnh vực AI.
  • Mỹ lập hội đồng khuyến nghị ứng dụng AI an toàn cho hạ tầng trọng yếu
    Chính phủ Mỹ đã yêu cầu các công ty trí tuệ nhân tạo (AI) đưa ra khuyến nghị cách sử dụng công nghệ AI để bảo vệ các hãng hàng không, dịch vụ công cộng và cơ sở hạ tầng trọng yếu khác, đặc biệt là chống các cuộc tấn công sử dụng AI.
  • Làm gì để phát triển tài năng chuyển đổi?
    Partha Srinivasa, Giám đốc CNTT (CIO) của nhà cung cấp bảo hiểm tài sản và tai nạn Erie có trụ sở tại Pennsylvania, Mỹ đã chia sẻ về cách tiếp cận của ông trong việc xây dựng đội ngũ nhân viên có tinh thần chuyển đổi.
  • Báo chí ở mặt trận Điện Biên Phủ
    Chiến dịch Điện Biên Phủ là cuộc “hội quân” của cả nước. Trong cuộc “hội quân” lịch sử đó có sự tham gia và đóng góp không nhỏ của “đội quân báo chí”.
  • Những ấn phẩm đặc biệt kỷ niệm 70 năm chiến thắng Điện Biên Phủ
    Bộ ấn phẩm kỉ niệm 70 năm chiến thắng Điện Biên Phủ do Nhà xuất bản (NXB) Kim Đồng ấn hành, góp phần nhắc nhớ thế hệ trẻ về một thời hoa lửa, tự hào về khí phách Việt Nam, biết ơn các thế hệ cha anh đi trước, và trân trọng nền hòa bình mà chúng ta đang sống hôm nay.
Tại sao cần phải phân biệt sao lưu và lưu trữ dữ liệu
POWERED BY ONECMS - A PRODUCT OF NEKO