Tại sao cần phải phân biệt sao lưu và lưu trữ dữ liệu

Trương Khánh Hợp| 25/07/2018 15:29
Theo dõi ICTVietnam trên

Sao lưu (back up) và lưu trữ (archive) dữ liệu có các chức năng riêng biệt và nếu người dùng có cả 2 chức năng trên, có thể dẫn đến các vấn đề về truy cập và thậm chí cả các vấn đề pháp lý. Tin tốt là sự khác biệt giữa sao lưu và lưu trữ khá rõ ràng và dễ hiểu

Backup vs. archive: Why it’s important to know the difference

Sao lưu – Back up là gì?

Back up là bản sao dữ liệu được tạo để khôi phục dữ liệu đã đề cập trong trường hợp có thiệt hại hoặc mất mát. Dữ liệu gốc sẽ không bị xóa sau khi sao lưu được thực hiện.

Ví dụ về các bản sao lưu bao gồm bản sao lưu hàng đêm của tất cả các tệp trên máy tính xách tay hoặc máy tính để bàn của người dùng hoặc tất cả ảnh trên iPhone được sao chép sang iCloud trong trường hợp người dùng đánh rơi điện thoại. Người dùng cũng sao lưu các tệp máy chủ (dữ liệu phi cấu trúc) và cơ sở dữ liệu (dữ liệu có cấu trúc). Một bản sao lưu có thể tập trung vào dữ liệu, như trong một kho chứa cơ sở dữ liệu, hệ điều hành của máy chủ, hoặc trên cả hai như với bản sao lưu của các tệp VMware .VMDK files.

Định nghĩa của back up thực sự chính là mục đích của back up, và mục đích của một bản sao lưu luôn giống nhau: để khôi phục dữ liệu nếu có vấn đề gì xảy ra với nó. Ví dụ, một khối RAID 6 (Redundant Arrays of Inexpensive Disks - là hình thức ghép nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa cứng có chức gia tăng tốc độ đọc/ghi dữ liệu hoặc nhằm tăng thêm sự an toàn của dữ liệu chứa trên hệ thống đĩa hoặc kết hợp cả hai yếu tố trên) có thể bị hỏng ba đĩa, và tất cả dữ liệu của nó sẽ cần được khôi phục. Ai đó có thể vô tình hoặc cố ý xóa một hoặc nhiều máy ảo trong cấu hình VMware, Hyper-V hoặc AWS EC2 của người dùng và chúng sẽ cần được khôi phục. Người dùng có thể một ngày nào đó sẽ nhận ra mọi tệp trong tổ chức của bạn đã được mã hóa bởi gói phần mềm ransomware. Nếu không có một hệ thống sao lưu tốt, lựa chọn của người dùng sẽ là trả tiền chuộc. Với một hệ thống sao lưu tốt, người dùng có thể tìm ra nguồn gốc của phần mềm ransomware để ngăn chặn, sau đó khôi phục tất cả dữ liệu và không phải trả tiền cho tin tặc.

Lưu trữ - Archive là gì?

Archive là bản sao dữ liệu được tạo cho mục đích tham chiếu. Mặc dù không bắt buộc, bản gốc thường bị xóa sau khi bản archive được tạo ra.

Mục đích của một bản back up là khôi phục một cái gì đó trở lại như bình thường (thông thường) như ngày hôm qua, tuy nhiên, archive có thể phục vụ nhiều mục đích. Mục đích phổ biến nhất là giúp người dùng tìm thấy một số dữ liệu từ một thời gian dài trước đây. Nó có thể là một tập tin duy nhất có một chứ thông tin thực sự quan trọng trong đó, chẳng hạn như một hợp đồng mà một khách hàng đã ký vài năm trước đây. Nó có thể là một nhóm dữ liệu liên quan, chẳng hạn như tất cả các bản vẽ cấu trúc của tòa nhà vừa bị sập. Hoặc nó có thể là tất cả các bản vẽ CAD của tiện ích mà công ty của bạn đã từng sử dụng và giờ đây bạn muốn tìm lại.

Một tập dữ liệu liên quan khác có thể là tất cả các email và / hoặc các tệp có thể chứng minh một vấn đề nhất định. Ví dụ một nhân viên cho rằng họ đã được phép thực hiện một nhiệm vụ, và sau đó bị sa thải vì đã làm như vậy. Vụ kiện này có thể đưa ra một yêu cầu điều tra điện tử để xem lại tất cả các email đến và đi có chứa các từ khóa liên quan đến nhiệm vụ. Trường hợp khác, một người có thể đang cố gắng chứng minh một môi trường làm việc thù địch và muốn xem tất cả các email từ một nhóm người quản lý cụ thể, trong đó có chứa một danh sách các từ nhất định.

Bản lưu trữ là những gì sẽ giúp người dùng hoàn thành tất cả các tác vụ này. Bạn có thể có một kho lưu trữ của toàn bộ đơn đặt hàng, báo giá hoặc hợp đồng mà doanh nghiệp bạn đã từng đưa ra. Người dùng có thể lưu trữ các hợp đồng và đơn đặt hàng hiện tại trực tuyến, nhưng nếu người dùng giữ tất cả các hợp đồng và đơn đặt hàng trong kho lưu trữ, và người dùng chỉ cần đặt chỉ mục để có thể dễ dàng truy xuất đơn đặt hàng và hợp đồng thông qua nội dung của các đơn đặt hàng đó. Bạn cũng có thể lưu trữ tất cả các email mà công ty của bạn đã gửi hoặc nhận.

Một số hệ thống lưu trữ email có thể lọc từ email máy chủ những email đã được lưu trữ có kích thước lớn hơn một kích thước nhất định và/hoặc chưa được truy cập trong hơn “n” ngày. Điều này giúp giữ cho hệ thống email gọn gàng, tiết kiệm không gian trên máy tính và tài nguyên lưu trữ, và làm cho nó dễ dàng hơn để sao lưu.

Khôi phục – restore và truy hồi – retrieval

Ngay cả khi mục đích của một kho lưu trữ là để tiết kiệm không gian trên kho lưu trữ chính, nó cần có khả năng thực truy hồi và khôi phục nếu nó được gọi là lưu trữ. Sao lưu khôi phục hệ thống và lưu trữ truy hồi hệ thống (Backup systems restore and archive systems retrieve).

Khi người dùng khôi phục lại một cái gì đó, nó thường là một tập tin duy nhất, máy chủ hoặc cơ sở dữ liệu. Khi người dùng truy hồi nội dung nào đó, đó thường là tập hợp các dữ liệu có liên quan, có thể được hoặc không được lưu trữ trên cùng một máy chủ hoặc thậm chí ở cùng một định dạng. Khôi phục cũng được thực hiện vào một thời điểm duy nhất, chẳng hạn như khôi phục cơ sở dữ liệu tại thời điểm hôm trước. Việc truy hồi được sử dụng một khoảng thời gian, chẳng hạn như tất cả các email trong ba năm qua.

Khôi phục yêu cầu người dùng phải biết về nơi mà các tập tin hoặc dữ liệu được lưu trữ khi nó được sao lưu; nếu không, người dùng không thể tìm thấy nó. Người dùng cũng cần phải biết tên của máy chủ, cơ sở dữ liệu hoặc thư mục mà tập tin được lưu trữ, tên của tệp hoặc bảng mà người dùng muốn sử dụng và ngày nó được nhìn tạo lần cuối. Truy hồi không cần có bất cứ thông tin nào trong số đó; người dùng chỉ biết rằng họ cần tất cả các tệp hoặc bản ghi khớp với một tập hợp các tham số. Truy hồi có thể cung cấp cho người dùng tất cả các tệp hoặc email đã được tạo trong ba năm qua có chứa một cụm từ cụ thể hoặc được tạo bởi một người cụ thể.

Tại sao sự khác biệt lại quan trọng?

Nhiều người cố gắng sử dụng hệ thống sao lưu của họ như một hệ thống lưu trữ, có nghĩa là họ giữ bản sao lưu của họ trong nhiều năm - hoặc thậm chí là mãi mãi. Lần đầu tiên người dùng nhận được yêu cầu truy hồi sẽ thấy rất khó khi thực hiện truy hồi một nội dung được đáng lẽ phải sử dụng khôi phục. Điều này sẽ làm cho quá trình truy hồi mất nhiều thời gian, nhiều khả năng mất tới cả tháng thay vì vài phút và tốn hàng triệu thay vì vài đô la.

Nếu việc truy hồi là yêu cầu điều tra điện tử từ một vụ kiện, và bạn không thể đáp ứng nó một cách kịp thời, bạn sẽ gặp nguy cơ thẩm phán đưa ra một hướng suy luận bất lợi. Bạn có thể đã dành sáu tháng để thỏa mãn những gì họ cho là đơn giản và bạn không biết bao giờ sẽ hoàn thành. Thẩm phán sẽ có thể cho rằng bạn đang cố che giấu điều gì đó, và họ nói với bồi thẩm đoàn. Bạn sẽ thua kiện. Ví dụ nổi tiếng nhất về vấn đề này là vụ kiện Morgan Stanley, họ đã bị mất hàng tỷ đô y hệt như những giả định vừa đặt ra.

Đừng sử dụng bản sao lưu của bạn làm lưu trữ. Nếu bạn có nhu cầu lưu trữ lâu dài, hãy sử dụng một hệ thống lưu trữ thực sự. Sẽ mất một chút chi phí, nhưng nó sẽ có giá trị trong thời gian dài.

Nổi bật Tạp chí Thông tin & Truyền thông
  • Báo chí quốc tế viết gì về Triển lãm Quốc phòng quốc tế Việt Nam 2024?
    Sự kiện Triển lãm Quốc phòng quốc tế Việt Nam năm 2024 thu hút sự chú ý trong - ngoài nước và cả nhiều cơ quan truyền thông quốc tế.
  • “AI như là một chiếc gương đen”
    Bài báo "AI is the Black Mirror" của Philip Ball cung cấp một cái nhìn chi tiết về trí tuệ nhân tạo (AI) và tác động của nó đến nhận thức con người.
  • Chất lượng thông tin báo chí về kinh tế - Vai trò, yêu cầu thước đo và giải pháp cần có
    Báo chí kinh tế cần là diễn đàn thực thụ cho doanh nghiệp, không chỉ cung cấp thông tin. Thông tin cần chính xác và kịp thời để hỗ trợ doanh nghiệp trong điều chỉnh chiến lược kinh doanh.
  • Những “ngọn đuốc” ở bản
    Ở Tuyên Quang, người có uy tín là những người đi đầu thay đổi nếp nghĩ, cách làm của bà con dân tộc thiểu số (DTTS). Họ như những “ngọn đuốc” đi trước, thắp sáng, lan tỏa tinh thần trách nhiệm, nêu gương với cộng đồng. Gương mẫu, uy tín, những người có uy tín đã và đang góp sức xây dựng bản làng, thôn xóm ngày càng ấm no, giàu mạnh.
  • 5 lý do để tăng cường bảo mật mạng
    Các chương trình an ninh mạng đã phát triển đáng kể trong vài thập kỷ qua. Sự ra đời của điện toán đám mây đã phá vỡ ranh giới an ninh mạng thông thường của của các doanh nghiệp, buộc các tổ chức phải liên tục cập nhật những chiến lược phòng thủ của mình.
Đừng bỏ lỡ
Tại sao cần phải phân biệt sao lưu và lưu trữ dữ liệu
POWERED BY ONECMS - A PRODUCT OF NEKO