Tại sao cần phải phân biệt sao lưu và lưu trữ dữ liệu

Trương Khánh Hợp| 25/07/2018 15:29
Theo dõi ICTVietnam trên

Sao lưu (back up) và lưu trữ (archive) dữ liệu có các chức năng riêng biệt và nếu người dùng có cả 2 chức năng trên, có thể dẫn đến các vấn đề về truy cập và thậm chí cả các vấn đề pháp lý. Tin tốt là sự khác biệt giữa sao lưu và lưu trữ khá rõ ràng và dễ hiểu

Backup vs. archive: Why it’s important to know the difference

Sao lưu – Back up là gì?

Back up là bản sao dữ liệu được tạo để khôi phục dữ liệu đã đề cập trong trường hợp có thiệt hại hoặc mất mát. Dữ liệu gốc sẽ không bị xóa sau khi sao lưu được thực hiện.

Ví dụ về các bản sao lưu bao gồm bản sao lưu hàng đêm của tất cả các tệp trên máy tính xách tay hoặc máy tính để bàn của người dùng hoặc tất cả ảnh trên iPhone được sao chép sang iCloud trong trường hợp người dùng đánh rơi điện thoại. Người dùng cũng sao lưu các tệp máy chủ (dữ liệu phi cấu trúc) và cơ sở dữ liệu (dữ liệu có cấu trúc). Một bản sao lưu có thể tập trung vào dữ liệu, như trong một kho chứa cơ sở dữ liệu, hệ điều hành của máy chủ, hoặc trên cả hai như với bản sao lưu của các tệp VMware .VMDK files.

Định nghĩa của back up thực sự chính là mục đích của back up, và mục đích của một bản sao lưu luôn giống nhau: để khôi phục dữ liệu nếu có vấn đề gì xảy ra với nó. Ví dụ, một khối RAID 6 (Redundant Arrays of Inexpensive Disks - là hình thức ghép nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa cứng có chức gia tăng tốc độ đọc/ghi dữ liệu hoặc nhằm tăng thêm sự an toàn của dữ liệu chứa trên hệ thống đĩa hoặc kết hợp cả hai yếu tố trên) có thể bị hỏng ba đĩa, và tất cả dữ liệu của nó sẽ cần được khôi phục. Ai đó có thể vô tình hoặc cố ý xóa một hoặc nhiều máy ảo trong cấu hình VMware, Hyper-V hoặc AWS EC2 của người dùng và chúng sẽ cần được khôi phục. Người dùng có thể một ngày nào đó sẽ nhận ra mọi tệp trong tổ chức của bạn đã được mã hóa bởi gói phần mềm ransomware. Nếu không có một hệ thống sao lưu tốt, lựa chọn của người dùng sẽ là trả tiền chuộc. Với một hệ thống sao lưu tốt, người dùng có thể tìm ra nguồn gốc của phần mềm ransomware để ngăn chặn, sau đó khôi phục tất cả dữ liệu và không phải trả tiền cho tin tặc.

Lưu trữ - Archive là gì?

Archive là bản sao dữ liệu được tạo cho mục đích tham chiếu. Mặc dù không bắt buộc, bản gốc thường bị xóa sau khi bản archive được tạo ra.

Mục đích của một bản back up là khôi phục một cái gì đó trở lại như bình thường (thông thường) như ngày hôm qua, tuy nhiên, archive có thể phục vụ nhiều mục đích. Mục đích phổ biến nhất là giúp người dùng tìm thấy một số dữ liệu từ một thời gian dài trước đây. Nó có thể là một tập tin duy nhất có một chứ thông tin thực sự quan trọng trong đó, chẳng hạn như một hợp đồng mà một khách hàng đã ký vài năm trước đây. Nó có thể là một nhóm dữ liệu liên quan, chẳng hạn như tất cả các bản vẽ cấu trúc của tòa nhà vừa bị sập. Hoặc nó có thể là tất cả các bản vẽ CAD của tiện ích mà công ty của bạn đã từng sử dụng và giờ đây bạn muốn tìm lại.

Một tập dữ liệu liên quan khác có thể là tất cả các email và / hoặc các tệp có thể chứng minh một vấn đề nhất định. Ví dụ một nhân viên cho rằng họ đã được phép thực hiện một nhiệm vụ, và sau đó bị sa thải vì đã làm như vậy. Vụ kiện này có thể đưa ra một yêu cầu điều tra điện tử để xem lại tất cả các email đến và đi có chứa các từ khóa liên quan đến nhiệm vụ. Trường hợp khác, một người có thể đang cố gắng chứng minh một môi trường làm việc thù địch và muốn xem tất cả các email từ một nhóm người quản lý cụ thể, trong đó có chứa một danh sách các từ nhất định.

Bản lưu trữ là những gì sẽ giúp người dùng hoàn thành tất cả các tác vụ này. Bạn có thể có một kho lưu trữ của toàn bộ đơn đặt hàng, báo giá hoặc hợp đồng mà doanh nghiệp bạn đã từng đưa ra. Người dùng có thể lưu trữ các hợp đồng và đơn đặt hàng hiện tại trực tuyến, nhưng nếu người dùng giữ tất cả các hợp đồng và đơn đặt hàng trong kho lưu trữ, và người dùng chỉ cần đặt chỉ mục để có thể dễ dàng truy xuất đơn đặt hàng và hợp đồng thông qua nội dung của các đơn đặt hàng đó. Bạn cũng có thể lưu trữ tất cả các email mà công ty của bạn đã gửi hoặc nhận.

Một số hệ thống lưu trữ email có thể lọc từ email máy chủ những email đã được lưu trữ có kích thước lớn hơn một kích thước nhất định và/hoặc chưa được truy cập trong hơn “n” ngày. Điều này giúp giữ cho hệ thống email gọn gàng, tiết kiệm không gian trên máy tính và tài nguyên lưu trữ, và làm cho nó dễ dàng hơn để sao lưu.

Khôi phục – restore và truy hồi – retrieval

Ngay cả khi mục đích của một kho lưu trữ là để tiết kiệm không gian trên kho lưu trữ chính, nó cần có khả năng thực truy hồi và khôi phục nếu nó được gọi là lưu trữ. Sao lưu khôi phục hệ thống và lưu trữ truy hồi hệ thống (Backup systems restore and archive systems retrieve).

Khi người dùng khôi phục lại một cái gì đó, nó thường là một tập tin duy nhất, máy chủ hoặc cơ sở dữ liệu. Khi người dùng truy hồi nội dung nào đó, đó thường là tập hợp các dữ liệu có liên quan, có thể được hoặc không được lưu trữ trên cùng một máy chủ hoặc thậm chí ở cùng một định dạng. Khôi phục cũng được thực hiện vào một thời điểm duy nhất, chẳng hạn như khôi phục cơ sở dữ liệu tại thời điểm hôm trước. Việc truy hồi được sử dụng một khoảng thời gian, chẳng hạn như tất cả các email trong ba năm qua.

Khôi phục yêu cầu người dùng phải biết về nơi mà các tập tin hoặc dữ liệu được lưu trữ khi nó được sao lưu; nếu không, người dùng không thể tìm thấy nó. Người dùng cũng cần phải biết tên của máy chủ, cơ sở dữ liệu hoặc thư mục mà tập tin được lưu trữ, tên của tệp hoặc bảng mà người dùng muốn sử dụng và ngày nó được nhìn tạo lần cuối. Truy hồi không cần có bất cứ thông tin nào trong số đó; người dùng chỉ biết rằng họ cần tất cả các tệp hoặc bản ghi khớp với một tập hợp các tham số. Truy hồi có thể cung cấp cho người dùng tất cả các tệp hoặc email đã được tạo trong ba năm qua có chứa một cụm từ cụ thể hoặc được tạo bởi một người cụ thể.

Tại sao sự khác biệt lại quan trọng?

Nhiều người cố gắng sử dụng hệ thống sao lưu của họ như một hệ thống lưu trữ, có nghĩa là họ giữ bản sao lưu của họ trong nhiều năm - hoặc thậm chí là mãi mãi. Lần đầu tiên người dùng nhận được yêu cầu truy hồi sẽ thấy rất khó khi thực hiện truy hồi một nội dung được đáng lẽ phải sử dụng khôi phục. Điều này sẽ làm cho quá trình truy hồi mất nhiều thời gian, nhiều khả năng mất tới cả tháng thay vì vài phút và tốn hàng triệu thay vì vài đô la.

Nếu việc truy hồi là yêu cầu điều tra điện tử từ một vụ kiện, và bạn không thể đáp ứng nó một cách kịp thời, bạn sẽ gặp nguy cơ thẩm phán đưa ra một hướng suy luận bất lợi. Bạn có thể đã dành sáu tháng để thỏa mãn những gì họ cho là đơn giản và bạn không biết bao giờ sẽ hoàn thành. Thẩm phán sẽ có thể cho rằng bạn đang cố che giấu điều gì đó, và họ nói với bồi thẩm đoàn. Bạn sẽ thua kiện. Ví dụ nổi tiếng nhất về vấn đề này là vụ kiện Morgan Stanley, họ đã bị mất hàng tỷ đô y hệt như những giả định vừa đặt ra.

Đừng sử dụng bản sao lưu của bạn làm lưu trữ. Nếu bạn có nhu cầu lưu trữ lâu dài, hãy sử dụng một hệ thống lưu trữ thực sự. Sẽ mất một chút chi phí, nhưng nó sẽ có giá trị trong thời gian dài.

Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
  • Xây dựng hạ tầng cho mạng 5G tương lai của Việt Nam
    Đông Nam Á là một trong những khu vực có tốc độ phát triển nhanh nhất trên thế giới. Dự kiến tới năm 2030, ASEAN (gồm 10 quốc gia Đông Nam Á) sẽ trở thành nền kinh tế lớn thứ tư toàn cầu. Phần lớn động lực thúc đẩy sự phát triển này đến từ sự vận động và tăng trưởng không ngừng của nền kinh tế số trong khu vực, với giá trị ước tính lên đến gần 1 nghìn tỉ đô-la vào năm 2030.
  • 5G và những thay đổi toàn diện trong xây dựng thành phố thông minh
    Với tốc độ cực cao, độ trễ cực thấp, băng thông rộng và kết nối mật độ cực lớn, 5G là hạ tầng cốt lõi hỗ trợ toàn diện cho sự đổi mới và phát triển của thành phố thông minh trên tất cả các lĩnh vực, tác động tích cực vào công tác xây dựng và quản lý thành phố, tạo ra một môi trường sống tiện nghi, bền vững và an toàn hơn bao giờ hết.
  • Vượt qua hơn 1.000 doanh nghiệp, Bưu điện Việt Nam đạt giải Thương hiệu Quốc gia 2024
    Đây là lần thứ 2 liên tiếp Bưu điện Việt Nam vinh dự nhận giải thưởng danh giá này bởi những thành tựu lớn trong lĩnh vực logistics, bưu chính chuyển phát tại Việt Nam và Quốc tế.
  • Trên 1 triệu người đăng ký tài khoản “Công dân Thủ đô số”
    Theo thông tin từ Sở Thông tin và Truyền thông Hà Nội, tính đến hết tháng 10/2024, ứng dụng “Công dân Thủ đô số” – iHanoi đã đã có khoảng 14 triệu lượt người dân truy cập khai thác, sử dụng. Tổng số người dùng đăng ký tài khoản trên ứng dụng này lên tới 1.043.724.
  • Sắp diễn ra Lễ hội văn hoá ẩm thực Hà Nội năm 2024
    UBND TP. Hà Nội vừa ban hành Kế hoạch số 313/KH-UBND về việc tổ chức Lễ hội văn hóa ẩm thực Hà Nội năm 2024 (The HaNoi Culinary Culture Festival 2024) với chủ đề "Hà Nội kết nối năm châu".
  • GHTK được vinh danh Thương hiệu Quốc gia Việt Nam lần thứ hai
    Công ty CP Giao hàng Tiết Kiệm tự hào là một trong 190 doanh nghiệp tiêu biểu, đạt danh hiệu Thương hiệu Quốc gia Việt Nam năm 2024 trong số hơn 1.000 doanh nghiệp đăng ký.
  • Cuộc đua trung tâm dữ liệu AI tại Đông Nam Á
    Trí tuệ nhân tạo (AI) đã trở thành một động lực chính thúc đẩy đổi mới công nghệ toàn cầu và Đông Nam Á đang ngày càng khẳng định vai trò của mình trong cuộc đua phát triển AI. Hàng loạt các hãng công nghệ và đám mây lớn đã thông báo kế hoạch xây dựng, vận hành trung tâm dữ liệu mới tại Đông Nam Á.
  • Mở rộng trông xe không dùng tiền mặt mang lại lợi ích "kép"
    Việc áp dụng hình thức thanh toán qua ứng dụng thu phí không dừng VETC và mã QR vào hoạt động thanh toán phí gửi xe không dùng tiền mặt không những góp phần từng bước hình thành hệ thống giao thông thông minh mà còn tăng cường công tác quản lý nhà nước, minh bạch trong công tác thu phí dịch vụ trông giữ xe.
  • MobiFone được vinh danh Thương hiệu quốc gia Việt Nam 2024
    Tại Lễ công bố sản phẩm đạt Thương hiệu quốc gia Việt Nam năm 2024 tối 4/11, MobiFone xuất sắc được vinh danh tại sự kiện với 5 thương hiệu sản phẩm đột phá bao gồm: Dịch vụ viễn thông MobiFone, mobiEdu, ClipTV, mobiAgri và nền tảng số MobiFone.
  • 10 xu hướng định hình tương lai của quản lý giao dịch số
    Quản lý giao dịch số đang phát triển mạnh mẽ, được thúc đẩy bởi những tiến bộ công nghệ và nhu cầu ngày càng tăng về xử lý tài liệu an toàn, hiệu quả. Đây là công cụ quan trọng giúp doanh nghiệp giảm bớt thủ tục hành chính và tối ưu hóa quy trình xử lý tài liệu số.
Tại sao cần phải phân biệt sao lưu và lưu trữ dữ liệu
POWERED BY ONECMS - A PRODUCT OF NEKO