Tại sao cần phải phân biệt sao lưu và lưu trữ dữ liệu

Trương Khánh Hợp| 25/07/2018 15:29
Theo dõi ICTVietnam trên

Sao lưu (back up) và lưu trữ (archive) dữ liệu có các chức năng riêng biệt và nếu người dùng có cả 2 chức năng trên, có thể dẫn đến các vấn đề về truy cập và thậm chí cả các vấn đề pháp lý. Tin tốt là sự khác biệt giữa sao lưu và lưu trữ khá rõ ràng và dễ hiểu

Backup vs. archive: Why it’s important to know the difference

Sao lưu – Back up là gì?

Back up là bản sao dữ liệu được tạo để khôi phục dữ liệu đã đề cập trong trường hợp có thiệt hại hoặc mất mát. Dữ liệu gốc sẽ không bị xóa sau khi sao lưu được thực hiện.

Ví dụ về các bản sao lưu bao gồm bản sao lưu hàng đêm của tất cả các tệp trên máy tính xách tay hoặc máy tính để bàn của người dùng hoặc tất cả ảnh trên iPhone được sao chép sang iCloud trong trường hợp người dùng đánh rơi điện thoại. Người dùng cũng sao lưu các tệp máy chủ (dữ liệu phi cấu trúc) và cơ sở dữ liệu (dữ liệu có cấu trúc). Một bản sao lưu có thể tập trung vào dữ liệu, như trong một kho chứa cơ sở dữ liệu, hệ điều hành của máy chủ, hoặc trên cả hai như với bản sao lưu của các tệp VMware .VMDK files.

Định nghĩa của back up thực sự chính là mục đích của back up, và mục đích của một bản sao lưu luôn giống nhau: để khôi phục dữ liệu nếu có vấn đề gì xảy ra với nó. Ví dụ, một khối RAID 6 (Redundant Arrays of Inexpensive Disks - là hình thức ghép nhiều ổ đĩa cứng vật lý thành một hệ thống ổ đĩa cứng có chức gia tăng tốc độ đọc/ghi dữ liệu hoặc nhằm tăng thêm sự an toàn của dữ liệu chứa trên hệ thống đĩa hoặc kết hợp cả hai yếu tố trên) có thể bị hỏng ba đĩa, và tất cả dữ liệu của nó sẽ cần được khôi phục. Ai đó có thể vô tình hoặc cố ý xóa một hoặc nhiều máy ảo trong cấu hình VMware, Hyper-V hoặc AWS EC2 của người dùng và chúng sẽ cần được khôi phục. Người dùng có thể một ngày nào đó sẽ nhận ra mọi tệp trong tổ chức của bạn đã được mã hóa bởi gói phần mềm ransomware. Nếu không có một hệ thống sao lưu tốt, lựa chọn của người dùng sẽ là trả tiền chuộc. Với một hệ thống sao lưu tốt, người dùng có thể tìm ra nguồn gốc của phần mềm ransomware để ngăn chặn, sau đó khôi phục tất cả dữ liệu và không phải trả tiền cho tin tặc.

Lưu trữ - Archive là gì?

Archive là bản sao dữ liệu được tạo cho mục đích tham chiếu. Mặc dù không bắt buộc, bản gốc thường bị xóa sau khi bản archive được tạo ra.

Mục đích của một bản back up là khôi phục một cái gì đó trở lại như bình thường (thông thường) như ngày hôm qua, tuy nhiên, archive có thể phục vụ nhiều mục đích. Mục đích phổ biến nhất là giúp người dùng tìm thấy một số dữ liệu từ một thời gian dài trước đây. Nó có thể là một tập tin duy nhất có một chứ thông tin thực sự quan trọng trong đó, chẳng hạn như một hợp đồng mà một khách hàng đã ký vài năm trước đây. Nó có thể là một nhóm dữ liệu liên quan, chẳng hạn như tất cả các bản vẽ cấu trúc của tòa nhà vừa bị sập. Hoặc nó có thể là tất cả các bản vẽ CAD của tiện ích mà công ty của bạn đã từng sử dụng và giờ đây bạn muốn tìm lại.

Một tập dữ liệu liên quan khác có thể là tất cả các email và / hoặc các tệp có thể chứng minh một vấn đề nhất định. Ví dụ một nhân viên cho rằng họ đã được phép thực hiện một nhiệm vụ, và sau đó bị sa thải vì đã làm như vậy. Vụ kiện này có thể đưa ra một yêu cầu điều tra điện tử để xem lại tất cả các email đến và đi có chứa các từ khóa liên quan đến nhiệm vụ. Trường hợp khác, một người có thể đang cố gắng chứng minh một môi trường làm việc thù địch và muốn xem tất cả các email từ một nhóm người quản lý cụ thể, trong đó có chứa một danh sách các từ nhất định.

Bản lưu trữ là những gì sẽ giúp người dùng hoàn thành tất cả các tác vụ này. Bạn có thể có một kho lưu trữ của toàn bộ đơn đặt hàng, báo giá hoặc hợp đồng mà doanh nghiệp bạn đã từng đưa ra. Người dùng có thể lưu trữ các hợp đồng và đơn đặt hàng hiện tại trực tuyến, nhưng nếu người dùng giữ tất cả các hợp đồng và đơn đặt hàng trong kho lưu trữ, và người dùng chỉ cần đặt chỉ mục để có thể dễ dàng truy xuất đơn đặt hàng và hợp đồng thông qua nội dung của các đơn đặt hàng đó. Bạn cũng có thể lưu trữ tất cả các email mà công ty của bạn đã gửi hoặc nhận.

Một số hệ thống lưu trữ email có thể lọc từ email máy chủ những email đã được lưu trữ có kích thước lớn hơn một kích thước nhất định và/hoặc chưa được truy cập trong hơn “n” ngày. Điều này giúp giữ cho hệ thống email gọn gàng, tiết kiệm không gian trên máy tính và tài nguyên lưu trữ, và làm cho nó dễ dàng hơn để sao lưu.

Khôi phục – restore và truy hồi – retrieval

Ngay cả khi mục đích của một kho lưu trữ là để tiết kiệm không gian trên kho lưu trữ chính, nó cần có khả năng thực truy hồi và khôi phục nếu nó được gọi là lưu trữ. Sao lưu khôi phục hệ thống và lưu trữ truy hồi hệ thống (Backup systems restore and archive systems retrieve).

Khi người dùng khôi phục lại một cái gì đó, nó thường là một tập tin duy nhất, máy chủ hoặc cơ sở dữ liệu. Khi người dùng truy hồi nội dung nào đó, đó thường là tập hợp các dữ liệu có liên quan, có thể được hoặc không được lưu trữ trên cùng một máy chủ hoặc thậm chí ở cùng một định dạng. Khôi phục cũng được thực hiện vào một thời điểm duy nhất, chẳng hạn như khôi phục cơ sở dữ liệu tại thời điểm hôm trước. Việc truy hồi được sử dụng một khoảng thời gian, chẳng hạn như tất cả các email trong ba năm qua.

Khôi phục yêu cầu người dùng phải biết về nơi mà các tập tin hoặc dữ liệu được lưu trữ khi nó được sao lưu; nếu không, người dùng không thể tìm thấy nó. Người dùng cũng cần phải biết tên của máy chủ, cơ sở dữ liệu hoặc thư mục mà tập tin được lưu trữ, tên của tệp hoặc bảng mà người dùng muốn sử dụng và ngày nó được nhìn tạo lần cuối. Truy hồi không cần có bất cứ thông tin nào trong số đó; người dùng chỉ biết rằng họ cần tất cả các tệp hoặc bản ghi khớp với một tập hợp các tham số. Truy hồi có thể cung cấp cho người dùng tất cả các tệp hoặc email đã được tạo trong ba năm qua có chứa một cụm từ cụ thể hoặc được tạo bởi một người cụ thể.

Tại sao sự khác biệt lại quan trọng?

Nhiều người cố gắng sử dụng hệ thống sao lưu của họ như một hệ thống lưu trữ, có nghĩa là họ giữ bản sao lưu của họ trong nhiều năm - hoặc thậm chí là mãi mãi. Lần đầu tiên người dùng nhận được yêu cầu truy hồi sẽ thấy rất khó khi thực hiện truy hồi một nội dung được đáng lẽ phải sử dụng khôi phục. Điều này sẽ làm cho quá trình truy hồi mất nhiều thời gian, nhiều khả năng mất tới cả tháng thay vì vài phút và tốn hàng triệu thay vì vài đô la.

Nếu việc truy hồi là yêu cầu điều tra điện tử từ một vụ kiện, và bạn không thể đáp ứng nó một cách kịp thời, bạn sẽ gặp nguy cơ thẩm phán đưa ra một hướng suy luận bất lợi. Bạn có thể đã dành sáu tháng để thỏa mãn những gì họ cho là đơn giản và bạn không biết bao giờ sẽ hoàn thành. Thẩm phán sẽ có thể cho rằng bạn đang cố che giấu điều gì đó, và họ nói với bồi thẩm đoàn. Bạn sẽ thua kiện. Ví dụ nổi tiếng nhất về vấn đề này là vụ kiện Morgan Stanley, họ đã bị mất hàng tỷ đô y hệt như những giả định vừa đặt ra.

Đừng sử dụng bản sao lưu của bạn làm lưu trữ. Nếu bạn có nhu cầu lưu trữ lâu dài, hãy sử dụng một hệ thống lưu trữ thực sự. Sẽ mất một chút chi phí, nhưng nó sẽ có giá trị trong thời gian dài.

Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
  • Chìa khóa giải quyết thách thức trong bảo vệ trẻ em trên không gian mạng
    Trẻ em - đối tượng dễ bị tổn thương nhất, đang phải đối mặt với nhiều nguy cơ. Đây không chỉ là bài toán của riêng Việt Nam mà còn là thách thức toàn cầu đòi hỏi sự chung tay hợp tác từ nhiều phía.
  • Việt Nam đang đối mặt 3 thách thức an toàn thông tin
    Các cuộc tấn công mạng hiện nay ngày càng tinh vi và phức tạp hơn, đặc biệt khi có sự hỗ trợ của trí tuệ nhân tạo. Tuy nhiên, việc kết hợp công nghệ này với trí tuệ của con người đã giúp phát hiện và phòng, chống tấn công mạng hiệu quả hơn.
  • Bốn giải pháp trọng tâm để giải bài toán an toàn dữ liệu quốc gia
    Theo Thứ trưởng Bộ TT&TT Bùi Hoàng Phương, năm 2024 đánh dấu bước tiến vượt bậc của Việt Nam trong lĩnh vực an toàn thông tin. Tuy nhiên, còn rất nhiều thách thức cần vượt qua để đảm bảo an toàn dữ liệu quốc gia.
  • Việt Nam - Hàn Quốc đồng hành trong kỷ nguyên AI
    Thứ trưởng Bộ TT&TT Phan Tâm hy vọng, Việt Nam có thể học tập nhiều hơn từ Hàn Quốc về các bài học kinh nghiệm, cách làm hay để phát huy tối đa vai trò công nghệ số nói chung và trợ lý ảo nói riêng trong hoạt động của cơ quan nhà nước, thúc đẩy phát triển kinh tế, tạo lập xã hội số nhân văn và thu hẹp khoảng cách số.
  • Việt Nam - Malaysia nâng cấp quan hệ Đối tác chiến lược toàn diện
    Phát biểu tại họp báo, Tổng Bí thư Tô Lâm cho biết, Việt Nam-Malaysia tăng cường hợp tác trên các lĩnh vực mới (như kinh tế xanh, đổi mới sáng tạo, khoa học công nghệ, chuyển đổi số, năng lượng xanh...).
  • Robot Delta hữu dụng trong nhiều ngành
    Nhờ vào thiết kế độc đáo và khả năng hoạt động với tốc độ và độ chính xác cao, robot Delta là một giải pháp tối ưu trong nhiều ngành công nghiệp hiện đại.
  • Cà Mau ứng dụng các phần mềm chuyển đổi số trong ngành nông nghiệp
    Ngành nông nghiệp tỉnh Cà Mau đã không ngừng triển khai các giải pháp chuyển đổi số thông qua việc sử dụng các phần mềm, xây dựng cơ sở dữ liệu chuyên ngành phục vụ quản lý, điều hành. Trong tương lai không xa, các phần mềm này sẽ hoàn thiện và bắt kịp xu hướng công nghệ để hỗ trợ người nông dân nhiều hơn trong việc tăng gia sản xuất.
  • Chính thức ra mắt Nền tảng hỗ trợ diễn tập thực chiến an toàn thông tin
    Nền tảng hướng tới nâng cao chất lượng và điều phối hiệu quả các hoạt động diễn tập trên toàn quốc thông qua nền tảng hỗ trợ diễn tập thực chiến an toàn thông tin.
  • Bảo vệ các hệ thống mạng trọng yếu là cấp thiết
    Song song với tiến trình chuyển đổi số, các chiến dịch tấn công mạng, gián điệp và khủng bố mạng nhằm vào hệ thống công nghệ thông tin (IT) và công nghệ vận hành (OT) trọng yếu ngày càng gia tăng, việc đảm bảo an ninh mạng trở thành ưu tiên hàng đầu của các quốc gia.
  • ‏OPPO Find X8 Series sẽ chính thức lên kệ ngày 7/12‏
    Ngày 21/11, OPPO chính thức ra mắt Find X8 Series‏‏ tại Việt Nam và sẽ lên kệ ngày 7/12 tới. Đây là lần đầu tiên người dùng Việt Nam được trải nghiệm dòng flagship cao cấp nhất của OPPO cùng lúc với toàn cầu. ‏
Tại sao cần phải phân biệt sao lưu và lưu trữ dữ liệu
POWERED BY ONECMS - A PRODUCT OF NEKO