Những điều doanh nghiệp cần biết về data decay

Data decay là sự già đi và lỗi thời của dữ liệu, khiến cho dữ liệu không còn sử dụng được nữa do mất tính toàn vẹn, tính đầy đủ và sự chính xác. Điều này có nghĩa là dữ liệu không thể tận dụng được một cách hiệu quả, vì thế mà nó không còn giá trị.

Hạnh Tâm
08:15 AM 11/10/2021
In bài viết này
Những điều doanh nghiệp cần biết về data decay

Chia sẻ bài viết này

Trong 5 năm tới, dự kiến có khoảng hơn 180 zettabyte dữ liệu được tạo ra, có nghĩa là quá trình data decay chắc chắn sẽ xảy ra với tốc độ còn nhanh hơn hiện nay.

Chúng ta đang sống trong một thế giới được thúc đẩy bởi dữ liệu, giá trị của nhiều tổ chức phụ thuộc vào dữ liệu mà họ thu thập được. Do đó, sự thành công trong kinh doanh lại thường bị phụ thuộc vào những rủi ro và thiệt hại do dữ liệu được "bảo trì" kém và do  data decay. Đây là lý do tại sao những nhà lãnh đạo phải hiểu về data decay và cách quản lý nó như thế nào.

Data decay xảy ra như thế nào?

Có nhiều bối cảnh có thể dẫn đến data decay. Trường hợp phổ biến là hồ sơ khách hàng như dữ liệu bán hàng, dữ liệu quản trị quan hệ khách hàng (CRM) và tiếp thị, những dữ liệu thường không được bảo trì. Trên những hệ thống luôn thay đổi và phát triển để đáp ứng các nhu cầu kinh doanh, các mối liên kết và tính hoàn chỉnh của các tập dữ liệu có thể nhanh chóng bị phá vỡ và lỗi thời nếu không được bảo trì đúng cách. Thông thường, nguồn dữ liệu trong mọi tổ chức nào đều nằm trong các kho dữ liệu phân tán trên nhiều nền tảng, nhiều định dạng và nhiều chế độ hiển thị.

Một yếu tố khác dẫn đến data decay là yếu tố con người. Thông thường, một số thời điểm trong quy trình dữ liệu được nhập thủ công. Thời điểm nhập sai thông tin hoặc thông tin không chính xác cũng như hệ thống, dữ liệu không nhất quán, không bảo vệ dữ liệu định kỳ (data hygiene) thì data decay cũng có thể xảy ra.

Hiện nay, các doanh nghiệp (DN) đang sao chép dữ liệu trung bình 12 lần trên mỗi tệp, có nghĩa là một sai sót nhỏ có thể gây ra tác động kép với thiệt hại theo cấp số nhân.

Hơn nữa, tất cả dữ liệu đều có vòng đời, nghĩa là dữ liệu tạo ra, sử dụng, giám sát và đến một lúc nào đó nó không còn thích hợp để lưu trữ và phải được xử lý an toàn.

Tại sao các DN nên quan tâm đến data decay?

Data decay thường là dấu hiệu của việc không được chú ý trong quản lý dữ liệu và có ít hoặc không thực hiện xử lý vòng đời dữ liệu. Những biểu hiện ban đầu của data decay là dữ liệu hiển thị kém trên toàn bộ hệ thống DN.

Từ quan điểm bảo mật và của người lãnh đạo, khả năng đảm bảo các tài sản dữ liệu an  toàn và bảo mật của một tổ chức đều phải được xây dựng dựa trên sự hiểu biết cơ bản về nơi mà tất cả dữ liệu được lưu trữ.

Tìm và khắc phục dữ liệu bị data decay

Việc tìm kiếm dữ liệu, cho dù nó ở trạng thái đã phân rã (decayed) hay vẫn còn nguyên thì vẫn cần khả năng phát hiện trong từng nơi lưu trữ dữ liệu được sử dụng trong DN. Điều này bao gồm cả nơi lưu trữ dữ liệu phi cấu trúc như các tệp tin, các email, kho dữ liệu trên đám mây và kho dữ liệu lớn. Những nơi lưu trữ dữ liệu có cấu trúc (ví dụ các nền tảng phân tích cơ sở dữ liệu tại chỗ và dữ liệu trên đám mây) dễ có nguy cơ bị data decay hơn.

Một cách tiếp cận khác để tránh data decay là tìm kiếm dữ liệu ROT (dữ liệu dư thừa, lỗi thời và không có giá trị), thường là dữ liệu cũ hơn, ít sử dụng và không còn quan trọng đối với DN.

Trong những trường hợp này, chiến lược tốt nhất là xóa dữ liệu đó vĩnh viễn. Làm như vậy sẽ giảm thiểu nguy cơ vi phạm quyền riêng tư và yêu cầu về luật bảo mật đã quy định các tổ chức phải đảm bảo dữ liệu chỉ được lưu trữ theo nhu cầu thực tế hiện tại của DN.

Cách tốt nhất để ngăn chặn data decay

Data decay chắc chắn sẽ xảy ra với hầu hết các tổ chức. Sự già hóa và tích trữ quá nhiều tệp tin không phải là hiếm, nhưng các DN vẫn nên chủ động thực hiện các bước để ngăn chặn data decay theo quy trình được đề xuất như sau:

- Giảm các quy trình thủ công bằng việc tự động hóa.

- Đảm bảo tất cả các nguồn dữ liệu đầu vào (ví dụ từ khách hàng) được xác thực đầu vào mạnh mẽ, có sự xác minh độc lập nếu có thể (ví dụ: địa chỉ cơ sở dữ liệu, xác minh ID của chính phủ…)

- Xác thực mối liên kết mạnh, an toàn giữa tất cả tập hợp các bản ghi với việc kiểm tra thường xuyên tính toàn vẹn của dữ liệu trong các kho lưu trữ dữ liệu.

- Liên tục giám sát tất cả các nơi lưu trữ dữ liệu để đảm bảo tính toàn vẹn và dung lượng dữ liệu.

Giá trị của những hiểu biết sâu sắc về dữ liệu đang định hướng phát triển kinh doanh trong mọi ngành. Tuy nhiên, khả năng quản lý dữ liệu và việc đảm bảo tính bí mật, tính toàn vẹn và tính sẵn sàng vẫn còn là một trong những thách thức lớn nhất mà các tổ chức phải đối mặt.

Với dữ liệu được sử dụng và lưu trữ trên nhiều thiết bị đầu cuối, máy chủ, email, ứng dụng kinh doanh, bên thứ ba và lưu trữ đám mây, khả năng bị data decay hoặc mất dữ liệu thực sự là một mối đe dọa.

Khi bắt tay vào hành trình cải thiện chất lượng dữ liệu, quản lý dữ liệu hoặc các sáng kiến vòng đời dữ liệu, một bước cơ bản thường bị bỏ qua là trước tiên phải hiểu biết về tất cả dữ liệu đang tồn tại. Để đạt được khả năng này, các tổ chức nên áp dụng các công cụ khai thác dữ liệu cho tất cả các kho dữ liệu. Sau đó, dữ liệu cần được tổ chức và phân loại thành các nhóm riêng biệt theo mức độ nhạy cảm. Điều này sẽ giúp các tổ chức tránh được nguy cơ data decay thông qua việc liên tục nhận diện được và sau đó là quản lý tất cả dữ liệu./.

Theo helpnetsecurity.com