Dữ liệu phi cấu trúc sẽ dẫn đến vi phạm an ninh và các vấn đề về tuân thủ

09:30 PM 11/04/2019 In bài viết

Will unstructured data lead to security breaches and regulation compliance issues? image

Dữ liệu phi cấu trúc (hoặc thông tin phi cấu trúc) là thông tin không có mô hình dữ liệu được xác định trước hoặc không được tổ chức theo cách được xác định trước. Thông tin phi cấu trúc thường nặng về văn bản, nhưng cũng có thể chứa dữ liệu như ngày, số và sự kiện. Điều này dẫn đến sự bất thường và mơ hồ gây khó hiểu khi sử dụng các chương trình truyền thống so với dữ liệu có cấu trúc được lưu trữ thành các bản ghi với kiểu dữ liệu và trường dữ liệu rõ ràng.

Các giám đốc công nghệ thông tin của Anh đã tiết lộ mối đe dọa tiềm tàng của các dữ liệu phi cấu trúc ẩn giấu trong các tổ chức vừa và lớn.

9/10 người được hỏi trong nghiên cứu từ Crown Records Management cho rằng, các biển dữ liệu phi cấu trúc – bao gồm rất nhiều dữ liệu khó xem, khó truy cập và khó bảo mật - là một vấn đề và đặt ra rủi ro về bảo mật và không tuân thủ các quy định về dữ liệu.

Có tới 59% dữ liệu trên khắp các tổ chức của Vương quốc Anh là phi cấu trúc, trong khi 40% là dữ liệu tối (dark data) hoặc không được sử dụng. Dữ liệu tối là dữ liệu có được thông qua các hoạt động mạng máy tính khác nhau nhưng không được sử dụng dưới bất kỳ hình thức nào để rút ra những hiểu biết hoặc đưa ra quyết định.

Do Trung tâm dữ liệu Internet (IDC) nhận thấy 90% dữ liệu phi cấu trúc không bao giờ được phân tích, các tổ chức đang lúng túng và không thể kiểm soát khi nói đến việc quản lý rủi ro, thực hiện các yêu cầu thông tin cá nhân theo GDPR (Quy định bảo vệ dữ liệu chung).

Theo nghiên cứu, 51% số người được hỏi cho biết rằng dữ liệu phi cấu trúc là một rủi ro bảo mật và 49% cho rằng dữ liệu phi cấu trúc khiến họ có nguy cơ không tuân thủ các quy định.

Không phải tất cả dữ liệu phi cấu trúc đều là những rủi ro

Không phải tất cả đều là rủi ro dữ liệu, nếu được quản lý hiệu quả, dữ liệu phi cấu trúc có thể nắm giữ chìa khóa để thành công hơn nữa trong kinh doanh; 64% cho biết họ có thể cải thiện hiệu quả hoạt động và năng suất bằng cách khai thác dữ liệu phi cấu trúc, 34% cho biết họ có thể tăng doanh số, 32% cảm thấy sự trung thành của khách hàng có thể được cải thiện và 31% coi đó là nguồn cải thiện sự gắn kết của nhân viên.

Câu hỏi hóc búa về lưu trữ dữ liệu

Crown Records Management nhận thấy rằng dữ liệu thường được lưu trữ ở hơn 20 loại vị trí. Phổ biến nhất là cơ sở dữ liệu, hệ thống đám mây và sao lưu.

Tuy nhiên, một điều đáng báo động là việc cả dữ liệu đã sử dụng và chưa sử dụng được lưu giữ ở những nơi khó tiếp cận và bảo vệ an ninh hạn chế.

Đối với tất cả dữ liệu đã sử dụng, 29% người được hỏi cho biết nó được lưu giữ trên ổ cứng máy tính xách tay, 22% cho biết được lưu trữ trên các tài khoản email và 21% cho biết dữ liệu được lưu trong các tủ hồ sơ. Đối với tất cả các dữ liệu tối, 19% cho biết chúng được lưu trữ trên bàn và ngăn kéo, 17% cho biết họ ghi chú bằng văn bản và 12% cho biết chúng được lưu trữ tại nhà của nhân viên.

Một thách thức về quản lý

Dữ liệu phi cấu trúc đang trở nên khó quản lý hơn do sự phức tạp của nó.

Nghiên cứu của Crown, cho thấy dữ liệu phi cấu trúc được chia đều thành các tệp giấy, dữ liệu trong tài liệu điện tử gốc và dữ liệu trong các bản scan của tài liệu. Những người được hỏi cũng tiết lộ các loại dữ liệu phi cấu trúc mà họ lo lắng nhất:

  • 90% người được hỏi quan tâm đến dữ liệu trong các tài liệu bằng văn bản;
  • 88% quan tâm đến dữ liệu trong email;
  • 85% quan tâm đến dữ liệu trên các phương tiện truyền thông xã hội;
  • 85% quan tâm đến các tài liệu và biểu mẫu viết tay.

Cho rằng các nguồn dữ liệu này không được bảo vệ đầy đủ hoặc dễ dàng truy cập khi cần dữ liệu, các tổ chức lo sợ vấn đề vi phạm an ninh và không thể cung cấp dữ liệu trong các khung thời gian cần thiết - 43% người được hỏi lo ngại về việc lưu trữ các dữ liệu phi cấu trúc.

Năm tới, việc sản xuất dữ liệu được ước tính là lớn hơn 44 lần so với 10 năm trước đó. Do đó, các tổ chức sẽ phải trả thêm tiền cho nhiều không gian lưu trữ hơn khi việc tăng trưởng dữ liệu vẫn tiếp tục, chưa kể các rủi ro của dữ liệu phi cấu trúc tăng lên khi phải quản lý một khối lượng lớn hơn.

Kevin Widdop, chuyên gia tư vấn bảo mật thông tin tại Crown Records Management nhận xét: “Nhiều tổ chức dường như có nguy cơ bị chìm trong một lượng lớn dữ liệu mà họ không biết và nhiều người đang phải chịu đựng rất nhiều dữ liệu mà họ không biết nó chứa những thông tin gì”.

Một số trường hợp hợp lệ để lưu giữ dữ liệu không sử dụng cho các mục đích tuân thủ như ngành dịch vụ tài chính lưu giữ dữ liệu tài chính trong tối đa 25 năm hoặc mãi mãi trong một số trường hợp, theo quy định của Cơ quan Quản lý Tài chính. Tuy nhiên, nó trở thành một vấn đề khi phần lớn dữ liệu này được giữ ở các định dạng phi cấu trúc và khi dữ liệu nhạy cảm không được bảo vệ đầy đủ, có khả năng các doanh nghiệp sẽ bị phạt và ảnh hưởng tiêu cực đến hình ảnh của doanh nghiệp nếu dữ liệu bị vi phạm. Theo một số cách, nó thậm chí còn tệ hơn khi các tổ chức không nhận thức được lượng dữ liệu nằm trong những nguồn không có cấu trúc này, làm hạn chế cơ hội của họ”.

Ông cũng cho biết: “Khi các công cụ quản lý và lập chỉ mục dữ liệu phát triển, các tổ chức có các tùy chọn ngày càng nhiều để giúp họ giữ cả dữ liệu phi cấu trúc và dữ liệu tối của họ một cách an toàn nhưng có thể truy cập được. Sau đó, họ có thể đảm bảo rằng các rủi ro xung quanh vấn đề an ninh và tuân thủ được giữ ở mức tối thiểu. Dữ liệu tối sẽ trở nên hữu hình và dễ dàng truy cập, giúp các tổ chức có kiến ​​thức tốt hơn về thông tin họ đang nắm giữ và những gì nó có thể làm cho họ”.

Ngọc Huyền