Toàn vẹn dữ liệu (Data Integrity) của một cơ sở dữ liệu (CSDL) là cách xây dựng CSDL làm sao để dữ liệu chứa trong CSDL này phải chính xác và tin cậy. Nếu dữ liệu chứa trong CSDL không chính xác có thể nói CSSL đó mất tính toàn vẹn (lost data integrity).
Tính toàn vẹn của dữ liệu rất quan trọng vì mọi quyết định kinh doanh quan trọng đều dựa trên dữ liệu của công ty. Với tính toàn vẹn của dữ liệu tốt, bạn có thể phân tích dữ liệu của công ty để trả lời các câu hỏi như: thành tựu kinh doanh của bạn là gì? Chi phí kinh doanh của bạn là gì? Doanh số bán hàng của bạn ở các khu vực khác nhau như thế nào? Có lĩnh vực kinh doanh của bạn mà chi phí tăng nhanh hơn thu nhập không? Năng suất của các bộ phận khác nhau trong lực lượng lao động của bạn là gì? Bạn có đang đáp ứng các mục tiêu điểm chuẩn của mình không? Bạn có thể dự báo chi phí của mình cho năm tài chính sắp tới không? Nếu bạn không có dữ liệu tốt, bạn không thể trả lời chính xác bất kỳ câu hỏi nào trong số này.
Theo một nghiên cứu được Precisely và Corinium Global Intelligence công bố, 82% người thực thi dữ liệu mức C nói rằng chất lượng dữ liệu là một rào cản của các dự án tích hợp dữ liệu vốn là tiền thân của các sáng kiến CĐS và là nguồn gốc cho những nhận thức đúng đắn để đưa ra các quyết định kinh hiệu quả. 80% cảm thấy khó khăn trong việc đảm bảo dữ liệu vừa có sự phong phú vừa có tính phù hợp trên quy mô lớn để giúp đưa ra những quyết định kinh doanh sáng suốt hơn.
Nghiên cứu đã khảo sát hơn 300 giám đốc dữ liệu (Chief Data Officers - CDO) tại các công ty có hơn 2.500 nhân viên trong các ngành công nghiệp ở châu Mỹ, châu Âu - Trung Đông và châu Phi (EMEA) và châu Á - Thái Bình Dương (APAC). Kết quả cho thấy 65% nhân viên chỉ tin tưởng vào dữ liệu khi nguồn dữ liệu đó làm cho họ có cảm giác tin tưởng. Điều này đặt ra câu hỏi làm thế nào để xây dựng lòng tin vững chắc vào dữ liệu để khuyến khích các giám đốc điều hành cũng như nhân viên tuyến đầu của họ tự tin tiến về phía trước với những nhận thức phía sau dữ liệu ẩn hay những kết nối lạ.
Amy O'Connor, Giám đốc thông tin và dữ liệu tại Precisely cho biết: "Các DN trong tất cả các ngành và tất cả các khu vực tham gia vào những sáng kiến CĐS là điều thực sự cấp bách. Tuy nhiên, các chương trình này muốn thành công thì phải được xây dựng trên một nền tảng toàn vẹn".
Những sáng kiến dựa trên dữ liệu thúc đẩy nhu cầu về tính toàn vẹn dữ liệu
Nghiên cứu mới nêu bật một số sáng kiến cụ thể mà các CDO đang ưu tiên vào năm 2021 khi thực hiện CĐS trong các tổ chức của họ. 63% CDO tham gia khảo sát xác định đáp ứng nhu cầu mong đợi về những trải nghiệm khách hàng là ưu tiên hàng đầu trong năm nay. 58% tích cực tham gia cam kết trong các dự án khởi chạy hoặc mở rộng AI và những phân tích nâng cao. Gần một nửa số người được hỏi cho biết các tổ chức của họ đang thực hiện các sáng kiến vào năm 2021 với mục đích:
• Đáp ứng các yêu cầu về tuân thủ và quy định (48,68%)
• Tạo điều kiện cho lực lượng lao động từ xa hoặc phân tán (48,36%)
• Tạo sự thuận lợi cho những giao tiếp khách hàng được cá nhân hóa hoặc được nhắm chọn chi tiết (micro-targeted) (48,36%)
• Tích hợp hoặc loại bỏ do sáp nhập và mua lại (47,7%)
• Xây dựng tầm nhìn 360 độ về khách hàng (46,38%)
Nhiều sáng kiến CĐS đang được ưu tiên vào năm 2021 nêu bật tầm quan trọng ngày càng cao của Giám đốc dữ liệu và nhu cầu về nền tảng dữ liệu tin cậy để đảm bảo cho sự thành công cho các dự án.
Những thách thức quan trọng cản trở sự đổi mới theo hướng dữ liệu
Báo cáo cho thấy, mặc dù số lượng lớn các sáng kiến CĐS đang được thực hiện tại các DN hàng đầu trên thế giới, nhưng vẫn tồn tại các rào cản và những thách thức trong việc đảm bảo tính toàn vẹn của dữ liệu cũng như sự thành công của các dự án. Cụ thể:
Nhóm dữ liệu mất quá nhiều thời gian (40%) để làm sạch và chuẩn bị dữ liệu để phân tích, với một số báo cáo lên đến 80% thời gian. Gấn 2/3 số người được hỏi (65%) nói rằng nhân viên sẽ chỉ tin tưởng những thông tin chi tiết từ dữ liệu nếu họ xác nhận được cảm nhận của họ. Những mối lo ngại về chất lượng dữ liệu đang cản trở những chương trình tích hợp dữ liệu cho 82% CDO. Gần 9/10 CDO cho biết họ đang gặp thách thức do thiếu hụt nhân viên có những kỹ năng phù hợp. 4/5 DN đấu tranh để làm giàu dữ liệu hiện có của mình trên quy mô lớn để khám phá những hiểu biết sâu sắc mới và các mô hình tiềm năng.
Các ngành đang tiến tới toàn vẹn dữ liệu ở các bước tiến khác nhau
Báo cáo chỉ ra rằng trong khi CĐS là sự ưu tiên hàng đầu thì các DN đang phát triển ở những cấp độ khác nhau mang lại những kết quả khác nhau. Các công ty công nghệ và phần mềm dẫn đầu trong việc thiết lập một chương trình phân tích với 80% cho biết đến nay ít nhất họ cũng "khá thành công".
Theo sau là các công ty vận tải và hậu cần với tỷ lệ thành công là 65%. Dịch vụ tài chính, viễn thông, bao hiểm và chăm sóc sức khỏe có tỷ lệ thành công là 60%. Bán lẻ đứng là 55%.
Trong việc tích hợp các chương trình phân tích vào quy trình hiện có và thúc đẩy việc áp dụng vào các DN trên quy mô lớn thì các nhà bán lẻ báo cáo tỷ lệ thành công là 60%, dịch vụ tài chính là 66%. Các công ty công nghệ và phần mềm báo cáo tỷ lệ thành công chỉ 47% với các công ty vận tải và hậu cầu là 43%. Các cơ quan chính phủ và giáo dục có với tỷ lệ thành công là 30%.
Sự khác biệt giữa các khu vực tồn tại nhưng ít rõ rệt hơn so với các ngành
Xu hướng CĐS trên toàn thế giới có ít sự thay đổi theo khu vực hơn theo ngành. Trong số ba khu vực được khảo sát trong báo cáo, châu Mỹ, EMEA và APAC, các công ty ở EMEA có thời gian chuẩn bị dữ liệu để phân tích ở mức 42%, châu Mỹ là 41%, các công ty ở APAC chỉ có 29%.
Trên toàn thế giới đang thiếu nhân viên có kỹ năng chuyên môn với 3 khu vực báo cáo những thách thức tương tự trong việc tìm kiếm nhân viên phù hợp với các mục tiêu của họ. Trên khắp các khu vực 85 - 90% CDO báo cáo rằng tìm kiếm nhân viên có kỹ năng phù hợp là "rất khó" hoặc "khá khó".
Báo cáo cho thấy sự khác biệt lớn hơn về khả năng của CDO trong việc truy nhập vào các công cụ hay dịch vụ phù hợp để CĐS được thành công. Ở châu Mỹ, 76% CDO cho biết đang gặp khó khăn trong việc tìm kiếm các công cụ và dịch vụ phù hợp với 70% ở APAC và 69% ở EMEA.
Ở Việt Nam các DN Việt hiện có mô hình ALCOA làm nguyên tắc tuân thủ để đảm bảo tính toàn vẹn dữ liệu: Nguyên tắc phụ thuộc (attributable); Nguyên tắc rõ ràng (legible); Nguyên tắc đồng thời (contemporaneous); Nguyên tắc nguyên bản bản (original); Nguyên tắc chính xác (accurate).
Toàn vẹn dữ liệu cũng là yếu tố quan trong cho bất kỳ DN nào. Các DN muốn thành công trong CĐS cần phải tuân thủ các nguyên tắc của toàn vẹn dữ liệu và an toàn dữ liệu để nâng cao chất lượng sản phẩm./.