Tăng cường xử lý chất lượng dữ liệu trong quá trình chuyển đổi số doanh nghiệp

Chuyển đổi số - Ngày đăng : 07:58, 20/03/2023

“Chất lượng dữ liệu tốt rất quan trọng để xử lý dữ liệu tốc độ cao, dữ liệu lớn, bao gồm cả các công nghệ học máy mà công nghệ này rất dễ bị ảnh hưởng bởi chất lượng dữ liệu kém. Việc xác định các điểm nóng về chất lượng dữ liệu cung cấp một phương pháp có hệ thống để các chuyên gia kỹ thuật liên tục cải thiện chất lượng dữ liệu trong quá trình chuyển đổi số (CĐS) doanh nghiệp.”
Chuyển đổi số

Tăng cường xử lý chất lượng dữ liệu trong quá trình chuyển đổi số doanh nghiệp

Tạ Quốc Ưng - VTV 20/03/2023 07:58

“Chất lượng dữ liệu tốt rất quan trọng để xử lý dữ liệu tốc độ cao, dữ liệu lớn, bao gồm cả các công nghệ học máy mà công nghệ này rất dễ bị ảnh hưởng bởi chất lượng dữ liệu kém. Việc xác định các điểm nóng về chất lượng dữ liệu cung cấp một phương pháp có hệ thống để các chuyên gia kỹ thuật liên tục cải thiện chất lượng dữ liệu trong quá trình chuyển đổi số (CĐS) doanh nghiệp.”

Tóm tắt:

* Chất lượng dữ liệu

- Dữ liệu chất lượng là dữ liệu “Phù hợp với mục đích”

- Doanh nghiệp và CNTT cùng chịu trách nhiệm về chất lượng dữ liệu - Chất lượng dữ liệu là một thành phần cơ bản quan trọng của tất cả các phần của khung (framework) quản trị dữ liệu và quản lý thông tin doanh nghiệp (DN)

* Nhận định của Gartner về tăng cường chất lượng dữ liệu trong CĐS DN:

- Đến năm 2024, các đánh giá về đạo đức sẽ phổ biến như đánh giá về quyền riêng tư, loại bỏ mọi lời bào chữa cho việc sử dụng vô trách nhiệm về dữ liệu và công nghệ.

- Đến năm 2025, các giám đốc dữ liệu (CDO) sẽ sử dụng nhiều các công việc đa chức năng dựa trên luồng giá trị.

- Đến 2026: các hoạt động tài chính tăng cường (FinOps) sẽ cải thiện khả năng tối ưu hóa chi phí trên đám mây và giảm tới 40% nỗ lực lập kế hoạch ngân sách.

- Đến năm 2026, hơn 50% tổ chức thương mại sẽ có những nỗ lực ban đầu trong việc kiếm tiền từ dữ liệu.

Các dự đoán gần đây nhất của Gartner cho thấy tầm quan trọng của dữ liệu và phân tích đối với các ý tưởng kinh doanh và ứng dụng CNTT ngày càng mở rộng. Dữ liệu và phân tích là những yếu tố ngày càng quan trọng trong hầu hết các ngành, các chức năng kinh doanh và các nguyên tắc ứng dụng CNTT ở cả khu vực kinh tế tư nhân và cả khu vực công.

CHẤT LƯỢNG DỮ LIỆU

Chất lượng dữ liệu là một thành phần quan trọng nhưng thường bị bỏ qua trong quản lý dữ liệu. Chất lượng dữ liệu kém có thể khiến tổ chức tốn thời gian, tiền bạc và mất khách hàng. Gần 60% tổ chức không đo lường chi phí tài chính hàng năm của dữ liệu chất lượng kém. Các vai trò thiết yếu về chất lượng dữ liệu, chẳng hạn như người quản lý dữ liệu, thường không tồn tại hoặc không được trao quyền để tác động đến quy trình chất lượng dữ liệu. Chất lượng dữ liệu là một phần không thể thiếu trong framework quản trị dữ liệu và quản lý thông tin DN (EIM). Ba vòng quản trị thông tin của Gartner xác định các tiêu chuẩn phân loại dữ liệu được các tổ chức sử dụng để giúp xác định các mục tiêu quan trọng đối với chất lượng dữ liệu. Hình 1 cho thấy ba vòng quản trị thông tin. Càng gần trung tâm của ba vòng, nhu cầu về dữ liệu chất lượng cao càng lớn.

Xác định chỉ số đo lường hiệu quả (KPI) cho chất lượng dữ liệu quan trọng tập trung vào dữ liệu chính trong vòng trung tâm. Điều này cho phép một cách tiếp cận có cấu trúc, định hướng kinh doanh để đảm bảo dữ liệu chất lượng cao.

Thách thức là chất lượng dữ liệu kém, ngay cả trong một trường hợp sử dụng ứng dụng đơn lẻ ở vòng ngoài, vẫn có thể gây ra các tác động kinh doanh ngoài ý muốn. DN có thể không nhận thức được nguồn gốc của những tác động này vì vấn đề chất lượng dữ liệu bị ẩn trong các lớp quy trình.

DN và bộ phận CNTT cùng chịu trách nhiệm về chất lượng dữ liệu. Các yêu cầu xử lý dữ liệu hiện đại, được thúc đẩy bởi khối lượng và tốc độ cao hơn, đòi hỏi nhân viên dữ liệu phải chú ý nhiều hơn đến các mối quan tâm về chất lượng dữ liệu. Cách tiếp cận truyền thống nhắm mục tiêu KPI chất lượng dữ liệu dựa trên KPI kinh doanh có hiệu quả, nhưng do sự phức tạp của nhu cầu hiện đại, các tổ chức gặp khó khăn trong việc theo kịp các yêu cầu về chất lượng dữ liệu. Các công cụ được mua và triển khai để giải quyết chất lượng dữ liệu kém, nhưng nhiều tổ chức đánh giá quá cao, gấp đôi lượng thời gian để triển khai các công cụ chất lượng dữ liệu.

hinh-1_chat-luong-du-lieu.png
Hình 1. Quản trị thông tin theo ba vòng tròn Gartner [1]

Dữ liệu chất lượng là dữ liệu “Phù hợp với mục đích”

KPI và bất kỳ nỗ lực nào khác về chất lượng dữ liệu đều dựa trên việc xác định thời điểm dữ liệu “phù hợp với mục đích”. Một bộ dữ liệu giống hệt nhau có thể phù hợp với mục đích này nhưng không hữu ích cho mục đích khác. Tuy nhiên, trong nhiều trường hợp sử dụng dữ liệu trùng lặp, thì tập dữ liệu đã được làm sạch sẽ được xác định để được sử dụng lại cho nhiều mục đích. Nói cách khác, dữ liệu phải được làm sạch mỗi khi nó được sử dụng.

Một khái niệm quan trọng là chất lượng dữ liệu khác biệt dựa trên một hoặc nhiều trường hợp sử dụng dữ liệu. Thách thức là thu thập siêu dữ liệu về một dòng dữ liệu đầy đủ của tập dữ liệu và áp dụng các quy tắc phù hợp với mục đích để làm sạch dữ liệu cho từng trường hợp sử dụng. Đây có thể là một nhiệm vụ khó khăn trong thực tế.

Thành công chung của bất kỳ sáng kiến chất lượng dữ liệu nào đều phụ thuộc vào mối quan hệ được trao quyền giữa DN và bộ phận CNTT. DN sẽ thúc đẩy KPI cần thiết để liên kết các chức năng chất lượng dữ liệu với dữ liệu quan trọng và quy trình kinh doanh.

Xu hướng sử dụng dữ liệu

Chất lượng dữ liệu là một môn thể thao đồng đội đòi hỏi sự tham gia của cả bộ phận CNTT và DN để thành công. Hầu hết các chương trình chất lượng dữ liệu tập trung vào việc xác định các chỉ số hiệu suất chính (KPI) từ phía DN nhằm vào các quy trình và dữ liệu quan trọng. Các KPI này tập trung vào những gì DN coi là mục tiêu cho các sáng kiến về chất lượng dữ liệu. DN sở hữu việc xác định các KPI. KPI chất lượng dữ liệu được liên kết với KPI kinh doanh nhưng xác định các chi tiết cụ thể mà chất lượng dữ liệu kém có thể ảnh hưởng đến KPI kinh doanh.

Những thách thức với KPI chất lượng dữ liệu đi kèm với việc đảm bảo triển khai thực tế các giải pháp chất lượng dữ liệu hỗ trợ KPI kinh doanh. Mối liên hệ giữa hai loại KPI này là cần thiết cho một chương trình chất lượng dữ liệu thành công. Để hỗ trợ cách tiếp cận theo nhóm và cuối cùng là cải thiện chất lượng dữ liệu, các chuyên gia kỹ thuật có thể tiếp cận các mối quan tâm về chất lượng dữ liệu bằng cách sử dụng mô hình quản lý dữ liệu.

Mô hình này cho phép các chuyên gia xác định và giải quyết các mối quan tâm về chất lượng dữ liệu từ góc độ kiến trúc dữ liệu. Việc lặp lại qua các bước được mô tả sẽ cung cấp một giải pháp năng động, linh hoạt để giải quyết vấn đề chất lượng dữ liệu. Cách tiếp cận này điều chỉnh KPI chất lượng dữ liệu với KPI kinh doanh và có thể giúp xác định các vấn đề về chất lượng dữ liệu chưa biết.

Framework Gartner cung cấp các bước có cấu trúc xác định cách tiếp cận nhanh, dựa trên kiến trúc dữ liệu để đạt được chất lượng dữ liệu liên tục. Hình 2 cho thấy framework Gartner về chất lượng dữ liệu linh hoạt.

Các chuyên gia kỹ thuật nên tiếp cận DN theo cách sáng kiến chất lượng dữ liệu liên kết trực tiếp với KPI của DN. Việc lập bản đồ các mối quan hệ này là rất quan trọng đối với một sáng kiến về chất lượng dữ liệu, vừa để hiểu nơi nào cần nhắm mục tiêu chất lượng dữ liệu nhanh vừa để thể hiện giá trị trực tiếp cho DN.

Các chuyên gia kỹ thuật cần hoàn thành bốn nhiệm vụ sau trước khi DN đưa ra chiến lược kinh doanh: Thứ nhất là xác định độ chín của chất lượng dữ liệu. Thứ hai là nắm bắt vai trò chất lượng dữ liệu hiện có. Thứ ba là thu thập KPI kinh doanh và KPI chất lượng dữ liệu đã biết. Thứ tư là lựa chọn năm bước để tạo các trường hợp kinh doanh cho chất lượng dữ liệu.

Tại các nhiệm vụ trên, các bước để chuẩn bị thực hiện tăng cường chất lượng dữ liệu bao gồm: [1]

Bước 1. Xác định trạng thái hiện tại của chất lượng dữ liệu bằng cách ánh xạ các thành phần kiến trúc quản lý dữ liệu tới các điểm nóng chất lượng dữ liệu tiềm ẩn. [2]

Bước 2. Phân tích và xếp hạng các điểm nóng về chất lượng dữ liệu để xác định mục tiêu về chất lượng dữ liệu. Điều này bao gồm ánh xạ các điểm nóng về dữ liệu đã xác định thành KPI kinh doanh. [3]

Bước 3. Xác định quy trình và bộ công cụ để giải quyết các điểm nóng về chất lượng dữ liệu. Nó có thể đơn giản như quy trình thủ công hoặc hoàn thành yêu cầu đề xuất (RFP) cho bộ công cụ chất lượng dữ liệu hiệu suất cao. [4]

Bước 4. Xác định và truyền đạt những thay đổi được đề xuất đối với quy trình chất lượng dữ liệu. DN hoặc người quản lý dữ liệu nên tham gia và mục tiêu ban đầu phải là lợi nhuận trên giá trị cao nhưng ít rủi ro. [5]

Bước 5. Thực hiện các thay đổi về chất lượng dữ liệu được đề xuất. Điều này bao gồm lập kế hoạch, liên lạc, giám sát mọi tác động và chuẩn bị sẵn sàng cho việc khôi phục ngay lập tức nếu cần. [6]

Bước 6. Thực hiện kiểm tra liên tục các thay đổi về chất lượng dữ liệu và lặp lại các bước này. Bằng cách liên tục ánh xạ lại và xếp hạng lại các điểm nóng về chất lượng dữ liệu, cần có một quy trình linh hoạt để quản lý chất lượng dữ liệu.

Hầu hết các tổ chức sẽ có một số loại chương trình chất lượng dữ liệu. Chương trình có thể rất yếu, hoặc rất tiên tiến và có cấu trúc. Nó sẽ không hiệu quả 100% trong việc giải quyết các mối lo ngại về chất lượng dữ liệu. Luôn có chỗ cho sự cải tiến. Các chuyên gia kỹ thuật nên liên hệ với DN và đánh giá tình trạng hiện tại của bất kỳ chương trình chất lượng dữ liệu hiện có nào. Bất kể chương trình hiện có hay thiếu một chương trình, mục tiêu là xác định KPI kinh doanh và liên kết chúng với KPI chất lượng dữ liệu, được xác định bởi dữ liệu và quy trình quan trọng.

Sử dụng bảy khối xây dựng EIM của Gartner làm framework để tiếp cận DN và xác định các sáng kiến chất lượng dữ liệu hiện có. Chất lượng dữ liệu là một thành phần cơ bản quan trọng của tất cả các phần của mô hình EIM, mặc dù các liên kết trực tiếp giữa hiệu suất kinh doanh và chất lượng dữ liệu khó nắm bắt hơn. Hình 3 cho thấy mô hình EIM của Gartner.

hinh-3_chat-luong-du-lieu.png
Hình 3. Quản lý thông tin doanh nghiệp (Nguồn: Gartner, 10/2017) [1]

Các chương trình chất lượng dữ liệu hiện có được triển khai như một phần của quy trình quản trị. Khối quản trị sở hữu các định nghĩa về KPI kinh doanh và thiết lập các liên kết đến KPI chất lượng dữ liệu. Trong khi các tham số chất lượng dữ liệu thuộc sở hữu của khối quản trị, thì chất lượng dữ liệu linh hoạt được triển khai trong khối quy trình. DN có thể sẽ tập trung vào các khối EIM khác nhau: tầm nhìn, chiến lược và số liệu. DN có thể có ít hiểu biết sâu về quy trình hoặc các khối cơ sở hạ tầng. Trong nhiều trường hợp, các thành phần này sẽ được coi là vấn đề cần CNTT giải quyết. Sử dụng mô hình trên có thể cho thấy tất cả các thành phần EIM có thể tác động đến tầm nhìn kinh doanh như thế nào. Hình 4 dưới đây cho phép DN tăng cường chất lượng dữ liệu và phân tích dữ liệu thông qua kiến trúc dữ liệu toàn diện

hinh-4-chat-luong-du-lieu.png
Hình 4. Tăng cường chất lượng dữ liệu và phân tích dữ liệu theo mô hình Gartner [2]

BẢO MẬT DỮ LIỆU VÀ QUẢN TRỊ DỮ LIỆU

Bảo mật và quản trị dữ liệu ngày càng trở nên quan trọng khi số lượng và giá trị của thông tin tăng lên. Dữ liệu có chức năng trung tâm trong nền kinh tế số. Nó được thu thập với số lượng khổng lồ để có thể đưa ra các quyết định tự động hoặc tự chủ trên cơ sở phân tích dữ liệu.

Trong bối cảnh này, bảo mật dữ liệu đạt được bằng các công nghệ như mã hóa, bảo vệ quyền truy cập và các công cụ ngăn chặn các cuộc tấn công (ví dụ: SQL injection) vào thông tin. Ngược lại, quản trị dữ liệu liên quan đến các công cụ khuyến khích xử lý dữ liệu chính xác (ví dụ: quản lý thông tin cá nhân và thông tin nhạy cảm khác) và thực hiện quản lý rủi ro liên quan với việc sử dụng, chẳng hạn như các công cụ đo lường và kiểm soát.

Bảo mật dữ liệu

Các chức năng của quản trị dữ liệu hoạt động như một chủ đề tổng thể trên các lớp của kết cấu dữ liệu. Bảo mật dữ liệu trong những năm gần đây đã phát triển vượt ra ngoài các giải pháp kỹ thuật riêng lẻ để bảo vệ cơ sở dữ liệu quan hệ, cổ điển. Bảo mật cơ sở dữ liệu tiếp tục là một lĩnh vực quan trọng, bảo vệ cơ sở dữ liệu chống lại các hành vi vi phạm tính toàn vẹn, tính bảo mật của thông tin và tính khả dụng. Bảo mật chủ yếu liên quan đến các chức năng đối với thông tin được lưu trữ và xử lý trên các hệ thống cơ sở dữ liệu, cũng như cơ sở hạ tầng mạng và máy chủ bên dưới và quyền truy cập vào thông tin.

Tuy nhiên, khi cơ sở hạ tầng và công nghệ để xử lý và lưu trữ dữ liệu thay đổi - đặc biệt là các công cụ dựa trên đám mây và kết quả là cơ sở hạ tầng kết hợp của các phương pháp tiếp cận hiện đại và kế thừa - các yêu cầu sẽ thay đổi. Các chức năng cốt lõi của các sản phẩm bảo mật dữ liệu hiện đại bao gồm các lĩnh vực chức năng sau:

Đánh giá lỗ hổng: xác định các điểm tấn công tiềm năng, lỗi cấu hình và các mối nguy hiểm khác.

Khám phá và phân loại dữ liệu: kiến thức về dữ liệu và phân loại dữ liệu theo độ nhạy cảm (ví dụ: thông tin cá nhân); lý tưởng nhất là xây dựng các công cụ trên cơ sở hạ tầng hiện có để quản lý siêu dữ liệu và danh mục dữ liệu.

Bảo vệ dữ liệu: mã hóa, gắn thẻ và các công nghệ khác cho cả lưu trữ và truyền dữ liệu.

Giám sát và phân tích: giám sát liên tục quyền truy cập và sử dụng dữ liệu, đồng thời phân tích để phát hiện và phản hồi các điểm bất thường, bao gồm tích hợp với các công cụ quản lý sự kiện và thông tin bảo mật (SIEM).

Ngăn chặn mối đe dọa: bảo vệ chống lại các cuộc tấn công có chủ đích như SQL injection.

Quản lý truy cập: bảo vệ có mục tiêu các tài khoản người dùng đặc quyền và kiểm soát truy cập động, theo chính sách; thường được xử lý bởi các ứng dụng chuyên dụng.

Báo cáo kiểm tra và tuân thủ: các báo cáo và bảng điều khiển được tạo tự động và đặc biệt để có cái nhìn tổng quan về tình trạng bảo mật hiện tại. Những công cụ này là các khối xây dựng cơ bản của kết cấu dữ liệu an toàn, hiện đại và phải được thiết kế để hỗ trợ các môi trường kết hợp phức tạp và nền tảng nhiều đám mây.

Quản trị dữ liệu

Như đã đề cập trước đó, quản trị dữ liệu không chỉ đơn thuần là bảo vệ dữ liệu và được định nghĩa tốt nhất là một thuật ngữ chung bao gồm nhiều chức năng bảo vệ và kiểm soát dữ liệu cũng như việc sử dụng dữ liệu. Hai lĩnh vực chức năng quan trọng khác ngoài bảo mật dữ liệu là:

(i) Quản lý quyền riêng tư để xử lý thông tin thuộc phạm vi của GDPR. Giống như toàn bộ chủ đề về quản lý dữ liệu, nó không chỉ là về dữ liệu có cấu trúc mà còn về dữ liệu phi cấu trúc cần được phân tích, quản lý và bảo vệ.

(ii) Quản trị dữ liệu và rủi ro là một lĩnh vực phụ tập trung vào các số liệu cụ thể và các chức năng kiểm soát có thể được sử dụng để giám sát và cải thiện việc tuân thủ các quy tắc đã xác định để xử lý dữ liệu. Một mặt, lĩnh vực này bao gồm các quy định trong lĩnh vực bảo vệ dữ liệu như GDPR; mặt khác, nó bao gồm các yêu cầu khác để xử lý thông tin nhạy cảm, cũng như các quy tắc nội bộ để xử lý và bảo vệ dữ liệu đặc biệt quan trọng và có giá trị. Những công cụ như vậy thường ăn khớp với các sản phẩm quản trị CNTT, rủi ro và tuân thủ (GRC) để đưa dữ liệu vào cấp độ quản lý rủi ro cao hơn. Một chiến lược tốt để quản trị dữ liệu luôn được xây dựng dựa trên việc tích hợp các chức năng cụ thể với bảo mật dữ liệu, cũng như danh mục dữ liệu và quản lý siêu dữ liệu cơ bản.

Trong thời đại ngành công nghiệp 4.0 cần có thêm nhiều dữ liệu được xử lý để bảo đảm dữ liệu chất lượng. Chất lượng dữ liệu và kiến thức thực hành quản lý có thể cải thiện đáng kể chức năng giao tiếp và hiệu suất tổng thể. Hình 4 là 11 khu vực dữ liệu được tổ chức thành ba loại: dữ liệu chất lượng, quản lý dữ liệu và dữ liệu quản trị.

NHẬN ĐỊNH VỀ TĂNG CƯỜNG CHẤT LƯỢNG DỮ LIỆU TRONG CĐS DN

Theo đánh giá của các chuyên gia Gartner, đến năm 2024, các đánh giá về đạo đức sẽ phổ biến như đánh giá về quyền riêng tư, loại bỏ mọi lời bào chữa cho việc sử dụng vô trách nhiệm về dữ liệu và công nghệ. Đến năm 2025, các giám đốc dữ liệu (CDO) sẽ sử dụng nhiều các công việc đa chức năng dựa trên luồng giá trị. Đến năm 2026, các hoạt động tài chính tăng cường (FinOps) sẽ cải thiện khả năng tối ưu hóa chi phí trên đám mây và giảm tới 40% nỗ lực lập kế hoạch ngân sách. Đến năm 2026, hơn 50% tổ chức thương mại sẽ bắt đầu nỗ lực kiếm tiền từ dữ liệu.

Tăng cường chất lượng dữ liệu trong các giải pháp phân tích, báo cáo quản trị thông minh và khoa học dữ liệu: Trong năm 2023, tính dễ di chuyển, khả năng tương tác và tính nhất quán sẽ là những yếu tố quyết định trong 90% quyết định mua bán được ứng dụng khoa học dữ liệu dựa trên học máy và về nền tảng trí tuệ nhân tạo (AI).

Đến năm 2024, 60% các tổ chức sẽ áp dụng mô hình phân phối dẫn đến chi phí hoạt động thu thập và phân tích dữ liệu thấp hơn 5 lần so với những tổ chức không áp dụng. Đến năm 2024, các tổ chức thiếu framework vận hành phân tích và dữ liệu bền vững sẽ bị chậm tối đa hai năm. [8]

Tăng cường chất lượng dữ liệu trong giải pháp quản lý dữ liệu: Đến năm 2026, 90% DN sử dụng công cụ và nền tảng quản lý dữ liệu mà không sử dụng nền tảng đa đám mây sẽ ngừng hoạt động trong vòng ba năm. Đến năm 2025, các thiết kế kết cấu dữ liệu sử dụng siêu dữ liệu sẽ giúp giảm ít nhất 50% nhiệm vụ quản lý dữ liệu do con người điều khiển và quản lý. [8]

Tăng cường chất lượng dữ liệu trong trí tuệ nhân tạo: Đến năm 2025, 80% các DN lớn trên toàn cầu sẽ ứng dụng ít nhất 1 thuật toán học máy để tạo ra các mô hình chính xác, an toàn và bền vững với môi trường hơn. Đến năm 2026, những mô hình ứng dụng cảm biến sẽ cách mạng hóa AI, tạo nền tảng cho 50% trường hợp sử dụng xử lý ngôn ngữ tự nhiên (2021: dưới 5%). [8]

Tăng cường chất lượng dữ liệu trong đám mây và cơ sở hạ tầng: Đến năm 2025, các đám mây có quyền của chủ sở hữu sẽ giải quyết các yêu cầu về tuân thủ cụ thể đối với khối lượng công việc của khu vực công được quản lý chặt chẽ, nhưng sẽ không bắt buộc đối với hầu hết khối lượng công việc của DN. Đến năm 2025, hơn 50% dữ liệu do DN quản lý sẽ được tạo và xử lý ở ngoài trung tâm dữ liệu hoặc đám mây của DN. [8]

Tăng cường chất lượng dữ liệu trong đổi mới công nghệ: Đến năm 2026, các lô hàng cảm biến và thiết bị CNTT nhỏ hàng năm sẽ vượt quá 100 triệu đơn vị điều này sẽ tạo ra các cơ hội trong đóng gói thông minh và kiểm tra theo thời gian thực. Đến năm 2026, 30% DN toàn cầu sẽ sử dụng AI để đo lường và phân tích chính xác tác động của biến đổi khí hậu đối với hoạt động kinh doanh của DN. [8]

hinh-5_chat-luong-du-lieu.png
Hình 5: 11 khu vực dữ liệu được tổ chức thành ba loại: dữ liệu chất lượng, dữ liệu quản lý, và dữ liệu quản trị [4]

Tóm lại, các chuyên gia kỹ thuật tập trung vào chất lượng dữ liệu nên:

(i) Xác định các nguồn dữ liệu mới liên quan đến chất lượng dữ liệu bằng cách sử dụng phương pháp Gartner về chất lượng dữ liệu. Sử dụng phương pháp này để tăng cường các quy trình chất lượng dữ liệu hiện có.

(ii) Tương tác với DN để đưa ra các sáng kiến về chất lượng dữ liệu. Xác định các vai trò chất lượng dữ liệu hiện có và KPI kinh doanh quan trọng, đồng thời liên kết những vai trò này với KPI chất lượng dữ liệu.

(iii) Kích hoạt chất lượng dữ liệu linh hoạt từ góc độ kỹ thuật bằng cách tận dụng phương pháp ánh xạ kiến trúc quản lý dữ liệu để xác định các điểm nóng về chất lượng dữ liệu.

THAY LỜI KẾT

Nhận thức được tầm quan trọng của bảo mật và quản trị dữ liệu có nghĩa là DN cần tránh xa các công cụ biệt lập, không đầy đủ, không đáp ứng được các yêu cầu quản trị dữ liệu và bảo mật quan trọng hoặc không thực hiện đầy đủ công việc cung cấp phạm vi bảo hiểm. Một cân nhắc bổ sung là việc liên tục giới thiệu các giải pháp cục bộ mới đơn giản là mất quá nhiều thời gian. Tuy nhiên, các giải pháp cũng phải phục vụ các yêu cầu khá khác nhau của các bên liên quan từ kinh doanh, bảo mật CNTT, bảo vệ dữ liệu và các lĩnh vực khác.

Để xử lý tăng cường chất lượng dữ liệu một cách hiệu quả, DN cần có một chiến lược trong đó cái nhìn tổng thể về các yếu tố cần thiết (ví dụ: kết cấu dữ liệu) đóng vai trò trung tâm. Cách tiếp cận cá nhân trong lĩnh vực phân tích là không đủ. Các nhà quản lý CNTT cần triển khai cả hai nền tảng với quản lý siêu dữ liệu và danh mục dữ liệu cũng như các chức năng liên ngành về quản trị dữ liệu và bảo mật dữ lCiệu một cách chính xác để có thể làm việc tối ưu với dữ liệu và tạo ra giá trị gia tăng mong muốn.

Tài liệu tham khảo:

[1]. Agile Data Quality to Maximize Your Business Results by Thornton Jared Craig Published: 03 October 2017 ID: G00327537

[2]. Data security and data governance New Gold in Admin – Magazine (admin-magazine.com) Issue 73 01/2023

[3]. Roadmap Drive Successful Digital Growth With Data and Analytics https://emtemp.gcom.cloud/ngw/... information-technology/documents/insights/the-it-roadmap- for-data-and-analytics.pdf

[4] Enterprise Artificial Intelligence Transformation by Rashed Haq, Copyright © 2020 by Rashed Haq. All rights reserved. Published by John Wiley & Sons, Inc., Hoboken, New Jersey. Published simultaneously in Canada

[5]. Drive Business Outcomes by Measuring the Value of Data Literacy by Alan D. Duncan Published: 14/3/2022

[6]. Drive Business Outcomes by Measuring the Value of Data Literacy by Alan D. Duncan Published: 14/3/2022

[7]. What Are the Essential Roles for Data and Analytics? By Analyst(s): Jorgen Heizenberg, Saul Judah, Alan D. Duncan Published 16 August 2022 - ID G00774299

[8]. 100 Data & Analytics Predictions Through 2026 for APAC by Alan D. Duncan, https://webinar.gartner.com/42... agenda/session/1037639

(Bài đăng ấn phẩm in Tạp chí TT&TT số 2 tháng 2/2023)

Tạ Quốc Ưng - VTV