Doanh nghiệp muốn phát triển: Cần định lượng, đong đếm dữ liệu của chính mình
Chuyển đổi số - Ngày đăng : 13:35, 21/03/2022
Tuy nhiên, để các DN ứng dụng dữ liệu hiệu quả trong quản trị, điều hành, điều quan trọng cần có là phương pháp chuẩn, cách thức quản lý tối ưu. Chính vì điều này, mới đây COLE.VN đã tổ chức Hội thảo trực tuyến "Ứng dụng Data Warehouse và Data Lake trong CĐS DN. Tại đây, các chuyên gia đã có những phân tích, chia sẻ quan điểm thấu đáo hơn về chủ đề này.
Thời gian sẽ dần hình thành các kho dữ liệu
Theo ông Nguyễn Thế Anh, chuyên gia có nhiều kinh nghiệm về CĐS, phụ trách phần mềm, Tập đoàn BRG cho rằng, giờ đây, khi DN CĐS mạnh mẽ mọi khâu, mọi quy trình, về lâu dài sẽ dần hình thành các kho dữ liệu. Đến một giai đoạn nào đó, các DN sẽ tích lũy đủ dữ liệu và sẽ tận dụng nó để khai thác, phân tích sử dụng dữ liệu.
"Khi dữ liệu hình thành đủ lớn, nếu DN chỉ chạy báo cáo phức hợp cùng hệ thống cũ (chưa nâng cấp) sẽ sinh ra quá tải, điều này ảnh hưởng đến hệ thống báo cáo tổng hợp nhiều chiều, khiến việc đưa ra kết quả, quyết định xử lý thông tin không chính xác", ông Nguyễn Thế Anh phân tích.
Để hạn chế điều này, ứng dụng Data Warehouse được thiết kế, ra đời nhằm: Phân tích các thông tin, dữ liệu chuẩn hoá; lưu trữ dữ liệu từ nhiều nguồn khác nhau; có khả năng làm mới thông tin, dữ liệu từ nhiều nguồn khác nhau (không cần phải đợi hệ thống chạy tạo lại dữ liệu định kỳ)…
Đặc biệt, khi ứng dụng Data Warehouse, dữ liệu hiện tại và lịch sử được lưu trữ, đồng thời, có khả năng tiếp cận đa chiều (chuẩn hóa cấu trúc dữ liệu) và lưu trữ dữ liệu tóm tắt.
Với những ưu điểm trên, ứng dụng Data Warehouse còn được coi là một giải pháp để DN lựa chọn, nhưng để tăng hiệu quả sử dụng, do đó, các DN cần áp dụng quy trình triển khai theo các bước: Đơn vị nghiệp vụ cần đưa ra các yêu cầu nghiệp vụ (người lên kế hoạch chi tiết cho các quy trình (BA) cần phân tích các thông tin nghiệp vụ, yêu cầu tiện ích và phương pháp hiển thị
Đồng thời, Data Warehouse còn giúp DN phân tích hệ thống xử lý giao dịch trực tuyến (OLTP) có liên quan và đưa ra các quyết định tự động cần bổ sung, chỉnh sửa, sửa chữa dữ liệu mới hay không.
Đặc biệt, Data Warehouse còn tối ưu trên phương diện tự động lựa chọn các mô hình như: Ngôi sao, Thiên hà (bông tuyết), thiết kế các bảng dimension, fact và xây dựng biểu đồ trích xuất - biến đổi - tải (ETL).
Thông qua các tính năng này, Data Warehouse sẽ góp phần giúp DN: Phát triển báo cáo và sử dụng các công cụ phân tích kinh doanh (BI); lên kế hoạch thực hiện; kiểm tra trên hệ thống lập trình (DEV) hoặc nhìn thấy tất cả (Stag); triển khai hệ thống, quy trình sản xuất (Production).
Dữ liệu giúp DN sẽ tạo ra những quyết định sáng suốt
Trên quan điểm khác, ông Lê Tiến Dũng, đại diện Software Architecture tại VNPT, cho biết, dữ liệu phát sinh đang là một nhu cầu, nhiệm vụ đã được hình thành tại các tổ chức DN, có nhiệm vụ chạy trong cổng thông tin và càng ngày càng phát sinh ra các nguồn dữ liệu lớn (gig data) mới, vì đó theo các khung thời gian sẽ dần phát sinh nhiều và đòi hỏi một phương pháp cách thức quản lý phù hợp.
Do đó, trong quá trình tạo lập, lưu trữ, sử dụng dữ liệu, các DN cần ứng dụng Data Warehouse và Data Lake để thực hiện nhiệm vụ CĐS trong quy trình quản lý, quản trị, sản xuất, tăng trưởng.
Cụ thể về quan điểm này, ông Dũng khái quát, dữ liệu lớn bản chất là các tập dữ liệu rất lớn hoặc phức tạp mà các ứng dụng truyền thống không thể xử lý được.
Thuật ngữ "dữ liệu lớn" thường được đề cập đơn giản đến việc sử dụng để phân tích dự đoán, phân tích hành vi người dùng hoặc một số phương pháp nâng cao khác để trích xuất giá trị từ dữ liệu mà hiếm khi ở một kích thước cụ thể của tập dữ liệu.
"Big data cũng có thể được hiểu là một tiêu chí để DN sử dụng phát triển và để làm được điều này DN cần định lượng, đong đếm dữ liệu của chính mình; vận dụng hiệu quả các thuộc tính đa dạng, sống động về vô số nguồn dữ liệu phát sinh", ông Dũng khái quát.
Tuy nhiên, theo ông Dũng, big data còn phải được hiểu, thực hiện tốt ở 02 vấn đề, khía cạnh: Tốc độ dữ liệu được tạo ra và khả năng phân tích được lượng dữ liệu khổng lồ trong thời gian thực để đưa ra một số kết luận có ý nghĩa.
Để đáp ứng được các tiêu chí này, DN cần thiết phải áp dụng hiệu quả Data lake và Data Warehouse. Đây là hai nhân tố quan trọng, có thể bổ sung ý nghĩa cho nhau trong nhu cầu của tổ chức, DN.
Theo ông Dũng, Data lake đang được lựa chọn, coi là công cụ giải pháp số, sử dụng cho mục đích nhằm rút ra được ý nghĩa và hiểu biết liên quan đến DN, nhờ thông tin mà nó lưu trữ thông qua các thuật toán phân tích và học máy (machine learning) khác nhau.
Lợi ích của Data lake, còn thể hiện rõ ở việc dần hình thành, xây dựng, tạo nên một hồ dữ liệu chịu trách nhiệm thu thập, xử lý, phân tích và cung cấp cho các ứng dụng tiêu thụ, có những lợi ích sau: Quản trị dữ liệu và dòng đời dữ liệu (data lineage); áp dung trong học máy hoặc trí tuệ nhân tạo (AI) để tạo ra giá trị mới trong DN; phân tích và dự đoán… Tất cả những điều quan trọng trên, khi DN khi sử dụng, tận dụng triệt để sẽ đóng góp việc tạo ra những quyết định sáng suốt hơn.
"Đây chính là điều cần, vì các quyết định này rất quan trọng, quyết định sự tăng trưởng cho các DN trong hiện tại và tương lai", ông Dũng nhấn mạnh.
Không chỉ có vậy, Data lake, còn giúp DN thu thập tất cả các loại dữ liệu có cấu trúc, bán cấu trúc hoặc phi cấu trúc ở dạng tự nhiên (raw data) từ các hệ thống nguồn. Đặc biệt, dữ liệu trong Data lake thường phục vụ cho các data scientist, có khả năng dễ dàng truy cập và thay đổi. Đây chính là một thuộc tính mang sức mạnh để xử lý và phân tích tất cả các loại dữ liệu, tạo ra dữ liệu đa chiều.
Với những điểm tối ưu mà Data lake mang lại, Data Warehouse cũng không thua kém. Theo ông Dũng, Data Warehouse là dạng dữ liệu thu thập có cấu trúc và đã được xử lý ngay khi thu thập, sau đó được lưu vào một mô hình được xác định cho một mục đích.
Vì dữ liệu trong Data warehouse có kiến trúc, cấu trúc, do đó rất thuận lợi cho việc phân tích, đánh giá theo mục đích thuận lợi từ trước. Đặc biệt, việc xử lý dữ liệu có cấu trúc sẽ tạo ra các chiều dữ liệu (dimensional data), hoặc các dữ liệu báo cáo.
"Tuy nhiên, bên cạnh các ưu điểm, Data Warehouse cũng có những nhược điểm là khó khăn trong việc thay đổi mô hình dữ liệu hoặc thiếu thông tin trong việc phân tích theo yêu cầu mới", ông Dũng phân tích.
Dữ liệu giúp DN sớm "định danh" trên bản đồ số
Cũng nói về các ưu điểm của dữ liệu nói chung cũng như Data lake, Data Warehouse nói riêng, ông Phạm Tuấn Anh, đại diện SkyMap Global cho rằng, đây sẽ là chất liệu để các DN sử dụng, ứng dụng để hình thành nên các bản đồ số. "Khi DN hình thành nên các bản đồ số của mình sẽ tối ưu được các thuộc tính, tính chất: Tính trực quan; tính đầy đủ; chuẩn hóa cao; đa dạng ứng dụng", ông Tuấn Anh nhấn mạnh.
Cùng với đó, DN khi sử dụng có thể phát huy được những lợi thế, thế mạnh để tăng tính tương tác thông qua: Hệ thống bản đồ (google map, bing map, bản đồ chuyên đề; hệ thống thông tin địa lý (quản lý thông tin các đối tượng gắn với vị trí trên bản đồ); các dữ liệu khai thác ảnh vệ tinh).
Đặc biệt DN có thể sử dụng để xây dựng và thiết lập bản đồ kinh doanh; tăng hiệu quả lĩnh vực sản xuất, bán lẻ. Cụ thể, khi nói về việc DN có thể sử dụng dữ liệu thông qua dịch vụ bản đồ số để tăng hiệu quả lĩnh vực sản xuất, bán lẻ, ông Tuấn Anh chỉ ra ưu điểm: Tối ưu hóa tuyến bán hàng; tăng hiệu quả quản lý trực quan; quản lý lịch làm việc; quản ý kho, nhà phân phối; tự động hóa bán hàng.
"Đã có nhiều DN hoạt động trong lĩnh vực nông nghệp thành công khi sử dụng dữ liệu hiệu quả đối với các quy trình: Đếm cây; tìm vị trí cây chết; theo dõi sức khỏe cây bằng chỉ số thực vật; tính diện tích cây được bao phủ", ông Tuấn Anh nêu ví dụ.
Cũng theo ông Tuấn Anh, dữ liệu có vai trò rất quan trọng để các DN ứng dụng trong lĩnh vực nông nghiệp công nghệ cao. Để làm được điều này, DN cần thu thập, quản lý thông tin dựa trên dữ liệu ảnh vệ tinh thường kỳ; căn cứ vào các dữ liệu phân tích, đánh giá…/.