Cần chủ động hướng đến Việt Nam hoá các sản phẩm dữ liệu
Make in Viet Nam - Ngày đăng : 06:00, 31/07/2023
Cần chủ động hướng đến Việt Nam hoá các sản phẩm dữ liệu
“Dữ liệu cần xuất phát từ đa nguồn, đa chủng loại và cần phải được giám sát, vận hành theo thời gian thực...”.
Tóm tắt:
- Việc xây dựng kho dữ liệu dùng chung là cần thiết và dữ liệu trong kho phải đảm bảo đa nguồn, dễ tích hợp
- Sản phẩm VLAKE của FSI - nền tảng dữ liệu dựa trên công nghệ mở Hadoop là một giải pháp lưu trữ và xử lý
dữ liệu lớn:
+ Cho phép: lưu trữ; kết nối và tổng hợp dữ liệu; xử lý dữ liệu; quản lý chia sẻ dữ liệu.
+ Hiệu quả dự báo: tiết kiệm 50% chi phí triển khai, 80% thời gian và nguồn lực
Điều này đã được ông Nguyễn Xuân Đài, chuyên gia tư vấn chuyển đổi số (CĐS), Công ty CP đầu tư Thương mại và Phát triển Công nghệ (FSI) nhấn mạnh khi nói về tầm quan trọng của việc cần thiết phải xây dựng kho dữ liệu dùng chung hiện nay.
Dữ liệu phải đảm bảo đa nguồn, dễ tích hợp
Trước khi nói đến các quan điểm về giải pháp kỹ thuật, ông Nguyễn Xuân Đài cho rằng, muốn có kết quả tốt, tốt hơn nữa chúng ta cần nhiều bước, trong đó cần đánh giá, nhìn thẳng vào thực trạng các điểm mạnh, yếu đang tồn tại hiện nay.
“Mừng vì chúng ta đã có nhiều văn bản hướng dẫn, chỉ đạo từ các cơ quan quản lý và sự hỗ trợ thông qua các chính sách thúc đẩy thực hiện nhiệm vụ này rất tích cực, kịp thời. Và kết quả đã có nhiều chuyển biến tích cực, tuy nhiên, đây vẫn chưa thực sự là kết quả như kỳ vọng, mong đợi”, chuyên gia Nguyễn Xuân Đài nêu quan điểm.
Nói về những kết quả không được như kỳ vọng, mong đợi, ông Nguyễn Xuân Đài cho rằng đó là vì nguyên nhân khách quan và chủ quan. Ở nguyên nhân khách quan, chúng ta vẫn còn thiếu, chưa hoàn thiện, đồng bộ về các cơ chế, chính sách trong việc quản lý, chia sẻ nguồn dữ liệu các lĩnh vực, nhóm, ngành. Hơn nữa, vẫn còn hạn chế về nguồn nhân lực CNTT và còn tâm lý e ngại khi tích hợp chia sẻ dữ liệu, dẫn đến việc dữ liệu bị ách ứ, không liên thông, thống nhất. Đặc biệt, còn thiếu các công cụ, nền tảng sử dụng trong các cơ quan nhà nước, tổ chức, đơn vị, doanh nghiệp... Chính điều này dẫn đến việc khai thác, sử dụng, quản lý các dữ liệu kém năng suất, kém hiệu quả.
“Do đó, yêu cầu hiện nay cần thực hiện tốt chính là việc khi sử dụng các công cụ nền tảng cần phải được đảm bảo hội đủ các tiêu chuẩn dễ dùng, sử dụng, thân thiện, phù hợp nhu cầu của người sử dụng”, ông Nguyễn Xuân Đài nhấn mạnh.
Nói về nguyên nhân chủ quan, chuyên gia này cho rằng, chúng ta vẫn còn e dè, chưa tích cực, tạo sức mạnh chủ động làm chủ các công nghệ, nhất là các công nghệ số mới; chưa tạo ra các cơ chế khuyến khích các tổ chức, doanh nghiệp, đơn vị, cơ quan nhà nước tham gia các: hội nghị, hội thảo, cuộc thi, chương trình, chuyên đề, thường xuyên đăng ký, sáng kiến đề tài khoa học... để nghiên cứu, phát triển về các nền tảng công nghệ đáp ứng nhu cầu, xu hướng phát triển của thời kỳ 4.0 hiện nay. Đồng thời, vẫn còn hạn chế về nguồn kinh phí cho việc nghiên cứu, phát triển công nghệ cao, các công nghệ số.
Đưa ra dẫn chứng cho luận điểm này, chuyên gia Nguyễn Xuân Đài nêu, hiện nay, chúng ta đang sử dụng nhiều phần mềm, nền tảng công nghệ còn hoạt động độc lập, chồng chéo, rời rạc, và điều này dẫn đến việc tích hợp dữ liệu, chia sẻ dữ liệu gặp khó khăn vì khuôn, định dạng, trường dữ liệu sẽ không thống nhất, chuẩn hóa và mất nhiều thao tác khi xử lý.
Không chỉ nêu rõ các yếu tố trong hai nguyên nguyên nhân nêu trên, ông Nguyễn Xuân Đài còn cho rằng, hầu hết ở các đơn vị, doanh nghiệp và các trong một số cơ quan nhà nước đang hạn chế nguồn nhân sự về công nghệ thông tin trình độ cao, thao tác lập trình, kết nối dữ liệu phức tạp để xây dựng kho cơ sở dữ liệu (CSDL) lớn trong đơn vị mình quản lý.
Nêu ra giải pháp nhằm thúc đẩy việc kết nối và chia sẻ dữ liệu hiệu quả hiện nay, ông Nguyễn Xuân Đài cho rằng, chúng ta cần xây dựng, sử dụng mô hình kho dữ liệu số dùng chung. Tại kho dữ liệu dùng chung này, cần đảm bảo có khả năng dễ dàng tích hợp được với các hệ thống nguồn dữ liệu, không ảnh hưởng ứng dụng và phần mềm đang sử dụng.“Việc dễ dàng tích hợp dữ liệu cũng có thể cần được bổ sung mở rộng phần cứng và nâng cao cấu hình của dữ liệu lưu trữ. Đặc biệt hệ thống kho dữ liệu phải lưu trữ được tất cả các loại dữ liệu, với kích thước tệp (file) không giới hạn”.
Chưa dừng lại cho các ý kiến trên, theo ông Nguyễn Xuân Đài, khi chúng ta tiến hành việc lưu trữ, xử lý, dùng dữ liệu phải đảm bảo có khả năng lưu trữ được nguồn dữ liệu lớn, phù hợp với các hệ quản trị CSDL hện tại; dễ dàng mở rộng (không gian lưu trữ và tốc độ xử lý); cho phép cài đặt được nhiều ứng dụng; sử dụng các thuật toán trí tuệ nhân tạo (AI), học máy (ML) để sử dụng được dữ liệu.
Đặc biệt, kho dữ liệu số dùng chung còn cần phải đảm bảo tính năng: Có hệ thống chủ động tích hợp với các nguồn dữ liệu; có cơ chế đồng bộ dữ liệu giữa nguồn và đích; có công cụ dễ dàng tạo dựng kho dữ liệu (data warehouse) mà không cần phải lập trình lại; chấp nhận đa nguồn, đa chủng loại dữ liệu; xử lý dữ liệu và giám sát dữ liệu theo thời gian thực trong quá trình vận hành dữ liệu; chấp nhận được cả nguồn dữ liệu lớn và dữ liệu thời gian thực.
Giải quyết bài toán dữ liệu của đa ngành
Điển hình về giải pháp hệ thống lưu trữ và xử lý dữ liệu lớn, FSI đã phát triển, ra đời sản phẩm mang tên VLAKE - nền tảng dữ liệu dựa trên công nghệ mở Hadoop. Nổi bật của sản phẩm VLAKE chính là việc sử dụng: Module Module lưu trữ; Module kết nối và tổng hợp dữ liệu (Pipelines); Module xử lý dữ liệu (Data Service); Module quản lý chia sẻ dữ liệu (API Manager).
Giải pháp số hóa của FSI giúp các đơn vị tổ chức tạo lập CSDL, tiết kiệm 50% chi phí triển khai, 80% thời gian và nguồn lực
Hơn nữa, điểm nổi bật của các giải pháp kết nối và chia sẻ dữ liệu của FSI đã góp phần đáp ứng, giải quyết hiệu quả bài toán: Công cụ và nền tảng (dữ liệu đa nguồn); giá thành phù hợp để cạnh tranh; thiết kế theo yêu cầu của khách hàng; nguồn nhân lực; tạo giao diện đồ họa thân thiện; mang đến những trải nghiệm tốt nhất cho khách hàng; đào tạo và chuyển giao công nghệ; Việt Nam hóa các sản phẩm (Dễ sử dụng; không yêu cầu trình độ tin học cao); tuân thủ đạt tiêu chuẩn chất lượng quốc tế...
Ngoài ra, FSI đã hoàn thiện hệ sinh thái CĐS lấy dữ liệu làm trọng tâm và thông qua hệ sinh thái này đã góp phần cung cấp hệ sinh thái CĐS toàn diện, giải quyết trọn vẹn bài toán dữ liệu của đa ngành. FSI cũng luôn tiên phong đổi mới và ứng dụng các công nghệ mới như: AI, dữ liệu lớn (big data), tự động hóa (RPA), ML... Đơn vị không ngừng bổ sung các module sản phẩm mới để hỗ trợ thêm các nhu cầu khác của doanh nghiệp. Và hiện nay, FSI đã cung cấp sản phẩm của mình cho hơn 5500 khách hàng là tổ chức, doanh nghiệp, tập đoàn lớn, cơ quan nhà nước trong đa dạng lĩnh vực: Y tế, giáo dục, tài chính - ngân hàng...
Và với những thế mạnh trên, đến nay FSI đã được được biết đến là đơn vị đi đầu, tiên phong trong việc phát triển các sản phẩm công nghệ số, nhất là các công nghệ về dữ liệu. Đặc biệt, các sản phẩm của FSI đã lọt trong danh sách Top 10 DN CNTT hàng đầu Việt Nam về CĐS; Top 10 Make in Việt Nam về sản phẩm số xuất sắc.
Như vậy có thể nói, dữ liệu chính là một “nhân tố” quan trọng và khi khai thác tốt sẽ góp phần thúc đẩy sự phát triển kinh tế, xã hội và công nghệ của một quốc gia. Theo đó, năm 2023 để thực hiện nhiệm vụ này hiệu quả, “mốc son” năm chủ đề “Năm dữ liệu số quốc gia” đã ra đời, tập trung cụ thể vào các nội dung: Phát triển dữ liệu mở; phát triển CSDL... Và muốn để làm tốt điều này, đòi hỏi những sự nỗ lực, tích cực, trách nhiệm, thực chất không ngừng của toàn hệ thống chính trị, trong đó có đơn vị, doanh nghiệp công nghệ thông tin, công nghệ số.
Vì vậy, các doanh nghiệp CNTT, công nghệ số cần mạnh dạn, đi đầu, tạo đột phá trong thực hiện chiến lược “Make in Viet Nam” để làm chủ công nghệ, chủ động thiết kế, chế tạo, cung cấp các sản phẩmC, giải pháp công nghệ số trọng điểm quốc gia, thúc đẩy thực hiện tốt nhiệm vụ CĐS mạnh mẽ.
(Bài đăng ấn phẩm in Tạp chí TT&TT số 6 tháng 6/2023)