Trong bối cảnh mới về phát triển Chính phủ điện tử (CPĐT), đất nước bước vào thời kỳ chuyển đổi số (CĐS), trong đó, dữ liệu đóng vai trò quan trọng cho sự phát triển, là tài sản, tài nguyên cần thúc đẩy khai thác, chia sẻ. Tuy nhiên, việc xây dựng, kết nối, chia sẻ dữ liệu còn nhiều hạn chế do nhiều nguyên nhân trong đó có cả nguyên nhân về tổ chức dữ liệu, chất lượng dữ liệu, quản lý, vận hành, khai thác chia sẻ dữ liệu.
Dữ liệu trong CQNN hiện nay đang phân tán ở các CQNN được giao làm chủ đầu tư xây dựng. Các Bộ, ngành, địa phương tự quản lý dữ liệu của mình, phục vụ nhu cầu của mình và ít chia sẻ cho các CQNN khác. Một phần cũng do các CQNN không biết các bộ ngành địa phương nào, CQNN nào đang cung cấp dữ liệu gì để có thể đề nghị cung cấp dữ liệu. Nhiều dữ liệu đặc thù chồng lấn và trùng lặp trong khi thiếu nguồn dữ liệu chuẩn hóa và có chất lượng cao.
Theo tinh thần có nhìn thấy được mới quản lý được. Để có thể quản lý được dữ liệu trong CQNN thì nhất thiết phải có một "cuốn sổ" để ghi lại toàn bộ các cơ sở dữ liệu (CSDL), hạng mục dữ liệu của CQNN và công bố một cách công khai để các CQNN đều biết được mình có gì, CQNN khác có gì. Từ đó, việc triển khai xây dựng, vận hành, khai thác, chia sẻ trong CQNN mới từng bước được sắp xếp và chuẩn hóa. Chính vì lý do này cần thiết phải có một nơi là môi trường để các CQNN cung cấp thông tin cho các CQNN khác về dữ liệu cơ quan mình đang quản lý, sẵn sàng chia sẻ cho CQNN theo quy trình ra sao để tạo sự tiếp cận dễ dàng hơn về dữ liệu giữa các cơ quan.
Cổng dữ liệu quốc gia chính là một "cuốn sổ" ghi lại và công bố toàn bộ danh mục dữ liệu trong CQNN, làm nền tảng để theo dõi, giám sát, kiểm soát hoạt động về xây dựng, quản lý vận hành và chia sẻ dữ liệu.
Bên cạnh đó, nguồn nhân lực về dữ liệu trong CQNN còn rất hạn chế. Cụ thể cán bộ về CNTT còn thiếu kiến thức, kỹ năng về dữ liệu. Từ đó không những chưa quản lý chặt chẽ, duy trì được dữ liệu mà còn chưa tận dụng, khai thác được giá trị dữ liệu phát sinh mới, chưa áp dụng được các công nghệ mới về dữ liệu để phục vụ các hoạt động nghiệp vụ. Xuất phát từ hiện trạng này, Cổng dữ liệu quốc gia là nơi tập trung hóa các thông tin, kiến thức, kỹ năng và công cụ hỗ trợ các cán bộ CNTT trong hoạt động về phát triển dữ liệu.
Ngoài ra, trong các văn bản quy phạm pháp luật đều nhắc tới người dân, DN được quyền tiếp cận để tra cứu thông tin về mình do CQNN đang nắm giữ. Tuy nhiên, hiện tại chưa có một phương tiện nào để thực thi quyền này của người dân, doanh nghiệp (DN). Cổng dữ liệu quốc gia sẽ là phương tiện để góp phần triển khai thực thi quyền này.
Cổng dữ liệu quốc gia - nền tảng để thực hiện thủ tục trao đổi dữ liệu trên môi trường mạng
Hiện tại, kết nối, chia sẻ dữ liệu trong CQNN rất hạn chế và được xác định bởi bất cập chính sau:
Chưa có sự thống nhất về quy trình, cách thức đề nghị và giải quyết đề nghị kết nối, chia sẻ dữ liệu, cách thức xử lý các trường hợp xử lý phát sinh khi kết nối, chia sẻ dữ liệu. Đây là những vấn đề bất cập chính phải đối mặt để thực hiện việc chia sẻ cũng như sử dụng dữ liệu chia sẻ của CQNN.
Ngay cả khi đã tiếp cận khai thác được dữ liệu, việc sử dụng được dữ liệu trong hoạt động của cơ quan, đơn vị cũng còn là vấn đề lớn do sự không đồng nhất về thông tin, về quy trình thực hiện chia sẻ dữ liệu và phụ thuộc lớn vào ngữ cảnh và ý chí chủ quan của các đơn vị phối hợp.
Khi triển khai kết nối, các CQNN phải sử dụng đường văn bản để trao đi, đổi lại các thông tin về yêu cầu chia sẻ và hồi đáp về dữ liệu. Việc triển khai thực tế đòi hỏi các cán bộ làm việc trực tiếp với nhau rất nhiều. Trong phạm vi hẹp và với số lượng hạn chế thì có thể triển khai được nhưng khi việc chia sẻ diễn ra với số lượng lớn thì không thực hiện được.
Vì vậy, để giải quyết các vấn đề vướng mắc trên về mặt triển khai cần có một hệ thống quản lý dịch vụ dữ liệu tập trung đóng vai trò là cầu nối giữa các CQNN với nhau và để thống nhất các quy trình chia sẻ dữ liệu, tạo điều kiện cho các CQNN cung cấp và chia sẻ dữ liệu thuận lợi và hiệu quả. Hệ thống đóng vai trò là một nền tảng để hỗ trợ quản lý toàn bộ giao dịch các giao dịch về cung cấp và chia sẻ dữ liệu; là một công cụ theo dõi, giám sát việc chia sẻ dữ liệu, từ đó giúp việc chia sẻ dữ liệu trong CQNN an toàn và hiệu quả.
Theo Nghị định số 47/2020/NĐ-CP ngày 09/4/2020 của Chính phủ về quản lý, kết nối và chia sẻ dữ liệu số của CQNN, Hệ thống quản lý dịch vụ chia sẻ dữ liệu là phương tiện để triển khai thi hành Nghị định và là một thành phần của Cổng dữ liệu quốc gia.
Cổng dữ liệu quốc gia, nơi hội tụ dữ liệu, sinh ra các giá trị mới
Dữ liệu được xác định là tài nguyên số quan trọng như dầu mỏ của thời kỳ CĐS. Phân tích, xử lý, tinh chế dữ liệu sẽ cung cấp những thông tin rất quan trọng nhằm hỗ trợ chỉ đạo điều hành của CQNN các cấp. Dữ liệu hiện tại được quản lý riêng rẽ, phân mảnh tại các bộ, ngành, địa phương nên việc phân tích dữ liệu, khai thác dữ liệu chỉ thực hiện trong phạm vi của các CSDL đó mà thiếu tính gắn kết, phân tích tổng thể để mang lại các thông tin hữu ích tầm quốc gia liên ngành, liên lĩnh vực.
Cổng dữ liệu quốc gia sẽ là một nền tảng thực hiện trích chọn các thông tin từ các bộ, ngành, địa phương và chuyển tải tập trung về một chỗ phục vụ phân tích tổng hợp. Bên cạnh đó, nguồn dữ liệu từ xã hội từ mạng Internet khi được kết hợp với nguồn dữ liệu chính thức của CQNN sẽ mang lại các thông tin quan trọng để phục vụ chỉ đạo điều hành của Chinh phủ, của các CQNN các cấp.
Ngoài ra, nhu cầu phân tích và xử lý dữ liệu của các bộ ngành, địa phương cũng rất lớn. Tuy nhiên triển khai phân tích và xử lý dữ liệu đòi hỏi phải có sự đầu tư các thiết bị, công nghệ cao chuyên về xử lý dữ liệu như các máy học để xây dựng mô hình trí tuệ nhân tạo (AI), phân tích dữ liệu lớn (Big data)... mà một cơ quan riêng lẻ khó thực hiện được do thiếu cả về hạ tầng cũng như về dữ liệu. Để thúc đẩy điều này, cần thiết phải có một hệ thống tập trung để giúp quy tụ dữ liệu từ các CQNN cũng như cung cấp các dịch vụ phân tích dữ liệu, dịch vụ xử lý dữ liệu thông minh cho các bộ, ngành, địa phương để giúp các đơn vị này nhanh chóng tiếp cận được những công nghệ mới, lợi ích mới của khoa học dữ liệu.
Hiện nay, Cổng dữ liệu quốc gia mới thiết lập ở mức độ ban đầu. Cổng mới cung cấp thông tin sơ bộ về hiện trạng dữ liệu trong CQNN, chia sẻ kiến thức, kinh nghiệm về dữ liệu. Cổng đã thống kê được hơn 580 mục CSDL của các bộ, ngành địa phương đã, đang và chuẩn bị triển khai; cung cấp hơn 311 danh mục dữ liệu dùng chung. Thông tin thời gian thực về tình hình kết nối, chia sẻ dữ liệu qua nền tảng tích hợp, chia sẻ dữ liệu quốc gia cũng được công bố trên Cổng dữ liệu quốc gia. Cổng cũng đã tập hợp và cung cấp nhiều thông tin về kinh nghiệm về phát triển dữ liệu, quản trị dữ liệu trên thế giới; thông tin cập nhật về công nghệ, kỹ thuật để truyền tải đến các bộ, ngành, địa phương, giúp nâng cao kiến thức và kỹ năng trong công tác phát triển dữ liệu CPĐT. Còn nhiều thành phần đang trong quá trình phát triển.
Trong thời gian tới, Cổng dữ liệu quốc gia sẽ tiếp tục phát triển các hệ thống thành phần: Hệ thống quản lý dịch vụ chia sẻ dữ liệu để tạo môi trường thực hiện các thủ tục chia sẻ dữ liệu; các công cụ để phân tích dữ liệu và từng bước làm giầu thông tin. Tuy nhiên, Cổng dữ liệu quốc gia là nền tảng về dữ liệu dùng chung của Chính phủ đòi hỏi phải có sự phối hợp của tất cả các bộ, ngành, địa phương cùng phát triển và mở rộng. Vì vậy, sự thành công của Cổng dữ liệu quốc gia nằm ở tất cả các CQNN, người dân và doanh nghiệp cùng chung tay xây dựng.
Cổng dữ liệu quốc gia không chỉ là một cổng thông tin mà là hệ sinh thái các hệ thống về dữ liệu; Là điểm hội tụ của dữ liệu trong CQNN; Là nền tảng để hỗ trợ thực hiện các hoạt động trao đổi, chia sẻ dữ liệu; Là nơi phân tích và tạo ra các giá trị mới; Là nền tảng để nhà nước cung cấp dữ liệu mở cho người dân, DN, cộng đồng và nơi người dân, DN, cộng đồng đóng góp, tham gia cùng các hoạt động của CQNN.
(Bài đăng ấn phẩm in Tạp chí TT&TT Số 2 tháng 2/2021)