Phát triển cơ sở hạ tầng dữ liệu cho chính phủ số và thành phố thông minh dựa trên các nền tảng số công nghệ mở
Đô thị thông minh - Ngày đăng : 11:52, 26/07/2020
Cơ sở hạ tầng dữ liệu quốc gia đóng vai trò là một trong các cơ sở hạ tầng thiết yếu dùng để hình thành nên chính phủ số và các thành phố thông minh ở nước ta. Cần có sự thay đổi về cách tiếp cận xây dựng cơ sở hạ tầng dữ liệu theo phương thức truyền thống dựa trên các hệ thống thông tin, cơ sở dữ liệu rời rạc để thay thế bằng một mô hình và giải pháp phát triển dựa trên các nền tảng số công nghệ mở.
Cơ sở hạ tầng dữ liệu phục vụ phát triển chính phủ số và các thành phố thông minh
Cơ sở hạ tầng dữ liệu quốc gia có vai trò thúc đẩy việc chia sẻ, tiêu thụ dữ liệu phục vụ các nhu cầu thiết yếu bảo đảm hoạt động của nhà nước và xã hội, cung cấp các dịch vụ và phương tiện cần thiết cho một nền kinh tế hoạt động, đặc biệt là kinh tế số trong bối cảnh CMCN 4.0. Chúng bao gồm toàn bộ các hệ thống công nghệ và các loại dữ liệu được thu thập, lưu trữ, kết nối chia sẻ và quản lý khai thác sử dụng phục vụ mục tiêu phát triển chính phủ số và các thành phố thông minh.
Chương trình Chuyển đổi số quốc gia đến năm 2025, định hướng đến năm 2030 theo Quyết định số 749/QĐ-TTg của Thủ tướng chính phủ cũng đã xác định việc xây dựng các nền tảng số trong đó có cơ sở hạ tầng dữ liệu là giải pháp đột phá để phát triển chính phủ số, kinh tế số và xã hội số. Cụ thể đối với phát triển chính phủ số sẽ phải đẩy nhanh tiến độ xây dựng các cơ sở dữ liệu quốc gia, cơ sở dữ liệu chuyên ngành phục vụ yêu cầu quản lý nhà nước đối với các ngành, lĩnh vực và hỗ trợ doanh nghiệp phát triển. Trong đó ưu tiên triển khai các cơ sở dữ liệu dùng làm nền tảng của cơ sở hạ tầng dữ liệu quốc gia như dân cư, doanh nghiệp, đất đai, y tế, v.v. Trong các nhiệm vụ triển khai có nhấn mạnh tới việc phải hình thành một nền tảng tích hợp, chia sẻ dữ liệu quốc gia để thực hiện kết nối các cơ sở dữ liệu quốc gia, cơ sở dữ liệu của các bộ, ngành, địa phương nhằm chia sẻ thông tin, liên thông trong khai thác sử dụng giữa các cơ quan nhà nước; đồng thời cung cấp các nguồn dữ liệu mở cho phép các cá nhân, tổ chức được quyền khai thác để tạo ra các dịch vụ mang giá trị mới của nền kinh tế số.
Thông thường quá trình xây dựng để hình thành một cơ sở hạ tầng dữ liệu được tổng kết sẽ trải qua 4 giai đoạn (Hình 1). Trong giai đoạn đầu tiên, các cơ sở dữ liệu thường được xây dựng dựa trên các nhu cầu chuyên biệt của từng lĩnh vực quản lý chuyên ngành. Lúc này thường rất ít có sự chia sẻ trao đổi dữ liệu giữa các hệ thống. Việc chia sẻ trao đổi dữ liệu nếu có sẽ được triển khai đơn lẻ cho từng nhu cầu cụ thể. Tại giai đoạn 2, việc chia sẻ dữ liệu trở thành yêu cầu mặc định giữa các hệ thống thông tin của cơ quan nhà nước. Một nền tảng tích hợp, chia sẻ dữ liệu được triển khai để tạo ra sự kết nối liên thông giữa các nguồn dữ liệu và tạo thuận lợi cho quá trình khai thác sử dụng của người dùng trên nhiều hệ thống khác nhau. Sang giai đoạn 3, dữ liệu không chỉ được chia sẻ nội bộ trong các cơ quan nhà nước mà nó còn được cung cấp cho người dân, doanh nghiệp tự do khai thác dưới dạng dữ liệu mở. Đến giai đoạn phát triển cuối cùng, dữ liệu dùng để khai thác sử dụng không chỉ dừng ở các nguồn nội sinh trong cơ quan nhà nước. Lúc này nhiều nguồn dữ liệu bên ngoài như từ các mạng xãhội, từ các tổ chức, doanh nghiệp sẽ được thu thập để phục vụ quá trình phân tích, xây dựng các mô hình dự báo hỗ trợ ra quyết định trong công tác quản lý điều hành. Bảng 1 tóm tắt các đặc điểm của cơ sở hạ tầng dữ liệu khi được chuyển đổi qua 4 giai đoạn.
Hiện nay cơ sở hạ tầng dữ liệu ở nước ta được đánh giá là còn đang ở trong giai đoạn xây dựng các hệ thống thông tin, cơ sở dữ liệu rời rạc. Mục tiêu của chuyển đổi số là phát triển cơ sở hạ tầng dữ liệu quốc gia để tiến tới giai đoạn 4 (nền tảng dữ liệu thông minh). Quá trình chuyển đổi số có thể được triển khai tuần tự theo lộ trình qua từng giai đoạn nhưng phải dựa trên một kế hoạch tổng thể và hướng tới việc khai thác sử dụng các nền tảng công nghệ tiên tiến nhất để rút ngắn thời gian, giảm chi phí đầu tư và tăng hiệu quả sử dụng. Cần phải tránh thực hiện đầu tư vào các dự án chỉ phục vụ cho mục tiêu ngắn hạn và không hình thành nên các nền tảng số dùng chung cho cơ sở hạ tầng dữ liệu.
Mô hình các nền tảng số dùng cho cơ sở hạ tầng dữ liệu
Rõ ràng để hình thành một cơ sở hạ tầng dữ liệu quốc gia, các nền tảng số giữ một vai trò thiết yếu. Chúng được xem như là các thành phần dùng chung hoặc hỗ trợ việc kết nối chia sẻ dữ liệu giữa các hệ thống thông tin, cơ sở dữ liệu quốc gia, cơ sở dữ liệu chuyên ngành của các cơ quan quản lý và doanh nghiệp. Có 4 mô hình tiếp cận để xây dựng các nền tảng số cho chính phủ số như sau [2].
Mô hình nền tảng tập trung: toàn bộ cơ sở hạ tầng dữ liệu quốc gia sẽ được tích hợp chia sẻ qua một nền tảng số duy nhất của cơ quan nhà nước; cung cấp một điểm truy cập tập trung (một cửa) cho tất cả các dịch vụ dữ liệu có thể khai thác sử dụng bởi bên thứ 3. Mô hình xây dựng một nền tảng số chính phủ này thích hợp đối với các quốc gia có quy mô dân số và địa lý nhỏ tương đương với một bang hoặc một thành phố lớn trên thế giới.
Mô hình nền tảng phân tán (P2P): các nền tảng số được xây dựng theo các lĩnh vực nghiệp vụ và được dùng chung cho một nhóm cơ quan tổ chức. Giữa các nền tảng số phải có sự kết nối chia sẻ, liên thông dữ liệu theo mô hình của mạng ngang hàng. Đây chính là cách tiếp cận đã được quy định trong Khung kiến trúc chính phủ điện tử Việt Nam. Các nền tảng số sẽ được phân cấp xây dựng theo cả chiều dọc (tại bộ, ngành) và chiều ngang (tại tỉnh, thành).
Mô hình nền tảng hệ sinh thái: lúc này phạm vi kết nối, chia sẻ của nền tảng số không còn bị giới hạn sử dụng chỉ trong các cơ quan nhà nước. Nền tảng số được xây dựng có tính mở để khuyến khích sự tham gia của tất cả các bên thứ ba vào việc thiết kế, cung cấp các dịch vụ gia tăng. Kiểu xây dựng nền tảng hệ sinh thái là cách tiếp cận phù hợp nhất để thực thi các chính sách có mối quan hệ phức tạp, mà rất khó để quản lý bởi chỉ một nhà cung cấp dịch vụ (ví dụ: nền tảng số dùng trong quản lý vận tải sẽ cần mở rộng để có sự tham gia trực tiếp của các doanh nghiệp kinh doanh vận tải và doanh nghiệp cung cấp dịch vụ kết nối vận tải trong nền kinh tế số).
Mô hình nền tảng nguồn lực đám đông: nền tảng số được xây dựng mở rộng để có thể khai thác nguồn lực đám đông của người dân, doanh nghiệp, các tổ chức chính phủ và phi chính phủ trong việc cùng giải quyết một vấn đề mới của xã hội. Kiểu nền tảng này giống như một mạng xã hội, nơi tất cả mọi người đều có thể tham gia đóng góp như nhau. Các ý kiến, thông tin phản ánh của người dân và doanh nghiệp được thu thập thông qua mạng xã hội và được sử dụng như là một nguồn dữ liệu đầu vào quan trọng để cải thiện các hoạt động của chính phủ.
Phân loại các nền tảng số của cơ sở hạ tầng dữ liệu
Cơ sở hạ tầng dữ liệu được xây dựng trên nền tảng của các loại dữ liệu lớn. Nó không chỉ bao gồm các loại dữ liệu dạng có cấu trúc được quản lý lưu trữ trong các cơ sở dữ liệu; còn có cả các loại dữ liệu bán cấu trúc hoặc phi cấu trúc được hình thành qua nhiều giai đoạn từ thu thập, phân tích xử lý, cho đến khi được phân phối khai thác qua các kênh thông tin khác nhau. Các nền tảng số dữ liệu có thể được phân loại dựa trên đặc điểm chức năng sử dụng cho các mục đích khác nhau sau đây.
Dữ liệu biểu mẫu điện tử: cho phép người sử dụng thiết kế linh hoạt biểu mẫu dùng để nhập dữ liệu theo nhu cầu. Biểu mẫu điện tử thường được sử dụng để thu thập thông tin cho các khảo sát trực tuyến hoặc tạo hồ sơ yêu cầu giải quyết các thủ tục hành chính. Phần lớn các hệ thống sử dụng mô hình dữ liệu bán cấu trúc (NoSQL) để lưu trữ dữ liệu cho các biểu mẫu điện tử.
Dữ liệu thiết bị IoT: dùng để biểu diễn thông tin số hóa các tín hiệu của thiết bị vật lí được thu thập hoặc điều khiển qua mạng Internet. Đây là nguồn dữ liệu quan trọng dùng để kết nối không gian số với thế giới thực trong các thành phố thông minh. Cấu trúc dữ liệu thu được rất đa dạng theo chuẩn của các nhà cung cấp thiết bị được dùng trong nhiều lĩnh vực khác nhau như quản lý tòa nhà thông minh, nhà máy thông minh, giao thông thông minh, giám sát môi trường, v.v..
Dữ liệu đa phương tiện: dùng để lưu trữ các thể loại tư liệu bằng các định dạng số như văn bản, ảnh quét, âm thanh hoặc video. Mục đích lưu trữ dữ liệu đa phương tiện trước tiên là hỗ trợ người dùng có thể nghe, nhìn được trên môi trường trực tuyến. Ngoài ra thông tin có thể được trích rút tự động từ các nội dung âm thanh, hình ảnh có trong tư liệu số để làm đầu vào cho các nhu cầu xử lý ngữ nghĩa khác.
Dữ liệu truyền thông xã hội: cung cấp các thông tin trao đổi qua giao tiếp, tương tác của người dùng trên không gian mạng. Chúng thường là các loại dữ liệu phi cấu trúc được thể hiện bằng các hình thức truyền thông trực tuyến như email, tin nhắn (chat), bài viết, bình luận, tương tác bình chọn, v.v.. Trong kỉ nguyên của CMCN 4.0 thì loại hình dữ liệu này ngày càng đa dạng và chứa đựng tiềm ẩn rất nhiều thông tin, tri thức để có thể khai thác tạo ra giá trị cho nền kinh tế số.
Dữ liệu tham chiếu: cung cấp danh sách các giá trị liệt kê, các bộ từ vựng có kiểm soát hoặc các bộ mã danh mục điện tử được sử dụng thống nhất trong mô tả các thực thể thông tin trên nhiều hệ thống cơ sở dữ liệu khác nhau. Dữ liệu tham chiếu là một thành phần kĩ thuật cơ bản dùng để bảo đảm sự liên thông về ngữ nghĩa của các nguồn dữ liệu độc lập.
Dữ liệu chủ: dùng để mô hình hóa thông tin các đối tượng thực thể được quản lí trong cơ sở dữ liệu. Nhiều hệ thống thông tin quản lý khác nhau có thể cùng tham chiếu sử dụng và cập nhật dữ liệu cho các loại đối tượng được chia sẻ dùng chung trong tổ chức.
Dữ liệu chuỗi thời gian: mã hóa thông tin sự kiện được gắn với chuỗi thời gian để có thể truy vết được quá khứ lịch sử. Thông qua các phương pháp toán học, dữ liệu theo chuỗi thời gian có thể được phân tích để tìm ra các dự báo xu thế, tự động phát hiện các bất thường hoặc ước tính các giá trị bị thiếu.
Dữ liệu không gian: dùng để quản lý lưu trữ các thông tin địa lý được biểu diễn bằng đối tượng hình học (điểm, đường, vùng) sử dụng các tọa độ không gian vật lí. Đây là nguồn dữ liệu dùng để cung cấp dịch vụ tạo ra các loại bản đồ số với nhiều lớp nền thông tin khác nhau. Ngoài ra nó cũng có thể được khai thác sử dụng trong các mô hình tính toán không gian phục vụ nhu cầu ứng dụng phát triển cơ sở hạ tầng trong thế giới thực.
Dữ liệu đa chiều: là mô hình biểu diễn cơ bản được dùng cho các thông tin thống kê. Số liệu thống kê là các chỉ số đo được tính toán trên nhiều chiều dữ liệu khác nhau. Mỗi chiều dữ liệu là một bộ lọc dữ liệu theo các nhóm dựa trên giá trị thể hiện không gian, thời gian hoặc phân loại của dữ liệu.
Dữ liệu báo cáo: là hình thức trình diễn thông tin dưới dạng của các bảng biểu hoặc biểu đồ phân tích giúp người dùng có cái nhìn trực quan hơn về dữ liệu. Dữ liệu báo cáo có thể được kết xuất trực tiếp hoặc được tạo ra gián tiếp nhờ các phân tích thông minh sử dụng phương pháp toán học dựa trên các loại dữ liệu sẵn có ở trên.
Dữ liệu mở: dùng để phân phối, tái sử dụng thông qua các bộ dữ liệu (dataset) hoặc dịch vụ truy cập dữ liệu trực tuyến (API). Dữ liệu mở chỉ có thể hình thành được sau khi có các loại dữ liệu đã được thu thập, xử lý theo như các cách như đã mô tả ở trên.
Hình 2 thể hiện mối tương quan của các nền tảng số được phân loại theo dữ liệu. Dữ liệu của một nền tảng số có thể dùng làm đầu vào để xử lý tạo ra dữ liệu cho một nền tảng số khác. Các nguồn dữ liệu ở tầng thu thập thông tin (ví dụ: dữ liệu biểu mẫu điện tử hoặc thiết bị IoT) có thể được xử lý phân tích như là đầu vào để tạo ra dữ liệu dùng ở tầng quản lý thông tin (ví dụ: dữ liệu chủ hoặc dữ liệu chuỗi thời gian); Dữ liệu ở tầng chia sẻ thông tin (số liệu thống kê, dữ liệu báo cáo và dữ liệu mở) phải được tạo ra bằng việc phân tích và xử lý tổng hợp từ các nguồn dữ liệu đầu vào ở các tầng trên. Cách thức thực hiện xử lý phân tích dữ liệu có thể được thực hiện theo hai biện pháp tự động hoặc thủ công. Trong trường hợp thực hiện thủ công người dùng sẽ chịu trách nhiệm thực hiện kết xuất dữ liệu từ một nền tảng số đầu vào để có thể biên tập lại trước khi nạp vào một nền tảng số khác.
Khung cấu trúc liên thông để xây dựng cơ sở hạ tầng dữ liệu
Dựa trên khung cấu trúc liên thông của châu Âu [3], chính phủ số khi xây dựng cần phải có một môi trường liên thông ở 4 tầng khác nhau gồm: pháp lí, tổ chức, ngữ nghĩa (dữ liệu) và kĩ thuật (công nghệ). Ở góc độ liên thông về pháp lí, các luật và nghị định phải được nghiên cứu xây dựng và sửa đổi để bảo đảm tính hợp pháp trong việc kết nối, chia sẻ dữ liệu phục vụ hoạt động của chính phủ số, nền kinh tế số và xã hội số. Gần đây, Chính phủ đã ban hành Nghị định số 47/2020/NĐ-CP quy định cụ thể về quản lý, kết nối và chia sẻ dữ liệu số của cơ quan nhà nước. Ngoài ra các cơ quan chính phủ cũng phải rà soát lại toàn các văn bản pháp quy để chỉnh sửa bảo đảm sự tương thích hoàn của các hoạt động diễn ra trên môi trường không gian số.
Về mặt tổ chức, các quy trình nghiệp vụ được xây dựng có tính rời rạc tại từng cơ quan trước đây sẽ phải được rà soát xây dựng lại theo cơ chế bảo đảm sự liên thông trong hoạt động của các tổ chức. Để bảo đảm duy trì được sự liên thông của quy trình nghiệp vụ trên môi trường số, cần có các văn bản quy định hoặc thỏa thuận thể hiện được quy chế phối hợp và chia sẻ dữ liệu giữa các cơ quan với nhau.
Liên thông về ngữ nghĩa thể hiện khả năng quản lí thông tin, mô hình hóa dữ liệu theo một phương thức thống nhất để các nguồn dữ liệu có thể được dịch và hiểu hoàn toàn giống nhau trên nhiều hệ thống khác nhau. Bài báo nghiên cứu [4] đã chỉ ra sự cần thiết và giải pháp xây dựng một từ điển dữ liệu liên kết mở để dùng làm cơ sở nền tảng cho chuyển đổi số ở Việt Nam. Từ điển này sẽ được dùng trong việc thiết kế, đọc và hiểu dữ liệu một cách thống nhất trên toàn bộ cơ sở hạ tầng dữ liệu quốc gia. Việc thiếu vắng một từ điển dữ liệu dùng chung để liên thông về ngữ nghĩa đang dẫn đến hiện trạng luôn luôn phải thực hiện tích hợp dữ liệu giữa các hệ thống đơn lẻ với nhau. Công việc tích hợp sẽ luôn bị phát sinh khi có hệ thống mới xây dựng với chuẩn cấu trúc định dạng dữ liệu mới.
Nền tảng số dữ liệu là các hệ thống công nghệ được triển khai để cung cấp các dịch vụ quản lý lưu trữ, chia sẻ và khai thác dữ liệu bởi các hệ thống thông tin khác nhau. Các nguyên tắc kĩ thuật cơ bản đối với nền tảng số này là phải đáp ứng được tiêu chuẩn FAIR (Findable – Accessible – Interoperable - Reusable) trong quản lý dữ liệu [5]. Ngoài ra dữ liệu sẽ phải được thu thập và quản lý trên các nền tảng số để đạt chuẩn cấp độ 5 của chia sẻ dữ liệu mở [6]. Ở chuẩn cấp độ này, toàn bộ dữ liệu sẽ phải được mã hóa và sử dụng các từ vựng được định danh duy nhất bằng URI. Dữ liệu của các tổ chức khác nhau có thể tham chiếu lẫn nhau, và có sự liên thông về ngữ nghĩa thông qua việc áp dụng mô hình dữ liệu liên kết mở (open linked data) của web thế hệ mới.
Tầng cuối cùng trong khung cấu trúc là liên thông về kĩ thuật. Nó bao gồm các tiêu chuẩn kĩ thuật kết nối, định dạng dữ liệu và các nền tảng công nghệ dùng để tích hợp liên thông các hệ thống thông tin, cơ sở dữ liệu trong sự thống nhất của một chính phủ số. Trong quy định của Khung kiến trúc Chính phủ điện tử Việt Nam [7], một nền tảng LGSP sẽ được xây dựng tại các bộ, ngành và tỉnh, thành để cung cấp dịch vụ kĩ thuật tích hợp và chia sẻ dùng chung trong các cơ quan nhà nước.
Ứng dụng giải pháp công nghệ mởđể xây dựng các nền tảng số
Phân tích ở trên đã nêu rõ được sự cần thiết của các nền tảng số trong phát triển chính phủ số và các thành phố thông minh. Chúng ta phân biệt có hai dạng nền tảng số được sử dụng là nền tảng số kĩ thuật và nền tảng số dữ liệu. Sự phát triển của công nghệ trong lĩnh vực công nghệ thông tin hiện nay đang diễn ra với tốc độ rất nhanh. Độ phức tạp của các nền tảng thường lớn, trong khi vòng đời công nghệ của sản phẩm ngắn nên chi phí để triển khai sẽ đòi hỏi rất cao. Trong điều kiện và hoàn cảnh kinh tế của Việt Nam, việc triển khai sử dụng các nền tảng công nghệ mở với chi phí thấp sẽ là ưu tiên hàng đầu trong lựa chọn đầu tư. Ngoài ra nó cũng là biện pháp giúp thúc đẩy quá trình tự làm chủ công nghệ, bảo đảm an toàn, an ninh cho các hệ thống ứng dụng công nghệ trọng điểm của cơ quan nhà nước.
Thực tế hiện nay, các hệ thống nền tảng LGSP đã và đang được triển khai sử dụng tại nhiều bộ, ngành và tỉnh thành. Khảo sát các dự án đầu tư cho thấy đều lựa chọn sử dụng công nghệ mở khi triển khai. Cụ thể các thành phần dịch vụ kĩ thuật của LGSP bao gồm nền tảng quản lý định danh và truy cập tập trung (IdAM), nền tảng dịch vụ tích hợp ứng dụng (ESB), nền tảng quản lý dịch vụ ứng dụng (API), nền tảng giám sát và phân tích log hệ thống,... phần lớn được lựa chọn sử dụng từ các phần mềm nguồn mở như WSO2, CAS, Keycloak, Kafka,...
Sử dụng phần mềm nguồn mở sẽ không tính chi phí cho bản quyền sử dụng. Tuy nhiên chủ đầu tư vẫn cần phải thuê các chuyên gia hỗ trợ thực hiện triển khai và bảo đảm sự vận hànhổn định của hệ thống. Ngoài ra việc tích hợp hệ thống cũng cần có thêm những tùy biến đáp ứng các nhu cầu cụ thể, ví dụ tạo thư viện kết nối với Cổng dịch vụ công quốc gia, các cơ sở dữ liệu quốc gia. Đây là các chi phí triển khai thường dùng cho các dự án sử dụng phần mềm nguồn mở, tuy nhiên sẽ thấp hơn rất nhiều so với chi phí để sở hữu bản quyền sử dụng phần mềm thương mại.
Đối với các nền tảng số dữ liệu, hiện không có một phần mềm nguồn mở quản lý tích hợp đủ tất cả các loại dữ liệu nền tảng như đã phân tích bao gồm dữ liệu biểu mẫu điện tử, dữ liệu thiết bị IoT, dữ liệu đa phương tiện, dữ liệu truyền thông xã hội, dữ liệu tham chiếu, dữ liệu chủ, dữ liệu chuỗi thời gian, dữ liệu không gian, dữ liệu đa chiều, dữ liệu báo cáo và dữ liệu mở. Các phần mềm nguồn mở thường được triển khai để sử dụng cho các mục đích chuyên dùng theo phân loại của các nền tảng gồm có: nền tảng quản lý biểu mẫu điện tử (eform) như Form.io; nền tảng cổng thông tin và mạng xã hội như Liferay, eXo Platform, OpenPaas; nền tảng quản lý đám mây IoT như FiWare, Kaa, Thingboard, Sofia2; nền tảng quản lý tài liệu điện tử (ECM) như Alfresco, OpenKM, LogicalDOC, Nuxeo, Dspace; nền tảng quản lý dữ liệu chủ (MDM) và mô hình hóa dữ liệu như TreoPIM, PIMCore, CUBA Platform; nền tảng quản lý thông tin địa lý (GIS) như GeoNode, GeoServer; nền tảng phân tích dữ liệu thông minh (BI) như Pentaho, SpagoBI; nền tảng quản lý dữ liệu mở (Open data) như CKAN.
Việc triển khai nhiều nền tảng số chuyên dùng trong cho các hệ thống ứng dụng của bộ ngành và tỉnh thành sẽ không tạo ra được sự liên thông về ngữ nghĩa của dữ liệu. Khi đó sẽ cần phải phát triển tùy biến thêm rất nhiều các dịch vụ bảo đảm tích hợp về ngữ nghĩa của dữ liệu giữa các nền tảng. Các dịch vụ công của chính phủ số và các thành phố thông minh sẽ phải được tích hợp thông minh như trong kiến trúc phát triển tại giai đoạn 4 của cơ sở hạ tầng dữ liệu. Do đó sẽ cần phải có một nền tảng số tích hợp dữ liệu cho phép xử lý tự động dữ liệu từ các biểu mẫu điện tử, thiết bị IoT, đa phương tiện, truyền thông xã hội để trở thành các CSDL nghiệp vụ quản lý thông tin chuyên ngành; đồng thời có thể kết xuất tự động các loại dữ liệu hỗ trợ quản lý điều hành thông minh như số liệu thống kê, báo cáo, chia sẻ dữ liệu mở.
Liên minh phát triển cơ sở hạ tầng dữ liệu mở Việt Nam
Sử dụng các nền tảng số là yêu cầu thiết yếu trong phát triển các hệ thống thông tin ứng dụng của chính phủ số và thành phố thông minh. Trong chiến lược của Chương trình chuyển đối số quốc gia đến năm 2025, các doanh nghiệp công nghệ thông tin Việt Nam sẽ đảm nhận sứ mệnh tiên phong trong nghiên cứu, phát triển, làm chủ công nghệ và chủ động sản xuất các nền tảng số "Make in Vietnam" để phục vụ nhu cầu trước mắt ở trong nước và tiến tới có thể mở rộng triển khai ở các nước khác trong khu vực.
Khai thác các nền tảng phần mềm nguồn mở hiện có trên thế giới là định hướng tốt để rút ngắn quá trình nghiên cứu phát triển của các doanh nghiệp. Tuy nhiên các nền tảng số dùng trong chính phủ số và các thành phố thông minh sẽ có
độ phức tạp rất lớn về công nghệ, và đòi hỏi nhiều yêu cầu xử lí các nghiệp vụ đặc thù. Chỉ một doanh nghiệp công nghệ đơn lẻ sẽ không thể có đủ nguồn lực để giải quyết được tổng thể bài toán của chính phủ số và thành phố thông minh. Do vậy cần có sự hợp tác của nhiều doanh nghiệp trong một liên minh có sứ mệnh phát triển cơ sở hạ tầng dữ liệu mở Việt Nam thông qua các nền tảng số công nghệ mở.
Các nền tảng số được nghiên cứu phát triển bởi liên minh có yêu cầu bảo đảm được đồng thời khả năng liên thông về kĩ thuật và về ngữ nghĩa như đã phân tích. Để làm được việc này thì nhiệm vụ đầu tiên của liên minh sẽ là hợp tác cùng xây dựng một từ điển dữ liệu liên kết mở theo cách tiếp cận trong bài báo nghiên cứu [4]. Nền tảng số mới dùng cho chính phủ số và thành phố thông minh là một nền tảng tích hợp của nhiều công nghệ mở và bảo đảm liên thông về ngữ nghĩa của dữ liệu dựa trên từ điển dữ liệu liên kết mở được xây dựng.
Cách tiếp cận kinh doanh trong liên minh là sẽ cùng hợp tác đầu tư phát triển một phần mềm nguồn mở tạo ra các dịch vụ lõi của nền tảng số tích hợp dữ liệu. Bằng các sản phẩm, tri thức được tạo ra trong liên minh, các doanh nghiệp tham gia sẽ thu được lợi ích khi cung cấp các dịch vụ cho khách hàng dưới hình thức của các dự án như sau:
- Sử dụng các nền tảng số công nghệ mở để xây dựng các hệ thống ứng dụng công nghệ thông tin của các bộ ngành, tỉnh thành như các cơ sở dữ liệu dùng chung, cơ sở dữ liệu quản lý chuyên ngành; kho lưu trữ điện tử dùng chung; hệ thống thông tin tổng hợp báo cáo, thống kê; cổng khai thác dữ liệu mở;...
- Xây dựng các trung tâm quản lý điều hành của chính phủ số và thành phố thông minh dựa trên một nền tảng số tích hợp "Make in Vietnam".
- Tư vấn chuyển đổi mô hình cung cấp dịch vụ công của chính phủ số và thành phố thông minh trên môi trường điện tử theo định hướng dựa trên thông tin lưu trữ trong cơ sở hạ tầng dữ liệu để thay thế cho các thành phần hồ sơ giấy tờ hành chính.
- Cung cấp dịch vụ kĩ thuật hỗ trợ các cơ quan nhà nước trong triển khai, duy trì vận hành các nền tảng số công nghệ mở.
Hình thức hợp tác tạo ra các liên minh công nghệ mở đang ngày càng trở nên phổ biến trên thế giới để tập hợp sức mạnh giải quyết các bài toán có tính toàn cầu. Chẳng hạn như dự án schema.org xây dựng từ điển dữ liệu liên kết mở có sự tham gia đầy đủ của các hãng công nghệ lớn về máy tìm kiếm trên Internet gồm Google, Bing, Yahoo, Yandex. Đây sẽ là xu thế tất yếu và cần được khuyến khích phát triển mở rộng tại Việt Nam.
Tài liệu tham khảo
1. Anveshi Gutta (2016). "Government Data Exchange and Open Data Platform - Tapping into the latest natural resource", The Open Group Conference – Hyderabad, India
2. Tạ Tuấn Anh (2019). "Xây dựng Chính phủ như là một nền tảng trong kỷ nguyên số", Tạp chí Thông tin và Truyền thông - Kỳ 2, Số 346, ISSN 1859–3550
3. Publications Office of the European Union (2017), "New European Interoperability Framework - Promoting seamless services and data flows for European public administrations", Luxembourg, ISBN 978-92-79-63756-8
4. Tạ Tuấn Anh (2020). "Xây dựng từ điển dữ liệu liên kết mở dùng làm nền tảng cho chuyển đổi số chính phủ điện tử ở Việt Nam", bài gửi đăng Tạp chí Thông tin và Tư liệu
5. Wilkinson, M. D. et al. (2016). "The FAIR Guiding Principles for scientific data management and stewardship", Scientific Data. Vol 3.
6. Tạ Tuấn Anh (2019). "Xây dựng hệ sinh thái dữ liệu mở cùng CMCN 4.0", Kỉ yếu Hội thảo khoa học Xây dựng và khai thác tài nguyên giáo dục mở, Hà Nội.
(Bài đăng trên Tạp chí TT&TT Số 5+6 tháng 6/2020)