Bài viết trình bày một đề xuất kiến trúc hệ thống dùng để xây dựng hạ tầng kết nối, chia sẻ dữ liệu quốc gia dựa trên việc khai thác sử dụng các mã định danh điện tử.
Mô hình nhà cung cấp dịch vụ kết nối, chia sẻ dữ liệu số
Hình 1 minh họa một kiến trúc triển khai liên thông kĩ thuật các hệ thống thông tin, cơ sở dữ liệu (HTTT, CSDL) trong toàn quốc thông qua các nhà cung cấp dịch vụ kết nối, chia sẻ dữ liệu số được gọi là DSP (Data Service Provider). Có nhiều DSP khác nhau cùng tham gia vào hạ tầng kết nối, chia sẻ dữ liệu số quốc gia để hình thành nên một mạng kết nối kiểu ngang hàng (P2P). Có thể phân nhóm các DSP theo 4 cấp quản lý của chính phủ bao gồm Quốc gia, Bộ, ngành, Tỉnh/thành và Doanh nghiệp để kết nối với các HTTT, CSDL ở các cấp tương ứng.
Như vậy có thể thấy, hạ tầng kết nối, chia sẻ dữ liệu số sẽ không chỉ hạn chế dùng trong nội bộ các cơ quan Nhà nước mà còn có sự tham gia của doanh nghiệp. Đây chính là điểm khác biệt của chính phủ số trong việc tạo dựng hạ tầng kĩ thuật bảo đảm tính liên thông xuyên ngành - lấy người dân, doanh nghiệp làm trọng tâm để phục vụ kết nối.
Một Cổng QRCode quốc gia sẽ được xây dựng để thực hiện vai trò thống nhất trong quản lý và kiểm soát các DSP tham gia hạ tầng kết nối, chia sẻ dữ liệu số dựa trên hệ thống mã định danh điện tử. Về mặt kĩ thuật, nó cung cấp các dịch vụ của một “siêu nút” (super-peer) để điều phối kết nối các DSP trong mạng ngang hàng. Ngoài ra, Cổng QRCode quốc gia sẽ là đầu mối cung cấp dịch vụ phân giải mã định danh điện tử của dữ liệu số tại một địa chỉ tập trung.
Ví dụ, để tìm hiểu thông tin của một doanh nghiệp có mã định danh là vodi:ToChuc:1234567890123, người dùng có thể gõ địa chỉ URL như sau https://
Các HTTT, CSDL được xây dựng, triển khai với những lựa chọn công nghệ, cấu trúc dữ liệu rất khác nhau. Giải pháp tiến tới áp dụng thống nhất về mặt công nghệ và cấu trúc dữ liệu dùng chung cho tất cả các HTTT, CSDL đã triển khai và/hoặc xây mới sẽ là bất khả thi, ngay cả khi chỉ áp dụng trong phạm vi một ngành, lĩnh vực hẹp. Trong mô hình kiến trúc hệ thống đề xuất, các DSP đóng vai trò như là một nền tảng trung gian phục vụ liên thông kĩ thuật giữa các ứng dụng. Mỗi DSP sẽ đảm nhiệm việc cung cấp 3 loại dịch vụ cơ bản như dưới đây.
Dịch vụ đăng kí mã định danh điện tử và chia sẻ dữ liệu số
Dữ liệu có trong các HTTT, CSDL sẽ phải được đóng gói cùng với mã định danh điện tử để chia sẻ ra bên ngoài thông qua một DSP. Gói dữ liệu đăng kí gồm có 2 phần: i) dữ liệu biểu diễn các thuộc tính mô tả đối tượng quản lý; ii) siêu dữ liệu mô tả gói dữ liệu (xem Bảng 1). Mỗi mã định danh điện tử chỉ được dùng để mô hình hóa thông tin cho một đối tượng quản lý duy nhất trên thực tế. Có thể có nhiều gói dữ liệu đăng kí sử dụng cho cùng một mã định danh điện tử. Khi đó chúng dùng để mô hình hóa các góc nhìn thông tin khác nhau cho cùng một đối tượng. Ví dụ, một doanh nghiệp có mã định danh điện tử được chia sẻ dữ liệu đầu tiên từ CSDL quốc gia về đăng kí kinh doanh. Mã định danh này sau đó sẽ được tiếp tục sử dụng để chia sẻ thêm các dữ liệu liên quan đến việc cấp phép cho doanh nghiệp hoạt động trong các lĩnh vực có yêu cầu điều kiện (y tế, giáo dục,...).
Dữ liệu khi chia sẻ nếu có chữ ký số xác thực hợp lệ thì sẽ được khai thác sử dụng với tính pháp lý tương đương như một văn bản hành chính gốc. Khi khai thác, người dùng dữ liệu sẽ phải kiểm tra thẩm quyền pháp lý của chủ dữ liệu đối với các nội dung thông tin đã cung cấp. Tuy nhiên để tránh việc cung cấp thông tin, dữ liệu giả mạo trên hệ thống, các DSP sẽ phải xây dựng quy trình kiểm soát để hạn chế các cá nhân, tổ chức (chủ dữ liệu) chỉ có thể cung cấp dữ liệu chia sẻ trên một số mẫu cấu trúc thông tin mô tả cho một miền mã định danh nhất định. Quy trình kiểm duyệt này có thể so sánh giống như việc kiểm soát tránh spam, giả mạo thông tin đối với các tin nhắn được gửi trên mạng viễn thông. Tuy nhiên việc kiểm soát đối với các dữ liệu số sẽ dễ dàng hơn rất nhiều vì nó có cấu trúc và ngữ nghĩa được định nghĩa rất rõ ràng.
Dữ liệu được lưu trữ quản lý trên các HTTT, CSDL chuyên ngành có thể được dùng với các định dạng, cấu trúc riêng biệt. Tuy nhiên khi được đăng kí chia sẻ qua một DSP, nó sẽ phải được chuyển đổi về một cấu trúc thống nhất để đảm bảo tính liên thông về mặt ngữ nghĩa. Giải pháp công nghệ được lựa chọn hiện nay là sử dụng mô hình dữ liệu mở liên kết (Linked Open Data) để biểu diễn thông tin cho gói dữ liệu được chia sẻ. Một tiêu chuẩn chung về lược đồ khái niệm (ontology) sẽ được áp dụng để định nghĩa cấu trúc gói tin cho dữ liệu chia sẻ.
Dịch vụ phân giải mã định danh điện tử và tìm kiếm dữ liệu số
Dữ liệu đã sẵn sàng cho chia sẻ được quản lý phân tán bởi các DSP. Khi người dùng quan tâm đến một mã định danh nào đó thì sẽ phải thực hiện tìm kiếm nó trên các DSP theo đúng cơ chế của mạng chia sẻ ngang hàng. Đây là mô hình đã được triển khai rất thành công trong thực tiễn để hỗ trợ người dùng chia sẻ tệp dữ liệu trên mạng Internet. Có nhiều kết quả nghiên cứu về xây dựng một hệ thống chia sẻ dữ liệu phân tán dựa trên mô hình mạng ngang hàng. Chúng ta sẽ phải xây dựng một chuẩn giao thức để kết nối các DSP phục vụ cho việc tìm kiếm dữ liệu theo mã định danh điện tử.
Sau đây là mô tả cho tiến trình thực hiện phân giải cho một mã định danh điện tử. Người dùng quét hình ảnh QRCode bằng ứng dụng để nhận về mã định danh của đối tượng cần tra cứu thông tin. Ứng dụng gửi mã định danh cho Cổng QRCode Quốc gia để thực hiện yêu cầu tìm kiếm dữ liệu trên hạ tầng kết nối các DSP. Các DSP tìm trong CSDL đăng kí để gửi trả thông tin về các gói dữ liệu chia sẻ trùng mã định danh cần tìm kiếm. Kết quả trả về phải chứa ít nhất là thông tin mô tả (metadata) của gói dữ liệu chia sẻ. Trong trường hợp dữ liệu được chia sẻ mở thì kết quả trả về sẽ bao gồm cả nội dung chính của nó. Trong thông tin mô tả gói dữ liệu chia sẻ có đường dẫn URL để chỉ dẫn người dùng truy cập vào trang thông tin gốc mô tả đối tượng cần tra cứu.
Không chỉ dùng để phân giải mã định danh qua Cổng QRCode quốc gia, dữ liệu chia sẻ có thể được tìm kiếm, khai thác bởi các ứng dụng thông qua việc kết nối vào các DSP. Khi có nhu cầu, ứng dụng sẽ gửi yêu cầu tìm kiếm đến một DSP. Nội dung tìm kiếm có thể không chỉ hạn chế ở một mã định danh nhất định mà có thể mở rộng tìm kiếm trên một số trường thông tin quan tâm. Ví dụ có thể tìm kiếm dữ liệu theo tên, mã số quản lý của đối tượng. DSP sẽ thực hiện gửi yêu cầu tìm kiếm trên mạng chia sẻ ngang hàng và nhận trả về kết quả cho ứng dụng. Không phải tất cả dữ liệu được chia sẻ đều là mở. Ứng dụng sẽ phải thực hiện các giao dịch tính phí hoặc tương đương để có thể tìm kiếm trên các nguồn dữ liệu được chia sẻ theo cơ chế thỏa thuận.
Dịch vụ kết nối liên thông trao đổi dữ liệu số
Trong kết nối liên thông, dữ liệu còn có thể được chia sẻ theo phương thức gửi chủ động giữa tổ chức với tổ chức hay còn gọi là B2B. Nó được dùng để làm phương thức trao đổi thông tin, dữ liệu chính thức giữa các bên. Một ví dụ áp dụng phổ biến hiện nay là việc triển khai gửi, nhận văn bản điện tử bằng hệ thống CNTT trong các cơ quan Nhà nước.
Khi cần gửi thông tin, một ứng dụng sẽ tạo gói tin giống như cấu trúc của gói dữ liệu chia sẻ để gửi đến DSP mà nó đã đăng kí kết nối. Sự khác biệt duy nhất là gói tin này sẽ có thêm thông tin nơi nhận (cá nhân, tổ chức) và vòng đời xác định thời gian hiệu lực của nó. DSP nơi gửi sẽ đóng vai trò như là một hub kết nối thực hiện trung chuyển gói tin đến một DSP khác mà ứng dụng nơi nhận đang kết nối. Giao thức kết nối sẽ được thiết kế để cho phép truy vết được tình trạng gửi, nhận của các gói tin trên mạng lưới các DSP.
Mô hình liên thông dựa trên hạ tầng kết nối các nền tảng tích hợp là một lựa chọn để thay thế cho các kết nối tích hợp trong các mạng theo cấu trúc điểm-điểm hoặc điểm-hub-điểm đang được sử dụng phổ biến hiện nay. Các mạng kết nối này thường sử dụng các giao thức (API) dùng riêng để trao đổi thông tin. Từ đó một ứng dụng tạo ra sẽ phải tích hợp cùng lúc với nhiều điểm kết nối sử dụng các API khác nhau. Ngoài ra cấu trúc kết nối trên thường sẽ tạo ra điểm tắc nghẽn “cổ chai” làm hạn chế khả năng triển khai rộng trên quy mô toàn quốc. Lấy ví dụ về hệ thống thông tin quản lý văn bản điện tử, cho đến nay chưa triển khai được việc gửi, nhận liên thông phường xã với phường xã ở trên toàn quốc.
Dịch vụ kết nối liên thông trên một hạ tầng dùng chung của quốc gia là giải pháp giúp hạn chế các đầu mối và số giao thức (API) mà các ứng dụng phải tích hợp khi tham gia vào chính phủ số. Nó giúp tiết kiệm được chi phí triển khai và tăng khả năng mở rộng liên thông xuyên ngành giữa các ứng dụng. Các dạng kết nối tích hợp sử dụng giao thức dùng riêng vẫn cần được duy trì. Tuy nhiên chỉ nên áp dụng cho các nghiệp vụ đặc thù theo từng lĩnh vực chuyên ngành hẹp.
Triển khai hạ tầng kết nối, chia sẻ dữ liệu trong kiến trúc chính phủ số
Phát triển các nền tảng số và hệ thống quy mô quốc gia đã được xác định là nhiệm vụ trọng tâm của chuyển đổi số. Trong Quyết định số 942/QĐ-TTg của Thủ tướng Chính phủ về phê duyệt Chiến lược phát triển Chính phủ điện tử hướng tới Chính phủ số giai đoạn 2021 - 2025, định hướng đến năm 2030 đã chỉ ra hai nội dung liên quan đến kết nối, chia sẻ dữ liệu là: i) “Phát triển Nền tảng tích hợp, chia sẻ dữ liệu quốc gia (NDXP) để kết nối, tích hợp, chia sẻ dữ liệu giữa các hệ thống thông tin, cơ sở dữ liệu của các bộ, ngành, địa phương trên quy mô toàn quốc thông qua việc kết nối với Nền tảng tích hợp, chia sẻ dữ liệu của các bộ, ngành, địa phương (LGSP)”; ii) “Xây dựng nền tảng QR code cho phép liên thông thống nhất các mã định danh của người dân, tổ chức trong toàn xã hội”.
Mô hình kĩ thuật của các nền tảng NDXP và LGSP hiện đã được chỉ ra trong Khung kiến trúc chính phủ điện tử Việt Nam, phiên bản 2.0 do Bộ TT&TT ban hành. Tuy nhiên, nội dung của Khung kiến trúc mới chỉ đề cập đến mô hình kết nối kĩ thuật các LGSP theo phương thức tập trung về NDXP. Chưa có các quy định cụ thể về các dịch vụ cần thiết để bảo đảm sự liên thông về mặt ngữ nghĩa trên các nền tảng tích hợp, chia sẻ dữ liệu. Ngoài ra cũng cần làm rõ thêm mối tương quan về dịch vụ kĩ thuật giữa các nền tảng NDXP, LGSP và các nền tảng khác (danh tính điện tử, QRCode,...) để hình thành một hệ thống tổng thể của chính phủ số. Do vậy cần có nghiên cứu cập nhật, bổ sung Khung kiến trúc chính phủ điện tử Việt Nam lên phiên bản mới cho phù hợp với chiến lược phát triển chính phủ số giai đoạn 2021-2025.
Theo mô hình kiến trúc đã đề xuất, các bộ, ngành, địa phương sẽ đầu tư xây dựng nền tảng LGSP kết hợp cùng với kho dữ liệu dùng chung [2] để hình thành nên các DSP Bộ, ngành, Tỉnh, thành. Một DSP Quốc gia sẽ được hình thành dựa trên việc phát triển nền tảng NDXP kết hợp cùng với CSDL danh mục dùng chung và các CSDL quốc gia khác chứa dữ liệu dùng làm nền tảng cho chính phủ số (ví dụ CSDLQG về dân cư, CSDLQG về đăng kí kinh doanh,...). Tiến hành việc nâng cấp mô hình kết nối tập trung thay bằng mô hình kết nối ngang hàng giữa các nền tảng. Hạ tầng kết nối bảo mật để trao đổi dữ liệu (gói tin) do Văn phòng Chính phủ đang triển khai (nền tảng VDXP sử dụng công nghệ X-Road) có thể được kế thừa để tạo ra mạng lưới kết nối, chia sẻ theo mô hình phi tập trung.
Cổng QRCode quốc gia sẽ đóng vai trò là “siêu nút”, đảm nhiệm việc điều phối các DSP tham gia vào hạ tầng kết nối, chia sẻ dữ liệu quốc gia. Ngoài các DSP của cơ quan Nhà nước, cần khuyến khích phát triển các DSP là doanh nghiệp. Như vậy hạ tầng kết nối, chia sẻ dữ liệu quốc gia sẽ có khả năng mở rộng để không chỉ phục vụ cho chính phủ số, mà còn hỗ trợ phát triển cả kinh tế số và xã hội số.
Về mặt tiếp cận triển khai, cần có 3 yếu tố mở để bảo đảm sự thành công là: tiêu chuẩn mở, thiết kế mở và phần mềm nguồn mở. Tiêu chuẩn mở chính là điều kiện cần để bảo đảm tính liên thông cả về mặt kĩ thuật và ngữ nghĩa trong kết nối, chia sẻ dữ liệu. Các nền tảng sẽ sử dụng chung một chuẩn mã định danh và bộ từ điển dữ liệu được xây dựng dựa trên mô hình dữ liệu mở liên kết (LOD).
Thiết kế mở là điều kiện đủ cho phép mở rộng triển khai hạ tầng kết nối, chia sẻ đến với mọi thành phần trong xã hội. Toàn bộ thiết kế hệ thống cùng với API mở phải được công bố để bất kì một doanh nghiệp nào cũng có thể phát triển một nền tảng riêng khi muốn tham gia với vai trò như một DSP. Qua đó việc chuyển đổi số không chỉ giới hạn trong các hệ thống của chính phủ mà sẽ lan tỏa ra toàn xã hội.
Phần mềm nguồn mở là lựa chọn tối ưu giúp tiết kiệm chi phí, nguồn lực phát triển. Cùng một mã nguồn phần mềm sẽ được triển khai cho nhiều DSP bộ, ngành, địa phương. Hơn nữa nó tạo ra sự cạnh tranh công bằng cho nhiều doanh nghiệp trong việc cung cấp dịch vụ hỗ trợ, vận hành hệ thống một cách tốt nhất.
Chúng ta đã xây dựng được chiến lược chuyển đổi số chính phủ với những mục tiêu, nhiệm vụ rõ ràng. Để hiện thực hóa chiến lược này, sẽ phải tiến hành cụ thể hóa bằng những phương án, giải pháp kĩ thuật nằm trong Kiến trúc chính phủ số Việt Nam ở giai đoạn mới (dùng thay thế cho Khung kiến trúc chính phủ điện tử Việt Nam, phiên bản 2.0). Chính phủ cần chú trọng hơn vào việc tạo ra hành lang về chính sách và các tiêu chuẩn mở để có thể huy động mọi nguồn lực xã hội cùng tham gia vào phát triển hạ tầng kĩ thuật số. Nếu như các ISP là hạt nhân của hạ tầng kết nối mạng Internet thì các DSP sẽ là hạt nhân của hạ tầng kết nối, chia sẻ dữ liệu số trong tương lai./.
Tài liệu tham khảo
1. Tạ Tuấn Anh, “Xây dựng hệ thống mã định danh điện tử dùng làm QRCode phục vụ kết nối, chia sẻ dữ liệu trong chính phủ số”. Tạp chí TT&TT số 10 tháng 10/2021.
2. Tạ Tuấn Anh, “Mô hình kiến trúc và công nghệ xây dựng kho dữ liệu dùng chung phục vụ phát triển chính phủ số”. Tạp chí TT&TT số 7 tháng 7/2021.
(Bài đăng ấn phẩm in Tạp chí TT&TT số 11/tháng 11/2021)