Dữ liệu mở, đặc biệt dữ liệu mở của cơ quan nhà nước (CQNN) đã trở thành một động lực để thúc đẩy phát triển kinh tế, thúc đẩy sáng tạo của xã hội. Việt Nam đang đi đến đâu trong cung cấp dữ liệu mở?
Năm 2009 , Chính phủ Mỹ đã chính thức công bố dữ liệu mở của Chính phủ thông qua cổng dữ liệu Chính phủ (data.gov). Ban đầu, trên data.gov chỉ có 47 tập dữ liệu, 27 công cụ với thiết kế đơn giản. Trong ngày đầu tiên, cổng đã có 2,1 triệu lượt truy cập, ngày thứ hai có 2,5 triệu lượt truy cập tại Mỹ và trong hai tháng đầu tiên có tới 20 triệu truy cập từ khắp nơi trên thế giới. Sau đó việc cung cấp dữ liệu mở của Chính phủ đã nhanh chóng trở thành mục tiêu cam kết minh bạch thông tin, dữ liệu của nhiều quốc gia.
Vào năm 2014, theo số liệu khảo sát của Đại học Waseda - Tokyo Nhật Bản, có 38 quốc gia đã cung cấp dữ liệu mở của Chính phủ để phục vụ người dân và doanh nghiệp (DN) thông qua cổng dữ liệu Chính phủ. Đến nay, theo báo cáo đánh giá của Liên Hợp Quốc năm 2020, trên thế giới đã có 80% các nước đã xây dựng Cổng dữ liệu để cung cấp dữ liệu mở của Chính phủ để phục vụ người dân và DN. Việc cung cấp dữ liệu mở của Chính phủ đã trở thành một tiêu chí quan trọng trong việc đánh giá Chính phủ điện tử của các quốc gia.
Vai trò của dữ liệu mở đối với người dân và phát triển kinh tế
Dữliệu mở (Open data): là dữ liệu có thể được bất kỳ ai tự do sử dụng, sử dụng lại và phân phối lại, chỉ yêu cầu phải ghi nhận nguồn và chia sẻ tương tự.
Dữliệu mở của CQNN (Open government data): làdữliệuđược CQNNcóthẩmquyềncôngbốrộngrãichocơquan,tổchức,cánhântựdosửdụng,táisửdụng,chiasẻ(theoNghịđịnhsố47/2020/NĐ-CPngày09/4/2020củaChínhphủvềQuảnlý,kếtnốivàchiasẻdữliệusốcủa CQNN).
Đối với công dân, dữ liệu mở giúp người dân tìm được đúng dịch vụ đáp ứng nhu cầu cần thiết, chẳng hạn như bác sỹ theo yêu cầu của họ hoặc giáo viên tốt nhất cho con của họ. Thông qua các nguồn dữ liệu, các chuyên gia có thể so sánh kết quả có được. Các bệnh nhân hoặc bác sỹ có thể truy cập đến các bệnh án để theo dõi sức khỏe tốt hơn và làm cho các quyết định được thông báo rộng rãi hơn đến các bác sỹ khác.
Ngoài ra, công dân có thể gửi dữ liệu lên cơ quan thẩm quyền xử lý và gia tăng thách thức đối với giá trị của dịch vụ được cung cấp. Như vậy, dữ liệu mở sẽ gia tăng nguồn cung cấp dữ liệu công dân cần để có lựa chọn phù hợp và cải thiện chất lượng các dịch vụ công được cung cấp. Từ đó, trách nhiệm của người dân được cải thiện. Mối quan hệ xã hội giữa người dân và cộng đồng có thể biến đổi. Dữ liệu mở có thể trở thành một động lực để thúc đẩy phát triển kinh tế. Vì thế, dữ liệu này có chất lượng cao hơn để hỗ trợ các dịch vụ chất lượng tốt hơn, đáp ứng tốt hơn đối với yêu cầu của người dân và cộng đồng, có giá trị cao hơn, và được cung cấp tự do hơn.
Theo báo cáo của Ủy ban hạ tầng quốc gia Vương quốc Anh, việc công bố dữ liệu cho công chúng có thể giúp người sử dụng tiết kiệm thời gian tương đương giá trị từ 15 - 58 triệu bảng Anh mỗi năm. Việc chia sẻ dữ liệu có thể tạo nên lợi ích gia tăng thông qua các sáng kiến, giải pháp hỗ trợ di chuyển có giá trị khoảng 15 tỷ bảng Anh vào năm 2025 (tại Anh).
Dữ liệu về giao thông, môi trường khi thu thập và công bố dưới dạng dữ liệu mở có thể tạo điều kiện cho các nhà khoa học nghiên cứu giải quyết các bài toán về tắc đường, bảo vệ môi trường; có thể giúp cho các DN phát triển các ứng dụng, dịch vụ cho người dân hay hỗ trợ các nhóm khởi nghiệp tạo ra các sản phẩm kinh doanh mới. Từ đó đóng góp vào giải quyết các vấn đề xã hội, thúc đẩy phát triển kinh tế.
Dữ liệu mở đóng vai trò rất quan trọng trong phát triển trí tuệ nhân tạo (AI). Để phát triển AI thì điều cơ bản và quan trọng nhất là phải cần dữ liệu để đào tạo máy. Các thuật toán, công nghệ có thể dễ dàng chia sẻ và chuyển giao công nghệ giữa các quốc gia, giữa các lĩnh vực.
Tuy nhiên, dữ liệu cho AI thì phải được bản địa hóa, chuyên ngành hóa cho từng quốc gia, từng lĩnh vực để tạo ra các trí thông minh phù hợp. Điều này không thể có được khi chuyển giao từ nước ngoài. Máy sẽ càng thông minh hơn khi càng có nhiều dữ liệu mà dữ liệu lớn không thể được tạo chỉ bởi một cá nhân hay tổ chức nào.
Chính vì vậy, dữ liệu mở sẽ là nguồn dữ liệu quan trọng để huy động dữ liệu từ mọi nguồn lực nhà nước, cá nhân, tổ chức để cùng phát triển AI quốc gia. Đây cũng chính là nội dung quan trọng trong chiến lược quốc gia về nghiên cứu, phát triển và ứng dụng AI đến năm 2030 theo Quyết định số 127/QĐ-TTg ngày 26/01/2021 của Thủ tướng Chính phủ ban hành.
Việt Nam đang đi đến đâu trong cung cấp dữ liệu mở?
Tại Việt Nam, trước nhu cầu thực tế hiện nay từ các DN, cộng đồng, sáng kiến về dữ liệu mở cũng đã xuất hiện. TP Hồ Chí Minh đã công bố cổng dữ liệu mở của mình tại https://opendata.hochiminhcity.gov. vn; Đà Nẵng đã cung cấp dữ liệu mở tại https://opendata. danang.gov.vn.
Các dữ liệu này cần thiết cho người dân, cộng đồng để khai thác phát triển các giải pháp sáng tạo và cung cấp rộng rãi trên Internet. Trên phạm vi quốc gia, dự án Hệ tri thức Việt số hóa cũng đã cho ra mắt cổng dữ liệu mở https://dulieu.itrithuc.vn đã cung cấp được một số nội dung dữ liệu ban đầu. Tuy nhiên, tất cả các cổng dữ liệu này mới chỉ cung cấp dữ liệu hạn chế do chưa có cơ sở pháp lý, chưa có tính đồng bộ và mới được ra mắt để đáp ứng bước đầu nhu cầu của cộng đồng về dữ liệu mở.
Nhận thức được vai trò của dữ liệu mở, với tinh thần Chính phủ kiến tạo phát triển, dữ liệu mở của CQNN đã được quan tâm và thúc đẩy trong thời gian gần đây.
Ngày 9/4/2020, Chính phủ đã ban hành Nghị định số 47/2020/NĐ-CP về quản lý, kết nối và chia sẻ dữ liệu số của CQNN. Đây có thể coi là bước đột phá về chính sách khi đã đưa nội dung quy định về dữ liệu mở của CQNN. CQNN sẵn sàng cung cấp dữ liệu mở để tạo điều kiện cho mọi đối tượng trong cộng đồng: học sinh, sinh viên, các nhà nghiên cứu, DN… khai thác sử dụng phục vụ tạo ra các sản phẩm sáng tạo, phục vụ cộng đồng, đóng góp cho xã hội.
Có thể nói, việc quy định dữ liệu mở trong văn bản quy phạm pháp luật của Việt Nam là khá sớm và đi trước một bước so với thực tiễn nếu so sánh với một số nước. Ví dụ, tại Mỹ mặc dù sáng kiến dữ liệu mở triển khai khá sớm (Cổng dữ liệu mở quốc gia triển khai năm 2009) nhưng tới năm 2019, dữ liệu mở mới được đưa vào văn bản pháp luật cấp liên bang. Điều này thể hiện Chính phủ rất quan tâm và xúc tiến việc triển khai dữ liệu mở cho cộng đồng.
Nghị định 47/2020/NĐ-CP quy định - Dữ liệu mở của CQNN là dữ liệu được CQNN có thẩm quyền công bố rộng rãi cho cơ quan, tổ chức, cá nhân tự do sử dụng, tái sử dụng, chia sẻ lại. Dữ liệu mở của CQNN phải đảm bảo một số nguyên tắc: toàn vẹn và phản ánh đầy đủ nội dung thông tin CQNN cung cấp; cung cấp là dữ liệu được cập nhật mới nhất; truy cập được trên môi trường mạng; thiết bị số có thể xử lý được; tự do truy cập, sử dụng và dữ liệu mở phải ở định dạng mở. Các nguyên tắc này được thiết kế tương đồng với các nguyên tắc các nước đang sử dụng để đảm bảo sự đồng bộ, thống nhất khi đề cập đến dữ liệu mở.
Theo thông lệ chung về dữ liệu mở, việc khai thác, sử dụng dữ liệu mở đi kèm với giấy phép về dữ liệu mở. Nghị định 47/2020/NĐ-CP cụ thể hóa nội dung giấy phép dữ liệu mở trong Điều 18 về quy định sử dụng dữ liệu mở của CQNN. Cụ thể: khi sử dụng dữ liệu mở phải trích dẫn, ghi nhận nguồn gốc của dữ liệu mở; không được bán dữ liệu mở; phải cung cấp miễn phí dữ liệu mở kèm theo các sản phẩm, dịch vụ của mình. Để khuyến khích các CQNN, đẩy mạnh việc cung cấp dữ liệu mở, cơ quan cung cấp sẽ không phải chịu trách nhiệm về những thiệt hại phát sinh đối với người sử dụng khi khai thác dữ liệu mở.
Một trong những điểm thể hiện sự tích cực của CQNN cung cấp dữ liệu mở là ưu tiên cung cấp dữ liệu mở đối với dữ liệu mà người dân, DN có nhu cầu sử dụng cao; khuyến khích tổ chức, cá nhân xây dựng, đóng góp dữ liệu mở; tiếp nhận ý kiến phản hồi của tổ chức, cá nhân để thực hiện công bố dữ liệu mở phù hợp với nhu cầu.
Tuy nhiên, các quy định pháp lý mới chỉ là bước đầu, để triển khai tốt chủ trương về dữ liệu mở đòi hỏi phải tất cả các CQNN vào cuộc và thể hiện bằng các hành động mở dữ liệu cụ thể. Theo quy định, các bộ, ngành, địa phương phải xây dựng kế hoạch cung cấp dữ liệu mở của mình. Kế hoạch cung cấp dữ liệu mở phải có những tiêu chí số lượng tối thiểu trong từng giai đoạn.
Bên cạnh việc triển khai hạ tầng pháp lý, Chính phủ cũng đã triển khai hoạt động cụ thể để thúc đẩy dữ liệu mở. Thực hiện nhiệm vụ được Chính phủ giao, ngày 30/9/2020, Bộ TT&TT đã tổ chức buổi lễ khởi động Cổng dữ liệu quốc gia. Đây được xác định là một điểm đầu mối để các CQNN cung cấp dữ liệu mở. Quá trình thực hiện cũng đã có sự cam kết đồng hành của các CQNN, tổ chức như Bộ Tài nguyên và Môi trường, Bộ Khoa học Công nghệ, Bộ Giáo dục và Đào tạo, Bộ Y tế, Đại học quốc gia Hà Nội… cùng nhau thúc đẩy và cung cấp dữ liệu mở lên Cổng dữ liệu quốc gia. Cổng dữ liệu quốc gia được thiết lập giúp Việt Nam đứng trong đội ngũ các nước đã được thiết lập Cổng dữ liệu của Chính phủ.
Cổng dữ liệu mở quốc gia là một thành phần trong Cổng dữ liệu quốc gia, nơi các cơ quan nhà nước cung cấp dữ liệu mở của mình cho cộng đồng.
Kiến nghị, đề xuất
Các bước đi của Việt Nam về dữ liệu mở cũng mới chỉ bắt đầu, triển khai dữ liệu mở đòi hỏi phải có sự hợp lực của nhiều cơ quan, đơn vị, cá nhân cả phía cung cấp và khai thác dữ liệu mở.
Để thúc đẩy cung cấp dữ liệu mở, kiến nghị các CQNN, trong thời gian tới cần xem xét triển khai tiếp các giải pháp quản lý triển khai như sau:
Tăng cường khả năng truy cập và khả năng sử dụng của dữ liệu từ Trung ương đến địa phương Xây dựng và triển khai kế hoạch về dữ liệu mở trong phạm vi bộ, ngành, địa phương mình. Kế hoạch cần có các tiêu chí tối thiểu và thước đo để các đơn vị trực thuộc phấn đấu cung cấp dữ liệu mở cho người dân.
Xây dựng danh mục dữ liệu mở CQNN ưu tiên triển khai cung cấp phù hợp với nhu cầu khai thác của người dân, DN. Các cơ quan tích cực rà soát dữ liệu hiện có, trong trường hợp dữ liệu không vi phạm các quy định của pháp luật thì khuyến khích mở cho người dân, DN khai thác, đồng thời bám sát các nguyên tắc cung cấp dữ liệu mở của CQNN để đảm bảo dữ liệu mở được cập nhật, toàn vẹn và dễ dàng sử dụng. Tích cực cung cấp lên cổng dữ liệu quốc gia để tạo đầu mối dữ liệu mở tập trung.
Về kỹ thuật, các cơ quan Trung ương cần phối hợp việc công khai danh mục dữ liệu theo một mẫu chung để đảm bảo cung cấp metadata phù hợp, cũng như tạo điều kiện dễ dàng so sánh và tích hợp với một danh mục khác;
Tăng cường phối hợp với các tổ chức, cá nhân để cung cấp dữ liệu mở phù hợp với nhu cầu và khuyến khích sử dụng, khai thác dữ liệu mở.
Tăng cường sự tham gia đóng góp dữ liệu mở của các tổ chức xã hội đối với dữ liệu mở.
Các CQNN tích cực triển khai các biện pháp khuyến khích tổ chức, cá nhân sử dụng dữ liệu mở:
- Tiếp nhận ý kiến phản hồi của tổ chức, cá nhân để xác định mức độ ưu tiên và thực hiện công bố dữ liệu mở phù hợp với nhu cầu;
- Tổ chức các cuộc thi sáng tạo trên các tập dữ liệu mở được cung cấp.
- Khuyến khích các công ty công nghệ số tham gia đóng góp các bộ dữ liệu mở dùng chung để đào tạo các máy học cho AI.
- Thúc đẩy các hoạt động nghiên cứu và thu thập kết quả dữ liệu từ nghiên cứu trong các trường đại học để đóng góp vào không gian dữ liệu mở quốc gia.
- Hỗ trợ các tổ chức, cá nhân trong xã hội, cộng đồng thực hiện các hoạt động xây dựng, đóng góp để mở rộng dữ liệu mở bằng cách hỗ trợ kinh phí đặt hàng xây dựng dữ liệu mở, thu thập dữ liệu mở.
- Làm việc với các nhà tài trợ và các tổ chức xã hội để khuyến khích họ tham gia vào dự án về dữ liệu mở hay đưa yêu cầu về dữ liệu; tham gia giám sát, đánh giá việc cung cấp dữ liệu mở của cơ quan nhà nước.
Phát triển, cung cấp các ứng dụng cho các tổ chức xã hội để khai thác dữ liệu mở đã được cung cấp.
Tóm lại, trong cung cấp dữ liệu mở, không chỉ CQNN cung cấp dữ liệu cho người dân, DN, mà người dân, DN cũng cần phối hợp để đóng góp, cung cấp dữ liệu cho CQNN, cho các cá nhân, tổ chức khác. Khi tất cả CQNN và DN cùng đồng hành, việc thiết lập không gian dữ liệu mở dùng chung giữa các CQNN, các tổ chức, cá nhân trong xã hội sẽ ngày càng được mở rộng và được làm giầu; và sẽ làm cơ sở để thúc đẩy sáng tạo và phát triển kinh tế.
Tài liệu tham khảo:
https://data.gov.vn/en/web/guest/homehttps://nic.org.uk/app/uploads/Data-for-the-Public-Good-NIC-Report.pdf
Nghịđịnhsố47/2020/NĐ-CPvềquảnlý,kếtnốivàchiasẻdữliệusốcủa CQNN
(Bài đăng ấn phẩm in Tạp chí TT&TT số 2 tháng 2/2021)