Kinh nghiệm triển khai kho dữ liệu mở của chính phủ Hàn Quốc
Kho dữ liệu mở của chính phủ Hàn Quốc tạo điều kiện cho mọi người dân và doanh nghiệp có thể truy cập dữ liệu, ứng dụng đào tạo AI, thúc đẩy các ý tưởng đổi mới sáng tạo về ứng dụng AI trong khu vực tư nhân.
Đẩy mạnh ranh giới dữ liệu mở
Trong nhiều năm qua, Hàn Quốc liên tục đứng đầu bảng xếp hạng thế giới về Chỉ số dữ liệu mở, hữu ích và có thể tái sử dụng (Open, Useful, and Re-usable data (OURdata) Index).
Chính phủ Hàn Quốc đã và đang đẩy mạnh ranh giới về những gì có thể làm với dữ liệu mở, giúp các doanh nghiệp (DN) và người dùng dễ dàng khai thác dữ liệu chính phủ mở, cung cấp năng lượng cho các ứng dụng và dịch vụ của họ.
Theo Giám đốc Cơ quan Xã hội thông tin quốc gia Hàn Quốc (NIA), ông Dongyub Baek, hiện nay các cơ quan khu vực công ngày càng quan tâm đến việc khai thác nguồn dữ liệu như vậy để đào tạo các mô hình AI, mặc dù tất cả vẫn còn ở giai đoạn đầu.
Ông Baek làm việc tại bộ phận dữ liệu mở của NIA, nơi xử lý các chính sách, cơ sở hạ tầng như Cổng dữ liệu mở quốc gia cũng như đánh giá tác động của các sáng kiến của chính phủ.
Cổng dữ liệu mở quốc gia Hàn Quốc được thành lập vào năm 2013 như một trung tâm một cửa để công dân truy cập các tập dữ liệu công khai. Những tập dữ liệu này được lưu ở nhiều định dạng khác nhau, tạo điều kiện cho việc truy cập và tải dễ dàng.
Tính đến năm nay, đã có 87.000 tập dữ liệu công khai có sẵn trên cổng thông tin, ông Baek cho biết tại Hội nghị quốc tế về dữ liệu và quản trị số do Bộ phận kinh tế và xã hội của Liên hợp quốc (UN DESA) tổ chức vào ngày 19 - 21/10 vừa qua.
Xây dựng năng lực của khu vực tư nhân
Hàn Quốc đã nhấn mạnh về chương trình nghị sự của chính phủ trong việc cung cấp dữ liệu mở để kích thích sự đổi mới của khu vực tư nhân. Theo ông Dongyub Baek, dữ liệu mở phục vụ mục đích hỗ trợ các đổi mới nhằm hiện thực hóa mục tiêu phát triển bền vững của Hàn Quốc.
“Để xây dựng năng lực của khu vực tư nhân nhằm tận dụng dữ liệu mở cho đổi mới AI, chính phủ đã khởi xướng sáng kiến đào tạo AI thông qua AI Hub”, ông cho biết.
Các đơn vị tư nhân, như TTCare, ứng dụng di động phân tích các triệu chứng bệnh về mắt và da ở vật nuôi, có thể khai thác AI Hub - một nền tảng tích hợp do chính phủ Hàn Quốc thiết lập để hỗ trợ cơ sở hạ tầng AI của quốc gia - để truy cập dữ liệu đào tạo, tài nguyên điện toán đám mây để phát triển các dịch vụ AI.
Theo The Korea Herald, kinh nghiệm sử dụng dữ liệu mở để đào tạo AI của Hàn Quốc có từ năm 2021, khi dữ liệu được sử dụng có chọn lọc trong 8 lĩnh vực chính, trong đó có chăm sóc sức khỏe và xe tự hành. Chính phủ Hàn Quốc cũng thường xuyên tổ chức các diễn đàn để thu hút các chuyên gia, người dùng thảo luận về các vấn đề liên quan đến dữ liệu mở.
TTCare là một trường hợp điển hình. Theo tờ báo Hàn Quốc Donga, mô hình AI ứng dụng trong TTCare đã được đào tạo trên khoảng 1 triệu dữ liệu - trong đó, một nửa dữ liệu đến từ AI Hub do chính phủ điều hành và phần còn lại do chính công ty thu thập.
Tổng giám đốc điều hành TTCare Heo Eun-ah đã nhấn mạnh tầm quan trọng của nguồn dữ liệu đào tạo AI do chính phủ điều hành trong việc cải thiện khả năng chẩn đoán các triệu chứng bệnh của TTCare. Dữ liệu đào tạo của công ty hiện có thể truy cập thông qua AI Hub và bất kỳ công dân Hàn Quốc nào cũng có thể tải xuống hoặc sử dụng.
Tạo dữ liệu tổng hợp
Theo kinh nghiệm được ông Beak đưa ra, một số cơ quan khu vực công đang sử dụng AI để tạo dữ liệu tổng hợp - loại dữ liệu được AI tạo ra, tổng hợp từ dữ liệu thực tế trong khi vẫn bảo vệ quyền riêng tư dữ liệu.
"Dữ liệu tổng hợp có thể bảo vệ quyền riêng tư trong khi vẫn duy trì các đặc điểm thống kê của nhóm dân số được nghiên cứu, điều đó có thể nâng cao giá trị của dữ liệu chính phủ mở", ông Baek giải thích.
Đầu năm nay, Seoul đã trở thành chính quyền địa phương đầu tiên ở Hàn Quốc cung cấp dữ liệu tổng hợp về lối sống điển hình của công dân Seoul, phân tích các mô hình tiêu dùng và điều kiện tài chính của 7,4 triệu công dân.
Trang web chính thức của thành phố Seoul đưa tin: "Chính quyền địa phương giải thích rằng dữ liệu tổng hợp mới chỉ có thể được sử dụng cho một số mục đích nhất định với quyền truy cập hạn chế, cho phép nghiên cứu chính sách và ứng dụng rộng hơn".
“Dữ liệu tổng hợp sẽ bổ sung cho số liệu thống kê trong các mục khảo sát nhạy cảm như Khảo sát về tài chính và phúc lợi hộ gia đình của Cục Thống kê Hàn Quốc, hỗ trợ phân tích chính xác các điều kiện tài chính”.
Vào tháng 5, chính phủ cũng đã công bố các biện pháp bảo vệ đối với việc tạo dữ liệu tổng hợp. Theo đó, hàng năm chính phủ sẽ phát hành năm loại mô hình tham chiếu nhằm giúp các nhà nghiên cứu và các công ty tạo và sử dụng dữ liệu tổng hợp để phát triển AI và máy học.
Đảm bảo dữ liệu hữu ích, đáp ứng nhu cầu của người dùng và DN
Hầu hết dữ liệu mở có xu hướng ở dạng tập dữ liệu có cấu trúc - đó là các con số xếp theo hàng và cột - đây được xem là định dạng dữ liệu kém thân thiện nhất với người dùng. Nhưng hiện nay, chính phủ cũng đang quan tâm đến việc khai thác dữ liệu phi cấu trúc như hình ảnh và âm thanh.
Ông Beak cho biết nếu chỉ đơn thuần là mở dữ liệu, thì dữ liệu có thể chưa chắc sẽ hữu ích với mọi người. “Vấn đề là phát hành dữ liệu sao cho đáp ứng nhu cầu thực sự của người dùng và nâng cao chất lượng dữ liệu”, ông giải thích.
Vì thế, để giải quyết vấn đề về chất lượng dữ liệu, NIA đã triển khai một dịch vụ chẩn đoán trên cổng thông tin, cung cấp xếp hạng về khả năng sử dụng dữ liệu để giúp các cơ quan khu vực công đánh giá dữ liệu của họ trước khi tải lên.
“Việc đánh giá dữ liệu sẽ dựa trên năm tiêu chí, cụ thể là khả năng hiểu, dễ xử lý, khả năng liên kết, tuân thủ và tầm quan trọng. Với các tiêu chí này, các cơ quan có thể kiểm tra dữ liệu của họ hữu ích như thế nào”, ông giải thích.
Hợp tác chủ động trong dữ liệu mở
Chia sẻ về tầm quan trọng của việc giao tiếp chủ động với khu vực tư nhân và công dân - những người sử dụng dữ liệu, ông Beak cho biết để tạo điều kiện thuận lợi cho việc giao tiếp, chính phủ Hàn Quốc đã thành lập một hội đồng chiến lược dữ liệu mở, do Thủ tướng Han Duck-Soo và các chuyên gia dữ liệu khu vực tư nhân đồng chủ trì, để thảo luận, phối hợp, giám sát và đánh giá các chính sách và việc thực hiện dữ liệu mở của chính phủ.
Một nửa số thành viên của hội đồng đến từ khu vực tư nhân, bao gồm các công ty đã thành lập và khởi nghiệp.
Đối với các chính phủ đang tìm cách khởi động các sáng kiến dữ liệu mở, ông Beak nhấn mạnh tầm quan trọng của một khuôn khổ pháp lý mạnh mẽ để hướng dẫn các cơ quan thực hiện các chính sách dữ liệu mở.
“Giống như nhiều quốc gia khác, chúng tôi đã ban hành một số luật quan trọng, bao gồm Luật thông tin (Information Law), Luật dữ liệu mở (Open Data law) năm 2013 và cuối cùng là Luật quản lý dữ liệu (The Data-driven Administration Law) được ban hành gần đây vào năm 2020”, ông Baek lưu ý.
Chính phủ Hàn Quốc hiện cũng đang hỗ trợ Bộ Công nghệ và Truyền thông (MIC) của Lào về dữ liệu mở và Văn phòng Thống kê Quốc gia (NSO) của Mông Cổ về xây dựng năng lực và quản lý chất lượng dữ liệu. Ngoài ra, Hàn Quốc cũng tăng cường hợp tác quốc tế xung quanh nền kinh tế dữ liệu - quan hệ đối tác gần đây nhất diễn ra cách đây vài ngày với Liên minh Châu Âu (EU) để thúc đẩy hợp tác về quản trị dữ liệu toàn cầu và thương mại./.