Mở "dữ liệu chính phủ" - Kinh nghiệm từ Vương quốc Anh

10:15 PM 03/11/2018 In bài viết

Ông cho biết đã ở Việt Nam 4 ngày, tại Hà Nội và TP. Hồ Chí Minh, và đã có cơ hội tìm hiểu Chính phủ Việt Nam vận hành như thế nào. Với tư cách trưởng bộ phận chính sách dữ liệu tại Vương quốc Anh, ông Thom Townsend thực hiện 2 nhiệm vụ chính là nghiên cứu giám sát việc: Chính phủ chia sẻ dữ liệu như thế nào một cách hiệu quả, và dữ liệu sau khi được công bố rộng rãi được tận dụng như thế nào để mang lại hiệu quả xã hội cũng như kinh tế. 

Về cơ sở pháp lý về chia sẻ dữ liệu của Anh Quốc

Ông Thom Townsend cho biết, Vương quốc Anh có sách tập hợp nhiều luật và đạo luật khác nhau, chúng được xây dựng, ban hành từ rất lâu đời và khá phức tạp, gồm các chính sách quy định Chính phủ có quyền chia sẻ dữ liệu như thế nào. Bên cạnh danh sách dài bao gồm nhiều quy định luật pháp, Anh quốc còn có luật chung tập hợp rất nhiều án lệ được xây dựng qua 150 năm trở lại đây, là định hướng trong khuôn khổ pháp lý tại Anh quốc. Lý do ông Thom Townsend chia sẻ 2 luật này để có thể thấy tính rắc rối và phức tạp của vấn đề khiến các cơ quan Chính phủ không chắc chắn về việc chia sẻ dữ liệu của chính phủ, họ không hiểu và không biết mình có quyền hay không.

Đơn giản hóa các quy định về chia sẻ dữ liệu

Trong công việc của mình, ông Thom Townsend cho biết, ông có khoảng thời gian dài làm việc với các cơ quan của chính phủ nhưng luôn nhận được câu trả lời "không" khi hỏi họ có thể chia sẻ các dữ liệu. Sau đó, ông đã phải chỉ ra các điều luật này và cho họ biết họ phải chia sẻ, chỉ là họ chưa hiểu và chưa đọc luật mà thôi. Trên thực tế, cũng có thể do một phần vì họ chưa hiểu thật, phần khác họ lấy lý do để từ chối mà thôi. Nhiều khi họ lợi dụng việc không hiểu và diễn giải sai luật để không chia sẻ dữ liệu. Đó là lý do vì sao ông Thom Townsend chia sẻ kinh nghiệm chúng ta càng đơn giản hóa càng tốt.

Nước Anh vừa có luật mới gọi là bản Quy định chung về bảo vệ dữ liệu. Cụ thể, luật này điều chỉnh các thông tin cá nhân, định nghĩa thông tin cá nhân là gì, đó là thông tin mang tính chất định danh một người nào đó và luật này áp dụng cho cả cơ quan Chính phủ lẫn khu vực tư nhân.

Nội dung luật này đề cập 6 điểm, lý do, cơ sở cho phép chúng ta chia sẻ dữ liệu. Và trong đó nguyên tắc số 1 quan trọng nhất là đồng thuận, cá nhân đó bày tỏ đồng thuận rõ ràng, không có điểm mờ ám cho phép chúng ta quyền xử lý dữ liệu của họ, xử lý dữ liệu cá nhân vì một mục đích rõ ràng, cụ thể. Khung quy định chung về bảo vệ dữ liệu ra đời ước tính có khoảng 50—60 quy định khác nhau cho phép chia sẻ dữ liệu nhưng khi luật này ra đời thì tổng hợp lại chỉ có 1 mà thôi. Như vậy bài học là đơn giản hóa tất cả quy định về chia sẻ dữ liệu. Nhưng đã đơn giản hóa rồi mà vẫn có thách thức về mặt kỹ thuật. Về phía Anh có 2 vấn đề kỹ thuật là chất lượng và tiếp cận dữ liệu. Ông Thom Townsend cho biết trong tuần qua ông đã có cơ hội tiếp cận với nhiều cơ quan Việt Nam và có vẻ 2 điều này cũng là hai thách thức của nước ta..

Lấy ví dụ Scotland trong cơ sở dữ liệu chỉ có 10 phiên bản, nhưng lại có thêm tới 50-60 phiên bản khác nhau. Đó là lý do vì sao sự sai lệch thông tin thế này, chất lượng thông tin kém nên cần phải phải đăng ký một kho thông tin chung và các cơ quan phải truy cập vào kho thông tin này. Chúng ta có nhiều dòng thông tin và chúng phải được tổng hợp vào một kho duy nhất. Ví dụ đầu tiên là bảng thông tin đầu vào của một doanh nghiệp thì một phần của bảng đó được cung cấp bởi các cơ quan quản lý của Anh quốc. Bởi vì lấy ví dụ doanh nghiệp (DN) thực phẩm đồ ăn nhanh thì bên cạnh đơn vị quản lý thông tin DN này thì còn có đơn vị khác cung cấp thông tin và Cơ quan tiêu chuẩn thực phẩm cho biết họ có bằng, giấy phép kinh doanh chưa, đã bị khiếu nại về vệ sinh an toàn thực phẩm chưa... Tương tự, các cơ quan khác có thông tin về DN sẽ bổ sung vào khối thông tin chung như trên. Như vậy, theo dự kiến kế hoạch từ chính phủ có nghĩa là bảng thông tin phía trên do một cơ quan Chính phủ duy nhất quản lý. Điều đó có nghĩa là trong hệ thống có sự liên kết, cơ quan quản lý chia sẻ thông tin với các cơ quan khác và cơ quan nào có liên quan phải chịu trách nhiệm về tính chính xác của thông tin mình nộp.

"Chúng ta phải tiếp cận thông qua API nhưng tôi tải về thông qua bảng tính để chúng ta dễ theo dõi. Bảng thông tin này rất đơn giản, cột 1 có mã định danh, cột 2 đến 5 là mã của đất nước đó, tên thường gọi, và tên chính thức quốc gia, quốc tịch của quốc gia đó, và cột cuối cùng là thời điểm bắt đầu và kết thúc của quốc gia đó. Quay trở lại ví dụ tôi đề cập ở trên, mỗi cái tên Scotland mà viết thành nhiều kiểu như vậy", ông Thom Townsend chia sẻ. Đó cũng là một trong các giải pháp mà nước Anh đã ứng dụng để giải quyết chất lượng dữ liệu.

Ông Thom Townsend - Trưởng bộ phận Chính sách dữ liệu - Vương quốc Anh

Giải pháp dải thông tin

Mục đích của Anh quốc là làm sao quy tụ dữ liệu vào một cơ quan duy nhất là đầu mối, thay vì nhiều đầu mối như trước đây. Vậy nên điểm quan trọng là không chỉ đơn thuần suy nghĩ xem dữ liệu nào mở, đóng mà phải suy nghĩ về cả dải dữ liệu. Chẳng hạn vấn đề biển số xe và vấn đề bảo mật riêng tư. Vậy để trả lời cho băn khoăn đó không chỉ nói xem nên công bố mở hay đóng mà phải xem với dữ liệu đó người muốn tiếp cận phải có bằng cấp hay giấy tờ như thế nào, và dữ liệu đó thuộc loại giấy phép nào. Ở Anh quốc, vấn đề đặt ra là công bố càng nhiều dữ liệu càng tốt, ước tính hiện tại đã công bố 45.000 tập dữ liệu, tuy nhiên với con số đó thì không phải tất cả đều hữu ích mà chỉ có số nhỏ thôi. Vậy nên sự thay đổi mà ông Thom Townsend mong thực hiện ở Anh là thay đổi tư duy, có nghĩa là khi chúng ta bắt đầu đối thoại thì không phải bắt đầu với câu hỏi mà là chúng ta công bố dữ liệu như thế nào, nhằm đạt kết quả gì? Và sau khi đã cùng nhau ngồi lại biết kết quả cuối cùng mong muốn là gì, thì với dải dữ liệu đó chúng ta muốn nó nằm ở mức độ nào.

Cách chia sẻ dữ liệu mở

Ông Thom Townsend cho biết: Sự thay đổi thứ 2 mà họ đang chứng kiến là cách chia sẻ dữ liệu mở. Năm 2011 việc trình bày dữ liệu nhiều cách khác nhau, có vẻ như một cửa hàng thông tin trực tuyến. Song, hiện tại họ đã cải cách sửa đổi theo hướng là người sử dụng cần thông tin gì sẽ có ngay thông tin phù hợp. Đây là phương trình quan trọng cần được suy  tính thấu đáo. Bản thân dữ liệu không có giá trị gì cả, khi nào có dữ liệu cộng với sự tham gia mới tạo ra giá trị. Ở Anh  quốc thời gian qua chỉ tập trung nhiều vào dữ liệu và đến thời điểm hiện tại cần nói nhiều hơn đến phần 2 của chương trình là sự tham gia.

Làm thế nào chúng ta thương mại hóa và kiếm tiền từ dữ liệu. Cụ thể là vấn đề dữ liệu giao thông vận tải. Ông Thom Townsend cho biết London có lợi thế là hệ thống cơ sở dữ liệu giao thông vận tải chi tiết nhất thế giới và đều được công bố miễn phí. Có một nghiên cứu được tiến hành đã tiết lộ: giá trị mà tất cả dữ liệu GTVT tạo ra 167 triệu Bảng (khoảng 300 triệu USD). Và một trong những doanh nghiệp nhờ hưởng giá trị đó mà thành công là Citymaple. Có điểm thú vị là họ không kiếm được quá nhiều tiền nhưng định giá doanh nghiệp của họ là 1 tỷ USD. Vậy nên hiện tại với dữ liệu có trong tay họ đang cố gắng xây dựng mô hình kinh doanh và mô hình doanh thu. Và một trong những mô hình kinh doanh họ tạo ra khá thú vị là mô hình tuyến xe buýt thông minh. Ban đầu họ chỉ có ứng dụng thông tin rất đơn giản và tiền họ kiếm được không nhiều. Nhưng với người dùng ứng dụng họ tìm hiểu người dùng đang ở đâu trong thành phố và họ muốn đi đến địa điểm nào. Với dữ liệu họ có từ ứng dụng của mình và dữ liệu trực tiếp từ chính phủ về hệ thống giao thông họ tạo ra tuyến xe buýt linh động theo nhu cầu người sử dụng, tức là nó ko đi đúng một tuyến mà ở đâu có người là nó đến đó. Do vậy, họ đã gặp các cơ quan chính phủ và đề xuất: Thay vì đặt tuyến cố định tại sao không sử dụng dữ liệu có trong tay để biến tuyến xe buýt thay đổi theo ngày, theo năm để đáp ứng nhu cầu người dùng.

Với dữ liệu mà chính phủ tạo ra và họ được sử dụng miễn phí giờ họ xây dựng mô hình kinh doanh và đưa lại chính ý tưởng đó cho chính phủ cải thiện mô hình xe buýt của mình.

Về vấn đề đặt ra là dữ liệu có nên tính phí hay không? Đây là vấn đề mà chính phủ Anh đang băn khoăn. Hệ thống dữ liệu không gian địa lý của Anh thuộc loại tốt nhất thế giới với nhiều công cụ thu thập khác nhau: dữ liệu vệ tinh, hình ảnh chụp từ máy bay trên cao… Hàng năm để thu thập được các dữ liệu như vậy Anh tốn khoảng 350 triệu bảng và bán dữ liệu đó. Tuy nhiên, rất nhiều DN nhỏ và vừa và DN khởi nghiệp muốn được tiếp cận và sử dụng thông tin này miễn phí. Vậy chính phủ có tranh cãi thảo luận liệu chúng ta có nên cung cấp thông tin dữ liệu này miễn phí không và nếu miễn phí thì việc sử dụng thông tin ở đâu sẽ đánh thuế. Ông Thom Townsend cho biết: "từ đó chúng tôi tiến hành dự án với thời hạn 3 năm về vấn đề dữ liệu không gian địa lý và tính phí này. Sau 3 năm, dự án nghiên cứu phương thức tính phí của dữ liệu và tạm thời chúng tôi tính theo mô hình, DN nào nhỏ thì miễn phí, còn DN nào lớn vẫn tính phí".

 

Thanh Nhàn