Báo chí trong cuộc chơi dữ liệu

Truyền thông - Ngày đăng : 09:40, 19/02/2021

Trong bối cảnh ngày càng có nhiều ý kiến cho rằng dữ liệu mới là tài nguyên lớn nhất của thế kỷ 21 thì báo chí cũng không thể đứng ngoài cuộc chơi. Tuy nhiên, thu thập dữ liệu để làm gì thì cũng không phải là câu hỏi dễ trả lời đối với những người làm báo thuần túy, nhất là với báo chí Việt Nam.

Trên thực tế, chủ đề dữ liệu trong báo chí (bao gồm cả Báo chí Dữ liệu - Data Journalism) ở Việt Nam cũng đã được "xới xáo" từ nhiều năm trước. Tuy nhiên, nó chưa nhận được sự quan tâm đúng mực ngay cả khi một vài cơ quan báo chí cho ra mắt cái gọi là Tòa soạn thông minh, với những sản phẩm như Chatbot (VietnamPlus) hay Trợ lý ảo ra lệnh bằng giọng nói (Thanh Niên).

Báo chí trong cuộc chơi dữ liệu - Ảnh 1.

Chỉ đến lúc dịch COVID-19 ập tới khiến nhiều cơ quan báo chí bị sụt giảm nguồn thu nghiêm trọng thì nhiều người mới nhận ra rằng càng chậm chân trong cuộc chơi này thì sẽ càng nhận thêm phần thua thiệt về mình.

“Chủ nghĩa thực dân dữ liệu”

Không phải ngẫu nhiên mà các chuyên gia ví von việc khai phá thị trường dữ liệu hiện nay với việc khám phá các mỏ vàng ở tân thế giới cách đây vài thế kỷ. Bởi làn sóng khai thác tài nguyên ở những vùng đất mới đã mở màn cho sự ra đời của chủ nghĩa thực dân. Và giờ tình thế tương tự cũng đang lặp lại, với cái gọi là “chủ nghĩa thực dân dữ liệu” (data colonialism). 

Thuật ngữ trên được đưa ra lần đầu trong cuộc hội thảo trực tuyến do Đại học Stanford tổ chức hồi mùa Hè 2020, giữa Giáo sư Nick Couldry (trường Kinh tế London) và chuyên gia Ulises A. Meija, tác giả của cuốn sách bán chạy “The Cost of Connection” (tạm dịch: Cái giá của kết nối). Trong cuộc trò chuyện này, các tác giả bày tỏ quan ngại về cách thức mà chủ nghĩa thực dân dữ liệu “đào sâu và che lấp cách thức tái tạo bất bình đẳng thông qua xử lý thuật toán tự động”, và điều đó “gây ảnh hưởng ở mọi quốc gia trong những thập kỷ tới.”

Nếu đem điều này áp vào thị trường Việt Nam thì không phải là không có lý, khi mà ngày càng có nhiều tiếng nói cảnh báo về việc dữ liệu của người Việt giờ lại do các công ty đa quốc gia nắm giữ chủ yếu. Nhiều người thoải mái chia sẻ tất thông tin cá nhân, từ số hộ chiếu, tài khoản ngân hàng cho tới nhận dạng khuôn mặt, mống mắt, cho Google, Facebook, Apple hay Grab, nhưng lại ngại ngần nếu như cơ quan quản lý nhà nước tiến hành thu thập dữ liệu phục vụ cho chiến lược chuyển đổi số quốc gia, chẳng hạn như sổ hộ khẩu điện tử. Chúng ta làm gì, đi đâu, sở thích thế nào, tiêu tiền ra sao đều dựa trên hệ sinh thái của các nền tảng xuyên biên giới ấy. Điều đó đồng nghĩa với việc tài nguyên quan trọng nhất của Việt Nam giờ đang nằm trong tay các công ty nước ngoài.

Điều tương tự xảy ra ở lĩnh vực truyền thông. Tại một sự kiện do Bộ Thông tin và Truyền thông tổ chức cuối năm 2019, một công ty công nghệ kiêm agency lớn ở trong nước đã công khai kêu gọi các cơ quan báo chí hợp tác với đơn vị này, thay vì sử dụng nền tảng quảng cáo của Google và Facebook. Nhưng đấy là việc làm khó khăn, bởi giờ các báo đều phải đứng trên vai người khổng lồ. Ngắt kết nối khỏi Google và Facebook cũng đồng nghĩa với việc mất người đọc. Đơn vị nội kia hứa hẹn giá thành quảng cáo tốt hơn, song việc các doanh nghiệp có tin tưởng nền tảng ấy hay không lại là một chuyện khác. Bởi ngân sách quảng cáo của nhiều doanh nghiệp vẫn đổ dồn vào các nền tảng xuyên biên giới, vốn có thế mạnh về tệp dữ liệu người dùng.

Tại hội thảo “Chuyển đổi số và các mô hình kiếm tiền mới cho báo chí” do Bộ Thông tin và Truyền thông tổ chức ở Quảng Ninh tháng 8/2020, ông Lê Quốc Minh, Phó Tổng giám đốc Thông tấn xã Việt Nam đã phát biểu rằng “Google và Facebook cho chúng ta traffic (lưu lượng người đọc), nhưng chúng ta không biết chính xác độc giả của mình là ai.”

Thực ra, những công cụ thống kê dữ liệu miễn phí mà Google cung cấp cho các cơ quan báo chí, cụ thể là Google Analytics cũng cho phép các báo nắm được đặc tính người dùng, như độ tuổi, giới tính, truy cập từ đâu, bằng trình duyệt nào... Nhưng xây dựng chiến lược phát triển cũng như kiếm tiền dựa trên các thông số đó cũng không phải là nhiệm vụ dễ dàng.

Tổng Biên tập của một tờ báo điện tử thuộc hàng tốp đầu từng tâm sự với người viết rằng, cách đây 3-4 năm, riêng doanh thu từ quảng cáo Google (adsense) của đơn vị này đã đạt tới vài ngàn USD mỗi tháng. Song con số ấy cứ giảm dần đều trong những năm gần đây, đến mức “phát nản.” Đó là chưa kể việc phụ thuộc vào quảng cáo dạng programmatic (tự động lập trình dựa trên hành vi người dùng) như vậy dẫn tới nhiều hệ lụy khó lường, khi trang báo tràn ngập những mẩu quảng cáo “rác”. Hệ lụy của việc đứng trên vai người khổng lồ nằm ở chỗ đó.

Một chuyên gia công nghệ tỏ ra bi quan khi tâm sự với người viết rằng, các công ty công nghệ ở Việt Nam khó có thể triển khai các công cụ trí tuệ nhân tạo phục vụ cho báo chí một cách suôn sẻ, không chỉ bởi khoảng cách về trình độ, mà còn bởi chúng ta không có đủ dữ liệu để huấn luyện các con bot. Trong khi đó, các tài liệu mới nhất về mô hình tòa soạn ở Mỹ và Bắc Âu đều cho thấy, tại các cuộc họp giao ban đầu tuần tại những cơ quan báo chí lớn, bên cạnh các phóng viên, biên tập viên, chuyên viên quảng cáo đã xuất hiện nhân vật mới: chuyên viên phân tích dữ liệu. 

Muộn còn hơn không

Nhưng chính những lý do kể trên lại càng thúc đẩy nhiều cơ quan báo chí chủ động trong cuộc chơi “thu thập thông tin người dùng”, khái niệm thay cho thuật ngữ nhạy cảm “thu thập dữ liệu”. Các dự án “Tòa soạn thông minh” của nhiều đơn vị báo chí tiên phong ở Việt Nam đều đề cao yếu tố thu thập dữ liệu nhằm phục vụ độc giả một cách tốt hơn.

Cụ thể, từ thông tin của bạn đọc mà tòa soạn thu thập được, các công cụ sử dụng trí tuệ nhân tạo (AI) sẽ tiến hành phân tích đối tượng người dùng, tương tự như cái cách mà Google Analytics vẫn tiến hành. Lợi ích đầu tiên mà các báo có thể xây dựng tệp độc giả trung thành, giúp độc giả cá nhân hóa trang tin.

Báo điện tử được ví như cỗ máy xay khổng lồ, không giới hạn về số lượng tin bài. Một cơ quan báo chí lớn có thể phát tới hơn 200 đơn vị thông tin mỗi ngày. Số lượng tin bài đó không thể hiển thị đầy đủ trên trang chủ. Vì thế, nhờ việc phân tích người dùng, các báo sẽ tiến hành phân loại độc giả, giúp họ cá nhân hóa trang tin theo sở thích, hoặc tuyển chọn thông tin cho độc giả thông qua hình thức Thư tòa soạn (Newsletter) hay Tuyển chọn của Ban biên tập (Editors Picks).

Chẳng hạn, một bạn đọc nam giới trung tuổi, quan tâm đến các vấn đề chính trị - xã hội, công nghệ và thể thao sẽ không bị làm phiền bởi các thông tin liên quan tới làm đẹp, mỹ phẩm và ngược lại. Trên diễn đàn nghiệp vụ báo chí Vietnamjournalism, một người dùng bình luận “Nếu khi nào các tin giải trí không xuất hiện mỗi khi tôi truy cập vào một trang báo bất kỳ, thì có nghĩa là AI đã được sử dụng đúng lúc đúng chỗ.”

Lối thoát cho tương lai

Tuy vậy, nếu chỉ dừng lại ở mức “phục vụ độc giả tốt hơn” thì cuộc chơi dữ liệu sẽ không phải là lối thoát cho báo chí trong giai đoạn khủng hoảng doanh thu. Cái đích lớn nhất của việc thu thập dữ liệu chính là quảng cáo trúng đích, hay nói chung nhất là kinh doanh dữ liệu.

Ngay từ năm 2018, ấn bản “Sáng tạo báo chí” do Mạng lưới truyền thông quốc tế FIPP phát hành (TTXVN mua bản quyền và dịch sang tiếng Việt) đã nói đến mô hình môi giới dữ liệu (data broker). Đến ấn bản 2021, các tác giả đã nói rõ hơn về mô hình này: “Đây là nơi là dữ liệu chính chủ đóng vai trò rất quan trọng. Thay vì tốn kém chi phí để phát triển các chiến lược nhằm lập ra các vị trí quảng cáo hoàn toàn mới, các cơ quan báo chí có thể tận dụng những gì họ đang có - dữ liệu hành vi, khách hàng đăng ký dài hạn và dữ liệu xã hội đa dạng, vốn hầu hết đang bị bỏ xót rất lãng phí. Khi được sử dụng phù hợp, dữ liệu chính chủ này có thể giúp cơ quan báo chí tăng doanh thu trực tiếp và gián tiếp. Nó giúp họ không phải làm việc vất vả nữa mà làm việc thông minh hơn.” 

Chuyên gia Prescott Shibles, Phó Chủ tịch cao cấp phụ trách dữ liệu của công ty Quảng cáo Randall-Reilly phát biểu tại diễn đàn Connectiv Executive Summit rằng “dữ liệu nhắm trúng đích sẽ sớm có giá trị hơn vị trí quảng cáo.” Lấy ví dụ, nếu một hãng sữa tung ra sản phẩm nước uống làm đẹp da cho phụ nữ, họ sẽ hài lòng nếu sản phẩm đó được tiếp thị đến đúng đối tượng là quý bà trung tuổi hơn là mẫu quảng cáo xuất hiện giữa hai hiệp của một trận bóng đá. Nên nếu các cơ quan báo chí phân lập được từng tệp đối tượng khách hàng, họ sẽ có thể lên kế hoạch truyền thông trúng đích cho hãng sữa kể trên. Và đương nhiên, trước khi làm được điều đó thì họ phải thu thập được thông tin của bạn đọc và tiến hành phân tích dữ liệu dựa trên các công cụ sử dụng AI. 

Một ví dụ khác, tại Hội nghị Báo chí châu Á 2016, nhiều người tỏ ra bỡ ngỡ khi nghe Tổng Biên tập tờ Nhật báo Quảng Châu (Trung Quốc) nói về mô hình kinh doanh bán thông tin của bạn đọc cho các công ty bán hàng trực tuyến. Đến giờ, khi thương mại điện tử ngày càng phát triển mạnh mẽ, nhiều người mới nhận  thấy dường như toán tự động”, và điều đó “gây ảnh hưởng ở mọi quốc gia trong những thập kỷ tới.”

Nhưng muộn còn hơn không. Với báo chí Việt Nam, không còn đường lùi nữa rồi.

(Bài đăng ấn phẩm in Tạp chí TT&TT số 1 tháng 1/2021)

Nguyễn Hoàng Nhật