Báo chí trong cuộc chơi dữ liệu

Truyền thông - Ngày đăng : 09:40, 19/02/2021

Trong bối cảnh ngày càng có nhiều ý kiến cho rằng dữ liệu mới là tài nguyên lớn nhất của thế kỷ 21 thì báo chí cũng không thể đứng ngoài cuộc chơi. Tuy nhiên, thu thập dữ liệu để làm gì thì cũng không phải là câu hỏi dễ trả lời đối với những người làm báo thuần túy, nhất là với báo chí Việt Nam.

Trên thực tế, chủ đề dữ liệu trong báo chí (bao gồm cả Báo chí Dữ liệu - Data Journalism) ở Việt Nam cũng đã được "xới xáo" từ nhiều năm trước. Tuy nhiên, nó chưa nhận được sự quan tâm đúng mực ngay cả khi một vài cơ quan báo chí cho ra mắt cái gọi là Tòa soạn thông minh, với những sản phẩm như Chatbot (VietnamPlus) hay Trợ lý ảo ra lệnh bằng giọng nói (Thanh Niên).

Báo chí trong cuộc chơi dữ liệu - Ảnh 1.

Chỉ đến lúc dịch COVID-19 ập tới khiến nhiều cơ quan báo chí bị sụt giảm nguồn thu nghiêm trọng thì nhiều người mới nhận ra rằng càng chậm chân trong cuộc chơi này thì sẽ càng nhận thêm phần thua thiệt về mình.

“Chủ nghĩa thực dân dữ liệu”

Không phải ngẫu nhiên mà các chuyên gia ví von việc khai phá thị trường dữ liệu hiện nay với việc khám phá các mỏ vàng ở tân thế giới cách đây vài thế kỷ. Bởi làn sóng khai thác tài nguyên ở những vùng đất mới đã mở màn cho sự ra đời của chủ nghĩa thực dân. Và giờ tình thế tương tự cũng đang lặp lại, với cái gọi là “chủ nghĩa thực dân dữ liệu” (data colonialism).

Thuật ngữ trên được đưa ra lần đầu trong cuộc hội thảo trực tuyến do Đại học Stanford tổ chức hồi mùa Hè 2020, giữa Giáo sư Nick Couldry (trường Kinh tế London) và chuyên gia Ulises A. Meija, tác giả của cuốn sách bán chạy “The Cost of Connection” (tạm dịch: Cái giá của kết nối). Trong cuộc trò chuyện này, các tác giả bày tỏ quan ngại về cách thức mà chủ nghĩa thực dân dữ liệu “đào sâu và che lấp cách thức tái tạo bất bình đẳng thông qua xử lý thuật toán tự động”, và điều đó “gây ảnh hưởng ở mọi quốc gia trong những thập kỷ tới.”

Nếu đem điều này áp vào thị trường Việt Nam thì không phải là không có lý, khi mà ngày càng có nhiều tiếng nói cảnh báo về việc dữ liệu của người Việt giờ lại do các công ty đa quốc gia nắm giữ chủ yếu. Nhiều người thoải mái chia sẻ tất thông tin cá nhân, từ số hộ chiếu, tài khoản ngân hàng cho tới nhận dạng khuôn mặt, mống mắt, cho Google, Facebook, Apple hay Grab, nhưng lại ngại ngần nếu như cơ quan quản lý nhà nước tiến hành thu thập dữ liệu phục vụ cho chiến lược chuyển đổi số quốc gia, chẳng hạn như sổ hộ khẩu điện tử. Chúng ta làm gì, đi đâu, sở thích thế nào, tiêu tiền ra sao đều dựa trên hệ sinh thái của các nền tảng xuyên biên giới ấy. Điều đó đồng nghĩa với việc tài nguyên quan trọng nhất của Việt Nam giờ đang nằm trong tay các công ty nước ngoài.

Điều tương tự xảy ra ở lĩnh vực truyền thông. Tại một sự kiện do Bộ Thông tin và Truyền thông tổ chức cuối năm 2019, một công ty công nghệ kiêm agency lớn ở trong nước đã công khai kêu gọi các cơ quan báo chí hợp tác với đơn vị này, thay vì sử dụng nền tảng quảng cáo của Google và Facebook. Nhưng đấy là việc làm khó khăn, bởi giờ các báo đều phải đứng trên vai người khổng lồ. Ngắt kết nối khỏi Google và Facebook cũng đồng nghĩa với việc mất người đọc. Đơn vị nội kia hứa hẹn giá thành quảng cáo tốt hơn, song việc các doanh nghiệp có tin tưởng nền tảng ấy hay không lại là một chuyện khác. Bởi ngân sách quảng cáo của nhiều doanh nghiệp vẫn đổ dồn vào các nền tảng xuyên biên giới, vốn có thế mạnh về tệp dữ liệu người dùng.

Tại hội thảo “Chuyển đổi số và các mô hình kiếm tiền mới cho báo chí” do Bộ Thông tin và Truyền thông tổ chức ở Quảng Ninh tháng 8/2020, ông Lê Quốc Minh, Phó Tổng giám đốc Thông tấn xã Việt Nam đã phát biểu rằng “Google và Facebook cho chúng ta traffic (lưu lượng người đọc), nhưng chúng ta không biết chính xác độc giả của mình là ai.”

Thực ra, những công cụ thống kê dữ liệu miễn phí mà Google cung cấp cho các cơ quan báo chí, cụ thể là Google Analytics cũng cho phép các báo nắm được đặc tính người dùng, như độ tuổi, giới tính, truy cập từ đâu, bằng trình duyệt nào... Nhưng xây dựng chiến lược phát triển cũng như kiếm tiền dựa trên các thông số đó cũng không phải là nhiệm vụ dễ dàng.

Tổng Biên tập của một tờ báo điện tử thuộc hàng tốp đầu từng tâm sự với người viết rằng, cách đây 3-4 năm, riêng doanh thu từ quảng cáo Google (adsense) của đơn vị này đã đạt tới vài ngàn USD mỗi tháng. Song con số ấy cứ giảm dần đều trong những năm gần đây, đến mức “phát nản.” Đó là chưa kể việc phụ thuộc vào quảng cáo dạng programmatic (tự động lập trình dựa trên hành vi người dùng) như vậy dẫn tới nhiều hệ lụy khó lường, khi trang báo tràn ngập những mẩu quảng cáo “rác”. Hệ lụy của việc đứng trên vai người khổng lồ nằm ở chỗ đó.

Một chuyên gia công nghệ tỏ ra bi quan khi tâm sự với người viết rằng, các công ty công nghệ ở Việt Nam khó có thể triển khai các công cụ trí tuệ nhân tạo phục vụ cho báo chí một cách suôn sẻ, không chỉ bởi khoảng cách về trình độ, mà còn bởi chúng ta không có đủ dữ liệu để huấn luyện các con bot. Trong khi đó, các tài liệu mới nhất về mô hình tòa soạn ở Mỹ và Bắc Âu đều cho thấy, tại các cuộc họp giao ban đầu tuần tại những cơ quan báo chí lớn, bên cạnh các phóng viên, biên tập viên, chuyên viên quảng cáo đã xuất hiện nhân vật mới: chuyên viên phân tích dữ liệu.

Muộn còn hơn không

Nhưng chính những lý do kể trên lại càng thúc đẩy nhiều cơ quan báo chí chủ động trong cuộc chơi “thu thập thông tin người dùng”, khái niệm thay cho thuật ngữ nhạy cảm “thu thập dữ liệu”. Các dự án “Tòa soạn thông minh” của nhiều đơn vị báo chí tiên phong ở Việt Nam đều đề cao yếu tố thu thập dữ liệu nhằm phục vụ độc giả một cách tốt hơn.

Cụ thể, từ thông tin của bạn đọc mà tòa soạn thu thập được, các công cụ sử dụng trí tuệ nhân tạo (AI) sẽ tiến hành phân tích đối tượng người dùng, tương tự như cái cách mà Google Analytics vẫn tiến hành. Lợi ích đầu tiên mà các báo có thể xây dựng tệp độc giả trung thành, giúp độc giả cá nhân hóa trang tin.

Báo điện tử được ví như cỗ máy xay khổng lồ, không giới hạn về số lượng tin bài. Một cơ quan báo chí lớn có thể phát tới hơn 200 đơn vị thông tin mỗi ngày. Số lượng tin bài đó không thể hiển thị đầy đủ trên trang chủ. Vì thế, nhờ việc phân tích người dùng, các báo sẽ tiến hành phân loại độc giả, giúp họ cá nhân hóa trang tin theo sở thích, hoặc tuyển chọn thông tin cho độc giả thông qua hình thức Thư tòa soạn (Newsletter) hay Tuyển chọn của Ban biên tập (Editors Picks).

Chẳng hạn, một bạn đọc nam giới trung tuổi, quan tâm đến các vấn đề chính trị - xã hội, công nghệ và thể thao sẽ không bị làm phiền bởi các thông tin liên quan tới làm đẹp, mỹ phẩm và ngược lại. Trên diễn đàn nghiệp vụ báo chí Vietnamjournalism, một người dùng bình luận “Nếu khi nào các tin giải trí không xuất hiện mỗi khi tôi truy cập vào một trang báo bất kỳ, thì có nghĩa là AI đã được sử dụng đúng lúc đúng chỗ.”

Lối thoát cho tương lai

Tuy vậy, nếu chỉ dừng lại ở mức “phục vụ độc giả tốt hơn” thì cuộc chơi dữ liệu sẽ không phải là lối thoát cho báo chí trong giai đoạn khủng hoảng doanh thu. Cái đích lớn nhất của việc thu thập dữ liệu chính là quảng cáo trúng đích, hay nói chung nhất là kinh doanh dữ liệu.

Ngay từ năm 2018, ấn bản “Sáng tạo báo chí” do Mạng lưới truyền thông quốc tế FIPP phát hành (TTXVN mua bản quyền và dịch sang tiếng Việt) đã nói đến mô hình môi giới dữ liệu (data broker). Đến ấn bản 2021, các tác giả đã nói rõ hơn về mô hình này: “Đây là nơi là dữ liệu chính chủ đóng vai trò rất quan trọng. Thay vì tốn kém chi phí để phát triển các chiến lược nhằm lập ra các vị trí quảng cáo hoàn toàn mới, các cơ quan báo chí có thể tận dụng những gì họ đang có - dữ liệu hành vi, khách hàng đăng ký dài hạn và dữ liệu xã hội đa dạng, vốn hầu hết đang bị bỏ xót rất lãng phí. Khi được sử dụng phù hợp, dữ liệu chính chủ này có thể giúp cơ quan báo chí tăng doanh thu trực tiếp và gián tiếp. Nó giúp họ không phải làm việc vất vả nữa mà làm việc thông minh hơn.”

Chuyên gia Prescott Shibles, Phó Chủ tịch cao cấp phụ trách dữ liệu của công ty Quảng cáo Randall-Reilly phát biểu tại diễn đàn Connectiv Executive Summit rằng “dữ liệu nhắm trúng đích sẽ sớm có giá trị hơn vị trí quảng cáo.” Lấy ví dụ, nếu một hãng sữa tung ra sản phẩm nước uống làm đẹp da cho phụ nữ, họ sẽ hài lòng nếu sản phẩm đó được tiếp thị đến đúng đối tượng là quý bà trung tuổi hơn là mẫu quảng cáo xuất hiện giữa hai hiệp của một trận bóng đá. Nên nếu các cơ quan báo chí phân lập được từng tệp đối tượng khách hàng, họ sẽ có thể lên kế hoạch truyền thông trúng đích cho hãng sữa kể trên. Và đương nhiên, trước khi làm được điều đó thì họ phải thu thập được thông tin của bạn đọc và tiến hành phân tích dữ liệu dựa trên các công cụ sử dụng AI.

Một ví dụ khác, tại Hội nghị Báo chí châu Á 2016, nhiều người tỏ ra bỡ ngỡ khi nghe Tổng Biên tập tờ Nhật báo Quảng Châu (Trung Quốc) nói về mô hình kinh doanh bán thông tin của bạn đọc cho các công ty bán hàng trực tuyến. Đến giờ, khi thương mại điện tử ngày càng phát triển mạnh mẽ, nhiều người mới nhận thấy dường như toán tự động”, và điều đó “gây ảnh hưởng ở mọi quốc gia trong những thập kỷ tới.”

Nhưng muộn còn hơn không. Với báo chí Việt Nam, không còn đường lùi nữa rồi.

(Bài đăng ấn phẩm in Tạp chí TT&TT số 1 tháng 1/2021)

Nguyễn Hoàng Nhật