Phát triển AI trong lĩnh vực báo chí

Hợp Trương, Trương Ngọc Huyền| 18/06/2019 16:15
Theo dõi ICTVietnam trên

Nicholas Diakopoulos là trợ lý giáo sư nghiên cứu truyền thông tại Đại học Northwestern. Mới đây, ông đã công bố một nghiên cứu về báo chí được tăng cường sức mạnh của trí tuệ nhân tạo và tự động hóa.

Cũng như cách các robot đã biến đổi toàn bộ các nền kinh tế sản xuất, trí tuệ nhân tạo và tự động hóa hiện đang thay đổi các công việc truyền thông, cho phép con người giảm tải lao động nhận thức. Ví dụ, trong lĩnh vực báo chí, các hệ thống khai thác dữ liệu cảnh báo các phóng viên về những câu chuyện tin tức tiềm năng, trong khi các bản tin đưa ra những cách tiếp cận mới để khán giả khám phá thông tin. Hệ thống viết tự động tạo ra các bài viết về tài chính, thể thao và bầu cử.

Một câu hỏi phổ biến được đặt ra chính là: Các công nghệ thông minh thâm nhập vào các ngành công nghiệp khác nhau sẽ ảnh hưởng đến công việc và người lao động như thế nào? Trong trường hợp này, ai - hoặc cái gì - sẽ làm báo trong thế giới tự động và được tăng cường trí tuệ nhân tạo như hiện nay, và họ sẽ làm như thế nào?

Trong cuốn sách “Tự động hóa: Cách các thuật toán viết lại lĩnh vực truyền thông” cho thấy rằng tương lai của báo chí hỗ trợ trí tuệ nhân tạo sẽ vẫn cần những nhà báo con người. Tuy nhiên, công việc, vai trò và nhiệm vụ của những người đó sẽ phát triển và thay đổi ít nhiều. Công việc của con người sẽ được lai ghép - pha trộn với các thuật toán - để phù hợp với khả năng của trí tuệ nhân tạo và phù hợp với những hạn chế của nó.

Tăng cường nhưng không thay thế

Một số ước tính cho thấy rằng trình độ công nghệ trí tuệ nhân tạo hiện tại chỉ có thể tự động hóa khoảng 15% công việc của phóng viên và 9% công việc của biên tập viên. Con người vẫn có lợi thế hơn trí tuệ nhân tạo trong một số lĩnh vực chính cần thiết cho hoạt động báo chí, bao gồm giao tiếp phức tạp, tư duy chuyên ngành, khả năng thích ứng và sáng tạo.

Trí tuệ nhân tạo không thể thực hiện bất kỳ nhiệm vụ báo chí thiết yếu bao gồm: Báo cáo, lắng nghe, phản hồi, xúc tiến, đàm phán với các nguồn tin và sau đó thể hiện sự sáng tạo để kết hợp các thông tin thu thập được. Tuy nhiên, nó có thể hỗ trợ tăng cường khả năng của con người, để giúp con người làm việc nhanh hơn và chất lượng được cải thiện. Và nó có thể tạo ra những cơ hội mới để tăng cường độ phủ sóng tin tức và làm cho tin tức trở nên cá nhân hóa hơn cho từng người đọc hoặc người xem.

Công việc của phòng tin tức luôn phải thích nghi với các làn sóng công nghệ mới, bao gồm nhiếp ảnh, điện thoại, máy tính - hoặc thậm chí chỉ là máy photocopy. Các nhà báo cũng sẽ cần thích nghi để làm việc với trí tuệ nhân tạo. Là một công nghệ, nó đã và sẽ tiếp tục thay đổi lĩnh vực truyền thông, báo chí, sẽ tăng cường nhưng khó có thể thay thế cho một nhà báo được đào tạo.

Công việc mới

Tôi nhận thấy rằng các công nghệ trí tuệ nhân tạo dường như thực sự tạo ra các loại công việc mới trong ngành báo chí.

Lấy ví dụ, Associated Press vào năm 2017 đã giới thiệu việc sử dụng các kỹ thuật trí tuệ nhân tạo thị giác máy tính để dán nhãn cho hàng ngàn bức ảnh tin tức mà nó xử lý mỗi ngày. Hệ thống có thể gắn thẻ ảnh với thông tin về hình ảnh hoặc hình ảnh về đối tượng hay sự vật nào, phong cách chụp ảnh và liệu hình ảnh có mang tính bạo lực hay không.

Hệ thống giúp các biên tập viên hình ảnh có nhiều thời gian hơn để suy nghĩ về những gì họ nên xuất bản, và giải phóng họ khỏi những công việc ngốn nhiều thời gian chỉ để dán nhãn và phân loại những gì họ có. Nhưng việc phát triển những hình ảnh trên tốn rất nhiều công sức, kể cả kỹ năng biên tập và kỹ thuật: Các biên tập viên phải tìm ra những gì cần gắn thẻ và liệu các thuật toán có phù hợp với nhiệm vụ hay không, sau đó phát triển các bộ dữ liệu thử nghiệm mới để đánh giá hiệu suất. Khi tất cả đã được thực hiện, họ vẫn phải giám sát hệ thống, phê duyệt thủ công các thẻ được đề xuất cho mỗi hình ảnh để đảm bảo độ chính xác cao.

Stuart Myles, giám đốc điều hành AP giám sát dự án, đã nói với tôi sẽ mất khoảng 36 nhân viên làm việc nhiều tháng, trải dài qua vài năm và hơn một chục nhân viên biên tập, kỹ thuật và hành chính. Ông cho biết khoảng 1/3 công việc liên quan đến chuyên môn báo chí và phán đoán, và những công việc này cực kỳ khó để tự động hóa. Mặc dù một số sự giám sát của con người có thể được giảm thiểu trong tương lai, ông nghĩ rằng mọi người sẽ vẫn cần phải làm công việc biên tập liên tục khi hệ thống phát triển và mở rộng.

Sản xuất nội dung bán tự động

Tại Vương quốc Anh, dự án RADAR bán tự động cho ra đời khoảng 8.000 bài báo tin tức địa phương mỗi tháng. Hệ thống này dựa trên sáu nhà báo địa phương, tìm kiếm các bộ dữ liệu của chính phủ được lập theo khu vực địa lý, xác định các góc độ thú vị và đáng tin cậy, sau đó phát triển các ý tưởng đó thành các mẫu dựa trên dữ liệu. Các mẫu mã hóa cách tự động điều chỉnh các bit của văn bản đến các vị trí địa lý được xác định trong dữ liệu. Chẳng hạn, một câu chuyện có thể nói về sự già hóa dân số trên khắp nước Anh, và cho độc giả ở Luton thấy cộng đồng của họ đang thay đổi như thế nào, với các số liệu thống kê địa phương khác nhau so với khu vực Bristol. Những câu chuyện sau đó được gửi đến các phương tiện truyền thông địa phương, và biên tập địa phương sẽ lựa chọn những tin tức để xuất bản.

Cách tiếp cận kết hợp các nhà báo và tự động hóa thành một quá trình hiệu quả. Các nhà báo sử dụng chuyên môn và kỹ năng giao tiếp của mình để đưa ra các tùy chọn cho cốt truyện. Họ cũng trao đổi với các nguồn thông tin để thu thập bối cảnh quốc gia và đưa ra các mẫu. Việc tự động hóa sau đó hoạt động như một trợ lý sản xuất, điều chỉnh văn bản cho các vị trí địa lý khác nhau.

Các nhà báo tại RADAR sử dụng một công cụ có tên Arria Studio, cung cấp một cái nhìn sơ lược về việc viết nội dung tự động trong thực tế. Nó thực sự chỉ là một giao diện phức tạp để xử lý văn bản. Tác giả viết các đoạn văn bản được điều khiển bởi các quy tắc “if-then-other” (nếu…thì) điều khiển dữ liệu. Chẳng hạn, trong một báo cáo về động đất, người viết có thể muốn sử dụng một tính từ khác để nói về một trận động đất có cường độ 8 độ richter so với động đất có cường độ 3 độ richter. Vì vậy, bạn có một quy tắc như: IF magnitude > 7 THEN text = “strong earthquake,” ELSE IF magnitude < 4 THEN text = “minor earthquake.” (Nếu cường độ > 7 thì văn bản = Trận động đất mạnh, nếu cường độ <4 thì = Trận động đất nhỏ). Các công cụ như Arria cũng chứa chức năng ngôn ngữ để tự động chia động từ hoặc danh từ, giúp dễ dàng làm việc với các bit văn bản cần thay đổi dựa trên dữ liệu.

Các giao diện tác giả như Arria cho phép người dùng thực hiện những gì họ giỏi nhất: cấu trúc logic các cốt truyện hấp dẫn và tạo ra những văn bản sáng tạo, không lặp lại. Nhưng hệ thống cũng đòi hỏi một số cách nghĩ mới về văn bản. Ví dụ, người viết mẫu cần tiếp cận một câu chuyện với sự hiểu biết về những gì dữ liệu có thể thể hiện - để tưởng tượng làm thế nào dữ liệu có thể tạo ra các góc độ và các câu chuyện khác nhau, và phân định logic để điều khiển các biến thể đó.

Sự giám sát, quản lý hoặc những gì các nhà báo thường gọi là “chỉnh sửa” các hệ thống nội dung tự động, cũng đang ngày càng chiếm lĩnh vị trí quan trọng trong phòng tin tức. Duy trì chất lượng và độ chính xác là mối quan tâm lớn nhất trong ngành báo chí.

RADAR đã phát triển một quy trình đảm bảo chất lượng ba giai đoạn. Đầu tiên, một nhà báo sẽ đọc mẫu của tất cả các bài báo được sản xuất. Sau đó, một nhà báo khác lần theo dấu vết trong câu chuyện, trở lại nguồn dữ liệu ban đầu của họ. Khi kiểm tra lần thứ ba, một biên tập viên sẽ duyệt qua logic của mẫu, để cố gắng phát hiện bất kỳ lỗi hoặc thiếu sót nào. Nó giống như công việc mà một nhóm các kỹ sư phần mềm có thể làm trong việc gỡ lỗi một tập lệnh - và đó là tất cả những công việc mà con người phải làm, để đảm bảo tự động hóa thực hiện công việc của mình một cách chính xác.

Phát triển nguồn nhân lực

Các sáng kiến ​​như ở Associated Press và tại RADAR chứng minh rằng trí tuệ nhân tạo và tự động hóa không thể phá hủy việc làm trong ngành báo chí. Chúng đã tạo ra công việc mới - cũng như thay đổi các công việc hiện có. Các nhà báo của ngày mai sẽ cần được đào tạo để thiết kế, cập nhật, chỉnh sửa, xác nhận, sửa chữa, giám sát và thường xuyên duy trì các hệ thống này. Nhiều người có thể cần các kỹ năng làm việc với dữ liệu và tư duy logic để hành động trên dữ liệu đó. Việc thành thạo với những kỹ năng cơ bản của lập trình máy tính cũng sẽ giúp ích rất nhiều trong tương lai.

Khi những công việc mới này phát triển, điều quan trọng là phải đảm bảo con ngươi có những công việc tốt - con người không nên trở thành một chiếc bánh răng trong một quy trình máy lớn hơn nhiều. Các nhà quản lý và thiết kế hình thức lao động kết hợp mới này sẽ cần xem xét mối quan tâm của con người về quyền tự chủ, hiệu quả và khả năng sử dụng. Nhưng tôi tin rằng việc tập trung vào trải nghiệm của con người trong các hệ thống này sẽ cho phép các nhà báo phát triển và xã hội sẽ gặt hái những thành quả về tốc độ, độ bao phủ và chất lượng gia tăng, điều mà trí tuệ nhân tạo và tự động hóa có thể mang lại.

Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
Phát triển AI trong lĩnh vực báo chí
POWERED BY ONECMS - A PRODUCT OF NEKO