AI bắt tin tức giả bằng cách đánh giá độ chính xác của nguồn tin

Diễn đàn - Ngày đăng : 15:57, 08/10/2018

Những gã khổng lồ internet đang trở nên giỏi hơn trong việc chống lại tin tức giả. Mặc dù, đối với hầu hết các phần, họ sàng lọc nội dung trên cơ sở từng câu chuyện và chỉ chặn toàn bộ các nguồn tin sau khi chúng đã gây ra thiệt hại đáng kể.

Các nhà nghiên cứu từ CSAIL của MIT và Viện nghiên cứu máy tính của Qatar có một giải pháp tốt hơn: sử dụng AI để đo lường chất lượng của nguồn tin. Thuật toán học máy của họ sử dụng các bộ sưu tập các bài báo hiện có để đánh giá độ chính xác và độ thiên vị của một trang tin tức nhất định với giả định rằng một nhà cung cấp tin tức giả mạo sẽ không thay đổi cách thức hoạt động. Thay vì tập trung vào các tuyên bố, nó nghiên cứu ngôn ngữ được sử dụng để thể hiện những tuyên bố đó.

Nhóm nghiên cứu đã sử dụng phân tích của Media Bias/Fact Check của hơn 2.000 trang tin tức để đào tạo thuật toán tìm kiếm các dấu hiệu ngôn ngữ của các trang web đưa ra các tin bài giả mạo hoặc bị bóp méo. Các tổ chức này có xu hướng dựa vào ngôn ngữ phóng đại, cường điệu, kích thích cảm xúc như "diễn viên khủng hoảng", "xuất quỷ nhập thần" và "cờ giả". Một trang web có tính thiên vị có thể nói về "công bằng" và "có đi có lại", trong khi một trang web bảo thủ có thể đề cập đến "thẩm quyền" và "sự thánh thiện". Cách tiếp cận máy học thậm chí có thể rút ra các liên kết giữa tính xác thực của trang web và trang Wikipedia của nó (dài hơn thường đáng tin cậy hơn) hoặc địa chỉ web (các trang phức tạp có nhiều khả năng chứa tin giả).

AI hiện vẫn chưa sẵn sàng để được sử dụng trong một hệ thống kiểm tra nội dung thực sự. Nó chỉ có thể phát hiện chính xác với hiệu quả 65% phần trăm, và thiên vị với 70%. Nó cũng đòi hỏi 150 bài viết để đưa ra quyết định đáng tin cậy. Đó là đủ để bắt các trang web mờ ám đã hoạt động khoảng một thời gian, nhưng nó sẽ không giúp đỡ nhiều trong việc sàng lọc các trang web mà gần đây mới gieo rắc dữ liệu giả mạo. Nhân viên kiểm tra thực tế vẫn cần kiểm tra lại các phát hiện, ít nhất là bây giờ.

Như bạn có thể đoán, các hàm ý cho một hệ thống thực sự đáng tin cậy sẽ rất lớn. Mạng xã hội có thể làm giảm ảnh hưởng hoặc chặn các câu chuyện từ các trang web không trung thực như một vấn đề tất nhiên, và giới hạn phán đoán của con người trong các tình huống phán quyết không rõ ràng. Trong khi đó, các trang web kiểm tra thông tin có thể ngay lập tức chuyển sang AI để quyết định liệu nguồn tin mới có giá trị hay là rác. Với điều đó, bất kỳ công ty nào dựa vào hệ thống này đều có thể đang đi qua một bãi mìn. Đã có những tuyên bố về sự thiên vị chính trị giữa các công cụ tìm kiếm và mạng xã hội - họ có thể thấy mình bị chỉ trích hơn nữa nếu AI đánh dấu một trang web phổ biến, bất kể công nghệ có thể chính xác như thế nào.

Nguyễn Thùy Linh, Lâm Thị Nguyệt