Học máy giúp dự đoán thảm họa toàn cầu sắp xảy ra
Các nhà nghiên cứu ở Hoa Kỳ cho biết họ đã chứng minh được cách học máy có thể dự đoán các thảm họa thảm khốc, bao gồm động đất và đại dịch.
Việc dự đoán các sự kiện cực đoan, bao gồm động đất, sóng thần hay đại dịch có thể gặp vấn đề do mô hình tính toán không đạt yêu cầu; nói theo thống kê, những sự kiện này hiếm đến mức không có đủ dữ liệu để sử dụng các mô hình dự đoán nhằm dự đoán chính xác thời điểm chúng sẽ xảy ra lần nữa.
Giờ đây, một nhóm các nhà nghiên cứu từ Đại học Brown và Viện Công nghệ Massachusetts cho biết họ có thể giải quyết vấn đề này. Trong một nghiên cứu mới đây trên Tạp chí Khoa học tính toán tự nhiên, các nhà khoa học đã mô tả cách họ kết hợp các thuật toán thống kê - cần ít dữ liệu hơn để đưa ra dự đoán chính xác, hiệu quả - với một kỹ thuật học máy mạnh mẽ được phát triển tại Brown.
Các nhà khoa học đã đào tạo nó để dự đoán các sự kiện hiếm gặp mặc dù thiếu dữ liệu lịch sử, đồng thời giảm thiểu nhu cầu về một lượng dữ liệu khổng lồ cần thiết cho các mô hình tính toán truyền thống.
George Karniadakis, Giáo sư Toán học và Kỹ thuật ứng dụng tại Brown và là tác giả nghiên cứu cho biết: “Bạn phải nhận ra rằng đây là những sự kiện ngẫu nhiên. Một đại dịch bùng phát như COVID-19, thảm họa môi trường ở Vịnh Mexico, động đất, cháy rừng lớn ở California, sóng cao 30 m làm lật úp một con tàu - đây là những sự kiện hiếm gặp và vì chúng hiếm gặp nên chúng tôi không có nhiều dữ liệu lịch sử. Chúng tôi không có đủ các mẫu từ quá khứ để dự đoán chúng trong tương lai. Câu hỏi mà chúng tôi giải quyết trong bài báo là: Đâu là dữ liệu tốt nhất có thể mà chúng tôi có thể sử dụng để giảm thiểu số lượng điểm dữ liệu mà chúng tôi cần?”
Các nhà nghiên cứu đã tìm thấy câu trả lời trong một kỹ thuật lấy mẫu tuần tự được gọi là học tích cực. Các thuật toán này không chỉ có thể phân tích dữ liệu đầu vào mà còn có thể học hỏi từ thông tin được cung cấp để gắn nhãn các điểm dữ liệu mới có tầm quan trọng tương đương hoặc thậm chí lớn hơn.
Điều đó rất quan trọng đối với mô hình học máy mà các nhà nghiên cứu đã sử dụng trong nghiên cứu. Được gọi là DeepOnet, mô hình này là một loại mạng thần kinh nhân tạo, sử dụng các nút được liên kết và phân lớp có thể bắt chước các kết nối nơ-ron của bộ não con người. Trong bài báo, nhóm nghiên cứu chỉ ra rằng kết hợp với các kỹ thuật học tích cực, mô hình DeepOnet có thể được đào tạo ngay cả khi không có nhiều điểm dữ liệu.
Karniadakis nói: “Nhiệm vụ không phải là lấy mọi dữ liệu có thể và đưa vào hệ thống mà là chủ động tìm kiếm các sự kiện sẽ biểu thị các sự kiện hiếm gặp. Chúng tôi có thể không có nhiều ví dụ về sự kiện thực, nhưng thông qua toán học, chúng tôi xác định chúng, cùng với các sự kiện thực tế sẽ giúp chúng tôi đào tạo mô hình này”.
Trong bài báo, các nhà nghiên cứu áp dụng phương pháp xác định các tham số và các phạm vi xác suất khác nhau đối với các đợt gia tăng đột biến nguy hiểm trong đại dịch, tìm và dự đoán các đợt sóng thần, đồng thời ước tính thời điểm một con tàu sẽ bị nứt làm đôi.
Các nhà nghiên cứu nhận thấy phương pháp mới của họ vượt trội so với các mô hình truyền thống và họ tin rằng nó có thể phát hiện và dự đoán hiệu quả tất cả các loại sự kiện hiếm gặp./.