Mạng nơron có lý luận giống con người
Diễn đàn - Ngày đăng : 09:15, 19/09/2018
Nhóm nghiên cứu từ Nhóm công nghệ thông minh và quyết định của Phòng thí nghiệm Lincoln của đại học công nghệ Massachusetts đã phát triển một mạng lưới thần kinh thực hiện lý luận giống như con người để trả lời các câu hỏi về nội dung của hình ảnh.
Để giải quyết vấn đề, tính minh bạch của mạng thiết kế (TbD-net) cho thấy các hoạt động của nó, bằng cách hiển thị trực quan quá trình ra quyết định của nó, cho phép các nhà nghiên cứu thấy được lý do đằng sau kết luận của nó.
Mô hình này không chỉ đạt được mức độ minh bạch mới, mà nó còn hoạt động tốt hơn hầu hết các mạng thần kinh hình ảnh lý tưởng nhất hiện nay.
Nghiên cứu được trình bày trong một bài báo gọi là Tính minh bạch bằng thiết kế: Xóa khoảng cách giữa hoạt động và khả năng diễn giải trong lý luận trực quan.
Sự phức tạp của các mạng thần kinh lấy cảm hứng từ não tăng khả năng đáng kể, nhưng không thấu hiểu hết hiểu biết của con người, biến chúng thành hệ thống 'hộp đen'. Trong một số trường hợp, các nhà nghiên cứu không thể theo dõi quá trình tính toán của mạng thần kinh.
Mạng nơron trong suốt (Transparent neural network)
Trong trường hợp TbD-net, tính trong suốt của nó cho phép các nhà nghiên cứu sửa bất kỳ giả định sai lầm nào mà hệ thống có thể đã thực hiện. Các nhà phát triển của nó nói rằng loại cơ chế điều chỉnh này đang thiếu từ các mạng thần kinh hàng đầu hiện nay.
Ví dụ, xe tự lái phải có khả năng phân biệt nhanh chóng và chính xác người đi bộ từ biển báo giao thông. Để tạo ra trí tuệ nhân tạo xử lý việc này là cực kỳ khó khăn, vì nhiều hệ thống không thể phân biệt được. Ngay cả với một mạng lưới thần kinh đủ khả năng, quá trình lập luận của nó có thể không rõ ràng đối với các nhà phát triển - một vấn đề mà cách tiếp cận mới của trường đại học công nghệ Massachusetts được thiết lập để thay đổi.
Ryan Soklaski, người đã tạo ra TbD-net cùng với các nhà nghiên cứu Arjun Majumdar, David Mascharka và Philip Tran, cho biết:
Tiến bộ về cải thiện hiệu quả lập luận trực quan nhờ đến từ khả năng diễn giải.
Nhóm nghiên cứu đã sử dụng phương pháp mô-đun cho mạng nơ-ron của họ - xây dựng các mạng con nhỏ chuyên thực hiện các nhiệm vụ phụ. TbD-net chia nhỏ câu hỏi và gán nó cho mô-đun liên quan. Mỗi mạng phụ được xây dựng dựa trên kết luận của một mạng trước đó.
Majumdar nói: “Phá vỡ một chuỗi các lý luận phức tạp thành một loạt các vấn đề nhỏ hơn, mỗi vấn đề có thể được giải quyết một cách độc lập và sáng tạo, là một phương tiện mạnh mẽ và trực quan.
Cách tiếp cận của mạng thần kinh để giải quyết vấn đề tương tự như quy trình lý luận của con người. Kết quả là, nó có thể trả lời các câu hỏi lý luận phức tạp về không gian như "Màu sắc là khối lập phương ở bên phải của quả cầu kim loại lớn?"
Mô hình này chia nhỏ câu hỏi thành các khái niệm thành phần, xác định quả cầu nào là kim loại lớn, hiểu ý nghĩa của vật thể ở bên phải của một vật khác, rồi tìm khối lập phương và giải thích màu của nó.
Mạng hiển thị kết quả của mỗi mô-đun trực quan dưới dạng ‘mặt nạ chú ý’. Bản đồ nhiệt được xếp chồng lên các vật thể trong hình ảnh để cho các nhà nghiên cứu biết cách mô-đun diễn giải nó, cho phép họ hiểu quy trình ra quyết định của mạng thần kinh ở mỗi bước.
Mặc dù thiết kế khiến hệ thống minh bạch hơn, TbD-net cũng đạt được độ chính xác tối tân 99,1%, sử dụng tập dữ liệu được gọi là CLEVR. Và nhờ tính minh bạch của hệ thống, các nhà nghiên cứu đã có thể giải quyết các lỗi trong lý luận của nó và thiết kế lại một số mô-đun cho phù hợp.
Nhóm nghiên cứu hy vọng rằng những hiểu biết sâu sắc về hoạt động của mạng thần kinh có thể giúp xây dựng lòng tin của người dùng trong các hệ thống lý luận trực quan trong tương lai.
Khả năng diễn giải hạn chế của nhiều mạng nơron gây ra các vấn đề mang tính hệ thống và đạo đức, trong đó yếu tố thiên vị còn chưa được xác minh.
Tuy nhiên, khi các mạng nơ-ron lý luận trực quan được trong suốt hơn, chúng thường hoạt động kém trên các nhiệm vụ phức tạp, chẳng hạn như trên tập dữ liệu CLEVR.
Những nỗ lực khắc phục vấn đề của mô hình hộp đen AI, như việc sử dụng chưng cất mô hình minh bạch của Đại học Cornell, đã áp dụng một số phương pháp để giải quyết những vấn đề này, quá trình lý luận của TbD-net đã nâng tính trong suốt của mạng lên tầm cao mới. mà không làm mất đi độ chính xác của mô hình.
Hệ thống có khả năng thực hiện các tác vụ lý luận phức tạp theo cách hiểu rõ ràng, xóa bỏ khoảng cách hiệu suất giữa các mô hình diễn giải và các phương pháp lý luận trực quan tiên tiến nhất.
Hệ thống thị giác máy tính và lý luận trực quan đóng vai trò lớn trong các phương tiện tự động, hình ảnh vệ tinh, giám sát, giám sát thành phố thông minh và nhiều ứng dụng khác, đây là bước đột phá lớn trong việc tạo ra các mạng thần kinh trong suốt, chính xác.