Google cải thiện việc đào tạo mô hình AI bằng mã nguồn mở

Thanh Hương, Phạm Thu Trang| 31/08/2018 18:39
Theo dõi ICTVietnam trên

Google đang giúp các nhà nghiên cứu tìm cách đào tạo các mô hình AI bằng việc mở mã nguồn của một khung phần mềm học tăng cường được sử dụng cho các dự án của riêng mình.

Học tăng cường (Reinforcement Learning) đã được sử dụng cho một số AI ấn tượng nhất cho đến nay, bao gồm cả những AI đã đánh bại game thủ chuyên nghiệp của Alpha Go và Dota 2. Công ty con của Google, DeepMind, sử dụng nó cho Deep Q-Network (DQN).

Xây dựng một khuôn khổ học tăng cường cần thời gian và nguồn lực đáng kể. Để cho AI đạt được tiềm năng đầy đủ, học tăng cường cần phải trở nên dễ tiếp cận hơn.

Bắt đầu từ hôm tư vừa rồi, Google để một khung phần mềm học tăng cường nguồn mở dựa trên TensorFlow - thư viện học máy của Google - có sẵn trên GitHub.

Pablo Samuel Castro và Marc G. Bellemare, các nhà nghiên cứu của Google Brain, viết trong một bài đăng trên blog:

“Lấy cảm hứng từ một trong những thành phần chính trong hành vi có động lực từ phần thưởng trong não và phản ánh mối liên hệ lịch sử mạnh mẽ giữa khoa học thần kinh và nghiên cứu học tập tăng cường, nền tảng này nhằm mục đích cho phép nghiên cứu suy lí luận có thể thúc đẩy những khám phá căn bản.

Bản phát hành này cũng bao gồm một bộ đính kèm làm rõ cách sử dụng khung phần mềm của chúng tôi. ”

Khung phần mềm của Google được thiết kế với ba trọng tâm: tính linh hoạt, tính ổn định và khả năng tái tạo.

Công ty cung cấp 15 ví dụ mã cho Arcade Learning Environment- một nền tảng sử dụng các trò chơi video để đánh giá hiệu suất của công nghệ AI - cùng với bốn mô hình học máy khác nhau: C51, DQN, Implicit Quantile Network, và Rainbow.

Học tăng cường là một trong những phương pháp đào tạo hiệu quả nhất. Nếu bạn đang huấn luyện một chú chó, đưa ra phần thưởng khi chú chó thực hiện điều bạn yêu cầu là một ví dụ chính về tăng cường tích cực trong thực tế.

Đào tạo máy tính là một khái niệm tương tự, chỉ khác là những phần thưởng được phân phối hoặc giữ lại như thay vì là vật chất.

“Chúng tôi hy vọng rằng tính linh hoạt và dễ sử dụng của khung phần mềm sẽ giúp các nhà nghiên cứu thử nghiệm các ý tưởng mới”, Bellemare và Castro viết. "Chúng tôi đã tích cực sử dụng nó cho nghiên cứu của mình và nhận thấy nó cho chúng ta sự linh hoạt để thực hiện nhanh chóng nhiều ý tưởng."

Nổi bật Tạp chí Thông tin & Truyền thông
  • Thủ tướng Phạm Minh Chính trao quyết định điều động, bổ nhiệm Tổng Giám đốc VTV
    Chiều 2/11, Thủ tướng Chính phủ Phạm Minh Chính đã trao quyết định điều động, bổ nhiệm Thứ trưởng Bộ Thông tin và Truyền thông Nguyễn Thanh Lâm giữ chức Tổng Giám đốc Đài Truyền hình Việt Nam (VTV). Cùng dự lãnh đạo các ban, bộ, ngành Trung ương và VTV.
  • Tạo "hệ sinh thái" KOL trẻ vì cộng đồng
    Sau hành trình của Đội tuyển bóng đá U23 Việt Nam năm 2018, vượt ra ngoài khuôn khổ trận đấu, mỗi cầu thủ sau khi trở về đều trở thành niềm tự hào của quê hương, đồng thời truyền cảm hứng, nối ước mơ cho thế hệ trẻ. Cùng công thức ấy, liệu có thể áp dụng cho lĩnh vực chính trị-xã hội?
  • Chiến lược "4 Mới" - chìa khóa then chốt để khai phóng giá trị kinh doanh của nhà mạng
    Trước làn sóng chuyển đổi số thông minh, chiến lược "4 Mới" không chỉ đại diện cho nỗ lực đổi mới công nghệ mạng, mà còn là động lực quan trọng để không ngừng khai phóng giá trị kinh doanh của mạng.
  • Bưu điện ra quân vận động 150.000 người tham gia BHXH
    Phát huy khí thế của ngày ra quân, các Bưu điện trung tâm trên địa bàn TP. Hồ Chí Minh quyết tâm hoàn thành mục tiêu, phấn đấu đến 31/12/2024 đạt được 15.000 người tham gia bảo hiểm xã hội tự nguyện và 900.000 người tham gia bảo hiểm y tế hộ gia đình.
  • ‏YouTube Shopping Affiliate ra mắt tại Việt Nam
    Ngày 2/11, YouTube chính thức ra mắt chương trình YouTube Shopping Affiliate tại Việt Nam, mở đầu hợp tác cùng Shopee. Chương trình này sẽ góp phần nâng cao trải nghiệm mua sắm và thúc đẩy tăng trưởng kinh tế số tại Việt Nam.
Đừng bỏ lỡ
Google cải thiện việc đào tạo mô hình AI bằng mã nguồn mở
POWERED BY ONECMS - A PRODUCT OF NEKO