Vào tháng 12/2017, DeepMind, phòng nghiên cứu được Google mua lại vào năm 2014 đã giới thiệu AlphaZero, chương trình trí tuệ nhân tạo có thể đánh bại các nhà vô địch thế giới trong vài trò chơi board games.
Điều thú vị là AlphaZero không hề nhận được sự hướng dẫn nào của con người về luật chơi các trò chơi. Thay vào đó, nó đã sử dụng học máy (machine learning) – một nhánh của trí tuệ nhân tạo – để phát triển các hành vi của nó thông qua kinh nghiệm thay vì các lệnh rõ ràng.
Trong vòng 24h, AlphaZero đã đạt được thành tích cao nhất trong cờ vua và đánh bại chương trình cờ vua vô địch thế giới trước đó. Không lâu sau đó, thuật toán học máy của AlphaZero cũng biến nó thành bậc thầy của trò chơi cờ Shogi (cờ Nhật Bản) và trò chơi board games Go của Trung Quốc. Nó cũng đánh bại người tiền nhiệm, AlphaGo, 100 tới 0.
Học máy đã trở nên rất phổ biến trong vài năm gần đây và đang giúp máy tính giải quyết các vấn đề trước đây vẫn được coi là lĩnh vực độc quyền của trí tuệ con người. Và mặc dù vẫn còn cách xa tầm nhìn ban đầu về trí tuệ nhân tạo, học máy đã đưa chúng ta tới gần hơn mục tiêu cuối cùng là tạo ra được những cỗ máy biết tư duy.
Sự khác nhau giữa trí tuệ nhân tạo và học máy là gì?
Cách tiếp cận truyền thống để phát triển trí thông minh nhân tạo là mã hóa kỹ lưỡng tất cả các quy tắc và kiến thức để xác định hành vi của tác nhân trí tuệ nhân tạo (AI). Khi tạo nên các quy tắc dựa trên AI, các nhà phát triển phải viết hướng dẫn cụ thể để AI có thể tương tác lại với từng tình huống cụ thể. Cách tiếp cận dựa trên quy tắc này, được gọi là AI cổ điển (GOFAI) hay AI tượng trưng, cố gắng bắt chước suy nghĩ và các chức năng hoạt động của con người.
Ví dụ tuyệt vời nhất cho AI tượng trưng này là Stockfish, một công cụ cờ vua mã nguồn mở đứng đầu trong hơn 10 năm ra đời. Hàng trăm người chơi cờ và lập trình viên đã đóng góp và giúp Stockfish phát triển logic của nó bằng cách mã hóa các quy tắc của nó – ví dụ, AI nên làm gì khi cờ thủ di chuyển hiệp sĩ từ B1 sang C3.
Tuy nhiên AI dựa trên quy tắc thường bị phá vỡ khi phải xử lý các tình huống mà các quy tắc trở nên quá phức tạp và bí ẩn. Ví dụ nhận dạng giọng nói và các đối tượng trong hình ảnh là hoạt động nâng cao không thể diễn tả bằng cách quy tắc logic.
Trái ngược với AI tượng trưng, hình mẫu học máy AI được phát triển không phải bằng viết quy tắc mà bằng việc thu thập các ví dụ. Ví dụ, để tạo ra học máy dựa trên công cụ cờ vua, các nhà phát triển tạo ra thuật toán căn bản và sau đó “đào tạo” chúng với dữ liệu từ hàng nghìn các trò chơi cờ vua trước đó. Bằng cách phân tích dữ liệu, AI tìm ra được hình mẫu chung để xác định chiến lược mà qua đó sẽ giúp nó chiến thắng và đánh bại các đối thủ thực tế.
AI biết càng nhiều trò chơi cờ vua thì nó càng phát đoán được các bước cờ để giành chiến thắng trong quá trình chơi nhanh hơn. Đó là lý do vì sao học máy được coi là chương trình có hiệu suất được nâng cao qua từng kinh nghiệm.
Học máy có thể được áp dụng cho nhiều công việc trong thế giới thực, bao gồm phân loại hình ảnh, nhận dạng giọng nói, đề xuất nội dung, phát hiện gian lận và xử lý ngôn ngữ tự nhiên.
Học máy được giám sát và không được giám sát.
Tùy theo vấn đề mà các nhà phát triển muốn giải quyết, họ chuẩn bị các dữ liệu liên quan để xây tạo ra mô hình học máy. Ví dụ, nếu họ muốn sử dụng học máy để phát hiện giao dịch ngân hàng gian lận, họ sẽ soạn ra một danh sách các giao dịch sẵn có và gắn tên đầu ra cho chúng (gian lận hoặc hợp lệ). Khi họ đưa các dữ liệu này vào thuật toán, nó sẽ phân chia ra giao dịch nào là gian lận, giao dịch nào là hợp lệ rồi tìm tính chất chung trong mỗi hạng mục. Quá trình đào tạo hình mẫu với dữ liệu được giải thích này được gọi là “học có giám sát” và hiện đang là hình thức chủ yếu của học máy.
Nhiều kho lưu trữ dữ liệu trực tuyến cho các mục đích khác nhau đã tồn tại. Một vài ví dụ phổ biến là ImageNet, kho dữ liệu mã nguồn mở với hơn 14 triệu bức ảnh, và MNIST, kho dữ liệu với 60,000 con số viết tay. Các nhà phát triển học máy cũng sử dụng nền tảng như Mechanical Turk của Amazon, một trung tâm tuyển dụng theo yêu cầu trực tuyến để thực hiện các nhiệm vụ liên quan đến nhận thức như ghi nhãn hình ảnh và mẫu âm thanh hay một lĩnh vực khởi nghiệp đang phát triển chuyên về phân tích dữ liệu.
Nhưng không phải tất cả các vấn đề đều cần dữ liệu đã được dán nhãn. Một vài vấn đề học máy có thể được giải quyết thông qua “học không giám sát”, tức là bạn cung cấp cho AI một dữ liệu thô và để tự nó tìm ra mẫu hình có liên quan.
Học không giám sát được dùng nhiều nhất để phát hiện sự bất thường. Ví dụ, thuật toán học thuật có thể đào tạo dữ liệu lưu lượng truy cập mạng thô của thiết bị có kết nối internet, như là tủ lạnh thông minh. Sau khi đào tạo, AI thiết lập đường cơ sở cho thiết bị và có thể đánh dấu hành vi ngoại lệ. Nếu thiết bị bị nhiễm phần mềm độc hại và bắt đầu giao tiếp với các máy chủ độc hại, mô hình học máy có thể phát hiện ra vì lưu lượng truy cập mạng khác với hành vi thông thường thấy được trong quá trình đào tạo.
Học tăng cường
Đến bây giờ, bạn có thể biết rằng dữ liệu đào tạo chất lượng đóng vai trò to lớn trong tính hiệu quả của các mô hình học máy. Nhưng “Học tăng cường” là một loại học máy chuyên dụng mà AI phát triển hành vi của nó không cần sử dụng các dữ liệu trước đó.
Mô hình học máy tăng cường bắt đầu với nền tảng sạch sẽ. Chúng chỉ được hướng dẫn về các quy tắc cơ bản của môi trường và nhiệm vụ trong tay. Thông qua các thử nghiệm và sai sót, chúng sẽ học được cách tối ưu hóa hành động cho mục tiêu của mình.
AlphaZero của DeepMind là ví dụ thú vị của học tăng cường. Trái với các mô hình học máy khác, phải xem cách con người chơi cờ và học từ con người, AlphaZero mới đầu chỉ biết các bước đi và luật để thắng trò chơi. Sau đó, nó tự chơi hàng triệu ván cờ với chính nó, bắt đầu bằng những hành động ngẫu nhiên rồi dần dần phát triển các mô hình hành vi.
Học tăng cường là lĩnh vực nghiên cứu hấp dẫn. Đây là công nghệ chính được dùng để phát triển các mô hình AI từ đó làm chủ các trò chơi phức tạp như Dota 2 và StarCraft 2. Nó cũng được dùng để giải quyết các vấn đề trong đời sống thức như quản lý tài nguyên trung tâm dữ liệu hay tạo ra bàn tay robot có thể cầm được các vật thể khéo léo như con người.
Học kĩ càng
Học kĩ càng là tập hợp con phổ biến của học máy. Nó sử dụng hệ thống thần kinh nhân tạo, các cấu trúc phần mềm lấy cảm hứng từ cấu trúc sinh học của não bộ con người.
Mạng lưới thần kinh nổi trội trong việc xử lý các dữ liệu không có cấu trúc như hình ảnh, video, âm thanh và các đoạn trích văn bản dài như các bài báo hay tài liệu nghiên cứu. Trước khi “học kĩ càng”, các chuyên gia học máy phải nỗ lực để tách các đặc tính từ hình ảnh, video và chạy các thuật toán lên các đặc tính đó. Hệ thống thần kinh sẽ tự động phát hiện các đặc tính này mà không cần nhiều nỗ lực từ các kĩ sư con người.
Học kĩ càng được sử dụng nhiều trong các công nghệ AI hiện đại như xe không người lái, hệ thống dịch thuật nâng cao và công nghệ nhận dạng khuôn mặt trong iPhone X.
Những hạn chế của Học máy
Con người thường nhầm lẫn giữa học máy với trí tuệ nhân tạo ở cấp bậc con người. Vì thế bộ phận marketing của một số công ty cố tình sử dụng các thuật ngữ này thay cho nhau. Nhưng trong khi học máy đã có những bước tiến lớn trong việc giải quyết các vấn đề phức tạp thì nó vẫn còn cách xa so với việc tạo ra những cỗ máy biết tư duy trong tưởng tượng của những người tiên phong của AI.
Để rút ra được kinh nghiệm, trí tuệ thật sự cần phải biết lý lẽ, khả năng thưởng thức chung và tư duy phản biện – những lĩnh vực mà các mô hình học máy vận hành rất kém.
Ví dụ, trong khi học máy rất giỏi trong việc nhận dạng các mô hình phức tạp như dự đoán ung thư vú trước năm năm, thì nó lại phải đấu tranh với những nhiệm vụ logic và lý luận đơn giản hơn nhiều như giải toán cấp ba.
Việc thiếu khả năng lý luận của học máy làm nó không giỏi trong việc khái quát hóa kiến thức của nó. Ví dụ, một tác nhân học máy có thể chơi Super Mario 3 siêu đẳng nhưng sẽ không thắng được các trò chơi ở nền tảng khác như Mega Man hay thậm chí là phiên bản khác của Super Mario. Nó sẽ cần phải được đào tạo từ đầu.
Thiếu khả năng đúc rút kiến thức khái niệm từ kinh nghiệm, các mô hình học máy cần hàng tấn dữ liệu đào tạo để thực hiện. Thật không may, nhiều lĩnh vực thiếu dữ liệu đào tạo đầy đủ hoặc không có đủ kinh phí để có nhiều hơn. Học kĩ càng, hiện là hình thức phổ biến của học máy, cũng gặp phải vấn đề có thể giải thích rằng: Mạng lưới thần kinh hoạt động theo những cách phức tạp nên những người tạo ra chúng thậm chí cũng phải vật lộn để tuân thủ theo các quy trình tạo ra quyết định của họ. Điều này làm cho chúng ta rất khó sử dụng khả năng của hệ thần kinh trong việc thiết lập những nơi có yêu cầu pháp lý để giải thích các quyết định AI.
May mắn thay, chúng ta vẫn luôn nỗ lực để giải quyết các mặt hạn chế của học máy. Các dự án khác nhằm giảm sự phụ thuộc quá mức của học máy vào dữ liệu đã được giải thích và làm cho công nghệ có thể truy cập được vào các miền có dữ liệu đào tạo hạn chế. Các nhà nghiên cứu tại IBM và MIT gần đây cũng đã nghiên cứu lĩnh vực này bằng cách kết hợp AI biểu tượng và hệ thần kinh. Các mô hình lai AI cần ít dữ liệu để đào tạo hơn và có thể cung cấp từng bước các giải thích cho các quyết định của chúng.
Chưa biết liệu sự phát triển của học máy có giúp chúng ta đạt được mục tiêu khó nắm bắt là tạo ra AI ở cấp độ con người hay không? Nhưng những gì chúng ta biết chắc chắn là nhờ những tiến bộ của học máy, các thiết bị chỉ nằm trên bàn và nghỉ ngơi trong túi quần chúng ta đang ngày càng thông minh hơn.