Mất 4 tháng, với sự hỗ trợ từ 1.000 người để xây dựng đề thi cho Zalo AI Challenge

Trong nước - Ngày đăng : 10:05, 04/11/2022

Sau hơn 4 tháng làm việc liên tục, cuối cùng 7 thành viên ban cố vấn và hơn 20 kỹ sư thuộc ban tổ chức chương trình cũng đã kỳ công hoàn thành 3 đề bài và bộ dữ liệu huấn luyện với sự tham gia đóng góp của hơn 1.000 người, hy vọng mang đến ý nghĩa lớn cho cộng đồng trí tuệ nhân tạo (AI) Việt Nam.

Ngày 04/11, Zalo AI Challenge 2022 chính thức công bố bộ 3 đề thi và mở cổng cho các đội đăng ký tham gia thi đấu tại https://bit.ly/ZALO-AIChallenge2022. 

Mỗi đề bài tương ứng với một mảng đang là xu hướng trong lĩnh vực AI. Cụ thể, đề bài thuộc lĩnh vực xử lý ảnh số/video là Liveness Detection - xác định khuôn mặt người trong video là thật hay giả mạo. Mảng xử lý ngôn ngữ tự nhiên có đề E2E Question Answering - tìm câu trả lời chính xác nhất từ Wikipedia cho một câu hỏi. Đề bài Lyric Alignment - tìm giải pháp để cân chỉnh trùng khớp lời bài hát và nhạc - thuộc mảng xử lý âm thanh.

Mất 4 tháng, với sự hỗ trợ từ 1.000 người để xây dựng đề thi cho Zalo AI Challenge - Ảnh 1.

Theo ông Châu Thành Đức - Data Science Manager tại Zalo AI, đồng thời là Phó trưởng ban tổ chức chương trình, các đề bài 2022 dựa trên các vấn đề "nóng hổi" của xã hội Việt Nam và cũng là nhu cầu thiết thực trong cuộc sống thường ngày đó là xác định hình ảnh/video giả mạo, tìm kiếm thông tin trực tuyến, karaoke giải trí.

Điểm nổi bật nhất ở Zalo AI Challenge 2022 là yếu tố thời sự của đề bài. Hiện nay, các hoạt động chuyển đổi số định danh bằng khuôn mặt đang diễn ra ở nhiều lĩnh vực quan trọng như ngân hàng, y tế, giáo dục... Thông qua xác minh khuôn mặt trên điện thoại, người dân không cần trực tiếp đến các cơ sở để giải quyết một số thủ tục, từ đó có thể tiết kiệm thời gian và công sức. Tuy nhiên, việc làm giả khuôn mặt trong hình ảnh, video đang trở nên ngày càng tinh vi.

Với đề bài Liveness Detection, các đội tham gia phải vượt qua thử thách xây dựng mô hình AI có khả năng phân loại các video chứa khuôn mặt thu trực tiếp từ người thật, video giả mạo từ khuôn mặt giả hay video giả đã thu từ trước. Với thí sinh, đây là đề bài thách thức nhất, còn với ban tổ chức, Liveness Detection chính là bài toán cần chuẩn bị cầu kỳ nhất bởi dữ liệu được thu thập từ người thật. 

Để tăng kịch tính, ban tổ chức đã nâng độ khó của đề thi bằng cách cho các tình nguyện viên mang khẩu trang. Sau đó, nguồn dữ liệu giả được tạo ra tương ứng. Nhiệm vụ của các đội là phân loại các dữ liệu giống hệt nhau về mặt hiển thị.

Mất 4 tháng, với sự hỗ trợ từ 1.000 người để xây dựng đề thi cho Zalo AI Challenge - Ảnh 2.

Một thử thách gay cấn khác dành cho các đội thi năm nay là tìm được giải pháp cho đề bài E2E Question Answering. Khi nhập câu hỏi trên Internet, mọi người thường sẽ nhận về hàng triệu kết quả, trong đó có rất nhiều kết quả không đúng như mong muốn. Trong thử thách này, các đội tham gia phải xây dựng được hệ thống có thể đưa ra câu trả lời chính xác cho một câu hỏi cụ thể từ nguồn dữ liệu Wikipedia, giúp người hỏi có được đúng thông tin đang cần.

Lyric Alignment là bài toán đáp ứng được hình thức giải trí rất phổ biến của người dân Việt Nam, đó là karaoke. Điểm khó là làm sao căn chỉnh phần lời hiển thị (lyric) trùng khớp với phần giai điệu (audio). Trong thử thách này, các đội thi sẽ xây dựng mô hình AI có khả năng căn chỉnh trùng khớp lời bài hát chạy trên nền âm nhạc.

Mất 4 tháng, với sự hỗ trợ từ 1.000 người để xây dựng đề thi cho Zalo AI Challenge - Ảnh 3.

Dù trở ngại về mặt địa lý, những nhân sự "nồng cốt" của chương trình cũng đã cố gắng sắp xếp lịch trình dày đặc và nén dung lượng các buổi họp sao cho quá trình thảo luận ý tưởng được thuận tiện và phối hợp nhịp nhàng, đạt hiệu quả cao nhất với mong muốn cuối cùng là tạo nên một cuộc thi chất lượng. Ban tổ chức kỳ vọng, khi vượt qua các đề bài mang tính thử thách cao của Zalo AI Challenge 2022, các sinh viên, kỹ sư trẻ sẽ có thêm kinh nghiệm làm AI thực tiễn, góp nhặt hành trang để tự tin theo đuổi lĩnh vực AI chuyên nghiệp.

Kết quả thi đấu của các đội tham gia trong Zalo AI Challenge 2022 sẽ được chấm điểm tự động và được xếp hạng trên leaderboard real-time tương tự thể thức thi đấu của các nền tảng uy tín trên thế giới. Thời gian thi đấu diễn ra liên tục từ 04/11 - 06/12/2022.

Chương trình năm nay nâng tổng giá trị giải thưởng lên 15.000 USD. Trong đó, 3 đội quán quân tương ứng với 3 bảng thi đấu sẽ nhận được phần thưởng 3.500 USD/giải, 3 đội á quân sẽ giành về 1.500 USD/giải./.

PV