Viettel AI lần thứ 2 liên tiếp dẫn đầu ở hạng mục Nhận dạng tiếng nói

PV| 01/12/2022 14:35
Theo dõi ICTVietnam trên

Đây là năm thứ 2 liên tiếp Viettel AI giành giải Nhất tại hạng mục Nhận dạng tiếng nói, cuộc thi VLSP 2022 (Vietnamese Language and Speech Processing), thuộc khuôn khổ Hội thảo Quốc tế lần thứ 9 về xử lý ngôn ngữ và tiếng nói tiếng Việt do CLB VLSP, Chi hội của Hội Tin học Việt Nam tổ chức.

Là hội thảo uy tín được tổ chức thường niên trong lĩnh vực xử lý ngôn ngữ và tiếng nói tiếng Việt, VLSP 2022 là nơi quy tụ các nhà nghiên cứu, chuyên gia và đơn vị nghiên cứu, phát triển công nghệ hàng đầu.

Nhận dạng tiếng nói (Automatic Speech Recognition) là một trong những bài toán quan trọng nhất của xử lý tiếng nói nhằm chuyển đổi tín hiệu tiếng nói đầu vào thành văn bản tương ứng. Các đội thi được yêu cầu nhận dạng các bài giảng trực tuyến nhằm phục vụ nhu cầu tự động phân loại, đánh chỉ mục, tìm kiếm nội dung bài giảng… từ kho dữ liệu.

Tiếp cận vấn đề theo hướng tận dụng hiệu quả nguồn dữ liệu thô không nhãn thay vì chỉ tập trung vào dữ liệu gán nhãn như thông thường, giải pháp của Viettel AI, do Trung tâm Không gian mạng Viettel phát triển, đã ứng dụng một số cải tiến quan trọng như phương pháp che tín hiệu tiếng nói ở cả miền thời gian và miền tần số hay thay thế mô hình Transformer bằng mô hình Conformer tiên tiến hơn… Những cải tiến này đã giúp Viettel AI giải quyết hiệu quả cả 2 bộ dữ liệu tại hạng mục Nhận dạng tiếng nói với tỷ lệ chính xác lên đến 92,03%, trong khi độ chính xác của các nhóm còn lại là từ 67,24 - 89,79%.

Đây là năm thứ 3 và là năm thứ 2 liên tiếp Viettel AI chiến thắng tại cuộc thi VLSP. Bên cạnh 02 giải Nhất tại hạng mục Nhận dạng tiếng nói, Viettel AI cũng đạt giải Nhì tại hạng mục Tổng hợp tiếng nói có cảm xúc (Emotional Speech Synthesis).

Tiên phong phát triển và ứng dụng công nghệ hàng đầu về xử lý tiếng nói, các sản phẩm thuộc hệ sinh thái trí tuệ nhân tạo Viettel AI như trợ lý ảo, tổng đài ảo… có thể tương tác hơn 2.600 kịch bản hội thoại với độ chính xác hơn 96%, giọng nói truyền cảm, độ tự nhiên đạt 95% giọng người thật. Hiện nay, các sản phẩm này đã được ứng dụng rộng rãi tại nhiều doanh nghiệp, cơ quan nhà nước tại các tỉnh thành trên toàn quốc và sẽ tiếp tục được phát triển, nâng cấp liên tục để tăng mức độ chính xác, khả năng hiểu ý định người dùng và hiệu suất làm việc.

Trong những năm gần đây, hội thảo VLSP tập trung tổ chức các cuộc thi về xử lý ngôn ngữ, nhằm thúc đẩy phát triển nghiên cứu cũng như tạo ra các bộ dữ liệu chung chia sẻ cho cộng đồng nghiên cứu VLSP. Năm 2022, cuộc thi thu hút đông đảo các đội dự thi đến từ các trường đại học nổi tiếng trong và ngoài nước như Đại học Stanford - Hoa Kỳ, Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST), cũng như các đội đến từ các doanh nghiệp công nghệ lớn như Viettel, Vin Group, FPT./.

Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
Viettel AI lần thứ 2 liên tiếp dẫn đầu ở hạng mục Nhận dạng tiếng nói
POWERED BY ONECMS - A PRODUCT OF NEKO