Viettel AI lần thứ 2 liên tiếp dẫn đầu ở hạng mục Nhận dạng tiếng nói

PV| 01/12/2022 14:35
Theo dõi ICTVietnam trên

Đây là năm thứ 2 liên tiếp Viettel AI giành giải Nhất tại hạng mục Nhận dạng tiếng nói, cuộc thi VLSP 2022 (Vietnamese Language and Speech Processing), thuộc khuôn khổ Hội thảo Quốc tế lần thứ 9 về xử lý ngôn ngữ và tiếng nói tiếng Việt do CLB VLSP, Chi hội của Hội Tin học Việt Nam tổ chức.

Là hội thảo uy tín được tổ chức thường niên trong lĩnh vực xử lý ngôn ngữ và tiếng nói tiếng Việt, VLSP 2022 là nơi quy tụ các nhà nghiên cứu, chuyên gia và đơn vị nghiên cứu, phát triển công nghệ hàng đầu.

Nhận dạng tiếng nói (Automatic Speech Recognition) là một trong những bài toán quan trọng nhất của xử lý tiếng nói nhằm chuyển đổi tín hiệu tiếng nói đầu vào thành văn bản tương ứng. Các đội thi được yêu cầu nhận dạng các bài giảng trực tuyến nhằm phục vụ nhu cầu tự động phân loại, đánh chỉ mục, tìm kiếm nội dung bài giảng… từ kho dữ liệu.

Tiếp cận vấn đề theo hướng tận dụng hiệu quả nguồn dữ liệu thô không nhãn thay vì chỉ tập trung vào dữ liệu gán nhãn như thông thường, giải pháp của Viettel AI, do Trung tâm Không gian mạng Viettel phát triển, đã ứng dụng một số cải tiến quan trọng như phương pháp che tín hiệu tiếng nói ở cả miền thời gian và miền tần số hay thay thế mô hình Transformer bằng mô hình Conformer tiên tiến hơn… Những cải tiến này đã giúp Viettel AI giải quyết hiệu quả cả 2 bộ dữ liệu tại hạng mục Nhận dạng tiếng nói với tỷ lệ chính xác lên đến 92,03%, trong khi độ chính xác của các nhóm còn lại là từ 67,24 - 89,79%.

Đây là năm thứ 3 và là năm thứ 2 liên tiếp Viettel AI chiến thắng tại cuộc thi VLSP. Bên cạnh 02 giải Nhất tại hạng mục Nhận dạng tiếng nói, Viettel AI cũng đạt giải Nhì tại hạng mục Tổng hợp tiếng nói có cảm xúc (Emotional Speech Synthesis).

Tiên phong phát triển và ứng dụng công nghệ hàng đầu về xử lý tiếng nói, các sản phẩm thuộc hệ sinh thái trí tuệ nhân tạo Viettel AI như trợ lý ảo, tổng đài ảo… có thể tương tác hơn 2.600 kịch bản hội thoại với độ chính xác hơn 96%, giọng nói truyền cảm, độ tự nhiên đạt 95% giọng người thật. Hiện nay, các sản phẩm này đã được ứng dụng rộng rãi tại nhiều doanh nghiệp, cơ quan nhà nước tại các tỉnh thành trên toàn quốc và sẽ tiếp tục được phát triển, nâng cấp liên tục để tăng mức độ chính xác, khả năng hiểu ý định người dùng và hiệu suất làm việc.

Trong những năm gần đây, hội thảo VLSP tập trung tổ chức các cuộc thi về xử lý ngôn ngữ, nhằm thúc đẩy phát triển nghiên cứu cũng như tạo ra các bộ dữ liệu chung chia sẻ cho cộng đồng nghiên cứu VLSP. Năm 2022, cuộc thi thu hút đông đảo các đội dự thi đến từ các trường đại học nổi tiếng trong và ngoài nước như Đại học Stanford - Hoa Kỳ, Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST), cũng như các đội đến từ các doanh nghiệp công nghệ lớn như Viettel, Vin Group, FPT./.

Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
  • Khai thác dữ liệu phục vụ chỉ đạo, điều hành tại trung tâm IOC: Kinh nghiệm của Bình Phước
    Xác định dữ liệu là nguồn tài nguyên quý trong kỷ nguyên số - một trong những yếu tố quan trọng quyết định sự thành công của quá trình chuyển đổi số (CĐS), tỉnh Bình Phước đã sớm tập trung quan tâm tạo lập, khai thác, sử dụng, tăng cường chia sẻ, kết nối dữ liệu số cùng với việc thành lập IOC và những kết quả bước đầu thu được rất đáng ghi nhận.
  • Những người làm báo từ rừng về phố
    Ngày 30/4/1975, trong những cánh Giải phóng quân từ khắp nẻo tiến về Sài Gòn, có cả một đội quân nhà báo xuất phát từ các chiến khu hoặc hành quân theo các binh chủng, đã kịp thời có mặt, chứng kiến giây phút trọng đại: Giải phóng hoàn toàn miền nam, thống nhất đất nước.
  • Háo hức khám phá di tích lịch sử theo một cách mới
    Ứng dụng công nghệ số giúp nhiều du khách gia tăng trải nghiệm thú vị khi tới thăm các di tích lịch sử như Địa đạo Củ Chi, Dinh Độc Lập…
  • Mỹ phạt nhà mạng vì chia sẻ vị trí của người dùng
    Chính phủ Mỹ đã đưa ra mức phạt hàng triệu USD đối với các nhà mạng AT&T, Sprint, T-Mobile và Verizon sau một cuộc điều tra cho thấy các nhà mạng lớn của nước này đã chia sẻ bất hợp pháp dữ liệu cá nhân của thuê bao mà không có sự đồng ý của họ.
  • Các công cụ bảo mật đám mây dựa trên AI
    Ngày nay, AI tiên tiến đang được đưa vào sử dụng ở mọi loại hình doanh nghiệp (AI). Một loạt các nhà cung cấp bảo mật bên thứ ba đã phát hành các công cụ bảo mật đám mây dưới sự hỗ trợ của AI. Dường như đây là một trong những xu hướng nóng nhất trong ngành.
  • Oracle đầu tư mạnh vào AI tạo sinh, đáp ứng xu hướng "chủ quyền dữ liệu"
    Nhà cung cấp dịch vụ cơ sở hạ tầng đám mây của Hoa Kỳ Oracle đang tăng cường các tính năng trí tuệ nhân tạo (AI) tạo sinh của mình khi cạnh tranh trên thị trường điện toán đám mây (ĐTĐM) ngày càng khốc liệt và ngày càng có nhiều công ty nhảy vào lĩnh vực AI.
  • Mỹ lập hội đồng khuyến nghị ứng dụng AI an toàn cho hạ tầng trọng yếu
    Chính phủ Mỹ đã yêu cầu các công ty trí tuệ nhân tạo (AI) đưa ra khuyến nghị cách sử dụng công nghệ AI để bảo vệ các hãng hàng không, dịch vụ công cộng và cơ sở hạ tầng trọng yếu khác, đặc biệt là chống các cuộc tấn công sử dụng AI.
  • Làm gì để phát triển tài năng chuyển đổi?
    Partha Srinivasa, Giám đốc CNTT (CIO) của nhà cung cấp bảo hiểm tài sản và tai nạn Erie có trụ sở tại Pennsylvania, Mỹ đã chia sẻ về cách tiếp cận của ông trong việc xây dựng đội ngũ nhân viên có tinh thần chuyển đổi.
  • Báo chí ở mặt trận Điện Biên Phủ
    Chiến dịch Điện Biên Phủ là cuộc “hội quân” của cả nước. Trong cuộc “hội quân” lịch sử đó có sự tham gia và đóng góp không nhỏ của “đội quân báo chí”.
  • Những ấn phẩm đặc biệt kỷ niệm 70 năm chiến thắng Điện Biên Phủ
    Bộ ấn phẩm kỉ niệm 70 năm chiến thắng Điện Biên Phủ do Nhà xuất bản (NXB) Kim Đồng ấn hành, góp phần nhắc nhớ thế hệ trẻ về một thời hoa lửa, tự hào về khí phách Việt Nam, biết ơn các thế hệ cha anh đi trước, và trân trọng nền hòa bình mà chúng ta đang sống hôm nay.
Viettel AI lần thứ 2 liên tiếp dẫn đầu ở hạng mục Nhận dạng tiếng nói
POWERED BY ONECMS - A PRODUCT OF NEKO