Ra mắt 2 nền tảng xử lý giọng nói tiếng Việt ứng dụng AI

VAIS và Vbee là hai công nghệ lõi trong nền tảng công nghệ xử lý giọng nói tiếng Việt ứng dụng trí tuệ nhân tạo (AI) tiên phong tại Việt Nam.
16:23 PM 19/06/2020 In bài viết này

Ngày 19/6/2020, Bộ TT&TT đã tổ chức Lễ ra mắt nền tảng công nghệ xử lý giọng nói tiếng Việt ứng dụng trí tuệ nhân tạo VAIS và Vbee. Hoạt động này nằm trong chuỗi sự kiện giới thiệu các nền tảng số "Make in Vietnam", nhằm thực hiện "Chương trình Chuyển đổi số quốc gia đến năm 2025, định hướng đến năm 2030" vừa được Thủ tướng Chính phủ phê duyệt.

Với chiều sâu nghiên cứu về công nghệ nói chung và đặc thù ngôn ngữ tiếng Việt nói riêng, công nghệ của VAIS và Vbee đã giải quyết triệt để những vấn đề mà các giải pháp dành cho tiếng Việt của nước ngoài chưa khắc phục được.

Ra mắt 2 nền tảng xử lý giọng nói tiếng Việt ứng dụng AI thiết thực - Ảnh 1.

Thứ trưởng Nguyễn Thành Hưng: cả VAIS và Vbee đều đứng trước thị trường rộng lớn với hơn 96 triệu dân

Phát biểu tại Lễ ra mắt, Thứ trưởng Bộ TT&TT Nguyễn Thành Hưng cho biết: Nền tảng VAIS hiện đã được nhiều cơ quan nhà nước ở Trung ương và địa phương sử dụng như Văn phòng Trung ương Đảng, Văn phòng Chính phủ, Văn phòng Quốc hội, Bộ TT&TT, UBND TP. Hà Nội, cùng hơn 50 đơn vị báo chí, truyền hình để phục vụ gỡ băng các bài phát biểu tại nhiều kỳ họp, sự kiện.

Trong khi đó, nền tảng Vbee đã cung cấp dịch vụ cho hơn 20.000 khách hàng cá nhân, hơn 500 doanh nghiệp (DN), tổng công ty, sử dụng rộng rãi trong 3 lĩnh vực chính: Tổng đài tự động, giải pháp tương tác thiết bị thông minh, nội dung số tự động.

Xu thế tự động hóa và tương tác giọng nói trên các thiết bị thông minh như nhà thông minh, thiết bị trên ô tô, giao thông thông minh, thành phố thông minh, tương tác người máy… chắc chắn là xu thế bắt buộc trong cuộc cách mạng công nghệ 4.0.

Theo Thứ trưởng, cả VAIS và Vbee đều đứng trước thị trường rộng lớn với hơn 96 triệu dân, 700.000 DN, 126 triệu thuê bao điện thoại di động, tỷ lệ người sử dụng Internet đạt 68,7% (số liệu thống kê năm 2019). Ngoài ra, nền tảng chuyển đổi giọng nói tiếng Việt thành văn bản VAIS cũng có tiềm năng lớn với khối cơ quan nhà nước với 22 Bộ, cơ quan ngang bộ, 8 cơ quan thuộc Chính phủ, 63 tỉnh, thành phố trực thuộc Trung ương bao gồm toàn bộ các cơ quan hành chính, đơn vị sự nghiệp các cấp.

Đặc biệt, công nghệ giọng nói tiếng Việt có thể được ứng dụng vào các sản phẩm và dịch vụ, cung cấp cho cộng đồng người khiếm thị và người bị câm, giúp người khuyết tật dễ dàng tiếp cận thông tin và sản xuất thông tin, mang lại ý nghĩa xã hội to lớn.

Thứ trưởng tin tưởng với năng lực sáng tạo của DN công nghệ số Việt Nam và tiềm năng to lớn của thị trường trong nước, sẽ có ngày càng nhiều các nền tảng số tham gia "Chương trình Chuyển đổi số quốc gia", góp phần thúc đẩy mạnh mẽ tiến trình chuyển đổi số trong chính phủ, kinh tế và xã hội.

Chia sẻ thêm về các sản phẩm "Make in Vietnam" đã được công bố, ông Nguyễn Huy Dũng, Cục trưởng Cục Tin học hoá, Bộ TT&TT cho biết, cho tới nay, Bộ TT&TT đã ra mắt 10 nền tảng khác nhau, có những nền tảng mới và những nền tảng đã được thị trường chấp nhận, sử dụng phổ biến.

Các nền tảng của Việt Nam có chất lượng không thua kém các sản phẩm tương tự của nước ngoài, thậm chí một số sản phẩm ở lĩnh vực ngách còn tốt hơn, như nền tảng xử lý nhận dạng giọng nói tiếng Việt, hay nền tảng học trực trực tuyến khi kết hợp học, thi và quản lý giáo dục.

Những đặc trưng của VAIS

VAIS là nền tảng công nghệ lõi chuyển giọng nói tiếng Việt thành văn bản (Speech To Text) tiên phong tại Việt Nam.

Giải pháp nhận dạng được đầy đủ giọng nói cả 3 miền Bắc, Trung, Nam với độ chính xác lên đến 95%. Chuyển đổi giọng nói tiếng Việt thành văn bản với kết quả tức thì, tốc độ vượt trội có thể nhanh gấp 500 lần thời lượng âm thanh. Nhận dạng tốt trong môi trường nhiễu và ở khoảng cách xa. Đặc biệt, nền tảng này có tính năng chuẩn hóa văn bản đầu ra: tên riêng, ngày, tháng, số,… hỗ trợ nhiều loại định dạng âm thanh đầu vào.

Ứng dụng nhận dạng tiếng nói không cần mạng: 3 Cách điều khiển nhà thông minh Lumi (Nguồn: vtv)

Giải pháp được cung cấp cho người dùng trực tiếp hoặc kết nối thông qua API tại: https://vais.vn/.

Những đặc trực của Vbee

Vbee là nền tảng công nghệ lõi về giọng nói nhân tạo Việt có cảm xúc (chuyển đổi văn bản thành giọng nói AI tiếng Việt có cảm xúc - Text To Speech) tiên phong tại Việt Nam.

Với hơn 10 năm nghiên cứu và phát triển chuyên sâu, công nghệ Vbee những đặc trưng sau: có thể học theo bất kỳ giọng của một người nào đó trong vòng 4 giờ đồng hồ với độ tương tự trên 95%; Giọng nói Vbee đa dạng vùng miền (Bắc, Trung, Nam...), giới tính và độ tuổi (nam, nữ); Giọng nói Vbee đa dạng độ tuổi, giới tính (nam, nữ).

Vbee sử dụng rộng rãi trong 3 lĩnh vực chính: Tổng đài tự động, giải pháp tương tác thiết bị thông minh, nội dung số tự động

Công nghệ giọng nói nhân tạo Vbee có thể dự đoán cách đọc, các từ viết tắt, từ vay mượn, các từ ngữ đặc trưng của tiếng Việt mà các giải pháp nước ngoài không thể. Vbee xây dựng thành công nền tảng Vbee cloud (https://www.vbee.vn), cho phép người sử dụng, DN, lập trình viên có thể sử dụng trực tiếp hoặc qua tích hợp (API) một cách dễ dàng và thuận tiện.

Mặt khác, Vbee đã tích hợp toàn diện các giải pháp trong các lĩnh vực sử dụng giọng nói nhân tạo của Vbee như: giải pháp về nội dung nhân tạo (sách nói, báo nói, lồng tiếng phim tự động, thu âm tự động…), giải pháp về tổng đài nhân tạo (vận tải, tài chính, thương mại điện tử…), giải pháp nhà thông minh (giao tiếp với thiết bị qua ngôn ngữ), giải pháp chatbot chăm sóc, tư vấn khách hàng.

Ra mắt 2 nền tảng xử lý giọng nói tiếng Việt ứng dụng AI thiết thực - Ảnh 2.

Đại diện của VAIS và Vbee: con người và máy móc sẽ trao đổi và "hiểu nhau" thông qua ngôn ngữ tự nhiên

Theo đại diện của VAIS và Vbee, trong xu hướng chuyển đổi số nói chung, việc ứng dụng giọng nói nhân tạo và công nghệ xử lý tiếng nói là một xu hướng tất yếu không thể tránh khỏi.

Thế giới đã chứng kiến sự đổi mới mạnh mẽ trong mọi dịch vụ nhờ áp dụng công nghệ giọng nói nhân tạo, như tổng đài AI tự động tra cứu và trả lời khách hàng thay cho con người, các lĩnh vực như trợ lý ảo thông minh, lĩnh vực giao tiếp người máy (robot, nhà thông minh, giao thông thông minh, thành phố thông minh…). Đã tới lúc, tất cả dịch vụ, con người và máy móc sẽ trao đổi và "hiểu nhau" thông qua ngôn ngữ tự nhiên thay cho phím bấm và các tần số điều khiển.

Dựa vào xu hướng và tình hình thực tế tại Việt Nam, quá trình chuyển đổi số chắc chắn không thể tránh khỏi, do đó chúng ta cần xây dựng và làm chủ những công nghệ lõi và hệ sinh thái các dịch vụ sử dụng công nghệ tiếng nói.

Việc xây dựng các công nghệ lõi này không những khắc phục được những đặc thù của ngôn ngữ Việt Nam mà còn giúp chúng ta chủ động triển khai dịch vụ một cách phù hợp, tiết kiệm chi phí, tăng tính bảo mật an ninh thông tin quốc gia. Công nghệ lõi về xử lý giọng nói tiếng Việt sẽ giúp Việt Nam mở rộng cơ hội trong mọi lĩnh vực chuyển đổi số.

Ưu đãi sử dụng nền tảng

Để kích cầu cho khách hàng DN, VAIS đang có chương trình hỗ trợ cộng động và các DN như: Cung cấp 3 tháng sử dụng API miễn phí 200 giờ/ đơn vị.

Để kích cầu cho khách hàng DN, VBEE đang có chương trình hỗ trợ cộng động và các DN như: Miễn phí 100% chi phí Vbee Text To Speech API cho toàn bộ học sinh, sinh viên, lập trình viên và các startup trong 6 tháng; Hỗ trợ 100% chi phí cho các tổ chức xã hội có nhu cầu sử dụng giọng nói nhân tạo Vbee; Hỗ trợ miễn phí cài đặt và 6 tháng sử dụng cho các Báo, Đài và các trang tin chính thống thuộc Chính phủ, Bộ, Sở Ban ngành

VBEE cũng tư vấn miễn phí giải pháp về tổng đài nhân tạo cho DN, tổ chức và miễn phí 1000 cuộc gọi thử nghiệm.

Lan Phương
Xem thêm