Make in Viet Nam

Startup tiên phong ứng dụng công nghệ giọng nói tại Việt Nam

Hoàng Linh 14:28 05/08/2025

Xác thực bằng giọng nói đang trở thành xu hướng khi mang lại những lợi ích thiết thực cho người sử dụng. Và tại Việt Nam, Namitech - một startup Việt đang tiên phong về ứng dụng giọng nói vào xác thực, định danh trong các giao dịch của đời sống, xã hội.

Vì sao lại ứng dụng giọng nói?

Nhiều người dùng hiện nay giao dịch với ngân hàng, công ty bảo hiểm, thực hiện dịch vụ công, đặt xe công nghệ… đều phải trải qua cách xác thực định danh thường gặp là mật khẩu (password), OTP, thông qua ứng dụng (app). Một số giao dịch ngân hàng thậm chí còn đòi hỏi người dùng phải trả lời một số thông tin bí mật để xác thực.

Gần đây, việc sử dụng công nghệ sinh trắc học như gương mặt, vân tay trên những thiết bị thông minh để xác thực, định danh đang ngày càng trở nên phổ biến. Còn khi xác thực bằng sinh trắc học giọng nói thì người dùng chỉ cần nói và không cần nhớ mật khẩu, hay phải bước ra chỗ sáng để nhận diện được khuôn mặt.

xac-thuc-giong-noi.jpg

Trên thế giới từ năm 2015, cơ quan thuế của Anh đã áp dụng sinh trắc học giọng nói. Cơ quan này đã thu được hơn 7 triệu mẫu giọng công dân chỉ sau 1 năm áp dụng thông qua tổng đài hỗ trợ khách hàng và app.

Trong khi đó, tại Úc, trong 3 năm từ 2015 - 2018, cơ quan thuế của nước này đã thu được hơn 3 triệu mẫu giọng nói của công dân và dùng chính mẫu giọng này để xác thực cho gần 5 triệu giao dịch khi công dân tương tác với cơ quan thuế.

Tương tự, cơ quan thuế của New Zealand đã thu thập được 2,1 triệu mẫu giọng nói của người dân, tương đương 75% dân số, để sử dụng nộp thuế trong 3 năm triển khai từ 2018 - 2021. Còn tại Mỹ, năm 2021, Chính phủ nước này đã áp dụng sinh trắc học giọng nói vào một số hoạt động an sinh xã hội.

Trong lĩnh vực ngân hàng, ngân hàng Barclay của Anh từ năm 2013 đã sử dụng sinh trắc học giọng nói cho tổng đài chăm sóc khách hàng (CSKH). Khách hàng sử dụng câu nói “your voice is your password” là đã đủ để có thể xác thực mẫu giọng khi tương tác với tổng đài.

Ngân hàng HSBC từ năm 2015 đã sử dụng sinh trắc học giọng nói để thay thế cho việc nhập mã PIN và đã áp dụng cho hơn 15 triệu khách hàng. Con số này hiện nay đã tăng hơn rất nhiều.

Citibank, trong đó có Citibank Việt Nam, từ năm 2018 đã sử dụng sinh trắc học giọng nói cho tổng đài CSKH cũng như cho phép người dùng đăng nhập (login) vào app thông qua sinh trắc học giọng nói.

Ở Việt Nam, có hai ngân hàng tiên phong ứng dụng sinh trắc học giọng nói là TPBank và VPBank từ những năm 2018 - 2020 nhưng là giải pháp của nước ngoài.

Những số liệu này cho thấy các nước đã nhìn nhận sự khả thi rất lớn của việc áp dụng sinh trắc học giọng nói trong các lĩnh vực, trong đó có dịch vụ công.

Giải pháp “Make in Viet Nam” ứng dụng công nghệ giọng nói

Nhận thấy tiềm năng và những lợi ích to lớn của công nghệ sinh trắc học giọng nói, bà Trang Đỗ, đồng sáng lập công ty khởi nghiệp Namitech cho biết công ty đã sáng tạo và đẩy mạnh ứng dụng công nghệ sinh trắc học giọng nói (voice biometric).

Giải pháp này đang được áp dụng phổ biến trong lĩnh vực tài chính, ngân hàng và đang được mở rộng sang các lĩnh vực khác. Cụ thể, ba ngân hàng VIB, Eximbank và VietinBank đã áp dụng giải pháp sinh trắc học giọng nói “Make in Viet Nam” của Namitech cho các tổng đài của các ngân hàng này.

Theo bà Trang Đỗ, thường các giải pháp sinh trắc học giọng nói của nước ngoài khi lấy mẫu giọng nói của khách hàng để xác thực, khách hàng phải nói một đoạn rất dài tới gần 1 phút. Với giải pháp “Make in Viet Nam”, khách hàng chỉ cần nói hoặc trả lời một vài câu đơn giản trong khoảng thời gian 10 - 15 giây là đã đủ thời lượng để đăng ký mẫu giọng.

ba-trang-do.jpeg
Bà Trang Đỗ: Với giải pháp “Make in Viet Nam”, khách hàng chỉ cần nói hoặc trả lời một vài đâu đơn giản trong khoảng thời gian 10 - 15 giây là đã đủ thời lượng để đăng ký mẫu giọng.

Với lợi thế này, khách hàng của ba ngân hàng Việt Nam VIB, Eximbank, VietinBank có thể sử dụng giọng nói của của khách hàng đã được lấy mẫu để lần tiếp sau khách hàng gọi điện đến tổng đài đã có thể được tự động xác thực giao dịch, vừa nhanh chóng vừa đảm bảo độ chính xác cao.

xac-thuc-bang-giong-noi.jpg

Các công ty bảo hiểm nhân thọ cũng đang là những đơn vị tiên phong sử dụng sinh trắc học giọng nói trong các hoạt động kinh doanh.

“Chúng tôi làm việc với các công ty bảo hiểm hàng đầu ở Việt Nam và áp dụng sinh trắc học giọng nói trong việc ghi âm khi tư vấn viên giao dịch với khách hàng. Khi thực hiện ghi âm, mẫu giọng nói của tư vấn viên và của khách hàng đã được lấy mẫu để xác thực. Bằng công nghệ này, chúng tôi đã giúp các công ty bảo hiểm phòng tránh được rất nhiều rủi ro gian lận về bảo hiểm trong suốt thời gian vừa qua”.

“Những ví dụ cho thấy sinh trắc học không phải là chuyện ở nước ngoài và không phải là tương lai nữa mà đã đang áp dụng phổ biến ở Việt Nam và đã “chạy” thực tế xung quanh chúng ta”, bà Trang Đỗ chia sẻ thêm.

Ưu việt của công nghệ Việt

Theo bà Trang Đỗ, khách hàng đăng ký giọng nói sinh trắc học bằng giải pháp của Việt Nam chỉ mất thời gian cực ngắn như trên đã trao đổi. Với công nghệ Việt Nam, việc đăng ký mẫu giọng nói chỉ cần 10 giây và thậm chí với chỉ 2 - 3 câu nói của khách hàng được ghép lại là cũng đã đủ thời lượng để đăng ký mẫu giọng nói. Việc này làm cho tốc độ triển khai lấy mẫu giọng nói nhanh hơn nhiều.

Tiếp theo, một ưu việt nữa của giải pháp này là việc xác thực khách hàng chỉ mất 1/2 thời gian so với các giải pháp từ nước ngoài. Cụ thể, các giải pháp nước ngoài cần từ 10 - 12 giây, giải pháp của Namitech cần 3 - 5 giây là đã có thể xác thực, định danh khách hàng.

Một điểm đáng chú ý nữa là giải pháp của Việt Nam có thể đáp ứng môi trường tiếng ồn lớn như trong quán café, ở cổng trường học giờ tan trường, với mức chỉ số tín hiệu trên nhiễu (SNR) chỉ 5 - 8 dB đã có thể đăng ký, xác thực bằng giọng nói. Giải pháp của nước ngoài yêu cầu là phải thu âm, xác thực và đăng ký trong môi trường cực kỳ yên tĩnh, kín, tức là SNR phải đạt mức 20 dB.

Bà Trang Đỗ cho biết: “Đây là 1 đòn “knock-out” mà công nghệ Việt có thể sử dụng để có thể “đánh thắng” được các giải pháp đến từ nước ngoài. Đồng thời, giải pháp có tính năng chống giả mạo cao như có thể phát hiện được trường hợp sử dụng công nghệ deepfake, audio giả mạo".

Đây là 1 đòn “knock-out” mà công nghệ Việt có thể sử dụng để có thể “đánh thắng” được các giải pháp đến từ nước ngoài. Đồng thời, giải pháp có tính năng chống giả mạo cao như có thể phát hiện được trường hợp sử dụng công nghệ deepfake, audio giả mạo.

Theo bà Trang Đỗ, Luật Căn cước công dân năm 2023 là cơ sở pháp lý cao nhất khi nêu rõ sinh trắc học giọng nói là một trong những yếu tố được thu thập và lưu trữ trong cơ sở dữ liệu quốc gia về dân cư. Ngoài việc có gương mặt, vân tay, mống mắt, sinh trắc học giọng nói, ADN cũng là một trong những yếu tố để xác thực một công dân. Đây là cơ sở để cho phép sử dụng sinh trắc học giọng nói giống như những phương pháp sinh trắc học khác để xác thực khách hàng trong những tương tác giao dịch số.

“Đây là một bước tiến khá táo bạo để tạo ra một hệ thống CSDL công dân đa sinh trắc để có thể dễ dàng ứng dụng trong nhiều ứng dụng”.

Bên cạnh đó, bà Trang Đỗ chia sẻ Namitech cũng giới thiệu Voicewallet để thay thế cho những phương thức xác thực cần phải ghi nhớ và có thể dùng chính giọng nói của mình để tham gia vào những tương tác trên không gian chuỗi khối (blockchain).

Cụ thể, thay vì việc đăng nhập với nhiều thao tác, người dùng có thể dùng giọng nói của mình để chuyển tiền cho người nào đó trong danh sách liên hệ (contact list) mà không phải dùng USB Token. Sau khi hệ thống bóc tách được nhu cầu thì đồng thời sẽ xác thực được giọng nói này có phải là giọng nói “chính chủ” của người dùng đã đăng ký tài khoản hay không và bước tiếp theo, hệ thống smart contract tiếp tục thực thi những giao dịch của khách hàng.

Bà Trang Đỗ tin tưởng trong tương lai, công nghệ blockchain ngày càng phát triển trở thành công nghệ lõi và sẽ được ứng dụng cho nhiều dịch vụ công như đăng ký cấp phép lại bằng lái xe, yêu cầu trợ cấp hoặc được sử dụng xác thực những hợp đồng điện tử (e-contract) được thực hiện trên không gian số, cũng như nhiều ứng dụng khác.

“Khi các dịch vụ công ngày càng được mở rộng thì ứng dụng Voicewallet cũng sẽ được mở rộng theo. Chuyển đổi số quốc gia không chỉ là chuyện công nghệ - mà là câu chuyện về sự đơn giản hoá, tiện lợi hoá và bình đẳng hoá trong tiếp cận dịch vụ. Giọng nói là một trong những chìa khoá mở ra cánh cửa ấy”, bà Trang Đỗ bày tỏ./.

Bài liên quan
Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
Startup tiên phong ứng dụng công nghệ giọng nói tại Việt Nam
POWERED BY ONECMS - A PRODUCT OF NEKO