Xu hướng - Dự báo

‏Trí tuệ nhân tạo “đặt chân” vào thế giới ngôn ngữ tiếng Việt‏

NK 09:29 15/06/2023

‏Việc kết hợp giữa ngôn ngữ và khoa học máy tính không chỉ giúp con người học ngoại ngữ nhanh hơn mà còn giúp trí tuệ nhân tạo (AI) có thể “hiểu” và “phản hồi” ngôn ngữ tự nhiên tốt hơn.

tri-tue-nhan-tao-1(1).jpeg
Hiện rất nhiều các ứng dụng AI đã ra đời nhằm hỗ trợ quá trình dạy - học trở nên nhanh chóng, hiệu quả hơn.

‏Kết hợp AI “dạy” tiếng Việt‏

‏Lãnh đạo‏‏ của một doanh nghiệp (DN) ‏‏có vốn đầu tư tiếp trực tiếp nước ngoài (FDI) tại Việt Nam ‏‏mong muốn học tiếng Việt nhanh, đọc được 90% nội dung các văn bản thông thường. Tuy nhiên, vị lãnh đạo này quá bận và chỉ có khoảng thời gian 1 tiếng (từ 12 - 13 giờ trưa mỗi ngày) để học. Vậy, cần áp dụng công nghệ vào phần mềm học ngôn ngữ ra sao để giúp ‏‏ông ‏‏học ngoại ngữ nhanh?‏

‏Trên đây là ‏‏bài toán ‏‏của vị ‏‏lãnh đạo công ty FDI đặt ra ‏‏với PGS. TS Đinh Điền, Giám đốc Trung tâm Ngôn ngữ học tính toán, Trường Đại học (ĐH) Khoa học tự nhiên, ĐH Quốc gia TP. HCM đưa ra.‏

‏Là người có nhiều đề tài nghiên cứu khoa học và ‏‏công trình công bố‏‏ quốc tế về áp dụng AI trong dịch máy, ngôn ngữ học đối chiếu và dạy tiếng Việt cho người nước ngoài‏‏,‏‏ PGS. Điền cho rằng, ứng dụng AI rất cần thiết để giải quyết các vấn đề tr‏‏ong‏‏ ngôn ngữ học.‏

‏Cụ thể, bước đầu tiên của việc học bất kỳ một ngôn ngữ nào là dạy ngữ âm. Rào cản ở đây là tiếng Việt có thanh điệu, do đó, khi dạy cho những người học thuộc hệ ngôn ngữ không có thanh điệu như người Anh, Pháp… sẽ rất khó. Đơn cử, thay vì hỏi: “Bạn đi ‏‏ngủ‏‏ chưa?” thì người học sẽ nói “Bạn đi ‏‏ngu‏‏ chưa?”, bởi, họ không phân biệt được thanh điệu. Cần dạy họ đặt lưỡi ở đâu khi phát âm, khẩu hình miệng ra sao, tiếng phát âm ra đúng hay sai‏‏ khác nhau như thế nào.‏

‏Lúc này, phần mềm ứng dụng AI trong dạy ngoại ngữ có thể mô phỏng khẩu hình miệng, phát âm sẵn để người học bắt chước. Sau đó, người học tập phát âm lại, thu vào phần mềm, sử dụng công nghệ đối sánh giữa phát âm của người học và phát âm chuẩn từ phần mềm, cải thiện nhanh khả năng phát âm. Tất cả các công đoạn trên đều bắt buộc phải ứng dụng AI. ‏

‏Một dẫn chứng khác, theo Từ điển tiếng Việt của Viện Ngôn ngữ học do cố GS. Hoàng Phê chủ biên, vốn từ gốc tiếng Việt có khoảng 34.000 từ, tính toán cho thấy, cần dạy khoảng 10% số lượng từ cho máy, tương đương 3.400 từ thông dụng, là máy có thể đọc khoảng 90% văn bản tiếng Việt thông thường. Để có được ‏‏dữ liệu‏‏ thống kê này, PGS Điền buộc phải sử dụng AI, gán nhãn lên hệ thống từ vựng trong kho ngữ liệu ti‏‏ếng Việt‏‏.‏

‏Có thể nói, AI đã thay đổi cách dạy - học của ngành giáo dục. Thực tế, rất nhiều các ứng dụng AI đã ra đời nhằm hỗ trợ quá trình dạy - học trở nên nhanh chóng, hiệu quả hơn. ‏

423-202306141814204.jpg

‏Câu chuyện kết hợp giữa khoa học máy tính và ngôn ngữ học khá thú vị trên cho thấy, quá trình để ‏‏huấn luyện‏‏, ứng dụng AI vào thực tiễn là rất cần thiết, song không dễ. Các dữ liệu cần được phân tách theo nhiều lớp định danh, ở mỗi lớp sẽ phải xử lý tiếp từng biến số với những định danh cụ thể khác nhau nữa. ‏

‏Khi máy móc học ngôn ngữ...‏

‏Không chỉ giúp con người học ngôn ngữ, AI còn giúp hệ thống các trợ lý thông minh hiểu ngôn ngữ tốt hơn. Máy móc được huấn luyện và tiến bộ mỗi ngày. ‏

‏Tương tự c‏‏âu chuyện của PGS. Điền‏‏, d‏‏ưới đây lại là dẫn chứng sinh động khác về cách mà một trợ lý thông minh hiểu ngôn ngữ con người.‏

‏Đó là ‏‏quá trình nghiên cứu và phát triển trợ lý giọng nói tiếng Việt‏‏ Kiki‏‏ tr‏‏ên ô tô‏‏, để nhận dạng tốt‏‏ ‏‏giọng nói v‏‏ới nhiều ngữ điệu vùng miền ‏‏khác nhau‏‏. Trong khoa học máy tính, nhận dạng giọng nói là một nhánh quan trọng của AI, chuyển đổi giọng nói con người thành một định dạng hữu ích và có thể hiểu được bằng các ứng dụng máy tính. Công nghệ này là cầu nối tương tác giữa máy móc và con người. Trợ lý giọng nói đã trở thành ứng dụng không thể thiếu trên toàn thế giới, phổ biến nhất có thể kể đến như: Siri của Apple, Google Assistant, Amazon Alexa, hay Kiki ở Việt Nam.‏

‏Anh Nguyễn Hoàng Khánh Duy, Giám đốc sản phẩm tại Zalo AI, người viết những dòng code đầu tiên cho Kiki chia sẻ, để huấn luyện mô hình AI đủ thông minh khi nhận diện giọng nói, phản hồi thông tin đúng cho người dùng, thì dữ liệu ng‏‏ôn ngữ ‏‏đóng vai trò chủ chốt. ‏

423-202306141814206.jpg

‏Dẫn chứng‏‏, chức năng rất quan trọng với người dùng tr‏‏ợ lý tiếng Việt ‏‏Kiki trên ôtô là dẫn đường. Do đó, đội ngũ phát triển sản phẩm phải chuẩn bị dữ liệu, vốn từ vựng để hỗ trợ “mượt” cho các câu lệnh từ người dùng. Sau quá trình thu thập dữ liệu, huấn luyện mô hình, chỉ số thể hiện chất lượng nhận diện giọng nói ở phiên bản sau đã cải thiện 40% so với ban đầu.‏

‏Việc nhận diện giọng nói trên xe ô tô không chỉ dừng lại ở mỗi bài toán về dẫn đường, địa điểm mà còn nhiều vấn đề khác. ‏

‏Ví dụ, đặc thù sử dụng Kiki trên xe ô tô thì tiếng ồn do động cơ, gió hay tiếng phát ra từ các thiết bị giao thông trên đường cũng rất lớn, điều này ảnh hưởng trực tiếp tới chất lượng nhận diện giọng nói của Kiki trên xe. Do đó, đòi hỏi đội ngũ Kiki phải cố gắng giả lập điều kiện ồn bằng cách tăng cường dữ liệu giọng nói trong điều kiện tiếng ồn sao cho sát với cuộc sống thực tế nhất.‏

‏Ngoài ra, bằng các kỹ thuật mới trên thế giới như self-supervised (học tự giám sát), Kiki đang cố gắng‏‏ “học” từ cả những dữ liệu‏‏ không được gán nhãn, để cải thiện mô hình tốt hơn nữa. ‏‏Tính ổn định của trợ lý giọng nói tiếng Việt n‏‏ày đang ‏‏cải thiện với việc không ngừng ‏‏đào tạo‏‏, nâng cấp sản phẩm. ‏

423-202306141814207.jpg

‏Rõ ràng, tiến bộ của công nghệ đang diễn ra hàng ngày, hàng giờ. ChatGPT ra đời cuối năm 2022 đã trả lời một phần cho câu hỏi về cách dữ liệu lớn vận hành. Công nghệ đang “bước” vào giữa đời sống, đặc biệt, trong giáo dục, ngôn ngữ, những lĩnh vực vốn phụ thuộc nhiều vào con người trước đây. AI tái định nghĩa cách chúng ta học tập, làm việc, sinh hoạt,... như những ví dụ cụ thể nêu trên./‏.

Bài liên quan
Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
  • Chìa khóa giải quyết thách thức trong bảo vệ trẻ em trên không gian mạng
    Trẻ em - đối tượng dễ bị tổn thương nhất, đang phải đối mặt với nhiều nguy cơ. Đây không chỉ là bài toán của riêng Việt Nam mà còn là thách thức toàn cầu đòi hỏi sự chung tay hợp tác từ nhiều phía.
  • Việt Nam đang đối mặt 3 thách thức an toàn thông tin
    Các cuộc tấn công mạng hiện nay ngày càng tinh vi và phức tạp hơn, đặc biệt khi có sự hỗ trợ của trí tuệ nhân tạo. Tuy nhiên, việc kết hợp công nghệ này với trí tuệ của con người đã giúp phát hiện và phòng, chống tấn công mạng hiệu quả hơn.
  • Bốn giải pháp trọng tâm để giải bài toán an toàn dữ liệu quốc gia
    Theo Thứ trưởng Bộ TT&TT Bùi Hoàng Phương, năm 2024 đánh dấu bước tiến vượt bậc của Việt Nam trong lĩnh vực an toàn thông tin. Tuy nhiên, còn rất nhiều thách thức cần vượt qua để đảm bảo an toàn dữ liệu quốc gia.
  • Robot Delta hữu dụng trong nhiều ngành
    Nhờ vào thiết kế độc đáo và khả năng hoạt động với tốc độ và độ chính xác cao, robot Delta là một giải pháp tối ưu trong nhiều ngành công nghiệp hiện đại.
  • Cà Mau ứng dụng các phần mềm chuyển đổi số trong ngành nông nghiệp
    Ngành nông nghiệp tỉnh Cà Mau đã không ngừng triển khai các giải pháp chuyển đổi số thông qua việc sử dụng các phần mềm, xây dựng cơ sở dữ liệu chuyên ngành phục vụ quản lý, điều hành. Trong tương lai không xa, các phần mềm này sẽ hoàn thiện và bắt kịp xu hướng công nghệ để hỗ trợ người nông dân nhiều hơn trong việc tăng gia sản xuất.
  • Chính thức ra mắt Nền tảng hỗ trợ diễn tập thực chiến an toàn thông tin
    Nền tảng hướng tới nâng cao chất lượng và điều phối hiệu quả các hoạt động diễn tập trên toàn quốc thông qua nền tảng hỗ trợ diễn tập thực chiến an toàn thông tin.
  • Bảo vệ các hệ thống mạng trọng yếu là cấp thiết
    Song song với tiến trình chuyển đổi số, các chiến dịch tấn công mạng, gián điệp và khủng bố mạng nhằm vào hệ thống công nghệ thông tin (IT) và công nghệ vận hành (OT) trọng yếu ngày càng gia tăng, việc đảm bảo an ninh mạng trở thành ưu tiên hàng đầu của các quốc gia.
  • ‏OPPO Find X8 Series sẽ chính thức lên kệ ngày 7/12‏
    Ngày 21/11, OPPO chính thức ra mắt Find X8 Series‏‏ tại Việt Nam và sẽ lên kệ ngày 7/12 tới. Đây là lần đầu tiên người dùng Việt Nam được trải nghiệm dòng flagship cao cấp nhất của OPPO cùng lúc với toàn cầu. ‏
  • Chuyển đổi số từ thực tiễn Báo Hải Dương
    Báo Hải Dương có nhiều thuận lợi khi thực hiện chuyển đổi số. Đó là Ban Biên tập có quyết tâm cao. Đội ngũ cán bộ, phóng viên, nhân viên của báo nhanh nhạy với cái mới, ham học hỏi...
  • Đưa siêu ứng dụng "Công dân Thủ đô số - iHanoi" vào cuộc sống
    “Công dân Thủ đô số” - iHaNoi là kênh tương tác trực tuyến trên môi trường số giữa người dân, doanh nghiệp với các cấp chính quyền thành phố Hà Nội. Qua ứng dụng này, người dân và doanh nghiệp có thể phản ánh các vấn đề đời sống, từ đó giúp chính quyền tiếp nhận và giải quyết kịp thời.
‏Trí tuệ nhân tạo “đặt chân” vào thế giới ngôn ngữ tiếng Việt‏
POWERED BY ONECMS - A PRODUCT OF NEKO