Xử lý ngôn ngữ tự nhiên là gì?
Diễn đàn - Ngày đăng : 19:29, 30/03/2019
Mỗi khi người dùng nhập nội dung nào đó vào chatbot và nhận được câu trả lời, các quy trình tính toán phức tạp sẽ cố gắng hết sức để giải mã những gì bạn đã viết, để chúng có thể cung cấp phản hồi hữu ích và phù hợp. Điều này được gọi là xử lý ngôn ngữ tự nhiên và những tiến bộ trong học máy đang giúp tạo ra các hệ thống tinh vi hơn bao giờ hết sẽ có khả năng bắt chước một con người.
Xử lý ngôn ngữ tự nhiên (NLP - Natural language processing) là không thể thiếu đối với một loạt các dịch vụ mà chúng ta sử dụng với mức độ đều đặn, liên quan đến cả ngôn ngữ viết và ngôn ngữ nói.
Nó cho phép các trợ lý thông minh như Alexa, Google Assistant và Siri, đáp ứng các yêu cầu được nói ra bởi người dùng về dự báo thời tiết, thời gian của chuyến tàu tiếp theo, những gì đang chiếu tại rạp chiếu phim địa phương và hơn thế nữa. Nó cung cấp khả năng cho phần mềm xử lý văn bản của chúng ta để kiểm tra ngữ pháp. Nó nằm sau Google Dịch, cố gắng hết sức để đảm bảo rằng tài liệu bằng ngôn ngữ mà người dùng không thể đọc được chuyển thành ngôn ngữ mà người dùng có thể hiểu được. Nó giúp các chatbot của ngân hàng có thể hiểu và tuân thủ các yêu cầu của người dùng trong chớp mắt.
Một vấn đề rất khó giải quyết
Tuy nhiên, để có một cuộc trò chuyện hoàn chỉnh hoặc đọc văn bản một cách hiệu quả không hề đơn giản khi chúng chứa hàng loạt những sắc thái, suy luận và đánh giá. Một vấn đề chính là cách để chia một ngôn ngữ thành các danh từ, động từ, tính từ và phần còn lại, nhưng ngôn ngữ không chỉ là "những phần của lời nói". Và phần “không chỉ” này khiến ngôn ngữ trở nên khó khăn cho máy tính để có thể giải thích và tái tạo.
Cùng một từ có thể có ý nghĩa khác nhau tùy thuộc vào ngữ cảnh mà nó được sử dụng. Hãy xem xét ví dụ này: từ “bow” trong tiếng Anh không chỉ có ý nghĩ là hành động cúi chào, mà còn có ý nghĩa là một cây cung. Hay bản thân tiếng Việt cũng có những ví dụ rất điển hình: con ngựa đá con ngựa đá.
Biết cách sử dụng từ ngữ trong mỗi câu đó tùy thuộc vào ngữ cảnh được cung cấp bởi các từ xung quanh. Tuy nhiên, đôi khi bối cảnh của những từ xung quanh cũng không giúp được gì.
Ngôn ngữ tiếng Anh phụ thuộc rất nhiều vào ngữ cảnh, điều mà những người không nói tiếng Anh gặp khó khăn, chưa kể đến máy móc. Và đó là trước khi chúng ta bắt đầu bao gồm các đặc điểm cá nhân khác nhau, đặc trưng cho người nói, như giọng điệu mỉa mai, châm biếm và hài hước, mà ngay cả con người chúng ta cũng khó có thể tự suy luận ra ý nghĩa của câu nói đó.
Phần mềm xử lý ngôn ngữ tự nhiên có chức năng gì?
Phần mềm xử lý ngôn ngữ tự nhiên khắc phục các vấn đề về hiểu ngôn ngữ bằng cách áp dụng các phân tích và thuật toán giúp nó bối cảnh hóa các từ mà nó đang đọc. Có hai khía cạnh rộng lớn - cú pháp và ngữ nghĩa.
Cú pháp nói chung mang tính chính thức hơn trong hai khía cạnh. Nó bao gồm các kỹ thuật như hiểu định nghĩa từ điển, biết cách tạo thành câu (chẳng hạn như biết về những 'phần của lời nói') và phân tích cú pháp.
Phân tích cú pháp đặc biệt có liên quan, vì đây là về việc hiểu ý nghĩa của một câu thực sự.
Ngữ nghĩa là khía cạnh ít cấu trúc và thường khó khăn hơn. Đó là về cách hiểu ý nghĩa của các từ riêng lẻ trong ngữ cảnh của câu, chẳng hạn như định nghĩa của 'bow' phù hợp nhất trong từng hoàn cảnh.
Có rất nhiều công cụ khác nhau có thể giúp phần mềm xử lý ngôn ngữ tự nhiên xử lý vấn đề này. Ví dụ, một hệ thống cần phải biết tên của người, địa điểm và đồ vật để nó biết John có thể là tên người hoặc tiếng lóng cho nhà vệ sinh, và Paris là địa điểm hay là tên người. Và nó cần phải hiểu sự phụ thuộc, đó là một manh mối khi suy luận về ý nghĩa.
Chúng ta đã thành công hay chưa?
Để đạt được một số nhiệm vụ liên quan đến xử lý ngôn ngữ tự nhiên, máy tính cần phải học cách 'fuzzy' - để làm việc với các phép tính gần đúng và đưa ra các phỏng đoán có đào tạo, nếu được chứng minh là đúng, sẽ thông báo những gì chúng làm tiếp theo. Học máy giúp vì các hệ thống có thể học nhanh hơn từ những sai lầm (và thành công) của chúng hơn là so với việc con người đào tạo chúng và tốc độ xử lý được cải thiện giúp các phần mềm xử lý ngôn ngữ tự nhiên tiến gần hơn để làm việc trong thời gian thực.
M&S đã thay thế toàn bộ nhân viên trung tâm cuộc gọi của mình bằng phần mềm dựa trên phần mềm xử lý ngôn ngữ tự nhiên.
Tuy nhiên, đó là một câu trả lời cho các câu hỏi của chúng tôi - đó là những gì Siri, Alexa và Google Home đã và đang làm. Apple, Amazon, Google và các công ty công nghệ quan trọng khác như IBM (với Watson), cũng như vô số các công ty khởi nghiệp, đều đang làm việc trên các hệ thống xử lý ngôn ngữ tư nhiên của riêng họ để giải quyết một loạt các nhiệm vụ. Chúng bao gồm các cơ chế đàm thoại trong dịch vụ khách hàng và chăm sóc sức khỏe, trích xuất thông tin quan trọng từ các tài liệu và thậm chí phân tích email để kiểm soát dòng thư rác.
Hiện đã có rất nhiều chatbot trực tuyến - nhưng chúng thường chỉ xử lý các tương tác câu hỏi và trả lời đơn giản. Các hệ thống đang được cải thiện mọi lúc, nhưng chúng ta còn lâu mới có được sự tương tác liền mạch mà ngành dịch vụ khách hàng dự kiến.