Xây dựng mô hình ngôn ngữ nhỏ để thúc đẩy phát triển AI ở châu Phi
Chuyển đổi số - Ngày đăng : 07:15, 28/06/2024
Xây dựng mô hình ngôn ngữ nhỏ để thúc đẩy phát triển AI ở châu Phi
Công nghệ trí tuệ nhân tạo (AI) có thể giúp giải quyết những thách thức lớn về phát triển toàn cầu, nhưng trước hết cần phải xoá bỏ những rào cản về ngôn ngữ ở châu Phi.
Cơ hội tham gia vào nền kinh tế số toàn cầu phụ thuộc vào khả năng tiếp cận công nghệ. Do đó, nếu bạn không hiểu tiếng Anh hoặc một số ngôn ngữ khác đang thống trị trên Internet, bạn sẽ bỏ lỡ cơ hội này. Đây là thông điệp trọng tâm trong bài phát biểu quan trọng tại Hội nghị thượng đỉnh toàn cầu về AI của Pelonomi Moila, Giám đốc điều hành của Lelapa AI, một công ty khởi nghiệp về phát triển AI cho các ngôn ngữ châu Phi.
Tiềm năng to lớn của AI trong việc thúc đẩy sự phát triển phải được cân nhắc với nguy cơ làm sâu sắc thêm sự bất bình đẳng hiện có. Điều này đặc biệt rõ ràng trong bối cảnh châu Phi, nơi có một lượng lớn dân số không được tiếp cận các dịch vụ và sản phẩm thiết yếu như y tế, giáo dục, tài chính và các dịch vụ của chính phủ thông qua Internet trên điện thoại di động.
Những thách thức này có thể được giải quyết trên quy mô lớn với chi phí thấp hơn và phạm vi tiếp cận rộng hơn bằng cách cung cấp các sản phẩm, công cụ và dịch vụ - từ nông nghiệp đến tài chính hoặc giảng dạy - qua thiết bị di động.
Tuy nhiên, thách thức đặt ra là ngôn ngữ phổ biến của các dịch vụ công nghệ và viễn thông là tiếng Anh, trong khi đó phần lớn người châu Phi không nói được ngôn ngữ này.
Moila cho biết: “Nếu bạn không nói được một trong những ngôn ngữ chính của châu Âu, bạn không thể truy cập các sản phẩm và dịch vụ số không đa ngôn ngữ – từ chatbot đến hướng dẫn bằng giọng nói hoặc dịch vụ của chính phủ”. Do đó, khi việc tiếp cận giáo dục chủ yếu là trực tuyến thì người học phải học tiếng Anh trước khi học toán hoặc khoa học.
Những thách thức trong việc phát triển mô hình AI ở châu Phi
Cuộc đua về AI tiếp tục diễn ra ngày càng mạnh mẽ, trong bối cảnh công nghệ này được nhận định sẽ làm thay đổi đáng kể hành vi không chỉ với những người dùng cá nhân mà còn cả các doanh nghiệp. AI mở ra nhiều cơ hội cho lao động trẻ tuổi, từ việc học tập và phát triển kỹ năng mới, tạo dựng sự nghiệp trong các ngành công nghệ tiên tiến, cho đến việc tham gia vào các dự án đổi mới sáng tạo.
Tuy nhiên, hầu hết các mô hình ngôn ngữ lớn (Large Language Model - LLM) chưa hỗ trợ các ngôn ngữ châu Phi. Các mô hình LLM được đào tạo bằng văn bản lấy từ Internet, trong đó tiếng Anh là ngôn ngữ chung - chiếm 75% lượng dữ liệu đào tạo.
Trong số 34 ngôn ngữ được sử dụng nhiều nhất trên Internet trên toàn cầu, không có một ngôn ngữ nào là tiếng Châu Phi. Điều đó cũng có nghĩa là không có lượng dữ liệu lớn nào tiếng châu Phi được thu thập để lấy thông tin và đào tạo LLM.
Chính vì vậy, các mô hình LLM của các big tech thường không tập trung giải quyết các vấn đề ở châu Phi do những hạn chế về sức mạnh tính toán, nguồn tài trợ và bộ dữ liệu hạn chế tại khu vực này.
Theo Pelonomi Moila, lời giải cho bài toán này chính là cách tiếp cận mà mạng lưới AI châu Phi đang áp dụng. Đây là một tập hợp các cộng đồng công nghệ, phòng thí nghiệm và các phong trào tham gia hợp tác nghiên cứu và phát triển các giải pháp ngôn ngữ châu Phi. Trải rộng trên 8 quốc gia, nhóm ban đầu đang nghiên cứu 8 ngôn ngữ châu Phi có tiềm năng kết nối 520 triệu người trên khắp lục địa này với xã hội số toàn cầu.
Pelonomi Moila cho hay mạng lưới AI châu Phi có hai mục tiêu. Đầu tiên là xây dựng công nghệ để giúp người dân châu Phi giao tiếp với công nghệ bằng các ngôn ngữ cho phép họ tiếp cận các sản phẩm, dịch vụ và thông tin dễ dàng. Thứ hai là xây dựng công nghệ để gắn kết mọi người lại với nhau.
Hướng tới xây dựng các mô hình ngôn ngữ nhỏ
Thay vì các LLM ngốn dữ liệu, tốn kém để phát triển, vận hành và đào tạo, sáng kiến này ưu tiên các tùy chọn đòi hỏi ít dữ liệu, có mức tính toán thấp được tối ưu hóa cho các hạn chế thực tế của châu Phi.
Theo Pelonomi Moila, các mô hình ngôn ngữ nhỏ hơn có chi phí rẻ hơn, có thể tuỳ chỉnh và hoạt động tốt hơn, tạo ra ít ảo giác hơn (đầu ra LLM không nhạy cảm hoặc không chính xác) vì chúng tập trung vào các lĩnh vực nhỏ hơn hoặc các vấn đề cụ thể.
Các công cụ biên dịch, đàm thoại và phân tích văn bản hoạt động tốt khi sử dụng khối lượng dữ liệu nhỏ hơn nhiều - và những công cụ do mạng lưới AI châu Phi phát triển thường là những mô hình duy nhất hỗ trợ cho các ngôn ngữ được đề cập đến trong các câu hỏi
Moila kêu gọi sự hỗ trợ quốc tế trong việc xây dựng thêm những mô hình ngôn ngữ nhỏ cần thiết này để tạo nội dung, biên dịch và phát triển các ứng dụng kỹ thuật số hoặc AI trên khắp châu Phi. Theo bà, so với các LLM dành cho các ngôn ngữ chính trên thế giới, các mô hình ngôn ngữ nhỏ sẽ sử dụng ít tài nguyên hơn, do đó ít gây tác động tới biến đổi khí hậu toàn cầu. Chúng sẽ được đào tạo dựa trên các dữ liệu từ các hệ thống xã hội châu Phi.
"Giải quyết vấn đề ngôn ngữ ở châu Phi sẽ là chìa khóa để đạt được các Mục tiêu phát triển bền vững của Liên Hợp Quốc", Pelonomi Moila, Giám đốc điều hành của Lelapa AI nhấn mạnh./.