VinAI công bố dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn “PhởGPT”
Chuyển động ICT - Ngày đăng : 13:31, 06/12/2023
VinAI công bố dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn “PhởGPT”
PhởGPT có khả năng hiểu và viết văn phong tiếng Việt một cách vượt bậc so với các công nghệ về ngôn ngữ thế hệ trước.
Ngày Trí tuệ nhân tạo 2023 với chủ đề “AI - tái thiết thực tại” diễn ra trong hai ngày 5 và 6/12, với chủ đề trọng tâm là AI tạo sinh - GenAI.
Đây là sự kiện thường niên do Công ty Nghiên cứu và Ứng dụng Trí tuệ nhân tạo VinAI (thuộc Tập đoàn Vingroup) và New Turning Institute đồng tổ chức, với sự đồng hành của Bộ Khoa học & Công nghệ Việt Nam và Trung tâm Đổi mới sáng tạo (ĐMST) Quốc gia (NIC). Sự kiện cũng lần đầu tiên giới thiệu tới công chúng một dự án thú vị của AI Việt Nam với tên gọi “PhởGPT”.
Chia sẻ tại sự kiện, ông Trần Duy Đông, Thứ trưởng Bộ Kế hoạch và Đầu tư (KH&ĐT), cho rằng AI sẽ là một trong những lĩnh vực mang lại cho Việt Nam nhiều tiềm năng để phát triển mạnh mẽ và sớm bắt kịp với trình độ của thế giới. Bộ KH&ĐT luôn ủng hộ và đồng hành cùng cộng đồng AI nói riêng, và cộng đồng khoa học công nghệ nói chung để phát triển một hệ sinh thái ĐMST toàn diện, năng động, đóng góp cho sự phát triển chung của đất nước.
Đặc biệt, AI tạo sinh - GenAI là chủ đề nóng, được quan tâm bởi tính thiết thực và công năng. Ngoài ra, người tham dự còn có cơ hội trải nghiệm các tính năng, sản phẩm công nghệ AI tại gian hàng của VinAI và các nhà tài trợ.
TS. Bùi Hải Hưng, Tổng Giám đốc VinAI, cho biết: “AI Day 2023 là ngày Trí tuệ nhân tạo quy mô lớn nhất mà VinAI đồng tổ chức trong 5 năm qua cùng với sự hiện diện của những bộ óc giỏi nhất trên thế giới trong lĩnh vực AI. Năm nay, VinAI cùng New Turning Institute đồng tổ chức AI Day 2023 với trọng tâm là GenAI, được kỳ vọng sẽ là cầu nối trí tuệ Việt với những tiến bộ của tương lai. Đây cũng là sứ mệnh hàng đầu, là mục tiêu của ngày Trí tuệ nhân tạo mỗi năm, nhằm đưa cộng đồng AI Việt ngày một phát triển, vươn ra thế giới".
Tại AI Day 2023, VinAI đã lần đầu tiên chính thức công bố dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn cho riêng tiếng Việt là “PhởGPT”. Mục tiêu của dự án là phát triển các mô hình tương tự như ChatGPT cho tiếng Việt và văn hoá người Việt.
PhởGPT có khả năng hiểu và viết văn phong tiếng Việt một cách vượt bậc so với các công nghệ về ngôn ngữ thế hệ trước. Mô hình cũng được huấn luyện từ đầu với tập dữ liệu tiếng Việt, không phụ thuộc vào bất cứ một mô hình nào khác của thế giới, đảm bảo việc làm chủ công nghệ lõi tiên tiến cho Việt Nam.
“PhởGPT” là một dự án mã nguồn mở, song hành cùng trào lưu các mô hình ngôn ngữ lớn với mã nguồn mở của thế giới như Llama của Meta hay Mistral được phát triển để cạnh tranh với ChatGPT của OpenAI.
So sánh phiên bản PhởGPT-7B5-Instruct và ChatGPT mã nguồn đóng (GPT-3.5-turbo) và các mô hình mã nguồn mở khác cho thấy: PhởGPT đứng thứ hai chỉ sau ChatGPT trong hầu hết các mục đánh giá. Đội ngũ phát triển PhởGPT đang tiếp tục cải tiến mô hình và sẽ mở rộng dự án cho các ngôn ngữ khác, đặc biệt là các ngôn ngữ trong khu vực Đông Nam Á.
Theo Precedence Research, chi tiêu cho phần cứng AI đang tăng lên nhanh chóng, từ 43 tỉ USD năm 2021, có thể lên tới 248 tỉ USD vào năm 2030. Con số đã và đang trở thành một vấn đề gây đau đầu cho các nhà sản xuất. Hiểu rõ tác động, VinAI đã đầu tư công sức vào việc tối ưu các thuật toán AI, giúp giảm thiểu mức hao phí xuống thấp nhất.
Tối ưu hoá mô hình AI giúp VinAI thiết kế các mô hình AI có hiệu suất sử dụng phần cứng tốt hơn trong khi độ chính xác không thay đổi, ngay lập tức giúp giảm thiểu đáng kể chi phí đầu tư phần cứng và chi phí vận hành điện toán đám mây của khách hàng. Các mô hình AI sau khi được tối ưu sẽ chiếm ít dung lượng bộ nhớ hơn và tiêu tốn ít điện năng hơn, từ đó giảm lượng khí thải ra môi trường.
AI Day 2023 gồm 4 phiên thảo luận chính, có tầm ảnh hưởng lớn đến nhiều lĩnh vực, là: “Tương lai của mô hình ngôn ngữ lớn (LLMs)”; “Định hình lại tầm nhìn về tương lai AI”; “Tác động toàn cầu của AI tạo sinh GenAI” và “Tiềm năng của GenAI trong nền kinh tế Đông Nam Á”.
Sự kiện đã thu hút hơn 30 chuyên gia là các giáo sư, nhà khoa học hàng đầu trong lĩnh vực AI đến từ khắp nơi trên thế giới cùng hơn 100 đại diện doanh nghiệp và 1500 khách mời trong lĩnh vực công nghệ, sản xuất và chế tạo trong nước và quốc tế.
Ngoài ra, các đối tác lớn cũng góp mặt như Intel, AWS, Elsa Speak, Do Ventures, AMD, Lenovo, Trusting Social, Google, VinFuture Prize, New World Saigon Hotel, NIC, Sovico Group, Vietjet Air, Vietsuccess, VietAI và The Global City./.