Đưa Việt Nam trở thành điểm sáng về nghiên cứu, phát triển, ứng dụng AI
Trong hơn hai năm vừa qua, thế giới gặp nhiều khó khăn và thử thách, trong đó đại dịch COVID-19 đã gây tác động tiêu cực đến nền kinh tế toàn cầu. Đại dịch đã ảnh hưởng đến những kế hoạch phát triển, kết quả các chỉ tiêu kinh tế - xã hội, làm gián đoạn các hoạt động kinh doanh.
Trong bối cảnh đó, nền tảng khoa học công nghệ nói chung, khoa học dữ liệu, cũng như công nghệ AI nói riêng có vai trò hết sức quan trọng, trở thành những công nghệ then chốt góp phần thúc đẩy sự phát triển kinh tế - xã hội.
Đầu năm 2021, Việt Nam cũng đã ban hành Chiến lược quốc gia về nghiên cứu, phát triển và ứng dụng AI đến năm 2030. Chiến lược đặt mục tiêu đẩy mạnh nghiên cứu, phát triển và ứng dụng AI, đưa AI trở thành lĩnh vực công nghệ quan trọng của Việt Nam trong cuộc Cách mạng công nghiệp lần thứ tư góp phần phát triển kinh tế - xã hội từng bước đưa Việt Nam trở thành điểm sáng về nghiên cứu phát triển, ứng dụng AI trong khu vực và trên thế giới.
Từ nhu cầu phát triển thực tế, tháng 7/2020, Tập đoàn Naver đã chính thức hợp tác nghiên cứu và đào tạo với Trường Công nghệ thông tin và Truyền thông (CNTT-TT) - Đại học (ĐH) Bách Khoa Hà Nội, mở đầu cho chuỗi hợp tác thuộc chương trình chiến lược "Vành đai Nghiên cứu và Phát triển AI toàn cầu (Global AI R&D Belt)". Trung tâm đào tạo và nghiên cứu trí tuệ nhân tạo BKAI đi vào hoạt động, với mục tiêu trở thành trung tâm có tầm ảnh hưởng trong khu vực.
Naver là Tập đoàn công nghệ đa quốc gia của Hàn Quốc, cũng là tập đoàn duy nhất trên thế giới (trừ Trung Quốc và Nga với chính sách "hàng rào Internet Quốc gia") sở hữu Cổng thông tin Tìm kiếm nội địa chiến thắng Google.
Tháng 10/2019, Naver tiến hành dự án "Vành đai AI R&D toàn cầu" với mục đích giao lưu và trao đổi công nghệ vượt ra khỏi phạm vi biên giới quốc gia, từ đó nuôi dưỡng và đào tạo nhân tài trong lĩnh vực công nghệ AI tương lai giữa Hàn Quốc, Nhật Bản, Pháp và Việt Nam.
Chia sẻ tại Hội thảo khoa học Xu thế hiện tại và tương lai trong Khoa học dữ liệu và AI được tổ chức ngày 6/5, nhận định về sự hợp tác giữa ĐH Bách khoa Hà Nội và Tập đoàn Naver Hàn Quốc, TS. Lý Hoàng Tùng, Vụ phó Vụ Công nghệ cao, Bộ Khoa học và Công nghệ đánh giá cao những kết quả đã đạt được trong năm vừa qua.
TS. Lý Hoàng Tùng cho biết: "Trung tâm BKAI đã góp phần kết nối, tạo môi trường làm việc lý tưởng cho các nhóm nghiên cứu. Đặc biệt, những sự kiện với quy mô quốc tế được Trung tâm BKAI và Tập đoàn Naver cùng phối hợp tổ chức như Hội thảo AI NOW, Cuộc thi AI Hackathon,… có ảnh hưởng rất tích cực tới cộng đồng nghiên cứu AI và các sinh viên có đam mê với lĩnh vực AI".
Đưa các nghiên cứu AI đến gần hơn với ứng dụng thực tiễn
Giữa năm 2021, Tập đoàn Naver và ĐH Bách Khoa Hà Nội đã triển khai chương trình hợp tác nghiên cứu về AI. Đến nay, qua 1 năm cùng nhau xây dựng và phát triển, chương trình đã gặt hái được rất nhiều thành công tiêu biểu.
Đáng chú ý, 5 dự án hợp tác nghiên cứu đã được triển khai và hoàn thiện với 10 bài công bố, 4 bộ dữ liệu công cộng, 12 nhà nghiên cứu và 35 sinh viên tham gia.
Trong khuôn khổ hội thảo, đại diện của các nhóm nghiên cứu hợp tác giữa Tập đoàn Naver và BKAI đã trình bày về kết quả đạt được của 5 đề tài. Cụ thể gồm: Vietnamese OCR: Research and Applications (Nghiên cứu OCR trong tiếng Việt); Unsupervised Domain Adaptation for Semantic Segmentation (Thích ứng miền không giám sát); Vietnamese Natural Language Understading (Hiểu ngôn ngữ tự nhiên bằng tiếng Việt); Some results on knowledge discovery from heterogeneous web data (Khám phá các tri thức hữu ích từ nguồn dữ liệu web hỗn tạp); Datasets and Benchmarks for hand gesture recognition (Bộ dữ liệu và điểm chuẩn để nhận dạng cử chỉ tay).
Trong đó, đề tài nghiên cứu OCR trong tiếng Việt là một bài toán được nghiên cứu từ rất lâu đời và nhận được sự quan tâm từ đông đảo cộng đồng nghiên cứu.
OCR (Optical Character Recognition) có nghĩa là nhận diện các ký tự quang học, hiện nay OCR được hiểu với nghĩa rộng hơn đó là lĩnh vực nghiên cứu về việc nhận diện các ký tự trong ảnh, các dữ liệu về hình ảnh. OCR là một trong những lĩnh vực AI được ứng dụng rộng rãi ở trong thực tế. Tuy nhiên, đối với các nghiên cứu chuyên sâu về OCR cho tiếng Việt thì chưa thật sự có nhiều như đối với các ngôn ngữ khác như tiếng Anh, tiếng Nhật, tiếng Trung.
Cùng với đó, nhận thấy dữ liệu phục vụ cho bài toán cho nghiên cứu và phát triển ứng dung OCR cho tiếng Việt hiện nay cũng đang thiếu hụt, từ thực tế đó nhóm nghiên cứu của BKAI đã cùng với nhóm OCR của Tập đoàn Naver đã bắt đầu thực hiện đề tài nghiên cứu liên quan đến OCR cho ngôn ngữ tiếng Việt.
Trong năm đầu tiên, nhóm nghiên cứu tập trung vào 3 mục tiêu chính: Xây dựng bộ dữ liệu chuẩn chỉnh về OCR cho tiếng Việt; Dựa trên bộ dữ liệu xây dựng được tiến hành kiểm thử và đánh giá, đề xuất các biện pháp để cải tiến độ chính xác cho OCR tiếng Việt; Xây dựng một hệ thống OCR cho tiếng Việt với đầy đủ các tính năng có thể đưa vào vận hành và chuyển giao công nghệ.
Kết quả mà nhóm nghiên cứu đạt được là đã xây dựng thành công hệ thống OCR dành cho tiếng Việt với đầy đủ các tính năng có thể đưa vào vận hành trực tiếp và tiến hành chuyển giao công nghệ.
Bên cạnh đó, các đề tài hợp tác nghiên cứu khác như: Thích ứng miền không giám sát và ứng dụng cụ thể cho bài toán phân loại ngữ nghĩa với mục đích là nghiên cứu các kỹ thuật thích ứng miền không giám sát cho bài toán hiểu ngữ cảnh của xe tự hành; Đề tài Hiểu ngôn ngữ tự nhiên bằng tiếng Việt; Khám phá các tri thức hữu ích từ nguồn dữ liệu web hỗn tạp; và Bộ dữ liệu và điểm chuẩn để nhận dạng cử chỉ tay, cũng đều đạt được những kết quả tích cực.
Chia sẻ về sự hợp tác này, TS. Đặng Thiếu Ngân - Giám đốc Hợp tác và Quan hệ Quốc tế của Tập đoàn Naver đã đánh giá cao những kết quả đạt được trong năm đầu hợp tác với ĐH Bách Khoa Hà Nội.
Bà Ngân cho biết: "Ngay từ khi triển khai dự án Vành đai Nghiên cứu và Phát triển AI toàn cầu, Naver đã chọn Việt Nam là một trong bốn mắt xích chính, bởi tiềm năng về CNTT của đất nước hình chữ S và tài năng của các nhân sự lập trình viên AI tại đây".
Theo bà Ngân, khi bắt tay hợp tác nghiên cứu, đào tạo về AI, cả ĐH Bách Khoa Hà Nội và Naver đều đang ở tâm thế "tìm hiểu" lẫn nhau nên đã không đặt nặng quá nhiều vào kết quả nghiên cứu, nhưng qua 1 năm cùng nhau thực hiện các hoạt động trong hợp tác, Naver đã bất ngờ về những thành quả đạt được.
Không chỉ vậy, một dự án nghiên cứu giữa hai bên còn được đánh giá cao tại hội thảo quốc tế. Chính vì vậy, Tập đoàn Naver đã quyết định tiếp tục mở rộng hợp tác và đẩy mạnh, sâu rộng các đề tài nghiên cứu cũng như các hoạt động khoa học ý nghĩa khác.
Bà Ngân cũng cho biết thêm, Trung tâm Lập trình đầu tiên của Naver đã được thành lập tại TP. Hồ Chí Minh và dự kiến sẽ tuyển dụng hơn 300 nhân sự vào năm 2023. Trước mắt, Trung tâm sẽ ưu tiên tuyển dụng các học sinh sinh viên, các nghiên cứu sinh cũng như các chuyên gia tham gia trực tiếp vào dự án hợp tác giữa Naver và các đối tác tại Việt Nam./.