Make in Vietnam

CMC ATI dành các giải thưởng trong việc phát triển giải pháp AI ứng dụng vào cuộc sống

Gia Bách 09:26 13/01/2023

CMC ATI vừa đạt Top 1 tại Hội thi Giải pháp ứng dụng trí tuệ nhân tạo (AI) năm 2022 với giải pháp số hóa, chuyển đổi số (CĐS) văn bản, hồ sơ giấy tờ dạng ảnh C-ORC.

Hội thi Giải pháp ứng dụng AI lần 3 do Sở Thông tin và Truyền thông (TT&TT) TP. Hồ Chí Minh (HCM), Thành đoàn phối hợp Đại học Quốc gia TP.HCM, Hiệp hội phần mềm và dịch vụ công nghệ thông tin Việt Nam (VNISA) tổ chức nhằm tìm kiếm các giải pháp ứng dụng AI vào các lĩnh vực cuộc sống.

Hội thi năm nay có 210 đội thi, gồm có 2 nhóm dự thi: nhóm 1 là thử thách AI (AI Challenge) với chủ đề "Truy vấn sự kiện từ dữ liệu thị giác" (Event Retrieval from Visual Data) được tổ chức theo chuẩn của các cuộc thi quốc tế; nhóm 2 là sản phẩm ứng dụng AI (AI solution).

anh-1.jpg
Viện CMC ATI nhận giải 3 tại Hội thi Giải pháp ứng dụng AI.

Ông Nguyễn Tiến Đồng, đại diện đội CMC ATI tham dự cuộc thi cho biết, nhóm nghiên cứu, giải pháp có thể số hóa toàn bộ các dạng tài liệu, văn bản, kể cả văn bản viết tay, biểu mẫu, hồ sơ... phục vụ các thủ tục hành chính. Riêng văn bản chữ viết tay, mô hình của nhóm có thể nhận dạng với độ chính xác trên 95% dựa trên việc cho máy học trên tập hơn 10.000 loại dữ liệu viết tay tiếng Việt.

CMC ATI nhận cú đúp giải thưởng


Nhóm CMC AI của Viện Nghiên cứu Ứng dụng Công nghệ CMC (CMC ATI) tiếp tục nhận cú đúp giải thưởng tại cuộc thi Xử lý Ngôn ngữ và tiếng nói tiếng Việt - VLSP 2022 (Vietnamese Language and Speech Processing) với một giải Nhất và một giải Ba.

Đây là cuộc thi được Câu lạc bộ Xử lý ngôn ngữ và tiếng nói tiếng Việt (VLSP) và Hội Tin học Việt Nam tổ chức lần thứ 9. VLSP 2022 tổ chức 7 cuộc thi về xử lý tiếng nói và xử lý văn bản, bao gồm: tổng hợp tiếng nói, nhận dạng tiếng nói, xác minh người nói, phân tích cú pháp thành phần, tóm tắt đa văn bản, dịch máy Trung - Việt, hỏi đáp đa ngữ về nội dung ảnh.

Cụ thể, nhóm CMC AI đạt giải Nhất với giải pháp “Mô hình transformers cho dữ liệu đa miền với khả năng phát hiện đối tượng cho bài toán hỏi đáp trực quan đa ngôn ngữ” tại cuộc thi “Hỏi đáp trực quan đa ngôn ngữ dựa trên hình ảnh”. Đồng thời, nhóm còn giành được giải Ba với giải pháp “Mô hình transformers với khả năng mô hình hoá văn bản dài cho bài toán tóm tắt tóm lược đa văn bản” tại Cuộc thi “Tóm tắt tóm lược đa văn bản Tiếng Việt”.

anh-2.jpg
Nhóm CMC AI của Viện Nghiên cứu Ứng dụng Công nghệ CMC (CMC ATI) đã nhận cú đúp giải thưởng tại cuộc thi VLSP 2022.

Với cuộc thi “Hỏi đáp trực quan đa ngôn ngữ dựa trên hình ảnh”, các đội phải giải bài toán nghiên cứu đa lĩnh vực: Xử lý ngôn ngữ tự nhiên và Xử lý ảnh. Cuộc thi này xuất hiện lần đầu tiên tại VLSP 2022. Nhiệm vụ của các nhóm là xây dựng những mô hình/hệ thống phải có khả năng trả lời câu hỏi về nội dung ảnh bằng ngôn ngữ tự nhiên. Thêm một thách thức nữa cho các đội là câu hỏi có thể bằng tiếng Việt, tiếng Anh hoặc tiếng Nhật.

anh-3.png
Viện CMC ATI giành giải Nhất tại cuộc thi “Hỏi đáp trực quan đa ngôn ngữ dựa trên hình ảnh” trong khuôn khổ chương trình VLSP 2022.

Cuộc thi “Tóm tắt tóm lược đa văn bản Tiếng Việt” (VLSP Abmusu) là một trong các tác vụ xử lý ngôn ngữ hữu ích để giải quyết vấn đề khai thác dữ liệu văn bản. Trong thời đại bùng nổ thông tin, khai thác dữ liệu một cách hiệu quả có tiềm năng rất lớn nhưng lại là một bài toán khó, tốn nhiều thời gian, tiền bạc và công sức. Nhận một tập tài liệu đầu vào, hệ thống tóm tắt phải chọn lọc hoặc tạo sinh một bản tóm tắt ngắn gọn cho các tài liệu này.

Để đạt được giải nhất trong cuộc thi VLSP 2022, nhóm CMC AI đã thử nghiệm nhiều thuật toán khác nhau để tìm được ra thuật toán tốt nhất. Kết quả được đánh giá trên hệ thống do ban tổ chức cuộc thi cung cấp và team đã vượt qua 27 đội dự thi khác như Viettel, VinGroup, VCCorp, TopCV,… để đạt được vị trí dẫn đầu.

Toàn bộ cuộc thi diễn ra trong khoảng hơn 1 tháng, trong đó thời gian để các đội thi đăng ký, chuẩn bị là khoảng 3 tuần. Thời gian để các đội nộp bài thi và cạnh tranh với nhau trên bảng xếp hạng kéo dài trong 10 ngày.

“Giải thưởng là kết quả của sự cố gắng của cả nhóm trong một khoảng thời gian tuy không quá dài nhưng hết sức cam go và thử thách. Đây cũng là minh chứng cho năng lực của nhóm AI nói riêng cũng như Viện CMC ATI nói chung. Các bài toán trong cuộc thi nếu xử lý được rất tiềm năng trong việc tích hợp trong nền tảng trợ lý ảo mà nhóm đã và đang phát triển”, TS Đặng Minh Tuấn, Viện trưởng Viện Nghiên cứu Ứng dụng Công nghệ CMC ATI chia sẻ.

anh-4.jpg
Viện CMC ATI đạt giải Ba tại cuộc thi “Tóm tắt tóm lược đa văn bản Tiếng Việt” trong khuôn khổ chương trình VLSP 2022.

Ý tưởng sáng tạo riêng dựa trên kinh nghiệm làm việc

Nói về điểm nổi bật về giải pháp “Mô hình transformers cho dữ liệu đa miền với khả năng phát hiện đối tượng cho bài toán hỏi đáp trực quan đa ngôn ngữ” của Viện CMC ATI, ông Nguyễn Tiến Đồng Trưởng nhóm CMC AI cho biết, đây là một một ý tưởng sáng tạo riêng, dựa trên kinh nghiệm làm việc cũng như khả năng chuyên môn của Viện. Giải pháp này vừa đơn giản lại vừa hiệu quả, không giới hạn trong phạm vi cuộc thi mà còn có thể áp dụng vào thực tiễn. Đây chính là sự giao thoa giữa kỹ thuật xử lý ảnh và xử lý ngôn ngữ tự nhiên. Bên cạnh đó, giải pháp còn kết hợp các thông tin về đặc trưng ảnh với các thực thể có trong ảnh để đưa ra câu trả lời. Đặc biệt, mô hình giải pháp này cho phép đưa ra câu trả lời cũng như sử dụng câu hỏi ở nhiều ngôn ngữ khác nhau, bao gồm tiếng Việt, tiếng Anh và tiếng Nhật.

Đặc biệt, với “Mô hình transformers với khả năng mô hình hoá văn bản dài cho bài toán tóm tắt tóm lược đa văn bản” đã được đội CMC AI lựa chọn dựa trên việc thử nghiệm rất nhiều bộ tham số khác nhau. Mô hình này có thể xử lý được các văn bản dài cũng như các bài toán tóm tắt đơn văn bản và đa văn bản.

anh-5.jpg
Ảnh mô tả yêu cầu của một bài toán trong cuộc thi VLSP 2022.

“Cả nhóm đã phải thử nghiệm nhiều thuật toán khác nhau nhưng có các thuật toán không đem lại kết quả như kỳ vọng. Khó khăn là vậy nhưng nhóm đã không nản chí và tiếp tục cố gắng trong suốt quá trình diễn ra cuộc thi để cuối cùng tìm ra một giải pháp tốt nhất và giành được vị trí cao nhất trong cuộc thi. Mỗi thời điểm bài thi được nộp lên hệ thống và thấy kết quả được cải thiện đều là những kỷ niệm đáng nhớ đối với nhóm’, ông Đồng tâm sự.

Viện CMC ATI tiền thần là Viện Nghiên cứu Ứng dụng Công nghệ CMC (CIST) được thành lập ngày 15/7/2014. Hiện tại, CMC ATI đang có gần 60 thành viên. Các chức năng chính của Viện bao gồm nghiên cứu khoa học và phát triển công nghệ trong lĩnh vực CNTT – Viễn thông; cung cấp các dịch vụ khoa học công nghệ như tư vấn, chuyển giao công nghệ, tham gia đào tạo, bồi dưỡng nâng cao nghiệp vụ chuyên môn, hợp tác trong nước và quốc tế; bên cạnh triển khai thực nghiệm và sản xuất thử nghiệm từ kết quả nghiên cứu khoa học.

Hiện tại, CMC đang tập trung xu hướng dịch chuyển các sản phẩm Viện nghiên cứu và phát triển mang khả năng ứng dụng cao và thương mại hóa các giải pháp. Việc đổi tên Viện CMC CIST thành Viện CMC ATI cũng đánh dấu một bước chuyển mới trong chiến lược phát triển của tập đoàn CMC./.

Bài liên quan
  • CMC tăng trưởng mạnh mảng kinh doanh quốc tế
    Tập đoàn Công nghệ CMC (CMG) công bố kết quả 9 tháng đầu năm tài chính 2022 tăng trưởng ấn tượng. Đặc biệt là ở lĩnh vực kinh doanh quốc tế, doanh thu tăng trưởng 75% so với cùng kỳ.
Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
CMC ATI dành các giải thưởng trong việc phát triển giải pháp AI ứng dụng vào cuộc sống
POWERED BY ONECMS - A PRODUCT OF NEKO