Xã hội số

Viettel Cyberspace đưa sản phẩm Make in VietNam vươn tầm thế giới

PV 26/09/2023 15:16

Vừa qua tại sự kiện IDCAR lần thứ 17, hội nghị hàng đầu thế giới về phân tích và nhận dạng tài liệu tại Mỹ. Trung tâm Không gian mạng Viettel (Viettel Cyberspace), đã công bố kết quả nghiên cứu khoa học.

Hội nghị ICDAR lần thứ 17 được tổ chức tại California, Mỹ, Viettel là đơn vị duy nhất đại diện doanh nghiệp Việt Nam tham dự sự kiện này cùng nhiều chuyên gia cấp cao đến từ các tổ chức hàng đầu về nghiên cứu AI trong lĩnh vực xử lý ảnh tài liệu như Google Research, Microsoft Research, Adobe, Naver, CASIA, Wacom, Goodnote…

Theo nội dung Trung tâm Không gian mạng Viettel (Viettel Cyberspace) công bố tại sự kiện, Viettel Cyberspace mang đến sự kiện các sản phẩm công nghệ được tập trung cải thiện hiệu suất nhận diện cấu trúc bảng trong ảnh tài liệu, đặc biệt là với những bảng có cấu trúc phức tạp.

Cũng theo Viettel Cyberspace cho biết trích xuất thông tin trong bảng biểu thuộc ảnh tài liệu đang là bài toán rất thách thức do cấu trúc đọc khác biệt với dữ liệu đoạn văn thông thường, trong khi thông tin của bảng lại mang nhiều ý nghĩa quan trọng, nhất là trong các lĩnh vực tài chính, ngân hàng, bảo hiểm.

fgrghfgh.jpg
Nhóm nghiên cứu công nghệ OCR, Viettel Cyberspace tham gia hội nghị

Công nghệ này đang được ứng dụng trong Viettel Intelligent Document Processing (Viettel IDP), thuộc hệ sinh thái sản phẩm Viettel AI, cho phép chuyển đổi không chỉ chữ mà cả bảng biểu từ dạng hình ảnh sang định dạng có thể chỉnh sửa được như Excel, Word với độ chính xác cao.

Điểm khác biệt của Viettel IDP là xem bảng biểu là một thực thể quan trọng trong ảnh tài liệu để trích xuất toàn bộ thông tin, thay vì chỉ coi là một đối tượng ảnh thông thường. Công nghệ này được coi là một trong những thành phần cốt lõi trong xây dựng công cụ chuyển đổi số và tìm kiếm thông tin thông minh.

Phương pháp này đặc biệt hiệu quả với các ô trong bảng, không chỉ áp dụng với ô tiêu đề. Thử nghiệm trên các bộ dữ liệu chuẩn, phương pháp này cho kết quả cao hơn hẳn về độ chính xác so với các phương pháp đã được công bố trước đó. Cụ thể, cao hơn 0,3% F1-score trên tập dữ liệu SciTSR-COMP và cao hơn 1,2% WAvgF1 trên tập ICDAR19-cTDaR so với kết quả đứng thứ hai.

Ông Nguyễn Mạnh Quý, Giám đốc Viettel Cyberspace chia sẻ: "Viettel Cyberspace luôn đề cao nghiên cứu công nghệ gắn liền với ứng dụng thực tiễn. Với các công nghệ lõi trong lĩnh vực trí tuệ nhân tạo (AI), chúng tôi xác định mục tiêu không ngừng nghiên cứu, tìm tòi và phát triển các phương pháp, thuật toán mới. Từ đó, đơn vị liên tục ứng dụng nâng cấp chất lượng của các sản phẩm, dịch vụ trong hệ sinh thái Viettel AI, hỗ trợ hiệu quả cho quá trình chuyển đổi số của các tổ chức, doanh nghiệp và chính phủ".

Thông thường, việc nhận diện các ô gộp trong bảng (Spanning cells) dễ bị bỏ sót nội dung, sai định dạng khiến thông tin không còn chính xác. Thay vì chỉ lấy thông tin từ một số ô lân cận ô gộp để xử lý như các phương pháp cũ, Viettel Cyberspace đề xuất sử dụng mạng nơ-ron dựa trên cấu trúc Transformer, nhận diện đặc trưng từ tất cả các ô trong bảng, giúp nhận diện đúng và không bỏ sót nội dung.

Phương pháp này đặc biệt hiệu quả với các ô trong bảng, không chỉ áp dụng với ô tiêu đề. Thử nghiệm trên các bộ dữ liệu chuẩn, phương pháp này cho kết quả cao hơn hẳn về độ chính xác so với các phương pháp đã được công bố trước đó. Cụ thể, cao hơn 0,3% F1-score trên tập dữ liệu SciTSR-COMP và cao hơn 1,2% WAvgF1 trên tập ICDAR19-cTDaR so với kết quả đứng thứ hai.

Viettel Cyberspace hiện cung cấp hệ sinh thái sản phẩm trí tuệ nhân tạo Viettel AI gồm 5 dòng sản phẩm: Nền tảng trí tuệ nhân tạo, nền tảng quản trị và phân tích dữ liệu, nền tảng trợ lý ảo, nền tảng robot thông minh và nền tảng bản sao số.

International Conference on Document Analysis and Recognition (ICDAR) thuộc top 14,55% hội nghị uy tín nhất thế giới về AI trong số các hội nghị được xếp hạng. Đây là sự kiện quốc tế hàng đầu dành cho các nhà khoa học, kỹ sư về phân tích và nhận dạng tài liệu, một lĩnh vực ngày càng quan trọng trong thời đại chuyển đổi số hiện nay. Các nghiên cứu khoa học sẽ phải vượt qua nhiều vòng thẩm định vô danh khắt khe từ hội đồng chuyên gia đến từ nhiều quốc gia trên thế giới. Hội nghị được tổ chức 2 năm một lần, trung bình có khoảng 30% nghiên cứu được chấp nhận mỗi năm.

Nổi bật Tạp chí Thông tin & Truyền thông
  • 5G và những thay đổi toàn diện trong xây dựng thành phố thông minh
    Với tốc độ cực cao, độ trễ cực thấp, băng thông rộng và kết nối mật độ cực lớn, 5G là hạ tầng cốt lõi hỗ trợ toàn diện cho sự đổi mới và phát triển của thành phố thông minh trên tất cả các lĩnh vực, tác động tích cực vào công tác xây dựng và quản lý thành phố, tạo ra một môi trường sống tiện nghi, bền vững và an toàn hơn bao giờ hết.
  • ĐMST mở xã hội mang lại cho 90% doanh nghiệp cơ hội tạo giá trị kinh doanh bền vững
    Theo bà Nguyễn Phương Linh, Viện trưởng Viện MSD, hơn 90% các doanh nghiệp cho rằng đổi mới sáng tạo (ĐMST) mở xã hội mang lại cho doanh nghiệp cơ hội tạo ra giá trị kinh doanh bền vững, tác động tích cực đến xã hội và môi trường.
  • ‏FPT đẩy mạnh phát triển giải pháp low-code tại thị trường Hàn Quốc‏
    ‏Mới đây, FPT vừa ký kết thỏa thuận hợp tác ba năm với OutSystems, chính thức trở thành đối tác phân phối và triển khai tại thị trường Hàn Quốc, đảm bảo thời gian ra mắt phần mềm của khách hàng được rút ngắn và tối ưu chi phí.
  • Người giữ bình yên nơi vùng cao
    Huyện Sơn Động là huyện vùng cao của tỉnh Bắc Giang, có tỷ lệ người dân tộc thiểu số (DTTS) cao nhất tỉnh, chiếm 56,92%, với địa hình rừng núi, giao thông đi lại khó khăn, phong tục tập quán, bản sắc văn hóa đa dạng chính vì vậy công tác đảm bảo an ninh trật tự ở các bản làng luôn là nhiệm vụ được các cấp ủy Đảng quan tâm. Do đó, đội ngũ già làng, trưởng bản, người uy tín luôn là đội ngũ nòng cốt góp phần xây dựng khối đại đoàn kết dân tộc, giữ gìn an ninh trật tự xã hội trong cộng đồng.
  • Tuyên Quang: Kiên trì phương châm “mưa dầm thấm lâu” để nâng cao kiến thức pháp luật cho đồng bào vùng DTTS&MN
    Với phương châm “mưa dầm thấm lâu”, những năm qua, các cấp chính quyền tỉnh Tuyên Quang đã đa dạng hoá các hình thức tuyên truyền, góp phần giúp các kiến thức pháp luật về mọi mặt của đời sống ngày một đến gần hơn với người dân (đặc biệt là vùng đồng bào DTTS&MN).
Đừng bỏ lỡ
Viettel Cyberspace đưa sản phẩm Make in VietNam vươn tầm thế giới
POWERED BY ONECMS - A PRODUCT OF NEKO