Xã hội số

Viettel Cyberspace đưa sản phẩm Make in VietNam vươn tầm thế giới

PV 26/09/2023 15:16

Vừa qua tại sự kiện IDCAR lần thứ 17, hội nghị hàng đầu thế giới về phân tích và nhận dạng tài liệu tại Mỹ. Trung tâm Không gian mạng Viettel (Viettel Cyberspace), đã công bố kết quả nghiên cứu khoa học.

Hội nghị ICDAR lần thứ 17 được tổ chức tại California, Mỹ, Viettel là đơn vị duy nhất đại diện doanh nghiệp Việt Nam tham dự sự kiện này cùng nhiều chuyên gia cấp cao đến từ các tổ chức hàng đầu về nghiên cứu AI trong lĩnh vực xử lý ảnh tài liệu như Google Research, Microsoft Research, Adobe, Naver, CASIA, Wacom, Goodnote…

Theo nội dung Trung tâm Không gian mạng Viettel (Viettel Cyberspace) công bố tại sự kiện, Viettel Cyberspace mang đến sự kiện các sản phẩm công nghệ được tập trung cải thiện hiệu suất nhận diện cấu trúc bảng trong ảnh tài liệu, đặc biệt là với những bảng có cấu trúc phức tạp.

Cũng theo Viettel Cyberspace cho biết trích xuất thông tin trong bảng biểu thuộc ảnh tài liệu đang là bài toán rất thách thức do cấu trúc đọc khác biệt với dữ liệu đoạn văn thông thường, trong khi thông tin của bảng lại mang nhiều ý nghĩa quan trọng, nhất là trong các lĩnh vực tài chính, ngân hàng, bảo hiểm.

fgrghfgh.jpg
Nhóm nghiên cứu công nghệ OCR, Viettel Cyberspace tham gia hội nghị

Công nghệ này đang được ứng dụng trong Viettel Intelligent Document Processing (Viettel IDP), thuộc hệ sinh thái sản phẩm Viettel AI, cho phép chuyển đổi không chỉ chữ mà cả bảng biểu từ dạng hình ảnh sang định dạng có thể chỉnh sửa được như Excel, Word với độ chính xác cao.

Điểm khác biệt của Viettel IDP là xem bảng biểu là một thực thể quan trọng trong ảnh tài liệu để trích xuất toàn bộ thông tin, thay vì chỉ coi là một đối tượng ảnh thông thường. Công nghệ này được coi là một trong những thành phần cốt lõi trong xây dựng công cụ chuyển đổi số và tìm kiếm thông tin thông minh.

Phương pháp này đặc biệt hiệu quả với các ô trong bảng, không chỉ áp dụng với ô tiêu đề. Thử nghiệm trên các bộ dữ liệu chuẩn, phương pháp này cho kết quả cao hơn hẳn về độ chính xác so với các phương pháp đã được công bố trước đó. Cụ thể, cao hơn 0,3% F1-score trên tập dữ liệu SciTSR-COMP và cao hơn 1,2% WAvgF1 trên tập ICDAR19-cTDaR so với kết quả đứng thứ hai.

Ông Nguyễn Mạnh Quý, Giám đốc Viettel Cyberspace chia sẻ: "Viettel Cyberspace luôn đề cao nghiên cứu công nghệ gắn liền với ứng dụng thực tiễn. Với các công nghệ lõi trong lĩnh vực trí tuệ nhân tạo (AI), chúng tôi xác định mục tiêu không ngừng nghiên cứu, tìm tòi và phát triển các phương pháp, thuật toán mới. Từ đó, đơn vị liên tục ứng dụng nâng cấp chất lượng của các sản phẩm, dịch vụ trong hệ sinh thái Viettel AI, hỗ trợ hiệu quả cho quá trình chuyển đổi số của các tổ chức, doanh nghiệp và chính phủ".

Thông thường, việc nhận diện các ô gộp trong bảng (Spanning cells) dễ bị bỏ sót nội dung, sai định dạng khiến thông tin không còn chính xác. Thay vì chỉ lấy thông tin từ một số ô lân cận ô gộp để xử lý như các phương pháp cũ, Viettel Cyberspace đề xuất sử dụng mạng nơ-ron dựa trên cấu trúc Transformer, nhận diện đặc trưng từ tất cả các ô trong bảng, giúp nhận diện đúng và không bỏ sót nội dung.

Phương pháp này đặc biệt hiệu quả với các ô trong bảng, không chỉ áp dụng với ô tiêu đề. Thử nghiệm trên các bộ dữ liệu chuẩn, phương pháp này cho kết quả cao hơn hẳn về độ chính xác so với các phương pháp đã được công bố trước đó. Cụ thể, cao hơn 0,3% F1-score trên tập dữ liệu SciTSR-COMP và cao hơn 1,2% WAvgF1 trên tập ICDAR19-cTDaR so với kết quả đứng thứ hai.

Viettel Cyberspace hiện cung cấp hệ sinh thái sản phẩm trí tuệ nhân tạo Viettel AI gồm 5 dòng sản phẩm: Nền tảng trí tuệ nhân tạo, nền tảng quản trị và phân tích dữ liệu, nền tảng trợ lý ảo, nền tảng robot thông minh và nền tảng bản sao số.

International Conference on Document Analysis and Recognition (ICDAR) thuộc top 14,55% hội nghị uy tín nhất thế giới về AI trong số các hội nghị được xếp hạng. Đây là sự kiện quốc tế hàng đầu dành cho các nhà khoa học, kỹ sư về phân tích và nhận dạng tài liệu, một lĩnh vực ngày càng quan trọng trong thời đại chuyển đổi số hiện nay. Các nghiên cứu khoa học sẽ phải vượt qua nhiều vòng thẩm định vô danh khắt khe từ hội đồng chuyên gia đến từ nhiều quốc gia trên thế giới. Hội nghị được tổ chức 2 năm một lần, trung bình có khoảng 30% nghiên cứu được chấp nhận mỗi năm.

Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
  • Chữ ký số và dịch vụ tin cậy: Nền tảng then chốt cho kinh tế số trong thời đại lượng tử
    Dịch vụ tin cậy - đặc biệt là chữ ký số là mắt xích quan trọng, cốt lõi để xây dựng niềm tin số, bảo đảm rằng mọi giao dịch trên không gian mạng đều an toàn, có căn cứ pháp lý và đáng tin cậy.
  • Báo chí đổi mới, sáng tạo, ứng dụng công nghệ để nâng tầm và phát triển
    Trưởng Ban Tuyên giáo và Dân vận Trung ương Nguyễn Trọng Nghĩa đề nghị báo chí phải lấy đổi mới sáng tạo làm động lực, lấy công nghệ làm công cụ để nâng tầm báo chí Việt Nam.
  • Chính thức phát hành bộ tem kỷ niệm 100 năm Ngày Báo chí Cách mạng Việt Nam
    Theo Thứ trưởng Bộ KH&CN Bùi Hoàng Phương, phát hành bộ tem bưu chính “Kỷ niệm 100 năm Ngày Báo chí Cách mạng Việt Nam (1925 - 2025)” là hoạt động thiết thực, có ý nghĩa chính trị, văn hóa sâu sắc nhằm tôn vinh chặng đường một thế kỷ hình thành và phát triển của nền báo chí cách mạng Việt Nam.
  • Trẻ em gia tăng mức độ tìm kiếm công cụ AI, trào lưu từ Ý
    Trẻ em đang ngày càng quan tâm đến các chatbot ứng dụng AI, cùng trào lưu có xuất xứ từ Ý “tralalero tralala” - một kiểu “brainrot meme” (các hình ảnh, GIF, clip ngắn về nội dung chất lượng thấp hoặc có ít giá trị).
  • Bộ công cụ bảo mật không gian làm việc được hỗ trợ bởi AI
    FortiMail Workspace Security và các bản nâng cấp FortiDLP mạnh mẽ của Fortinet sẽ nâng cao khả năng bảo vệ cho email, trình duyệt và các công cụ cộng tác trong khi vẫn bảo vệ hiệu quả các dữ liệu nhạy cảm khỏi mối đe dọa nội bộ
  • Thời đại của báo chí hậu nhân (posthuman journalism)
    Một sáng nào đó, bạn mở điện thoại lên và đọc một bản tin về biến đổi khí hậu. Tin được viết súc tích, nhiều dữ liệu, hình ảnh minh họa động, có cả đoạn video tổng hợp các góc nhìn từ chuyên gia. Mọi thứ có vẻ rất chuyên nghiệp - nhưng không có tên tác giả. Thay vào đó là dòng chữ nhỏ: “Sản phẩm của hệ thống ngôn ngữ tự động phiên bản X, phối hợp cùng dữ liệu vệ tinh từ hệ thống số hóa của Liên minh Địa cầu” Bạn băn khoăn: Vậy ai là tác giả thực của sản phẩm này?
  • Bộ trưởng Bộ Tài chính trả lời thu hút doanh nghiệp tư nhân tham gia đổi mới sáng tạo
    Sáng 19/6, trả lời chất vấn của đại biểu Quốc hội Lê Thị Ngọc Linh (Đoàn ĐBQH tỉnh Bạc Liêu) về cơ chế thu hút doanh nghiệp tư nhân vào đổi mới sáng tạo, Bộ trưởng Tài chính Nguyễn Văn Thắng cho biết, sẽ có cơ chế thu hút đầu tư từ các doanh nghiệp tư nhân, tạo hệ sinh thái từ đào tạo, thử nghiệm.
  • Tin tặc tấn công nhằm phá huỷ sàn giao dịch tiền điện tử lớn nhất tại Iran
    Căng thẳng địa chính trị ở Trung Đông đã lan sang ngành công nghiệp tiền điện tử. Ngày 18/6, Nobitex, sàn giao dịch tiền điện tử lớn nhất tại Iran, đã bị tấn công hơn 90 triệu USD, theo công ty phân tích tiền điện tử Elliptic.
  • Cơ hội, thách thức và trách nhiệm người làm báo trong kỷ nguyên AI
    Nhân kỷ niệm 100 năm Ngày Báo chí Cách mạng Việt Nam (21/6/1925 - 21/6/2025), trong bối cảnh trí tuệ nhân tạo (AI) đang làm thay đổi mạnh mẽ mọi lĩnh vực của đời sống, trong đó có báo chí, phóng viên TTXVN tại Brussels đã có dịp trao đổi với 2 chuyên gia báo chí tại Đại học Tự do Brussels (ULB) của Bỉ: ông David Grunewald, giảng viên truyền thông và ông Alain Gérard, Tổng Biên tập tạp chí “Latitude” và cũng là giảng viên và nhà đào tạo báo chí với hơn 30 năm kinh nghiệm.
  • Own - Ứng dụng mạng xã hội mới hướng đến mã hóa nền kinh tế sáng tạo
    Khi thời hạn TikTok phải bán mảng hoạt động tại Mỹ đến gần, một ứng dụng mạng xã hội phi tập trung mới mang tên Own đã chính thức ra mắt phiên bản beta mới đây, đánh dấu sự xuất hiện của một đối thủ tiềm năng trên thị trường.
Viettel Cyberspace đưa sản phẩm Make in VietNam vươn tầm thế giới
POWERED BY ONECMS - A PRODUCT OF NEKO