Nâng cấp công nghệ OCR nhờ khả năng bóc tách vượt trội

Minh Thiện| 06/01/2023 08:03
Theo dõi ICTVietnam trên

OCR đã trở thành một trợ thủ công nghệ đắc lực cho nhiều doanh nghiệp trong quy trình số hóa tài liệu. Không chỉ dừng lại ở việc nhận diện tài liệu, công nghệ này đang dần hoàn thiện và đáp ứng tối đa quy trình số hóa của doanh nghiệp.

Xu hướng số hóa dữ liệu tại Việt Nam

Được nghiên cứu và phát triển dựa trên nền tảng trí tuệ nhân tạo (AI), OCR là giải pháp công nghệ hỗ trợ đắc lực cho nhiều doanh nghiệp (DN) đang loay hoay trên hành trình số hóa tài liệu, chuyển đổi số (CĐS) toàn diện.

OCR (Optical Character Recognition) (nhận dạng ký tự quang học), là ứng dụng công nghệ chuyên dùng để đọc text ở file ảnh.

Được biết đến là một công cụ quét (scan) kỹ thuật số chuyên nhận dạng các ký tự, chữ viết tay, hay chữ đánh máy, công nghệ này chuyên dùng để truyền tải, nhập liệu dữ liệu. Đặc biệt, ở OCR có khả năng số hóa nhiều dạng tài liệu khác nhau: hóa đơn, hộ chiếu, danh thiếp, tài liệu ...

Công nghệ OCR đang ngày càng được sử dụng rộng rãi

Theo báo cáo của Grand View Research, quy mô thị trường OCR toàn cầu dự kiến sẽ đạt ngưỡng 26,31 tỷ USD vào năm 2028. Sự tăng trưởng nhanh chóng này sở dĩ bắt nguồn từ cuộc cách mạng số hóa vận hành trên toàn cầu. Theo đó, các DN sẽ tận dụng tối đa công nghệ OCR để nâng cao hiệu suất kinh doanh, tiết kiệm chi phí lao động.

Tại Việt Nam, xu hướng ứng dụng công nghệ OCR đơn giản quy trình số hóa văn bản, tài liệu cũng đã được nhiều DN triển khai từ năm 2020. Ở giai đoạn triển khai ban đầu, các sản phẩm OCR trên thị trường đã và đang giải quyết hiệu quả bài toán nhận diện, chuyển các loại dữ liệu từ dạng ảnh chụp/scan sang dạng text, có thể chỉnh sửa được.

Tuy nhiên, việc đáp ứng nhu cầu số hóa toàn diện của DN vẫn là một bài toán khó mà ít giải pháp OCR trên thị trường có khả năng thực hiện. Bởi mỗi DN đều có hàng nghìn các loại tài liệu, biểu mẫu mang những đặc thù riêng biệt. Vì thế, một giải pháp OCR thông thường khó có thể số hóa được toàn bộ các loại tài liệu này với độ chính xác mà DN mong muốn. Chưa kể đến khả năng tự động hóa toàn bộ quy trình số hóa (tự động bóc tách, phân luồng, chỉnh sửa và trả dữ liệu) cũng là tính năng mà nhiều DN mong muốn nhưng ít giải pháp OCR trên thị trường có thể đáp ứng.

Tích hợp tính năng bóc tách SmartOCR Studio giúp tăng tốc quy trình số hóa tài liệu

Nhìn nhận được bài toán của thị trường, ông Nguyễn Tấn Minh, Phó Tổng Giám đốc GMO-Z.com RUNSYSTEM chia sẻ: “Chúng tôi đã tập trung nghiên cứu chuyên sâu về công nghệ OCR và phát triển một tính năng tích hợp trong OCR gọi là SmartOCR Studio. Tính năng này có khả năng giúp DN chủ động trong việc tự xử lý dữ liệu, tự số hóa mọi loại tài liệu mà DN mong muốn”.

Tính năng bóc tách SmartOCR Studio tạo nên hiệu quả cao hơn so với các giải pháp khác hiện có tại Việt Nam

Ra mắt từ tháng 3/2022, tính năng bóc tách SmartOCR Studio đã giúp công nghệ OCR của GMO trở thành giải pháp nhận diện văn bản hoàn thiện, giải quyết bài toán số hóa phức tạp của nhiều doanh nghiệp.

Với khả năng bóc tách mọi loại tài liệu, SmartOCR Studio hoàn toàn cho phép người dùng tự định nghĩa và bóc tách các trường thông tin mong muốn ngay trên giao diện web mà không cần lập trình. Đặc biệt là khả năng nhận diện chữ viết tay duy nhất trên thị trường với độ chính xác lên tới 95% (trong điều kiện dữ liệu đầu vào tốt), SmartOCR có thể giúp DN chủ động bóc tách và số hóa hàng trăm, hàng nghìn biểu mẫu mà không cần tốn thêm chi phí cũng như thời gian chờ đợi.

Bên cạnh khả năng bóc tách dữ liệu vượt trội, SmartOCR Studio còn giúp tự động hóa toàn bộ chu trình thực hiện OCR từ đầu tới cuối. Bắt đầu từ việc nhập dữ liệu từ kho dữ liệu vào SmartOCR, nhận diện chữ viết, thực hiện bóc tách dữ liệu, phân luồng, chỉnh sửa và trả ra kết quả theo các định dạng phổ biến như excel, csv, json…

Nhờ vậy, DN có thể ngay lập tức ứng dụng SmartOCR vào bộ máy vận hành hiện tại mà không tốn nhiều thời gian, công sức cho việc tích hợp và triển khai các vùng đệm xử lý.

Khả năng load nhiều file cùng lúc của SmartOCR Studio

Ngoài ra, thay vì phải nhập từng file dữ liệu lên hệ thống, chờ xử lý và lấy kết quả như một vài đơn vị cung cấp OCR khác, SmartOCR Studio có khả năng nhập được nhiều file dữ liệu lên cùng lúc, sau đó hệ thống sẽ tự động xử lý và trả ra kết quả theo từng file đã nhập lên hệ thống ban đầu. Điều này giúp DN có thể tiết kiệm 80% thời gian trong khâu xử lý dữ liệu đầu vào đồng thời giúp nhân viên tạm biệt với tình cảnh tải (upload) hàng trăm file thủ công mỗi ngày.

Chia sẻ về lợi ích mà SmartOCR Studio mang lại cho DN, ông Nguyễn Tấn Minh bày tỏ, số hóa dữ liệu là điều kiện tiền đề để DN có thể ứng dụng bất kỳ công nghệ mới nào. SmartOCR Studio sẽ giúp DN tăng tốc quy trình số hóa dữ liệu bởi khả năng chủ động trong việc bóc tách và xử lý dữ liệu đồng thời nâng cao tính bảo mật thông tin, đặc biệt là trong lĩnh vực ngân hàng, tài chính và bảo hiểm.

Theo Phó Tổng Giám đốc GMO-Z.com RUNSYSTEM, khi sử dụng ứng dụng SmartOCR Studio, DN có thể tiết kiệm từ 50% – 80% thời gian, quy trình, chi phí. Trong tương lai, OCR sẽ được ứng dụng rộng rãi trong toàn bộ các lĩnh vực giúp rút ngắn thủ tục, quy trình, số hóa dữ liệu và gia tăng trải nghiệm cho người dùng./.

Bài liên quan
  • FSI giành 3 giải thưởng tại Top 10 DN CNTT năm 2021
    Công ty CP Đầu tư thương mại và phát triển công nghệ (FSI) đã đạt 03 giải thưởng ở các lĩnh vực: Cung cấp dịch vụ, giải pháp chuyển đổi số (CĐS); cung cấp giải pháp chính phủ điện tử; DN BPO xuất sắc năm 2021 tại Lễ trao giải TOP 10 DN CNTT Việt Nam 2021" (TOP 10 Vietnam ICT Companies 2021) ngày 9/10/2021.
  • Giải pháp Viettel OCR: Lời giải cho "tự động hoá" dữ liệu
    Giúp doanh nghiệp (DN) tiết kiệm 90% thời gian nhập liệu so với cách làm thủ công cùng với độ chính xác đạt đến 99%, đó là những kết quả đã được xác thực khi áp dụng Viettel OCR trong các ngành Tài chính - Ngân hàng, Bảo hiểm, Y tế, GTVT,...
  • Ra mắt ứng dụng nhận dạng và trích xuất văn bản FPT.AI Reader
    FPT Smart Cloud, đơn vị thành viên của FPT, mới đây chính thức ra mắt FPT.AI Reader - Ứng dụng nhận dạng và trích xuất văn bản từ ảnh chụp tự động, cho phép người dùng dễ dàng trích xuất văn bản đa dạng tại nhiều nhóm ngành nghề, với độ chính xác lên tới 98%.
Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
Nâng cấp công nghệ OCR nhờ khả năng bóc tách vượt trội
POWERED BY ONECMS - A PRODUCT OF NEKO