Trí tuệ nhân tạo và thị giác máy tính thúc đẩy tự động hóa việc làm

Phạm Thu Trang, Hồng Phương| 01/08/2018 16:37
Theo dõi ICTVietnam trên

Mạng nơron thể hiện kết quả ấn tượng khi xử lý dữ liệu hình ảnh. Ngày nay, công nghệ huấn luyện thực hiện chức năng não bộ của con người có thể phân loại hàng triệu hình ảnh hoặc nhận dạng các đường nét trong các bức ảnh chụp bằng kính viễn vọng Kepler. Kết quả là, phân tích và xử lý hình ảnh sử dụng trí tuệ nhân tạo không chỉ tạo những bước nhảy vọt trong nhiếp ảnh và mạng xã hội mà còn lấn sang các lĩnh vực khác.

An android looking at x-ray imaging

Ví dụ, EBay đã khởi động tính năng thị giác máy tính cho phép tìm kiếm các sản phẩm bằng hình ảnh thay vì sử dụng từ khóa hoặc mô tả. Tìm kiếm bằng hình ảnh cho phép khách hàng chỉ cần chụp ảnh sản phẩm để tìm sản phẩm tương tự trên thị trường.

Trong lĩnh vực chăm sóc sức khỏe, việc sử dụng mạng nơron hứa hẹn nâng cao năng lực chẩn đoán. Ngày nay, các mạng thần kinh được sử dụng để phân loại ung thư da và có thể xác định khối u ác tính với độ chính xác 90%.

Ngoài ra công nghệ này còn được ứng dụng trong an ninh quốc phòng. Gần đây, các cơ quan hành pháp của Mỹ đã sử dụng ứng dụng Amazon Rekognition để phát hiện các đối tượng tình nghi. Hệ thống nhận dạng khuôn mặt tiên tiến này không chỉ theo dõi mọi người trong thời gian thực mà còn cho thấy tuổi tác và trạng thái cảm xúc của họ.

Do mạng thần kinh đã chứng tỏ được sự hoàn thiện ở nhiều lĩnh vực khác nhau, nhiều thương hiệu đang tập trung nghiên cứu tiềm năng của dữ liệu hình ảnh để tích hợp với các chiến lược chuyển đổi kỹ thuật số.

Dưới đây là những cơ hội sử dụng mạng nơron trong các doanh nghiệp dữ liệu hình ảnh:

Cải thiện mục tiêu và cá nhân hóa

Các công ty kinh doanh theo mô hình doanh nghiệp – khách hàng B2C liên tục tìm kiếm cơ hội tiếp cận khách hàng và hình dung được những kỳ vọng và mục tiêu của doanh nghiệp. Nhờ nền tảng truyền thông xã hội và nền tảng đánh giá của khách hàng, doanh nghiệp có thể dễ dàng nhận biết đánh giá của khách hàng về các sản phẩm và dịch vụ, chứ không phải những gì họ thấy và trình bày.

Thị giác máy tính có thể mở rộng tầm nhìn của doanh nghiệp với khách hàng của mình. Nhờ hình ảnh doanh nghiệp có thể nhận biết tốt hơn sở thích của khách hàng. Do đó, những doanh nghiệp lĩnh hội được những dữ liệu này có thể dẫn đầu cuộc cạnh tranh.

Startup Shoto là một trong những công ty đầu tiên nhận ra cơ hội này. Công ty đã đào tạo mạng lưới thần kinh để có thể hiểu những hình ảnh mọi người chụp tại các sự kiện và cho phép người tham dự trao đổi những bức ảnh này.

Đầu tiên, nó cải thiện mối quan hệ với khách hàng và tăng cường mức độ phủ sóng trên truyền thông xã hội. Tuy nhiên, đây chưa phải viên đá quý thực sự. Quan trọng nhất là công ty có thể nhận biết thông tin về các sự kiện – phần nào được ưa thích nhất, điều gì khiến các diễn giả chính có thể thu hút được phần đông khán giả, số lượng người tham gia trực tuyến. Thông tin này cho phép các công ty đưa ra quyết định dựa trên dữ liệu được cung cấp để rút kinh nghiệm cho các sự kiện tiếp theo, cá nhân hóa các mục phù hợp với một số đối tượng nhất định và hướng đến người tham dự tốt hơn.

Tăng phạm vi tiếp cận

Khi mạng nơron hiểu nội dung hình ảnh, chúng có thể biến đổi thành bất kỳ hình thức giao tiếp nào. Nói cách khác, nó có thể viết ra hoặc nói ra, ví dụ, bằng cách sử dụng hỗ trợ giọng nói. Điều này có nghĩa là phạm vi ứng dụng của nội dung hình ảnh sẽ mở rộng, tùy thuộc vào mục đích.

Facebook bắt đầu dịch hình ảnh thành lời nói để nâng cao trải nghiệm cho khách hàng là người khiếm thị. Công ty đã tạo ra công nghệ thị giác máy tính để có thể biến đổi nội dung hình ảnh thành văn bản và sau đó nói với mọi người bằng tiếng Anh những gì có trong hình bằng các cụm từ đơn giản như “ngoài trời, người cười, chó con”.

ABBYY đã có bước tiến và hỗ trợ nhận dạng văn bản trong các bức ảnh chụp bằng máy ảnh điện thoại thông minh và được dịch tức thì ở cả chế độ trực tuyến và ngoại tuyến. Offline TextGrabber có thể hiểu văn bản từ 10 ngôn ngữ phổ biến. Chế độ trực tuyến mở rộng lên tới 62 nguồn và 104 ngôn ngữ đích được dịch trong thời gian thực.

Tự động hóa quá trình, nâng cao năng suất và độ chính xác

Tận dụng dữ liệu hình ảnh có thể nâng cao trải nghiệm của khách hàng và giúp doanh nghiệp tiếp cận khách hàng tốt hơn bằng các kênh hiện có và kênh mới.

Tuy nhiên, ở một số công ty mà dữ liệu hình ảnh là cốt lõi của hoạt động, cho đến gần đây công việc vẫn chỉ được xử lý thủ công. Ngày nay, nhờ phân tích và xử lý hình ảnh thông minh, các hoạt động này có thể hiệu quả hơn nhiều.

Thứ nhất, thị giác máy tính có thể tự động hóa các quy trình thủ tục giấy tờ đòi hỏi quyết định đơn giản, ví dụ, sao chép dữ liệu từ các mẫu giấy sang các nguồn trực tuyến.

Công ty khởi nghiệp Fintech xây dựng phần mềm Receipt Bank, một hệ thống kế toán cho các đơn vị thuộc ngành nghề khác nhau và tự động hóa các thủ tục giấy tờ bằng ứng dụng thị giác máy tính. Hệ thống phân tích hình ảnh hóa đơn, hóa đơn và biên nhận, trích xuất thông tin quan trọng từ dữ liệu hình ảnh này và tải lên phần mềm của khách hàng. Vì vậy, Receipt Bank cho phép tự động hóa hoàn toàn các công việc có tính lặp lại thường xuyên, nâng cao hiệu quả và thậm chí giảm sai sót và không chính xác.

Thứ hai, các giải pháp nắm bắt dữ liệu trực quan có thể ảnh hưởng đến các hoạt động phức tạp hơn chỉ dành cho con người. Gần đây, Google DeepMind đã tạo ra hệ thống có thể hiển thị các đối tượng 3D từ hình ảnh 2D. Nói cách khác, DeepMind đào tạo mạng thần kinh để tưởng tượng không gian từ các góc độ khác nhau và xây dựng một môi trường ba chiều mà không cần bất kỳ sự giám sát của con người.

Ngày nay, các nhà thiết kế, kỹ sư và kiến trúc sư phải nắm bắt từng phần của cấu trúc để xây dựng mô hình 3D. Thuật toán DeepMind có thể giảm thời gian và chi phí cho thói quen này, và do đó cải thiện hiệu quả cho doanh nghiệp.

Kết luận

Trong hầu hết các trường hợp, mạng thần kinh được huấn luyện tốt là minh chứng cho những gì công nghệ này có thể làm, thay vì những gì nó làm được. Trong thực tế, gợi ý công thức nấu ăn của một tủ lạnh thông minh được đánh giá là một phần thưởng hơn là lợi ích.

Nổi bật Tạp chí Thông tin & Truyền thông
  • 5G và những thay đổi toàn diện trong xây dựng thành phố thông minh
    Với tốc độ cực cao, độ trễ cực thấp, băng thông rộng và kết nối mật độ cực lớn, 5G là hạ tầng cốt lõi hỗ trợ toàn diện cho sự đổi mới và phát triển của thành phố thông minh trên tất cả các lĩnh vực, tác động tích cực vào công tác xây dựng và quản lý thành phố, tạo ra một môi trường sống tiện nghi, bền vững và an toàn hơn bao giờ hết.
  • Cuộc đua trung tâm dữ liệu AI tại Đông Nam Á
    Trí tuệ nhân tạo (AI) đã trở thành một động lực chính thúc đẩy đổi mới công nghệ toàn cầu và Đông Nam Á đang ngày càng khẳng định vai trò của mình trong cuộc đua phát triển AI. Hàng loạt các hãng công nghệ và đám mây lớn đã thông báo kế hoạch xây dựng, vận hành trung tâm dữ liệu mới tại Đông Nam Á.
  • Hai nền tảng số MISA được công nhận là sản phẩm Thương hiệu quốc gia Việt Nam 2024
    Vượt qua hơn 1.000 hồ sơ và nhiều vòng thẩm định khắt khe, MISA có hai nền tảng số đạt danh hiệu Thương hiệu quốc gia Việt Nam 2024.
  • Mở rộng trông xe không dùng tiền mặt mang lại lợi ích "kép"
    Việc áp dụng hình thức thanh toán qua ứng dụng thu phí không dừng VETC và mã QR vào hoạt động thanh toán phí gửi xe không dùng tiền mặt không những góp phần từng bước hình thành hệ thống giao thông thông minh mà còn tăng cường công tác quản lý nhà nước, minh bạch trong công tác thu phí dịch vụ trông giữ xe.
  • 10 xu hướng định hình tương lai của quản lý giao dịch số
    Quản lý giao dịch số đang phát triển mạnh mẽ, được thúc đẩy bởi những tiến bộ công nghệ và nhu cầu ngày càng tăng về xử lý tài liệu an toàn, hiệu quả. Đây là công cụ quan trọng giúp doanh nghiệp giảm bớt thủ tục hành chính và tối ưu hóa quy trình xử lý tài liệu số.
Đừng bỏ lỡ
Trí tuệ nhân tạo và thị giác máy tính thúc đẩy tự động hóa việc làm
POWERED BY ONECMS - A PRODUCT OF NEKO