Ví dụ, EBay đã khởi động tính năng thị giác máy tính cho phép tìm kiếm các sản phẩm bằng hình ảnh thay vì sử dụng từ khóa hoặc mô tả. Tìm kiếm bằng hình ảnh cho phép khách hàng chỉ cần chụp ảnh sản phẩm để tìm sản phẩm tương tự trên thị trường.
Trong lĩnh vực chăm sóc sức khỏe, việc sử dụng mạng nơron hứa hẹn nâng cao năng lực chẩn đoán. Ngày nay, các mạng thần kinh được sử dụng để phân loại ung thư da và có thể xác định khối u ác tính với độ chính xác 90%.
Ngoài ra công nghệ này còn được ứng dụng trong an ninh quốc phòng. Gần đây, các cơ quan hành pháp của Mỹ đã sử dụng ứng dụng Amazon Rekognition để phát hiện các đối tượng tình nghi. Hệ thống nhận dạng khuôn mặt tiên tiến này không chỉ theo dõi mọi người trong thời gian thực mà còn cho thấy tuổi tác và trạng thái cảm xúc của họ.
Do mạng thần kinh đã chứng tỏ được sự hoàn thiện ở nhiều lĩnh vực khác nhau, nhiều thương hiệu đang tập trung nghiên cứu tiềm năng của dữ liệu hình ảnh để tích hợp với các chiến lược chuyển đổi kỹ thuật số.
Dưới đây là những cơ hội sử dụng mạng nơron trong các doanh nghiệp dữ liệu hình ảnh:
Cải thiện mục tiêu và cá nhân hóa
Các công ty kinh doanh theo mô hình doanh nghiệp – khách hàng B2C liên tục tìm kiếm cơ hội tiếp cận khách hàng và hình dung được những kỳ vọng và mục tiêu của doanh nghiệp. Nhờ nền tảng truyền thông xã hội và nền tảng đánh giá của khách hàng, doanh nghiệp có thể dễ dàng nhận biết đánh giá của khách hàng về các sản phẩm và dịch vụ, chứ không phải những gì họ thấy và trình bày.
Thị giác máy tính có thể mở rộng tầm nhìn của doanh nghiệp với khách hàng của mình. Nhờ hình ảnh doanh nghiệp có thể nhận biết tốt hơn sở thích của khách hàng. Do đó, những doanh nghiệp lĩnh hội được những dữ liệu này có thể dẫn đầu cuộc cạnh tranh.
Startup Shoto là một trong những công ty đầu tiên nhận ra cơ hội này. Công ty đã đào tạo mạng lưới thần kinh để có thể hiểu những hình ảnh mọi người chụp tại các sự kiện và cho phép người tham dự trao đổi những bức ảnh này.
Đầu tiên, nó cải thiện mối quan hệ với khách hàng và tăng cường mức độ phủ sóng trên truyền thông xã hội. Tuy nhiên, đây chưa phải viên đá quý thực sự. Quan trọng nhất là công ty có thể nhận biết thông tin về các sự kiện – phần nào được ưa thích nhất, điều gì khiến các diễn giả chính có thể thu hút được phần đông khán giả, số lượng người tham gia trực tuyến. Thông tin này cho phép các công ty đưa ra quyết định dựa trên dữ liệu được cung cấp để rút kinh nghiệm cho các sự kiện tiếp theo, cá nhân hóa các mục phù hợp với một số đối tượng nhất định và hướng đến người tham dự tốt hơn.
Tăng phạm vi tiếp cận
Khi mạng nơron hiểu nội dung hình ảnh, chúng có thể biến đổi thành bất kỳ hình thức giao tiếp nào. Nói cách khác, nó có thể viết ra hoặc nói ra, ví dụ, bằng cách sử dụng hỗ trợ giọng nói. Điều này có nghĩa là phạm vi ứng dụng của nội dung hình ảnh sẽ mở rộng, tùy thuộc vào mục đích.
Facebook bắt đầu dịch hình ảnh thành lời nói để nâng cao trải nghiệm cho khách hàng là người khiếm thị. Công ty đã tạo ra công nghệ thị giác máy tính để có thể biến đổi nội dung hình ảnh thành văn bản và sau đó nói với mọi người bằng tiếng Anh những gì có trong hình bằng các cụm từ đơn giản như “ngoài trời, người cười, chó con”.
ABBYY đã có bước tiến và hỗ trợ nhận dạng văn bản trong các bức ảnh chụp bằng máy ảnh điện thoại thông minh và được dịch tức thì ở cả chế độ trực tuyến và ngoại tuyến. Offline TextGrabber có thể hiểu văn bản từ 10 ngôn ngữ phổ biến. Chế độ trực tuyến mở rộng lên tới 62 nguồn và 104 ngôn ngữ đích được dịch trong thời gian thực.
Tự động hóa quá trình, nâng cao năng suất và độ chính xác
Tận dụng dữ liệu hình ảnh có thể nâng cao trải nghiệm của khách hàng và giúp doanh nghiệp tiếp cận khách hàng tốt hơn bằng các kênh hiện có và kênh mới.
Tuy nhiên, ở một số công ty mà dữ liệu hình ảnh là cốt lõi của hoạt động, cho đến gần đây công việc vẫn chỉ được xử lý thủ công. Ngày nay, nhờ phân tích và xử lý hình ảnh thông minh, các hoạt động này có thể hiệu quả hơn nhiều.
Thứ nhất, thị giác máy tính có thể tự động hóa các quy trình thủ tục giấy tờ đòi hỏi quyết định đơn giản, ví dụ, sao chép dữ liệu từ các mẫu giấy sang các nguồn trực tuyến.
Công ty khởi nghiệp Fintech xây dựng phần mềm Receipt Bank, một hệ thống kế toán cho các đơn vị thuộc ngành nghề khác nhau và tự động hóa các thủ tục giấy tờ bằng ứng dụng thị giác máy tính. Hệ thống phân tích hình ảnh hóa đơn, hóa đơn và biên nhận, trích xuất thông tin quan trọng từ dữ liệu hình ảnh này và tải lên phần mềm của khách hàng. Vì vậy, Receipt Bank cho phép tự động hóa hoàn toàn các công việc có tính lặp lại thường xuyên, nâng cao hiệu quả và thậm chí giảm sai sót và không chính xác.
Thứ hai, các giải pháp nắm bắt dữ liệu trực quan có thể ảnh hưởng đến các hoạt động phức tạp hơn chỉ dành cho con người. Gần đây, Google DeepMind đã tạo ra hệ thống có thể hiển thị các đối tượng 3D từ hình ảnh 2D. Nói cách khác, DeepMind đào tạo mạng thần kinh để tưởng tượng không gian từ các góc độ khác nhau và xây dựng một môi trường ba chiều mà không cần bất kỳ sự giám sát của con người.
Ngày nay, các nhà thiết kế, kỹ sư và kiến trúc sư phải nắm bắt từng phần của cấu trúc để xây dựng mô hình 3D. Thuật toán DeepMind có thể giảm thời gian và chi phí cho thói quen này, và do đó cải thiện hiệu quả cho doanh nghiệp.
Kết luận
Trong hầu hết các trường hợp, mạng thần kinh được huấn luyện tốt là minh chứng cho những gì công nghệ này có thể làm, thay vì những gì nó làm được. Trong thực tế, gợi ý công thức nấu ăn của một tủ lạnh thông minh được đánh giá là một phần thưởng hơn là lợi ích.