Trong vài năm qua, các ứng dụng thị giác máy tính (computer vision) đã trở nên phổ biến. Từ smartphone nhận dạng khuôn mặt người dùng, ô tô tự lái, đến vệ tinh theo dõi chuyển động của tàu, giá trị của thị giác máy tính (TGMT) chưa bao giờ rõ ràng như hiện nay.
Nhưng tình trạng thiếu hụt phần cứng và gián đoạn nhân lực trong bối cảnh đại dịch đang trở thành thách thức về khả năng của các công ty trong việc thực hiện các kế hoạch liên quan đến TGMT, ngay cả khi chính đại dịch đã trở thành tác nhân đẩy nhanh việc ứng dụng TGMT.
Sau đây là cái nhìn về cách các công ty trong nhiều ngành đang triển khai TGMT để cải thiện và tối ưu hóa các quy trình kinh doanh chính, từ bán lẻ đến chẩn đoán chăm sóc sức khỏe.
TGMT là gì?
TGMT là một lĩnh vực AI tập trung vào việc xử lý hình ảnh và video để trích xuất ra thông tin có ý nghĩa. Ví dụ về ứng dụng của TGMT, bao gồm nhận dạng ký tự quang học, nhận dạng hình ảnh, nhận dạng mẫu, nhận dạng khuôn mặt, phát hiện và phân loại đối tượng...
Các ngành sử dụng nhiều TGMT bao gồm sản xuất, chăm sóc sức khỏe (CSSK), ô tô, nông nghiệp, hậu cần và chuỗi cung ứng... Trong các doanh nghiệp, các động lực hàng đầu để triển khai TGMT bao gồm tự động hóa, cải tiến quy trình và năng suất, cũng như tuân thủ quy định và an toàn...
Theo IDC, tổng thị trường toàn cầu cho công nghệ TGMT sẽ tăng lên 2,1 tỷ USD trong năm nay, từ 760 triệu USD vào năm 2020, với tốc độ tăng trưởng kép hàng năm là 57%, dự kiến đến năm 2025, với tổng giá trị thị trường là 7,2 tỷ USD.
Hầu hết thị trường này hiện đang được triển khai tại chỗ, nhưng IDC dự đoán, việc triển khai lên đám mây công cộng sẽ chiếm 48% chi tiêu cho TGMT vào năm 2025.
Mở rộng quy mô, xúc tiến thực hiện và giao hàng
Ngành bán lẻ đã chứng kiến sự gián đoạn đáng kể trong thời điểm đại dịch, với việc khách hàng chuyển sang mua sắm trực tuyến nhiều hơn và ngày càng chuyển sang hình thức giao hàng tận nhà.
Ví dụ, Walmart đã cho biết, số lượng người mua sắm muốn giao hàng tận nơi đã tăng gấp 6 lần so với trước đại dịch. Để đối phó với thách thức này, chuỗi đại siêu thị đa quốc gia đã tăng công suất nhận và giao hàng lên 20% vào năm ngoái và có kế hoạch tăng thêm 35% trong năm nay.
Để biến điều này thành hiện thực, Walmart đang đầu tư vào một công nghệ được tích hợp TGMT, bao gồm cả máy bay không người lái và xe tự hành. Tháng 7 năm ngoái, công ty đã công bố kế hoạch triển khai robot từ Symbotic tại 25 trong số 42 trung tâm phân phối khu vực của mình. Các robot sử dụng TGMT và một số công nghệ AI khác để di chuyển hàng hóa trong các nhà kho.
Trong khi đó, chuỗi siêu thị Kroger của Mỹ đã và đang đầu tư vào các trung tâm vi mô - kho phân phối quy mô nhỏ, được tự động hóa nhiều, nằm ở gần nơi khách hàng sinh sống. Theo công ty, mục tiêu là giao hàng tạp hóa cho khách trong vòng 30 phút. Từ mùa hè năm ngoái, Kroger đã mở các cơ sở ở Florida, Alabama, Texas, California, Ohio và Georgia, và có kế hoạch mở thêm 17 cơ sở trong vòng 24 tháng tới.
Tại một địa điểm, hơn 1.000 bot "quay xung quanh các lưới 3D khổng lồ, được điều phối bởi các hệ thống kiểm soát không lưu độc quyền," theo Kroger. Thay vì di chuyển toàn bộ các pallet sản phẩm như ở trung tâm phân phối khu vực, ở đây các robot lấy từng gói hàng riêng lẻ. TGMT được sử dụng để phân loại và đóng gói hàng sao cho các mặt hàng nặng ở dưới cùng và các túi có trọng lượng đồng đều.
Nhà đồng sáng lập Ori Avraham cho biết: "Chúng tôi sử dụng TGMT như một công nghệ quan trọng trong giải pháp robot của công ty. Ví dụ, khả năng điều hướng chính xác của robot trên sàn dựa trên phân tích tầm nhìn của các miếng dán sàn. Quá trình này diễn ra trong thời gian thực như một phần của điều hướng robot."
Ông nói, các cánh tay robot cũng sử dụng TGMT. "Để làm được điều đó, chúng tôi sử dụng thuật toán phân đoạn và phân loại để cho phép chọn và đặt hàng. Cả hai khả năng này đều quan trọng đối với khả năng vận hành thành công các trung tâm thực hiện vi mô".
Tháng trước, Fabric đã mở một trung tâm thực hiện vi mô mới ở Dallas, bổ sung vào các hoạt động hiện có của họ ở New York, Washington DC, và Tel Aviv. Fabric có quan hệ đối tác với Walmart, Instacart và FreshDirect, họ có kế hoạch tăng gấp đôi mạng lưới các trung tâm thực hiện vi mô vào cuối năm nay.
Hợp lý hóa và cải tiến quy trình sản xuất
Sản xuất là một ngành khác đang được cách mạng hóa bởi TGMT, được sử dụng rộng rãi trên các dây chuyền sản xuất để kiểm tra sản phẩm, tự động hóa quy trình và tối ưu hóa năng suất.
Mike Griffin, nhà khoa học dữ liệu trưởng tại Insight - một công ty tư vấn công nghệ đã làm việc với một số khách hàng sản xuất về các dự án TGMT. Quan hệ đối tác này liên quan đến việc phát triển một hệ thống trong đó có thể sử dụng thiết bị cầm tay để chụp ảnh thùng sản phẩm và tự động cung cấp số lượng sản phẩm trong thùng.
Griffin nói: "Nghe có vẻ dễ phát triển, nhưng thách thức là ứng dụng thị giác phải làm nhiều việc hơn là diễn giải những gì có thể nhìn thấy, nó cũng phải ngưng làm việc với những gì nó không thể nhìn thấy".
Các sản phẩm có thể được xếp chồng lên nhau, che khuất các sản phẩm ở dưới khỏi tầm nhìn. Vì vậy, hệ thống TGMT phải lấy một hình ảnh hai chiều và chuyển nó thành mô hình ba chiều. Griffin nói: "Chúng tôi cần phải biết chính xác ít nhất 80% về hàng tồn kho của mình, bao gồm cả các gói được bọc bằng nhựa trong với nhiều ánh sáng phản chiếu".
Học chuyển giao cho phép đào tạo mô hình nhanh hơn, với các tập dữ liệu nhỏ hơn. Griffin cho biết: "Bạn có thể tạo dữ liệu tổng hợp. Ví dụ, một công ty xây dựng muốn xác định các mối nguy hiểm và họ chỉ có vài trăm hình ảnh dùng để đào tạo mô hình. Chúng tôi sẽ tạo ra thêm các hình ảnh bổ sung nhằm thúc đẩy quá trình đào tạo đó".
Một ứng dụng sáng tạo khác của xử lý hình ảnh trong sản xuất là dịch dữ liệu thử nghiệm thành hình ảnh, sau đó sử dụng máy học trên các hình ảnh đã được tạo ra.
Griffin nói: "Các lỗi thử nghiệm có thể ở gần nhau nhưng không rõ ràng là chúng có liên quan đến nhau cho đến khi bạn dịch dữ liệu đó thành hình ảnh. Chúng ở gần nhau trong không gian thử nghiệm, trái ngược với việc ở gần nhau trong không gian vật lý".
Cải thiện chẩn đoán CSSK
Trong chăm sóc sức khỏe (CSSK), TGMT được sử dụng rộng rãi trong chẩn đoán, chẳng hạn như việc giải thích hình ảnh và video do AI hỗ trợ. Nhà phân tích Tuong Nguyen của Gartner cho biết, TGMT cũng được sử dụng để theo dõi bệnh nhân về mức độ an toàn và cải thiện hoạt động CSSK.
Ông nói: "Tiềm năng cho TGMT là rất lớn. Về cơ bản, nó giúp máy móc hiểu được thế giới. Các ứng dụng là vô hạn - thực sự, bất cứ thứ gì bạn cần xem. Toàn bộ thế giới này."
Theo cuộc khảo sát thường niên lần thứ 4 của Optum về AI trong CSSK, được công bố vào cuối năm 2021, 98% tổ chức CSSK đã có chiến lược AI hoặc đang có kế hoạch triển khai chiến lược AI, và 99% các nhà lãnh đạo hoạt động trong lĩnh vực CSSK tin rằng AI có thể được tin cậy để sử dụng trong việc CSSK.
Giải thích hình ảnh y tế là 1 trong 3 lĩnh vực hàng đầu được những người trả lời khảo sát nhắc đến, nơi AI có thể được sử dụng để cải thiện sức khoẻ của bệnh nhân. Hai lĩnh vực khác là chăm sóc bệnh nhân ảo và chẩn đoán y tế, cũng đã chín muồi cho TGMT.
Lấy ví dụ, bệnh xơ phổi vô căn - một căn bệnh gây chết người, ảnh hưởng đến hàng trăm nghìn người trên toàn cầu. Đây là căn bệnh không rõ nguyên nhân, không có cách chữa khỏi và rất khó chẩn đoán. Riêng tại Mỹ, hàng năm có khoảng 40.000 người chết vì căn bệnh này.
Theo PwC, thường phải mất hơn hai năm để chẩn đoán chính xác bệnh xơ phổi vô căn, khi đó, những người bị bệnh này chỉ còn sống được 3 - 5 năm.
Kho lưu trữ dữ liệu của Hiệp hội Hình ảnh Mã nguồn mở, được hỗ trợ bởi PwC và Microsoft, đang xây dựng một nền tảng để chia sẻ dữ liệu hình ảnh ẩn danh, giúp chẩn đoán bệnh. Đến cuối năm nay, tổ chức này dự kiến sẽ có 15.000 lượt quét trong cơ sở dữ liệu này.
Với AI và máy học, các bác sĩ có thể chẩn đoán bệnh nhanh hơn và chính xác hơn, giúp họ có nhiều thời gian để điều trị cho bệnh nhân hơn.
Và, trong tương lai, nền tảng tương tự cũng có thể được sử dụng cho các bệnh hiếm gặp khác.
Các ngành công nghiệp khác
Trong lĩnh vực ô tô, TGMT được sử dụng để hỗ trợ và giám sát người lái, để đảm bảo rằng họ đang tập trung lái xe. Aracaro của IDC cho biết đây cũng là chìa khóa để kích hoạt ô tô tự lái, một động lực tăng trưởng chính cho việc sử dụng TGMT trong ngành ô tô.
Nhưng có một thị trường quan trọng khác cho xe tự hành và TGMT nói chung, Arcaro nói: "Nông nghiệp. TGMT cũng đang được sử dụng trong nông nghiệp để phân loại sản phẩm, theo dõi sức khỏe động thực vật cũng như giám sát và quản lý tài sản nông nghiệp".
Trong an ninh mạng, phân tích hình ảnh có thể được sử dụng để đọc chữ ký hoặc phát hiện các trang web lừa đảo được thiết kế để trông giống với các trang web thực - nhưng đủ khác biệt để tránh các phương pháp phát hiện khác.
Trong ngành khách sạn, TGMT giúp theo dõi nơi khách đến khi lên tàu du lịch để cải thiện trải nghiệm của họ.
Trong ngành dịch vụ tài chính, xử lý hình ảnh thu thập dữ liệu từ các tài liệu để cải thiện hiệu quả của các quy trình kinh doanh.
Dinesh Batra, Phó Chủ tịch phụ trách dữ liệu và AI của Capgemini Invent cho biết: "TGMT trải dài trên hầu hết mọi ngành công nghiệp. Nó đã là một công cụ cực kỳ thành công cho các doanh nghiệp trong những năm gần đây - và TGMT sẽ tiếp tục phát triển nhanh".
Tương lai tươi sáng
Tuy nhiên, bất chấp sự đa dạng của các trường hợp đã thành công trong việc sử dụng, TGMT vẫn có chỗ cho sự phát triển.
Tuong Nguyen của Gartner nói: "Vẫn còn là những ngày đầu. Tôi hy vọng sẽ thấy nhiều nhà cung cấp hơn xuất hiện, giải quyết các yếu tố khác nhau của chuỗi giá trị. Vẫn còn nhiều cơ hội, giá cả sẽ phải chăng và dễ tiếp cận hơn. Chúng ta sẽ bắt đầu thấy TGMT được sử dụng ở mọi nơi".
Tuy nhiên, không phải tất cả đều thuận buồm xuôi gió. Theo Gartner, những trở ngại đối với việc áp dụng TGMT, bao gồm: thiếu phần cứng và thiếu khả năng xử lý. Trong một số ứng dụng, vẫn có vấn đề về độ chính xác. Hệ thống TGMT cũng cần được tích hợp vào dây chuyền sản xuất cũng như hệ thống back-end, cả hai đều có thể là thách thức.
Vì vậy, trong khi COVID-19 đã làm tăng nhu cầu và tiềm năng của TGMT trong kinh doanh, tình trạng thiếu hụt phần cứng hỗ trợ và gián đoạn nhân lực xảy ra sau đại dịch đã khiến nhiều doanh nghiệp gặp khó khăn trong việc tận dụng công nghệ TGMT./.
Tài liệu tham khảo:
[1]. www.idc.com/getdoc.jsp?containerId=US47736921
[2]. https://corporate.walmart.com/newsroom/2022/02/28/working-as-fulfillment-centers-walmart-stores-are-the-star-of-the-last-mile
[3]. https://corporate.walmart.com/newsroom/2021/07/14/chain-reaction-were-partnering-with-symbotic-to-bring-high-tech-automation-to-our-supply-chain
[4]. https://ir.kroger.com/CorporateProfile/press-releases/press-release/2022/Kroger-Fulfillment-Network-Expands-to-Three-New-Cities/default.aspx
[5]. www.pwc.com/us/en/library/case-studies/osic
[6]. www.optum.com/business/resources/library/2021-ai-survey-report.