Hướng dẫn bước đầu về AI: thị giác máy tính và khả năng nhận dạng hình ảnh

Phạm Thu Trang, Hồng Phương| 19/07/2018 14:07
Theo dõi ICTVietnam trên

Dạy một máy tính có thể "nhìn được" không phải là chuyện đơn giản. Bạn có thể lắp trực tiếp một máy ảnh trên PC, nhưng việc này không giúp nó có thể nhìn được. Để một chiếc máy thực sự nhìn được thế giới giống như con người hay động vật, nó dựa trên thị giác máy tính và nhận dạng hình ảnh.

A beginner’s guide to AI: Computer vision and image recognition

Thị giác máy tính là khả năng của một máy quét mã vạch để “nhìn thấy” một loạt các sọc trong UPC. Đó cũng là cách Face ID của Apple có thể nhận dạng khuôn mặt của bạn. Về cơ bản, bất cứ khi nào máy xử lý hình ảnh đầu vào - chẳng hạn như tệp JPEG hoặc nguồn cấp dữ liệu máy ảnh - nó sử dụng thị giác máy tính để hiển thị. Cách dễ nhất để hình dung thị giác máy tính là một phần của bộ não con người đó là nó có thể xử lý thông tin mà mắt nhìn thấy chứ không chỉ đơn giản là đôi mắt.

Một trong những hữu ích của thị giác máy tính, từ quan điểm AI, đó là khả năng nhận dạng hình ảnh, nhờ đó máy có thể diễn giải thông tin nhận được từ thị giác máy tính và phân loại những thông tin nhìn thấy.

Đây là một số ví dụ về khả năng nhận dạng hình ảnh tại nơi làm việc:

  • Ứng dụng Ebay cho phép bạn tìm kiếm các mục bằng sử dụng máy ảnh của mình
  • Mạng thần kinh nhân tạo này biến ảnh tối thành sáng
  • AI của Facebook biết rất nhiều về ảnh của bạn
  • Làm thế nào về một AI có thể đọc được suy nghĩ của bạn?

Ngoài ra còn có ứng dụng, ví dụ, sử dụng máy ảnh điện thoại thông minh của bạn để xác định xem một đối tượng có phải là miếng xúc xích hay không - ứng dụng đó là Not Hotdog. Điện thoại sử dụng thị giác máy tính và nhận dạng hình ảnh để đưa ra những đánh giá. Nó có thể không ấn tượng khi một đứa trẻ nói cho bạn một vật có phải là miếng xúc xích hay không. Nhưng quá trình đào tạo mạng thần kinh nhân tạo để nhận dạng hình ảnh là khá phức tạp, cả trong bộ não con người và trong máy tính.

Ở góc độ này AI không khác gì một trẻ nhỏ. Thị giác máy tính giúp nó nhìn được, nhưng điều đó không có nghĩa nó có thể hiểu về vũ trụ vật lý. Vì vậy, AI cũng cần được huấn luyện giống như trẻ em. Nếu bạn đưa cho trẻ một số hoặc chữ cái nhiều lần, nó sẽ học được cách nhận dạng con số đó.

Đáng ngạc nhiên, nhiều trẻ mới biết đi có thể ngay lập tức nhận ra các chữ cái và số lộn ngược nếu chúng đã được học ngay từ đầu. Mạng thần kinh sinh học của chúng ta khá giỏi trong việc diễn giải thông tin trực quan ngay cả khi hình ảnh đang xử lý không giống như kỳ vọng.

Thật dễ dàng để máy tính có thể nhận diện một hình ảnh cụ thể, như mã QR, nhưng chúng sẽ gặp khó khăn khi phải nhận dạng mọi thứ ở trạng thái không được lập trình sẵn -  nhận dạng hình ảnh.

Cách thức nhận dạng hình ảnh hoạt động chủ yếu liên quan đến việc tạo ra một mạng thần kinh nhân tạo xử lý các điểm ảnh riêng lẻ của một hình ảnh. Các nhà nghiên cứu cung cấp cho các mạng này nhiều hình ảnh được dán nhãn, để “dạy” cho chúng cách nhận ra các hình ảnh tương tự.

Trong ví dụ miếng miếng xúc xích ở trên, các nhà nghiên cứu đã cho AI tiếp xúc với hàng ngàn bức ảnh của miếng xúc xích. Sau đó AI hình thành ý niệm chung về hình ảnh của một miếng xúc xích. Khi bạn đưa một hình nào đó, nó sẽ so sánh các điểm ảnh của hình ảnh đó với mọi bức ảnh miếng xúc xích mà nó từng thấy. Nếu hình ảnh đáp ứng một ngưỡng tối thiểu của các điểm ảnh tương tự, AI sẽ tuyên bố đó là một miếng miếng xúc xích.

Hệ thống AI xử lý thông tin trực quan thường dựa trên thị giác máy tính và khả năng xác định các đối tượng cụ thể hoặc phân loại hình ảnh dựa trên nội dung.

Điều này cực kỳ quan trọng đối với các robot để có thể nhanh chóng,  nhận dạng và phân loại chính xác các đối tượng khác nhau trong môi trường của chúng. Ví dụ, những chiếc xe không người lái, sử dụng thị giác máy tính và nhận dạng hình ảnh để xác định người đi bộ, biển báo và các phương tiện khác.

Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
  • Khai thác dữ liệu phục vụ chỉ đạo, điều hành tại trung tâm IOC: Kinh nghiệm của Bình Phước
    Xác định dữ liệu là nguồn tài nguyên quý trong kỷ nguyên số - một trong những yếu tố quan trọng quyết định sự thành công của quá trình chuyển đổi số (CĐS), tỉnh Bình Phước đã sớm tập trung quan tâm tạo lập, khai thác, sử dụng, tăng cường chia sẻ, kết nối dữ liệu số cùng với việc thành lập IOC và những kết quả bước đầu thu được rất đáng ghi nhận.
  • Những người làm báo từ rừng về phố
    Ngày 30/4/1975, trong những cánh Giải phóng quân từ khắp nẻo tiến về Sài Gòn, có cả một đội quân nhà báo xuất phát từ các chiến khu hoặc hành quân theo các binh chủng, đã kịp thời có mặt, chứng kiến giây phút trọng đại: Giải phóng hoàn toàn miền nam, thống nhất đất nước.
  • Háo hức khám phá di tích lịch sử theo một cách mới
    Ứng dụng công nghệ số giúp nhiều du khách gia tăng trải nghiệm thú vị khi tới thăm các di tích lịch sử như Địa đạo Củ Chi, Dinh Độc Lập…
  • Mỹ phạt nhà mạng vì chia sẻ vị trí của người dùng
    Chính phủ Mỹ đã đưa ra mức phạt hàng triệu USD đối với các nhà mạng AT&T, Sprint, T-Mobile và Verizon sau một cuộc điều tra cho thấy các nhà mạng lớn của nước này đã chia sẻ bất hợp pháp dữ liệu cá nhân của thuê bao mà không có sự đồng ý của họ.
  • Các công cụ bảo mật đám mây dựa trên AI
    Ngày nay, AI tiên tiến đang được đưa vào sử dụng ở mọi loại hình doanh nghiệp (AI). Một loạt các nhà cung cấp bảo mật bên thứ ba đã phát hành các công cụ bảo mật đám mây dưới sự hỗ trợ của AI. Dường như đây là một trong những xu hướng nóng nhất trong ngành.
  • Oracle đầu tư mạnh vào AI tạo sinh, đáp ứng xu hướng "chủ quyền dữ liệu"
    Nhà cung cấp dịch vụ cơ sở hạ tầng đám mây của Hoa Kỳ Oracle đang tăng cường các tính năng trí tuệ nhân tạo (AI) tạo sinh của mình khi cạnh tranh trên thị trường điện toán đám mây (ĐTĐM) ngày càng khốc liệt và ngày càng có nhiều công ty nhảy vào lĩnh vực AI.
  • Mỹ lập hội đồng khuyến nghị ứng dụng AI an toàn cho hạ tầng trọng yếu
    Chính phủ Mỹ đã yêu cầu các công ty trí tuệ nhân tạo (AI) đưa ra khuyến nghị cách sử dụng công nghệ AI để bảo vệ các hãng hàng không, dịch vụ công cộng và cơ sở hạ tầng trọng yếu khác, đặc biệt là chống các cuộc tấn công sử dụng AI.
  • Làm gì để phát triển tài năng chuyển đổi?
    Partha Srinivasa, Giám đốc CNTT (CIO) của nhà cung cấp bảo hiểm tài sản và tai nạn Erie có trụ sở tại Pennsylvania, Mỹ đã chia sẻ về cách tiếp cận của ông trong việc xây dựng đội ngũ nhân viên có tinh thần chuyển đổi.
  • Báo chí ở mặt trận Điện Biên Phủ
    Chiến dịch Điện Biên Phủ là cuộc “hội quân” của cả nước. Trong cuộc “hội quân” lịch sử đó có sự tham gia và đóng góp không nhỏ của “đội quân báo chí”.
  • Những ấn phẩm đặc biệt kỷ niệm 70 năm chiến thắng Điện Biên Phủ
    Bộ ấn phẩm kỉ niệm 70 năm chiến thắng Điện Biên Phủ do Nhà xuất bản (NXB) Kim Đồng ấn hành, góp phần nhắc nhớ thế hệ trẻ về một thời hoa lửa, tự hào về khí phách Việt Nam, biết ơn các thế hệ cha anh đi trước, và trân trọng nền hòa bình mà chúng ta đang sống hôm nay.
Hướng dẫn bước đầu về AI: thị giác máy tính và khả năng nhận dạng hình ảnh
POWERED BY ONECMS - A PRODUCT OF NEKO