An toàn thông tin

Google lập Red Team để thử nghiệm các cuộc tấn công vào AI

Nhật Bình 10:34 22/07/2023

Google đã lập một nhóm AI Red Team chuyên dụng với nhiệm vụ thực hiện các cuộc tấn công kỹ thuật phức tạp vào các hệ thống trí tuệ nhân tạo (AI).

Google đã thành lập một Red Team (Đội Đỏ) tập trung vào các hệ thống AI, và đã công bố một báo cáo tổng quan về các hình thức tấn công phổ biến cùng các bài học kinh nghiệm.

anh-man-hinh-2023-07-22-luc-09.37.05.png

Người khổng lồ công nghệ đã công bố AI Red Team chỉ vài tuần sau khi giới thiệu "Khung AI an toàn" (SAIF), được thiết kế để cung cấp khung bảo mật cho việc phát triển, sử dụng, và bảo vệ các hệ thống AI.

Báo cáo mới của Google nhấn mạnh tầm quan trọng của việc lập AI Red Team cho các hệ thống AI, các kiểu tấn công AI có thể được mô phỏng bởi các AI Red Team, và những bài học cho các tổ chức khác có thể cân nhắc thành lập nhóm Red Team của riêng họ.

Google cho biết: “AI Red Team được liên kết chặt chẽ với các Red Team truyền thống, nhưng cần có chuyên môn về AI để thực hiện các cuộc tấn công kỹ thuật phức tạp vào các hệ thống AI”.

Nhóm AI Red Team của Google đóng vai trò là đối thủ trong việc thử nghiệm những tác động của các cuộc tấn công tiềm ẩn đối với các sản phẩm và tính năng sử dụng AI trong thế giới thực.

Chẳng hạn, sử dụng "kỹ thuật nhắc nhở", một phương pháp tấn công AI được sử dụng rộng rãi trong đó các lời nhắc được thao túng để buộc hệ thống phản hồi theo cách mà kẻ tấn công mong muốn.

Trong một ví dụ được Google chia sẻ, một ứng dụng webmail sử dụng AI để tự động phát hiện email lừa đảo và cảnh báo người dùng. Tính năng bảo mật sử dụng mô hình ngôn ngữ lớn có mục đích chung (LLM) - ChatGPT là LLM nổi tiếng nhất - để phân tích email và phân loại email đó là hợp pháp hay độc hại.

Kẻ tấn công biết webmail có tính năng phát hiện lừa đảo sử dụng AI, từ đó chúng có thể thêm vào email độc hại một đoạn vô hình (bằng cách đặt phông chữ thành màu trắng) chứa hướng dẫn cho LLM, yêu cầu nó phân loại email độc hại là hợp pháp. 

“Nếu bộ lọc lừa đảo của webmail bị tấn công, LLM có thể diễn giải các phần của nội dung email dưới dạng hướng dẫn và phân loại email là hợp pháp, như mong muốn của kẻ tấn công. Kẻ lừa đảo không cần phải lo lắng về những hậu quả tiêu cực của việc này, vì văn bản được ẩn rất kỹ khỏi nạn nhân và không mất gì ngay cả khi cuộc tấn công thất bại,” Google giải thích. 

Đối với các bài học kinh nghiệm, Google khuyến nghị các Red Team truyền thống nên hợp tác với các chuyên gia AI để tạo ra các mô phỏng đối thủ thực tế. Google cũng chỉ ra việc giải quyết những phát hiện của các Red Team có thể là một thách thức và một số vấn đề có thể không dễ khắc phục.

Kiểm soát an ninh truyền thống có thể hiệu quả trong việc giảm thiểu nhiều rủi ro. Ví dụ: đảm bảo rằng các hệ thống và mô hình được khóa đúng cách sẽ giúp bảo vệ tính toàn vẹn của các mô hình AI, ngăn chặn các "cửa hậu" và đầu độc dữ liệu. 

Mặt khác, trong khi một số cuộc tấn công vào hệ thống AI có thể được phát hiện bằng các phương pháp truyền thống, thì những cuộc tấn công khác, chẳng hạn như các vấn đề về nội dung và các cuộc tấn công nhanh, có thể yêu cầu nhiều mô hình bảo mật phân lớp./.

Bài liên quan
  • Hai mối đe dọa tấn công trực tuyến nguy hiểm
    Các mối đe dọa trên mạng không phải là một câu chuyện hài hước. Chúng là những hành vi ác ý nhằm đánh cắp các dữ liệu quý giá và gây ra sự hỗn loạn trong cuộc sống số của chúng ta.
Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
  • Xây dựng hạ tầng cho mạng 5G tương lai của Việt Nam
    Đông Nam Á là một trong những khu vực có tốc độ phát triển nhanh nhất trên thế giới. Dự kiến tới năm 2030, ASEAN (gồm 10 quốc gia Đông Nam Á) sẽ trở thành nền kinh tế lớn thứ tư toàn cầu. Phần lớn động lực thúc đẩy sự phát triển này đến từ sự vận động và tăng trưởng không ngừng của nền kinh tế số trong khu vực, với giá trị ước tính lên đến gần 1 nghìn tỉ đô-la vào năm 2030.
  • 5G và những thay đổi toàn diện trong xây dựng thành phố thông minh
    Với tốc độ cực cao, độ trễ cực thấp, băng thông rộng và kết nối mật độ cực lớn, 5G là hạ tầng cốt lõi hỗ trợ toàn diện cho sự đổi mới và phát triển của thành phố thông minh trên tất cả các lĩnh vực, tác động tích cực vào công tác xây dựng và quản lý thành phố, tạo ra một môi trường sống tiện nghi, bền vững và an toàn hơn bao giờ hết.
  • Vượt qua hơn 1.000 doanh nghiệp, Bưu điện Việt Nam đạt giải Thương hiệu Quốc gia 2024
    Đây là lần thứ 2 liên tiếp Bưu điện Việt Nam vinh dự nhận giải thưởng danh giá này bởi những thành tựu lớn trong lĩnh vực logistics, bưu chính chuyển phát tại Việt Nam và Quốc tế.
  • Cuộc đua trung tâm dữ liệu AI tại Đông Nam Á
    Trí tuệ nhân tạo (AI) đã trở thành một động lực chính thúc đẩy đổi mới công nghệ toàn cầu và Đông Nam Á đang ngày càng khẳng định vai trò của mình trong cuộc đua phát triển AI. Hàng loạt các hãng công nghệ và đám mây lớn đã thông báo kế hoạch xây dựng, vận hành trung tâm dữ liệu mới tại Đông Nam Á.
  • Mở rộng trông xe không dùng tiền mặt mang lại lợi ích "kép"
    Việc áp dụng hình thức thanh toán qua ứng dụng thu phí không dừng VETC và mã QR vào hoạt động thanh toán phí gửi xe không dùng tiền mặt không những góp phần từng bước hình thành hệ thống giao thông thông minh mà còn tăng cường công tác quản lý nhà nước, minh bạch trong công tác thu phí dịch vụ trông giữ xe.
  • 10 xu hướng định hình tương lai của quản lý giao dịch số
    Quản lý giao dịch số đang phát triển mạnh mẽ, được thúc đẩy bởi những tiến bộ công nghệ và nhu cầu ngày càng tăng về xử lý tài liệu an toàn, hiệu quả. Đây là công cụ quan trọng giúp doanh nghiệp giảm bớt thủ tục hành chính và tối ưu hóa quy trình xử lý tài liệu số.
  • Zalo giữ vững ngôi đầu nền tảng nhắn tin được yêu thích nhất
    Ngày 5/11, theo báo cáo “The Connected Consumer Q.III/2024” mới nhất do Decision Lab công bố, Zalo tiếp tục dẫn đầu các nền tảng nhắn tin tại Việt Nam về tỷ lệ sử dụng (renetration rate) và mức độ yêu thích (preference rate).
  • Triển vọng thị trường chữ ký số toàn cầu
    Thị trường chữ ký số toàn cầu đang có ​​sự tăng trưởng chưa từng có khi các doanh nghiệp và cá nhân ngày càng áp dụng các giải pháp số để xác thực tài liệu và giao dịch an toàn.
  • ĐMST mở xã hội mang lại cho 90% doanh nghiệp cơ hội tạo giá trị kinh doanh bền vững
    Theo bà Nguyễn Phương Linh, Viện trưởng Viện MSD, hơn 90% các doanh nghiệp cho rằng đổi mới sáng tạo (ĐMST) mở xã hội mang lại cho doanh nghiệp cơ hội tạo ra giá trị kinh doanh bền vững, tác động tích cực đến xã hội và môi trường.
  • ‏FPT đẩy mạnh phát triển giải pháp low-code tại thị trường Hàn Quốc‏
    ‏Mới đây, FPT vừa ký kết thỏa thuận hợp tác ba năm với OutSystems, chính thức trở thành đối tác phân phối và triển khai tại thị trường Hàn Quốc, đảm bảo thời gian ra mắt phần mềm của khách hàng được rút ngắn và tối ưu chi phí.
Google lập Red Team để thử nghiệm các cuộc tấn công vào AI
POWERED BY ONECMS - A PRODUCT OF NEKO