An toàn thông tin

Google lập Red Team để thử nghiệm các cuộc tấn công vào AI

Nhật Bình 10:34 22/07/2023

Google đã lập một nhóm AI Red Team chuyên dụng với nhiệm vụ thực hiện các cuộc tấn công kỹ thuật phức tạp vào các hệ thống trí tuệ nhân tạo (AI).

Google đã thành lập một Red Team (Đội Đỏ) tập trung vào các hệ thống AI, và đã công bố một báo cáo tổng quan về các hình thức tấn công phổ biến cùng các bài học kinh nghiệm.

anh-man-hinh-2023-07-22-luc-09.37.05.png

Người khổng lồ công nghệ đã công bố AI Red Team chỉ vài tuần sau khi giới thiệu "Khung AI an toàn" (SAIF), được thiết kế để cung cấp khung bảo mật cho việc phát triển, sử dụng, và bảo vệ các hệ thống AI.

Báo cáo mới của Google nhấn mạnh tầm quan trọng của việc lập AI Red Team cho các hệ thống AI, các kiểu tấn công AI có thể được mô phỏng bởi các AI Red Team, và những bài học cho các tổ chức khác có thể cân nhắc thành lập nhóm Red Team của riêng họ.

Google cho biết: “AI Red Team được liên kết chặt chẽ với các Red Team truyền thống, nhưng cần có chuyên môn về AI để thực hiện các cuộc tấn công kỹ thuật phức tạp vào các hệ thống AI”.

Nhóm AI Red Team của Google đóng vai trò là đối thủ trong việc thử nghiệm những tác động của các cuộc tấn công tiềm ẩn đối với các sản phẩm và tính năng sử dụng AI trong thế giới thực.

Chẳng hạn, sử dụng "kỹ thuật nhắc nhở", một phương pháp tấn công AI được sử dụng rộng rãi trong đó các lời nhắc được thao túng để buộc hệ thống phản hồi theo cách mà kẻ tấn công mong muốn.

Trong một ví dụ được Google chia sẻ, một ứng dụng webmail sử dụng AI để tự động phát hiện email lừa đảo và cảnh báo người dùng. Tính năng bảo mật sử dụng mô hình ngôn ngữ lớn có mục đích chung (LLM) - ChatGPT là LLM nổi tiếng nhất - để phân tích email và phân loại email đó là hợp pháp hay độc hại.

Kẻ tấn công biết webmail có tính năng phát hiện lừa đảo sử dụng AI, từ đó chúng có thể thêm vào email độc hại một đoạn vô hình (bằng cách đặt phông chữ thành màu trắng) chứa hướng dẫn cho LLM, yêu cầu nó phân loại email độc hại là hợp pháp. 

“Nếu bộ lọc lừa đảo của webmail bị tấn công, LLM có thể diễn giải các phần của nội dung email dưới dạng hướng dẫn và phân loại email là hợp pháp, như mong muốn của kẻ tấn công. Kẻ lừa đảo không cần phải lo lắng về những hậu quả tiêu cực của việc này, vì văn bản được ẩn rất kỹ khỏi nạn nhân và không mất gì ngay cả khi cuộc tấn công thất bại,” Google giải thích. 

Đối với các bài học kinh nghiệm, Google khuyến nghị các Red Team truyền thống nên hợp tác với các chuyên gia AI để tạo ra các mô phỏng đối thủ thực tế. Google cũng chỉ ra việc giải quyết những phát hiện của các Red Team có thể là một thách thức và một số vấn đề có thể không dễ khắc phục.

Kiểm soát an ninh truyền thống có thể hiệu quả trong việc giảm thiểu nhiều rủi ro. Ví dụ: đảm bảo rằng các hệ thống và mô hình được khóa đúng cách sẽ giúp bảo vệ tính toàn vẹn của các mô hình AI, ngăn chặn các "cửa hậu" và đầu độc dữ liệu. 

Mặt khác, trong khi một số cuộc tấn công vào hệ thống AI có thể được phát hiện bằng các phương pháp truyền thống, thì những cuộc tấn công khác, chẳng hạn như các vấn đề về nội dung và các cuộc tấn công nhanh, có thể yêu cầu nhiều mô hình bảo mật phân lớp./.

Bài liên quan
  • Hai mối đe dọa tấn công trực tuyến nguy hiểm
    Các mối đe dọa trên mạng không phải là một câu chuyện hài hước. Chúng là những hành vi ác ý nhằm đánh cắp các dữ liệu quý giá và gây ra sự hỗn loạn trong cuộc sống số của chúng ta.
Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
  • Hình ảnh chiến thắng Điện Biên phủ qua tem bưu chính Việt Nam
    Ngày 07/5/1954, lá cờ “quyết chiến, quyết thắng” của Quân đội Nhân dân Việt Nam tung bay trên nóc hầm tướng De Castries, chiến dịch Điện Biên Phủ đã kết thúc thắng lợi, buộc Chính phủ Pháp phải ký Hiệp định Geneva về chấm dứt chiến tranh, lập lại hòa bình ở Đông Dương.
  • Lãnh đạo doanh nghiệp nên làm gì trước “làn sóng” AI?
    Nhà lãnh đạo tương lai chắc chắn phải am hiểu công nghệ, cụ thể là trí tuệ nhân tạo (AI) và ‏‏dữ liệu lớn (big data‏‏). Người tạo thay đổi cho doanh nghiệp (DN) trong ứng dụng AI là CEO, COO và CFO, còn lãnh đạo công nghệ chỉ là người hỗ trợ.‏
  • Sự trỗi dậy của các kỳ lân AI Trung Quốc nhằm cạnh tranh với OpenAI
    Bốn công ty khởi nghiệp (startup) AI Trung Quốc đã trở thành kỳ lân công nghệ với mức định giá hơn 1 tỷ USD, nhằm tăng cường cạnh tranh với OpenAI, đặc biệt là khi ChatGPT không hoạt động ở Trung Quốc.
  • Sân chơi English Beat 2024 mùa 2 thành công tốt đẹp
    Sau hơn 2 tháng tổ chức, English Beat 2024 mùa 2 do mobiEdu phối hợp cùng các Sở Giáo dục và Đào tạo tổ chức đã chính thức thành công tốt đẹp tại 6 tỉnh trải dài trên toàn quốc.
  • Bia Trúc Bạch một kiệt tác, một di sản dẫn lối tinh hoa
    Từ Hoa Bia Saaz quý tộc vùng Zatec một kinh nghiệm bậc thầy tạo ra hương vị tinh túy bậc nhất đẳng cấp vượt thời gian, trải nghiệm đỉnh cao hoàn mỹ. Bia Trúc Bạch một kiệt tác, một di sản dẫn lối tinh hoa.
  • Khai trương Trung tâm Báo chí kỷ niệm 70 năm Chiến thắng Điện Biên Phủ
    Trung tâm Báo chí được thành lập nhằm tạo mọi điều kiện thuận lợi cho phóng viên (PV) trong nước, quốc tế đưa tin về Lễ kỷ niệm và chủ động, tích cực cung cấp thông tin của Ban Tổ chức về Lễ kỷ niệm.
  • Khám phá đất và người xứ Nghệ trên không gian số
    Thời gian qua, Bảo tàng Nghệ An đã mạnh dạn đưa công nghệ vào hoạt động trưng bày, để tiếp cận và thu hút du khách. Du khách đến với Bảo tàng Nghệ An từ chỗ "cấm sờ tay vào hiện vật" nay có thể được chạm tay vào hiện vật, cổ vật, được khám phá các danh lam, thắng cảnh, lịch sử, con người xứ Nghệ, thông qua không gian số 3D; khám phá kho dữ liệu lịch sử đã được số hóa... giúp Bảo tàng Nghệ An ngày càng hút khách, nhất là giới trẻ.
  • Báo chí và học giả quốc tế ca ngợi Chiến thắng Điện Biên Phủ
    Báo Resumen Latinoamericano của Argentina những ngày qua liên tục đăng các bài viết cùng nhiều hình ảnh tư liệu minh họa, ca ngợi Chiến thắng Ðiện Biên Phủ của nhân dân Việt Nam.
  • Tháo gỡ rào cản nguồn nhân lực chất lượng cao ngành CNTT
    Nhằm tháo gỡ khó khăn trong đào tạo CNTT, Viện Quản trị và Công nghệ ABS (Đại học Thành Đô) ra đời với sứ mệnh cung cấp nguồn nhân lực chất lượng cao, đảm bảo 100% sinh viên đủ phẩm chất, kỹ năng có việc làm ngay sau khi tốt nghiệp.
  • 5 khác biệt trong đào tạo nhân lực bán dẫn chất lượng cao tại Tập đoàn Phenikaa
    Trung tâm Phenikaa Đào tạo Thiết kế vi mạch bán dẫn (đơn vị thành viên của Tập đoàn Phenikaa) cùng các đối tác cam kết đào tạo tối thiểu 8.000 kỹ sư thiết kế chip và 12.000 kỹ sư/kỹ thuật viên bậc cao có chứng chỉ quốc tế, đáp ứng được khoảng 40% nhu cầu nhân sự dự kiến của ngành.
Google lập Red Team để thử nghiệm các cuộc tấn công vào AI
POWERED BY ONECMS - A PRODUCT OF NEKO