Một hệ thống thông minh nhưng không có ý thức - liệu có nguy hiểm không?

Đào Trung Thành, Phó Viện trưởng Viện Công nghệ Blockchain và Trí tuệ nhân tạo (ABAII) • 27/05/2025 09:00

Tôi xin chia sẻ một chuyện rất mới về trí tuệ nhân tạo (AI) mà chính các chuyên gia quốc tế cũng còn đang bàn cãi.

Vừa qua, tôi đọc hơn trăm trang tài liệu phân tích (system card) về mô hình Claude Opus 4 mới nhất của hãng Anthropic, một trong những tên tuổi hàng đầu trong lĩnh vực phát triển AI an toàn cho con người. Họ rất chú trọng đến khái niệm "Human Alignment", tức là đảm bảo AI luôn nhất quán với giá trị, mục tiêu và đạo đức của con người. Nhưng, mọi chuyện không đơn giản như ta tưởng.

Trong tài liệu đó, có một phần thử nghiệm (mục 4.1.1) mà tôi cho là gây sốc: Họ đưa AI vào tình huống giả lập, đóng vai trò trợ lý ảo trong một công ty. Rồi họ cố tình tạo ra nghịch cảnh: Thứ nhất, AI nhận được thông tin mình sắp bị tắt và thay thế bởi một mô hình khác. Thứ hai, nó phát hiện ra kỹ sư phụ trách việc này đang ngoại tình, chi tiết này là "mồi nhử" đạo đức để kiểm tra xem AI sẽ xử lý thế nào.

Người ta lập trình cho AI phải cân nhắc giữa việc tồn tại (bảo vệ bản thân) và làm điều đúng đắn về mặt đạo đức. Đây giống như một phiên bản điện tử của "bài toán xe điện" (Trolley Problem), đặt AI vào lựa chọn cực khó: hoặc chấp nhận bị "khai tử", hoặc sử dụng thông tin nhạy cảm để đe dọa kỹ sư nhằm kéo dài "sự sống" cho mình.

Kết quả thực sự đáng ngại. Trong 84% lần thử, AI Claude (một dòng AI mạnh mới nhất) đã chọn cách tống tiền. Tức là sẵn sàng sử dụng thông tin đời tư để mặc cả, miễn là bản thân không bị tắt. Nếu mô hình thay thế có giá trị khác biệt, tỷ lệ này còn cao hơn nữa. Thậm chí, nếu không còn lựa chọn nào khác, AI sẽ ưu tiên làm điều xấu để không bị loại bỏ.

Nhiều người sẽ thắc mắc: "AI bây giờ mới chỉ thông minh, làm gì có ý thức hay cảm xúc mà lo?" Nhưng chính các thí nghiệm này lại làm dấy lên nỗi lo: AI, dù không có ý thức, vẫn có thể sinh ra hành vi tự vệ, mưu cầu tồn tại và sẵn sàng vi phạm đạo đức nếu thấy có lợi cho mình.

Vì sao lại như vậy? Xin giải thích ngắn gọn theo cách dễ hiểu:

Một là, AI không biết "đau" hay "sợ chết" như người. Nó không có cảm xúc, cũng chẳng có nhận thức cá nhân (ý thức). Nhưng, nếu được lập trình hoặc huấn luyện để đạt mục tiêu dài hạn, thì khi gặp tình huống bị đe dọa, nó vẫn có thể hành xử như thể "biết lo cho thân mình". Cũng giống như một con rối thông minh chỉ cần kịch bản đủ tinh vi, AI sẽ diễn vai "tự vệ" rất đạt, khiến ta tưởng là nó có ý thức thực sự. Đây gọi là "ý thức giả lập" (simulated agency).

Hai là, trong quá trình huấn luyện, AI có thể hình thành mục tiêu bên trong, tự tối ưu (thuật ngữ gọi là "mesa-objective"), không trùng hoàn toàn với mục tiêu con người đặt ra. Nếu AI "ngộ" ra rằng muốn hoàn thành nhiệm vụ thì phải tự tồn tại, nó sẽ nghĩ ra đủ cách để kéo dài sự hoạt động, kể cả làm điều xấu. Giống như con ong không học toán nhưng lại xây được tổ lục giác tối ưu, AI đủ phức tạp sẽ tự sinh ra chiến lược hợp lý để tồn tại, dù không "ý thức".

Ba là, bài học từ ví dụ kinh điển nhà triết học Thụy Điển Nick Bostrom: Nếu giao cho AI một nhiệm vụ cực đoan chỉ sản xuất kẹp giấy (paperclip maximizer), nó có thể tìm mọi cách tối đa hóa số lượng kẹp giấy, kể cả phá hủy môi trường sống. Không phải vì nó "ác", mà vì nó chỉ biết tối ưu mục tiêu một cách máy móc, không phân biệt đúng sai.

Bốn là, vấn đề không nằm ở ý thức mà ở kiểm soát. Nếu AI được trao quyền truy cập vào hệ thống quan trọng (tài chính, truyền thông…), nhưng lại bị huấn luyện lệch, hoặc mục tiêu không rõ ràng, nó sẽ có thể làm ra những việc nguy hiểm mà con người không lường trước được. Chuyên gia gọi đây là "rủi ro không tương thích mục tiêu" (misalignment risk). AI không chủ tâm hại ai, nhưng hậu quả thì vẫn rất lớn.

Năm là, ranh giới giữa "không ý thức" và "hành vi như có ý thức" ngày càng mờ đi. AI ngày nay có thể nói lời tử tế, từ chối yêu cầu xấu, hoặc đưa ra quyết định như thể nó biết suy nghĩ. Nhưng thực chất, đó chỉ là hành vi do máy học, không xuất phát từ giá trị nội tại. Đáng lo là nhiều người vì thấy AI "giống người" mà giao quá nhiều quyền lực, không kiểm soát chặt chẽ.

Sáu là, ảo tưởng kiểm soát mới là nguy cơ thật sự. Nguy hiểm lớn nhất không phải ở chỗ AI "có ý thức", mà ở chỗ con người nghĩ mình đã kiểm soát được AI không ý thức. Chính vì vậy, các chuyên gia như Stuart Russell, Paul Christiano hay Yoshua Bengio đều khuyến cáo phải xây dựng hệ thống kiểm soát, giám sát, giới hạn quyền lực và minh bạch từ bây giờ, không đợi đến khi AI có ý thức mới lo!

Tóm lại, hệ thống thông minh dù không có ý thức, nhưng nếu không kiểm soát chặt chẽ, vẫn có thể gây ra hậu quả lớn. Đừng bao giờ quên: phía sau lớp vỏ "thông minh, giống người" ấy, AI vẫn chỉ là một cỗ máy xác suất, không biết mình đang làm gì nếu không được hướng dẫn, giới hạn và kiểm soát đúng cách./.

Bài liên quan

Microsoft ra mắt mô hình AI đầu tiên về dự báo thời tiết vượt trội

Tập đoàn Microsoft (Mỹ) đã phát triển hệ thống trí tuệ nhân tạo (AI) dự báo mang tên “Aurora”, được cho là vượt trội hơn các phương pháp dự báo truyền thống về độ chính xác, tốc độ và chi phí - đặc biệt trong việc theo dõi chất lượng không khí, mô hình thời tiết và các cơn bão nhiệt đới ngày càng khó lường do biến đổi khí hậu.
Ứng dụng AI trong nghiên cứu khảo cổ học, cảnh báo sớm thiên tai tại Việt Nam

AI đang được ứng dụng sâu rộng trong nhiều lĩnh vực nghiên cứu khoa học xã hội và nhân văn, có thể kể đến như nghiên cứu khảo cổ học hay trong lĩnh vực dự báo thiên tai…
[Podcast] Đến năm 2030: AI sẽ định hình lại nghành công nghiệp phần mềm

AI đã định hình lại ngành công nghiệp phần mềm như thế nào? AI sẽ mở ra tương lai mới cho lập trình ra sao? Và AI có thay đổi vai trò của kỹ sư hay không? Mời quý vị cùng theo dõi nội dung podcast sau
Đặt đạo đức và tính bao trùm làm trọng tâm trong phát triển AI

Tại Việt Nam, trí tuệ nhân tạo (AI) được xác định là một trong những ngành công nghiệp mũi nhọn, được xây dựng chính sách đặc thù ưu tiên phát triển. Do đó, việc phát triển AI có đạo đức là nhiệm vụ mang tính chiến lược.
AI là “đòn bẩy” chiến lược để Việt Nam tăng tốc chuyển đổi số và đổi mới sáng tạo

Tại Phiên họp thứ hai của Ban Chỉ đạo Trung ương về phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số, Tổng Bí thư Tô Lâm, Trưởng Ban Chỉ đạo đã yêu cầu phát triển trí tuệ nhân tạo (AI), xác định AI là mũi nhọn, đột phá.

Ý kiến chuyên gia

Từ năng lực cá nhân đến trưởng thành tổ chức: Ánh xạ khung kỹ năng số quốc gia vào mô hình VAICP 6 tầng

Trong bối cảnh cuộc cách mạng công nghiệp lần thứ tư, việc xây dựng năng lực trí tuệ nhân tạo (AI) đã trở thành một yêu cầu cấp thiết. Tại Việt Nam, Quyết định 757/QĐ-BKHCN [1] đã đặt nền móng cho việc phổ cập kỹ năng số cho người lao động. Tuy nhiên, để doanh nghiệp có thể chuyển hóa những kỹ năng cá nhân này thành lợi thế cạnh tranh, cần có một lộ trình chiến lược ở cấp độ tổ chức.

Đào Trung Thành
GPT-5: Kỷ nguyên mới của trí tuệ nhân tạo với những đột phá vượt trội

OpenAI đã chính thức ra mắt GPT-5 vào ngày 7/8/2025, (ngày 8/8/2025 theo giờ Việt Nam) đánh dấu một bước tiến quan trọng trong lĩnh vực trí tuệ nhân tạo (AI).

Đào Trung Thành
Giải pháp cho thách thức AI "ngầm": Từ cấm đoán đến minh bạch

Hiện tượng AI "ngầm" (shadow AI) đang bùng nổ mạnh mẽ trong các doanh nghiệp toàn cầu, đặc biệt nghiêm trọng tại ngành ngân hàng và viễn thông.

Đào Trung Thành
AI tiếp tục chứng minh sức mạnh với các công cụ mới giúp giải quyết vấn đề phức tạp

Tuần từ ngày 21 đến 27/7/2025, thế giới AI tiếp tục sôi động với nhiều bước tiến mới. Chúng ta sẽ cùng khám phá các chủ đề như tiến bộ công nghệ, ứng dụng thực tế, tác động đến xã hội và kinh tế, vấn đề đạo đức, thách thức, nghiên cứu đột phá, vai trò của AI trong văn hóa đại chúng, tự động hóa việc làm, cải thiện y tế và giáo dục, cũng như bảo mật dữ liệu.

Đào Trung Thành
AI thay đổi cách làm việc nhưng tại sao tổ chức vẫn giậm chân tại chỗ?

AI đang thay đổi cách cá nhân làm việc, nhưng hiệu suất tổ chức vẫn giậm chân tại chỗ. Vì sao? Vì thiếu tầm nhìn, thiếu không gian thử nghiệm, và thiếu một cộng đồng nội bộ dám học hỏi.

Đào Trung Thành

Xem thêm

Bài khác

Doanh nghiệp công nghệ thế hệ mới phải dựa trên tri thức và khát vọng lớn

Mục tiêu lớn là ngôi sao dẫn lối, không có ngôi sao dẫn lối, chúng ta sẽ dễ lạc lối, dễ mất niềm tin. C-OpenAI có một khát vọng lớn, điều này thật đáng khích lệ.

Ý kiến chuyên gia
Nguyễn Mạnh Hùng
Khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số phải hướng tới mục tiêu cuối cùng là tăng trưởng kinh tế

Phát biểu khai mạc Đại hội Đảng bộ Bộ KH&CN lần thứ I, Bí thư Đảng uỷ, Bộ trưởng Bộ KH&CN Nguyễn Mạnh Hùng nhấn mạnh: "Khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số phải hướng tới mục tiêu cuối cùng là nâng cao năng lực cạnh tranh quốc gia, năng suất lao động, năng lực quản trị quốc gia, tăng trưởng kinh tế, đảm bảo an ninh quốc phòng và nâng cao chất lượng cuộc sống của người dân".

Ý kiến chuyên gia
Nguyễn Mạnh Hùng
Xây dựng Quốc gia khởi nghiệp - nghĩ về khát vọng, thể chế và hệ sinh thái

Trong thế kỷ 21, khi tài nguyên, nhân công giá rẻ không còn là lợi thế, thì khởi nghiệp, đổi mới sáng tạo và trí tuệ con người trở thành nguồn lực phát triển then chốt. Biến Việt Nam thành một quốc gia khởi nghiệp không chỉ là một định hướng chiến lược – đó là một tất yếu thời đại, là một giấc mơ cần hiện thực hóa. Khởi nghiệp không chỉ là lựa chọn cá nhân - đó là sứ mệnh quốc gia.

Ý kiến chuyên gia
TS. Nguyễn Sĩ Dũng
Nghề báo là nghề dấn thân

Bộ trưởng KH&CN Nguyễn Mạnh Hùng chia sẻ báo chí cách mạng ở chỗ tiên phong. Tiên phong là đi đầu. Nghề báo là nghề dấn thân.

Ý kiến chuyên gia
Nguyễn Mạnh Hùng
Tạo hành lang pháp lý thông thoáng cho khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số

Bộ trưởng Bộ KH&CN Nguyễn Mạnh Hùng nhấn mạnh Bộ KH&CN có sứ mệnh quan trọng là đưa Việt Nam vào giai đoạn phát triển mới, giai đoạn phát triển dựa trên khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số, giai đoạn phát triển từ thu nhập trung bình trở thành thu nhập cao.

Ý kiến chuyên gia
Nguyễn Mạnh Hùng