Chuyển động ICT

DeepSeek, ứng dụng AI hùng mạnh mới của Trung Quốc, làm chấn động làng công nghệ thế giới và Washington

Anh Minh 28/01/2025 17:52

Một startup trí tuệ nhân tạo (AI) ít tên tuổi của Trung Quốc đã gây chấn động giới công nghệ vào cuối tuần qua khi ra mắt sản phẩm trợ lý AI tương tự OpenAI, nhanh chóng leo lên vị trí số 1 trên cửa hàng ứng dụng của Apple và khiến giá cổ phiếu của các gã khổng lồ công nghệ Mỹ sụt giảm.

Vì sao DeepSeek trở thành tâm điểm trong lĩnh vực AI?

Từ góc nhìn của Washington, thông tin này ngay lập tức dấy lên lo ngại về chính sách: Điều này xảy ra bất chấp những nỗ lực kiên định từ cả hai đảng nhằm kìm hãm sự tiến bộ AI ở Trung Quốc.

Cả Tổng thống Donald Trump và cựu Tổng thống Joe Biden đều đặt cạnh tranh toàn cầu - đặc biệt là việc loại bỏ Trung Quốc - làm trọng tâm trong chính sách công nghệ và AI của mình. Dẫu vậy, một công ty nhỏ và linh hoạt của Trung Quốc vẫn bất ngờ vươn lên dẫn trước.

DeepSeek đã trở thành tâm điểm chú ý lớn trong lĩnh vực AI vì nhiều lý do.

5000.jpg
Vào ngày 10/1/2025, DeepSeek ra mắt chatbot miễn phí đầu tiên, DeepSeek-R1, nhanh chóng vượt qua ChatGPT

Trước đây, các mô hình AI thành công nhất cần một lượng lớn sức mạnh tính toán để huấn luyện chatbot của họ. Những công ty như ChatGPT (do Sam Altman sáng lập) và Meta phải sử dụng tới 16.000 chip của Nvidia - loại chip nổi tiếng vì hiệu suất năng lượng và khả năng xử lý tác vụ phức tạp, với giá từ 30.000 đến 40.000 USD mỗi chip.

Tuy nhiên, DeepSeek tuyên bố đã huấn luyện mô hình AI cơ bản của mình chỉ với khoảng 2.000 chip Nvidia kém tiên tiến hơn, với chi phí khoảng 6 triệu USD, trong chưa đầy 2 tháng. Theo ước tính của Citigroup, Microsoft, Meta, Amazon và Alphabet đã chi khoảng 209 tỷ USD cho cơ sở hạ tầng dữ liệu vào năm ngoái, trong đó 80% dành cho trung tâm dữ liệu (TTDL).

DeepSeek-R1, mô hình "lập luận" của công ty, có khả năng giải quyết các vấn đề toán học và khoa học phức tạp trong những lĩnh vực mà nó chưa từng biết đến. Được cho là có thể thực hiện các nhiệm vụ phức tạp tương tự mô hình o1 của OpenAI nhưng với chi phí rẻ hơn từ 20 - 50 lần cho người dùng doanh nghiệp.

Tuy nhiên, vẫn có sự nghi ngờ về tính chính xác của những tuyên bố này. Trên nền tảng X, Elon Musk đồng tình với Alexandr Wang, CEO của công ty AI Scale, người cho rằng DeepSeek thực ra đang sử dụng khoảng 50.000 chip tiên tiến nhất của Nvidia nhưng không thể công khai do lệnh kiểm soát xuất khẩu từ Mỹ. Dù vậy, ông Wang không đưa ra bằng chứng cụ thể cho nhận định này.

Ngược lại, có lý do để tin tưởng vào tuyên bố của DeepSeek vì mô hình của họ là mã nguồn mở – không giống như OpenAI dù cái tên mang ý nghĩa "mở". Điều này cho phép bất kỳ ai cũng có thể kiểm tra cách hoạt động của mô hình.

Sam Altman, CEO của OpenAI, cho biết vào tối ngày 28/1 rằng DeepSeek "ấn tượng, đặc biệt là về những gì họ có thể cung cấp với chi phí như vậy."

Ông cũng thông báo rằng OpenAI sẽ đẩy nhanh việc ra mắt một số sản phẩm mới để đáp ứng thách thức này. "Chúng tôi rõ ràng sẽ cung cấp những mô hình tốt hơn nhiều và thật sự cảm thấy hào hứng khi có một đối thủ mới!", Altman chia sẻ.

Tác động rộng lớn của DeepSeek, từ công nghệ, đến kinh doanh và chính sách

Về mặt công nghệ, điều khiến mọi người sửng sốt về mô hình R1 của DeepSeek là việc ứng dụng này tái hiện - và trong một số trường hợp còn vượt qua - hiệu suất của sản phẩm tiên tiến o1 của OpenAI trên hàng loạt tiêu chí đánh giá, với chi phí chỉ bằng một phần nhỏ.

Từ góc độ kinh doanh, thông điệp rút ra rất rõ ràng: Thành công của DeepSeek cho thấy các công ty Mỹ có thể không cần chi tiêu quá nhiều như dự đoán để phát triển các mô hình AI. Điều này vừa gây hứng thú vừa khiến các nhà đầu tư và lãnh đạo công nghệ lo lắng.

Một số người, như CEO Microsoft Satya Nadella, hoan nghênh viễn cảnh AI trở thành một công nghệ phổ biến, nơi nhiều công ty có thể triển khai với chi phí thấp hơn đáng kể. Tuy nhiên, các nhà đầu tư rõ ràng có sự hoài nghi: Không ít cổ phiếu công nghệ lao dốc, đặc biệt là Nvidia - nhà sản xuất chip được định giá cao nhất và hưởng lợi lớn nhất từ cơn sốt hạ tầng AI hiện nay.

Tuy nhiên, những tác động về chính sách lại phức tạp hơn nhiều. Sự lo lắng quá mức của Washington về Trung Quốc đã dẫn đến những chính sách gây nhiều ý kiến trái chiều trong ngành công nghệ.

Một mặt, hầu hết các công ty công nghệ ghét những quy định kiểm soát xuất khẩu khiến họ không thể bán nhiều hàng hóa cho nền kinh tế lớn thứ hai thế giới và buộc phải phát triển sản phẩm mới nếu muốn kinh doanh tại Trung Quốc. Nếu thành công của DeepSeek chứng minh rằng những quy định này là vô nghĩa, nhiều công ty sẽ vui mừng nếu chúng được bãi bỏ.

Mặt khác, làn sóng bảo hộ và thái độ chống Trung Quốc đã khuyến khích Washington chấp nhận hàng loạt chính sách có lợi cho ngành công nghệ, từ việc giảm nhẹ quy định quản lý AI đến việc đơn giản hóa quy trình cấp phép cho các dự án xây dựng liên quan. Thành công của DeepSeek liệu có đồng nghĩa với việc những nỗ lực đó cũng thất bại? Hay ngược lại, sẽ khiến chính quyền siết chặt hơn nữa?

Thành công của DeepSeek dường như thực sự thách thức niềm tin rằng tương lai của AI Mỹ đòi hỏi ngày càng nhiều chip và năng lượng. Điều này làm phức tạp thêm tham vọng của ông Trump trong việc nhanh chóng xây dựng cơ sở hạ tầng công nghệ cao tại Mỹ.

image-5-.jpg
Sam Altman, CEO của OpenAI, phát biểu cùng Tổng thống Donald Trump (trái), Masayoshi Son, CEO của SoftBank Group và Larry Ellison, chủ tịch của Oracle Corporation kiêm giám đốc công nghệ, tại Phòng Roosevelt ở Nhà Trắng, ngày 21/1/2025. (Ảnh: AP)

Tại sao phải đầu tư 500 tỷ USD vào dự án khổng lồ “Stargate” do ông Trump ủng hộ - và tại sao thị trường lại đánh giá cao những công ty như Meta, đơn vị đã chi tới 65 tỷ USD chỉ trong 1 năm cho AI - nếu DeepSeek tuyên bố chỉ cần 5,6 triệu USD và sử dụng chip Nvidia tầm trung để huấn luyện một trong những mô hình tiên tiến nhất của họ? (Các chuyên gia Mỹ tỏ ra nghi ngờ con số này và cho rằng DeepSeek không công bố đầy đủ thông tin, nhưng ngay cả nếu chi phí cao hơn gấp 100 lần thì đó vẫn là một món hời).

“Những công ty hàng đầu của Mỹ đều đang tham gia vào hiện tượng mà ở đó các mô hình AI ngày càng nhỏ hơn, nhanh hơn và rẻ hơn,” Gregory Allen, Giám đốc Trung tâm AI Wadhwani tại Viện Nghiên cứu Chiến lược và Quốc tế (CSIS), cho biết.

Ông cũng chỉ ra rằng các kỹ thuật của DeepSeek, nếu được áp dụng với thiết bị hiện đại hơn, có thể thúc đẩy sự phát triển AI của Mỹ: “Nếu DeepSeek đại diện cho một ‘mức sàn’ về khả năng công nghệ có thể đạt được với chi phí thấp, thì đồng thời cũng tồn tại một hiện tượng khác là ‘mức trần’ đang ngày càng được nâng cao".

Các công ty công nghệ tất nhiên rất ủng hộ làn sóng hỗ trợ liên bang gần đây và khó có khả năng họ sẽ từ bỏ việc thúc đẩy thêm đầu tư từ chính phủ trong tương lai gần. Marc Andreessen, nhà đầu tư mạo hiểm và đồng minh của Trump, lập luận rằng DeepSeek nên được coi là “thời khắc Sputnik của AI,” một cột mốc nâng cao mức độ cạnh tranh toàn cầu.

Còn quá sớm để xác định Quốc hội Mỹ sẽ phản ứng thế nào, nhưng những sự kiện trong quá khứ có thể cung cấp vài gợi ý. Theo nhiều cách, DeepSeek phản chiếu một bước đột phá công nghệ khác từ Bắc Kinh từng khiến cả giới hoạch định chính sách và Thung lũng Silicon bất ngờ: khi Huawei vào năm 2023 dường như đã né được các lệnh trừng phạt của Mỹ để ra mắt một chiếc smartphone sử dụng chip 7 nanomet - công nghệ tiên tiến nhất mà Trung Quốc từng sản xuất vào thời điểm đó./.

Theo Politico, The Guardian
Copy Link
Bài liên quan
Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
DeepSeek, ứng dụng AI hùng mạnh mới của Trung Quốc, làm chấn động làng công nghệ thế giới và Washington
POWERED BY ONECMS - A PRODUCT OF NEKO