Chuyển động ICT

Lý do thực sự đằng sau cơn sốt DeepSeek

QA 09:32 17/02/2025

DeepSeek đã làm đảo lộn thế giới công nghệ vào tháng trước. Theo các chuyên gia về AI, chúng ta có thể chỉ mới thấy khởi đầu của sự ảnh hưởng từ công ty khởi nghiệp công nghệ Trung Quốc này đối với lĩnh vực AI.

deepseek.png
DeepSeek đã làm đảo lộn thế giới công nghệ và Phố Wall với mô hình AI hiệu suất cao mà công ty này tuyên bố được đào tạo với chi phí chỉ bằng một phần nhỏ so với các đối thủ cạnh tranh lớn (Ảnh: Shutterstock).

DeepSeek đã gây chú ý vào cuối tháng 1 với mô hình AI R1 có hiệu suất được cho là gần sánh nganh mô hình o1 của Open AI với chi phí chỉ bằng một phần nhỏ. Cổ phiếu công nghệ đã lao dốc khi DeepSeek tạm thời đánh bại ChatGPT để trở thành ứng dụng hàng đầu trên App Store của Apple.

Thành tích này đã thúc đẩy những gã khổng lồ công nghệ của Hoa Kỳ đặt câu hỏi về vị thế của Hoa Kỳ trong cuộc đua AI với Trung Quốc - và hàng tỷ đô la đằng sau những nỗ lực đó. Trong khi Phó Tổng thống JD Vance không nhắc đến DeepSeek hay Trung Quốc trong bài phát biểu của mình tại Hội nghị thượng đỉnh hành động về trí tuệ nhân tạo (AI Action Summit) ở Paris vào ngày 11/2, nhưng ông đã nhấn mạnh đến việc Hoa Kỳ ưu tiên dẫn đầu lĩnh vực này như thế nào.

"Hoa Kỳ là quốc gia dẫn đầu về AI và chính quyền của chúng tôi có kế hoạch duy trì vị thế đó", mặc dù Phó Tổng thống Vance có nói thêm rằng "Hoa Kỳ muốn hợp tác" với các quốc gia khác.

Nhưng không chỉ có hiệu quả và sức mạnh của DeepSeek. Các chuyên gia cho biết cách DeepSeek R1 có thể lý luận và "suy nghĩ" thông qua các câu trả lời để cung cấp kết quả chất lượng, cùng với quyết định công khai các phần chính của công nghệ của công ty, cũng sẽ thúc đẩy lĩnh vực này phát triển.

Mặc dù AI đã được sử dụng từ lâu trong các sản phẩm công nghệ, nhưng đã đạt đến đỉnh điểm trong 2 năm qua nhờ sự phát triển của ChatGPT và các dịch vụ AI tạo sinh khác đã định hình lại cách mọi người làm việc, giao tiếp và tìm kiếm thông tin. AI đã biến các công ty như nhà sản xuất chip Nvidia trở thành những công ty được Phố Wall yêu thích và làm đảo lộn quỹ đạo của những gã khổng lồ ở Thung lũng Silicon. Vì vậy, bất kỳ sự phát triển nào có thể giúp xây dựng các mô hình có năng lực và hiệu quả hơn chắc chắn sẽ được theo dõi chặt chẽ.

“Đây chắc chắn không phải là sự cường điệu”, Oren Etzioni, cựu CEO của Viện Trí tuệ nhân tạo Allen cho biết. “Nhưng đây cũng là một thế giới chuyển động rất nhanh”.

Khoảnh khắc TikTok của AI

Các nhà lãnh đạo công nghệ đã nhanh chóng phản ứng với sự trỗi dậy của DeepSeek. Tổng giám đốc điều hành Google DeepMind Demis Hassabis gọi sự cường điệu xung quanh DeepSeek là "phóng đại", nhưng cũng nói rằng mô hình của công ty này "có lẽ là công trình tốt nhất mà tôi từng thấy đến từ Trung Quốc", theo CNBC.

CEO Microsoft Satya Nadella đã nói tại cuộc họp về doanh thu của công ty vào tháng 1 rằng DeepSeek có một số "sáng kiến ​​thực sự", trong khi CEO Apple Tim Cook cho biết trong cuộc họp về doanh thu của nhà sản xuất iPhone rằng "sáng kiến ​​thúc đẩy hiệu quả là một điều tốt".

Nhưng không phải tất cả sự chú ý đều tích cực. Nhà nghiên cứu chất bán dẫn SemiAnalysis đã nghi ngờ tuyên bố của DeepSeek là công ty này chỉ mất 5,6 triệu USD để đào tạo. OpenAI nói với The Financial Times (FT) là đã tìm thấy bằng chứng cho thấy DeepSeek đã sử dụng các mô hình của công ty Hoa Kỳ để đào tạo đối thủ cạnh tranh của chính mình.

"Chúng tôi đã biết và đang xem xét các dấu hiệu cho thấy DeepSeek có thể đã chắt lọc không đúng cách các mô hình của chúng tôi và sẽ chia sẻ thông tin khi chúng tôi biết thêm", một phát ngôn viên của OpenAI cho biết trong một bình luận với CNN. DeepSeek chưa có bình luận ngay lập tức.

Và đã có một số nhà lập pháp Hoa Kỳ đã kêu gọi cấm ứng dụng này khỏi các thiết bị của chính phủ sau khi các nhà nghiên cứu bảo mật nêu mối liên hệ tiềm ẩn của DeepSeek với chính phủ, như Associated Press và ABC News đưa tin.

Những lo ngại tương tự đã được nêu ra về ứng dụng truyền thông xã hội phổ biến TikTok, ứng dụng này phải được bán cho một chủ sở hữu người Hoa Kỳ hoặc có nguy cơ bị cấm tại Hoa Kỳ.

"DeepSeek là TikTok của (các mô hình ngôn ngữ lớn)", Etzioni nói.

Ấn tượng sâu sắc của DeepSeek đối với giới công nghệ

Các gã khổng lồ công nghệ đã suy nghĩ về cách công nghệ của DeepSeek có thể ảnh hưởng đến các sản phẩm và dịch vụ của họ.

"Những gì DeepSeek cung cấp cho chúng tôi về cơ bản là công thức dưới dạng báo cáo công nghệ, nhưng không cung cấp các phần còn thiếu", Lewis Tunstall, một nhà khoa học nghiên cứu cấp cao tại Hugging Face, một nền tảng AI cung cấp các công cụ cho các nhà phát triển, cho biết.

Tunstall đang dẫn đầu nỗ lực tại Hugging Face để mở nguồn hoàn toàn mô hình R1 của DeepSeek; trong khi DeepSeek cung cấp một bài báo nghiên cứu và các tham số của mô hình nhưng không tiết lộ mã hoặc dữ liệu đào tạo.

Nadella cho biết PC Windows Copilot+ hoặc PC được xây dựng theo một thông số kỹ thuật nhất định để hỗ trợ các mô hình AI, sẽ có thể chạy các mô hình AI được chắt lọc từ DeepSeek R1. Nhà sản xuất chip di động Qualcomm cho biết vào ngày 11/2 là các mô hình được chắt lọc từ DeepSeek R1 đã chạy trên điện thoại thông minh và PC được cung cấp năng lượng bởi chip của họ trong vòng 1 tuần.

Các nhà nghiên cứu, học giả và nhà phát triển AI vẫn đang khám phá ý nghĩa của DeepSeek đối với sự tiến bộ của AI.

Mô hình của DeepSeek không phải là mô hình nguồn mở duy nhất, cũng không phải là mô hình đầu tiên có thể suy luận về các câu trả lời trước khi phản hồi; mô hình o1 của OpenAI từ năm ngoái cũng có thể làm được điều đó.

Điều khiến DeepSeek trở nên quan trọng là cách có thể suy luận và học hỏi từ các mô hình khác, cùng với thực tế là cộng đồng AI có thể thấy những gì đang diễn ra đằng sau hậu trường. Những người sử dụng mô hình R1 trong ứng dụng DeepSeek cũng có thể thấy quá trình "suy nghĩ" của R1 khi trả lời các câu hỏi.

"Bạn có thể thấy các bánh xe quay bên trong cỗ máy", Durga Malladi, Phó chủ tịch cấp cao kiêm Tổng giám đốc lập kế hoạch công nghệ và giải pháp biên tại Qualcomm, cho CNN biết.

Tunstall cho rằng chúng ta có thể chứng kiến một làn sóng các mô hình mới có thể suy luận như DeepSeek trong tương lai không xa. Điều đó có thể rất quan trọng khi các gã khổng lồ công nghệ chạy đua để xây dựng các tác nhân AI, mà Thung lũng Silicon thường tin là sự phát triển tiếp theo của chatbot và cách người tiêu dùng sẽ tương tác với các thiết bị - mặc dù sự thay đổi đó vẫn chưa thực sự diễn ra.

Grok 3, phiên bản tiếp theo của chatbot trên nền tảng truyền thông xã hội X, sẽ có "khả năng suy luận rất mạnh mẽ", chủ sở hữu của nó, Elon Musk, cho biết 13/2 trong một video tại Hội nghị thượng đỉnh của các chính phủ thế giới.

Hiện tại, cộng đồng AI sẽ tiếp tục mày mò những gì DeepSeek cung cấp. Nghĩa là, cho đến khi có bước đột phá tiếp theo.

Etzioni cho biết "Tôi chắc chắn dự đoán rằng trong 12 tháng tới, nó sẽ bị thay thế bởi thứ gì đó khác. Nhưng đó là một bước tiến rất thực tế"./.

Theo CNN
Copy Link
Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
Lý do thực sự đằng sau cơn sốt DeepSeek
POWERED BY ONECMS - A PRODUCT OF NEKO