Chuyển động ICT

Tại sao DeepSeek làm rung chuyển thế giới AI?

QA • 18:53 28/01/2025

DeepSeek, một công ty khởi nghiệp AI của Trung Quốc mới chỉ hơn 1 năm tuổi, đã gây ra sự kinh ngạc và bàng hoàng ở Thung lũng Silicon sau khi trình diễn các mô hình trí tuệ nhân tạo (AI) đột phá cung cấp hiệu suất tương đương với các chatbot tốt nhất thế giới với chi phí thấp hơn nhiều.

DeepSeek đã gây ra sự chấn động trên thị trường Mỹ với các mô hình AI đột phá cung cấp hiệu suất tương đương với các chatbot tốt nhất thế giới với chi phí thấp hơn nhiều. (Ảnh: Reuters).

Sự xuất hiện của DeepSeek đã phản bác lại quan điểm rằng tương lai của AI sẽ đòi hỏi ngày càng nhiều các nguồn lực và năng lượng để phát triển.

Cổ phiếu công nghệ toàn cầu lao dốc khi sự cường điệu xung quanh câu chuyện DeepSeek ngày càng lan rộng.

DeepSeek chính xác là gì?

DeepSeek được ông Liang Wenfeng, Giám đốc quỹ AI High-Flyer thành lập vào năm 2023. Công ty phát triển các mô hình AI mã nguồn mở, nghĩa là cộng đồng nhà phát triển nói chung có thể kiểm tra và cải thiện phần mềm. Ứng dụng di động của công ty đã tăng vọt lên vị trí đầu bảng xếp hạng tải xuống tại Mỹ sau khi phát hành hồi đầu tháng 1.

Ứng dụng này khác biệt với các chatbot khác như ChatGPT của OpenAI khi đưa ra lý lẽ rõ ràng của mình trước khi có phản hồi cho một câu hỏi (prompt).

DeepSeek tuyên bố mô hình AI mới của mình, R1, cung cấp hiệu suất ngang bằng với mô hình mới nhất của OpenAI và đã cấp phép cho những cá nhân quan tâm đến việc phát triển chatbot bằng công nghệ này.

R1 của DeepSeek khác biệt thế nào so với OpenAI hoặc Meta AI?

Mặc dù DeepSeek không nêu chi tiết đầy đủ, chi phí đào tạo và việc phát triển các mô hình của DeepSeek dường như chỉ là một phần nhỏ so với những gì cần thiết cho các sản phẩm tốt nhất của OpenAI hoặc Meta Platforms.

Hiệu suất tốt hơn nhiều của mô hình này đặt ra câu hỏi về nhu cầu để mua các bộ gia tốc AI mới nhất và mạnh mẽ nhất từ những công ty như Nvidia. Điều đó làm tăng sự chú ý vào lệnh hạn chế xuất khẩu của Mỹ đối với các chất bán dẫn tiên tiến sang Trung Quốc, vốn nhằm mục đích ngăn chặn một bước đột phá như DeepSeek.

DeepSeek cho biết R1 gần hoặc tốt hơn các mô hình đối thủ trong một số sản phẩm hàng đầu như AIME 2024 đối với các tác vụ toán học: MMLU đối với kiến thức chung và AlpacaEval 2.0 đối với hiệu suất hỏi và trả lời. R1 được xếp hạng trong số những mô hình có thành tích cao nhất trên bảng xếp hạng liên kết với UC Berkeley có tên là Chatbot Arena.

Điều gì đang gây báo động ở Mỹ?

Washington đã cấm xuất khẩu các công nghệ cao cấp như chất bán dẫn GPU sang Trung Quốc, nhằm ngăn chặn những tiến bộ của nước này trong lĩnh vực AI, biên giới chính trong cuộc cạnh tranh giành quyền thống trị công nghệ giữa Mỹ và Trung Quốc. Nhưng sự phát triển của DeepSeek cho thấy các kỹ sư AI của Trung Quốc đã tìm ra cách để vượt qua các hạn chế với các nguồn lực hạn chế.

Mặc dù chưa rõ DeepSeek đã tiếp cận được bao nhiêu phần cứng đào tạo AI tiên tiến, nhưng công ty đã phần nào chứng minh rằng các hạn chế thương mại không hoàn toàn có hiệu quả trong việc ngăn cản sự tiến bộ của Trung Quốc.

DeepSeek đã khơi dậy sự quan tâm toàn cầu như thế nào?

DeepSeek đã cho thế giới thấy một cách tổng quát mô hình DeepSeek R1 của mình, được thiết kế để mô phỏng suy nghĩ của con người. Mô hình này được biết đến như một giải pháp thay thế OpenAI rẻ hơn nhiều, nhà đầu tư Marc Andreessen gọi đó là "khoảnh khắc Sputnik của AI".

Giám đốc điều hành OpenAI Sam Altman cho biết trên mạng xã hội X: "R1 của DeepSeek là một mô hình ấn tượng, đặc biệt là về những gì họ có thể cung cấp với mức giá này".

Ứng dụng di động DeepSeek đã được tải xuống 1,6 triệu lần vào ngày 25/1 và xếp hạng số 1 trên các cửa hàng ứng dụng iPhone tại Australia, Canada, Trung Quốc, Singapore, Mỹ và Anh, theo công ty theo dõi thị trường App Figures.

Người sáng lập DeepSeek là ai?

Sinh ra tại Quảng Đông vào năm 1985, ông Liang đã nhận bằng cử nhân và thạc sĩ về kỹ thuật điện tử và thông tin từ Đại học Chiết Giang. Ông thành lập DeepSeek vào năm 2023 với số vốn đăng ký là 10 triệu nhân dân tệ, theo cơ sở dữ liệu công ty Tianyancha.

Ông thông tin với hãng truyền thông Trung Quốc 36kr rằng nút thắt cổ chai đối với những tiến bộ hơn nữa không phải là việc huy động thêm vốn, mà là những hạn chế của Mỹ đối với việc tiếp cận các chip tốt nhất.

Ông cho biết hầu hết các nhà nghiên cứu hàng đầu của ông đều là những sinh viên mới tốt nghiệp từ các trường đại học hàng đầu của Trung Quốc, đồng thời nhấn mạnh rằng Trung Quốc cần phải phát triển hệ sinh thái trong nước của riêng mình.

"Đầu tư nhiều hơn không nhất thiết sẽ dẫn đến nhiều đổi mới hơn. Nếu không, các công ty lớn sẽ tiếp quản mọi đổi mới", ông Liang cho biết.

DeepSeek đứng ở vị trí nào trong bối cảnh AI của Trung Quốc?

Các công ty công nghệ hàng đầu của Trung Quốc, từ Alibaba Group Holding và Baidu đến Tencent Holdings, đã đổ rất nhiều tiền và nguồn lực vào cuộc đua giành phần cứng và khách hàng cho các dự án AI của họ.

Bên cạnh công ty khởi nghiệp 01.AI của CEO Kai-Fu Lee, DeepSeek nổi bật với phương pháp tiếp cận nguồn mở - được thiết kế để tuyển dụng số lượng người dùng lớn nhất một cách nhanh chóng trước khi phát triển các chiến lược kiếm tiền.

Các mô hình của DeepSeek có giá cả phải chăng hơn, do đó giúp giảm chi phí cho các nhà phát triển AI tại Trung Quốc.

Những tác động đối với thị trường AI toàn cầu

Thành công của DeepSeek có thể thúc đẩy OpenAI và các nhà cung cấp của Mỹ hạ giá để duy trì vị thế dẫn đầu đã được thiết lập của các công ty này.

Điều này đặt ra câu hỏi về khoản chi tiêu khổng lồ của các công ty như Meta và Microsoft - mỗi công ty đã cam kết chi tiêu vốn là 65 tỷ USD trở lên trong năm nay, chủ yếu là cho cơ sở hạ tầng AI - nếu các mô hình hiệu quả hơn cũng có thể cạnh tranh với chi phí nhỏ hơn nhiều.

Điều đó đã làm rung chuyển thị trường chứng khoán toàn cầu khi các nhà đầu tư bán tháo các công ty như Nvidia và ASML Holding, những công ty đã hưởng lợi từ nhu cầu bùng nổ về dịch vụ AI. Cổ phiếu của các tên Trung Quốc liên quan đến DeepSeek, chẳng hạn như Iflytek, cũng đã tăng.

Các nhà phát triển trên toàn thế giới đã thử nghiệm phần mềm của DeepSeek để xây dựng các công cụ bằng phần mềm này. Điều đó có thể đẩy nhanh việc áp dụng các mô hình lý luận AI tiên tiến, đồng thời có khả năng gây ra thêm lo ngại về nhu cầu về các rào cản xung quanh việc sử dụng chúng. Những tiến bộ của DeepSeek có thể đẩy nhanh quá trình quản lý để kiểm soát cách phát triển AI.

Tuy nhiên, giống như tất cả các mô hình AI khác của Trung Quốc, DeepSeek tự kiểm duyệt các chủ đề được coi là nhạy cảm ở Trung Quốc. Trong các cuộc thử nghiệm, bot DeepSeek có khả năng đưa ra các phản hồi chi tiết về các nhân vật chính trị như Thủ tướng Ấn Độ Narendra Modi, nhưng từ chối thông tin của Trung Quốc.

Cơ sở hạ tầng đám mây của DeepSeek có thể sẽ gặp hạn chế khi sự truy cập tăng đột biến.

DeepSeek cũng đã trải qua một sự cố ngừng hoạt động lớn trong thời gian ngắn vào ngày 27/1 và sẽ phải quản lý nhiều lưu lượng truy cập hơn nữa khi người dùng mới và người dùng cũ đổ nhiều truy vấn vào chatbot của DeepSeek./.

Tại sao DeepSeek làm rung chuyển thế giới AI?

DeepSeek, ứng dụng AI hùng mạnh mới của Trung Quốc, làm chấn động làng công nghệ thế giới và Washington

Xu hướng an ninh mạng năm 2025: Kết hợp giữa công nghệ AI và yếu tố con người

AI 2024: Bước nhảy vọt công nghệ và dự báo xu hướng định hình tương lai năm 2025

Văn phòng AI quốc gia Malaysia và những ảnh hưởng đến xu hướng AI tại Đông Nam Á

7 xu hướng định hình dữ liệu và AI trong năm 2025

Xu hướng an ninh mạng năm 2025: Kết hợp giữa công nghệ AI và yếu tố con người

AI 2024: Bước nhảy vọt công nghệ và dự báo xu hướng định hình tương lai năm 2025

Văn phòng AI quốc gia Malaysia và những ảnh hưởng đến xu hướng AI tại Đông Nam Á

7 xu hướng định hình dữ liệu và AI trong năm 2025

FPT đẩy mạnh hợp tác nâng cao chất lượng nguồn nhân lực toàn cầu

Hợp tác chiến lược giữa hai DN công nghệ Việt - Hàn để phát triển TTDL siêu quy mô

FPT hợp tác với Hàn Quốc phát triển chip thế hệ mới và đào tạo nhân lực công nghệ

Nhiều thỏa thuận hợp tác về hạ tầng số, chuyển đổi số giữa doanh nghiệp Việt Nam và Hàn Quốc

Tỷ phú Elon Musk cáo buộc Apple vi phạm luật chống độc quyền

Phát huy truyền thống 80 năm Bưu điện Việt Nam - Đổi mới cùng đất nước, vươn tới tầm cao mới

Thủ tướng: Hoan nghênh Tập đoàn CT Group đi thẳng vào phát triển các công nghệ tiên tiến

Nhiệt liệt chào mừng Đại hội đại biểu Đảng bộ Bộ Khoa học và Công nghệ lần thứ I, nhiệm kỳ 2025 - 2030!

FPT đẩy mạnh hợp tác nâng cao chất lượng nguồn nhân lực toàn cầu

YouTube bắt đầu thử nghiệm hệ thống xác minh độ tuổi sử dụng AI tại Mỹ

Hợp tác chiến lược giữa hai DN công nghệ Việt - Hàn để phát triển TTDL siêu quy mô

Hợp tác khoa học công nghệ là một trụ cột quan trọng nâng tầm quan hệ Việt Nam - Hàn Quốc

Bộ KH&CN nắm bắt khó khăn, tháo gỡ vướng mắc trong vận hành chính quyền hai cấp tại Phú Thọ

Nhiều thỏa thuận hợp tác về hạ tầng số, chuyển đổi số giữa doanh nghiệp Việt Nam và Hàn Quốc

FPT hợp tác với Hàn Quốc phát triển chip thế hệ mới và đào tạo nhân lực công nghệ

Cảnh giác trước thủ đoạn "bắt cóc online"

Trung tâm SOC tiên tiến: Chìa khóa cho xu hướng hợp nhất IT và OT tại châu Á - Thái Bình Dương

Tỷ phú Elon Musk cáo buộc Apple vi phạm luật chống độc quyền

Thêm giải pháp tăng cường năng lực bảo mật đám mây tại ASEAN

Hàng trăm KOL và các nhà quản lý, doanh nghiệp, nền tảng góp mặt tại Hội nghị KOL toàn quốc

Nghị quyết 57-NQ/TW: 31/34 địa phương đã hoàn thành đúng tiến độ các nhiệm vụ phải xong trước ngày 1/9