Tại sao DeepSeek làm rung chuyển thế giới AI?
DeepSeek, một công ty khởi nghiệp AI của Trung Quốc mới chỉ hơn 1 năm tuổi, đã gây ra sự kinh ngạc và bàng hoàng ở Thung lũng Silicon sau khi trình diễn các mô hình trí tuệ nhân tạo (AI) đột phá cung cấp hiệu suất tương đương với các chatbot tốt nhất thế giới với chi phí thấp hơn nhiều.
Sự xuất hiện của DeepSeek đã phản bác lại quan điểm rằng tương lai của AI sẽ đòi hỏi ngày càng nhiều các nguồn lực và năng lượng để phát triển.
Cổ phiếu công nghệ toàn cầu lao dốc khi sự cường điệu xung quanh câu chuyện DeepSeek ngày càng lan rộng.
DeepSeek chính xác là gì?
DeepSeek được ông Liang Wenfeng, Giám đốc quỹ AI High-Flyer thành lập vào năm 2023. Công ty phát triển các mô hình AI mã nguồn mở, nghĩa là cộng đồng nhà phát triển nói chung có thể kiểm tra và cải thiện phần mềm. Ứng dụng di động của công ty đã tăng vọt lên vị trí đầu bảng xếp hạng tải xuống tại Mỹ sau khi phát hành hồi đầu tháng 1.
Ứng dụng này khác biệt với các chatbot khác như ChatGPT của OpenAI khi đưa ra lý lẽ rõ ràng của mình trước khi có phản hồi cho một câu hỏi (prompt).
DeepSeek tuyên bố mô hình AI mới của mình, R1, cung cấp hiệu suất ngang bằng với mô hình mới nhất của OpenAI và đã cấp phép cho những cá nhân quan tâm đến việc phát triển chatbot bằng công nghệ này.
R1 của DeepSeek khác biệt thế nào so với OpenAI hoặc Meta AI?
Mặc dù DeepSeek không nêu chi tiết đầy đủ, chi phí đào tạo và việc phát triển các mô hình của DeepSeek dường như chỉ là một phần nhỏ so với những gì cần thiết cho các sản phẩm tốt nhất của OpenAI hoặc Meta Platforms.
Hiệu suất tốt hơn nhiều của mô hình này đặt ra câu hỏi về nhu cầu để mua các bộ gia tốc AI mới nhất và mạnh mẽ nhất từ những công ty như Nvidia. Điều đó làm tăng sự chú ý vào lệnh hạn chế xuất khẩu của Mỹ đối với các chất bán dẫn tiên tiến sang Trung Quốc, vốn nhằm mục đích ngăn chặn một bước đột phá như DeepSeek.
DeepSeek cho biết R1 gần hoặc tốt hơn các mô hình đối thủ trong một số sản phẩm hàng đầu như AIME 2024 đối với các tác vụ toán học: MMLU đối với kiến thức chung và AlpacaEval 2.0 đối với hiệu suất hỏi và trả lời. R1 được xếp hạng trong số những mô hình có thành tích cao nhất trên bảng xếp hạng liên kết với UC Berkeley có tên là Chatbot Arena.
Điều gì đang gây báo động ở Mỹ?
Washington đã cấm xuất khẩu các công nghệ cao cấp như chất bán dẫn GPU sang Trung Quốc, nhằm ngăn chặn những tiến bộ của nước này trong lĩnh vực AI, biên giới chính trong cuộc cạnh tranh giành quyền thống trị công nghệ giữa Mỹ và Trung Quốc. Nhưng sự phát triển của DeepSeek cho thấy các kỹ sư AI của Trung Quốc đã tìm ra cách để vượt qua các hạn chế với các nguồn lực hạn chế.
Mặc dù chưa rõ DeepSeek đã tiếp cận được bao nhiêu phần cứng đào tạo AI tiên tiến, nhưng công ty đã phần nào chứng minh rằng các hạn chế thương mại không hoàn toàn có hiệu quả trong việc ngăn cản sự tiến bộ của Trung Quốc.
DeepSeek đã khơi dậy sự quan tâm toàn cầu như thế nào?
DeepSeek đã cho thế giới thấy một cách tổng quát mô hình DeepSeek R1 của mình, được thiết kế để mô phỏng suy nghĩ của con người. Mô hình này được biết đến như một giải pháp thay thế OpenAI rẻ hơn nhiều, nhà đầu tư Marc Andreessen gọi đó là "khoảnh khắc Sputnik của AI".
Giám đốc điều hành OpenAI Sam Altman cho biết trên mạng xã hội X: "R1 của DeepSeek là một mô hình ấn tượng, đặc biệt là về những gì họ có thể cung cấp với mức giá này".
Ứng dụng di động DeepSeek đã được tải xuống 1,6 triệu lần vào ngày 25/1 và xếp hạng số 1 trên các cửa hàng ứng dụng iPhone tại Australia, Canada, Trung Quốc, Singapore, Mỹ và Anh, theo công ty theo dõi thị trường App Figures.
Người sáng lập DeepSeek là ai?
Sinh ra tại Quảng Đông vào năm 1985, ông Liang đã nhận bằng cử nhân và thạc sĩ về kỹ thuật điện tử và thông tin từ Đại học Chiết Giang. Ông thành lập DeepSeek vào năm 2023 với số vốn đăng ký là 10 triệu nhân dân tệ, theo cơ sở dữ liệu công ty Tianyancha.
Ông thông tin với hãng truyền thông Trung Quốc 36kr rằng nút thắt cổ chai đối với những tiến bộ hơn nữa không phải là việc huy động thêm vốn, mà là những hạn chế của Mỹ đối với việc tiếp cận các chip tốt nhất.
Ông cho biết hầu hết các nhà nghiên cứu hàng đầu của ông đều là những sinh viên mới tốt nghiệp từ các trường đại học hàng đầu của Trung Quốc, đồng thời nhấn mạnh rằng Trung Quốc cần phải phát triển hệ sinh thái trong nước của riêng mình.
"Đầu tư nhiều hơn không nhất thiết sẽ dẫn đến nhiều đổi mới hơn. Nếu không, các công ty lớn sẽ tiếp quản mọi đổi mới", ông Liang cho biết.
DeepSeek đứng ở vị trí nào trong bối cảnh AI của Trung Quốc?
Các công ty công nghệ hàng đầu của Trung Quốc, từ Alibaba Group Holding và Baidu đến Tencent Holdings, đã đổ rất nhiều tiền và nguồn lực vào cuộc đua giành phần cứng và khách hàng cho các dự án AI của họ.
Bên cạnh công ty khởi nghiệp 01.AI của CEO Kai-Fu Lee, DeepSeek nổi bật với phương pháp tiếp cận nguồn mở - được thiết kế để tuyển dụng số lượng người dùng lớn nhất một cách nhanh chóng trước khi phát triển các chiến lược kiếm tiền.
Các mô hình của DeepSeek có giá cả phải chăng hơn, do đó giúp giảm chi phí cho các nhà phát triển AI tại Trung Quốc.
Những tác động đối với thị trường AI toàn cầu
Thành công của DeepSeek có thể thúc đẩy OpenAI và các nhà cung cấp của Mỹ hạ giá để duy trì vị thế dẫn đầu đã được thiết lập của các công ty này.
Điều này đặt ra câu hỏi về khoản chi tiêu khổng lồ của các công ty như Meta và Microsoft - mỗi công ty đã cam kết chi tiêu vốn là 65 tỷ USD trở lên trong năm nay, chủ yếu là cho cơ sở hạ tầng AI - nếu các mô hình hiệu quả hơn cũng có thể cạnh tranh với chi phí nhỏ hơn nhiều.
Điều đó đã làm rung chuyển thị trường chứng khoán toàn cầu khi các nhà đầu tư bán tháo các công ty như Nvidia và ASML Holding, những công ty đã hưởng lợi từ nhu cầu bùng nổ về dịch vụ AI. Cổ phiếu của các tên Trung Quốc liên quan đến DeepSeek, chẳng hạn như Iflytek, cũng đã tăng.
Các nhà phát triển trên toàn thế giới đã thử nghiệm phần mềm của DeepSeek để xây dựng các công cụ bằng phần mềm này. Điều đó có thể đẩy nhanh việc áp dụng các mô hình lý luận AI tiên tiến, đồng thời có khả năng gây ra thêm lo ngại về nhu cầu về các rào cản xung quanh việc sử dụng chúng. Những tiến bộ của DeepSeek có thể đẩy nhanh quá trình quản lý để kiểm soát cách phát triển AI.
Tuy nhiên, giống như tất cả các mô hình AI khác của Trung Quốc, DeepSeek tự kiểm duyệt các chủ đề được coi là nhạy cảm ở Trung Quốc. Trong các cuộc thử nghiệm, bot DeepSeek có khả năng đưa ra các phản hồi chi tiết về các nhân vật chính trị như Thủ tướng Ấn Độ Narendra Modi, nhưng từ chối thông tin của Trung Quốc.
Cơ sở hạ tầng đám mây của DeepSeek có thể sẽ gặp hạn chế khi sự truy cập tăng đột biến.
DeepSeek cũng đã trải qua một sự cố ngừng hoạt động lớn trong thời gian ngắn vào ngày 27/1 và sẽ phải quản lý nhiều lưu lượng truy cập hơn nữa khi người dùng mới và người dùng cũ đổ nhiều truy vấn vào chatbot của DeepSeek./.