Chuyển động ICT

Alibaba sẽ phát hành mô hình AI vượt trội hơn DeepSeek?

QA • 18:20 29/01/2025

Hôm nay 29/1, công ty công nghệ Trung Quốc Alibaba đã phát hành phiên bản mới của mô hình trí tuệ nhân tạo (AI) Qwen 2.5, được tuyên bố là vượt trội hơn DeepSeek-V3.

Thời điểm phát hành Qwen 2.5-Max được cho là bất thường, bởi hôm nay là ngày đầu tiên của Tết Nguyên đán Ất Tỵ 2025, hầu hết người dân Trung Quốc và nhiều nước châu Á đang trong kỳ nghỉ Tết và ở bên gia đình. Điều này cho thấy áp lực rất lớn từ công ty khởi nghiệp AI Trung Quốc DeepSeek trong 3 tuần qua. Áp lực này không chỉ đặt lên các đối thủ nước ngoài mà còn cả đối thủ cạnh tranh trong nước.

"Qwen 2.5-Max vượt trội hơn... hầu như trên mọi phương diện so với GPT-4o, DeepSeek-V3 và Llama-3.1-405B", đơn vị đám mây của Alibaba cho biết trong một thông báo được đăng trên tài khoản WeChat chính thức của công ty, ám chỉ đến các mô hình AI nguồn mở tiên tiến nhất của OpenAI và Meta.

Việc phát hành trợ lý AI của DeepSeek vào ngày 10/1, được hỗ trợ bởi mô hình DeepSeek-V3, cũng như việc phát hành mô hình R1 vào ngày 20/1, đã gây chấn động Thung lũng Silicon và khiến cổ phiếu công nghệ lao dốc. Với chi phí phát triển và sử dụng thấp hơn nhiều, công ty khởi nghiệp Trung Quốc DeepSeek đã khiến các nhà đầu tư đặt câu hỏi về kế hoạch chi tiêu khổng lồ của các công ty AI hàng đầu tại Mỹ.

Nhưng thành công của DeepSeek cũng dẫn đến một cuộc chạy đua giữa các đối thủ cạnh tranh trong nước để nâng cấp các mô hình AI của mình.

Hai ngày sau khi phát hành DeepSeek-R1, chủ sở hữu TikTok là ByteDance đã phát hành bản cập nhật cho mô hình AI hàng đầu của công ty này, được cho là vượt trội hơn o1 của OpenAI do Microsoft hỗ trợ trong AIME, một bài kiểm tra chuẩn mực đo lường mức độ hiểu và phản hồi của các mô hình AI đối với các hướng dẫn phức tạp.

Điều này lặp lại tuyên bố của DeepSeek rằng mô hình R1 của DeepSeek có thể sánh ngang với o1 của OpenAI trên một số chuẩn mực hiệu suất.

Liang Wenfeng, nhà sáng lập bí ẩn của DeepSeek, đã cho biết trong một cuộc phỏng vấn hiếm hoi với hãng truyền thông Trung Quốc Waves vào tháng 7/2024 rằng công ty khởi nghiệp này "không quan tâm" đến cuộc chiến giá cả và mục tiêu chính của họ là đạt được AGI (trí tuệ nhân tạo tổng quát).

OpenAI định nghĩa AGI là các hệ thống tự động vượt qua con người trong hầu hết các nhiệm vụ có giá trị kinh tế.

Trong khi các công ty công nghệ lớn của Trung Quốc như Alibaba có hàng trăm nghìn nhân viên thì DeepSeek hoạt động giống như một phòng thí nghiệm nghiên cứu, chủ yếu do những sinh viên mới tốt nghiệp và nghiên cứu sinh tiến sĩ từ các trường đại học hàng đầu Trung Quốc thực hiện.

Nhà sáng lập DeepSeek cũng cho biết trong cuộc phỏng vấn rằng các công ty công nghệ lớn nhất của Trung Quốc có thể không phù hợp với tương lai của ngành AI, khi so sánh chi phí cao và cơ cấu theo hướng từ trên xuống của họ với hoạt động tinh gọn và phong cách quản lý lỏng lẻo của DeepSeek.

"Các mô hình nền tảng lớn đòi hỏi sự đổi mới liên tục, trong khi khả năng của các gã khổng lồ công nghệ có giới hạn", ông Liang Wenfeng thông tin thêm./.

Alibaba sẽ phát hành mô hình AI vượt trội hơn DeepSeek?

Tại sao DeepSeek làm rung chuyển thế giới AI?

DeepSeek, ứng dụng AI hùng mạnh mới của Trung Quốc, làm chấn động làng công nghệ thế giới và Washington

Trung Quốc tăng cường tích trữ chip để đối phó với các lệnh trừng phạt của Mỹ

Trung Quốc mở cửa thị trường viễn thông cho các nhà đầu tư nước ngoài

Startup AI Trung Quốc Baichuan huy động được 700 triệu USD

DeepSeek, ứng dụng AI hùng mạnh mới của Trung Quốc, làm chấn động làng công nghệ thế giới và Washington

Trung Quốc tăng cường tích trữ chip để đối phó với các lệnh trừng phạt của Mỹ

Trung Quốc mở cửa thị trường viễn thông cho các nhà đầu tư nước ngoài

Startup AI Trung Quốc Baichuan huy động được 700 triệu USD

Đồng Nai hợp tác với VNNIC phát triển hạ tầng số hiện đại, tiên phong cho Internet thế hệ mới

Kỹ sư Việt giành giải nhất cuộc thi Global AI Challenge tại Hong Kong

Việt Nam xếp thứ hai trong khu vực ASEAN về số lượng startup GenAI

Tập đoàn công nghệ Đức ra mắt Trung tâm R&D tại Việt Nam với mức đầu tư hơn 150 triệu euro

Mức áp thuế mới với chất bán dẫn của Tổng thống Mỹ đặt ra nhiều câu hỏi

Z Fold7 và Flip7: S martphone gập không còn là “công nghệ của tương lai”

Bộ KH&CN Việt Nam với Bộ Khoa học, CNTT và Truyền thông Hàn Quốc hợp tác khoa học công nghệ

Mảnh đất màu mỡ cho các mối đe dọa mạng đánh cắp dữ liệu

Kỹ sư Việt Nam giành giải Nhất cuộc thi trí tuệ nhân tạo (AI) về xây dựng và kỹ thuật

Từ năng lực cá nhân đến trưởng thành tổ chức: Ánh xạ khung kỹ năng số quốc gia vào mô hình VAICP 6 tầng

Kỹ sư Việt giành giải nhất cuộc thi Global AI Challenge tại Hong Kong

Tổng Bí thư Tô Lâm: Đẩy mạnh kết nối các chuyên gia, trí thức, doanh nhân người Việt tại Hàn Quốc và các nước

Đồng Nai hợp tác với VNNIC phát triển hạ tầng số hiện đại, tiên phong cho Internet thế hệ mới

Phát hiện, bắt giữ đối tượng người nước ngoài dùng BTS giả phát tán tin nhắn lừa đảo

GPT-5: Kỷ nguyên mới của trí tuệ nhân tạo với những đột phá vượt trội

Olympic Trí tuệ nhân tạo quốc tế (IOAI) 2025: Việt Nam trong nhóm 4 quốc gia, vùng lãnh thổ đạt thành tích cao nhất

Nghiên cứu thu phí “0 đồng” khi thực hiện thủ tục hành chính trực tuyến

Cầu nối tạo lập khung pháp lý và giảm thiểu nguy cơ lừa đảo thị trường tài sản số

Việt Nam xếp thứ hai trong khu vực ASEAN về số lượng startup GenAI

Bộ trưởng Nguyễn Mạnh Hùng: Đưa KHCN, ĐMST và chuyển đổi số thực sự trở thành động lực chính của phát triển đất nước

Cục Bưu điện Trung ương: 60 năm giữ vững "mạch máu" thông tin liên lạc của Đảng và Nhà nước