Chuyển động ICT

Alibaba sẽ phát hành mô hình AI vượt trội hơn DeepSeek?

QA 18:20 29/01/2025

Hôm nay 29/1, công ty công nghệ Trung Quốc Alibaba đã phát hành phiên bản mới của mô hình trí tuệ nhân tạo (AI) Qwen 2.5, được tuyên bố là vượt trội hơn DeepSeek-V3.

alibaba.png

Thời điểm phát hành Qwen 2.5-Max được cho là bất thường, bởi hôm nay là ngày đầu tiên của Tết Nguyên đán Ất Tỵ 2025, hầu hết người dân Trung Quốc và nhiều nước châu Á đang trong kỳ nghỉ Tết và ở bên gia đình. Điều này cho thấy áp lực rất lớn từ công ty khởi nghiệp AI Trung Quốc DeepSeek trong 3 tuần qua. Áp lực này không chỉ đặt lên các đối thủ nước ngoài mà còn cả đối thủ cạnh tranh trong nước.

"Qwen 2.5-Max vượt trội hơn... hầu như trên mọi phương diện so với GPT-4o, DeepSeek-V3 và Llama-3.1-405B", đơn vị đám mây của Alibaba cho biết trong một thông báo được đăng trên tài khoản WeChat chính thức của công ty, ám chỉ đến các mô hình AI nguồn mở tiên tiến nhất của OpenAI và Meta.

Việc phát hành trợ lý AI của DeepSeek vào ngày 10/1, được hỗ trợ bởi mô hình DeepSeek-V3, cũng như việc phát hành mô hình R1 vào ngày 20/1, đã gây chấn động Thung lũng Silicon và khiến cổ phiếu công nghệ lao dốc. Với chi phí phát triển và sử dụng thấp hơn nhiều, công ty khởi nghiệp Trung Quốc DeepSeek đã khiến các nhà đầu tư đặt câu hỏi về kế hoạch chi tiêu khổng lồ của các công ty AI hàng đầu tại Mỹ.

Nhưng thành công của DeepSeek cũng dẫn đến một cuộc chạy đua giữa các đối thủ cạnh tranh trong nước để nâng cấp các mô hình AI của mình.

Hai ngày sau khi phát hành DeepSeek-R1, chủ sở hữu TikTok là ByteDance đã phát hành bản cập nhật cho mô hình AI hàng đầu của công ty này, được cho là vượt trội hơn o1 của OpenAI do Microsoft hỗ trợ trong AIME, một bài kiểm tra chuẩn mực đo lường mức độ hiểu và phản hồi của các mô hình AI đối với các hướng dẫn phức tạp.

Điều này lặp lại tuyên bố của DeepSeek rằng mô hình R1 của DeepSeek có thể sánh ngang với o1 của OpenAI trên một số chuẩn mực hiệu suất.

Liang Wenfeng, nhà sáng lập bí ẩn của DeepSeek, đã cho biết trong một cuộc phỏng vấn hiếm hoi với hãng truyền thông Trung Quốc Waves vào tháng 7/2024 rằng công ty khởi nghiệp này "không quan tâm" đến cuộc chiến giá cả và mục tiêu chính của họ là đạt được AGI (trí tuệ nhân tạo tổng quát).

OpenAI định nghĩa AGI là các hệ thống tự động vượt qua con người trong hầu hết các nhiệm vụ có giá trị kinh tế.

Trong khi các công ty công nghệ lớn của Trung Quốc như Alibaba có hàng trăm nghìn nhân viên thì DeepSeek hoạt động giống như một phòng thí nghiệm nghiên cứu, chủ yếu do những sinh viên mới tốt nghiệp và nghiên cứu sinh tiến sĩ từ các trường đại học hàng đầu Trung Quốc thực hiện.

Nhà sáng lập DeepSeek cũng cho biết trong cuộc phỏng vấn rằng các công ty công nghệ lớn nhất của Trung Quốc có thể không phù hợp với tương lai của ngành AI, khi so sánh chi phí cao và cơ cấu theo hướng từ trên xuống của họ với hoạt động tinh gọn và phong cách quản lý lỏng lẻo của DeepSeek.

"Các mô hình nền tảng lớn đòi hỏi sự đổi mới liên tục, trong khi khả năng của các gã khổng lồ công nghệ có giới hạn", ông Liang Wenfeng thông tin thêm./.

Theo Reuters
Copy Link
Bài liên quan
  • Tại sao DeepSeek làm rung chuyển thế giới AI?
    DeepSeek, một công ty khởi nghiệp AI của Trung Quốc mới chỉ hơn 1 năm tuổi, đã gây ra sự kinh ngạc và bàng hoàng ở Thung lũng Silicon sau khi trình diễn các mô hình trí tuệ nhân tạo (AI) đột phá cung cấp hiệu suất tương đương với các chatbot tốt nhất thế giới với chi phí thấp hơn nhiều.
Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
Alibaba sẽ phát hành mô hình AI vượt trội hơn DeepSeek?
POWERED BY ONECMS - A PRODUCT OF NEKO