Chuyển động ICT

Xây dựng mô hình AI không cần trung tâm dữ liệu: Cuộc cách mạng mới trong phát triển AI toàn cầu

Anh Minh 02/05/2025 06:30

Thay vì sử dụng các trung tâm dữ liệu tập trung với hàng ngàn GPU kết nối bằng cáp quang tốc độ cao, mô hình AI mới của hai startup đã được xây dựng dựa trên hàng trăm máy tính phân bố khắp thế giới, kết nối qua Internet.

Collective-1: Mô hình AI phân tán đầu tiên

Một phương pháp đột phá trong việc xây dựng trí tuệ nhân tạo (AI) đang được thử nghiệm, hứa hẹn phá vỡ cách thức thống trị hiện nay của ngành công nghiệp AI. Hai startup là Flower AI và Vana đã hợp tác để tạo ra mô hình ngôn ngữ lớn (LLM) mới mang tên Collective-1, sử dụng các GPU phân bố khắp thế giới và kết hợp dữ liệu công khai lẫn riêng tư.

Phương pháp này không chỉ mở ra cơ hội cho các công ty nhỏ và quốc gia thiếu hạ tầng công nghệ tiên tiến mà còn có thể thay đổi cán cân quyền lực trong ngành AI.

ai-lab-llm-scaling-business.jpg
Một phương pháp đột phá trong việc xây dựng AI đang được thử nghiệm, hứa hẹn phá vỡ cách thức thống trị hiện nay của ngành công nghiệp AI. Ảnh minh họa

Cụ thể, theo The Wired, hai startup Flower AI và Vana đã cùng nhau phát triển Collective-1, một mô hình ngôn ngữ lớn với 7 tỷ tham số - con số nhỏ so với hàng trăm tỷ tham số của các mô hình tiên tiến như ChatGPT, Claude hay Gemini. Tuy nhiên, điều làm Collective-1 nổi bật là cách nó được huấn luyện: thay vì sử dụng các trung tâm dữ liệu tập trung với hàng ngàn GPU kết nối bằng cáp quang tốc độ cao, mô hình này được xây dựng trên hàng trăm máy tính phân bố khắp thế giới, kết nối qua internet.

Flower AI đã phát triển các kỹ thuật cho phép phân chia quá trình huấn luyện trên nhiều thiết bị từ xa, trong khi Vana cung cấp nguồn dữ liệu đa dạng, bao gồm tin nhắn riêng tư từ các nền tảng như X, Reddit và Telegram. Dù nhỏ, Collective-1 là bước đầu tiên trong tham vọng mở rộng quy mô của Flower AI.

Nic Lane, nhà khoa học máy tính tại Đại học Cambridge và đồng sáng lập Flower AI, cho biết phương pháp phân tán này có tiềm năng vượt xa quy mô hiện tại của Collective-1. Công ty đang huấn luyện một mô hình 30 tỷ tham số với dữ liệu truyền thống và dự kiến xây dựng mô hình 100 tỷ tham số - ngang tầm với các mô hình hàng đầu - vào cuối năm nay.

Lane nhấn mạnh: “Phương pháp này có thể thay đổi cách mọi người nghĩ về AI, và chúng tôi đang nỗ lực hết sức để hiện thực hóa nó”. Flower AI cũng đang tích hợp hình ảnh và âm thanh vào quá trình huấn luyện để tạo ra các mô hình đa phương thức.

Phá vỡ mô hình xây dựng AI truyền thống

Hiện nay, các công ty AI lớn xây dựng mô hình bằng cách kết hợp khối lượng dữ liệu khổng lồ với sức mạnh tính toán tập trung tại các trung tâm dữ liệu (TTDL) chứa hàng ngàn GPU tiên tiến. Họ thường dựa vào dữ liệu công khai, đôi khi có bản quyền, thu thập từ các trang web, sách và các nguồn khác.

Phương pháp này đòi hỏi nguồn lực tài chính và hạ tầng công nghệ mà chỉ các công ty giàu có hoặc quốc gia có nguồn chip mạnh mới đáp ứng được. Ngay cả các mô hình mã nguồn mở như Llama của Meta hay R1 của DeepSeek cũng được tạo ra bởi những công ty sở hữu trung tâm dữ liệu lớn.

Phương pháp phân tán của Flower AI có thể thay đổi cục diện này. Bằng cách tận dụng các tài nguyên tính toán rải rác trên toàn cầu, các công ty nhỏ, trường đại học, hoặc các quốc gia thiếu hạ tầng hiện đại có thể hợp sức để xây dựng các mô hình AI tiên tiến. Chẳng hạn, nhiều TTDL nhỏ ở các quốc gia khác nhau có thể được kết nối để tạo ra một mô hình mạnh mẽ hơn. Lane nhận định: “Phương pháp phân tán cho phép mở rộng sức mạnh tính toán một cách hiệu quả hơn so với mô hình TTDL".

Để xây dựng Collective-1, Flower AI hợp tác với các nhà nghiên cứu từ Đại học Bưu chính Viễn thông Bắc Kinh và Đại học Chiết Giang (Trung Quốc) để phát triển công cụ Photon. Công cụ này giúp tối ưu hóa quá trình huấn luyện phân tán bằng cách cải thiện cách biểu diễn dữ liệu trong mô hình và phương thức chia sẻ, đồng bộ hóa dữ liệu huấn luyện.

So với cách tiếp cận của Google (DIstributed PAth COmposition - DiPaCo), Photon hiệu quả hơn, dù chậm hơn so với huấn luyện truyền thống. Điểm mạnh của Photon là tính linh hoạt, cho phép bổ sung phần cứng mới để tăng tốc độ huấn luyện. Tháng trước, nhóm nghiên cứu đã phát hành Photon dưới dạng mã nguồn mở, cho phép bất kỳ ai sử dụng công cụ này.

Trong khi đó, Vana mang đến một cách tiếp cận mới về dữ liệu. Công ty phát triển phần mềm cho phép người dùng đóng góp dữ liệu cá nhân từ các nền tảng như X hay Reddit để huấn luyện AI, đồng thời kiểm soát cách dữ liệu được sử dụng và thậm chí hưởng lợi tài chính từ đóng góp của họ. Anna Kazlauskas, đồng sáng lập Vana, giải thích: “Đây là dữ liệu thường không được sử dụng vì không công khai. Lần đầu tiên, dữ liệu do người dùng đóng góp trực tiếp được dùng để huấn luyện một mô hình nền tảng, và người dùng có quyền sở hữu mô hình AI mà dữ liệu của họ tạo ra”.

Cho phép doanh nghiệp nhỏ, quốc gia thiếu hạ tầng công nghệ xây dựng mô hình AI mạnh mẽ

Phương pháp phân tán không chỉ mở ra cơ hội kỹ thuật mà còn có thể thay đổi động lực quyền lực trong ngành AI. Helen Toner, chuyên gia về quản trị AI tại Trung tâm An ninh và Công nghệ mới nổi, nhận định cách tiếp cận của Flower AI “thú vị và có thể rất quan trọng” đối với cạnh tranh và quản trị AI. Mặc dù khó cạnh tranh trực tiếp với các mô hình tiên phong, phương pháp này có thể trở thành một “người theo sau nhanh” hiệu quả.

67e4112a63e6b0b27fc8ce9c_frame-3.jpg
Hai startup là Flower AI và Vana đã hợp tác tạo ra mô hình ngôn ngữ lớn mới mang tên Collective-1, không cần đến TTDL mà sử dụng các GPU phân bố khắp thế giới.

Mirco Musolesi, nhà khoa học máy tính tại Đại học College London, nhấn mạnh lợi ích lớn nhất của phương pháp này là khả năng khai thác các loại dữ liệu mới, đặc biệt là dữ liệu nhạy cảm về quyền riêng tư trong các lĩnh vực như y tế và tài chính.

Ông cho rằng: “Việc mở rộng phương pháp này lên các mô hình tiên tiến sẽ cho phép ngành AI tận dụng lượng dữ liệu phi tập trung khổng lồ mà không gặp rủi ro từ việc tập trung dữ liệu”.

Dù đầy hứa hẹn, phương pháp phân tán vẫn đối mặt với thách thức. Quá trình huấn luyện phân tán chậm hơn so với TTDL truyền thống do phụ thuộc vào kết nối Internet có tốc độ và độ ổn định thay đổi. Ngoài ra, việc quản lý dữ liệu riêng tư từ người dùng đòi hỏi các cơ chế bảo mật chặt chẽ và khung pháp lý rõ ràng để đảm bảo quyền lợi của người đóng góp.

Tuy nhiên, tiềm năng của phương pháp này là rất lớn. Nó không chỉ giúp các tổ chức nhỏ hơn tham gia cuộc đua AI mà còn cho phép các quốc gia thiếu hạ tầng công nghệ cao hợp tác để xây dựng các mô hình mạnh mẽ. Hơn nữa, việc sử dụng dữ liệu riêng tư mở ra cơ hội tạo ra các mô hình AI phù hợp hơn với nhu cầu địa phương, từ chăm sóc sức khỏe đến giáo dục.

Sự ra đời của Collective-1 đánh dấu một bước tiến quan trọng trong việc định hình lại cách xây dựng AI. Bằng cách kết hợp huấn luyện phân tán với dữ liệu công khai và riêng tư, Flower AI và Vana đang mở đường cho một tương lai nơi các mô hình AI tiên tiến không còn là độc quyền của các gã khổng lồ công nghệ.

Với các kế hoạch mở rộng quy mô, phương pháp này có thể mang lại cơ hội cho các công ty nhỏ, trường đại học, và các quốc gia đang phát triển, đồng thời đặt ra những câu hỏi mới về quản trị và cạnh tranh trong ngành AI./.

Bài liên quan
Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
Xây dựng mô hình AI không cần trung tâm dữ liệu: Cuộc cách mạng mới trong phát triển AI toàn cầu
POWERED BY ONECMS - A PRODUCT OF NEKO