Khi YouTube trở thành “mỏ vàng” dữ liệu cho AI của Google
Chuyển động ICT - Ngày đăng : 11:55, 23/06/2025
Khi YouTube trở thành “mỏ vàng” dữ liệu cho AI của Google
YouTube không chỉ là nền tảng chia sẻ video lớn nhất thế giới mà còn trở thành “mỏ vàng” dữ liệu quan trọng giúp Google phát triển các mô hình trí tuệ nhân tạo tiên tiến như Veo 3 và Gemini.
Tuy nhiên, việc sử dụng kho video khổng lồ này để huấn luyện AI đang dấy lên nhiều tranh cãi, khi nhiều nhà sáng tạo nội dung chưa nhận thức đầy đủ về quyền lợi và sự khai thác từ phía Google.

Veo 3, mô hình tạo video bằng AI tiên tiến nhất của Google, đã chính thức ra mắt tại hội nghị Google I/O 2025. Đây là công cụ có khả năng tạo ra video chân thực với chất lượng điện ảnh, bao gồm cả âm thanh và lời thoại hoàn chỉnh.
Theo CNBC, Google đã sử dụng hàng nghìn video trong kho 20 tỷ video trên YouTube để huấn luyện các mô hình AI mới nhất của mình, bao gồm cả Gemini và Veo 3. Điều đáng chú ý là phần lớn người sáng tạo nội dung trên nền tảng này không hề biết rằng nội dung của họ đang được dùng để huấn luyện AI.
Dù Google chưa công bố cụ thể những video nào trong kho 20 tỷ video của YouTube đã được sử dụng, công ty khẳng định họ tuân thủ đầy đủ các thỏa thuận với người sáng tạo và các tổ chức truyền thông.
“Chúng tôi luôn sử dụng nội dung trên YouTube để cải thiện các sản phẩm của mình, và điều này vẫn tiếp tục với sự xuất hiện của AI. Chúng tôi hiểu rõ tầm quan trọng của việc bảo vệ quyền lợi người sáng tạo, đó là lý do chúng tôi đầu tư vào các công cụ bảo vệ mạnh mẽ, giúp họ kiểm soát hình ảnh và danh tính trong kỷ nguyên AI – cam kết này sẽ được chúng tôi duy trì lâu dài”, người phát ngôn của Google nhấn mạnh.
Người sáng tạo nội dung trên YouTube có thể từ chối việc các công ty như Amazon, Nvidia hay Apple sử dụng nội dung của họ để huấn luyện AI. Tuy nhiên, họ không có quyền từ chối nếu nội dung đó được sử dụng bởi chính Google.
Dù YouTube trước đó đã công khai các điều khoản liên quan, nhiều người sáng tạo và tổ chức truyền thông vẫn chưa hoàn toàn nhận thức được rằng Google có quyền sử dụng thư viện video khổng lồ trên nền tảng này để huấn luyện các mô hình AI.
Điều khoản dịch vụ của YouTube nêu rõ rằng “bằng cách cung cấp nội dung cho Dịch vụ, bạn cấp cho YouTube một giấy phép không độc quyền, toàn cầu, miễn phí bản quyền, có thể cấp phép lại và chuyển nhượng để sử dụng nội dung đó”. Trong một bài đăng trên blog vào tháng 9/2024, YouTube cũng xác nhận rằng nội dung người dùng có thể được sử dụng để “cải thiện trải nghiệm sản phẩm… bao gồm thông qua các ứng dụng học máy và AI”.
Nhiều nhà sáng tạo độc lập bày tỏ lo ngại rằng nội dung của họ đang bị khai thác để huấn luyện các mô hình AI - những công cụ vốn có thể trở thành đối thủ cạnh tranh hoặc thậm chí thay thế chính họ trong tương lai. Nội dung do AI tạo ra cũng dẫn đến sự xuất hiện của các mô hình khác có thể cạnh tranh trực tiếp với những người sáng tạo nội dung, và họ cho rằng họ không được ghi nhận hay đền bù thỏa đáng cho những đóng góp của mình.
Tuần trước, The Walt Disney Company và Universal (thuộc Comcast) thông báo đã đệ đơn kiện bản quyền đối với Midjourney – công cụ tạo ảnh bằng AI, với cáo buộc sao chép và phân phối trái phép những nhân vật mang tính biểu tượng nhất của họ.
Các hãng phim mô tả Midjourney như một “hố không đáy của sự đạo văn”, cho rằng công cụ này đã tái tạo và kiếm tiền từ các hình ảnh có bản quyền mà không có sự cho phép.
Chỉ vài ngày sau khi vụ kiện được công bố, phòng thí nghiệm AI đứng sau Midjourney đã cho ra mắt mô hình tạo video từ văn bản đầu tiên của mình mang tên V1.
Theo giới thiệu, V1 có khả năng chuyển đổi hình ảnh tĩnh thành video dài 5 giây do AI tạo ra, và được đánh giá có độ chân thực cùng tính sáng tạo cao và chi phí thấp. Người dùng có thể tải lên hình ảnh của riêng mình hoặc sử dụng hình ảnh do Midjourney tạo để tạo hoạt ảnh.
V1 ra đời cạnh tranh trực tiếp với các mô hình AI tạo video khác như Sora của OpenAI, Gen 4 của Runway, Firefly của Adobe và Veo 3 của Google. Midjourney cho biết AI của họ sẽ "đặc biệt phục vụ những người sáng tạo"./.