Chuyển động ICT

Mỹ lo ngại bị "sao chép" công nghệ AI: DeepSeek có vi phạm sở hữu trí tuệ?

Tâm An 30/01/2025 19:30

Mỹ đang lo ngại mô hình DeepSeek có thể đã hưởng lợi từ một phương pháp được cho là “sao chép” những tiến bộ của các đối thủ cạnh tranh ở Mỹ, được gọi là "distillation" (tạm dịch: chiết xuất).

Đây là kỹ thuật cho phép các nhà phát triển sử dụng đầu ra từ các mô hình AI sẵn có để huấn luyện một mô hình mới với chi phí và thời gian thấp hơn đáng kể.

deepseek.jpg

Theo các giám đốc điều hành và nhà đầu tư tại Thung lũng Silicon, phương pháp này - trong đó một hệ thống AI học hỏi từ một hệ thống AI khác - rất khó để kiểm soát và ngăn chặn.

Vừa qua, DeepSeek đã gây “chấn động” ngành công nghệ với một mô hình AI có khả năng cạnh tranh với các gã khổng lồ của Mỹ như OpenAI nhưng lại hoạt động với chi phí thấp hơn nhiều. Đáng chú ý, công ty có trụ sở tại Trung Quốc này còn công khai mã nguồn miễn phí.

Một số chuyên gia công nghệ tin rằng mô hình của DeepSeek có thể đã “học hỏi” từ các mô hình AI của Mỹ để đạt được bước tiến của mình. Kỹ thuật "chiết xuất" cho phép sử dụng một mô hình AI cũ hơn, mạnh hơn để đánh giá chất lượng đầu ra của một mô hình mới hơn, qua đó truyền đạt hiệu quả các kiến thức của mô hình cũ.

Điều này đồng nghĩa với việc DeepSeek có thể đã hưởng lợi từ hàng loạt tài nguyên tính toán và thời gian phát triển mà các công ty Mỹ đã đầu tư, nhưng không phải gánh chịu các chi phí tương ứng.

Mặc dù phương pháp này đã được sử dụng rộng rãi trong nghiên cứu AI, nhưng nó lại vi phạm các điều khoản dịch vụ của một số mô hình AI hàng đầu do các công ty công nghệ Mỹ phát triển trong những năm gần đây, bao gồm cả OpenAI.

Lo ngại của Mỹ về DeepSeek

Phát ngôn viên của OpenAI chia sẻ với Reuters rằng họ biết về việc các công ty có trụ sở tại Trung Quốc đang cố gắng sao chép các mô hình AI của Mỹ bằng cách sử dụng kỹ thuật “chiết xuất” và công ty cũng đang xem xét liệu DeepSeek có sử dụng các mô hình của mình một cách không phù hợp hay không

Howard Lutnick, ứng cử viên cho vị trí Bộ trưởng Thương mại trong chính quyền Tổng thống Donald Trump, người sẽ giám sát các biện pháp kiểm soát xuất khẩu đối với công nghệ AI trong tương lai, đã phát biểu trước Thượng viện Mỹ trong phiên điều trần mới đây rằng DeepSeek có thể đã sử dụng công nghệ AI của Mỹ một cách không hợp pháp và cam kết sẽ áp đặt các hạn chế.

"Tôi không tin rằng DeepSeek hoạt động minh bạch và tuân thủ tất cả các quy định. Điều đó thật vô lý", Lutnick nhấn mạnh. "Tôi sẽ thực hiện các biện pháp hạn chế nghiêm ngặt để đảm bảo Mỹ duy trì vị thế dẫn đầu".

Trả lời phỏng vấn Đài Fox News mới đây, ông David Sacks, cố vấn về vấn đề AI và tiền điện tử của chính quyền Tổng thống Mỹ Donald Trump, cũng cho rằng "có khả năng" DeepSeek đã vi phạm quyền sở hữu trí tuệ của OpenAI.

DeepSeek hiện vẫn chưa đưa ra phản hồi về những cáo buộc này.

OpenAI khẳng định sẽ hợp tác với Chính phủ Mỹ để bảo vệ công nghệ của Mỹ, song chưa tiết lộ cụ thể các biện pháp thực hiện. "Với tư cách là nhà phát triển AI hàng đầu, chúng tôi đang áp dụng các biện pháp bảo vệ tài sản trí tuệ, bao gồm một quy trình kiểm soát chặt chẽ những tính năng AI tiên tiến nào được đưa vào các mô hình công khai", đại diện OpenAI tuyên bố.

Washington lo ngại công nghệ Mỹ có thể được khai thác để thúc đẩy ngành AI nội địa, tương tự như những gì đã xảy ra trong ngành công nghiệp bán dẫn trước đây. Mỹ từng áp đặt các hạn chế nghiêm ngặt đối với xuất khẩu chip và thiết bị sản xuất sang Trung Quốc và hiện đang xem xét áp dụng các biện pháp tương tự đối với một số công nghệ mã nguồn mở.

Khó khăn khi ngăn "chiết xuất" và DeepSeek có vi phạm sở hữu trí tuệ?

Các chuyên gia công nghệ nhận định việc ngăn chặn "chiết xuất" trong AI có thể phức tạp hơn so với những gì người ta tưởng.

Một trong những điểm đáng chú ý của DeepSeek là họ đã chứng minh rằng chỉ cần một lượng nhỏ dữ liệu đầu ra - chưa đến một triệu mẫu - từ một mô hình AI lớn và mạnh hơn cũng có thể giúp cải thiện đáng kể hiệu suất của một mô hình nhỏ hơn.

Với những sản phẩm AI phổ biến như ChatGPT có hàng trăm triệu người dùng, việc phát hiện ra một lượng dữ liệu nhỏ như vậy có thể rất khó khăn. Hơn nữa, một số mô hình như Llama của Meta hay các sản phẩm của startup Mistral (Pháp) có thể được tải xuống miễn phí và sử dụng trong các trung tâm dữ liệu tư nhân. Điều này khiến cho việc giám sát và phát hiện vi phạm điều khoản dịch vụ trở nên khó khăn.

“Không thể ngăn chặn hoàn toàn việc “chiết xuất” khi có các mô hình nguồn mở như Mistral và Llama. Chúng sẵn có cho tất cả mọi người. Thậm chí, người ta còn có thể tiếp cận mô hình của OpenAI thông qua các khách hàng của họ", Umesh Padval, Giám đốc điều hành tại Thomvest Ventures, nhận định.

Phát ngôn viên của Meta chia sẻ với Reuters rằng giấy phép sử dụng mô hình Llama yêu cầu người dùng phải tiết lộ thông tin nếu họ sử dụng mô hình này cho mục đích chiết xuất. Trong khi đó, DeepSeek cũng công bố trong một nghiên cứu rằng họ đã sử dụng Llama cho một số phiên bản mô hình của mình đã công bố trong tháng này, nhưng không đề cập đến việc liệu họ có từng sử dụng các mô hình của Meta trước đó hay không. Khi được hỏi về khả năng DeepSeek vi phạm điều khoản dịch vụ, người phát ngôn của Meta từ chối bình luận.

Một nguồn tin thân cận với một phòng thí nghiệm AI lớn cho biết cách duy nhất để hạn chế các công ty như DeepSeek thu thập các mô hình là áp dụng các yêu cầu xác minh khách hàng nghiêm ngặt, tương tự như cách các công ty tài chính xác định khách hàng của họ. Tuy nhiên, hiện chưa có quy định nào như vậy được ban hành. Trước đây, chính quyền cựu Tổng thống Mỹ Joe Biden đã đề xuất các biện pháp này, nhưng chưa rõ liệu chính quyền ông Donald Trump có tiếp tục ủng hộ hay không.

Jonathan Ross, CEO của Groq - một công ty điện toán AI chuyên lưu trữ các mô hình AI trên nền tảng đám mây, đã quyết định chặn tất cả địa chỉ IP từ Trung Quốc nhằm ngăn các công ty nước này tiếp cận mô hình AI do công ty lưu trữ.

"Tuy nhiên, điều đó vẫn chưa đủ, vì người ta luôn có cách vượt qua các rào cản", Ross nói. "Chúng tôi có một số ý tưởng để ngăn điều này, nhưng đây vẫn là một cuộc chơi “mèo vờn chuột”. Tôi không biết đâu là giải pháp tối ưu. Nếu ai đó tìm ra, hãy cho chúng tôi biết - chúng tôi sẽ áp dụng ngay".

Trong khi đó, Naveen Rao, Phó Chủ tịch AI tại Databricks có trụ sở tại San Francisco cho biết việc học hỏi từ các đối thủ là "điều bình thường" trong ngành AI. Naveen Rao ví điều này giống như cách các nhà sản xuất ô tô mua rồi kiểm tra động cơ của nhau.

"Công bằng mà nói, tình trạng này xảy ra trong mọi ngành công nghiệp. Cạnh tranh là thực tế, và khi thông tin có thể khai thác, người ta sẽ khai thác nó để giành lợi thế", Rao nói. "Chúng tôi đều cố gắng tuân thủ quy định đạo đức, nhưng đồng thời cũng đang cạnh tranh"./.

Theo Reuters
Copy Link
Bài liên quan
Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
Mỹ lo ngại bị "sao chép" công nghệ AI: DeepSeek có vi phạm sở hữu trí tuệ?
POWERED BY ONECMS - A PRODUCT OF NEKO