Chuyển động ICT

Meta tiết lộ Voicebox AI tái tạo giọng nói bạn bè và người thân

Hoàng Linh 09:10 21/06/2023

Bước đột phá công nghệ đã được Meta công bố thông qua một bài báo. Mặc dù sản phẩm chưa được phổ biến rộng rãi, nhưng bạn có thể nghe các bản trình diễn (demo).

Khi các chatbot AI và trình tạo nghệ thuật dường như trở nên phổ biến hơn theo từng phút, một số công ty nổi bật nhất trong lĩnh vực đang cố gắng duy trì vị thế bằng các công cụ của riêng họ. Meta vừa giới thiệu Voicebox, một trình tạo giọng nói thông minh nhân tạo, dựa trên văn bản mạnh mẽ đến mức Meta tuyên bố vượt trội hơn tất cả các model hiện có.

voice-box.png
Ảnh: Getty Images

Voicebox đủ mạnh để tạo giọng nói dễ dàng như ChatGPT có thể tạo văn bản và Bing hoặc Dall-E 2 có thể tạo các hình ảnh. Mặc dù hệ thống chưa được phổ biến rộng rãi cho công chúng sử dụng, nhưng Meta đã cung cấp các bản trình diễn có thể truy cập được cho bất kỳ ai quan tâm đến việc tìm hiểu thêm về Voicebox.

Ví dụ, hệ thống này có thể được sử dụng trong chỉnh sửa âm thanh bởi người tạo và biên tập viên nội dung, vì khả năng tạo giọng nói của nó tạo ra các clip âm thanh rất tự nhiên. Nhưng Voicebox cũng đủ linh hoạt để lọc tiếng ồn từ các đoạn thoại một cách thông minh, chẳng hạn như lọc tiếng ồn và tái tạo giọng nói mà không bị lỡ nhịp.

Một trong những khả năng mà Voicebox thể hiện là có thể khớp với kiểu âm thanh của mẫu và tạo các clip chuyển văn bản thành giọng nói. Về cơ bản, người dùng khiếm thị có thể cung cấp cho Voicebox một đoạn âm thanh của một người bạn trong vòng hai giây và có thể đọc tin nhắn đã viết của người bạn đó bằng giọng nói của họ bằng AI.

Công cụ AI thế hệ mới có thể giải quyết các nhiệm vụ thông qua học theo ngữ cảnh, vì vậy, công cụ này có thể xử lý văn bản chưa từng được cung cấp trước đây và tạo chính xác ngữ cảnh cũng như cách diễn đạt giống như cách một người sẽ đọc văn bản đó bằng cách sử dụng kiến thức hiện có để tìm hiểu và giải quyết những thách thức mới.

Ý nghĩa đạo đức và pháp lý của công cụ đột phá này không dễ bị bác bỏ. Bất kỳ ai cũng có thể tạo các đoạn âm thanh bằng cách sử dụng bản ghi âm giọng nói của một người mà không được phép và yêu cầu họ nói bất cứ điều gì họ muốn.

Trong bài báo đã xuất bản, Meta tuyên bố một mô hình phân loại nhị phân có thể phân biệt giữa giọng nói trong thế giới thực và giọng nói mà Voicebox tạo ra.

Meta đã đào tạo Vociebox trên 60.000 giờ sách nói tiếng Anh và 50.000 giờ sách nói đa ngôn ngữ bằng 6 ngôn ngữ để có hiệu suất tối ưu. Quá trình đào tạo của Voicebox cho phép thực hiện chuyển văn bản thành giọng nói đa ngôn ngữ mà không cần đào tạo, khử nhiễu giọng nói, tạo kiểu, chỉnh sửa và tạo các mẫu giọng nói đa dạng.

Trong một bài báo được xuất bản bởi Meta AI, công ty tuyên bố có thể tạo ra các mẫu âm thanh đa dạng nhanh hơn 20 lần so với VALL-E của Microsoft và dễ hiểu hơn.

Ngoài việc nhanh hơn và mắc ít lỗi hơn so với các đối thủ cạnh tranh, Meta tuyên bố Vociebox có thể chuyển đổi văn bản viết thành lời nói bằng một hoặc nhiều ngôn ngữ mà không cần được đào tạo riêng cho từng ngôn ngữ.

So với mô hình tiên tiến trước đây, YourTTS, Voicebox đã giảm tỷ lệ lỗi từ trung bình từ 10,9% xuống 5,2%, cũng như tăng độ tương tự của âm thanh từ 0,335 lên 0,481./.

Theo zdnet, voicebot
Copy Link
Bài liên quan
  • Singapore đầu tư vào cơ sở hạ tầng và quản trị AI
    Bộ trưởng Bộ Thông tin và Truyền thông Singapore Josephine Teo vừa phát biểu về các khoản đầu tư của Singapore vào cơ sở hạ tầng số và chia sẻ các ý tưởng quản trị công nghệ trí tuệ nhân tạo (AI) cũng như nhu cầu tăng cường quan hệ đối tác nước ngoài.
Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
  • Khai thác dữ liệu phục vụ chỉ đạo, điều hành tại trung tâm IOC: Kinh nghiệm của Bình Phước
    Xác định dữ liệu là nguồn tài nguyên quý trong kỷ nguyên số - một trong những yếu tố quan trọng quyết định sự thành công của quá trình chuyển đổi số (CĐS), tỉnh Bình Phước đã sớm tập trung quan tâm tạo lập, khai thác, sử dụng, tăng cường chia sẻ, kết nối dữ liệu số cùng với việc thành lập IOC và những kết quả bước đầu thu được rất đáng ghi nhận.
  • Mỹ phạt nhà mạng vì chia sẻ vị trí của người dùng
    Chính phủ Mỹ đã đưa ra mức phạt hàng triệu USD đối với các nhà mạng AT&T, Sprint, T-Mobile và Verizon sau một cuộc điều tra cho thấy các nhà mạng lớn của nước này đã chia sẻ bất hợp pháp dữ liệu cá nhân của thuê bao mà không có sự đồng ý của họ.
  • 5 cách để nâng cao bảo mật khi sử dụng trình duyệt Chrome
    Trình duyệt Chrome đang được rất nhiều người tin dùng bởi độ ổn định và khả năng bảo mật. Tuy nhiên, sự phổ biến này cũng khiến nó trở thành mục tiêu của tin tặc.
  • Các công cụ bảo mật đám mây dựa trên AI
    Ngày nay, AI tiên tiến đang được đưa vào sử dụng ở mọi loại hình doanh nghiệp (AI). Một loạt các nhà cung cấp bảo mật bên thứ ba đã phát hành các công cụ bảo mật đám mây dưới sự hỗ trợ của AI. Dường như đây là một trong những xu hướng nóng nhất trong ngành.
  • Những người làm báo từ rừng về phố
    Ngày 30/4/1975, trong những cánh Giải phóng quân từ khắp nẻo tiến về Sài Gòn, có cả một đội quân nhà báo xuất phát từ các chiến khu hoặc hành quân theo các binh chủng, đã kịp thời có mặt, chứng kiến giây phút trọng đại: Giải phóng hoàn toàn miền nam, thống nhất đất nước.
  • Oracle đầu tư mạnh vào AI tạo sinh, đáp ứng xu hướng "chủ quyền dữ liệu"
    Nhà cung cấp dịch vụ cơ sở hạ tầng đám mây của Hoa Kỳ Oracle đang tăng cường các tính năng trí tuệ nhân tạo (AI) tạo sinh của mình khi cạnh tranh trên thị trường điện toán đám mây (ĐTĐM) ngày càng khốc liệt và ngày càng có nhiều công ty nhảy vào lĩnh vực AI.
  • Mỹ lập hội đồng khuyến nghị ứng dụng AI an toàn cho hạ tầng trọng yếu
    Chính phủ Mỹ đã yêu cầu các công ty trí tuệ nhân tạo (AI) đưa ra khuyến nghị cách sử dụng công nghệ AI để bảo vệ các hãng hàng không, dịch vụ công cộng và cơ sở hạ tầng trọng yếu khác, đặc biệt là chống các cuộc tấn công sử dụng AI.
  • Làm gì để phát triển tài năng chuyển đổi?
    Partha Srinivasa, Giám đốc CNTT (CIO) của nhà cung cấp bảo hiểm tài sản và tai nạn Erie có trụ sở tại Pennsylvania, Mỹ đã chia sẻ về cách tiếp cận của ông trong việc xây dựng đội ngũ nhân viên có tinh thần chuyển đổi.
  • Báo chí ở mặt trận Điện Biên Phủ
    Chiến dịch Điện Biên Phủ là cuộc “hội quân” của cả nước. Trong cuộc “hội quân” lịch sử đó có sự tham gia và đóng góp không nhỏ của “đội quân báo chí”.
  • Những ấn phẩm đặc biệt kỷ niệm 70 năm chiến thắng Điện Biên Phủ
    Bộ ấn phẩm kỉ niệm 70 năm chiến thắng Điện Biên Phủ do Nhà xuất bản (NXB) Kim Đồng ấn hành, góp phần nhắc nhớ thế hệ trẻ về một thời hoa lửa, tự hào về khí phách Việt Nam, biết ơn các thế hệ cha anh đi trước, và trân trọng nền hòa bình mà chúng ta đang sống hôm nay.
Meta tiết lộ Voicebox AI tái tạo giọng nói bạn bè và người thân
POWERED BY ONECMS - A PRODUCT OF NEKO