Kỹ sư trẻ sáng tác âm nhạc bằng công nghệ AI

Châu Anh| 12/07/2021 13:50
Theo dõi ICTVietnam trên

Vừa là kỹ sư công nghệ thông tin, vừa có khả năng sáng tác và biểu diễn âm nhạc, chàng trai trẻ sinh năm 1994 Nguyễn Hoàng Bảo Đại thường được mọi người gọi là “nhạc sĩ biết code”.

Mới đây, anh đã mang đến niềm tự hào cho cộng đồng công nghệ thông tin (IT) Việt khi trở thành người Việt Nam thứ ba được Google công nhận là Google Developer Expert (chuyên gia phát triển của Google) của ngành khoa học máy tính với mô hình sáng tác âm nhạc bằng công nghệ trí tuệ nhân tạo (AI).

Sau khi theo học ngành khoa học máy tính tại Trường đại học Khoa học tự nhiên TP Hồ Chí Minh, Nguyễn Hoàng Bảo Đại trở thành kỹ sư nghiên cứu về AI trong lĩnh vực xử lý ngôn ngữ tự nhiên và thị giác máy tính, song anh chưa bao giờ từ bỏ đam mê sáng tác âm nhạc đã theo mình từ nhỏ.

 Video ca nhạc “Dân IT” do anh sáng tác và biểu diễn đã nhận được sự yêu thích của đông đảo người làm công nghệ với hàng chục nghìn lượt xem trên YouTube. Bảo Đại cho biết, anh có thói quen sáng tác giai điệu trước rồi mới đến hợp âm và lời. Đây cũng là khâu khiến anh mất nhiều thời gian và tâm huyết nhất bởi bản thân quan niệm một ca khúc hay trước hết phải có những giai điệu đẹp. Nhiều bài hát mất tới cả tháng trời anh mới xong giai điệu vì viết xong lại chỉnh, thành hình lại sửa… Từ thực tế này, chàng kỹ sư trẻ đã lóe lên ý định dùng chính những kiến thức chuyên môn được học về trí tuệ nhân tạo để hỗ trợ thực hiện đam mê âm nhạc của mình. “Tôi nghĩ AI có thể vẽ tranh thì cũng có thể viết nhạc. Vì thế, tôi dự định làm một mô hình AI viết nhạc cho người Việt theo thị hiếu của người Việt” - Bảo Đại chia sẻ.

Đầu năm 2017, anh chính thức bắt tay vào nghiên cứu. Sau hai năm mày mò tìm hiểu, triển khai, mô hình AI sáng tác âm nhạc đã ra đời và gây bất ngờ cho bất cứ ai biết đến với khả năng có thể viết mười giai điệu bài hát chỉ trong một giây. Bằng mô hình này, người sáng tác chỉ cần đưa ra vài nốt nhạc, hệ thống sẽ xử lý dữ liệu, chuyển giai điệu đầu vào thành véc-tơ nhiều số và đầu ra sẽ là những giai điệu dài hơn. Thuật toán ngẫu nhiên của AI cho phép hệ thống tạo ra những phiên bản giai điệu hoàn toàn khác nhau để người nghe lựa chọn, từ đó tiếp tục điều chỉnh theo ý muốn. Mô hình này giúp các nhạc sĩ có thể rút ngắn công đoạn làm giai điệu bằng cách đưa ra những gợi ý để khơi gợi cảm hứng, từ đó nhạc sĩ có nhiều thời gian hơn để trau chuốt cho những khâu còn lại như hòa âm, phối khí, viết lời.

Bảo Đại cho hay, trên thế giới cũng đã có nghiên cứu về mô hình AI trong âm nhạc, song những mô hình này chủ yếu hướng đến sáng tác nhạc cổ điển, khác nhiều so với thị hiếu nghe nhạc của người Việt Nam. Vì thế, muốn có một mô hình sáng tác âm nhạc bằng trí tuệ nhân tạo với những bản nhạc nhẹ, pop ballad dễ nghe, phù hợp với người Việt thì anh buộc phải xây dựng những thuật toán riêng. Thách thức lớn nhất mà chàng “nhạc sĩ kỹ sư” gặp phải là việc tìm kiếm nguồn dữ liệu đầu vào sao cho đủ lớn để có thể huấn luyện mô hình. Muốn mô hình có khả năng sáng tác nhạc trẻ thì phải có nguồn dữ liệu về nhạc trẻ. Tuy nhiên, dữ liệu này không thể lấy từ những bài hát trên YouTube hay các trang nghe nhạc vì đây là những sản phẩm đầu cuối đã hoàn chỉnh, trong khi hệ thống chỉ có thể đọc, hiểu những dữ liệu đầu vào dưới dạng file midi. Để giải được bài toán này, Bảo Đại chỉ còn cách dành ra nhiều ngày để tự đánh và thu lại giai điệu các bài nhạc trẻ của Việt Nam trên đàn pi-a-nô điện và xử lý chúng thành dạng midi. Trong số 30.000 file bài hát mà mô hình đang sử dụng, chỉ có khoảng 5.000 bài Bảo Đại tìm được ở những diễn đàn âm nhạc do bạn bè chia sẻ, 25.000 bài còn lại do anh tự đánh để chuẩn hóa dữ liệu. Có những ngày anh thức thâu đêm suốt sáng để đánh lại 200 đến 300 bài hát…

Cùng với đó là thách thức về hệ thống vận hành, bởi những máy tính để bàn hay laptop thông thường không đủ năng lượng tính toán để có thể huấn luyện trí tuệ nhân tạo, còn nếu đầu tư cả một dàn máy thì quá sức về kinh phí với một chàng kỹ sư trẻ. Vậy là dồn hết vốn liếng, Đại lựa chọn phương thức thuê máy, sử dụng điện toán đám mây và trả phí theo nhu cầu sử dụng. Trong quá trình xây dựng mô hình, anh mong muốn có được những người bạn đồng hành vừa hiểu về âm nhạc, vừa có kỹ năng về AI để cùng chia sẻ, nhưng tìm được người hội đủ những yếu tố này dường như quá khó. Một mình phải cặm cụi “chinh chiến” khiến mọi việc có phần gian nan hơn, song bù lại, thành quả nghiên cứu của chàng kỹ sư trẻ đã thật sự khiến mọi người nể phục.

Đặt câu hỏi về việc liệu tính ưu việt của mô hình làm nhạc bằng AI có làm tăng tính phụ thuộc vào công nghệ, hạn chế khả năng sáng tạo âm nhạc của nhạc sĩ hay không, Bảo Đại thẳng thắn khẳng định bản chất của mô hình này là giúp người sáng tác tiết kiệm được thời gian làm nhạc thông qua quá trình tham chiếu, lựa chọn chứ không phải công cụ toàn năng để thay thế công việc của người nhạc sĩ. Mỗi sản phẩm âm nhạc phải mang phong cách, cảm xúc và dấu ấn cá nhân riêng mới có chỗ đứng, cho nên không thể thiếu vai trò sáng tạo chủ đạo của người làm âm nhạc. Bảo Đại cho biết thời gian tới, để tối ưu hóa các tính năng của mô hình, anh sẽ tiếp tục nghiên cứu để phát triển thêm khả năng làm hợp âm, viết lời, đưa mô hình trở thành trợ thủ đắc lực của người sáng tạo âm nhạc.

Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
  • Khai thác dữ liệu phục vụ chỉ đạo, điều hành tại trung tâm IOC: Kinh nghiệm của Bình Phước
    Xác định dữ liệu là nguồn tài nguyên quý trong kỷ nguyên số - một trong những yếu tố quan trọng quyết định sự thành công của quá trình chuyển đổi số (CĐS), tỉnh Bình Phước đã sớm tập trung quan tâm tạo lập, khai thác, sử dụng, tăng cường chia sẻ, kết nối dữ liệu số cùng với việc thành lập IOC và những kết quả bước đầu thu được rất đáng ghi nhận.
  • Mỹ phạt nhà mạng vì chia sẻ vị trí của người dùng
    Chính phủ Mỹ đã đưa ra mức phạt hàng triệu USD đối với các nhà mạng AT&T, Sprint, T-Mobile và Verizon sau một cuộc điều tra cho thấy các nhà mạng lớn của nước này đã chia sẻ bất hợp pháp dữ liệu cá nhân của thuê bao mà không có sự đồng ý của họ.
  • 5 cách để nâng cao bảo mật khi sử dụng trình duyệt Chrome
    Trình duyệt Chrome đang được rất nhiều người tin dùng bởi độ ổn định và khả năng bảo mật. Tuy nhiên, sự phổ biến này cũng khiến nó trở thành mục tiêu của tin tặc.
  • Các công cụ bảo mật đám mây dựa trên AI
    Ngày nay, AI tiên tiến đang được đưa vào sử dụng ở mọi loại hình doanh nghiệp (AI). Một loạt các nhà cung cấp bảo mật bên thứ ba đã phát hành các công cụ bảo mật đám mây dưới sự hỗ trợ của AI. Dường như đây là một trong những xu hướng nóng nhất trong ngành.
  • Những người làm báo từ rừng về phố
    Ngày 30/4/1975, trong những cánh Giải phóng quân từ khắp nẻo tiến về Sài Gòn, có cả một đội quân nhà báo xuất phát từ các chiến khu hoặc hành quân theo các binh chủng, đã kịp thời có mặt, chứng kiến giây phút trọng đại: Giải phóng hoàn toàn miền nam, thống nhất đất nước.
  • Oracle đầu tư mạnh vào AI tạo sinh, đáp ứng xu hướng "chủ quyền dữ liệu"
    Nhà cung cấp dịch vụ cơ sở hạ tầng đám mây của Hoa Kỳ Oracle đang tăng cường các tính năng trí tuệ nhân tạo (AI) tạo sinh của mình khi cạnh tranh trên thị trường điện toán đám mây (ĐTĐM) ngày càng khốc liệt và ngày càng có nhiều công ty nhảy vào lĩnh vực AI.
  • Mỹ lập hội đồng khuyến nghị ứng dụng AI an toàn cho hạ tầng trọng yếu
    Chính phủ Mỹ đã yêu cầu các công ty trí tuệ nhân tạo (AI) đưa ra khuyến nghị cách sử dụng công nghệ AI để bảo vệ các hãng hàng không, dịch vụ công cộng và cơ sở hạ tầng trọng yếu khác, đặc biệt là chống các cuộc tấn công sử dụng AI.
  • Làm gì để phát triển tài năng chuyển đổi?
    Partha Srinivasa, Giám đốc CNTT (CIO) của nhà cung cấp bảo hiểm tài sản và tai nạn Erie có trụ sở tại Pennsylvania, Mỹ đã chia sẻ về cách tiếp cận của ông trong việc xây dựng đội ngũ nhân viên có tinh thần chuyển đổi.
  • Báo chí ở mặt trận Điện Biên Phủ
    Chiến dịch Điện Biên Phủ là cuộc “hội quân” của cả nước. Trong cuộc “hội quân” lịch sử đó có sự tham gia và đóng góp không nhỏ của “đội quân báo chí”.
  • Những ấn phẩm đặc biệt kỷ niệm 70 năm chiến thắng Điện Biên Phủ
    Bộ ấn phẩm kỉ niệm 70 năm chiến thắng Điện Biên Phủ do Nhà xuất bản (NXB) Kim Đồng ấn hành, góp phần nhắc nhớ thế hệ trẻ về một thời hoa lửa, tự hào về khí phách Việt Nam, biết ơn các thế hệ cha anh đi trước, và trân trọng nền hòa bình mà chúng ta đang sống hôm nay.
Kỹ sư trẻ sáng tác âm nhạc bằng công nghệ AI
POWERED BY ONECMS - A PRODUCT OF NEKO