Kỹ sư trẻ sáng tác âm nhạc bằng công nghệ AI

Châu Anh| 12/07/2021 13:50
Theo dõi ICTVietnam trên

Vừa là kỹ sư công nghệ thông tin, vừa có khả năng sáng tác và biểu diễn âm nhạc, chàng trai trẻ sinh năm 1994 Nguyễn Hoàng Bảo Đại thường được mọi người gọi là “nhạc sĩ biết code”.

Mới đây, anh đã mang đến niềm tự hào cho cộng đồng công nghệ thông tin (IT) Việt khi trở thành người Việt Nam thứ ba được Google công nhận là Google Developer Expert (chuyên gia phát triển của Google) của ngành khoa học máy tính với mô hình sáng tác âm nhạc bằng công nghệ trí tuệ nhân tạo (AI).

Sau khi theo học ngành khoa học máy tính tại Trường đại học Khoa học tự nhiên TP Hồ Chí Minh, Nguyễn Hoàng Bảo Đại trở thành kỹ sư nghiên cứu về AI trong lĩnh vực xử lý ngôn ngữ tự nhiên và thị giác máy tính, song anh chưa bao giờ từ bỏ đam mê sáng tác âm nhạc đã theo mình từ nhỏ.

 Video ca nhạc “Dân IT” do anh sáng tác và biểu diễn đã nhận được sự yêu thích của đông đảo người làm công nghệ với hàng chục nghìn lượt xem trên YouTube. Bảo Đại cho biết, anh có thói quen sáng tác giai điệu trước rồi mới đến hợp âm và lời. Đây cũng là khâu khiến anh mất nhiều thời gian và tâm huyết nhất bởi bản thân quan niệm một ca khúc hay trước hết phải có những giai điệu đẹp. Nhiều bài hát mất tới cả tháng trời anh mới xong giai điệu vì viết xong lại chỉnh, thành hình lại sửa… Từ thực tế này, chàng kỹ sư trẻ đã lóe lên ý định dùng chính những kiến thức chuyên môn được học về trí tuệ nhân tạo để hỗ trợ thực hiện đam mê âm nhạc của mình. “Tôi nghĩ AI có thể vẽ tranh thì cũng có thể viết nhạc. Vì thế, tôi dự định làm một mô hình AI viết nhạc cho người Việt theo thị hiếu của người Việt” - Bảo Đại chia sẻ.

Đầu năm 2017, anh chính thức bắt tay vào nghiên cứu. Sau hai năm mày mò tìm hiểu, triển khai, mô hình AI sáng tác âm nhạc đã ra đời và gây bất ngờ cho bất cứ ai biết đến với khả năng có thể viết mười giai điệu bài hát chỉ trong một giây. Bằng mô hình này, người sáng tác chỉ cần đưa ra vài nốt nhạc, hệ thống sẽ xử lý dữ liệu, chuyển giai điệu đầu vào thành véc-tơ nhiều số và đầu ra sẽ là những giai điệu dài hơn. Thuật toán ngẫu nhiên của AI cho phép hệ thống tạo ra những phiên bản giai điệu hoàn toàn khác nhau để người nghe lựa chọn, từ đó tiếp tục điều chỉnh theo ý muốn. Mô hình này giúp các nhạc sĩ có thể rút ngắn công đoạn làm giai điệu bằng cách đưa ra những gợi ý để khơi gợi cảm hứng, từ đó nhạc sĩ có nhiều thời gian hơn để trau chuốt cho những khâu còn lại như hòa âm, phối khí, viết lời.

Bảo Đại cho hay, trên thế giới cũng đã có nghiên cứu về mô hình AI trong âm nhạc, song những mô hình này chủ yếu hướng đến sáng tác nhạc cổ điển, khác nhiều so với thị hiếu nghe nhạc của người Việt Nam. Vì thế, muốn có một mô hình sáng tác âm nhạc bằng trí tuệ nhân tạo với những bản nhạc nhẹ, pop ballad dễ nghe, phù hợp với người Việt thì anh buộc phải xây dựng những thuật toán riêng. Thách thức lớn nhất mà chàng “nhạc sĩ kỹ sư” gặp phải là việc tìm kiếm nguồn dữ liệu đầu vào sao cho đủ lớn để có thể huấn luyện mô hình. Muốn mô hình có khả năng sáng tác nhạc trẻ thì phải có nguồn dữ liệu về nhạc trẻ. Tuy nhiên, dữ liệu này không thể lấy từ những bài hát trên YouTube hay các trang nghe nhạc vì đây là những sản phẩm đầu cuối đã hoàn chỉnh, trong khi hệ thống chỉ có thể đọc, hiểu những dữ liệu đầu vào dưới dạng file midi. Để giải được bài toán này, Bảo Đại chỉ còn cách dành ra nhiều ngày để tự đánh và thu lại giai điệu các bài nhạc trẻ của Việt Nam trên đàn pi-a-nô điện và xử lý chúng thành dạng midi. Trong số 30.000 file bài hát mà mô hình đang sử dụng, chỉ có khoảng 5.000 bài Bảo Đại tìm được ở những diễn đàn âm nhạc do bạn bè chia sẻ, 25.000 bài còn lại do anh tự đánh để chuẩn hóa dữ liệu. Có những ngày anh thức thâu đêm suốt sáng để đánh lại 200 đến 300 bài hát…

Cùng với đó là thách thức về hệ thống vận hành, bởi những máy tính để bàn hay laptop thông thường không đủ năng lượng tính toán để có thể huấn luyện trí tuệ nhân tạo, còn nếu đầu tư cả một dàn máy thì quá sức về kinh phí với một chàng kỹ sư trẻ. Vậy là dồn hết vốn liếng, Đại lựa chọn phương thức thuê máy, sử dụng điện toán đám mây và trả phí theo nhu cầu sử dụng. Trong quá trình xây dựng mô hình, anh mong muốn có được những người bạn đồng hành vừa hiểu về âm nhạc, vừa có kỹ năng về AI để cùng chia sẻ, nhưng tìm được người hội đủ những yếu tố này dường như quá khó. Một mình phải cặm cụi “chinh chiến” khiến mọi việc có phần gian nan hơn, song bù lại, thành quả nghiên cứu của chàng kỹ sư trẻ đã thật sự khiến mọi người nể phục.

Đặt câu hỏi về việc liệu tính ưu việt của mô hình làm nhạc bằng AI có làm tăng tính phụ thuộc vào công nghệ, hạn chế khả năng sáng tạo âm nhạc của nhạc sĩ hay không, Bảo Đại thẳng thắn khẳng định bản chất của mô hình này là giúp người sáng tác tiết kiệm được thời gian làm nhạc thông qua quá trình tham chiếu, lựa chọn chứ không phải công cụ toàn năng để thay thế công việc của người nhạc sĩ. Mỗi sản phẩm âm nhạc phải mang phong cách, cảm xúc và dấu ấn cá nhân riêng mới có chỗ đứng, cho nên không thể thiếu vai trò sáng tạo chủ đạo của người làm âm nhạc. Bảo Đại cho biết thời gian tới, để tối ưu hóa các tính năng của mô hình, anh sẽ tiếp tục nghiên cứu để phát triển thêm khả năng làm hợp âm, viết lời, đưa mô hình trở thành trợ thủ đắc lực của người sáng tạo âm nhạc.

Nổi bật Tạp chí Thông tin & Truyền thông
Đừng bỏ lỡ
  • Chuyển đổi số hướng tới phục vụ người dân trong kỷ nguyên mới
    Đất nước ta đang bắt đầu bước vào kỷ nguyên mới, kỷ nguyên vươn mình, kỷ nguyên thịnh vượng của dân tộc Việt Nam phát triển, giàu mạnh, kỷ nguyên của sự bứt phá, đổi mới mạnh mẽ, quyết liệt và cách mạng, dưới sự lãnh đạo của Đảng Cộng sản, hướng tới mục tiêu dân giàu, nước mạnh, xã hội xã hội chủ nghĩa, sánh vai với các cường quốc năm châu như Chủ tịch Hồ Chí Minh hằng mong đợi.
  • Gỡ điểm nghẽn khoán chi và thương mại hóa các kết quả nghiên cứu
    Ngày 17/2, Quốc hội thảo luận ở hội trường về Dự thảo Nghị quyết thí điểm một số chính sách tháo gỡ vướng mắc trong hoạt động khoa học, công nghệ và đổi mới sáng tạo.
  • Chiêu trò lừa đảo giả mạo ứng dụng thuế tiếp tục tái diễn
    Cục An toàn thông tin, Bộ TT&TT, vừa đưa ra cảnh báo về các thủ đoạn lừa đảo trực tuyến nổi bật trong tuần từ 10/2 - 16/2/2025). Trong đó, đặc biệt đáng chú ý là tình trạng một số đối tượng lừa đảo bằng hình thức gọi điện thoại, gửi tin nhắn đến người nộp thuế tự xưng là công chức thuế tại các chi cục thuế đề nghị cài đặt các ứng dụng của ngành thuế.
  • Đẩy mạnh hoạt động kinh doanh mảng SAP cho thị trường Nhật Bản
    Mới đây, FPT đã triển khai dự án FPT BTP Park với sự đồng hành của SAP Japan, công ty thành viên của SAP. Dự án này với mục tiêu mở rộng đội ngũ chuyên gia trong mảng này lên 1.000 người trong năm 2025 và 3.000 người tới năm 2027.‏
  • Các kỹ sư Trung Quốc sử dụng tre trong cây cầu vượt biển dài nhất thế giới như thế nào
    Nhóm nghiên cứu từ Viện nghiên cứu Nam Kinh, Trung Quốc đã phát triển các công nghệ xử lý tre thông minh, xanh hơn và bền hơn.
  • Ứng dụng hoạt hình 2D trong số hóa nội dung: Giải pháp tối ưu cho doanh nghiệp và giáo dục
    Trong bối cảnh công nghệ số phát triển mạnh mẽ, số hóa không chỉ là xu hướng mà còn là giải pháp thiết yếu giúp các tổ chức và doanh nghiệp truyền tải thông tin một cách hiệu quả và sáng tạo. Trong đó, video hoạt hình 2D đang trở thành công cụ đắc lực, giúp chuyển đổi những khái niệm phức tạp thành hình ảnh sinh động, dễ hiểu, tạo ra giá trị bền vững trong quản lý và kinh doanh. Mytoon tự hào là đơn vị chuyên cung cấp các giải pháp số hóa nội dung qua hoạt hình 2D, mang đến những sản phẩm sinh động, dễ hiểu và phù hợp với mọi đối tượng khán giả.
  • Ngã rẽ nào cho Meta
    Facebook đã khởi động kỷ nguyên truyền thông xã hội hiện đại vào đầu những năm 2000. Nhưng tham vọng mở rộng của công ty mẹ Meta trong thập kỷ qua không đạt được thành công như vậy. Tuy nhiên, công ty này vẫn đang cố gắng hiện thực hóa với sản phẩm mới nhất: robot hình người (humanoid robots).
  • Hàng nhập khẩu từ 1 triệu đồng trở xuống gửi qua chuyển phát nhanh quốc tế phải nộp VAT
    Theo Quyết định số 01/2025/QĐ-TTg ngày 3/1/2025 của Thủ tướng Chính phủ, từ 18/2/2025, hàng hóa nhập khẩu gửi qua dịch vụ chuyển phát nhanh quốc tế có trị giá hải quan trong định mức miễn thuế nhập khẩu theo quy định tại khoản 2 Điều 29 Nghị định số 134/2016/NĐ-CP (hàng hóa giá trị từ 1 triệu đồng trở xuống hoặc có số tiền thuế phải nộp dưới 100.000 đồng Việt Nam) và không thuộc mặt hàng phải có giấy phép nhập khẩu, kiểm tra chuyên ngành phải nộp thuế giá trị gia tăng (GTGT).
  • Meta chính thức công bố xây dựng tuyến ​​cáp quang biển kết nối 5 châu lục
    Dự án cáp quang biển mới nhất của Meta sẽ kéo dài hơn 50.000 km và kết nối 5 châu lục.
  • Đào tạo chuyên sâu kiến trúc sư, kỹ sư trưởng và cao cấp thiết kế vi mạch bán dẫn
    Phát triển các chương trình đào tạo chuyên sâu về thiết kế vi mạch là yếu tố then chốt để ngành công nghiệp vi mạch bán dẫn của Việt Nam có thể vươn lên mạnh mẽ trong khu vực và thế giới.
Kỹ sư trẻ sáng tác âm nhạc bằng công nghệ AI
POWERED BY ONECMS - A PRODUCT OF NEKO