Neural network - đây là một lễ hội

podcast community cover# Neural network - đó là một lễ hội

Sự phát triển của mạng nơ-ron ở giai đoạn hiện tại không chỉ cho phép tạo ra các bản sao của những nghệ sĩ âm nhạc nổi tiếng, mà còn phục hồi giọng nói của những người nổi tiếng từ thời kỳ chưa số hóa. Về nghệ thuật của các bản cover bằng nơ-ron và tầm quan trọng của tiền điện tử đối với thị trường âm nhạc AI, Andrey, tác giả kênh YouTube "Ai, guitarist!" đã chia sẻ.

ForkLog (FL): Андрей, những bức tranh thần kinh của bạn đang thu hút hàng triệu lượt xem. Nghệ thuật này có được ưa chuộng hiện nay không?

Andrey: Tôi nghĩ vậy. Tôi đã hình thành một khán giả đến để tìm kiếm sự hoài niệm, để nghe giọng nói của những nghệ sĩ đã qua đời từ lâu - như Tsoi, Letov. Đây là những người hâm mộ của họ, và có thể không phải là hàng triệu như trong nhạc pop, nhưng vẫn là một số lượng đáng kể. Đối với tôi, điều này rất đặc biệt.

FL: Bạn đến với âm nhạc như thế nào?

Andrei: Tôi chơi guitar từ năm 13 tuổi. Tôi bắt đầu trên cây guitar cũ của cha, sản xuất từ nhà máy đồ nội thất Chernihiv. Và điều này đã ở lại với tôi suốt cuộc đời — như một sở thích. Sau đó, tôi tham gia các buổi tiệc rock, underground. Trong cuộc sống, tôi đã làm những việc hoàn toàn khác, nhưng hai năm rưỡi qua, tôi lại tập trung vào âm nhạc.

FL: Khi nào bạn bắt đầu làm việc với các neurocovers và tại sao bạn thường xuyên tìm đến giọng nói của Letov?

Andrey: Tôi luôn nghe nhạc rock, và Letov cùng Tsой là những huyền thoại được công nhận của rock Nga. Cụ thể, tôi đã được anh trai giới thiệu về Letov, người đã là một fan hâm mộ lớn của ông, đã mang băng từ Moscow về.

Khi tôi học chơi guitar, nảy ra ý tưởng cover các nghệ sĩ. Giọng hát của Letov có một sức hút nhất định, một cái gì đó tuyệt vọng. Nếu dùng giọng của anh ấy để trình bày các bài hát từ phim hoạt hình, chúng trở nên rất sâu lắng, thậm chí xé lòng.

Vào năm 2023, tôi bắt đầu tham gia vào việc làm neurocovers, và mẫu giọng đầu tiên mà tôi có chính là Letov. Lúc đó, trong giới trẻ, ông đã bắt đầu một vòng tay phổ biến thứ hai, sau khi qua đời.

FL: Quy trình tạo ra một bản nhạc diễn ra như thế nào?

Andrei: Ban đầu tôi sẽ hát tất cả, phác thảo một bản thảo nào đó. Tôi chọn bài hát hoặc là tự tôi, hoặc là bài mà những người theo dõi gợi ý trong các bình luận.

Phần lớn quá trình thuộc về tôi. Tiếp theo, tôi áp dụng mô hình giọng nói vào mạng nơ-ron RVC, sau đó xử lý tất cả trong phần mềm chỉnh sửa âm thanh Ableton. Cũng sử dụng các mạng nơ-ron khác cho quá trình hậu kỳ: ElevenLabs, Adobe Podcast.

Tôi đã làm những lớp phủ thần kinh đầu tiên trên một mô hình giọng nói công khai, bây giờ tôi đã sử dụng một mô hình tự xây dựng, được đào tạo trên một số album của Letov trong suốt một năm rưỡi. Tuy nhiên, cách thể hiện và phong cách vẫn được đảm nhiệm bởi một con người sống, mạng nơ-ron không thể làm được điều này.

FL: Phòng thu của bạn được trang bị như thế nào?

Andrey: Bộ công cụ hoàn toàn tiêu chuẩn. Điều duy nhất, tôi khuyên bạn nên mua một giao diện âm thanh tốt. Tôi có giao diện âm thanh iCON Duo 22 Dyna, nó có cổng cho guitar và micro condenser. Micro và tai nghe Superlux, giá cả phải chăng.

FL: Thực tế các neurocovers được tạo ra trong thời gian thực?

Andrey: Mạng nơron RVC áp dụng mô hình giọng nói trong thời gian thực. Điều quan trọng nhất là phải đồng bộ hóa guitar và giọng hát, vì card đồ họa cần khoảng một vài giây để xử lý. Tôi đang sử dụng RTX 3090 cục bộ, không phải là mạnh nhất. Nhưng đối với các mạng nơron, bộ nhớ video là quan trọng, ở đây nó có 34 GB - tôi còn đủ dùng trong vài năm nữa.

FL: Hiện tại thị trường nhạc AI đang diễn ra những gì?

Andrey: Đã hơn một năm kể từ khi các mẫu Suno đầu tiên ra mắt, mọi người đã tạo ra âm nhạc của riêng mình, đăng tải nó lên các nền tảng và kiếm tiền từ đó. Điều này đã dẫn đến một loạt các vụ kiện lớn giữa các hãng thu âm và các công ty khởi nghiệp AI. Các khiếu nại cho rằng để đào tạo các mạng nơ-ron của mình, Suno và Udio sử dụng các bản nhạc gốc, trong khi các tác giả và nghệ sĩ không nhận được bất kỳ khoản tiền nào.

Trong tương lai, tôi nghĩ rằng chúng ta sẽ đến lúc các nhạc sĩ sẽ nhận được tiền bản quyền — có thể là 50/50 — cho việc sử dụng giọng hát của họ.

Hơn nữa, các quy trình studio thường lệ sẽ chuyển sang các mạng nơ-ron. Nếu tôi là các hãng thu âm, tôi đã áp dụng công cụ này để giảm bớt công việc.

FL: Bạn đã tham gia vào các dự án cộng đồng để phục hồi giọng nói của những người nổi tiếng trong các thời kỳ trước. Quá trình này diễn ra như thế nào?

Andrey: Tôi đã giúp các bạn từ Uzbekistan phục hồi những giọng nói vàng của nước cộng hòa - các phát thanh viên và ca sĩ khác nhau. Dự án được thực hiện với sự hỗ trợ của nhà nước. Các bản ghi âm từ các kho lưu trữ quốc gia đã được sử dụng, dựa trên đó tôi tạo ra các mô hình giọng nói và cải thiện chất lượng âm thanh.

Hiện tại tôi cũng đang tham gia vào việc phục hồi giọng nói của Sergey Yesenin, người mà năm 2025 sẽ được tưởng niệm ở Nga. Trong suốt cuộc đời, ông chỉ có một bản ghi âm chất lượng khá, trong đó ông đọc bài thơ của mình trong khoảng bốn phút. Và mặc dù chỉ còn lại một chút ký ức về giọng nói, tôi vẫn cố gắng kéo nó lên và tạo ra một mô hình giọng nói dựa trên đó. Vào mùa thu, dự án này sẽ được giới thiệu.

FL: Bạn có thấy vấn đề đạo đức trong việc sử dụng giọng nói của những nghệ sĩ đã qua đời không?

Andrey: Tôi phản đối việc có những sự lệch lạc trong việc sử dụng nguyên liệu gốc khi tạo ra các bài hát từ AI. Trong sáng tác của mình, tôi cố gắng tiếp cận các nhạc sĩ đã khuất với sự tôn trọng. Các bài hát của tôi phần lớn là sự tái diễn giải.

FL: Tại Nga đã đề xuất bảo vệ giọng nói của công dân như một đối tượng quyền tài sản vô hình. Liệu lĩnh vực này có nên được điều chỉnh và nếu có thì như thế nào?

Andrei: Điều này sẽ không thể tránh khỏi. Dự thảo luật của Nga chủ yếu nhằm chống lại việc sử dụng giọng nói của con người cho các mục đích gian lận. Trong bối cảnh này, đây là một đề xuất rất đúng đắn.

Tôi hoàn toàn không làm việc với các mô hình đối thoại, tôi tạo ra những tác phẩm parody, viết nhạc từ đầu và luôn chỉ ra điều đó.

Chắc chắn rằng sẽ có các sửa đổi đối với luật pháp trong lĩnh vực này. Châu Âu và Hoa Kỳ hiện đang rất lo ngại về việc chống lại deepfake. Không cần có sự hỗn loạn trong bất kỳ lĩnh vực nào.

Nếu điều này ảnh hưởng đến hoạt động của tôi và tôi phải xin bất kỳ giấy phép nào, tôi vẫn sẽ tiếp tục làm điều này, dù có hạn chế.

FL: Bạn có theo dõi bất kỳ token AI nào không?

Andrey: Một trong những dự án thú vị là io.net. Họ cung cấp các khả năng điện toán đám mây, điều này rất quan trọng cho các mạng nơ-ron, khi bạn không có thiết bị phù hợp ở nhà. Bạn mua sức mạnh tính toán từ họ bằng token và sử dụng nó để huấn luyện các mô hình của mình.

Một dự án tuyệt vời khác là ChainGPT. Họ có nhiều tác nhân AI khác nhau giúp giải quyết các vấn đề liên quan đến tiền điện tử, kiểm tra hợp đồng thông minh.

Tôi chắc chắn rằng trong tương lai sẽ có những dự án tương tự như ElevenLabs với các token của riêng chúng, mà người dùng có thể sử dụng để thanh toán cho các dịch vụ xử lý giọng nói hoặc âm nhạc. Thật tuyệt khi công nghệ và tiền điện tử hòa quyện với nhau.

FL: Bạn nghĩ gì về ý tưởng token hóa trong lĩnh vực này?

Andrey: Tôi rất thích. Tôi thậm chí đã có ý tưởng để khởi chạy bot Telegram của riêng mình, bot này sẽ tạo ra âm nhạc trong Suno với việc thanh toán bằng token.

Tôi cho rằng việc token hóa trong nhạc thần kinh là rất hữu ích, nhưng hiện tại chưa có sự chấp nhận rộng rãi để điều này xảy ra ở một mức độ nghiêm túc. Tôi tin rằng sẽ có những bước tiến trong hướng này, một phần nhờ vào Telegram.

FL: Trí tuệ nhân tạo sẽ tiêu diệt nhân loại?

Andrey: Tôi nghĩ không. Với cách tiếp cận đúng, ngược lại, sẽ bổ sung thêm

Đăng ký podcast:

Apple Podcasts

Spotify

YouTube

Deezer

Yandex.Music

YouTube Music

RVC-4.78%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)