Нейросети для локального использования

Помимо Foocus при помощи которого теперь могу создавать обложки для постов, меня заинтересовала вот такая нейронка so-vits-svc-fork.

Чем же она меня зацепила? Дали мне послушать каверы песен спетые голосами совершенно других исполнителей, которых к сожалению уже нет в этом мире. У меня возник вопрос, как… Как это возможно? Нагуглившись нашел один из вариантов, как это возможно. Обучив модель голосу на примере песен, потом скорее всего записывали трек своим голосом, что бы максимально передать интонации, а потом отдав нейросети переделывали голос под нужного исполнителя.

Поскольку я не певец, однозначно 😆 поэтому собираюсь сделать каверы на основе других исполнителей переделав их голоса при помощи нейросети. Сейчас на скору руку начал обучать модель голосу Егора Летова. Процесс обучения не быстрый, а результата уже хочется по прошествии 56 эпох уже выдает такой результат:

А далее открывается широкий простор для творчества 🙂

Можно стать, как Вован и Лексус разыгрывая кого нибудь голосами знаменитостей, потому что данный форк нейросети позволяет переделывать голос на лету, говоришь в микрофон, а на выходе уже другой голос.

Скачал модель голоса Шнура и переделал несколько песен вот эта лучше получилась: