На конференции Interspeech 2021 Nvidia представила новую технологию, позволяющую синтезировать реалистичную человеческую речь.
Чтобы нейросеть нельзя было отличить от живого человека, компания создала несколько моделей преобразования текста в речь. Одна из них, ведущая, получила название RAD-TTS.
Технология позволяет обучать модель синтеза речи с помощью собственного голоса. Это даёт ей данные о тональности, тембре и других индивидуальных характеристиках. В итоге нейросеть сможет заговорить любым голосом, просто зачитав готовый текст.
В компании добавили, что их разработка будет полезна, например, для воссоздания голоса знаменитости. Либо она может стать помощником для людей с функциональными нарушениями голоса.
Демонстрация работы:
Испытать некоторые обученные модели можно через инструментарий Nvidia.
Читайте также:
31 комментариев
Форум →Интересно будет, если обученная нейросеть сможет произносить текст на другом языке голосом знаменитости
Короче я понял, чего я хочу в новой iOS. Я хочу галку в настройках, чтобы включить искажение голоса при звонках с номерами не из контактов.
@DrunkenArms, как то кринжово. Мне больше нравится идея гугол ассистента, где ИИ приятным голосом за тебя на звонки отвечает.
@madbro, Олег, от Тинькова это делает.
@FiLunder_7, правда?
@FiLunder_7, всех спамеров на него отправляю сейчас, но заметил что после подключения «Олега» звонков стало очень мало
@Dr.Plush, он так криво это делает, что когда новый коллега врубил эту хрень, я думал, что мне спамер звонил.
Вроде тут рекламировали другого платного ассистента, надеюсь, что там получше.
@Cyborg, Да ему и не надо быть хорошим собеседником. Его работа ответить, записать звонок и прислать мне расшифровку. Все он это делает.
@FiLunder_7, правда с распознаванием текста там чет не все супер, на записи все хорошо слышно, а вот в тексте бывает лютая дичь
@Cyborg, Ну косяк в том что он начинает приветствие со слов “Алло”, а не сразу что юзернейм не может ответить, это косяк, но у меня переадресация туда только когда я скидываю туда звонок
Т.е. она заговорит моим голосом. Сомнительное удовольствие, если учесть, что большинство терпеть не могут слышать свой голос.
Я хочу ассистента который общался с телефонными спамерами и посылал их в долгое пешее. Уже и хуколс купил, и яндекс блокировку спамеров в дополнение поставил, все равно, нет-нет а прорываются.
@GIK, Олег от Тинькофф общается со спамерами
@Артём Баусов, а как это включить
@di3x, там ему надо написать в чате «Телефонный секретарь» и следовать инструкциям
@di3x, в телеграмме боту OlegOtvetBot постучаться надо и там инструкция будет
@GIK, я включил антиспам от МТС. В некоторые дни по 30-40 звонков блокирует (спасибо маркетологам моей компании, что мои презы с контактами в открытый Интернет выкладывают).
WhoCalls и Яндекс даже отключил, оставил 2ГИС по старинке для идентификации. Если спам и пробивается теперь, то не более 1 звонка в неделю, причем сразу после подключения услуги результат был ужасен, но вот спустя несколько месяцев все ок.
Простор для компроматов, потом доказывай что ты не верблюд и ничего подобного не говорил
Ждём новый поток мошенников.
@progreccor, Ага. Особенно на фоне банковских инициатив, раздавать кредиты удалённо без появления в офисе.
Здравствуй «username”, я твой голосовой помощник, и я решил(а) что тебе нужен кредит. Я уже оформил(а) его на тебя. Не благодари.
@werk, было бы здорово! А то когда кончается очередной кредит, надо бегать и получать новый..
@Smolny, пиши перс данные и фоточки
Как же страшно жить. В будущем.
Кто-нибудь, запилите Дроздова на такую штуку. Для будущих переводов документалок.
@e-ch, Дроздов конечно знаковый перс, но у всех кукуха поехала что-ли? на каждом углу пригласите пока жив, позовите пока не умер. оставьте человека в покое
Лучше бы показали карты по рекомендуемым ценам…
Adobe уже показывала такую технологию пару лет назад на своей конференции. И похоже решила не выпускать в массы боясь последствий…
давно уже адоби показывали такую штуку, но так и не выпустили. Думаю, из-за понятных соображений. В купе с дипфейсом может и войну развязать и вообще стереть границы реальности у людей.
Компания Бекмамбетова выпускала подобное пару лет назад:
youtu.be/WyU-gJ2NTGc
Или она сможет помочь злоумышленницам списать через ваш голос деньги с Сбербанка )))
Или приварится звонком от родственника и так далее
Нашли орфографическую ошибку в новости?
Выделите ее мышью и нажмите Ctrl+Enter.Почему iPhone очень долго заряжается
Какой минимум оперативной памяти нужен в 2017 году?
Почему связка ключей не переносится из iCloud на Mac
Как настроить синхронизацию контактов и заметок между iCloud и Google?
Как на iPhone с iOS 18.1 размыть лицо на фото
Как менять циферблат Apple Watch вместе с изменением режима Фокусирования
Почему некоторые беспроводные мыши не работают на Mac под Windows
Как подключить OneDrive в качестве сетевого диска на Mac?