Добавить новость
smi24.net
Technology Review
Июль
2025
1 2 3 4
5
6
7 8 9 10 11
12
13
14 15 16 17 18 19
20
21
22
23
24
25
26
27
28
29
30
31

AI text-to-speech programs could “unlearn” how to imitate certain people

0

A technique known as “machine unlearning” could teach AI models to forget specific voices—an important step in stopping the rise of audio deepfakes, where someone’s voice is copied to carry out fraud or scams.

Recent advances in artificial intelligence have revolutionized the quality of text-to-speech technology so that people can convincingly re-create a piece of text in any voice, complete with natural speaking patterns and intonations, instead of having to settle for a robotic voice reading it out word by word. “Anyone’s voice can be reproduced or copied with just a few seconds of their voice,” says Jong Hwan Ko, a professor at Sungkyunkwan University in Korea and the coauthor of a new paper that demonstrates one of the first applications of machine unlearning to speech generation.

Copied voices have been used in scams, disinformation, and harassment. Ko, who researches audio processing, and his collaborators wanted to prevent this kind of identity fraud. “People are starting to demand ways to opt out of the unknown generation of their voices without consent,” he says. 

AI companies generally keep a tight grip on their models to discourage misuse. For example, if you ask ChatGPT to give you someone’s phone number or instructions for doing something illegal, it will likely just tell you it cannot help. However, as many examples over time have shown, clever prompt engineering or model fine-tuning can sometimes get these models to say things they otherwise wouldn’t. The unwanted information may still be hiding somewhere inside the model so that it can be accessed with the right techniques. 

At present, companies tend to deal with this issue by applying guardrails; the idea is to check whether the prompts or the AI’s responses contain disallowed material. Machine unlearning instead asks whether an AI can be made to forget a piece of information that the company doesn’t want it to know. The technique takes a leaky model and the specific training data to be redacted and uses them to create a new model—essentially, a version of the original that never learned that piece of data. While machine unlearning has ties to older techniques in AI research, it’s only in the past couple of years that it’s been applied to large language models.

Jinju Kim, a master’s student at Sungkyunkwan University who worked on the paper with Ko and others, sees guardrails as fences around the bad data put in place to keep people away from it. “You can’t get through the fence, but some people will still try to go under the fence or over the fence,” says Kim. But unlearning, she says, attempts to remove the bad data altogether, so there is nothing behind the fence at all. 

The way current text-to-speech systems are designed complicates this a little more, though. These so-called “zero-shot” models use examples of people’s speech to learn to re-create any voice, including those not in the training set—with enough data, it can be a good mimic when supplied with even a small sample of someone’s voice. So “unlearning” means a model not only needs to “forget” voices it was trained on but also has to learn not to mimic specific voices it wasn’t trained on. All the while, it still needs to perform well for other voices. 

To demonstrate how to get those results, Kim taught a recreation of VoiceBox, a speech generation model from Meta, that when it was prompted to produce a text sample in one of the voices to be redacted, it should instead respond with a random voice. To make these voices realistic, the model “teaches” itself using random voices of its own creation. 

According to the team’s results, which are to be presented this week at the International Conference on Machine Learning, prompting the model to imitate a voice it has “unlearned” gives back a result that—according to state-of-the-art tools that measure voice similarity—mimics the forgotten voice more than 75% less effectively than the model did before. In practice, this makes the new voice unmistakably different. But the forgetfulness comes at a cost: The model is about 2.8% worse at mimicking permitted voices. While these percentages are a bit hard to interpret, the demo the researchers released online offers very convincing results, both for how well redacted speakers are forgotten and how well the rest are remembered. A sample from the demo is given below. 

A voice sample of a speaker to be forgotten by the model.
The generated text-to-speech audio from the original model using the above as a prompt.
The generated text-to-speech audio using the same prompt, but now from the model where the speaker was forgotten.

Ko says the unlearning process can take “several days,” depending on how many speakers the researchers want the model to forget. Their method also requires an audio clip about five minutes long for each speaker whose voice is to be forgotten.

In machine unlearning, pieces of data are often replaced with randomness so that they can’t be reverse-engineered back to the original. In this paper, the randomness for the forgotten speakers is very high—a sign, the authors claim, that they are truly forgotten by the model. 

 “I have seen people optimizing for randomness in other contexts,” says Vaidehi Patil, a PhD student at the University of North Carolina at Chapel Hill who researches machine unlearning. “This is one of the first works I’ve seen for speech.” Patil is organizing a machine unlearning workshop affiliated with the conference, and the voice unlearning research will also be presented there. 

She points out that unlearning itself involves inherent trade-offs between efficiency and forgetfulness because the process can take time, and can degrade the usability of the final model. “There’s no free lunch. You have to compromise something,” she says.

Machine unlearning may still be at too early a stage for, say, Meta to introduce Ko and Kim’s methods into VoiceBox. But there is likely to be industry interest. Patil is researching unlearning for Google DeepMind this summer, and while Meta did not respond with a comment, it has hesitated for a long time to release VoiceBox to the wider public because it is so vulnerable to misuse. 

The voice unlearning team seems optimistic that its work could someday get good enough for real-life deployment. “In real applications, we would need faster and more scalable solutions,” says Ko. “We are trying to find those.”








Опасная сторона загара: дерматолог Энгельгардт о последствиях для кожи

Невские весы: автомобильные весы серии ВСА-Р теперь официально в реестре российской промышленности!

Мустафа Саад представит Египет на международном музыкальном конкурсе «Интервидение-2025»

Косметолог Наталья Рябинова: в чем разница между эстетическим и медицинским трихологом


The anti-DEI movement has a new ally: The FCC

American firms in China report record-low new investment plans for 2025, and doubts about their profitability

Jerome Powell is gaining some key backing on Capitol Hill from GOP senators

At Last We Know Why Shemar Turner Fell To The 2nd Round


Владимир Путин открыл участок дороги М-12 между Дюртюли и Ачитом

НПС построил мост через Москву-реку около Лыткарино

Объявлена стоимость проезда по новой дороге от Москвы до Екатеринбурга

В Екатеринбурге вынесли приговор криминальному авторитету Овчине


В Pokémon TCG Pocket обновится система торговли карточками

The origin of 'AI Appreciation Day' isn't what you think: It was started by an Elon Musk admirer who camped outside of SpaceX Starbase for a year hoping to talk to the billionaire about AI regulation

As the Nintendo eShop fails to protect from 'eslop', indie devs reflect on how it affects their work and why Steam is just better: 'Their algorithm will more or less naturally bury AI slop'

В демоверсию Silver Palace можно будет поиграть 3 августа в Китае



Сергей Собянин сообщил о планах расширения сети летних лагерей для подростков

Сергей Собянин рассказал о проекте «Сделано в Москве» и его значении для предпринимателей

Mash: Москвичка, которую уволили с работы из-за ИИ, выиграла в суде 1,5 миллиона

Ярошенко: "Русские люди больше не обязаны платить за чужое предательство"


Собака по кличке Дора нанесла первый удар в матче "Динамо" - "Балтика"

Токио собирался купить "никому не нужный металлом": СМИ Китая напомнили о величайшем унижении японской дипломатии от России

«Путь к вершинам»: вдохновляющий проект для детей и подростков с ограниченными возможностями здоровья в Приэльбрусье

Главный тренер "Балтики" Талалаев повторил рекорд в чемпионате России


Олимпийский чемпион Алексей Ягудин открыл первую инклюзивную площадку в Туле

Представитель Рязанской области Захар Петров завоевал две золотых медали на Чемпионате России по гребле

На стройке ЖК "Ручьи" в Санкт-Петербурге погиб рабочий, его ударило плитой

«Самая красивая страна» открылась в Новой Третьяковке


Рублев пробился в полуфинал турнира в Лос-Кабосе.

Подмосковный теннисист стал призером юниорского Уимблдона

Подмосковный теннисист стал бронзовым призером юниорского Уимблдона

Томми Пол снялся с турнира ATP-500 в Вашингтоне


На стройке ЖК "Ручьи" в Санкт-Петербурге погиб рабочий, его ударило плитой

Олимпийский чемпион Алексей Ягудин открыл первую инклюзивную площадку в Туле

«Спартак» порадует болельщиков домашней победой, «Шанхай Шэньхуа» не проиграет «Бэйцзин Гоань». Экспресс дня 19 июля: прогноз и ставка

Подводный праздник в Dhawa Ihuru: погружение за скидками


Музыкальные новости

Украли кукол? В Ялте ограбили дачу певицы Софии Ротару

Конкурс юных певцов Елены Образцовой объявил победителей

Собака по кличке Дора нанесла первый удар в матче "Динамо" - "Балтика"

Позирует топлес, обнимается с брюнетом, безудержно смеется: веселый отдых Анастасии Волочковой на Мальдивах


Сергей Собянин сообщил о планах расширения сети летних лагерей для подростков

Mash: Москвичка, которую уволили с работы из-за ИИ, выиграла в суде 1,5 миллиона

Ярошенко: "Русские люди больше не обязаны платить за чужое предательство"

Сергей Собянин рассказал о проекте «Сделано в Москве» и его значении для предпринимателей


Кажетта Ахметжанова: что не стоит дарить согласно приметам и суевериям

Сергей Собянин: К началу учебного года подготовим 30 детских садов и школ

«Музы хоккея»: Юлианна Караулова выступила в роли спортивного комментатора в новых эпизодах мультсериала «Чемпионы»

Росавиация ввела ограничения на работу аэропорта Внуково


Легендарные авто XX века стали участниками ретроралли «СТОЛИЦА.RODIS Классик Тур»

В Москве наказали водителей, которые подрались на фоне Кремля

Маршрут от Ноябрьска до Москвы на автомобиле станет короче

Объявлена стоимость проезда по новой дороге от Москвы до Екатеринбурга


Мединский отметил, что Путин лучше многих историков разбирается в прошлом.

Губернатор Авдеев рассказал о поджоге Киева в XII веке.

Полетели! Бересту дали Героя. Объявлен заморный период. Противогаз в массы. А вы не ищите...

Маршрут от Ноябрьска до Москвы на автомобиле станет короче


Ситуация в медицине в России: преодоление новых вызовов хуже, чем во время COVID-19.



Сахар в жару скачет даже у здоровых: как климат влияет на инсулин и глюкозу рассказала доктор Филатова

Всё меняется после 45: как мягко пережить климакс без гормонов — рассказывает врач Филатова

Источник 360.ru: в московской клинике пациентов снимали скрытой камерой

Первую в СКФО роботизированную операцию по замене сустава провели в Пятигорске


Раскрыта роль Зеленского в убийстве полковника СБУ Воронича в Киеве

Все получат по заслугам. Россия заявила о праве бить по странам, которые помогают Киеву. Свежая сводка с фронтов СВО от военкоров

В Киеве пожаловались, что Европа не хочет отдать им российские активы


Александрова покинула турнир в Гамбурге, не дойдя до полуфинала.

Российский фехтовальщик на шпагах стал чемпионом Универсиады.

В Ульяновске пройдет фестиваль пляжного волейбола «Комус Fest 2025»

Московское «Динамо» потеряло очки в первом матче сезона с новичком РПЛ


Лукашенко настоятельно призвал жестко остановить воровство в аграрной сфере.

«Хочу пообщаться»: Ольга Бузова нежно обратилась к Александру Лукашенко и пригласила его на шоу «Фактор.BY»

Лукашенко жестко поставил задачу по уборке урожая со словами «умри, но сделай»

Лукашенко утвердил указ о повышенном обеспечении вооруженных сил в условиях военного времени.


Сергей Собянин: К началу учебного года подготовим 30 детских садов и школ

Собянин сообщил о втором сбитом на подлете к Москве беспилотнике

Сергей Собянин рассказал о проекте «Сделано в Москве» и его значении для предпринимателей

Собянин: Еще два БЛПА уничтожены силами ПВО Минобороны на подлете к Москве


Компании Москвы разрабатывают уникальное оборудование для очистки воды

В экоточках Москвы теперь можно сдать на переработку электроприборы

Два краснокнижных стервятника поселились в Московском зоопарке впервые за 50 лет

В парке Кузьминки в Москве обнаружили официально исчезнувший вид рыбы


Подводный праздник в Dhawa Ihuru: погружение за скидками

Олимпийский чемпион Алексей Ягудин открыл первую инклюзивную площадку в Туле

Представитель Рязанской области Захар Петров завоевал две золотых медали на Чемпионате России по гребле

Проверь здоровье: диспансеризацию можно пройти в парках Москвы и Подмосковья


Алтайский край оказался в числе регионов-аутсайдеров по доступности вторичного жилья

Владимир Ефимов: На станции «Рублево-Архангельское» стартовали монолитные работы

Защищённый планшет Saotron RT-W11J на базе ОС Windows10

Архангельская область - не самое перспективное место для трудоустройства


Прогноз погоды в Крыму на 17 июля

Новый археологический парк создан в Севастополе

Традиции народов Марокко и Мавритании в пересказе российского путешественника

Депутат Госдумы сравнил новый пакет санкций с удавкой на шее ЕС


На стройке ЖК "Ручьи" в Санкт-Петербурге погиб рабочий, его ударило плитой

Аэропорт Геленджика возобновил прием пассажирских рейсов после трехлетнего перерыва

Проверь здоровье: диспансеризацию можно пройти в парках Москвы и Подмосковья

Звезда мировой оперы Шагимуратова споёт для гостей «Спасской башни»














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *