Добавить новость
smi24.net
News in English
Март
2024

It’s easy to tamper with watermarks from AI-generated text

0

Watermarks for AI-generated text are easy to remove and can be stolen and copied, rendering them useless, researchers have found. They say these kinds of attacks discredit watermarks and can fool people into trusting text they shouldn’t. 

Watermarking works by inserting hidden patterns in AI-generated text, which allow computers to detect that the text comes from an AI system. They’re a fairly new invention, but they have already become a popular solution for fighting AI-generated misinformation and plagiarism. For example, the European Union’s AI Act, which enters into force in May, will require developers to watermark AI-generated content. But the new research shows that the cutting edge of watermarking technology doesn’t live up to regulators’ requirements, says Robin Staab, a PhD student at ETH Zürich, who was part of the team that developed the attacks. The research is yet to be peer reviewed, but will be presented at the International Conference on Learning Representations conference in May.  

AI language models work by predicting the next likely word in a sentence, generating one word at a time on the basis of those predictions. Watermarking algorithms for text divide the language model’s vocabulary into words on a “green list” and a “red list,” and then make the AI model choose words from the green list. The more words in a sentence that are from the green list, the more likely it is that the text was generated by a computer. Humans tend to write sentences that include a more random mix of words. 

The researchers tampered with five different watermarks that work in this way. They were able to reverse-engineer the watermarks by using an API to access the AI model with the watermark applied and prompting it many times, says Staab. The responses allow the attacker to “steal” the watermark by building an approximate model of the watermarking rules. They do this by analyzing the AI outputs and comparing them with normal text. 

Once they have an approximate idea of what the watermarked words might be, this allows the researchers to execute two kinds of attacks. The first one, called a spoofing attack, allows malicious actors to use the information they learned from stealing the watermark to produce text that can be passed off as being watermarked. The second attack allows hackers to scrub AI-generated text from its watermark, so the text can be passed off as human-written. 

The team had a roughly 80% success rate in spoofing watermarks, and an 85% success rate in stripping AI-generated text of its watermark. 

Researchers not affiliated with the ETH Zürich team, such as Soheil Feizi, an associate professor and director of the Reliable AI Lab at the University of Maryland, have also found watermarks to be unreliable and vulnerable to spoofing attacks. 

The findings from ETH Zürich confirm that these issues with watermarks persist and extend to the most advanced types of chatbots and large language models being used today, says Feizi. 

The research “underscores the importance of exercising caution when deploying such detection mechanisms on a large scale,” he says. 

Despite the findings, watermarks remain the most promising way to detect AI-generated content, says Nikola Jovanović, a PhD student at ETH Zürich who worked on the research. 

But more research is needed to make watermarks ready for deployment on a large scale, he adds. Until then, we should manage our expectations of how reliable and useful these tools are. “If it’s better than nothing, it is still useful,” he says.  

Update: This research will be presented at the International Conference on Learning Representations conference. The story has been updated to reflect that.








TRENDBOOKS.AI – первая в России нейросетевая платформа для предиктивной тренд-аналитики в моде и дизайне

Custom Clinic - это клиника в центре Санкт-Петербурга, где решают проблему выпадения волос комплексно и эффективно

Гастроэнтеролог Садыков: аппендицит из-за семечек арбуза или шелухи подсолнуха — миф

Российский рэпер сжег кабриолет BMW прямо на сцене


Cameroon star has said yes to Man Utd transfer but Red Devils face hurdle

Man Utd have agreed deal with AC Milan for £40m star's exit, await player decision - report

Palestinian envoy urges action at UN: “History will judge us all”

AI talent comes at a 30% salary premium: ‘If you try to play catch up later, this is going to cost you even more’


Персиковые дожди Колымы...

В Орле на территории детского сада уничтожили осиное гнездо

Антиармянские публикации в российском научном журнале «Современная научная мысль»: расследование фонда «Гегард»

DCLogic и HIDEN создают альянс для защиты ИТ-инфраструктуры от сбоев в электропитании


Steam for Chromebooks is getting axed in 2026 instead of exiting its 4-year beta

Открыты сервера MMORPG ROM: Golden Age

New study shows that Gen Z is spending way less money on videogames than older gamers

Modders are trying their hardest to add an NVMe SSD to the Switch 2, which is both impressive and something I'm not going to do


Овочі можусть стати розкішшю для українців


Платформа «DатаРу Облако» аттестована для работы с государственными данными и информацией повышенной категории

Семейное приключение на «Кораблике Детского радио»

Директор Росгвардии Герой России генерал армии Виктор Золотов принял участие в заседании Национального антитеррористического комитета

Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления


Продвижение в Телеграм. Продвижение канала в Телеграм.

Сотрудники Росгвардии пришли на помощь пенсионеру, внезапно потерявшему сознание в кафе на востоке столицы

В первом полугодии 2025 года общие сборы КАПИТАЛ LIFE показали рост и составили 12,7 млрд рублей

Семейное приключение на «Кораблике Детского радио»


Эксперт исключил вероятность резкого сокращения поставок нефти из России в Индию

Осень наступит раньше, чем мы думали: аномальный холод накроет РФ уже в августе

Экс-чиновница Минздрава Башкирии предстала перед судом за необеспечение лекарствами пациентов

В Пензе на Московской сгорел павильнон с пончиками


Александрова пробилась в третий круг турнира в Цинциннати

Потапова проиграла Свёнтек во втором круге турнира WTA в Цинциннати

Хачанов достиг третьего раунда теннисного турнира «Мастерс»

Анна Калинская вышла в третий круг турнира WTA 1000 в Цинциннати


В Пензе на Московской сгорел павильнон с пончиками

"ПРОРОЧЕСТВО: ОЧЕРЕДИ БУДУТ, ЧТОБЫ ВСЕХ ПЕРЕМЕСТИЛИ В КОМПЬЮТЕР". И СКОРО ВСТРЕЧА ПУТИНА И ТРАМПА. ВАЖНЫЕ НОВОСТИ! Россия, США, Европа могут улучшить отношения и здоровье общества!

Захарова: европейским элитам необходим «враг» в лице РФ, чтобы списать провалы

Экс-чиновница Минздрава Башкирии предстала перед судом за необеспечение лекарствами пациентов


Музыкальные новости

Баха и Чайковского исполнят на органном концерте в Печорах

Концерт к 100-летию со дня кончины святителя Тихона дадут в Псковском кремле

Работа над байопиком о Шэрон и Оззи Осборн продолжается после смерти музыканта

Ровно 50 лет назад не стало великого композитора Дмитрия Шостаковича, выступавшего в Воронеже


Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления

Побывавший в космосе объектив «Швабе» стал частью коллекции Политехнического музея

Nexign Interconnect получила сертификат совместимости с российской Java-платформой Axiom JDK

Директор Росгвардии Герой России генерал армии Виктор Золотов принял участие в заседании Национального антитеррористического комитета


Сергей Собянин. Главное за день

Хачанов достиг третьего раунда теннисного турнира «Мастерс»

Футболистки «Крыльев Советов» уступили ЦСКА в матче Суперлиги – счет 0:2

«Торпедо» и «Спартак» Кострома сразятся за три очка. «Торпедо» Москва — «Спартак» Кострома: прогноз и ставка


Baza: Мотоциклист попал в ДТП в Москве из-за нарушившего ПДД водителя

В Сети появились кадры ДТП с подростками на самокате, которые врезались в столб

В Москве на видео попало, как подростка на электросамокате отбросило под автобус

Выяснились детали смертельной аварии с участием 16-летних самокатчиков на западе Москвы


Bloomberg: встреча Путина и Трампа сама по себе представляет победу Москвы

Почему Трамп захотел быстро встретиться с Путиным, объяснил Хазин

Bloomberg: встреча Путина и Трампа означает победу России

Почему Трамп сказал, что едет в Россию, если встреча назначена в Аляске




Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления

Главный врач клиники микрохирургии глаза АйМед Элина Санторо: что делать если лопнул сосуд в глазу

Здоровье Бориса Щербакова: обновленные сведения от научно-исследовательского центра имени Склифосовского

Подмосковный травматолог дал советы по выбору рюкзака для первоклассника


Политолог: Алиев пересек красную линию и столкнется с ответом Москвы

«Будет обмен землей»: Трамп поставил Зеленского на место, вызвав панику в Киеве


Росгвардейцы охраняли правопорядок на фестивале «ЛИГА ТРИАТЛОНА & IRONSTAR МОСКВА 2025»

В регионах центральной России росгвардейцы отметили День физкультурника

Чемпионат по самбо столичного главка Росгвардии завершился в Москве

На пенсии отоспишься. 13 идей для ночного досуга в Москве — от тенниса до парилки


Лукашенко получил первую золотую монету из белорусского сырья


Ивлеева предположила, что Трамп увидит метро Москвы и увезет Собянина в США

Собянин рассказал, как проект «Город героев» укрепляет связь времен и поколений

Собянин оценил вклад проектов "Город героев" и "Герой моего района

Собянин объявил об открытии новой детской поликлиники в районе Крюково


В Крыму потушили угрожавший двум селам природный пожар

Площадь возгорания на горе Куцай достигла 650 тысяч квадратных метров

Что подготовили в павильонах «Музеона» в рамках форума «Москва 2030»

Орловская область планирует войти в число национальных туристических маршрутов с проектом «Бирюзовое кольцо России»


Школьники приходят на завод ОМК в Челябинске для знакомства с профессиями

«Локомотив» будет настроен на победу. «Локомотив» — «Балтика»: прогноз и ставка

Осень наступит раньше, чем мы думали: аномальный холод накроет РФ уже в августе

"ПРОРОЧЕСТВО: ОЧЕРЕДИ БУДУТ, ЧТОБЫ ВСЕХ ПЕРЕМЕСТИЛИ В КОМПЬЮТЕР". И СКОРО ВСТРЕЧА ПУТИНА И ТРАМПА. ВАЖНЫЕ НОВОСТИ! Россия, США, Европа могут улучшить отношения и здоровье общества!


Полицейский погиб при задержании поджигателя релейного шкафа под Архангельском

Здание морского речного вокзала в Архангельске будет обновлено к концу 2026 года

Сотрудниками полиции и Росгвардии задержан гражданин, причастный к поджогу релейного шкафа в Архангельской области

Орловская область планирует войти в число национальных туристических маршрутов с проектом «Бирюзовое кольцо России»


Прогноз погоды в Крыму на 12 августа

Историко-краеведческая выставка «Древности земли крымской»

Прогноз погоды в Крыму на 11 августа

Прогноз погоды в Крыму на понедельник


Захарова: европейским элитам необходим «враг» в лице РФ, чтобы списать провалы

"ПРОРОЧЕСТВО: ОЧЕРЕДИ БУДУТ, ЧТОБЫ ВСЕХ ПЕРЕМЕСТИЛИ В КОМПЬЮТЕР". И СКОРО ВСТРЕЧА ПУТИНА И ТРАМПА. ВАЖНЫЕ НОВОСТИ! Россия, США, Европа могут улучшить отношения и здоровье общества!

«Я верил в победу». Уроженец Хабаровска выиграл в «Русское лото» 1 млн рублей

Потеряла миллион, играя на бирже














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *