Добавить новость
smi24.net
World News in Spanish
Октябрь
2024

¿Adiós a las trampas con ChatGPT? Desarrollan marcas de agua para detectar los textos generados por IA

0

Un equipo ha creado un algoritmo de muestreo para sesgar sutilmente la elección de palabras de estas herramientas y generar una firma invisible que puede ser reconocida mediante un software de detección

Hemeroteca - Las inteligencias artificiales “colapsan” si se quedan sin obras humanas de las que aprender

Desde la aparición de los modelos de lenguaje extenso de inteligencia artificial (IA) como ChatGPT, una de las grandes preocupaciones ha sido la posibilidad de que muchas personas hagan pasar por propios trabajos que en realidad ha producido un algoritmo, un asunto de especial relevancia en ámbitos como el educativo o el de la investigación. 

Un equipo liderado por Sumanth Dathathri y Pushmeet Kohli, miembros del laboratorio DeepMind de Google, ha desarrollado un algoritmo de muestreo capaz de aplicar marcas de agua al texto generado por su herramienta de IA y hacerlo reconocible. El sistema introduce pequeños cambios, detectables estadísticamente, pero apenas apreciables para los humanos, que funcionan como una firma que puede ser reconocida por el software de detección asociado. 

El nuevo software, bautizado como SynthID-Text, se describe en un trabajo publicado este miércoles en la revista Nature. Los autores han puesto a prueba la detectabilidad de estas marcas de agua y han encontrado una mejora sustancial en comparación con los enfoques existentes. El algoritmo dispone de un modo “distorsionador”, que mejora la marca de agua con un pequeño costo de la calidad de salida del texto, y un modo “no distorsionador”, que preserva la calidad del texto.

La calidad del texto se ha evaluado utilizando casi 20 millones de respuestas de interacciones de chat en vivo con el modelo de lenguaje de Google DeepMind, Gemini LLM

Los autores han evaluado el sistema utilizando casi 20 millones de respuestas de interacciones de chat en vivo con el modelo de lenguaje de Google DeepMind, Gemini LLM y concluyen que el modo sin distorsión no disminuye la calidad del texto. También han comprobado que la herramienta no tiene un impacto insignificante en la potencia computacional necesaria para ejecutar LLM, lo que reduce la barrera para la implementación.

Aunque los investigadores de DeepMind han probado la herramienta de Google, este tipo de aproximaciones podrían generalizarse en otras tecnologías, como la más popular, ChatGPT. La compañía responsable de este chatbot, OpenAI, reconoció este verano que tiene listo un sistema para reconocer sus textos, aunque no se decide a lanzarlo por temor a perjudicar sus resultados. “Nuestros equipos han desarrollado un método de marca de agua de texto que seguimos considerando mientras investigamos alternativas”, admitieron desde la empresa. También están investigando el uso de otras vías, como los metadatos, para reconocer la procedencia del texto.

“Esta tecnología permite a Google detectar contenido de texto generado por nuestra propia aplicación Gemini y la experiencia web”, explican desde DeepMind a elDiario.es. “Ahora, otros desarrolladores de IA generativa podrán usar esta tecnología para ayudarlos a detectar si los resultados de texto provienen de sus propios LLM, ya que se ofrece en código en código abierto”. Los autores del nuevo trabajo consideran que es un paso más para mejorar la rendición de cuentas y la transparencia del uso responsable de la inteligencia artificial, aunque reconocen que las marcas de agua de texto se pueden evitar editando o parafraseando el resultado.

Una posible vía de escape

La doctora en inteligencia artificial, Nerea Luis, cree que el resultado es muy interesante y destaca que, a pesar de introducir ciertos conjuntos de palabras para generar esas marcas, la calidad del texto no se altera y el usuario no percibe una pérdida de calidad. “Para mí el punto fuerte es que la demostración se ha hecho con el modelo como el que usa todo el mundo, no uno de laboratorio”, explica a elDiario.es. “Aun así, el método es efectivo en la primera generación del texto, pero no se puede mantener en el tiempo si se añade nuevo o se modifica parte”, señala. “Este es el verdadero problema en general del tema de trazabilidad si queremos aplicarlo a LLMs, especialmente con textos, que son algo tan cambiante”. 

El punto fuerte es que la demostración se ha hecho con el modelo como el que usa todo el mundo, no uno de laboratorio

Nerea Luis Doctora en inteligencia artificial

“Mientras que en imágenes, vídeos o audios es sencillo insertar marcas de agua, en el caso del texto esto representa un desafío, ya que cualquier alteración en las palabras puede afectar significativamente el significado y la calidad del contenido”, asegura Pablo Haya, investigador del Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid (UAM) en declaraciones al SMC . Actualmente, los sistemas para detectar si un documento ha sido generado por IA tienen bajos índices de acierto, por lo que tecnologías que faciliten la identificación de la autoría son muy necesarias, explica.

Para entender cómo funcionan estas marcas de agua, Haya pone un ejemplo. Si el modelo hubiera producido la siguiente frase: El informe muestra que el mercado ha tenido un crecimiento significativo durante el último trimestre, relata, el algoritmo de marca de agua generaría una frase equivalente, pero escogiendo una serie de palabras que, sin modificar el significado, siguen una relación estadística conocida por el algoritmo: El reporte indica que el mercado ha tenido un avance notable durante el último trimestre. “En este ejemplo, que aparezcan en la misma frase estas cuatro palabras, 'reporte', 'indica', 'avance', 'notable', y no otras, es poco probable en el caso de un LLM, y altamente probable si se ha utilizado el algoritmo de marca de agua”, explica a SMC.

Mikel Galar, experto en IA de la Universidad Pública de Navarra (UPNA), recuerda que este estudio está basado en otros trabajos previos. “Los resultados parecen convincentes y dicen que el sistema ya está implantado en Gemini y Gemini advanced”, destaca. “Creo que para sus usuarios sería importante saber esto, porque quizás no tengan interés en usar un sistema que sea fácilmente detectable”.

Este tipo de técnicas son vulnerables a modificaciones del texto o reescrituras por parte de otros modelos, por lo que su utilidad práctica está todavía por ver

Mikel Galar, Experto en IA de la Universidad Pública de Navarra (UPNA)

Según los resultados, recuerda Galar, para textos cortos (100 tokens, 60-70 palabras) la detección es de un 50%, aunque con muy pocos falsos positivos (1%), y aumenta al 80% cuando llegamos a los 400 tokens (unas 300 palabras). “Aunque es un paso adelante, las limitaciones de este trabajo son claras y expuestas por los autores: hay muchas implementaciones abiertas en internet que no van a incluirlo”, subraya. “Además, este tipo de técnicas son vulnerables a modificaciones del texto o reescrituras por parte de otros modelos, por lo que su utilidad práctica está todavía por ver. Alguien con conocimiento podría modificar ligeramente el texto reduciendo la capacidad de detección”.








Custom Clinic - это клиника в центре Санкт-Петербурга, где решают проблему выпадения волос комплексно и эффективно

3 привычки, которые мешают сжечь жир на животе

Чудо-колонка Детского радио: малыш будет в восторге!

Коллекция Zuhair Murad осень-зима 2025/26


Palestinian envoy urges action at UN: “History will judge us all”

AI talent comes at a 30% salary premium: ‘If you try to play catch up later, this is going to cost you even more’

Report: Liverpool decision hands advantage to Man United in midfielder pursuit

Exclusive: Fintech giant Stripe building ‘Tempo’ blockchain with crypto VC Paradigm


В Петербурге центр города и Лахтинскую гавань связали водными круизами

Трансстроймеханизация - лауреат конкурса на лучшую строительную организацию

Northern Cardinal male - Красный кардинал самец

Антиармянские публикации в российском научном журнале «Современная научная мысль»: расследование фонда «Гегард»


The US Air Force wants to test blowing up Cybertrucks because 'it is likely the type of vehicles used by the enemy may transition to Tesla Cyber trucks'

New study shows that Gen Z is spending way less money on videogames than older gamers

Открыты сервера MMORPG ROM: Golden Age

Steam for Chromebooks is getting axed in 2026 instead of exiting its 4-year beta


Овочі можусть стати розкішшю для українців


Платформа «DатаРу Облако» аттестована для работы с государственными данными и информацией повышенной категории

Директор Росгвардии Герой России генерал Виктор Золотов принял участие в заседании Национального антитеррористического комитета

Nexign Interconnect получила сертификат совместимости с российской Java-платформой Axiom JDK

Всё об операциях на почках: показания, какие бывают и как проходят


Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления

Директор Росгвардии Герой России генерал Виктор Золотов принял участие в заседании Национального антитеррористического комитета

Когда ударят первые морозы: подробный и точный прогноз на осень-2025

Московский суд взыскал с Басты долг по коммунальным платежам


Баста и его супруга задолжали за коммунальные услуги

РИА Новости: суд в Москве взыскал с Басты долг по коммунальным платежам

Ветераны Росгвардии обсудили актуальные вопросы поддержки участников специальной военной операции

«Ведомости»: У курирующего вопросы Армении главы администрации Путина появятся новые полномочия


Андрей Рублёв обыграл Лёнера Тьена на старте «Мастерса» в Цинциннати

В Цинциннати остановили матчи ATP и WTA из-за пожара генератора

Вероника Кудерметова в третьем круге турнира WTA: победа в Цинциннати!

Потапова проиграла Свёнтек во втором круге турнира WTA в Цинциннати


В США раскрыли присутствие неизвестного участника на саммите в Аляске

Отзывы о франшизе «Автополка»

Праздник «Дни литературы в Кузбассе 2025» пройдет в сентябре

это мне взрослому такой издевательство и все ссылаеются как папа


Музыкальные новости

Суд вынес решение о выплате рэпером Бастой долга по коммунальным платежам

Дима Билан сплясал на крыше трактора в Ленинградской области

Добро в каждой чашке: Елизавета Боярская, фонд «Жизнь в Движении» и сеть кофеен «Ягода» запускают авторский кофе для помощи детям с ОВЗ

Экстрасенс объяснила, как у Тимати возник «венец безбрачия» и чем это чревато


Директор Росгвардии Герой России генерал Виктор Золотов принял участие в заседании Национального антитеррористического комитета

Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления

Nexign Interconnect получила сертификат совместимости с российской Java-платформой Axiom JDK

Всё об операциях на почках: показания, какие бывают и как проходят


Рок-фестиваль «Окна Открой» в Петербурге: возвращение звезд и открытие новых талантов

В регионах центральной России росгвардейцы отметили День физкультурника

«Бежим за Мечту — Ходить»: подростки на протезах пробегут марафон в Екатеринбурге

На фоне ограничений из Пулково отменили 18 рейсов


Преимущества франшизы «Автополка»

Baza: Мотоциклист попал в ДТП в Москве из-за нарушившего ПДД водителя

Магазин автозапчастей франшиза – успешное и прибыльное предприятие

Выбор подходящей франшизы автозапчастей


Почему Трамп сказал, что едет в Россию, если встреча назначена в Аляске

В России объяснили скорую организацию встречи Путина и Трампа

Почему Трамп захотел быстро встретиться с Путиным, объяснил Хазин

Bloomberg: встреча Путина и Трампа сама по себе представляет победу Москвы




Здоровье Бориса Щербакова: обновленные сведения от научно-исследовательского центра имени Склифосовского

Солнечному мальчику необходимо лекарство, чтобы спасти сердце от перегрузок

Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления

Подмосковный травматолог дал советы по выбору рюкзака для первоклассника


Зеленский пригрозил «третьей мировой войной» в случае давления на Киев в вопросе уступок территорий


Журова о возвращении граждан, сменивших гражданство: «Практически невозможно»

На пенсии отоспишься. 13 идей для ночного досуга в Москве — от тенниса до парилки

Сотрудники Росгвардии пришли на помощь женщине, внезапно потерявшей сознание на улице

Сотрудники и военнослужащие Росгвардии обеспечили безопасность футбольного матча


Лукашенко получил первую золотую монету из белорусского сырья


Собянин рассказал, как проект «Город героев» укрепляет связь времен и поколений

Сергей Собянин. Главное за день

Собянин оценил вклад проектов "Город героев" и "Герой моего района

Сергей Собянин: Герои — не какие-то особенные люди, они живут рядом с нами


Что подготовили в павильонах «Музеона» в рамках форума «Москва 2030»

Хватит морщиться: ученые назвали пользу от участившихся московских ливней

Площадь возгорания на горе Куцай достигла 650 тысяч квадратных метров

Погода сошла с ума? Главный синоптик России Вильфанд предупреждает: аномалий будет все больше - то в жар, то в холод


это мне взрослому такой издевательство и все ссылаеются как папа

Отзывы о франшизе «Автополка»

В США раскрыли присутствие неизвестного участника на саммите в Аляске

Баста и его супруга задолжали за коммунальные услуги


На Новой Земле провели испытания межконтинентальной крылатой ракеты «Буревестник»

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

Заместитель прокурора Архангельской области и Ненецкого автономного округа Павел Матанцев проверил ход ремонтных работ в школе № 1 г. Нарьян-Мара

Сотрудниками полиции и Росгвардии задержан гражданин, причастный к поджогу релейного шкафа в Архангельской области


Прогноз погоды в Крыму на 12 августа

Новый автобус свяжет Крым и Астрахань

Прогноз погоды в Крыму на 11 августа

Прогноз погоды в Крыму на понедельник


Инцидент с ребёнком: СК начал проверку после того, как девочку засосало в трубу бассейна в Москве

Баста и его супруга задолжали за коммунальные услуги

Исследование выявило число россиян, которые избегают покупок на маркетплейсах

полторашка ьля полторашка орут знакомые а мне лишь утопии писать и фантасгармонии














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *