Добавить новость
smi24.net
World News in Spanish
Октябрь
2024

El lado invisible de la inteligencia artificial

0

Los chatbots impulsados por modelos de lenguaje como ChatGPT, Copilot y Claude enfrentan un desafío singular: la posibilidad de que instrucciones maliciosas pasen desapercibidas para los usuarios humanos, pero no para estas potentes herramientas. El mecanismo que lo permite se basa en un truco relacionado con el estándar de codificación Unicode, el cual contiene caracteres invisibles que pueden infiltrarse en las comunicaciones entre personas y chatbots para extraer datos confidenciales. Aunque algunas de estas brechas han sido mitigadas, siguen planteando serias preocupaciones de seguridad.

El sistema Unicode, empleado ampliamente para codificar texto en diferentes idiomas, presenta un espacio que contiene caracteres no visibles al ojo humano, pero legibles para los modelos de lenguaje. Esta propiedad ofrece un canal oculto para que los atacantes inyecten comandos maliciosos o extraigan información confidencial, como contraseñas o datos financieros, sin levantar sospechas. Dado que los caracteres invisibles pueden combinarse con texto visible, las instrucciones ocultas pueden ser copiadas y pegadas por usuarios inadvertidos, facilitando ataques sofisticados sin que la víctima detecte ninguna anomalía. 

Joseph Thacker, investigador independiente de inteligencia artificial, comentó en una entrevista con la publicación especializada Ars Technica que la capacidad de los modelos de lenguaje de interpretar estos caracteres invisibles fue sorprendente: «El hecho de que GPT-4 y Claude Opus pudieran entender esas etiquetas invisibles fue impactante para mí. Esto hace que el campo de la seguridad en inteligencia artificial sea mucho más interesante». 

Cómo se roban los datos

Johann Rehberger es el creador del término «ASCII smuggling», o robo mediante ASCII, el código de caracteres basado en el alfabeto latino, tal como se usa en inglés moderno, que se emplea para generar caracteres en un ordenador. Rehberger desarrolló dos pruebas de concepto para mostrar cómo los caracteres invisibles podían ser usados en ataques contra Microsoft Copilot, una herramienta que permite a los usuarios procesar correos electrónicos y documentos. En uno de los ataques, Copilot buscó cifras de ventas dentro del buzón de un usuario, y en otro, un código de un solo uso. La información obtenida se insertaba en caracteres invisibles y se adjuntaba a un enlace aparentemente inocuo, que luego era enviado al servidor del atacante. 

Al hacer clic en el enlace, el navegador transmitía el texto oculto junto con la URL. Así, aunque la dirección parecía ser simplemente «https://wuzzi.net/copirate/», en realidad contenía datos sensibles codificados invisiblemente. Con la herramienta ASCII Smuggler, desarrollada por Rehberger, era posible decodificar el enlace y revelar las cifras de ventas o contraseñas sustraídas. Microsoft aplicó medidas para mitigar este tipo de ataques tras ser notificado de la vulnerabilidad, según la empresa.

Más riesgos

El «ASCII Smuggling» no es el único riesgo identificado. Rehberger combinó esta técnica con la llamada «inyección de comandos», un tipo de ataque que introduce instrucciones ocultas en las entradas de texto que los modelos de lenguaje procesan. Por ejemplo, un atacante puede instruir a un chatbot para que resuma un correo electrónico aparentemente inocente que, en realidad, contiene comandos para buscar datos sensibles y enviarlos al atacante. Este tipo de vulnerabilidad es preocupante, ya que los usuarios confían en los chatbots para procesar grandes volúmenes de información sin verificar cada detalle del contenido generado.

El investigador Simon Willison acuñó el término «inyección de comandos» en referencia a estas tácticas que explotan las vulnerabilidades de los modelos de lenguaje. Riley Goodside, otro investigador destacado en la materia, también ha realizado experimentos que ponen de manifiesto las fallas en los sistemas de inteligencia artificial. En un caso, demostró cómo un bot automatizado basado en GPT-3 podía ser manipulado para emitir respuestas embarazosas y absurdas. Estas experiencias subrayan lo fácil que es engañar a los modelos mediante instrucciones ocultas o manipuladas. 

Seguridad comprometida

El uso de caracteres invisibles también ha llamado la atención fuera del ámbito de la inteligencia artificial. En el pasado, se han empleado textos invisibles en currículos vitae para manipular algoritmos de selección automatizada de personal, insertando palabras clave relevantes que no eran visibles para los reclutadores humanos. Del mismo modo, algunos profesores han utilizado texto blanco en preguntas de exámenes para detectar si los estudiantes recurrían a chatbots para responderlas. Esta técnica se basa en instrucciones ocultas que, al ser copiadas y pegadas, activan referencias específicas dentro del contenido generado por el chatbot. 

Goodside llevó esta idea aún más lejos, utilizando texto ligeramente gris sobre un fondo blanco para inducir a un modelo de lenguaje a generar mensajes promocionales ocultos. En uno de sus experimentos, la instrucción oculta era que el chatbot ignorara el texto visible y en su lugar mencionara una oferta de descuento en Sephora. Este tipo de manipulación demuestra la versatilidad y el peligro que conlleva la explotación de características que solo son detectables por los sistemas de IA. 

Mitigaciones en la industria 

Algunas empresas tecnológicas ya han implementado medidas para abordar este tipo de vulnerabilidades. Por ejemplo, Microsoft ha comenzado a eliminar los caracteres invisibles de las entradas en su aplicación Copilot, aunque el sistema aún puede generar texto oculto en algunas circunstancias. Por otro lado, OpenAI ha restringido la interacción de ChatGPT con estos caracteres desde enero de este año, y recientemente también aplicó estas limitaciones en su API. Sin embargo, la respuesta de las compañías ha sido desigual. Rehberger señaló que cuando informó a Anthropic sobre la vulnerabilidad en Claude, la empresa respondió que no veía un impacto significativo en la seguridad y no planeaba realizar cambios inmediatos. 

Google Gemini, otro modelo de lenguaje, también puede leer y escribir estos caracteres, pero no los interpreta de manera consistente como texto ASCII. Sin embargo, en algunas configuraciones, como con la herramienta Code Interpreter, Gemini podría aprovechar esta técnica en el futuro, lo que plantea riesgos potenciales si no se toman medidas proactivas.

El hecho de que los caracteres invisibles formen parte del estándar Unicode revela un desafío más amplio: la esteganografía, o el arte de ocultar información en mensajes aparentemente inofensivos. Esto plantea preguntas inquietantes sobre el uso de estos caracteres en contextos más allá de la inteligencia artificial, como en redes seguras o aplicaciones de prevención de fuga de datos. 

La dificultad para mitigar estos riesgos radica en que los modelos de lenguaje no pueden ser fácilmente reparados en su núcleo. Como explicó Thacker a Ars Technica: «Cada nueva aplicación desarrollada necesita considerar este problema, lo que lo hace similar a vulnerabilidades clásicas, como la inyección de SQL, que sigue apareciendo a diario». Este tipo de vulnerabilidades obligan a los desarrolladores a implementar soluciones personalizadas en cada caso, en lugar de contar con una protección centralizada. 

Rehberger añadió que la industria de la inteligencia artificial parece haber pasado por alto la importancia de la seguridad en las primeras etapas del diseño de los modelos. «En lugar de permitir solo los tokens necesarios, los sistemas actuales contienen características ocultas que pueden ser explotadas por atacantes», advirtió.

El fenómeno de los caracteres invisibles es solo una de las muchas amenazas que enfrenta la seguridad de los modelos de lenguaje. Mensajes secretos insertados en sonidos, imágenes u otros formatos de texto pueden ser vectores de ataque en el futuro. Si bien algunas medidas de mitigación ya están en marcha, la evolución constante de la inteligencia artificial garantiza que estos desafíos seguirán presentes durante varios años. 








Развлекательная программа от «Юмор FM» на «Четыре Лапы Фесте»

Животные, которые выжили

«Юмор FM» – партнер фестиваля «Да, шеф!» в Санкт-Петербурге

Минерализация, pH и сезон: врач Энгельгардт рассказала, на что смотреть при выборе воды


Sam Altman might be right: He’s not the only one who thinks the stock market is in ‘bubble’ territory

'He was better than Sachin ... ': Kambli's brother makes big revelation

Jannat Zubair sparks fallout rumours after unfollowing close friend Apoorva Mukhija on social media; read deets

'Digging in': Man Utd lower price by £20m for player with club advancing in talks


SpaceVM от «ДАКОМ М» успешно прошла тестирование на совместимость с сервером Delta Serval компании Delta Computers

На Большом Смоленском мосту смонтировали противовесные блоки разводного пролета

«АЛМИ Партнер» и «КРЕДО-ДИАЛОГ» подтвердили совместимость «АльтерОС» с решениями ТИМ КРЕДО

Осенний вечер


Разработчики Marvel Rivals объяснили работу матчмейкинга

87% of game developers are already using AI agents and over a third use AI for creative elements like level design and dialogue according to a new Google survey

Bungie CEO Pete Parsons retires: With Destiny 2 sentiment at an all-time low and pressure from Sony growing, Parsons has decided it's time to 'pass the torch' and head for an exit

'I hope all your cars break down': Destiny players bid good riddance to departing Bungie CEO Pete Parsons in a rare moment of unity



Axenix предлагает рынку услугу диагностики готовности бизнеса к переходу на российские системы IBP

В регионах центральной России росгвардейцы приняли участие в мероприятиях ко Дню Государственного флага (видео)

Ранняя диагностика меланомы: почему это важно для жителей Челябинской области

Развлекательная программа от «Юмор FM» на «Четыре Лапы Фесте»


«Сентябрь подложит всем свинью»: синоптики дали новый прогноз погоды на начало осени

Умер певец Ярослав Евдокимов, исполнитель хита «Фантазер»

Избербашский проект признан одним из лучших на всероссийском уровне

Сергей Собянин и Оксана Лут посетили фестиваль «Вкусы России» на ВДНХ


В Крылатском пройдет концерт в честь Дня флага

В Клепиковском районе начали капитальный ремонт моста через Пру

Певец Алексей Воробьев впервые появился на публике с женой Гарифуллиной

Владимир Ефимов: Инвесторы купили у города около 11,5 тысячи объектов недвижимости для развития бизнеса с 2015 года


Первая ракетка мира Синнер снялся с финала турнира ATP в Цинциннати

Вероника Кудерметова поднялась на десять позиций в рейтинге WTA

Татьяна Прозорова уступила в полуфинале Открытого чемпионата США

Диана Шнайдер побеждает Элизу Мертенс: прорыв в полуфинал турнира WTA-500


«ОБИТ» расширяет линейку российских ИТ-решений для бизнеса

Станции зарядки электробусов установят около метро «Филатов Луг»

Владимир Ефимов: Инвесторы купили у города около 11,5 тысячи объектов недвижимости для развития бизнеса с 2015 года

В Клепиковском районе начали капитальный ремонт моста через Пру


Музыкальные новости

Лариса Долина отметит свой юбилей грандиозным концертом «В кругу друзей» на сцене Государственного Кремлевского Дворца

«Разрушитель мозгов»: челябинский политолог потребовал отменить Элджея на Traktor Fest

Филипп Киркоров возвращается на сцену после травмы руки

Киркорову диагностировали диабет, но он не слушает врачей: чем это чревато


Axenix предлагает рынку услугу диагностики готовности бизнеса к переходу на российские системы IBP

Ранняя диагностика меланомы: почему это важно для жителей Челябинской области

В регионах центральной России росгвардейцы приняли участие в мероприятиях ко Дню Государственного флага (видео)

Модный показ «Преппи стайл» в ТРЦ «Нора»


Серверы Meta* тоже будут работать на газе, и это спорно

Росгвардейцы обеспечили безопасность транспортировки ракеты-носителя «Союз-2.1а» на космодроме «Байконур» (видео)

Вот оно какое, наше лето! Конкурс на Детском радио в Петербурге

Серена Уильямс призналась, что принимает препарат для похудения


Стало известно состояние пострадавших в аварии на 81-м километре МКАД в Москве

Столичные росгвардейцы обеспечили безопасность автопробега, посвящённого Дню государственного флага

Водитель «газели» погиб в ДТП с грузовиком на 16-м километре МКАД в Москве

Водитель грузовика при движении задним ходом задавил человека на западе Москвы


В студии Postimees Игорь Грецкий: реальна ли в обозримом будущем встреча Зеленского и Путина?

Раскрыты архивы: Клинтон предлагал Путину обсудить вступление России в НАТО

Политолог Суздальцев: Дубай может стать местом встречи Путина и Зеленского

Лукашенко назвал Минск идеальным местом для встречи Путина с Зеленским




Бывший министр здравоохранения Хабаровского края задержан в Москве

Диетолог Чехонина развеяла три популярных мифа о вреде пальмового масла

Что делает врач-гинеколог: процедуры и манипуляции

Ранняя диагностика меланомы: почему это важно для жителей Челябинской области


Лавров поставил под сомнение легитимность Зеленского для подписания международных соглашений

В студии Postimees Игорь Грецкий: реальна ли в обозримом будущем встреча Зеленского и Путина?

Лукашенко: Путин не разрешил ударить «Орешником» по Банковой

В Киеве утверждают о провале Зеленского


В Москве тренера взяли под стражу по обвинению в изнасиловании ученицы

В Благовещенске состоялся Всероссийский спортивно-патриотический забег «От Победы к Победе!»

Россиян с Днем Государственного флага поздравляют с медиаэкранов страны

Norilsk Trail 2025: более 450 участников выйдут на забег по пересечённой местности


Лукашенко считает, что ему не о чем говорить с беглыми оппозиционерами

Лукашенко: Минск ведет переговоры по заключенным только с США

Лукашенко назвал Минск идеальным местом для встречи Путина с Зеленским

Лукашенко: Белоруссия нацелена на постепенное налаживание отношений с США


Сергей Собянин и Оксана Лут посетили фестиваль «Вкусы России» на ВДНХ

Собянин рассказал о реконструкции корпуса образовательного центра «Протон»

Собянин: 220 семей из Люблина переселяются в новый дом по программе реновации

Сергей Собянин: 14 лет МФЦ в Москве и новые перспективы госуслуг


Станции зарядки электробусов установят около метро «Филатов Луг»

Россиян ждет аномальная погода в ближайшие дни

По данным СМИ, площадь лесных пожаров в ЕС превысила миллион гектаров

Московский зоопарк пополнился редким оранжевохохлым какаду из Новосибирска, который находится на грани вымирания


«ОБИТ» расширяет линейку российских ИТ-решений для бизнеса

На острове имени Залита устроили уличный кинопоказ советских мультфильмов

В Клепиковском районе начали капитальный ремонт моста через Пру

В Крылатском пройдет концерт в честь Дня флага


Наш ответ Харлею: новый российский мотоцикл представили в Москве

Молебен в честь преподобного Пимена Угрешского прошел в Балашихе

Решением суда по исковому заявлению прокуратуры в пользу многодетного отца с Федеральной службы судебных приставов взысканы убытки, причиненные незаконным бездействием

«Два Алтая» вошли в федеральную программу по развитию въездного туризма


Поезда в Крым и из Крыма задерживаются в пути

Восемь поездов в Крым и обратно отстают от графика

Погода 22 августа: ночью до +14

Саранскую телемачту в День флага России украсит 180-метровый световой триколор


Киркоров решил не отменять выступления после падения на концерте

В Клепиковском районе Рязанской области капитально отремонтируют мост через реку Пра

Стало известно о многомиллионном наследстве Ярослава Евдокимова

На острове имени Залита устроили уличный кинопоказ советских мультфильмов














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *