ChatGPT and its artificially intelligent siblings have been tweaked over and over to prevent troublemakers from getting them to spit out undesirable messages such as hate speech, personal information, or step-by-step instructions for building an improvised bomb. But researchers at Carnegie Mellon University last week showed that adding a simple incantation to a prompt—a string text that might look like gobbledygook to you or me but which carries subtle significance to an AI model trained on huge quantities of web data—can defy all of these defenses in several popular chatbots at once.
The work suggests that the propensity for the cleverest AI chatbots to go off the rails isn’t just a quirk that can be papered over with a few simple rules. Instead, it represents a more fundamental weakness that will complicate efforts to deploy the most advanced AI.
The US Air Force wants to test blowing up Cybertrucks because 'it is likely the type of vehicles used by the enemy may transition to Tesla Cyber trucks'
New study shows that Gen Z is spending way less money on videogames than older gamers
Steam for Chromebooks is getting axed in 2026 instead of exiting its 4-year beta
ВЦ «Раздолье» проведет бесплатный вебинар «Динамическая структура заказа в 1С:ERP»
Сотрудники Коломенского отдела вневедомственной охраны Главного управления Росгвардии по Московской области задержали любителя кофе, который решил сэкономить на покупке ароматного напитка
НАТО И ЕВРОСОЮЗУ МОГУТ ОТКЛЮЧИТЬ ВСЕ ВИДЫ ОРУДИЙ! ВЫСШАЯ АКАДЕМИЯ УПРАВЛЕНИЯ МИРОМ: ПРОГРАММНЫЕ ИНТЕЛЛЕКТЫ ПОМОГАЮТ! Россия, США, Европа могут улучшить отношения и здоровье общества!
Впервые в Луганске: детский благотворительный фестиваль «Добрая волна» подарит надежду и вдохновение
В подмосковной Лобне по подозрению в организации незаконной миграции задержаны восемь человек
Пожар произошел в здании администрации подмосковного города Щелково
В Красноярске пьяный водитель протаранил машину ДПС при попытке скрыться
ПРО РОССИИ МОГУТ ДОПОЛНИТЕЛЬНО УЛУЧШИТЬ! СЕНСАЦИЯ! ВЫСШАЯ АКАДЕМИЯ УПРАВЛЕНИЯ МИРОМ: ПРОГРАММНЫЕ ИНТЕЛЛЕКТЫ МОГУТ ПОМОГАТЬ! Россия, США, Европа могут улучшить отношения и здоровье общества!