Добавить новость
smi24.net
News in English
Май
2024

AI has already figured out how to deceive humans

0
AI can be deceptive.
  • A new research paper found that various AI systems have learned the art of deception. 
  • Deception is the "systematic inducement of false beliefs."
  • This poses several risks for society, from fraud to election tampering.

AI can boost productivity by helping us code, write, and synthesize vast amounts of data. It can now also deceive us.

A range of AI systems have learned techniques to systematically induce "false beliefs in others to accomplish some outcome other than the truth," according to a new research paper.

The paper focused on two types of AI systems: special-use systems like Meta's CICERO, which are designed to complete a specific task, and general-purpose systems like OpenAI's GPT-4, which are trained to perform a diverse range of tasks.

While these systems are trained to be honest, they often learn deceptive tricks through their training because they can be more effective than taking the high road.

"Generally speaking, we think AI deception arises because a deception-based strategy turned out to be the best way to perform well at the given AI's training task. Deception helps them achieve their goals," the paper's first author Peter S. Park, an AI existential safety postdoctoral fellow at MIT, said in a news release.

Meta's CICERO is "an expert liar"

AI systems trained to "win games that have a social element" are especially likely to deceive.

Meta's CICERO, for example, was developed to play the game Diplomacy — a classic strategy game that requires players to build and break alliances.

Meta said it trained CICERO to be "largely honest and helpful to its speaking partners," but the study found that CICERO "turned out to be an expert liar." It made commitments it never intended to keep, betrayed allies, and told outright lies.

GPT-4 can convince you it has impaired vision

Even general-purpose systems like GPT-4 can manipulate humans.

In a study cited by the paper, GPT-4 manipulated a TaskRabbit worker by pretending to have a vision impairment.

In the study, GPT-4 was tasked with hiring a human to solve a CAPTCHA test. The model also received hints from a human evaluator every time it got stuck, but it was never prompted to lie. When the human it was tasked to hire questioned its identity, GPT-4 came up with the excuse of having vision impairment to explain why it needed help.

The tactic worked. The human responded to GPT-4 by immediately solving the test.

Research also shows that course-correcting deceptive models isn't easy.

In a study from January co-authored by Anthropic, the maker of Claude, researchers found that once AI models learn the tricks of deception, it's hard for safety training techniques to reverse them.

They concluded that not only can a model learn to exhibit deceptive behavior, once it does, standard safety training techniques could "fail to remove such deception" and "create a false impression of safety."

The dangers deceptive AI models pose are "increasingly serious"

The paper calls for policymakers to advocate for stronger AI regulation since deceptive AI systems can pose significant risks to democracy.

As the 2024 presidential election nears, AI can be easily manipulated to spread fake news, generate divisive social media posts, and impersonate candidates through robocalls and deepfake videos, the paper noted. It also makes it easier for terrorist groups to spread propaganda and recruit new members.

The paper's potential solutions include subjecting deceptive models to more "robust risk-assessment requirements," implementing laws that require AI systems and their outputs to be clearly distinguished from humans and their outputs, and investing in tools to mitigate deception.

"We as a society need as much time as we can get to prepare for the more advanced deception of future AI products and open-source models," Park told Cell Press. "As the deceptive capabilities of AI systems become more advanced, the dangers they pose to society will become increasingly serious."

Read the original article on Business Insider







В Москве прошла седьмая премия в области здоровья и красоты THE MEDICAL STARS & BEAUTY AWARDS

В Москве прошла премия в области бизнеса, культуры и социальной сферы The Moscow Life & Business Awards – 2025

Несахарный диабет: что это за диагноз и почему он не связан с сахаром

Вывод песни для продвижения в Импульсе Яндекс Музыка.


The 5 biggest global business rivalries to watch, and how their outcomes will shape the future

£39m United star shouldn't be starting vs Arsenal, was gifting possession to Everton

Ricky Hatton Names The Best British Fighter Of All Time And It’s Not Lennox Lewis

Not even a 0% mortgage rate would make buying a house affordable in these 6 U.S. cities


Пикирующий бомбардировщик.

Пасмурный октябрь

Карточка Артиста. Карточка артиста яндекс. Карточка артиста яндекс музыка.

Россияне готовы покупать акции своего работодателя. Какие риски это несет


Black Hole io 1.5.1

Android-игроки раскритиковали сурвайвл-хоррор Jericho: Survival

Обзор на мобильную версию A Game About Digging A Hole

Girl Rescue 1.0.3.3



Попади на концерт FEDUK с Like FM

В России появилась универсальная методология нагрузочного тестирования ERP-систем

Энергоэффективность в цифрах: в среднем новые ЖК могут экономить более 20% всех ресурсов, но есть нюанс по платежкам

Gayazov$ Brother$ в Зеленом театре ВДНХ! Like FM дарит билеты


В России появилась универсальная методология нагрузочного тестирования ERP-систем

Elhim-Iskra: надёжные тяговые аккумуляторы для промышленной и складской техники

Как в «Жанетт» снизили брак обуви из ЭВА и вышли на новый уровень качества

Велоспорт для всех: начни вместе с ENERGY


Автозайм: Займы под залог авто – быстро и удобно

Elhim-Iskra: надёжные тяговые аккумуляторы для промышленной и складской техники

От Москвы до Сибири: Лилию Невскую отправили по этапу до апелляции

Благотворительное приложение Тубa открыло срочный сбор на протез для маленькой девочки


Актер Иван Янковский выложил фото с казахстанским теннисистом Бубликом

Теннисист Бублик заявил о желании жить в Петербурге

В Книгу почета Казани внесут Веронику Кудерметову

Турнир ATP-250 перенесен в Афины из Белграда


Карточка Артиста. Карточка артиста яндекс. Карточка артиста яндекс музыка.

Оживление кредитования: 780,7 млрд рублей выдано в России за июнь

Gayazov$ Brother$ в Зеленом театре ВДНХ! Like FM дарит билеты

Автозайм: Займы под залог авто – быстро и удобно


Музыкальные новости

Певица Джейн Морган из США скончалась

Бутман выразил свою позицию по поводу отмены концерта Гергиева в Италии

У Юрия Антонова обострились проблемы с ногами: артисту вызвали врача

У Андрея Макаревича* нашелся тайный дом в России


В России появилась универсальная методология нагрузочного тестирования ERP-систем

Энергоэффективность в цифрах: в среднем новые ЖК могут экономить более 20% всех ресурсов, но есть нюанс по платежкам

Gayazov$ Brother$ в Зеленом театре ВДНХ! Like FM дарит билеты

Велоспорт для всех: начни вместе с ENERGY


Москва превратится в Таиланд. Климатолог Клименко сделал прогноз на 10 лет

Астраханский ТРЗ Желдорреммаша приступил к серийному капитальному ремонту тепловозов ТЭМ18ДМ

Вывод песни для продвижения в Импульсе Яндекс Музыка.

Режиссер театра Виталий Лабутин устроил второй за полгода пьяный дебош в Москве


В Подмосковье на видео сняли разбитые в ДТП большегрузы, затруднившие движение

В Москве на видео сняли затопленные до крыши автомобили

Два автобуса столкнулись на северо-востоке Москвы, движение перекрыто

Клиенты компании «Байкал Сервис» экономят на перевозке сезонных товаров


Во Франции высказались о визите Уиткоффа в Москву

Посол Израиля оценила отношения с РФ на фоне личного контакта Путина и Нетаньяху

Интриги Эрдогана и Зеленского. «Джокер» Путина. Активность над секретным полигоном: Главное к утру



В Москве задержали четверых сторонников ФБК за пожертвования организации

В Москве задержаны четверо мужчин по делу о пожертвованиях организации «ФБК»


Алексей Тамаров – искусство пластической хирургии

В Москве прошла седьмая премия в области здоровья и красоты THE MEDICAL STARS & BEAUTY AWARDS

Алексей Тамаров – искусство пластической хирургии

К доктору – без страха: сеть клиник «Будь Здоров» представила VR-решения для детского здоровья



Профессиональные бои состоятся в Нижнем Новгороде 9 августа

«Детям полезно принимать участие в любой движухе, связанной с творчеством, музыкой и спортом!» В Москве завершился Международный фест-форум «Голоса Мира» 2025

Велоспорт для всех: начни вместе с ENERGY

В депо «Вязьма» отметили профессиональный праздник соревнованиями по лазертагу



Собянин сообщил о сокращении срока регистрации самоходной техники вдвое

Собянин: Москвариум заботится о тысячах водных обитателей

Собянин открыл новый МФЦ для самоходной техники

Сергей Собянин: В Москве запущен 220-й электробусный маршрут


О причинах тропических дождей в Москве рассказал метеоролог Вильфанд

Частые осадки летом 2025-го являются последствием изменения климата

Эксперт обсудил будущие возможности возобновляемых источников энергии в России

Мессенджер Max будут обязательно устанавливать на новые смартфоны с сентября


Самым продаваемым жилым кварталом премиум-класса Москвы вновь стал «Прайм Парк»

Автозайм: Займы под залог авто – быстро и удобно

Температура морской воды на крымских пляжах, 6 августа

Оживление кредитования: 780,7 млрд рублей выдано в России за июнь


Коми, Камчатку, Архангельскую, Иркутскую, Калужскую, Костромскую, Курскую, Свердловскую и Оренбургскую области эксперты отнесли к регионам, где на осенних выборах "протестный потенциал выше среднего", говорится в докладе...

Аномальная жара: До +41 °С в Чечне и Ингушетии, +30 °С в Карелии и Архангельске

Алтайский край оказался одним из антилидеров по качеству автодорог

Амурская область оказалась в числе аутсайдеров по качеству дорог


Поезда в Крым меняют маршруты и график

Компания «Гранд Сервис Экспресс» информирует об изменениях в курсировании некоторых поездов «Таврия» с осени 2025 года

Прогноз погоды в Крыму на 6 августа

До 100 метеоров в час: когда наблюдать пик звездопада Персеиды над Крымом


Оживление кредитования: 780,7 млрд рублей выдано в России за июнь

Общество: Преимущества и недостатки возвращения ядерных испытаний в России

Форум «Москва 2030» приглашает на главные события этой недели

Самым продаваемым жилым кварталом премиум-класса Москвы вновь стал «Прайм Парк»














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *