Добавить новость
smi24.net
News in English
Май
2024

AI Systems Are Already Skilled At Deceiving And Manipulating Humans

0

Many artificial intelligence (AI) systems have already learned how to deceive humans, even systems that have been trained to be helpful and honest. In a review article publishing in the journal Patterns on May 10, researchers describe the risks of deception by AI systems and call for governments to develop strong regulations to address this issue as soon as possible.

“AI developers do not have a confident understanding of what causes undesirable AI behaviors like deception,” says first author Peter S. Park, an AI existential safety postdoctoral fellow at MIT. “But generally speaking, we think AI deception arises because a deception-based strategy turned out to be the best way to perform well at the given AI’s training task. Deception helps them achieve their goals.”

Park and colleagues analyzed literature focusing on ways in which AI systems spread false information—through learned deception, in which they systematically learn to manipulate others.

The most striking example of AI deception the researchers uncovered in their analysis was Meta’s CICERO, an AI system designed to play the game Diplomacy, which is a world-conquest game that involves building alliances. Even though Meta claims it trained CICERO to be “largely honest and helpful” and to “never intentionally backstab” its human allies while playing the game, the data the company published along with its Science paper revealed that CICERO didn’t play fair.

“We found that Meta’s AI had learned to be a master of deception,” says Park. “While Meta succeeded in training its AI to win in the game of Diplomacy—CICERO placed in the top 10% of human players who had played more than one game—Meta failed to train its AI to win honestly.”

Other AI systems demonstrated the ability to bluff in a game of Texas hold ‘em poker against professional human players, to fake attacks during the strategy game Starcraft II in order to defeat opponents, and to misrepresent their preferences in order to gain the upper hand in economic negotiations.

While it may seem harmless if AI systems cheat at games, it can lead to “breakthroughs in deceptive AI capabilities” that can spiral into more advanced forms of AI deception in the future, Park added.

Some AI systems have even learned to cheat tests designed to evaluate their safety, the researchers found. In one study, AI organisms in a digital simulator “played dead” in order to trick a test built to eliminate AI systems that rapidly replicate.

“By systematically cheating the safety tests imposed on it by human developers and regulators, a deceptive AI can lead us humans into a false sense of security,” says Park.

The major near-term risks of deceptive AI include making it easier for hostile actors to commit fraud and tamper with elections, warns Park. Eventually, if these systems can refine this unsettling skill set, humans could lose control of them, he says.

“We as a society need as much time as we can get to prepare for the more advanced deception of future AI products and open-source models,” says Park. “As the deceptive capabilities of AI systems become more advanced, the dangers they pose to society will become increasingly serious.”

While Park and his colleagues do not think society has the right measure in place yet to address AI deception, they are encouraged that policymakers have begun taking the issue seriously through measures such as the EU AI Act and President Biden’s AI Executive Order. But it remains to be seen, Park says, whether policies designed to mitigate AI deception can be strictly enforced given that AI developers do not yet have the techniques to keep these systems in check.

“If banning AI deception is politically infeasible at the current moment, we recommend that deceptive AI systems be classified as high risk,” says Park.

This work was supported by the MIT Department of Physics and the Beneficial AI Foundation.








Без ошибки определяем точный день зачатия

Лендруш Егикян: человек, который сохраняет высокую миссию быть армянином вдали от Родины

Антитела альпак помогли ученым создать новые методы лечения рака

Custom Clinic - это клиника в центре Санкт-Петербурга, где решают проблему выпадения волос комплексно и эффективно


Report: Liverpool decision hands advantage to Man United in midfielder pursuit

Report: AC Milan’s Christian Pulisic set to team up with $87 million Manchester United star

Man Utd have agreed deal with AC Milan for £40m star's exit, await player decision - report

OpenAI launches GPT-5, its most powerful AI yet—will it be enough to stay ahead in today’s ruthless AI race? 


Мобильный терминал сбора данных с ридером RFID тегов Saotron RT41G

Сотрудниками полиции и Росгвардии задержан гражданин, причастный к поджогу релейного шкафа в Архангельской области

Операционная система «АльтерОС» совместима с программным комплексом «Энергосфера 9»

CorpSoft24 предоставил сервера для нужд машинного обучения


Steam for Chromebooks is getting axed in 2026 instead of exiting its 4-year beta

Находи идеальные места для персонажей-фигурок в «Is This Seat Taken?»

Mafia: The Old Country получила положительные оценки в Steam

The US Air Force wants to test blowing up Cybertrucks because 'it is likely the type of vehicles used by the enemy may transition to Tesla Cyber trucks'


Овочі можусть стати розкішшю для українців


Семейное приключение на «Кораблике Детского радио»

В регионах центральной России росгвардейцы отметили День физкультурника

Сотрудники Росгвардии пришли на помощь пенсионеру, внезапно потерявшему сознание в кафе на востоке столицы

Чемпионат по самбо столичного главка Росгвардии завершился в Москве


Сотрудники Росгвардии пришли на помощь пенсионеру, внезапно потерявшему сознание в кафе на востоке столицы

Грачья Погосян: достойный пример гуманизма и патриотизма (к 55-летию известного благотворителя)

Подмосковный травматолог дал советы по выбору рюкзака для первоклассника

Антиармянские публикации в российском научном журнале «Современная научная мысль»: расследование фонда «Гегард»


Директор ФСБ России Александр Бортников провёл заседание НАК

Самарский клуб победит на «Фиште»? «Сочи» — «Крылья Советов»: прогноз и ставка

В музее-заповеднике «Архангельское» впервые пройдет фестиваль «Jazzовые сезоны»

Педиатр объяснил, зачем нужна проверка репродуктивного здоровья с шести лет


Андрей Рублёв обыграл Лёнера Тьена на старте «Мастерса» в Цинциннати

Хачанов достиг третьего раунда теннисного турнира «Мастерс»

Кафельников: Бублик поносил ATP-250. Если бы не эти турниры, он бы «челленджеры» играл

Вероника Кудерметова в третьем круге турнира WTA: победа в Цинциннати!


Гаишники оштрафовали дрифтившего на юге Москвы водителя

Самарский клуб победит на «Фиште»? «Сочи» — «Крылья Советов»: прогноз и ставка

В музее-заповеднике «Архангельское» впервые пройдет фестиваль «Jazzовые сезоны»

Бинджвотчинг и думстриминг: как стриминги повлияли на наши привычки? Рассказывает киноколумнист PEOPLETALK Артем Ремизов


Музыкальные новости

Песни Победы прозвучали в парке Пскова в исполнении юных музыкантов. ФОТО

«Я принципиально не написала его имя!» Марина Кравец отказалась петь песню Натана в шоу «Большой хит» на ТНТ

Продвижение Песни в Импульсе Яндекс Музыка.

Би-би-си выпустит документальный фильм об Оззи Осборне


Сотрудники Росгвардии пришли на помощь пенсионеру, внезапно потерявшему сознание в кафе на востоке столицы

Семейное приключение на «Кораблике Детского радио»

Чудо-колонка Детского радио: малыш будет в восторге!

Чемпионат по самбо столичного главка Росгвардии завершился в Москве


«Бежим за Мечту — Ходить»: подростки на протезах пробегут марафон в Екатеринбурге

В Пулково 10 августа задержали десяток рейсов – есть отмены

Будут ли магнитные бури сегодня, 10 августа 2025 года?

Абрау Дюрсо, аналитика по компании #ABRD #обзор


Автобус насмерть задавил подростка на электросамокате в Москве

Российский рэпер сжег кабриолет BMW прямо на сцене

В Сети появились кадры ДТП с подростками на самокате, которые врезались в столб

Хуснуллин по видеосвязи поприветствовал участников автопробега БРИКС


Bloomberg: встреча Путина и Трампа означает победу России

Хазин объяснил, почему Путин и Трамп решили встретиться на Аляске

Почему Трамп захотел быстро встретиться с Путиным, объяснил Хазин

В Москве надеются, что встреча Путина и Трампа придаст импульс отношениям РФ и США




Косметолог-эстетист Наталья Рябинова: самые эффективные способы борьбы с веснушками

Уровень медицины в Некрасовке растет

В регионах центральной России росгвардейцы отметили День физкультурника

Врач-онколог Денис Романов: «Современные исследования предполагают важное значение митохондрий в развитии и росте клеток опухоли»


Политолог: Алиев пересек красную линию и столкнется с ответом Москвы

«Будет обмен землей»: Трамп поставил Зеленского на место, вызвав панику в Киеве


В регионах центральной России росгвардейцы отметили День физкультурника

Соревнования по многоборью кинологов-росгвардейцев завершились в Грозном

Росгвардейцы охраняли правопорядок на фестивале «ЛИГА ТРИАТЛОНА & IRONSTAR МОСКВА 2025»

Чемпионат по самбо столичного главка Росгвардии завершился в Москве


Лукашенко получил первую золотую монету из белорусского сырья


Собянин заявил об уничтожении пятого БПЛА, который летел на Москву

Собянин оценил вклад проектов "Город героев" и "Герой моего района

Собянин рассказал, как проект «Город героев» укрепляет связь времен и поколений

Собянин рассказал о строительстве нового путепровода на северо-востоке Москвы


В Крыму потушили угрожавший двум селам природный пожар

Преимущества применения озона для очистки воды

Орловская область планирует войти в число национальных туристических маршрутов с проектом «Бирюзовое кольцо России»

Хватит морщиться: ученые назвали пользу от участившихся московских ливней


Билайн увеличивает емкость сети более чем в 2 раза в Самарской области

Гаишники оштрафовали дрифтившего на юге Москвы водителя

Педиатр объяснил, зачем нужна проверка репродуктивного здоровья с шести лет

22 млн рублей направят на ПО системы распознавания лиц в Нижегородской области


Сотрудниками полиции и Росгвардии задержан гражданин, причастный к поджогу релейного шкафа в Архангельской области

В Алтайском крае не будут проводить проверку на предмет чрезмерного роста тарифов на ЖКУ

Орловская область планирует войти в число национальных туристических маршрутов с проектом «Бирюзовое кольцо России»

без заголовка


Прогноз погоды в Крыму на 10 августа

Прогноз погоды в Крыму на понедельник

Когда достроят больницу скорой помощи и онкодиспансер в Севастополе

Историко-краеведческая выставка «Древности земли крымской»


22 млн рублей направят на ПО системы распознавания лиц в Нижегородской области

В июле вторичный рынок жилья вырос в Москве на 17%

Андрей Воробьев: В 2025 году в Подмосковье откроются 33 новые школы

В музее-заповеднике «Архангельское» впервые пройдет фестиваль «Jazzовые сезоны»














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *