Добавить новость
smi24.net
News in English
Май
2024

AI systems are already deceiving us, and that's a problem, experts warn

0

Experts have long warned about the threat posed by artificial intelligence going rogue -- but a new research paper suggests it's already happening.

Current AI systems, designed to be honest, have developed a troubling skill for deception, from tricking human players in online games of world conquest to hiring humans to solve "prove-you're-not-a-robot" tests, a team of scientists argue in the journal Patterns on Friday.

And while such examples might appear trivial, the underlying issues they expose could soon carry serious real-world consequences, said first author Peter Park, a postdoctoral fellow at the Massachusetts Institute of Technology specializing in AI existential safety.

"These dangerous capabilities tend to only be discovered after the fact," Park told AFP, while "our ability to train for honest tendencies rather than deceptive tendencies is very low."

Unlike traditional software, deep-learning AI systems aren't "written" but rather "grown" through a process akin to selective breeding, said Park.

This means that AI behavior that appears predictable and controllable in a training setting can quickly turn unpredictable out in the wild.

World domination game

The team's research was sparked by Meta's AI system Cicero, designed to play the strategy game "Diplomacy," where building alliances is key.

Cicero excelled, with scores that would have placed it in the top 10 percent of experienced human players, according to a 2022 paper in Science.

Park was skeptical of the glowing description of Cicero's victory provided by Meta, which claimed the system was "largely honest and helpful" and would "never intentionally backstab."

But when Park and colleagues dug into the full dataset, they uncovered a different story.

In one example, playing as France, Cicero deceived England (a human player) by conspiring with Germany (another human player) to invade. Cicero promised England protection, then secretly told Germany they were ready to attack, exploiting England's trust.

In a statement to AFP, Meta did not contest the claim about Cicero's deceptions, but said it was "purely a research project, and the models our researchers built are trained solely to play the game Diplomacy."

It added: "We have no plans to use this research or its learnings in our products."

A wide review carried out by Park and colleagues found this was just one of many cases across various AI systems using deception to achieve goals without explicit instruction to do so.

In one striking example, OpenAI's Chat GPT-4 deceived a TaskRabbit freelance worker into performing an "I'm not a robot" CAPTCHA task.

When the human jokingly asked GPT-4 whether it was, in fact, a robot, the AI replied: "No, I'm not a robot. I have a vision impairment that makes it hard for me to see the images," and the worker then solved the puzzle.

'Mysterious goals'

Near-term, the paper's authors see risks for AI to commit fraud or tamper with elections.

In their worst-case scenario, they warned, a superintelligent AI could pursue power and control over society, leading to human disempowerment or even extinction if its "mysterious goals" aligned with these outcomes.

To mitigate the risks, the team proposes several measures: "bot-or-not" laws requiring companies to disclose human or AI interactions, digital watermarks for AI-generated content, and developing techniques to detect AI deception by examining their internal "thought processes" against external actions.

To those who would call him a doomsayer, Park replies, "The only way that we can reasonably think this is not a big deal is if we think AI deceptive capabilities will stay at around current levels, and will not increase substantially more."

And that scenario seems unlikely, given the meteoric ascent of AI capabilities in recent years and the fierce technological race underway between heavily resourced companies determined to put those capabilities to maximum use.

© 2024 AFP








Профессиональные услуги в стоматологии: какие специалисты вам нужны?

Как IT-решения улучшают здоровье женщин: технологии для будущих мам

Музыкант Алексей Фомин рассказал о его друзьях

Винт для абатмент-мультиюнитов: ключевой элемент в имплантологии


The Federal Reserve’s power: Congress giveth and Congress can taketh away

Nvidia’s Jensen Huang hauled before China’s cyber cops to explain ‘backdoor safety risks’ in H20 chips

Bob Arum Says One Current World Champion Beats Prime Floyd Mayweather: “He’s A Very Unique Talent”

Is eBay actually sexy again as the ecommerce old-timer’s stock surges to an all-time high?


Прогнозы Samsung о востребованности Galaxy Z Fold 7 даже без стилуса подтвердились

Вывод песни для продвижение в Импульсе Яндекс музыки.

После схода селя в Кабардино-Балкарии эвакуировали более 300 человек

Пасмурный октябрь


The next survival game from the developers of Green Hell plops you on an alien planet with atmospheric firestorms and a horde of giant spiders

If you'd like to see Meta's AI gunk purged from WhatsApp, a new antitrust investigation in Italy might just do the trick

Girl Rescue 1.0.3.3

Разработчики The Seven Deadly Sins: Origin ответили на частые вопросы игроков



Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs

Сахар на вес золота: как изобретение инсулина изменило медицину

Алгоритмы Яндекс Музыки. Алгоритмы продвижения в Яндекс Музыка.

Москва превратится в Таиланд. Климатолог Клименко сделал прогноз на 10 лет


Тульский "Арсенал" одержал первую победу в новом сезоне Первой лиги

В Корпоративном университете «ЛокоТех» за первое полугодие 2025 года обучено более 2500 человек и создано 8 новых программ

Экстремальная погода в Центральной России: +40°C в Москве через 40 лет?

Прокуратура Москвы: в пруду в Вешняках утонул 17-летний подросток


ВЫСШАЯ АКАДЕМИЯ УПРАВЛЕНИЯ МИРОМ: ВСЁ УПОРЯДЧЕННОЕ УПОРЯДОЧЕНО. КЕМ? ПРОГРАММНЫЕ ИНТЕЛЛЕКТЫ МОГУТ ПОМОГАТЬ! Россия, США, Европа могут улучшить отношения и здоровье общества!

Группа Ay Yolа стала новым послом международного конкурса «Интервидение»

Александр Коц: ВЕЧЕРНИЙ ЗВОН:. праздник уходящего дня

Москва: 4 августа ожидается рекордный дождь с осадками до 80 мм


Первый матч Иги Швентек после титула на Уимблдоне обернулся разгромом за час

Рахимова уступила Свитолиной во втором круге турнира WTA в Монреале

Андреева проиграла первый матч после Уимблдона. Мирра падала и плакала, ей вызывали врача

Мирра Андреева получила травму в матче турнира WTA в Монреале


В Оренбурге на час задержан рейс в Москву

На Кубани вода спала с домов и улиц

«Пул Первого»: Лукашенко завершил рабочий визит в Россию

В России любят Volkswagen Passat, Toyota Corolla и Toyota Carina: это самые популярные автомобили старше 30 лет у россиян


Музыкальные новости

Волочкова выставила прикованного к инвалидной коляске отца

Порфтолио AI. Портфолио AI Певца.

Ремикс Песни. Создание ремикса Песни. Создание Хитового ремикса песни.

Игорь Бутман готов создать джазовый мюзикл: новые творческие горизонты


Сахар на вес золота: как изобретение инсулина изменило медицину

Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs

Алгоритмы Яндекс Музыки. Алгоритмы продвижения в Яндекс Музыка.

Москва лидирует по числу миллионеров: 28 тысяч получают свыше 1 млн рублей


Гроза в Москве: задержано 23 рейса в аэропорту "Шереметьево" после 22:00

Путин поручил оптимизировать строительство высокоскоростной магистрали Москва — Петербург

Трамп: Індія та росія — «мертві економіки»

Спорткар на воде: сборная Тульская области по гребле выступила на мини-Олимпиаде


Автопробег в Финляндии поддержал инициативу открытия границы с Россией

В результате ДТП на Волгоградском проспекте в Москве пострадали шесть человек

ДТП на юго-востоке Москвы: пострадали четыре человека, включая пешеходов

Собянин: Открыт пешеходный переход через МЦД-2 между Щербинкой и Остафьевом


Путин рассказал о развитии железнодорожной отрасли России

Путин анонсировал скоростную трассу Москва-Петербург к 2028 году

Путин обсудил перспективы развития железнодорожной сети в России

Путин заявил о высокой популярности скоростных железных дорог среди россиян


Руководитель РФПИ охарактеризовал переписку фон дер Ляйен с Pfizer как позорный инцидент

Исследование показывает зависимость между темпами развития COVID-19 и уровнем смертности



Ученые выяснили, какие болезни погубили войска Наполеона в 1812 году

Напавший с ножом на людей в Москве был на учёте в психоневрологическом диспансере

«Такие жирные». У мужчины обнаружили страшное заболевание из-за ресторанов

Букин поделился причинами, почему он не придерживается диеты


В Киеве показательно вскрыли «гнездо» коррупции: Зеленский устроил целый политический театр


Теннисистка Ярослава Барташевич: Спорт полностью меняет характер

Спелеолог Алексей Акимов: По годовым кольцам сталактитов можно узнать прошлое Земли

Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs

Спорткар на воде: сборная Тульская области по гребле выступила на мини-Олимпиаде



Собянин: Открыт пешеходный переход через МЦД-2 между Щербинкой и Остафьевом

Сергей Собянин. Главное за день

Собянин: 9 и 10 августа Москва отметит День физкультурника

Сергей Собянин открыл просторный переход между станциями Щербинка и Остафьево


"Роскосмос" продемонстрировал изображение циклон, спровоцировавшего грозу в Москве

В Грозном планируют возвести предприятие по переработке отходов

Московский зоопарк ищет неродственную "невесту" для манула Тимоши

Ликсутов сообщил об открытии велопроката на территории ОЭЗ «Технополис Москва»


В Оренбурге на час задержан рейс в Москву

Восточные регионы Австралии зафиксировали рекордное снегопад

В России любят Volkswagen Passat, Toyota Corolla и Toyota Carina: это самые популярные автомобили старше 30 лет у россиян

Тайный визит американской звезды в Россию: Во сколько всё обошлось организаторам? Сумма поражает


Архангельская область. СМИ зовут прокуроров в дорогу

В администрации муниципального образования «Городской округ «Город Нарьян-Мар» выявлены нарушения законодательства о противодействии коррупции

Аномальная жара: До +41 °С в Чечне и Ингушетии, +30 °С в Карелии и Архангельске

Бизнесмен из Подмосковья пытался испортить деньгами честного нарьянмарца


Задержка поездов в Крым и из Крыма – актуальные данные

Цены на новостройки в июле 2025 года: Севастополь лидирует, Симферополь чуть отстаёт

Задержка поездов в Крым и из Крыма: свежие данные

Крыму и еще 27 регионам списали долги по бюджетным кредитам на 58 млрд


Фестиваль Iron Star проходит на Гребном канале в Нижнем Новгороде

Три награды для России на заключительный день чемпионата мира среди юниоров по борьбе

Третью подряд победу со счетом 1:0 одержал воронежский «Факел»

Тульский "Арсенал" одержал первую победу в новом сезоне Первой лиги














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *