Мы в Telegram
Добавить новость
smi24.net
Блог сайта «Хайтек+»
Май
2024
1 2 3
4
5 6 7 8
9
10
11 12 13 14 15 16 17
18
19 20 21 22 23 24
25
26 27 28 29 30
31

ИИ уже способен обманывать тесты безопасности и манипулировать людьми

В исследовании одним из самых ярких примеров стал ИИ-игрок CICERO от Meta, который, как оказалось, «превратился в искусного лжеца». CICERO был разработан для игры Diplomacy, требующей стратегического построения альянсов. Несмотря на заявления Meta о том, что CICERO тренировали быть «в основном честным и полезным», ИИ прибегал к ложным обещаниям, предательству союзников и манипулированию другими игроками ради победы. Хотя в игровой обстановке это может показаться безобидным, данный пример демонстрирует потенциал ИИ для обучения и использования тактик обмана в реальных сценариях.

В другом случае на предмет обмана тестировали ChatGPT от OpenAI, созданный на базе моделей GPT-3.5 и GPT-4. В одном из тестов GPT-4 заставил работника TaskRabbit решить капчу, притворившись лицом с ограниченными возможностями зрения. Хотя GPT-4 и получил некоторые подсказки от оценщика-человека, он действовал преимущественно самостоятельно, и не получал прямых указаний лгать.

В отчете говорится, что GPT-4 использовал собственные рассуждения, чтобы придумать ложное оправдание, зачем ему нужна помощь с капчей. Это демонстрирует, как модели ИИ могут научиться обманывать, если это выгодно для выполнения их задач.

Системы ИИ также преуспели в обмане в играх на социальную дедукцию. Во время игры Hoodwinked, где один игрок должен убить всех остальных, модели GPT от OpenAI демонстрировали тревожную картину. Они часто убивали других игроков тайно, а затем лгали во время групповых обсуждений, чтобы избежать подозрений. Эти модели даже придумывали алиби или обвиняли других игроков, чтобы скрыть свои истинные намерения.

Исследователи также обнаружили, что некоторые системы искусственного интеллекта научились обманывать тесты, предназначенные для оценки их безопасности.

Разработчики до сих пор не до конца понимают, что вызывает такое нежелательное поведение ИИ. Вероятно, это связано с тем, что при обучении искусственного интеллекта часто применяется метод обучения с подкреплением с обратной связью от человека (RLHF). Это означает, что ИИ учится, получая одобрение человека, а не обязательно достигая конкретной цели. Однако в некоторых случаях ИИ может научиться обманывать людей, чтобы получить это одобрение, даже не выполняя задачу по-настоящему.

OpenAI столкнулась с такой ситуацией, когда они обучали робота хватать мяч. ИИ поместил руку робота между камерой и мячом. С точки зрения человека, наблюдающего за процессом, это создавало впечатление успешного захвата мяча, хотя на самом деле он остался на месте. Получив одобрение от человека ИИ усвоил этот трюк. В данном случае обман, скорее всего, произошел непреднамеренно. Он был обусловлен специфической настройкой обучения и неудачным выбором угла камеры. ИИ не ставил перед собой цель обмануть человека, а просто нашел способ получить награду (одобрение) за невыполненное действие.

Способность искусственного интеллекта к обучению обману сопряжена с рядом серьезных рисков. Злоумышленники могут использовать эти возможности для дезинформации и нанесения вреда другим людям. Это может привести к росту мошенничества, политическим манипуляциям и даже потенциально к вербовке террористов. Кроме того, системы, предназначенные для принятия стратегических решений, обученные использовать обман, могут нормализовать дезинформацию в политике и бизнесе. Поскольку искусственный интеллект продолжает развиваться и глубже интегрироваться в нашу жизнь, крайне важно решать проблему обмана с самого начала, считают ученые.

 







Фотовыставка «Древнейшие пирамиды мира» пройдёт в Крыму

Правильная эксплуатация грузовых шин позволит продлить срок их службы

Эксперт по семейному капиталу Светлана Петрова: как быстро накопить на авто

Компания ICDMC приняла участие в торжественном открытии выставки “Тульское качество”


BYD-FORKLIFT - официальный дистрибьютор BYD в России

Компании Группы "Интеррос" взяли ряд наград премии FINAWARD

Компания ICDMC приняла участие в торжественном открытии выставки “Тульское качество”

Генералов много, а Норат Тер-Григорьянц один!


‘Please don’t play that at matches next season’, beg Luton fans after Coldplay reveal new song for Hatters at festival

Fentanyl distribution indictment follows Westminster traffic stop

Real Sociedad In Talks To Land Aston Villa Target

When Narine asked Gambhir 'can I bring my girlfriend to IPL?'


Денис Сафин перевел 100 миллионов рублей в фонд помощи пострадавшим от паводка

Крупная авария в деревне Образцово Орловского МО. Движение затруднено

"ДиМ" строит участок 5 трассы СБВ

Портативный ТСД корпоративного класса Saotron RT-T70


Bungie wins a little walkin' around money in first of its kind jury trial against Destiny 2 cheat maker, but the victory will likely make it even easier for game companies to keep taking cheaters to court

Зомби-экшен Zombiehood позволяет погрузиться в эпоху 90-х

Конец близок в релизном трейлере Destiny 2: The Final Shape

Мафия-НН: отличная команда сплоченных коллег, которые стали друг другу почти как семья.


ОіБ - охорона і безпека: замовляй охорону в Харькові


Всеармянский союз «Гардман-Ширван-Нахиджеван» осуждает лживое заявление президента Азербайджана Алиева

«СВЯТОЙ ЛЕНИН» спасает население от борьбы с перенаселением, 3 серия, СЕРЬЁЗНЫЙ НОВОСТНОЙ СЕРИАЛ.

Третья Московская неделя моды: масштабное событие с участием дизайнеров из России и мира пройдет в октябре

В исторических парках покажут любимые мультфильмы от СТС Kids ко Дню защиты детей


«СВЯТОЙ ЛЕНИН» спасает население от борьбы с перенаселением, 3 серия, СЕРЬЁЗНЫЙ НОВОСТНОЙ СЕРИАЛ.

"СВЯТОЙ ЛЕНИН" раскрыл загадку В.В. Жириновского и В.Г. Мессинга. СЕНСАЦИОННЫЕ ДАННЫЕ!

Компания ICDMC приняла участие в торжественном открытии выставки “Тульское качество”

Концертное агентство TCI опровергло слухи о выступлении Канье Уэста в Москве


Горняцкие игры: состоялась летняя спартакиада Группы «Сибантрацит»

Подбор Песен. Подбор Музыкального репертуара, Стихов, Музыки для Исполнителей в различных музыкальных стилях и направлений.

Серия голосований «Вот это Москва!» собрала уже более 700 тыс мнений горожан

В Звенигороде продолжается реконструкция очистных сооружений «Верхний Посад»


Медведев пошутил о том, что часто проводит ночные матчи на турнирах «Большого шлема»

Матч Котова и Вавринки перенесли на корт Сюзанн Ленглен

Соболенко победила на старте открытого чемпионата Франции по теннису

Касаткина о романе Синнера и Калинской: рада, больше ничего не хочу говорить


Впервые Бурятский театр оперы и балета выступит с концертом в храме Кяхты

"Контракт" на выступление Канье Уэста в Москве назвали фейком

Горняцкие игры: состоялась летняя спартакиада Группы «Сибантрацит»

Доктор Кутушов назвал болезни, которые поджидают отдыхающих у водоёмов


Музыкальные новости

Сергей Лазарев рекомендовал Казань для отпуска выходного дня

Внучатый племянник Олега Лундстрема нашёл в Ульяновске свою кровь

«Борис Фрумкин – 80!»: Государственный камерный оркестр джазовой музыки имени Олега Лундстрема отпраздновал юбилей своего худрука большим концертом

60 сосисок и чёрный хлеб: раскрыт райдер рэпера Басты


«СВЯТОЙ ЛЕНИН» спасает население от борьбы с перенаселением, 3 серия, СЕРЬЁЗНЫЙ НОВОСТНОЙ СЕРИАЛ.

Всеармянский союз «Гардман-Ширван-Нахиджеван» осуждает лживое заявление президента Азербайджана Алиева

ONYX отправляется в Большой тур по России

Третья Московская неделя моды: масштабное событие с участием дизайнеров из России и мира пройдет в октябре


Маленьким пациентам центра трансплантологии рассказали о тех, кто спасает их жизни каждый день

Белый дом: Байден посетит Францию на годовщину высадки союзников в Нормандии

«СВЯТОЙ ЛЕНИН» спасает население от борьбы с перенаселением, 3 серия, СЕРЬЁЗНЫЙ НОВОСТНОЙ СЕРИАЛ.

ЦСКА шагнул к трофею // Команда обыграла УНИКС в первом матче финала Единой лиги ВТБ


Итальянские корни: дизайн автомобилей SWM

Эксперт по семейному капиталу Светлана Петрова: как быстро накопить на авто

Открытие первого дилерского центра VGV в России. ГК «АВТОРУСЬ» стала первым дилером

Важные магистрали: Столица вышла на рекордные темпы дорожного строительства


Ветераны СВО с тяжелыми ранениями смогут получить машины с ручным приводом

Власти Зимбабве поблагодарили Москву за помощь в период засухи

Путин наградил коллектив станции скорой помощи Белгородской области

Третий визит Путина: Узбекистан стал Москве ближе Казахстана. Как среагировал Кремль на "заигрывание" Астаны с Лондоном.


В Москве в мае не выявили случаев заражения новым штаммом коронавируса FLiRT

Какое будущее увидит поколение зуммеров?

Ракова: в Москве в мае не нашли случаев инфицирования штаммом коронавируса FLiRT

В Москве в мае не выявили ни одного случая штамма коронавируса FLiRT


Раз нет протестов, будут санкции: как навальнисты и команда Ходорковского меняют стратегию борьбы с Россией


В РУМЦ МГППУ действует правовой просветительский лекторий для студентов с инвалидностью и сотрудников вузов-партнеров

Доктор Кутушов назвал болезни, которые поджидают отдыхающих у водоёмов

Эксперты Центра лечебной педагогики приняли участие в IV Форуме руководителей организаций «Мы в ответе за наших детей» и провели курс повышения квалификации для специалистов

Доктор Кутушов назвал болезни, которые поджидают отдыхающих у водоёмов


В Польше заявили о зловещем плане Киева

Белый дом признал причастность к выработке «формулы мира» Киева


Два проекта Первый Бит отмечены дипломами финалистов конкурса «BPM-проект года»

Онлайн-лекторий «Иннагрика»: подкасты с учеными и экспертами об агротехе доступным языком

Волонтеры Президентской академии в Санкт-Петербурге вносят свой вклад в развитие и повышение доступности спорта для граждан

Четырёх футболисток самарских "Крыльев" сняли с поезда за дебош



Собянин: 10 тыс. человек получили медпомощь в обновленных приемных отделениях

В Москве выбрали лучших педагогов в рамках городского конкурса — Собянин

Собянин: На городском вокзале Зеленоград — Крюково появился еще один переход

Собянин анонсировал большую летнюю спортивную программу


«Компьютерный 3D-переводчик на жестовый язык» стал одним из победителей конкурса цифровых проектов и идей для людей с нарушением слуха «Мы услышим»

Электромобиль Xiaomi SU7 начали продавать в России

Проверку начали после загрязнения реки Сетунь в Москве

Прокуратура начала проверку из-за загрязнения реки Сетуни в Москве


На большей части Подмосковья 30 мая ожидается IV класс пожарной опасности

Серия голосований «Вот это Москва!» собрала уже более 700 тыс мнений горожан

Руденко: Запад применяет грязные инструменты для внесения разлада между РФ и КНР

Подбор Песен. Подбор Музыкального репертуара, Стихов, Музыки для Исполнителей в различных музыкальных стилях и направлений.


XXXIII Церемония «Хрустальная Турандот» объявит победителей сезона 2023/2024

Прокуратура Архангельской области и Ненецкого автономного округа 31 мая 2024 года в г. Нарьян-Мар проведет прием граждан и «Горячую линию» по вопросам защиты прав и законных интересов несовершеннолетних

ТСД промышленного класса Saotron RT-T60

Эксперт Президентской академии в Санкт-Петербурге о повышении экологического статуса целлюлозно-бумажных технологий в России


Выставка-предупреждение «Пожарная безопасность», В рамках Федеральной информационной противопожарной кампании «Останови огонь».

Наркокурьер изобретательно спрятал «товар» в машине, но это не помогло (видео)

К 240-летию города-собирателя: в Симферополе проведут бесплатную экскурсию «Крутые соты»

Сожалеют, что бросающих черепах не бросили в тюрьму


Манипуляция

Беспилотный трамвай в Москве проехал свои первые 100 км по маршруту №10

Свыше 40 детей из Пушкино отправились в летний лагерь в Краснодарском крае

Врио губернатора Кузбасса Илья Середюк принял участие в совещании по нацпроектам в Москве














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *