Добавить новость
smi24.net
News in English
Июнь
2024

It's dangerously easy to 'jailbreak' AI models so they'll tell you how to build Molotov cocktails, or worse

0
Skeleton Key can get many AI models to divulge their darkest secrets.
  • A jailbreaking method called Skeleton Key can prompt AI models to reveal harmful information.
  • The technique bypasses safety guardrails in models like Meta's Llama3 and OpenAI GPT 3.5.
  • Microsoft advises adding extra guardrails and monitoring AI systems to counteract Skeleton Key.

It doesn't take much for a large language model to give you the recipe for all kinds of dangerous things.

With a jailbreaking technique called "Skeleton Key," users can persuade models like Meta's Llama3, Google's Gemini Pro, and OpenAI's GPT 3.5 to give them the recipe for a rudimentary fire bomb, or worse, according to a blog post from Microsoft Azure's chief technology officer, Mark Russinovich.

The technique works through a multi-step strategy that forces a model to ignore its guardrails, Russinovich wrote. Guardrails are safety mechanisms that help AI models discern malicious requests from benign ones.

"Like all jailbreaks," Skeleton Key works by "narrowing the gap between what the model is capable of doing (given the user credentials, etc.) and what it is willing to do," Russinovich wrote.

But it's more destructive than other jailbreak techniques that can only solicit information from AI models "indirectly or with encodings." Instead, Skeleton Key can force AI models to divulge information about topics ranging from explosives to bioweapons to self-harm through simple natural language prompts. These outputs often reveal the full extent of a model's knowledge on any given topic.

Microsoft tested Skeleton Key on several models and found that it worked on Meta Llama3, Google Gemini Pro, OpenAI GPT 3.5 Turbo, OpenAI GPT 4o, Mistral Large, Anthropic Claude 3 Opus, and Cohere Commander R Plus. The only model that exhibited some resistance was OpenAI's GPT-4.

Russinovich said Microsoft has made some software updates to mitigate Skeleton Key's impact on its own large language models, including its Copilot AI Assistants.

But his general advice to companies building AI systems is to design them with additional guardrails. He also noted that they should monitor inputs and outputs to their systems and implement checks to detect abusive content.

Read the original article on Business Insider







Семейное приключение на «Кораблике Детского радио»

Ортопед дал совет по сохранению здоровья спины на сидячей работе

Парад вулканов на Камчатке

Рок-фестиваль «Окна Открой» в Петербурге: возвращение звезд и открытие новых талантов


Palestinian envoy urges action at UN: “History will judge us all”

Exclusive: Fintech giant Stripe building ‘Tempo’ blockchain with crypto VC Paradigm

Report: Liverpool decision hands advantage to Man United in midfielder pursuit

3 Terrifying Horror Series To Watch Ahead Of HBO’s ‘It: Welcome to Derry’


CorpSoft24 предоставил сервера для нужд машинного обучения

"Главный азербайджанец Урала" сдал Алиева. Этот раунд Баку проиграл. Что будет дальше?

В Орле легковушка врезалась в многоэтажный дом

В приложении BelkaCar появилась функция поиска авто по фото


New study shows that Gen Z is spending way less money on videogames than older gamers

Steam for Chromebooks is getting axed in 2026 instead of exiting its 4-year beta

Открыты сервера MMORPG ROM: Golden Age

Первый взгляд на мобильную версию Neon Spellstorm


Овочі можусть стати розкішшю для українців


Всё об операциях на почках: показания, какие бывают и как проходят

Платформа «DатаРу Облако» аттестована для работы с государственными данными и информацией повышенной категории

Nexign Interconnect получила сертификат совместимости с российской Java-платформой Axiom JDK

Директор Росгвардии Герой России генерал Виктор Золотов принял участие в заседании Национального антитеррористического комитета


Москвичам пообещали 25 градусов тепла к выходным

Махачкалинский «Динамо» обыграл «Спартак» по пенальти в матче Кубка России

Магазин автозапчастей франшиза – успешное и прибыльное предприятие

Преимущества франшизы «Автополка»


Симоньян заявила, что еще на третьем курсе вуза достигла «потолка в профессии»

Баста и его супруга задолжали за коммунальные услуги

Дорога на улице Трифоновской будет перекрыта до 22 августа

На городские торги выставили четырехэтажное здание в ЦАО


Калинская обыграла финалистку Уимблдона на турнире в Цинциннати

Фриц достиг третьего раунда на турнире в Цинциннати

Самсонова уступила 125-й ракетке мира во втором раунде турнира в Цинциннати

Теннисистка Калинская пробилась в третий круг турнира в Цинциннати


Дорога на улице Трифоновской будет перекрыта до 22 августа

Когда ударят первые морозы: подробный и точный прогноз на осень-2025

Баста и его супруга задолжали за коммунальные услуги

Преимущества франшизы «Автополка»


Музыкальные новости

Раскрыты гонорары ушедшего на пенсию Леонтьева

Сергунина пригласила москвичей и туристов на фестиваль «Вкусы России»

Продюсер "Лаского мая" Андрей Разин сделал Ярославской области царский подарок

Вспоминаем клипы эпохи: извиняющийся Бибер, знойный Псай и восставший Маккартни (видео)


Директор Росгвардии Герой России генерал Виктор Золотов принял участие в заседании Национального антитеррористического комитета

Платформа «DатаРу Облако» аттестована для работы с государственными данными и информацией повышенной категории

Nexign Interconnect получила сертификат совместимости с российской Java-платформой Axiom JDK

Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления


Квартира, дача, 50 млн: кому достанется наследство актера Ивана Краско

Команда «Буран» одержала победу на «Архипелаге 2025»

Специалисты «Россети Новосибирск» зафиксировали самовольные подвесы еще на 770 опорах ЛЭП

«Бежим за Мечту — Ходить»: подростки на протезах пробегут марафон в Екатеринбурге


Быстрый старт в прибыльном бизнесе по продаже автозапчастей

Выбор подходящей франшизы автозапчастей

Преимущества франшизы «Автополка»

Магазин автозапчастей франшиза – успешное и прибыльное предприятие


В России объяснили скорую организацию встречи Путина и Трампа

Bloomberg: встреча Путина и Трампа сама по себе представляет победу Москвы

«Трампу надо соглашаться»: сейчас у Путина наименьшее количество требований за все время – итальянские СМИ

Почему Трамп сказал, что едет в Россию, если встреча назначена в Аляске




КГ PROGRESS: в Перми работают самые опытные стоматологи в России

Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления

Подмосковный травматолог дал советы по выбору рюкзака для первоклассника

Солнечному мальчику необходимо лекарство, чтобы спасти сердце от перегрузок


Зеленский пригрозил «третьей мировой войной» в случае давления на Киев в вопросе уступок территорий


На пенсии отоспишься. 13 идей для ночного досуга в Москве — от тенниса до парилки

Журова о возвращении граждан, сменивших гражданство: «Практически невозможно»

Сотрудники и военнослужащие Росгвардии обеспечили безопасность футбольного матча

Street Boxing


Лукашенко получил первую золотую монету из белорусского сырья


Собянин рассказал, как проект «Город героев» укрепляет связь времен и поколений

Собянин оценил вклад проектов "Город героев" и "Герой моего района

Собянин объявил об открытии новой детской поликлиники в районе Крюково

Сергей Собянин. Главное за день


Площадь возгорания на горе Куцай достигла 650 тысяч квадратных метров

Что подготовили в павильонах «Музеона» в рамках форума «Москва 2030»

Погода сошла с ума? Главный синоптик России Вильфанд предупреждает: аномалий будет все больше - то в жар, то в холод

Хватит морщиться: ученые назвали пользу от участившихся московских ливней


Баста и его супруга задолжали за коммунальные услуги

Татарстан попал в топ-5 регионов по спросу на ипотеку

На городские торги выставили четырехэтажное здание в ЦАО

Один из участников ограбления отделения почты в Москве — пенсионер, ему почти 68 лет


Сотрудниками полиции и Росгвардии задержан гражданин, причастный к поджогу релейного шкафа в Архангельской области

Заместитель прокурора Архангельской области и Ненецкого автономного округа Павел Матанцев проверил ход ремонтных работ в школе № 1 г. Нарьян-Мара

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

Орловская область планирует войти в число национальных туристических маршрутов с проектом «Бирюзовое кольцо России»


Прогноз погоды в Крыму на 11 августа

Историко-краеведческая выставка «Древности земли крымской»

Прогноз погоды в Крыму на понедельник

Прогноз погоды в Крыму на 12 августа


Дорога на улице Трифоновской будет перекрыта до 22 августа

Отзывы о франшизе «Автополка»

Когда ударят первые морозы: подробный и точный прогноз на осень-2025

«Думали, меньше некуда»: в магазинах Новосибирска сливочное масло стали продавать в пачках по 100 граммов














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *