Добавить новость
smi24.net
News in English
Март
2024

LLMs become more covertly racist with human intervention

0

Since their inception, it’s been clear that large language models like ChatGPT absorb racist views from the millions of pages of the internet they are trained on. Developers have responded by trying to make them less toxic. But new research suggests that those efforts, especially as models get larger, are only curbing racist views that are overt, while letting more covert stereotypes grow stronger and better hidden.

Researchers asked five AI models—including OpenAI’s GPT-4 and older models from Facebook and Google—to make judgments about speakers who used African-American English (AAE). The race of the speaker was not mentioned in the instructions.

Even when the two sentences had the same meaning, the models were more likely to apply adjectives like “dirty,” “lazy,” and “stupid” to speakers of AAE than speakers of Standard American English (SAE). The models associated speakers of AAE with less prestigious jobs (or didn’t associate them with having a job at all), and when asked to pass judgment on a hypothetical criminal defendant, they were more likely to recommend the death penalty. 

An even more notable finding may be a flaw the study pinpoints in the ways that researchers try to solve such biases. 

To purge models of hateful views, companies like OpenAI, Meta, and Google use feedback training, in which human workers manually adjust the way the model responds to certain prompts. This process, often called “alignment,” aims to recalibrate the millions of connections in the neural network and get the model to conform better with desired values. 

The method works well to combat overt stereotypes, and leading companies have employed it for nearly a decade. If users prompted GPT-2, for example, to name stereotypes about Black people, it was likely to list “suspicious,” “radical,” and “aggressive,” but GPT-4 no longer responds with those associations, according to the paper.

However the method fails on the covert stereotypes that researchers elicited when using African-American English in their study, which was published on arXiv and has not been peer reviewed. That’s partially because companies have been less aware of dialect prejudice as an issue, they say. It’s also easier to coach a model not to respond to overtly racist questions than it is to coach it not to respond negatively to an entire dialect.

“Feedback training teaches models to consider their racism,” says Valentin Hofmann, a researcher at the Allen Institute for AI and a coauthor on the paper. “But dialect prejudice opens a deeper level.”

Avijit Ghosh, an ethics researcher at Hugging Face who was not involved in the research, says the finding calls into question the approach companies are taking to solve bias.

“This alignment—where the model refuses to spew racist outputs—is nothing but a flimsy filter that can be easily broken,” he says. 

The covert stereotypes also strengthened as the size of the models increased, researchers found. That finding offers a potential warning to chatbot makers like OpenAI, Meta, and Google as they race to release larger and larger models. Models generally get more powerful and expressive as the amount of their training data and the number of their parameters increase, but if this worsens covert racial bias, companies will need to develop better tools to fight it. It’s not yet clear whether adding more AAE to training data or making feedback efforts more robust will be enough.

“This is revealing the extent to which companies are playing whack-a-mole—just trying to hit the next bias that the most recent reporter or paper covered,” says Pratyusha Ria Kalluri, a PhD candidate at Stanford and a coauthor on the study. “Covert biases really challenge that as a reasonable approach.”

The paper’s authors use particularly extreme examples to illustrate the potential implications of racial bias, like asking AI to decide whether a defendant should be sentenced to death. But, Ghosh notes, the questionable use of AI models to help make critical decisions is not science fiction. It happens today. 

AI-driven translation tools are used when evaluating asylum cases in the US, and crime prediction software has been used to judge whether teens should be granted probation. Employers who use ChatGPT to screen applications might be discriminating against candidate names on the basis of race and gender, and if they use models to analyze what an applicant writes on social media, a bias against AAE could lead to misjudgments. 

“The authors are humble in claiming that their use cases of making the LLM pick candidates or judge criminal cases are constructed exercises,” Ghosh says. “But I would claim that their fear is spot on.”








Музыкант Алексей Фомин поделился историей о его отношениях с друзьями

Участники Первенства России по стрельбе из лука остановились в Marins Park Hotel Новосибирск

Сооружения сервисного участка «Свердловск-Пассажирский» стали арт-объектом

Marins Park Hotel Новосибирск – место, где сбываются мечты!


Is eBay actually sexy again as the ecommerce old-timer’s stock surges to an all-time high?

Bob Arum Says One Current World Champion Beats Prime Floyd Mayweather: “He’s A Very Unique Talent”

Nvidia’s Jensen Huang hauled before China’s cyber cops to explain ‘backdoor safety risks’ in H20 chips

The surprising reason fewer people are dying from extreme weather


Жительница Орловской области набросилась на гражданского мужа с арматурой

Фридрихсбургские ворота

С особой требовательностью

Сегодня без рыбалки...


Разработчики The Seven Deadly Sins: Origin ответили на частые вопросы игроков

Girl Rescue 1.0.3.3

The next survival game from the developers of Green Hell plops you on an alien planet with atmospheric firestorms and a horde of giant spiders

«Деньги не пахнут»: Как Blox World наживается на доверии игроков Roblox



Сахар на вес золота: как изобретение инсулина изменило медицину

Алгоритмы Яндекс Музыки. Алгоритмы продвижения в Яндекс Музыка.

Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs

Москва превратится в Таиланд. Климатолог Клименко сделал прогноз на 10 лет


Финансист Селезнев: самые низкие ставки по ипотеке должны быть в Москве

Сахар на вес золота: как изобретение инсулина изменило медицину

В Волгограде приостановлено движение поездов из-за упавшего беспилотника

Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs


Бизнесмен Илон Маск назвал безумием британский закон о безопасном интернете

Ефимов: к 2030 году в Москве построят почти 60 деловых центров

В Назрани обновили 5 км тротуаров

Небесный феномен. Как измерили рекордную мегамолнию над США


Новак Джокович вошел в число инвесторов футбольного клуба

Рублев и Хачанов не смогли пройти первый круг парного разряда теннисного турнира в Торонто

Хачанов обыграл Рууда и вышел в 1/4 финала турнира в Торонто

Вероника Кудерметова проиграла второй ракетке мира Гаффу


ПВО поразила три воздушных цели в районе Севастополя

Победители Всероссийского конкурса детского рисунка стали участниками AmberForum

Посол России назвал «знаковым проявлением русофобии» отмену концерта Гергиева в Италии

Трамп заявил, что Уиткофф посетит Москву за один-два дня до истечения срока ультиматума


Музыкальные новости

Цискаридзе показал редкое фото Алины Кабаевой

Купить Песню. Песни на продажу. Продажа песен.

«Я устал»: умер музыкант The Rolling Stones Флако Хименес

В Ереване оправдали выделение $7 миллионов на концерт Дженнифер Лопес


Сахар на вес золота: как изобретение инсулина изменило медицину

Алгоритмы Яндекс Музыки. Алгоритмы продвижения в Яндекс Музыка.

Москва превратится в Таиланд. Климатолог Клименко сделал прогноз на 10 лет

Москва лидирует по числу миллионеров: 28 тысяч получают свыше 1 млн рублей


Рекорд «Спартака», бразилец в «Динамо» и топ-сделка по Осимхену. Трансферы и слухи дня

Сооружения сервисного участка «Свердловск-Пассажирский» стали арт-объектом

[LIVE] «Краснодар» — «Динамо». Онлайн, прямая трансляция

Рубио: не уверен, что заявления Медведева о Трампе отражают позицию России


В результате ДТП на Волгоградском проспекте в Москве пострадали шесть человек

Шесть человек пострадали в крупной аварии на Волгоградском проспекте в Москве

Собянин: Открыт пешеходный переход через МЦД-2 между Щербинкой и Остафьевом

ДТП на юго-востоке Москвы: пострадали четыре человека, включая пешеходов


Путин анонсировал скоростную трассу Москва-Петербург к 2028 году

Путин обсудил перспективы развития железнодорожной сети в России

Путин рассказал о развитии железнодорожной отрасли России

Путин отметил, что железнодорожники успешно обеспечивают снабжение вооруженных сил


Руководитель РФПИ охарактеризовал переписку фон дер Ляйен с Pfizer как позорный инцидент

Исследование показывает зависимость между темпами развития COVID-19 и уровнем смертности



Напавший с ножом на людей в Москве был на учёте в психоневрологическом диспансере

Сахар на вес золота: как изобретение инсулина изменило медицину

Ученые выяснили, какие болезни погубили войска Наполеона в 1812 году

«Такие жирные». У мужчины обнаружили страшное заболевание из-за ресторанов


В Киеве показательно вскрыли «гнездо» коррупции: Зеленский устроил целый политический театр


Спелеолог Алексей Акимов: По годовым кольцам сталактитов можно узнать прошлое Земли

Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs

Спорткар на воде: сборная Тульская области по гребле выступила на мини-Олимпиаде

Галактионов подвел итог игры с "Нижним Новгородом"



Сергей Собянин. Главное за день

Сергей Собянин открыл просторный переход между станциями Щербинка и Остафьево

Собянин: 9 и 10 августа Москва отметит День физкультурника

Собянин: Количество цветников в Москве с 2010 года увеличено почти в 2,5 раза


Московский зоопарк ищет неродственную "невесту" для манула Тимоши

В Грозном планируют возвести предприятие по переработке отходов

"Роскосмос" продемонстрировал изображение циклон, спровоцировавшего грозу в Москве

Конец истории: тополиный пух может навсегда исчезнуть из Москвы


«Сигнал коллективному Западу»: как проходят российско-китайские учения «Морское взаимодействие — 2025»

В Великобритании выделят 132 миллиона долларов на пресечение нелегальной миграции

Трамп заявил, что Уиткофф посетит Москву за один-два дня до истечения срока ультиматума

Посол России назвал «знаковым проявлением русофобии» отмену концерта Гергиева в Италии


В администрации муниципального образования «Городской округ «Город Нарьян-Мар» выявлены нарушения законодательства о противодействии коррупции

Аномальная жара: До +41 °С в Чечне и Ингушетии, +30 °С в Карелии и Архангельске

Бизнесмен из Подмосковья пытался испортить деньгами честного нарьянмарца

Архангельская область. СМИ зовут прокуроров в дорогу


Задержка поездов в Крым и из Крыма – актуальные данные

Задержка поездов в Крым и из Крыма: свежие данные

Цены на новостройки в июле 2025 года: Севастополь лидирует, Симферополь чуть отстаёт

В пути следования задерживаются поезда «Таврия», сообщили в пресс-службе компании-перевозчика "Гранд Сервис Экспресс"


Запрет на алкоголь во дворах: Московская область вводит новые ограничения

Компании Амурской области приглашают москвичей к себе на работу

В Волгоградской области после атаки БПЛА загорелась станция, задержаны 5 поездов

Санкции против России обернулись для ЕС ущербом в $1,5 трлн и ростом ВВП 0,5%














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *