Добавить новость
smi24.net
News in English
Декабрь
2023

Researchers find more than 1,000 child sexual abuse images inside AI image generation training data

0

By Davey Alba and Rachel Metz

A massive public dataset used to build popular artificial intelligence image generators contains at least 1,008 instances of child sexual abuse material, a new report from the Stanford Internet Observatory found.

LAION-5B, which contains more than 5 billion images and related captions from the internet, may also include thousands of additional pieces of suspected child sexual abuse material, or CSAM, according to the report. The inclusion of CSAM in the dataset could enable AI products built on this data — including image generation tools like Stable Diffusion — to create new, and potentially realistic, child abuse content, the report warned.

The rise of increasingly powerful AI tools has raised alarms in part because these services are built with troves of online data — including public datasets such as LAION-5B — that can contain copyrighted or harmful content. AI image generators, in particular, rely on datasets that include pairs of images and text descriptions to determine a wide range of concepts and create pictures in response to prompts from users.

In a statement, a spokesperson for LAION, the Germany-based nonprofit behind the dataset, said the group has a “zero tolerance policy” for illegal content and was temporarily removing LAION datasets from the internet “to ensure they are safe before republishing them.” Prior to releasing its datasets, LAION created and published filters for spotting and removing illegal content from them, the spokesperson said.Christoph Schuhmann, LAION’s founder, previously told Bloomberg News that he was unaware of any child nudity in the dataset, though he acknowledged he did not review the data in great depth. If notified about such content, he said, he would remove links to it immediately.

A spokesperson for Stability AI, the British AI startup that funded and popularized Stable Diffusion, said the company is committed to preventing the misuse of AI and prohibits the use of its image models for unlawful activity, including attempts to edit or create CSAM. “This report focuses on the LAION-5B dataset as a whole,” the spokesperson said in a statement. “Stability AI models were trained on a filtered subset of that dataset. In addition, we fine-tuned these models to mitigate residual behaviors.”

LAION-5B, or subsets of it, have been used to build multiple versions of Stable Diffusion. A more recent version of the software, Stable Diffusion 2.0, was trained on data that substantially filtered out “unsafe” materials in the dataset, making it much more difficult for users to generate explicit images. But Stable Diffusion 1.5 does generate sexually explicit content and is still in use in some corners of the internet. The spokesperson said Stable Diffusion 1.5 was not released by Stability AI, but by Runway, an AI video startup that helped create the original version of Stable Diffusion. Runway said it was released in collaboration with Stability AI.

“We have implemented filters to intercept unsafe prompts or unsafe outputs when users interact with models on our platform,” the Stability AI spokesperson added. “We have also invested in content labeling features to help identify images generated on our platform. These layers of mitigation make it harder for bad actors to misuse AI.”

LAION-5B was released in 2022 and relies on raw HTML code collected by a California nonprofit to locate images around the web and associate them with descriptive text. For months, rumors that the dataset contained illegal images have circulated in discussion forums and on social media.“As far as we know, this is the first attempt to actually quantify and validate concerns,”  David Thiel, chief technologist of the Stanford Internet Observatory, said in an interview with Bloomberg News.

For their report, Stanford Internet Observatory researchers detected the CSAM material by looking for different kinds of hashes, or digital fingerprints, of such images. The researchers then validated them using APIs dedicated to finding and removing known images of child exploitation, as well as by searching for similar images in the dataset.

Much of the suspected CSAM content that the Stanford Internet Observatory found was validated by third parties like Canadian Centre for Child Protection and through a tool called PhotoDNA, developed by Microsoft Corp., according to the report. Given that the Stanford Internet Observatory researchers could only work with a limited portion of high-risk content, additional abusive content likely exists in the dataset, the report said.

While the amount of CSAM present in the dataset doesn’t indicate that the illicit material “drastically” influences the images churned out by AI tools,  Thiel said it does likely still have an impact. “These models are really good at being able to learn concepts from a small number of images,” he said. “And we know that some of these images are repeated, potentially dozens of times in the dataset.”

Stanford Internet Observatory’s work previously found that generative AI image models can produce CSAM, but that work assumed the AI systems were able to do so by combining two “concepts,” such as children and sexual activity. Thiel said the new research suggests these models might generate such illicit images because of some of the underlying data on which they were built. The report recommends that models based on Stable Diffusion 1.5 “should be deprecated and distribution ceased wherever feasible.”

– With assistance from Marissa Newman and Aggi Cantrill.

More stories like this are available on bloomberg.com

©2023 Bloomberg L.P.








Письмо с душой из Marins Park Hotel Екатеринбург

Marins Park Hotel Ростов – это больше, чем просто отель

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки

Психолог Зберовский заявил, что расставание может помочь преодолеть зависимость


Dow futures sink as Trump keeps pushing tariffs while White House suggests Powell’s job could be at risk

First confirmed death during Trump ICE raid is a farmworkers at a California cannabis facility

ICE is 'supercharging detention' with 'flagrantly unlawful' policy: lawyers

Son Of British Boxing Legend Retires From The Sport Aged Just 24: “Won’t Be Fighting Again”


The sun of the North

Беспроводной сканер штрих-кодов Heroje S-H29W

Мобильный терминал сбора данных с ридером RFID тегов Saotron RT41G

Дивеево


I've swapped modern live service games for a browser game that's been running since 2009

Those shadow giants in the distance in Elden Ring Nightreign are over 2 miles tall⁠—almost as big as the Erdtree⁠—and nobody even mentions them in the game

Гайд на Fuqiu из Etheria Restart: навыки, PvE-билд, расклад в PvP и дубликаты

The Expanse RPG's developers are 'humbled' by comparisons to BioWare's heyday, but don't expect it to be a straight Mass Effect clone: 'We make our story a little bit differently'



Росгвардейцы из Чеченской Республики стали победителями и призерами чемпионата Северо-Кавказского округа Росгвардии по комплексному единоборству

Косметолог Наталья Рябинова: в чем разница между эстетическим и медицинским трихологом

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки

Пора пригласить певца A.SERGIO для участия в теле- и радиопрограммах, подкастах и шоу!


Косметолог Наталья Рябинова: в чем разница между эстетическим и медицинским трихологом

Росгвардейцы из Чеченской Республики стали победителями и призерами чемпионата Северо-Кавказского округа Росгвардии по комплексному единоборству

Вторичное жилье начало дешеветь

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки


На озере в Красноармейском округе пропала женщина

Замоскворецкая линия метро: отсутствие движения между «Белорусской» и «Театральной»

Москва прощается с жарой: жителей столицы предупредили о ливнях и грозах

АвтоВАЗ отгружает Lada Iskra дилерам. Цены объявят на этой неделе


Кудерметова стала первой россиянкой, выигравшей парный разряд Уимблдона с 2017 года

Кудерметова завоевала свой первый титул Уимблдона в парном разряде.

Синнер впервые стал победителем Уимблдона

Подмосковный теннисист стал бронзовым призером юниорского Уимблдона


Эквадор передаст России гражданина, похитившего миллионы из Социального фонда

Дептранс: на Замоскворецкой линии московского метро восстановили движение

Эквадор выдал россиянина, подозреваемого в мошенничестве.

Ливень, гроза, град и ветер: москвичей предупредили о непогоде до утра вторника


Музыкальные новости

Мясной ресторан «Frank by Баста» открылся в Афимолле

Беременная фанатка разочаровалась в Басте: жена рэпера не стала молчать

Суд Петербурга начал административное дело против группы «Порнофильмы»

«По понятиям»: как Любовь Успенская выбирает мужчин


Росгвардейцы из Чеченской Республики стали победителями и призерами чемпионата Северо-Кавказского округа Росгвардии по комплексному единоборству

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки

Пора пригласить певца A.SERGIO для участия в теле- и радиопрограммах, подкастах и шоу!

Косметолог Наталья Рябинова: в чем разница между эстетическим и медицинским трихологом


Энергетики смоленского филиала «Россети Центр» провели познавательное мероприятие для детей «Как подружиться с электричеством?»

Тренер "Спартака" Станкович: у Барко вышел волнообразный сезон

Сделка против Путина: Что предложила Канада Пригожину за снятие санкций. Правду скрывали годами

Эквадор передаст России гражданина, похитившего миллионы из Социального фонда


Красные арки, синяя подсветка. В Москве строят новые пешеходные мосты

КАМАЗ-4280 начал тестовую эксплуатацию на маршруте в Подмосковье

Мобильный интернет перестанут массово отключать в России

В Москве мужчина ограбил магазин на АЗС, угрожая пистолетом


В РФ раскрыли замысел Трампа после его попыток шантажировать Путина

В США сделали смелое заявление в отношении Путина.

Путин отметил успех школьников на Международной химической олимпиаде.

Посол Акира Муто: Япония будет приветствовать возможную встречу Путина и Трампа




Врач-трихолог Мадина Осман: как часто можно делать пересадку волос

Травмированного на репетиции в цирке Москвы акробата выписали из больницы

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки

Клинический психолог Юлия Тарибо: каким типам личностей сложно было вместе


ВСУ атаковали дронами женщин под Сумами: Били за надпись "Мы русские"


Росгвардейцы из Чеченской Республики стали победителями и призерами чемпионата Северо-Кавказского округа Росгвардии по комплексному единоборству

"Пока Путин не заметит это безобразие": Пономарев резко высказался о легионерах в РПЛ

«Турбозавры» поучаствовали в Дне московского транспорта

Травмированного на репетиции в цирке Москвы акробата выписали из больницы


Лукашенко встретился в Минске с делегацией Петербурга для обсуждения сотрудничества

Лукашенко предложил Петербургу ремонтировать всю белорусскую технику

«Нам в Минске надо учиться». Лукашенко похвалил Беглова за зимнюю уборку Петербурга

Лукашенко заявил о необходимости проверки чиновников за манипуляции с ценами.


Сергей Собянин: роботы и электромашины на страже московских улиц

Сергей Собянин: В Москве появятся три новых пешеходных моста к 2027 году


РЭО проведет акселератор для экоцентров на базе Плехановского университета

Позднякова: температура в Москве останется выше климатической нормы

РЭО запускает акселератор для экологических центров на базе Плехановского университета

Губернатор Андрей Бочаров принимает участие в образовательной программе Сбера


Посол Акира Муто: Япония будет приветствовать возможную встречу Путина и Трампа

Ливень, гроза, град и ветер: москвичей предупредили о непогоде до утра вторника

Эквадор передаст России гражданина, похитившего миллионы из Социального фонда

Дептранс: на Замоскворецкой линии московского метро восстановили движение


Алтайский край оказался в числе регионов-аутсайдеров по доступности вторичного жилья

Защищённый планшет Saotron RT-W11J на базе ОС Windows10

Фестиваль духовых оркестров пройдет в трех городах Поморья по случаю Дня ВМФ

В городе Барнауле стартовал третий этап смотра-конкурса на звание "Лучшее звено газодымозащитной службы" среди Главных управлений МЧС России


Под Симферополем горят десятки гектаров леса

Десятки улиц Симферополя остались без света 14 июля

Крыму и еще 24 регионам России спишут долги на миллиарды рублей

Симферополь частично остался без света утром 14 июля


На озере в Красноармейском округе пропала женщина

Москвичам сообщили о надвигающейся грозе с порывистым ветром.

МВД: мошенники крадут аккаунты «Госуслуг» под предлогом поступления в вуз

Замоскворецкая линия метро: отсутствие движения между «Белорусской» и «Театральной»














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *