Добавить новость
smi24.net
News in English
Декабрь
2023

Researchers found child abuse material in the largest AI image generation dataset

0

Researchers from the Stanford Internet Observatory say that a dataset used to train AI image generation tools contains at least 1,008 validated instances of child sexual abuse material. The Stanford researchers note that the presence of CSAM in the dataset could allow AI models that were trained on the data to generate new and even realistic instances of CSAM.

LAION, the non-profit that created the dataset, told 404 Media that it "has a zero tolerance policy for illegal content and in an abundance of caution, we are temporarily taking down the LAION datasets to ensure they are safe before republishing them." The organization added that, before publishing its datasets in the first place, it created filters to detect and remove illegal content from them. However, 404 points out that LAION leaders have been aware since at least 2021 that there was a possibility of their systems picking up CSAM as they vacuumed up billions of images from the internet. 

According to previous reports, the LAION-5B dataset in question contains "millions of images of pornography, violence, child nudity, racist memes, hate symbols, copyrighted art and works scraped from private company websites." Overall, it includes more than 5 billion images and associated descriptive captions. LAION founder Christoph Schuhmann said earlier this year that while he was not aware of any CSAM in the dataset, he hadn't examined the data in great depth.

It's illegal for most institutions in the US to view CSAM for verification purposes. As such, the Stanford researchers used several techniques to look for potential CSAM. According to their paper, they employed "perceptual hash‐based detection, cryptographic hash‐based detection, and nearest‐neighbors analysis leveraging the image embeddings in the dataset itself." They found 3,226 entries that contained suspected CSAM. Many of those images were confirmed as CSAM by third parties such as PhotoDNA and the Canadian Centre for Child Protection.

Stability AI founder Emad Mostaque trained Stable Diffusion using a subset of LAION-5B data. Google's Imagen text-to-image model was trained on a subset of LAION-5B as well as internal datasets. A Stability AI spokesperson told Bloomberg that it prohibits the use of its test-to-image systems for illegal purposes, such as creating or editing CSAM.“This report focuses on the LAION-5B dataset as a whole,” the spokesperson said. “Stability AI models were trained on a filtered subset of that dataset. In addition, we fine-tuned these models to mitigate residual behaviors.”

Stable Diffusion 2 (a more recent version of Stability AI's image generation tool) was trained on data that substantially filtered out 'unsafe' materials from the dataset. That, Bloomberg notes, makes it more difficult for users to generate explicit images. However, it's claimed that Stable Diffusion 1.5, which is still available on the internet, does not have the same protections. "Models based on Stable Diffusion 1.5 that have not had safety measures applied to them should be deprecated and distribution ceased where feasible," the Stanford paper's authors wrote.

This article originally appeared on Engadget at https://www.engadget.com/researchers-found-child-abuse-material-in-the-largest-ai-image-generation-dataset-154006002.html?src=rss







Ортопед дал совет по сохранению здоровья спины на сидячей работе

Коллекция Zuhair Murad осень-зима 2025/26

Российский рэпер сжег кабриолет BMW прямо на сцене

Гастроэнтеролог Садыков: аппендицит из-за семечек арбуза или шелухи подсолнуха — миф


Report: Liverpool decision hands advantage to Man United in midfielder pursuit

Palestinian envoy urges action at UN: “History will judge us all”

Exclusive: Fintech giant Stripe building ‘Tempo’ blockchain with crypto VC Paradigm

3 Terrifying Horror Series To Watch Ahead Of HBO’s ‘It: Welcome to Derry’


#вкимжевсегдахорошо

Чудо-колонка Детского радио: малыш будет в восторге!

Хибины

Экстренная посадка.


The US Air Force wants to test blowing up Cybertrucks because 'it is likely the type of vehicles used by the enemy may transition to Tesla Cyber trucks'

New study shows that Gen Z is spending way less money on videogames than older gamers

Steam for Chromebooks is getting axed in 2026 instead of exiting its 4-year beta

Первый взгляд на мобильную версию Neon Spellstorm


Овочі можусть стати розкішшю для українців


Всё об операциях на почках: показания, какие бывают и как проходят

Солнечному мальчику необходимо лекарство, чтобы спасти сердце от перегрузок

Директор Росгвардии Герой России генерал Виктор Золотов принял участие в заседании Национального антитеррористического комитета

Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления


Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления

Грачья Погосян: достойный пример гуманизма и патриотизма (к 55-летию известного благотворителя)

Антиармянские публикации в российском научном журнале «Современная научная мысль»: расследование фонда «Гегард»

В Красноярске пьяный водитель протаранил машину ДПС при попытке скрыться


Когда ударят первые морозы: подробный и точный прогноз на осень-2025

Праздник «Дни литературы в Кузбассе 2025» пройдет в сентябре

Дорога на улице Трифоновской будет перекрыта до 22 августа

Казна Путина полна. Россия получила $330 млрд, пока Европа вводила санкции


Хачанов достиг третьего раунда теннисного турнира «Мастерс»

Самсонова уступила 125-й ракетке мира во втором раунде турнира в Цинциннати

Синнер пробился в четвертый раунд турнира "Мастерс" в Цинциннати

Павлюченкова не сумела пробиться в третий раунд турнира в Цинциннати


Один из участников ограбления отделения почты в Москве — пенсионер, ему почти 68 лет

Татарстан попал в топ-5 регионов по спросу на ипотеку

Синоптики сообщили о переменной облачности и небольшом дожде в Москве 13 августа

Дорога на улице Трифоновской будет перекрыта до 22 августа


Музыкальные новости

«Я принципиально не написала его имя!» Марина Кравец отказалась петь песню Натана в шоу «Большой хит» на ТНТ

Концерт нижегородского фестиваля «Музыка балконов» прошел в Санкт-Петербурге

Концерт рэпера Эйкона прошел в Москве

Концерт к 100-летию со дня кончины святителя Тихона дадут в Псковском кремле


Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления

Солнечному мальчику необходимо лекарство, чтобы спасти сердце от перегрузок

Алгоритмы Яндекс Музыки. Алгоритмы продвижения в Яндекс Музыка.

Всё об операциях на почках: показания, какие бывают и как проходят


"Динамо" Карпина упустило победу над "Сочи" в конце матча

Роднина: «Жить люблю и хочу в Москве. Вы меня перепутали с другим поколением, которое всегда ищет, где лучше»

CNN: встреча Путина и Трампа пройдет на военной базе в Анкоридже

Московский суд взыскал с Басты долг по коммунальным платежам


Быстрый старт в прибыльном бизнесе по продаже автозапчастей

Магазин автозапчастей франшиза – успешное и прибыльное предприятие

Преимущества франшизы «Автополка»

Выбор подходящей франшизы автозапчастей


Bloomberg: встреча Путина и Трампа сама по себе представляет победу Москвы

Ким Чен Ын подтвердил Путину неизменную поддержку КНДР в отношении России

В России объяснили скорую организацию встречи Путина и Трампа

СМИ: американские чиновники рады решению Путина посетить Аляску




Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления

Здоровье Бориса Щербакова: обновленные сведения от научно-исследовательского центра имени Склифосовского

КГ PROGRESS: в Перми работают самые опытные стоматологи в России

Солнечному мальчику необходимо лекарство, чтобы спасти сердце от перегрузок


Зеленский пригрозил «третьей мировой войной» в случае давления на Киев в вопросе уступок территорий


«Лето в Москве» в Южном округе объединит спорт, искусство и технологии в ближайшие выходные

Благодаря совместным действиям сотрудников Росгвардии и их коллег футбольный матч «Акрон» – ЦСКА завершился без происшествий

Журова о возвращении граждан, сменивших гражданство: «Практически невозможно»

На пенсии отоспишься. 13 идей для ночного досуга в Москве — от тенниса до парилки


Лукашенко получил первую золотую монету из белорусского сырья


Собянин объявил об открытии новой детской поликлиники в районе Крюково

Сергей Собянин: Герои — не какие-то особенные люди, они живут рядом с нами

Собянин оценил вклад проектов "Город героев" и "Герой моего района

Сергей Собянин. Главное за день


Орловская область планирует войти в число национальных туристических маршрутов с проектом «Бирюзовое кольцо России»

Погода сошла с ума? Главный синоптик России Вильфанд предупреждает: аномалий будет все больше - то в жар, то в холод

Хватит морщиться: ученые назвали пользу от участившихся московских ливней

Площадь возгорания на горе Куцай достигла 650 тысяч квадратных метров


Девять клипов подряд: группа REFLEX планирует установить мировой рекорд

Отзывы о франшизе «Автополка»

Дорога на улице Трифоновской будет перекрыта до 22 августа

Татарстан попал в топ-5 регионов по спросу на ипотеку


Универсальный ТСД промышленного класса Saotron RT-T40X V.2

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

Сотрудниками полиции и Росгвардии задержан гражданин, причастный к поджогу релейного шкафа в Архангельской области

Заместитель прокурора Архангельской области и Ненецкого автономного округа Павел Матанцев проверил ход ремонтных работ в школе № 1 г. Нарьян-Мара


Прогноз погоды в Крыму на среду

Прогноз погоды в Крыму на 11 августа

Историко-краеведческая выставка «Древности земли крымской»

Прогноз погоды в Крыму на 13 августа


Когда ударят первые морозы: подробный и точный прогноз на осень-2025

Один из участников ограбления отделения почты в Москве — пенсионер, ему почти 68 лет

Синоптики сообщили о переменной облачности и небольшом дожде в Москве 13 августа

Он был гордостью СССР, но до этого проявил слабость — Михайлов хотел сбежать из лучшего клуба страны














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *