Добавить новость
smi24.net
News in English
Декабрь
2023

Large AI dataset has over 1,000 child abuse images, Stanford researchers Find

0

By Davey Alba and Rachel Metz | Bloomberg

A massive public dataset used to build popular artificial intelligence image generators contains at least 1,008 instances of child sexual abuse material, a new report from the Stanford Internet Observatory found.

LAION-5B, which contains more than 5 billion images and related captions from the internet, may also include thousands of additional pieces of suspected child sexual abuse material, or CSAM, according to the report. The inclusion of CSAM in the dataset could enable AI products built on this data — including image generation tools like Stable Diffusion — to create new, and potentially realistic, child abuse content, the report warned.

The rise of increasingly powerful AI tools has raised alarms in part because these services are built with troves of online data — including public datasets such as LAION-5B — that can contain copyrighted or harmful content. AI image generators, in particular, rely on datasets that include pairs of images and text descriptions to determine a wide range of concepts and create pictures in response to prompts from users.

In a statement, a spokesperson for LAION, the Germany-based nonprofit behind the dataset, said the group has a “zero tolerance policy” for illegal content and was temporarily removing LAION datasets from the internet “to ensure they are safe before republishing them.” Prior to releasing its datasets, LAION created and published filters for spotting and removing illegal content from them, the spokesperson said.Christoph Schuhmann, LAION’s founder, previously told Bloomberg News that he was unaware of any child nudity in the dataset, though he acknowledged he did not review the data in great depth. If notified about such content, he said, he would remove links to it immediately.

A spokesperson for Stability AI, the British AI startup that funded and popularized Stable Diffusion, said the company is committed to preventing the misuse of AI and prohibits the use of its image models for unlawful activity, including attempts to edit or create CSAM. “This report focuses on the LAION-5B dataset as a whole,” the spokesperson said in a statement. “Stability AI models were trained on a filtered subset of that dataset. In addition, we fine-tuned these models to mitigate residual behaviors.”

LAION-5B, or subsets of it, have been used to build multiple versions of Stable Diffusion. A more recent version of the software, Stable Diffusion 2.0, was trained on data that substantially filtered out “unsafe” materials in the dataset, making it much more difficult for users to generate explicit images. But Stable Diffusion 1.5 does generate sexually explicit content and is still in use in some corners of the internet. The spokesperson said Stable Diffusion 1.5 was not released by Stability AI, but by Runway, an AI video startup that helped create the original version of Stable Diffusion. Runway said it was released in collaboration with Stability AI.

“We have implemented filters to intercept unsafe prompts or unsafe outputs when users interact with models on our platform,” the Stability AI spokesperson added. “We have also invested in content labeling features to help identify images generated on our platform. These layers of mitigation make it harder for bad actors to misuse AI.”

LAION-5B was released in 2022 and relies on raw HTML code collected by a California nonprofit to locate images around the web and associate them with descriptive text. For months, rumors that the dataset contained illegal images have circulated in discussion forums and on social media.“As far as we know, this is the first attempt to actually quantify and validate concerns,”  David Thiel, chief technologist of the Stanford Internet Observatory, said in an interview with Bloomberg News.

For their report, Stanford Internet Observatory researchers detected the CSAM material by looking for different kinds of hashes, or digital fingerprints, of such images. The researchers then validated them using APIs dedicated to finding and removing known images of child exploitation, as well as by searching for similar images in the dataset.

Much of the suspected CSAM content that the Stanford Internet Observatory found was validated by third parties like Canadian Centre for Child Protection and through a tool called PhotoDNA, developed by Microsoft Corp., according to the report. Given that the Stanford Internet Observatory researchers could only work with a limited portion of high-risk content, additional abusive content likely exists in the dataset, the report said.

While the amount of CSAM present in the dataset doesn’t indicate that the illicit material “drastically” influences the images churned out by AI tools,  Thiel said it does likely still have an impact. “These models are really good at being able to learn concepts from a small number of images,” he said. “And we know that some of these images are repeated, potentially dozens of times in the dataset.”

Stanford Internet Observatory’s work previously found that generative AI image models can produce CSAM, but that work assumed the AI systems were able to do so by combining two “concepts,” such as children and sexual activity. Thiel said the new research suggests these models might generate such illicit images because of some of the underlying data on which they were built. The report recommends that models based on Stable Diffusion 1.5 “should be deprecated and distribution ceased wherever feasible.”

–With assistance from Marissa Newman and Aggi Cantrill.

More stories like this are available on bloomberg.com

©2023 Bloomberg L.P.








Письмо с душой из Marins Park Hotel Екатеринбург

Специалисты «ДИАКОН» установили современные анализаторы Lifotronic eCL-8000 в ведущих медицинских учреждениях России

Ольга Романив: как вести себя с мужчиной, который нравится

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки


Dow futures sink as Trump keeps pushing tariffs while White House suggests Powell’s job could be at risk

First confirmed death during Trump ICE raid is a farmworkers at a California cannabis facility

ICE is 'supercharging detention' with 'flagrantly unlawful' policy: lawyers

Trump's cuts force Texas food banks to ration supplies for flood survivors


Каршеринг BelkaCar запустил новый сезон проекта «Умные путешествия»

Беспроводной сканер штрих-кодов Heroje S-H29W

Предзимние туманы

В Курской области мужчину осудили за угрозу убийством матери


Гайд на Fuqiu из Etheria Restart: навыки, PvE-билд, расклад в PvP и дубликаты

The Expanse RPG's developers are 'humbled' by comparisons to BioWare's heyday, but don't expect it to be a straight Mass Effect clone: 'We make our story a little bit differently'

Those shadow giants in the distance in Elden Ring Nightreign are over 2 miles tall⁠—almost as big as the Erdtree⁠—and nobody even mentions them in the game

I've swapped modern live service games for a browser game that's been running since 2009



Пора пригласить певца A.SERGIO для участия в теле- и радиопрограммах, подкастах и шоу!

Росгвардейцы из Чеченской Республики стали победителями и призерами чемпионата Северо-Кавказского округа Росгвардии по комплексному единоборству

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки

Вот билет на контент, на эксплойт билетов нет


Вторичное жилье начало дешеветь

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки

Косметолог Наталья Рябинова: в чем разница между эстетическим и медицинским трихологом

Росгвардейцы из Чеченской Республики стали победителями и призерами чемпионата Северо-Кавказского округа Росгвардии по комплексному единоборству


Эквадор выдал россиянина, подозреваемого в мошенничестве.

(НЕ)СЕКРЕТНУЮ СЛУЖБУ США ПОДОЗРЕВАЮТ В ПОСТАНОВКЕ СЦЕНЫ ПОКУШЕНИЯ НА ТРАМПА. СЕНСАЦИЯ! Новости. В.В. Путин, Дональд Трамп. Россия, США, Европа могут улучшить отношения и здоровье общества!

В Москве мужчина ограбил магазин на АЗС, угрожая пистолетом

Γpуɜинcκий пοлитиκ: Βce ɜдpaвοмыcлящиe xοтят вepнутьcя в eдинοe пpοcтpaнcтвο c Ροccиeй


Синнер впервые стал победителем Уимблдона

«Гордимся!»: Рустам Минниханов отметил успех Вероники Кудерметовой на Уимблдоне

Синнер завоевал титул на Уимблдоне, победив Алькараса.

Кудерметова завоевала свой первый титул Уимблдона в парном разряде.


Татарстан вошел в число лидеров по количеству заявок на конкурс брендов «Знай наших»

Эту одежду многие уже давно выкинули, а зря: топ-7 стильных в 2025 году вещей, которые и через 100 лет будут в моде

«Турбозавры» поучаствовали в Дне московского транспорта

Синоптик Леус: 45 процентов месячной нормы осадков выпало в столичном регионе


Музыкальные новости

Благотворительный забег «Мелодия добрых дел» пройдёт в Ульяновске

Певец из Узбекистана Шохрух Ганиев примет участие в «Интервидении»

Юрий Антонов заявил о своей роли в избрании Лукашенко

Суд в Петербурге может признать экстремистской одну из песен группы «Порнофильмы»


Росгвардейцы из Чеченской Республики стали победителями и призерами чемпионата Северо-Кавказского округа Росгвардии по комплексному единоборству

Вот билет на контент, на эксплойт билетов нет

Пора пригласить певца A.SERGIO для участия в теле- и радиопрограммах, подкастах и шоу!

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки


Трамп вновь заявил о своем разочаровании Путиным

«Спартак» продлил контракт с люксембургским футболистом Мартинсом

Правительство спишет долги 25 регионов по бюджетным кредитам на 43 миллиарда рублей – Мишустин

«Она пошла встречаться с подружками в Москве»: новый сериал от Бони и ее дочери


В Москве мужчина ограбил магазин на АЗС, угрожая пистолетом

Красные арки, синяя подсветка. В Москве строят новые пешеходные мосты

КАМАЗ-4280 начал тестовую эксплуатацию на маршруте в Подмосковье

Вскрытие без последствий – сервис «Спас-замков»


В РФ раскрыли замысел Трампа после его попыток шантажировать Путина

"Пока Путин не заметит это безобразие": Пономарев резко высказался о легионерах в РПЛ

Посол Акира Муто: Япония будет приветствовать возможную встречу Путина и Трампа

В США сделали смелое заявление в отношении Путина.




Клинический психолог Юлия Тарибо: каким типам личностей сложно было вместе

Травмированного на репетиции в цирке Москвы акробата выписали из больницы

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки

Врач-трихолог Мадина Осман: как часто можно делать пересадку волос


ВСУ атаковали дронами женщин под Сумами: Били за надпись "Мы русские"


Травмированного на репетиции в цирке Москвы акробата выписали из больницы

Раскрыто расписание Олимпийских игр 2028 года в Лос-Анджелесе.

«Турбозавры» поучаствовали в Дне московского транспорта

"Пока Путин не заметит это безобразие": Пономарев резко высказался о легионерах в РПЛ


Лукашенко встретился в Минске с делегацией Петербурга для обсуждения сотрудничества

Петербургская делегация провела переговоры с президентом Беларуси в Минске

«Нам в Минске надо учиться». Лукашенко похвалил Беглова за зимнюю уборку Петербурга

Лукашенко предложил Петербургу ремонтировать всю белорусскую технику


Сергей Собянин: роботы и электромашины на страже московских улиц

Сергей Собянин: В Москве появятся три новых пешеходных моста к 2027 году


РЭО запускает акселератор для экологических центров на базе Плехановского университета

Губернатор Андрей Бочаров принимает участие в образовательной программе Сбера

ГК «АСНА» внедрила систему продвинутой аналитики «Дельта BI»

РЭО проведет акселератор для экоцентров на базе Плехановского университета


МВД: мошенники крадут аккаунты «Госуслуг» под предлогом поступления в вуз

Синоптик Леус: 45 процентов месячной нормы осадков выпало в столичном регионе

«Динамо» ведёт переговоры о переходе Рубенса из «Атлетико Минейро»

Москвичам сообщили о надвигающейся грозе с порывистым ветром.


В городе Барнауле стартовал третий этап смотра-конкурса на звание "Лучшее звено газодымозащитной службы" среди Главных управлений МЧС России

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

Алтайский край оказался в числе регионов-аутсайдеров по доступности вторичного жилья

Защищённый планшет Saotron RT-W11J на базе ОС Windows10


Симферополь частично остался без света утром 14 июля

Десятки улиц Симферополя остались без света 14 июля

Феодосия получила 150 миллионов на ремонты дворов - где начнут работы

Под Симферополем горят десятки гектаров леса


Жители Прикамья активно покупают билеты на транспорт в отделениях Почты России

На озере в Красноармейском округе пропала женщина

Дептранс: на Замоскворецкой линии московского метро восстановили движение

Экс-жена Сафонова Анастасия требует от вратаря 4 млн рублей судебных издержек














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *