Добавить новость
smi24.net
News in English
Июль
2024

The copyright lawsuits against OpenAI are piling up as the tech company seeks data to train its AI

0
OpenAI is facing several lawsuits over copyrighted material used to train ChatGPT.
  • Publishers want compensation from OpenAI for using their works to train AI models.
  • The Center for Investigative Reporting filed a lawsuit against the company this week.
  • The New York Times and other outlets also have similar lawsuits against OpenAI.

OpenAI uses any and all publicly available data to train ChatGPT, including books and articles from the internet. Now, those who own them want to be paid for their work.

Training data is an essential part of creating the AI models that are taking over the tech world. Leading tech companies like Google, Meta, OpenAI, Anthropic, and Microsoft are all scrambling to find new sources of data. Meta at one point even considered buying Simon & Schuster, one of the world's biggest publishing houses.

Part of the problem is that publishers are increasingly accusing these companies of hoovering up copyrighted data. They'd like to be paid for their work. Meta and OpenAI have argued in comments to the US Copyright Office that putting copyrighted material on the internet makes it "publicly available" and thus under fair use.

But they'll still have to make that argument in court as the company faces lawsuits from several groups over the copyrighted material.

The Center for Investigative Reporting, a news nonprofit known sometimes by its acronym CIR and which merged with Mother Jones and Reveal earlier this year, sued OpenAI and Microsoft last week in federal court. The lawsuit accuses OpenAI of being "built on the exploitation of copyrighted works belonging to creators around the world, including CIR."

Lawyers for the CIR accused OpenAI and Microsoft of using copyrighted material from Mother Jones to train their GPT and Copilot AI models.

"OpenAI and Microsoft started vacuuming up our stories to make their product more powerful, but they never asked for permission or offered compensation, unlike other organizations that license our material," Monika Bauerlein, CEO of the Center for Investigative Reporting, said in an announcement about the lawsuit. "This free rider behavior is not only unfair, it is a violation of copyright."

The lawsuit says that "16,793 distinct URLs from Mother Jones's web domain" appeared in a published list of the top web domains present in the company's WebText training set.

In another class action lawsuit from the Author's Guild, two authors claimed that the company used information from their books to train ChatGPT. The New York Times also filed a similar lawsuit against the company in December 2023.

In May, court documents in the Author's Guild lawsuit revealed that OpenAI deleted two huge datasets used to train GPT-3. Lawyers for the guild said the two sets likely contained "more than 100,000 published books."

The two employees responsible for putting together the data no longer work for OpenAI, court documents say.

OpenAI has begun signing licensing agreements with news organizations to fairly use their work. The company has signed such agreements with The Associated Press, publishers of The Wall Street Journal and New York Post, The Atlantic, Prisa Media, Le Monde newspaper, Financial Times, and Business Insider parent Axel Springer.

But the scale of content required for these bots to continuously learn will require far more than a handful of licensing agreements.

One solution is synthetic data, which is artificially generated rather than collected from the real world, and can easily be generated by machine learning algorithms.

OpenAI has considered synthetic data as an option to train its models, but CEO Sam Altman has raised concerns about producing quality data.

"As long as you can get over the synthetic data event horizon, where the model is smart enough to make good synthetic data, everything will be fine," Altman said at a tech conference in May 2023. The company has also explored a process in which AI models work together — one AI system produces data, while another judges it.

OpenAI did not immediately return a request for comment from Business Insider.

Read the original article on Business Insider







В Москве прошла седьмая премия в области здоровья и красоты THE MEDICAL STARS & BEAUTY AWARDS

Музыкант Алексей Фомин поделился историей о его отношениях с друзьями

Неочевидные услуги в поезде

Город Бакуракерт на полуострове Ланжерон


Jovic set for new opportunity after leaving Milan as free agent

The 5 biggest global business rivalries to watch, and how their outcomes will shape the future

Not even a 0% mortgage rate would make buying a house affordable in these 6 U.S. cities

£39m United star shouldn't be starting vs Arsenal, was gifting possession to Everton


Фридрихсбургские ворота

Ладожское утро...

Вывод песни для продвижение в Импульсе Яндекс музыки.

Севастополь вошёл в десятку регионов-лидеров по количеству оформленных годовых полисов рейтинга РСА


Обзор на мобильную версию A Game About Digging A Hole

Black Hole io 1.5.1

Раскрой потенциал Мистера Террифика из DC Worlds Collide с этим гайдом

Girl Rescue 1.0.3.3



«Турбозавры» на фестивале «Динозавры на каникулах» в ЦДМ на Лубянке

Концерты органной музыки в Москве: волшебство звуков в галерее Ильи Глазунова

В Москве прошла премия «Триумф Года»

Два автобуса столкнулись на северо-востоке Москвы, движение перекрыто


В Москве прошла премия «Триумф Года»

Спрос на услуги салонов красоты и косметологию активно растет после спада в 2022 году

В рамках AmberForum состоялся единственный в мире аукцион редкого янтаря

Афиша мероприятий на август в ТРЦ «Нора»


Аналитик проанализировал impacto санкций США на Россию для Турции

Суточная аренда выдала прибыль // Какая недвижимость выгодна для инвестиций

Похороны худрука «Электротеатра Станиславский» Юхананова пройдут 7 августа

Битцевский маньяк Пичушкин оспорил отказ в переводе в московскую колонию


Турнир ATP в Афинах: Джокович меняет планы из-за протестов в Сербии

Российский теннисист Рублев проиграл американцу Фритцу в четвертьфинале турнира ATP

Хачанов обогнал Медведева, Рублев приятно удивил, а Таусон остановила Свентек

Бублик честно высказался о провале Рублёва и Медведева


Юрист Хаминский: в РФ вводится сбор данных о покупателях монет из драгметаллов

Филолог объяснил, как добиться от ChatGPT объективности вместо приятных ответов

8 августа в «Лужниках» стартуют бесплатные тренировки на всесезонном льду

Финальным аккордом Дня города в Орле стали «UMA2RMAN» и салют


Музыкальные новости

Астраханский ТРЗ Желдорреммаша приступил к серийному капитальному ремонту тепловозов ТЭМ18ДМ

В Москве прошла премия «Триумф Года»

Variety: причиной смерти Оззи Осборна стал острый инфаркт миокарда

Певец Дима Билан пригласил Медведеву на свой концерт


Дептранс Москвы рекомендовал использовать метро из-за ограничения движения

В Москве прошла премия «Триумф Года»

Два автобуса столкнулись на северо-востоке Москвы, движение перекрыто

Концерты органной музыки в Москве: волшебство звуков в галерее Ильи Глазунова


Кубок Посла Китая по Вэйци прошёл в Москве

Фестиваль «Культурный код Подмосковья» посетили более 30 тысяч человек

В Москве прошла премия «Триумф Года»

После матча с "Ростовом" КДК оштрафовал "Динамо" из-за нарушения регламента


Нейросеть наводят на большую дорогу // Москва расширяет контроль за дорожными авариями, животными и мусором на проезжей части

Два автобуса столкнулись на северо-востоке Москвы, движение перекрыто

Автобус попал в ДТП на трассе М-4 под Тулой: что рассказали пассажиры

Клиенты компании «Байкал Сервис» экономят на перевозке сезонных товаров


Великое переселение офисов: Путин прогоняет чиновников из Москвы в регионы

Во Франции высказались о визите Уиткоффа в Москву

Интриги Эрдогана и Зеленского. «Джокер» Путина. Активность над секретным полигоном: Главное к утру

Сфотографировавшийся с Путиным мальчик из Китая обратился к нему спустя 25 лет



В Москве задержали четверых сторонников ФБК за пожертвования организации

В Москве задержаны четверо мужчин по делу о пожертвованиях организации «ФБК»


Клинический психолог Юлия Тарибо: что такое односторонняя дружба и стоит ли ее продолжать

Как проверить качество получаемой медицинской помощи по ОМС...

К доктору – без страха: сеть клиник «Будь Здоров» представила VR-решения для детского здоровья

В Москве прошла седьмая премия в области здоровья и красоты THE MEDICAL STARS & BEAUTY AWARDS


Зеленский добивается визита Эрдогана в Киев

«Хоть в платье, хоть в парике»: слухи о побеге Зеленского распространяются в Киеве


«Детям полезно принимать участие в любой движухе, связанной с творчеством, музыкой и спортом!» В Москве завершился Международный фест-форум «Голоса Мира» 2025

«Ты будешь моей…»: Николай Ерусланкин из Нижнего Новгорода удивил всех участников шоу «Погоня» на ТНТ

Худайбердиева указала, что день смерти Гришина стал самым мрачным за последние годы

В депо «Вязьма» отметили профессиональный праздник соревнованиями по лазертагу


Лукашенко предупреждает: не стоит соревноваться с крупными государствами


Сергей Собянин: реставрация Большого Каменного моста завершена за 14 месяцев

Сергей Собянин: В Москве запущен 220-й электробусный маршрут

Собянин открыл первый флагманский МФЦ для регистрации самоходной техники

Мэр Собянин поделился информацией о новорожденных животных в «Москвариуме»


Объем российского добычи водных биоресурсов превысил три миллиона тонн

Зачем нужна программная нормализация воды после очистки — объясняет Алексей Горшков

Мессенджер Max будут обязательно устанавливать на новые смартфоны с сентября

Около 850 тысяч тонн вторсырья собрано в Москве за полгода


8 августа в «Лужниках» стартуют бесплатные тренировки на всесезонном льду

Филолог объяснил, как добиться от ChatGPT объективности вместо приятных ответов

"Москвич Mag": москвички массово едят масло пачками из-за нового тренда в сети

Алексей Тамаров – искусство пластической хирургии


Аномальная жара: До +41 °С в Чечне и Ингушетии, +30 °С в Карелии и Архангельске

Амурская область оказалась в числе аутсайдеров по качеству дорог

Коми, Камчатку, Архангельскую, Иркутскую, Калужскую, Костромскую, Курскую, Свердловскую и Оренбургскую области эксперты отнесли к регионам, где на осенних выборах "протестный потенциал выше среднего", говорится в докладе...

Вильфанд предупредил об аномальной жаре в девяти регионах


В Симферополе вспомнили крымскую писательницу, пережившую оккупацию ребенком: 100 лет Елене Криштоф

Поезда в Крым меняют маршруты и график

До 100 метеоров в час: когда наблюдать пик звездопада Персеиды над Крымом

Компания «Гранд Сервис Экспресс» информирует об изменениях в курсировании некоторых поездов «Таврия» с осени 2025 года


Юрист Хаминский: в РФ вводится сбор данных о покупателях монет из драгметаллов

Москва инвестирует 13,7 млрд рублей в технопарк на юго-востоке столицы

Финальным аккордом Дня города в Орле стали «UMA2RMAN» и салют

Алексей Тамаров – искусство пластической хирургии














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *