Добавить новость
smi24.net
News in English
Июль
2023

Sarah Silverman and novelists sue ChatGPT-maker OpenAI for ingesting their books

0

Ask ChatGPT about comedian Sarah Silverman’s memoir “The Bedwetter” and the artificial intelligence chatbot can come up with a detailed synopsis of every part of the book.

Does that mean it effectively “read” and memorized a pirated copy? Or it scraped so many customer reviews and online chatter about the bestseller or the musical it inspired that it passes for an expert?

The U.S. courts may now help sort that out after Silverman sued ChatGPT-maker OpenAI for copyright infringement this week, joining a growing number of writers who say they unwittingly built the foundation for Silicon Valley’s red-hot AI boom.

Silverman’s lawsuit says she never gave permission for OpenAI to ingest the digital version of her 2010 book to train its AI models, and it was likely stolen from a “shadow library” of pirated works. It says the memoir was copied “without consent, without credit, and without compensation.”

It’s one of a mounting number of cases that could crack open the secrecy of OpenAI and its rivals about the valuable data used to train increasingly widely used “generative AI” products that create new text, images and music. And it raises questions about the ethical and legal bedrock of tools that the McKinsey Global Institute projects will add the equivalent of $2.6 trillion to $4.4 trillion to the global economy.

“This is an open, dirty secret of the whole machine learning industry,” said Matthew Butterick, one of the lawyers representing Silverman and other authors in seeking a class-action case. “They love book data and they get it from these illicit sites. We’re kind of blowing the whistle on that whole practice.”

OpenAI didn’t respond to requests for comment about the allegations. Another lawsuit from Silverman makes similar claims about an AI model built by Facebook and Instagram parent company Meta, which declined comment.

It may be a tough case for writers to win, especially after Google’s success in beating back legal challenges to its online book library. The U.S. Supreme Court in 2016 let stand lower court rulings that rejected authors’ claim that Google’s digitizing of millions of books and showing small portions of them to the public amounts to “copyright infringement on an epic scale.”

“I think what OpenAI has done with books is awfully close to what Google was allowed to do with its Google Books project and so will be legal,” said Deven Desai, associate professor of law and ethics at the Georgia Institute of Technology.

While only a handful have sued, including Silverman and bestselling novelists Mona Awad and Paul Tremblay, concerns about the tech industry’s AI-building practices have gained traction in literary and artist communities.

Other prominent authors — among them Nora Roberts, Margaret Atwood, Louise Erdrich and Jodi Picoult — signed a letter late last month to the CEOs of OpenAI, Google, Microsoft, Meta and other AI developers accusing them of exploitative practices in building chatbots that “mimic and regurgitate” their language, style and ideas.

“Millions of copyrighted books, articles, essays, and poetry provide the ‘food’ for AI systems, endless meals for which there has been no bill,” said the open letter organized by the Authors Guild and signed by more than 4,000 writers. “You’re spending billions of dollars to develop AI technology. It is only fair that you compensate us for using our writings, without which AI would be banal and extremely limited.”

The AI systems behind popular products such as ChatGPT, Google’s Bard and Microsoft’s Bing chatbot are known as large language models that have “learned” by analyzing and picking up patterns from a wide body of ingested text. They’ve awed the public with their strong command of the human language, though they’re also known for a tendency to spout falsehoods.

While the models have also been trained on news articles and social media feeds, books are particularly valuable, as OpenAI acknowledged in a 2018 paper cited in Silverman’s lawsuit.

The earliest version of OpenAI’s large language model, known as GPT-1, relied on a dataset compiled by university researchers called the Toronto Book Corpus that included thousands of unpublished books, some in the adventure, fantasy and romance genres.

“Crucially, it contains long stretches of contiguous text, which allows the generative model to learn to condition on long-range information,” OpenAI researchers said at the time. Other tech companies such as Google and Amazon also relied on the same data, which is no longer available in its original form.

But since then, OpenAI and other top AI developers have grown more secretive about their sources of data, even as they have ingested even larger troves of written works. Butterick said circumstantial evidence points to the use of so-called shadow libraries of pirated content that held the works of Silverman and other plaintiffs.

“It’s important for their models because books are the best source of long-form, well-edited, coherent writing,” he said. “You basically can’t have a high-quality language model unless you have books in your training data.”

It could be weeks or months a formal response is due from OpenAI. But once the case proceeds, tech executives could have to testify, under oath, about what sources of books they copied.

“As far as we know, the other side hasn’t denied it,” said Joseph Saveri, another of Silverman’s lawyers. “They don’t have an alternative explanation for this.”

Saveri said authors aren’t necessarily asking tech companies to throw away their algorithms and training data and start over — though there’s a precedent for destroying ill-gotten AI data. But some way of compensating writers is needed, he said.

Source








Marins Park Hotel Ростов – это больше, чем просто отель

Бизнесу усиливают защиту: двойной канал связи для безопасности

Сотрудничество с БГТУ: студенты проходят практику в депо «Вязьма»

Клинический психолог Юлия Тарибо: каким типам личностей сложно было вместе


Dow futures sink as Trump keeps pushing tariffs while White House suggests Powell’s job could be at risk

First confirmed death during Trump ICE raid is a farmworkers at a California cannabis facility

Son Of British Boxing Legend Retires From The Sport Aged Just 24: “Won’t Be Fighting Again”

ICE is 'supercharging detention' with 'flagrantly unlawful' policy: lawyers


Туристический спецпроект «Умные путешествия» стартовал в Подмосковье

Каршеринг BelkaCar запустил новый сезон проекта «Умные путешествия»

На трассе Р-158 в Мордовии обновили 10 км покрытия

Пора пригласить певца A.SERGIO для участия в теле- и радиопрограммах, подкастах и шоу!


I've swapped modern live service games for a browser game that's been running since 2009

MMORPG Lord Nine: Infinite Class выпустят в Юго-Восточной Азии 31 июля

Those shadow giants in the distance in Elden Ring Nightreign are over 2 miles tall⁠—almost as big as the Erdtree⁠—and nobody even mentions them in the game

Гайд на Fuqiu из Etheria Restart: навыки, PvE-билд, расклад в PvP и дубликаты



Косметолог Наталья Рябинова: в чем разница между эстетическим и медицинским трихологом

Вот билет на контент, на эксплойт билетов нет

Пора пригласить певца A.SERGIO для участия в теле- и радиопрограммах, подкастах и шоу!

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки


Татарстан вошел в число лидеров по количеству заявок на конкурс брендов «Знай наших»

Вторичное жилье начало дешеветь

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки

«Сила в команде»: судебные приставы Кузбасса приняли участие во всероссийских хоккейных соревнованиях среди силовиков


(НЕ)СЕКРЕТНУЮ СЛУЖБУ США ПОДОЗРЕВАЮТ В ПОСТАНОВКЕ СЦЕНЫ ПОКУШЕНИЯ НА ТРАМПА. СЕНСАЦИЯ! Новости. В.В. Путин, Дональд Трамп. Россия, США, Европа могут улучшить отношения и здоровье общества!

«Союз-Аполлон» — вторая встреча над Эльбой. А можем повторить?

Юрист Хаминский назвал возможных наследников режиссёра Юрия Мороза

Экс-жена Сафонова Анастасия требует от вратаря 4 млн рублей судебных издержек


Тарпищев объяснил причины неудачного выступления Анисимовой против Швентек.

Российская теннисистка Вероника Кудерметова выиграла Уимблдон в парном разряде, а итальянец Янник Синнер – в одиночном

Кудерметова стала первой россиянкой, выигравшей парный разряд Уимблдона с 2017 года

Медведев стал обладателем Кубка короля в Испании.


Андрей Воробьев рассказал об открытии новых школ в Подмосковье к 1 сентября

Эту одежду многие уже давно выкинули, а зря: топ-7 стильных в 2025 году вещей, которые и через 100 лет будут в моде

Многим рискует: юрист сказал, как сидит «золотой» экс-полковник Захарченко

На Замоскворецкой линии метро Москвы восстановили движение


Музыкальные новости

Быков, Харламов, Цой. Знаменитые артисты, которые погибли за рулем

Жена Басты сцепилась с Onlyfans-моделью Eva Bogut: подробности скандала

Волочкова отказалась выступать с Штурм: «Я балерина, а не певица»

Музыканты поделились чувствами после прощального концерта Оззи Осборна


Росгвардейцы из Чеченской Республики стали победителями и призерами чемпионата Северо-Кавказского округа Росгвардии по комплексному единоборству

Пора пригласить певца A.SERGIO для участия в теле- и радиопрограммах, подкастах и шоу!

Косметолог Наталья Рябинова: в чем разница между эстетическим и медицинским трихологом

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки


Росгвардейцы из Чеченской Республики стали победителями и призерами чемпионата Северо-Кавказского округа Росгвардии по комплексному единоборству

Франция предупредила о риске крупного конфликта в Европе к 2030 году

Время покупать? В России дешевеет вторичное жилье

"Пока Путин не заметит это безобразие": Пономарев резко высказался о легионерах в РПЛ


В Москве мужчина ограбил магазин на АЗС, угрожая пистолетом

Мобильный интернет перестанут массово отключать в России

Вскрытие без последствий – сервис «Спас-замков»

КАМАЗ-4280 начал тестовую эксплуатацию на маршруте в Подмосковье


В РФ раскрыли замысел Трампа после его попыток шантажировать Путина

Путин отметил успех школьников на Международной химической олимпиаде.

Посол Акира Муто: Япония будет приветствовать возможную встречу Путина и Трампа

В США сделали смелое заявление в отношении Путина.




Травмированного на репетиции в цирке Москвы акробата выписали из больницы

Клинический психолог Юлия Тарибо: каким типам личностей сложно было вместе

Врач-офтальмолог Элина Санторо: как выбрать идеальные солнцезащитные очки

Врач-трихолог Мадина Осман: как часто можно делать пересадку волос


ВСУ атаковали дронами женщин под Сумами: Били за надпись "Мы русские"


Раскрыто расписание Олимпийских игр 2028 года в Лос-Анджелесе.

Росгвардейцы из Чеченской Республики стали победителями и призерами чемпионата Северо-Кавказского округа Росгвардии по комплексному единоборству

«Турбозавры» поучаствовали в Дне московского транспорта

"Пока Путин не заметит это безобразие": Пономарев резко высказался о легионерах в РПЛ


«Нам в Минске надо учиться». Лукашенко похвалил Беглова за зимнюю уборку Петербурга

Лукашенко предложил Петербургу ремонтировать всю белорусскую технику

Петербургская делегация провела переговоры с президентом Беларуси в Минске

Лукашенко встретился в Минске с делегацией Петербурга для обсуждения сотрудничества


Сергей Собянин: В Москве появятся три новых пешеходных моста к 2027 году

Сергей Собянин: роботы и электромашины на страже московских улиц


РЭО проведет акселератор для экоцентров на базе Плехановского университета

Губернатор Андрей Бочаров принимает участие в образовательной программе Сбера

Позднякова: температура в Москве останется выше климатической нормы

ГК «АСНА» внедрила систему продвинутой аналитики «Дельта BI»


Ливень, гроза, град и ветер: москвичей предупредили о непогоде до утра вторника

Эту одежду многие уже давно выкинули, а зря: топ-7 стильных в 2025 году вещей, которые и через 100 лет будут в моде

Многим рискует: юрист сказал, как сидит «золотой» экс-полковник Захарченко

Эквадор выдал россиянина, подозреваемого в мошенничестве.


Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

В городе Барнауле стартовал третий этап смотра-конкурса на звание "Лучшее звено газодымозащитной службы" среди Главных управлений МЧС России

Защищённый планшет Saotron RT-W11J на базе ОС Windows10

Фестиваль духовых оркестров пройдет в трех городах Поморья по случаю Дня ВМФ


Под Симферополем горят десятки гектаров леса

Десятки улиц Симферополя остались без света 14 июля

Феодосия получила 150 миллионов на ремонты дворов - где начнут работы

Симферополь частично остался без света утром 14 июля


Проверить стыковку и показать «разрядку»: полвека назад началась советско-американская миссия «Союз» — «Аполлон»

Андрей Воробьев рассказал об открытии новых школ в Подмосковье к 1 сентября

Молния убила трех человек на пляже в России

На Замоскворецкой линии метро Москвы восстановили движение














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *