Добавить новость
smi24.net
News in English
Март
2024

Top websites block Google from training AI models on their data. Nowhere near as much as OpenAI, though.

0
Sundar Pichai on stage at Google IO 2023
  • Google launched a new tool that lets publishers opt out of training Google's AI models.
  • More and more top-ranking websites are using it.
  • Google is not being blocked as much as OpenAI, though. There may be a good reason for this.

There's a grand bargain at the heart of the web: A small piece of code that has maintained order for decades.

Robots.txt lets website owners choose whether to let Google and other tech giants scrape their online content. Most sites have let Google do this because the company distributes so much valuable traffic.

Then, the AI wars began. It turns out that all this content has been stored in datasets that are the foundation for training powerful AI models, including those from OpenAI, Google, Meta, and others. These models often answer user questions directly, so less traffic may be distributed and the grand web bargain begins to unravel.

Part of Google's response has been to launch a new tool that lets websites block the company from using their content for training AI models. It's called Google-Extended. It came out in September, and it's getting some pickup.

Data shared by Originality.ai shows the Google-Extended snippet is being used by about 10% of the top 1,000 websites, as of late March.

Use of code snippets that block tech companies from using online content for AI model training.

The New York Times has enabled the Google-Extended blocker, according to a review of its robots.txt file. The publication, which is in a heated AI copyright battle with OpenAI, has also blocked that startup's access to its content.

It's on a warpath with other companies that either tap online data for AI model training, or compile this type of data for others to use in similar ways.

"Use of any device, tool, or process designed to data mine or scrape the content using automated means is prohibited without prior written permission," NYT states on its robots.txt page.

Prohibited uses include "the development of any software, machine learning, artificial intelligence (AI), and/or large language models (LLMs)," the publisher adds. A spokesperson for NYT declined to comment.

Google blocked less than OpenAI

For Google-Extended, other websites have switched this on too, including CNN, BBC, Yelp, and Business Insider, the publisher of this story.

However, Google-Extended has had much less pickup than OpenAI's GPTBot, which is hovering at around 32% of the top 1,000 websites. CCBot, offered by Common Crawl, also has been switched on more.

BI asked Originality.ai CEO Jonathan Gillham why Google-Extended is being used less than other AI training data-blockers.

He said that if Google rolls out a generative AI search engine to the wider public, there's a risk that sites that have blocked the company's access to training data won't get picked up in AI-generated results.

"If a query is 'What is the best deep dish pizza in Chicago?' and a Pizza shop excludes Google's AI from using its website data to train on, then it will not have any knowledge of that restaurant and be unable to include it in its response," Gillham explained.

Google is testing an early version of genAI search through its Search Generative Experience, or SGE. It's unclear if the company will launch this fully in the future, or how much different it will be from the traditional Google search engine.

Those decisions will go a long way to deciding the future of the web in this new AI world.

Axel Springer, Business Insider's parent company, has a global deal to allow OpenAI to train its models on its media brands' reporting.

Read the original article on Business Insider







«Абзац»: Валерий Меладзе отказался давать концерты в РФ

Профессиональные услуги в стоматологии: какие специалисты вам нужны?

Как IT-решения улучшают здоровье женщин: технологии для будущих мам

Что важно знать о поступлении в садик на Пресне: советы родителям


The surprising reason fewer people are dying from extreme weather

Bob Arum Says One Current World Champion Beats Prime Floyd Mayweather: “He’s A Very Unique Talent”

Is eBay actually sexy again as the ecommerce old-timer’s stock surges to an all-time high?

The Federal Reserve’s power: Congress giveth and Congress can taketh away


После схода селя в Кабардино-Балкарии эвакуировали более 300 человек

В РФ возобновили продажи новых кроссоверов Skoda Kodiaq

В наличии у дилеров появился новый кроссовер Москвич

Новая эра гибридных атак разблокирована


Разработчики The Seven Deadly Sins: Origin ответили на частые вопросы игроков

Girl Rescue 1.0.3.3

«Деньги не пахнут»: Как Blox World наживается на доверии игроков Roblox

If you'd like to see Meta's AI gunk purged from WhatsApp, a new antitrust investigation in Italy might just do the trick



Сахар на вес золота: как изобретение инсулина изменило медицину

Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs

Алгоритмы Яндекс Музыки. Алгоритмы продвижения в Яндекс Музыка.

Кабинет Артиста.


Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs

На МКАД капот авто вспыхнул и попал на видео

Продлен прием заявок на национальную премию «Лучший промышленный дизайн России»

В Корпоративном университете «ЛокоТех» за первое полугодие 2025 года обучено более 2500 человек и создано 8 новых программ


Кузбассовцы вошли в число финалистов шестого сезона «Большой перемены»

Сообщается, что Китай вводит ограничения на экспорт минералов для западных оборонных компаний

«Он вернул». Семья Громовых высказалась о подарке Ефремова за 9,5 млн

Терри — о промахе с пенальти: я не должен был бить, но Дрогба получил красную карточку


Андреева проиграла первый матч после Уимблдона. Мирра падала и плакала, ей вызывали врача

Пегула уступила 386-й ракетке мира в третьем раунде турнира в Монреале

Александрова уступила и не прошла в третий круг турнира в Монреале.

Рахимова уступила Свитолиной во втором круге турнира WTA в Монреале


Дата-центричность // Стоимость услуг ЦОДов в столичных регионах возросла на 13-17%

В «Зарядье» презентовали программу форума «Территория будущего. Москва 2030»

Гляди в оба. Терял ли глаз в бою фельдмаршал Кутузов?

В Москве стартовал чемпионат по тетрису


Музыкальные новости

Уехавший в США Никита Пресняков вернулся в семью — долгожданная встреча

Андрей Григорьев-Апполонов пережил измену: «Сердце было разрублено на куски»

Российская оперная певица Аида Гарифуллина выступит с итальянским тенором Андреа Бочелли в Узбекистане

«Шаляпин-фестиваль» пройдет в Подмосковье в начале августа


Москва лидирует по числу миллионеров: 28 тысяч получают свыше 1 млн рублей

Москва превратится в Таиланд. Климатолог Клименко сделал прогноз на 10 лет

Сахар на вес золота: как изобретение инсулина изменило медицину

Алгоритмы Яндекс Музыки. Алгоритмы продвижения в Яндекс Музыка.


Гроза в Москве: задержано 23 рейса в аэропорту "Шереметьево" после 22:00

Концертный Директор для Артистов из Регионов.

Роскосмос показал вызвавший грозу в Москве циклон

Кабинет Артиста в Яндекс. Кабинет Артиста в Яндекс Музыке.


В результате ДТП на Волгоградском проспекте в Москве пострадали шесть человек

Автопробег в Финляндии поддержал инициативу открытия границы с Россией

Собянин: Открыт пешеходный переход через МЦД-2 между Щербинкой и Остафьевом

ДТП на юго-востоке Москвы: пострадали четыре человека, включая пешеходов


Путин анонсировал скоростную трассу Москва-Петербург к 2028 году

Путин рассказал о развитии железнодорожной отрасли России

Путин обсудил перспективы развития железнодорожной сети в России

Путин заявил о высокой популярности скоростных железных дорог среди россиян


Руководитель РФПИ охарактеризовал переписку фон дер Ляйен с Pfizer как позорный инцидент

Исследование показывает зависимость между темпами развития COVID-19 и уровнем смертности



Букин поделился причинами, почему он не придерживается диеты

Ученые выяснили, какие болезни погубили войска Наполеона в 1812 году

Напавший с ножом на людей в Москве был на учёте в психоневрологическом диспансере

«Такие жирные». У мужчины обнаружили страшное заболевание из-за ресторанов


В Киеве показательно вскрыли «гнездо» коррупции: Зеленский устроил целый политический театр


Галактионов подвел итог игры с "Нижним Новгородом"

Спелеолог Алексей Акимов: По годовым кольцам сталактитов можно узнать прошлое Земли

Спорткар на воде: сборная Тульская области по гребле выступила на мини-Олимпиаде

Теннисистка Ярослава Барташевич: Спорт полностью меняет характер



Сергей Собянин открыл просторный переход между станциями Щербинка и Остафьево

Собянин: Открыт пешеходный переход через МЦД-2 между Щербинкой и Остафьевом

Собянин: Количество цветников в Москве с 2010 года увеличено почти в 2,5 раза

Сергей Собянин. Главное за день


Ликсутов сообщил об открытии велопроката на территории ОЭЗ «Технополис Москва»

В Грозном планируют возвести предприятие по переработке отходов

Московский зоопарк ищет неродственную "невесту" для манула Тимоши

Конец истории: тополиный пух может навсегда исчезнуть из Москвы


Гляди в оба. Терял ли глаз в бою фельдмаршал Кутузов?

Москва к 2030: 58 новых бизнес-центров и тысячи рабочих мест

Lada Iskra SW Cross стартовала лишь на бумаге: в салонах — всего 40 выставочных машин на всю Россию

В рамках форума "Москва 2030" пройдет чемпионат по тетрису


Аномальная жара: До +41 °С в Чечне и Ингушетии, +30 °С в Карелии и Архангельске

Институт развития Интернета поддержал мультимедийный просветительский проект холдинга «ЕвроМедиа» о героях и событиях, которые сформировали образ Русского Севера и продолжают вдохновлять поколения

Бизнесмен из Подмосковья пытался испортить деньгами честного нарьянмарца

В администрации муниципального образования «Городской округ «Город Нарьян-Мар» выявлены нарушения законодательства о противодействии коррупции


Крыму и еще 27 регионам списали долги по бюджетным кредитам на 58 млрд

Цены на новостройки в июле 2025 года: Севастополь лидирует, Симферополь чуть отстаёт

Задержка поездов в Крым и из Крыма – актуальные данные

В пути следования задерживаются поезда «Таврия», сообщили в пресс-службе компании-перевозчика "Гранд Сервис Экспресс"


Небесный феномен. Как измерили рекордную мегамолнию над США

Москвичей предупредили о возможных заторах на дорогах из-за сильного дождя

Театр кукол Белгорода получил президентский грант на постановку нового спектакля

Дрон задержал движение поездов в Волгоградской области














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *