Добавить новость
smi24.net
News in English
Октябрь
2023

AI models can analyze thousands of words at a time. A Google researcher has found a way to increase that by millions.

0
Google shows off its Bard AI chatbot on stage at Google I/O 2023
  • A recent research paper revealed a new way to help AI models ingest way more data. 
  • "Ring Attention" removes a major memory bottleneck for AI models. 
  • Soon, you'll be able to put millions of words into context windows of AI models, researchers say.

Right now, ChatGPT can ingest a few thousand words at most. Bigger AI models can handle more, but only up to about 75,000.

What if you could pump millions of words or whole codebases or big videos into these models?

A Google researcher, along with Databricks CTO Matei Zaharia and UC Berkeley professor Pieter Abbeel, have worked out a way to do just that.

The advance, revealed in a recent preprint research paper, promises to radically change how we interact with these powerful new tech tools.

The current approach can't handle huge inputs due to memory limitations of the GPUs that train and run AI models.

In the industry, this stuff is measured and discussed based on "tokens" and "context windows." A token is a unit that might represent a word, or a bit of a word, a number or something similar. The context window is the space where you plop a question or text or other inputs into a chatbot or AI model so it can analyze the content and spit back something smart.

AI startup Anthropic, and its chatbot Claude, has a context window of up to 100,000 tokens, which works out roughly to 75,000 words. That's basically one book that the system can take in at once and do clever things with.

OpenAI's GPT-3.5 model has a context length of 16,000 tokens. GPT-4's is 32,000. A model created by MosiacML, owned by Databricks, can handle 65,000 tokens, according to the recent research paper.

Pay attention to Ring Attention

Hao Liu, a UC Berkeley PhD student and part-time researcher at Google DeepMind, is co-author of the paper, titled "Ring Attention with Blockwise Transformers for Near-Infinite Context."

I interviewed him via video chat soon after the paper came out. He looks really young, and he's whip-smart and capable of explaining some of the complex technology behind his idea.

It's a riff on the original Transformer architecture that revolutionized AI in 2017 and forms the basis of ChatGPT and all the new models that have come out in recent years, such at GPT-4, Llama 2 and Google's upcoming Gemini.

The basic idea is that modern AI models crunch data in a way that requires GPUs to store various internal outputs and then recompute them before passing this along to the next GPU.

This requires a lot of memory and there just isn't enough. This ends up limiting how much input an AI model can process. No matter how fast the GPU is, there's a memory bottleneck.

"The goal of this research was to remove this bottleneck," Liu told me.

The new approach he created with Zaharia and Abbeel forms a kind of ring of GPUs that pass bits of the process along to the next GPU while simultaneously receiving similar blocks from their other GPU neighbor. And so on.

"This effectively eliminates the memory constraints imposed by individual devices," the researchers wrote, referring to GPUs.

I boiled that explanation down to an incredibly basic level. But the end result is what's really important.

Massive context windows

This Ring Attention method means that we should be able to put millions of words into the context windows of AI models, not just tens of thousands.

Liu goes further, saying that, in theory, many books and even videos can be dropped in one go into context windows in the future, and AI models will analyze them and produce coherent responses.

"An AI model could read an entire codebase, or output an entire codebase," Liu said. "The more GPUs you have, the longer the context window can be now. I'm GPU poor, I can't do that. The big tech companies, the GPU rich companies, it will be exciting to see what they build."

This chart shows some of the results of tests from the "Ring Attention" AI research paper.

The researchers tested this in real-world experiments. I asked Liu if he was worried the approach might not work. His response was very Googley.

"I didn't worry," he said. "You can compute this mathematically."

With the current way of doing things, if you have a 16,000 token context window, with a 13 billion parameter AI model that relies on 256 Nvidia A100 GPUs, the context length is limited to 16,000, he explained. 

With the Ring Attention approach, that same setup would be able to handle a 4 million token context window, he said. 

That's the math. In reality, when you train AI models, you need some GPUs to do other tasks, so 4 million wouldn't be the actual size of the context window. But it would be millions, according to Liu. 

Nvidia GPU demand

These findings beg an important question: If you can do more with fewer GPUs, will that mean weaker demand for Nvidia's AI chips?

No, according to Liu. Instead, developers and tech companies will just try bigger and bolder things with this new technique, he said. 

"Ring Attention won't discourage the sale of GPUs," he added. "If you need GPUs, you need GPUs."

Read the original article on Business Insider







Онколог Агаев: тяга пациента к жизни позволила провести гемикорпорэктомию

В Корпоративном университете «ЛокоТех» за первое полугодие 2025 года обучено более 2500 человек и создано 8 новых программ

Что важно знать о поступлении в садик на Пресне: советы родителям

Marins Park Hotel Новосибирск – место, где сбываются мечты!


The surprising reason fewer people are dying from extreme weather

Nvidia’s Jensen Huang hauled before China’s cyber cops to explain ‘backdoor safety risks’ in H20 chips

Is eBay actually sexy again as the ecommerce old-timer’s stock surges to an all-time high?

All the news from Nintendo’s July 2025 Direct showcase


Куряне стали лауреатами Всероссийского конкурса «Большая перемена»

После схода селя в Кабардино-Балкарии эвакуировали более 300 человек

Жительница Орловской области набросилась на гражданского мужа с арматурой

Курянина на год лишили прав за наезд на деревья


«Деньги не пахнут»: Как Blox World наживается на доверии игроков Roblox

Color Maze Adventure 2.0.0

Разработчики The Seven Deadly Sins: Origin ответили на частые вопросы игроков

OpenAI just raised another $8.3 billon in a funding round that values it at an unbelievable $300B, surpassing AMD, Coca-Cola, and General Electric



Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs

Сахар на вес золота: как изобретение инсулина изменило медицину

Кабинет Артиста.

Алгоритмы Яндекс Музыки. Алгоритмы продвижения в Яндекс Музыка.


Норвегия перед выборами: Коллективная вонь русофобии и региональный упадок

В Корпоративном университете «ЛокоТех» за первое полугодие 2025 года обучено более 2500 человек и создано 8 новых программ

Гаражную амнистию могут продлить в России

Сооружения сервисного участка «Свердловск-Пассажирский» стали арт-объектом


Приговор вычислили по радиоприборам // Назначены сроки за аферу с оборудованием для береговой охраны погранслужбы

Туристка из Йошкар-Олы погибла в Дербенте от ветки старого платана у Джума-мечети

Футболисты «Машука-КМВ» в Пятигорске сыграли вничью с гостями из Москвы

Киберразведка по-русски: как развивается отечественный Threat Intelligence


Мирра Андреева получила травму в матче турнира WTA в Монреале

Хачанов обыграл Рууда и вышел в 1/4 финала турнира в Торонто

Пегула уступила 386-й ракетке мира в третьем раунде турнира в Монреале

У пауэрлифтера из Австралии Османа полилась кровь из глаз


В России любят Volkswagen Passat, Toyota Corolla и Toyota Carina: это самые популярные автомобили старше 30 лет у россиян

Тульский "Арсенал" одержал первую победу в новом сезоне Первой лиги

Экстремальные погодные явления в Центральной России участились на 18%

Туристка из Йошкар-Олы погибла в Дербенте от ветки старого платана у Джума-мечети


Музыкальные новости

Шоу-бизнес: Джигурда был с ней 11 лет, Митяев ушел к ней из семьи: Как живет Марина Есипенко в свои 60

Хакерская атака на «Аэрофлот», землетрясение на Камчатке и новые торговые пошлины Трампа // Чем запомнилась неделя 28 июля — 1 августа: цитаты, цифры и факты

«Вообще ругаю регулярно!»: мать Тимати рассказала о съемках внучки Алисы в кино

Дженнифер Лопес удивила отдыхающих на пляже Астаны во время мирового тура


Сахар на вес золота: как изобретение инсулина изменило медицину

Алгоритмы Яндекс Музыки. Алгоритмы продвижения в Яндекс Музыка.

Москва лидирует по числу миллионеров: 28 тысяч получают свыше 1 млн рублей

Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs


Рубио: не уверен, что заявления Медведева о Трампе отражают позицию России

Алиев получил убойное послание: Разгулу диаспор конец – силовики достали "секретные папочки"

Роскосмос показал видео с циклоном, который принес грозу в Москву

У ЦСКА будет свой Лусиано. «Армейцы» в Аргентине нашли замену Келлвену


Собянин: Открыт пешеходный переход через МЦД-2 между Щербинкой и Остафьевом

Шесть человек пострадали в крупной аварии на Волгоградском проспекте в Москве

ДТП на юго-востоке Москвы: пострадали четыре человека, включая пешеходов

Автопробег в Финляндии поддержал инициативу открытия границы с Россией


Путин отметил, что железнодорожники успешно обеспечивают снабжение вооруженных сил

Путин заявил о высокой популярности скоростных железных дорог среди россиян

Путин анонсировал скоростную трассу Москва-Петербург к 2028 году

Путин обсудил перспективы развития железнодорожной сети в России


Исследование показывает зависимость между темпами развития COVID-19 и уровнем смертности

Руководитель РФПИ охарактеризовал переписку фон дер Ляйен с Pfizer как позорный инцидент



Букин поделился причинами, почему он не придерживается диеты

Напавший с ножом на людей в Москве был на учёте в психоневрологическом диспансере

Ученые выяснили, какие болезни погубили войска Наполеона в 1812 году

«Такие жирные». У мужчины обнаружили страшное заболевание из-за ресторанов


В Киеве показательно вскрыли «гнездо» коррупции: Зеленский устроил целый политический театр


Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs

Галактионов подвел итог игры с "Нижним Новгородом"

Спорткар на воде: сборная Тульская области по гребле выступила на мини-Олимпиаде

Теннисистка Ярослава Барташевич: Спорт полностью меняет характер



Собянин: 9 и 10 августа Москва отметит День физкультурника

Собянин: Открыт пешеходный переход через МЦД-2 между Щербинкой и Остафьевом

Сергей Собянин открыл просторный переход между станциями Щербинка и Остафьево

Собянин: Количество цветников в Москве с 2010 года увеличено почти в 2,5 раза


Ликсутов сообщил об открытии велопроката на территории ОЭЗ «Технополис Москва»

"Роскосмос" продемонстрировал изображение циклон, спровоцировавшего грозу в Москве

Конец истории: тополиный пух может навсегда исчезнуть из Москвы

В Грозном планируют возвести предприятие по переработке отходов


Тульский "Арсенал" одержал первую победу в новом сезоне Первой лиги

Туристка из Йошкар-Олы погибла в Дербенте от ветки старого платана у Джума-мечети

Кедми – о провале Трампа: Надавить на БРИКС не вышло. "Страшные" тарифы оказались выстрелом в молоко

Киберразведка по-русски: как развивается отечественный Threat Intelligence


Институт развития Интернета поддержал мультимедийный просветительский проект холдинга «ЕвроМедиа» о героях и событиях, которые сформировали образ Русского Севера и продолжают вдохновлять поколения

Архангельская область. СМИ зовут прокуроров в дорогу

Бизнесмен из Подмосковья пытался испортить деньгами честного нарьянмарца

В администрации муниципального образования «Городской округ «Город Нарьян-Мар» выявлены нарушения законодательства о противодействии коррупции


Цены на новостройки в июле 2025 года: Севастополь лидирует, Симферополь чуть отстаёт

Задержка поездов в Крым и из Крыма – актуальные данные

В пути следования задерживаются поезда «Таврия», сообщили в пресс-службе компании-перевозчика "Гранд Сервис Экспресс"

Задержка поездов в Крым и из Крыма: свежие данные


Экстремальные погодные явления в Центральной России участились на 18%

Тульский "Арсенал" одержал первую победу в новом сезоне Первой лиги

Норвегия перед выборами: Коллективная вонь русофобии и региональный упадок

Синоптик Шувалов: экстремальная погода в Центральной России участилась














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *