Добавить новость
smi24.net
News in English
Август
2023

4 Charts That Show Why AI Progress Is Unlikely to Slow Down

0

In the last ten years, AI systems have developed at rapid speed. From the breakthrough of besting a legendary player at the complex game Go in 2016, AI is now able to recognize images and speech better than humans, and pass tests including business school exams and Amazon coding interview questions.

Last week, during a U.S. Senate Judiciary Committee hearing about regulating AI, Senator Richard Blumenthal of Connecticut described the reaction of his constituents to recent advances in AI. “The word that has been used repeatedly is scary.” 

[time-brightcove not-tgx=”true”]

The Subcommittee on Privacy, Technology, and the Law overseeing the meeting heard testimonies from three expert witnesses, who stressed the pace of progress in AI. One of those witnesses, Dario Amodei, CEO of prominent AI company Anthropic, said that “the single most important thing to understand about AI is how fast it is moving.”

It’s often thought that scientific and technological progress is fundamentally unpredictable, and is driven by flashes of insight that are clearer in hindsight. But progress in the capabilities of AI systems is predictably driven by progress in three inputs—compute, data, and algorithms. Much of the progress of the last 70 years has been a result of researchers training their AI systems using greater computational processing power, often referred to as “compute”, feeding the systems more data, or coming up with algorithmic hacks that effectively decrease the amount of compute or data needed to get the same results. Understanding how these three factors have driven AI progress in the past is key to understanding why most people working in AI don’t expect progress to slow down any time soon.

Read more: The AI Arms Race Is Changing Everything

Compute

The first artificial neural network, Perceptron Mark I, was developed in 1957 and could learn to tell whether a card was marked on the left side or the right. It had 1,000 artificial neurons, and training it required around 700,000 operations. More than 70 years later, OpenAI released the large language model GPT-4. Training GPT-4 required an estimated 21 septillion operations.

Increasing computation allows AI systems to ingest greater amounts of data, meaning the system has more examples to learn from. More computation also allows the system to model the relationship between the variables in the data in greater detail, meaning it can draw more accurate and nuanced conclusions from the examples it is shown.

Since 1965, Moore’s law—the observation that the number of transistors in an integrated circuit doubles about every two years—has meant the price of compute has been steadily decreasing. While this did mean that the amount of compute used to train AI systems increased, researchers were more focused on developing new techniques for building AI systems rather than focusing on how much compute was used to train those systems, according to Jaime Sevilla, director of Epoch, a research organization.

This changed around 2010, says Sevilla. “People realized that if you were to train bigger models, you will actually not get diminishing returns,” which was the commonly held view at the time.

Since then, developers have been spending increasingly large amounts of money to train larger scale models. Training AI systems requires expensive specialized chips. AI developers either build their own computing infrastructure, or pay cloud computing providers for access to theirs. Sam Altman, CEO of OpenAI, has said that GPT-4 cost over $100 million to train. This increased spending, combined with the continued decreases in the cost of the increases in compute resulting from Moore’s Law, has led to AI models being trained on huge amounts of compute.
OpenAI and Anthropic, two of the leading AI companies, have each raised billions from investors to pay for the compute they use to train AI systems, and each has partnerships with tech giants that have deep pockets—OpenAI with Microsoft and Anthropic with Google.

Data

AI systems work by building models of the relationships between variables in their training data—whether it’s how likely the word “home” is to appear next to the word “run,” or patterns in how gene sequence relates to protein folding, the process by which a protein takes its 3D form, which then defines its function.

In general, a larger number of data points means that AI systems have more information with which to build an accurate model of the relationship between the variables in the data, which improves performance. For example, a language model that is fed more text will have a greater number of examples of sentences in which the “run” follows “home”—in sentences that describe baseball games or emphatic success, this sequence of words is more likely.
The original research paper about Perceptron Mark I says that it was trained on just six data points. By comparison, LlaMa, a large language model developed by researchers at Meta and released in 2023, was trained on around one billion data points—a more than 160-million fold increase from Perceptron Mark 1. In the case of LlaMa, the data points was text collected from a range of sources, including 67% from Common Crawl data (Common Crawl is a non-profit that scrapes the internet and makes the data collected freely available), 4.5% from GitHub (an internet service used by software developers), and 4.5% from Wikipedia.

Algorithms

Algorithms—sets of rules or instructions that define a sequence of operations to be carried out— determine how exactly AI systems use computational horsepower to model the relationships between variables in the data they are given. In addition to simply training AI systems on greater amounts of data using increasing amounts of compute, AI developers have been finding ways to get more from less. Research from Epoch found that “every nine months, the introduction of better algorithms contributes the equivalent of a doubling of computation budgets.”

The next phase of AI progress

According to Sevilla, the amount of compute that AI developers use to train their systems is likely to continue increasing at its current accelerated rate for a while, with companies increasing the amount of money they spend on each AI system they train, and with increased efficiency as the price of compute continues to decrease steadily. Sevilla predicts that this will continue until at some point it is no longer worth it to keep spending more money, when increasing the amount of compute only slightly improves performance. After that, the amount of compute used will continue to increase, but at a slower rate solely due to the cost of compute decreasing as a result of Moore’s law.

The data that feeds into modern AI systems, such as LlaMa, is scraped from the internet. Historically, the factor limiting how much data is fed into AI systems has been having enough compute to process that data. But, the recent explosion in the amount of data used to train AI systems has outpaced the production of new text data on the internet has led researchers at Epoch to predict that AI developers will run out of high-quality language data by 2026. 

Those developing AI systems tend to be less concerned about this issue. Appearing on the Lunar Society podcast in March, Ilya Sutskever, chief scientist at OpenAI, said that “the data situation is still quite good. There’s still lots to go.” Appearing on the Hard Fork podcast in July, Dario Amodei estimated that “there’s maybe a 10% chance that this scaling gets interrupted by inability to gather enough data.”

Sevilla is also confident that a dearth of data won’t prevent further AI improvements—for example by finding ways to use low-quality language data—because unlike compute, lack of data hasn’t been a bottleneck to AI progress before. He expects there to be lots of low hanging fruit in terms of innovation that AI developers will likely discover to address this problem.

Algorithmic progress, Sevilla says, is likely to continue to act as an augmenter of how much compute and data is used to train AI systems. So far, most improvements have come from using compute more efficiently. Epoch found that more than three quarters of algorithmic progress in the past has been used to make up for shortfalls in compute. If in future, as data becomes a bottleneck for progress on AI training, more of the algorithmic progress may be focused on making up for shortfalls in data.

Putting the three pieces together, experts including Sevilla expect AI progress to continue at breakneck speed for at least the next few years. Compute will continue to increase as companies spend more money and the underlying technology becomes cheaper. The remaining useful data on the internet will be used to train AI models, and researchers will continue to find ways to train and run AI systems which make more efficient use of compute and data. The continuation of these decadal trends is why experts think AI will continue to become more capable.

This has many experts worried. Speaking at the Senate Committee hearing, Amodei said that, if progress continues at the same rate, a wide range of people could be able to access scientific know-how that even experts today do not have within the next two to three years by using AI systems. This could increase the number of people who can “wreak havoc,” he said. “In particular, I am concerned that AI systems could be misused on a grand scale in the domains of cybersecurity, nuclear technology, chemistry, and especially biology.”








Онколог Агаев: тяга пациента к жизни позволила провести гемикорпорэктомию

«ЛокоТех» проводит комплексную оценку знаний специалистов службы качества

Неочевидные услуги в поезде

Кабинет Артиста в Яндекс. Кабинет Артиста в Яндекс Музыке.


Nvidia’s Jensen Huang hauled before China’s cyber cops to explain ‘backdoor safety risks’ in H20 chips

Is eBay actually sexy again as the ecommerce old-timer’s stock surges to an all-time high?

The surprising reason fewer people are dying from extreme weather

Figma IPO’s surprise winner is a charity with 13 million shares—and a famous backstory that sparked a bitter feud over an oil fortune decades ago


Куряне стали лауреатами Всероссийского конкурса «Большая перемена»

Жительница Орловской области набросилась на гражданского мужа с арматурой

Башня Врангеля. Калининград

Перевозки металлопродукции, инструментов и комплектующих стали чаще заказывать при выборе межтерминальной доставки – «Деловые Линии»


Разработчики The Seven Deadly Sins: Origin ответили на частые вопросы игроков

Color Maze Adventure 2.0.0

If you'd like to see Meta's AI gunk purged from WhatsApp, a new antitrust investigation in Italy might just do the trick

«Деньги не пахнут»: Как Blox World наживается на доверии игроков Roblox



Кабинет Артиста.

Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs

Сахар на вес золота: как изобретение инсулина изменило медицину

Алгоритмы Яндекс Музыки. Алгоритмы продвижения в Яндекс Музыка.


В Корпоративном университете «ЛокоТех» за первое полугодие 2025 года обучено более 2500 человек и создано 8 новых программ

Глава азербайджанской диаспоры на Урале сдаёт своих: После повторного задержания запел по-другому

Москва превратится в Таиланд. Климатолог Клименко сделал прогноз на 10 лет

Сахар на вес золота: как изобретение инсулина изменило медицину


Монолит подземной части корпуса для начальных классов возводят в Очаково-Матвеевском

Синоптик Шувалов: экстремальная погода в Центральной России участилась

За что пассажиры поездов не любят 3 и 6 купе - и в купейном, и в плацкартном вагоне

Группа Ay Yolа стала новым послом международного конкурса «Интервидение»


Российский теннисист Андрей Рублёв пробился в 1/8 финала турнира в Торонто, с которого ранее вылетел Даниил Медведев

Результата по-прежнему нет: Медведев оступился в Торонто и рискует в ближайшее время покинуть топ-20 рейтинга ATP

Калинская вышла в третий раунд турнира в Монреале

Медведев прошёл в третий круг турнира ATP в Торонто, обыграв Сврчину


За что пассажиры поездов не любят 3 и 6 купе - и в купейном, и в плацкартном вагоне

Гаражную амнистию могут продлить в России

В Дербенте из-за падения ветки возле мечети погибла туристка

Рособрнадзор опроверг сообщения о «аномальном» числе стобалльников на ЕГЭ


Музыкальные новости

Пытается спасти свой брак: стало известно о неожиданном решении Джастина Бибера

«Лифт или дружба?»: Зачем Басте концерт с Гуфом в «Лужниках»

Олеся Шергина из Екатеринбурга взошла на Эльбрус: история смелости, вдохновения и преодоления девушки с протезом

Семья Оззи Осборна похоронила его на территории поместья


Москва лидирует по числу миллионеров: 28 тысяч получают свыше 1 млн рублей

Москва превратится в Таиланд. Климатолог Клименко сделал прогноз на 10 лет

Алгоритмы Яндекс Музыки. Алгоритмы продвижения в Яндекс Музыка.

Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs


«Зенит» — ЦСКА, «Акрон» — «Спартак» и еще два матча продолжат третий тур РПЛ

Путин обсудил перспективы развития железнодорожной сети в России

NASA: корабль Crew Dragon с космонавтом "Роскосмоса" стартовал к МКС

Андрей Рюмин обсудил с руководством дочерних обществ повышение операционной эффективности


В результате ДТП на Волгоградском проспекте в Москве пострадали шесть человек

Шесть человек пострадали в крупной аварии на Волгоградском проспекте в Москве

Автопробег в Финляндии поддержал инициативу открытия границы с Россией

Собянин: Открыт пешеходный переход через МЦД-2 между Щербинкой и Остафьевом


Путин заявил о высокой популярности скоростных железных дорог среди россиян

Путин обсудил перспективы развития железнодорожной сети в России

Путин рассказал о развитии железнодорожной отрасли России

Путин анонсировал скоростную трассу Москва-Петербург к 2028 году


Руководитель РФПИ охарактеризовал переписку фон дер Ляйен с Pfizer как позорный инцидент

Исследование показывает зависимость между темпами развития COVID-19 и уровнем смертности



Букин поделился причинами, почему он не придерживается диеты

Ученые выяснили, какие болезни погубили войска Наполеона в 1812 году

Сахар на вес золота: как изобретение инсулина изменило медицину

Напавший с ножом на людей в Москве был на учёте в психоневрологическом диспансере


В Киеве показательно вскрыли «гнездо» коррупции: Зеленский устроил целый политический театр


Карпин о «Динамо»: «У нас нехватка кадров, так скажем. Говорить про “довольны”, “недовольны” — мне надо командой заниматься. А трансферная кампания — прерогатива клуба. Кто&nbs

Теннисистка Ярослава Барташевич: Спорт полностью меняет характер

Спелеолог Алексей Акимов: По годовым кольцам сталактитов можно узнать прошлое Земли

Галактионов подвел итог игры с "Нижним Новгородом"



Собянин: Количество цветников в Москве с 2010 года увеличено почти в 2,5 раза

Сергей Собянин. Главное за день

Собянин: Открыт пешеходный переход через МЦД-2 между Щербинкой и Остафьевом

Собянин: 9 и 10 августа Москва отметит День физкультурника


Ликсутов сообщил об открытии велопроката на территории ОЭЗ «Технополис Москва»

Конец истории: тополиный пух может навсегда исчезнуть из Москвы

В Грозном планируют возвести предприятие по переработке отходов

"Роскосмос" продемонстрировал изображение циклон, спровоцировавшего грозу в Москве


Синоптик Шувалов: экстремальная погода в Центральной России участилась

За что пассажиры поездов не любят 3 и 6 купе - и в купейном, и в плацкартном вагоне

Первый самолет из Петербурга прибыл в новый аэропорт Геленджика

Группа Ay Yolа стала новым послом международного конкурса «Интервидение»


В администрации муниципального образования «Городской округ «Город Нарьян-Мар» выявлены нарушения законодательства о противодействии коррупции

Аномальная жара: До +41 °С в Чечне и Ингушетии, +30 °С в Карелии и Архангельске

Институт развития Интернета поддержал мультимедийный просветительский проект холдинга «ЕвроМедиа» о героях и событиях, которые сформировали образ Русского Севера и продолжают вдохновлять поколения

Бизнесмен из Подмосковья пытался испортить деньгами честного нарьянмарца


Задержка поездов в Крым и из Крыма – актуальные данные

Цены на новостройки в июле 2025 года: Севастополь лидирует, Симферополь чуть отстаёт

Крыму и еще 27 регионам списали долги по бюджетным кредитам на 58 млрд

Задержка поездов в Крым и из Крыма: свежие данные


Противники закрытия границ с Россией устроили автопробег в Финляндии

Пассажиры первого рейса из Петербурга в новый аэропорт Геленджика поделились эмоциями

Цукерберг предлагает эксперту $1,5 млрд: отказ от уникального предложения

Российская команда занимает четвертую позицию по количеству медалей на чемпионате мира в Сингапуре














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *