Добавить новость
smi24.net
News in English
Март
2023

An AI Learned to Play Atari 6,000 Times Faster by Reading the Instructions

0

Despite impressive progress, today’s AI models are very inefficient learners, taking huge amounts of time and data to solve problems humans pick up almost instantaneously. A new approach could drastically speed things up by getting AI to read instruction manuals before attempting a challenge.

One of the most promising approaches to creating AI that can solve a diverse range of problems is reinforcement learning, which involves setting a goal and rewarding the AI for taking actions that work towards that goal. This is the approach behind most of the major breakthroughs in game-playing AI, such as DeepMind’s AlphaGo.

As powerful as the technique is, it essentially relies on trial and error to find an effective strategy. This means these algorithms can spend the equivalent of several years blundering through video and board games until they hit on a winning formula.

Thanks to the power of modern computers, this can be done in a fraction of the time it would take a human. But this poor “sample-efficiency” means researchers need access to large numbers of expensive specialized AI chips, which restricts who can work on these problems. It also seriously limits the application of reinforcement learning to real-world situations where doing millions of run-throughs simply isn’t feasible.

Now a team from Carnegie Mellon University has found a way to help reinforcement learning algorithms learn much faster by combining them with a language model that can read instruction manuals. Their approach, outlined in a pre-print published on arXiv, taught an AI to play a challenging Atari video game thousands of times faster than a state-of-the-art model developed by DeepMind.

“Our work is the first to demonstrate the possibility of a fully-automated reinforcement learning framework to benefit from an instruction manual for a widely studied game,” said Yue Wu, who led the research. “We have been conducting experiments on other more complicated games like Minecraft, and have seen promising results. We believe our approach should apply to more complex problems.”

Atari video games have been a popular benchmark for studying reinforcement learning thanks to the controlled environment and the fact that the games have a scoring system, which can act as a reward for the algorithms. To give their AI a head start, though, the researchers wanted to give it some extra pointers.

First, they trained a language model to extract and summarize key information from the game’s official instruction manual. This information was then used to pose questions about the game to a pre-trained language model similar in size and capability to GPT-3. For instance, in the game PacMan this might be, “Should you hit a ghost if you want to win the game?”, for which the answer is no.

These answers are then used to create additional rewards for the reinforcement algorithm, beyond the game’s built-in scoring system. In the PacMan example, hitting a ghost would now attract a penalty of -5 points. These extra rewards are then fed into a well-established reinforcement learning algorithm to help it learn the game faster.

The researchers tested their approach on Skiing 6000, which is one of the hardest Atari games for AI to master. The 2D game requires players to slalom down a hill, navigating in between poles and avoiding obstacles. That might sound easy enough, but the leading AI had to run through 80 billion frames of the game to achieve comparable performance to a human.

In contrast, the new approach required just 13 million frames to get the hang of the game, although it was only able to achieve a score about half as good as the leading technique. That means it’s not as good as even the average human, but it did considerably better than several other leading reinforcement learning approaches that couldn’t get the hang of the game at all. That includes the well-established algorithm the new AI relies on.

The researchers say they have already begun testing their approach on more complex 3D games like Minecraft, with promising early results. But reinforcement learning has long struggled to make the leap from video games, where the computer has access to a complete model of the world, to the messy uncertainty of physical reality.

Wu says he is hopeful that rapidly improving capabilities in object detection and localization could soon put applications like autonomous driving or household automation within reach. Either way, the results suggest that rapid improvements in AI language models could act as a catalyst for progress elsewhere in the field.

Image Credit: StockSnap from Pixabay








Велоспорт для всех: начни вместе с ENERGY

PUNKT E принял участие в круглом столе «Перспективы развития электротранспорта в России»

Сервис OneClickMoney перешёл на 100% аудит звонков с помощью речевой аналитики

Карточка Артиста. Карточка артиста яндекс. Карточка артиста яндекс музыка.


£39m United star shouldn't be starting vs Arsenal, was gifting possession to Everton

Jovic set for new opportunity after leaving Milan as free agent

The 5 biggest global business rivalries to watch, and how their outcomes will shape the future

Not even a 0% mortgage rate would make buying a house affordable in these 6 U.S. cities


Куряне стали лауреатами Всероссийского конкурса «Большая перемена»

juvenile. Bluebird - cлеток, Восточная сиалия

Термотрансферный принтер этикеток корпоративного класса TSC TTP-342 Pro SUT

Россияне готовы покупать акции своего работодателя. Какие риски это несет


DeepMind CEO makes big brain claims, saying AGI could be here within 'five to 10 years' and cause humanity to experience widespread change that's '10 times bigger than the Industrial Revolution, and maybe 10 times faster'

Находи идеальные места для персонажей-фигурок в «Is This Seat Taken?»

Android-игроки раскритиковали сурвайвл-хоррор Jericho: Survival

Обзор на мобильную версию A Game About Digging A Hole



«Забег 2030» в «Лужниках» при поддержке ENERGY

«Юмор FM» приглашает поклонников Шерлока Холмса в театр

«Деловые Линии» запустили более 400 новых направлений экспресс-доставки

Врывайся в Trail! Начни вместе с ENERGY


В России появилась универсальная методология нагрузочного тестирования ERP-систем

Gayazov$ Brother$ в Зеленом театре ВДНХ! Like FM дарит билеты

Велоспорт для всех: начни вместе с ENERGY

Трамп: вопрос о новых антироссийских санкциях будет зависеть от действий РФ


Посадили преступников воровавших у Чубайса

«Пари НН» остался без очков в 3‑ем туре чемпионата России

Вернувшийся из-за возможной неполадки рейс Москва – Пенза сел в Шереметьево

Луна изменит цвет из-за затмения 7 сентября


Анастасия Потапова выходит во второй круг турнира WTA в Цинциннати

Теннисист Хачанов рассказал, что полгода не заходил в соцсети из-за хейта

Актер Иван Янковский выложил фото с казахстанским теннисистом Бубликом

Российский теннисист Рублев проиграл американцу Фритцу в четвертьфинале турнира ATP


Шаляпин-Фестиваль в Подмосковье: музыка и память 80-летия Победы

Трамп выступил перед журналистами в Белом доме

«Пари НН» остался без очков в 3‑ем туре чемпионата России

Президент ОАЭ на русском языке прокомментировал в соцсети встречу с Путиным


Музыкальные новости

Звёзды NILETTO и Ольга Кормухина выступят в Прокопьевске на День шахтёра

Суд Москвы взыскал с рэпера Тимати долг по взносам на капитальный ремонт

В Москве прошла премия «Триумф Года»

Суд оставил в силе решение о банкротстве бывшей жены Баскова Шпигель


«Юмор FM» приглашает поклонников Шерлока Холмса в театр

«Забег 2030» в «Лужниках» при поддержке ENERGY

«Деловые Линии» запустили более 400 новых направлений экспресс-доставки

Врывайся в Trail! Начни вместе с ENERGY


Сотрудник Росгвардии стал победителем турнира по историческому европейскому фехтованию во Владивостоке

Пэн Пай: как встреча с Путиным в 2000 году изменила мою судьбу

Петросян с женой собрали вещи и сбежали из России — давно хотели

Москва и Санкт-Петербург: лидеры комфортной жизни для молодёжи России


Московских водителей предупредили о перекрытии дорог в центре столицы

Где в России водители используют европротокол чаще всего

ДТП с участием трех автомобилей произошло на Ленинградском шоссе

PUNKT E принял участие в круглом столе «Перспективы развития электротранспорта в России»


Путин встретился в Кремле с президентом ОАЭ

Президент ОАЭ и Путин обсудили перспективы стратегического партнёрства

Президент ОАЭ на русском языке рассказал о переговорах с Путиным

ВСМ Москва-Санкт-Петербург: Путин поручил ускорить реализацию проекта


В Китае вновь введены ограничения по коронавирусу из-за угрозы опасного вируса



Московские росгвардейцы пришли на помощь медикам, задержав агрессивную пациентку

На Камчатку - в круиз, в Крым - на лечебное голодание: Как звезды проводят отпуск летом-2025 года

Природа и эко-тропы вместо психологов: все больше москвичей выбирают эко-форматы терапии

«День физкультурника» в Москве пройдет на 13 площадках


«Импотент»: в Киеве сделали жесткое заявление о Зеленском

Зеленский назвал сроки достижения мира

В Киеве сделали неожиданное заявление о предложениях по перемирию


Велоспорт для всех: начни вместе с ENERGY

Фрадков объявил о планах ВФЛА по развитию до 2038 года

«День физкультурника» в Москве пройдет на 13 площадках

Врывайся в Trail! Начни вместе с ENERGY


Лукашенко поручил усилить кибербезопасность с учетом мнения специалистов

Вблизи Минска появятся новые жилые районы: вот для кого там построят жилье

Лукашенко высказал озабоченность по поводу напряженности со стороны Польши и стран Балтии

В Минске обсуждено совершенствование деятельности КГБ


Собянин: В Москве продолжают строительство улично-дорожной сети от МСД до Юрловского проезда

Сергей Собянин: Неделя кино объединит представителей индустрии и зрителей

Собянин: Продолжается строительство дорожной сети от МСД до Юрловского проезда

Сергей Собянин рассказал о строительстве дорог от МСД до Юрловского проезда


«Метриум»: Обзор новых подмосковных проектов II квартала 2025 для инвестиций

PUNKT E принял участие в круглом столе «Перспективы развития электротранспорта в России»

Электробусы вышли на маршрут 878

Климатолог РАН Карнаухов: Москва может столкнуться с 45-градусной жарой


Президент ОАЭ на русском языке прокомментировал в соцсети встречу с Путиным

Посадили преступников воровавших у Чубайса

Нижний Новгород в кино: 6 фильмов и сериалов, снятых в «столице закатов»

Ярославский «Локомотив» узнал расписание турнира в Омске


Коми, Камчатку, Архангельскую, Иркутскую, Калужскую, Костромскую, Курскую, Свердловскую и Оренбургскую области эксперты отнесли к регионам, где на осенних выборах "протестный потенциал выше среднего", говорится в докладе...

Амурская область оказалась в числе аутсайдеров по качеству дорог

Защищённый планшет промышленного класса Saotron RT-W11

В суд направлено уголовное дело в отношении предпринимателя, обвиняемого в даче взятки руководителю государственного предприятия за помощь в заключении договоров


Аренда квартир в июле 2025 года: за сколько можно снять жильё в Симферополе и Севастополе?

Семь поездов задерживаются на Кубани из-за падения обломков БПЛА между станциями Величковка и Ангелинская, там пропало напряжение контактной сети

В Калининском районе Краснодарского края фрагменты дронов повредили контактную сеть на железной дороге между станциями Величковка и Ангелинская, сообщил оперштаб региона

Поезда в Крым меняют маршруты и график


Пассажирам вернувшийся в Шереметьево рейса Москва – Пенза выделили резервный борт

Обнародованы детали будущей встречи Путина и Трампа

Глава Колумбии обратился к парламенту с предложением рассмотреть закон о запрете наемничества

Природа и эко-тропы вместо психологов: все больше москвичей выбирают эко-форматы терапии














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *