A faster, better way to train general-purpose robots

30.10.2024 02:45

Spacedaily.com

Boston MA (SPX) Oct 29, 2024 - In the classic cartoon "The Jetsons," Rosie the robotic maid seamlessly switches from vacuuming the house to cooking dinner to taking out the trash. But in real life, training a general-purpose robot remains a major challenge.

Typically, engineers collect data that are specific to a certain robot and task, which they use to train the robot in a controlled environment. However, gathering these data is costly and time-consuming, and the robot will likely struggle to adapt to environments or tasks it hasn't seen before.

To train better general-purpose robots, MIT researchers developed a versatile technique that combines a huge amount of heterogeneous data from many of sources into one system that can teach any robot a wide range of tasks.

Their method involves aligning data from varied domains, like simulations and real robots, and multiple modalities, including vision sensors and robotic arm position encoders, into a shared "language" that a generative AI model can process.

By combining such an enormous amount of data, this approach can be used to train a robot to perform a variety of tasks without the need to start training it from scratch each time.

This method could be faster and less expensive than traditional techniques because it requires far fewer task-specific data. In addition, it outperformed training from scratch by more than 20 percent in simulation and real-world experiments.

"In robotics, people often claim that we don't have enough training data. But in my view, another big problem is that the data come from so many different domains, modalities, and robot hardware. Our work shows how you'd be able to train a robot with all of them put together," says Lirui Wang, an electrical engineering and computer science (EECS) graduate student and lead author of a paper on this technique.

Wang's co-authors include fellow EECS graduate student Jialiang Zhao; Xinlei Chen, a research scientist at Meta; and senior author Kaiming He, an associate professor in EECS and a member of the Computer Science and Artificial Intelligence Laboratory (CSAIL). The research will be presented at the Conference on Neural Information Processing Systems.

Inspired by LLMs
A robotic "policy" takes in sensor observations, like camera images or proprioceptive measurements that track the speed and position a robotic arm, and then tells a robot how and where to move.

Policies are typically trained using imitation learning, meaning a human demonstrates actions or teleoperates a robot to generate data, which are fed into an AI model that learns the policy. Because this method uses a small amount of task-specific data, robots often fail when their environment or task changes.

To develop a better approach, Wang and his collaborators drew inspiration from large language models like GPT-4.

These models are pretrained using an enormous amount of diverse language data and then fine-tuned by feeding them a small amount of task-specific data. Pretraining on so much data helps the models adapt to perform well on a variety of tasks.

"In the language domain, the data are all just sentences. In robotics, given all the heterogeneity in the data, if you want to pretrain in a similar manner, we need a different architecture," he says.

Robotic data take many forms, from camera images to language instructions to depth maps. At the same time, each robot is mechanically unique, with a different number and orientation of arms, grippers, and sensors. Plus, the environments where data are collected vary widely.

The MIT researchers developed a new architecture called Heterogeneous Pretrained Transformers (HPT) that unifies data from these varied modalities and domains.

They put a machine-learning model known as a transformer into the middle of their architecture, which processes vision and proprioception inputs. A transformer is the same type of model that forms the backbone of large language models.

The researchers align data from vision and proprioception into the same type of input, called a token, which the transformer can process. Each input is represented with the same fixed number of tokens.

Then the transformer maps all inputs into one shared space, growing into a huge, pretrained model as it processes and learns from more data. The larger the transformer becomes, the better it will perform.

A user only needs to feed HPT a small amount of data on their robot's design, setup, and the task they want it to perform. Then HPT transfers the knowledge the transformer grained during pretraining to learn the new task.

Enabling dexterous motions
One of the biggest challenges of developing HPT was building the massive dataset to pretrain the transformer, which included 52 datasets with more than 200,000 robot trajectories in four categories, including human demo videos and simulation.

The researchers also needed to develop an efficient way to turn raw proprioception signals from an array of sensors into data the transformer could handle.

"Proprioception is key to enable a lot of dexterous motions. Because the number of tokens is in our architecture always the same, we place the same importance on proprioception and vision," Wang explains.

When they tested HPT, it improved robot performance by more than 20 percent on simulation and real-world tasks, compared with training from scratch each time. Even when the task was very different from the pretraining data, HPT still improved performance.

"This paper provides a novel approach to training a single policy across multiple robot embodiments. This enables training across diverse datasets, enabling robot learning methods to significantly scale up the size of datasets that they can train on. It also allows the model to quickly adapt to new robot embodiments, which is important as new robot designs are continuously being produced," says David Held, associate professor at the Carnegie Mellon University Robotics Institute, who was not involved with this work.

In the future, the researchers want to study how data diversity could boost the performance of HPT. They also want to enhance HPT so it can process unlabeled data like GPT-4 and other large language models.

"Our dream is to have a universal robot brain that you could download and use for your robot without any training at all. While we are just in the early stages, we are going to keep pushing hard and hope scaling leads to a breakthrough in robotic policies, like it did with large language models," he says.

Research Report:Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained Transformers

Партнёры Smi24.net

Все новости за 24 часа

Life24.pro

Антитела альпак помогли ученым создать новые методы лечения рака

Концерт Тимберлейка в Стамбуле превратился в хаос: Мот рассказал о давке, сломанных заборах и драках

Грачья Погосян: достойный пример гуманизма и патриотизма (к 55-летию известного благотворителя)

Коллекция Elie Saab осень-зима 2025/26

Today24.pro

Exclusive: Fintech giant Stripe building ‘Tempo’ blockchain with crypto VC Paradigm

Palestinian envoy urges action at UN: “History will judge us all”

AI talent comes at a 30% salary premium: ‘If you try to play catch up later, this is going to cost you even more’

Report: Liverpool decision hands advantage to Man United in midfielder pursuit

News24.pro

Хорошо в деревне летом...

Хибины

Преподаватели Подмосковья первые в России подтвердили свои ИТ-компетенции у независимого эксперта «Группа Астра»

Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления

Game24.pro

Первый взгляд на мобильную версию Neon Spellstorm

New study shows that Gen Z is spending way less money on videogames than older gamers

Steam for Chromebooks is getting axed in 2026 instead of exiting its 4-year beta

Открыты сервера MMORPG ROM: Golden Age

Ua24.pro

Овочі можуть стати розкішшю для українців

Овочі можусть стати розкішшю для українців

Russia24.pro

Почему у канализационной системы должен быть выход на крышу?

Кубок Федерации: спортивный праздник в формате светского пикника под музыку Relax FM

Впервые в Луганске: детский благотворительный фестиваль «Добрая волна» подарит надежду и вдохновение

EVITA BEAUTY STORE - интернет-магазин косметики премиум-класса

News-life

Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления

Семейное приключение на «Кораблике Детского радио»

Впервые в Луганске: детский благотворительный фестиваль «Добрая волна» подарит надежду и вдохновение

ВЦ «Раздолье» проведет бесплатный вебинар «Динамическая структура заказа в 1С:ERP»

Ru24.net

Сотрудники отдела лицензионно-разрешительной работы по городу Королеву передали добровольно сданное охотничье оружие в зону проведения СВО

SUPER WEEKEND: денежные выходные с «Авторадио»

Тариф — ноль. «Выберу.ру» составил рейтинг бесплатных кредитных карт за июль 2025 года

EVITA BEAUTY STORE - интернет-магазин косметики премиум-класса

News.tennis

Теннисист Медведев проиграл австралийцу Уолтону и выбыл из турнира Цинциннати

Калинская обыграла Анисимову в третьем круге турнира WTA в Цинциннати

Андрей Рублёв обыграл Лёнера Тьена на старте «Мастерса» в Цинциннати

Вероника Кудерметова вышла в третий круг турнира WTA-1000 в США

29ru.net

Сотрудники отдела лицензионно-разрешительной работы по городу Королеву передали добровольно сданное охотничье оружие в зону проведения СВО

SUPER WEEKEND: денежные выходные с «Авторадио»

LEGENDA презентовала концепцию дворовой территории в проекте «Северный порт»

Сотрудники Коломенского отдела вневедомственной охраны Главного управления Росгвардии по Московской области задержали любителя кофе, который решил сэкономить на покупке ароматного напитка

Музыкальные новости

Poisk-music.ru

Архипелаг 2025: стартовали с максимальными баллами

С Басты взыскали долг по коммуналке

Раскрыты гонорары ушедшего на пенсию Леонтьева

РИА Новости: суд в Москве взыскал с Басты долг по коммунальным платежам

Ria.city

Впервые в Луганске: детский благотворительный фестиваль «Добрая волна» подарит надежду и вдохновение

Почему у канализационной системы должен быть выход на крышу?

Тариф — ноль. «Выберу.ру» составил рейтинг бесплатных кредитных карт за июль 2025 года

Кубок Федерации: спортивный праздник в формате светского пикника под музыку Relax FM

Rss.plus

Солнечному мальчику необходимо лекарство, чтобы спасти сердце от перегрузок

Специалисты «Россети Новосибирск» зафиксировали самовольные подвесы еще на 770 опорах ЛЭП

Кубок Федерации: спортивный праздник в формате светского пикника под музыку Relax FM

"Начинаем привыкать". Бизнес и власти о том, как россиянам жить в эпоху интернет-блэкаутов

Auto.russia24.pro

Отзывы о франшизе «Автополка»

Магазин автозапчастей франшиза – успешное и прибыльное предприятие

Быстрый старт в прибыльном бизнесе по продаже автозапчастей

Преимущества франшизы «Автополка»

Putin.russia24.pro

Источники сообщают о встрече Путина и Трампа на военной базе в Анкоридже

СМИ: американские чиновники рады решению Путина посетить Аляску

«Трампу надо соглашаться»: сейчас у Путина наименьшее количество требований за все время – итальянские СМИ

Ким Чен Ын подтвердил Путину неизменную поддержку КНДР в отношении России

Health.russia24.pro

Солнечному мальчику необходимо лекарство, чтобы спасти сердце от перегрузок

Подмосковный травматолог дал советы по выбору рюкзака для первоклассника

Хирурги в Москве спасли жизнь 43-летнему мужчине, ампутировав нижнюю часть тела

Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления

Zelensky.russia24.pro

Зеленский пригрозил «третьей мировой войной» в случае давления на Киев в вопросе уступок территорий

Sport.russia24.pro

Журова о возвращении граждан, сменивших гражданство: «Практически невозможно»

Благодаря совместным действиям сотрудников Росгвардии и их коллег футбольный матч «Акрон» – ЦСКА завершился без происшествий

Street Boxing

Кубок Федерации: спортивный праздник в формате светского пикника под музыку Relax FM

Lukashenko.russia24.pro

Лукашенко получил первую золотую монету из белорусского сырья

Person.russian.city

Сергей Собянин: Герои — не какие-то особенные люди, они живут рядом с нами

Собянин объявил об открытии новой детской поликлиники в районе Крюково

Сергей Собянин. Главное за день

Собянин: Создадим условия для развития технологичных предприятий

Ecology.russia24.pro

Погода сошла с ума? Главный синоптик России Вильфанд предупреждает: аномалий будет все больше - то в жар, то в холод

В Канаде зафиксировано ухудшение ситуации с лесными пожарами

Экологи требуют ограничения роста цен на авиабилеты по окончании школьных каникул

Площадь возгорания на горе Куцай достигла 650 тысяч квадратных метров

29ru.net

Впервые в Луганске: детский благотворительный фестиваль «Добрая волна» подарит надежду и вдохновение

ВЦ «Раздолье» проведет бесплатный вебинар «Динамическая структура заказа в 1С:ERP»

Сотрудники отдела лицензионно-разрешительной работы по городу Королеву передали добровольно сданное охотничье оружие в зону проведения СВО

НАТО И ЕВРОСОЮЗУ МОГУТ ОТКЛЮЧИТЬ ВСЕ ВИДЫ ОРУДИЙ! ВЫСШАЯ АКАДЕМИЯ УПРАВЛЕНИЯ МИРОМ: ПРОГРАММНЫЕ ИНТЕЛЛЕКТЫ ПОМОГАЮТ! Россия, США, Европа могут улучшить отношения и здоровье общества!

Severodvinsk.ws

Беспроводной сканер штрих-кодов SAOTRON P05i промышленного класса

Заместитель прокурора Архангельской области и Ненецкого автономного округа Павел Матанцев проверил ход ремонтных работ в школе № 1 г. Нарьян-Мара

Орловская область планирует войти в число национальных туристических маршрутов с проектом «Бирюзовое кольцо России»

На Новой Земле провели испытания межконтинентальной крылатой ракеты «Буревестник»

Sevpoisk.ru

Прогноз погоды в Крыму на 12 августа

Историко-краеведческая выставка «Древности земли крымской»

Прогноз погоды в Крыму на среду

Прогноз погоды в Крыму на 11 августа

103news.com

«Птицы любви»: песня, в которой слышно биение двух сердец — матери и дочери

ВЦ «Раздолье» проведет бесплатный вебинар «Динамическая структура заказа в 1С:ERP»

Впервые в Луганске: детский благотворительный фестиваль «Добрая волна» подарит надежду и вдохновение

НАТО И ЕВРОСОЮЗУ МОГУТ ОТКЛЮЧИТЬ ВСЕ ВИДЫ ОРУДИЙ! ВЫСШАЯ АКАДЕМИЯ УПРАВЛЕНИЯ МИРОМ: ПРОГРАММНЫЕ ИНТЕЛЛЕКТЫ ПОМОГАЮТ! Россия, США, Европа могут улучшить отношения и здоровье общества!

Агрегатор новостей 24СМИ