Добавить новость
smi24.net
News in English
Июль
2023

A Faster Way To Teach A Robot

0

Imagine purchasing a robot to perform household tasks. This robot was built and trained in a factory on a certain set of tasks and has never seen the items in your home. When you ask it to pick up a mug from your kitchen table, it might not recognize your mug (perhaps because this mug is painted with an unusual image, say, of MIT’s mascot, Tim the Beaver). So, the robot fails.

“Right now, the way we train these robots, when they fail, we don’t really know why. So you would just throw up your hands and say, ‘OK, I guess we have to start over.’ A critical component that is missing from this system is enabling the robot to demonstrate why it is failing so the user can give it feedback,” says Andi Peng, an electrical engineering and computer science (EECS) graduate student at MIT.

Peng and her collaborators at MIT, New York University, and the University of California at Berkeley created a framework that enables humans to quickly teach a robot what they want it to do, with a minimal amount of effort.

When a robot fails, the system uses an algorithm to generate counterfactual explanations that describe what needed to change for the robot to succeed. For instance, maybe the robot would have been able to pick up the mug if the mug were a certain color. It shows these counterfactuals to the human and asks for feedback on why the robot failed. Then the system utilizes this feedback and the counterfactual explanations to generate new data it uses to fine-tune the robot. 

Fine-tuning involves tweaking a machine-learning model that has already been trained to perform one task, so it can perform a second, similar task. 

The researchers tested this technique in simulations and found that it could teach a robot more efficiently than other methods. The robots trained with this framework performed better, while the training process consumed less of a human’s time. 

This framework could help robots learn faster in new environments without requiring a user to have technical knowledge. In the long run, this could be a step toward enabling general-purpose robots to efficiently perform daily tasks for the elderly or individuals with disabilities in a variety of settings.

Peng, the lead author, is joined by co-authors Aviv Netanyahu, an EECS graduate student; Mark Ho, an assistant professor at the Stevens Institute of Technology; Tianmin Shu, an MIT postdoc; Andreea Bobu, a graduate student at UC Berkeley; and senior authors Julie Shah, an MIT professor of aeronautics and astronautics and the director of the Interactive Robotics Group in the Computer Science and Artificial Intelligence Laboratory (CSAIL), and Pulkit Agrawal, a professor in CSAIL. The research will be presented at the International Conference on Machine Learning.

On-the-job training

Robots often fail due to distribution shift — the robot is presented with objects and spaces it did not see during training, and it doesn’t understand what to do in this new environment. 

One way to retrain a robot for a specific task is imitation learning. The user could demonstrate the correct task to teach the robot what to do. If a user tries to teach a robot to pick up a mug, but demonstrates with a white mug, the robot could learn that all mugs are white. It may then fail to pick up a red, blue, or “Tim-the-Beaver-brown” mug.

Training a robot to recognize that a mug is a mug, regardless of its color, could take thousands of demonstrations.

“I don’t want to have to demonstrate with 30,000 mugs. I want to demonstrate with just one mug. But then I need to teach the robot so it recognizes that it can pick up a mug of any color,” Peng says.

To accomplish this, the researchers’ system determines what specific object the user cares about (a mug) and what elements aren’t important for the task (perhaps the color of the mug doesn’t matter). It uses this information to generate new, synthetic data by changing these “unimportant” visual concepts. This process is known as data augmentation. 

The framework has three steps. First, it shows the task that caused the robot to fail. Then it collects a demonstration from the user of the desired actions and generates counterfactuals by searching over all features in the space that show what needed to change for the robot to succeed. 

The system shows these counterfactuals to the user and asks for feedback to determine which visual concepts do not impact the desired action. Then it uses this human feedback to generate many new augmented demonstrations. 

In this way, the user could demonstrate picking up one mug, but the system would produce demonstrations showing the desired action with thousands of different mugs by altering the color. It uses these data to fine-tune the robot.

Creating counterfactual explanations and soliciting feedback from the user are critical for the technique to succeed, Peng says.

From human reasoning to robot reasoning

Because their work seeks to put the human in the training loop, the researchers tested their technique with human users. They first conducted a study in which they asked people if counterfactual explanations helped them identify elements that could be changed without affecting the task. 

“It was so clear right off the bat. Humans are so good at this type of counterfactual reasoning. And this counterfactual step is what allows human reasoning to be translated into robot reasoning in a way that makes sense,” she says.

Then they applied their framework to three simulations where robots were tasked with: navigating to a goal object, picking up a key and unlocking a door, and picking up a desired object then placing it on a tabletop. In each instance, their method enabled the robot to learn faster than with other techniques, while requiring fewer demonstrations from users.

Moving forward, the researchers hope to test this framework on real robots. They also want to focus on reducing the time it takes the system to create new data using generative machine-learning models.

“We want robots to do what humans do, and we want them to do it in a semantically meaningful way. Humans tend to operate in this abstract space, where they don’t think about every single property in an image. At the end of the day, this is really about enabling a robot to learn a good, human-like representation at an abstract level,” Peng says.








Аукцион за часть дачи Пугачевой опровергли

Жена Дмитрия Диброва Полина опубликовала первое фото с похудевшим на 20 кг мужем

На банкет – в Fish Point Family Resort

Один год в двадцатилетней истории Marins Москва Пражская


Kolo Muani: Juventus prepare new offer but face Man United and Chelsea threat

Chat log from R20 of 2025: Richmond vs Collingwood

The Great Indian Kapil Show: Raghav Chadha reveals telling Parineeti Chopra to manifest he will never become the PM; says ‘Yeh jo bolti hai wo ulta hota hai’

UFC Abu Dhabi live blog: Shara Bullet vs. Marc-Andre Barriault


ТСМ готовит территорию под реконструкцию ростовского участка трассы М-4

В Орловской области в реке утонула женщина

В Санкт-Петербурге обсудили внедрение ИИ в разработку и оптимальные корпоративные архитектуры

Сунул нос не в своё дело: серийного нюхателя жоп снова поймали в Калифорнии


Quarantine Zone creator reveals 3 reasons the zombie sim went viral on TikTok

Ninja Party можно предзаказать в мобильных маркетах с релизом в конце июля

Первый трейлер Battlefield 6

«Если бы у Наруто и AC Shadows был ребёнок»: Разбор англоязычной версии Where Winds Meet



Потерянная библиотека, подземный город и бункер Сталина: какие секреты хранит Кремль

Адвокат Гаврилова раскрыла, чего добивается семья Тиммы после его смерти

Возобновлены прямые рейсы из Москвы в Пхеньян

Остался только страх. Пашинян хочет ударить по Москве, но "удавка" сдерживает


В Санкт-Петербурге обсудили внедрение ИИ в разработку и оптимальные корпоративные архитектуры

Пловец из Москвы скончался во время заплыва по Волге в Нижнем Новгороде

Прокуратура: инцидент со сбоем систем "Аэрофлота" в Шереметьево на контроле

Курс на мечту: «Национальная Лотерея» и РОЛЬФ вручили новый автомобиль победителю розыгрыша в честь запуска «Автомобильной лотереи «РОЛЬФ»


Прошла испытания система дистанционной передачи данных для корректировки навигационных карт

И впрямь — зачем России Шпицберген?

Книга «365 уличных посланий. Нижний Новгород» выходит в свет

Температура морской воды на крымских пляжах: 28 июля


Боузкова одержала победу на теннисном турнире в Праге

Калинская пробилась в полуфинал турнира в Вашингтоне.

Рублев: Немного лучше стали результаты

Россиянин Сидоренко выиграл соревнования по настольному теннису на Универсиаде‑2025


Температура морской воды на крымских пляжах: 28 июля

Прошла испытания система дистанционной передачи данных для корректировки навигационных карт

Память Максима Горького увековечили в Сербии

День российско-словенской дружбы отметили у Русской часовни на перевале Вршич


Музыкальные новости

В мэрии назвали условия присвоения Элджею звания почётного жителя

Дорога любви: Жасмин представляет романтичный клип на песню «Ты и я»

Старшей дочери Джигана и Оксаны Самойловой Ариеле исполнилось 14 лет

«Молодежь любит так же, как мы»: Баста рассказал о смыслах своего мюзикла


Возобновлены прямые рейсы из Москвы в Пхеньян

Семь воздушных судов 28 июля прилетают во Владивосток вне расписания

Дорога любви: Жасмин представляет романтичный клип на песню «Ты и я»

Остался только страх. Пашинян хочет ударить по Москве, но "удавка" сдерживает


Цена ОСАГО оказалась выше средней по стране в 16 регионах России

Собянин в День работника МФЦ поздравил сотрудников центров госуслуг Москвы

Лето в самом разгаре: смоленский филиал «Россети Центр» проводит занятия по электробезопасности в детских лагерях

27 июля 2012 года открылись XXX летние Олимпийские игры в Лондоне


Курс на мечту: «Национальная Лотерея» и РОЛЬФ вручили новый автомобиль победителю розыгрыша в честь запуска «Автомобильной лотереи «РОЛЬФ»

Канал, о котором мечтали несколько веков...

НПС построит два велопешеходных моста через Москву-реку

В Кот-д'Ивуаре в результате аварии с участием автобуса и самосвала погибли 16 человек.


Путин в День ВМФ прибыл на территорию Главного Адмиралтейства в Санкт-Петербурге

Путин поздравил Жапарова с юбилеем подписания декларации о союзничестве.

«Внезапно»: Запад встревожен новым указом Путина

СМИ: Путин на этой неделе отправил США ominous сигнал.


Приговор экс-руководителю компании по производству вакцин против ковида был смягчен.



Экс-директору института вакцин Маковскому смягчили приговор по делу о взятке

Ночные перекусы в отпуске: доктор Садыков о том, как они влияют на микрофлору и вес

Кот-массажист получает 80 тысяч рублей: какую работу доверяют животным

Приговор экс-руководителю компании по производству вакцин против ковида был смягчен.


Зеленский настаивает: встреча с Путиным до конца августа с участием Европы

Киевский режим применил все 18 пакетов санкций ЕС

Запад ударил Зеленского по самому больному месту – кошельку: Киев показательно лишили 1,5 миллиардов помощи

Кто заставил Зеленского предложить России новый раунд переговоров: В Британии показали пальцем


Сотрудники Росгвардии обеспечили безопасность футбольных матчей в Москве

Команда столичного управления МЧС России готовится к участию во Всероссийских соревнованиях по пожарно-спасательному спорту

Росгвардия обеспечила безопасность празднования Дня ВМФ и футбольного матча в Москве

В САРАТОВЕ ПРОДОЛЖАЕТСЯ МАСШТАБНАЯ ВСЕРОССИЙСКАЯ ВЕДОМСТВЕННАЯ АКЦИЯ «КАНИКУЛЫ С РОСГВАРДИЕЙ»


«Беларусь-1»: Лукашенко дал интервью одному из американских СМИ

Лукашенко получил приглашения от стран Латинской Америки и Азии для визитов.

Лукашенко дал интервью одному из американских СМИ


Собянин в День работника МФЦ поздравил сотрудников центров госуслуг Москвы

Собянин: На территории промзоны «Кирпичные улицы» будет создана социнфраструктура

Сергей Собянин. Главное за день

Собянин поздравил работников центров госуслуг с профессиональным праздником


РИА: глава Минприроды Козлов летит первым авиарейсом Москва - Пхеньян

В Феодосии ликвидировали пожар на площади

Самолёт совершил первый прямой авиарейс из Москвы в Пхеньян

Почему технологии ПВВК безопасны и эффективны, химия и экология воды по мнению Алексея Горшкова


Минсельхоз сохранил прогноз урожая зерновых на 2025 год

Тяжело ходить по лестнице и мыть голову: врач рассказала о неочевидных симптомах саркопении

В Екатеринбурге на видео сняли драку 30 мужчин на парковке

Ядерный шантаж


В Архангельске представили киноальманах «Север, я люблю тебя!» по произведениям современных писателей

В Архангельске началось обучение бойцов СВО, сообщил Цыбульский.

В музее-заповеднике «Архангельское» пройдут «Jazzовые сезоны»

Путин дал указание рассмотреть проблемы онкологии в Архангельской области.


В Севастополе пройдет масштабная выставка картин Александра Дейнеки

Прогноз погоды в Крыму на 27 июля

Сколько пассажиров прибывают в Крым летом на поездах ежедневно

В Крыму из-за дыма от пожара столкнулись девять автомобилей


УК просят разрешить продавать долги граждан за ЖКУ

Тяжело ходить по лестнице и мыть голову: врач рассказала о неочевидных симптомах саркопении

В Екатеринбурге на видео сняли драку 30 мужчин на парковке

Прошла испытания система дистанционной передачи данных для корректировки навигационных карт














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *