Прорыв MIT может изменить процесс обучения роботов

Робот играет на пианино

Исследователи из MIT разработали метод обучения роботов, который сокращает время и затраты, одновременно повышая способность приспосабливаться к новым задачам и условиям.

Подход, названный Heterogeneous Pretrained Transformers (HPT), объединяет огромное количество разнообразных данных из различных источников в единую систему, эффективно создавая общий язык, который могут обрабатывать генеративные модели ИИ. Данный метод представляет собой значительное отклонение от традиционных методов обучения роботов, где инженеры обычно собирают специфические данные для каждого робота и задачи в контролируемых условиях.

Ведущий исследователь Лируй Ван — студент магистратуры по электротехнике и информатике в MIT — считает, что, хотя многие называют недостаток обучающих данных основной проблемой в робототехнике, более важным вопросом является огромное разнообразие различных областей, модальностей и аппаратного обеспечения роботов. Их работа демонстрирует, как эффективно объединить и использовать все эти разнообразные элементы.

Команда разработала архитектуру, которая унифицирует различные типы данных, включая изображения с камер, текстовые инструкции и карты глубины. HPT использует трансформерную модель, аналогичную моделям, стоящим за передовыми языковыми моделями, для обработки визуальных и проприоцептивных данных.

В практических тестах система продемонстрировала замечательные результаты, превзойдя традиционные методы обучения более чем на 20 процентов как в симулированных, так и в реальных сценариях. Это улучшение сохранилось даже тогда, когда роботы сталкивались с задачами, существенно отличающимися от данных, на которых они были обучены.

Исследовательская группа собрала впечатляющий набор данных для предобучения, включающий 52 датасета с более чем 200 000 траекториями роботов в четырех категориях. Этот подход позволяет роботам учиться из обширного опыта, включая человеческие демонстрации и симуляции.

Одно из ключевых нововведений системы заключается в обработке проприоцепции (осознание роботом своего положения и движения). Команда разработала архитектуру, которая придаёт одинаковую важность как проприоцепции, так и зрению, что позволяет выполнять более сложные, точные движения.

В дальнейшем команда планирует улучшить возможности HPT для обработки немаркированных данных, аналогично передовым языковым моделям. Их конечная цель — создать универсальный «мозг» робота, который можно будет загрузить и использовать для любого робота без дополнительного обучения.

Хотя они признают, что находятся на ранних стадиях, команда остаётся оптимистичной в отношении того, что масштабирование может привести к прорывным разработкам в политике управления роботами, аналогичным тем, что наблюдаются в крупных языковых моделях.

Источник: Artificial Intelligence News

Интересно? Поделиться:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *