До встречи на танцполе: роботы теперь обучаются движениям на лету и открывают для себя новый класс задач

Страницы:  1

Ответить
 

Professor Seleznov


pic
В IEEE Spectrum на днях показали ролик с гуманоидом Digit от Agility Robotics, который танцует неожиданно легко и уверенно. Компания объясняет это не постановкой каждого шага отдельно, как это делали раньше, а новым циклом обучения: движения собирают из данных захвата движений, анимации и телеуправления, после чего навык докручивают в симуляции и переносят на реального робота. А значит, теперь гуманоидов можно заметно быстрее обучать новым движениям.
pic
Источник gif
Танец для робота — это тест сразу нескольких важных навыков: удержания равновесия, согласованной работы рук, ног и корпуса, плавности переходов между движениями и устойчивости к ошибкам. Если машина может не просто сделать шаг вперед, но и выполнить сложную танцевальную связку без ошибок, значит, у нее выросло качество управления всем телом. Именно поэтому IEEE Spectrum считает танцующего Digit показателем того, как меняется обучение роботов в физическом мире.
Логика подхода к обучению робота движениям изменилась на 180 градусов
pic
Источник
Если вспомнить старые демонстрации, изменилась сама логика. В 2010 году IEEE Spectrum рассказывала про японского гуманоидного робота HRP-4C: ключевой новинкой тогда было программное обеспечение, похожее на инструменты для компьютерной анимации. Человек задавал опорные позы, а система строила траектории, проверяла устойчивость и подправляла движения, если робот мог потерять равновесие. Это был большой шаг вперед, восторженные реакции, но по сути речь шла о более удобной постановке заранее продуманной хореографии.
pic
Источник
Следующий этап показала Boston Dynamics. Когда компания выпускала знаменитый

с танцующим Atlas, инженеры рассказывали IEEE Spectrum, что сначала работали с танцорами и хореографом, затем быстро прогоняли движения в симуляции и только после этого переносили их на робота. То есть даже тогда акцент уже смещался от «ручной постановки» к быстрой итерации через модель и проверку на железе. Но нынешний уровень отличается тем, что роботам все чаще не просто подбирают движения, а строят масштабируемый конвейер обучения новым навыкам.
Digit — это продукт Agility Robotics, их ключевая платформа гуманоидной робототехники
pic
Источник
Для обеспечения безопасности и устойчивости гуманоидного робота Digit при выполнении самых разных задач разработана модель управления всем телом. Она работает по принципу, напоминающему моторную кору головного мозга человека: получает сигналы с разных уровней иерархии управления и координирует произвольные движения, включая точные моторные действия.
В основе этой системы лежит сравнительно компактная нейронная сеть LSTM с менее чем миллионом параметров. Обучение модели проходит в физическом симуляторе NVIDIA Isaac Sim: за три-четыре дня она успевает пройти объем моделирования, эквивалентный десятилетиям.
Система обучается исключительно в симуляции, после чего переносится на реального робота без предварительного дообучения в физической среде. Ее можно использовать для выполнения задач, требующих точного позиционирования рук и туловища, включая ходьбу, подъем и перенос тяжелых предметов. На этой базе также возможно обучение более сложным навыкам манипулирования и координации действий.
Модель может работать в разных режимах в зависимости от поставленной задачи. Один из ранних вариантов этой разработки был представлен в марте на конференции NVIDIA GTC. Тогда систему использовали для

сценария действий робота в магазине: политика управления запускалась на основе распознавания объектов с помощью детектора с открытым словарем, адаптированного для трехмерного пространства, а выполнение действий контролировалось через цикл планирования на базе конечного автомата.
Глубокое обучение с подкреплением становится одним из главных подходов в управлении человекоподобными роботами
У робота с неподвижным основанием задача проще: ему достаточно рассчитать, как довести руку или другой исполнительный элемент до нужной точки. А у шагающего робота все меняется в момент каждого шага: одна нога в воздухе, другая на опоре, контакты с поверхностью постоянно меняются, а вместе с ними меняется и вся физика движения.
Из-за этого роботу нужно в реальном времени не только тянуться к объекту, но и заново координировать все тело — переставлять ноги, удерживать устойчивость, избегать столкновений и компенсировать внешние воздействия. Именно поэтому управление гуманоидным роботом намного сложнее, чем управление стационарным манипулятором.
Глубокое обучение с подкреплением становится одним из главных подходов в управлении человекоподобными роботами. Вместо того чтобы вручную описывать сложную механику движений, разработчики обучают нейросеть в симуляторе, а затем переносят ее на реального робота.
Такие системы уже показывают впечатляющие результаты, особенно в динамичных движениях вроде танцев. Но для практической работы этого недостаточно: роботу нужно не просто эффектно двигаться, а точно управлять всем телом, взаимодействовать с предметами, удерживать равновесие и прикладывать усилие руками и ногами.
Еще одна важная задача — научить робота двигаться не просто с заданной скоростью, а приходить в конкретную точку и удерживать положение. Это делает движения точнее, устойчивее и полезнее для реальной работы.
Сложность и в том, что во многих ранних системах движения верхней части тела задавались через углы суставов. Это неудобно, потому что для практического использования такого контроллера нужны дополнительные инструменты: либо системы захвата движений, либо отдельные планировщики, которые переводят задачу в команды для робота.
Это усложняет работу, поскольку и оператору, и системе управления более высокого уровня приходится учитывать внутреннюю кинематику робота. Гораздо удобнее, когда команды задаются сразу в понятных координатах: через положение и ориентацию рук и корпуса в пространстве. Такой подход упрощает управление, дистанционную работу и обучение робота на примерах.
Главное изменение — рост роли симуляции, данных и обучаемых моделей управления  
NVIDIA в своем техническом блоге пишет, что в конвейере для гуманоидов смогла сгенерировать 780 тысяч синтетических траекторий — это эквивалент примерно 6,5 тысячи часов или девяти непрерывных месяцев человеческих демонстраций — всего за 11 часов. По данным компании, сочетание синтетических и реальных данных дало 40-процентный прирост качества модели GR00T N1 по сравнению с обучением только на реальных примерах. Для отрасли это означает, что обучение роботов начинает ускоряться не линейно, а за счет масштабирования данных.
Другой важный сдвиг — переход к управлению всем телом как единой системой. Figure AI пишет о модели Helix 02: одна нейросетевая система теперь управляет у гуманоидного робота ходьбой, манипуляцией и удержанием равновесия как непрерывным процессом. Компания приводит в качестве демонстрацию четырехминутную автономную работу на кухне без перезапусков и вмешательства человека. Это контрастирует с ранними роликами, где робот показывал одну удачную связку: теперь рынок движется к длинным последовательностям действий, в которых робот должен не просто красиво двигаться, но и сохранять цель и доводить задачу до конца.
Google DeepMindидет в ту же сторону, но делает ставку на модели класса «зрение — язык — действие». На странице Gemini Robotics компания пишет, что такие модели должны уметь воспринимать пространство, рассуждать, пользоваться инструментами, взаимодействовать с людьми и разбивать сложные задачи на шаги. Так красивое движение само по себе уже перестает быть конечной целью, но становится частью более широкого набора навыков, где робот видит, понимает и действует в реальной среде.
Такие роботы уже вовсю работают на заводах
pic
Источник
Компании перестали ограничиваться роликами. Agility Robotics в 2024 году объявила о многолетнем соглашении с GXO и назвала его первым формальным коммерческим внедрением гуманоидных роботов и первой моделью «роботы как услуга» для такого класса машин. 
В феврале 2026-го Agility Robotics заключила коммерческое соглашение с Toyota Motor Manufacturing Canada о внедрении гуманоидного робота Digit на канадских заводах компании. После пилотного проекта Toyota планирует использовать робота в производственных и логистических операциях. Также у компании крупные проекты с Amazon, GXO и Schaeffler.
Digit предназначен для выполнения монотонных и физически тяжелых задач, чтобы снизить нагрузку на сотрудников, повысить безопасность и улучшить эффективность работы предприятий.
Figure AI приводит еще более предметные цифры. По данным компании, ее Figure 02 проработал на заводе BMW в Спартанберге 11 месяцев, выходил в 10-часовые смены по будням, загрузил более 90 тысяч деталей и участвовал в выпуске более 30 тысяч автомобилей X3. Компания отдельно подчеркивает, что такой опыт дал данные для новой версии робота и помог выявить слабые места в механике и электронике. Это и есть ключевой переход, который сейчас происходит на рынке: демонстрация движений становится способом обкатать машину в реальных условиях.
pic
Источник
Apptronik идет по схожему пути. В феврале 2025 года компания объявила о сотрудничестве с Jabil: партнер должен не только помочь масштабировать выпуск гуманоидов Apollo, но и предоставить реальную производственную среду для их внедрения в конкретные операции. В сообщении Apptronik и Jabil утверждают, что это нужно и для наращивания выпуска, и для сбора прикладных сценариев автоматизации, и для дообучения моделей Apollo. И снова прослеживается та же логика: сначала робот учится уверенно владеть телом, а затем этот навык превращается в производственную компетенцию.
Так революция или еще нет?
Международная федерация робототехники в своем обзоре Humanoid Robots: Vision and Reality называет гуманоидов одной из самых заметных тем отрасли, но одновременно предупреждает, что массовое распространение таких машин пока не гарантировано. В федерации подчеркивают: гуманоиды, скорее всего, будут не заменой всем существующим типам роботов, а дополнением к ним. Поэтому даже если робот уже красиво двигается, рынку все еще нужны надежность, экономическая эффективность, автономность, безопасность и понятная интеграция в рабочие процессы.
Но ролик с Digit показывает нам, что инженерный цикл заметно ускорился. Когда компания может быстро собрать движение из данных захвата, анимации и телеуправления, прогнать его через симуляцию и перенести на реального гуманоидного робота, это означает, что тем же способом можно будет обучать уже не танцу, а развороту в узком проходе, работе с коробками, безопасному обходу человека или точной подаче детали на сборочной линии. И этим компании уже занимаются.
Р. S. Какие еще подходы к обучению роботов танцевать существуют
pic
Источник
Если вам интересна эта тема, можете изучить другие подходы к тому, как заставить робота двигаться наподобие человека.
  • Обучение на больших массивах данных движений человека в симуляции. Expressive Whole-Body Control for Humanoid Robots. Ее авторы исследуют, можно ли научить гуманоидного робота не только ходить и сохранять равновесие, но и воспроизводить более богатые, разнообразные и выразительные движения, близкие к человеческим, — как тот же танец или сортировка продуктов в супермаркете.
В работе описан подход, при котором политика управления всем телом обучается на больших массивах данных захвата движений человека в симуляции, а затем переносится на реального робота. При этом исследователи учитывают, что напрямую копировать человеческие движения невозможно из-за различий в конструкции, степенях свободы и физических возможностях робота. Поэтому система делает акцент на выразительности верхней части тела, а движения ног подчиняет задаче устойчивости и следования заданной скорости. Такой подход позволяет роботу в реальных условиях двигаться в разных стилях, взаимодействовать с человеком и выполнять танцевальные движения.
  • Перенос из симуляции в реальный мир. ExBody2: Advanced Expressive Humanoid Whole-Body Control. В ней исследователи показывают, что гуманоидного робота можно обучить устойчиво воспроизводить не только ходьбу, но и более сложные и динамичные движения — бег, приседания, танцевальные связки, боковые шаги и удары корпусом. Важный момент в том, что речь идет не об одном эффектном, заранее подготовленном номере, а о более общем подходе к слежению за эталонным движением, который затем переносится из симуляции в реальный мир.
Авторы поставили задачу совместить выразительность, динамику и устойчивость, а в качестве решения предлагают не одну универсальную настройку, а двухуровневую схему: общую политику для широкого спектра движений и специализированные донастройки для отдельных классов действий — например, танца или других сложных паттернов.
В ExBody2 движения сначала адаптируют под морфологию робота, а затем автоматически отфильтровывают слишком сложные или физически невыполнимые фрагменты. Это нужно, чтобы сохранить баланс между разнообразием движений и их реализуемостью на железе.
Также используют стратегию отслеживания ключевых точек тела отделено от контроля скорости движения. Это позволяет одновременно добиваться более точной имитации поз и сохранять стабильность шагающего робота.
Сначала обучается «универсальная» политика на широком наборе движений, а затем она донастраивается под конкретные типы моторики. Такой подход дает компромисс между широтой навыков и качеством исполнения отдельных движений.
  • Телеуправление всем телом.В Learning Human-to-Humanoid Real-Time Whole-Body Teleoperation исследователи представили систему H2O, в которой гуманоидный робот в реальном времени повторяет движения человека, используя только RGB-камеру. Авторы отдельно подчеркивают, что система справляется не только с базовой локомоцией, но и с более сложными действиями — поворотами, махами руками, толчками, ударами ногой, боксированием и даже прыжком назад. 
Дальнейшее развитие этой идеи представлено в работе OmniH2O: Universal and Dexterous Human-to-Humanoid Whole-Body Teleoperation and Learning. Авторы описывают систему как универсальную платформу для телеуправления гуманоидом и обучения по демонстрациям: управление возможно через VR-гарнитуру, голосовые инструкции и RGB-камеру, а сами демонстрации затем используются для обучения новых навыков. Отдельно исследователи выпустили OmniH2O-6, который они называют первым датасетом для управления всем телом гуманоидного робота на шести бытовых задачах.
pic
Источник
  • Робот получает инструмент для синтеза новых движений. У Disney Research в работе Robot Motion Diffusion Model показана связка генеративной модели движения с физическим контролем персонажа-робота. Исследователи пишут, что многие «красивые» генеративные движения плохо соблюдают физические ограничения, поэтому их подход строится так, чтобы движение оставалось не только зрелищным, но и выполнимым на реальном роботе.
Схожий подход — у авторов работы BeyondMimic. Они пишут, что существующим системам обычно не хватает либо естественности движения, либо универсальности, а их цель — научить гуманоидов собирать разные двигательные примитивы в новые задачи. В качестве примеров они называют прыжки с вращением, спринт, колесо, а затем переходят к практическим сценариям — навигации по точкам, телеуправлению джойстиком и обходу препятствий. То есть технология, которая умеет собирать танцевальные или акробатические фрагменты, затем может использовать тот же запас движений в прикладной задаче.
pic
  • Модельный подход к генерации динамичных танцевальных движений авторы описывают в Dynamic Whole-Body Dancing with Humanoid Robots: сначала записывают человеческие танцы через систему захвата движений, затем оптимизируют траектории и исполняют их на гуманоиде в онлайне.
-Источник
 
Loading...
Error