Google DeepMind только что объявила о двух новых моделях ИИ – Gemini Robotics 1.5 и Gemini Robotics-ER 1.5 – которые разработаны для улучшения возможностей роботов, позволяя им не только выполнять команды, но и планировать, рассуждать, искать информацию и делиться навыками.

Роботы могут самостоятельно изучать и адаптироваться

Вместо того чтобы просто следовать заранее заданному сценарию, роботы нового поколения могут решать сложные задачи. Например, они могут:

Искать прогноз погоды онлайн, чтобы упаковать подходящую одежду.

Получать информацию о местных правилах переработки и правильно сортировать мусор.

Складывать одежду по цвету или материалу без необходимости программировать каждую деталь.

Это способность «обобщения» – обобщение, с которым традиционные роботы и алгоритмы часто сталкиваются с трудностями.

Как две модели работают вместе

Gemini Robotics-ER 1.5: выполняет роль «мозга», планируя многоэтапные действия и ища информацию через Google Search.

Gemini Robotics 1.5: преобразует план в точные физические действия благодаря модели vision-language-action (VLA).

В ходе испытаний роботы могут распознавать объекты, искать инструкции по переработке в Сан-Франциско, а затем самостоятельно убирать мусор. Хотя уровень успеха составляет всего 20% – 40%, это является значительным шагом вперед по сравнению с предыдущим поколением.

Стратегическое значение

Генеральный директор Sundar Pichai подчеркнул, что новые технологии приблизят роботов к способности мыслить, планировать и учиться, как люди, закладывая основу для многофункциональных роботов (general-purpose robots).