Идеи и мнения CryptoNews_1102 (@Cryptoexpress1)

Google DeepMind только что объявила о двух новых моделях ИИ – Gemini Robotics 1.5 и Gemini Robotics-ER 1.5 – которые разработаны для улучшения возможностей роботов, позволяя им не только выполнять команды, но и планировать, рассуждать, искать информацию и делиться навыками.
Роботы могут самостоятельно изучать и адаптироваться
Вместо того чтобы просто следовать заранее заданному сценарию, роботы нового поколения могут решать сложные задачи. Например, они могут:
Искать прогноз погоды онлайн, чтобы упаковать подходящую одежду.
Получать информацию о местных правилах переработки и правильно сортировать мусор.
Складывать одежду по цвету или материалу без необходимости программировать каждую деталь.
Это способность «обобщения» – обобщение, с которым традиционные роботы и алгоритмы часто сталкиваются с трудностями.
Как две модели работают вместе
Gemini Robotics-ER 1.5: выполняет роль «мозга», планируя многоэтапные действия и ища информацию через Google Search.
Gemini Robotics 1.5: преобразует план в точные физические действия благодаря модели vision-language-action (VLA).
В ходе испытаний роботы могут распознавать объекты, искать инструкции по переработке в Сан-Франциско, а затем самостоятельно убирать мусор. Хотя уровень успеха составляет всего 20% – 40%, это является значительным шагом вперед по сравнению с предыдущим поколением.
Стратегическое значение
Генеральный директор Sundar Pichai подчеркнул, что новые технологии приблизят роботов к способности мыслить, планировать и учиться, как люди, закладывая основу для многофункциональных роботов (general-purpose robots).