Автор: 新智元
Google I/O 2026, все по максимуму!
Только что, Chop и Demis Hassabis вышли на сцену вместе, показав все свои козыри за полгода в одном флаконе.
Без всяких сомнений, сегодня вечером главная звезда, Gemini Omni, официально представлена!
Как настоящий универсальный 'модель', Omni может принимать любые формы ввода и генерировать любой контент. И, впервые, поддержка видео-выхода, можно назвать его 'видеоверсией Nano Banana'.
Еще один хайп вечера, принадлежит Gemini 3.5 Flash.
В почти всех бенчмарках 3.5 Flash превзошел своего предшественника, флагман Gemini 3.1 Pro. Скорость вывода удвоилась, а по сравнению с GPT-5.5 и Opus 4.7, он даже в четыре раза быстрее. Более мощная версия 3.5 Pro будет выпущена в следующем месяце.
Кроме того, на сцене были представлены множество новых мощных продуктов:
Antigravity 2.0: новое независимое настольное приложение, эволюционировавшее из IDE в платформу для разработки агентов.
Gemini Spark: личный AI агент, работающий 7×24 в облаке.
Обновление Gemini App: кодовое название Neural Expressive, изменено на расчет вычислительных мощностей.
Подписка AI Ultra: добавлен вариант за 100 долларов, высший уровень снижён с 250 до 200 долларов.
Самое большое обновление Google Search за 25 лет: интеграция 3.5 Flash, добавлены интеллектуальные поисковые поля, автоматическая генерация мини-приложений и т.д....
Не преувеличивая, можно сказать, что плотность информации на этой I/O можно считать самой высокой за все годы.
Запуск Gemini Omni: родился «всеобъемлющий» AI.
Как безумно намекал тизер, долгожданный Gemini Omni наконец-то здесь. Хассабис лично вышел на сцену, чтобы объявить: «Мы делаем следующий важный шаг — Gemini Omni, новая модель, которая может создавать контент из любого ввода».
Эта демонстрация говорит о многом. Google на этот раз намерен создать «всеобъемлющий» AI творческий движок. Он объединяет интеллект Gemini и самый мощный генеративный AI, заполняя все три измерения: понимание мира, мультимодальность и редактирование. Проще говоря, дайте ему любую комбинацию изображений, аудио, видео и текста, и он сможет сгенерировать качественное видео. Более того, редактировать видео можно в формате чата.
Что более важно, Omni не просто «выглядит как», он действительно понимает физический мир. Оригинальные слова Хассабиса: раньше системы часто ошибались при моделировании таких понятий, как гравитация и кинетическая энергия, но Omni достиг «скачкообразного изменения». Он внедрил «мировые знания» и «умственные способности» Gemini в генерацию видео.
Дайте ему команду «Объясните сворачивание белка с помощью пластилиновой анимации», и сгенерированное видео будет показывать каждую научно точную стадию сворачивания цепей аминокислот в α-спираль и β-слойку, визуально это будет изысканная покадровая анимация.
Например, сопоставление 26 английских букв с соответствующими объектами. C — капибара, D — диско-шар, L — лампа с расплавленным воском. Omni не просто собирает материалы, он действительно связывает язык, изображения и семантику.
Нужно сказать, что шаг от реалистичности к значимости был огромным.
На сцене Хассабис достал видео-селфи и начал вносить изменения в реальном времени. Круг, нарисованный на ладони, превратился в черную дыру, а улица, по которой он гулял вечером, превратилась в киберпанковскую сцену. Одно предложение переписывает картину, одно предложение меняет мир. Всё может стать холстом для создания новой реальности. Например, селфи с игрой с огнем: нарисовав круг на бумаге, он сразу стал черной дырой, и множество креативных идей могут быть реализованы.
Более того, это не одноразовая генерация. Вы можете продолжать общение. Видео, сгенерированное Gemini Omni, сохраняет последовательность персонажей, физическая логика остаётся в силе, сцены имеют связную память.
С одного оригинального исполнения. На втором этапе: «Перенесите скрипача в эту среду», прилагая изображение снежной горы и травы, сцена мгновенно меняется, движения и свет адаптируются к новой среде.
На третьем этапе: «Поменяйте угол обзора на спину скрипача», перспектива поворачивается, но действия игры и музыка полностью продолжаются.
Как бы ни менялись сцены, основной объект на экране не разрушится.
Еще более пугающим является гибкость ввода Omni. Изображения, текст, видео, аудио — любые справочные материалы можно смешивать для получения связного вывода. Вы даже можете создать своего собственного аватара, чтобы AI версия вас появилась в любом сценарии, говорила вашим голосом и делала то, что вы никогда не делали.
В настоящее время Omni Flash официально запущен, версия API будет доступна в ближайшие недели. А более мощный Omni Pro также в разработке. Благодаря мощной интеграционной способности Google, Omni был запущен с интеграцией Gemini App, Google Flow и YouTube Shorts, пользователи YouTube Shorts даже могут использовать его бесплатно.
Flash обошел Pro: 3.5 переписал определение «флагмана».
После Gemini Omni, другой важной частью конференции I/O стало представление нового флагмана Gemini 3.5 Flash. Google определяет его как самый мощный на сегодняшний день кодировщик и модель для агентов.
На сцене Хассабис объявил: «3.5 Flash полностью обошёл Gemini 3.1 Pro по почти всем бенчмаркам!» Стоит отметить, что 3.1 Pro был флагманской моделью Google, выпущенной три месяца назад, а теперь модель Flash уровня просто смела её.
Никто не ожидал, что Google сможет за столь короткий срок представить такие впечатляющие результаты:
Terminal-Bench 2.1 (кодирование): 76.2%
GDPval-AA (задачи реального мира для агентов): 1656 Elo
MCP Atlas (масштабное использование инструментов): 83.6%
CharXiv Reasoning (мультимодальное понимание): 84.2%
Параметры слишком абстрактны, давайте посмотрим на реальные предельные демонстрации. В одно мгновение 3.5 Flash может переработать сложную академическую статью и создать визуализированный веб-сайт с идеальным взаимодействием. В задачах для агентов с помощью Antigravity он может выполнять многоступенчатые рабочие процессы, автоматически классифицируя и именуя активы. Или, используя двух агентов, всего за шесть часов воспроизвести статью AlphaZero и написать полностью работоспособную игру.
93 агента создали ОС всего за 12 часов.
Как видно, все возможности 3.5 Flash реализованы с помощью совершенно нового Antigravity 2.0. Сегодня платформа разработки агентов Google Antigravity обновилась до 2.0, превратившись из IDE в независимое настольное приложение, полностью приняв дизайн «агент в первую очередь».
Varun вышел на сцену с демо, от которого у всех перехватило дыхание. Он заставил Antigravity, используя 3.5 Flash, создать операционную систему с нуля. 93 подагента работали параллельно, отправляя более 15000 запросов модели, обрабатывая 2,6 миллиарда токенов, и через 12 часов полностью пустой проект превратился в полноценное ядро ОС. Планировщик, управление памятью, файловая система — каждая строка кода была написана агентом, протестирована агентом, проверена агентом. Стоимость API составила менее 1000 долларов.
Затем он попытался запустить DOOM на этой AI написанной операционной системе. Первая попытка провалилась из-за отсутствия видео и клавиатурных драйверов. Поэтому он тут же ввел команду для исправления в Antigravity 2.0, агент начал автоматически дописывать код драйвера. Подождав немного, изображение DOOM появилось на экране, аудитория взорвалась.
В заключение, Antigravity 2.0 принесла ключевые обновления, включая:
Подагенты могут динамически генерироваться, главный агент разбивает задачу на подзадачи и распределяет их, работая параллельно без взаимных помех;
Асинхронное управление задачами позволяет длинным операциям больше не блокировать главный поток;
Запланированные задачи могут быть установлены как «периодические», позволяя агенту автоматически выполнять задачи, например, проверять состояние PR раз в день или запускать скрипт проверки здоровья каждый час.
Новые команды: /goal позволяют агенту выполнить задачу разом, /grill-me наоборот, позволяет агенту разобраться в требованиях, прежде чем действовать, /browser явно контролирует использование браузера.
Тем не менее, все это уже внутренние возможности. Внутри Google скорость обработки токенов на Antigravity в марте составляла 500 миллиардов в день. Теперь она составляет 3 триллиона в день. И эта версия Flash с 12-кратным ускорением сегодня доступна в Antigravity.
3.5 Flash стал стандартной моделью AI Mode для Gemini App и Google Search, доступной для всех пользователей по всему миру. Разработчики могут обращаться через Antigravity 2.0, Gemini API и Google AI Studio. Более того, 3.5 Pro проходит внутреннее тестирование и будет выпущен в следующем месяце.
7x24h личный помощник: Google Spark наконец-то здесь.
Сегодняшний третий большой анонс — это Gemini Spark! Его позиционирование очень четкое: ваш личный AI агент. Даже если вы закроете ноутбук, он не остановится. Он работает на облачной виртуальной машине, обеспечивая доступ 7x24.
Gemini Spark работает на базе Gemini 3.5 + Antigravity и глубоко интегрируется с «офисным пакетом» Google. Вице-президент продукта Джош Вудвард продемонстрировал два сценария, которые сразу же свели всех с ума.
Первый сценарий — рабочий: введите команду: «Помоги мне составить письмо команде, обобщающее всю информацию за прошедшую неделю о запуске Gemini Live». Spark автоматически собирает информацию из Gmail, Docs, чатов, и даже использует написанный Вудвардом навык «ghostwriter», чтобы письмо соответствовало его личному стилю. Весь процесс проходит в фоновом режиме, человеку нужно только проверить и отправить. Да, Spark поддерживает пользовательские навыки, позволяя ему учиться вашему стилю, вашим предпочтениям, вашему способу работы.
Второй сценарий — планирование уличной вечеринки. После получения задания Spark поэтапно выполнил все действия. Он создал RSVP трекер в Google Sheets, напрямую подключив его к Gmail, и автоматически обновлял, кто ответил. Для соседей, которые не записались, Spark автоматически подготовил напоминание, сгенерировав черновик, который отправил после подтверждения. Затем он также создал рекламную презентацию в Google Slides, включив информацию о надувном замке для улицы. Весь процесс прошел без открытия какого-либо приложения.
Более того, Spark также обладает мощной способностью ввода голосом. На сцене Вудвард достал телефон и прямо с помощью голоса задал три задачи: «Найди все встречи с Сундаром, помеченные ярко-розовым», «Напиши приглашение новому соседу Джону, чтобы он присоединился к списку участников уличной вечеринки», «Создай документ с делами, которые нужно сделать до конца учебного года для детей, отсортировав по срокам».
Голосовые команды были непосредственно преобразованы в текстовые инструкции, Spark автоматически разделил последовательный голосовой ввод на три независимых потока задач и выполнил их параллельно в фоновом режиме.
Что касается цен, подписка AI Ultra будет стоить 100 долларов в месяц для доступа к Spark Beta. Высший уровень Ultra снижен с 250 долларов до 200 долларов. Spark будет первыми открыты бета-версии для пользователей AI Ultra в США на следующей неделе.
Этой ночью Google открыл вход в ASI.
Оглядываясь на эту I/O, действительно пугает не какой-то один продукт. Это все возможности, которые одновременно работают.
Полномодальное понимание, полномодальная генерация, круглосуточный онлайн агент — эти три части мозаики Google собрал за одну ночь. Omni превращает одно предложение в целый мир, не требуя от человека предоставления каких-либо материалов; 93 агента создали операционную систему с нуля, не требуя от человека написания ни одной строки кода; Spark работает 7×24 для вас, не требуя от человека открытия какого-либо приложения.
Когда AI больше не нуждается в «подаче питания» от человека, а сам понимает, сам принимает решения, сам выполняет и сам итеративно улучшает — конечная цель этого пути называется ASI (суперумный).
Никто не может дать точный график. Но сегодняшнее Google I/O дало всем понять одну вещь: на пути к суперумному больше нет барьера «технически невозможно». Остается лишь скорость развертывания. Полгода назад мы спорили, является ли AGI пузырем. Спустя полгода Google уже использует агентов для написания операционных систем. Ускорение в этой отрасли уже вышло за пределы того, что может воспринять человеческая интуиция.
Справочные материалы:
https://youtu.be/wYSncx9zLIU
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/
https://antigravity.google/blog/introducing-google-antigravity-2-0
https://antigravity.google/blog/google-io-2026-feature-deep-dive
