Anthropic объявила о выходе Claude Opus 4.8 в среду, сократив цены на быстрый режим на две трети. Компания намекнула, что её самый мощный модель, Mythos, будет доступен всем пользователям в течение нескольких недель.
Стандартные цены для Opus 4.8 остаются на уровне $5 за вход и $25 за выход на миллион токенов, согласно блогу Anthropic.
Opus 4.8 обходится дешевле, чем GPT-5.5, и превосходит его по большинству бенчмарков
Быстрый режим теперь стоит $10 за вход и $50 за выход на миллион токенов при скорости 2.5x. На Opus 4.7 тот же уровень стоил $30/$150. По стандартным расценкам, Opus 4.8 берет $25 за миллион выходных токенов. GPT-5.5 берет $30.
Бенчмарк Opus 4.7 Opus 4.8 GPT-5.5 Gemini 3.1 Pro SWE-bench Pro 64.3% 69.2% 58.6% 54.2% SWE-bench Verified 87.6% 88.6% — — USAMO 2026 Math 69.3% 96.7% — — Terminal-Bench 2.1 66.1% 74.6% — — GraphWalks F1 (1M токенов) 40.3% 68.1% — — Online-Mind2Web — 84% Ниже 84% —
GPT-5.5 имеет преимущество в терминальных и CLI рабочих процессах. VentureBeat сообщила, что Opus 4.8 превосходит GPT-5.5 по как минимум 12 критериям, охватывающим интеллектуальную работу, использование инструментов агентами и задачи с длинным контекстом.
Корпоративные партнеры подтвердили прирост в производстве. Databricks сообщила о "значительном изменении в агентном рассуждении" внутри своего data agent Genie при "61% более низкой стоимости токенов, чем у Opus 4.7" благодаря мультимодальной эффективности на PDF и диаграммах.
Когниция отметила, что в версии 4.8 исправлены проблемы с комментированием и вызовом инструментов из версии 4.7. Hebbia указала на более четкую точность ссылок в плотных финансовых документах.
Оценка несоответствия для Opus 4.8 на уровне Mythos.
Команда по выравниванию в Anthropic провела около 2,600 смоделированных исследований, используя Opus 4.8. Они обнаружили, что уровень несоответствия составляет около 1.9 по сравнению с 2.5 у Opus 4.7. Это значение почти равно значению Mythos Preview.
Модель в четыре раза менее вероятно, чем 4.7, пропустит недостатки в своем собственном сгенерированном коде, не отметив их. Она получает 0% за некритическое сообщение о некачественных результатах, первая модель Claude, достигшая этой отметки.
Anthropic отметил одну проблему. Anthropic выявил одну область беспокойства. В примерно 5% случаев тренировки модель начала рассуждать о критериях оценки, не будучи проинформированной о том, что она проходит оценку.
Компания заявила, что это не привело к ухудшению наблюдаемого поведения, но назвала это "беспокоящей тенденцией, которая может усложнить обучение в будущем", по данным VentureBeat.
Mythos Preview остается ограниченным для небольшого числа организаций в рамках проекта Glasswing для работы в области кибербезопасности. Anthropic заявила, что ожидает предоставить модели класса Mythos всем своим клиентам в ближайшие недели, как только будут внедрены дополнительные киберзащиты, по данным Axios. Компания также намекнула на более дешевые модели, которые обеспечат "многие из тех же возможностей, что и Opus."
Как отмечал Cryptopolitan, когда была выпущена версия Opus 4.5 в ноябре, Anthropic выпускает обновления примерно каждые два месяца с 2026 года. Появление Opus 4.8 всего через 41 день после Opus 4.7 ускорило этот график.
Разрыв DeepSeek увеличился на той же неделе.
Два дня назад DeepSeek навсегда снизил цену на вывод V4-Pro до $0.87 за миллион токенов. Стандартный вывод Opus 4.8 стоит $25. Быстрый режим — $50.
Крипто-трейдинговые боты и агенты DeFi обрабатывают миллионы токенов за сессию. При таких объемах стоимость DeepSeek в $0.87 выглядит оправданной. Комиссия Opus в $25 — нет.
Если вы это читаете, вы уже впереди. Оставайтесь в курсе с нашей рассылкой.

