Claude Sonnet 5: Anthropic сделала дешевого агента для браузера, терминала и Claude Code

Anthropic представила Claude Sonnet 5 и прямо позиционирует его не как "самый умный Claude вообще", а как самый агентный Sonnet. Это важная разница. Opus и Mythos остаются верхним этажом по общим возможностям, а Sonnet 5 выглядит как модель для массовой работы: писать код, открывать браузер, пользоваться терминалом, строить планы, проверять результат и крутить длинные процессы без цены большой frontier-модели.

Если совсем по-человечески: раньше автономный агент был как стажер с очень дорогим консультантом внутри. Теперь Anthropic пытается сделать вариант, который можно чаще запускать в реальной работе, не считая каждое действие как маленькую финансовую драму.

Что именно выпустили

Claude Sonnet 5 - это новая Sonnet-модель Anthropic и апгрейд Sonnet 4.6. В официальном анонсе компания пишет, что модель умеет строить планы, пользоваться инструментами вроде браузеров и терминалов и работать автономно на уровне, который еще недавно требовал более крупных и дорогих моделей.

Ключевые параметры из официальной документации:

  • API ID: claude-sonnet-5;
  • контекстное окно: 1 миллион токенов;
  • максимальный output в синхронном Messages API: 128k токенов;
  • ввод: текст и изображения;
  • вывод: текст;
  • доступность: Claude plans, Claude Code и Claude Platform;
  • Sonnet 5 указан как default-модель для Free и Pro планов;
  • introductory API pricing до 31 августа 2026: $2 за миллион input tokens и $10 за миллион output tokens;
  • стандартная цена после introductory-периода: $3 input и $15 output за миллион токенов.

Главная продуктовая мысль: Sonnet 5 должен закрывать большой пласт работы, где тебе не всегда нужен самый дорогой Claude, но уже нужен не чат-бот, а исполнитель.

Почему это важно для агентов

В обычном чате модель отвечает один раз. В агентном сценарии она делает цепочку действий: прочитала задачу, составила план, открыла файлы, запустила команды, получила ошибку, поправила код, проверила результат, написала отчет. Цена ошибки и цена каждого токена там растут быстро.

Поэтому Anthropic двигает Sonnet 5 как execution layer - модель для запуска рабочих процессов. Это хорошо ложится на все, что сейчас происходит вокруг AI-сотрудников:

  • coding agents в IDE и терминале;
  • браузерные агенты для ресерча и операционки;
  • workflow с несколькими инструментами;
  • обработка больших документов;
  • длинные задачи, где модель должна помнить контекст и не терять цель.

Для ProdAdvice-аудитории главный вопрос не "обгоняет ли она всех на каждом бенчмарке". Главный вопрос: можно ли дешевле и стабильнее делегировать ей кусок работы. И вот тут Sonnet 5 выглядит интереснее, чем обычный релиз "новая модель плюс красивые графики".

benchmark chart: Main official Claude Sonnet 5 benchmark table shown near the top of the announcement and product page.

Anthropic official Claude Sonnet 5 benchmark table/chart. Source: https://www.anthropic.com/_next/image?url=https%3A%2F%2Fwww-cdn.anthropic.com%2Fimages%2F4zrzovbb%2Fwebsite%2F9941d610909f28a504e16dd5af823df172ec6035-2600x1234.png&w=3840&q=75

Цена: дешевле Opus, но есть нюанс

Официальная headline-цена выглядит вкусно: $2 за миллион input и $10 за миллион output до 31 августа 2026. Потом - $3 и $15. Anthropic отдельно говорит, что Sonnet 5 приближается к Opus 4.8 по важным агентным задачам, но стоит дешевле.

Но есть деталь, которую легко пропустить: Sonnet 5 использует обновленный tokenizer. По сноске Anthropic один и тот же input может превращаться примерно в 1.0-1.35x токенов в зависимости от типа контента. То есть в реальном счете важна не только цена за миллион токенов, но и то, сколько токенов получится из твоих файлов, переписок и логов.

Еще один рычаг - effort. В документации Anthropic для Sonnet 5 есть уровни low, medium, high, xhigh и max. По умолчанию стоит high. Для тяжелого кодинга и агентных задач рекомендуются xhigh и max, но это почти наверняка будет менять стоимость и скорость конкретного workflow.

Практический вывод: не ставь Sonnet 5 сразу в max на все. Тестируй одну и ту же задачу на нескольких effort levels и смотри не только качество, но и итоговую цену за выполненную работу.

benchmark chart: Direct image from Cursor's Sonnet 5 availability and CursorBench post.

Cursor: CursorBench chart for Claude Sonnet 5 versus Sonnet 4.6 (author: Cursor). Source: https://pbs.twimg.com/media/HMFLuJjaEAAgpWK.jpg

Где модель уже появляется

Anthropic заявляет доступность Sonnet 5 в Claude Code, Claude Platform и Claude plans. Отдельно разработческий аккаунт ClaudeDevs написал, что модель доступна на платформе, API и Managed Agents.

Cursor тоже сообщил, что Sonnet 5 появился в Cursor, и привел свой CursorBench: 57% у Sonnet 5 против 49% у Sonnet 4.6. Это не официальный бенчмарк Anthropic, но важный сигнал от партнерской IDE: модель уже встраивается туда, где люди реально пишут код.

При этом реакция не полностью восторженная. В X есть комментарии, что на high/max effort экономия относительно Opus 4.8 может быть не такой очевидной в конкретных IDE-сценариях. Это стоит воспринимать как мнение и повод тестировать на своих задачах, а не как доказанный факт против модели.

Безопасность: меньше frontier-риска, но больше safeguards

В официальных материалах Anthropic есть важная оговорка: Sonnet 5 не двигает общий capability frontier относительно более мощных Opus- и Mythos-классов. То есть это не "самая опасно умная модель Anthropic", а самая сильная в Sonnet-линейке.

По cyber-направлению Anthropic пишет, что Sonnet 5 не оптимизирован под cyber capabilities и заметно уступает более мощным Opus/Mythos-моделям. В оценке Firefox 147 exploit оба Sonnet-варианта не сделали полный рабочий exploit: 0.0% working exploit success. При этом у Sonnet 5 была чуть выше частичная успешность, поэтому компания все равно включает real-time cyber safeguards по умолчанию.

Для обычного пользователя это значит две вещи:

  1. модель может быть более полезной в агентных задачах, где есть инструменты и автономные действия;
  2. часть запросов в cyber-зоне может упираться в дополнительные проверки и ограничения.

Это нормальная новая реальность: чем больше модель умеет делать руками через инструменты, тем больше вокруг нее появляется защитных рамок.

Как использовать Sonnet 5 на практике

Если ты работаешь с ИИ не ради "поболтать", а ради результата, я бы тестировал Sonnet 5 в четырех сценариях.

1. Coding agent вместо ручного ассистента

Дай модели не вопрос, а маленькую рабочую задачу: найти баг, прочитать соседние файлы, поправить код, запустить тесты и объяснить изменения. Смотри, сколько итераций она выдерживает без потери контекста.

2. Ресерч с браузером

Проверь задачу, где модель должна не просто пересказать одну страницу, а собрать несколько источников, отделить официальные данные от мнений и выдать аккуратный вывод с уровнем уверенности.

3. Длинные документы

1M контекста полезен не потому, что можно "засунуть все". Полезен он тогда, когда модель реально держит структуру большого материала: договоры, спецификации, логи, курс, документацию, переписки.

4. Агентный workflow с ценой за результат

Самый честный тест - не benchmark, а стоимость готовой задачи. Например: сколько стоит подготовить черновик статьи, найти медиа, сделать fact-check и сдать JSON для CMS. Если Sonnet 5 делает это заметно дешевле Opus при приемлемом качестве, тогда смысл релиза становится очень конкретным.

Что не надо делать

Не надо воспринимать Sonnet 5 как универсальную замену всех Claude-моделей. По собственным материалам Anthropic это не вершина всей линейки. Для самых сложных reasoning-задач, где цена ошибки выше цены токенов, Opus/Mythos-класс может оставаться логичнее.

Не надо верить только headline-цене. Из-за tokenizer, effort levels и длины agentic loops итоговая стоимость может отличаться от ожиданий.

И не надо тащить X-комментарии в статус факта. Партнерские посты и реакции полезны для понимания рынка, но финансовые и benchmark-выводы лучше проверять на своих задачах и официальных источниках.

Главный вывод

Claude Sonnet 5 - это не релиз про "самую большую пушку". Это релиз про доступного исполнителя. Anthropic пытается сделать модель, которую можно ставить в рабочие цепочки: IDE, терминал, браузер, документы, агенты, CMS, внутренние операции.

Если Opus - это дорогой эксперт для самых сложных решений, то Sonnet 5 - это сильный операционный сотрудник: не всегда самый умный в комнате, зато достаточно умный, быстрый и дешевый, чтобы делать много реальной работы.

И именно поэтому этот релиз важен. Не потому что у него самое громкое название, а потому что он приближает момент, когда ИИ-агенты перестают быть демо и становятся обычной частью рабочего процесса.

Источники