Исследование: Почему и как Opus 4.7 потребляет токены значительно быстрее, чем Opus 4.6

Модель Opus 4.7 демонстрирует повышенную производительность, однако это сопряжено со значительно более быстрым потреблением токенов из пользовательских пакетов. Основные причины такого явления — особенности токенизации и более "интенсивный" процесс обработки запросов, оба из которых требуют большего количества токенов. Следовательно, хотя стоимость одного токена через API для версий 4.6 и 4.7 остается неизменной, общие затраты на использование Opus 4.7 при аналогичных задачах, как правило, будут выше.
После выпуска Opus 4.7 пользователи стали активно выражать недовольство быстрым исчерпанием своих тарифных планов по сравнению с версией 4.6. Эта проблема затронула и модель Claude Code. В ответ на обратную связь, Anthropic предпринял меры по оптимизации, в частности, сократив объем генерируемых ответов, что позволило уменьшить расход выходных токенов.
- Ранее: Claude Code слишком много "думал", затем — недостаточно: Anthropic исправляет эту проблему.
При запуске Opus 4.7, компания Anthropic заявляла о сохранении прежних тарифов: 5 долларов за миллион входных токенов и 25 долларов за миллион выходных токенов. Однако, компания также признала, что один и тот же ввод может приводить к большему расходу токенов в Opus 4.7, поскольку модель использует обновленный токенизатор, который увеличивает потребление токенов в 1.0 до 1.35 раза в зависимости от типа контента. Кроме того, было отмечено, что "Opus 4.7 демонстрирует повышенную производительность при обработке более сложных запросов", что, улучшая надежность решения комплексных задач, ведет к генерации большего количества выходных токенов.
Один и тот же запрос: на 41% больше токенов
На практике, для оценки реального потребления, было проведено сравнение моделей Opus 4.6 и 4.7 на относительно простых запросах. Для этого был разработан специальный скрипт с использованием Claude Code, который позволил измерять количество расходуемых токенов через API. (Оригинальный скрипт, не содержащий API-ключа, упоминался в конце исходной статьи).
Похожие новости

Как включить режим «Картинка в картинке» (PiP) в YouTube на iPhone бесплатно
Режим «Картинка в картинке» (PiP) для YouTube, ранее доступный бесплатно только в США, теперь распространяется на всех пользователей iOS и Android по всему миру, независимо от наличия подписки YouTube Premium. Эта функция, позволяющая просматривать видео в миниатюрном окне поверх других прилож

Meta* (Facebook*, Instagram*) оштрафуют за слабую защиту детей в соцсетях
Европейский союз выражает обеспокоенность недостаточной защитой детей со стороны Meta* на её платформах, таких как Facebook* и Instagram*. Европейская комиссия полагает, что действия компании могут противоречить нормам нового Закона о цифровых услугах (DSA). Несмотря на установленное Meta*

В России подчеркнули важность раннего освоения молодежью управления искусственным интеллектом
Молодым людям необходимо с раннего возраста активно осваивать работу с искусственным интеллектом (ИИ) и использовать его в качестве эффективного инструмента для решения различных задач. Такое мнение выразил заместитель руководителя администрации президента РФ Максим Орешкин, подчеркнув, что сов

Инновационные интеллектуальные энергосистемы: российская разработка для снижения выбросов на промышленных предприятиях
Специалисты Центра НТИ «Энерджинет» представили передовую технологию микро-ИРЭС (интеллектуальных распределенных энергосистем), разработанную специально для нужд промышленных предприятий. Эти инновационные системы способны автоматически регулировать и перераспределять энергетические ресурсы меж

Минфин России внедряет искусственный интеллект для оптимизации бюджетного процесса
Министерство финансов России, возглавляемое Антоном Силуановым, начало применять технологии искусственного интеллекта (ИИ) в процессе подготовки государственного бюджета. При этом подчеркивается, что ИИ выступает исключительно в качестве вспомогательного инструмента, а окончательное решение вс

Яндекс получил патент на технологию безопасного управления облачными платформами в разных регионах
«Яндекс» запатентовал инновационную технологию, предназначенную для безопасного администрирования облачных инфраструктур, распределенных по различным географическим регионам. Эта разработка призвана обеспечить строгое соблюдение локальных законодательных норм в области хранения данных, а также