Claude Sonnet 4.6: Anthropic выпустила модель с лучшим в мире Computer Use
Anthropic представила Claude Sonnet 4.6 — модель, которая достигла 72.5% на OSWorld и стала новым стандартом для AI-автоматизации. Разбираем что нового.

Claude Sonnet 4.6: Anthropic выпустила модель с лучшим в мире Computer Use
17 февраля 2026 — Anthropic официально выпустила Claude Sonnet 4.6, который стал новым стандартом для AI-управления компьютером. На бенчмарке OSWorld модель достигла 72.5% — это в 5 раз лучше, чем первые версии Computer Use в 2024 году.
Что произошло
Официальный анонс
Anthropic объявила 17 февраля 2026:
- Claude Sonnet 4.6 — новая версия флагманской модели среднего класса
- 72.5% на OSWorld — лучший результат для AI Computer Use
- Бесплатные пользователи — модель доступна как дефолт в Claude.ai
- API — доступна по тем же ценам, что и Sonnet 4.5
Что такое OSWorld
OSWorld — ведущий бенчмарк для оценки способности AI управлять компьютером:
- Реальные задачи — работа с файлами, браузером, приложениями
- Открытая среда — не симуляция, а настоящая ОС
- Сложные сценарии — многошаговые операции
Прогресс Anthropic на OSWorld:
| Дата | Модель | Результат |
|---|---|---|
| Октябрь 2024 | Claude 3.5 | 14.9% |
| Январь 2025 | Claude 3.5 Sonnet v2 | 22% |
| Октябрь 2025 | Claude Sonnet 4.5 | 49% |
| Февраль 2026 | Claude Sonnet 4.6 | 72.5% |
Рост в 5 раз за 16 месяцев — это беспрецедентная скорость прогресса.
Что нового в Sonnet 4.6
Computer Use 2.0
Ключевые улучшения для управления компьютером:
1. Улучшенное понимание интерфейсов
- Точнее распознаёт кнопки, поля ввода, меню
- Понимает контекст окна и позицию элементов
- Работает с нестандартными UI-компонентами
2. Более стабильные действия
- Меньше случайных кликов
- Корректная работа с drag-and-drop
- Правильная обработка диалоговых окон
3. Мультиприложенческие сценарии
- Работа с несколькими окнами одновременно
- Копирование данных между приложениями
- Управление Alt-Tab переключением
4. Обработка ошибок
- Распознаёт когда что-то пошло не так
- Предлагает альтернативные пути
- Не зацикливается на неудачных действиях
Улучшения кодинга
Claude Sonnet 4.6 также улучшен для программирования:
- SWE-bench: 68% (vs 64% у 4.5)
- HumanEval: 92% точности
- Длинные контексты: до 200K токенов без деградации
Производительность
| Метрика | Sonnet 4.5 | Sonnet 4.6 |
|---|---|---|
| MMLU | 86.5% | 87.5% |
| HumanEval | 89% | 92% |
| OSWorld | 49% | 72.5% |
| MATH | 76% | 78% |
Приобретение Vercept
Одновременно с релизом Sonnet 4.6, Anthropic объявила о приобретении Vercept — стартапа, специализирующегося на Computer Use.
Что такое Vercept
Vercept разработал:
- Технологии точного управления мышью
- Методы распознавания UI-элементов
- Инструменты для тестирования Computer Use
Почему это важно
Приобретение Vercept означает:
- Anthropic серьёзно инвестирует в Computer Use
- Ожидается ускорение прогресса
- Vercept-технологии уже интегрированы в Sonnet 4.6
По словам Anthropic:
"Vercept will wind down its external product in the coming weeks and join Anthropic in pushing the frontiers of computer use."
Практические применения
RPA (Robotic Process Automation)
Claude Sonnet 4.6 с Computer Use может автоматизировать:
Примеры задач:
- Заполнение форм в legacy-системах
- Перенос данных между приложениями
- Генерация отчётов из нескольких источников
- Обработка email и документов
Пример использования:
import anthropic
client = anthropic.Anthropic()
response = client.beta.computer_use.create(
model="claude-sonnet-4.6",
task="Open Excel, copy data from sheet 1 to sheet 2, save file",
environment={
"os": "windows",
"apps": ["excel"]
}
)
QA-автоматизация
Тестировщики могут использовать Claude для:
- Создания тестовых сценариев
- Выполнения manual тестов автоматически
- Проверки UI на соответствие дизайну
Ассистенты для пользователей
Техподдержка нового уровня:
- "Покажи мне как настроить X"
- AI берёт управление и показывает
- Или выполняет задачу за пользователя
Ограничения
Безопасность
Anthropic сохраняет ограничения:
- Скриншоты — модель видит экран, не файловую систему
- Подтверждения — критические действия требуют approval
- Sandbox — рекомендуется запуск в изолированной среде
Технические
Что пока не работает идеально:
- Очень сложные UI (CAD-системы, специализированный софт)
- Real-time приложения (игры, видеоредакторы)
- Приложения с нестандартной архитектурой
Скорость
Computer Use медленнее прямого API:
- Каждое действие = скриншот + анализ + действие
- Простая задача может занять минуты
- Не подходит для real-time сценариев
Цены и доступность
API
Цены не изменились относительно Sonnet 4.5:
- Input: $3 / 1M tokens
- Output: $15 / 1M tokens
- Computer Use: +20% к стоимости (скриншоты)
Claude.ai
- Free tier: Sonnet 4.6 как дефолт, лимиты на сообщения
- Pro ($20/мес): Увеличенные лимиты + Opus 4.6
- Team/Enterprise: Кастомные условия
Доступность
- API: Глобально, включая Россию (через VPN)
- Claude.ai: Ограничения для некоторых регионов
Сравнение с конкурентами
Computer Use
| Модель | OSWorld | Доступность |
|---|---|---|
| Claude Sonnet 4.6 | 72.5% | API + Claude.ai |
| GPT-5 + Operator | ~55% | Ограниченный beta |
| Gemini + Project Mariner | ~40% | Internal preview |
Claude лидирует с большим отрывом.
Общее качество
| Модель | MMLU | Цена (1M out) |
|---|---|---|
| Claude Sonnet 4.6 | 87.5% | $15 |
| GPT-5 | 90.2% | $15 |
| Gemini 2.5 Pro | 88.3% | $10.50 |
GPT-5 чуть впереди на бенчмарках, но Computer Use у Claude лучше.
Что это значит
Для разработчиков
- Новые возможности автоматизации
- RPA без написания кода
- Тестирование без Selenium
Для бизнеса
- Автоматизация legacy-процессов
- Снижение затрат на ручной труд
- Интеграция без API (через UI)
Для индустрии
- Computer Use становится mainstream
- Конкуренты будут догонять
- Ожидайте аналогичные фичи от OpenAI и Google
Как попробовать
Claude.ai
- Зайдите на claude.ai
- Включите Computer Use в настройках (beta)
- Попросите Claude выполнить задачу на компьютере
API
import anthropic
client = anthropic.Anthropic(api_key="your-key")
# Простой запрос
response = client.messages.create(
model="claude-sonnet-4.6-20260217",
max_tokens=4096,
messages=[{
"role": "user",
"content": "Write a Python function to sort a list"
}]
)
Заключение
Claude Sonnet 4.6 — это не просто incremental update. 72.5% на OSWorld означает, что Computer Use перешёл из категории "прикольная демка" в "реальный инструмент".
Ключевые выводы:
- 72.5% OSWorld — лучший результат в индустрии
- Vercept acquisition — Anthropic серьёзно инвестирует
- Доступно сейчас — API и Claude.ai
- Цены прежние — $3/$15 за 1M токенов
- RPA без кода — новые возможности автоматизации
Будущее, где AI управляет компьютером за вас, стало ближе.
Следите за обновлениями AI-моделей! Подписывайтесь на @AI_and_zarubejka — первыми расскажем о новых релизах!
Оцените статью
0 реакций📬 Получай новые гайды первым
Раз в неделю, без спама
📚 Похожие статьи

Claude приходит в Microsoft 365: что изменится для пользователей
С 7 января 2026 года модели Anthropic включены в Microsoft 365 Copilot по умолчанию. Разбираем, что это значит и как использовать Claude в Word, Excel и PowerPoint.

Claude Sonnet 4.6 и Opus 4.6 — полный обзор февральских релизов Anthropic
Подробный обзор новых моделей Anthropic: Claude Sonnet 4.6 с производительностью уровня Opus за 5x меньшую цену, и Claude Opus 4.6 с расширенным мышлением. Бенчмарки, цены, сравнения, практические рекомендации.

Apple Xcode 26.3: Claude Agent и OpenAI Codex теперь встроены в IDE
Apple обновила Xcode до версии 26.3, добавив нативную поддержку Claude Agent от Anthropic и OpenAI Codex. Разработчики iOS/macOS получили продвинутые AI-функции прямо в IDE.
Комментарии (0)
Обсудить в Telegram💬
Пока нет комментариев. Будьте первым!
💬
Хотите обсудить статью?
Присоединяйтесь к нашему Telegram-каналу для живого общения
Перейти в TelegramНужна помощь с настройкой?
Бесплатная консультация в Telegram. Поможем за 5 минут.
Получить консультацию