Claude Sonnet 4.6: Anthropic выпустила модель с лучшим в мире Computer Use

17 февраля 2026 — Anthropic официально выпустила Claude Sonnet 4.6, который стал новым стандартом для AI-управления компьютером. На бенчмарке OSWorld модель достигла 72.5% — это в 5 раз лучше, чем первые версии Computer Use в 2024 году.

Что произошло

Официальный анонс

Anthropic объявила 17 февраля 2026:

Claude Sonnet 4.6 — новая версия флагманской модели среднего класса
72.5% на OSWorld — лучший результат для AI Computer Use
Бесплатные пользователи — модель доступна как дефолт в Claude.ai
API — доступна по тем же ценам, что и Sonnet 4.5

Что такое OSWorld

OSWorld — ведущий бенчмарк для оценки способности AI управлять компьютером:

Реальные задачи — работа с файлами, браузером, приложениями
Открытая среда — не симуляция, а настоящая ОС
Сложные сценарии — многошаговые операции

Прогресс Anthropic на OSWorld:

Дата	Модель	Результат
Октябрь 2024	Claude 3.5	14.9%
Январь 2025	Claude 3.5 Sonnet v2	22%
Октябрь 2025	Claude Sonnet 4.5	49%
Февраль 2026	Claude Sonnet 4.6	72.5%

Рост в 5 раз за 16 месяцев — это беспрецедентная скорость прогресса.

Что нового в Sonnet 4.6

Computer Use 2.0

Ключевые улучшения для управления компьютером:

1. Улучшенное понимание интерфейсов

Точнее распознаёт кнопки, поля ввода, меню
Понимает контекст окна и позицию элементов
Работает с нестандартными UI-компонентами

2. Более стабильные действия

Меньше случайных кликов
Корректная работа с drag-and-drop
Правильная обработка диалоговых окон

3. Мультиприложенческие сценарии

Работа с несколькими окнами одновременно
Копирование данных между приложениями
Управление Alt-Tab переключением

4. Обработка ошибок

Распознаёт когда что-то пошло не так
Предлагает альтернативные пути
Не зацикливается на неудачных действиях

Улучшения кодинга

Claude Sonnet 4.6 также улучшен для программирования:

SWE-bench: 68% (vs 64% у 4.5)
HumanEval: 92% точности
Длинные контексты: до 200K токенов без деградации

Производительность

Метрика	Sonnet 4.5	Sonnet 4.6
MMLU	86.5%	87.5%
HumanEval	89%	92%
OSWorld	49%	72.5%
MATH	76%	78%

Приобретение Vercept

Одновременно с релизом Sonnet 4.6, Anthropic объявила о приобретении Vercept — стартапа, специализирующегося на Computer Use.

Что такое Vercept

Vercept разработал:

Технологии точного управления мышью
Методы распознавания UI-элементов
Инструменты для тестирования Computer Use

Почему это важно

Приобретение Vercept означает:

Anthropic серьёзно инвестирует в Computer Use
Ожидается ускорение прогресса
Vercept-технологии уже интегрированы в Sonnet 4.6

По словам Anthropic:

"Vercept will wind down its external product in the coming weeks and join Anthropic in pushing the frontiers of computer use."

Практические применения

RPA (Robotic Process Automation)

Claude Sonnet 4.6 с Computer Use может автоматизировать:

Примеры задач:

Заполнение форм в legacy-системах
Перенос данных между приложениями
Генерация отчётов из нескольких источников
Обработка email и документов

Пример использования:

import anthropic

client = anthropic.Anthropic()

response = client.beta.computer_use.create(
    model="claude-sonnet-4.6",
    task="Open Excel, copy data from sheet 1 to sheet 2, save file",
    environment={
        "os": "windows",
        "apps": ["excel"]
    }
)

QA-автоматизация

Тестировщики могут использовать Claude для:

Создания тестовых сценариев
Выполнения manual тестов автоматически
Проверки UI на соответствие дизайну

Ассистенты для пользователей

Техподдержка нового уровня:

"Покажи мне как настроить X"
AI берёт управление и показывает
Или выполняет задачу за пользователя

Ограничения

Безопасность

Anthropic сохраняет ограничения:

Скриншоты — модель видит экран, не файловую систему
Подтверждения — критические действия требуют approval
Sandbox — рекомендуется запуск в изолированной среде

Технические

Что пока не работает идеально:

Очень сложные UI (CAD-системы, специализированный софт)
Real-time приложения (игры, видеоредакторы)
Приложения с нестандартной архитектурой

Скорость

Computer Use медленнее прямого API:

Каждое действие = скриншот + анализ + действие
Простая задача может занять минуты
Не подходит для real-time сценариев

Цены и доступность

API

Цены не изменились относительно Sonnet 4.5:

Input: $3 / 1M tokens
Output: $15 / 1M tokens
Computer Use: +20% к стоимости (скриншоты)

Claude.ai

Free tier: Sonnet 4.6 как дефолт, лимиты на сообщения
Pro ($20/мес): Увеличенные лимиты + Opus 4.6
Team/Enterprise: Кастомные условия

Доступность

API: Глобально, включая Россию (через VPN)
Claude.ai: Ограничения для некоторых регионов

Сравнение с конкурентами

Computer Use

Модель	OSWorld	Доступность
Claude Sonnet 4.6	72.5%	API + Claude.ai
GPT-5 + Operator	~55%	Ограниченный beta
Gemini + Project Mariner	~40%	Internal preview

Claude лидирует с большим отрывом.

Общее качество

Модель	MMLU	Цена (1M out)
Claude Sonnet 4.6	87.5%	$15
GPT-5	90.2%	$15
Gemini 2.5 Pro	88.3%	$10.50

GPT-5 чуть впереди на бенчмарках, но Computer Use у Claude лучше.

Что это значит

Для разработчиков

Новые возможности автоматизации
RPA без написания кода
Тестирование без Selenium

Для бизнеса

Автоматизация legacy-процессов
Снижение затрат на ручной труд
Интеграция без API (через UI)

Для индустрии

Computer Use становится mainstream
Конкуренты будут догонять
Ожидайте аналогичные фичи от OpenAI и Google

Как попробовать

Claude.ai

Зайдите на claude.ai
Включите Computer Use в настройках (beta)
Попросите Claude выполнить задачу на компьютере

API

import anthropic

client = anthropic.Anthropic(api_key="your-key")

# Простой запрос
response = client.messages.create(
    model="claude-sonnet-4.6-20260217",
    max_tokens=4096,
    messages=[{
        "role": "user",
        "content": "Write a Python function to sort a list"
    }]
)

Заключение

Claude Sonnet 4.6 — это не просто incremental update. 72.5% на OSWorld означает, что Computer Use перешёл из категории "прикольная демка" в "реальный инструмент".

Ключевые выводы:

72.5% OSWorld — лучший результат в индустрии
Vercept acquisition — Anthropic серьёзно инвестирует
Доступно сейчас — API и Claude.ai
Цены прежние — $3/$15 за 1M токенов
RPA без кода — новые возможности автоматизации

Будущее, где AI управляет компьютером за вас, стало ближе.

Следите за обновлениями AI-моделей! Подписывайтесь на @AI_and_zarubejka — первыми расскажем о новых релизах!

Claude Sonnet 4.6: Anthropic выпустила модель с лучшим в мире Computer Use

Что произошло

Официальный анонс

Что такое OSWorld

Что нового в Sonnet 4.6

Computer Use 2.0

Улучшения кодинга

Производительность

Приобретение Vercept

Что такое Vercept

Почему это важно

Практические применения

RPA (Robotic Process Automation)

QA-автоматизация

Ассистенты для пользователей

Ограничения

Безопасность

Технические

Скорость

Цены и доступность

API

Claude.ai

Доступность

Сравнение с конкурентами

Computer Use

Общее качество

Что это значит

Для разработчиков

Для бизнеса

Для индустрии

Как попробовать

Claude.ai

API

Заключение

Оцените статью

📬 Получай новые гайды первым

📚 Похожие статьи

Anthropic: $100M на Claude Partner Network и Claude в Microsoft 365 Copilot

Claude 1M контекст GA: Anthropic убирает наценку за длинный контекст

Claude приходит в Microsoft 365: что изменится для пользователей

Комментарии (0)

Хотите обсудить статью?

Нужна помощь с настройкой?