Назад
Новости17 февраля 202610 мин

Claude Sonnet 4.6: Anthropic выпустила модель с лучшим в мире Computer Use

Anthropic представила Claude Sonnet 4.6 — модель, которая достигла 72.5% на OSWorld и стала новым стандартом для AI-автоматизации. Разбираем что нового.

Claude Sonnet 4.6: Anthropic выпустила модель с лучшим в мире Computer Use

Claude Sonnet 4.6: Anthropic выпустила модель с лучшим в мире Computer Use

17 февраля 2026 — Anthropic официально выпустила Claude Sonnet 4.6, который стал новым стандартом для AI-управления компьютером. На бенчмарке OSWorld модель достигла 72.5% — это в 5 раз лучше, чем первые версии Computer Use в 2024 году.

Что произошло

Официальный анонс

Anthropic объявила 17 февраля 2026:

  • Claude Sonnet 4.6 — новая версия флагманской модели среднего класса
  • 72.5% на OSWorld — лучший результат для AI Computer Use
  • Бесплатные пользователи — модель доступна как дефолт в Claude.ai
  • API — доступна по тем же ценам, что и Sonnet 4.5

Что такое OSWorld

OSWorld — ведущий бенчмарк для оценки способности AI управлять компьютером:

  • Реальные задачи — работа с файлами, браузером, приложениями
  • Открытая среда — не симуляция, а настоящая ОС
  • Сложные сценарии — многошаговые операции

Прогресс Anthropic на OSWorld:

ДатаМодельРезультат
Октябрь 2024Claude 3.514.9%
Январь 2025Claude 3.5 Sonnet v222%
Октябрь 2025Claude Sonnet 4.549%
Февраль 2026Claude Sonnet 4.672.5%

Рост в 5 раз за 16 месяцев — это беспрецедентная скорость прогресса.

Что нового в Sonnet 4.6

Computer Use 2.0

Ключевые улучшения для управления компьютером:

1. Улучшенное понимание интерфейсов

  • Точнее распознаёт кнопки, поля ввода, меню
  • Понимает контекст окна и позицию элементов
  • Работает с нестандартными UI-компонентами

2. Более стабильные действия

  • Меньше случайных кликов
  • Корректная работа с drag-and-drop
  • Правильная обработка диалоговых окон

3. Мультиприложенческие сценарии

  • Работа с несколькими окнами одновременно
  • Копирование данных между приложениями
  • Управление Alt-Tab переключением

4. Обработка ошибок

  • Распознаёт когда что-то пошло не так
  • Предлагает альтернативные пути
  • Не зацикливается на неудачных действиях

Улучшения кодинга

Claude Sonnet 4.6 также улучшен для программирования:

  • SWE-bench: 68% (vs 64% у 4.5)
  • HumanEval: 92% точности
  • Длинные контексты: до 200K токенов без деградации

Производительность

МетрикаSonnet 4.5Sonnet 4.6
MMLU86.5%87.5%
HumanEval89%92%
OSWorld49%72.5%
MATH76%78%

Приобретение Vercept

Одновременно с релизом Sonnet 4.6, Anthropic объявила о приобретении Vercept — стартапа, специализирующегося на Computer Use.

Что такое Vercept

Vercept разработал:

  • Технологии точного управления мышью
  • Методы распознавания UI-элементов
  • Инструменты для тестирования Computer Use

Почему это важно

Приобретение Vercept означает:

  • Anthropic серьёзно инвестирует в Computer Use
  • Ожидается ускорение прогресса
  • Vercept-технологии уже интегрированы в Sonnet 4.6

По словам Anthropic:

"Vercept will wind down its external product in the coming weeks and join Anthropic in pushing the frontiers of computer use."

Практические применения

RPA (Robotic Process Automation)

Claude Sonnet 4.6 с Computer Use может автоматизировать:

Примеры задач:

  • Заполнение форм в legacy-системах
  • Перенос данных между приложениями
  • Генерация отчётов из нескольких источников
  • Обработка email и документов

Пример использования:

import anthropic

client = anthropic.Anthropic()

response = client.beta.computer_use.create(
    model="claude-sonnet-4.6",
    task="Open Excel, copy data from sheet 1 to sheet 2, save file",
    environment={
        "os": "windows",
        "apps": ["excel"]
    }
)

QA-автоматизация

Тестировщики могут использовать Claude для:

  • Создания тестовых сценариев
  • Выполнения manual тестов автоматически
  • Проверки UI на соответствие дизайну

Ассистенты для пользователей

Техподдержка нового уровня:

  • "Покажи мне как настроить X"
  • AI берёт управление и показывает
  • Или выполняет задачу за пользователя

Ограничения

Безопасность

Anthropic сохраняет ограничения:

  • Скриншоты — модель видит экран, не файловую систему
  • Подтверждения — критические действия требуют approval
  • Sandbox — рекомендуется запуск в изолированной среде

Технические

Что пока не работает идеально:

  • Очень сложные UI (CAD-системы, специализированный софт)
  • Real-time приложения (игры, видеоредакторы)
  • Приложения с нестандартной архитектурой

Скорость

Computer Use медленнее прямого API:

  • Каждое действие = скриншот + анализ + действие
  • Простая задача может занять минуты
  • Не подходит для real-time сценариев

Цены и доступность

API

Цены не изменились относительно Sonnet 4.5:

  • Input: $3 / 1M tokens
  • Output: $15 / 1M tokens
  • Computer Use: +20% к стоимости (скриншоты)

Claude.ai

  • Free tier: Sonnet 4.6 как дефолт, лимиты на сообщения
  • Pro ($20/мес): Увеличенные лимиты + Opus 4.6
  • Team/Enterprise: Кастомные условия

Доступность

  • API: Глобально, включая Россию (через VPN)
  • Claude.ai: Ограничения для некоторых регионов

Сравнение с конкурентами

Computer Use

МодельOSWorldДоступность
Claude Sonnet 4.672.5%API + Claude.ai
GPT-5 + Operator~55%Ограниченный beta
Gemini + Project Mariner~40%Internal preview

Claude лидирует с большим отрывом.

Общее качество

МодельMMLUЦена (1M out)
Claude Sonnet 4.687.5%$15
GPT-590.2%$15
Gemini 2.5 Pro88.3%$10.50

GPT-5 чуть впереди на бенчмарках, но Computer Use у Claude лучше.

Что это значит

Для разработчиков

  • Новые возможности автоматизации
  • RPA без написания кода
  • Тестирование без Selenium

Для бизнеса

  • Автоматизация legacy-процессов
  • Снижение затрат на ручной труд
  • Интеграция без API (через UI)

Для индустрии

  • Computer Use становится mainstream
  • Конкуренты будут догонять
  • Ожидайте аналогичные фичи от OpenAI и Google

Как попробовать

Claude.ai

  1. Зайдите на claude.ai
  2. Включите Computer Use в настройках (beta)
  3. Попросите Claude выполнить задачу на компьютере

API

import anthropic

client = anthropic.Anthropic(api_key="your-key")

# Простой запрос
response = client.messages.create(
    model="claude-sonnet-4.6-20260217",
    max_tokens=4096,
    messages=[{
        "role": "user",
        "content": "Write a Python function to sort a list"
    }]
)

Заключение

Claude Sonnet 4.6 — это не просто incremental update. 72.5% на OSWorld означает, что Computer Use перешёл из категории "прикольная демка" в "реальный инструмент".

Ключевые выводы:

  1. 72.5% OSWorld — лучший результат в индустрии
  2. Vercept acquisition — Anthropic серьёзно инвестирует
  3. Доступно сейчас — API и Claude.ai
  4. Цены прежние — $3/$15 за 1M токенов
  5. RPA без кода — новые возможности автоматизации

Будущее, где AI управляет компьютером за вас, стало ближе.


Следите за обновлениями AI-моделей! Подписывайтесь на @AI_and_zarubejka — первыми расскажем о новых релизах!

AnthropicClaudeComputer UseSonnet 4.6AI Models

Понравилась статья? Поделись с друзьями!

Поделиться:

Оцените статью

0 реакций

📬 Получай новые гайды первым

Раз в неделю, без спама

Комментарии (0)

Обсудить в Telegram

Комментарии модерируются

💬

Пока нет комментариев. Будьте первым!

💬

Хотите обсудить статью?

Присоединяйтесь к нашему Telegram-каналу для живого общения

Перейти в Telegram

Нужна помощь с настройкой?

Бесплатная консультация в Telegram. Поможем за 5 минут.

Получить консультацию