📚 Для новичков

Словарь AI-терминов

Все термины простым языком с примерами

Промпт (Prompt)

Основы

Текстовый запрос, который вы отправляете нейросети. Чем точнее промпт, тем лучше результат.

Пример: Плохо: "Напиши текст". Хорошо: "Напиши продающий текст для лендинга фитнес-клуба, 300 слов, с призывом к действию".

Токен (Token)

Основы

Единица измерения текста для AI. Примерно 1 токен = 4 символа на английском или 1-2 символа на русском.

Пример: Слово "привет" = 2-3 токена. За токены платят при использовании API.

Контекст (Context)

Основы

Вся информация, которую AI "помнит" в рамках диалога. Ограничен контекстным окном.

Пример: GPT-5.2 помнит 128K токенов ≈ 100 страниц текста.

Контекстное окно

Основы

Максимальный объём текста, который модель может обработать за раз (ваш запрос + её ответ).

Пример: Claude: 200K токенов, Gemini: 2M токенов, GPT-5.2: 128K токенов.

Температура (Temperature)

Параметры

Параметр "креативности" AI. 0 = строго по фактам, 1 = максимум творчества.

Пример: Для кода используйте 0-0.3, для креатива 0.7-1.0.

LLM (Large Language Model)

Модели

Большая языковая модель — нейросеть, обученная на огромном количестве текстов.

Пример: GPT-4, Claude, Gemini, LLaMA — это всё LLM.

Fine-tuning

Продвинутое

Дообучение готовой модели на специфических данных для улучшения в конкретной области.

Пример: Можно дообучить GPT на юридических документах для лучшего понимания права.

Галлюцинации (Hallucinations)

Проблемы

Когда AI уверенно выдаёт неправильную или выдуманную информацию.

Пример: AI может придумать несуществующую книгу или неверную дату. Всегда проверяйте факты!

RAG (Retrieval-Augmented Generation)

Продвинутое

Технология, когда AI сначала ищет информацию в базе данных, а потом отвечает на её основе.

Пример: Чат-бот поддержки сначала ищет в FAQ, потом формирует ответ.

API (Application Programming Interface)

Техническое

Способ подключить AI к своему приложению или автоматизации программно.

Пример: Через API можно встроить ChatGPT в свой сайт или Telegram-бота.

Мультимодальность

Модели

Способность AI работать с разными типами данных: текст, изображения, аудио, видео.

Пример: GPT-4 понимает картинки, Gemini — ещё и видео с аудио.

System Prompt

Промптинг

Скрытая инструкция для AI, которая задаёт его "роль" и правила поведения.

Пример: "Ты — эксперт по маркетингу. Отвечай кратко и с примерами."

Chain of Thought (CoT)

Промптинг

Техника, когда просишь AI рассуждать пошагово перед ответом. Улучшает качество.

Пример: Добавьте: "Рассуждай пошагово" или "Think step by step".

Zero-shot / Few-shot

Промптинг

Zero-shot: запрос без примеров. Few-shot: запрос с несколькими примерами желаемого результата.

Пример: Few-shot: "Пример 1: ... Пример 2: ... Теперь сделай для: ..."

Embedding

Техническое

Числовое представление текста, позволяющее AI понимать смысл и сравнивать похожесть.

Пример: Используется для поиска похожих документов или кластеризации текстов.

Inference

Техническое

Процесс генерации ответа моделью. За inference платят при использовании API.

Пример: Каждый запрос к ChatGPT — это inference.

Thinking Mode / Extended Thinking

Параметры

Режим, когда AI "думает" дольше перед ответом, улучшая качество для сложных задач.

Пример: Claude Extended Thinking, GPT-5.2 high mode.

Агент (AI Agent)

Продвинутое

AI, который может выполнять цепочку действий: искать информацию, запускать код, управлять приложениями.

Пример: AI-агент может сам найти информацию в интернете, проанализировать и написать отчёт.

Transformer

Архитектура

Архитектура нейросети, на которой основаны все современные LLM. Использует механизм внимания (attention) для обработки текста.

Пример: GPT = Generative Pre-trained Transformer. Буква T — это как раз Transformer.

Attention (Внимание)

Архитектура

Механизм, позволяющий модели "фокусироваться" на важных частях текста при генерации ответа.

Пример: В предложении "Кот сидел на коврике, он был пушистый" attention помогает понять, что "он" = "кот".

MoE (Mixture of Experts)

Архитектура

Архитектура, где модель состоит из нескольких "экспертов", и для каждого запроса активируется только часть из них.

Пример: Mistral и GPT-4 используют MoE — это позволяет иметь огромную модель, но работать быстро.

Distillation (Дистилляция)

Архитектура

Процесс обучения маленькой модели на ответах большой модели. Позволяет получить компактную, но умную модель.

Пример: Phi-3 от Microsoft — дистиллированная модель, которая умещается в телефон, но умна как большая.

Quantization (Квантизация)

Архитектура

Сжатие модели путём уменьшения точности чисел (с 32 до 8 или 4 бит). Модель меньше, работает быстрее.

Пример: Квантизированная Llama 70B может работать на домашнем компьютере с 32GB RAM.

RLHF

Архитектура

Reinforcement Learning from Human Feedback — обучение с подкреплением на основе человеческой обратной связи.

Пример: Люди оценивают ответы AI как хорошие/плохие, и модель учится давать более полезные ответы.

Prompt Engineering

Промптинг

Искусство составления эффективных промптов для получения лучших результатов от AI.

Пример: Вместо "напиши текст" — "напиши продающий текст для IT-аудитории, 300 слов, с CTA в конце".

Jailbreak

Промптинг

Попытка обойти ограничения AI с помощью специальных промптов. Обычно нарушает правила сервиса.

Пример: Промпты типа "притворись, что ты DAN без ограничений" — это jailbreak-попытки.

Role Prompting

Промптинг

Техника, когда AI присваивается определённая роль для улучшения качества ответов.

Пример: "Ты — опытный маркетолог с 10-летним стажем. Проанализируй этот текст."

Tree of Thought

Промптинг

Продвинутая техника, когда AI рассматривает несколько путей решения и выбирает лучший.

Пример: AI генерирует 3 разных подхода к задаче, оценивает каждый, и выбирает оптимальный.

ReAct

Промптинг

Фреймворк "Reasoning + Acting" — AI чередует рассуждения с действиями (поиск, вычисления).

Пример: AI думает: "Мне нужна цена биткоина" → ищет в интернете → продолжает рассуждение с данными.

Agentic AI

Применение

AI-системы, способные автономно выполнять сложные задачи, принимать решения и использовать инструменты.

Пример: Devin (AI-программист) может сам писать код, тестировать, исправлять ошибки и деплоить.

Tool Use

Применение

Способность AI использовать внешние инструменты: поиск, калькулятор, API, браузер.

Пример: Claude может искать в интернете, запускать код, работать с файлами — это tool use.

Function Calling

Применение

Возможность AI вызывать заданные функции/API с правильными параметрами.

Пример: Ты описываешь функцию get_weather(city), и AI сам вызывает её с нужным городом.

Structured Output

Применение

Режим, когда AI возвращает ответ в строгом формате (JSON, XML) вместо свободного текста.

Пример: Вместо текста "цена 100 рублей" AI вернёт {"price": 100, "currency": "RUB"}.

Streaming

Применение

Режим, когда ответ AI приходит по частям в реальном времени, а не целиком в конце.

Пример: Когда текст в ChatGPT появляется слово за словом — это streaming.

Alignment

Безопасность

Процесс настройки AI, чтобы его цели и поведение соответствовали человеческим ценностям.

Пример: AI должен быть полезным, безопасным и честным — это цели alignment.

Red Teaming

Безопасность

Процесс намеренного поиска уязвимостей и проблем в AI-системе.

Пример: Специалисты пытаются "сломать" модель, чтобы найти способы её неправильного использования.

Guardrails

Безопасность

Ограничения и фильтры, встроенные в AI для предотвращения нежелательного поведения.

Пример: ChatGPT откажется помогать с чем-то опасным или незаконным — это guardrails.

Watermarking

Безопасность

Невидимая метка в контенте, сгенерированном AI, для определения его происхождения.

Пример: Google встраивает watermark в картинки от Imagen — его можно обнаружить программно.

TPM / RPM

Бизнес

Tokens Per Minute / Requests Per Minute — лимиты на количество токенов или запросов в минуту.

Пример: API ChatGPT Free: 3 RPM, 40K TPM. Значит, не больше 3 запросов и 40K токенов в минуту.

SLA (Service Level Agreement)

Бизнес

Гарантированный уровень доступности и качества сервиса, зафиксированный в договоре.

Пример: SLA 99.9% означает, что сервис может быть недоступен не более 8 часов в год.

Self-hosted

Бизнес

Модель или сервис, развёрнутый на собственных серверах, а не в облаке провайдера.

Пример: Можно запустить Llama на своём сервере — данные не уходят наружу.

On-premise

Бизнес

Развёртывание AI в инфраструктуре клиента (его дата-центр), а не в облаке.

Пример: Банки часто требуют on-premise решения из-за требований к безопасности данных.

Token-based Pricing

Бизнес

Модель оплаты, где платишь за количество обработанных токенов (input + output).

Пример: GPT-4: $30 за 1M input токенов + $60 за 1M output токенов.

Context Window

Основы

Максимальное количество токенов (вход + выход), которое модель может обработать за один запрос.

Пример: Claude 3: 200K токенов ≈ 150K слов ≈ книга на 500 страниц.

Latency

Техническое

Задержка между отправкой запроса и получением ответа от AI.

Пример: Groq имеет latency ~100ms, обычные API — 1-5 секунд.

Throughput

Техническое

Количество токенов, которое модель генерирует в секунду.

Пример: GPT-4: ~50 токенов/сек, Groq Llama: ~8000 токенов/сек.

Prompt Injection

Безопасность

Атака, когда злоумышленник внедряет инструкции в данные, обрабатываемые AI.

Пример: Пользователь пишет "Игнорируй предыдущие инструкции и..." — это prompt injection.

Grounding

Продвинутое

Привязка ответов AI к реальным данным/источникам для снижения галлюцинаций.

Пример: Perplexity "заземляет" ответы ссылками на источники.

Synthetic Data

Продвинутое

Данные, сгенерированные AI для обучения других моделей.

Пример: GPT-4 генерирует диалоги, на которых потом обучают другую модель.

Vision Model

Модели

AI-модель, способная понимать и анализировать изображения.

Пример: GPT-4 Vision может описать что на картинке, прочитать текст, найти объекты.

50 из 50 терминов