Словарь AI-терминов
Все термины простым языком с примерами
Промпт (Prompt)
ОсновыТекстовый запрос, который вы отправляете нейросети. Чем точнее промпт, тем лучше результат.
Пример: Плохо: "Напиши текст". Хорошо: "Напиши продающий текст для лендинга фитнес-клуба, 300 слов, с призывом к действию".
Токен (Token)
ОсновыЕдиница измерения текста для AI. Примерно 1 токен = 4 символа на английском или 1-2 символа на русском.
Пример: Слово "привет" = 2-3 токена. За токены платят при использовании API.
Контекст (Context)
ОсновыВся информация, которую AI "помнит" в рамках диалога. Ограничен контекстным окном.
Пример: GPT-5.2 помнит 128K токенов ≈ 100 страниц текста.
Контекстное окно
ОсновыМаксимальный объём текста, который модель может обработать за раз (ваш запрос + её ответ).
Пример: Claude: 200K токенов, Gemini: 2M токенов, GPT-5.2: 128K токенов.
Температура (Temperature)
ПараметрыПараметр "креативности" AI. 0 = строго по фактам, 1 = максимум творчества.
Пример: Для кода используйте 0-0.3, для креатива 0.7-1.0.
LLM (Large Language Model)
МоделиБольшая языковая модель — нейросеть, обученная на огромном количестве текстов.
Пример: GPT-4, Claude, Gemini, LLaMA — это всё LLM.
Fine-tuning
ПродвинутоеДообучение готовой модели на специфических данных для улучшения в конкретной области.
Пример: Можно дообучить GPT на юридических документах для лучшего понимания права.
Галлюцинации (Hallucinations)
ПроблемыКогда AI уверенно выдаёт неправильную или выдуманную информацию.
Пример: AI может придумать несуществующую книгу или неверную дату. Всегда проверяйте факты!
RAG (Retrieval-Augmented Generation)
ПродвинутоеТехнология, когда AI сначала ищет информацию в базе данных, а потом отвечает на её основе.
Пример: Чат-бот поддержки сначала ищет в FAQ, потом формирует ответ.
API (Application Programming Interface)
ТехническоеСпособ подключить AI к своему приложению или автоматизации программно.
Пример: Через API можно встроить ChatGPT в свой сайт или Telegram-бота.
Мультимодальность
МоделиСпособность AI работать с разными типами данных: текст, изображения, аудио, видео.
Пример: GPT-4 понимает картинки, Gemini — ещё и видео с аудио.
System Prompt
ПромптингСкрытая инструкция для AI, которая задаёт его "роль" и правила поведения.
Пример: "Ты — эксперт по маркетингу. Отвечай кратко и с примерами."
Chain of Thought (CoT)
ПромптингТехника, когда просишь AI рассуждать пошагово перед ответом. Улучшает качество.
Пример: Добавьте: "Рассуждай пошагово" или "Think step by step".
Zero-shot / Few-shot
ПромптингZero-shot: запрос без примеров. Few-shot: запрос с несколькими примерами желаемого результата.
Пример: Few-shot: "Пример 1: ... Пример 2: ... Теперь сделай для: ..."
Embedding
ТехническоеЧисловое представление текста, позволяющее AI понимать смысл и сравнивать похожесть.
Пример: Используется для поиска похожих документов или кластеризации текстов.
Inference
ТехническоеПроцесс генерации ответа моделью. За inference платят при использовании API.
Пример: Каждый запрос к ChatGPT — это inference.
Thinking Mode / Extended Thinking
ПараметрыРежим, когда AI "думает" дольше перед ответом, улучшая качество для сложных задач.
Пример: Claude Extended Thinking, GPT-5.2 high mode.
Агент (AI Agent)
ПродвинутоеAI, который может выполнять цепочку действий: искать информацию, запускать код, управлять приложениями.
Пример: AI-агент может сам найти информацию в интернете, проанализировать и написать отчёт.
Transformer
АрхитектураАрхитектура нейросети, на которой основаны все современные LLM. Использует механизм внимания (attention) для обработки текста.
Пример: GPT = Generative Pre-trained Transformer. Буква T — это как раз Transformer.
Attention (Внимание)
АрхитектураМеханизм, позволяющий модели "фокусироваться" на важных частях текста при генерации ответа.
Пример: В предложении "Кот сидел на коврике, он был пушистый" attention помогает понять, что "он" = "кот".
MoE (Mixture of Experts)
АрхитектураАрхитектура, где модель состоит из нескольких "экспертов", и для каждого запроса активируется только часть из них.
Пример: Mistral и GPT-4 используют MoE — это позволяет иметь огромную модель, но работать быстро.
Distillation (Дистилляция)
АрхитектураПроцесс обучения маленькой модели на ответах большой модели. Позволяет получить компактную, но умную модель.
Пример: Phi-3 от Microsoft — дистиллированная модель, которая умещается в телефон, но умна как большая.
Quantization (Квантизация)
АрхитектураСжатие модели путём уменьшения точности чисел (с 32 до 8 или 4 бит). Модель меньше, работает быстрее.
Пример: Квантизированная Llama 70B может работать на домашнем компьютере с 32GB RAM.
RLHF
АрхитектураReinforcement Learning from Human Feedback — обучение с подкреплением на основе человеческой обратной связи.
Пример: Люди оценивают ответы AI как хорошие/плохие, и модель учится давать более полезные ответы.
Prompt Engineering
ПромптингИскусство составления эффективных промптов для получения лучших результатов от AI.
Пример: Вместо "напиши текст" — "напиши продающий текст для IT-аудитории, 300 слов, с CTA в конце".
Jailbreak
ПромптингПопытка обойти ограничения AI с помощью специальных промптов. Обычно нарушает правила сервиса.
Пример: Промпты типа "притворись, что ты DAN без ограничений" — это jailbreak-попытки.
Role Prompting
ПромптингТехника, когда AI присваивается определённая роль для улучшения качества ответов.
Пример: "Ты — опытный маркетолог с 10-летним стажем. Проанализируй этот текст."
Tree of Thought
ПромптингПродвинутая техника, когда AI рассматривает несколько путей решения и выбирает лучший.
Пример: AI генерирует 3 разных подхода к задаче, оценивает каждый, и выбирает оптимальный.
ReAct
ПромптингФреймворк "Reasoning + Acting" — AI чередует рассуждения с действиями (поиск, вычисления).
Пример: AI думает: "Мне нужна цена биткоина" → ищет в интернете → продолжает рассуждение с данными.
Agentic AI
ПрименениеAI-системы, способные автономно выполнять сложные задачи, принимать решения и использовать инструменты.
Пример: Devin (AI-программист) может сам писать код, тестировать, исправлять ошибки и деплоить.
Tool Use
ПрименениеСпособность AI использовать внешние инструменты: поиск, калькулятор, API, браузер.
Пример: Claude может искать в интернете, запускать код, работать с файлами — это tool use.
Function Calling
ПрименениеВозможность AI вызывать заданные функции/API с правильными параметрами.
Пример: Ты описываешь функцию get_weather(city), и AI сам вызывает её с нужным городом.
Structured Output
ПрименениеРежим, когда AI возвращает ответ в строгом формате (JSON, XML) вместо свободного текста.
Пример: Вместо текста "цена 100 рублей" AI вернёт {"price": 100, "currency": "RUB"}.
Streaming
ПрименениеРежим, когда ответ AI приходит по частям в реальном времени, а не целиком в конце.
Пример: Когда текст в ChatGPT появляется слово за словом — это streaming.
Alignment
БезопасностьПроцесс настройки AI, чтобы его цели и поведение соответствовали человеческим ценностям.
Пример: AI должен быть полезным, безопасным и честным — это цели alignment.
Red Teaming
БезопасностьПроцесс намеренного поиска уязвимостей и проблем в AI-системе.
Пример: Специалисты пытаются "сломать" модель, чтобы найти способы её неправильного использования.
Guardrails
БезопасностьОграничения и фильтры, встроенные в AI для предотвращения нежелательного поведения.
Пример: ChatGPT откажется помогать с чем-то опасным или незаконным — это guardrails.
Watermarking
БезопасностьНевидимая метка в контенте, сгенерированном AI, для определения его происхождения.
Пример: Google встраивает watermark в картинки от Imagen — его можно обнаружить программно.
TPM / RPM
БизнесTokens Per Minute / Requests Per Minute — лимиты на количество токенов или запросов в минуту.
Пример: API ChatGPT Free: 3 RPM, 40K TPM. Значит, не больше 3 запросов и 40K токенов в минуту.
SLA (Service Level Agreement)
БизнесГарантированный уровень доступности и качества сервиса, зафиксированный в договоре.
Пример: SLA 99.9% означает, что сервис может быть недоступен не более 8 часов в год.
Self-hosted
БизнесМодель или сервис, развёрнутый на собственных серверах, а не в облаке провайдера.
Пример: Можно запустить Llama на своём сервере — данные не уходят наружу.
On-premise
БизнесРазвёртывание AI в инфраструктуре клиента (его дата-центр), а не в облаке.
Пример: Банки часто требуют on-premise решения из-за требований к безопасности данных.
Token-based Pricing
БизнесМодель оплаты, где платишь за количество обработанных токенов (input + output).
Пример: GPT-4: $30 за 1M input токенов + $60 за 1M output токенов.
Context Window
ОсновыМаксимальное количество токенов (вход + выход), которое модель может обработать за один запрос.
Пример: Claude 3: 200K токенов ≈ 150K слов ≈ книга на 500 страниц.
Latency
ТехническоеЗадержка между отправкой запроса и получением ответа от AI.
Пример: Groq имеет latency ~100ms, обычные API — 1-5 секунд.
Throughput
ТехническоеКоличество токенов, которое модель генерирует в секунду.
Пример: GPT-4: ~50 токенов/сек, Groq Llama: ~8000 токенов/сек.
Prompt Injection
БезопасностьАтака, когда злоумышленник внедряет инструкции в данные, обрабатываемые AI.
Пример: Пользователь пишет "Игнорируй предыдущие инструкции и..." — это prompt injection.
Grounding
ПродвинутоеПривязка ответов AI к реальным данным/источникам для снижения галлюцинаций.
Пример: Perplexity "заземляет" ответы ссылками на источники.
Synthetic Data
ПродвинутоеДанные, сгенерированные AI для обучения других моделей.
Пример: GPT-4 генерирует диалоги, на которых потом обучают другую модель.
Vision Model
МоделиAI-модель, способная понимать и анализировать изображения.
Пример: GPT-4 Vision может описать что на картинке, прочитать текст, найти объекты.