Продвинутые запросы

Когда вы начинаете использовать ИИ всерьёз, вы пишете одни и те же типы промптов снова и снова. Практическая система для создания, организации и распространения библиотеки промптов — что фиксировать, как версионировать и какую инфраструктуру использовать.

Многоразовые библиотеки промптов: от сниппетов к общим шаблонам

Превратить отдельные промпты в общие версионируемые шаблоны с владельцами, примерами и проверками качества.

10 мин чтения

Reasoning-модели — это не быстрые модели с лишними шагами. Они вознаграждают другое промптование, игнорируют часть привычных паттернов и имеют свои подвохи. Практическое руководство по работе с ними.

Prompt engineering для reasoning-моделей (o3, R1, Claude extended thinking)

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

12 мин чтения

Контекстные окна на 1M токенов существуют, но качество просаживается задолго до этого предела. Context engineering — дисциплина эффективного использования контекстного окна: что включать, что суммировать, что подгружать на лету и какие паттерны держат качество, пока контекст растёт.

Context engineering: как обращаться с окнами на 1M токенов и не словить context rot

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

Еще по этой теме

12 мин чтения

Промптинг, RAG и файнтюнинг — три главных рычага адаптации LLM под вашу задачу. Каждый правилен для одних задач и неправилен для других. Фреймворк выбора, реалистичные затраты на каждый и продакшен-паттерны, где их сочетание блистает.

Выбор между промптингом, RAG и файнтюнингом (и когда их сочетать)

Использовать статью как контекст для решений о внедрении, риске, управлении или инвестициях.

12 мин чтения

Продакшен-промпты — это не «скажите ИИ, чего вы хотите». Это многослойная система: стабильные инструкции, динамический контекст, переменные конкретного вызова — управляемая как код. Архитектура, паттерны и дисциплина, отделяющие продакшен от прототипа.

Проектирование промптов для продакшена: системный, разработческий и пользовательский слои

Разделять системные, разработческие и пользовательские инструкции и тестировать продакшен-промпты как версионируемые компоненты системы.

13 мин чтения

Структурированные выходы и function calling — это мост от «LLM, которая генерирует текст» к «системе, которая делает работу». В продакшене важны паттерны вокруг схем, обработки ошибок, идемпотентности и аккуратной деградации — а не просто JSON mode.

Структурированные выходы и function calling: продакшен-паттерны

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

10 мин чтения

Три техники рассуждений, которые действительно улучшают результаты AI на сложных задачах, — и арифметика их издержек и выгод. С конкретными промптами, сравнениями бок-о-бок и подвохами, которые приносят современные reasoning-модели.

Chain-of-thought, self-critique, tree-of-thoughts — когда что использовать

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

7 мин чтения

За какой моделью тянуться, в зависимости от типа задачи. GPT, Claude, Gemini, reasoning-модели и open-weights варианты — отсортированы по тому, в чём они на самом деле сильны, с простыми правилами выбора.

Выбираем правильную модель под задачу: шпаргалка по решениям на 2026 год

Превратить рабочий процесс в небольшой практический эксперимент с понятной проверкой качества.

Начинающий

22 мин

LangChain. Фреймворк Лэнса Мартина — write, select, compress, isolate — с конкретными примерами того, когда нужно суммировать историю действий, когда выгружать состояние в файлы, а когда запускать суб-агентов исключительно ради защиты контекста родителя. Ложится почти напрямую на раздел статьи про управление окнами в 1M токенов на практике.

Context Engineering for Agents

8 мин

Chroma. Келли Хонг проходит по исследованию Chroma на 18 моделях — почему оценки needle-in-haystack обманчивы, как качество деградирует при неоднозначности и отвлекающих факторах, почему даже простые задачи на повторение строк деградируют после 500 токенов. Кратко, доказательно и ровно та позиция, к которой статья хочет, чтобы вы отнеслись всерьёз, прежде чем переходить к инженерным ходам.

Context Rot: How Increasing Input Tokens Impacts LLM Performance

9 мин

IBM Technology. Более плотный фокус на тех двух техниках, которые команды чаще всего путают. Глубже идёт по свежести данных, атрибуции источников и аргументу скорости на инференсе в пользу fine-tuning. Стоит посмотреть, если вы конкретно пытаетесь аргументировать против ненужного fine-tune проекта.

RAG vs. Fine Tuning

13 мин

IBM Technology. Ясный проход по всем трём техникам на доске с их соответствующими затратами — латентность retrieval, training compute и catastrophic forgetting, ограничения решений только на промптах — и комбинациями, которые реально имеют смысл в продакшене. Заключительный пример с юридической ИИ-системой, использующей все три, — это почти точно аргумент статьи про «когда сочетать».

RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models

25 мин

Anthropic. Живая сессия сборки промпта для страховых заявок от команды Applied AI в Anthropic — они начинают с расплывчатой инструкции и итерируют до чего-то, что разработчик реально стал бы выкатывать в продакшен, демонстрируя ровно те правки, которые описывает статья для слоёв system и developer. Посмотрите перед перечитыванием чек-листа статьи про примеры, структуру вывода и обработку отказов.

Prompting 101 | Code w/ Claude

77 мин

Anthropic. Четыре prompt-инженера Anthropic (research, alignment, applied, developer relations) подробно говорят о том, что они реально делают изо дня в день: как редактируют промпты под давлением, как думают о «честности» в инструкциях, когда помогают XML-каркасы, а когда нет. Слоистая модель статьи чисто ложится на то, как они описывают работу; это лучший способ услышать эту ментальную модель вслух.

AI prompt engineering: A deep dive

41 мин

OpenAI. Проходится по `strict: true`, отличиям от старого JSON-режима, обработке отказов и тому, как компонуются function calling и схемы response-format. Полезно ровно тем, что описывает контракт, который вам даёт API, — а именно на нём построены продакшен-паттерны статьи.

OpenAI DevDay 2024 | Structured outputs for reliable applications

18 мин

AI Engineer. Выступление, кристаллизовавшее современный паттерн «опиши модель Pydantic, отдай её LLM, пусть валидация делает остальное», с конкретными примерами вложенных объектов, валидаторов, ловящих галлюцинированные URL, и Chain-of-Thought как типизированного поля. Посмотрите перед перечитыванием раздела статьи про валидаторы — и узнаете, откуда взялись её правила ретраев и отказов.

Pydantic is all you need: Jason Liu

3 мин

OpenAI. Три минуты с командой o1, которая описывает момент, когда модель начала ставить под сомнение собственные рассуждения во время RL-обучения. Полезно как первоисточник к утверждению статьи, что chain-of-thought теперь происходит внутри модели, а не в вашем промпте.

Building OpenAI o1

28 мин

AI Explained. Самое ясное объяснение без хайпа того, почему o1 (и по аналогии o3, R1, Claude extended thinking) обучен на корректность, а не на предсказание следующего токена, и что это значит для того, как с ним разговаривать. Посмотрите это, и совет статьи «перестаньте говорить think step by step, начните писать спецификацию» перестанет казаться произвольным.

o1 - What is Going On? Why o1 is a 3rd Paradigm of Model + 10 Things You Might Not Know

29 мин

Yannic Kilcher. Янник проходится по оригинальной статье Tree-of-Thoughts из Princeton/DeepMind — циклу generate-score-prune-backtrack, почему он поднимает точность на Game of 24 с 4% до 74% и где техника перестаёт быть оправданной при её 10-кратной стоимости в токенах. Полезно ровно тем, что заставляет увидеть ToT как алгоритм поиска, а не как магический префикс к промпту.

Tree of Thoughts: Deliberate Problem Solving with Large Language Models (Full Paper Review)

25 мин

Anthropic. Два человека из команды Applied AI в Anthropic вживую собирают реальный промпт, послойно добавляя роль, структурированные секции и явные шаги размышления. Это самая авторитетная демонстрация на YouTube «как использовать chain-of-thought, не превращая его в ритуал», и она делает тезис статьи «перестаньте вставлять во всё “Let's think step by step”» конкретным.

Prompting 101

10 мин

Lawton Learns. Конкретный, готовый к копированию C.R.A.F.T. мета-промпт (Context, Role, Action, Format, Target audience), о котором статья говорит по духу. Полезно как первая запись в новой библиотеке — промпт, чья задача — генерировать хорошо структурированные промпты для всех остальных.

The best ChatGPT Prompt I've ever created - I spent 2 months curating this prompt to write prompts

20 мин

Tina Huang. Тина сжимает полный курс Google по промптингу до двух вещей, которые библиотека на самом деле и хранит: фреймворк из пяти частей task/context/references/evaluate/iterate и четыре именованных хода итерации для дальнейшего ужатия промпта. Она также проходится по агентским паттернам и chain-of-thought, так что то же видео работает и как точка входа в более продвинутые шаблоны, которые вы позже добавите в библиотеку.

Google's 9 Hour AI Prompt Engineering Course In 20 Minutes