Тема

RAG и системы знаний

Личный RAG, рабочий поиск, разбиение, права доступа, загрузка документов и границы источников.

22 материала (10 статей · 12 видео)

Начните здесь

Несколько хороших первых материалов перед полной лентой.

10 мин чтения
Статья

Соберите личный RAG: чат со своими документами (без кода)

Соберите собственный чат, привязанный к вашим документам, меньше чем за час и без кода. Три no-code-варианта, которые в 2026 году стоит использовать, их компромиссы и паттерны, отличающие полезный RAG от раздражающего.

Собрать ассистента, привязанного к документам, и понимать, когда устаревшие, слабые или внерамочные источники делают ответы небезопасными.

Уверенный
12 мин чтения
Статья

Production RAG: ingestion, embedding, retrieval, reranking, eval

Production-пайплайн RAG — это шесть стадий, у каждой свои паттерны, определяющие качество. Архитектура, выборы на каждой стадии и дисциплина итеративной оценки, которая отличает работающий RAG от разочаровывающего.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

Эксперт
10 мин чтения
Статья

Company knowledge RAG: права доступа, утечки и границы источников

Company knowledge assistant безопасен только тогда, когда retrieval соблюдает права доступа. Как проектировать RAG source boundaries, ACL filtering, document ownership, logging, stale-source handling и refusal behavior.

Спроектировать company knowledge RAG с permission-aware retrieval, ownership источников, leakage controls и безопасным refusal behavior.

Эксперт

Еще по этой теме

7 мин
Видео

Лучший RAG и AI-агенты с Docling

IBM Technology. Объясняет сторону загрузки данных в RAG и агентах: как подготовить PDF и другие файлы, чтобы структура документа, таблицы и макет сохранились для поиска. Это поддерживает предупреждение статьи: качество и безопасность RAG начинаются до embeddings, особенно для сложных бизнес-документов.
Эксперт
20 мин
Видео

Права и access control для RAG: глубокий tutorial

Paragon. Проходит через проблему разрешений в production RAG и сравнивает вызовы инструментов, пространства имён, ACL-таблицы и разрешения на основе отношений. Это напрямую поддерживает главное правило статьи: поиск должен возвращать только источники, доступные текущему пользователю.
Эксперт
11 мин чтения
Статья

Secure document ingestion для RAG: PDF, OCR, metadata и retention

Качество RAG начинается до retrieval. Руководство по secure ingestion для PDF, OCR, metadata, permissions, source freshness, deletion, malware risk и operational ownership.

Спроектировать secure document-ingestion pipeline для RAG с permission metadata, OCR quality checks, source freshness, retention rules, deletion behavior и ingestion tests.

Эксперт
12 мин чтения
Статья

Context engineering: как обращаться с окнами на 1M токенов и не словить context rot

Контекстные окна на 1M токенов существуют, но качество просаживается задолго до этого предела. Context engineering — дисциплина эффективного использования контекстного окна: что включать, что суммировать, что подгружать на лету и какие паттерны держат качество, пока контекст растёт.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

Эксперт
12 мин чтения
Статья

Выбор между промптингом, RAG и файнтюнингом (и когда их сочетать)

Промптинг, RAG и файнтюнинг — три главных рычага адаптации LLM под вашу задачу. Каждый правилен для одних задач и неправилен для других. Фреймворк выбора, реалистичные затраты на каждый и продакшен-паттерны, где их сочетание блистает.

Использовать статью как контекст для решений о внедрении, риске, управлении или инвестициях.

Эксперт
12 мин чтения
Статья

RAG за пределами чанков: graph RAG, agentic RAG, long-context RAG

У классического чанк-ориентированного RAG есть пределы. Graph RAG, agentic RAG и long-context RAG ломают их по-разному. Когда какой подход — правильный инструмент, как они реально работают и какие production-компромиссы имеют значение.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

Эксперт
11 мин чтения
Статья

Чанкинг, переранжирование и гибридный поиск: как заставить RAG реально работать

Большинство RAG-реализаций работают плохо, потому что неправильно делают три вещи. Практический гид по чанкингу документов, переранжированию результатов и сочетанию ключевого поиска с семантическим — без необходимости становиться поисковым инженером.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

Уверенный
11 мин чтения
Статья

AI-агент клиентской поддержки, который закрывает 70% тикетов

Реалистичный дизайн AI-агента поддержки, который закрывает типовые кейсы, эскалирует сложные и не делает ошибок такого рода, что потом всплывают на Hacker News. Архитектура, промпты, ограничители.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

Уверенный
11 мин чтения
Статья

Соберите своего первого ИИ-агента в n8n: рабочий процесс триажа лидов от начала до конца

Полный разбор того, как собрать настоящего ИИ-агента в n8n — такого, что принимает входящих лидов, обогащает их, оценивает и маршрутизирует. Каждый узел, каждый промпт, каждая подводная мель.

Спроектировать агента для триажа лидов с явными инструментами, схемами, правилами маршрутизации, логированием и человеческой проверкой.

Уверенный
9 мин
Видео

RAG vs. Fine Tuning

IBM Technology. Более плотный фокус на тех двух техниках, которые команды чаще всего путают. Глубже идёт по свежести данных, атрибуции источников и аргументу скорости на инференсе в пользу fine-tuning. Стоит посмотреть, если вы конкретно пытаетесь аргументировать против ненужного fine-tune проекта.
Эксперт
13 мин
Видео

RAG vs Fine-Tuning vs Prompt Engineering: Optimizing AI Models

IBM Technology. Ясный проход по всем трём техникам на доске с их соответствующими затратами — латентность retrieval, training compute и catastrophic forgetting, ограничения решений только на промптах — и комбинациями, которые реально имеют смысл в продакшене. Заключительный пример с юридической ИИ-системой, использующей все три, — это почти точно аргумент статьи про «когда сочетать».
Эксперт
16 мин
Видео

Graph RAG: Improving RAG with Knowledge Graphs

Prompt Engineering. Сфокусированный разбор GraphRAG от Microsoft — извлечение сущностей, суммаризация сообществ, query-focused summarization — развёрнутый на локальной машине с заметками по стоимости. Смотрите конкретно под раздел графового RAG в статье; обсуждение стоимости — та часть, которую большинство материалов пропускают.
Эксперт
39 мин
Видео

Introducing RAG 2.0: Agentic RAG + Knowledge Graphs (FREE Template)

Cole Medin. Рабочая сборка agentic-RAG плюс knowledge graph, где агент сам решает, когда делать векторный поиск, когда ходить в Neo4j, а когда и то, и другое. Это самая чистая на YouTube демонстрация паттерна «агент как планировщик retrieval», описанного в статье, в коде, который можно реально скачать и запустить.
Эксперт
17 мин
Видео

RAG Agents in Prod: 10 Lessons We Learned — Douwe Kiela, creator of RAG

AI Engineer. Доуве Кила вёл оригинальную статью про RAG в FAIR, а теперь выкатывает RAG в регулируемые предприятия. Выступление в основном о том, что перестаёт работать в масштабе — стратегии чанкинга, не пережившие 100K документов, «точность — это базовый уровень, реальная проблема — это неточность» и почему атрибуция и наблюдаемость важнее, чем модель эмбеддингов. Хорошая калибровка перед перечитыванием разделов статьи про оценку и мониторинг.
Эксперт
19 мин
Видео

Building Production-Ready RAG Applications: Jerry Liu

AI Engineer. CEO LlamaIndex проходит разрыв между «наивным RAG-демо» и реальным пайплайном — small-to-big retrieval, маршрутизация по подвопросам, гибридный поиск, оценка. Форма его слайдов почти напрямую совпадает с разделами пайплайна в статье; сначала посмотрите, затем перечитайте статью с его диаграммами в голове.
Эксперт
69 мин
Видео

The 5 Levels Of Text Splitting For Retrieval

Greg Kamradt. Статья тратит немало слов на chunking; это самое длинное и терпеливое объяснение того, что на самом деле делает каждая стратегия — от character-recursive через document-aware до семантического и agentic-сплиттинга. Сочетайте с бесплатным инструментом Грега ChunkViz, чтобы построить интуицию, прежде чем начать тюнить.
Уверенный
24 мин
Видео

"I want Llama3 to perform 10x with my private knowledge" - Local Agentic RAG w/ llama3

AI Jason. Покрывает ровно тот стек, за который выступает статья — query translation, гибридный retrieval, reranking и corrective-RAG цикл — в одной запускаемой сборке. Полезно как рабочая ментальная модель того, как выглядит пайплайн chunk → rerank → answer, когда он реально делает свою работу.
Уверенный
11 мин
Видео

How To Use NotebookLM For Beginners In 2024 (NotebookLM Tutorial)

TheAIGRID. Быстрый тур по фичам: загрузка смешанных источников (PDF, транскрипты YouTube, посты блогов), генерация брифинг-документа, фокусировка чата на одном источнике и аудио-обзорный подкаст. Хорошо подойдёт, если хочется быстрая карта возможностей, прежде чем тратить время на более длинное прохождение.
Уверенный
26 мин
Видео

How to Use NotebookLM (Google's AI "Tool for Understanding")

Tiago Forte. Тьяго — автор *Building a Second Brain*, и он относится к NotebookLM ровно так, как описывает статья — как к личному RAG над собственными заметками, PDF и вырезками. Он показывает чат с обоснованием по цитатам, ограничения инструмента и то, как он встаёт рядом с воркфлоу Readwise/Obsidian, что и есть естественная конечная точка для большинства читателей статьи.
Уверенный