Уровень обучения

Эксперт

Глубина для рабочих систем. Проектирование, оценки качества и архитектурные решения.

Все видео
48 результатов
7 мин

Лучший RAG и AI-агенты с Docling

IBM Technology. Объясняет сторону загрузки данных в RAG и агентах: как подготовить PDF и другие файлы, чтобы структура документа, таблицы и макет сохранились для поиска. Это поддерживает предупреждение статьи: качество и безопасность RAG начинаются до embeddings, особенно для сложных бизнес-документов.

Понять, почему парсинг документов, сохранение структуры и quality gates на этапе загрузки важны до построения RAG поверх PDF и смешанных форматов файлов.

ЭкспертБезопасность ИИ и приватность данных
59 мин

От хайпа к привычке: как технологические компании масштабируют ИИ дальше экспериментов

Propeller Consulting. Обсуждает управление, операционную дисциплину, внедрение среди сотрудников и измерение ROI как связанные части масштабирования ИИ за пределы экспериментов. Это подходит модели зрелости из статьи, потому что внедрение рассматривается как изменённая работа с владельцами и метриками, а не как использование инструментов или посещение workshop.

Связать зрелость внедрения ИИ с измерениями на уровне рабочих процессов, управлением, операционным здоровьем и устойчивым изменением поведения.

ЭкспертИИ для бизнеса
41 мин

Private AI против cloud: как лидерам принимать более умные build-or-buy решения

World Wide Technology. Связывает решения build-or-buy с бизнес-результатами, размещением нагрузок, экономикой облака, суверенитетом данных, безопасностью, готовностью инфраструктуры и гибридными операционными моделями. Это полезно для выбора между покупкой инструмента, расширением платформы, тонким собственным слоем или большим владением стеком развёртывания.

Принимать AI build-vs-buy решения вокруг результата, контроля данных, экономики нагрузки, готовности инфраструктуры и операционного владения.

ЭкспертИИ для бизнеса
20 мин

Права и access control для RAG: глубокий tutorial

Paragon. Проходит через проблему разрешений в production RAG и сравнивает вызовы инструментов, пространства имён, ACL-таблицы и разрешения на основе отношений. Это напрямую поддерживает главное правило статьи: поиск должен возвращать только источники, доступные текущему пользователю.

Оценить практические паттерны контроля доступа для RAG по знаниям компании перед индексацией чувствительных внутренних документов.

ЭкспертБезопасность ИИ и приватность данных
48 мин

Как строить надёжных AI-агентов: контекст и evals

Arize AI. Объясняет, почему агенты в продакшене ломаются без правильного контекста, данных для оценки, трассировки и доменной экспертизы. Это хорошо ложится на реестр отказов из статьи: отделяйте поиск от рассуждения, определяйте ожидаемые результаты, оценивайте вызовы инструментов и трассируйте ошибки до смены модели.

Проектировать рабочие процессы с ИИ вокруг контекста, оценок качества и наблюдаемости, чтобы сбои в продакшене можно было назвать, измерить и исправить.

ЭкспертБезопасность ИИ и приватность данных
35 мин

Генерация кода с ИИ: успехи, провалы и будущее

IBM Technology. Обсуждает неровное качество разработки с ИИ, владение архитектурой, оркестрацию агентов, ограничения контекста, открытые и закрытые инструменты, а также то, почему модель может решить сложную задачу, но провалить обычную инженерную деталь.

Построить реалистичную ментальную модель того, когда кодовые агенты с контекстом репозитория помогают и где всё ещё нужен контроль senior-инженера.

ЭкспертИИ для бизнеса
37 мин

Возможности VMware Private AI Foundation и обновление от Broadcom

Tech Field Day. Показывает приватный ИИ как многослойную инфраструктуру: контролируемые вычисления, изолированные среды, Kubernetes, контейнеры для инференса, управление моделями, самообслуживание, совместное использование GPU и мониторинг. Это напрямую соответствует предупреждению статьи: приватность зависит от границ, логов, доступа и операций, а не от слова «локально».

Оценивать приватный ИИ как решение об инфраструктуре и управлении, а не автоматически выбирать SaaS или самостоятельное размещение.

ЭкспертПриватный и локальный ИИ
6 мин

AI-голосовые агенты: как они работают и почему звучат так по-человечески

CX Foundation. Разбирает голосового агента как практический конвейер: распознавание речи, языковая модель, API бизнес-систем, синтез речи и обработка перебиваний. Это даёт техническую основу для рамки внедрения из статьи перед выбором Twilio, Retell, Vapi, LiveKit или другой платформы.

Узнать базовую архитектуру голосового агента и точки отказа, которые влияют на доверие клиента в реальных звонках.

ЭкспертАвтоматизация
33 мин

Руководство AI-инженера: как пережить Закон ЕС об ИИ

GOTO Conferences. Связывает Закон ЕС об ИИ с качеством данных, MLOps, документацией и мониторингом после внедрения. Это хорошо поддерживает базовую SME-модель из статьи: работа начинается с понимания системы, данных, владельца, цели и контролей, а не с покупки compliance-платформы.

Понять, почему готовность к AI Act зависит от инвентаризации AI-систем, управления данными, инженерных контролей и понятного владельца.

ЭкспертБезопасность ИИ и приватность данных
42 мин

Vertical AI Agents Could Be 10X Bigger Than SaaS

Y Combinator. Ведущие Lightcone прорабатывают, почему вертикальные ИИ-агенты — а не горизонтальные обёртки — это защитимая форма для компаний прикладного слоя, с конкретными примерами и трезвым взглядом на то, какие категории провайдеры моделей съедят. Это и есть та ловушка отсутствия рва, о которой предупреждает статья, выраженная как позитивный плейбук.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертИИ для бизнеса
34 мин

How AI is Reinventing Software Business Models ft. Bret Taylor of Sierra

Sequoia Capital. Брет Тейлор проходит по сдвигу от per-seat SaaS к ценообразованию по результату — за что цепляться (resolution, CSAT, NPS), почему инкумбентам трудно следовать и как вертикальная специализация создаёт ценовую власть. Напрямую отзеркаливает разделы статьи про ценообразование и маржу.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертИИ для бизнеса
32 мин

Fast LLM Serving with vLLM and PagedAttention

Anyscale. Проходит, почему наивный LLM-serving тратит впустую 60–80% памяти GPU, как PagedAttention заимствует пейджинг в стиле OS, чтобы это починить, и почему continuous batching даёт те самые 24× по throughput, на которые опирается арифметика статьи. После этого фраза статьи «вам повезёт попасть в 50% утилизации» перестаёт казаться абстрактной.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертПриватный и локальный ИИ
56 мин

Build Hour: Prompt Caching

OpenAI. Собственный Build Hour OpenAI по prompt caching — порог в 1024 токена, требование стабильности префикса, кеширование аудио с 99% скидкой для realtime, влияние на time-to-first-token на длинных вводах. Полезно, когда вы оцениваете инженерные усилия для надёжного попадания в кеш на ваших продакшен-промптах.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертИИ для бизнеса
19 мин

Is This the End of RAG? Anthropic's NEW Prompt Caching

Prompt Engineering. Проходит prompt caching от Anthropic против context caching от Gemini с конкретными сокращениями латентности и стоимости по сценариям (long-document чат, few-shot, multi-turn). Разбивка надбавки за запись в кеш против скидки за чтение из кеша — ровно то, что предполагает статья, говоря, когда кеширование окупается.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертИИ для бизнеса
17 мин

Defending LLM - Prompt Injection

LiveOverflow. Проходит реальный плейбук эшелонированной защиты — taint-анализ вывода LLM, ограничение ожидаемой формы вывода, изоляция пользователей, few-shot каркасы, fine-tuning, температура 0 для детерминизма, избыточность на критических путях. Совпадает с разделом про защитный стек в статье почти пункт в пункт.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертБезопасность ИИ и приватность данных
13 мин

Attacking LLM - Prompt Injection

LiveOverflow. Рамкует prompt injection как классическую injection-атаку против систем, которые смешивают инструкции и недоверенные данные — с конкретным примером модерации контента, где атакующий подставляет невинного пользователя. Сдвиг ментальности с «целью является модель» на «целью является приложение» — ровно тот ход, с которого начинает статья.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертБезопасность ИИ и приватность данных
8 мин

Anthropic's Claude Computer Use Is A Game Changer | YC Decoded

Y Combinator. Гэрри Тан проходит по тому, что computer use реально меняет для неавтоматизируемого длинного хвоста софта — легаси-приложения, внутренние порталы, всё без API. Рамка здесь — ровно аргумент статьи «браузер — это универсальный интерфейс», но с более бизнесово-реалистичным взглядом на то, где это окупится в первую очередь.

Использовать видео как контекст для решений о внедрении, риске, управлении или инвестициях.

ЭкспертАвтоматизация
5 мин

Claude has taken control of my computer...

Fireship. Самое ясное короткое объяснение на YouTube цикла screenshot–action–screenshot, включая честные режимы отказа (Claude уходит смотреть Йеллоустоун, расход токенов, латентность на шаг). Fireship по дизайну скуп на продакшен-детали — за этим в статью — но он оставляет вас с правильной интуицией того, почему такие системы дороги и хрупки, прежде чем вы поставите одну из них в свой стек.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертАвтоматизация
44 мин

Building Brain-Like Memory for AI | LLM Agent Memory Systems

Adam Lucek. Более длинная реализационная проходка по категориям из когнитивной науки — эпизодическая, семантическая, рабочая, процедурная — встроенным в агента в коде. Стоит посмотреть после концептуального видео LangChain, если хочется более мнённую ментальную модель и рабочий пример, который можно стащить.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертАвтоматизация
7 мин

Memory for agents (conceptual video)

LangChain. Короткий разбор без кода: разделение short-term-vs-long-term, три формы, которые обычно принимает долгосрочная память (инструкции, профиль, список объектов), и компромисс «горячий путь vs. фоновая запись». Раздел про архитектуру памяти в статье предполагает ровно эту таксономию.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертАвтоматизация
22 мин

Context Engineering for Agents

LangChain. Фреймворк Лэнса Мартина — write, select, compress, isolate — с конкретными примерами того, когда нужно суммировать историю действий, когда выгружать состояние в файлы, а когда запускать суб-агентов исключительно ради защиты контекста родителя. Ложится почти напрямую на раздел статьи про управление окнами в 1M токенов на практике.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертЗапросы к ИИ
8 мин

Context Rot: How Increasing Input Tokens Impacts LLM Performance

Chroma. Келли Хонг проходит по исследованию Chroma на 18 моделях — почему оценки needle-in-haystack обманчивы, как качество деградирует при неоднозначности и отвлекающих факторах, почему даже простые задачи на повторение строк деградируют после 500 токенов. Кратко, доказательно и ровно та позиция, к которой статья хочет, чтобы вы отнеслись всерьёз, прежде чем переходить к инженерным ходам.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертЗапросы к ИИ
66 мин

CrewAI Tutorial: Complete Crash Course for Beginners

aiwithbrandon. Та же сборка, но в стиле CrewAI с role-goal-backstory — агенты как члены команды, задачи как deliverables, фреймворк скрывает execution-цикл. Посмотрите сразу после курса по LangGraph; контраст в том, насколько много фреймворк решает за вас, — ровно то, что статья просит вас взвесить.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертАвтоматизация
190 мин

LangGraph Complete Course for Beginners – Complex AI Agents with Python

freeCodeCamp.org. Длинная code-along сборка по графам состояний LangGraph, узлам, рёбрам, условной маршрутизации, чек-поинтам и использованию инструментов. К концу у вас достаточно ощущения от типизированного состояния, модели «каждый переход явный», чтобы сравнения статьи с CrewAI и кодом прямого API перестали быть абстрактными.

Оценить архитектурный подход, возможные сбои и защитные меры до разработки.

ЭкспертАвтоматизация

Показано 24 из 48