Складчина: [Stepik] AI Agents PRO: LangGraph, AutoGen и LLMOps в продакшне (Алексей Малышкин)
Ссылка на картинку
Научитесь создавать надёжных AI-агентов с LangGraph, AutoGen и LLMOps. Практика построения агентов для поддержки, продаж и автоматизации данных: от RAG и инструментов до метрик качества, бюджета и продакшн-деплоя. Курс для тех, кто хочет выводить ИИ-проекты за пределы демо.
Чему вы научитесь
Проектировать архитектуру AI-агентов на основе LangGraph и AutoGen: роли, состояния, инструменты, переходы
Строить графы задач (DAG/FSM) с ветвлением, параллелизмом, отменой и компенсационными шагами
Проектировать рабочую память агента: short-term/long-term, entity/summary memory, TTL и эвикцию
Делать checkpointing состояния и корректное восстановление после падений
Интегрировать инструменты: HTTP-клиенты, БД (Postgres/Redis), файловые хранилища, почта, внешние API
Подключать браузерную автоматизацию (Playwright) и управлять побочными эффектами инструментов
Создавать безопасные инструменты со скоупами, валидацией входов/выходов и песочницей
Реализовывать RAG-ядро: индексация, чанкинг, hybrid BM25+dense, выбор top-k, перезапросы
Подключать Qdrant/Weaviate/FAISS, настраивать rerankers и компрессию контекста
Управлять контекстным окном: selective retrieval, цитирование источников, предотвращение галлюцинаций
Проектировать планирование действий (tool-use planning) и циклы self-critique/reflection
Маршрутизировать запросы между моделями по задаче, бюджету, latency и политике данных
Настраивать бюджет-каппинг: лимиты токенов/запросов/стоимости на пользователя и на пайплайн
Обеспечивать надежность: таймауты, ретраи с backoff, идемпотентность, саги и dead-letter очереди
Определять SLI/SLO для агентов: p50/p95 латентность, доля успешных задач, стоимость операции
Вести структурированное логирование, трассировку и корреляцию событий (correlation IDs)
Оценивать качество: golden-сеты, LLM-judge, ручная разметка; считать pass@k сценариев
Строить наблюдаемость (Langfuse/Prometheus/Grafana) и алертинг на деградации/перерасход
Проводить A/B-тесты ролей, промптов, памяти и Retrieval-стратегий; анализировать uplift и критерии остановки
Версионировать промпты и пайплайны: семантические версии, changelog, rollback-стратегии
Проектировать строгий структурированный вывод (JSON/DSL), парсинг и валидацию (Pydantic)
Строить guardrails: грамматики/регексы/политики, фильтрация опасных действий
Начальные требования
Уверенно владеть Python 3 (уметь писать функции, классы, работать с пакетами).
Знать основы работы с REST API и базами данных.
Базовое понимание LLM.
Опыт работы с Docker или любыми контейнерами будет плюсом, но не обязателен — всё объясняется в курсе.