Складчина: [Stepik] Vector DB & RAG Developer (Алексей Малышкин)
Ссылка на картинку
Vector DB & RAG Developer
Практический курс по векторным базам данных и семантическому поиску. Вы развернёте Qdrant, Weaviate и FAISS, научитесь индексировать миллионы эмбеддингов, строить k-NN-поиск с фильтрами, объединять его с BM-25 и создавать RAG-ботов, которые отвечают на вопросы на основе ваших данных.
Чему вы научитесь:
Пояснять, как работают эмбеддинги и к-NN-поиск
Разворачивать Qdrant, Weaviate и FAISS локально и в Docker
Загружать и хранить миллионы векторов, не теряя производительность
Настраивать фильтрацию и гибридный поиск (BM25 + ANN)
Реализовывать мультимодальный поиск (текст, изображение) с CLIP
Строить RAG-чат-ботов, дополняющих LLM свежими фактами из базы
Метриками Recall@K и nDCG измерять качество выдачи
Автоматизировать CI/CD пайплайн для поиска с GitHub Actions
Оптимизировать индексы под CPU и GPU, выбирая HNSW, IVF или PQ
Оценивать, когда выбрать облако (Pinecone, Qdrant Cloud) vs on-prem
О курсе:
Vector DB & RAG Developer — практический маршрут от «что такое эмбеддинги?» до production-чат-бота, отвечающего на вопросы из вашей корпоративной базы знаний.
За несколько недель вы:
развернёте Qdrant, Weaviate и FAISS локально и в Docker/Cloud;
создадите коллекции на миллионы векторов, подберёте правильный индекс (HNSW, IVF-PQ, ScaNN);
настроите гибридный поиск (BM25 + ANN) и мультимодальный поиск с CLIP;
подключите базу к LLM (OpenAI/GPT-4o, Mistral, Llama) и реализуете RAG-архитектуру;
измерите качество выдачи (Recall@K, nDCG) и построите автоматические тесты;