• Форумы
  • Складчикам курсы
  • Программирование

[Stepik] Разработка LLM с нуля (Вячеслав Колосков)

Найти складчину
  • Дата начала 04.10.2025
Организатор: Олег КО
Ссылки для скачивания
Скачать
Скачать
Скачать
Олег КО
Организатор
Сообщения
Монеты
0.0
Оплачено
0
Купоны
0
Кешбэк
0
Баллы
0
04.10.2025
  • @Skladchiki
  • #1

Складчина: [Stepik] Разработка LLM с нуля (Вячеслав Колосков)

Ссылка на картинку
Разработка LLM с нуля

Этот практический курс погрузит студентов в создание современных языковых моделей (LLM) на примере GPT-архитектуры. Участники с нуля реализуют все основные компоненты Трансформера: от токенизации (BPE) до механизмов Внимания и генерации текста. Для разработки будем использовать только Python и низкоуровневый PyTorch, не полагаясь на какие-либо сторонние библиотеки.

Чему вы научитесь:
  • Научитесь читать схемы архитектур основанных на Трансформерах.
  • Изучите принципы проектирования современных LLM.
  • Понимать алгоритм токенизации текста.
  • Реализовывать ключевые компоненты GPT.
  • Управлять креативностью модели.
  • Собирать и подготавливать данные для обучения.
  • Настраивать Pre-train цикл обучения LLM.
Для кого этот курс:

Курс предназначен для разработчиков, инженеров машинного обучения и исследователей, желающих глубоко разобраться в архитектуре современных языковых моделей (LLM).

Начальные требования:

Базовые знания Python, минимальный ООП (классы, функции).
Понимание основ машинного обучения (train/test, таргет, фичи, градиент, функции потерь, метрики и т.д.).
Базовые знания по PyTorch: линейные слои, активации, нормализация, дропаут, обратное распространение ошибки.
Желателен опыт реализации простой полносвязнной сети для задачи много-классовой классификации.

Преподаватель Вячеслав Колосков:

Machine Learning Engineer (в телекоме)
В IT работаю более 15 лет. Последние 5 лет работаю Machine Learning Engineer (в телекоме). Много занимался большими табличками (Spark, Hadoop и пр.). В последнее время в основном работаю с NLP и в частности разрабатываю RAG-систему на работе.

Программа курса:

Введение
  • Инструкция
  • Что такое LLM?
  • Архитектура LLM
Токены и эмбединги
  • Byte-Pair Encoding
  • Эмбединги
Transformer
  • «‎Внимание»‎
  • Feed-Forward Network
  • Decoder
LLM
  • Собираем GPT
  • Сэмплирование
Обучение
  • Датасет
  • Train/Eval
  • Применение
Другие модели
  • GPT-2
  • LLama
  • Mistral
  • Mixtral
  • Gemma
Показать больше
 
Зарегистрируйтесь , чтобы посмотреть авторский контент.
Поиск по тегу:
Теги
stepik вячеслав колосков разработка llm с нуля
Похожие темы
Скачать [Stepik] LangChain: c нуля до продакшн LLM-приложений (Алексей Малышкин)
  • 02.10.2025
Просмотры
145
02.10.2025
Скачать [Stepik] Fullstack разработка (Антон Ларичев)
  • 11.04.2024
Просмотры
439
11.04.2024
Скачать [Stepik] Разработка веб-приложений на Go (GoLang) (Илья Шаляпин)
  • 11.05.2024
Просмотры
936
11.05.2024
Скачать [Stepik] Linux с нуля: пошаговый и понятный курс (Сергей Спирёв)
  • 22.09.2025
Просмотры
136
22.09.2025
Скачать [Stepik] Фулстек-разработка веб-сервиса на TypeScript, Reaсt, Node.js (Сергей Дмитриев)
  • 17.09.2024
Просмотры
238
17.09.2024
Показать больше похожих складчин

Зарегистрируйтесь или войдите, чтобы обсуждать и скачивать материалы!

Зарегистрироваться

Создайте учетную запись. Это быстро!

Регистрация

Авторизоваться

Вы уже зарегистрированы? Войдите.

Вход
  • Форумы
  • Складчикам курсы
  • Программирование
  • Русский (RU)
  • Условия и правила
  • Политика конфиденциальности
  • Помощь
Меню
Вход

Регистрация

  • Форумы
    • Новые сообщения
    • Поиск сообщений
  • Что нового?
    • Новые сообщения
    • Новые сообщения профилей
    • Последняя активность
    • Новые оценки тем
  • Помощь