Обработка Естественного Языка

новый
Семестр:Осенний
Доступен в: МИСИС
Читается с:2025

Краткое описание

Курс включает 8 лекций и 8 семинаров, каждое занятие длится около 1.5 часов. В рамках курса мы изучим ключевые концепции обработки естественного языка (NLP), начиная с токенизации и векторного представления слов. Затем мы перейдем к изучению архитектуры трансформера и попробуем написать код этой модели с нуля. В завершение, мы рассмотрим современные большие языковые модели (LLM) и подходы к их обучению.

Лекции будут проводиться раз в две недели. В эти же дни будут проходить семинары, на которых будут разбираться технические примеры в Jupyter-ноутбуках по материалу, изученному на лекции. В остальные дни будут организованы консультации, где можно будет задать теоретические вопросы или уточнить детали по домашним заданиям.

Отчетность по курсу

Для успешного завершения курса необходимо выполнить три домашних задания, которые будут включать как практические упражнения, так и теоретические вопросы. Для выполнения заданий достаточно будет использовать такие платформы, как Google Colaboratory или Kaggle.

Финальная шкала оценок будет определена ближе к концу семестра и будет зависеть от общих результатов группы по итогам всех заданий. Задания можно сдавать после дедлайна до конца курса, однако в этом случае оценка за задание будет снижена.

Это еще обсуждается, но возможно, в конце курса будет проведен теоретический экзамен с вопросами по материалам лекций, который также повлияет на итоговую оценку за курс. Точная информация будет предоставлена позже в телеграм-канале курса.

Записи занятий

МИСИС

Материалы занятий

Дата
Название
Материалы (МИСИС)
01-lec
19 сентября
Word Embeddings
01-semWord Embeddings
02-lec
3 октября
Text Classification
02-semText Classification, Pytorch Tutorial
03-lec
24 октября
Language Models
03-semLanguage Models
04-lec
7 ноября
Seq2Seq and Attention
04-semTransformer Architecture
05-lec
21 ноября
Transfer Learning
05-semTransformer (p.2) & PEFT
06-lec
5 декабря
Large Language Models
06-semPre-trained Models and Prompting
07-sem19 декабряRAG & RLHF
08-lec26 декабряFlash Attention