Обработка Естественного Языка

новый

Семестр:Осенний

Доступен в: МИСИС

Читается с:2025

Краткое описание

Курс включает 8 лекций и 8 семинаров, каждое занятие длится около 1.5 часов. В рамках курса мы изучим ключевые концепции обработки естественного языка (NLP), начиная с токенизации и векторного представления слов. Затем мы перейдем к изучению архитектуры трансформера и попробуем написать код этой модели с нуля. В завершение, мы рассмотрим современные большие языковые модели (LLM) и подходы к их обучению.

Лекции будут проводиться раз в две недели. В эти же дни будут проходить семинары, на которых будут разбираться технические примеры в Jupyter-ноутбуках по материалу, изученному на лекции. В остальные дни будут организованы консультации, где можно будет задать теоретические вопросы или уточнить детали по домашним заданиям.

Отчетность по курсу

Для успешного завершения курса необходимо выполнить три домашних задания, которые будут включать как практические упражнения, так и теоретические вопросы. Для выполнения заданий достаточно будет использовать такие платформы, как Google Colaboratory или Kaggle.

Финальная шкала оценок будет определена ближе к концу семестра и будет зависеть от общих результатов группы по итогам всех заданий. Задания можно сдавать после дедлайна до конца курса, однако в этом случае оценка за задание будет снижена.

Это еще обсуждается, но возможно, в конце курса будет проведен теоретический экзамен с вопросами по материалам лекций, который также повлияет на итоговую оценку за курс. Точная информация будет предоставлена позже в телеграм-канале курса.

Записи занятий

МИСИС
YouTube
VKVideo

Материалы занятий

№	Дата	Название	Материалы (МИСИС)
`01-lec`	19 сентября	Word Embeddings	slides
`01-sem`	19 сентября	Word Embeddings	notebook
`02-lec`	3 октября	Text Classification	slides
`02-sem`	3 октября	Text Classification, Pytorch Tutorial	notebook
`03-lec`	24 октября	Language Models	slides
`03-sem`	24 октября	Language Models	notebook
`04-lec`	7 ноября	Seq2Seq and Attention	slides
`04-sem`	7 ноября	Transformer Architecture	notebook
`05-lec`	21 ноября	Transfer Learning	slides
`05-sem`	21 ноября	Transformer (p.2) & PEFT	notebook
`06-lec`	5 декабря	Large Language Models	slides
`06-sem`	5 декабря	Pre-trained Models and Prompting	notebook
`07-sem`	19 декабря	RAG & RLHF	notebook
`08-lec`	26 декабря	Flash Attention	slides