Расписание

Блок 1. Текст-майнинг

1. Введение в DH. Препроцессинг. Регулярные выражения

Дата: 04.04.2026 в 11:10

Первая пара — организационная часть: структура курса, система оценивания; лекционная часть: Digital Humanities, как, что и почему?, основные понятия, история возникновения.

Вторая пара — практика: токенизация, лемматизация, подсчёт частотности слов. Повторение базового Pandas на текстовом материале.

Материалы: тетрадка | данные

Домашнее задание: тетрадка | справочник по re | форма для сдачи

2. Количественный анализ текста. Культуромика на capta-данных

Дата: 11.04.2026 в 11:10

Первая пара — разбор статьи А.А. Бонч-Осмоловской «Культуромика в Национальном корпусе русского языка, к постановке задачи: Три века русских дорог»

Вторая пара — работа с корпусом Посланий Федеральному собранию, закрепление работы с pandas. TF-IDF.

Материалы: статья | тетрадка

3. API на примере НКРЯ. Культуромика на medium-данных

Дата: 18.04.2026 в 11:10

Первая пара и вторая пара — изучение JSON структур, работа с API НКРЯ: Портрет слова, статистики, конкордансы.

Материалы: тетрадка

Домашнее задание: задание и форма для сдачи

4. Стилеметрия

Дата: 25.04.2026 в 11:10

!!! ВНИМАНИЕ !!! в этот день аудитория 504

Первая пара — разбор статьи О.В. Алиевой «Pseudoplatonica: блеск и нищета стилометрии»; лабораторная работа по TF-IDF.

Вторая пара — знакомство с дельтой Бёрроуза, считаем статистическое расстояние на текстах Дж. Роулинг; разъяснение формата ридинг-семинара, распределение статей по группам.

Лабораторная работа: тетрадка | форма для сдачи

Материалы: тетрадка | распределение статей в гугл-доке

Майские праздники! shake Источник: Светлана Нагаева

5. Ридинг-семинар

Дата: 16.05.2026 в 11:10

Групповые презентации исследований и обсуждение. Подробности — на странице Ридинг-семинар.

Следующий раздел находится на стадии подготовки. Вы можете обращаться с пожеланиями, какие темы вам было бы интереснее разобрать на семинарах.

Блок 2. Деревья, сети, карты

6. Сетевой анализ

Дата: 23.05.2026 в 11:10

Первая пара — Сетевой анализ

Вторая пара

Материалы: статья | тетрадка | данные

7. Работа с геоданными

Дата: 30.05.2026 в 11:10

Вторая пара — Работа с геоданными

Материалы: статья | тетрадка | данные

8. OCR и работа с визуальными источниками

Дата: 06.06.2026 в 11:10

Первая пара — Компьютер вижн

Вторая пара

Материалы: статья | тетрадка | данные

Экзамен

Защита финальных мини-проектов. Подробности — на странице Проект.