В рамках трехнедельного курса рассматриваются подходы к описанию получаемых в исследованиях данных, основные методы и принципы статистического анализа, интерпретация и визуализация получаемых результатов. Слушатели познакомятся с такими методами статистического анализа как дисперсионный, регрессионный и кластерный анализ. Мы научимся сравнивать группы между собой, рассчитывать коэффициенты корреляции и строить регрессионные уравнения.
Основной акцент делается на математических идеях, интуиции и логике, которые обуславливают методы и расчетные формулы. Изученный материал будет применим для решения широкого круга задач, возникающих в рамках исследовательской работы практически любого направления.
Overview
Syllabus
Введение
1.1 Общая информация о курсе
1.2 Генеральная совокупность и выборка
1.3 Типы переменных. Количественные и номинативные переменные
1.4 Меры центральной тенденции
1.5 Меры изменчивости
1.6 Квартили распределения и график box-plot
1.7 Нормальное распределение
1.8 Центральная предельная теорема
1.9 Доверительные интервалы для среднего
1.10 Идея статистического вывода, p-уровень значимости
Сравнение средних
2.1 T-распределение
2.2 Сравнение двух средних; t-критерий Стьюдента
2.3 Проверка распределения на нормальность, QQ-Plot
2.4 Однофакторный дисперсионный анализ
2.5 Множественные сравнения в ANOVA
2.6 Многофакторный ANOVA
Корреляция и регрессия
3.1 Понятие корреляции
3.2 Условия применения коэффициента корреляции
3.3 Регрессия с одной независимой переменной
3.4 Гипотеза о значимости взаимосвязи и коэффициент детерминации
3.5 Условия применения линейной регрессии с одним предиктором
3.6 Применение регрессионного анализа и интерпретация результатов
3.7 Задача предсказания значений зависимой переменной
3.8 Регрессионный анализ с несколькими независимыми переменными
3.9 Выбор наилучшей модели
3.10 Классификация: логистическая регрессия и кластерный анализ
3.11 Заключение
Taught by
Anatoliy Karpov