• HSE UX LAB | WLM 2021
  • Preface
    • Благодарности
    • Условные обозначения
  • I R programming
  • 1 Знакомство с R и RStudio
    • 1.1 Что это и откуда?
    • 1.2 Почему R?
      • 1.2.1 А он лучше Питона?
    • 1.3 Установка R и RStudio
      • 1.3.1 А зачем обе штуки ставить?
    • 1.4 Где спросить вопрос или искать ответ?
    • 1.5 Интерфейс R
    • 1.6 Интерфейс RStudio
      • 1.6.1 Console
      • 1.6.2 Code Editor
      • 1.6.3 Environment (Workspace) и History
      • 1.6.4 Plots, Files, Packages, Help, Viewer
    • 1.7 R как калькулятор
      • 1.7.1 Арифметические операции
      • 1.7.2 Функции
      • 1.7.3 Сравнение и логические операции
    • 1.8 Assignment и переменные
    • 1.9 Рабочая директория. Projects
  • 2 Типы данных
    • 2.1 numeric
    • 2.2 logical
    • 2.3 character
    • 2.4 factor
    • 2.5 Coercion [part one]
  • 3 Структуры данных
    • 3.1 Векторы
      • 3.1.1 Coercion [part two]
      • 3.1.2 Генерация числовых последовательностей
      • 3.1.3 Операции с векторами
      • 3.1.4 Recycling
      • 3.1.5 Индексация векторов
      • 3.1.6 NA, NaN, NULL
    • 3.2 Матрицы
      • 3.2.1 Индексация матриц
      • 3.2.2 Операции в матрицами
    • 3.3 Списки
      • 3.3.1 Индексация списков
    • 3.4 Датафреймы
  • 4 Функции
    • 4.1 Открытый исходный код
  • 5 Строки
    • 5.1 Установка дополнительных пакетов
    • 5.2 Создание строк
    • 5.3 Конкатенация строк
    • 5.4 Разделение строк
    • 5.5 Сортировка строк
    • 5.6 Изменение регистра
    • 5.7 Поиск подстроки
    • 5.8 Изменение строк
      • 5.8.1 Выделение подстроки
      • 5.8.2 Замена подстроки
      • 5.8.3 Удаление подстроки
      • 5.8.4 Транслитерация строк
    • 5.9 Регулярные выражения
      • 5.9.1 Метасимволы
      • 5.9.2 Классы знаков
      • 5.9.3 Квантификация
  • 6 Работа с реальными данными
    • 6.1 Рабочая директория
    • 6.2 Импорт данных
      • 6.2.1 Форматы данных
    • 6.3 Исследование данных
    • 6.4 Файл .RData
  • 7 Предобработка данных. Концепция tidy data
    • 7.1 tidyverse
    • 7.2 Импорт данных
    • 7.3 tibble
    • 7.4 Грузим много данных
    • 7.5 Сабсет данных
      • 7.5.1 %>%
      • 7.5.2 select()
      • 7.5.3 rename()
      • 7.5.4 slice()
      • 7.5.5 filter()
    • 7.6 mutate()
    • 7.7 Догрузим остальные данные
      • 7.7.1 Соединение датафреймов I
    • 7.8 Сортировка
      • 7.8.1 sort()
      • 7.8.2 arrange()
      • 7.8.3 distinct()
    • 7.9 Соединение датафреймов II
      • 7.9.1 ..._join()
    • 7.10 Группировка и аггрегация данных
      • 7.10.1 group_by() & ungroup()
      • 7.10.2 summarize()
    • 7.11 Широкий и длинный формат
      • 7.11.1 pivot_longer() & pivot_wider()
  • 8 Визуализация данных
    • 8.1 Философия ggplot2 (A Layered Grammar of Graphics)
      • 8.1.1 Собственно к философии построения графиков
    • 8.2 Данные
    • 8.3 Строим базовый график
      • 8.3.1 Базовый слой
      • 8.3.2 Разметка осей и переменные
      • 8.3.3 Геомы
    • 8.4 Группировка по переменной
    • 8.5 Графики со встроенной статистической обработкой
      • 8.5.1 Статы (stat_)
    • 8.6 Ищем более сложные закономерности
    • 8.7 Настраиваем график
      • 8.7.1 Темы
      • 8.7.2 Кастомизация шкал (scale_)
      • 8.7.3 Последние штрихи
    • 8.8 Больше переменных
      • 8.8.1 Фасетизация
    • 8.9 Сохранение графиков
    • 8.10 Другие геомы
  • II Теория вероятностей и математическая статистика
  • 9 Математический ликбез
    • 9.1 Элементы алгебры логики
      • 9.1.1 Высказывания
      • 9.1.2 Логические операции
      • 9.1.3 Сложные высказвания
      • 9.1.4 Условные высказывания
    • 9.2 Элементы теории множеств
      • 9.2.1 Множество
      • 9.2.2 Операции над множествами
      • 9.2.3 Отображения
    • 9.3 Немного комбинаторики
      • 9.3.1 Перестановки
      • 9.3.2 Размещения
      • 9.3.3 Сочетания
    • 9.4 Элементы математического анализа
      • 9.4.1 Последовательность
      • 9.4.2 Предел последовательности
      • 9.4.3 Функции
      • 9.4.4 Дифференцируемость функции. Производная
      • 9.4.5 Функции нескольких переменных
      • 9.4.6 Частные производные
      • 9.4.7 Интеграл
    • 9.5 Элементы линейной алгебры
      • 9.5.1 Что такое матрица?
      • 9.5.2 Откуда берутся матрицы?
      • 9.5.3 Действия с матрицами
      • 9.5.4 Скалярное произведение векторов
      • 9.5.5 Векторное произведение векторов
      • 9.5.6 Произведение матриц (матричное умножение)
      • 9.5.7 Транспонирование матрицы
      • 9.5.8 Детерминант и обратная матрица
      • 9.5.9 След матрицы
  • 10 Введение в статистику
    • 10.1 Исходные понятия статистики
    • 10.2 Виды статистических данных
    • 10.3 Шкалы
    • 10.4 Задачи статистики
      • 10.4.1 Этапы статистического моделирования
  • 11 Случайный эксперимент
    • 11.1 Ход исследования
    • 11.2 Событие. Пространство элементарных событий.
      • 11.2.1 Игральный кубик
      • 11.2.2 Действия над событиями
    • 11.3 Классическое определение вероятности
    • 11.4 Статистическое определение вероятности
    • 11.5 Кроме кубика
    • 11.6 Вероятности сложных событий
      • 11.6.1 Условная вероятность
      • 11.6.2 Теорема Байеса
  • 12 Вероятность и случайные величины
    • 12.1 Дискретные случайные величины
    • 12.2 Непрерывные случайные величины
    • 12.3 Характеристики распределения случайных величин
    • 12.4 Нормальное распределение
  • 13 Оценивание параметров в практике статистического анализа
    • 13.1 Точечные оценки
      • 13.1.1 Метод моментов
      • 13.1.2 Свойства точечных оценок
    • 13.2 Интервальные оценки
      • 13.2.1 Доверительный интервал
  • 14 Тестирование статистических гипотез
  • III Анализ данных
  • 15 Описательные статистики
    • 15.1 Меры центральной тенденции
      • 15.1.1 Мода
      • 15.1.2 Медиана
      • 15.1.3 Среднее
    • 15.2 Меры разброса
      • 15.2.1 Минимум и максимум
      • 15.2.2 Размах
      • 15.2.3 Дисперсия
      • 15.2.4 Стандартное отклонение
      • 15.2.5 Стандартная ошибка среднего
      • 15.2.6 Квантили
    • 15.3 Асимметрия
    • 15.4 Эксцесс
    • 15.5 Описательные статистики в R
  • 16 Корреляционный анализ
    • 16.1 Ковариация
    • 16.2 Корреляция
      • 16.2.1 Тестирование статистической значимости коэффициента корреляции
      • 16.2.2 Доверительный интервал для коэффициента корреляции
  • 17 Общие линейные модели. Простая линейная регрессия
  • 18 Множественная линейная регрессия
  • 19 Дисперсионный анализ
  • 20 Ковариационный анализ
  • 21 Обобщенные линейные модели. Логистическая регрессия
  • 22 Пуассоновская регрессия
  • 23 Регуляризация регрессии
  • 24 Смешанные линейные модели
  • 25 Кластерный анализ
  • 26 Анализ главных компонент
  • 27 Эксплораторный факторный анализ
  • 28 Конфирматорный факторный анализ
  • 29 Что дальше?
  • Литература
    • Касаемо математики
    • Относительно статистики
    • About R
    • Во славу андана
  • Published with bookdown

HSE UX LAB | Анализ данных + R: мир линейных моделей | Book

Литература

Касаемо математики

  • Lovász, L., Pelikán, J., & Vesztergombi, K. (2003). Discrete Mathematics. Undergraduate Texts in Mathematics
  • Wallis, W. D. (2012). A Beginner’s Guide to Discrete Mathematics
  • Gorodentsev, A. L. (2016). Algebra I
  • Gorodentsev, A. L. (2017). Algebra II
  • Olver, P. J., & Shakiban, C. (2018). Applied Linear Algebra. Undergraduate Texts in Mathematics
  • Ross, K. A. (2013). Elementary Analysis. Undergraduate Texts in Mathematics
  • Laczkovich, M., & Sós, V. T. (2015). Real Analysis. Undergraduate Texts in Mathematics
  • Abbott, S. (2015). Understanding Analysis. Undergraduate Texts in Mathematics

Относительно статистики

About R

Во славу андана