
P8 // Оценивание параметров в практике статистического анализа. Тестирование статистических гипотез
Основные задания
#1
Сегодня мы будем активно заниматься симуляциями. Начнем с трёх матриц.
Сгенерируйте матрицы sim1, sim2 и sim3:
- первые две должны содержать по 1000 выборок из 100 наблюдений из генеральной совокупности, в которой параметр распределен \(\mathcal N (10, 225)\)
- третья должна содержать 1000 выборок из 100 наблюдений из генеральной совокупности, в которой параметр распределен \(\mathcal N (15, 225)\)
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#2
Пользуясь матрицей sim1 визуализируйте центральную предельную теорему.
Центральная предельная теорема утверждает, что распределение выборочных средних с ростом числа выборок стремиться к нормальному распределению.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#3
На лекции мы математически вывели, что среднее арифметическое является несмещенной оценкой математического ожидания генеральной совокупности. Проверьте это на симуляции. Используйте матрицу sim1.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#4
Мы также математически вывели, что оценка дисперсии \(\hat \sigma^2 = \frac{\sum_{i=1}^n (x_i - \bar x)}{n}\) является смещенной, а оценка \(\hat \sigma^2 = s^2 = \frac{\sum_{i=1}^n (x_i - \bar x)}{n-1}\) является несмещенной. Проверьте это на симуляциях. Используйте матрицу sim1.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#5
Ещё на лекции мы говорили о состоятельности оценки. Покажите с помощью симуляций, что среднее арифметической является состоятельной оценкой математического ожидания генеральной совокупности.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#6
Покажите с помощью симуляций, что s^2 является состоятельной оценкой дисперсии генеральной совокупности.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#7
Напишите функцию для вычисления доверительного интервала для среднего. Считайте, что мы работем с выборокой большого объема (порядка 100 наблюдений).
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#8
Постройте визуализацию, выражающую статистически корректную интерпретацию доверительного интервала для среднего. Используйте матрицу sim1.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#9
На лекции мы упомянули, что реальную вероятность того, что математическое ожидание попадает в пределы отдельного доверительного интервала называют capture percantage. Эта вероятность оказывается значительно меньше 0.95 для 95% доверительного интервала.
Постройте визуализацию, показывающую это графически. Используйте матрицу sim1.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#10
Повторите построение визуализаций из двух предыдущих заданий для матрицы sim2. Сравните визуализации.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#11
Поизучаем закономерности p-value. Для этого нам потребуется какой-то статистический тест — возьмем t-тест Стьютенда как наиболее простой и, вероятно, знакомый:
\[ t = \frac{\bar X_1 - \bar X_2}{s_{\bar \Delta}}, \quad s_{\bar \Delta} = \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}} \]
Формула выше справедлива для двухвыборочного t-теста (выборки независимы). Существует также и одновыборочный t-тест:
\[ t = \frac{\bar X - \mu}{s / \sqrt{n}} = \frac{\bar X - \mu}{\text{se}_X} \]
Проведите одновыборочный t-тест на первых выборка sim1 и sim3. Дайте статистическую интерпретацию результатов.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#12
Покажите графически, что t-распределение сходится к стандартному нормальному распределению с ростом объема выборки:
\[ t(n-1) \underset{n \to \infty}{\to} \mathcal N (0,1) \]
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#13
Выясните с помощью симумляций, какова вероятность получить статистически значимые резульаты при заданном уровне значимости, если верна \(H_0\). Рассчитайте эту вероятность для случаев \(\alpha = 0.05\) и \(\alpha = 0.005\). Используйте матрицы sim1 и sim2.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#14
Рассчитайте вероятность получить статистически значимые результаты, если верна \(H_1\), для случаев \(\alpha = 0.05\) и \(\alpha = 0.005\). Используйте матрицы sim1 и sim3.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#15
Визуализируйте распределение p-value при справедливости \(H_0\) и \(H_1\).
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#16
Визуализируйте зависимость распределения p-value от объема выборки.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#17
Визуализируйте зависимость распределения p-value от размера эффекта.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#18
Визуализируйте зависимость распределения размера эффекта от размера выборки.
\[ d = \frac{\bar X_1 - \bar X_2}{s}, \quad s = \sqrt{\frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2}} \]
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#19
Постройте 95% доверительный интервал для среднего методом bootstrap.
Описание формата инпута.
Подсказки
Как делать задание?
Что надо сделать?
Ответ неверный
#20
Постройте 95% доверительный интервал для медианы методом bootstrap.
Описание формата инпута.