P7 // Случайный эксперимент. Случайные величины

Основные задания

#1

Какова вероятность, что при броске трехгранного игрального кубика:

  1. выпадет число от 1 до 3?
  2. выпадет 1?
  3. выпадет 3?
  4. выпадет 4?

Описание формата инпута.

#2

Какова вероятность, что при броске четырехгранного игрального кубика выпадет:

  1. выпадет 1?
  2. выпадет 1 или 2?
  3. выпадет 1, 2 или 3?
  4. выпадет 2 или 4?

Описание формата инпута.

#3

По ссылке расположен файл .RData с симуляцией двух четырехгранных игральных кубиков dice1 и dice2. Один из них является честным, другой — нечестным.

Выясните, каким именно является каким.

Описание формата инпута.

#4

Если дискретная случайная величина определена на конечном множестве элементрных исходов, то её функцию вероятности можно задать с помощью таблицы:

X x1 x2 x3 ... xn
P(X=x) p1 p2 p3 ... pn

Тогда математическое ожидание такой случайной величины будет определяться следующим образом:

E(X)=i=1nxipi

Дана случайная величина X со следующей функцией вероятности:

x 0 2 4 8 9
P(X=x) 0.2 0.3 0.1 0.15 0.25

Найдите математическое ожидание данной случайное величины.

Отсюда можно скачать таблицу, задающую функцию вероятности этой случайной величины.

Описание формата инпута.

#5

По таблице функции вероятности дискретной случайной величины можно найти и её дисперсию. Она определяется по формуле:

var(X)=E(X2)(E(X))2

Для случайной величины из предыдущего задания найдите её дисперсию.

Описание формата инпута.

#6

Рассчитайте дисперсию следующей случайной величины:

x 2 1 1 3 4
P(X=x) 0.35 0.28 0.16 0.05 0.16

Тут можно скачать таблицу.

Описание формата инпута.

#7

Визуализируйте функцию вероятности случайной величины из предыдущего задания.

Описание формата инпута.

#8

Некоторая случайная величина подчиняется нормальному распределению с параметрами μ=1.5 и σ2=2.1. Визуализируйте график функции плотности распределения этой случайной величины.

Описание формата инпута.

#9

Рассчитайте вероятность того, что случайная величина XN(1.5,2.1) из предыдущего задания принимает значения:

  1. меньшие 5
  2. большие 4
  3. от -1 до 1

Описание формата инпута.

#10

Вы генерируете ID для ваших респондентов как случайную последовательность пяти буквенных символов. Используются только латинские буквы нижнего регистра. В каждом случае символ выбирается случайно. Какова вероятность, что вы сгенерируете ID из пяти одинаковых символов?

Описание формата инпута.

#11

Чтобы набрать выборку для качественное апробации новой психометрической методики вы обратились в три рекрутинговых агенства. Первое агенство нашло для вас 130 потенциальных респондентов, второе — 201, третье — 94. Из интернет отзывов известно, что среди респондентов первого агенства в среднем попадается 5% профессиональных респондетов, второго — 7%, а третьего — 2.5%.

Из всех потенциальных респондентов вы выбираете рандомизатором случайного. Какова вероятность, что это профессиональный респондент?

Описание формата инпута.

#12

Выбранный вами в предыдущем задании респондент действительно оказался профессиональным. Какова вероятность, что он был рекрутирован

  • первым агенством?
  • вторым агенством?

Описание формата инпута.

#13

Студент решает тест из 10 вопросов. Он вообще не в курсе по какому предмету этот тест, поэтому отвечает наугад. В каждом вопросе теста четыре варианта ответа, только один из которых правильный. Тест хорошо сконструирован, поэтому все альтернативы в каждом вопросе равнозначны, а вопросы не связаны друг с другом.

Какова вероятность, что бедолага-студент:

  1. ответит на все вопросы верно?
  2. ответит на все вопросы неверно?

Описание формата инпута.

#14

Чтобы сдать тест, бедному студенту из предыдущео задания необходимо ответить правильно хотя бы на 6 любых вопросов. Какова вероятность, что наш студент сдаст тест?

Описание формата инпута.

#15

Известно, что распределения — даже нормальное — могут быть разными. Достаточно часто — примерное всегда — нам придется сравнивать случайные величины друг с другом на основе их распределений. Однако распределения с разными параметрами сравнивать достаточно трудно — нам надо научиться приводить разные распределения к одним и тем же параметрам.

У нас есть два распределения — N(0,5) и N(3,5). Обоснуйте, что из всех значений второго распределения можно вычесть 3 и превратить его в первое распределение.

Описание формата инпута.

#16

Подолжает делать возможным сравнение разных распределений.

У нас есть два распределения — N(0,1) и N(0,10). Обоснуйте, что можно все значения второго распределения поделить на σ=10 и превратить его в первое распределение.

Описание формата инпута.

#17

Если мы соединим две операции из предыдущих заданий, мы получим стандартизацию. Эта операция приводит любое нормальное распределение к стандартному нормальному распределению N(0,1).

zi=xix¯σx

  1. Сгенерируйте нормально распределенную случайную величину (1000 значений) с параметрами μ=10, σ2=25 (set.seed(120)).
  2. Визуализируйте распределение получившейся величины.
  3. Выполните стандартизацию сгенерированной случайной величины.
  4. Визуализируйте распределение стандартизированной случайной величины.

Описание формата инпута.

#18

Если можно выполнить стандартизацию, то можно выполнить и обратное преобразование — привести стандартное нормальное распределение к распределению с некоторыми параметрами N(μ,σ2).

xi=zi×σx+x¯

Описание формата инпута.

#19

Однако стандартизировать можно в общем случае не только нормально распределенные величины, так как для любой случайной величины мы можем рассчитать среднее и стандартное отклонение. Однако здесь возникает вопрос: а не изменится ли форма распределения при выполнении стандартизации? Не потеряем ли мы какой-то важной информации?

Утверждение: стандартизация не меняет форму распределения.

Проверьте, справедливо ли это утверждение с помощью симуляции.

Описание формата инпута.

#20

Мы говорили на лекции о том, что главными характеристиками статистических данных являются неопределенность и вариативность. Давайте посмотрим, как это проявляется на распределениях.

Сгенерируйте 12 выборок по 60 наблюдений из нормального распределения N(3,4). Вызуализируйте распределение переменной в каждой из выборок и сравните их друг с другом.

Описание формата инпута.