L15 // Конфирматорный факторный анализ

Антон Ангельгардт

Что будет?

  • проверка теоретических моделей на эмпирических данных
  • особенности методов структурного моделирования
  • принципы работы с результатами конфирматорного факторного анализа

Структурное моделирование

  • structural equation modelling, SEM
  • два шага:
    • задание теоретической модели
    • проверка того, насколько предложенная модель хорошо подходит под наши данные

Особенность SEM

  • в модель включаются латентные переменные
  • в модель могут быть включены косвенные связи

Сколько нужно данных

  • статистические расчеты часто оказываются далеки от запросов алгоритмов
  • на один оцениваемый параметр нужно не менее 10–15 наблюдений

Модель конфирматорного факторного анализа

  • confirmatory factor analysis, CFA
  • измерения — латентные → наблюдаемые
  • корреляции — наблюдаемые → наблюдаемые, латентные → латентные
  • остатки — то, что не удалось смоделировать

В SEM ещё и

  • регрессии — наблюдаемые → латентные

Вопросы конфирматорного факторного анализа

  • пересекаются ли факторы? — действительно ли каждый переменная обусловлена влиянием одного фактора?
  • достоверны ли статистически факторные нагрузки?
  • как коррелируют сами факторы и как это влияет на факторные нагрузки?
  • отличается ли дисперсия фактора от нуля? — ведь если нет, тогда этот фактор не информативен, то есть не дифференцирует респондентов

Оценка качества модели

  • chi-squared for model fit
    • нулевая гипотеза — модель соответствует данным
    • альтернативная — что модель не соответствует им
  • на больших выборках тест всегда дает статистически значимые результаты
  • используются метрики качества модели
Метрика Значение
GFI, goodnes of fit (аналог \(R^2\)) \(>0.95\)
AGFI, adjusted goodnes of fit \(>0.90\)
CFI, comparative fit index \(>0.95\)
TLI, Tucker Lewis index \(>0.95\)
RMSEA, Root Mean Square Error of Approximation \(<0.05\)
SRMR, Standardized Root Mean Square Residual \(<0.05\)

Изучение параметров модели

Связь Оценка параметра SE z p Доверительный интервал
F1 =~ q1 0.787 0.020 39.421 0.000 [0.748, 0.827]
F1 ~~ F2 0.674 0.032 21.123 0.000 [0.611, 0.736]
  • измерения, корреляции, остатки
  • собственно оценки параметров и их статистическая значимость

Модификация модели

  • насколько связи, не включенные в модель, потенциально улучшают качество модели
  • индексы модификации (modification indices)
  • относительная мера того, насколько улучшится наша модель, если мы включим в неё данную связь
  • рассчитываются для всех связей, которые могут быть включены в модель

Хочется включить в изначальную модель связи с высокими индексами модификации, чтобы улучшить модель — особенно в случае, когда метрики качества модели не очень хороши.

Так делать не надо. Это p-hacking.

Как работать с индексами модификации?

  • изучить индексы модификации и выявить связи с наибольшими индексами модификации
  • попробовать найти теоретическое основание таких связей
  • включить их в теоретическую модель
  • собрать новые данные
  • проверить обновленную модель на новых данных

Сравнение моделей

  • метрики качества моделей
  • хи-квадрат тест
  • информационные критерии

L15 // Конфирматорный факторный анализ

Антон Ангельгардт