Слайд 2
Факторный анализ
Факторный анализ – как религия: каждый находит
в нем что-то свое
Под факторным анализом понимают два
метода:
Метод главных компонент
Факторный анализ
Слайд 3
Основная идея
Метод главных компонент объясняет наибольшую вариативность в
терминах наименьшего количества линейных комбинаций переменных.
Слайд 4
Основная идея
Факторный анализ объясняет отношения между переменными с
помощью нескольких факторов, которые не могут быть прямо измерены.
Слайд 5
Основная идея
Оба метода основываются на корреляциях (или ковариациях)
между исходными переменными и часто называются одним термином –
факторный анализ.
Слайд 6
Основная идея
Главными целями факторного анализа являются: (1) сокращение
числа переменных и (2) определение структуры взаимосвязей между переменными,
т.е. классификация переменных.
Слайд 7
Метод главных компонент
– это метод, который переводит большое
количество связанных между собой (зависимых, коррелирующих) переменных в меньшее
количество независимых переменных.
Слайд 8
Метод главных компонент
ПРИМЕР: у студентов измерили
интеллект
по тесту Векслера,
интеллект по тесту Айзенка,
интеллект по тесту Равена,
а также
успеваемость по социальной ψ
успеваемость по когнитивной ψ
успеваемость по общей ψ.
Слайд 9
Метод главных компонент
Если переменных в исследовании слишком много
(x1, x2, …, xp), а некоторые из них взаимосвязаны,
то у исследователя иногда возникает желание уменьшить сложность данных, сократив количество переменных.
Слайд 10
Метод главных компонент
Для этого и служит метод главных
компонент, который создает несколько новых переменных y1, y2, …,
yp, каждая из которых является линейной комбинацией первоначальных переменных x1, x2, …, xp:
Слайд 11
Метод главных компонент
y1=a11x1+a12x2+…+a1pxp
y2=a21x1+a22x2+…+a2pxp
… (1)
yp=ap1x1+ap2x2+…+appxp
Это и есть модель для метода
главных компонент
Слайд 12
Метод главных компонент
Переменные y1, y2, …, yp называются
главными компонентами или факторами.
Таким образом, фактор – это
искусственный статистический показатель, возникающий в результате специальных преобразований корреляционной матрицы.
Слайд 13
Метод главных компонент
Процедура извлечения факторов называется факторизацией матрицы.(проведение
ФА).
В результате факторизации из корреляционной матрицы может быть
извлечено разное количество факторов вплоть до числа, равного количеству исходных переменных.
Слайд 14
Метод главных компонент
Коэффициенты aij, определяющие новую переменную, выбираются
таким образом, чтобы новые переменные (главные компоненты, факторы) описывали
максимальное количество вариативности данных и не коррелировали между собой.
Слайд 15
Метод главных компонент
Часто полезно представить коэффициенты aij таким
образом, чтобы они представляли собой коэффициент корреляции между исходной
переменной и новой переменной (фактором). Это достигается умножением aij на стандартное отклонение фактора.
Слайд 16
Метод главных компонент
Коэффициенты aij называются факторными нагрузками.
Слайд 18
Факторный анализ
Основное отличие между факторным анализом и методом
главных компонент заключается в том, что главные компоненты являются
линейными функциями от наблюдаемых переменных, в то время как общие факторы не выражаются через комбинацию наблюдаемых переменных.
Слайд 19
Факторный анализ
Модель факторного анализа предполагает, что корреляции между
наблюдаемыми переменными x1, x2, …, xp получаются благодаря их
связи с некоторыми фундаментальными переменными, известными как общие факторы или латентные переменные f1, f2, …, fk , где k
Слайд 20
Факторный анализ
Дисперсия исходных переменных здесь объясняется не в
полном объеме: признается, что часть дисперсии остается нераспознанной как
характерность.
Слайд 21
Факторный анализ
x1=λ11f1+ λ 12f2+…+ λ1kfk+u1
x2= λ21f1+ λ 22f2+…+
λ2kfk+u2
… (2)
xp= λp1f1+ λ p2f2+…+ λpkfk+up
Это и
есть модель факторного анализа
Слайд 22
Факторный анализ
Случайная погрешность ui называется характерностью и представляет
собой часть наблюдаемой переменной, которая не объясняется действием факторов.
Слайд 23
Факторный анализ
Общность (Communality) переменной xi - является той
дисперсией, которую переменная делит с другими явными переменными посредством
их отношения с латентной переменной.
Дисперсия явной переменной может быть разделена на две части:
Характерность - часть единичной дисперсии переменной, которая не связана с общими факторами.
Слайд 24
Факторный анализ
Если латентные факторы не коррелируют, то коэффициенты
λij являются корреляциями между латентными переменными и явными переменными.
Они также называются факторными нагрузками и представляются в виде такой же таблицы, как и факторные нагрузки в методе главных компонент
Слайд 25
Факторный анализ
Соответствие факторной модели полученным данным проверяется путем
сравнения исходной корреляционной матрицы с матрицей корреляций, полученной в
результате применения модели. Такая оценка соответствия может быть проведена различными методами.
Слайд 26
Факторный анализ
В программе STATISTICA реализовано пять методов факторного
анализа:
Слайд 27
Факторный анализ
Commonalities=multiple R-square.
Если выбран этот метод, то
перед факторизацией диагональные элементы корреляционной матрицы (общности) будут вычисляться
как множественные коэффициенты корреляции данной переменной со всеми остальными переменными, а затем возводиться в квадрат. Это самый распространенный метод факторного анализа, обычно выбираемый по умолчанию.
Слайд 28
Факторный анализ
Iterated commonalities (MINRES).
Этот метод отличается от
предыдущего тем, что после факторизации оптимизирует факторные нагрузки посредством
нескольких итераций, основываясь на оценке квадратов сумм остатков.
Слайд 29
Факторный анализ
Maximum likelihood factors
метод максимального правдоподобия Д.
Лоули. В отличие от остальных методов тут предполагается, что
число факторов заранее известно (и должно быть установлено в окошке maximum number of factors). Программа затем вычисляет оценки факторных нагрузок и общностей, которые максимизируют вероятность получения исходной корреляционной матрицы.
Слайд 30
Факторный анализ
Centroid method
– центроидный метод Л. Тэрстоуна.
В нем корреляции между переменными рассматриваются как пучок векторов,
а латентный фактор геометрически представляется как уравновешивающий вектор, проходящий через центр этого пучка. Это наименее современный метод факторного анализа, требующий также наименьшего количества вычислений.
Слайд 31
Факторный анализ
Principal axis method
В этом методе (методе
главных осей) на каждом итерационном шаге собственные значения вычисляются
с помощью общностей, затем общности пересчитываются на основании собственных значений. Новые общности помещаются на диагональ корреляционной матрицы, и начинается новый итерационный шаг. Итерации продолжаются либо пока их число не достигнет максимума (заранее определенного), либо пока минимальные изменения в общностях не станут меньше, чем наперед заданные значения.
Слайд 32
Факторный анализ
Факторный анализ
Statistics ⇒
Multivariate Exploratory Techniques ⇒ Factor
Analysis
Слайд 34
Факторный анализ
☹ В SPSS реализованы некоторые перечисленные и
некоторые другие методы
Слайд 35
Факторный анализ
☺ Но! Факторные отображения одной и той
же корреляционной матрицы эквивалентны друг другу, если они содержат
одинаковое число факторов.
Практически это значит, что вы получите одни и те же результаты при любом методе.
Слайд 36
Факторный анализ
Результаты, полученные с помощью метода главных компонент,
и результаты, полученные с помощью различных процедур собственно факторного
анализа, практически никогда существенно не отличаются друг от друга!
☺
Слайд 37
Сколько факторов?
Для применения процедуры выбора следует посчитать некоторую
статистику – собственные значения корреляционной матрицы и процент объясненной
дисперсии для каждого фактора.
Слайд 39
Сколько факторов?
1) Процент объясненной дисперсии. Если кумулятивный (накопленный)
процент общей дисперсии достигает 60% или больше, то можно
остановиться на данном количестве факторов.
Слайд 41
Сколько факторов?
2) Критерий Кайзера (H. Keiser). Вы можете
отобрать только факторы с собственными значениями, большими 1. По
существу, это означает, что если фактор не выделяет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, то он опускается.
Слайд 43
Сколько факторов?
3) Критерий каменистой осыпи является графическим методом.
Вы можете изобразить собственные значения, представленные в таблице ранее,
в виде простого графика:
Слайд 45
Сколько факторов?
4) На практике возникает важный дополнительный вопрос,
а именно: когда полученное решение может быть содержательно интерпретировано.
☺
Слайд 46
Вращение матрицы факторных нагрузок
Оказывается, что описанные выше шаги
не дают однозначного решения задачи определения факторов. Основываясь на
геометрическом представлении рассматриваемой задачи, поиск однозначного решения называют задачей вращения факторов. (Брать после вращения)
Слайд 47
Вращение матрицы факторных нагрузок
Необходимость вращения факторов возникает чаще
всего, когда выявленным факторам не удается дать достаточно четкую
содержательную интерпретацию.
Слайд 48
Вращение матрицы факторных нагрузок
В программе STATISTICA:
Варимакс (Varimax) –
это такое ортогональное вращение, при котором происходит минимизация количества
переменных с высокой факторной нагрузкой.
Слайд 49
Вращение матрицы факторных нагрузок
Квартимакс (Quartimax) – ортогональное вращение,
при котором происходит минимизация количества факторов, необходимых для объяснения
переменных.
Слайд 50
Вращение матрицы факторных нагрузок
Биквартимакс (Biquartimax) –метод, который является
компромиссом между варимаксом и квартимаксом, то есть направлен на
одновременную максимизацию дисперсий и строк, и столбцов матрицы квадратов факторных нагрузок
Слайд 51
Вращение матрицы факторных нагрузок
Эквамакс (Equamax) – тоже является
компромиссом между варимаксом и квартимаксом; отличается от биквартимакса весом,
который присваивается критерию варимакс.
Слайд 52
Алгоритм факторного анализа
Заносим данные в программу.
Выбираем метод -
анализ главных компонент или факторный анализ. Если выбран факторный
анализ, то выбираем метод факторного анализа.
Слайд 53
Алгоритм факторного анализа
Выбираем количество факторов.
Строим матрицу факторных нагрузок.
Вращаем
матрицу факторных нагрузок.
Интерпретируем факторы.
Слайд 54
Алгоритм факторного анализа
Если ничего не получается, то можно
попробовать разные способы вращения (возвращаемся на п.5).
Если это ничего
не дает, то можно попробовать взять разное количество факторов (возвращаемся на п. 3)
Если и это ничего не дает, то можно попробовать взять другой метод (возвращаемся на п. 2)
Слайд 55
Как это посчитать?
Выбираем число факторов
Слайд 56
Как это посчитать?
Таблица собственных значений
Слайд 58
Как это посчитать?
График каменистой осыпи
Слайд 60
Как это посчитать?
Выбор метода вращения
Слайд 61
Разбиение на группы
Если факторы найдены и истолкованы, то
на последнем шаге ФА отдельным наблюдениям (т.е. испытуемым) можно
присвоить значения этих факторов (т.н. факторные значения – factor scores).
Слайд 62
Разбиение на группы
Таким образом, для каждого наблюдения значения
большого количества переменных можно перевести в значения небольшого количества
факторов. Факторные значения лежат, как правило, в пределах от –3 до +3 и характеризуют положение испытуемого на шкале, задаваемой фактором.
Слайд 65
Разбиение на группы
Если факторов больше или введены дополнительные
градации (плохо учится – хорошо учится – отлично учится),
то групп становится намного больше.
Слайд 66
Как это посчитать?
Факторные значения
Слайд 68
Факторный анализ
Наиболее плодотворно использование факторного анализа на ранних
стадиях исследования
Факторный анализ есть прежде всего средство проверки, отбора
гипотез, а не волшебная палочка, извлекающая из груды сырых фактов «скрытые закономерности».
Слайд 69
Удачные примеры (с моей т.з.)
Адаптация теста (психодиагностичекой методики)
Исследование
семантических пространств
Слайд 70
Удачные примеры
Измерение личностных особенностей (по Иванову
для взрослых)
Шкалы:
Кривизны
Неприспособленности
Неудачливости
Нужды в психологической помощи
Слайд 71
Удачные примеры
Измерение личностных особенностей (по Иванову
для взрослых)
Шкала кривизны
Насколько часто Вы попадаете в неприятные положения?
Как
часто над Вами смеются?
…
Слайд 73
Удачные примеры
Семантический дифференциал
(например, у В.Ф. Петренко «Основы психосемантики»)
Баба
Яга
Добрая – Злая
Красивая – Некрасивая
Ленивая – Трудолюбивая
…
Слайд 76
Требования и ограничения ФА
Нормальное распределение всех переменных
Все
наблюдения независимы
По крайней мере интервальные шкалы
Т.е. данные должны быть
такими, которые подходят для подсчета к-та корреляции Пирсона
Слайд 77
Что представляем в статье?
Обычно дается матрица факторных
нагрузок после вращения с указанием процента объясненной дисперсии для
каждого фактора
+ ВАША ИНТЕРПРЕТАЦИЯ!
Слайд 79
Что такое КМО?
КМО - это показатель Кайзера
и его коллег: Kaiser-Meyer-Olkin measure
Мера выборочной адекватности
Это % дисперсии,
который объясняют общие (латентные) факторы
Должен быть > 0,5
KMO and Bartlett's Test of Sphericity –
есть в SPSS, но нет в Statistica
Слайд 80
Что такое КМО?
Bartlett's Test of Sphericity –
проверяет,
является ли матрица единичной, что будет свидетельствовать о том,
что факторная модель не подходит для этого случая.
Т.е. этот тест д.б. значимым!
KMO and Bartlett's Test of Sphericity –
есть в SPSS, но нет в Statistice
Слайд 81
Полезная литература
Просто и доходчиво факторный анализ изложен в
Гусев А.Н., Измайлов Ч.А., Михалевская М.Б. Измерение в психологии:
общий психологический практикум. – М.: Смысл, 1997.
Ермолаев О.Ю. Математическая статистика для психологов: Учебник/ - 2-е изд., испр. – М.: Московский психолого-социальный институт: Флинта, 2003.
Электронный учебник по ФА (Радчикова Н., Радчиков А.)
Слайд 82
Полезная литература
ПРОГРАММА STATISTICA
Боровиков В. Программа STATISTICA для студентов
и инженеров. - Компьютер Пресс: Москва, 2001.
Электронный учебник
по программе (StatSoft)
ПРОГРАММА SPSS
Наследов А.Д. Математические методы психологического исследования. Анализ и интерпретация данных. – СПб. – Речь. – 2004.
Бююль А., Цефель П. SPSS: Искусство обработки информации. – СПб, «ЛиаСофтЮп». –2001.
Слайд 83
Факторный анализ
СПАСИБО
ЗА ВНИМАНИЕ!
Слайд 84
Факторный анализ
Это все был только эксплораторный факторный анализ!
Слайд 85
Конфирматорный ФА
Основная идея:
Вы сами придумываете модель (какие
переменные должны объединяться) и проверяете, насколько это предположение соответствует
собранным данным
Слайд 86
Конфирматорный ФА
В STATISTICA 6.0
Statistics – Advanced Linear/Nonlinear
Models – Structural Equation Modeling – Path Wizard –
Confirmatory factor analysis
Слайд 88
Конфирматорный ФА
Левая сторона
показывает, благополучно ли завершились итерации
Слайд 89
Конфирматорный ФА
Maximum Residual Cosine – показатель хорошего завершения
итераций. Должен быть близок к нулю
Слайд 90
Конфирматорный ФА
Maximum Absolute Constraint
Тоже показатель хорошего завершения итераций.
Должен быть близок к нулю
Слайд 91
Конфирматорный ФА
ICSF Criterion.
и
ICS Criterion.
Должны быть близки
к нулю
Слайд 92
Конфирматорный ФА
Boundary Conditions.
Должен равняться нулю.
Если этот показатель
не равен нулю, критерий хи-квадрат может давать неверную информацию
Слайд 93
Конфирматорный ФА
Правая сторона
показывает, соответствует ли реальность Вашей модели
Слайд 94
Конфирматорный ФА
Chi-square Statistic
Проверяет нуль-гипотезу об идеальном соответствии
Слайд 95
Конфирматорный ФА
RMS Standardized Residual
Этот показатель должен быть меньше,
чем 0,05 для того, чтобы считать выбранную модель «хорошей»
в практическом плане
Слайд 96
Конфирматорный ФА
Кроме этого, можно посмотреть еще несколько индексов:
Слайд 97
Полезная литература
К практическому занятию по ФА надо прочитать:
Войскунский
А.Е. и др. Мотивация хакеров: психосемантическое исследование// ПЖ, 2003,
т.24, № 1, с. 104-118