Факторный анализ в психологии.
Факторный анализ в психологии с помощью программы SPSS
Важное отличие факторного анализа от всех других методов в том, что его нельзя применять для обработки первичных, или, как говорят, "сырых", экспериментальных данных, т.е. полученных непосредственно при обследовании испытуемых. Материалом для факторного анализа служат корреляционные связи, а точнее – коэффициенты корреляции Пирсона, которые вычисляются между переменными, включенными в обследование. Иными словами, факторному анализу подвергаются корреляционные матрицы.
Используется для конструирования тестов и методик; для изучения любых экспериментальных наблюдений, их структуры, исходя из внешних признаков.
Главное понятие факторного анализа – фактор. Это искусственный статистический показатель, возникающий в результате специальных преобразований таблицы коэффициентов корреляции между изучаемыми психологическими признаками, или матрицы корреляций. В результате факторизации из корреляционной матрицы может быть извлечено разное количество факторов вплоть до числа, равного количеству исходных переменных. Однако факторы, выделяемые в результате факторизации, как правило, неравноценны по своему значению.
Метод позволяет составлять гипотезы относительно природных процессов, присущих самому измеряемому свойству. Так же факторный анализ позволяет установить для большого числа признаков узкий набор свойств, характеризующих связь между признаками и факторами.
Факторный анализ имеет 4 стадии:
1. вычисление корреляционной матрицы для всех переменных, участвующих в анализе,
2. извлечение факторов,
3. вращение факторов для создания упрощенной структуры,
4. интерпретация факторов.
1.2 Формула, нормы, применение.
Во всех современных статистических пакетах есть программы для корреляционного и факторного анализов. Компьютерная программа по факторному анализу по существу пытается "объяснить" корреляции между переменными в терминах небольшого числа факторов.
Пример факторной матрицы:
Переменная |
Фактор 1 |
Фактор 2 |
V1 |
0,91 |
0,01 |
V2 |
0,20 |
0,96 |
V3 |
0,94 |
- 0,15 |
Из матрицы видно, что корреляция между переменной V1 и первым фактором = 0,91. Чем выше факторная нагрузка, тем больше ее связь с фактором.
Существует одно принципиально важное свойство коэффициента корреляции, благодаря которому составляются описательные характеристики. Коэффициент корреляции, возведенный в квадрат, показывает, какая часть дисперсии (вариативности) признака является общей для двух переменных, или, говоря проще, насколько эти переменные перекрываются. Например, 2 переменные с корреляцией 0,9 перекрываются со степенью 0,9 * 0,9 = 0,81. Т.е. 81% дисперсии той и другой переменной являются общими, т.е. совпадают.
Чтобы вычислить собственные значения фактора 1, нужно возвести в квадрат факторные нагрузки и сложить их по столбцу. 0,91*0,91 + 0,20*0,20 + 0,94*0,94 = 1,7517. Если собственное значение фактора разделить на число переменных, полученное число покажет, какая доля дисперсии объясняется данным фактором. 1,7517: 3 = 0,5839. Фактор 1 объясняет около 58 % информации.
КМО – Коэффициент, характеризующий степень применимости факторного анализа для данной выборки.
0,9 и больше – безусловная адекватность,
0,8 – высокая применимость,
0,7 – приемлемая,
0,6 – удовлетворительная,
0,5 – низкая,
Меньше 0,5 – факторный анализ не приемлем для данной выборки.
Значение Bartletta должно быть не меньше 0,05.
Условия применения факторного анализа:
1. нельзя факторизовать качественные данные, полученные по шкале наименований, например, цвет волос, глаз и т.д.
2. все переменные должны быть независимым, а их распределение должно приближаться к нормальному.
3. связи между переменными должны быть приблизительно линейны или не иметь явно криволинейного характера,
4. в исходной корреляционной матрице должно быть несколько корреляций по модулю выше 0,3. Иначе – трудно извлечь из матрицы какие-либо факторы.
5. выборка испытуемых должна быть достаточно большой (желательно 100 испытуемых).
Как проводить факторный анализ в SPSS
Пример: Экспериментальное изучение особенностей сформированности мыслительных операций младших школьников.
Предмет исследования: |
1. Мыслительные операции младших школьников (анализ, обобщение, абстрагирование, логические связи, отношения между понятиями) 2. Успеваемость по основным предметам. |
Объект исследования: |
Ученики 4 класса средней школы №27г. Кирова в количестве 30 человек. |
Цель: |
1. Изучить особенности сформированности мыслительных операций младших школьников (анализ, обобщение, абстрагирование, логические связи, отношения между понятиями). 2. Определить зависимость между успеваемостью по основным предметам и уровнем развития мыслительных операций детей четвертого класса начальной школы. |
Гипотеза: |
Между развитием у младших школьников мыслительных операций и их успеваемостью существует положительная связь, т.е. чем выше уровень сформированности мыслительных операций (анализ, обобщение, абстрогирование, логические связи, отношения между понятиями), тем выше уровень успеваемости школьников. |
Задачи: |
1. Определить уровень сформированности мыслительных операций младших школьников (анализ, обобщение, абстрагирование, логические связи, отношения между понятиями). 2. Определить степень связи между уровнем сформированности мыслительных операций и успеваемостью. 3. Подобрать упражнения, способствующие развитию мыслительных операций у учащихся начальных классов. |
Для выявления зависимости между уровнем развития мыслительных операций и уровнем успеваемости, была проведена диагностика логических приемов умственных действий у детей начальных классов. В качестве испытуемых были взяты дети четвертых классов начальной школы в количестве 30 человек. Для диагностики использовались методики Коробковой Э.А.
Название методики Коробковой Э.А. |
Цель методики: |
"Исключение понятий". |
Изучение индивидуальных различий в уровне развития мыслительных операций обобщения и отвлечения. |
"Простые аналогии". |
Изучение характера логических связей и отношений между понятиями. |
"Сравнение понятий". |
Изучение индивидуальных различий у школьников в развитии процессов анализа и обобщения. |
Результаты экспериментального изучения проблемы.
Исследование проводилось среди учеников четвертых классов в количестве 30 человек. Данные, полученные в результате исследования, представлены в таблице.
Результаты методик и общая успеваемость (табл. №1).
Фамилия |
Количество баллов, полученных в методике: |
Общая оценка успеваемости: |
||||||
Математика. |
Русский. |
Литература. |
История. |
|||||
"Исключение понятий" |
"Простые аналогии" |
"Сравнение понятий" |
||||||
Глушаков С. |
14 |
15 |
9 |
4 |
4 |
4 |
4 |
|
Гущин И. |
14 |
16 |
12 |
4 |
4 |
5 |
4 |
|
Дудырев А. |
15 |
14 |
5 |
4 |
4 |
4 |
4 |
|
Золотарева К. |
16 |
13 |
11 |
4 |
4 |
5 |
4 |
|
Катаева А. |
15 |
16 |
16 |
5 |
4 |
5 |
5 |
|
Киселева Н. |
16 |
11 |
10 |
5 |
4 |
5 |
5 |
|
Коробов Д. |
15 |
16 |
15 |
5 |
5 |
5 |
5 |
|
Котельникова К. |
14 |
14 |
13 |
5 |
4 |
5 |
5 |
|
Крутихин И. |
6 |
7 |
2 |
3 |
3 |
3 |
3 |
|
Куклин И. |
16 |
14 |
10 |
4 |
4 |
5 |
4 |
|
Легких Л. |
8 |
10 |
3 |
3 |
3 |
3 |
3 |
|
Ложкина К. |
16 |
16 |
14 |
5 |
5 |
5 |
5 |
|
Лычева Н. |
5 |
16 |
10 |
5 |
5 |
5 |
5 |
|
Мочалова В. |
15 |
15 |
13 |
5 |
5 |
5 |
5 |
|
Никулин В. |
16 |
14 |
9 |
4 |
4 |
5 |
5 |
|
Овчинников С. |
16 |
14 |
6 |
4 |
4 |
5 |
5 |
|
Попова М. |
12 |
13 |
10 |
4 |
4 |
5 |
4 |
|
Попцов С. |
0 |
11 |
5 |
3 |
3 |
3 |
3 |
|
Росляков А. |
7 |
8 |
5 |
3 |
3 |
3 |
3 |
|
Рылова Л. |
9 |
9 |
5 |
3 |
3 |
3 |
3 |
|
Смердова Д. |
15 |
12 |
14 |
4 |
4 |
5 |
5 |
|
Татаринова Т. |
12 |
10 |
9 |
5 |
4 |
5 |
5 |
|
Титова К. |
15 |
15 |
10 |
4 |
4 |
5 |
5 |
|
Устиничев И. |
15 |
15 |
11 |
4 |
4 |
5 |
4 |
|
Феоктистова К. |
7 |
9 |
6 |
3 |
3 |
3 |
3 |
|
Халевина Р. |
8 |
13 |
8 |
4 |
5 |
5 |
5 |
|
Храмушин Д. |
0 |
10 |
4 |
3 |
3 |
3 |
3 |
|
Чернядьева Ж. |
10 |
14 |
10 |
4 |
4 |
4 |
4 |
|
Шахматова Н. |
14 |
14 |
10 |
5 |
5 |
5 |
5 |
|
Юдинцев М. |
9 |
12 |
11 |
4 |
4 |
4 |
4 |
Интерпретация данных таблицы №1:
После изучения бланков ответов учащихся была составлена сводная таблица заработанных ими баллов. В 2, 3, 4 столбиках таблицы помещены баллы, которые ученик заработал за выполнение методик: "Исключение понятий", "Простые аналогии", "Сравнение понятий" соответственно. В 5, 6, 7, 8 столбиках – оценки общей успеваемости учеников по основным предметам.
Затем все данные мы заносим в файл SPSS.
Окно Variable view.
Окно Data view.
Алгоритм вычисления в SPSS: Analyze – Data Reduction – Factor.
В этом окне нужно изменить параметры в следующих разделах:
1. Descriptives
2. Extraction
3. Rotation
4. Scores
Options
Correlation Matrix
исключение понятий |
простые аналогии |
сравнение понятий |
математика |
русский |
литература |
история | ||
Correlation |
исключение понятий |
1,000 |
,586 |
,629 |
,608 |
,520 |
,750 |
,654 |
простые аналогии |
,586 |
1,000 |
,734 |
,684 |
,768 |
,751 |
,678 | |
сравнение понятий |
,629 |
,734 |
1,000 |
,786 |
,695 |
,780 |
,723 | |
математика |
,608 |
,684 |
,786 |
1,000 |
,841 |
,829 |
,886 | |
русский |
,520 |
,768 |
,695 |
,841 |
1,000 |
,808 |
,835 | |
литература |
,750 |
,751 |
,780 |
,829 |
,808 |
1,000 |
,898 | |
история |
,654 |
,678 |
,723 |
,886 |
,835 |
,898 |
1,000 |
Таблица показывает корреляцию между переменными. Достоверная взаимосвязь прослеживается между всеми переменными, т.е. между каждой из методик и всеми школьными предметами.
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. |
,877 | |
Bartlett's Test of Sphericity |
Approx. Chi-Square |
203,368 |
df |
21 | |
Sig. |
,000 |
КМО = 0,877. Это говорит о том, что степень применимости факторного анализа для данной выборки является высокой.
Component Matrix(a)
Component | |
1 | |
литература |
,946 |
история |
,926 |
математика |
,919 |
русский |
,892 |
сравнение понятий |
,867 |
простые аналогии |
,842 |
исключение понятий |
,762 |
Т.о. после проведения факторного анализа выделен один компонент, который включает в себя все переменные.
Extraction Method: Principal Component
Analysis.
a 1 components extracted.
Из матрицы видно, что корреляция между первым фактором и:
* переменной литература = 0,946;
* переменной история = 0,926;
* математика = 0,919;
* русский = 0,892;
* сравнение понятий = 0,867;
* простые аналогии = 0,842;
* исключение понятий = 0,762
Чем выше факторная нагрузка, тем больше ее связь с фактором.
Чтобы вычислить собственные значения фактора 1, нужно возвести в квадрат факторные нагрузки и сложить их по столбцу. 0,946*0,946 + 0,926*0,926 + 0,919*0,919 + 0,892*0,892 + 0,867*0,867 + 0,842*0,842 + 0,762*0,762 = 5,433914. Если собственное значение фактора разделить на число переменных, полученное число покажет, какая доля дисперсии объясняется данным фактором. 5,433914: 7 = 0,7763. Фактор 1 объясняет около 78 % информации.
Graph
После проведения факторного анализа строим графики, которые показывают, каким образом связаны данные каждой методики с успеваемостью по четырем основным школьным предметам. Графики еще раз иллюстрируют достоверную корреляцию между переменными. Чем выше уровень сформированности мыслительных операций (анализ, обобщение, абстрогирование, логические связи, отношения между понятиями), тем выше уровень успеваемости школьников.
Литература.
Ермолаев О.Ю. Математическая статистика для психологов.