Webbc.ru

Веб и кризис
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Многофакторный корреляционный анализ

Многофакторный корреляционный и регрессионный анализ

Как известно, явления общественной жизни складываются под воздействием не одного, а целого ряда факторов.

Многофакторный корреляционный и регрессионный анализ позволяет оценить меру влияния на исследуемый результативный показатель каждого из включенных в модель (уравнение) факторов при фиксированном положении (на среднем уровне) остальных факторов. Он позволяет также при любых возможных сочетаниях факторов с определенной степенью точности найти теоретическое значение этого показателя (важным условием является отсутствие между факторами функциональной связи).

Математически задача формулируется следующим образом. Требуется найти аналитическое выражение, наилучшим образом отражающее установленную теоретическим анализом связь независимых признаков с результативным, т.е. функцию:

В условиях использования ЭВМ выбор аппроксимирующей математической функции осуществляется перебором решений, наиболее часто применяемых в анализе корреляции уравнений регрессии.

После выбора типа аппроксимирующей функции приступают к многофакторному корреляционному и регрессионному анализу, задачей которого является построение уравнения множественной регрессии и нахождение его неизвестных параметров.

Параметры уравнения множественной регрессии, как и в случае парной регрессии, находят по способу наименьших квадратов.

Для расчета параметров простейшего уравнения множественной линейной двухфакторной регрессии, которая имеет вид:

где _ расчетные значения зависимой переменной (результативного признака);

x1, х2 _ независимые переменные (факторные признаки);

a0, a1, a2 _ параметры уравнения,

строится следующая система нормальных уравнений:

(8.5)

Параметры этой системы могут быть найдены методом К. Гаусса.

Парные коэффициенты корреляции применяются для измерения тесноты связи между двумя из рассматриваемых переменных (без учета их взаимодействия с другими переменными). Методика расчета таких коэффициентов и их интерпретация аналогичны методике расчета линейного коэффициента корреляции в случае однофакторной связи. Если известны средние квадратические отклонения анализируемых величин, то парные коэффициенты корреляции можно рассчитать проще, по следующим формулам:

(8.6)

(8.7)

. (8.8)

Частные коэффициенты корреляции. Однaкo в реальныx условиях все переменные, как правило, взaимoсвязaны. Тeснота этой связи определяется частными кoэффициентами корреляции, которые характеризуют степень и влияние одного из аргументов на функцию при условии, что остальные независимые переменные закреплены на постоянном уровне. В зависимости от количества переменных, влияние которых исключается, частные коэффициенты корреляции могут быть различного порядка: при исключении влияния одной переменной получаем частный коэффициент корреляции первого порядка; при исключении влияния двух переменных _ второго порядка и т.д. Парный коэффициент корреляции между функцией и аргументом обычно не равен соответствующему частному коэффициенту.

Частный коэффициент корреляции первого порядка между признаками x1 и y при исключении влияния признака х2 вычисляют по формуле:

(8.9)

Зависимость y от х2 при исключенном влиянии x1 рассчитывают по формуле:

(8.10)

Можно рассчитать взаимосвязь факторных признаков при исключении влияния результативного признака:

(8.11)

где r _ парные коэффициенты корреляции между соответствующими признаками.

Показателем тесноты связи, устанавливаемой между результативными и двумя или более факторными признаками, является совокупный коэффициент множественной корреляции _ . В случае линейной двухфакторной связи совокупный коэффициент множественной корреляции может быть рассчитан по формуле:

(8.12)

где r _ линейные коэффициенты корреляции (парные); подстрочные индексы показывают, между какими признаками они исчисляются.

Совокупный коэффициент множественной корреляции измеряет одновременное влияние факторных признаков на результативный. Его значения находятся в пределах _1 до +1. Чем меньше наблюдаемые значения изучаемого показателя отклоняются от линии множественной регрессии, тем корреляционная связь является более интенсивной, а следовательно, значение R ближе к единице.

Совокупный коэффициент множественной детерминации. Величина R2 называется совокупным коэффициентом множественной детерминации . Она показывает, какая доля вариации изучаемого показателя объясняется влиянием факторов, включенных в уравнение множественной регрессии. Значение совокупного коэффициента множественной детерминации находится в пределах от 0 до 1. Поэтому, чем ближе R2 к единице, тем вариация изучаемого показателя в большей мере характеризуется влиянием отобранных факторов.

Понятие о многофакторном корреляционно-регрессионном анализе;

Для многофакторного корреляционного анализа математически задача формулируется следующим образом: требуется найти аналитическое выражение, наилучшим образом отражающее связь между факторными признаками и результативными:

Наиболее сложным представляется выбор формы связи, т.к. графический метод здесь неприемлем. Можно опираться на теоретические знания, на опыт предыдущих исследований, а при отсутствии таких сведений можно определить вид связи опытным путем, т.е. путем перебора функций разных видов. Однако это сопряжено с большим количеством лишних расчетов.

Поскольку любую функцию многих переменных можно свести к линейному виду, то уравнение множественной регрессии можно искать в линейной форме:

.

В случае неадекватности линейного уравнения множественной регрессии рекомендуется повышать порядок уравнения, пока не удастся подобрать кривую, соответствующую данной статистической информации. При этом, как бы удачно не был выбран вид функции, нельзя ожидать полного соответствия расчетных ух и фактических у значений изучаемого показателя, так как уравнение множественной регрессии учитывает влияние (среднее) на результативный признак не всех, а лишь основных, существенных факторов. Действие остальных неучтенных факторов и вызывает разброс фактических значений вокруг расчетных.

С помощью многофакторного корреляционного анализа находятся различного рода характеристики тесноты связи между изучаемым показателем и факторами: парные, частные и множественные коэффициенты корреляции, множественный коэффициент детерминации.

Парные коэффициенты корреляции. Для измерения тесноты связи между двумя из рассматриваемых переменных (без учета их взаимодействия с другими переменными) применяются парные коэффициенты корреляции. Методика расчета таких коэффициентов и их интерпретация аналогичны линейному коэффициенту корреляции в случае однофакторной связи.

Частные коэффициенты корреляции. Однако в реальных условиях все переменные, как правило, взаимосвязаны. Теснота этой связи определяется частными коэффициентами корреляции, которые характеризуют степень влияния одного из аргументов на функцию при условии, что остальные независимые переменные закреплены на постоянном уровне. В зависимости от количества переменных, влияние которых исключается (элиминируется), частные коэффициенты корреляции могут быть различного порядка. При исключении влияния одной переменной получаем частный коэффициент корреляции первого порядка; при исключении влияния двух переменных – второго порядка и т. д. Парный коэффициент корреляции между функцией и аргументом обычно не равен соответствующему частному коэффициенту.

Частный коэффициент корреляции первого порядка между признаками у и х1 при исключенном влиянии признака х2 вычисляется по формуле

где r – парные коэффициенты корреляции между соответствующими признаками.

Совокупный коэффициент множественной корреляции. Показателем тесноты связи, устанавливаемой между результативным и двумя или более факторными признаками, является совокупный коэффициент множественной корреляции R. Он служит основным показателем линейной корреляционной связи. В случае линейной двухфакторной связи совокупный коэффициент множественной корреляции может быть рассчитан по формуле

где r – линейные коэффициенты корреляции (парные), а подстрочные индексы показывают, между какими признаками они исчисляются.

Совокупный коэффициент множественной корреляции измеряет одновременное влияние факторных признаков на результативный. Его значения находятся в пределах от 0 до 1. Чем меньше наблюдаемые значения изучаемого показателя отклоняются от линии множественной регрессии, тем корреляционная связь является более интенсивной, а, следовательно, величина R ближе к единице.

Читать еще:  Методические основы экономического анализа

Совокупный коэффициент множественной детерминации. Величина R 2 называется совокупным коэффициентом множественной детерминации. Она показывает, какая доля вариации изучаемого показателя объясняется влиянием факторов, включенных в уравнение множественной регрессии. Значения совокупного коэффициента множественной детерминации находятся в пределах от 0 до 1. Поэтому, чем R 2 ближе к единице, тем вариация изучаемого показателя в большей мере характеризуется влиянием отобранных факторов.

Задачей многофакторного регрессионного анализа является построение уравнения множественной регрессии и нахождение неизвестных параметров а, а1, . аn, выбранной функции. Параметры уравнения, как и в случае парной регрессии, находятся по способу наименьших квадратов.

Так, для расчета параметров простейшего уравнения множественной регрессии – линейной двухфакторной регрессии

где ух – расчетные значения результативного признака-функции;

строится следующая система нормальных уравнений:

;

;

.

Для получения данной системы нужно составить вспомогательную; таблицу значений: х1, х2, у, ух1, ух2, х1х2, х1 2 , х2 2 .

Каждый коэффициент этого уравнения, кроме а, показывает степень влияния соответствующего фактора на анализируемый показатель (при фиксированном положении на среднем уровне остальных факторов), и все эти коэффициенты называются коэффициентами регрессии и показывают, как меняется результативный признак при изменении соответствующего факторного на 1.

Однако коэффициенты регрессии не могут сами по себе определить, какие из них оказываю: наибольшее влияние на исследуемый показатель (поскольку они измерены различными единицами), а также в развитии каких факторов заложены крупные резервы его улучшения (так как не учитывается вариация факторов).

Для этого должны быть вычислены частные коэффициенты эластичности (Эi) итак называемые βi (бета-коэффициенты).

Различия в единицах измерения факторов устраняются с помощью частных коэффициентов эластичности, которые рассчитываются по формуле

где ai – коэффициент регрессии при i-м факторе;

– среднее значение i-го фактора;

– среднее значение изучаемого показателя.

Частные коэффициенты эластичности показывают, на сколько процентов в среднем изменяется анализируемый показатель с измененном на 1% каждого фактора при фиксированном положении других факторов.

Для определения факторов, в развитии которых заложены наиболее крупные резервы улучшения (с точки зрения целей исследования) изучаемого показателя, необходимо учесть различия в степени варьирования вошедших в уравнение факторов. Это можно сделать с помощью βi — коэффициентов, которые вычисляются по формуле

где – среденее квадратическое отклонение i-го фактора;

– среденее квадратическое отклонение показателя.

βi – коэффициент показывает, на какую часть среднего квадратического отклонения изменяется результативный признак с изменением соответствующего факторного признака на величину его среднего квадратического отклонения.

Методика многофакторного корреляционного анализа

Экономические явления и процессы хозяйственной деятельности предприятий зависят от большого количества факторов. Как правило, каждый фактор в отдельности не определяет изучаемое явление во всей полноте. Только комплекс факторов в их взаимосвязи может дать более или менее полное представление о характере изучаемого явления.

Многофакторный корреляционный анализ состоит из нескольких этапов.

На первом, этапе определяются факторы, которые оказывают воздействие на изучаемый показатель, и отбираются наиболее существенные для корреляционного анализа.

На втором этапе собирается и оценивается исходная информация, необходимая для корреляционного анализа.

На третьем этапе изучается характер и моделируется связь между факторами и результативным показателем, то есть подбирается и обосновывается математическое уравнение, которое наиболее точно выражает сущность исследуемой зависимости.

На четвертом этапе проводится расчет основных показателей связи корреляционного анализа.

На пятом этапе дается статистическая оценка результатов корреляционного анализа и практическое их применение.

Отбор факторов для корреляционного анализа является очень важным моментом в экономическом анализе. От того, насколько правильно он сделан, зависит точность выводов по итогам анализа. Главная роль при отборе факторов принадлежит теории, а также практическому опыту анализа. При этом необходимо придерживаться следующих правил.

1. При отборе факторов в первую очередь следует учитывать причинно-следственные связи между показателями, так как только они раскрывают сущность изучаемых явлений. Анализ же таких факторов, которые находятся только в математических соотношениях с результативным показателем, не имеет практического смысла.

2. При создании многофакторной корреляционной модели необходимо отбирать самые значимые факторы, которые оказывают решающее воздействие на результативный показатель, так как охватить все условия и обстоятельства практически невозможно. Факторы, которые имеют критерий надежности по Стьюденту меньше табличного, не рекомендуется принимать в расчет.

3. Все факторы должны быть количественно измеримы, т.е. иметь единицу измерения, и информация о них должна содержаться в учете и отчетности.

4. В корреляционную модель линейного типа не рекомендуется включать факторы, связь которых с результативным показателем имеет криволинейный характер.

5. Не рекомендуется включать в корреляционную модель взаимосвязанные факторы. Если парный коэффициент корреляции между двумя факторами больше 0,85, то по правилам корреляционного анализа один из них необходимо исключить, иначе это приведет к искажению результатов анализа.

6. Нежелательно включать в корреляционную модель факторы, связь которых с результативным показателем носит функциональный характер.

Большую помощь при отборе факторов для корреляционной. модели оказывают аналитические группировки, способ сопоставления параллельных и динамических рядов, линейные графики. Благодаря им можно определить наличие, направление и форму зависимости между изучаемыми показателями. Отбор факторов можно производить также в процессе решения задачи корреляционного анализа на основе оценки их значимости по критерию Стьюдента, о котором будет сказано ниже.

Решение задач многофакторного корреляционного анализа произво­дится на компьютерах по типовым программам.

Многофакторный корреляционный анализ позволяет изучить закономерности изменения результативного показателя в зависимости от поведения разных факторов, определить их влияние на величину результативного показателя, установить, какие из них являются основными, а какие второстепенными. Этим достигается более объективная оценка деятельности предприятия, более точное и полное определение внутрихозяйственных резервов и планового уровня показателей.

Метод корреляционного анализа: пример. Корреляционный анализ — это.

В научных исследованиях часто возникает необходимость в нахождении связи между результативными и факторными переменными (урожайностью какой-либо культуры и количеством осадков, ростом и весом человека в однородных группах по полу и возрасту, частотой пульса и температурой тела и т.д.).

Вторые представляют собой признаки, способствующие изменению таковых, связанных с ними (первыми).

Понятие о корреляционном анализе

Существует множество определений термина. Исходя из вышеизложенного, можно сказать, что корреляционный анализ — это метод, применяющийся с целью проверки гипотезы о статистической значимости двух и более переменных, если исследователь их может измерять, но не изменять.

Читать еще:  Анализ содержания книги это

Есть и другие определения рассматриваемого понятия. Корреляционный анализ — это метод обработки статистических данных, заключающийся в изучении коэффициентов корреляции между переменными. При этом сравниваются коэффициенты корреляции между одной парой или множеством пар признаков, для установления между ними статистических взаимосвязей. Корреляционный анализ — это метод по изучению статистической зависимости между случайными величинами с необязательным наличием строгого функционального характера, при которой динамика одной случайной величины приводит к динамике математического ожидания другой.

Понятие о ложности корреляции

При проведении корреляционного анализа необходимо учитывать, что его можно провести по отношению к любой совокупности признаков, зачастую абсурдных по отношению друг к другу. Порой они не имеют никакой причинной связи друг с другом.

В этом случае говорят о ложной корреляции.

Задачи корреляционного анализа

Исходя из приведенных выше определений, можно сформулировать следующие задачи описываемого метода: получить информацию об одной из искомых переменных с помощью другой; определить тесноту связи между исследуемыми переменными.

Корреляционный анализ предполагает определение зависимости между изучаемыми признаками, в связи с чем задачи корреляционного анализа можно дополнить следующими:

  • выявление факторов, оказывающих наибольшее влияние на результативный признак;
  • выявление неизученных ранее причин связей;
  • построение корреляционной модели с ее параметрическим анализом;
  • исследование значимости параметров связи и их интервальная оценка.

Связь корреляционного анализа с регрессионным

Условия использования метода

Результативные факторы зависят от одного до нескольких факторов. Метод корреляционного анализа может применяться в том случае, если имеется большое количество наблюдений о величине результативных и факторных показателей (факторов), при этом исследуемые факторы должны быть количественными и отражаться в конкретных источниках. Первое может определяться нормальным законом — в этом случае результатом корреляционного анализа выступают коэффициенты корреляции Пирсона, либо, в случае, если признаки не подчиняются этому закону, используется коэффициент ранговой корреляции Спирмена.

Правила отбора факторов корреляционного анализа

При применении данного метода необходимо определиться с факторами, оказывающими влияние на результативные показатели. Их отбирают с учетом того, что между показателями должны присутствовать причинно-следственные связи. В случае создания многофакторной корреляционной модели отбирают те из них, которые оказывают существенное влияние на результирующий показатель, при этом взаимозависимые факторы с коэффициентом парной корреляции более 0,85 в корреляционную модель предпочтительно не включать, как и такие, у которых связь с результативным параметром носит непрямолинейный или функциональный характер.

Отображение результатов

Результаты корреляционного анализа могут быть представлены в текстовом и графическом видах. В первом случае они представляются как коэффициент корреляции, во втором — в виде диаграммы разброса.

При отсутствии корреляции между параметрами точки на диаграмме расположены хаотично, средняя степень связи характеризуется большей степенью упорядоченности и характеризуется более-менее равномерной удаленностью нанесенных отметок от медианы. Сильная связь стремится к прямой и при r=1 точечный график представляет собой ровную линию. Обратная корреляция отличается направленностью графика из левого верхнего в нижний правый, прямая — из нижнего левого в верхний правый угол.

Трехмерное представление диаграммы разброса (рассеивания)

Помимо традиционного 2D-представления диаграммы разброса в настоящее время используется 3D-отображение графического представления корреляционного анализа.

Также используется матрица диаграммы рассеивания, которая отображает все парные графики на одном рисунке в матричном формате. Для n переменных матрица содержит n строк и n столбцов. Диаграмма, расположенная на пересечении i-ой строки и j-ого столбца, представляет собой график переменных Xi по сравнению с Xj. Таким образом, каждая строка и столбец являются одним измерением, отдельная ячейка отображает диаграмму рассеивания двух измерений.

Оценка тесноты связи

Теснота корреляционной связи определяется по коэффициенту корреляции (r): сильная — r = ±0,7 до ±1, средняя — r = ±0,3 до ±0,699, слабая — r = 0 до ±0,299. Данная классификация не является строгой. На рисунке показана несколько иная схема.

Пример применения метода корреляционного анализа

В Великобритании было предпринято любопытное исследование. Оно посвящено связи курения с раком легких, и проводилось путем корреляционного анализа. Это наблюдение представлено ниже.

Фермеры, лесники и рыбаки

Шахтеры и работники карьеров

Производители газа, кокса и химических веществ

Изготовители стекла и керамики

Работники печей, кузнечных, литейных и прокатных станов

Работники электротехники и электроники

Инженерные и смежные профессии

Изготовители рабочей одежды

Работники пищевой, питьевой и табачной промышленности

Производители бумаги и печати

Производители других продуктов

Художники и декораторы

Водители стационарных двигателей, кранов и т. д.

Рабочие, не включенные в другие места

Работники транспорта и связи

Складские рабочие, кладовщики, упаковщики и работники разливочных машин

Работники службы спорта и отдыха

Администраторы и менеджеры

Профессионалы, технические работники и художники

Начинаем корреляционный анализ. Решение лучше начинать для наглядности с графического метода, для чего построим диаграмму рассеивания (разброса).

Она демонстрирует прямую связь. Однако на основании только графического метода сделать однозначный вывод сложно. Поэтому продолжим выполнять корреляционный анализ. Пример расчета коэффициента корреляции представлен ниже.

С помощью программных средств (на примере MS Excel будет описано далее) определяем коэффициент корреляции, который составляет 0,716, что означает сильную связь между исследуемыми параметрами. Определим статистическую достоверность полученного значения по соответствующей таблице, для чего нам нужно вычесть из 25 пар значений 2, в результате чего получим 23 и по этой строке в таблице найдем r критическое для p=0,01 (поскольку это медицинские данные, здесь используется более строгая зависимость, в остальных случаях достаточно p=0,05), которое составляет 0,51 для данного корреляционного анализа. Пример продемонстрировал, что r расчетное больше r критического, значение коэффициента корреляции считается статистически достоверным.

Использование ПО при проведении корреляционного анализа

Описываемый вид статистической обработки данных может осуществляться с помощью программного обеспечения, в частности, MS Excel. Корреляционный анализ в Excel предполагает вычисление следующих парамет­ров с использованием функций:

1. Коэффициент корреляции определяется с помощью функции КОРРЕЛ [CORREL](массив1; массив2). Массив1,2 — ячейка интервала значений результативных и факторных переменных.

Линейный коэффициент корреляции также называется коэффициентом корреляции Пирсона, в связи с чем, начиная с Excel 2007, можно использовать функцию ПИРСОН (PEARSON) с теми же массивами.

Графическое отображение корреляционного анализа в Excel производится с помощью панели «Диаграммы» с выбором «Точечная диаграмма».

После указания исходных данных получаем график.

2. Оценка значимости коэффициента парной корреляции с использованием t-критерия Стьюдента. Рассчитанное значение t-критерия сравнивается с табличной (критической) величиной данного показателя из соответствующей таблицы значений рассматриваемого параметра с учетом заданного уровня значимости и числа степеней свободы. Эта оценка осуществляется с использованием функции СТЬЮДРАСПОБР (вероятность; степени_свободы).

3. Матрица коэффициентов парной корреляции. Анализ осуществляется с помощью средства «Анализ данных», в котором выбирается «Корреляция». Статистическую оценку коэффициентов парной корреляции осуществляют при сравнении его абсолютной величины с табличным (критическим) значением. При превышении расчетного коэффициента парной корреляции над таковым критическим можно говорить, с учетом заданной степени вероятности, что нулевая гипотеза о значимости линейной связи не отвергается.

Читать еще:  Анализ организационной структуры организации на примере

В заключение

Использование в научных исследованиях метода корреляционного анализа позволяет определить связь между различными факторами и результативными показателями. При этом необходимо учитывать, что высокий коэффициент корреляции можно получить и из абсурдной пары или множества данных, в связи с чем данный вид анализа нужно осуществлять на достаточно большом массиве данных.

После получения расчетного значения r его желательно сравнить с r критическим для подтверждения статистической достоверности определенной величины. Корреляционный анализ может осуществляться вручную с использованием формул, либо с помощью программных средств, в частности MS Excel. Здесь же можно построить диаграмму разброса (рассеивания) с целью наглядного представления о связи между изучаемыми факторами корреляционного анализа и результативным признаком.

Применение методов корреляционного и факторного анализа в психолого-педагогических исследованиях Текст научной статьи по специальности «Математика»

Похожие темы научных работ по математике , автор научной работы — Коростелкин Б.Г.

Текст научной работы на тему «Применение методов корреляционного и факторного анализа в психолого-педагогических исследованиях»

ПРИМЕНЕНИЕ МЕТОДОВ КОРРЕЛЯЦИОННОГО И ФАКТОРНОГО АНАЛИЗА В ПСИХОЛОГО-ПЕДАГОГИЧЕСКИХ ИССЛЕДОВАНИЯХ

Большинство зависимостей в психологии и педагогике имеют характер не функциональной, а статистической связи. В статистической связи между двумя элементами всегда есть элементы случайности, поэтому статистическая связь проявляется только как тенденция. Так, например, связь между успеваемостью в начальных классах и возрастом, в котором дети научились читать, имеет статистический характер, так как можно встретить слабоуспевающего ребенка, который научился читать еще до школы и наоборот.

В статистике зависимость между двумя и более переменными называют корреляцией (от лат. «связь», «соотношение»), а в качестве показателя степени и величины статистической связи используют коэффициент корреляции (К). С изменением коэффициента корреляции изменяется характер связи между переменными, причем если:

• К = 1, то имеет место прямая функциональная связь;

• К = — 1, то связь имеет обратнофункциональный характер;

• К = 0, то связь между признаками отсутствует;

• !К! > 0, 6, то корреляционная связь считается выраженной;

где ЕI и Е | т — погрешности отображения.

По исходным представлениям о количестве общих факторов в корреляционной матрице исторически выделилось три вида факторного анализа:

• однофакторный (по Спирмену);

• бифакторный (по Холзингеру);

• мультифакторный (по Терсону).

При факторизации любым методом первым выделяется всегда общий фактор. Остальные могут быть общими либо групповыми. Во многих случаях оказывается выгодным использовать более простую однофакторную модель, дающую сходные с мультифакторным анализом результаты. Ниже подробно будет рассмотрен однофакторный метод. За недостатком места бифакторная и мультифакторная модели не будут рассматриваться.

Процедура извлечения факторных зарядов (факторизации) по методу Спирмена относится лишь к общему фактору и состоит из трех этапов. На первом этапе для каждой _]-й переменной вычисляются заряды я1 общего фактора по следующей формуле:

где (г): — сумма всех коэффициентов корреляции в ]-м столбце корреляционной матрицы;

(г)2 — квадрат предыдущей суммы;

(г2): — сумма квадратов всех коэффициентов корреляции в ]-м столбце

(ГК — сумма всех коэффициентов корреляции в корреляционной матрице.

Определенные таким путем факторные заряды а. образуют факторную матрицу в которой всего один столбец и п строк (по числу переменных: ]’ = 1, 2, . п):

На втором этапе факторного анализа по методу Спирмена осуществляется транспортирование факторной матрицы — столбца. Транспортированная матрица ^т) содержит одну строку с п столбцами:

Далее, согласно уравнению, определяется репродуцированная корреляционная матрица

каждый элемент которой определяется по формуле

где г * . к — репродуцированный коэффициент корреляции; а 1 — факторный заряд ]-й переменной,

а к — факторный заряд к-й переменной (] = 1, 2, .. .п; к = 1, 2,. п; ] Ф к). По правилу умножения столбцов цифр на строку матрицы, каждая цифра столбца последовательно умножается на каждую цифру строки и результаты парных произведений записываются в строку аналогичной матрицы.

Третий этап процедуры состоит в определении остаточной корреляционной матрицы и проверки возможности рассматривать остаточную матрицу как матрицу погрешностей.

Остаточная корреляционная матрица определяется как разность между исходной и репродуцированной корреляционными матрицами:

где К 0 — исходная,

К 2 — остаточная корреляционные матрицы. Обозначив элементы остаточной матрицы г * к , напомним, что они находятся для каждой пары элементов г . к и г * . к по уравнению

Далее требуется осуществить проверку равенства

где E — матрица погрешностей. При проверке обычно исходят из того, что в остаточной матрице, если она действительно образована погрешностями, остаточные коэффициенты корреляции r j k распределены нормально со средним значением, равным нулю. Следовательно, достаточно определить стандартное отношение сг и проверить условие

Если оно выполняется, то остаточную матрицу считают за матрицу погрешностей, если же оно не выполняется, то значит в остаточной матрице, наряду с погрешностями, содержаться заряды других общих факторов (по крайней мере одного), которые можно извлечь другими методами факторного анализа.

Величину сг можно определить либо через математическое ожидание, либо по более простой формуле:

где N — количество испытуемых (в общем случае — число пар коррелируемых значений).

Рассмотрим теперь процедуру однофакторного анализа по Спирмену на примере*.

Пример. В исследовании индивидуальных различий при запоминании разных видов материала изучались следующие шесть видов заучиваемого материала: 1) картинки, 2) слова конкретные, 3) слова абстрактные, 4) числа двузначные, 5) числа трехзначные, 6) бессмысленные слоги. Оценкой служило количество повторений, потребовавшихся для полного запоминания.

Ряды оценок, полученных для 32 испытуемых, коррелировались для каждой пары видов заучиваемого материала. Корреляционная матрица порядка 6 представлена в верхней части табл.1, а в её нижней части представлены промежуточные и окончательные данные, соответствующие формуле (3).

Факторная матрица F представлена в табл. 2. Умножая, согласно (4), матрицу F на её транспозицию Fp получили репродуцированную матрицу Rj5 (табл. 3). Далее, вычитая, согласно (5) и (6), матрицу Rj из исходной корреляционной матрицы R0, получаем остаточную матрицу R2, (табл. 4). Выполним для этой матрицы проверку условия (7). Максимальное абсолютное значе-

* См.: Теплов Б.М. Простейшие способы факторного анализа // Психологические особенности высшей нервной деятельности человека. М., 1967. Т.5.

ние сг в соответствии с формулой (8) составляет

Ссылка на основную публикацию
Adblock
detector