Webbc.ru

Веб и кризис
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Анализ таблиц сопряженности

Анализ таблиц сопряженности

Анализ таблиц сопряженности применяется для решения задач, которые могут быть сформулированы следующим образом:

1. Необходимо сравнить два или более распределения между собой. Например: разли- чаются ли мужчины и женщины по распределению предпочтений пяти политических лидеров?

2. Необходимо определить связь между двумя номинативными признаками (между классификациями объектов по двум разным основаниям). Например: связано ли соотноше- ние предпочтений трех групп напитков (соки, лимонады, минеральные воды) с сезонностью (зима, весна, лето, осень)?

В подобных случаях подразумевается анализ таблиц сопряженности, в которых столбцы соответствуют сравниваемым распределениям (градациям одной номинативной пе- ременной), а строки соответствуют градациям сравниваемых распределений (градациям дру- гой номинативной переменной).

Формулировка проверяемой Н0: классификация объектов (людей, событий) по одному основанию не зависит от их классификации по другому основанию.

Исходные данные: определена принадлежность каждого объекта выборки к одной из градаций одной номинативной переменной и к одной из градаций второй номинативной пе- ременной. Иными словами, две номинативные переменные измерены на выборке объектов. Строки таблицы сопряженности соответствуют градациям одной номинативной пере- менной, столбцы – градациям другой номинативной переменной.

Если проверка содержательной гипотезы предполагает анализ таблиц сопряженности, то принципиальным является вопрос о размерности таблицы. Различаются два случая:

1. Общий случай (число градаций хотя бы одного из признаков больше двух).

2. Частный случай: таблицы сопряженности 2×2 (по две градации для каждой пере- менной).

Эти случаи различаются как порядком расчетов, так и особенностями интерпретации.

Число градаций больше 2

По сравнению с анализом классификаций, специфика применения критерия χ2- Пирсона к таблицам сопряженности заключается в том, что теоретические частоты рассчи-

тываются отдельно для каждой ячейки таблицы. Таким образом, число слагаемых в формуле данного критерия равно количеству ячеек таблицы сопряженности и равно Р= k× l, где k – число строк, а l – число столбцов.

Формула для расчета теоретической частоты для ячейки i – строки и j – столбца:

где fi – сумма частот во всех ячейках i – строки; fj – сумма частот во всех ячейках j – столбца; N – сумма частот всей таблицы сопряженности.

Таблицы сопряженности 2×2

Существует большое разнообразие различных ситуаций, когда по результатам иссле- дования может быть построена таблица сопряженности 2×2. Их объединяет то, что объекты (испытуемые, события) классифицированы по двум основаниям, каждое из которых пред- ставляет собой дихотомию. Важно различать два варианты такой классификации объек- тов:

1. По двум различным дихотомическим основаниям – случай независимых выборок. Для этого случая применяется критерий χ2-Пирсона.

2. По одному и тому же дихотомическому основанию дважды (например, до и после воздействия) – случай зависимых выборок. Во втором случае более адекватным является критерий Мак-Нимара.

Независимые выборки

Это наиболее часто встречающаяся ситуация применения таблиц 2×2, когда одна группа объектов классифицируется по двум дихотомическим основаниям и проверяется ги- потеза о связи этих двух оснований классификации.

По сравнению с другими таблицами сопряженности особенность таблиц 2×2 проявля- ется в нескольких отношениях:

1. Эти таблицы могут быть построены разными способами, но только один из них яв- ляется правильным в отношении применимости критерия χ2-Пирсона (см.формулу 2.7).

2. Допустима проверка направленных альтернатив. Соответственно меняется способ определения р-уровня значимости, он делится на 2.

3. В некоторых случаях при расчете χ2-Пирсона необходимо введение поправки на не- прерывность Йетса (см. формулу 2.8). χ2-Пирсона с поправкой на непрерывность применим для анализа таблиц сопряженности 2×2, когда N≥20, а если хотя бы одна из теоретических частот меньше 5, то при N≥40. Такая поправка используется в большинстве случаев для про- верки направленных альтернатив.

Зависимые выборки

Структура исходных данных соответствует ситуации, когда одна выборка объектов классифицирована на две группы дважды по одному и тому же основанию. В таких ситуаци- ях применяется критерий Мак-Нимара, который позволяет сопоставить долю тех, кто не об- ладал некоторой характеристикой до воздействия (0), но стал обладать ею после воздействия (1), с долей тех, кто обладал этой характеристикой до воздействия (1) и перестал обладать ею после воздействия (0). Иначе говоря, метод позволяет сопоставить диагональные элементы таблицы сопряженности 2×2, построенной непосредственно по дважды проведенной дихо- томической классификации одной и той же выборки:

Статистический анализ таблицы сопряжённости двух номинальных признаков

МЕТОДЫ СТАТИСТИЧЕСКОГО АНАЛИЗА ДАННЫХ В ЭМПИРИЧЕСКОМ ИССЛЕДОВАНИИ

АНАЛИЗ ПАРНОГО РАСПРЕДЕЛЕНИЯ ПРИЗНАКОВ

Парное (двухмерное) распределение признаков — это распределение совокупности по двум переменным. Если переменная № 1 влияет на переменную №2, то первую называют независимой переменной, а вторую — зависимой.1

В исследовательской практике нередки случаи, когда нельзя точно определить, какая именно переменная оказывает влияние, а какая — объект воздействия. Например, что считать независимой переменной — оценку собственного здоровья или оценку политической ситуации в стране? В таких случаях лучше говорить о взаимозависимости признаков.

Анализ двухмерных и трёхмерных распределений признаков, измеренных с помощью номинальных и порядковых шкал, осуществляется чаще всего на основе данных, полученных из таблиц двухмерного (парного) распределения. Эти таблицы нередко называют таблицами сопряжённости. В основе таблицы двухмерного распределения лежат два признака. Приведём пример простейшей таблицы парного распределения, основанной на двух номинальных признаках.

Влияние участия в последних выборах на характер потребительского намерения

Из двух переменных – наличия детей и характера покупательского намерения — независимой переменной является наличие детей. Естественно, что именно оно может оказать влияние на намерение купить товар.

Для конструирования и описания таблицы следует:

1. Разделить респондентов на подгруппы, имеющие различные значения независимой переменной

2. Сравнить выделенные подгруппы при помощи процентов лиц, имеющих определенные значения зависимой переменной

Наличие детей является независимой переменной, поэтому массив был разделен на подгруппы имеющих и не имеющих детей. Соответственно за 100% берётся численность респондентов, имеющих значения независимой переменной — “имеет” и “не имеет”.

Описать данную таблицу мы можем, сравнив группы имеющих и не имеющих детей при помощи процентов лиц, обладающих определенным значением зависимой переменной. В нашем случае это намерение купить товар определённой марки. Однако, описывать таблицу сопряженности мы имеем право лишь после расчёта значения определённого статистического критерия.

Читать еще:  Анализ микроокружения предприятия

Статистический анализ таблицы сопряжённости двух номинальных признаков

Приведём пример статистического анализа взаимосвязи двух номинальных признаков: участия в последних выборах и потребительских предпочтений.

Для того, чтобы ответить на вопрос, существует ли взаимосвязь между наличием детей и характером покупательского намерения, следует проанализировать таблицу сопряжённости данных двух признаков, применив статистический критерий.

Статистический критерий – правило, при помощи которого проверяются статистические гипотезы. Нулевая гипотеза в данном случае — предположение о статистической независимости рассматриваемых переменных, то есть наличие детей не влияет на характер потребительских намерений. Альтернативная гипотеза—предположение о том, что указанные переменные взаимозависимы, их связь является статистически значимой.

Корреляционная связь является значимой, когда с высокой степенью уверенности можно утверждать, что она вызвана не случайными причинами – колебаниями выборочных показателей вокруг генерального — а наличием такой связи в генеральной совокупности. Нужно отметить, что наличие корреляционной связи необязательно означает существование причинно-следственной связи между данными признаками. Эта связь может быть следствием некой третьей причины, также оба признака могут выступать и в качестве причины, и следствия.

Доверительная вероятность Р—вероятность правильности альтернативной гипотезы. Величина, связанная с доверительной вероятностью — уровень значимости , он равен 1-Р. Это вероятность ошибки в нашем выводе о подтверждении альтернативной гипотезы. Если, например, Р=0,95, то =1-0,95=0,05.

Применим для проверки нулевой гипотезы статистический критерий ,он применяется для анализа взаимосвязей, прежде всего номинальных признаков. В случае, если расчётное значение критерия превысит его критическое значение, определяемое по таблицам распределения ,нулевая гипотеза отвергается. Нужно отметить, что расчёты для определения значимости корреляционной связи осуществляют, основываясь на постулате, что выборка была простой случайной.

Расчётное значение (основа расчётов – таблица 2)

Приемлемым для общественных наук является уровень значимости, равный 0,05 и меньше, то есть вероятность ошибки пять шансов из ста. Если исследователь получает в процессе машинной обработки данных информацию именно о таком уровне значимости, то он может с полным основанием формулировать вывод о наличии связи между признаками. Если же уровень значимости оказался равным величине, большей 0,05, например, составил 0,07, то делать заключение такого рода нельзя.

Формула расчёта числа степеней свободы для таблицы сопряженности имеет следующий вид: df=(c-1)(r-1), где с-число столбцов, r-число строк таблицы. Для нашего случая с=3; r=2, поэтому df=(3-1)(2-1)=2.

Определив число степеней свободы и задав уровень значимости, равный 0,05, мы можем определить критическое значение данного критерия по специальным таблицам.

Приведём фрагмент таблицы «Значения — критерия Пирсона» для уровня значимости 0,05.

Как видно из таблицы, критическое значение для двух степеней свободы составляет 5,99, расчётное же значение критерия – 70,39. . То есть расчётное значение критерия превышает критическое. Следовательно, статистическая связь между наличием детей и характером потребительских намерений является значимой.

Описывая таблицу 2, исследователь должен указать, что покупательские предпочтения различаются в группах людей, имеющих и не имеющих детей. Следует отметить, что наиболее существенно группы, имеющие и не имеющие детей, отличаются по доле приверженцев марки С. Среди имеющих детей эту марку выбрали 47,6%, а среди не имеющих — всего 28,7% (см. табл. 2). Если в первой группе товар марки С стоит на первом месте по “популярности”, то во второй группе — на третьем.

Убедившись в том, что связь между исследуемыми переменными является статистически значимой, можно определить её силу (тесноту).

Коэффициент корреляцииявляется мерой зависимости между признаками. Его численное значение и знак указывают на силу (тесноту) и направление корреляционной связи. Численное значение коэффициента корреляции указывает на тесноту связи и может по модулю меняться от нуля до единицы. Чем ближе значение коэффициента к единице, тем связь сильнее. Будем считать связь тесной (сильной), если значение коэффициента корреляции составляет 0,7 и более. Если коэффициент равен 0,3-0,699, то связь умеренная. Значения менее 0,3 указывают на слабую связь.

Довольно часто для анализа тесноты взаимосвязи двух номинальных признаков применяется коэффициент корреляции Крамера. Он изменяется от 0 до 1 и указывает только на тесноту, а не направление связи. Поэтому данный коэффициент не может иметь отрицательных значений. Коэффициент Крамера считается значимым, если эмпирическое значение критерия , рассчитанное для таблицы, окажется больше критического, то есть в том случае, если связь между признаками, положенными в основу таблицы, будет статистически значимой (то есть она существует не только в выборке, но и в генеральной совокупности).

(2)

N — объём выборки; r—число строк; k—число столбцов в таблице; число строк в таблице №2 равно двум, число столбцов – трём.

Min (r-1, k-1) — минимальная из двух величин r-1 и k-1. В нашем случае минимальным из чисел, равных 2-1 и 3-1 является 2-1=1.

К=

Так как значение коэффициента составляет менее 0,3, то связь между анализируемыми признаками является слабой. Однако, она статистически значима; значимость мы уже проверили с помощью критерия (см. табл.3)

Анализ таблиц сопряженностей в ходе статистического анализа социологической информации

Таблицы сопряженностей

Таблица сопряженностей, или таблица факторов в статистике — это способ представления совместного распределения каких-то двух переменных для исследования взаимосвязи между этими переменными.

Вообще, таблица сопряженностей считается наиболее универсальным и удобным инструментом изучения определенных статистических отношений, так как такая таблица способна представлять переменные абсолютно в любом уровне измерения.

Стоит отметить, что таблицы сопряженностей довольно часто используются в процессе проверки гипотезы о наличии некой связи между двумя конкретными признаками с применением критерия Фишера или критерия Пирсона.

Все строки таблицы сопряженностей всегда соответствуют значениям одной какой-то переменной, а столбцы — значениям другой переменной. Так, количественные шкалы сначала должны быть сгруппированы в интервалы.

Анализ таблиц сопряженностей

В структуре таблицы всегда есть подлежащее и сказуемое. Подлежащим является сам объект (список его структурных единиц или имеющихся групп), характеризующийся конкретными числовыми показателями. Подлежащее всегда располагается в строках самой таблицы. Обычно он находится в левой части таблицы.

Читать еще:  Как анализировать таблицы

Попробуй обратиться за помощью к преподавателям

Сказуемое всегда представляется в виде неких числовых показателей, характеризующих объект и находящихся в столбцах таблицы.

Все таблицы сопряженностей разделяют на:

Все одномерные таблицы обычно строятся на основе группировки имеющихся сведений по одному конкретному признаку. Так, например, на вопрос «С какой попытки Вы поступили в институт?» примерно 500 студентов ответили определенным образом, который и отражается в такой таблице.

Таблицу можно анализировать с помощью подсчета процентов от общего числа респондентов, ответивших на этот вопрос. Они представлены в последнем столбце таблицы. Сформулированный нами вопрос называется альтернативным, в нем отвечающий может выбрать только один вариант ответа, подходящий ему.

Одномерная таблица, прежде всего, позволяет анализировать структуру населения. В нашем случае это позволяет увидеть и сравнить результаты ответов на наш вопрос.

Рисунок 1. Пример одномерной таблицы сопряженностей. Автор24 — интернет-биржа студенческих работ

Задай вопрос специалистам и получи
ответ уже через 15 минут!

Двумерные таблицы направлены на расширение аналитических способностей самого исследователя. Синонимами двумерных таблиц являются такие названия, как таблица сопряжения, таблица корреляции, таблица двумерного распределения, таблица комбинированных статистических данных.

Двумерные таблицы построены на основе группировки данных по двум признакам. Анализируя информацию, можно рассчитать процент как «вертикальных», так и «горизонтальных» признаков, а также общее количество респондентов.

Рисунок 2. Пример двумерной таблицы сопряженностей. Автор24 — интернет-биржа студенческих работ

Выбор метода представления сведений в виде процентного значения напрямую зависит от поставленных целей и задач осуществляемого исследования и определяется с помощью общей логики анализа полученных данных.

Именно на месте пересечения строки и столбца таблицы указывается частота появления соответствующих значений двух каких-то признаков. Сумма частот в ряду называется предельной частотой ряда; сумма частот на столбец является предельной частотой столбца. Сумма предельных частот равна размеру выборки; их распределение является одномерным распределением какой-то переменной, которая формирует строки или столбцы этой таблицы. Так, в таблице непредвиденных обстоятельств можно увидеть и абсолютную, и, что очень важно, относительную частоту, выраженную в дробях или процентах.

Относительную частоту всегда можно рассчитать по отношению к:

  • предельной частоте на линии;
  • предельной частоте в колонке;
  • размеру выборки.

Таблицы сопряжения используются не только для проверки гипотезы о взаимосвязи между двумя определенными признаками (статистическая взаимосвязь, критерий хи-квадрат), но и для того, чтобы измерить близость имеющейся взаимосвязи.

Таблицы сопряженности считаются главным способом отражения всех доступных социологических сведений. Такие таблицы применяются (рассчитываются и анализируются) практически в каждом эмпирическом исследовании. А ведь это не случайно. Различные средства, используемые при изучении статистических закономерностей (а именно, закономерности исследования и попытки найти социолога, которые основываются на изучении таблиц сопряженностей, предлагаются современной наукой. Такие закономерности обычно основаны на правилах математической статистики.

Стоит отметить, что объектом исследования таких закономерностей являются случайные величины, а предметом исследования — параметры распределения.

Абсолютно все закономерности, которые возможно найти, используя математическую статистику, фактически представляются в виде наборов определенных параметров распределений определенных случайных величин.

Таблицы сопряжения — это, строго говоря, выборочные представления одномерных и многомерных случайных величин (во всех выборочных исследованиях вместо понятия «случайная величина» применяется понятие «признак» или его различные синонимы — «значение», «характеристика», «переменная»).

Итак, опора на анализ таблиц сопряженностей, к которому призывает социолога здравый смысл, на самом деле оправдывается серьезным исследованием концепции статистической закономерности, которое проводилось в течение нескольких веков в сфере математической статистики.

Значимость анализа таблиц сопряженности давно признана учеными. В настоящее время существует огромное количество методов соответствующего плана. Но не все они активно вовлечены в нашу социологию (парадоксальным является тот факт, что среди мало и редко используемых в большой отечественной практике методов существуют довольно интересные алгоритмы, которые сформированы советскими и российскими исследователями).

Так и не нашли ответ
на свой вопрос?

Просто напиши с чем тебе
нужна помощь

Логистическая регрессия в медицине и биологии

В серии 10 статей рассмотрены основы метода логистической регрессии. На многочисленных примерах анализа реальных массивов данных поясняется специфика использования данного метода. Приведены многочисленные уравнения логистической регрессии и ROC-кривых, полученные при анализе реальных данных.

СТАТИСТИКА УМЕЕТ МНОГО ГИТИК. С.Е. Бащинский, главный редактор Международного журнала медицинской практики, 1998; №4, с.13-15.

НЦ БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. Стандартные сроки анализа данных: для статей и докладов — 5-10 дней, для кандидатских диссертаций 1 месяц, для докторских диссертаций 1,5 месяца. (См. далее)

Анализ таблиц сопряжённости 2х2
с вычислением статистик связи (с поправкой Иэйтса)

Данная таблица вычисляет критерий хи-квадрат для таблицы сопряженности 2х2 и достигнутый уровень значимости (с поправкой Иэйтса на непрерывность). Кроме того производится оценка таких статистик связи, как отношения шансов (odds ratio), относительного риска (relative risk), чувствительности (sensitivy, Se), специфичности (specificity, Sp), прогностичность положительного результата (PVP), прогностичность отрицательного результата (PVN) а также границ 95% -ных доверительных интервалов для них. Аппроксимация для достигнутого уровня значимости дает погрешность в четвертом-пятом знаке после запятой. Такая погрешность не сказывается на решении об отвержении нулевой гипотезы. Введем данные таблицы о соотношении между приемом контрацептивных таблеток матерями, и желтухой у их детей, получающих грудное вскармливание (пример из монографии «Обучение медицинской статистике. Двадцать лекций и семинаров» под редакцией С.К.Лванга и Чжо-Ек Тыэ). Как и в предыдущей таблице числа в столбе и строке «Всего» вводить не обязательно, т.к. программа вычисляет их самостоятельно. После нажатия кнопки «Вычислить статистики» получим значение хи-квадрат равное 12,6604 при достигнутом уровне значимости равном 0,0011 . Напомним, что вычисление статистики хи-квадрат без поправки Иэйтса дает значение хи-квадрат равное 14,042.

Читать еще:  Методы экономического анализа деятельности предприятия

В том случае, когда достигнутый уровень значимости будет меньше критического, и будет принята гипотеза о наличии статистической взаимосвязи между парой качественных признаков, весьма важно идентифицировать в каких сочетаниях градаций этих признаков сконцентрирована данная взаимосвязь. Отметим, что факт наличия взаимосвязи не обязательно может трактоваться как установление причинно-следственной связи. Так как в этом случае возможны 2 ситуации.

Во-первых, действительно один из признаков может быть причиной, а второй — следствием. Во-вторых, оба признака могут быть следствиями других признаков. Однако в обоих случаях важно установить как сочетание градаций (клетки) этих двух анализируемых признаков, для которых имеет место максимальное проявление взаимосвязи. А также установить те комбинации градаций (клетки), в которых взаимосвязь отсутствует.

Следующий аспект такого углублённого анализа заключается в определении в клетках с максимальными вкладами в установленную взаимосвязь, направления этой взаимосвязи. Ниже приведена таблица сопряжённости 3*2 (3 строки и 2 столбца), в которой представлены частоты, полученные при анализе реальных данных. В данном исследовании был проведён опрос 1082 респондентов (медиков). Респонденты давали ответы на 659 вопросов. Основная цель исследования заключалась в изучении спектра лекарственных средств, применяемых в клинической практике для профилактики и лечения конкретных, наиболее распространённых заболеваний и синдромов в различных федеральных округах России, и оценить их соответствие современным рекомендациям. 3 строки данной стаблицы сопряжённости отвечают 3 специальностям респондентов. А 2 столбца означают 2 варианта ответа на вопрос об использовании конкретного препарата при конкретном заболевании.

Создание таблиц сопряженности

Создание таблиц сопряженности

Для создания таблиц сопряженности и вычисления меры связанности на их основе, выберите в меню команды Analyze (Анализ) ► Descriptive Statistics (Дескриптивные статистики) ► Crosstabs. (Таблицы сопряженности). Откроется диалоговое окно Crosstabs (см. рис. 11.1).

Рис. 11.1: Диалоговое окно Crosstabs (Таблицы cопряженности)

Список исходных переменных содержит переменные открытого файла данных. Здесь можно выбрать переменные для строк и столбцов таблицы сопряженности. Для каждого сочетания двух переменных будет создана таблица сопряженности. Например, если в списке строк (Rows) находится три переменных, а в списке столбцов (Columns) — две, то мы получим 3 x 2 = 6 таблиц сопряженности. Сначала мы построим таблицу сопряженности из переменных sex (пол) и psyche (психическое состояние). Поступите следующим образом:

Перенесите переменную sex в список строк (Rows), а переменную psyche — в список столбцов (Columns).

Щелкните на ОК, и будет создана таблица сопряженности в стандартном формате. В окне просмотра будут показаны следующие таблицы:

Case Processing Summary (Обработанные наблюдения)

Пол * Психическое состояние Crosstabulation (Таблица сопряженности)

Первая таблица содержит информацию о числе самих наблюдений; два наблюдения содержат пропущенные значения по крайней мере в одной из двух участвующих переменных. Вторая таблица — это собственно таблица сопряженности. Переменная «Психическое состояние» (psyche) является столбцовой переменной, так как каждое ее значение (крайне неустойчивое, устойчивое, . ) отображается в отдельном столбце. Переменная «Пол» (sex) — это переменная строк, так как каждое ее значение (женский, мужской) отображается в отдельной строке таблицы. Значение в каждой ячейке таблицы — количество наблюдений (частота).

Так, например, 16 респонденток оценивают свое психическое состояние как «крайне неустойчивое», а 5 респондентов-мужчин — как «очень устойчивое». Если для таблицы сопряженности приняты параметры по умолчанию, в каждой ячейке отображается только абсолютная частота. Метки переменных и значений в таблице соответствуют определениям переменных в файле данных SPSS.

Числа в последней строке и в последнем столбце (Total) показывают суммы значений соответственно по строкам и столбцам. В данном примере суммы по строкам указывают, что 44 (16+18+9+1) опрошенных — лица женского пола, а 62 — мужского. Суммы по столбцам показывают, что 19 опрошенных (16 + 3) оценивают свое психическое состояние как «крайне неустойчивое», 40 как неустойчивое, 41 как устойчивое и 6 как «Очень устойчивое». При анализе принимались в расчет 106 допустимых наблюдений. Полученные результаты мы можем интерпретировать следующим образом:

Из 106 опрошенных, которые учитывались при анализе, — 44 женщины и 62 мужчины.

16 женщин оценивают свою психику как «крайне неустойчивую», тогда как для мужчин это количество составляет только 3.

Лишь одна женщина считает свое психическое состояние «очень устойчивым», а мужчин с таким состоянием пятеро.

Даже первое впечатление, которое возникает при анализе таблицы сопряженности, свидетельствует о том, что зависимость между переменными Пол и Психическое состояние существует. Женщины считают свое психическое состояние более неустойчивым, чем мужчины. Исследуем эту зависимость чуть более детально; для этого нам понадобится точно ответить на следующие вопросы:

Существует ли зависимость вообще?

Что можно сказать об интенсивности этой зависимости?

Что можно сказать о направлении и характере этой зависимости?

Более тщательно исследовать существование зависимости позволяет вычисление значений ожидаемых частот. Чтобы определить эти значения, выполните следующие действия:

Выберите в меню команды Analyze (Анализ) ► Descriptive Statistics (Дескриптивные статистики) ► Crosstabs. (Таблицы сопряженности). В списке строк у нас должна стоять переменная sex, а в списке столбцов — переменная psyche.

Щелкните на кнопке Cells. (Ячейки). Откроется диалоговое окно Crosstabs: Cell Display (Таблицы сопряженности: Отображение ячеек). По умолчанию в ячейках таблицы сопряженности отображаются только наблюдаемые значения частот (Observed). В группе Counts (Частоты) можно выбрать один или более следующих вариантов отображения:

    Observed (Наблюдаемые): Будут отображаться наблюдаемые частоты. Это настройка по умолчанию.

    Expected (Ожидаемые): Если установить этот флажок, будут отображаться ожидаемые частоты. Они вычисляются как произведение сумм соответствующей строки и столбца, деленное на общую сумму частот. Например, ожидаемая частота для женщин с «крайне неустойчивым» психическим состоянием 7,9 = (16 + 18 + 9 + 1) x (16 + 3) / 106.

    Рис. 11.2: Диалоговое окно Crosstabs: Cell Display

    Установите флажок Expected.

    Щелкните на кнопке Continue, а затем на ОК. Вы получите следующую таблицу сопряженности.

    Пол * Психическое состояние Crosstabulation (Таблица сопряженности)

    Ссылка на основную публикацию
    Adblock
    detector