Хи-квадрат

Имеется существенное ограничение на использование критерия хи-квадрат (кроме предположения о случайном выборе наблюдений и независимости выборок) - ожидаемые частоты не должны быть очень малы.
Существует эмпирическое правило, помогающее определить минимальное значение ожидаемых частот, при котором применение критерия хи-квадрат можно считать корректным. Если количество степеней свободы df = 1, то ожидаемые частоты в каждой
ячейке не должны быть меньше 5. Если количество степеней свободы df > 1, то в таблице сопряженности не должно быть свыше 20% ячеек с ожидаемыми частотами ниже 5 и ни одной ячейки с ожидаемой частотой ниже 1.

Для таблиц сопряженности 2 х 2 с малыми частотами (меньше 10) рекомендуется рассчитывать эмпирическое значение критерия хи-квадрат, используя поправку на непрерывность Йетса (Yates’ correction for continuity)
_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________

Заказы (номинальные шкалы)


Поступил интереснейший заказ на обработку данных психологического исследования о формировании образа "Я" у пациентов с разными типами зависимостей для статьи.

Еще раз убеждаемся в том, что с одной линейкой к двум разным исследованиям подходить нельзя. Номинальные шкалы, характерные для психологических и социологических исследований, не дают расслабиться.  

Номинальная шкала (nominal scale)
Шкала, числа которой служат только как ярлыки или метки для определения и классификации объектов со строгим, один к одному, соответствием между числами и объектами.

Числа в номинальной шкале используются для классификации как ярлыки для классов и категорий. Например, контрольную группу можно классифицировать как группу 1, а экспериментальную — как группу 2.

Операции с числами для номинальной шкалы следующие:
1. Нахождение частот распределения по пунктам шкалы с помощью процентирования или в натуральных единицах. Нетрудно подсчитать численность каждой группы и отношение этой численности к общему ряду распределения (частоты).
2. Поиск средней тенденции по модальной частоте. Модальный (Мо) называют группу с наибольшей численностью.
3. Самым сильным способом количественного анализа является в данном случае установление взаимосвязи между рядами свойств, расположенных неупорядоченно. С этой целью составляют перекрестные таблицы.

Помимо простой процентовки, в таблицах перекрестной классификации можно подсчитать критерий сопряженности признаков по Пирсону: хи-квадрат (х2) — простейший показатель обоснованности вывода о наличии или отсутствии связи между сопоставляемыми характеристиками, т. е. связанности качественных классификаций.
Взято отсюда >>>>>

_______________
© 6 сигма - статистический анализ экспериментальных данных
______________________________________________________________