Непараметрические критерии

строятся не на основе числовых характеристик выборки, а на основе самих вариант выборок. Многие непараметрические методы заменяют реальные значения признака рангами. При этом сохраняется основная часть информации о распределении, но нет необходимости знать, что это за распределение.

Если в результате проверки нулевая гипотеза не отвергается, то функции распределения случайных величин X и Y одинаковы. Следовательно, одинаковы и сами случайные величины. Следовательно, обе выборки извлечены из одной генеральной совокупности. Если при этом изучалось влияние фактора на некоторую величину (или сравнивались 2 группы между собой), фактор на величину не влияет (между группами нет статистически значимых различий).

Непараметрические критерии для зависимых совокупностей

Критерий знаков

Предназначен для установления общего направления сдвига изучаемого признака.

Сдвигом называют разность между вторым и первым измерениями. Критерий знаков позволяет установить, в какую сторону в выборке в целом произошли изменения (произошло увеличение значений, уменьшение или значения не изменились).

После заполнения таблицы подсчитывается общее число положительных и отрицательных сдвигов и вводятся следующие понятия:

типичный сдвиг – сдвиг, чаще встречающийся в выборке;
нетипичный сдвиг – сдвиг, реже встречающийся в выборке.

Количество нетипичных сдвигов является наблюдаемым значением критерия.

При проверке гипотезы с помощью программы Statistica ориентируемся на p-уровень.

Ограничения критерия:

выборки должны быть зависимыми и иметь парные измерения;
критерий неприменим, когда количество типичных и нетипичных сдвигов одинаково.

Критерий Фридмана

Применяется для сопоставления показателей, измеренных в трех или более условиях на одной и той же выборке испытуемых. Критерий позволяет установить, что значения измеряемого признака изменяются от выборки к выборке, но не указывает направление изменений. При обработке данных ранжируются не сдвиги, а сами значения, полученные испытуемыми в первом, втором, третьем, … измерениях.

Суть метода:

Если различия между значениями признака, полученными при разных условиях, случайны, то суммы рангов в группах будут примерно равны. Если значения признака изменяются в различных условиях каким-то определенным образом, то в одной выборке будут преобладать высокие ранги, в другой – низкие. Тогда суммы рангов будут сильно отличаться друг от друга.
Эмпирическое значение показывает, насколько различаются суммы рангов. Чем оно больше, тем более существенны различия.

Критерий Фридмана основан на ранжировании значений, полученных у одного объекта в разных измерениях. Потому для вычисления наблюдаемого значения критерия полученные данные ранжируют по строкам и подсчитывают суммы рангов в столбцах.

Формула наблюдаемого значения критерия, где Ri - сумма рангов при i-ом условии, n – число испытуемых, с – число измерений.

В случае двух выборок гипотезы выдвигаются в следующем виде:

H0 - функции распределения изучаемых величин равны
H1 - функции распределения изучаемых величин не равны

При проверке статистических гипотез с помощью программы Statistica для принятия решения о том, какую из гипотез выбрать, так же, как и в параметрических критериях, используется p-уровень:

• если p < 0,05, то нулевую гипотезу отвергаем, принимаем конкурирующую
• если p > 0,05, то нет оснований отвергать нулевую гипотезу

Критерий Вилкоксона

Этот критерий также используется для связанных (зависимых) выборок, но он может применяться только для изучения признака, измеренного в метрической или ранговой шкале, так как учитывает не только направление сдвига, но и его выраженность. Критерий Вилкоксона является более мощным, чем критерий знаков.

Критерий Вилкоксона основан на ранжировании абсолютных значений сдвига (то есть, значений сдвига, взятых по модулю). Поэтому сдвиги должны варьироваться в достаточно широком диапазоне, иначе данный критерий не будет отличаться от критерия знаков.

Суть метода:

Сопоставляется выраженность по абсолютной величине сдвигов в том или ином направлении. Для этого ранжируются абсолютные величины сдвигов и суммируются полученные ранги.

Если сдвиги в какую-либо сторону происходят случайно, то суммы рангов будут примерно равны.
Если интенсивность сдвигов в одном направлении перевешивает, то сумма рангов противоположных по направлению сдвигов будет значительно меньше, чем это могло бы быть при случайном изменении. Это говорит о действии фактора.

Наблюдаемое значение критерия равно сумме рангов нетипичных сдвигов.

При расчете "вручную" по таблице критических точек находим значение Ткр(α, n'), где n' -объем выборки за вычетом нулевых сдвигов.

Если Тн ≤ Ткр, то гипотеза Н0 отвергается, принимается гипотеза Н1; нетипичных сдвигов немного и они невелики по абсолютному значению, преобладание типичного сдвига является неслучайным, оно обусловлено влиянием фактора.

Если Тн > Тк, то нет оснований отвергать гипотезу Н0; нетипичных сдвигов много и они не малы по значению, преобладание типичного сдвига является случайным.

При проверке гипотезы с помощью программы Statistica ориентируемся на p-уровень.

Ограничения критерия:

Выборки должны быть зависимыми и иметь парные измерения.
Сдвиги должны варьировать в широком диапазоне (иначе критерий Вилкоксона будет аналогичен критерию знаков).

Непараметрические критерии для независимых совокупностейтема

U - критерий Манна - Уитни.
Этот критерий является одним из наиболее распространенных и мощных критериев для независимых выборок. Он предназначен для оценки различий между двумя выборками. Он удобен для малых выборок при обработке вручную. Критерий основан на ранжировании значений обеих выборок, объединенных в один общий ряд.

Гипотезы выдвигаются, как и в других непараметрических критериях:
• H0 - функции распределения изучаемых величин равны
• H1 - функции распределения изучаемых величин не равны

Для обработки экспериментальных данных с помощью данного критерия, выполняют следующие действия:
1) Полученные данные объединяют, то есть представляют как один ряд и упорядочивают его по возрастанию значений.
2) Значения ранжируют по возрастанию признака по тем же правилам, что и в критерии Вилкоксона.
3) Подсчитывают суммы рангов первой и второй выборки.
4) Вычисляют наблюдаемое значение критерия.
5) По таблице критических точек распределения Манна – Уитни находят критическое значение, которое зависит от уровня значимости и от объемов выборок nX и nY.
6) Осуществляют выбор гипотезы, учитывая, что критерий левосторонний.

H - критерий Крускала – Уоллиса.
Критерий предназначен для оценки различий между тремя и более выборками одновременно. Он позволяет установить, что признак изменяется при переходе от группы к группе, но не указывает на направление изменений. Является обобщением критерия Манна-Уитни на большее число выборок

Все индивидуальные значения объединяются и ранжируются в общем ряду. Затем подсчитываются суммы рангов в каждой выборке. Если различия являются случайными, то высокие и низкие ранги равномерно распределятся в выборках. Если в одной группе будут преобладать высокие ранги, а в другой низкие, то это говорит о том, что различия не случайны, а обусловлены действием фактора.

Наблюдаемое значение критерия вычисляется по формуле, где N – суммарный объем всех выборок, ni – объем i-той выборки, Ri – сумма рангов в i-той выборке, с – число выборок.