Значение критерия манна уитни. Расчет по методике манн-уитни

Непараметрический критерий Манна-Уитни используется для сравнения двух независимых выборок. При этом совсем не важно, чтобы выборки были одинакового размера. Напомним, что все элементы из первой выборки сравниваются со всеми элементами второй выборки. Если какой-то элемент больше сравниваемого, то ему засчитывается 1 балл. Если элементы равны, то им засчитывается по 0,5 балла. Затем баллы элементов для каждой выборки суммируются, а меньшая полученная сумма является критерием – U-статистика. Если выборки не имеют существенных различий, то значение критерия должно быть больше критического значения для выборок соответствующего размера.

Примечание.
Здесь приведено очень упрощенное описание критерия Манна-Уитни, т.к. подразумевается, что Вы уже с ним знакомы.

Пример расчета критерия Манна-Уитни

У нас есть небольшой набор данных с эффективностью продаж двух продавцов:

Мы хотим определить, какой из продавцов работает лучше, и выплатить лучшему продавцу повышенную премию. Сделаем это с помощью надстройки от office-menu.

Перейдем на вкладку надстройки и кликнем на ленте пункт с нужным критерием, после чего будет предложено выбрать диапазон с данными для анализа. Диапазон выбирается без заголовков, первый столбец должен содержать наименование выборок, второй значения для них.

После клика по кнопке «Готово» откроется новая книга Excel с готовым расчетом и вспомогательной таблицей.

Из анализа видно, несмотря на то что продавец Иван хоть и имеет низкую конверсию в сравнении с Петром, это не говорит о том, что он работает хуже, а высокая конверсия Петра может быть выбросами в данных. Возможно на больших выборках результаты поменяются, но на текущем наборе говорить о существенных различиях нельзя.

Для того, чтобы использовать описанные в данной категории функции, скачайте и установите нашу надстройку.
Работа надстройки была успешно протестирована на версиях Excel: 2007, 2010 и 2013. В случае возникновения проблем с ее использованием, сообщайте .

  • < Назад

Если материалы office-menu.ru Вам помогли, то поддержите, пожалуйста, проект, чтобы мы могли развивать его дальше.

Где T x - наибольшая сумма рангов, n x - наибольшая из объемов выборок n 1 и n 2 .

Назначение сервиса . С помощью данного онлайн-калькулятора производится расчет U критерия Манна-Уитни .

Назначение критерия

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n 1 , n 2 ≥ 3 или n 1 =2, n 2 ≥ 5. В каждой выборке должно быть не более 60 наблюдений.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Положим, что первым рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а вторым рядом - тот, где они предположительно ниже.
Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.
Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп, тем более вероятно, что различия достоверны.

Гипотезы
H 0: Уровень признака в группе 2 не ниже уровня признака в группе 1.
H 1: Уровень признака в группе 2 ниже уровня признака в группе 1.

Алгоритм расчета критерия Манна-Уитни

  1. Объединить все данные в единый ряд, пометив данные, принадлежащие разным выборкам.
  2. Проранжировать значения , приписывая меньшему значению меньший ранг. Всего рангов получится (n 1 + n 2).
  3. Подсчитать сумму рангов отдельно для каждой выборки.
  4. Определить большую из двух ранговых сумм.
  5. Определить значение U по формуле:
    U = n 1 ·n 2 + n x ·(n x + 1)/2 – T x ,
    где n 1 – объем выборки №1; n 2 – объем выборки №2; T x – большая из двух ранговых сумм; n x – объем максимальной выборки: n x = max(n 1 , n 2).
  6. Определить критические значения U кр по таблице . Если U эмп > U кр (0,05). H 0 принимается. Если U эмп ≤ U кр (0,05) H 0 отвергается. Чем меньше значения U, тем достоверность различий выше.

Пример . У предполагаемых участников психологического эксперимента был измерен уровень вербального и невербального интеллекта с помощью методики Д. Векслера. Было обследовано две группы юношей в возрасте от 18 до 24 лет студентов физического факультета и психологического факультета. Показатели вербального интеллекта представлены в таблице. Можно ли утверждать, что одна из групп превосходит другую по уровню вербального интеллекта?

Ф П
135 130
130 129
131 121
128 129
127 119
137 124
126 125
137 129
131 129
137 130
137 131
127 123
133
125

Сравнение результатов показывает, что значения выборки X несколько выше, чем выборки Y, поэтому первой считаем выборку X.
Таким образом, нам требуется определить, можно ли считать имеющуюся разницу между баллами существенной.
Решение .
Проранжируем представленную таблицу. При ранжировании объединяем две выборки в одну. Ранги присваиваются в порядке возрастания значения измеряемой величины, т.е. наименьшему рангу соответствует наименьший балл. Заметим, что в случае совпадения баллов для нескольких учеников ранг такого балла следует считать, как среднее арифметическое тех позиций, которые занимают данные баллы при их расположении в порядке возрастания.
Так как в матрице имеются связанные ранги (одинаковый ранговый номер) 1-го ряда, произведем их переформирование. Переформирование рангов производиться без изменения важности ранга, то есть между ранговыми номерами должны сохраниться соответствующие соотношения (больше, меньше или равно). Также не рекомендуется ставить ранг выше 1 и ниже значения равного количеству параметров (в данном случае n = 26). Переформирование рангов производится в табл.
Номера мест в упорядоченном ряду Расположение факторов по оценке эксперта Новые ранги
1 119 1
2 121 2
3 123 3
4 124 4
5 125 5.5
6 125 5.5
7 126 7
8 127 8.5
9 127 8.5
10 128 10
11 129 12.5
12 129 12.5
13 129 12.5
14 129 12.5
15 130 16
16 130 16
17 130 16
18 131 19
19 131 19
20 131 19
21 133 21
22 135 22
23 137 24.5
24 137 24.5
25 137 24.5
26 137 24.5

Используя предложенный принцип ранжирования, получим таблицу рангов.
X Ранг X Y Ранг Y
125 5.5 119 1
126 7 121 2
127 8.5 123 3
127 8.5 124 4
128 10 125 5.5
130 16 129 12.5
131 19 129 12.5
131 19 129 12.5
133 21 129 12.5
135 22 130 16
137 24.5 130 16
137 24.5 131 19
137 24.5
137 24.5
Сумма 234.5 Сумма 116.5

Этих данных достаточно, чтобы воспользоваться формулой расчёта эмпирического значения критерия:

Гипотеза H 0 о незначительности различий между выборками принимается, если U кр < u эмп. В противном случае H 0 отвергается и различие определяется как существенное.
где U kp - критическая точка, которую находят по таблице Манна-Уитни.
Найдем критическую точку U kp
По таблице находим U kp (0.05) = 45
Так как U kp > u эмп - принимаем альтернативную гипотезу H 1 ; различия в уровнях выборок можно считать существенными.

Критерий в математической статистике - это строгое правило, в соответствии с которым гипотеза с определённым уровнем значимости принимается или отвергается. Чтобы построить его, необходимо найти определенную функцию. Она должна зависеть от конечных результатов эксперимента, то есть от эмпирически найденных значений. Именно эта функция будет являться инструментом оценки расхождения между выборками.

Статистически значимая величина. Общие сведения

Статистическая значимость - это величина, вероятность случайного возникновения которой очень мала. Незначительны также и более крайние ее показатели. Разницу называют статистически значимой в том случае, если существуют данные, вероятность появления которых незначительна, если утверждать, что эти расхождения не существуют. Но это не значит вовсе, что эта разница обязательно должна быть велика и значима.

Уровень статистической достоверности теста

Под данным термином следует понимать вероятность отклонения нулевой гипотезы в случае её истинности. Это также называется ошибкой первого рода или ложноположительным решением. В большинстве случаев процесс опирается на p-величину ("пи-величина"). Это накопленная вероятность при наблюдении за уровнем статистического критерия. Он, в свою очередь, насчитывается по выборке во время принятия нулевой гипотезы. Предположение будет отвергнуто, если эта p-величина будет меньше заявленного аналитиком уровня. От этого показателя зависит напрямую значимость тестовой величины: чем она меньше, тем, соответственно, и больше оснований отвергнуть гипотезу.

Уровень значимости, как правило, обозначается буквой б (альфа). Популярные показатели среди специалистов: 0,1%, 1%, 5% и 10%. Если, скажем, говорится, что шансы на совпадения равны 1 к 1000, то определённо речь идёт об уровне 0,1% статистической значимости случайной величины. Различные по значению б-уровни имеют свои плюсы и минусы. Если показатель меньше, то больше вероятность, что альтернативная гипотеза значимая. Хотя при этом возможен риск, что ложное нулевое предположение не будет отвергнуто. Можно сделать вывод, что выбор оптимального б-уровня зависит от баланса "значимость-мощность" или, соответственно, от компромисса вероятностей ложноположительного и ложноотрицательного решений. Синонимом "статистической значимости" в отечественной литературе является термин "достоверность".

Определение нулевой гипотезы

В математической статистике проверяемое на согласованность с уже имеющимися в запасе эмпирическими данными. В большинстве случаев в качестве нулевой гипотезы берётся гипотеза о том, что корреляция между исследуемыми переменными отсутствует или что в изучаемых распределениях нет различий однородности. При стандартных исследованиях математик пытается опровергнуть нулевую гипотезу, то есть доказать, что она не согласована с экспериментально полученными данными. Причем должно иметь место и альтернативное предположение, которое принимается вместо нулевого.

Ключевое определение

Критерий U (Манна-Уитни) в позволяет оценивать различия двух выборок. Они могут быть даны по уровню некоего признака, который измерен количественно. Этот метод идеален для оценки различий малых выборок. Этот простой критерий был предложен Фрэнком Уилкоксоном в 1945 году. А уже в 1947 году метод был пересмотрен и дополнен учёными Х. Б. Манном и Д. Р. Уитни, именами которых он и именуется по сей день. Критерий Манна-Уитни в психологии, математике, статистике и во многих других науках является одним из основополагающих элементов математического обоснования результатов теоретических исследований.

Описание

Критерий Манна-Уитни - относительно простой метод без параметров. Его мощность значительна. Она существенно выше, чем мощность Q-критерия Розенбаума. Метод оценивает, насколько мала область перекрёстных значений между выборками, а именно между ранжированными рядами значений первой и второй подборки. Чем значение критерия меньше, тем больше вероятность, что расхождения значений параметра достоверны. Чтобы корректно применить критерий U (Манна-Уитни), не стоит забывать о некоторых ограничениях. В каждой выборке должно быть как минимум 3 значения признака. Возможна ситуация, когда в одном случае значений два, но во втором обязательно тогда их должно быть хотя бы пять. В исследуемых выборках должно быть минимальное количество совпадающих показателей. Все числа должны быть разными в идеальном случае.

Использование

Как правильно использовать критерий Манна-Уитни? Таблица, которая составлена по данному методу, содержит определенные критические значения. Для начала нужно создать единый ряд из обеих сопоставленных выборок, который затем ранжируется. То есть элементы выстраиваются по степени нарастания признака, и меньший ранг присваивается меньшему значению. В итоге получим такое общее число рангов:

N = N1 + N2,

где величины N1 и N2 - количество единиц, содержащихся в первой и второй выборках соответственно. Далее единый ранжированный ряд значений делится на две категории. Единицы, соответственно, из первой и второй выборок. Теперь считается по очереди сумма рангов значений в первом и во втором рядах. Определяется большая из них (Tx), которая соответствует выборке с nx единицами. Чтобы использовать метод Уилкоксона далее, вычисляется его значение по следующей методике. Необходимо по таблице для выбранного уровня значимости выяснить критическое значение этого критерия для конкретно взятых N1 и N2.

Получившийся показатель может быть меньше или равен значению из таблицы. В этом случае констатируется значительное различие уровней признака в исследуемых выборках. Если полученное значение больше табличного, тогда нулевая гипотеза принимается. Когда производится расчет критерия Манна-Уитни, следует заметить, что если нулевая гипотеза справедлива, критерий будет иметь а также дисперсию. Отметим, что при достаточно больших объёмах данных выборок метод считается практически нормально распределенным. Достоверность различий тем выше, чем меньшее значение принимает критерий Манна-Уитни.

Назначение критерия

U - критерий Манна-Уитни предназначен для оценки различий между двумя выборками по уровню какого-либо признака, измеренного начиная со шкалы порядка (не ниже). Он позволяет выявлять различия между малыми выборками, когда n 1 , n 2 3 или n 1 = 2, n 2 5, и является более мощным, чем критерий Розенбаума.

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами упорядоченных значений. При этом 1-м рядом (выборкой группой) называется тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.

Расчетное (эмпирическое) значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп. , тем более вероятно, что различия достоверны.

Ограничения критерия

    Признак должен быть измерен по ординальной, интервальной или пропорциональной шкале.

    Выборки должны быть независимыми.

    В каждой выборке должно быть не менее 3 наблюдений: n 1 , n 2 3 ; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

    В каждой выборке должно быть не более 60 наблюдений: n 1 , n 2 60. Однако уже приn 1 , n 2 20 ранжирование становится достаточно трудоемким.

Алгоритм подсчета критерия Манна-Уитни.

    Для расчета критерия необходимо мысленно все значения 1-й выборки и 2-й выборки объединить в одну общую объединенную выборку и упорядочить их.

Все расчеты удобно производить в таблице (таблица 28), состоящей из 4-х столбцов. В эту таблицу заносятся упорядоченные значения объединенной выборки.

При этом:

    значения объединенной выборки упорядочиваются по нарастанию значений;

    значения каждой из выборок записываются в свой столбик: значения 1-й выборки записываются в столбик № 2, значения 2-й выборки записываются в столбик № 3;

    каждое значение записывается на отдельной строчке;

    общее число строк в этой таблице равно N=n 1 +n 2 , гдеn 1 - число испытуемых в 1-й выборке,n 2 - число испытуемых во 2-й выборке

Таблица 28

R 1

R 2

    Значения объединенной выборки ранжируются согласно правилам ранжирования, причем в столбике № 1 записываются ранги R 1 соответствующие значениям 1-й выборки, в столбике № 4 - ранги R 2 , соответствующие значениям 2-й выборки,

    Подсчитывается сумма рангов отдельно по столбику № 1 (для выборки 1) и отдельно по столбику № 4 (для выборки 2). Обязательно проверить, совпадает ли общая сумма рангов с расчетной суммой рангов для объединенной выборки.

    Определить бόльшую из двух ранговых сумм. Обозначим ее как Т х.

    Определить расчетное значение критерия U по формуле:

где n 1 - количество испытуемых в выборке 1,

n 2 - количество испытуемых в выборке 2,

T x - бόльшая из двух ранговых сумм,

n x - количество испытуемых в выборке с бόльшей суммой рангов.

    Правило вывода: Определить критические значения U по таблице критических значений для критерия Манна-Уитни.

Если U эмп. U кр. 0,05 , различия между выборками статистически незначимы.

Если U эмп. U кр. 0,05 , различия между выборками статистически достоверны.

Чем меньше значения U, тем достоверность различий выше.

Контрольные вопросы:

    Назовите условия применения критерия Стьюдента.

    Какие параметры распределений признаков необходимо знать для того, чтобы рассчитать критерий Стьюдента?

    Сформулируйте правило принятия решения по результатам расчетов критерия Стьюдента.

    Почему при расчете критерия Стьюдента необходимо параллельно оценивать и изменчивость признаков в выборках?

    Каким образом можно сравнить две дисперсии?

    В каких случаях в правило вывода критерия Стьюдента необходимо вводить поправку Снедекора?

    Назовите условия применения критерия Розенбуама.

    Сформулируйте правило принятия решения по результатам расчетов критерия Розенбаума.

    Перечислите условия применения критерия Манна-Уитни.

    Что такое общая объединенная выборка при расчете критерия Манна-Уитни.

    Сформулируйте правило принятия решения по результатам расчетов критерия Манна-Уитни.

Самостоятельное практическое задание:

Самостоятельно изучите по учебникам критерии Крускала-Уоллиса и тенденций Джонкира. Составьте конспект по схеме аналогичной той, которая использовалась в лекциях.

Материалы для изучения темы:

а) основная литература:

    Ермолаев О. Ю. Математическая статистика для психологов [Текст]: учебник / О. Ю. Ермолаев. - 5-е изд. - М.: МПСИ: Флинта, 2011. - 336 с. - С. 101-124; 169-172.

    Наследов А.Д. Математические методы психологического исследования: Анализ и интерпретация данных [Текст]: учебное пособие / А. Д. Наследов. - 3-е изд., стереотип. - СПб.: Речь, 2007. - 392 с. - С. 162-167; 173-176; 181-182.

    Сидоренко Е. В. Методы математической обработки в психологии [Текст] / Е. В. Сидоренко. - СПб.: Речь, 2010. - 350 с.: ил. - С. 39-72.

б) дополнительная литература:

    Гласс Дж. Статистические методы в педагогике и психологии [Текст]. / Дж. Гласс, Дж. Стенли- М., 1976. – 494 с. - С. 265-280.

    Кутейников А.Н. Математические методы в психологии [Текст]: учебно-методический комплекс / А. Н. Кутейников. - СПб.: Речь, 2008. - 172 с.: табл. - С. 81-93.

    Суходольский Г.В. Основы математической статистики для психологов [Текст]: учебник / Г. В. Суходольский. - СПб.: Изд-во СПбГУ, 1998. - 464 с. - С. 305-323.

Настоящий статистический метод был предложен Фрэнком Вилкоксоном (см. фото) в 1945 году. Однако в 1947 году метод был улучшен и расширен Х. Б. Манном и Д. Р. Уитни, посему U-критерий чаще называют их именами.

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n 1 ,n 2 ≥3 или n 1 =2, n 2 ≥5, и является более мощным, чем критерий Розенбаума.

Описание U-критерия Манна-Уитни

Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам (Гублер Е. В., 1978; Рунион Р., 1982; Захаров В. П., 1985; McCall R., 1970; Krauth J., 1988).

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок (Welkowitz J. et al., 1982).

Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп, тем более вероятно, что различия достоверны.

Гипотезы U - критерия Манна-Уитни

H 0 : Уровень признака в группе 2 не ниже уровня признака в группе 1.
H 1 : Уровень признака в группе 2 ниже уровня признака в группе 1.

Ограничения U-критерия Манна-Уитни

1. В каждой выборке должно быть не менее 3 наблюдений: n 1 ,n 2 ≥ З; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений; n 1 , n 2 ≤ 60.

Автоматический расчет U-критерия Манна-Уитни

Шаг 1

Введите в первую колонку («Выборка 1») данные первой выборки, а во вторую колонку («Выборка 2») данные второй выборки. Данные вводятся по одному числу на строку; без пробелов, пропусков и т.д. Вводятся только цифры. Дробные числа вводятся со знаком «.» (точка). После заполнения колонок нажмите на кнопку «Шаг 2», чтобы произвести автоматический расчет U-критерия Манна-Уитни.



Понравилась статья? Поделитесь с друзьями!