Signification du critère de Mann Whitney. Calcul selon la méthode Mann-Whitney

Le test non paramétrique de Mann-Whitney est utilisé pour comparer deux échantillons indépendants. Il n’est pas du tout important que les échantillons soient de la même taille. Rappelons que tous les éléments du premier échantillon sont comparés à tous les éléments du deuxième échantillon. Si un élément est plus grand que celui comparé, il obtient 1 point. Si les éléments sont égaux, ils reçoivent 0,5 point. Les scores des éléments de chaque échantillon sont ensuite additionnés et la plus petite somme résultante est utilisée comme critère : la statistique U. Si les échantillons ne diffèrent pas de manière significative, la valeur du critère doit alors être supérieure à la valeur critique pour les échantillons de taille appropriée.

Note.
Voici une description très simplifiée du test de Mann-Whitney, car on suppose que vous le connaissez déjà.

Exemple de calcul du test de Mann-Whitney

Nous disposons d'un petit ensemble de données avec les performances commerciales de deux vendeurs :

Nous voulons déterminer quel vendeur est le plus performant et verser au meilleur vendeur un bonus plus élevé. Faisons cela en utilisant le module complémentaire du menu Office.

Allons dans l'onglet modules complémentaires et cliquons sur l'élément avec le critère souhaité sur le ruban, après quoi il vous sera demandé de sélectionner une plage avec des données à analyser. La plage est sélectionnée sans en-têtes ; la première colonne doit contenir les noms des sélections, la seconde les valeurs de celles-ci.

Après avoir cliqué sur le bouton « Terminer », un nouveau classeur Excel s'ouvrira avec un calcul prêt à l'emploi et un tableau auxiliaire.

L’analyse montre que même si le vendeur Ivan, bien qu’il ait un faible taux de conversion par rapport à Peter, cela ne signifie pas qu’il travaille moins bien, et le taux de conversion élevé de Peter peut être une valeur aberrante dans les données. Peut-être que les résultats changeront dans des échantillons plus grands, mais dans l'ensemble actuel, nous ne pouvons pas parler de différences significatives.

Pour utiliser les fonctionnalités décrites dans cette catégorie, téléchargez et installez notre module complémentaire.
Le complément a été testé avec succès sur les versions Excel : 2007, 2010 et 2013. Si vous rencontrez des problèmes lors de son utilisation, veuillez le signaler.

  • < Назад

Si les documents d'office-menu.ru vous ont aidé, veuillez soutenir le projet afin que nous puissions le développer davantage.

Où T x est la plus grande somme de rangs, n x est la plus grande des tailles d'échantillon n 1 et n 2 .

Objet de la prestation. Grâce à ce calculateur en ligne, vous pouvez calculer Test U de Mann-Whitney.

Objectif du critère

Le critère vise à évaluer les différences entre deux échantillons en termes de niveau de tout attribut, mesuré quantitativement. Il vous permet d'identifier les différences entre les petits échantillons lorsque n 1, n 2 ≥ 3 ou n 1 =2, n 2 ≥ 5. Chaque échantillon ne doit pas contenir plus de 60 observations.
Cette méthode détermine si la zone de croisement des valeurs entre deux séries est suffisamment petite. Supposons que la première ligne (échantillon, groupe) soit la ligne de valeurs dans laquelle les valeurs, selon les estimations préliminaires, sont plus élevées, et la deuxième ligne est celle où elles sont censées être inférieures.
Plus la zone de chevauchement des valeurs est petite, plus il est probable que les différences soient significatives. Parfois, ces différences sont appelées différences dans l’emplacement des deux échantillons.
La valeur empirique du critère U reflète la taille de la zone d'accord entre les lignes. Par conséquent, plus U em est petit, plus il est probable que les différences soient significatives.

Hypothèses
H 0 : Le niveau du trait du groupe 2 n'est pas inférieur au niveau du trait du groupe 1.
H 1 : Le niveau du trait du groupe 2 est inférieur au niveau du trait du groupe 1.

Algorithme de calcul du critère de Mann-Whitney

  1. Combinez toutes les données en une seule série, en marquant les données appartenant à différents échantillons.
  2. Classez les valeurs, en attribuant un rang inférieur à la plus petite valeur. Le nombre total de rangs est (n 1 + n 2).
  3. Calculez la somme des rangs séparément pour chaque échantillon.
  4. Déterminez la plus grande des deux sommes de classement.
  5. Déterminez la valeur U à l'aide de la formule :
    U = n 1 n 2 + n x (n x + 1)/2 – T x ,
    où n 1 – taille de l'échantillon n° 1 ; n 2 – taille de l'échantillon n° 2 ; T x – la plus grande des deux sommes de rang ; n x – taille maximale de l'échantillon : n x = max(n 1, n 2).
  6. Déterminez les valeurs critiques de U cr à l'aide du tableau. Si U em > U cr (0,05). H 0 est accepté. Si U em ≤ U cr (0,05) H 0 est rejeté. Plus la valeur U est petite, plus la fiabilité des différences est élevée.

Exemple. Le niveau d’intelligence verbale et non verbale a été mesuré chez les participants potentiels à l’expérience psychologique en utilisant la technique de D. Wechsler. Deux groupes de jeunes hommes âgés de 18 à 24 ans, étudiants de la Faculté de Physique et de la Faculté de Psychologie, ont été examinés. Les indicateurs d'intelligence verbale sont présentés dans le tableau. Est-il possible de dire que l’un des groupes est supérieur à l’autre en termes d’intelligence verbale ?

FP.
135 130
130 129
131 121
128 129
127 119
137 124
126 125
137 129
131 129
137 130
137 131
127 123
133
125

Une comparaison des résultats montre que les valeurs de l'échantillon X sont légèrement supérieures à celles de l'échantillon Y, nous considérons donc d'abord l'échantillon X.
Nous devons donc déterminer si la différence existante entre les scores peut être considérée comme significative.
Solution.
Classons le tableau présenté. Lors du classement, nous combinons deux échantillons en un seul. Les rangs sont attribués par ordre croissant de la valeur de la grandeur mesurée, c'est-à-dire le rang le plus bas correspond au score le plus bas. A noter que si les scores de plusieurs élèves coïncident, le rang d'un tel score doit être considéré comme la moyenne arithmétique des positions occupées par ces scores lorsqu'ils sont classés par ordre croissant.
Puisque la matrice a des rangs liés (le même numéro de rang) de la 1ère ligne, nous allons les reformater. La réorganisation des rangs s'effectue sans changer l'importance du rang, c'est-à-dire que les relations correspondantes (supérieures, inférieures ou égales à) doivent être maintenues entre les numéros de rangs. Il est également déconseillé de fixer le rang au-dessus de 1 et en dessous d'une valeur égale au nombre de paramètres (dans ce cas n = 26). La réorganisation des rangs s'effectue sous forme de tableau.
Numéros de siège dans la rangée ordonnéeDisposition des facteurs selon l'évaluation de l'expertNouveaux classements
1 119 1
2 121 2
3 123 3
4 124 4
5 125 5.5
6 125 5.5
7 126 7
8 127 8.5
9 127 8.5
10 128 10
11 129 12.5
12 129 12.5
13 129 12.5
14 129 12.5
15 130 16
16 130 16
17 130 16
18 131 19
19 131 19
20 131 19
21 133 21
22 135 22
23 137 24.5
24 137 24.5
25 137 24.5
26 137 24.5

En utilisant le principe de classement proposé, nous obtenons un tableau de classements.
XRang XOuiRang Y
125 5.5 119 1
126 7 121 2
127 8.5 123 3
127 8.5 124 4
128 10 125 5.5
130 16 129 12.5
131 19 129 12.5
131 19 129 12.5
133 21 129 12.5
135 22 130 16
137 24.5 130 16
137 24.5 131 19
137 24.5
137 24.5
Somme234.5 Somme116.5

Ces données suffisent pour utiliser la formule de calcul de la valeur empirique du critère :

L'hypothèse H 0 sur l'insignifiance des différences entre les échantillons est acceptée si U cr< u эмп. В противном случае H 0 отвергается и различие определяется как существенное.
où U kp est le point critique, trouvé à l'aide de la table de Mann-Whitney.
Trouvons le point critique U kp
Dans le tableau, nous trouvons U kp (0,05) = 45
Puisque U kp > u em - nous acceptons l'hypothèse alternative H 1 ; les différences dans les niveaux d’échantillonnage peuvent être considérées comme significatives.

Un critère en statistique mathématique est une règle stricte selon laquelle une hypothèse ayant un certain niveau de signification est acceptée ou rejetée. Pour le construire, vous devez trouver une fonction spécifique. Cela devrait dépendre des résultats finaux de l’expérience, c’est-à-dire des valeurs trouvées empiriquement. C'est cette fonction qui sera un outil pour évaluer l'écart entre les échantillons.

Valeur statistiquement significative. informations générales

La signification statistique est une valeur qui a une très faible probabilité de se produire par hasard. Ses indicateurs les plus extrêmes sont également insignifiants. Une différence est dite statistiquement significative lorsqu’il existe des preuves qui seraient peu susceptibles de se produire si l’on prétendait que la différence n’existe pas. Mais cela ne signifie pas du tout que cette différence doit nécessairement être grande et significative.

Niveau de fiabilité statistique du test

Ce terme doit être compris comme la probabilité de rejeter l’hypothèse nulle si elle est vraie. C’est ce qu’on appelle également une erreur de type I ou une décision faussement positive. Dans la plupart des cas, le processus repose sur une valeur p (« valeur pi »). Il s'agit de la probabilité accumulée lors de l'observation du niveau d'un critère statistique. Celui-ci, à son tour, est calculé à partir de l’échantillon au moment où l’hypothèse nulle est acceptée. L'hypothèse sera rejetée si cette valeur p est inférieure au niveau indiqué par l'analyste. La significativité de la valeur du test dépend directement de cet indicateur : plus elle est petite, plus il y a de raisons de rejeter l'hypothèse.

Le niveau de signification est généralement désigné par la lettre b (alpha). Indicateurs populaires parmi les spécialistes : 0,1%, 1%, 5% et 10%. Si, disons, on dit que les chances d'une coïncidence sont de 1 sur 1000, alors nous parlons certainement du niveau de signification statistique de 0,1 % de la variable aléatoire. Les niveaux B de différentes significations ont leurs avantages et leurs inconvénients. Si le score est inférieur, il est plus probable que l’hypothèse alternative soit significative. Cependant, il existe un risque qu’une fausse hypothèse nulle ne soit pas rejetée. Nous pouvons conclure que le choix du niveau b optimal dépend de la balance « signification-pouvoir » ou, par conséquent, du compromis entre les probabilités de décisions faussement positives et faussement négatives. Un synonyme de « signification statistique » dans la littérature nationale est le terme « fiabilité ».

Définir l'hypothèse nulle

En statistiques mathématiques, quelque chose est testé pour vérifier sa cohérence avec les données empiriques existantes. Dans la plupart des cas, l'hypothèse nulle est l'hypothèse selon laquelle il n'y a pas de corrélation entre les variables étudiées ou qu'il n'y a pas de différences d'homogénéité dans les distributions étudiées. Dans la recherche standard, un mathématicien tente de réfuter l’hypothèse nulle, c’est-à-dire de prouver qu’elle n’est pas cohérente avec les données expérimentales. De plus, il doit également y avoir une hypothèse alternative, qui est acceptée à la place de l’hypothèse zéro.

Définition clé

Le test U (Mann-Whitney) permet d'évaluer les différences entre deux échantillons. Ils peuvent être donnés par le niveau d'un certain attribut, qui est mesuré quantitativement. Cette méthode est idéale pour évaluer les différences dans de petits échantillons. Ce critère simple a été proposé par Frank Wilcoxon en 1945. Et déjà en 1947, la méthode a été révisée et complétée par les scientifiques H. B. Mann et D. R. Whitney, qui lui ont donné son nom jusqu'à ce jour. Le critère de Mann-Whitney en psychologie, en mathématiques, en statistique et dans de nombreuses autres sciences est l'un des éléments fondamentaux de la justification mathématique des résultats de la recherche théorique.

Description

Le test de Mann-Whitney est une méthode relativement simple et sans paramètres. Sa puissance est importante. Elle est nettement supérieure à la puissance du test Rosenbaum Q. La méthode estime la taille de la zone des valeurs croisées entre les échantillons, à savoir entre les séries classées de valeurs de la première et de la deuxième sélection. Plus la valeur du critère est faible, plus il est probable que les écarts dans les valeurs des paramètres soient fiables. Pour appliquer correctement le test U (Mann-Whitney), il ne faut pas oublier certaines restrictions. Chaque échantillon doit avoir au moins 3 valeurs d'attribut. Il est possible que dans un cas il y ait deux valeurs, mais dans le second il doit y en avoir au moins cinq. Il doit y avoir un nombre minimum d'indicateurs correspondants dans les échantillons étudiés. Idéalement, tous les nombres devraient être différents.

Usage

Comment utiliser correctement le test de Mann-Whitney ? Le tableau compilé selon cette méthode contient certaines valeurs critiques. Tout d’abord, vous devez créer une seule série à partir des deux échantillons appariés, qui est ensuite classée. C'est-à-dire que les éléments sont disposés en fonction du degré de croissance de l'attribut et qu'un rang inférieur est attribué à une valeur inférieure. En conséquence, nous obtenons le nombre total de rangs suivant :

N = N1 + N2,

où les valeurs N1 et N2 sont respectivement le nombre d'unités contenues dans les premier et deuxième échantillons. La série de valeurs classées unique est ensuite divisée en deux catégories. Les unités proviennent respectivement du premier et du deuxième échantillons. Maintenant, la somme des rangs de valeurs des première et deuxième lignes est calculée tour à tour. Le plus grand d'entre eux (Tx) est déterminé, ce qui correspond à un échantillon de nx unités. Pour utiliser davantage la méthode de Wilcoxon, sa valeur est calculée à l'aide de la méthode suivante. Il est nécessaire d'utiliser le tableau du niveau de signification retenu pour connaître la valeur critique de ce critère pour les N1 et N2 spécifiques.

L'indicateur obtenu peut être inférieur ou égal à la valeur du tableau. Dans ce cas, une différence significative dans les niveaux du trait dans les échantillons étudiés est constatée. Si la valeur résultante est supérieure à la valeur du tableau, alors l'hypothèse nulle est acceptée. Lors du calcul du test de Mann-Whitney, il convient de noter que si l'hypothèse nulle est vraie, le test présentera également une variance. Notez qu'avec des volumes d'échantillons de données suffisamment importants, la méthode est considérée comme presque normalement distribuée. Plus la valeur du test de Mann-Whitney est faible, plus la fiabilité des différences est élevée.

Objectif du critère

Le test U de Mann-Whitney est conçu pour évaluer les différences entre deux échantillons en termes de niveau toute caractéristique mesurée à partir de l'échelle de commande (pas inférieure). Il permet d'identifier les différences entre les petits échantillons lorsque n 1, n 2 3 ou n 1 = 2, n 2 5, et est plus puissant que le test de Rosenbaum.

Cette méthode détermine si la zone de valeurs qui se chevauchent entre deux séries de valeurs ordonnées est suffisamment petite. Dans ce cas, la 1ère ligne (groupe d'échantillons) est la ligne de valeurs dans laquelle les valeurs, selon les estimations préliminaires, sont plus élevées, et la 2ème ligne est celle où elles sont censées être inférieures.

Plus la zone de chevauchement des valeurs est petite, plus il est probable que les différences soient significatives. Ces différences sont parfois appelées différences de emplacement deux échantillons.

La valeur calculée (empirique) du critère U reflète la taille de la zone de coïncidence entre les lignes. Par conséquent, moins U em. , plus il est probable que les différences soient significatives.

Limites du critère

    Le trait doit être mesuré sur une échelle ordinale, par intervalle ou proportionnelle.

    Les échantillons doivent être indépendants.

    Chaque échantillon doit comporter au moins 3 observations : n 1 , n 2 3 ;

    Il est permis qu'il y ait 2 observations dans un échantillon, mais dans le second il doit y en avoir au moins 5. n 1 , n 2 60. Chaque échantillon ne doit pas contenir plus de 60 observations : n 1 , n 2 20 Mais déjà avec

le classement devient assez laborieux.

    Algorithme de calcul du critère de Mann-Whitney.

Pour calculer le critère, il est nécessaire de combiner mentalement toutes les valeurs du 1er échantillon et du 2ème échantillon en un seul échantillon combiné commun et de les ordonner.

Il est pratique d'effectuer tous les calculs dans un tableau (tableau 28), composé de 4 colonnes. Les valeurs ordonnées de l'échantillon combiné sont inscrites dans ce tableau.

    Dans ce cas:

    les valeurs de chaque échantillon sont écrites dans sa propre colonne : les valeurs du 1er échantillon sont écrites dans la colonne n°2, les valeurs du 2ème échantillon sont écrites dans la colonne n°3 ;

    chaque valeur est écrite sur une ligne distincte ;

    le nombre total de lignes dans ce tableau est N=n 1 +n 2, où n 1 est le nombre de sujets dans le 1er échantillon, n 2 est le nombre de sujets dans le 2ème échantillon

Tableau 28

R. 1

R. 2

    Les valeurs de l'échantillon combiné sont classées selon les règles de classement, et dans la colonne n°1 sont inscrits les rangs R 1 correspondant aux valeurs du 1er échantillon, dans la colonne n°4 - les rangs R 2 correspondant aux valeurs du 2ème échantillon,

    La somme des rangs est calculée séparément pour la colonne n°1 (pour l'échantillon 1) et séparément pour la colonne n°4 (pour l'échantillon 2). Il est impératif de vérifier si la somme totale des classements correspond à la somme des classements calculée pour l’échantillon regroupé.

    Déterminez la plus grande des deux sommes de rang. Notons-le comme T x.

    Déterminez la valeur calculée du critère U à l'aide de la formule :

où n 1 est le nombre de sujets dans l'échantillon 1,

n 2 - nombre de sujets dans l'échantillon 2,

T x - la plus grande des deux sommes de rang,

n x est le nombre de sujets dans l'échantillon avec une somme de rangs plus grande.

    Règle d'inférence : Déterminez les valeurs critiques de U à l'aide du tableau des valeurs critiques du test de Mann-Whitney.

Si vous les em. U cr. 0,05, les différences entre les échantillons sont statistiquement non significatives.

Si vous les em. U cr. 0,05, les différences entre les échantillons sont statistiquement significatives.

Plus la valeur U est petite, plus la fiabilité des différences est élevée.

Questions de sécurité :

    Nommez les conditions d’application du test t de Student.

    Quels paramètres des distributions de caractéristiques doivent être connus pour calculer le test t de Student ?

    Formulez une règle de décision basée sur les résultats des calculs du test t de Student.

    Pourquoi est-il nécessaire d’évaluer simultanément la variabilité des caractéristiques des échantillons lors du calcul du test de Student ?

    Comment comparer deux écarts ?

    Dans quels cas est-il nécessaire d'introduire la correction de Snedecor dans la règle de dérivation du test t de Student ?

    Nommer les conditions d’application du critère Rosenbuam.

    Formuler une règle de décision basée sur les résultats des calculs du critère de Rosenbaum.

    Énumérez les conditions d’application du test de Mann-Whitney.

    Quel est l'échantillon total regroupé lors du calcul du test de Mann-Whitney.

    Formuler une règle de décision basée sur les résultats des calculs du critère de Mann-Whitney.

Tâche pratique indépendante :

Étudiez vous-même les critères Kruskal-Wallis et les tendances Jonkeer à l’aide de manuels. Prenez des notes selon un schéma similaire à celui utilisé en cours.

Matériel pour étudier le sujet :

a) littérature de base :

    Ermolaev O. Yu. Statistiques mathématiques pour les psychologues [Texte] : manuel / O. Yu. - 5e éd. - M. : MPSI : Flint, 2011. - 336 p. - P. 101-124 ; 169-172.

    Nasledov A.D. Méthodes mathématiques de recherche psychologique : Analyse et interprétation des données [Texte] : manuel / A. D. Nasledov. - 3e éd., stéréotype. - Saint-Pétersbourg : Rech, 2007. - 392 p. - pages 162-167 ; 173-176 ; 181-182.

    Sidorenko E. V. Méthodes de traitement mathématique en psychologie [Texte] / E. V. Sidorenko. - Saint-Pétersbourg : Rech, 2010. - 350 pp. : ill. - P. 39-72.

b) littérature supplémentaire :

    Glass J. Méthodes statistiques en pédagogie et en psychologie [Texte]. / J. Glass, J. Stanley-M., 1976. – 494 p. - pages 265-280.

    Kuteïnikov A.N. Méthodes mathématiques en psychologie [Texte] : complexe pédagogique et méthodologique / A. N. Kuteynikov. - Saint-Pétersbourg : Rech, 2008. - 172 pp. : tableau. - pp. 81-93.

    Sukhodolsky G.V. Fondamentaux des statistiques mathématiques pour les psychologues [Texte] : manuel / G. V. Sukhodolsky. - Saint-Pétersbourg : Maison d'édition de l'Université d'État de Saint-Pétersbourg, 1998. - 464 p. - pages 305 à 323.

La méthode statistique actuelle a été proposée par Frank Wilcoxon (voir photo) en 1945. Cependant, en 1947, la méthode a été améliorée et élargie par H. B. Mann et D. R. Whitney, c'est pourquoi le test U est plus souvent appelé par son nom.

Le critère vise à évaluer les différences entre deux échantillons en termes de niveau de tout attribut, mesuré quantitativement. Il vous permet d'identifier les différences entre les petits échantillons lorsque n 1,n 2 ≥3 ou n 1 =2, n 2 ≥5, et est plus puissant que le test de Rosenbaum.

Description du test U de Mann-Whitney

Il existe plusieurs manières d'utiliser le critère et plusieurs options pour les tableaux de valeurs critiques correspondant à ces méthodes (Gubler E. V., 1978 ; Runion R., 1982 ; Zakharov V. P., 1985 ; McCall R., 1970 ; Krauth J., 1988 ) .

Cette méthode détermine si la zone de croisement des valeurs entre deux séries est suffisamment petite. On se souvient que la 1ère ligne (échantillon, groupe) est la ligne de valeurs dans laquelle les valeurs, selon les estimations préliminaires, sont plus élevées, et la 2ème ligne est celle où elles sont censées être inférieures.

Plus la zone de chevauchement des valeurs est petite, plus il est probable que les différences soient significatives. Ces différences sont parfois appelées différences dans la localisation des deux échantillons (Welkowitz J. et al., 1982).

La valeur empirique du critère U reflète la taille de la zone d'accord entre les lignes. Par conséquent, plus U em est petit, plus il est probable que les différences soient significatives.

Hypothèses du test U - Mann-Whitney

H 0: Le niveau du trait du groupe 2 n'est pas inférieur au niveau du trait du groupe 1.
H1: Le niveau du trait du groupe 2 est inférieur au niveau du trait du groupe 1.

Limites du test U de Mann-Whitney

1. Chaque échantillon doit avoir au moins 3 observations : n 1,n 2 ≥ Z ; Il est permis qu'il y ait 2 observations dans un échantillon, mais dans le second il doit y en avoir au moins 5.

2. Chaque échantillon ne doit pas contenir plus de 60 observations ; n 1, n 2 ≤ 60.

Calcul automatique du test U de Mann-Whitney

Étape 1

Saisissez les données du premier échantillon dans la première colonne (« Échantillon 1 ») et les données du deuxième échantillon dans la deuxième colonne (« Échantillon 2 »). Les données sont saisies à raison d'un chiffre par ligne ; pas d'espaces, d'omissions, etc. Seuls les chiffres sont saisis. Les nombres fractionnaires sont saisis avec un « ». (point). Après avoir rempli les colonnes, cliquez sur le bouton « Étape 2 » pour calculer automatiquement le test U de Mann-Whitney.



Avez-vous aimé l'article? Partagez avec vos amis !