Test statistique d'adéquation de Pearson dans vos propres mots. Critère d'accord

Lors de l'analyse série de variations distribution grande valeur a combien distribution empirique le signe correspond normale. Pour ce faire, les fréquences de la distribution réelle doivent être comparées aux fréquences théoriques, caractéristiques d'une distribution normale. Cela signifie que, sur la base de données réelles, il est nécessaire de calculer les fréquences théoriques de la courbe de distribution normale, qui sont fonction des écarts normalisés.

En d’autres termes, la courbe de distribution empirique doit être alignée sur la courbe de distribution normale.

Caractéristiques objectives de la conformité théorique Et empirique fréquences peut être obtenu en utilisant des indicateurs statistiques qui sont appelés critères de consentement.

Critère d'accord appelé un critère qui vous permet de déterminer si l'écart est empirique Et théorique les distributions sont aléatoires ou significatives, c'est-à-dire si les données d'observation sont en accord ou non avec l'hypothèse statistique avancée. Distribution population, qu'elle possède en raison de l'hypothèse avancée, est dite théorique.

Il est nécessaire d'installer critère(règle) qui permettrait de juger si l’écart entre les données empiriques et distributions théoriques aléatoire ou significatif. Si l'écart s'avère être aléatoire, alors ils pensent que les données d'observation (échantillon) sont cohérentes avec l'hypothèse avancée sur la loi de répartition de la population générale et, par conséquent, l'hypothèse est acceptée ; si l'écart s'avère être significatif, alors les données d'observation ne sont pas d'accord avec l'hypothèse et celle-ci est rejetée.

Généralement, les fréquences empiriques et théoriques diffèrent parce que :

  • l'écart est aléatoire et dû à quantité limitée observations;
  • l'écart n'est pas aléatoire et s'explique par le fait que l'hypothèse statistique selon laquelle la population est normalement distribuée est erronée.

Ainsi, critères de consentement permettre de rejeter ou de confirmer la justesse de l'hypothèse avancée lors de l'alignement des séries sur la nature de la distribution dans la série empirique.

Fréquences empiriques obtenu à la suite de l’observation. Fréquences théoriques calculé à l'aide de formules.

Pour loi de distribution normale ils peuvent être trouvés comme suit :

  • Σƒ je - somme des fréquences empiriques accumulées (cumulatives)
  • h - différence entre deux options voisines
  • σ - écart type de l'échantillon
  • écart t-normalisé (standardisé)
  • φ(t) – fonction de densité de probabilité de distribution normale (trouvée pour la valeur correspondante de t)

Il existe plusieurs tests d'adéquation, dont les plus courants sont : le test du chi carré (Pearson), le test de Kolmogorov, le test de Romanovsky.

Test d'adéquation de Pearson χ 2– l'une des principales, qui peut être représentée comme la somme des rapports des carrés des différences entre les fréquences théoriques (f T) et empiriques (f) aux fréquences théoriques :

  • k est le nombre de groupes en lesquels la distribution empirique est divisée,
  • f je –fréquence observée du trait dans le i-ème groupe,
  • fT – fréquence théorique.

Pour la distribution χ 2, des tableaux ont été compilés qui indiquent la valeur critique du critère d'adéquation χ 2 pour le niveau de signification sélectionné α et les degrés de liberté df (ou ν).
Le niveau de signification α est la probabilité de rejeter par erreur l'hypothèse proposée, c'est-à-dire la probabilité qu'une hypothèse correcte soit rejetée. R- signification statistique acceptation hypothèse correcte. En statistique, trois niveaux de signification sont le plus souvent utilisés :

α=0,10, puis P=0,90 (dans 10 cas sur 100)

α=0,05, puis P=0,95 (dans 5 cas sur 100)

α=0,01, puis P=0,99 (dans 1 cas sur 100) l'hypothèse correcte peut être rejetée

Le nombre de degrés de liberté df est défini comme le nombre de groupes dans la série de distribution moins le nombre de connexions : df = k –z. Le nombre de connexions s'entend comme le nombre d'indicateurs des séries empiriques utilisées dans le calcul des fréquences théoriques, c'est-à-dire indicateurs reliant les fréquences empiriques et théoriques.Par exemple, lorsqu'il est aligné sur une courbe en cloche, il existe trois relations.Par conséquent, lorsqu’il est aligné parcourbe en clochele nombre de degrés de liberté est défini par df =k–3.Pour évaluer la signification, la valeur calculée est comparée au tableau χ 2 tableaux

Avec coïncidence complète des distributions théorique et empirique χ 2 =0, sinon χ 2 >0. Si χ 2 calc > χ 2 tab , alors pour un niveau de signification et un nombre de degrés de liberté donnés, nous rejetons l'hypothèse de l'insignifiance (caractère aléatoire) des écarts. Si χ 2 calculé< χ 2 табл то nous acceptons l'hypothèse et avec une probabilité P = (1-α), on peut affirmer que l'écart entre théorique et fréquences empiriques accidentellement. Il y a donc lieu d’affirmer que la distribution empirique obéit répartition normale. Le test d'adéquation de Pearson est utilisé si la taille de la population est suffisamment grande (N>50) et que la fréquence de chaque groupe doit être d'au moins 5.

Basé sur la détermination de l'écart maximal entre les fréquences empiriques et théoriques accumulées :

où D et d sont respectivement la différence maximale entre les fréquences cumulées et les fréquences cumulées des distributions empiriques et théoriques.
À l'aide du tableau de distribution des statistiques de Kolmogorov, la probabilité est déterminée, qui peut varier de 0 à 1. Lorsque P(λ) = 1, il y a une coïncidence complète des fréquences, P(λ) = 0 - une divergence complète. Si la valeur de probabilité P est significative par rapport à la valeur trouvée λ, alors nous pouvons supposer que les écarts entre les distributions théorique et empirique sont insignifiants, c'est-à-dire qu'ils sont aléatoires.
La principale condition pour utiliser le critère de Kolmogorov est que grand nombre observations.

Test d'ajustement de Kolmogorov

Considérons comment le critère de Kolmogorov (λ) est appliqué lorsque tester l'hypothèse de distribution normale population générale.L'alignement de la distribution réelle sur la courbe en cloche comprend plusieurs étapes :

  1. Comparez les fréquences réelles et théoriques.
  2. Sur la base de données réelles, les fréquences théoriques de la courbe de distribution normale, qui sont fonction de l'écart normalisé, sont déterminées.
  3. Ils vérifient dans quelle mesure la distribution de la caractéristique correspond à la normale.

PourIVcolonnes du tableau :

Dans MS Excel, l'écart normalisé (t) est calculé à l'aide de la fonction NORMALISATION. Il est nécessaire de sélectionner une plage de cellules libres par le nombre d'options (lignes tableur). Sans supprimer la sélection, appelez la fonction NORMALIZE. Dans la boîte de dialogue qui apparaît, précisez les cellules suivantes, qui contiennent respectivement les valeurs observées (X i), la moyenne (X) et l'écart type Ϭ. L'opération doit être terminée simultané en appuyant sur Ctrl+Maj+Entrée

PourVcolonnes du tableau :

La fonction de densité de probabilité de la distribution normale φ(t) se trouve à partir du tableau des valeurs de la fonction de Laplace locale pour la valeur correspondante de l'écart normalisé (t)

PourVIcolonnes du tableau :

Test d'ajustement de Kolmogorov (λ) déterminé en divisant le moduledifférence maximaleentre les fréquences cumulées empiriques et théoriques par la racine carrée du nombre d'observations :

En utilisant une table de probabilité spéciale pour le critère d'accord λ, nous déterminons que la valeur λ = 0,59 correspond à une probabilité de 0,88 (λ

Distribution des fréquences empiriques et théoriques, densité de probabilité de la distribution théorique

Lors de l'application de tests d'adéquation pour vérifier si la distribution observée (empirique) correspond à la distribution théorique, il convient de faire la distinction entre le test d'hypothèses simples et complexes.

Le test de normalité de Kolmogorov-Smirnov sur un échantillon est basé sur différence maximale entre cumulatif distribution empiriqueéchantillon et la distribution cumulative supposée (théorique). Si la statistique D de Kolmogorov-Smirnov est significative, alors l’hypothèse selon laquelle la distribution correspondante est normale doit être rejetée.

Voir aussi

Critères pour tester le caractère aléatoire et évaluer les observations aberrantes Littérature Introduction En pratique analyse statistique données expérimentales, l’intérêt principal n’est pas le calcul lui-même de certaines statistiques, mais les réponses à des questions de ce type. Ainsi, de nombreux critères ont été élaborés pour vérifier les arguments avancés. hypothèses statistiques. Tous les critères permettant de tester les hypothèses statistiques sont divisés en deux grands groupes: paramétrique et non paramétrique.


Partagez votre travail sur les réseaux sociaux

Si cette œuvre ne vous convient pas, en bas de page se trouve une liste d’œuvres similaires. Vous pouvez également utiliser le bouton de recherche


Test

Utiliser les critères de consentement

Introduction

Littérature

Introduction

Dans la pratique de l'analyse statistique de données expérimentales, l'intérêt principal n'est pas le calcul de certaines statistiques lui-même, mais les réponses à des questions de ce type. La moyenne de la population est-elle vraiment égale à un certain nombre ? Le coefficient de corrélation est-il significativement différent de zéro ? Les variances des deux échantillons sont-elles égales ? Et de nombreuses questions de ce type peuvent se poser, en fonction du problème de recherche spécifique. Ainsi, de nombreux critères ont été développés pour tester les hypothèses statistiques proposées. Nous examinerons certains des plus courants. Ceux-ci porteront principalement sur les moyennes, les variances, les coefficients de corrélation et les distributions d'abondance.

Tous les critères permettant de tester les hypothèses statistiques sont divisés en deux grands groupes : paramétriques et non paramétriques. Les tests paramétriques reposent sur l'hypothèse que les données de l'échantillon sont tirées d'une population dont la distribution est connue, et la tâche principale est d'estimer les paramètres de cette distribution. Les tests non paramétriques ne nécessitent aucune hypothèse sur la nature de la distribution, autre que l'hypothèse selon laquelle elle est continue.

Regardons d'abord critères paramétriques. La séquence de test comprendra la formulation de l'hypothèse nulle et de l'hypothèse alternative, la formulation des hypothèses à formuler, la détermination des statistiques d'échantillon utilisées dans le test et la formation de la distribution d'échantillon des statistiques testées, la identification des régions critiques pour le critère sélectionné et construction d'un intervalle de confiance pour les statistiques de l'échantillon.

1 Critères d'adéquation des moyens

Supposons que l'hypothèse testée soit celle du paramètre de population. La nécessité d’un tel contrôle peut survenir, par exemple, dans la situation suivante. Supposons que, sur la base de recherches approfondies, le diamètre de la coquille d'un mollusque fossile dans les sédiments d'un emplacement fixe ait été établi. Disposons également d'un certain nombre de coquilles trouvées à un autre endroit, et nous faisons l'hypothèse qu'un endroit précis n'affecte pas le diamètre de la coquille, c'est-à-dire que la valeur moyenne du diamètre de la coquille pour l'ensemble de la population de mollusques qui vivaient autrefois dans un nouvel endroit est égale à la valeur connue obtenue précédemment lors de l'étude de ce type de mollusque dans le premier habitat.

Si ceci valeur connue est égale, alors l'hypothèse nulle et l'hypothèse alternative s'écrivent comme suit : Supposons que la variable x dans la population considérée a répartition normale, et l'ampleur de la variance de la population est inconnue.

Nous testerons l’hypothèse à l’aide de statistiques :

, (1)
où est l’écart type de l’échantillon.

Il a été montré que si c'est vrai, alors t dans l'expression (1) a une distribution t de Student avec n-1 degrés de liberté. Si nous choisissons le niveau de signification (la probabilité de rejeter l'hypothèse correcte) égal, alors conformément à ce qui a été discuté dans chapitre précédent, vous pouvez définir des valeurs critiques pour vérifier =0.

DANS dans ce cas, puisque la distribution de Student est symétrique, alors (1-) une partie de l'aire sous la courbe de cette distribution avec n-1 degrés de liberté sera contenue entre les points et, qui sont égaux les uns aux autres dans valeur absolue. Par conséquent, toutes les valeurs sont inférieures à une valeur négative et supérieures à une valeur positive pour une distribution t avec numéro donné les degrés de liberté au niveau de signification choisi constitueront la région critique. Si la valeur t de l'échantillon se situe dans cette région, l'hypothèse alternative est acceptée.

Intervalle de confiance for est construit selon la méthode décrite précédemment et est déterminé à partir de l'expression suivante

(2)

Sachons donc dans notre cas que le diamètre de la coquille d'un mollusque fossile est de 18,2 mm. Nous avions à notre disposition un échantillon de 50 coquilles nouvellement trouvées, pour lesquelles mm, a = 2,18 mm. Vérifions : =18,2 contre On a

Si le niveau de signification est choisi =0,05 alors valeur critique. Il s’ensuit qu’il peut être rejeté en faveur au niveau de signification =0,05. Ainsi, pour notre exemple hypothétique, on peut affirmer (avec une certaine probabilité, bien sûr) que le diamètre de la coquille des mollusques fossiles certain type cela dépend des endroits dans lesquels ils ont vécu.

Étant donné que la distribution t est symétrique, seulement valeurs positives t de cette distribution à des niveaux de signification sélectionnés et en nombre de degrés de liberté. De plus, non seulement la part de l'aire sous la courbe de distribution à droite de la valeur t est prise en compte, mais également à gauche de la valeur -t. Cela est dû au fait que dans la plupart des cas, lors du test d'hypothèses, nous nous intéressons à la signification des écarts en eux-mêmes, que ces écarts soient plus grands ou plus petits, c'est-à-dire on vérifie par rapport, et non par : >a ou :

Revenons maintenant à notre exemple. L'intervalle de confiance de 100(1-) % pour est

18,92,01

Considérons maintenant le cas où il est nécessaire de comparer les moyennes de deux populations générales. L'hypothèse testée ressemble à ceci : : =0, : 0. On suppose également qu'elle a une distribution normale avec une moyenne et une variance, et - une distribution normale avec une moyenne et la même variance. De plus, nous supposons que les échantillons à partir desquels les populations générales sont estimées sont extraits indépendamment les uns des autres et ont respectivement un volume et. De l'indépendance des échantillons, il s'ensuit que si nous en prenons un plus grand nombre et calculons la moyenne valeurs pour chaque paire, alors l'ensemble de ces paires de moyennes sera complètement décorrélé.

Les tests d'hypothèse nulle sont effectués à l'aide de statistiques

(3)

où et sont des estimations de variance pour le premier et le deuxième échantillons, respectivement. Il est facile de voir que (3) est une généralisation de (1).

Il a été montré que les statistiques (3) ont une distribution t de Student avec degrés de liberté. Si et sont égaux, c'est-à-dire = = la formule (3) est simplifiée et a la forme

(4)

Regardons un exemple. Supposons qu’en mesurant les feuilles caulinaires d’une même population végétale sur deux saisons, on obtienne les résultats suivants : Nous supposons que les conditions d’utilisation du test de Student, c’est-à-dire la normalité des populations dans lesquelles sont prélevés les échantillons, l'existence d'une variance inconnue mais identique pour ces populations et l'indépendance des échantillons sont satisfaites. Estimons au niveau de signification =0,01. Nous avons

Valeur du tableau t = 2,58. Par conséquent, l'hypothèse de l'égalité des valeurs moyennes de la longueur des feuilles de la tige pour une population végétale sur deux saisons doit être rejetée au niveau de signification choisi.

Attention! L'hypothèse nulle en statistique mathématique est l'hypothèse selon laquelle il n'y a pas de différences significatives entre les indicateurs comparés, qu'il s'agisse de moyennes, de variances ou d'autres statistiques. Et dans tous ces cas, si la valeur empirique (calculée par formule) du critère est supérieure à la valeur théorique (sélectionnée dans les tableaux), il est rejeté. Si la valeur empirique est inférieure à la valeur tabulée, alors elle est acceptée.

Afin de construire un intervalle de confiance pour la différence entre les moyennes de ces deux populations, prêtons attention au fait que le test de Student, comme le montre la formule (3), évalue la significativité de la différence entre les moyennes relatives à l'erreur type de cette différence. Il est facile de vérifier que le dénominateur de (3) représente précisément cette erreur type en utilisant les relations et les hypothèses évoquées précédemment. En fait, nous savons qu'en général

Si x et y sont indépendants, alors le sont aussi

En prenant des valeurs d'échantillon et au lieu de x et y, et en rappelant l'hypothèse faite selon laquelle les deux populations ont la même variance, on obtient

(5)

L'estimation de la variance peut être obtenue à partir de la relation suivante

(6)

(Nous divisons par car deux quantités sont estimées à partir des échantillons et, par conséquent, le nombre de degrés de liberté doit être réduit de deux.)

Si nous remplaçons maintenant (6) dans (5) et prenons la racine carrée, nous obtenons le dénominateur dans l'expression (3).

Après cette digression, revenons à la construction d'un intervalle de confiance pour travers -.

Nous avons

Faisons quelques commentaires liés aux hypothèses utilisées dans la construction du test t. Tout d'abord, il a été montré que les violations de l'hypothèse de normalité pour ont un effet insignifiant sur le niveau de signification et la puissance du test pour 30. Les violations de l'hypothèse d'homogénéité des variances des deux populations à partir desquelles les échantillons sont prélevés sont également insignifiant, mais seulement dans le cas où les tailles d’échantillon sont égales. Si les variances des deux populations diffèrent les unes des autres, alors les probabilités d'erreurs des premier et deuxième types différeront considérablement de celles attendues.

Dans ce cas, le critère doit être utilisé pour vérifier

(7)

avec le nombre de degrés de liberté

. (8)

En règle générale, il s'avère qu'il s'agit d'un nombre fractionnaire. Par conséquent, lors de l'utilisation de tableaux de distribution t, il est nécessaire de prendre les valeurs du tableau pour les valeurs entières les plus proches et d'interpoler pour trouver le t correspondant au en a obtenu un.

Regardons un exemple. Lors de l'étude de deux sous-espèces de grenouilles de lac, le rapport entre la longueur du corps et la longueur du tibia a été calculé. Deux échantillons ont été prélevés avec des volumes =49 et =27. Les moyennes et les variances de la relation qui nous intéresse se sont révélées égales, respectivement, =2,34 ; =2,08 ; =0,21 ; =0,35. Si nous testons maintenant l'hypothèse à l'aide de la formule (2), nous obtenons que

Au niveau de signification =0,05, il faut rejeter l'hypothèse nulle (valeur tabulée t = 1,995) et supposer qu'il existe des différences statistiquement significatives au niveau de signification choisi entre les valeurs moyennes des paramètres mesurés pour les deux sous-espèces de grenouilles. .

En utilisant les formules (6) et (7) nous avons

Dans ce cas, pour le même niveau de signification =0,05, la valeur du tableau est t=2,015 et l'hypothèse nulle est acceptée.

Cet exemple montre clairement que négliger les conditions acceptées lors de la dérivation d'un critère particulier peut conduire à des résultats directement opposés à ceux qui se produisent réellement. Bien entendu, dans ce cas, ayant des échantillons de tailles différentes en l'absence de fait préétabli que les variances de l'indicateur mesuré dans les deux populations sont statistiquement égales, il a fallu utiliser les formules (7) et (8), qui ont montré l’absence de différences statistiquement significatives.

Par conséquent, je voudrais répéter une fois de plus que vérifier le respect de toutes les hypothèses formulées lors de l'élaboration d'un critère particulier est une condition absolument nécessaire à son utilisation correcte.

L’exigence constante dans les deux modifications ci-dessus du test t était l’exigence que les échantillons soient indépendants les uns des autres. Cependant, dans la pratique, il arrive souvent que cette exigence ne puisse être satisfaite pour des raisons objectives. Par exemple, certains indicateurs sont mesurés sur un même animal ou zone de territoire avant et après l’action d’un facteur extérieur, etc. Et dans ces cas, nous pourrions être intéressés à tester l’hypothèse. Nous continuerons de supposer que les deux échantillons proviennent de populations normales présentant la même variance.

Dans ce cas, nous pouvons profiter du fait que les différences entre des quantités normalement distribuées ont également une distribution normale, et donc nous pouvons utiliser le test t de Student sous la forme de (1). Ainsi, l'hypothèse sera testée selon laquelle n différences sont un échantillon d'une population normalement distribuée avec une moyenne égale à zéro.

En désignant la i-ème différence par, nous avons

, (9)

Regardons un exemple. Ayons à notre disposition des données sur le nombre d'impulsions d'une cellule nerveuse individuelle pendant un certain intervalle de temps avant () et après () l'action du stimulus :

Par conséquent, en gardant à l’esprit que (9) a une distribution t et en choisissant un niveau de signification de =0,01, dans le tableau correspondant en annexe, nous constatons que la valeur critique de t pour n-1=10-1=9 degrés de liberté est de 3,25. Une comparaison des valeurs théoriques et empiriques de la statistique t montre que l'hypothèse nulle d'absence de différences statistiquement significatives entre les taux de déclenchement avant et après le stimulus doit être rejetée. On peut conclure que le stimulus utilisé modifie statistiquement de manière significative la fréquence des impulsions.

Dans les études expérimentales, comme mentionné ci-dessus, des échantillons dépendants apparaissent assez souvent. Cependant, ce fait est parfois ignoré et le test t est utilisé de manière incorrecte dans le formulaire (3).

Le caractère inapproprié de cette situation peut être constaté en considérant les erreurs types de la différence entre les moyennes non corrélées et corrélées. Dans le premier cas

Et dans la seconde

L'erreur type de la différence d est

En tenant compte de cela, le dénominateur en (9) aura la forme

Faisons maintenant attention au fait que les numérateurs des expressions (4) et (9) coïncident :

par conséquent, la différence de valeur de t dépend des dénominateurs.

Ainsi, si la formule (3) est utilisée dans un problème avec des échantillons dépendants et que les échantillons ont une corrélation positive, alors les valeurs t résultantes seront inférieures à ce qu'elles devraient être lors de l'utilisation de la formule (9), et une situation peut survenir où l'hypothèse nulle sera acceptée lorsqu'elle est fausse. La situation inverse peut se produire lorsqu'il existe une corrélation négative entre les échantillons, c'est-à-dire dans ce cas, des différences seront reconnues comme significatives alors qu’elles ne le sont pas.

Revenons à l'exemple avec l'activité impulsionnelle et calculons la valeur t pour les données données à l'aide de la formule (3), sans prêter attention au fait que les échantillons sont liés. On a : Pour le nombre de degrés de liberté égal à 18, et le niveau de signification = 0,01, la valeur du tableau est t = 2,88 et, à première vue, il semble que rien ne se soit produit, même en utilisant une formule inadaptée au conditions données. Et dans ce cas, la valeur t calculée conduit au rejet de l’hypothèse nulle, c’est-à-dire à la même conclusion que celle tirée de la formule (9), correcte dans cette situation.

Cependant, reformatons les données existantes et présentons-les sous la forme suivante (2) :

Ce sont les mêmes valeurs, et elles pourraient bien être obtenues dans l’une des expériences. Étant donné que toutes les valeurs des deux échantillons sont conservées, l'utilisation du test t de Student dans la formule (3) donne la valeur précédemment obtenue = 3,32 et conduit à la même conclusion que celle déjà tirée.

Calculons maintenant la valeur de t à l’aide de la formule (9), qui devrait être utilisée dans ce cas. Nous avons : La valeur critique de t au niveau de signification sélectionné et à neuf degrés de liberté est de 3,25. Par conséquent, nous n'avons aucune raison de rejeter l'hypothèse nulle, nous l'acceptons, et il s'avère que cette conclusion est directement opposée à celle qui a été tirée lors de l'utilisation de la formule (3).

Grâce à cet exemple, nous avons été une fois de plus convaincus de l'importance d'obtenir des conclusions correctes lors de l'analyse des données expérimentales afin de respecter strictement toutes les exigences qui ont servi de base à la détermination d'un critère particulier.

Les modifications envisagées du test de Student visent à tester des hypothèses concernant la moyenne de deux échantillons. Cependant, des situations surviennent lorsqu'il devient nécessaire de tirer en même temps des conclusions sur l'égalité des k moyennes. Pour ce cas, une certaine procédure statistique a également été développée, qui sera discutée plus tard lors de l'examen des questions liées à l'analyse de la variance.

2 tests d'adéquation pour les écarts

Les tests d'hypothèses statistiques concernant les variances de population sont effectués dans le même ordre que pour les moyennes. Rappelons brièvement cette séquence.

1. Une hypothèse nulle est formulée (sur l'absence de différences statistiquement significatives entre les variances comparées).

2. Certaines hypothèses sont faites concernant la distribution d'échantillonnage des statistiques avec lesquelles il est prévu d'estimer le paramètre inclus dans l'hypothèse.

3. Le niveau de signification pour tester l'hypothèse est sélectionné.

4. La valeur des statistiques qui nous intéressent est calculée et une décision est prise concernant la véracité de l'hypothèse nulle.

Commençons maintenant par tester l'hypothèse selon laquelle la variance de la population =a, c'est-à-dire contre. Si nous supposons que la variable x a une distribution normale et qu'un échantillon de taille n est tiré au hasard dans la population, alors les statistiques sont utilisées pour tester l'hypothèse nulle.

(10)

En nous rappelant la formule de calcul de la dispersion, nous réécrivons (10) comme suit :

. (11)

De cette expression, il ressort clairement que le numérateur est la somme des carrés des écarts des valeurs normalement distribuées par rapport à leur moyenne. Chacun de ces écarts est également normalement distribué. Par conséquent, conformément à la distribution que nous connaissons, les sommes des carrés des valeurs normalement distribuées des statistiques (10) et (11) ont une distribution -avec n-1 degrés de liberté.

Par analogie avec l'utilisation de la distribution t, lors de la vérification du niveau de signification sélectionné, des points critiques sont établis à partir du tableau de distribution, correspondant aux probabilités d'acceptation de l'hypothèse nulle et. L’intervalle de confiance pour at selected est construit comme suit :

. (12)

Regardons un exemple. Supposons, sur la base de recherches expérimentales approfondies, que la dispersion de la teneur en alcaloïdes d'une espèce végétale d'une certaine zone est égale à 4,37 unités conventionnelles. Le spécialiste dispose d'un échantillon de n = 28 plantes de ce type, vraisemblablement originaires de la même zone. L'analyse a montré que pour cet échantillon = 5,01 et nous devons nous assurer que cette variance et les variances connues précédemment sont statistiquement impossibles à distinguer au niveau de signification = 0,1.

D'après la formule (10) on a

La valeur résultante doit être comparée aux valeurs critiques /2=0,05 et 1--/2=0,95. D'après le tableau de l'annexe pour 27 degrés de liberté, nous avons respectivement 40,1 et 16,2, ce qui signifie que l'hypothèse nulle peut être acceptée. L'intervalle de confiance correspondant pour est de 3,37<<8,35.

Contrairement au test des hypothèses concernant les moyennes d'échantillon à l'aide du test de Student, lorsque les erreurs des premier et deuxième types ne changeaient pas de manière significative lorsque l'hypothèse de distribution normale des populations était violée, dans le cas des hypothèses sur les variances lorsque les conditions de normalité n'étaient pas rencontrées, les erreurs ont changé de manière significative.

Le problème considéré ci-dessus concernant l'égalité de la variance par rapport à une valeur fixe est d'un intérêt limité, car les situations sont assez rares lorsque la variance de la population est connue. Le cas le plus intéressant est celui où il faut vérifier si les variances de deux populations sont égales, c'est-à-dire tester une hypothèse par rapport à une alternative. On suppose que les échantillons de taille et sont tirés au hasard dans la population générale avec des variances et.

Pour tester l'hypothèse nulle, le test du rapport de variance de Fisher est utilisé

(13)

Étant donné que les sommes des écarts carrés des variables aléatoires normalement distribuées par rapport à leurs moyennes ont une distribution, le numérateur et le dénominateur de (13) sont des valeurs distribuées divisées par et respectivement, et leur rapport a donc une distribution F avec -1 et -1 degrés de liberté.

Il est généralement admis - et c'est ainsi que sont construits les tableaux de distribution F - que la plus grande des variances est prise comme numérateur dans (13), et donc un seul point critique est déterminé, correspondant au niveau de signification choisi.

Disposons de deux échantillons de volume =11 et =28 provenant de populations d'escargots de bassin communs et ovales, pour lesquels les rapports hauteur sur largeur présentent des variances =0,59 et =0,38. Il est nécessaire de tester l'hypothèse d'égalité de ces variances de ces indicateurs pour les populations étudiées au niveau de signification =0,05. Nous avons

Dans la littérature, on peut parfois trouver une affirmation selon laquelle le test de l'hypothèse d'égalité des moyennes à l'aide du test t de Student doit être précédé du test de l'hypothèse d'égalité des variances. C’est une mauvaise recommandation. De plus, cela peut conduire à des erreurs qui peuvent être évitées si elles ne sont pas respectées.

En effet, les résultats du test de l'hypothèse d'égalité des variances à l'aide du test de Fisher dépendent largement de l'hypothèse selon laquelle les échantillons sont tirés de populations ayant une distribution normale. Dans le même temps, le test de Student est insensible aux violations de la normalité, et s'il est possible d'obtenir des échantillons de taille égale, alors l'hypothèse d'égalité des variances n'est pas non plus significative. Dans le cas de n inégal, les formules (7) et (8) doivent être utilisées pour la vérification.

Lors du test d'hypothèses sur l'égalité des variances, certaines caractéristiques apparaissent dans les calculs associés aux échantillons dépendants. Dans ce cas, les statistiques sont utilisées pour tester une hypothèse par rapport à une alternative.

(14)

Si l'hypothèse nulle est vraie, alors les statistiques (14) ont une distribution t de Student avec n-2 degrés de liberté.

Lors de la mesure de la brillance de 35 échantillons de revêtement, une dispersion de = 134,5 a été obtenue. Des mesures répétées deux semaines plus tard ont montré =199,1. Dans ce cas, le coefficient de corrélation entre les mesures appariées s'est avéré être égal à =0,876. Si nous ignorons le fait que les échantillons sont dépendants et utilisons le test de Fisher pour tester l'hypothèse, nous obtenons F=1,48. Si vous choisissez le niveau de signification =0,05, alors l'hypothèse nulle sera acceptée, puisque la valeur critique de la distribution F pour =35-1=34 et =35-1=34 degrés de liberté est de 1,79.

Dans le même temps, si l'on utilise la formule (14) adaptée à ce cas, on obtient t = 2,35, tandis que la valeur critique de t pour 33 degrés de liberté et le niveau de signification choisi = 0,05 est égal à 2,03. Par conséquent, l’hypothèse nulle d’égalité des variances dans les deux échantillons doit être rejetée. Ainsi, à partir de cet exemple, il ressort clairement que, comme dans le cas du test de l'hypothèse d'égalité des moyennes, l'utilisation d'un critère qui ne prend pas en compte les spécificités des données expérimentales conduit à une erreur.

Dans la littérature recommandée, vous pouvez trouver le test de Bartlett, qui est utilisé pour tester des hypothèses sur l'égalité simultanée de k variances. Outre le fait que le calcul statistique de ce critère est assez laborieux, le principal inconvénient de ce critère est qu'il est exceptionnellement sensible aux écarts par rapport à l'hypothèse de distribution normale des populations à partir desquelles les échantillons sont tirés. Ainsi, lorsque vous l’utilisez, vous ne pouvez jamais être sûr que l’hypothèse nulle est réellement rejetée parce que les variances sont statistiquement significativement différentes, et non parce que les échantillons ne sont pas normalement distribués. Ainsi, si le problème de la comparaison de plusieurs variances se pose, il faut rechercher une formulation du problème où il sera possible d'utiliser le critère de Fisher ou ses modifications.

3 Critères d'accord sur les actions

Très souvent, il est nécessaire d'analyser des populations dans lesquelles les objets peuvent être classés dans l'une des deux catégories suivantes. Par exemple, par sexe dans une certaine population, par la présence d'un certain oligo-élément dans le sol, par la couleur foncée ou claire des œufs chez certaines espèces d'oiseaux, etc.

Nous désignons la proportion d'éléments qui ont une certaine qualité par P, où P représente le rapport des objets ayant la qualité qui nous intéresse à tous les objets de l'agrégat.

Testons l'hypothèse selon laquelle dans une population suffisamment grande, la part P est égale à un certain nombre a (0

Pour les variables dichotomiques (ayant deux gradations), comme dans notre cas, P joue le même rôle que la moyenne de la population de variables mesurées quantitativement. D'autre part, il a été dit précédemment que l'erreur type de la fraction P peut être représentée par

Alors, si l’hypothèse est vraie, alors les statistiques

, (19)
où p est la valeur P de l'échantillon, a une distribution normale unitaire. Précisons d'emblée qu'une telle approximation est valable si le moindre des produits np ou (1-p)n est supérieur à 5.

Sachez par la littérature que dans la population de grenouilles lacustres, la proportion d'individus présentant une bande longitudinale sur le dos est de 62 %, soit 0,62. Nous avions à notre disposition un échantillon de 125 (n) individus dont 93 (f) présentent une bande longitudinale sur le dos. Il est nécessaire de savoir si la proportion d'individus présentant le trait qui nous intéresse dans la population sur laquelle l'échantillon a été prélevé correspond aux données connues. On a : p=f/n=93/125=0,744, a=0,62, n(1-p)=125(1-0,744)=32>5 et

Par conséquent, pour les niveaux de signification = 0,05 et = 0,01, l'hypothèse nulle doit être rejetée, puisque la valeur critique pour = 0,05 est 1,96 et pour = 0,01 - 2,58.

S'il existe deux grandes populations dans lesquelles les proportions d'objets possédant la propriété qui nous intéresse sont respectivement et, alors il est intéressant de tester l'hypothèse : = contre l'alternative :. Pour les tests, deux échantillons de volumes et sont extraits de manière aléatoire et indépendante. Sur la base de ces échantillons, des statistiques sont estimées et déterminées.

(20)

où et est le nombre d'objets possédant cette caractéristique, respectivement, dans le premier et le deuxième échantillons.

De la formule (20), on peut comprendre que dans sa dérivation, le même principe que celui que nous avons rencontré précédemment a été utilisé. À savoir, pour tester des hypothèses statistiques, on détermine le nombre d'écarts types qui composent la différence entre les indicateurs qui nous intéressent. En effet, la valeur (+)/(+) représente la proportion d'objets ayant une caractéristique donnée dans les deux ; échantillons simultanément. Si on le note, alors l'expression entre parenthèses du dénominateur (20) représente (1-) et il devient évident que l'expression (20) est équivalente à la formule pour tester l'hypothèse nulle :

Parce que.

En revanche, c'est une erreur standard. Ainsi, (20) peut s’écrire

. (21)

La seule différence entre cette statistique et la statistique utilisée pour tester les hypothèses sur les moyennes est que z a une distribution normale unitaire plutôt qu'une distribution t.

Que l'étude d'un groupe de personnes (=82) montre que la proportion de personnes qui ont un rythme - dans leur électroencéphalogramme est de 0,84 ou 84 %. Une étude portant sur un groupe de personnes dans une autre zone (=51) a révélé que cette proportion était de 0,78. Pour un seuil de signification =0,05, il faut vérifier que les proportions d'individus ayant une activité cérébrale alpha dans les populations générales dans lesquelles les échantillons ont été prélevés sont les mêmes.

Assurons-nous tout d’abord que les données expérimentales disponibles permettent d’utiliser des statistiques (20). Nous avons:

et puisque z a une distribution normale, pour laquelle le point critique à =0,05 est 1,96, alors l'hypothèse nulle est acceptée.

Le critère considéré est valable si les échantillons pour lesquels ont été comparées les proportions d'objets présentant la caractéristique qui nous intéresse sont indépendants. Si cette condition n'est pas remplie, par exemple lorsqu'une population est considérée dans des intervalles de temps successifs, alors le même objet peut ou non présenter cette caractéristique dans ces intervalles.

Notons la présence d'un attribut qui nous intéresse par 1, et son absence par 0. Nous arrivons ensuite au tableau 3, où (a+c) est le nombre d'objets du premier échantillon qui ont un attribut, (a +c) est le nombre d'objets présentant cette caractéristique dans le deuxième échantillon, et n est le nombre total d'objets examinés. Évidemment, il s'agit déjà d'un tableau à quatre champs bien connu, dont la relation est évaluée à l'aide du coefficient

Pour une telle table et petite (<10) значений в каждой клетке Р.Фишером было найдено точное распределение для, которое позволяет проверять гипотезу: =. Это распределение имеет довольно сложный вид, и его критические точки приводятся в специальных таблицах. В реальных ситуациях, как правило, значения в каждой клетке больше 10, и было показано, что в этих случаях для проверки нулевой гипотезы можно использовать статистику

(22)
qui, si l’hypothèse nulle est vraie, a une distribution du chi carré avec un degré de liberté.

Regardons un exemple. Testons sur deux ans l'efficacité des vaccins antipaludiques administrés à différentes périodes de l'année. L'hypothèse est testée selon laquelle l'efficacité des vaccins ne dépend pas de la période de l'année à laquelle ils sont administrés. Nous avons

La valeur du tableau pour =0,05 est 3,84 et pour =0,01 est 6,64. Par conséquent, à n’importe lequel de ces niveaux de signification, l’hypothèse nulle doit être rejetée, et dans cet exemple hypothétique (même si lié à la réalité), on peut conclure que les paris effectués au cours du second semestre sont nettement plus efficaces.

Une généralisation naturelle du coefficient de couplage pour une table à quatre champs est, comme mentionné précédemment, le coefficient de conjugaison mutuelle de Chuprov. La distribution exacte de ce coefficient est inconnue, la validité de l'hypothèse est donc jugée en comparant la valeur calculée et le niveau de signification sélectionné avec les points critiques pour cette distribution. Le nombre de degrés de liberté est déterminé à partir de l'expression (r-1)(c-1), où r et c sont le nombre de gradations pour chacune des caractéristiques.

Rappelons les formules de calcul

Les données obtenues en étudiant le champ de vision des yeux droit et gauche chez des personnes sans anomalies visuelles sont présentées. Classiquement, cette plage est divisée en quatre catégories, et nous nous intéressons à la fiabilité de la relation entre la plage visuelle de l'œil gauche et de l'œil droit. Commençons par trouver tous les termes de la double somme. Pour ce faire, le carré de chaque valeur donnée dans le tableau est divisé par la somme de la ligne et de la colonne auxquelles appartient le nombre sélectionné. Nous avons

En utilisant cette valeur, nous obtenons =3303,6 et T=0,714.

4 Critères de comparaison des répartitions de population

Dans les expériences classiques de sélection de pois qui ont marqué le début de la génétique, G. Mendel a observé les fréquences de différents types de graines obtenues en croisant des plantes à graines rondes jaunes et à graines vertes ridées.

Dans ce cas et dans des cas similaires, il est intéressant de tester l'hypothèse nulle sur l'égalité des fonctions de distribution des populations générales à partir desquelles les échantillons sont tirés, c'est-à-dire Des calculs théoriques ont montré que les statistiques peuvent être utilisées pour résoudre un tel problème

= (23)

Le critère utilisant cette statistique a été proposé par K. Pearson et porte son nom. Le test de Pearson est utilisé pour les données groupées, qu'elles aient une distribution continue ou discrète. Dans (23), k est le nombre d'intervalles de regroupement, représente les nombres empiriques et représente les nombres attendus ou théoriques (= n). Si l'hypothèse nulle est vraie, les statistiques (23) ont une distribution avec k-1 degrés de liberté.

Pour les données indiquées dans le tableau

Les points critiques de la distribution à 3 degrés de liberté pour =0,05 et =0,01 sont égaux respectivement à 7,81 et 11,3. Par conséquent, l’hypothèse nulle est acceptée et la conclusion est tirée que la ségrégation chez les descendants correspond assez bien aux schémas théoriques.

Regardons un autre exemple. Dans une colonie de cobayes, les nombres de naissances mâles suivants ont été obtenus au cours de l'année par mois, à partir de janvier : 65, 64, 65, 41, 72, 80, 88, 114, 80, 129, 112, 99. Peut on considère que les données obtenues correspondent à une distribution uniforme, c'est-à-dire distribution dans laquelle le nombre d'hommes nés au cours des différents mois est en moyenne le même ? Si nous acceptons cette hypothèse, alors le nombre moyen attendu d’hommes nés sera égal. Alors

La valeur critique d'une distribution avec 11 degrés de liberté et = 0,01 est 24,7, donc au niveau de signification choisi, l'hypothèse nulle est rejetée. Une analyse plus approfondie des données expérimentales montre que la probabilité que des cobayes mâles naissent au cours du second semestre augmente.

Dans le cas où la distribution théorique est supposée uniforme, le calcul des nombres théoriques ne pose aucun problème. Dans le cas d'autres distributions, les calculs deviennent plus compliqués. Examinons des exemples de la façon dont les nombres théoriques sont calculés pour les distributions normales et de Poisson, qui sont assez courantes dans la pratique de la recherche.

Commençons par déterminer les nombres théoriques pour la distribution normale. L’idée est de transformer notre distribution empirique en une distribution à moyenne nulle et à variance unitaire. Naturellement, dans ce cas, les limites des intervalles de classe seront exprimées en unités d'écart type, puis, en rappelant que l'aire sous la section de la courbe limitée par les valeurs supérieure et inférieure de chaque intervalle est égale à la probabilité de tomber dans un intervalle donné, en multipliant cette probabilité par le nombre total d'échantillonnage nous obtiendrons le nombre théorique souhaité.

Supposons que nous ayons une distribution empirique pour la longueur des feuilles de chêne et que nous devions vérifier si l'on peut considérer avec un niveau de signification de =0,05 que cette distribution ne diffère pas significativement de la normale.

Expliquons comment les valeurs indiquées dans le tableau ont été calculées. Tout d’abord, en utilisant la méthode standard pour les données groupées, la moyenne et l’écart type ont été calculés, qui se sont révélés égaux à =10,3 et =2,67. En utilisant ces valeurs, les limites des intervalles ont été trouvées en unités d'écart type, c'est-à-dire des valeurs standardisées ont été trouvées. Par exemple, pour les limites de l'intervalle (46) nous avons : (4-10,3)/2,67=-2,36 ; (6-10,3)/2,67=-1,61. Ensuite, pour chaque intervalle, la probabilité d’y tomber a été calculée. Par exemple, pour l'intervalle (-0,110,64) de la table de distribution normale, on a qu'à gauche du point (-0,11) il y a 0,444 de l'aire de la distribution normale unitaire, et à gauche de au point (0,64) il y a 0,739 de cette surface. Ainsi, la probabilité de tomber dans cet intervalle est de 0,739-0,444=0,295. Le reste des calculs est évident. La différence entre n et... doit être expliquée. Cela est dû au fait que la distribution normale théorique peut être considérée, à des fins pratiques, comme centrée sur un intervalle. Dans l'expérience, il n'y a pas de valeurs s'écartant plus que de la moyenne. Par conséquent, l'aire sous la courbe de distribution empirique n'est pas égale à l'unité, ce qui entraîne une erreur. Cependant, cette erreur ne modifie pas significativement les résultats finaux.

Lors de la comparaison des distributions empiriques et théoriques, le nombre de degrés de liberté pour la distribution - est obtenu à partir de la relation f=m-1-l, où m est le nombre d'intervalles de classe et l est le nombre de paramètres de distribution indépendants estimés à partir de l'échantillon. Pour une distribution normale l=2, puisqu'elle dépend de deux paramètres : et.

Le nombre de degrés de liberté est également réduit de 1, puisque pour toute distribution, il existe une condition =1, et par conséquent, le nombre de probabilités déterminées indépendamment est égal à k-1, et non à k.

Pour l'exemple donné, f = 8-2-1 = 5 et la valeur critique à =0,05 pour la distribution à 5 degrés de liberté est 11,07. L’hypothèse nulle est donc acceptée.

Considérons la technique de comparaison de la distribution empirique avec la distribution de Poisson en utilisant un exemple classique du nombre de dragons morts par mois dans l'armée prussienne par sabot de cheval. Les données remontent au 19ème siècle, et le nombre de décès est de 0, 1, 2, etc. caractérisent ces événements tristes, mais heureusement relativement rares dans la cavalerie prussienne sur près de 20 ans d'observation.

Comme on le sait, la distribution de Poisson a la forme suivante :

où est le paramètre de distribution égal à la moyenne,

K =0,1,2,...,n.

La distribution étant discrète, les probabilités qui nous intéressent se trouvent directement à partir de la formule.

Montrons, par exemple, comment est déterminé le nombre théorique pour k=3. De la manière habituelle, nous constatons que la moyenne de cette distribution est de 0,652. Compte tenu de cette valeur, on trouve

D'ici

Si nous choisissons =0,05, alors la valeur critique pour la distribution à deux degrés de liberté est de 5,99, et donc l'hypothèse selon laquelle la distribution empirique au niveau de signification choisi n'est pas différente de la distribution de Poisson est acceptée. Le nombre de degrés de liberté dans ce cas est de deux, car la distribution de Poisson dépend d'un paramètre, et donc, dans la relation f = m-1-l, le nombre de paramètres estimés à partir de l'échantillon est l = 1, et f = 4-1-1 = 2.

Parfois, en pratique, il est important de savoir si deux distributions sont différentes l’une de l’autre, même s’il est difficile de décider quelle distribution théorique peut s’en rapprocher. Ceci est particulièrement important dans les cas où, par exemple, leurs moyennes et/ou variances ne diffèrent pas statistiquement de manière significative les unes des autres. La découverte de différences significatives dans les modèles de distribution peut aider le chercheur à faire des prédictions sur les facteurs possibles qui conduisent à ces différences.

Dans ce cas, les statistiques (23) peuvent être utilisées, et les valeurs d'une distribution sont utilisées comme quantités empiriques, et les valeurs d'une autre comme valeurs théoriques. Naturellement, dans ce cas, la division en intervalles de classes doit être la même pour les deux distributions. Cela signifie que pour toutes les données des deux échantillons, les valeurs minimales et maximales sont sélectionnées, quel que soit l'échantillon auquel elles appartiennent, puis, en fonction du nombre sélectionné d'intervalles de classe, leur largeur est déterminée et le nombre d'objets. tombant dans des intervalles distincts est calculé pour chaque échantillon séparément.

Dans ce cas, il peut s'avérer que certaines classes ne contiennent pas ou que seules quelques (35) valeurs y rentrent. L'utilisation du critère de Pearson donne des résultats satisfaisants si au moins 35 valeurs rentrent dans chaque intervalle. Par conséquent, si cette exigence n’est pas remplie, les intervalles adjacents doivent être fusionnés. Bien entendu, cela est fait pour les deux distributions.

Et enfin, encore une remarque concernant la comparaison de la valeur calculée et de ses points critiques au niveau de signification sélectionné. Nous savons déjà que si >, alors l'hypothèse nulle est rejetée. Cependant, les valeurs proches du point critique 1- à droite devraient éveiller nos soupçons, car une trop bonne coïncidence des distributions empiriques et théoriques ou de deux distributions empiriques (après tout, dans ce cas les nombres différeront très légèrement de les uns les autres) est peu susceptible de se produire pour des distributions aléatoires. Dans ce cas, deux explications alternatives sont possibles : soit nous avons affaire à une loi, et alors le résultat obtenu n'est pas surprenant, soit les données expérimentales, pour une raison quelconque, sont « ajustées » les unes aux autres, ce qui nécessite leur revérification. .

À propos, dans l'exemple des pois, nous avons exactement le premier cas, c'est-à-dire l'apparition de graines de différentes douceurs et couleurs dans la progéniture est déterminée par la loi et il n'est donc pas surprenant que la valeur calculée se soit révélée si petite.

Revenons maintenant au test de l'hypothèse statistique sur l'identité de deux distributions empiriques. Des données sont présentées sur la répartition du nombre de pétales de fleurs d'anémone prélevées dans différents habitats.

D'après les données tabulaires, il ressort clairement que les deux premiers et deux derniers intervalles doivent être combinés, car le nombre de valeurs qui y figurent n'est pas suffisant pour une utilisation correcte du critère de Pearson. De cet exemple, il est également clair que si seule la répartition à partir de l'habitat A était analysée, alors l'intervalle de classe contenant 4 pétales n'existerait pas du tout. Cela est dû au fait que deux distributions sont considérées simultanément et que dans la deuxième distribution, il existe une telle classe.

Vérifions donc l'hypothèse selon laquelle ces deux distributions ne diffèrent pas l'une de l'autre. Nous avons

Pour un nombre de degrés de liberté égal à 4 et un seuil de signification même égal à 0,001, l'hypothèse nulle est rejetée.

Pour comparer deux distributions d'échantillons, vous pouvez également utiliser le critère non paramétrique proposé par N.V. Smirnov et basé sur les statistiques introduites précédemment par A.N. Kolmogorov. (C'est pourquoi ce test est parfois appelé test de Kolmogorov-Smirnov.) Ce test est basé sur une comparaison de séries de fréquences accumulées. Les statistiques de ce critère se trouvent comme

maximum, (24)
où et sont les courbes de distribution des fréquences accumulées.

Les points critiques pour les statistiques (24) résultent de la relation

, (25)
où et sont les volumes du premier et du deuxième échantillons.

Valeurs critiques pour =0,1 ;=0,05 ; et =0,01 sont respectivement égaux à 1,22 ; 1,36 ; 1.63. Illustrons l'utilisation du critère de Smirnov à partir de données groupées représentant la taille d'écoliers du même âge provenant de deux régions différentes.

L'écart maximum entre les courbes de fréquence cumulées est de 0,124. Si nous choisissons le niveau de signification =0,05, alors à partir de la formule (25) nous avons

0,098.

Ainsi, la différence empirique maximale est supérieure à celle théoriquement attendue. Par conséquent, au niveau de signification accepté, l'hypothèse nulle sur l'identité des deux distributions considérées est rejetée.

Le test de Smirnov peut également être utilisé pour des données non clusterisées, la seule condition étant que les données soient issues d'une population à distribution continue. Il est également souhaitable que le nombre de valeurs dans chaque échantillon soit d'au moins 40 à 50.

Pour tester l'hypothèse nulle, selon laquelle deux échantillons indépendants de tailles n et m correspondent aux mêmes fonctions de distribution, F. Wilcoxon a proposé un critère non paramétrique, justifié dans les travaux de G. Mann et F. Whitney. Par conséquent, dans la littérature, ce critère est appelé soit le critère de Wilcoxon, soit le critère de Mann-Whitney. Il est conseillé d'utiliser ce critère lorsque les tailles d'échantillon obtenues sont petites et que l'utilisation d'autres critères est inappropriée.

Les calculs ci-dessous illustrent l'approche de construction de critères qui utilisent des statistiques associées non pas aux valeurs de l'échantillon elles-mêmes, mais à leurs classements.

Ayons à notre disposition deux échantillons de valeurs de tailles n et m. Construisons à partir d'elles une série générale de variations, et comparons chacune de ces valeurs avec son rang (), c'est-à-dire le numéro d'ordre qu'il occupe dans la série classée. Si l'hypothèse nulle est vraie, alors toute distribution de rangs est également probable et le nombre total de combinaisons possibles de rangs pour n et m donnés est égal au nombre de combinaisons de N=n+m éléments par m.

Le test de Wilcoxon est basé sur des statistiques

. (26)

Formellement, pour tester l'hypothèse nulle, il faut compter toutes les combinaisons possibles de rangs pour lesquelles la statistique W prend des valeurs égales ou inférieures à celle obtenue pour une série classée spécifique, et trouver le rapport de ce nombre au total nombre de combinaisons possibles de rangs pour les deux échantillons. La comparaison de la valeur obtenue avec le niveau de signification sélectionné vous permettra d'accepter ou de rejeter l'hypothèse nulle. La raison derrière cette approche est que si une distribution est biaisée par rapport à une autre, cela se manifestera par le fait que les petits rangs devraient correspondre principalement à un échantillon et les grands à un autre. En fonction de cela, les sommes de classement correspondantes devraient être petites ou grandes selon l'alternative qui se présente.

Il est nécessaire de tester l'hypothèse sur l'identité des fonctions de distribution caractérisant les deux méthodes de mesure avec un seuil de signification de =0,05.

Dans cet exemple n = 3, m = 2, N = 2+3 = 5, et la somme des rangs correspondant aux mesures selon la méthode B est 1+3 = 4.

Écrivons toutes les =10 distributions possibles de rangs et leurs sommes :

Rangs : 1,2 1,3 1,4 1,5 2,3 2,4 2,5 3,4 3,5 4,5

Montants : 3 4 5 6 5 6 7 7 8 9

Le rapport entre le nombre de combinaisons de rangs, dont la somme ne dépasse pas la valeur obtenue de 4 pour la méthode B, sur le nombre total de combinaisons de rangs possibles est 2/10=0,2>0,05, donc pour cet exemple l'hypothèse nulle est accepté.

Pour les petites valeurs de n et m, l'hypothèse nulle peut être testée en comptant directement le nombre de combinaisons des sommes de rang correspondantes. Cependant, pour de grands échantillons, cela devient pratiquement impossible, c'est pourquoi une approximation a été obtenue pour la statistique W, qui, comme il s'est avéré, tend asymptotiquement vers la distribution normale avec les paramètres appropriés. Nous calculerons ces paramètres pour illustrer l'approche de synthèse de tests statistiques basés sur le classement. Pour ce faire, nous utiliserons les résultats présentés au chapitre 37.

Soit W la somme des rangs correspondant à l'un des échantillons, par exemple celui de volume m. Soit la moyenne arithmétique de ces rangs. L'espérance mathématique de la valeur est

puisque sous l'hypothèse nulle, les rangs des éléments dans un échantillon de taille m représentent un échantillon d'une population finie 1, 2,...,N (N=n+m). On sait que

C'est pourquoi.

Lors du calcul de la variance, on profite du fait que la somme des carrés des rangs de la série classée générale, composée des valeurs des deux échantillons, est égale à

Compte tenu des relations obtenues précédemment pour estimer les variances des populations générales et des échantillons, nous avons

Il s'ensuit que

Il a été démontré que les statistiques

(27)

pour les grands n et m, il a une distribution normale asymptotiquement unitaire.

Regardons un exemple. Obtenons des données sur l'activité polarographique du filtrat de sérum sanguin pour deux groupes d'âge. Il est nécessaire de tester l'hypothèse avec un niveau de signification =0,05 selon laquelle les échantillons sont issus de populations générales ayant les mêmes fonctions de distribution. La somme des rangs pour le premier échantillon est de 30, pour le second de 90. Vérifier l'exactitude du calcul des sommes des rangs est le respect de la condition. Dans notre cas, 30+90=(7+8)(7+8+1) :

:2=120. D'après la formule (27), en utilisant la somme des rangs du deuxième échantillon, on a

Si nous utilisons la somme des rangs pour le premier échantillon, nous obtenons la valeur = -3,01. Étant donné que les statistiques calculées ont une distribution normale unitaire, il est naturel que dans le premier comme dans le deuxième cas, l'hypothèse nulle soit rejetée, puisque la valeur critique pour le niveau de signification de 5 % est modulo 1,96.

Lors de l'utilisation du test de Wilcoxon, certaines difficultés surviennent lorsque les mêmes valeurs sont retrouvées dans les deux échantillons, puisque l'utilisation de la formule ci-dessus entraîne une diminution de la puissance du test, parfois de manière très significative.

Afin de réduire au minimum les erreurs dans de tels cas, il est conseillé d'utiliser la règle empirique suivante. La première fois que l'on rencontre des valeurs identiques appartenant à des échantillons différents, laquelle d'entre elles mettre en premier dans la série de variations est déterminée de manière aléatoire, par exemple en lançant une pièce de monnaie. S'il existe plusieurs valeurs de ce type, après avoir déterminé la première par hasard, les valeurs égales restantes des deux échantillons sont alternées. Dans les cas où d'autres valeurs égales sont trouvées, faites ceci. Si dans le premier groupe de valeurs égales, la première valeur a été sélectionnée au hasard dans un échantillon particulier, alors dans le groupe de valeurs égales suivant, la valeur d'un autre échantillon est sélectionnée en premier, etc.

5.Critères de vérification du caractère aléatoire et d'évaluation des observations aberrantes

Très souvent, les données sont acquises en série dans le temps ou dans l’espace. Par exemple, lors de la réalisation d'expériences psychophysiologiques, qui peuvent durer plusieurs heures, plusieurs dizaines ou centaines de fois, la latence (période de latence) de la réaction à un stimulus visuel présenté est mesurée, ou lors d'enquêtes géographiques, lorsque sur des sites situés à certains endroits, par exemple à la lisière des forêts, on compte le nombre de plantes d'un certain type, etc. En revanche, lors du calcul de diverses statistiques, on suppose que les données sources sont indépendantes et distribuées de manière identique. Il est donc intéressant de tester cette hypothèse.

Tout d’abord, considérons un critère pour tester l’hypothèse nulle d’indépendance de valeurs identiquement distribuées normalement. Ce critère est donc paramétrique. Elle est basée sur le calcul des carrés moyens des différences successives

. (28)

Si nous introduisons de nouvelles statistiques, alors, comme le sait la théorie, si l'hypothèse nulle est vraie, les statistiques

(29)
pour n>10 est distribué asymptotiquement selon la distribution normale standard.

Regardons un exemple. Les temps de réaction () du sujet dans l'une des expériences psychophysiologiques sont donnés.

Nous avons : d'où

Puisque pour =0,05, la valeur critique est de 1,96, l'hypothèse nulle concernant l'indépendance de la série résultante est acceptée avec le niveau de signification sélectionné.

Une autre question qui se pose souvent lors de l’analyse de données expérimentales est de savoir que faire de certaines observations qui diffèrent fortement de la majorité des observations. De telles observations aberrantes peuvent survenir en raison d’erreurs méthodologiques, d’erreurs de calcul, etc. Dans tous les cas où l'expérimentateur sait qu'une erreur s'est glissée dans l'observation, il doit exclure cette valeur, quelle que soit son ampleur. Dans d'autres cas, il n'y a qu'un soupçon d'erreur, et il est alors nécessaire d'utiliser des critères appropriés pour prendre une décision particulière, c'est-à-dire exclure ou laisser les observations aberrantes.

De manière générale, la question se pose de la manière suivante : les observations sont-elles faites sur la même population ou certaines parties ou valeurs individuelles appartiennent-elles à une population différente ?

Bien entendu, le seul moyen fiable d’exclure des observations individuelles est d’étudier attentivement les conditions dans lesquelles ces observations ont été obtenues. Si, pour une raison quelconque, les conditions différaient des conditions standard, les observations doivent alors être exclues d'une analyse plus approfondie. Mais dans certains cas, les critères existants, bien qu’imparfaits, peuvent s’avérer très utiles.

Nous présenterons ici, sans preuve, plusieurs relations qui peuvent être utilisées pour tester l'hypothèse selon laquelle les observations sont faites par hasard sur une même population. Nous avons

(30)

(31)

(32)

où se trouve l’observation suspectée « aberrante ». Si toutes les valeurs d'une série sont classées, alors l'observation la plus importante occupera la nième place.

Pour les statistiques (30), la fonction de distribution est tabulée. Les points critiques de cette distribution pour certains n sont donnés.

Les valeurs critiques pour les statistiques (31) en fonction de n sont

4,0; 6

4,5; 100

5,0 ; n>1000.

La formule (31) suppose que et sont calculés sans tenir compte de l'observation suspectée.

Avec les statistiques (32), la situation est plus compliquée. On montre que si elles sont distribuées uniformément, alors l'espérance mathématique et la variance ont la forme :

La région critique est formée de petites valeurs qui correspondent à de grandes valeurs. Si vous souhaitez rechercher une « valeur aberrante » de la plus petite valeur, transformez d'abord les données afin qu'elles aient une distribution uniforme sur l'intervalle, puis prenez l'addition de ces valeurs uniformes à 1 et vérifiez à l'aide de la formule ( 32).

Envisagez d'utiliser les critères ci-dessus pour les séries d'observations classées suivantes : 3,4,5,5,6,7,8,9,9,10,11,17. Vous devez décider si la valeur la plus élevée, 17, doit être rejetée.

Nous avons : D'après la formule (30) =(17-11)/3,81=1,57, et l'hypothèse nulle doit être acceptée à =0,01. D'après la formule (31) = (17-7,0)/2,61 = 3,83, l'hypothèse nulle doit également être acceptée. Pour utiliser le troisième critère, on trouve =5,53, alors

La statistique w est normalement distribuée avec une moyenne nulle et une variance unitaire, et donc l'hypothèse nulle à = 0,05 est acceptée.

La difficulté de l'utilisation des statistiques (32) est la nécessité de disposer d'informations a priori sur la loi de distribution des valeurs de l'échantillon, puis de transformer analytiquement cette distribution en une distribution uniforme sur l'intervalle.

Littérature

1. Eliseeva I.I. Théorie générale de la statistique : manuel pour les universités / I.I. Eliseeva, M.M. Youzbashev ; édité par I.I. Eliseeva. M. : Finances et Statistiques, 2009. 656 p.

2. Efimova M.R. Atelier de théorie générale de la statistique : manuel pour les universités / M.R. Efimova et autres M. : Finances et Statistiques, 2007. 368 p.

3. Melkoumov Y.S. Statistiques socio-économiques : manuel pédagogique et méthodologique. M. : IMPE-PUBLISH, 2007. 200 p.

4. Théorie générale de la statistique : Méthodologie statistique dans l'étude de l'activité commerciale : manuel pour les universités / O.E. Bashina et autres ; édité par O.E. Basina, A.A. Spirine. - M. : Finances et Statistiques, 2008. 440 p.

5. Salin V.N. Un cours de théorie des statistiques pour former des spécialistes des profils financiers et économiques : manuel / V.N. Salin, E. Yu. Churilova. M. : Finances et Statistiques, 2007. 480 p.

6. Statistiques socio-économiques : atelier : manuel / V.N. Salin et coll.; édité par V.N. Salina, E.P. Shpakovskaïa. M. : Finances et Statistiques, 2009. 192 p.

7. Statistiques : manuel / A.V. Bagat et coll.; édité par V. M. Simcher. M. : Finances et Statistiques, 2007. 368 p.

8. Statistiques : manuel / I.I. Eliseeva et autres ; édité par I.I. Eliseeva. M. : Enseignement supérieur, 2008. - 566 p.

9. Théorie des statistiques : manuel pour les universités / R.A. Shmoilova et autres ; édité par R.A. Chmoïlova. - M. : Finances et Statistiques, 2007. 656 p.

10. Shmoilova R.A. Atelier sur la théorie des statistiques : manuel pour les universités / R.A. Shmoilova et autres ; édité par R.A. Chmoïlova. - M. : Finances et Statistiques, 2007. 416 p.

PAGE \* FUSIONFORMAT 1

D'autres ouvrages similaires susceptibles de vous intéresser.vshm>

17926. Analyse des critères de compacité pour la robotique industrielle 1,77 Mo
Solutions logicielles pour évaluer la compacité d'un robot. Les robots miniatures peuvent pénétrer et se déplacer à travers des ouvertures étroites, ce qui leur permet d'effectuer diverses tâches dans des espaces confinés, tels que des tuyaux de petit diamètre mesurant quelques millimètres. Dans presque toutes les industries, les questions de miniaturisation des actionneurs et des mécanismes font partie des priorités ; ils sont de la plus haute importance pour les processus technologiques à faibles ressources...
1884. Développement de critères pour une gestion efficace du personnel à l'OJSC Kazan-Orgsintez pour QMS 204,77 Ko
Aspects théoriques de base du système de gestion du personnel. Le personnel comme objet de gestion. Méthodes de recherche pour les systèmes de gestion du personnel pour QMS. Moyens d'améliorer l'efficacité de la gestion du personnel.
16316. et cette théorie résout ce dilemme ; b la résolution de ce dilemme nécessite l'existence de critères pour cette théorie. 12,12 Ko
L'auteur soutient que la raison fondamentale du dilemme de politique macroéconomique dans des conditions de taux de change fixe n'est pas une violation de la règle de Tinbergen, qui est en fait une conséquence et non une cause, mais l'absence des conditions économiques préalables nécessaires à la fixation du taux de change. taux des zones monétaires optimales présentées dans la théorie. La raison de ce dilemme est généralement considérée comme une violation de la règle de Tinbergen, selon laquelle, pour atteindre un certain nombre d'objectifs économiques, l'État doit avoir...
18273. Analyse du statut juridique du Président de la République du Kazakhstan du point de vue des critères généralement acceptés de l'État de droit et du principe de séparation des pouvoirs 73,64 Ko
L’essence de l’approche du président était que le pays devait se développer de manière naturelle et évolutive. Règle présidentielle - prévue par la Constitution de l'État, il s'agit de la cessation des activités des institutions autonomes d'une certaine entité administrative régionale et de la mise en œuvre de la gestion de cette dernière par l'intermédiaire de personnes autorisées nommées par le chef de l'État - le président et les personnes qui lui sont responsables ; prévu par la Constitution, l'attribution au chef de l'Etat - le président - de pouvoirs d'exception à l'échelle mondiale...
5713. Utiliser DotNetNuke 1,87 Mo
Dans ce cours, nous étudierons DotNetNuke. DotNetNuke (nom abrégé DNN) est un système de gestion de contenu de site Web (Web Content Management System, en abrégé WCMS), qui a absorbé toutes les meilleures réalisations dans le domaine des technologies de création de projets Web.
7073. UTILISATION DES INTERFACES 56,59 Ko
Le mot interface est un mot polysémantique et il a des significations différentes selon les contextes. Il existe le concept d'interface logicielle ou matérielle, mais dans la plupart des cas, le mot interface est associé à une sorte de connexion entre des objets ou des processus.
6471. Structure et utilisation du registre 193,04 Ko
Structure et utilisation des registres Les registres sont conçus pour stocker et convertir des nombres binaires multi-bits. Les registres sont construits comme une séquence ordonnée de bascules. Dans les microprocesseurs, les registres sont le principal moyen de mémoriser et de stocker rapidement des informations numériques. Les éléments à partir desquels les registres sont construits sont des bascules D RS JK avec coupure d'impulsion dynamique ou contrôle statique.
6472. Structure et utilisation des compteurs 318,58 Ko
Classification et principe de construction des compteurs asynchrones Un compteur est un dispositif aux sorties duquel est formé un code binaire exprimant le nombre d'impulsions reçues à l'entrée du compteur. Le nombre d'états possibles d'un compteur est appelé module ou coefficient de comptage et est désigné. Principales caractéristiques temporelles des compteurs : fréquence maximale d'arrivée des impulsions de comptage ; temps de transition d'un état à un autre ; Il existe des microcircuits compteurs eux-mêmes et des circuits construits sur la base d'un ou plusieurs...
7066. UTILISER LE MENU DANS L'APPLICATION 240,2 Ko
Menu du programme Le menu du programme doit correspondre aux principaux modes de fonctionnement du programme ; par conséquent, la sélection des éléments de menu et les commandes des éléments individuels doivent être traitées avec un soin particulier. Pour mieux comprendre la technologie d'utilisation des menus dans les programmes, considérez la séquence d'actions lors de la résolution du programme de formation suivant. Toutes les actions doivent être effectuées à l'aide du menu.
7067. UTILISATION DES MENUS DE DIALOGUE 73,13 Ko
Poursuivant le développement d'une application avec un menu et une barre d'outils, nous devons écrire du code pour les gestionnaires de messages pour les commandes permettant de créer une matrice 6*6 et de sortir (imprimer) la matrice dans la zone client de notre application. La création de la matrice doit être complétée par l'affichage d'un message à l'écran indiquant la réussite du gestionnaire, par exemple « La matrice a été créée ».

Hypothèses statistiques. Critères de consentement.

Nul(basique) appeler une hypothèse avancée sur la forme d'une distribution inconnue, ou sur les paramètres de distributions connues. En compétition (alternative) appelée hypothèse qui contredit l’hypothèse nulle.

Par exemple, si l’hypothèse nulle est que la variable aléatoire X est distribuée selon la loi, alors une hypothèse concurrente pourrait être que la variable aléatoire X distribué selon une loi différente.

Critère statistique(ou juste critère) est appelée une variable aléatoire À, qui sert à tester l’hypothèse nulle.

Après avoir choisi un certain critère, par exemple critère , l'ensemble de toutes ses valeurs possibles est divisé en deux sous-ensembles disjoints : l'un d'eux contient les valeurs du critère pour lesquelles l'hypothèse nulle est rejetée, et l'autre - pour lesquelles elle est accepté.

Zone critique est un ensemble de valeurs de critères pour lesquelles l'hypothèse nulle est rejetée. Zone d’acceptation des hypothèses appeler l'ensemble des valeurs de critères auxquelles l'hypothèse est acceptée. Points critiques Ils appellent les points séparant la région critique de la région où l'hypothèse nulle est acceptée.

Pour notre exemple, avec une valeur de , la valeur calculée à partir de l'échantillon correspond à la zone d'acceptation de l'hypothèse : la variable aléatoire est distribuée selon la loi. Si la valeur calculée est , alors elle tombe dans la région critique, c'est-à-dire que l'hypothèse sur la distribution de la variable aléatoire selon la loi est rejetée.

Dans le cas de la distribution, la région critique est déterminée par l'inégalité, la région où l'hypothèse nulle est acceptée est déterminée par l'inégalité.

2.6.3. Critère d'accord Pearson.

L'une des tâches de la science animale et de la génétique vétérinaire est la sélection de nouvelles races et espèces présentant les caractéristiques requises. Par exemple, augmenter l’immunité, la résistance aux maladies ou changer la couleur de la fourrure.

En pratique, lors de l'analyse des résultats, il s'avère très souvent que les résultats réels correspondent plus ou moins à une loi théorique de distribution. Il est nécessaire d'évaluer le degré de correspondance entre les données réelles (empiriques) et les données théoriques (hypothétiques). Pour ce faire, émettons une hypothèse nulle : la population résultante est répartie selon la loi « A ». L'hypothèse sur la loi de distribution attendue est testée à l'aide d'une variable aléatoire spécialement sélectionnée : le critère d'adéquation.

Critère d'accord est appelé un critère pour tester une hypothèse sur la loi supposée d'une distribution inconnue.

Il existe plusieurs critères d'accord : Pearson, Kolmogorov, Smirnov, etc. Le test d’adéquation de Pearson est le plus couramment utilisé.

Considérons l'application du critère de Pearson à l'aide de l'exemple du test de l'hypothèse de répartition normale de la population. Pour cela, nous comparerons les fréquences empiriques et théoriques (calculées dans le prolongement de la distribution normale).

Il existe généralement une certaine différence entre les fréquences théoriques et empiriques. Par exemple:

Fréquences empiriques 7 15 41 93 113 84 25 13 5

Fréquences théoriques 5 13 36 89 114 91 29 14 6

Considérons deux cas :

L'écart entre les fréquences théoriques et empiriques est aléatoire (insignifiant), c'est-à-dire il est possible de faire une proposition sur la répartition des fréquences empiriques selon la loi normale ;

L'écart entre les fréquences théoriques et empiriques n'est pas accidentel (significatif), c'est-à-dire les fréquences théoriques ont été calculées sur la base de l’hypothèse erronée d’une répartition normale de la population.

À l'aide du test d'ajustement de Pearson, vous pouvez déterminer si l'écart entre les fréquences théoriques et empiriques est accidentel ou non, c'est-à-dire avec une probabilité de confiance donnée, déterminer si la population est distribuée selon une loi normale ou non.

Alors, obtenons la distribution empirique à partir d’un échantillon de taille n :

Possibilités.......

Fréquences empiriques…….

Supposons que les fréquences théoriques soient calculées sous l'hypothèse d'une distribution normale. Au niveau de signification, il est nécessaire de tester l’hypothèse nulle : la population est normalement distribuée.

Comme critère pour tester l'hypothèse nulle, nous prendrons une variable aléatoire

(*)

Cette quantité est aléatoire, car dans différentes expériences, elle prend des valeurs différentes, jusqu'alors inconnues. Il est clair que moins les fréquences empiriques et théoriques diffèrent, plus la valeur du critère est faible et, par conséquent, il caractérise dans une certaine mesure la proximité des distributions empiriques et théoriques.

Il a été prouvé que lorsque la loi de distribution d'une variable aléatoire (*), quelle que soit la loi de distribution à laquelle la population générale est soumise, tend vers une loi de distribution avec des degrés de liberté. Par conséquent, la variable aléatoire (*) est notée , et le critère lui-même est appelé test d’adéquation du « chi carré ».

Notons la valeur du critère calculé à partir des données observationnelles par . Les valeurs critiques tabulées du critère pour un niveau de signification et un nombre de degrés de liberté donnés sont désignées par . Dans ce cas, le nombre de degrés de liberté est déterminé à partir de l'égalité , où est le nombre de groupes (intervalles partiels) de l'échantillon ou des classes ; - nombre de paramètres de la distribution attendue. La distribution normale a deux paramètres : l’espérance mathématique et l’écart type. Par conséquent, le nombre de degrés de liberté pour une distribution normale est obtenu à partir de l’égalité

Si la valeur calculée et la valeur du tableau satisfont à l'inégalité , l'hypothèse nulle sur la répartition normale de la population est acceptée. Si , l'hypothèse nulle est rejetée et l'hypothèse alternative est acceptée (la population n'est pas normalement distribuée).

Commentaire. Lorsque vous utilisez le test d'adéquation de Pearson, la taille de l'échantillon doit être d'au moins 30. Chaque groupe doit contenir au moins 5 options. Si les groupes contiennent moins de 5 fréquences, ils sont regroupés avec les groupes voisins.

En général, le nombre de degrés de liberté pour la distribution du Chi carré est défini comme le nombre total de valeurs à partir desquelles les indicateurs correspondants sont calculés, moins le nombre de conditions qui relient ces valeurs, c'est-à-dire réduire la possibilité de variation entre eux. Dans les cas les plus simples, lors du calcul, le nombre de degrés de liberté sera égal au nombre de classes réduit d'une. Ainsi, par exemple, avec le fractionnement dihybride, 4 classes sont obtenues, mais seule la première classe n'est pas liée, les suivantes sont déjà liées aux précédentes. Par conséquent, pour le fractionnement dihybride, le nombre de degrés de liberté est .



Exemple 1. Déterminer le degré de conformité de la répartition réelle des groupes par le nombre de vaches atteintes de tuberculose avec celle théoriquement attendue, qui a été calculée en considérant la distribution normale. Les données sources sont résumées dans le tableau :

Solution.

En fonction du niveau de signification et du nombre de degrés de liberté du tableau des points critiques de la distribution (voir annexe 4), on trouve la valeur . Parce que , on peut conclure que la différence entre les fréquences théoriques et réelles est aléatoire. Ainsi, la répartition réelle des groupes selon le nombre de vaches atteintes de tuberculose correspond à celle théoriquement attendue.

Exemple 2. La répartition théorique par phénotype des individus obtenus en deuxième génération par croisement dihybride de lapins selon la loi de Mendel est de 9 : 3 : 3 : 1. Il est nécessaire de calculer la correspondance de la répartition empirique des lapins issus du croisement d'individus noirs à poils normaux avec des animaux duveteux - albinos. Lors du croisement en deuxième génération, 120 descendants ont été obtenus, dont 45 lapins noirs à poils courts, 30 lapins duveteux noirs, 25 lapins blancs à poils courts, 20 lapins duveteux blancs.

Solution. Théoriquement, la ségrégation attendue chez la progéniture devrait correspondre au rapport des quatre phénotypes (9 : 3 : 3 : 1). Calculons les fréquences théoriques (nombre de buts) pour chaque classe :

9+3+3+1=16, ce qui signifie qu'on peut s'attendre à ce qu'il y ait des poils courts noirs ; duveteux noir - ; blanc aux cheveux courts - ; duveteux blanc - .

La répartition empirique (réelle) des phénotypes était la suivante : 45 ; 30 ; 25 ; 20.

Résumons toutes ces données dans le tableau suivant :

À l’aide du test d’adéquation de Pearson, nous calculons la valeur :

Nombre de degrés de liberté en croisement dihybride. Pour le niveau de signification trouver la valeur . Parce que , on peut conclure que la différence entre les fréquences théoriques et réelles n’est pas aléatoire. Par conséquent, le groupe de lapins résultant s’écarte dans la distribution des phénotypes de la loi de Mendel lors du croisement dihybride et reflète l’influence de certains facteurs qui modifient le type de ségrégation phénotypique dans la deuxième génération de croisements.

Le test d'ajustement du chi carré de Pearson peut également être utilisé pour comparer deux distributions empiriques homogènes entre elles, c'est-à-dire ceux qui ont les mêmes limites de classe. L'hypothèse nulle est l'hypothèse selon laquelle deux fonctions de distribution inconnues sont égales. Le test du chi carré dans de tels cas est déterminé par la formule

(**)

où et se trouvent les volumes des distributions comparés ; et - les fréquences des classes correspondantes.

Considérons une comparaison de deux distributions empiriques à l'aide de l'exemple suivant.

Exemple 3. La longueur des œufs de coucou a été mesurée dans deux zones territoriales. Dans la première zone, un échantillon de 76 œufs () a été examiné, dans la seconde de 54 (). Les résultats suivants ont été obtenus :

Longueur (mm)
Fréquences
Fréquences - - -

Au niveau de signification, nous devons tester l’hypothèse nulle selon laquelle les deux échantillons d’œufs appartiennent à la même population de coucous.

Pour tester l'hypothèse sur la correspondance de la distribution empirique avec la loi de distribution théorique, des indicateurs statistiques spéciaux sont utilisés - des critères d'adéquation (ou critères de conformité). Il s'agit notamment des critères de Pearson, Kolmogorov, Romanovsky, Yastremsky, etc. La plupart des critères d'accord sont basés sur l'utilisation d'écarts de fréquences empiriques par rapport aux fréquences théoriques.

Évidemment, plus ces écarts sont faibles, plus la distribution théorique correspond à la distribution empirique (ou la décrit). Critères de consentement

- ce sont des critères permettant de tester des hypothèses sur la correspondance de la distribution empirique avec la distribution de probabilité théorique. Ces critères sont divisés en deux classes : générales et spéciales. Les tests généraux d'adéquation s'appliquent à la formulation la plus générale d'une hypothèse, à savoir l'hypothèse selon laquelle les résultats observés concordent avec toute distribution de probabilité supposée a priori. Les tests spéciaux d'adéquation impliquent des hypothèses nulles spéciales qui établissent un accord avec une forme particulière de distribution de probabilité.

Des critères d'accord, basés sur la loi de répartition établie, permettent d'établir quand les écarts entre fréquences théoriques et empiriques doivent être considérés comme insignifiants (aléatoires), et quand - significatifs (non aléatoires). Il s'ensuit que les critères d'accord permettent de rejeter ou de confirmer la justesse de l'hypothèse avancée lors de l'alignement des séries sur la nature de la distribution dans la série empirique et de répondre s'il est possible d'accepter pour une distribution empirique donnée un modèle exprimé par une loi de distribution théorique. Test d'adéquation de Pearson

c 2 (chi carré) est l'un des principaux critères d'accord. Proposé par le mathématicien anglais Karl Pearson (1857-1936) pour évaluer le caractère aléatoire (importance) des écarts entre les fréquences des distributions empiriques et théoriques :

Le schéma d'application du critère c 2 pour évaluer la cohérence des distributions théoriques et empiriques se résume au suivant :

1. La mesure calculée de l'écart est déterminée.

2. Le nombre de degrés de liberté est déterminé.

3. Sur la base du nombre de degrés de liberté, n est déterminé à l'aide d'un tableau spécial.

Niveau de signification est la probabilité de rejeter par erreur l'hypothèse avancée, c'est-à-dire la probabilité qu'une hypothèse correcte soit rejetée. Dans les études statistiques, en fonction de l'importance et de la responsabilité des problèmes à résoudre, les trois niveaux de signification suivants sont utilisés :

1) a = 0,1, alors R. = 0,9;

2) a = 0,05, alors R. = 0,95;

3) a = 0,01, alors R. = 0,99.

En utilisant le critère d’accord c 2, les conditions suivantes doivent être remplies :

1. Le volume de la population étudiée doit être suffisamment important ( N≥ 50), tandis que la fréquence ou la taille du groupe doit être d'au moins 5. Si cette condition n'est pas respectée, il faut d'abord combiner les petites fréquences (inférieures à 5).

2. La distribution empirique doit être constituée de données obtenues à la suite d'un échantillonnage aléatoire, c'est-à-dire ils doivent être indépendants.

L'inconvénient du critère d'adéquation de Pearson est la perte d'une partie des informations d'origine associée à la nécessité de regrouper les résultats d'observation en intervalles et de combiner des intervalles individuels avec un petit nombre d'observations. A cet égard, il est recommandé de compléter le contrôle de conformité de la distribution selon le critère par 2 autres critères. Ceci est particulièrement nécessaire avec une taille d’échantillon relativement petite ( n ≈ 100).

Dans les statistiques Test d'ajustement de Kolmogorov(également connu sous le nom de test d'ajustement de Kolmogorov-Smirnov) est utilisé pour déterminer si deux distributions empiriques obéissent à la même loi, ou pour déterminer si une distribution résultante obéit à un modèle supposé. Le critère de Kolmogorov est basé sur la détermination de l'écart maximum entre les fréquences accumulées ou les fréquences de distributions empiriques ou théoriques. Le critère de Kolmogorov est calculé à l'aide des formules suivantes :

D Et d- en conséquence, l'écart maximum entre les fréquences cumulées ( ff¢) et entre fréquences cumulées ( pp¢) séries de distributions empiriques et théoriques ; N- le nombre d'unités au total.

Après avoir calculé la valeur de λ, un tableau spécial est utilisé pour déterminer la probabilité avec laquelle on peut affirmer que les écarts des fréquences empiriques par rapport aux fréquences théoriques sont aléatoires. Si le signe prend des valeurs allant jusqu'à 0,3, cela signifie qu'il existe une coïncidence complète des fréquences. Avec un grand nombre d’observations, le test de Kolmogorov est capable de détecter tout écart par rapport à l’hypothèse. Cela signifie que toute différence dans la distribution de l'échantillon par rapport à la distribution théorique sera détectée avec son aide s'il existe un nombre suffisamment grand d'observations. L'importance pratique de cette propriété n'est pas significative, car dans la plupart des cas, il est difficile de compter sur l'obtention d'un grand nombre d'observations dans des conditions constantes, l'idée théorique de la loi de distribution à laquelle l'échantillon doit obéir est toujours approximative, et la précision des tests statistiques ne doit pas dépasser la précision du modèle sélectionné.

Test d'adéquation de Romanovsky est basé sur l'utilisation du critère de Pearson, c'est-à-dire valeurs déjà trouvées de c 2, et le nombre de degrés de liberté :

où n est le nombre de degrés de liberté de variation.

Le critère Romanovsky est pratique en l'absence de tableaux pour . Si< 3, то расхождения распределений случайны, если же >3, alors ils ne sont pas aléatoires et la distribution théorique ne peut pas servir de modèle à la distribution empirique étudiée.

B. S. Yastremsky a utilisé dans le critère d'accord non pas le nombre de degrés de liberté, mais le nombre de groupes ( k), une valeur spéciale de q, en fonction du nombre de groupes, et une valeur du chi carré. Test d'ajustement de Yastremski a la même signification que le critère de Romanovsky et s'exprime par la formule

où c 2 est le critère d'adéquation de Pearson ; - nombre de groupes ; q - coefficient, pour le nombre de groupes inférieur à 20, égal à 0,6.

Si L fait > 3, les écarts entre les distributions théoriques et empiriques ne sont pas aléatoires, c'est-à-dire la distribution empirique ne répond pas aux exigences d'une distribution normale. Si L fait< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.

Définition 51. Critères qui permettent de juger si les valeurs sont cohérentes X 1 , X 2 ,…, xn variable aléatoire X avec une hypothèse concernant sa fonction de distribution sont appelés critères de consentement.

L'idée d'utiliser des critères de consentement

Laissez une hypothèse être testée sur la base de ce matériel statistique N, consistant dans le fait que SV X obéit à une loi de distribution spécifique. Cette loi peut être spécifiée soit comme fonction de distribution F(x), ou sous forme de densité de distribution f(x), ou comme un ensemble de probabilités p je. Puisque parmi toutes ces formes la fonction de distribution F(x) est le plus général (existe aussi bien pour DSV que NSV) et détermine tout autre, nous formulerons une hypothèse N, comme consistant dans le fait que la quantité X a une fonction de distribution F(x).

Accepter ou rejeter une hypothèse N, considérez une certaine quantité U, caractérisant le degré de divergence (déviation) des distributions théoriques et statistiques. AmpleurU peut être sélectionné de différentes manières: 1) somme des écarts carrés des probabilités théoriques p jeà partir des fréquences correspondantes, 2) la somme des mêmes carrés avec certains coefficients (poids), 3) l'écart maximum de la fonction de distribution statistique (empirique) par rapport à la théorie F(x).

Laissez la valeur U choisi d’une manière ou d’une autre. Évidemment, il s'agit d'une sorte de variable aléatoire. Loi de répartition U dépend de la loi de distribution de la variable aléatoire X, sur quelles expériences ont été réalisées et sur le nombre d'expériences n. Si l'hypothèse N est vrai, alors la loi de distribution de la quantité U déterminé par la loi de distribution de la quantité X(fonction F(x)) et numéro n.

Supposons que cette loi de distribution soit connue. À la suite de cette série d'expériences, il a été découvert que la mesure de divergence choisie U a pris un certain sens toi. Question : cela peut-il s'expliquer par des raisons aléatoires ou cet écart est aussi est important et indique la présence d'une différence significative entre les distributions théorique et statistique (empirique) et, par conséquent, l'inadéquation de l'hypothèse N? Pour répondre à cette question, supposons que l'hypothèse N est correcte, et sous cette hypothèse, nous calculons la probabilité que, pour des raisons aléatoires associées à une quantité insuffisante de matériel expérimental, la mesure de l'écart U ne sera pas inférieure à la valeur observée expérimentalement toi, c'est-à-dire que nous calculons la probabilité de l'événement : .

Si cette probabilité est faible, alors l'hypothèse N doit être rejetée car peu plausible, mais si cette probabilité est significative, alors nous concluons que les données expérimentales ne contredisent pas l'hypothèse N.

La question se pose : comment choisir la mesure de l'écart (écart) ? U? Il s'avère qu'avec certaines méthodes de choix, la loi de distribution de la quantité U a des propriétés très simples et avec une taille suffisamment grande n pratiquement indépendant de la fonction F(x). Ce sont précisément ces mesures de divergence qui sont utilisées dans les statistiques mathématiques comme critères d’accord.

Définition 51/. Le critère d'accord est le critère permettant de tester l'hypothèse sur la loi supposée d'une distribution inconnue.

Pour les données quantitatives avec des distributions proches de la normale, utilisez paramétrique méthodes basées sur des indicateurs tels que l’espérance mathématique et l’écart type. En particulier, pour déterminer la fiabilité de la différence de moyenne pour deux échantillons, la méthode de Student (critère) est utilisée, et afin de juger les différences entre trois échantillons ou plus, le test F, ou analyse de variance. Si nous avons affaire à des données non quantitatives ou si les échantillons sont trop petits pour être sûr que les populations dont ils sont issus suivent une distribution normale, alors utilisez non paramétrique méthodes - critère χ 2(chi carré) ou Pearson pour les données qualitatives et les signes, classements, tests de Mann-Whitney, Wilcoxon, etc. pour les données ordinales.

De plus, le choix de la méthode statistique dépend du fait que les échantillons dont les moyennes sont comparées sont ou non indépendant(c'est-à-dire, par exemple, tiré de deux groupes de matières différents) ou dépendant(c'est-à-dire reflétant les résultats du même groupe de sujets avant et après l'exposition ou après deux expositions différentes).

p. 1. Test de Pearson (- chi carré)

Qu'il soit produit n expériences indépendantes, dans chacune desquelles la variable aléatoire X a pris une certaine valeur, c'est-à-dire qu'un échantillon d'observations de la variable aléatoire a été donné X(population générale) volume n. Considérons la tâche de vérifier la proximité des fonctions de distribution théorique et empirique pour une distribution discrète, c'est-à-dire qu'il est nécessaire de vérifier si les données expérimentales sont cohérentes avec l'hypothèse N 0, indiquant que la variable aléatoire X a une loi de distribution F(x) au niveau de signification α . Appelons cette loi « théorique ».

Lors de l'obtention d'un critère d'adéquation pour tester une hypothèse, déterminer la mesure Décarts de la fonction de distribution empirique d'un échantillon donné par rapport à la fonction de distribution estimée (théorique) F(x).

La mesure la plus couramment utilisée est celle introduite par Pearson. Considérons cette mesure. Divisons l'ensemble des valeurs de variables aléatoires X sur r ensembles - groupes S 1 , S 2 ,…, S r, sans points communs. En pratique, une telle partition est réalisée à l'aide de ( r- 1) chiffres c 1 < c 2 < … < c r-1. Dans ce cas, la fin de chaque intervalle est exclue de l'ensemble correspondant et celle de gauche est incluse.

S 1 S 2 S 3 …. S r -1 S r

c 1 c 2 c 3 c r -1

Laisser p je, , - la probabilité que SV X appartient à plusieurs S je(évidemment ). Laisser n je, , - le nombre de valeurs (variante) parmi les observables appartenant à l'ensemble S je(fréquences empiriques). Ensuite, la fréquence relative des coups SV X dans beaucoup S jeà n observations. Il est évident que .

Pour la répartition ci-dessus, p je il y a un incrément F(x) sur le plateau S je, et l'incrément est sur le même ensemble. Résumons les résultats des expériences dans un tableau sous forme de série statistique groupée.

Limites du groupe Fréquence relative
S 1:x 1 – x 2
S 2: x 2 – x 3
S r: xrxr +1

Connaissant la loi de distribution théorique, vous pouvez trouver les probabilités théoriques qu'une variable aléatoire tombe dans chaque groupe : r 1 , r 2 , …, p r. Lors de la vérification de la cohérence des distributions théoriques et empiriques (statistiques), nous partirons des écarts entre les probabilités théoriques p je et les fréquences observées.

Pour mesure D les écarts (écarts) de la fonction de distribution empirique par rapport à la fonction théorique sont la somme des carrés des écarts des probabilités théoriques p jeà partir des fréquences correspondantes prises avec certains "poids" c je: .

Chances c je sont introduits parce que, dans le cas général, les écarts appartenant à des groupes différents ne peuvent pas être considérés comme égaux en importance : un écart de même valeur absolue peut être peu significatif si la probabilité elle-même p je est grand et très visible s'il est petit. Par conséquent, naturellement les « poids » c je prendre inversement proportionnel aux probabilités. Comment choisir ce coefficient ?

K. Pearson a montré que si l'on met , alors pour les grands n loi de distribution de la quantité U a des propriétés très simples : il est pratiquement indépendant de la fonction de distribution F(x) et sur le nombre d'expériences n, mais cela dépend uniquement du nombre de groupes r, à savoir, cette loi avec une augmentation n se rapproche de la distribution dite du chi carré .

Si vous avez besoin de matériel supplémentaire sur ce sujet, ou si vous n'avez pas trouvé ce que vous cherchiez, nous vous recommandons d'utiliser la recherche dans notre base de données d'œuvres :

Que ferons-nous du matériel reçu :

Si ce matériel vous a été utile, vous pouvez l'enregistrer sur votre page sur les réseaux sociaux :



Avez-vous aimé l'article? Partagez avec vos amis !