Valeurs critiques de corrélation des rangs de Spearman. Comment est calculé le coefficient de classement ? Brèves instructions pour effectuer une analyse de corrélation à l'aide du critère de Spearman

Coefficient de corrélation de Pearson

Coefficient r- Pearson est utilisé pour étudier la relation entre deux variables métriques mesurées sur le même échantillon. Il existe de nombreuses situations dans lesquelles son utilisation est appropriée. L’intelligence affecte-t-elle les performances académiques au cours des dernières années universitaires ? Le montant du salaire d'un salarié est-il lié à sa convivialité envers ses collègues ? L’humeur d’un élève affecte-t-elle la réussite de la résolution d’un problème arithmétique complexe ? Pour répondre à ces questions, le chercheur doit mesurer deux indicateurs d’intérêt pour chaque membre de l’échantillon.

La valeur du coefficient de corrélation n'est pas affectée par les unités de mesure dans lesquelles les caractéristiques sont présentées. Par conséquent, toute transformation linéaire de caractéristiques (multiplication par une constante, ajout d'une constante) ne modifie pas la valeur du coefficient de corrélation. Une exception est la multiplication de l'un des signes par une constante négative : le coefficient de corrélation change de signe en l'opposé.

Application de la corrélation de Spearman et Pearson.

La corrélation de Pearson est une mesure de la relation linéaire entre deux variables. Il vous permet de déterminer dans quelle mesure la variabilité de deux variables est proportionnelle. Si les variables sont proportionnelles les unes aux autres, la relation entre elles peut être représentée graphiquement sous la forme d'une ligne droite avec une pente positive (proportion directe) ou négative (proportion inverse).

En pratique, la relation entre deux variables, si elle existe, est probabiliste et ressemble graphiquement à un nuage de dispersion ellipsoïdal. Cet ellipsoïde peut cependant être représenté (approché) comme une ligne droite ou une ligne de régression. Une droite de régression est une droite construite selon la méthode des moindres carrés : la somme des carrés des distances (calculées le long de l'axe Y) de chaque point du nuage de points à la droite est le minimum.

La variance des estimations de la variable dépendante revêt une importance particulière pour évaluer l’exactitude des prévisions. Essentiellement, la variance des estimations d'une variable dépendante Y est la partie de sa variance totale qui est due à l'influence de la variable indépendante X. En d'autres termes, le rapport de la variance des estimations de la variable dépendante à sa véritable variance est égal au carré du coefficient de corrélation.

Le carré du coefficient de corrélation entre les variables dépendantes et indépendantes représente la proportion de variance de la variable dépendante qui est due à l'influence de la variable indépendante et est appelé coefficient de détermination. Le coefficient de détermination montre ainsi dans quelle mesure la variabilité d'une variable est causée (déterminée) par l'influence d'une autre variable.

Le coefficient de détermination présente un avantage important par rapport au coefficient de corrélation. La corrélation n'est pas une fonction linéaire de la relation entre deux variables. Par conséquent, la moyenne arithmétique des coefficients de corrélation pour plusieurs échantillons ne coïncide pas avec la corrélation calculée immédiatement pour tous les sujets de ces échantillons (c'est-à-dire que le coefficient de corrélation n'est pas additif). Au contraire, le coefficient de détermination reflète la relation de manière linéaire et est donc additif : il peut être moyenné sur plusieurs échantillons.

Des informations supplémentaires sur la force du lien sont fournies par la valeur du coefficient de corrélation au carré - le coefficient de détermination : c'est la partie de la variance d'une variable qui peut s'expliquer par l'influence d'une autre variable. Contrairement au coefficient de corrélation, le coefficient de détermination augmente linéairement avec l'augmentation de la force de connexion.

Coefficients de corrélation de Spearman et τ - Kendall ( corrélations de classement )

Si les deux variables entre lesquelles la relation est étudiée sont présentées sur une échelle ordinale, ou si l'une d'elles est sur une échelle ordinale et l'autre sur une échelle métrique, alors des coefficients de corrélation de rang sont utilisés : Spearman ou τ - Kendella. Les deux coefficients nécessitent un classement préliminaire des deux variables pour leur application.

Le coefficient de corrélation de rang de Spearman est une méthode non paramétrique utilisée dans le but d'étudier statistiquement la relation entre les phénomènes. Dans ce cas, le degré réel de parallélisme entre les deux séries quantitatives des caractéristiques étudiées est déterminé et une évaluation de l'étroitesse du lien établi est donnée à l'aide d'un coefficient exprimé quantitativement.

Si les membres d'un groupe de taille étaient classés d'abord sur la variable x, puis sur la variable y, alors la corrélation entre les variables x et y peut être obtenue simplement en calculant le coefficient de Pearson pour les deux séries de classements. À condition qu'il n'y ait pas de relations de rang (c'est-à-dire pas de rangs répétitifs) pour l'une ou l'autre variable, la formule de Pearson peut être considérablement simplifiée sur le plan informatique et convertie en ce que l'on appelle la formule de Spearman.

La puissance du coefficient de corrélation de rang de Spearman est quelque peu inférieure à la puissance du coefficient de corrélation paramétrique.

Il est conseillé d'utiliser le coefficient de corrélation de rang lorsqu'il existe un petit nombre d'observations. Cette méthode peut être utilisée non seulement pour des données quantitatives, mais également dans les cas où les valeurs enregistrées sont déterminées par des caractéristiques descriptives d'intensité variable.

Le coefficient de corrélation des rangs de Spearman avec un grand nombre de rangs identiques pour une ou les deux variables comparées donne des valeurs approximatives. Idéalement, les deux séries corrélées devraient représenter deux séquences de valeurs divergentes

Une alternative à la corrélation de Spearman pour les rangs est la corrélation τ - Kendall. La corrélation proposée par M. Kendall est basée sur l'idée que la direction de la connexion peut être jugée en comparant des sujets par paires : si une paire de sujets a un changement de x qui coïncide en direction avec un changement de y, alors cela indique une connexion positive, si ne correspond pas - alors une connexion négative.

Les coefficients de corrélation ont été spécifiquement conçus pour quantifier la force et la direction de la relation entre deux propriétés mesurées sur des échelles numériques (métriques ou rang). Comme déjà mentionné, la force maximale de la connexion correspond aux valeurs de corrélation de +1 (connexion stricte directe ou directement proportionnelle) et -1 (connexion stricte inverse ou inversement proportionnelle) ; l'absence de connexion correspond à une corrélation égale à zéro ; . Des informations supplémentaires sur la force de la relation sont fournies par le coefficient de détermination : il s'agit de la part de la variance d'une variable qui peut être expliquée par l'influence d'une autre variable.

9. Méthodes paramétriques pour la comparaison des données


Les méthodes de comparaison paramétrique sont utilisées si vos variables ont été mesurées sur une échelle métrique.

Comparaison des écarts 2- x échantillons selon le test de Fisher .


Cette méthode permet de tester l'hypothèse selon laquelle les variances des 2 populations générales dont sont extraits les échantillons comparés diffèrent les unes des autres. Limites de la méthode - la distribution de la caractéristique dans les deux échantillons ne doit pas différer de la normale.

Une alternative à la comparaison des variances est le test de Levene, pour lequel il n'est pas nécessaire de tester la normalité de la distribution. Cette méthode peut être utilisée pour vérifier l'hypothèse d'égalité (homogénéité) des variances avant de vérifier la significativité des différences de moyennes à l'aide du test de Student pour des échantillons indépendants de tailles différentes.

Attribution du coefficient de corrélation de rang

La méthode de corrélation des rangs de Spearman vous permet de déterminer la proximité (force) et la direction de la corrélation entre deux signes ou deux profils (hiérarchies) panneaux.

Description de la méthode

Pour calculer la corrélation de rang, il est nécessaire de disposer de deux lignes de valeurs pouvant être classées. Une telle série de valeurs pourrait être :

1) deux signes mesuré dans le même groupe de sujets ;

2) deux hiérarchies individuelles de caractéristiques, identifié chez deux sujets selon le même ensemble de caractéristiques (par exemple, profils de personnalité selon le questionnaire à 16 facteurs de R. B. Cattell, hiérarchie de valeurs selon la méthode de R. Rokeach, séquence de préférences dans le choix parmi plusieurs alternatives , etc.);

3) deux hiérarchies de traits de groupe ;

4) individuel et en groupe hiérarchie des fonctionnalités.

Premièrement, les indicateurs sont classés séparément pour chacune des caractéristiques. En règle générale, un rang inférieur est attribué à une valeur d'attribut inférieure.

Considérons le cas 1 (deux signes). Ici, les valeurs individuelles de la première caractéristique obtenues par différents sujets sont classées, puis les valeurs individuelles de la deuxième caractéristique.

Si deux caractéristiques sont positivement liées, alors les sujets qui ont un rang faible sur l’une d’elles auront un rang faible sur l’autre, et les sujets qui ont un rang élevé sur l’une des caractéristiques auront également un rang élevé sur l’autre caractéristique. Compter r s il faut déterminer les différences (d) entre les rangs obtenus par un sujet donné pour les deux caractéristiques. Ensuite, ces indicateurs d sont transformés d'une certaine manière et soustraits de 1. Plus la différence entre les rangs est petite, plus r s sera grand, plus il sera proche de +1.

S’il n’y a pas de corrélation, alors tous les rangs seront mélangés et il n’y aura aucune correspondance entre eux. La formule est conçue pour que dans ce cas r s, sera proche de 0.

Dans le cas d’une corrélation négative, les rangs faibles des sujets sur un attribut correspondront à des rangs élevés sur un autre attribut, et vice versa.

Plus l'écart entre les classements des sujets sur deux variables est grand, plus r s est proche de -1.

Considérons le cas 2 (deux profils individuels). Ici, les valeurs individuelles obtenues par chacun des 2 sujets sont classées selon un certain ensemble de caractéristiques (identiques pour les deux). Le premier rang sera attribué à la fonctionnalité ayant la valeur la plus basse ; le deuxième rang est une fonctionnalité avec une valeur plus élevée, etc. Évidemment, tous les attributs doivent être mesurés dans les mêmes unités, sinon un classement est impossible. Par exemple, il est impossible de classer les indicateurs du Cattell Personality Inventory (16 PF), s'ils sont exprimés en points « bruts », puisque les plages de valeurs sont différentes selon les facteurs : de 0 à 13, de 0 à 20 et de 0 à 26. On ne peut pas dire quel facteur prendra la première place dans termes de gravité jusqu'à Nous ne ramènerons pas toutes les valeurs à une seule échelle (le plus souvent il s'agit de l'échelle murale).

Si les hiérarchies individuelles de deux sujets sont positivement liées, alors les caractéristiques qui ont un rang faible dans l’un d’entre elles auront un rang faible dans l’autre, et vice versa. Par exemple, si le facteur E (dominance) d'un sujet a le rang le plus bas, alors le facteur d'un autre sujet devrait avoir un rang bas ; si le facteur C (stabilité émotionnelle) d'un sujet a le rang le plus élevé, alors l'autre sujet devrait avoir un rang élevé sur ce facteur. rang, etc.

Considérons le cas 3 (deux profils de groupe). Ici, les valeurs moyennes de groupe obtenues dans 2 groupes de matières sont classées selon un certain ensemble de caractéristiques, identiques pour les deux groupes. Dans ce qui suit, le raisonnement est le même que dans les deux cas précédents.

Considérons le cas 4 (profils individuels et collectifs). Ici, les valeurs individuelles du sujet et les valeurs moyennes du groupe sont classées séparément selon le même ensemble de caractéristiques, qui sont obtenues, en règle générale, en excluant ce sujet individuel - il ne participe pas à la moyenne du groupe profil avec lequel son profil individuel sera comparé. La corrélation des classements testera la cohérence des profils individuels et de groupe.

Dans les quatre cas, la signification du coefficient de corrélation résultant est déterminée par le nombre de valeurs classées. N. Dans le premier cas, ce nombre coïncidera avec la taille de l'échantillon n. Dans le second cas, le nombre d'observations sera le nombre d'entités qui composent la hiérarchie. Dans les troisième et quatrième cas N- il s'agit également du nombre de caractéristiques comparées, et non du nombre de sujets dans les groupes. Des explications détaillées sont données dans les exemples.

Si la valeur absolue de r s atteint ou dépasse une valeur critique, la corrélation est fiable.

Hypothèses

Il y a deux hypothèses possibles. Le premier s’applique au cas 1, le second aux trois autres cas.

Première version des hypothèses

H 0 : La corrélation entre les variables A et B ne diffère pas de zéro.

H 1 : La corrélation entre les variables A et B est significativement différente de zéro.

Deuxième version des hypothèses

H 0 : La corrélation entre les hiérarchies A et B ne diffère pas de zéro.

H1 : La corrélation entre les hiérarchies A et B est significativement différente de zéro.

Représentation graphique de la méthode de corrélation de rang

Le plus souvent, la relation de corrélation est présentée graphiquement sous la forme d'un nuage de points ou sous forme de lignes reflétant la tendance générale à placer les points dans l'espace de deux axes : l'axe de l'élément A et l'axe de l'élément B (voir Fig. 6.2 ).

Essayons de décrire la corrélation de rang sous la forme de deux rangées de valeurs classées, reliées deux à deux par des lignes (Fig. 6.3). Si les rangs des traits A et B coïncident, alors il y a une ligne horizontale entre eux ; si les rangs ne coïncident pas, alors la ligne devient inclinée. Plus l’écart entre les rangs est grand, plus la ligne devient inclinée. A gauche sur la fig. La figure 6.3 montre la corrélation positive la plus élevée possible (r =+1,0) – il s'agit pratiquement d'une « échelle ». Au centre, il y a une corrélation nulle - une tresse aux tissages irréguliers. Tous les rangs sont ici mélangés. À droite se trouve la corrélation négative la plus élevée (rs = -1,0) - une toile avec un entrelacement régulier de lignes.

Riz. 6.3. Représentation graphique de la corrélation des rangs :

a) corrélation positive élevée ;

b) corrélation nulle ;

c) corrélation négative élevée

Restrictionscoefficient de rangcorrélations

1. Pour chaque variable, au moins 5 observations doivent être présentées. La limite supérieure de l'échantillon est déterminée par les tableaux de valeurs critiques disponibles (tableau XVI annexe 1), à savoir N40.

2. Le coefficient de corrélation des rangs de Spearman r s avec un grand nombre de rangs identiques pour une ou les deux variables comparées donne des valeurs approximatives. Idéalement, les deux séries corrélées devraient représenter deux séquences de valeurs divergentes. Si cette condition n’est pas remplie, il est nécessaire de procéder à un ajustement pour égalité de rang. La formule correspondante est donnée dans l'exemple 4.

Exemple 1 - corrélationentre deuxpanneaux

Dans une étude simulant l'activité d'un contrôleur aérien (Oderyshev B.S., Shamova E.P., Sidorenko E.V., Larchenko N.N., 1978), un groupe de sujets, étudiants de la Faculté de physique de l'Université d'État de Léningrad, a été formé avant de commencer à travailler sur le simulateur. Les sujets devaient résoudre des problèmes de choix du type de piste optimal pour un type d'avion donné. Le nombre d’erreurs commises par les sujets lors d’une séance de formation est-il lié à des indicateurs d’intelligence verbale et non verbale mesurés selon la méthode de D. Wechsler ?

Tableau 6.1

Indicateurs du nombre d'erreurs dans la séance de formation et indicateurs du niveau d'intelligence verbale et non verbale des étudiants en physique (N=10)

Sujet

Nombre d'erreurs

Indice d'intelligence verbale

Indice d'intelligence non verbale

Essayons d'abord de répondre à la question de savoir si les indicateurs du nombre d'erreurs et de l'intelligence verbale sont liés.

Formulons des hypothèses.

H 0 : La corrélation entre le nombre d'erreurs dans une séance d'entraînement et le niveau d'intelligence verbale ne diffère pas de zéro.

H1 : La corrélation entre le nombre d’erreurs lors d’une séance d’entraînement et le niveau d’intelligence verbale est statistiquement significativement différente de zéro.

Ensuite, nous devons classer les deux indicateurs, en attribuant un rang inférieur à la valeur la plus petite, puis calculer les différences entre les classements reçus par chaque sujet pour les deux variables (attributs) et mettre au carré ces différences. Faisons tous les calculs nécessaires dans le tableau.

Dans le tableau. 6.2 la première colonne de gauche montre les valeurs du nombre d'erreurs ; la colonne suivante montre leurs rangs. La troisième colonne en partant de la gauche montre les scores d'intelligence verbale ; la colonne suivante montre leurs rangs. Le cinquième en partant de la gauche présente les différences d entre le rang sur la variable A (nombre d'erreurs) et la variable B (intelligence verbale). La dernière colonne présente les différences au carré - d 2 .

Tableau 6.2

Calcul d 2 pour le coefficient de corrélation de rang de Spearman r s lors de la comparaison des indicateurs du nombre d'erreurs et de l'intelligence verbale chez les étudiants en physique (N = 10)

Sujet

Variable A

nombre d'erreurs

VariableB

intelligence verbale.

d (rang A -

J. 2

Individuel

valeurs

Individuel

valeurs

Le coefficient de corrélation de rang de Spearman est calculé à l'aide de la formule :

d - la différence entre les classements sur deux variables pour chaque sujet ;

N- nombre de valeurs classées, c. dans ce cas, le nombre de sujets.

Calculons la valeur empirique de r s :

La valeur empirique obtenue de r s est proche de 0. Néanmoins, nous déterminons les valeurs critiques de r s à N = 10 selon le tableau. XVI Annexe 1 :

Répondre: H 0 est accepté. La corrélation entre le nombre d'erreurs lors d'une séance d'entraînement et le niveau d'intelligence verbale ne diffère pas de zéro.

Essayons maintenant de répondre à la question de savoir si les indicateurs du nombre d’erreurs et de l’intelligence non verbale sont liés.

Formulons des hypothèses.

H 0 : La corrélation entre le nombre d'erreurs dans une séance d'entraînement et le niveau d'intelligence non verbale ne diffère pas de 0.

H 1 : La corrélation entre le nombre d'erreurs dans une séance d'entraînement et le niveau d'intelligence non verbale est statistiquement significativement différente de 0.

Les résultats du classement et de la comparaison des classements sont présentés dans le tableau. 6.3.

Tableau 6.3

Calcul d 2 pour le coefficient de corrélation de rang de Spearman r s lors de la comparaison des indicateurs du nombre d'erreurs et de l'intelligence non verbale chez les étudiants en physique (N = 10)

Sujet

Variable A

nombre d'erreurs

Variable E

intelligence non verbale

d (rang A -

d 2

Individuel

Individuel

valeurs

valeurs

Rappelons que pour déterminer la signification de r s, peu importe qu'il soit positif ou négatif, seule sa valeur absolue est importante. Dans ce cas:

r s em

Répondre: H 0 est accepté. La corrélation entre le nombre d'erreurs dans une séance d'entraînement et le niveau d'intelligence non verbale est aléatoire, r s ne diffère pas de 0.

On peut cependant prêter attention à une certaine tendance négatif relation entre ces deux variables. Nous pourrions être en mesure de confirmer cela à un niveau statistiquement significatif si nous augmentions la taille de l'échantillon.

Exemple 2 - corrélation entre profils individuels

Dans une étude consacrée aux problèmes de réorientation des valeurs, des hiérarchies de valeurs terminales ont été identifiées selon la méthode de M. Rokeach parmi les parents et leurs enfants adultes (Sidorenko E.V., 1996). Les rangs des valeurs terminales obtenues lors de l'examen d'un couple mère-fille (mère - 66 ans, fille - 42 ans) sont présentés dans le tableau. 6.4. Essayons de déterminer comment ces hiérarchies de valeurs sont corrélées les unes aux autres.

Tableau 6.4

Rangs des valeurs terminales selon la liste de M. Rokeach dans les hiérarchies individuelles mère et fille

Valeurs terminales

Classement des valeurs dans

Classement des valeurs dans

d 2

la hiérarchie de la mère

la hiérarchie de la fille

1 Vie active active

2 Sagesse de la vie

3 Santé

4 Travaux intéressants

5 La beauté de la nature et de l'art

7 Une vie financièrement sûre

8 Avoir de bons et fidèles amis

9 Reconnaissance publique

10 Cognition

11 Vie productive

12 Développement

13 Divertissement

14 Liberté

15 Une vie de famille heureuse

16 Le bonheur des autres

17 Créativité

18 Confiance en soi

Formulons des hypothèses.

H 0 : La corrélation entre les hiérarchies de valeurs terminales mère et fille n'est pas différente de zéro.

H 1 : La corrélation entre les hiérarchies de valeurs terminales de la mère et de la fille est statistiquement significativement différente de zéro.

Puisque le classement des valeurs est assumé par la procédure de recherche elle-même, nous ne pouvons calculer que les différences entre les rangs de 18 valeurs dans deux hiérarchies. Dans les 3ème et 4ème colonnes du tableau. 6.4 présente les différences d et les carrés de ces différences d 2 .

Nous déterminons la valeur empirique de r s à l'aide de la formule :

d - des différences entre rangs pour chacune des variables, en l'occurrence pour chacune des valeurs terminales ;

N- le nombre de variables qui forment la hiérarchie, en l'occurrence le nombre de valeurs.

Pour cet exemple :

D'après le tableau. XVI Annexe 1 détermine les valeurs critiques :

Répondre: H 0 est rejeté. H 1 est accepté. La corrélation entre les hiérarchies de valeurs terminales de la mère et de la fille est statistiquement significative (p<0,01) и является положительной.

D'après le tableau. 6.4, nous pouvons déterminer que les principales différences se situent dans les valeurs « Vie de famille heureuse », « Reconnaissance publique » et « Santé », les rangs des autres valeurs sont assez proches.

Exemple 3 - Corrélation entre deux hiérarchies de groupes

Joseph Wolpe, dans un livre écrit conjointement avec son fils (Wolpe J., Wolpe D., 1981), dresse une liste ordonnée des peurs « inutiles » les plus courantes, comme il l'appelle, chez l'homme moderne, qui n'ont pas de sens. signaler un sens et n’interférer qu’avec une vie et un acte bien remplis. Dans une étude nationale menée par M.E. Rakhova (1994) 32 sujets devaient évaluer sur une échelle de 10 points la pertinence pour eux de tel ou tel type de peur de la liste de Wolpe 3 . L'échantillon interrogé était composé d'étudiants des Instituts hydrométéorologiques et pédagogiques de Saint-Pétersbourg : 15 garçons et 17 filles âgés de 17 à 28 ans, âge moyen de 23 ans.

Les données obtenues sur une échelle de 10 points ont été moyennées sur 32 sujets et les moyennes ont été classées. Dans le tableau. Le tableau 6.5 présente les indicateurs de classement obtenus par J. Volpe et M. E. Rakhova. Les séquences de classement des 20 types de peur coïncident-elles ?

Formulons des hypothèses.

H 0 : La corrélation entre les listes ordonnées de types de peur dans les échantillons américains et nationaux ne diffère pas de zéro.

H 1 : La corrélation entre les listes ordonnées de types de peur dans les échantillons américains et nationaux est statistiquement significativement différente de zéro.

Tous les calculs liés au calcul et à la quadrature des différences entre les rangs des différents types de peur dans deux échantillons sont présentés dans le tableau. 6.5.

Tableau 6.5

Calcul d pour le coefficient de corrélation des rangs de Spearman lors de la comparaison de listes ordonnées de types de peur dans des échantillons américains et nationaux

Types de peur

Classement dans l'échantillon américain

Rang en russe

Peur de parler en public

La crainte de voler

Peur de faire une erreur

Peur de l'échec

Peur de la désapprobation

Peur d'être rejeté

Peur des méchants

Peur de la solitude

Peur du sang

Peur des blessures ouvertes

Peur du dentiste

Peur des injections

Peur de passer des tests

Peur de la police (milice)

Vertige

Peur des chiens

Peur des araignées

Peur des infirmes

Peur des hôpitaux

Peur du noir

Nous déterminons la valeur empirique de r s :

D'après le tableau. XVI Annexe 1 nous déterminons les valeurs critiques de g s à N=20 :

Répondre: H 0 est accepté. La corrélation entre les listes ordonnées de types de peur dans les échantillons américains et nationaux n’atteint pas le niveau de signification statistique, c’est-à-dire qu’elle ne diffère pas significativement de zéro.

Exemple 4 - corrélation entre profils moyens individuels et collectifs

Un échantillon de résidents de Saint-Pétersbourg âgés de 20 à 78 ans (31 hommes, 46 femmes), équilibré par âge de telle sorte que les personnes de plus de 55 ans en représentaient 50 % 4, a été invité à répondre à la question : "Quel est le niveau de développement de chacune des qualités suivantes requises pour un député de l'Assemblée municipale de Saint-Pétersbourg ?" (Sidorenko E.V., Dermanova I.B., Anisimova O.M., Vitenberg E.V., Shulga A.P., 1994). L'évaluation a été effectuée sur une échelle de 10 points. Parallèlement, un échantillon de députés et de candidats à la députation à l'Assemblée municipale de Saint-Pétersbourg (n=14) a été examiné. Des diagnostics individuels de personnalités politiques et de candidats ont été réalisés à l'aide du système de diagnostic vidéo Oxford Express en utilisant le même ensemble de qualités personnelles que celles présentées à un échantillon d'électeurs.

Dans le tableau. 6.6 montre les valeurs moyennes obtenues pour chacune des qualités Véchantillon d'électeurs («série de référence») et valeurs individuelles de l'un des députés de l'Assemblée municipale.

Essayons de déterminer dans quelle mesure le profil individuel d'un député de la K-va est en corrélation avec le profil de référence.

Tableau 6.6

Évaluations de référence moyennes des électeurs (n=77) et indicateurs individuels du député K-va sur 18 qualités personnelles du diagnostic vidéo express

Nom de qualité

Scores moyens des électeurs de référence

Indicateurs individuels du député K-va

1. Niveau général de culture

2. Capacité d'apprentissage

4. La capacité de créer de nouvelles choses

5.. Autocritique

6. Responsabilité

7. Indépendance

8. Énergie, activité

9. Détermination

10. Maîtrise de soi, maîtrise de soi

I. Persistance

12. Maturité personnelle

13. Décence

14. Humanisme

15. Capacité à communiquer avec les gens

16. Tolérance envers les opinions des autres

17. Flexibilité du comportement

18. Capacité à faire une impression favorable

Tableau 6.7

Calcul d 2 pour le coefficient de corrélation du rang de Spearman entre les profils de référence et individuels des qualités personnelles du député

Nom de qualité

rang de qualité dans le profil de référence

Ligne 2 : rang de qualité dans le profil individuel

d 2

1 Responsabilité

2 Décence

3 Capacité à communiquer avec les gens

4 Maîtrise de soi, maîtrise de soi

5 Niveau général de culture

6 Énergie, activité

8 Autocritique

9 Indépendance

10 Maturité personnelle

Et la détermination

12 Capacité d'apprentissage

13 Humanisme

14 Tolérance envers les opinions des autres

15 Courage

16 Flexibilité du comportement

17 Capacité à faire une impression favorable

18 Capacité à créer de nouvelles choses

Comme le montre le tableau. 6.6, les évaluations des électeurs et les indicateurs individuels des députés varient dans différentes fourchettes. En effet, les évaluations des électeurs ont été obtenues sur une échelle de 10 points, et les indicateurs individuels des diagnostics vidéo express sont mesurés sur une échelle de 20 points. Le classement nous permet de convertir les deux échelles de mesure en une seule échelle, où l'unité de mesure est de 1 rang et la valeur maximale est de 18 rangs.

Le classement, on s'en souvient, doit être effectué séparément pour chaque ligne de valeurs. Dans ce cas, il convient d'attribuer un rang inférieur à une valeur supérieure, afin de voir immédiatement où se situe telle ou telle qualité en termes d'importance (pour les électeurs) ou de gravité (pour un député).

Les résultats du classement sont présentés dans le tableau. 6.7. Les qualités sont répertoriées dans un ordre qui reflète le profil de référence.

Formulons des hypothèses.

H 0 : La corrélation entre le profil individuel d’un député K-va et le profil de référence construit à partir des appréciations des électeurs ne diffère pas de zéro.

H 1 : La corrélation entre le profil individuel d’un député de la K-va et le profil de référence construit à partir des appréciations des électeurs est statistiquement significativement différente de zéro. Puisque dans les deux séries de classement comparées, il y a

groupes de rangs identiques, avant de calculer le coefficient de rang

les corrélations doivent être corrigées pour les mêmes rangs de T a et T b :

UN - le volume de chaque groupe de rangs identiques dans la rangée de rang A,

b - le volume de chaque groupe de rangs identiques dans la série de classement B.

Dans ce cas, dans la rangée A (profil de référence), il y a un groupe de rangs identiques - les qualités « capacité d'apprentissage » et « humanisme » ont le même rang 12,5 ; ainsi, UN=2.

Ta =(2 3 -2)/12=0,50.

Dans la rangée B (profil individuel) se trouvent deux groupes de rangs identiques, tandis que b 1 =2 Et b 2 =2.

T a =[(2 3 -2)+(2 3 -2)]/12=1,00

Pour calculer la valeur empirique r s nous utilisons la formule

Dans ce cas:

Notez que si nous n'avions pas effectué la correction pour des rangs égaux, alors la valeur de r s n'aurait été que (0,0002) plus élevée :

Avec un grand nombre de rangs identiques, les changements de r 5 peuvent être beaucoup plus significatifs. La présence de rangs identiques signifie un degré plus faible de différenciation des variables ordonnées et, par conséquent, moins de possibilité d'évaluer le degré de connexion entre elles (Sukhodolsky G.V., 1972, p. 76).

D'après le tableau. XVI Annexe 1 on détermine les valeurs critiques de r, à N = 18 :

Répondre: Le QG est rejeté. La corrélation entre le profil individuel d'un député K-va et le profil de référence répondant aux exigences des électeurs est statistiquement significative (p<0,05) и является положи­тельной.

Du tableau. 6.7, il est clair que le député du K-v a un rang inférieur sur les échelles de capacité à communiquer avec les gens et des rangs plus élevés sur les échelles de détermination et de persévérance que ceux prescrits par la norme électorale. Ces écarts expliquent principalement une légère diminution des rs obtenus.

Formulons un algorithme général pour calculer r s.

Le coefficient de corrélation de rang, proposé par K. Spearman, fait référence à une mesure non paramétrique de la relation entre des variables mesurées sur une échelle de rang. Lors du calcul de ce coefficient, aucune hypothèse n'est requise sur la nature des distributions des caractéristiques au sein de la population. Ce coefficient détermine le degré d'étroitesse de connexion entre les caractéristiques ordinales, qui représentent dans ce cas les rangs des quantités comparées.

Le coefficient de corrélation de Spearman se situe également entre +1 et -1. Comme le coefficient de Pearson, il peut être positif et négatif, caractérisant la direction de la relation entre deux caractéristiques mesurées sur une échelle de rang.

En principe, le nombre de caractéristiques classées (qualités, traits, etc.) peut être quelconque, mais le processus de classement de plus de 20 caractéristiques est difficile. Il est possible que ce soit la raison pour laquelle le tableau des valeurs critiques du coefficient de corrélation de rang n'a été calculé que pour quarante entités classées (n< 40, табл. 20 приложения 6).

Le coefficient de corrélation de rang de Spearman est calculé à l'aide de la formule :

où n est le nombre de caractéristiques classées (indicateurs, sujets) ;

D est la différence entre les classements de deux variables pour chaque sujet ;

Somme des différences de rang au carré.

En utilisant le coefficient de corrélation de rang, considérons l'exemple suivant.

Exemple: Un psychologue découvre comment les indicateurs individuels de préparation à l'école, obtenus avant la rentrée scolaire auprès de 11 élèves de première année, sont liés entre eux et à leurs performances moyennes à la fin de l'année scolaire.

Pour résoudre ce problème, nous avons classé, d'une part, les valeurs des indicateurs de maturité scolaire obtenues à l'admission à l'école, et, d'autre part, les indicateurs finaux de performance scolaire en fin d'année pour ces mêmes élèves en moyenne. Nous présentons les résultats dans le tableau. 13.

Tableau 13

Numéro d'étudiant.

Rangs des indicateurs de préparation à l’école

Classements de performance annuels moyens

Nous substituons les données obtenues dans la formule et effectuons le calcul. On a:

Pour trouver le niveau de signification, reportez-vous au tableau. 20 de l'annexe 6, qui montre les valeurs critiques pour les coefficients de corrélation de rang.

Nous le soulignons dans le tableau. 20 de l'annexe 6, comme dans le tableau de corrélation linéaire de Pearson, toutes les valeurs des coefficients de corrélation sont données en valeur absolue. Le signe du coefficient de corrélation n’est donc pris en compte que lors de son interprétation.

La recherche des niveaux de signification dans ce tableau s'effectue par le nombre n, c'est-à-dire par le nombre de sujets. Dans notre cas n = 11. Pour ce nombre on trouve :

0,61 pour P 0,05

0,76 pour P 0,01

Nous construisons l'« axe de signification » correspondant :

Le coefficient de corrélation résultant coïncidait avec la valeur critique pour le niveau de signification de 1 %. Par conséquent, on peut affirmer que les indicateurs de préparation à l'école et les notes finales des élèves de première année sont liés par une corrélation positive - en d'autres termes, plus l'indicateur de préparation à l'école est élevé, meilleures sont les études des élèves de première année. En termes d'hypothèses statistiques, le psychologue doit rejeter l'hypothèse nulle de similarité et accepter l'hypothèse alternative de différences, qui suggère que la relation entre les indicateurs de maturité scolaire et le rendement scolaire moyen est différente de zéro.

Le cas de rangs identiques (égaux)

S'il existe des rangs identiques, la formule de calcul du coefficient de corrélation linéaire de Spearman sera légèrement différente. Dans ce cas, deux nouveaux termes sont ajoutés à la formule de calcul des coefficients de corrélation, en tenant compte des mêmes rangs. Elles sont appelées corrections de rang égal et s'ajoutent au numérateur de la formule de calcul.

où n est le nombre de rangs identiques dans la première colonne,

k est le nombre de rangs identiques dans la deuxième colonne.

S'il y a deux groupes de rangs identiques dans une colonne, la formule de correction devient un peu plus compliquée :

où n est le nombre de rangs identiques dans le premier groupe de la colonne classée,

k est le nombre de rangs identiques dans le deuxième groupe de la colonne classée. La modification de la formule dans le cas général est la suivante :

Exemple: Un psychologue, à l'aide d'un test de développement mental (MDT), mène une étude de l'intelligence chez 12 élèves de 9e. Parallèlement, il demande aux professeurs de littérature et de mathématiques de classer ces mêmes élèves selon des indicateurs de développement mental. La tâche consiste à déterminer comment les indicateurs objectifs du développement mental (données SHTUR) et les évaluations d'experts des enseignants sont liés les uns aux autres.

Nous présentons les données expérimentales de ce problème et les colonnes supplémentaires nécessaires au calcul du coefficient de corrélation de Spearman sous forme de tableau. 14.

Tableau 14

Numéro d'étudiant.

Rangs de tests utilisant SHTURA

Expertises d’enseignants de mathématiques

Expertises d'enseignants en littérature

D (deuxième et troisième colonnes)

D (deuxième et quatrième colonnes)

(deuxième et troisième colonnes)

(deuxième et quatrième colonnes)

Puisque les mêmes rangs ont été utilisés dans le classement, il est nécessaire de vérifier l’exactitude du classement dans les deuxième, troisième et quatrième colonnes du tableau. La somme de chacune de ces colonnes donne le même total – 78.

Nous vérifions à l'aide de la formule de calcul. Le chèque donne :

Les cinquième et sixième colonnes du tableau présentent les valeurs de la différence de classement entre les expertises du psychologue au test SHTUR pour chaque élève et les valeurs des expertises des enseignants, respectivement, en mathématiques et en littérature. La somme des valeurs de différence de rang doit être égale à zéro. La somme des valeurs D dans les cinquième et sixième colonnes a donné le résultat souhaité. La soustraction des rangs a donc été effectuée correctement. Une vérification similaire doit être effectuée à chaque fois lors de la réalisation de types de classement complexes.

Avant de commencer le calcul à l'aide de la formule, il est nécessaire de calculer des corrections pour les mêmes rangs pour les deuxième, troisième et quatrième colonnes du tableau.

Dans notre cas, dans la deuxième colonne du tableau il y a deux rangs identiques, donc, selon la formule, la valeur de la correction D1 sera :

La troisième colonne comporte trois rangs identiques, donc selon la formule, la valeur de la correction D2 sera :

Dans la quatrième colonne du tableau il y a deux groupes de trois rangs identiques, donc, selon la formule, la valeur de la correction D3 sera :

Avant de passer à la solution du problème, rappelons que le psychologue clarifie deux questions : comment les valeurs des classements au test SHTUR sont liées aux évaluations d'experts en mathématiques et en littérature. C'est pourquoi le calcul est effectué deux fois.

Nous calculons le premier coefficient de classement en tenant compte des additifs selon la formule. On a:

Calculons sans prendre en compte l'additif :

Comme on peut le constater, la différence dans les valeurs des coefficients de corrélation s'est avérée très insignifiante.

Nous calculons le coefficient de deuxième classement en tenant compte des additifs selon la formule. On a:

Calculons sans prendre en compte l'additif :

Encore une fois, les différences étaient très mineures. Puisque le nombre d'étudiants dans les deux cas est le même, selon le tableau. 20 de l'annexe 6 on retrouve les valeurs critiques à n = 12 pour les deux coefficients de corrélation à la fois.

0,58 pour P 0,05

0,73 pour P 0,01

Nous traçons la première valeur sur « l'axe de signification » :

Dans le premier cas, le coefficient de corrélation de rang obtenu se situe dans la zone de signification. Par conséquent, le psychologue doit rejeter l’hypothèse nulle selon laquelle le coefficient de corrélation est similaire à zéro et accepter l’hypothèse alternative selon laquelle le coefficient de corrélation est significativement différent de zéro. En d’autres termes, le résultat obtenu suggère que plus les évaluations d’experts des étudiants au test SHTUR sont élevées, plus leurs évaluations d’experts en mathématiques sont élevées.

Nous traçons la deuxième valeur sur « l'axe de signification » :

Dans le second cas, le coefficient de corrélation de rang se situe dans la zone d’incertitude. Par conséquent, un psychologue peut accepter l’hypothèse nulle selon laquelle le coefficient de corrélation est similaire à zéro et rejeter l’hypothèse alternative selon laquelle le coefficient de corrélation est significativement différent de zéro. Dans ce cas, le résultat obtenu suggère que les expertises des étudiants au test SHTUR ne sont pas liées aux expertises en littérature.

Pour appliquer le coefficient de corrélation de Spearman, les conditions suivantes doivent être remplies :

1. Les variables comparées doivent être obtenues sur une échelle ordinale (de rang), mais peuvent également être mesurées sur une échelle d'intervalle et de rapport.

2. La nature de la distribution des quantités corrélées n'a pas d'importance.

3. Le nombre de caractéristiques variables dans les variables comparées X et Y doit être le même.

Les tableaux de détermination des valeurs critiques du coefficient de corrélation de Spearman (tableau 20, annexe 6) sont calculés à partir du nombre de caractéristiques égal à n = 5 à n = 40, et avec un plus grand nombre de variables comparées, le tableau du Le coefficient de corrélation de Pearson doit être utilisé (tableau 19, annexe 6). La recherche des valeurs critiques s'effectue à k = n.

Date de publication : 03/09/2017 13:01

Le terme « corrélation » est activement utilisé dans les sciences humaines et la médecine ; apparaît souvent dans les médias. Les corrélations jouent un rôle clé en psychologie. En particulier, le calcul des corrélations constitue une étape importante dans la mise en œuvre de recherches empiriques lors de la rédaction d’une thèse en psychologie.

Les documents sur les corrélations sur Internet sont trop scientifiques. Il est difficile pour un non-spécialiste de comprendre les formules. Dans le même temps, comprendre la signification des corrélations est nécessaire pour un spécialiste du marketing, un sociologue, un médecin, un psychologue – toute personne menant des recherches sur des personnes.

Dans cet article, nous expliquerons dans un langage simple l'essence de la corrélation, les types de corrélations, les méthodes de calcul, les caractéristiques de l'utilisation de la corrélation dans la recherche psychologique, ainsi que lors de la rédaction de thèses en psychologie.

Contenu

Qu'est-ce que la corrélation

La corrélation est la connexion. Mais pas n’importe qui. Quelle est sa particularité ? Regardons un exemple.

Imaginez que vous conduisez une voiture. Vous appuyez sur la pédale d'accélérateur et la voiture va plus vite. Vous ralentissez le gaz et la voiture ralentit. Même quelqu'un qui ne connaît pas la structure d'une voiture dira : « Il existe un lien direct entre la pédale d'accélérateur et la vitesse de la voiture : plus la pédale est enfoncée fort, plus la vitesse est élevée. »

Il s'agit d'une relation fonctionnelle : la vitesse est une fonction directe de la pédale d'accélérateur. Le spécialiste vous expliquera que la pédale contrôle l'alimentation en carburant des cylindres, où le mélange est brûlé, ce qui entraîne une augmentation de la puissance de l'arbre, etc. Cette connexion est rigide, déterministe et ne permet aucune exception (à condition que la machine fonctionne correctement).

Imaginez maintenant que vous êtes le directeur d'une entreprise dont les employés vendent des produits. Vous décidez d’augmenter vos ventes en augmentant les salaires des employés. Vous augmentez votre salaire de 10 % et les ventes en moyenne de l'entreprise augmentent. Au bout d'un moment, vous l'augmentez encore de 10 %, et à nouveau il y a une croissance. Puis encore 5%, et encore une fois il y a un effet. La conclusion s'impose : il existe une relation directe entre les ventes de l'entreprise et les salaires des employés : plus les salaires sont élevés, plus les ventes de l'organisation sont élevées. Est-ce le même lien qu'entre la pédale d'accélérateur et la vitesse de la voiture ? Quelle est la principale différence ?

C'est vrai, la relation entre salaire et ventes n'est pas stricte. Cela signifie que les ventes de certains salariés pourraient même diminuer, malgré l’augmentation des salaires. Certains resteront inchangés. Mais en moyenne, les ventes de l’entreprise ont augmenté, et nous disons qu’il existe un lien entre les ventes et les salaires des employés, et qu’il est corrélationnel.

La connexion fonctionnelle (pédale d'accélérateur - vitesse) repose sur une loi physique. La base de la relation de corrélation (ventes - salaire) est la simple cohérence des évolutions de deux indicateurs. Il n’y a aucune loi (au sens physique du terme) derrière la corrélation. Il n’existe qu’un modèle probabiliste (stochastique).

Expression numérique de la dépendance de corrélation

Ainsi, la relation de corrélation reflète la dépendance entre les phénomènes. Si ces phénomènes peuvent être mesurés, ils reçoivent alors une expression numérique.

Par exemple, le rôle de la lecture dans la vie des gens est étudié. Les chercheurs ont pris un groupe de 40 personnes et ont mesuré deux indicateurs pour chaque sujet : 1) combien de temps il lit par semaine ; 2) dans quelle mesure il se considère prospère (sur une échelle de 1 à 10). Les scientifiques ont saisi ces données dans deux colonnes et ont utilisé un programme statistique pour calculer la corrélation entre lecture et bien-être. Disons qu'ils ont obtenu le résultat suivant -0,76. Mais que signifie ce chiffre ? Comment l'interpréter ? Voyons cela.

Le nombre obtenu est appelé coefficient de corrélation. Pour l’interpréter correctement, il est important de considérer les éléments suivants :

  1. Le signe « + » ou « - » reflète le sens de la dépendance.
  2. La valeur du coefficient reflète la force de la dépendance.

Direct et inverse

Le signe plus devant le coefficient indique que la relation entre phénomènes ou indicateurs est directe. Autrement dit, plus un indicateur est élevé, plus l'autre est élevé. Un salaire plus élevé signifie des ventes plus élevées. Cette corrélation est dite directe ou positive.

Si le coefficient a un signe moins, cela signifie que la corrélation est inverse ou négative. Dans ce cas, plus un indicateur est élevé, plus l'autre est bas. Dans l’exemple lecture et bien-être, nous avons trouvé -0,76, ce qui signifie que plus les gens lisent, plus leur niveau de bien-être diminue.

Fort et faible

Une corrélation en termes numériques est un nombre compris entre -1 et +1. Désigné par la lettre "r". Plus le nombre est élevé (en ignorant le signe), plus la corrélation est forte.

Plus la valeur numérique du coefficient est faible, moins la relation entre phénomènes et indicateurs est importante.

La force de dépendance maximale possible est de 1 ou -1. Comment comprendre et présenter cela ?

Regardons un exemple. Ils ont pris 10 étudiants et ont mesuré leur niveau d’intelligence (QI) et leurs performances académiques pour le semestre. Disposé ces données sous la forme de deux colonnes.

Sujet

QI

Performance académique (points)

Regardez attentivement les données du tableau. De 1 à 10, le niveau de QI du sujet augmente. Mais le niveau de réussite augmente également. Parmi deux élèves, celui ayant le QI le plus élevé obtiendra de meilleurs résultats. Et il n’y aura aucune exception à cette règle.

Voici un exemple de changement complet et cohérent à 100 % de deux indicateurs dans un groupe. Et ceci est un exemple de la relation la plus positive possible. Autrement dit, la corrélation entre l’intelligence et les résultats scolaires est égale à 1.

Regardons un autre exemple. Les mêmes 10 étudiants ont été évalués à l'aide d'une enquête dans quelle mesure ils se sentaient capables de communiquer avec le sexe opposé (sur une échelle de 1 à 10).

Sujet

QI

Réussite dans la communication avec le sexe opposé (points)

Examinons attentivement les données du tableau. De 1 à 10, le niveau de QI du sujet augmente. Dans le même temps, dans la dernière colonne, le niveau de réussite dans la communication avec le sexe opposé diminue constamment. Parmi deux élèves, celui dont le QI est le plus faible réussira mieux à communiquer avec le sexe opposé. Et il n’y aura aucune exception à cette règle.

Ceci est un exemple de cohérence totale dans les changements de deux indicateurs dans un groupe - la relation négative maximale possible. La corrélation entre le QI et la réussite dans la communication avec le sexe opposé est de -1.

Comment comprendre le sens d’une corrélation égale à zéro (0) ? Cela signifie qu’il n’y a aucun lien entre les indicateurs. Revenons encore une fois à nos étudiants et considérons un autre indicateur mesuré par eux : la longueur de leur saut debout.

Sujet

QI

Longueur de saut debout (m)

Il n’y a aucune cohérence observée entre la variation d’une personne à l’autre du QI et de la longueur du saut. Cela indique l’absence de corrélation. Le coefficient de corrélation entre le QI et la longueur du saut debout chez les élèves est de 0.

Nous avons examiné des cas extrêmes. Dans les mesures réelles, les coefficients sont rarement égaux exactement à 1 ou 0. L'échelle suivante est adoptée :

  • si le coefficient est supérieur à 0,70, la relation entre les indicateurs est forte ;
  • de 0,30 à 0,70 - connexion modérée,
  • moins de 0,30 - la relation est faible.

Si l'on évalue la corrélation entre lecture et bien-être que nous avons obtenue ci-dessus sur cette échelle, il s'avère que cette relation est forte et négative de -0,76. Autrement dit, il existe une forte relation négative entre le fait d’être bien lu et le bien-être. Ce qui confirme une fois de plus la sagesse biblique sur la relation entre sagesse et tristesse.

La gradation donnée donne des estimations très approximatives et est rarement utilisée dans la recherche sous cette forme.

Les gradations des coefficients selon les niveaux de signification sont plus souvent utilisées. Dans ce cas, le coefficient effectivement obtenu peut être significatif ou non. Ceci peut être déterminé en comparant sa valeur avec la valeur critique du coefficient de corrélation tirée d'un tableau spécial. De plus, ces valeurs critiques dépendent de la taille de l'échantillon (plus le volume est grand, plus la valeur critique est faible).

Analyse de corrélation en psychologie

La méthode de corrélation est l'une des principales méthodes de recherche psychologique. Et ce n’est pas un hasard, car la psychologie s’efforce d’être une science exacte. Est-ce que ça marche?

Quelles sont les particularités des lois dans les sciences exactes ? Par exemple, la loi de la gravité en physique fonctionne sans exception : plus la masse d'un corps est grande, plus il attire d'autres corps. Cette loi physique reflète la relation entre la masse corporelle et la gravité.

En psychologie, la situation est différente. Par exemple, les psychologues publient des données sur le lien entre les relations chaleureuses dans l'enfance avec les parents et le niveau de créativité à l'âge adulte. Cela signifie-t-il que certains sujets ayant entretenu des relations très chaleureuses avec leurs parents dans leur enfance auront des capacités créatives très élevées ? La réponse est claire : non. Il n’y a pas de loi comme la loi physique. Il n’existe aucun mécanisme permettant d’influencer l’expérience de l’enfance sur la créativité des adultes. Ce sont nos fantasmes ! Il y a une cohérence des données (relations – créativité), mais il n’y a aucune loi derrière cela. Mais il n'y a qu'une corrélation. Les psychologues appellent souvent les relations identifiées des modèles psychologiques, soulignant leur nature probabiliste et non leur rigidité.

L’exemple d’étude d’étudiant de la section précédente illustre bien l’utilisation des corrélations en psychologie :

  1. Analyse de la relation entre les indicateurs psychologiques. Dans notre exemple, le QI et la réussite dans la communication avec le sexe opposé sont des paramètres psychologiques. Identifier la corrélation entre eux élargit la compréhension de l'organisation mentale d'une personne, des relations entre divers aspects de sa personnalité - en l'occurrence, entre l'intellect et la sphère de la communication.
  2. L'analyse de la relation entre le QI et les résultats scolaires et le saut d'obstacles est un exemple du lien entre un paramètre psychologique et des paramètres non psychologiques. Les résultats obtenus révèlent les caractéristiques de l'influence de l'intelligence sur les activités éducatives et sportives.

Voici à quoi pourrait ressembler une synthèse de l’étude étudiante concoctée :

  1. Une relation positive significative entre l’intelligence des étudiants et leurs performances académiques a été révélée.
  2. Il existe une relation négative significative entre le QI et la réussite dans la communication avec le sexe opposé.
  3. Il n'y avait aucun lien entre le QI des étudiants et la capacité de sauter.

Ainsi, le niveau d'intelligence des étudiants agit comme un facteur positif dans leurs résultats scolaires, tout en affectant négativement les relations avec le sexe opposé et n'ayant pas d'impact significatif sur la réussite sportive, en particulier la capacité de sauter.

Comme nous le voyons, l’intelligence aide les élèves à apprendre, mais les empêche d’établir des relations avec le sexe opposé. Toutefois, cela n’affecte en rien leur réussite sportive.

L'influence ambiguë de l'intelligence sur la personnalité et l'activité des étudiants reflète la complexité de ce phénomène dans la structure des caractéristiques personnelles et l'importance de poursuivre les recherches dans ce sens. Il semble notamment important d’analyser la relation entre l’intelligence et les caractéristiques psychologiques et les activités des étudiants, en tenant compte de leur sexe.

Coefficients de Pearson et Spearman

Considérons deux méthodes de calcul.

Le coefficient de Pearson est une méthode spéciale pour calculer la relation entre les indicateurs entre la gravité des valeurs numériques dans un groupe. Très simplement, cela se résume à ceci :

  1. Les valeurs de deux paramètres dans un groupe de sujets sont prises (par exemple, l'agressivité et le perfectionnisme).
  2. Les valeurs moyennes de chaque paramètre du groupe sont trouvées.
  3. Les différences entre les paramètres de chaque sujet et la valeur moyenne sont trouvées.
  4. Ces différences sont substituées sous une forme spéciale pour calculer le coefficient de Pearson.

Le coefficient de corrélation de rang de Spearman est calculé de la même manière :

  1. Les valeurs de deux indicateurs du groupe de matières sont prises.
  2. On retrouve les rangs de chaque facteur du groupe, c'est-à-dire la place dans la liste par ordre croissant.
  3. Les différences de rang sont trouvées, mises au carré et additionnées.
  4. Ensuite, les différences de rang sont substituées sous une forme spéciale pour calculer le coefficient de Spearman.

Dans le cas de Pearson, le calcul a été effectué en utilisant la valeur moyenne. Par conséquent, des valeurs aberrantes aléatoires dans les données (différences significatives par rapport à la moyenne), dues par exemple à des erreurs de traitement ou à des réponses peu fiables, peuvent fausser considérablement le résultat.

Dans le cas de Spearman, les valeurs absolues des données ne jouent aucun rôle, puisque seule leur position relative les unes par rapport aux autres (rangs) est prise en compte. Autrement dit, les données aberrantes ou autres inexactitudes n’auront pas d’impact sérieux sur le résultat final.

Si les résultats du test sont corrects, alors les différences entre les coefficients de Pearson et de Spearman sont insignifiantes, tandis que le coefficient de Pearson montre une valeur plus précise de la relation entre les données.

Comment calculer le coefficient de corrélation

Les coefficients de Pearson et Spearman peuvent être calculés manuellement. Cela peut être nécessaire pour une étude approfondie des méthodes statistiques.

Cependant, dans la plupart des cas, lors de la résolution de problèmes appliqués, y compris en psychologie, il est possible d'effectuer des calculs à l'aide de programmes spéciaux.

Calcul à l'aide de feuilles de calcul Microsoft Excel

Revenons à l'exemple avec les élèves et considérons les données sur leur niveau d'intelligence et la longueur de leur saut debout. Entrons ces données (deux colonnes) dans un tableau Excel.

En déplaçant le curseur vers une cellule vide, cliquez sur l'option « Insérer une fonction » et sélectionnez « CORREL » dans la section « Statistiques ».

Le format de cette fonction implique la sélection de deux tableaux de données : CORREL (tableau 1 ; tableau"). Nous mettons en évidence la colonne avec le QI et la longueur du saut en conséquence.

Les feuilles de calcul Excel ont une formule pour calculer uniquement le coefficient de Pearson.

Calcul à l'aide du programme STATISTICA

Nous entrons des données sur l'intelligence et sautons dans le champ de données initial. Ensuite, sélectionnez l'option « Tests non paramétriques », « Spearman ». Nous sélectionnons les paramètres de calcul et obtenons le résultat suivant.


Comme vous pouvez le constater, le calcul a donné un résultat de 0,024, ce qui diffère du résultat de Pearson - 0,038, obtenu ci-dessus à l'aide d'Excel. Toutefois, les différences sont mineures.

Utiliser l'analyse de corrélation dans les thèses de psychologie (exemple)

La plupart des sujets des travaux finaux de qualification en psychologie (diplômes, cours, maîtrise) impliquent la réalisation de recherches de corrélation (le reste est lié à l'identification des différences d'indicateurs psychologiques dans différents groupes).

Le terme « corrélation » lui-même est rarement entendu dans les noms de sujets - il se cache derrière les formulations suivantes :

  • « La relation entre le sentiment subjectif de solitude et la réalisation de soi chez les femmes d'âge mûr » ;
  • « Caractéristiques de l'influence de la résilience des managers sur le succès de leur interaction avec les clients dans des situations de conflit » ;
  • "Facteurs personnels de résistance au stress des employés du ministère des Situations d'urgence."

Ainsi, les mots « relation », « influence » et « facteurs » sont des signes certains que la méthode d'analyse des données dans une étude empirique doit être une analyse de corrélation.

Examinons brièvement les étapes de sa mise en œuvre lors de la rédaction d'une thèse en psychologie sur le thème : « La relation entre anxiété personnelle et agressivité chez les adolescents ».

1. Pour le calcul, des données brutes sont nécessaires, qui correspondent généralement aux résultats des tests des sujets. Ils sont saisis dans un tableau croisé dynamique et placés dans l'application. Ce tableau est organisé comme suit :

  • chaque ligne contient des données pour un sujet ;
  • chaque colonne contient des indicateurs sur une échelle pour tous les sujets.

Sujet n°

Anxiété de la personnalité

Agressivité

2. Il est nécessaire de décider lequel des deux types de coefficients - Pearson ou Spearman - sera utilisé. Nous vous rappelons que Pearson donne un résultat plus précis, mais il est sensible aux valeurs aberrantes des données. Les coefficients de Spearman peuvent être utilisés avec n'importe quelle donnée (sauf l'échelle nominative), c'est pourquoi ils sont le plus souvent utilisés dans les diplômes de psychologie.

3. Entrez le tableau de données brutes dans le programme statistique.

4. Calculez la valeur.



5. L’étape suivante consiste à déterminer si la relation est significative. Le programme statistique a mis en évidence les résultats en rouge, ce qui signifie que la corrélation est statistiquement significative au niveau de signification de 0,05 (indiqué ci-dessus).

Cependant, il est utile de savoir comment déterminer manuellement la signification. Pour ce faire, vous aurez besoin d'un tableau des valeurs critiques de Spearman.

Tableau des valeurs critiques des coefficients de Spearman

Niveau de signification statistique

Nombre de sujets

p=0,05

p=0,01

p=0,001

0,88

0,96

0,99

0,81

0,92

0,97

0,75

0,88

0,95

0,71

0,83

0,93

0,67

0,63

0,77

0,87

0,74

0,85

0,58

0,71

0,82

0,55

0,68

0,53

0,66

0,78

0,51

0,64

0,76

Nous nous intéressons à un niveau de signification de 0,05 et notre échantillon est de 10 personnes. A l'intersection de ces données on retrouve la valeur critique de Spearman : Rcr=0,63.

La règle est la suivante : si la valeur empirique de Spearman qui en résulte est supérieure ou égale à la valeur critique, alors elle est statistiquement significative. Dans notre cas : Ramp (0,66) > Rcr (0,63), la relation entre agressivité et anxiété dans le groupe d'adolescents est donc statistiquement significative.

5. Dans le texte de la thèse, vous devez insérer les données dans un tableau au format Word, et non dans un tableau provenant d'un programme statistique. Sous le tableau, nous décrivons le résultat obtenu et l'interprétons.

Tableau 1

Coefficients de Spearman d'agressivité et d'anxiété dans un groupe d'adolescents

Agressivité

Anxiété de la personnalité

0,665*

* - statistiquement significatif (p0,05)

L'analyse des données présentées dans le tableau 1 montre qu'il existe une relation positive statistiquement significative entre l'agressivité et l'anxiété chez les adolescents. Cela signifie que plus l'anxiété personnelle des adolescents est élevée, plus leur niveau d'agressivité est élevé. Ce résultat suggère que l’agressivité chez les adolescents est l’un des moyens de soulager l’anxiété. Souffrant de doute et d'anxiété en raison de menaces pour l'estime de soi, particulièrement sensibles à l'adolescence, un adolescent a souvent recours à un comportement agressif, réduisant ainsi son anxiété de manière improductive.

6. Est-il possible de parler d'influence lors de l'interprétation des connexions ? Peut-on dire que l’anxiété affecte l’agressivité ? À proprement parler, non. Nous avons montré plus haut que la corrélation entre les phénomènes est de nature probabiliste et reflète uniquement la cohérence des changements de caractéristiques au sein du groupe. En même temps, on ne peut pas dire que cette cohérence soit due au fait que l'un des phénomènes est la cause de l'autre et l'influence. C'est-à-dire que la présence d'une corrélation entre les paramètres psychologiques ne permet pas de parler de l'existence d'une relation de cause à effet entre eux. Cependant, la pratique montre que le terme « influence » est souvent utilisé lors de l'analyse des résultats de l'analyse de corrélation.

La méthode de corrélation de rang de Spearman permet de déterminer la proximité (force) et la direction de la corrélation entre deux caractéristiques ou deux profils (hiérarchies) de caractéristiques.

Pour calculer la corrélation de rang, il est nécessaire d'avoir deux lignes de valeurs,

qui peut être classé. Une telle série de valeurs pourrait être :

1) deux signes mesurés dans le même groupe de sujets ;

2) deux hiérarchies individuelles de traits identifiées chez deux sujets utilisant le même ensemble de traits ;

3) deux hiérarchies de groupes de caractéristiques,

4) hiérarchies de caractéristiques individuelles et collectives.

Premièrement, les indicateurs sont classés séparément pour chacune des caractéristiques.

En règle générale, un rang inférieur est attribué à une valeur d'attribut inférieure.

Dans le premier cas (deux caractéristiques), les valeurs individuelles de la première caractéristique obtenues par différents sujets sont classées, puis les valeurs individuelles de la deuxième caractéristique.

Si deux caractéristiques sont positivement liées, alors les sujets qui ont un rang faible dans l'une d'elles auront un rang faible dans l'autre, et les sujets qui ont un rang élevé dans l'autre.

l’une des caractéristiques aura également un rang élevé pour l’autre caractéristique. Pour calculer rs, il faut déterminer les différences (d) entre les rangs obtenus par un sujet donné pour les deux caractéristiques. Ensuite, ces indicateurs d sont transformés d'une certaine manière et soustraits de 1. Que

Plus la différence entre les rangs est petite, plus rs sera grand, plus il sera proche de +1.

S'il n'y a pas de corrélation, alors tous les rangs seront mélangés et il n'y aura pas de corrélation.

aucune correspondance. La formule est conçue pour que dans ce cas, rs soit proche de 0.

Dans le cas d'une corrélation négative entre les faibles rangs des sujets sur un attribut

les rangs élevés sur une autre base correspondront, et vice versa. Plus l'écart entre les classements des sujets sur deux variables est grand, plus rs est proche de -1.

Dans le deuxième cas (deux profils individuels), individuel

valeurs obtenues par chacun des 2 sujets pour un certain ensemble de caractéristiques (identiques pour les deux). Le premier rang sera attribué à la fonctionnalité ayant la valeur la plus basse ; le deuxième rang est une fonctionnalité avec une valeur plus élevée, etc. Évidemment, tous les attributs doivent être mesurés dans les mêmes unités, sinon un classement est impossible. Par exemple, il est impossible de classer les indicateurs du Cattell Personality Inventory (16PF) s'ils sont exprimés en points « bruts », car les plages de valeurs​​des différents facteurs sont différentes : de 0 à 13, de 0 à

20 et de 0 à 26. Nous ne pouvons pas dire quel facteur prendra la première place en termes de gravité tant que nous n'aurons pas ramené toutes les valeurs sur une seule échelle (le plus souvent il s'agit de l'échelle murale).

Si les hiérarchies individuelles de deux sujets sont positivement liées, alors les caractéristiques qui ont un rang faible dans l’un d’entre elles auront un rang faible dans l’autre, et vice versa. Par exemple, si le facteur E (dominance) d’un sujet a le rang le plus bas, alors le facteur d’un autre sujet devrait également avoir un rang faible, si le facteur C d’un sujet

(stabilité émotionnelle) a le rang le plus élevé, alors l'autre sujet doit également avoir

ce facteur a un rang élevé, etc.

Dans le troisième cas (deux profils de groupe), les valeurs moyennes de groupe obtenues dans 2 groupes de matières sont classées selon un certain ensemble de caractéristiques, identiques pour les deux groupes. Dans ce qui suit, le raisonnement est le même que dans les deux cas précédents.

Dans le cas 4 (profils individuels et de groupe), les valeurs individuelles du sujet et les valeurs moyennes du groupe sont classées séparément selon le même ensemble de caractéristiques, qui sont obtenues, en règle générale, en excluant ce sujet individuel - il ne participe pas au profil moyen du groupe avec lequel il sera comparé au profil individuel. La corrélation des classements testera la cohérence des profils individuels et de groupe.

Dans les quatre cas, la signification du coefficient de corrélation résultant est déterminée par le nombre de valeurs classées N. Dans le premier cas, ce nombre coïncidera avec la taille de l'échantillon n. Dans le second cas, le nombre d'observations sera le nombre d'entités qui composent la hiérarchie. Dans les troisième et quatrième cas, N est également le nombre de caractéristiques comparées, et non le nombre de sujets dans les groupes. Des explications détaillées sont données dans les exemples. Si la valeur absolue de rs atteint ou dépasse une valeur critique, la corrélation est fiable.

Hypothèses.

Il y a deux hypothèses possibles. Le premier s’applique au cas 1, le second aux trois autres cas.

Première version des hypothèses

H0 : La corrélation entre les variables A et B n'est pas différente de zéro.

H1 : La corrélation entre les variables A et B est significativement différente de zéro.

Deuxième version des hypothèses

H0 : La corrélation entre les hiérarchies A et B n'est pas différente de zéro.

H1 : La corrélation entre les hiérarchies A et B est significativement différente de zéro.

Limites du coefficient de corrélation de rang

1. Pour chaque variable, au moins 5 observations doivent être présentées. La limite supérieure de l'échantillon est déterminée par les tableaux de valeurs critiques disponibles.

2. Le coefficient de corrélation des rangs de Spearman rs avec un grand nombre de rangs identiques pour une ou les deux variables comparées donne des valeurs approximatives. Idéalement, les deux séries corrélées devraient représenter deux séquences de valeurs divergentes. Si cette condition n’est pas remplie, il est nécessaire de procéder à un ajustement pour égalité de rang.

Le coefficient de corrélation de rang de Spearman est calculé à l'aide de la formule :

Si dans les deux séries de rangs comparées il y a des groupes de mêmes rangs, avant de calculer le coefficient de corrélation de rangs, il est nécessaire d'apporter des corrections pour les mêmes rangs Ta et Tb :

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

où a est le volume de chaque groupe de rangs identiques dans la série de rangs A, b est le volume de chaque

groupes de rangs identiques dans la série de rangs B.

Pour calculer la valeur empirique de rs, utilisez la formule :

Calcul du coefficient de corrélation de rang de Spearman rs

1. Déterminer à quelles deux caractéristiques ou deux hiérarchies de caractéristiques participeront

comparaison en tant que variables A et B.

2. Classer les valeurs de la variable A en attribuant le rang 1 à la plus petite valeur, conformément aux règles de classement (voir P.2.3). Entrez les classements dans la première colonne du tableau par ordre de sujets de test ou de caractéristiques.

3. Classez les valeurs de la variable B selon les mêmes règles. Inscrivez les rangs dans la deuxième colonne du tableau par ordre de numéros de sujets ou de caractéristiques.

5. Mettez au carré chaque différence : d2. Inscrivez ces valeurs dans la quatrième colonne du tableau.

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

où a est le volume de chaque groupe de rangs identiques dans la série de rangs A ; c – volume de chaque groupe

rangs identiques dans la série de classement B.

a) en l'absence de rangs identiques

rs  1 − 6 ⋅

b) en présence de rangs identiques

Σd 2  T  T

r  1 − 6 ⋅ une dans,

où Σd2 est la somme des carrés des différences entre les rangs ; Ta et TV - corrections pour le même

N – nombre de sujets ou de fonctionnalités participant au classement.

9. Déterminez à partir du tableau (voir annexe 4.3) les valeurs critiques de rs pour un N donné. Si rs dépasse la valeur critique ou est au moins égale à celle-ci, la corrélation est significativement différente de 0.

Exemple 4.1. Lors de la détermination du degré de dépendance de la réaction de consommation d'alcool sur la réaction oculomotrice dans le groupe test, des données ont été obtenues avant et après la consommation d'alcool. La réaction du sujet dépend-elle de l'état d'ébriété ?

Résultats de l'expérience :

Avant : 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. Après : 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Formulons des hypothèses :

H0 : la corrélation entre le degré de dépendance de la réaction avant et après la consommation d'alcool ne diffère pas de zéro.

H1 : la corrélation entre le degré de dépendance de la réaction avant et après la consommation d'alcool est significativement différente de zéro.

Tableau 4.1. Calcul de d2 pour le coefficient de corrélation de rang de Spearman rs lors de la comparaison des indicateurs de réaction oculomotrice avant et après l'expérience (N = 17)

valeurs

valeurs

Puisque nous avons des rangs répétitifs, dans ce cas nous appliquerons la formule ajustée pour des rangs identiques :

Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

Тb =((23-2)+(23-2)+(33-3))/12=3

Trouvons la valeur empirique du coefficient de Spearman :

rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05

A l'aide du tableau (Annexe 4.3) on retrouve les valeurs critiques du coefficient de corrélation

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

On a

rs=0,05∠rcr(0,05)=0,48

Conclusion : l'hypothèse H1 est rejetée et H0 est acceptée. Ceux. corrélation entre diplôme

la dépendance de la réaction avant et après avoir bu de l'alcool ne diffère pas de zéro.



Avez-vous aimé l'article? Partage avec tes amis!