Une corrélation positive le montre. Que signifie le concept de corrélation en termes simples ?

Qu’est-ce que la corrélation ? La signification du mot « Corrélation » dans les dictionnaires et encyclopédies populaires, exemples d'utilisation du terme dans la vie quotidienne.

Corrélation canonique

Généralisation de la corrélation par paires utilisée pour déterminer la relation entre deux groupes de traits. Kanonich. L'analyse, c'est-à-dire la méthode de recherche de K.k., est basée sur la construction de telles combinaisons linéaires de caractéristiques de l'un et de l'autre groupe que le coefficient de corrélation par paire habituel entre ces combinaisons atteint sa plus grande valeur. Ce coefficient maximum est appelé premier canonique. coefficient de corrélation, et les combinaisons linéaires correspondantes de deux groupes de caractéristiques sont appelées. le premier canonique quantités. Voir Kendall M.J., Stewart A. Analyse statique multivariée et séries chronologiques. M., 1976 ; Vold G. Modèles de chemin à variables latentes // Mathématiques en sociologie : modélisation et traitement de l'information M., 1977 ; Bolch B., Huan K.J. Méthodes statistiques multivariées pour l'économie. M., 1979 ; Dubrovsky S.A. Analyse statistique multivariée appliquée 1982 ; Lipovetski S.S. Quelques modèles de l'analyse de Gunner comme extrêmes de formes quadratiques et bilinéaires//Application complète des méthodes mathématiques dans la recherche sociologique. M., 1983 ; Van den Wollenberg A.L. Redondance : Une alternative à l'analyse de corrélation canonique//Psychometrica. 1977. Vol. 42, n° 2. C.C. Lipovetski, L.G. Badalyan.

Date de publication : 03/09/2017 13:01

Le terme « corrélation » est activement utilisé dans les sciences humaines et la médecine ; apparaît souvent dans les médias. Les corrélations jouent un rôle clé en psychologie. En particulier, le calcul des corrélations constitue une étape importante dans la mise en œuvre de recherches empiriques lors de la rédaction d’une thèse en psychologie.

Les documents sur les corrélations sur Internet sont trop scientifiques. Il est difficile pour un non-spécialiste de comprendre les formules. Dans le même temps, comprendre la signification des corrélations est nécessaire pour un spécialiste du marketing, un sociologue, un médecin, un psychologue - tous ceux qui mènent des recherches sur les personnes.

Dans cet article, nous expliquerons dans un langage simple l'essence de la corrélation, les types de corrélations, les méthodes de calcul, les caractéristiques de l'utilisation de la corrélation dans la recherche psychologique, ainsi que lors de la rédaction de thèses en psychologie.

Contenu

Qu'est-ce que la corrélation

La corrélation est la connexion. Mais pas n’importe qui. Quelle est sa particularité ? Regardons un exemple.

Imaginez que vous conduisez une voiture. Vous appuyez sur la pédale d'accélérateur et la voiture va plus vite. Vous ralentissez le gaz et la voiture ralentit. Même quelqu'un qui ne connaît pas la structure d'une voiture dira : « Il existe un lien direct entre la pédale d'accélérateur et la vitesse de la voiture : plus la pédale est enfoncée fort, plus la vitesse est élevée. »

Il s'agit d'une relation fonctionnelle : la vitesse est une fonction directe de la pédale d'accélérateur. Le spécialiste vous expliquera que la pédale contrôle l'alimentation en carburant des cylindres, où le mélange est brûlé, ce qui entraîne une augmentation de la puissance de l'arbre, etc. Cette connexion est rigide, déterministe et ne permet aucune exception (à condition que la machine fonctionne correctement).

Imaginez maintenant que vous êtes le directeur d'une entreprise dont les employés vendent des produits. Vous décidez d’augmenter vos ventes en augmentant les salaires des employés. Vous augmentez votre salaire de 10 % et les ventes en moyenne de l'entreprise augmentent. Au bout d'un moment, vous l'augmentez encore de 10 %, et à nouveau il y a une croissance. Puis encore 5 %, et encore une fois il y a un effet. La conclusion s'impose : il existe une relation directe entre les ventes de l'entreprise et les salaires des employés : plus les salaires sont élevés, plus les ventes de l'organisation sont élevées. Est-ce le même lien qu'entre la pédale d'accélérateur et la vitesse de la voiture ? Quelle est la principale différence ?

C'est vrai, la relation entre salaire et ventes n'est pas stricte. Cela signifie que les ventes de certains salariés pourraient même diminuer, malgré l’augmentation des salaires. Certains resteront inchangés. Mais en moyenne, les ventes de l’entreprise ont augmenté, et nous disons qu’il existe un lien entre les ventes et les salaires des employés, et qu’il est corrélationnel.

La connexion fonctionnelle (pédale d'accélérateur - vitesse) repose sur une loi physique. La base de la relation de corrélation (ventes - salaire) est la simple cohérence des évolutions de deux indicateurs. Il n’y a aucune loi (au sens physique du terme) derrière la corrélation. Il n’existe qu’un modèle probabiliste (stochastique).

Expression numérique de la dépendance de corrélation

Ainsi, la relation de corrélation reflète la dépendance entre les phénomènes. Si ces phénomènes peuvent être mesurés, ils reçoivent alors une expression numérique.

Par exemple, le rôle de la lecture dans la vie des gens est étudié. Les chercheurs ont pris un groupe de 40 personnes et ont mesuré deux indicateurs pour chaque sujet : 1) combien de temps il lit par semaine ; 2) dans quelle mesure il se considère prospère (sur une échelle de 1 à 10). Les scientifiques ont saisi ces données dans deux colonnes et ont utilisé un programme statistique pour calculer la corrélation entre lecture et bien-être. Disons qu'ils ont obtenu le résultat suivant -0,76. Mais que signifie ce chiffre ? Comment l'interpréter ? Voyons cela.

Le nombre obtenu est appelé coefficient de corrélation. Pour l’interpréter correctement, il est important de considérer les éléments suivants :

  1. Le signe « + » ou « - » reflète le sens de la dépendance.
  2. La valeur du coefficient reflète la force de la dépendance.

Direct et inverse

Le signe plus devant le coefficient indique que la relation entre phénomènes ou indicateurs est directe. Autrement dit, plus un indicateur est élevé, plus l'autre est élevé. Un salaire plus élevé signifie des ventes plus élevées. Cette corrélation est dite directe ou positive.

Si le coefficient a un signe moins, alors la corrélation est inverse ou négative. Dans ce cas, plus un indicateur est élevé, plus l'autre est bas. Dans l’exemple lecture et bien-être, nous avons trouvé -0,76, ce qui signifie que plus les gens lisent, plus leur niveau de bien-être diminue.

Fort et faible

Une corrélation en termes numériques est un nombre compris entre -1 et +1. Désigné par la lettre "r". Plus le nombre est élevé (en ignorant le signe), plus la corrélation est forte.

Plus la valeur numérique du coefficient est faible, moins la relation entre phénomènes et indicateurs est importante.

La force de dépendance maximale possible est de 1 ou -1. Comment comprendre et présenter cela ?

Regardons un exemple. Ils ont pris 10 étudiants et ont mesuré leur niveau d’intelligence (QI) et leurs performances académiques pour le semestre. Disposé ces données sous la forme de deux colonnes.

Sujet

QI

Performance académique (points)

Regardez attentivement les données du tableau. De 1 à 10, le niveau de QI du sujet augmente. Mais le niveau de réussite augmente également. Parmi deux élèves, celui ayant le QI le plus élevé obtiendra de meilleurs résultats. Et il n’y aura aucune exception à cette règle.

Voici un exemple de changement complet et cohérent à 100 % de deux indicateurs dans un groupe. Et ceci est un exemple de la relation la plus positive possible. Autrement dit, la corrélation entre l’intelligence et les résultats scolaires est égale à 1.

Regardons un autre exemple. Les mêmes 10 étudiants ont été évalués à l'aide d'une enquête dans quelle mesure ils se sentaient capables de communiquer avec le sexe opposé (sur une échelle de 1 à 10).

Sujet

QI

Réussite dans la communication avec le sexe opposé (points)

Examinons attentivement les données du tableau. De 1 à 10, le niveau de QI du sujet augmente. Dans le même temps, dans la dernière colonne, le niveau de réussite dans la communication avec le sexe opposé diminue constamment. Parmi deux élèves, celui dont le QI est le plus faible réussira mieux à communiquer avec le sexe opposé. Et il n’y aura aucune exception à cette règle.

Ceci est un exemple de cohérence totale dans les changements de deux indicateurs dans un groupe - la relation négative maximale possible. La corrélation entre le QI et la réussite dans la communication avec le sexe opposé est de -1.

Comment comprendre le sens d’une corrélation égale à zéro (0) ? Cela signifie qu’il n’y a aucun lien entre les indicateurs. Revenons encore une fois à nos étudiants et considérons un autre indicateur mesuré par eux : la longueur de leur saut debout.

Sujet

QI

Longueur de saut debout (m)

Il n’y a aucune cohérence observée entre la variation d’une personne à l’autre du QI et de la longueur du saut. Cela indique l’absence de corrélation. Le coefficient de corrélation entre le QI et la longueur du saut debout chez les élèves est de 0.

Nous avons examiné des cas extrêmes. Dans les mesures réelles, les coefficients sont rarement exactement égaux à 1 ou 0. L'échelle suivante est adoptée :

  • si le coefficient est supérieur à 0,70, la relation entre les indicateurs est forte ;
  • de 0,30 à 0,70 - connexion modérée,
  • moins de 0,30 - la relation est faible.

Si l'on évalue la corrélation entre lecture et bien-être que nous avons obtenue ci-dessus sur cette échelle, il s'avère que cette relation est forte et négative de -0,76. Autrement dit, il existe une forte relation négative entre le fait d’être bien lu et le bien-être. Ce qui confirme une fois de plus la sagesse biblique sur la relation entre sagesse et tristesse.

La gradation donnée donne des estimations très approximatives et est rarement utilisée dans la recherche sous cette forme.

Les gradations des coefficients selon les niveaux de signification sont plus souvent utilisées. Dans ce cas, le coefficient effectivement obtenu peut être significatif ou non. Ceci peut être déterminé en comparant sa valeur avec la valeur critique du coefficient de corrélation tirée d'un tableau spécial. De plus, ces valeurs critiques dépendent de la taille de l'échantillon (plus le volume est grand, plus la valeur critique est faible).

Analyse de corrélation en psychologie

La méthode de corrélation est l'une des principales méthodes de recherche psychologique. Et ce n’est pas un hasard, car la psychologie s’efforce d’être une science exacte. Est-ce que ça marche ?

Quelles sont les particularités des lois dans les sciences exactes ? Par exemple, la loi de la gravité en physique fonctionne sans exception : plus la masse d'un corps est grande, plus il attire d'autres corps. Cette loi physique reflète la relation entre la masse corporelle et la gravité.

En psychologie, la situation est différente. Par exemple, les psychologues publient des données sur le lien entre les relations chaleureuses dans l'enfance avec les parents et le niveau de créativité à l'âge adulte. Cela signifie-t-il que certains sujets ayant entretenu des relations très chaleureuses avec leurs parents dans leur enfance auront des capacités créatives très élevées ? La réponse est claire : non. Il n’y a pas de loi comme la loi physique. Il n’existe aucun mécanisme permettant d’influencer l’expérience de l’enfance sur la créativité des adultes. Ce sont nos fantasmes ! Il y a une cohérence des données (relations – créativité), mais il n’y a aucune loi derrière cela. Mais il n'y a qu'une corrélation. Les psychologues appellent souvent les relations identifiées des modèles psychologiques, soulignant leur nature probabiliste et non leur rigidité.

L’exemple d’étude d’étudiant de la section précédente illustre bien l’utilisation des corrélations en psychologie :

  1. Analyse de la relation entre les indicateurs psychologiques. Dans notre exemple, le QI et la réussite dans la communication avec le sexe opposé sont des paramètres psychologiques. Identifier la corrélation entre eux élargit la compréhension de l'organisation mentale d'une personne, des relations entre divers aspects de sa personnalité - en l'occurrence, entre l'intellect et la sphère de la communication.
  2. L'analyse de la relation entre le QI et les résultats scolaires et le saut d'obstacles est un exemple du lien entre un paramètre psychologique et des paramètres non psychologiques. Les résultats obtenus révèlent les caractéristiques de l'influence de l'intelligence sur les activités éducatives et sportives.

Voici à quoi pourrait ressembler une synthèse de l’étude étudiante concoctée :

  1. Une relation positive significative entre l’intelligence des étudiants et leurs performances académiques a été révélée.
  2. Il existe une relation négative significative entre le QI et la réussite dans la communication avec le sexe opposé.
  3. Il n'y avait aucun lien entre le QI des étudiants et la capacité de sauter.

Ainsi, le niveau d'intelligence des étudiants agit comme un facteur positif dans leurs résultats scolaires, tout en affectant négativement les relations avec le sexe opposé et n'ayant pas d'impact significatif sur la réussite sportive, en particulier la capacité de sauter.

Comme nous le voyons, l’intelligence aide les élèves à apprendre, mais les empêche d’établir des relations avec le sexe opposé. Toutefois, cela n’affecte en rien leur réussite sportive.

L'influence ambiguë de l'intelligence sur la personnalité et l'activité des étudiants reflète la complexité de ce phénomène dans la structure des caractéristiques personnelles et l'importance de poursuivre les recherches dans ce sens. Il semble notamment important d’analyser la relation entre l’intelligence et les caractéristiques psychologiques et les activités des étudiants, en tenant compte de leur sexe.

Coefficients de Pearson et Spearman

Considérons deux méthodes de calcul.

Le coefficient de Pearson est une méthode spéciale pour calculer la relation entre les indicateurs entre la gravité des valeurs numériques dans un groupe. Très simplement, cela se résume à ceci :

  1. Les valeurs de deux paramètres dans un groupe de sujets sont prises (par exemple, l'agressivité et le perfectionnisme).
  2. Les valeurs moyennes de chaque paramètre du groupe sont trouvées.
  3. Les différences entre les paramètres de chaque sujet et la valeur moyenne sont trouvées.
  4. Ces différences sont substituées sous une forme spéciale pour calculer le coefficient de Pearson.

Le coefficient de corrélation de rang de Spearman est calculé de la même manière :

  1. Les valeurs de deux indicateurs du groupe de matières sont prises.
  2. On retrouve les rangs de chaque facteur du groupe, c'est-à-dire la place dans la liste par ordre croissant.
  3. Les différences de rang sont trouvées, mises au carré et additionnées.
  4. Ensuite, les différences de rang sont substituées sous une forme spéciale pour calculer le coefficient de Spearman.

Dans le cas de Pearson, le calcul a été effectué en utilisant la valeur moyenne. Par conséquent, des valeurs aberrantes aléatoires dans les données (différences significatives par rapport à la moyenne), dues par exemple à des erreurs de traitement ou à des réponses peu fiables, peuvent fausser considérablement le résultat.

Dans le cas de Spearman, les valeurs absolues des données ne jouent aucun rôle, puisque seules leurs positions relatives les unes par rapport aux autres (rangs) sont prises en compte. Autrement dit, les données aberrantes ou autres inexactitudes n’auront pas d’impact sérieux sur le résultat final.

Si les résultats du test sont corrects, alors les différences entre les coefficients de Pearson et de Spearman sont insignifiantes, tandis que le coefficient de Pearson montre une valeur plus précise de la relation entre les données.

Comment calculer le coefficient de corrélation

Les coefficients de Pearson et Spearman peuvent être calculés manuellement. Cela peut être nécessaire pour une étude approfondie des méthodes statistiques.

Cependant, dans la plupart des cas, lors de la résolution de problèmes appliqués, y compris en psychologie, il est possible d'effectuer des calculs à l'aide de programmes spéciaux.

Calcul à l'aide de feuilles de calcul Microsoft Excel

Revenons à l'exemple avec les élèves et considérons les données sur leur niveau d'intelligence et la longueur de leur saut debout. Entrons ces données (deux colonnes) dans un tableau Excel.

En déplaçant le curseur vers une cellule vide, cliquez sur l'option « Insérer une fonction » et sélectionnez « CORREL » dans la section « Statistiques ».

Le format de cette fonction implique la sélection de deux tableaux de données : CORREL (tableau 1 ; tableau"). Nous mettons en évidence la colonne avec le QI et la longueur du saut en conséquence.

Les feuilles de calcul Excel ont une formule pour calculer uniquement le coefficient de Pearson.

Calcul à l'aide du programme STATISTICA

Nous entrons des données sur l'intelligence et sautons dans le champ de données initial. Ensuite, sélectionnez l'option « Tests non paramétriques », « Spearman ». Nous sélectionnons les paramètres de calcul et obtenons le résultat suivant.


Comme vous pouvez le constater, le calcul a donné un résultat de 0,024, ce qui diffère du résultat de Pearson - 0,038, obtenu ci-dessus à l'aide d'Excel. Toutefois, les différences sont mineures.

Utiliser l'analyse de corrélation dans les thèses de psychologie (exemple)

La plupart des sujets des travaux finaux de qualification en psychologie (diplômes, cours, maîtrise) impliquent la réalisation de recherches de corrélation (le reste est lié à l'identification des différences d'indicateurs psychologiques dans différents groupes).

Le terme « corrélation » lui-même est rarement entendu dans les noms de sujets - il se cache derrière les formulations suivantes :

  • « La relation entre le sentiment subjectif de solitude et la réalisation de soi chez les femmes d'âge mûr » ;
  • « Caractéristiques de l'influence de la résilience des managers sur le succès de leur interaction avec les clients dans des situations de conflit » ;
  • "Facteurs personnels de résistance au stress des employés du ministère des Situations d'urgence."

Ainsi, les mots « relation », « influence » et « facteurs » sont des signes certains que la méthode d'analyse des données dans une étude empirique doit être une analyse de corrélation.

Examinons brièvement les étapes de sa mise en œuvre lors de la rédaction d'une thèse en psychologie sur le thème : « La relation entre anxiété personnelle et agressivité chez les adolescents ».

1. Pour le calcul, des données brutes sont nécessaires, qui correspondent généralement aux résultats des tests des sujets. Ils sont saisis dans un tableau croisé dynamique et placés dans l'application. Ce tableau est organisé comme suit :

  • chaque ligne contient des données pour un sujet ;
  • chaque colonne contient des indicateurs sur une échelle pour tous les sujets.

Sujet n°

Anxiété de la personnalité

Agressivité

2. Il est nécessaire de décider lequel des deux types de coefficients - Pearson ou Spearman - sera utilisé. Nous vous rappelons que Pearson donne un résultat plus précis, mais il est sensible aux valeurs aberrantes des données. Les coefficients de Spearman peuvent être utilisés avec n'importe quelle donnée (sauf l'échelle nominative), c'est pourquoi ils sont le plus souvent utilisés dans les diplômes de psychologie.

3. Entrez le tableau des données brutes dans le programme statistique.

4. Calculez la valeur.



5. L'étape suivante consiste à déterminer si la relation est significative. Le programme statistique a mis en évidence les résultats en rouge, ce qui signifie que la corrélation est statistiquement significative au niveau de signification de 0,05 (indiqué ci-dessus).

Cependant, il est utile de savoir comment déterminer manuellement la signification. Pour ce faire, vous aurez besoin d'un tableau des valeurs critiques de Spearman.

Tableau des valeurs critiques des coefficients de Spearman

Niveau de signification statistique

Nombre de sujets

p=0,05

p=0,01

p=0,001

0,88

0,96

0,99

0,81

0,92

0,97

0,75

0,88

0,95

0,71

0,83

0,93

0,67

0,63

0,77

0,87

0,74

0,85

0,58

0,71

0,82

0,55

0,68

0,53

0,66

0,78

0,51

0,64

0,76

Nous nous intéressons à un niveau de signification de 0,05 et notre échantillon est de 10 personnes. A l'intersection de ces données on retrouve la valeur critique de Spearman : Rcr=0,63.

La règle est la suivante : si la valeur empirique de Spearman qui en résulte est supérieure ou égale à la valeur critique, alors elle est statistiquement significative. Dans notre cas : Ramp (0,66) > Rcr (0,63), la relation entre agressivité et anxiété dans le groupe d'adolescents est donc statistiquement significative.

5. Dans le texte de la thèse, vous devez insérer les données dans un tableau au format Word, et non dans un tableau provenant d'un programme statistique. Sous le tableau, nous décrivons le résultat obtenu et l'interprétons.

Tableau 1

Coefficients de Spearman d'agressivité et d'anxiété dans un groupe d'adolescents

Agressivité

Anxiété de la personnalité

0,665*

* - statistiquement significatif (p0,05)

L'analyse des données présentées dans le tableau 1 montre qu'il existe une relation positive statistiquement significative entre l'agressivité et l'anxiété chez les adolescents. Cela signifie que plus l'anxiété personnelle des adolescents est élevée, plus leur niveau d'agressivité est élevé. Ce résultat suggère que l’agressivité chez les adolescents est l’un des moyens de soulager l’anxiété. Souffrant de doute et d'anxiété en raison de menaces pour l'estime de soi, particulièrement sensibles à l'adolescence, un adolescent a souvent recours à un comportement agressif, réduisant ainsi son anxiété de manière improductive.

6. Est-il possible de parler d'influence lors de l'interprétation des connexions ? Peut-on dire que l’anxiété affecte l’agressivité ? À proprement parler, non. Nous avons montré plus haut que la corrélation entre les phénomènes est de nature probabiliste et reflète uniquement la cohérence des changements de caractéristiques au sein du groupe. En même temps, on ne peut pas dire que cette cohérence soit due au fait que l'un des phénomènes est la cause de l'autre et l'influence. C'est-à-dire que la présence d'une corrélation entre les paramètres psychologiques ne permet pas de parler de l'existence d'une relation de cause à effet entre eux. Cependant, la pratique montre que le terme « influence » est souvent utilisé lors de l'analyse des résultats de l'analyse de corrélation.

06.06.2018 12 879 0 Igor

Psychologie et société

Tout dans le monde est interconnecté. Chaque personne, au niveau de l'intuition, essaie de trouver des relations entre les phénomènes afin de pouvoir les influencer et les contrôler. Le concept qui reflète cette relation est appelé corrélation. Qu’est-ce que cela signifie en termes simples ?

Contenu:

Concept de corrélation

Corrélation (du latin « correlatio » – rapport, relation)– un terme mathématique qui désigne une mesure de dépendance statistique probabiliste entre des quantités aléatoires (variables).



Exemple: Prenons deux types de relations :

  1. D'abord- un stylo dans la main d'une personne. Dans quelle direction la main se déplace, dans quelle direction va le stylo. Si la main est au repos, le stylo n’écrira pas. Si une personne appuie un peu plus fort, la marque sur le papier sera plus riche. Ce type de relation reflète une stricte dépendance et n’est pas corrélationnel. Cette relation est fonctionnelle.
  2. Deuxième type– la relation entre le niveau d’éducation d’une personne et la lecture de littérature. On ne sait pas à l’avance quelles personnes lisent le plus : celles qui ont fait des études supérieures ou celles qui n’en ont pas fait. Cette connexion est aléatoire ou stochastique ; elle est étudiée par la science statistique, qui s'intéresse exclusivement aux phénomènes de masse. Si un calcul statistique permet de prouver la corrélation entre le niveau d'éducation et la lecture de la littérature, alors cela permettra de faire des prévisions et de prédire la survenance probabiliste d'événements. Dans cet exemple, avec un degré de probabilité élevé, on peut affirmer que les personnes ayant fait des études supérieures, celles qui sont plus instruites, lisent plus de livres. Mais comme la connexion entre ces paramètres n’est pas fonctionnelle, on peut se tromper. Vous pouvez toujours calculer la probabilité d'une telle erreur, qui sera clairement faible et est appelée niveau de signification statistique (p).

Des exemples de relations entre phénomènes naturels sont : la chaîne alimentaire dans la nature, le corps humain, qui est constitué de systèmes organiques interconnectés et fonctionnant comme un tout.

Chaque jour, nous rencontrons des corrélations dans la vie de tous les jours : entre la météo et la bonne humeur, la formulation correcte des objectifs et leur réalisation, une attitude positive et la chance, un sentiment de bonheur et de bien-être financier. Mais nous recherchons des liens, en nous appuyant non sur des calculs mathématiques, mais sur des mythes, des intuitions, des superstitions et de vaines spéculations. Ces phénomènes sont très difficiles à traduire en langage mathématique, à exprimer en chiffres et à mesurer. C’est une autre affaire quand on analyse des phénomènes qui peuvent être calculés et présentés sous forme de chiffres. Dans ce cas, nous pouvons définir la corrélation en utilisant le coefficient de corrélation (r), qui reflète la force, le degré, la proximité et la direction de la corrélation entre les variables aléatoires.

Forte corrélation entre les variables aléatoires- la preuve de la présence d'un certain lien statistique spécifiquement entre ces phénomènes, mais ce lien ne peut être transféré aux mêmes phénomènes, mais pour une situation différente. Souvent, les chercheurs, ayant obtenu une corrélation significative entre deux variables dans leurs calculs, basés sur la simplicité de l'analyse de corrélation, font de fausses hypothèses intuitives sur l'existence de relations de cause à effet entre les caractéristiques, oubliant que le coefficient de corrélation est de nature probabiliste. .

Exemple: le nombre de personnes blessées dans des conditions de verglas et le nombre d'accidents de la route entre véhicules à moteur. Ces quantités seront corrélées les unes aux autres, bien qu'elles ne soient absolument pas interconnectées, mais n'ont qu'un lien avec la cause commune de ces événements aléatoires - la glace noire. Si l'analyse ne révèle pas de corrélation entre les phénomènes, cela ne prouve pas encore l'absence de dépendance entre eux, qui peut être complexe, non linéaire et non révélée par les calculs de corrélation.




Les premiers à introduire le concept de corrélation dans l'usage scientifique furent les Français. paléontologue Georges Cuvier. Au XVIIIe siècle, il déduit la loi de corrélation des parties et organes des organismes vivants, grâce à laquelle il devient possible de restituer l'apparence d'une créature fossile entière, animal, à partir des parties trouvées du corps (restes). En statistique, le terme corrélation a été utilisé pour la première fois en 1886 par un scientifique anglais. Francis Galton. Mais il n'a pas pu dériver la formule exacte pour calculer le coefficient de corrélation, mais son élève l'a fait - célèbre mathématicien et biologiste Karl Pearson.

Types de corrélation

Par importance– hautement significatif, significatif et insignifiant.

Espèces

à quoi r est égal

Très significatif

r correspond au niveau de signification statistique p<=0,01

Significatif

r correspond à p<=0,05

Insignifiant

r n'atteint pas p>0,1

Négatif(une diminution de la valeur d'une variable entraîne une augmentation du niveau d'une autre : plus une personne a de phobies, moins elle a de chances d'occuper une position de leader) et positive (si une augmentation d'une variable entraîne une augmentation au niveau d'un autre : plus vous êtes nerveux, plus vous risquez de tomber malade). S'il n'y a aucun lien entre les variables, alors une telle corrélation est appelée zéro.

Linéaire(quand une valeur augmente ou diminue, la seconde augmente ou diminue également) et non linéaire (quand lorsqu'une valeur change, la nature du changement dans la seconde ne peut pas être décrite à l'aide d'une relation linéaire, alors d'autres lois mathématiques sont appliquées - polynomiale, hyperbolique relations).

Par force.

Chances




Selon l'échelle à laquelle appartiennent les variables étudiées, différents types de coefficients de corrélation sont calculés :

  1. Le coefficient de corrélation de Pearson, le coefficient de corrélation linéaire par paire ou la corrélation du moment du produit sont calculés pour les variables avec des échelles de mesure d'intervalle et de quantité.
  2. Coefficient de corrélation de rang de Spearman ou de Kendall - lorsqu'au moins une des quantités a une échelle ordinale ou n'est pas normalement distribuée.
  3. Coefficient de corrélation bisériale ponctuelle (coefficient de corrélation du signe de Fechner) – si l'une des deux quantités est dichotomique.
  4. Coefficient de corrélation à quatre champs (coefficient de corrélation (concordance) à rangs multiples – ​​si deux variables sont dichotomiques.

Le coefficient de Pearson fait référence aux indicateurs de corrélation paramétriques, tous les autres sont non paramétriques.

La valeur du coefficient de corrélation varie de -1 à +1. Avec une corrélation positive complète, r = +1, avec une corrélation négative complète, r = -1.

Formule et calcul





Exemples

Il est nécessaire de déterminer la relation entre deux variables : le niveau de développement intellectuel (selon les tests) et le nombre de retards par mois (selon les inscriptions au journal pédagogique) chez les écoliers.

Les données initiales sont présentées dans le tableau :

Données de QI (x)

Données sur le nombre de retards (y)

Somme

1122

Moyenne arithmétique

112,2


Pour donner une interprétation correcte de l'indicateur obtenu, il est nécessaire d'analyser le signe du coefficient de corrélation (+ ou -) et sa valeur absolue (modulo).

Conformément au tableau de classification du coefficient de corrélation par force, nous concluons que rxy = -0,827 est une forte corrélation négative. Ainsi, le nombre d’écoliers en retard dépend très fortement de leur niveau de développement intellectuel. On peut dire que les étudiants ayant un niveau de QI élevé sont moins souvent en retard en classe que les étudiants ayant un niveau de QI faible.



Le coefficient de corrélation peut être utilisé à la fois par les scientifiques pour confirmer ou réfuter l'hypothèse de dépendance de deux quantités ou phénomènes et mesurer sa force et sa signification, et par les étudiants pour mener des recherches empiriques et statistiques dans divers sujets. Il faut se rappeler que cet indicateur n'est pas un outil idéal ; il est calculé uniquement pour mesurer la force d'une relation linéaire et sera toujours une valeur probabiliste comportant une certaine erreur.

L'analyse de corrélation est utilisée dans les domaines suivants :

  • sciences économiques;
  • astrophysique;
  • sciences sociales (sociologie, psychologie, pédagogie) ;
  • agrochimie;
  • métallurgie;
  • industrie (pour le contrôle qualité) ;
  • hydrobiologie;
  • biométrie, etc.

Raisons de la popularité de la méthode d’analyse de corrélation :

  1. La relative simplicité du calcul des coefficients de corrélation ne nécessite pas de formation mathématique particulière.
  2. Permet de calculer les relations entre des variables aléatoires de masse, qui font l'objet d'analyses en science statistique. À cet égard, cette méthode s'est généralisée dans le domaine de la recherche statistique.

J'espère que vous saurez désormais distinguer une relation fonctionnelle d'une relation corrélationnelle et saurez que lorsque vous entendez à la télévision ou lisez dans la presse parler de corrélation, cela signifie une interdépendance positive et assez significative entre deux phénomènes.

Les concepts scientifiques sont toujours populaires. Le verbe « corréler » est largement utilisé par les journalistes et les hommes politiques, parfois de manière inappropriée. Généralement, le terme « corrélation » fait référence à toute relation.

Les gens ont remarqué depuis longtemps que tous les phénomènes qui se produisent sur notre planète s'influencent dans une certaine mesure. Les liens entre eux ne sont pas toujours faciles à détecter, mais ils existent néanmoins. Lorsqu’on parle de l’interdépendance des événements, le mot « corrélation » est souvent utilisé. Il est le plus souvent utilisé par les économistes et les analystes.

Voyons ce que signifie réellement ce concept.

Corrélation : définition

Le premier dans le monde scientifique à parler de corrélation fut peut-être le paléontologue Georges Cuvier. Au tournant des XVIIIe et XIXe siècles, il fait de nombreuses découvertes dans le domaine de l'anatomie comparée. À la suite de ces découvertes, Cuvier a formulé la loi des relations entre les parties, selon laquelle des modifications dans la structure de l'un des organes d'un animal entraînent des modifications dans la structure d'autres organes. Sur la base de ces connaissances, Cuvier a appris à restaurer l'apparence d'animaux fossiles à partir de fragments individuels survivants.

Quant aux statistiques, le concept de corrélation a été consolidé dans cette science plus tard - à la fin du XIXe siècle, grâce au biologiste anglais Francis Galton.

Corrélation– il ne s’agit pas simplement d’une connexion (relation), mais plutôt d’une relation ou d’une interdépendance (co-relation).

La formule permettant d'obtenir le coefficient de corrélation a été dérivée par l'étudiant, mathématicien et biologiste de Galton, K. Pearson.

Coefficient de corrélation

La corrélation est une connexion statistique entre des quantités indépendantes les unes des autres. On suppose que dès que la valeur de l’un des paramètres change, la valeur de l’autre change également. Si les changements concernent uniquement des caractéristiques statistiques individuelles, une relation de ce type est considérée comme statistique. Il n'est pas question de corrélation dans ce cas.

Le coefficient de corrélation est utilisé pour exprimer le degré d'interdépendance. La plage des valeurs des coefficients va de -1 à +1.

  • Si la corrélation est absolue et positive (+1), alors lorsque le prix d’un titre augmente, le prix de l’autre augmentera dans la même mesure.
  • Lorsque nous parlons de corrélation négative absolue, nous entendons que si la valeur d’un titre augmente, la valeur d’un titre corrélé négativement diminue.
  • Si le coefficient de corrélation est nul, alors il n'y a pas d'interdépendance entre les mouvements des titres : ils sont aléatoires.

Plus la valeur du coefficient est élevée, plus l’interdépendance est grande. Si la valeur du coefficient est supérieure à 0,5, alors la relation est clairement exprimée.

Il est nécessaire de préciser que la corrélation absolue des titres n'existe que dans un monde idéal. En réalité, les actions ne sont que partiellement corrélées.

Corrélation par paire

Ce terme est utilisé pour désigner la relation entre deux quantités spécifiques. On sait que les dépenses publicitaires aux États-Unis influencent considérablement le volume du PIB du pays. Le coefficient de corrélation entre ces valeurs basé sur des observations ayant duré 20 ans est de 0,9699.

Un exemple plus « terre-à-terre » est la relation entre le trafic vers la page d’une boutique en ligne et son volume de ventes.

Et bien sûr, personne ne nierait l’existence d’une relation entre la température de l’air et les ventes de bière ou de glaces.

La corrélation est l'interdépendance de deux quantités ; le coefficient de corrélation est un indicateur objectif qui détermine le degré de cette interdépendance. Le coefficient de corrélation peut être positif ou négatif. Quant aux titres, ils sont extrêmement rarement complètement corrélés.

Une corrélation entre deux quantités est une relation statistique dans laquelle une modification de l'une des quantités entraîne une modification systématique de l'autre. Une mesure quantitative de corrélation est le coefficient de corrélation linéaire (également appelé coefficient de corrélation de Pearson), calculé par la formule :

  • r xy – coefficient de corrélation des valeurs des quantités x et y ;
  • d x – écart d'une certaine valeur de la série x par rapport à la valeur moyenne de cette série ;
  • d y – écart d'une certaine valeur de la série y par rapport à la valeur moyenne de cette série.

La plage de valeurs possibles pour le coefficient de corrélation est comprise entre +1 et -1. Les options suivantes sont possibles :

  • +1 – relation directe entre les quantités ;
  • |r xy| > 0,7 – dépendance prononcée entre les valeurs ;
  • 0.4 < |r xy| >0,7 – relation modérément prononcée entre les valeurs ;
  • |r xy|< 0.4 – слабо выраженная зависимость между величинами;
  • -1 – relation inverse entre les quantités.

Il est important de noter que plus l'échantillon de valeurs est grand, plus l'ampleur du module du coefficient de corrélation est petite, on peut parler de la présence d'une relation entre x et y. Malheureusement, la formule contient un piège qui, appliqué aux instruments financiers, peut constituer une farce cruelle pour l’investisseur. Au numérateur, les écarts des quantités peuvent avoir des signes à la fois identiques et différents, de sorte que le produit peut également être positif ou négatif. Au dénominateur, les écarts sont au carré, ce qui garantit que le dénominateur est positif. Pour l’instant, nous allons juste y prêter attention, et nous reviendrons plus tard sur ce qui pourrait en résulter.

L'objectif pratique du calcul de la corrélation entre les instruments financiers est d'obtenir des données fondamentales importantes nécessaires à la prise de décisions commerciales. La réaction des marchés à la publication de nouvelles économiques importantes s'exprime dans le fait que d'abord les prix des principaux actifs (or, pétrole, contrats à terme sur indices industriels), et parfois la rentabilité, commencent à évoluer. En conséquence, les taux de change et les cours des actions changent. En suivant la relation entre les instruments individuels, ainsi que les relations de cause à effet entre les changements de prix, vous pouvez rapidement réviser vos plans de trading et d'investissement. De plus, l'analyse de corrélation est utilisée en gestion comme élément obligatoire.

Vous pouvez visualiser la corrélation de deux quantités sous forme de graphique en coordonnées temps-amplitude. Par exemple, avec une corrélation négative, nous obtenons une image similaire :

Connaître la corrélation des actifs réduit les risques du portefeuille


Supposons, par exemple, qu'il y ait 2 actifs. Pour simplifier, imaginons que leurs prix dépendent du temps selon la loi de la sinusoïde. Ensuite, avec une corrélation de +1, nous obtiendrons un chevauchement complet des vagues et ouvrir des transactions sur les deux actifs équivaudra à doubler les positions sur l'un d'eux. Une corrélation de -1 signifie au contraire que les gains et les pertes des actifs s'annulent. Bien entendu, les actifs bien choisis n’évoluent généralement pas au même niveau, mais ont tendance à augmenter avec le temps. De plus, pour certains actifs, la croissance d'autres permet de minimiser le risque total du portefeuille :

Un processus appelé rééquilibrage de portefeuille vous permet de générer des revenus en alternant la proportion d'actifs dans votre portefeuille. Ceci est plus facilement réalisé avec une corrélation négative prononcée. Supposons qu’au départ le portefeuille contenait les actifs A et B avec une corrélation inverse et un rapport 1:1, pour un montant total de 1 million de roubles. En six mois, le prix de l'actif A a chuté de 20 % et sa valeur de 500 000 roubles d'origine est devenue 400 000 roubles. L'actif B, au contraire, a augmenté de 20 % et sa valeur est passée à 600 000 roubles. La valeur totale du portefeuille n'a pas changé et reste à 1 million de roubles. Maintenant, nous transférons 50 % de l'actif B (300 000) à A et sa valeur est désormais de 700 000, et l'actif B est de 300 000.

Au cours des six mois suivants, le processus inverse se produit : les actifs reviennent à leur prix d'origine. Désormais, l'actif A coûte 840 000 au lieu de 700 000 et l'actif B coûte 240 000 au lieu de 300 000. La valeur totale du portefeuille s'élève ainsi à 1 million 80 000 roubles, soit sa rentabilité due au rééquilibrage est de 8% par an. Sans rééquilibrage, le rendement du portefeuille serait de 0 %. Les situations réelles sont beaucoup plus compliquées, parce que... Les corrélations de la plupart des instruments se situent entre +0,5 et -0,5. Si l’on considère le graphique risque-rendement pour différents ratios de deux instruments avec des valeurs de corrélation différentes, nous obtenons l’image suivante :

Comme vous pouvez le constater, plus la valeur du coefficient de corrélation de l'instrument est faible, plus le rendement possible du portefeuille est élevé pour la même valeur de risque, ou plus le risque est faible pour la même valeur de rendement.

Corrélation sur le Forex

Une stratégie courante basée sur la corrélation des paires de devises est qu'en cas de fort écart du coefficient de corrélation par rapport à la valeur actuelle, des transactions sont ouvertes dans le sens de restaurer cette valeur. Par exemple, si les paires EURUSD et GBPUSD ont évolué dans la même direction pendant une longue période, alors si elles divergent fortement, on peut s'attendre à une convergence, si la divergence n'est pas causée par des divergences à long terme (par exemple, un changement dans le taux d'actualisation).

De plus, la corrélation des paires de devises est utilisée dans une évaluation complète du marché. Par exemple, à la veille de la crise hypothécaire de 2008-2009, lorsque les dollars australien et néo-zélandais ainsi que la livre sterling avaient un taux directeur élevé, une stratégie commerciale appelée carry trade a connu un grand développement. Cela consistait dans le fait que lorsque les événements étaient favorables aux marchés boursiers, les paires de ces monnaies avec le yen, traditionnellement caractérisées par un taux très bas, augmentaient particulièrement activement, et elles diminuaient également activement lors d'événements défavorables.

Malgré le fait qu'aucune corrélation ne peut affecter absolument tous les intervalles de temps et que des mouvements multidirectionnels des monnaies sont possibles, un mouvement unidirectionnel prononcé indique, en règle générale, la présence d'un « moteur » fondamental commun. Cela facilite la planification des transactions. En particulier, il ne sert à rien de rechercher des replis et de travailler en intrajournalier si toutes les paires clairement corrélées vont dans la même direction.

Vous pouvez consulter le tableau de corrélation en temps réel pour les paires de devises et certains autres instruments sur myfxbook.com/forex-market/correlation. Ce tableau montre que les paires EURUSD et AUDCAD ne sont pratiquement pas corrélées entre elles. Si vous ouvrez des transactions sur ces paires en même temps, vous n'avez pas à vous soucier de la somme des pertes ou du chevauchement des bénéfices sur une paire avec les pertes sur une autre.

Ce graphique montre comment les dollars australien et néo-zélandais, inversement corrélés aux monnaies refuge que sont le yen et le franc suisse, ont fortement augmenté au cours de la période de plus grand écart de taux directeurs. Cette tendance s’est inversée après le début d’une période de baisse des taux alors que la crise hypothécaire s’aggravait.

Il n'y a pas d'effets sans cause

La corrélation des prix des actifs est quelque peu similaire aux tendances : plus l'intervalle de temps pour son calcul est long, plus elle évolue lentement. Mais il y a aussi quelque chose qui distingue la corrélation de nombreuses autres méthodes. Il peut être calculé pour des paires d'actifs qui ne sont négociés sur aucune bourse (pétrole-gaz, pétrole-or), ce qui permet de compléter l'arsenal de l'analyste avec des informations précieuses qui permettent de « lire le marché entre les graphiques ».

Toute corrélation de deux quantités ou plus a toujours une relation de cause à effet. L'une des quantités est déterminante dont dépendent l'autre (ou les autres). La corrélation en bourse ne fait pas exception. Par exemple, dans le couple pétrole-gaz, les cours du pétrole ont longtemps été déterminants. Dans le graphique ci-dessous, vous pouvez voir que l’élargissement de l’écart entre le pétrole et le gaz dû à la forte croissance relative du gaz a été suivi d’un retour tout aussi brutal à l’équilibre relatif :

Dans le même temps, dans une autre paire d’actifs, l’or-pétrole, le facteur déterminant est l’or. Avec une expansion importante (forte hausse ou baisse du pétrole avec un or plus stable), c'est le pétrole qui rétablit l'équilibre perturbé :

En surveillant ce comportement des actifs « suivants », vous pouvez ouvrir des transactions dans le sens du rétablissement de l'équilibre. À propos, la corrélation repose souvent sur le rattachement de certaines devises aux actifs liés aux matières premières. On les appelle « monnaies matières premières ». Par exemple, le dollar canadien et le rouble dépendent fortement du pétrole. Dans les deux cas, la corrélation est directe : plus le pétrole est cher, plus le taux de change de ces monnaies par rapport au dollar américain est élevé.

Dans le cas du rouble, la corrélation des graphiques est si claire qu'elle peut être utilisée dans une stratégie de trading. Regardons début 2014. Le pétrole s'échange autour de 110 dollars le baril, après quoi il augmente légèrement pendant un certain temps. A cette époque, le rouble, au contraire, de 33 pour un dollar américain diminue brièvement à 36. À un moment donné, la corrélation devient presque inverse, mais l'équilibre est rapidement rétabli et le rouble revient au taux de 33 pour un dollar, docilement huile suivante. Nous en voyons un exemple encore plus frappant fin 2014, lorsque le rouble s'est fortement affaibli dans un contexte de baisse beaucoup plus progressive du prix du pétrole. Et cette fois, l’équilibre perturbé a été rapidement rétabli grâce au renforcement du rouble. Au fil du temps, la corrélation peut subir de forts changements et même passer du direct au inversé. Cela était particulièrement évident dans le cas de la corrélation entre les indices Dow Jones Industrial Average et RTS.

Fin 2007, lorsque les premiers signes de la crise hypothécaire aux États-Unis ont commencé à apparaître, l'indice DJ a baissé, mais l'indice RTS, grâce à la croissance active des prix du pétrole, s'approchait encore d'un maximum historique. Cependant, plus tard, l’effondrement brutal de tous les indices boursiers du monde a également affecté le pétrole. Cela a conduit au fait que l'indice RTS a chuté presque deux fois plus vite que celui du DJ. Outre le pétrole, le taux de baisse de l’indice RTS a également été affecté par la fuite générale des capitaux des marchés émergents.

Cependant, la crise a été de courte durée et a déjà été remplacée par la croissance économique au début de 2009. Une forte corrélation entre DJ et RTS a été observée jusqu'en avril 2012, marquée par l'épuisement des possibilités du modèle de développement des matières premières de l'économie russe. Depuis cette année, même le pétrole coûteux n’assure plus la croissance économique. Par la suite, la récession économique en Russie n’a fait que s’aggraver sur fond de chute des prix du pétrole, tandis que l’économie américaine a reçu un stimulus supplémentaire pour sa croissance. La corrélation entre et est devenue inverse.

La simple présence d'une corrélation entre les actifs ne signifie pas que vous pouvez construire une stratégie de trading ou d'investissement sur celle-ci. Disons que nous nous intéressons à la corrélation des actions IBM sur les 12 derniers mois (voir impactopia.com/correlation). Ainsi, à la 4ème place en termes de corrélation se trouve Banco Santander (environ 0,43). Très probablement, il ne s’agit que d’une coïncidence fortuite ou d’un défaut systémique dans la méthode de calcul des corrélations elle-même.

Piège mathématique

Comme je l'ai mentionné plus haut, la formule de calcul du coefficient de corrélation est très sensible aux signes d'écarts des valeurs des grandeurs par rapport à leurs valeurs moyennes. Si ces écarts ont le plus souvent les mêmes signes, on obtient une valeur élevée du coefficient de corrélation. Mais cette valeur aura-t-elle un sens ? La réponse n’est pas du tout évidente. Regardons un exemple pratique. Supposons que sur les graphiques de deux grandeurs il y ait simultanément :

Alors les nouvelles valeurs de ces grandeurs seront systématiquement du côté de leurs valeurs moyennes. Cela se traduira par une corrélation positive élevée. Malheureusement, ces informations ne seront d'aucune utilité, car... Hormis la présence d’un écart, il n’y a rien de commun entre les cartes. Ceci est juste un exemple clair du fait que lors du calcul de la corrélation, il est permis d'utiliser exclusivement des séries de valeurs stationnaires, c'est-à-dire série dans laquelle il n’y a pas de composante de tendance. Cela signifie que le calcul des corrélations dans le monde des actifs financiers conduit inévitablement à une surestimation de l’importance de facteurs qui sont en réalité de nature aléatoire. Comprenez bien : il est important de ne pas rechercher ces facteurs et d'y introduire des corrections particulières, mais de montrer l'essence même du phénomène et de ne pas chercher le prochain Graal là où il n'existe pas.

Cependant, tout n’est pas mauvais. Il existe un moyen de contourner l’influence des tendances en calculant la corrélation non pas des prix eux-mêmes, mais de leurs augmentations. Le GEP mentionné ci-dessus se révélera alors être une valeur statistique aberrante qui n’a pratiquement aucun effet sur le résultat. Il ne reste plus qu'à attendre que cette approche prévale. Il n’est pas toujours possible de trouver des données de corrélation d’actifs à jour. Dans de tels cas, ils peuvent être calculés à l’aide de Microsoft Excel. Pour ce faire, des guillemets sont écrits sous la forme de deux plages de cellules, puis une fonction de la forme suivante est écrite dans l'une des cellules libres : =CORREL (tableau 1 ; tableau 2). Le tableau pourrait ressembler à ceci, par exemple : A1:A100. Pour calculer la corrélation en fonction des incréments de prix, ce programme est doublement utile, car en fonction des prix de clôture, vous devez d'abord calculer les incréments eux-mêmes.

CV

La corrélation entre les prix des actifs est un outil important à la fois pour l’analyse des données et la gestion des risques dans les investissements de portefeuille. Mais comme toute approche statistique, elle n’est pas sans inconvénients sérieux :

  • la présence d'une corrélation prononcée entre les données du passé ne peut la garantir dans le futur ;
  • le modèle mathématique utilisé comporte de grandes erreurs pendant les périodes de tendance.

L'utilisation d'une approche de corrélation apportera un maximum d'avantages en plus d'autres méthodes d'analyse et de gestion financière. Dans les commentaires, je propose d'expliquer comment vous pouvez gagner de l'argent en corrélant des actifs spécifiques. J'ai donné mes exemples dans l'article, j'attends avec impatience les vôtres pour en discuter.

Profite à tout le monde !



Avez-vous aimé l'article? Partagez avec vos amis !