Construction d'un champ de corrélation à partir des données du tableau. Analyse des données de corrélation et de régression

Une représentation visuelle d'une table de corrélation est le champ de corrélation. Il s'agit d'un graphique où les valeurs X sont tracées sur l'axe des abscisses, les valeurs Y sont tracées sur l'axe des ordonnées et les combinaisons de X et Y sont représentées par des points. Par l'emplacement des points, on peut juger de la présence. d'une connexion.

Utilisation de la méthode graphique.

Cette méthode est utilisée pour représenter visuellement la forme de connexion entre les indicateurs économiques étudiés. Pour ce faire, un graphique est dessiné dans un système de coordonnées rectangulaires, les valeurs individuelles de la caractéristique résultante Y sont tracées le long de l'axe des ordonnées et les valeurs individuelles de la caractéristique factorielle X sont tracées le long de l'axe des abscisses.

L'ensemble des points des caractéristiques résultantes et factorielles est appelé champ de corrélation.

Sur la base du champ de corrélation, on peut émettre l'hypothèse (pour la population) que la relation entre toutes les valeurs possibles de X et Y est linéaire.

L'équation de régression linéaire est y = bx + a + ε

Ici ε est une erreur aléatoire (déviation, perturbation).

Raisons de l'existence d'une erreur aléatoire :

1. Défaut d’inclure des variables explicatives significatives dans le modèle de régression ;

2. Agrégation de variables. Par exemple, la fonction de consommation totale est une tentative d’exprimer de manière générale l’ensemble des décisions de dépenses individuelles. Il ne s’agit là que d’une approximation de relations individuelles ayant des paramètres différents.

3. Description incorrecte de la structure du modèle ;

4. Spécification fonctionnelle incorrecte ;

21. Analyse de corrélation et de régression.

L'analyse de corrélation-régression en tant que concept général comprend la mesure de l'étroitesse et de la direction d'une connexion et l'établissement d'une expression analytique (forme) de la connexion (analyse de régression).

Le but de l'analyse de régression est d'évaluer la dépendance fonctionnelle de la valeur moyenne conditionnelle de la caractéristique résultante (Y) sur les facteurs factoriels (x1, x2, ..., xk).

L'équation de régression, ou modèle statistique de la relation entre phénomènes socio-économiques, s'exprime par la fonction :

Yx = f(x1, x2, …, xn),

où « n » est le nombre de facteurs inclus dans le modèle ;

Хi – facteurs influençant le résultat Y.

Étapes d'analyse de corrélation et de régression :

Analyse préliminaire (a priori). Elle donne de bons résultats si elle est réalisée par un chercheur suffisamment qualifié.

Collecte d'informations et son traitement primaire.

Construire un modèle (équations de régression). En règle générale, cette procédure est effectuée sur un PC à l'aide de programmes standards.

Évaluer l'étroitesse des relations entre les caractéristiques, estimer l'équation de régression et analyser le modèle.

Prévoir l'évolution du système analysé à l'aide de l'équation de régression.

Dans un premier temps, le problème de recherche est formulé, la méthodologie de mesure des indicateurs ou de collecte d'informations est déterminée, le nombre de facteurs est déterminé et les facteurs en double ou liés dans un système rigidement déterminé sont éliminés.

Dans un deuxième temps, le volume d'unités est analysé : la population doit être suffisamment grande en nombre d'unités et d'observations (N>>50), le nombre de facteurs « n » doit correspondre au nombre d'observations « N ». Les données doivent être quantitativement et qualitativement homogènes.

Dans la troisième étape, la forme de la connexion et le type de fonction analytique (parabole, hyperbole, droite) sont déterminés et ses paramètres sont trouvés.

Lors de la quatrième étape, la fiabilité de toutes les caractéristiques de la relation de corrélation et de l'équation de régression est évaluée à l'aide du critère de fiabilité de Fisher ou Student, et une analyse économique et technologique des paramètres est effectuée.

À la cinquième étape, les valeurs possibles du résultat sont prédites sur la base des meilleures valeurs des caractéristiques factorielles incluses dans le modèle. Ici, les meilleures et les pires valeurs des facteurs et le résultat sont sélectionnés.

22. Types d'équations de régression.

Pour décrire quantitativement les relations entre les variables économiques, les statistiques utilisent des méthodes de régression et de corrélation.

La régression est une quantité qui exprime la dépendance de la valeur moyenne d'une variable aléatoire y sur les valeurs d'une variable aléatoire x.

L'équation de régression exprime la valeur moyenne d'une caractéristique en fonction d'une autre.

La fonction de régression est un modèle de la forme y = l", où y est la variable dépendante (attribut résultat) ; x est une variable indépendante ou explicative (facteur caractéristique).

Ligne de régression - graphique de la fonction y = f (x).

2 types de relations entre x et y :

1) on ne sait pas laquelle des deux variables est indépendante et laquelle est dépendante, les variables sont égales, il s'agit d'une relation de type corrélation ;

2) si x et y sont inégaux et que l'un d'eux est considéré comme une variable explicative (indépendante) et l'autre comme une variable dépendante, alors il s'agit d'une relation de type régression.

Types de régressions :

1) hyperbolique - régression d'une hyperbole équilatérale : y = a + b / x + E ;

2) linéaire - régression utilisée en statistique sous la forme d'une interprétation économique claire de ses paramètres : y = a+b*x+E ;

3) logarithmiquement linéaire - régression de la forme : In y = In a + b * In x + In E

4) multiple - régression entre les variables y et x1, x2 ...xm, c'est-à-dire un modèle de la forme : y = f(x1, x2 ...xm)+E, où y est la variable dépendante (caractéristique résultante), x1 , x2 ...xm - variables explicatives indépendantes (caractéristiques-facteurs), E - perturbation ou variable stochastique, y compris l'influence de facteurs non pris en compte dans le modèle ;

5) non linéaire - régression non linéaire par rapport aux variables explicatives incluses dans l'analyse, mais linéaire par rapport aux paramètres estimés ; ou une régression non linéaire dans les paramètres estimés.

6) inverse - régression réduite à une forme linéaire, implémentée dans des packages d'applications standards de la forme : y = 1/a + b*x+E ;

    apparié - régression entre deux variables y et x, c'est-à-dire un modèle de la forme : y = f (x) + E, où y est la variable dépendante (attribut résultant), x est la variable indépendante et explicative (attribut - facteur) , E - perturbation ou variable stochastique, y compris l'influence de facteurs non pris en compte dans le modèle.

    Séries dynamiques et leurs types

Une série chronologique se compose toujours de 2 éléments : 1) un moment ou une période de temps par rapport auquel des données statistiques sont fournies, 2) un indicateur statistique appelé niveau de la série chronologique.

Selon le contenu de l'indicateur de temps, la série dynamique peut être un moment ou un intervalle

Selon le type d'indicateur statistique, les séries chronologiques sont divisées en séries de valeurs absolues, relatives et moyennes.

Valeurs absolues affichées avec précision

Les indicateurs relatifs montrent les changements dans les poids spécifiques de l'indicateur dans la population totale

Les valeurs moyennes contiennent l'évolution dans le temps de l'indicateur, qui est le niveau moyen du phénomène

    Indicateurs d'une série de dynamiques. Niveau moyen de la série dynamique.

Indicateurs : 1) niveau moyen des séries dynamiques, 2) croissance absolue, chaîne et base, croissance absolue moyenne, 3) croissance et taux de croissance, chaîne et base, croissance moyenne et taux d'incrément, 4) valeurs fmcjk.nyst 1 % augmenter

Dynamique moyenne

Caractéristiques généralisées d'un certain nombre de dynamiques, avec leur aide, l'intensité du développement d'un phénomène est comparée par rapport à différents objets, par exemple par pays, industrie, entreprise

Niveau moyen à l'heure actuelle ui. La méthode de calcul du niveau moyen dépend du type de série (instantané/intervalle) (à intervalles égaux/différents). Si une série d'intervalles de dynamiques de valeurs absolues ou moyennes avec des intervalles de temps égaux est donnée, alors pour calculer le niveau moyen, la formule de calcul de la valeur simple moyenne est utilisée. Si les intervalles de temps de la série d'intervalles sont inégaux, alors le niveau moyen est trouvé à l'aide de la moyenne arithmétique pondérée. Usr=smmUi*Ti/smmTi

25. Augmentation absolue(delta et) est la différence entre deux niveaux d'une série dynamique, qui montre à quel point un niveau donné d'une série dépasse le niveau pris comme base de comparaison. Deltau=Ui-U0

Delta u=Ui-Ui-1

Accélération absolue- la différence entre la croissance absolue pour une période donnée et la croissance absolue pour la période précédente de même durée : Delta et avec la droite = delta et - delta et -1. L'accélération absolue montre à quel point le taux de variation d'un indicateur a augmenté (diminué). L'indicateur d'accélération est utilisé pour les incréments absolus de la chaîne. Une valeur d'accélération négative indique un ralentissement de la croissance ou une accélération de la baisse des niveaux de série.

    Indicateurs de changements relatifs dans les niveaux d'une série de dynamiques.

Taux de croissance (taux de croissance)- c'est le rapport de deux niveaux comparés, qui montre combien de fois ce niveau dépasse le niveau de la période de base. Reflète l'intensité des changements dans les niveaux d'une série de dynamiques et montre combien de fois le niveau a augmenté par rapport au niveau de base, et en cas de diminution, quelle partie du niveau de base est le niveau comparé.

Formule de calcul du taux de croissance : par rapport à une base constante: K je .=y je /y 0 , par rapport à une base variable: K je .=y je /y je -1 .

Taux de croissance est le taux de croissance exprimé en pourcentage :

T R. = À 100 %.

Les taux de croissance pour toute série chronologique sont des indicateurs d'intervalle, c'est-à-dire caractériser une période (intervalle) de temps particulière.

Taux d'augmentation- le montant relatif de la croissance, c'est-à-dire le rapport entre la croissance absolue et le niveau précédent ou de référence. Caractérise de quel pourcentage le niveau d'une période donnée est supérieur (ou inférieur) au niveau de base.

Taux d'augmentation- le rapport entre la croissance absolue et le niveau pris comme base de comparaison :

Tpr=Ui-U0/U0*100 %

Taux d'augmentation- la différence entre le taux de croissance (en pourcentage) et 100,

Tu auras besoin de

  • - séries de distribution à partir de la variable dépendante et indépendante ;
  • - papier, crayon ;
  • - un programme informatique et un tableur.

Instructions

Choisissez-en deux qui, selon vous, entretiennent une relation, généralement celles qui changent avec le temps. Notez qu'une des variables doit être indépendante ; elle agira comme une cause. Le second devrait changer avec lui - diminuer, augmenter ou changer de manière aléatoire.

Mesurez la valeur de la variable dépendante pour chaque variable indépendante. Enregistrez vos résultats dans un tableau, sur deux lignes ou deux colonnes. Pour détecter la présence d'une connexion, au moins 30 lectures sont nécessaires, mais pour un résultat plus précis, assurez-vous qu'il y a au moins 100 points.

Construisez un plan de coordonnées et tracez les valeurs de la variable dépendante sur l'axe des ordonnées et de la variable indépendante sur l'axe des abscisses. Étiquetez les axes et indiquez les unités de mesure pour chaque indicateur.

Marquez les points du champ de corrélation sur le graphique. Sur l'axe des x, recherchez la première valeur de la variable indépendante et sur l'axe des y, recherchez la valeur correspondante de la variable dépendante. Construisez des perpendiculaires à ces projections et trouvez le premier point. Marquez-le, entourez-le avec un crayon doux ou un stylo. Construisez tous les autres points de la même manière.

L'ensemble de points résultant est appelé corrélation champ. Analysez le graphique obtenu, tirez des conclusions sur la présence d'une relation de cause à effet forte ou faible, ou sur son absence.

Veuillez noter des écarts occasionnels par rapport à l'horaire. Si, en général, une relation linéaire ou autre peut être tracée, mais que l'ensemble du « tableau » est gâché par un ou deux points qui sont en dehors de la population générale, ils peuvent être causés par des erreurs aléatoires et ne pas être pris en compte lors de l'interprétation de la situation. graphique.

Si vous avez besoin de construire et d'analyser un champ corrélations Pour de grandes quantités de données, utilisez des tableurs tels qu'Excel ou achetez des programmes spéciaux.

La relation entre plusieurs quantités, au cours de laquelle des changements dans l'une entraînent des changements dans les autres, est appelée corrélation. Elle peut être simple, multiple ou partielle. Ce concept est accepté non seulement en mathématiques, mais aussi en biologie.

Mot corrélation vient du latin correlatio, relation. Tous les phénomènes, événements et objets, ainsi que les grandeurs qui les caractérisent, sont interconnectés. La dépendance de corrélation diffère de la dépendance fonctionnelle en ce sens que dans ce type de dépendance, toute dépendance ne peut être mesurée qu'en moyenne, approximativement. La dépendance de corrélation suppose qu'une valeur variable correspond aux changements d'une valeur indépendante uniquement avec un certain degré de probabilité. Le degré de dépendance est appelé coefficient de corrélation. Le concept de corrélation est la relation entre la structure et les fonctions des différentes parties du corps. corrélation utilisé par les statisticiens. En statistique, il s'agit de la relation entre les quantités statistiques, les séries et les groupes. Pour déterminer la présence, l'absence ou l'existence d'une corrélation, une méthode spéciale est utilisée. La méthode de corrélation est utilisée pour déterminer les changements directs ou inverses des nombres dans les séries comparées. Une fois trouvé, alors la mesure ou le degré de parallélisme lui-même. Mais les facteurs de cause à effet internes ne sont pas découverts de cette manière. La tâche principale des statistiques en tant que science est de détecter de telles dépendances causales pour d'autres sciences. Sous la forme, une relation de corrélation peut être linéaire ou non linéaire, positive et négative. Lorsque, à mesure que l’une des variables augmente ou diminue, l’autre augmente ou diminue également, alors la relation est linéaire. Si, lorsqu'une quantité change, la nature des changements dans une autre est non linéaire, alors cela corrélation non linéaire.Positif corrélation est considéré lorsqu'une augmentation du niveau d'une valeur s'accompagne d'une augmentation du niveau d'une autre. Par exemple, lorsqu'une augmentation du son s'accompagne d'une sensation d'augmentation de sa hauteur, une corrélation lorsqu'une augmentation du niveau d'une variable s'accompagne d'une diminution du niveau d'une autre est dite négative. Dans les communautés, un niveau accru d'anxiété d'un individu entraîne une diminution de la probabilité que cet individu occupe une niche dominante parmi ses semblables. Lorsqu'il n'y a pas de lien entre les variables, corrélation est appelé zéro.

Vidéo sur le sujet

Sources:

  • Corrélation non linéaire en 2019

La corrélation est la dépendance mutuelle de deux variables aléatoires (généralement deux groupes de valeurs), dans laquelle un changement dans l'une d'elles entraîne un changement dans l'autre. Le coefficient de corrélation montre la probabilité que la deuxième valeur change lorsque les valeurs de la première changent, c'est-à-dire le degré de sa dépendance. Le moyen le plus simple de calculer cette valeur consiste à utiliser la fonction correspondante intégrée à l'éditeur de feuille de calcul Microsoft Office Excel.

Tu auras besoin de

  • Éditeur de feuilles de calcul Microsoft Office Excel.

Instructions

Lancez Excel et ouvrez un document contenant des groupes de données entre lesquels vous souhaitez calculer le coefficient de corrélation. Si un tel document n'a pas encore été créé, saisissez les données - l'éditeur de feuille de calcul le crée automatiquement lorsque vous démarrez le programme. Saisissez chacun des groupes de valeurs dont la corrélation vous intéresse dans une colonne distincte. Il n'est pas nécessaire qu'il s'agisse de colonnes adjacentes ; vous êtes libre de concevoir le tableau de la manière la plus pratique : ajoutez des colonnes supplémentaires avec des explications sur les données, des en-têtes de colonnes, des cellules récapitulatives avec des valeurs totales ou moyennes, etc. Vous pouvez même organiser les données non pas dans le sens vertical (en colonnes), mais dans le sens horizontal (en lignes). La seule condition à remplir est que les cellules contenant les données de chaque groupe soient situées séquentiellement les unes après les autres, afin de créer ainsi un tableau continu.

Accédez à la cellule qui doit contenir la valeur de corrélation des données des deux tableaux, et cliquez sur l'onglet « Formules » dans le menu Excel. Dans le groupe de commandes "Bibliothèque de fonctions", cliquez sur l'icône la plus récente - "Plus de fonctions". Une liste déroulante s'ouvrira dans laquelle vous devrez vous rendre dans la section « Statistiques » et sélectionner la fonction CORREL. En conséquence, la fenêtre Assistant de fonction s'ouvrira avec un formulaire à remplir. La même fenêtre peut être appelée sans l'onglet « Formules » en cliquant simplement sur l'icône d'insertion de fonction située à gauche de la barre de formule.

Spécifiez le premier groupe de données en corrélation dans le champ Array1 de l'assistant de formule. Pour saisir manuellement une plage de cellules, saisissez l'adresse de la première et de la dernière cellule, en les séparant par deux points (sans espaces). Une autre option consiste simplement à sélectionner la plage souhaitée avec la souris, et Excel placera lui-même l'entrée souhaitée dans ce champ de formulaire. La même opération doit être effectuée avec le deuxième groupe de données dans le champ « Array2 ».

Cliquez sur OK. L'éditeur de feuille de calcul calculera et affichera la valeur de corrélation dans la cellule avec la formule. Si nécessaire, vous pouvez enregistrer ce document pour une utilisation ultérieure (raccourci clavier Ctrl + S).

Nous construisons un champ de corrélation pour les composantes principales et associées. Sur l'axe des abscisses nous traçons le contenu du composant principal, en l'occurrence Hg, et sur l'axe des ordonnées nous traçons le contenu du composant associé, c'est-à-dire Sn.

Pour faire une évaluation préliminaire de la force de la connexion dans le champ de corrélation, il est nécessaire de tracer des lignes correspondant aux valeurs médianes des composants principaux et associés, divisant le champ en quatre carrés.

Une mesure quantitative de la force d’une connexion est le coefficient de corrélation. Son estimation approximative est calculée à l'aide de la formule :

où n1 est le nombre total de points en I et III, n2 = le nombre total de points en II et IV.

I = 4 II = 8 III = 7 IV = 5

Ensuite, à l'aide des données initiales calculées par ordinateur (Хср, Yср, variances Dx, Dy et leur covariance cov(x,y)), nous calculons la valeur du coefficient de corrélation r et les paramètres des équations de régression linéaire des valeurs associées. composant par le composant principal et le composant principal par le composant associé.

Nous calculons à l'aide des formules suivantes :

Donnée initiale:

cov(x, y) = 163,86

r = cov(x, y)/√Dx * Dy = 163,86/√157,27* 645,61= 0,51

b = cov(x, y)/Dx = 163,86/157,27= 1,04

a = Yamoy – b * Xavg = 153,13– (-0,08) * 36,75 = 150,19

d = cov(x, y)/Dy = 163,86/645,61= 0,25

c = Хср – d * Yср = 36,75– (0,25) * 153,13= -1,5

y =150,19+1,04x x = -1,5+0,25y

Nous construisons des droites de régression sur le champ de corrélation.

Étape 7. Test de l'hypothèse sur la présence d'une relation de corrélation

Le test de l'hypothèse de présence d'une corrélation repose sur le fait que pour une variable aléatoire bidimensionnelle normalement distribuée X, Y, en l'absence de corrélation entre x et y, le coefficient de corrélation est « 0 ». Pour tester l'hypothèse d'absence de corrélation, il faut calculer la valeur du critère :

t = r * √(N – 2)/√(1 – r2) = 0,51* √(24-2)/√(1 – (0,51) 2) = 2,65

Pour nos valeurs t = 2,65

Valeur du tableau ttab = 2,02

Étant donné que la valeur t calculée dépasse la valeur du tableau, l’hypothèse d’absence de corrélation est rejetée. Il y a un lien.

Étape 8. Construction de droites de régression empiriques. Calcul du rapport de corrélation

Les données sélectionnées sont regroupées en classes en fonction des valeurs de contenu du composant principal, en l'occurrence Hg. Pour ce faire, toute la plage de valeurs depuis le contenu minimum du principal composant utile jusqu'au contenu maximum est divisée en 6 intervalles. Pour chaque intervalle :

    Le nombre de valeurs entrant dans cet intervalle n(i) est déterminé

    Le nombre de valeurs de contenu des composants associées correspondant aux valeurs des composants principaux (y(I, av)) est calculé et ce nombre est divisé par n(i)

Tableau 3

Limite d'intervalle

Nous construisons une droite de régression empirique sur le champ de corrélation.

dtotal = √Dy = 25,4

condition = /N = 66,14

La valeur du rapport de corrélation de la composante associée au r principal est calculée à l'aide de la formule :

r = dcondition/ dtotal = 66,14/25,4 = 2,6

Pour l'étude expérimentale des dépendances entre variables aléatoires x et y réaliser un certain nombre d'expériences indépendantes. Résultat je- l'expérience donne une paire de valeurs (x r, y g), je = 1, 2,..., P.

Les grandeurs caractérisant diverses propriétés des objets peuvent être indépendantes ou interdépendantes. Les formes de manifestation des relations sont très diverses. Les deux types les plus courants sont les connexions fonctionnelles (complètes) et de corrélation (incomplètes).

Lorsque deux quantités dépendent fonctionnellement de la valeur de l'une -xh correspond nécessairement à une ou plusieurs valeurs précisément définies d'une autre grandeur -y ( . Assez souvent, des connexions fonctionnelles apparaissent en physique et en chimie. Dans des situations réelles, il existe un nombre infini de propriétés de l'objet lui-même et de l'environnement extérieur qui s'influencent mutuellement, ce type de connexion n'existe donc pas, en d'autres termes, les connexions fonctionnelles sont des abstractions mathématiques.

L'influence de facteurs généraux et la présence de modèles objectifs dans le comportement des objets ne conduisent qu'à la manifestation d'une dépendance statistique. La statistique est une dépendance dans laquelle un changement dans l'une des quantités entraîne un changement dans la distribution des autres (une autre), et ces autres quantités prennent certaines valeurs avec certaines probabilités. Dans ce cas, la dépendance fonctionnelle doit être considérée comme un cas particulier de dépendance statistique : la valeur d'un facteur correspond aux valeurs d'autres facteurs avec une probabilité égale à un. Un cas particulier plus important de dépendance statistique est la dépendance de corrélation, qui caractérise la relation entre les valeurs de certaines variables aléatoires et la valeur moyenne d'autres, bien que dans chaque cas individuel, toute valeur interdépendante puisse prendre des valeurs différentes.

Une relation de corrélation (qu'on appelle aussi incomplète, ou statistique) apparaît en moyenne, pour des observations de masse, lorsque les valeurs données de la variable dépendante correspondent à un certain nombre de valeurs probables de la variable indépendante. Explication - la complexité des relations entre les facteurs analysés, dont l'interaction est influencée par des variables aléatoires non prises en compte. Le lien entre les signes n’apparaît donc qu’en moyenne, dans la masse des cas. Dans une relation de corrélation, chaque valeur d'argument correspond à des valeurs de fonction réparties aléatoirement dans un certain intervalle.

Le terme « corrélation » a été utilisé pour la première fois par le paléontologue français J. Cuvier, qui a dérivé la « loi de corrélation des parties et organes des animaux » (cette loi permet de reconstruire l'apparence de l'animal entier à partir de parties du corps trouvées). . Ce terme a été introduit dans les statistiques par le biologiste et statisticien anglais F. Galton (pas seulement une relation, mais « comme une connexion » - corélation).

Les dépendances de corrélation se retrouvent partout. Par exemple, en agriculture, cela pourrait être la relation entre le rendement et la quantité d’engrais appliquée. Bien évidemment, ces derniers participent à la formation de la récolte. Mais pour chaque champ ou parcelle spécifique, la même quantité d'engrais appliquée entraînera une augmentation différente du rendement, car un certain nombre d'autres facteurs interagissent (météo, état du sol, etc.), qui forment le résultat final. Cependant, en moyenne, une telle relation est observée: une augmentation de la masse d'engrais appliqués entraîne une augmentation du rendement.

La méthode la plus simple pour identifier les liens entre les caractéristiques étudiées consiste à construire un tableau de corrélation ; sa représentation visuelle est le champ de corrélation. C'est un graphique où les valeurs jq sont tracées sur l'axe des abscisses, et le long de l'axe des ordonnées oui x. Par la localisation des points et leur concentration dans une certaine direction, on peut juger qualitativement de la présence d'une connexion.

Riz. 7.3.

Une corrélation positive entre variables aléatoires, proche d’une corrélation fonctionnelle parabolique, est montrée sur la Fig. 6.1 , UN. En figue. 6.1, b montre un exemple de faible corrélation négative, et sur la Fig. 6.1, V- un exemple de variables aléatoires pratiquement non corrélées. La corrélation est forte si la dépendance « peut être représentée » sur le graphique par une droite (de pente positive ou négative).

Il existe deux types dépendances entre phénomènes économiques: fonctionnel et statistique. Relation entre deux quantités X Et Oui, reflétant respectivement deux phénomènes, est appelé fonctionnel, si chaque valeur de la quantité x correspond à une seule valeur de la quantité Oui et vice versa. Un exemple de lien fonctionnel en économie est la dépendance de la productivité du travail sur le volume de produits fabriqués et le coût du temps de travail. Il convient de noter que si X est une quantité déterministe et non aléatoire, alors une quantité qui en dépend fonctionnellement Oui est également déterministe. Si X est une valeur aléatoire, alors Oui aussi une variable aléatoire.

Cependant, bien plus souvent en économie, il n'y a pas de fonction, mais dépendance statistique, lorsque chaque valeur fixe est une variable indépendante X correspond non pas à une, mais à plusieurs valeurs de la variable dépendante Y, et il est impossible de dire à l'avance quelle valeur elle prendra Oui. Cela est dû au fait que sur Oui sauf variable X De nombreux facteurs aléatoires incontrôlés influencent également. Dans cette situation Oui est une variable aléatoire, et la variable X peut être soit déterministe, soit aléatoire.

Un cas particulier de dépendance statistique est dépendance de corrélation, dans lequel les facteurs sont liés par une dépendance fonctionnelle X et la valeur moyenne (espérance mathématique) de l'indicateur effectif Oui. La dépendance statistique ne peut être révélée qu'à partir des résultats d'un nombre suffisamment important d'observations. Graphiquement, la dépendance statistique de deux caractéristiques peut être représentée à l'aide d'un champ de corrélation, une fois construit, la valeur de la caractéristique factorielle est tracée sur l'axe des abscisses X, et le long de l’axe des ordonnées – la résultante Oui.

Corrélation– un cas particulier de relation statistique dans laquelle différentes valeurs d'une variable correspondent à différentes valeurs moyennes d'une autre variable. La corrélation suppose que les variables étudiées ont une expression quantitative.

Si la relation entre deux traits est étudiée, il existe une corrélation par paire ; si la relation entre de nombreuses caractéristiques est étudiée - corrélation multiple.

A titre d'exemple sur la Fig.

1 présente des données illustrant la relation directe entre X Et à(Fig. 1, a) et relation inverse (Fig. 1, b). Dans le cas « a », il s’agit d’une relation directe entre, par exemple, le revenu moyen par habitant ( X) et l'épargne ( à) dans la famille. Dans le cas «b», nous parlons d'une relation inverse. Ceci est notre exemple, la relation entre la productivité du travail ( X) et le coût unitaire de production ( à). En figue. 1 chaque personnage de point étudie l'objet d'observation avec ses propres valeurs X Et à.

Riz. 1. Champ de corrélation

En figue. La figure 1 montre également des droites, des équations de régression linéaire de type caractérisant la relation fonctionnelle entre la variable indépendante X et la valeur moyenne de l'indicateur effectif à. Ainsi, selon l’équation de régression, sachant X, seule la valeur moyenne peut être restituée à.



Avez-vous aimé l'article? Partage avec tes amis!