La composante aléatoire de l’équation de tendance est : Ligne de tendance exponentielle

Calculs statistiques de la teneur en humidité

test

2. Équation de tendance basée sur une dépendance linéaire.

2.1. Éléments de base d'une série chronologique.

Vous pouvez créer un modèle économétrique à l'aide de deux types de données d'entrée :

Données caractérisant une collection d’objets différents à un moment donné.

Données caractérisant un objet pendant un certain nombre d'instants successifs dans le temps.

Les modèles construits à partir de données du premier type sont appelés spatiaux. Les modèles construits sur la base du deuxième type de données sont appelés séries chronologiques.

Une série chronologique est un ensemble de valeurs de n'importe quel indicateur pour plusieurs moments ou périodes de temps consécutifs. Chaque niveau d'une série chronologique se forme sous l'influence d'un grand nombre de facteurs, qui peuvent être divisés en trois groupes :

Facteurs qui façonnent la tendance de la série.

Facteurs qui forment des fluctuations cycliques dans la série.

Facteurs aléatoires.

Avec différentes combinaisons de ces facteurs dans le phénomène ou le processus étudié, la dépendance des niveaux de la série au temps peut prendre différentes formes.

Premièrement, la plupart des séries chronologiques d'indicateurs économiques ont une tendance qui caractérise l'impact cumulatif à long terme de nombreux facteurs sur la dynamique de l'indicateur étudié. Il est évident que ces facteurs, pris séparément, peuvent avoir un impact multidirectionnel sur l’indicateur étudié. Cependant, ensemble, ils forment une tendance à la hausse ou à la baisse. Sur la fig. 1. montre une série chronologique contenant une tendance croissante.

Deuxièmement, l'indicateur étudié peut être soumis à des fluctuations cycliques. Ces fluctuations peuvent être saisonnières, puisque l'activité économique de plusieurs secteurs économiques dépend de la période de l'année. Si de grandes quantités de données sont disponibles sur de longues périodes, il est possible d'identifier des fluctuations cycliques associées à la dynamique générale des conditions de marché, ainsi qu'à la phase du cycle économique dans laquelle se situe l'économie du pays. Sur la fig. 2. une série chronologique contenant uniquement la composante saisonnière est présentée.

Certaines séries chronologiques ne contiennent pas de tendance ou de composante cyclique, et chaque niveau suivant est basé sur la somme du niveau moyen de la série et d'une composante aléatoire. Un exemple de série contenant uniquement une composante aléatoire est présenté sur la figure. 3.

De toute évidence, les données réelles ne découlent entièrement d’aucun des modèles décrits. Le plus souvent, ils contiennent les trois composants. Chaque niveau se forme sous l'influence de tendances, de fluctuations saisonnières et d'une composante aléatoire.

Dans la plupart des cas, le niveau réel d’une série chronologique peut être représenté comme la somme ou le produit de composantes tendancielles, cycliques et aléatoires. Un modèle dans lequel une série chronologique est présentée comme la somme des composants répertoriés est appelé modèle additif. Un modèle dans lequel une série chronologique est présentée comme le produit des composants répertoriés est appelé modèle multiplicatif.

2.2. Autocorrélation des niveaux de séries chronologiques.

S'il existe une tendance et des fluctuations cycliques dans une série chronologique, les valeurs de chaque niveau suivant de la série dépendent des précédentes. La corrélation entre les niveaux successifs d’une série temporelle est appelée autocorrélation. Elle peut être mesurée quantitativement à l'aide d'un coefficient de corrélation linéaire entre les niveaux de la série temporelle d'origine et les niveaux de cette série décalés dans le temps.

L'une des formules de travail pour calculer le coefficient de corrélation est la suivante :

rxy = (xj - x) * (ouij - oui) .

(x j -x) 2 * (y j -y) 2

Comme variable x nous considérerons la série y 2, y 3, ... y t ; Comme variable y, considérons la série y 1, y 2, ... y t -1. Alors cette formule prendra la forme :

r 1 = (oui t - oui 1 ) * (o t-1 - oui 2 ) ; où oui 1 = oui t ; oui 2 = oui t-1 .

(y t -y 1) 2 * (y t-1 -y 2) 2 n - 1 n - 1

Cette quantité est appelée coefficient d’autocorrélation des niveaux de séries du premier ordre. Le nombre de périodes pour lesquelles le coefficient d'autocorrélation est calculé est appelé décalage. À mesure que le décalage augmente, le nombre de paires de valeurs à partir desquelles le coefficient d'autocorrélation est calculé diminue.

Propriétés du coefficient d'autocorrélation :

Premièrement, il est construit par analogie avec le coefficient de corrélation linéaire et caractérise ainsi la proximité de la seule relation linéaire entre les niveaux actuels et précédents de la série. Par conséquent, grâce au coefficient d'autocorrélation, on peut juger de la présence d'une tendance linéaire.

Deuxièmement, sur la base du signe du coefficient d'autocorrélation, on ne peut pas conclure à une tendance à la hausse ou à la baisse des niveaux de la série.

La séquence des coefficients d'autocorrélation des premier, deuxième, etc. niveaux. Les commandes sont appelées fonctions d’autocorrélation des séries chronologiques. Un graphique de la dépendance de ses valeurs à la valeur de décalage est appelé corrélogramme. L'analyse de la fonction d'autocorrélation et du corrélogramme nous permet de déterminer le décalage avec lequel l'autocorrélation est la plus élevée et, par conséquent, le décalage avec lequel la connexion entre les niveaux actuels et précédents de la série est la plus étroite, c'est-à-dire En analysant la fonction d'autocorrélation et le corrélogramme, la structure de la série peut être identifiée.

Si le coefficient d'autocorrélation du premier ordre s'avère le plus élevé, la série étudiée ne contient qu'une tendance. Si le coefficient d'autocorrélation le plus élevé est d'ordre t, la série contient des fluctuations cycliques avec une périodicité à t moments dans le temps. Si aucun des coefficients d'autocorrélation n'est significatif, nous pouvons conclure que soit la série ne contient pas de tendance ni de fluctuations cycliques, soit la série contient une forte tendance non linéaire, qui nécessite une analyse supplémentaire pour être identifiée.

2.3. Modélisation des tendances des séries chronologiques.

L'une des façons les plus courantes de modéliser la tendance d'une série chronologique consiste à construire une fonction analytique qui caractérise la dépendance des niveaux de la série au temps ou à la tendance. Cette méthode est appelée alignement analytique des séries chronologiques.

Parce que La dépendance au temps peut prendre différentes formes ; pour la formaliser, vous pouvez utiliser différents types de fonctions. Les fonctions suivantes sont le plus souvent utilisées pour créer des tendances :

Tendance linéaire : y t = a + b*t ;

Hyperbole : y t = a + b/t ;

Tendance exponentielle : y t = e a + b * t ;

Tendance sous forme de fonction puissance : y t = a*t ;

Parabole : y t = a + b 1 *t + b 2 *t 2 + ... + b k *t k ;

Les paramètres de chacune de ces tendances peuvent être déterminés par la méthode des moindres carrés, en utilisant le temps t = 1, 2, ..., n comme variable indépendante et les niveaux réels de la série chronologique y t comme variable dépendante. Pour les tendances non linéaires, une procédure standard de linéarisation est d'abord effectuée.

Il existe plusieurs façons de déterminer le type de tendance. Les méthodes les plus courantes comprennent l'analyse qualitative du processus étudié, la construction et l'analyse visuelle d'un graphique de la dépendance des niveaux de série au temps et le calcul de certains indicateurs de base de la dynamique. Aux mêmes fins, les coefficients d’autocorrélation des niveaux de séries peuvent être utilisés. Le type de tendance peut être déterminé en comparant les coefficients d'autocorrélation de premier ordre calculés à partir des niveaux d'origine et transformés de la série. Si une série chronologique a une tendance linéaire, alors ses niveaux voisins y t et y t -1 sont étroitement corrélés. Dans ce cas, le coefficient d’autocorrélation du premier ordre des niveaux de la série originale doit être élevé. Si la série chronologique contient une tendance non linéaire, par exemple sous la forme d'une exponentielle, alors le coefficient d'autocorrélation de premier ordre basé sur les logarithmes des niveaux de la série d'origine sera supérieur au coefficient correspondant calculé à partir des niveaux de la série temporelle. série. Plus la tendance non linéaire est prononcée dans la série chronologique étudiée, plus les valeurs des coefficients indiqués différeront.

La sélection de la meilleure équation si la série contient une tendance non linéaire peut être effectuée en recherchant parmi les principales formes de tendance, en calculant le coefficient de détermination ajusté R pour chaque équation et en sélectionnant l'équation de tendance avec la valeur maximale du coefficient de détermination ajusté.

Des valeurs élevées des coefficients d'autocorrélation des premier, deuxième et troisième ordres indiquent que la série contient une tendance. Des valeurs à peu près égales des coefficients d'autocorrélation pour les niveaux de cette série et pour les logarithmes des niveaux permettent de tirer la conclusion suivante : si la série contient une tendance non linéaire, alors elle s'exprime sous forme implicite. Par conséquent, pour modéliser sa tendance, il est également conseillé d'utiliser des fonctions linéaires et non linéaires, par exemple une puissance ou une tendance exponentielle. Pour identifier la meilleure équation de tendance, il est nécessaire de déterminer les paramètres des principaux types de tendances.

Les paramètres des tendances linéaires et exponentielles ont l'interprétation économique la plus simple. Paramètres de tendance linéaire :

a est le niveau initial de la série chronologique au temps t = 0 ;

b est l’augmentation absolue moyenne des niveaux de la série sur la période.

Les valeurs des niveaux de séries chronologiques calculées à l'aide d'une tendance linéaire sont déterminées de deux manières. Tout d'abord, vous pouvez remplacer séquentiellement les valeurs t = 1, 2, ..., n dans l'équation de tendance trouvée. Deuxièmement, conformément à l'interprétation des paramètres de tendance linéaire, chaque niveau suivant de la série est la somme du niveau précédent et de l'augmentation absolue moyenne de la chaîne.

Tâche n°1

Dix personnes d'âges différents ont les paramètres suivants :

1. Déterminez le signe effectif.

Calculons la dépendance de la taille à l'âge :

Facteur (X) : âge.

Caractéristique résultante (Y) : croissance.

a*x + b*x 2 = x*y

10*a + 248*b = 1812

248*a + 6492*b = 45023

une = 1812 - 248*b => 1812 - 248*b*248 + 6492*b = 45023

r = x*y - ( x* o)/n = 45023 - (248*1812)/10 =>

(x 2 - (x) 2 /n)*(y 2 - (y) 2 /n) (6492 - 248 2 /10)*(328444 - 1812 2 /10)

r = 0,44 - connexion directe modérée

r 2 = 0,19 - la croissance de 19 % dépend de l'âge

Test de Fisher :

F cp = r 2 * (n-2)

F cp = 0.19 * (10 - 2) = 1.78

Tableau F = 5,32

FCP< F табл =>

Calculons la dépendance du poids en fonction de l'âge :

Facteur (X) : âge.

Déterminons les paramètres de la fonction linéaire à l'aide du système d'équations :

a*x + b*x 2 = x*y

10*a + 248*b = 753

248*a + 6492*b = 18856

une = 753 - 248*b => 1812 - 248*b*248 + 6492*b = 18856

r = x*y - ( x* o)/n = 18856 - (248*753)/10 =>

(x 2 - (x) 2 /n)*(y 2 - (y) 2 /n) (6492 - 248 2 /10)*(56967 - 753 2 /10)

r = 0,6 - connexion directe notable

r 2 = 0,36 - le poids dépend à 36 % de l'âge

Test de Fisher :

F cp = r 2 * (n-2)

F cp = 0.36 * (10 - 2) = 4.5

Tableau F = 5,32

FCP< F табл =>l'hypothèse nulle était confirmée, l'équation était statistiquement non significative.

Calculons la relation entre le poids et la taille :

Facteur (X) : croissance.

Attribut résultant (Y) : poids.

Déterminons les paramètres de la fonction linéaire à l'aide du système d'équations :

a*x + b*x 2 = x*y

10*a + 1812*b = 753

1812*a + 328444*b = 136562

une = 753 - 1812*b => 753 - 1812*b*1812 + 328444*b = 136562

r = x*y - ( x* o)/n = 136562 - (1812*753)/10 =>

(x 2 - (x) 2 /n)*(y 2 - (y) 2 /n) (328444 - 1812 2 /10)*(56967 - 753 2 /10)

r = 0,69 - connexion directe notable

r 2 = 0,47 - le poids dépend à 47 % de la taille

x = 1812/10 = 181,2

Test de Fisher :

F cp = r 2 * (n-2)

F cp = 0.47 * (10 - 2) = 7.1

Tableau F = 5,32

F cp > F table => l'hypothèse nulle n'a pas été confirmée, l'équation a un sens économique.

Test t de l'étudiant :

Calculons les erreurs aléatoires :

.

m une = (o - ox ) 2 * x 2 .

n - 2 n*(x -x) 2

m b = (o - ox ) 2 / (n-2)

m r = 1 - r 2

m une = 138.19 * 328444 = 72

m b = 138.19 / (10 - 2) = 1

m r = 1 - 0.47 = 0.26

t a = a/m a = 120/72 = 1,67

t b = b/m b = 1,08/1 = 1,08

t r = r/m r = 0,69/0,26 = 2,65

tableau t = 2,3

Pour calculer l'intervalle de confiance, on calcule l'erreur maximale :

a = t tableau - t a = 2,3 - 1,67 = 0,63

b = t tableau - t b = 2,3 - 1,08 = 1,22

r = t tableau - t r = 2,3 - 2,65 = -0,35

Calculons les intervalles de confiance :

une = une une = -121,03 119,77

b = b b = -0,14 2,3

r = r r = 0,34 1,04

Tâche n°2

Lors d'une vérification par échantillon de contrôle du pourcentage d'humidité du sol des exploitations agricoles de la région, les données suivantes ont été obtenues :

1. Avec une probabilité de 0,95 et 0,99, définissez la limite dans laquelle se situe le pourcentage moyen de teneur en humidité.

2. Tirez des conclusions.

Moyenne générale : x = x = 31.1 = 3.8875

Écart général : 2 = (x - x) 2 = 1.8875 = 0.1261

n° 8 .

Erreur type quadratique moyenne : x = 2 = 0.1261 = 0.126

Erreur marginale d'échantillonnage : x = t* x

À partir du tableau des valeurs du test t de Student :

Pour une probabilité de 0,95, l’erreur d’échantillonnage maximale est :

x = 2,4469*0,126 = 0,308

Pour une probabilité de 0,99, l’erreur d’échantillonnage maximale est :

x = 3,7074*0,126 = 0,467

Intervalles de confiance :

Limite du pourcentage moyen d'humidité avec probabilité 0,95 :

Exposant central supérieur d'un système linéaire

Soit le système (2) donné et sa solution. Considérons une famille de fonctions, Définition 5 : Une fonction R(t) est dite supérieure pour le système (2) si elle est bornée, mesurable et évalue, Où est la norme de la matrice de Cauchy du système linéaire...

Calcul différentiel

Sur la base de la définition de la dérivée, nous formulons la règle suivante pour trouver la dérivée d'une fonction en un point : Pour calculer la dérivée de la fonction f(x) au point x0, vous devez : 1) Trouver f(x ) -f(x0); 2) créer une relation de différence ; 3) calculer la limite...

Calcul différentiel

Basé sur la définition de la dérivée...

Sous-groupes invariants de groupes biprimaires

La note (1) corrige une erreur commise par Burnside dans l'article (2). A savoir, dans (3) il est prouvé qu'un groupe d'ordre, où et sont des nombres premiers distincts et, soit possède un -sous-groupe d'ordre caractéristique...

Utiliser une technologie informatique et des logiciels modernes pour résoudre un problème appliqué issu de la pratique de l'ingénierie et du forage

Connaissant les valeurs des coefficients a0, a1 et a2, vous pouvez trouver les valeurs de y` à l'aide de la formule, dans notre cas. La différence entre les données expérimentales et théoriques est faible. Les données obtenues nous permettent de trouver une relation, 5...

Complexité linéaire des séquences cyclotomiques

Soit la séquence du quatrième ordre, c'est-à-dire qu'alors, selon le lemme 1.1, elle est formée selon la règle : (2.1) Notez que la règle (2.1) spécifie une séquence uniquement lorsque...

Modèle mathématique d'un appareil numérique pour le jeu "Tic-tac-toe" avec une personne

Le terrain de jeu d'un jeu de tic-tac-toe peut être représenté comme une grille composée de lignes et de colonnes. Chaque élément de la grille peut être dans trois états : vide (initial), marqué d'une croix, marqué d'un zéro...

Méthodes de découpage

Parmi un ensemble de n objets indivisibles, dont chacun i (i = 1,2,..., p) possède le i-ième indicateur caractéristique et utilité, trouvez un ensemble qui permet de maximiser l'efficacité d'utilisation des ressources du valeur...

Solution approximative d'équations algébriques et transcendantales. La méthode de Newton

Les informations sur les approximations précédentes de la racine sont utilisées pour trouver des approximations ultérieures non seulement dans la méthode tangente. À titre d'exemple d'une autre méthode de ce type, nous donnerons la méthode...

Calculs statistiques de la teneur en humidité

Tâches pratiques : 1. Dix personnes d'âges différents ont les paramètres suivants : Âge, années 18 20 21 22 22 24 25 26 31 39 Taille, cm 174 183 182 180 178 179 185 185 184 182 Poids, kg 65 73 69 74 77 75 78 8 4 79 79 1...

Les courbes de croissance qui décrivent les schémas d'évolution des phénomènes au fil du temps sont le résultat d'un alignement analytique des séries chronologiques. L'alignement d'une série à l'aide de certaines fonctions s'avère dans la plupart des cas être un moyen pratique de décrire des données empiriques. Cet outil, si un certain nombre de conditions sont remplies, peut également être utilisé à des fins de prévision. Le processus de mise à niveau comprend les étapes principales suivantes :

Sélectionner le type de courbe dont la forme correspond à la nature de l'évolution de la série temporelle ;

Détermination des valeurs numériques (estimation) des paramètres de courbe ;

Contrôle qualité a posteriori de la tendance sélectionnée.

Dans les PPP modernes, toutes les étapes répertoriées sont mises en œuvre simultanément, généralement dans le cadre d'une seule procédure.

Le lissage analytique utilisant l'une ou l'autre fonction permet d'obtenir des valeurs nivelées, ou, comme on les appelle parfois à tort, théoriques des niveaux d'une série temporelle, c'est-à-dire des niveaux qui seraient observés si la dynamique du phénomène coïncidait complètement avec la courbe. La même fonction, avec ou sans ajustement, est utilisée comme modèle pour l'extrapolation (prévision).

La question du choix du type de courbe est la principale lors de l’alignement d’une série. Toutes choses égales par ailleurs, une erreur dans la résolution de cette question s'avère plus importante dans ses conséquences (notamment pour la prévision) qu'une erreur liée à l'estimation statistique des paramètres.

Puisque la forme d'une tendance existe objectivement, pour l'identifier, il faut partir de la nature matérielle du phénomène étudié, en examinant les raisons internes de son développement, ainsi que les conditions et facteurs externes qui l'influencent. Ce n'est qu'après une analyse approfondie et significative que l'on peut procéder à l'utilisation de techniques spéciales développées par les statistiques.

Une technique très courante pour identifier la forme d’une tendance est la représentation graphique d’une série chronologique. Mais en même temps, l’influence du facteur subjectif est grande, même lors de l’affichage de niveaux nivelés.

Les méthodes les plus fiables pour sélectionner une équation de tendance reposent sur les propriétés des différentes courbes utilisées dans l’alignement analytique. Cette approche permet de relier le type de tendance à certaines propriétés qualitatives de l'évolution du phénomène. Il nous semble que dans la plupart des cas, une méthode pratiquement acceptable est celle qui repose sur la comparaison des caractéristiques de l'évolution des taux de croissance de la série dynamique étudiée avec les caractéristiques correspondantes des courbes de croissance. Pour l'alignement, la courbe dont la loi d'évolution de la croissance est la plus proche de la loi d'évolution des données réelles est sélectionnée.

Lors du choix de la forme de la courbe, une autre circonstance doit être prise en compte. Augmenter la complexité de la courbe dans un certain nombre de cas peut en effet augmenter la précision de la description de la tendance dans le passé, cependant, du fait que les courbes plus complexes contiennent plus de paramètres et des puissances plus élevées de la variable indépendante, leurs intervalles de confiance seront, en général, nettement plus larges que celles des courbes plus simples pour la même période de avance.

De nos jours, où l'utilisation de programmes spéciaux permet sans trop d'effort de construire simultanément plusieurs types d'équations, des critères statistiques formels sont largement utilisés pour déterminer la meilleure équation de tendance.

De ce qui précède, apparemment, nous pouvons conclure que le choix de la forme d'une courbe pour le nivellement est une tâche qui ne peut être résolue de manière unique, mais revient à obtenir un certain nombre d'alternatives. Le choix final ne peut pas se situer dans le domaine de l'analyse formelle, surtout si, en utilisant le nivellement, elle est censée non seulement décrire statistiquement le modèle de comportement de niveau dans le passé, mais aussi extrapoler le modèle trouvé dans le futur. Dans le même temps, diverses techniques statistiques de traitement des données d'observation peuvent présenter un avantage significatif ; au moins avec leur aide, il est possible de rejeter des options manifestement inadaptées et ainsi de limiter considérablement le champ de choix.

Considérons les types d'équations de tendance les plus utilisés :

1. Forme de tendance linéaire :

où est le niveau de ligne obtenu à la suite de l'alignement en ligne droite ; – niveau de tendance initial ; – augmentation moyenne absolue, tendance constante.

La forme linéaire de la tendance est caractérisée par l'égalité des différences dites premières (augmentations absolues) et des différences de zéro seconde, c'est-à-dire l'accélération.

2. Forme de tendance parabolique (polynôme du 2e degré) :

(3.6)

Pour ce type de courbe, les deuxièmes différences (accélération) sont constantes, et les troisièmes différences sont nulles.

La forme parabolique de la tendance correspond à une évolution accélérée ou lente des niveaux de la série à accélération constante. Si< 0 и >0, alors la parabole quadratique a un maximum si > 0 et< 0 – минимум. Для отыскания экстремума первую производную параболы по tégal à 0 et résoudre l’équation de t.

3. Forme de tendance logarithmique :

, (3.7)

où est la tendance constante.

Une tendance logarithmique peut décrire une tendance qui se manifeste par un ralentissement de la croissance des niveaux d'une série de dynamiques en l'absence d'une valeur maximale possible. Quand assez grand t la courbe logarithmique devient impossible à distinguer d'une ligne droite.

4. Forme de tendance multiplicative (puissance) :

(3.8)

5. Polynôme du 3ème degré :

Naturellement, il existe de nombreuses autres courbes décrivant les principales tendances. Cependant, le format du manuel ne permet pas d'en décrire toute la diversité. Les techniques de construction de modèles présentées ci-dessous permettront à l'utilisateur d'utiliser indépendamment d'autres fonctions, notamment inverses.

Pour résoudre le problème de lissage analytique des séries chronologiques dans le système STATISTICA, nous devrons créer une variable supplémentaire sur la feuille avec les données initiales de la variable « VG2001-2010 », qui devra être rendue active.

Nous devons construire une équation de tendance, qui est essentiellement une équation de régression dans laquelle le « temps » est un facteur. Nous créons une variable « T » contenant des intervalles de temps de 10 ans (de 2001 à 2010). La variable "T" sera composée de nombres naturels de 1 à 10, correspondant aux années spécifiées.

Le résultat est la feuille de travail suivante (Fig. 3.6)

Riz. 3.6. Feuille de calcul avec variable de temps créée

Ensuite, nous considérerons une procédure qui nous permet de construire des modèles de régression de types linéaires et non linéaires. Pour ce faire, choisissez : Statistiques/Modèles linéaires/non linéaires avancés/Estimation non linéaire (Fig. 3.7). Dans la fenêtre qui apparaît (Fig. 3.8), sélectionnez la fonction Régression spécifiée par l'utilisateur, moindres carrés (construction manuelle de modèles de régression par l'utilisateur, les paramètres d'équation sont trouvés à l'aide de la méthode des moindres carrés (LSM)).

Dans la boîte de dialogue suivante (Fig. 3.9), cliquez sur le bouton Fonction à estimer pour accéder à l'écran de spécification manuelle du modèle (Fig. 3.10).

Riz. 3.7. Exécuter une procédure Statistiques/Linéaire avancé/

Modèles non linéaires/estimation non linéaire

Riz. 3.8. Fenêtre de procédure Estimation non linéaire

Riz. 3.9 Fenêtre de procédure Régression spécifiée par l'utilisateur, moindres carrés

Riz. 3.10. Fenêtre de mise en œuvre de la procédure

spécification manuelle de l'équation de tendance

En haut de l'écran se trouve un champ pour saisir une fonction, en bas se trouvent des exemples de saisie de fonctions pour diverses situations.

Avant de former les modèles qui nous intéressent, il est nécessaire de clarifier certaines conventions. Les variables d'équation sont spécifiées au format " v№", où " v» désigne une variable ( de l'anglais « variable"), et "Non" est le numéro de la colonne dans laquelle il se trouve dans le tableau de la feuille de calcul contenant les données source. S'il y a beaucoup de variables, alors il y a un bouton à droite Examiner les variables , permettant de les sélectionner dans la liste par nom et de visualiser leurs paramètres à l'aide du bouton Zoom (Fig. 3.11).

Riz. 3.11. Fenêtre de sélection d'une variable à l'aide d'un bouton Examiner les variables

Les paramètres des équations sont désignés par des lettres latines qui ne désignent aucune opération mathématique. Pour simplifier le travail, il est proposé de désigner les paramètres de l'équation comme dans la description des équations de tendance - par la lettre latine " UN», en leur attribuant séquentiellement des numéros de série. Les signes des opérations mathématiques (soustraction, addition, multiplication, etc.) sont précisés de la manière habituelle Fenêtres-format de candidature. Aucun espace n'est requis entre les éléments de l'équation.

Considérons donc le premier modèle de tendance - linéaire, .

Par conséquent, après avoir tapé, cela ressemblera à ceci :

,

v 1 est une colonne sur la feuille avec les données source, qui contient les valeurs de la série dynamique d'origine ; UN 0 et UN 1 – paramètres de l'équation ; v 2 – colonne sur la feuille avec les données originales, qui contient les valeurs des intervalles de temps (variable T) (Fig. 3.12).

Après cela, appuyez deux fois sur le bouton D'ACCORD .

Riz. 3.12. Fenêtre de définition de l'équation de tendance linéaire

Riz. 3.13. Marque-page Rapide procédures d’estimation de l’équation de tendance.

Dans la fenêtre qui apparaît (Fig. 3.13), vous pouvez sélectionner une méthode d'estimation des paramètres de l'équation de régression ( Méthode d'estimation ), si nécessaire. Dans notre cas, nous devons aller au signet Avancé et appuyez sur le bouton Valeurs de départ (Fig. 3.14). Dans cette boîte de dialogue, les valeurs de départ des paramètres de l'équation sont spécifiées pour les trouver à l'aide de la méthode des moindres carrés, c'est-à-dire leurs valeurs minimales. Initialement, ils sont fixés à 0,1 pour tous les paramètres. Dans notre cas, nous pouvons laisser ces valeurs sous la même forme, mais si les valeurs de nos données sources sont inférieures à un, nous devons alors les définir sous la forme de 0,001 pour tous les paramètres de l'équation de tendance ( 3.15). Ensuite, appuyez sur le bouton D'ACCORD .

Riz. 3.14. Marque-page Avancé Procédures d'estimation de l'équation de tendance

Riz. 3.15. Fenêtre de définition des valeurs de départ des paramètres de l'équation de tendance

Riz. 3.16. Marque-page Rapide fenêtres de résultats d'analyse de régression

Sur le marque-page Rapide (Fig. 3.16) la signification de la ligne est très importante Proportion de variance prise en compte , qui correspond au coefficient de détermination ; Il est préférable d'écrire cette valeur séparément, car elle ne sera plus affichée à l'avenir et l'utilisateur devra calculer le coefficient manuellement, et trois décimales suffisent. Ensuite, appuyez sur le bouton Résumé : estimations des paramètres pour obtenir des données sur les paramètres de l'équation de tendance linéaire (Fig. 3.17).

Riz. 3.17. Résultats du calcul des paramètres du modèle de tendance linéaire

Colonne Estimation – les valeurs numériques des paramètres de l'équation ; Erreur type – erreur type du paramètre ; valeur t – valeur calculée t-critères; df – nombre de degrés de liberté ( n-2); niveau p – le niveau de signification calculé ; Lo. Conf. Limite Et En haut. Conf. Limite – respectivement, les limites inférieure et supérieure des intervalles de confiance pour les paramètres de l'équation avec une probabilité spécifiée (indiquées par Niveau de confiance dans le champ supérieur du tableau).

En conséquence, l'équation du modèle de tendance linéaire a la forme .

Après cela, nous revenons à l'analyse et cliquons sur le bouton Analyse de la variance (analyse de variance) sur le même onglet Rapide (voir Fig. 3.16).

Riz. 3.18. Résultats de l'analyse de variance du modèle de tendance linéaire

Cinq notes sont données dans la rangée supérieure du tableau :

Somme des carrés – somme des carrés des écarts ; df – nombre de degrés de liberté ; Carrés moyens – carré moyen ; Valeur F – critère de Fisher ; valeur p – niveau de signification calculé F-critères.

La colonne de gauche indique la source de variation :

Régression – variation expliquée par l'équation de tendance ; Résiduel – variation des résidus – écarts des valeurs réelles par rapport à celles ajustées (obtenues à partir de l'équation de tendance) ; Total – variation totale de la variable.

A l'intersection des colonnes et des lignes, nous obtenons des indicateurs définis de manière unique, dont les formules de calcul sont présentées dans le tableau. 3.2,

Tableau 3.2

Calcul des indicateurs de variation des modèles de tendance

Source df Somme des carrés Carrés moyens Valeur F
Régression m
Résiduel n-m
Total n
Total corrigé n-1
Régression contre Total corrigé m RSS MSR

où sont les valeurs alignées des niveaux de la série dynamique ; – valeurs réelles des niveaux de la série dynamique ; – valeur moyenne des niveaux de la série dynamique.

SSR (Somme de régression des carrés) – somme des carrés des valeurs prédites ; SSE (Somme résiduelle des carrés) – la somme des carrés des écarts des valeurs théoriques et réelles (pour calculer la variance résiduelle inexpliquée) ; SST (Somme Totale des Carrés) – la somme des première et deuxième lignes (la somme des carrés des valeurs réelles) ; SSCT (Somme Totale des Carrés Corrigée) – la somme des carrés des écarts des valeurs réelles par rapport à la valeur moyenne (pour calculer la dispersion totale) ; Régression contre Somme totale des carrés corrigée – répétition du premier vers ; MSR (régression des carrés moyens) – écart expliqué; MSE (carrés moyens résiduels) – variance résiduelle inexpliquée ; MSCT (Total moyen corrigé des carrés) – variance totale ajustée ; Régression contre Carrés moyens totaux corrigés – répétition du premier vers ; Valeur F de régression – valeur calculée F-critères; Régression contre Valeur F totale corrigée – valeur calculée ajustée F-critères; n– nombre de niveaux de la série ; m– nombre de paramètres de l'équation de tendance.

Plus loin encore sur le signet Rapide (voir Fig. 3.16) appuyez sur le bouton Valeurs prédites, résidus, etc. . Après avoir cliqué dessus, le système crée un tableau composé de trois colonnes (Fig. 3.19).

Observé – les valeurs observées (c'est-à-dire les niveaux de la série chronologique originale) ;

D'après la formule (9.29), les paramètres de la tendance linéaire sont égaux une = 1894/11 = 172,2 c/ha ; b= 486/110 = 4,418 c/ha. L'équation de tendance linéaire a la forme :

oui = 172,2 + 4,418t, Où t = 0 en 1987 Cela signifie que le niveau moyen réel et égalisé se réfère au milieu de la période, c'est-à-dire en 1991, égale à 172 c/ha par an ; l'augmentation annuelle moyenne est de 4,418 c/ha par an ;

Les paramètres de la tendance parabolique selon (9.23) sont égaux à b = 4,418; un = 177,75; c =-0,5571. L'équation de tendance parabolique a la forme у̃ = 177,75 + 4,418t - 0.5571t 2 ; t= 0 en 1991. Cela signifie que l'augmentation absolue du rendement ralentit en moyenne de 2,0,56 c/ha par an et par an. La croissance absolue elle-même n’est plus une constante de la tendance parabolique, mais une valeur moyenne sur la période. Dans l'année prise comme point de départ, c'est-à-dire 1991, la tendance passe par le point en ordonnée de 77,75 c/ha ; Le terme libre d'une tendance parabolique n'est pas le niveau moyen de la période. Les paramètres de la tendance exponentielle sont calculés à l'aide des formules (9.32) et (9.33) ln UN= 56,5658/11 = 5,1423 ; potentialisant, on obtient UN= 171,1 ; dans k= 2,853:110 = 0,025936 ; potentialisant, on obtient k = 1,02628.

L’équation de tendance exponentielle est la suivante : y = 171,1 1,02628 t.

Cela signifie que le taux de rendement annuel moyen pour la période était de 102,63 %. Au point K pris comme point de départ, la tendance passe le point d'ordonnée 171,1 c/ha.

Les niveaux calculés à l'aide des équations de tendance sont inscrits dans les trois dernières colonnes du tableau. 9.5. Comme le montrent ces données. Les valeurs calculées des niveaux pour les trois types de tendances ne diffèrent pas beaucoup, car l'accélération de la parabole et le taux de croissance de l'exponentielle sont faibles. Une parabole présente une différence significative : la croissance des niveaux s'est arrêtée depuis 1995, tandis qu'avec une tendance linéaire, les niveaux continuent de croître, et avec une tendance exponentielle, leur rythme s'accélère. Par conséquent, pour les prévisions pour l'avenir, ces trois tendances ne sont pas égales : en extrapolant la parabole aux années futures, les niveaux s'écarteront fortement de la droite et de l'exponentielle, comme le montre le tableau. 9.6. Ce tableau montre une impression de la solution sur un PC à l'aide du programme Statgraphics pour les trois mêmes tendances. La différence entre leurs termes libres et ceux donnés ci-dessus s'explique par le fait que le programme numérote les années non pas à partir du milieu, mais à partir du début, de sorte que les termes libres des tendances se réfèrent à 1986, pour laquelle t = 0. L'équation exponentielle sur l'imprimé est laissée sous forme logarithmique. La prévision est faite 5 ans à l'avance, c'est-à-dire jusqu'en 2001. Lorsque l'origine des coordonnées (référence temporelle) dans l'équation de la parabole change, la moyenne absolue augmente, le paramètre b. car en raison d'une accélération négative, la croissance diminue constamment et son maximum se situe au début de la période. La seule constante d'une parabole est l'accélération.


La ligne « Données » montre les niveaux de la série originale ; « Résumé des prévisions » désigne les données récapitulatives d'une prévision. Dans les lignes suivantes, il y a des équations d'une droite, des paraboles, des exposants - sous forme logarithmique. La colonne ME signifie la différence moyenne entre les niveaux de la série originale et les niveaux de tendance (alignés). Pour une droite et une parabole, cet écart est toujours nul. Les niveaux des exposants sont en moyenne inférieurs de 0,48852 aux niveaux de la série originale. Une correspondance exacte est possible si la véritable tendance est exponentielle ; dans ce cas, il n’y a pas de coïncidence, mais la différence est minime. Le graphique MAE est la variance s 2 - une mesure de la variabilité des niveaux réels par rapport à la tendance, comme indiqué au paragraphe 9.7. Colonne MAE - écart linéaire moyen des niveaux par rapport à l'évolution en valeur absolue (voir paragraphe 5.8) ; colonne MARE - écart linéaire relatif en pourcentage. Ici, ils sont présentés comme des indicateurs de l'adéquation du type de tendance sélectionné. La parabole a un module de dispersion et de déviation plus petit : pour la période 1986 - 1996. plus proche des niveaux réels. Mais le choix du type de tendance ne peut se réduire à ce seul critère. En fait, le ralentissement de la croissance est le résultat d’un écart négatif important, à savoir une mauvaise récolte en 1996.

La seconde moitié du tableau est une prévision des niveaux de rendement pour trois types de tendances sur plusieurs années ; t = 12, 13, 14, 15 et 16 à partir de l'origine (1986). Les niveaux prévus pour l'exponentielle jusqu'à la 16ème année ne sont pas beaucoup plus élevés que pour la ligne droite. Les niveaux de tendance parabolique diminuent et s’écartent de plus en plus des autres tendances.

Comme on peut le voir dans le tableau. 9.4, lors du calcul des paramètres de tendance, les niveaux de la série originale sont inclus avec différents poids - valeurs tp et leurs carrés. Par conséquent, l’influence des fluctuations de niveau sur les paramètres de tendance dépend du numéro de l’année de récolte ou d’année de soudure. Si un écart important se produit au cours d'une année avec un nombre nul ( t je = 0), alors cela n'aura aucun effet sur les paramètres de tendance, mais s'il atteint le début et la fin de la série, cela aura un effet important. Par conséquent, un seul alignement analytique ne libère pas complètement les paramètres de tendance de l'influence des fluctuations, et en cas de fortes fluctuations, ils peuvent être considérablement déformés, ce qui s'est produit avec la parabole dans notre exemple. Pour éliminer davantage l'effet de distorsion des fluctuations sur les paramètres de tendance, il convient d'appliquer méthode d'alignement coulissant multiple.

Cette technique consiste dans le fait que les paramètres de tendance ne sont pas calculés immédiatement pour l'ensemble de la série, mais selon une méthode glissante, d'abord pour la première T périodes de temps ou de moments, puis pour la période du 2 au t + 1, du 3ème au (t + 2) niveau, etc. Si le nombre de niveaux initiaux de la série est égal à p, et la longueur de chaque base coulissante de calcul des paramètres est égale à T, alors le nombre de ces bases mobiles t ou les valeurs de paramètres individuels qui en seront déterminées sera :

L = n + 1 - T.

L'utilisation de la technique d'alignement multiple glissant, comme le montrent les calculs ci-dessus, n'est possible qu'avec un nombre suffisamment grand de niveaux dans la série, généralement 15 ou plus. Considérons cette technique en utilisant les données du tableau 1 à titre d'exemple. 9.4 - dynamique des prix des biens non pétroliers dans les pays en développement, ce qui donne encore une fois au lecteur la possibilité de participer à une petite étude scientifique. En utilisant le même exemple, nous continuerons la technique de prévision à la section 9.10.

Si nous calculons les paramètres de notre série sur des périodes de 11 ans (à 11 niveaux), alors t= 17 + 1 - 11 = 7. La signification de l'alignement glissant multiple est qu'avec des changements successifs dans la base de calcul des paramètres, aux extrémités et au milieu, il y aura différents niveaux avec des écarts par rapport à la tendance de signe et d'ampleur différents. Par conséquent, avec certains changements dans la base, les paramètres seront surestimés, avec d'autres, ils seront sous-estimés, et avec la moyenne ultérieure des valeurs des paramètres sur tous les changements de la base de calcul, il y aura une annulation mutuelle supplémentaire des distorsions dans les paramètres de tendance par les fluctuations des niveaux.

L'alignement glissant multiple vous permet non seulement d'obtenir une estimation plus précise et plus fiable des paramètres de tendance, mais également de contrôler le choix correct du type d'équation de tendance. S'il s'avère que le paramètre de tendance dominant, sa constante lorsqu'il est calculé à l'aide de bases mobiles, ne fluctue pas de manière aléatoire, mais change systématiquement sa valeur de manière significative, cela signifie que le type de tendance a été mal choisi, ce paramètre n'est pas une constante .

Quant au terme libre lors de l'égalisation multiple, il n'est pas nécessaire et, de plus, il est tout simplement incorrect de calculer sa valeur comme moyenne sur tous les déplacements de base, car avec cette méthode, les niveaux individuels de la série d'origine seraient inclus dans le calcul. de la moyenne avec des poids différents, et la somme des niveaux égalisés divergerait avec la somme des termes de la série originale. Le terme libre de la tendance est la valeur moyenne du niveau sur la période, à condition que le temps soit compté à partir du milieu de la période. En comptant depuis le début, si le premier niveau je= 1, le terme libre sera égal à : une 0 = у̅ - b((N-1)/2). Il est recommandé que la longueur de la base mobile pour calculer les paramètres de tendance soit sélectionnée au moins entre 9 et 11 niveaux afin d'amortir suffisamment les fluctuations des niveaux. Si la rangée initiale est très longue, la base peut mesurer jusqu'à 0,7 à 0,8 de sa longueur. Pour éliminer l'influence des fluctuations (cycliques) à longue période sur les paramètres de tendance, le nombre de changements de base doit être égal ou multiple de la durée du cycle d'oscillation. Ensuite, le début et la fin de la base « parcourront » séquentiellement toutes les phases du cycle et lors de la moyenne du paramètre sur tous les changements, ses distorsions dues aux oscillations cycliques s'annuleront. Une autre façon consiste à prendre la longueur de la base mobile égale à la longueur du cycle, de sorte que le début et la fin de la base tombent toujours à la même phase du cycle d'oscillation.

Puisque selon le tableau. 9.4, il a déjà été établi que la tendance a une forme linéaire, on calcule l'augmentation absolue annuelle moyenne, c'est-à-dire le paramètre béquations de tendance linéaires de manière glissante sur des bases de 11 ans (voir tableau 9.7). Il contient également le calcul des données nécessaires à l'étude ultérieure de la variabilité au paragraphe 9.7. Regardons de plus près la technique d'alignement multiple à l'aide de bases coulissantes. Calculons le paramètre b pour toutes les bases de données :


Le plus souvent la tendance est représentée par une relation linéaire du type étudié

où y est la variable d'intérêt (par exemple, la productivité) ou la variable dépendante ;
x est un nombre qui détermine la position (deuxième, troisième, etc.) de l'année dans la période de prévision ou une variable indépendante.

Lors de l'approximation linéaire de la relation entre deux paramètres, la méthode des moindres carrés est le plus souvent utilisée pour trouver les coefficients empiriques d'une fonction linéaire. L'essence de la méthode est que la fonction linéaire « meilleur ajustement » passe par les points du graphique correspondant au minimum de la somme des écarts carrés du paramètre mesuré. Cette condition ressemble à :

où n est le volume de la population étudiée (le nombre d'unités d'observation).

Riz. 5.3. Construire une tendance en utilisant la méthode des moindres carrés

Les valeurs des constantes b et a ou le coefficient de la variable X et le terme libre de l'équation sont déterminés par la formule :

Dans le tableau 5.1 montre un exemple de calcul d'une tendance linéaire à partir de données.

Tableau 5.1. Calcul de tendance linéaire

Méthodes de lissage des oscillations.

S'il existe de forts écarts entre valeurs voisines, la tendance obtenue par la méthode de régression est difficile à analyser. Lors de la prévision, lorsqu'une série contient des données avec une large répartition des fluctuations des valeurs voisines, vous devez les lisser selon certaines règles, puis rechercher la signification dans la prévision. Vers la méthode de lissage des oscillations
incluent : la méthode de la moyenne mobile (la moyenne sur n points est calculée), la méthode de lissage exponentiel. Regardons-les.

Méthode de moyenne mobile (MAM).

MSS permet de lisser une série de valeurs afin de mettre en évidence une tendance. Cette méthode prend la moyenne (généralement la moyenne arithmétique) d’un nombre fixe de valeurs. Par exemple, une moyenne mobile de trois points. Les trois premières valeurs, compilées à partir des données de janvier, février et mars (10 + 12 + 13), sont prises et la moyenne est déterminée à 35 : 3 = 11,67.

La valeur résultante de 11,67 est placée au centre de la plage, c'est-à-dire selon la ligne de février. Ensuite, nous « glissons d'un mois » et prenons les trois seconds nombres, de février à avril (12 + 13 + 16), et calculons la moyenne égale à 41 : 3 = 13,67, et de cette manière nous traitons les données pour le série entière. Les moyennes obtenues représentent une nouvelle série de données permettant de construire une tendance et son approximation. Plus on prend de points pour calculer la moyenne mobile, plus le lissage des fluctuations est fort. Un exemple de MBA de construction de tendances est donné dans le tableau. 5.2 et sur la Fig. 5.4.

Tableau 5.2 Calcul de tendance à l'aide de la méthode de la moyenne mobile en trois points

La nature des fluctuations des données originales et des données obtenues par la méthode de la moyenne mobile est illustrée dans la Fig. 5.4. A partir d'une comparaison des graphiques des séries de valeurs initiales (série 3) et des moyennes mobiles à trois points (série 4), il apparaît clairement que les fluctuations peuvent être lissées. Plus le nombre de points impliqués dans la plage de calcul de la moyenne mobile est grand, plus la tendance apparaîtra clairement (ligne 1). Mais la procédure d'élargissement de la plage entraîne une réduction du nombre de valeurs finales, ce qui réduit la précision de la prévision.

Les prévisions doivent être établies sur la base d'estimations de la droite de régression basées sur les valeurs des données initiales ou des moyennes mobiles.

Riz. 5.4. La nature de l'évolution du volume des ventes par mois de l'année :
données initiales (ligne 3); moyennes mobiles (ligne 4) ; lissage exponentiel (ligne 2) ; tendance construite par méthode de régression (ligne 1)

Méthode de lissage exponentiel.

Une approche alternative pour réduire la propagation des valeurs des séries consiste à utiliser la méthode de lissage exponentiel. La méthode est appelée « lissage exponentiel » car chaque valeur des périodes allant dans le passé est réduite d'un facteur (1 – α).

Chaque valeur lissée est calculée à l'aide d'une formule de la forme :

St =aYt +(1−α)St−1,

où St est la valeur lissée actuelle ;
Yt – valeur actuelle de la série chronologique ; St – 1 – valeur lissée précédente ; α est une constante de lissage, 0 ≤ α ≤ 1.

Plus la valeur de la constante α est petite, moins elle est sensible aux changements de tendance dans une série temporelle donnée.

L'équation de tendance linéaire est y = at + b.

Les paramètres des équations de la fonction de tendance sont trouvés à l'aide de la théorie des corrélations utilisant la méthode des moindres carrés.

1. Méthode des moindres carrés.
La méthode des moindres carrés (LSM) est l'un des moyens de contrer les erreurs de mesure (Comme en physique, erreur d'écart).
Cette méthode est généralement utilisée pour trouver les paramètres d'équations (Lignes, hyperboles, paraboles, etc.)
Cette méthode consiste à minimiser la somme des carrés des écarts.
La signification de MNC peut être exprimée à travers ce graphique

2. Analyse de l'exactitude de la détermination des estimations des paramètres de l'équation de tendance (à l'aide du tableau de l'étudiant, nous trouvons le tableau TT et effectuons une prévision par intervalle, c'est-à-dire que nous identifions l'erreur quadratique moyenne)

3. Tester les hypothèses concernant les coefficients de l’équation de tendance linéaire (statistiques, test de Student, test de Fisher)

Test d'autocorrélation des résidus.
Une condition préalable importante pour construire un modèle de régression qualitative utilisant les MCO est l'indépendance des valeurs des écarts aléatoires par rapport aux valeurs des écarts dans toutes les autres observations. Cela garantit qu'il n'y a aucune corrélation entre d'éventuels écarts et, en particulier, entre des écarts adjacents.
Autocorrélation (corrélation série) L'autocorrélation des résidus (variances) est courante dans l'analyse de régression lors de l'utilisation de données de séries chronologiques et très rare lors de l'utilisation de données transversales.
Vérification de l'hétéroscédasticité.
1) Par analyse graphique des résidus.
Dans ce cas, les valeurs de la variable explicative X sont portées le long de l'axe des abscisses, et les écarts e i ou leurs carrés e 2 i sont portés le long de l'axe des ordonnées.
S'il existe un certain lien entre les écarts, une hétéroscédasticité se produit. L’absence de dépendance indiquera très probablement l’absence d’hétéroscédasticité.
2) Utilisation du test de corrélation de rang de Spearman.
Coefficient de corrélation de rang de Spearman.

36. Méthodes de mesure de la stabilité des tendances dynamiques (coefficient de rang de Spearman).

Le concept de « durabilité » est utilisé de manières très différentes. En relation avec l'étude scientifique de la dynamique, nous considérerons deux aspects de ce concept : 1) la stabilité comme catégorie opposée à la fluctuation ; 2) stabilité de la direction des changements, c'est-à-dire durabilité de la tendance.

La stabilité au deuxième sens ne caractérise pas les niveaux eux-mêmes, mais le processus de leur changement dirigé. Vous pouvez découvrir, par exemple, dans quelle mesure le processus de réduction des coûts des ressources spécifiques pour la production d'une unité de production est-il durable, la tendance à la réduction de la mortalité infantile est-elle durable, etc. De ce point de vue, la stabilité totale d'un changement de direction dans les niveaux d'une série dynamique, il faut considérer un tel changement au cours duquel chaque niveau suivant est soit supérieur à tous les précédents (croissance soutenue), soit inférieur à tous les précédents (déclin soutenu). Toute violation de la séquence de niveaux strictement classée indique une stabilité incomplète des changements.


De la définition du concept de stabilité de tendance découle également la méthode de construction de son indicateur. Comme indicateur de stabilité, on peut utiliser le coefficient de corrélation de rang de Spearman - rx.

où n est le nombre de niveaux ;

I est la différence entre les rangs de niveaux et le nombre de périodes.

S'il y a coïncidence complète des rangs de niveaux, en partant du plus bas, et des nombres de périodes (instants) de temps dans leur ordre chronologique, le coefficient de corrélation des rangs est égal à +1. Cette valeur correspond au cas de stabilité complète de niveaux croissants. Lorsque les rangs des niveaux sont complètement opposés aux rangs des années, le coefficient de Spearman est égal à -1, ce qui signifie la stabilité totale du processus de réduction des niveaux. Avec une alternance chaotique des rangs de niveaux, le coefficient est proche de zéro, cela signifie l'instabilité de toute tendance.

Une valeur rx négative indique une tendance à la baisse des niveaux et la durabilité de cette tendance est inférieure à la moyenne.

Il convient de garder à l'esprit que même avec une stabilité de tendance à 100 %, il peut y avoir des fluctuations des niveaux de dynamique et le coefficient de leur stabilité sera inférieur à 100 %. Avec de faibles fluctuations, mais une tendance encore plus faible, au contraire, un niveau élevé de coefficient de stabilité est possible, mais un coefficient de stabilité de tendance proche de zéro. D’une manière générale, les deux indicateurs sont bien entendu directement liés : le plus souvent, on observe simultanément une plus grande stabilité des niveaux et une plus grande stabilité de la tendance.

37. Modélisation de la tendance d'une série de dynamiques en présence de changements structurels.

Les changements ponctuels dans la nature d'une tendance de série chronologique causés par des changements structurels dans l'économie ou d'autres facteurs doivent être distingués des fluctuations saisonnières et cycliques. Dans ce cas, à partir d'un certain instant t, il y a un changement dans la nature de la dynamique de l'indicateur étudié, ce qui entraîne une modification des paramètres de la tendance qui décrit cette dynamique.

Le moment t s'accompagne de changements significatifs dans un certain nombre de facteurs qui ont un fort impact sur l'indicateur étudié. Modélisation de la tendance d'une série chronologique en présence de changements structurels. Le plus souvent, ces changements sont provoqués par des changements dans l'économie générale. situation ou événements mondiaux qui ont conduit à un changement dans la structure de l’économie. Si la série chronologique étudiée inclut le moment correspondant, l'une des tâches de son étude est alors de clarifier la question de savoir si les changements structurels généraux ont influencé de manière significative la nature de cette tendance.

Si cette influence est significative, des modèles de régression linéaire par morceaux doivent être utilisés pour modéliser la tendance de cette série chronologique, c'est-à-dire divisez la population d'origine en 2 sous-populations (avant le temps t et après) et construisez des équations de régression linéaire séparément pour chaque sous-population.

Si les changements structurels ont eu un léger impact sur la nature de la tendance de la série Modélisation de la tendance d'une série chronologique en présence de changements structurels., alors il peut être écrit en utilisant une équation de tendance uniforme pour l'ensemble de l'ensemble de données.

Chacune des approches décrites ci-dessus a ses côtés positifs et négatifs. Lors de la construction d'un modèle linéaire par morceaux, la somme des carrés résiduelle est réduite par rapport à l'équation de tendance qui est uniforme pour l'ensemble de la population. Mais diviser la population en parties entraîne une perte du nombre d'observations et une diminution du nombre de degrés de liberté dans chaque équation du modèle linéaire par morceaux. La construction d'une seule équation de tendance vous permet de conserver le nombre d'observations dans la population d'origine, mais la somme des carrés résiduelle pour cette équation sera plus élevée par rapport au modèle linéaire par morceaux. Évidemment, le choix du modèle dépend de la relation entre la réduction de la variance résiduelle et la perte du nombre de degrés de liberté lors du passage d'une équation de régression unique à un modèle linéaire par morceaux.

38. Analyse de régression des séries chronologiques connectées.

Les séries temporelles multivariées montrant la dépendance d'une caractéristique efficace sur un ou plusieurs facteurs sont appelées séries dynamiques connectées. L'utilisation des méthodes des moindres carrés pour le traitement des séries temporelles ne nécessite de faire aucune hypothèse sur les lois de distribution des données initiales. Cependant, lors de l'utilisation de la méthode des moindres carrés pour traiter des séries connectées, il convient de prendre en compte la présence d'autocorrélation (autorégression), qui n'a pas été prise en compte lors du traitement de séries temporelles unidimensionnelles, car sa présence a contribué à une image plus dense et plus claire. identification de la tendance d'évolution du phénomène socio-économique considéré dans le temps.

Détection d'autocorrélation dans les niveaux d'une série de dynamiques

Dans la dynamique des processus économiques, il existe une relation entre les niveaux, notamment les plus proches. Il convient de le présenter sous la forme d'une corrélation entre les séries y1,y2,y3,…..yn h y1+h, y2+h,…, yn+h. Le décalage temporel L est appelé décalage, et le phénomène d'interconnexion lui-même est appelé autocorrélation.

La dépendance à l'autocorrélation est particulièrement significative entre les niveaux suivants et précédents de la série dynamique.

Il existe deux types d'autocorrélation :

Autocorrélation dans les observations d'une ou plusieurs variables ;

Autocorrélation des erreurs ou autocorrélation des écarts par rapport à la tendance.

La présence de ces derniers entraîne une distorsion des valeurs des erreurs quadratiques moyennes des coefficients de régression, ce qui rend difficile la construction d'intervalles de confiance pour les coefficients de régression, ainsi que la vérification de leur significativité.

L'autocorrélation est mesurée à l'aide du coefficient d'autocorrélation cyclique, qui peut être calculé non seulement entre des niveaux adjacents, c'est-à-dire décalé d'une période, mais aussi entre décalé d'un nombre quelconque d'unités de temps (L). Ce décalage, appelé décalage temporel, détermine également l'ordre des coefficients d'autocorrélation : premier ordre (à L=1), deuxième ordre (à L=2), etc. Cependant, le plus grand intérêt de l'étude est le calcul du coefficient non cyclique (premier ordre), car les distorsions les plus sévères des résultats d'analyse surviennent lorsqu'il existe une corrélation entre les niveaux initiaux de la série et les mêmes niveaux décalés de une unité de temps.

Pour juger de la présence ou de l'absence d'autocorrélation dans la série étudiée, la valeur réelle des coefficients d'autocorrélation est comparée à la valeur tabulée (critique) pour le niveau de signification de 5 % ou 1 %.

Si la valeur réelle du coefficient d'autocorrélation est inférieure à la valeur tabulée, alors l'hypothèse de l'absence d'autocorrélation dans la série peut être acceptée. Lorsque la valeur réelle est supérieure à la valeur tabulée, nous pouvons conclure qu’il existe une autocorrélation dans la série dynamique.



Avez-vous aimé l'article? Partagez avec vos amis !