El componente aleatorio de la ecuación de tendencia es: Línea de tendencia exponencial

Cálculos estadísticos del contenido de humedad.

prueba

2. Ecuación de tendencia basada en dependencia lineal.

2.1. Elementos básicos de una serie temporal.

Puede construir un modelo econométrico utilizando dos tipos de datos de entrada:

Datos que caracterizan una colección de diferentes objetos en un momento determinado.

Datos que caracterizan un objeto durante varios momentos sucesivos en el tiempo.

Los modelos construidos con datos del primer tipo se denominan espaciales. Los modelos construidos a partir del segundo tipo de datos se denominan series de tiempo.

Una serie de tiempo es una colección de valores de cualquier indicador durante varios momentos o periodos de tiempo consecutivos. Cada nivel de una serie temporal se forma bajo la influencia de una gran cantidad de factores, que se pueden dividir en tres grupos:

Factores que marcan la tendencia de la serie.

Factores que forman fluctuaciones cíclicas en la serie.

Factores aleatorios.

Con diferentes combinaciones de estos factores en el fenómeno o proceso en estudio, la dependencia de los niveles de la serie en el tiempo puede tomar diferentes formas.

En primer lugar, la mayoría de las series temporales de indicadores económicos tienen una tendencia que caracteriza el impacto acumulativo a largo plazo de muchos factores en la dinámica del indicador en estudio. Es obvio que estos factores, tomados por separado, pueden tener un impacto multidireccional en el indicador en estudio. Sin embargo, juntos forman una tendencia creciente o decreciente. En la Fig. 1. muestra una serie temporal que contiene una tendencia creciente.

En segundo lugar, el indicador en estudio puede estar sujeto a fluctuaciones cíclicas. Estas fluctuaciones pueden ser estacionales, ya que la actividad económica de varios sectores económicos depende de la época del año. Si se dispone de grandes cantidades de datos durante largos períodos de tiempo, es posible identificar fluctuaciones cíclicas asociadas con la dinámica general de las condiciones del mercado, así como con la fase del ciclo económico en la que se encuentra la economía del país. En la Fig. 2. Se presenta una serie temporal que contiene únicamente el componente estacional.

Algunas series de tiempo no contienen una tendencia o un componente cíclico, y cada nivel posterior se basa en la suma del nivel promedio de la serie y algún componente aleatorio. En la figura 2 se muestra un ejemplo de una serie que contiene sólo un componente aleatorio. 3.

Obviamente, los datos reales no se derivan completamente de ninguno de los modelos descritos. La mayoría de las veces contienen los tres componentes. Cada nivel se forma bajo la influencia de tendencias, fluctuaciones estacionales y un componente aleatorio.

En la mayoría de los casos, el nivel real de una serie temporal se puede representar como la suma o producto de los componentes tendenciales, cíclicos y aleatorios. Un modelo en el que una serie de tiempo se presenta como la suma de los componentes enumerados se denomina modelo aditivo. Un modelo en el que una serie temporal se presenta como un producto de los componentes enumerados se denomina modelo multiplicativo.

2.2. Autocorrelación de niveles de series temporales.

Si hay tendencia y fluctuaciones cíclicas en una serie temporal, los valores de cada nivel posterior de la serie dependen de los anteriores. La correlación entre niveles sucesivos de una serie temporal se llama autocorrelación. Puede medirse cuantitativamente utilizando un coeficiente de correlación lineal entre los niveles de la serie temporal original y los niveles de esta serie desplazados en el tiempo.

Una de las fórmulas de trabajo para calcular el coeficiente de correlación es:

r x y = (Xj - X) * (yj - y) .

(x j -x) 2 * (y j -y) 2

Como variable x consideraremos la serie y 2, y 3, ... y t; Como variable y, considere la serie y 1, y 2, ... y t -1. Entonces esta fórmula tomará la forma:

r 1 = (y t - y 1 ) * (y t-1 - y 2 ) ; donde y 1 = y t ; y 2 = y t-1 .

(y t -y 1) 2 * (y t-1 -y 2) 2 n - 1 n - 1

Esta cantidad se denomina coeficiente de autocorrelación de niveles de series de primer orden. El número de períodos para los cuales se calcula el coeficiente de autocorrelación se denomina rezago. A medida que aumenta el retraso, disminuye el número de pares de valores a partir de los cuales se calcula el coeficiente de autocorrelación.

Propiedades del coeficiente de autocorrelación:

En primer lugar, se construye por analogía con el coeficiente de correlación lineal y, por tanto, caracteriza la cercanía de sólo la relación lineal entre los niveles actual y anterior de la serie. Por tanto, por el coeficiente de autocorrelación se puede juzgar la presencia de una tendencia lineal.

En segundo lugar, a partir del signo del coeficiente de autocorrelación no se puede concluir que exista una tendencia creciente o decreciente en los niveles de la serie.

La secuencia de coeficientes de autocorrelación del primer, segundo, etc. nivel. órdenes se llama función de autocorrelación de la serie temporal. Una gráfica de la dependencia de sus valores del valor del retraso se llama correlograma. El análisis de la función de autocorrelación y el correlograma nos permite determinar el rezago en el que la autocorrelación es mayor y, en consecuencia, el rezago en el que la conexión entre los niveles actual y anterior de la serie es más cercana, es decir Al analizar la función de autocorrelación y el correlograma, se puede identificar la estructura de la serie.

Si el coeficiente de autocorrelación de primer orden resulta ser el más alto, la serie en estudio contiene sólo una tendencia. Si el coeficiente de autocorrelación más alto es de orden t, la serie contiene fluctuaciones cíclicas con periodicidad en t puntos en el tiempo. Si ninguno de los coeficientes de autocorrelación es significativo, podemos concluir que o la serie no contiene una tendencia ni fluctuaciones cíclicas, o la serie contiene una fuerte tendencia no lineal, cuya identificación requiere un análisis adicional.

2.3. Modelado de tendencias de series temporales.

Una de las formas más comunes de modelar la tendencia de una serie temporal es construir una función analítica que caracterice la dependencia de los niveles de la serie en el tiempo o tendencia. Este método se llama alineación analítica de series de tiempo.

Porque La dependencia del tiempo puede adoptar diferentes formas; para formalizarla se pueden utilizar diferentes tipos de funciones. Las siguientes funciones se utilizan con mayor frecuencia para generar tendencias:

Tendencia lineal: y t = a + b*t ;

Hipérbole:y t = a + b/t ;

Tendencia exponencial: y t = e a + b * t ;

Tendencia en forma de función de potencia: y t = a*t ;

Parábola: y t = a + b 1 *t + b 2 *t 2 + ... + b k *t k ;

Los parámetros de cada una de estas tendencias pueden determinarse mediante el método de mínimos cuadrados, utilizando el tiempo t = 1, 2, ... ,n como variable independiente y los niveles reales de la serie temporal y t como variable dependiente. Para tendencias no lineales, primero se lleva a cabo un procedimiento estándar para su linealización.

Hay varias formas de determinar el tipo de tendencia. Los métodos más comunes incluyen el análisis cualitativo del proceso en estudio, la construcción y análisis visual de un gráfico de la dependencia de los niveles de la serie en el tiempo y el cálculo de algunos indicadores básicos de dinámica. Para los mismos fines, se pueden utilizar los coeficientes de autocorrelación de los niveles de las series. El tipo de tendencia se puede determinar comparando los coeficientes de autocorrelación de primer orden calculados a partir de los niveles originales y transformados de la serie. Si una serie de tiempo tiene una tendencia lineal, entonces sus niveles vecinos y t e y t -1 están estrechamente correlacionados. En este caso, el coeficiente de autocorrelación de primer orden de los niveles de la serie original debería ser alto. Si la serie de tiempo contiene una tendencia no lineal, por ejemplo, en forma exponencial, entonces el coeficiente de autocorrelación de primer orden basado en los logaritmos de los niveles de la serie original será mayor que el coeficiente correspondiente calculado a partir de los niveles de la serie original. serie. Cuanto más pronunciada sea la tendencia no lineal en la serie temporal en estudio, más diferirán los valores de los coeficientes indicados.

Se puede seleccionar la mejor ecuación si la serie contiene una tendencia no lineal buscando entre las principales formas de tendencia, calculando el coeficiente de determinación ajustado R para cada ecuación y seleccionando la ecuación de tendencia con el valor máximo del coeficiente de determinación ajustado.

Valores elevados de coeficientes de autocorrelación de primer, segundo y tercer orden indican que la serie contiene una tendencia. Los valores aproximadamente iguales de los coeficientes de autocorrelación para los niveles de esta serie y para los logaritmos de los niveles nos permiten sacar la siguiente conclusión: si la serie contiene una tendencia no lineal, entonces se expresa en forma implícita. Por lo tanto, para modelar su tendencia, es igualmente recomendable utilizar funciones lineales y no lineales, por ejemplo, una potencia o una tendencia exponencial. Para identificar la mejor ecuación de tendencia, es necesario determinar los parámetros de los principales tipos de tendencias.

Los parámetros de tendencias lineales y exponenciales tienen la interpretación económica más simple. Parámetros de tendencia lineal:

a es el nivel inicial de la serie temporal en el momento t = 0;

b es el aumento absoluto promedio de los niveles de la serie durante el período.

Los valores de los niveles de series temporales calculados mediante una tendencia lineal se determinan de dos formas. En primer lugar, puede sustituir secuencialmente los valores t = 1, 2, ..., n en la ecuación de tendencia encontrada. En segundo lugar, de acuerdo con la interpretación de los parámetros de tendencia lineal, cada nivel posterior de la serie es la suma del nivel anterior y el aumento absoluto promedio de la cadena.

Tarea número 1

Diez personas de diferentes edades tienen los siguientes parámetros:

1. Determinar el signo efectivo.

Calculemos la dependencia de la altura con la edad:

Factor (X): edad.

Característica resultante (Y): crecimiento.

a*x + b*x 2 = x*y

10*a + 248*b = 1812

248*a + 6492*b = 45023

un = 1812-248*b => 1812-248*b*248 + 6492*b = 45023

r = x*y - ( X* sí)/n = 45023 - (248*1812)/10 =>

(x 2 - (x) 2 /n)*(y 2 - (y) 2 /n) (6492 - 248 2/10)*(328444 - 1812 2/10)

r = 0,44 - conexión moderada directa

r 2 = 0,19 - el crecimiento del 19% depende de la edad

Prueba de Fisher:

Fcp = r 2 * (n - 2)

Fcp = 0.19 * (10 - 2) = 1.78

tabla F = 5,32

fcp< F табл =>

Calculemos la dependencia del peso de la edad:

Factor (X): edad.

Determinemos los parámetros de la función lineal usando el sistema de ecuaciones:

a*x + b*x 2 = x*y

10*a + 248*b = 753

248*a + 6492*b = 18856

un = 753-248*b => 1812-248*b*248 + 6492*b = 18856

r = x*y - ( X* sí)/n = 18856 - (248*753)/10 =>

(x 2 - (x) 2 /n)*(y 2 - (y) 2 /n) (6492 - 248 2/10)*(56967 - 753 2/10)

r = 0,6 - conexión directa notable

r 2 = 0,36 - el peso depende en un 36% de la edad

Prueba de Fisher:

Fcp = r 2 * (n - 2)

Fcp = 0.36 * (10 - 2) = 4.5

tabla F = 5,32

fcp< F табл =>Se confirmó la hipótesis nula, la ecuación fue estadísticamente insignificante.

Calculemos la relación entre peso y altura:

Factor (X): crecimiento.

Atributo resultante (Y): peso.

Determinemos los parámetros de la función lineal usando el sistema de ecuaciones:

a*x + b*x 2 = x*y

10*a + 1812*b = 753

1812*a + 328444*b = 136562

un = 753-1812*b => 753-1812*b*1812 + 328444*b = 136562

r = x*y - ( X* sí)/n = 136562 - (1812*753)/10 =>

(x 2 - (x) 2 /n)*(y 2 - (y) 2 /n) (328444 - 1812 2/10)*(56967 - 753 2/10)

r = 0,69 - conexión directa notable

r 2 = 0,47 - el peso depende en un 47% de la altura

x = 1812/10 = 181,2

Prueba de Fisher:

Fcp = r 2 * (n - 2)

Fcp = 0.47 * (10 - 2) = 7.1

tabla F = 5,32

F cp > F tabla => la hipótesis nula no fue confirmada, la ecuación tiene sentido económico.

Prueba t de Student:

Calculemos errores aleatorios:

.

ma = (y - yX ) 2 * X 2 .

norte-2 norte*(x-x) 2

m b = (y - yX ) 2 / (n - 2)

m r = 1-r 2

ma = 138.19 * 328444 = 72

m b = 138.19 / (10 - 2) = 1

m r = 1 - 0.47 = 0.26

t a = a/m a = 120/72 = 1,67

t b = b/m b = 1,08/1 = 1,08

tr = r/mr = 0,69/0,26 = 2,65

t tabla = 2,3

Para calcular el intervalo de confianza, calculamos el error máximo:

a = t tabla - t a = 2,3 - 1,67 = 0,63

b = t tabla - t b = 2,3 - 1,08 = 1,22

r = t tabla - t r = 2,3 - 2,65 = -0,35

Calculemos intervalos de confianza:

a = a a = -121,03 119,77

segundo = segundo segundo = -0,14 2,3

r = r r = 0,34 1,04

Tarea número 2

Durante una verificación con muestra de control del porcentaje de humedad del suelo en fincas de la región, se obtuvieron los siguientes datos:

1. Con una probabilidad de 0,95 y 0,99, establezca el límite dentro del cual se encuentra el porcentaje promedio de contenido de humedad.

2. Sacar conclusiones.

Promedio general: x = X = 31.1 = 3.8875

Varianza general: 2 = (X - X) 2 = 1.8875 = 0.1261

número 8 .

Error estándar cuadrático medio: x = 2 = 0.1261 = 0.126

Error de muestreo marginal: x = t* x

De la tabla de valores de la prueba t de Student:

Para una probabilidad de 0,95, el error de muestreo máximo es:

x = 2,4469*0,126 = 0,308

Para una probabilidad de 0,99, el error de muestreo máximo es:

x = 3,7074*0,126 = 0,467

Intervalos de confianza:

Límite del contenido de humedad porcentual promedio con probabilidad 0,95:

Exponente central superior de algún sistema lineal.

Sea el sistema (2) dado y su solución. Considere una familia de funciones, Definición 5: Una función R (t) se llama superior para el sistema (2) si es acotada, mensurable y estimable, Donde está la norma de la matriz de Cauchy del sistema lineal...

Calculo diferencial

Con base en la definición de derivada, formulamos la siguiente regla para encontrar la derivada de una función en un punto: Para calcular la derivada de la función f(x) en el punto x0, necesitas: 1) Encontrar f(x) ) -f(x0); 2) crear una relación de diferencia; 3) calcular el límite...

Calculo diferencial

Basado en la definición de derivada...

Subgrupos invariantes de grupos biprimarios.

La nota (1) corrige un error cometido por Burnside en el artículo (2). Es decir, en (3) se demuestra que un grupo de orden, donde y son primos distintos y, cualquiera de los dos tiene una característica -subgrupo de orden...

Usar tecnología informática y software modernos para resolver un problema aplicado de la práctica de ingeniería y perforación.

Conociendo los valores de los coeficientes a0, a1 y a2, puedes encontrar los valores de y` usando la fórmula, en nuestro caso. La diferencia entre datos experimentales y teóricos es pequeña. Los datos obtenidos nos permiten encontrar una relación, 5...

Complejidad lineal de secuencias ciclotómicas.

Sea la secuencia de cuarto orden, es decir, entonces, según el Lema 1.1, se forma según la regla: (2.1) Nótese que la regla (2.1) especifica una secuencia sólo cuando...

Modelo matemático de un dispositivo digital para el juego "Tic-tac-toe" con una persona

El campo de juego para un juego de tres en raya se puede representar como una cuadrícula que consta de filas y columnas. Cada elemento de la grilla puede estar en tres estados: vacío (inicial), marcado con una cruz, marcado con un cero...

Métodos de recorte

Entre un conjunto de n objetos indivisibles, cada i (i = 1,2,..., n) de los cuales tiene el i-ésimo indicador característico y utilidad, encuentre un conjunto que le permita maximizar la eficiencia en el uso de los recursos del valor...

Solución aproximada de ecuaciones algebraicas y trascendentales. El método de Newton.

La información sobre aproximaciones anteriores de la raíz se utiliza para encontrar aproximaciones posteriores no solo en el método tangente. Como ejemplo de otro método similar, daremos el método...

Cálculos estadísticos del contenido de humedad.

Tareas prácticas: 1. Diez personas de diferentes edades tienen los siguientes parámetros: Edad, años 18 20 21 22 22 24 25 26 31 39 Altura, cm 174 183 182 180 178 179 185 185 184 182 Peso, kg 65 73 69 74 77 75 78 8 4 79 79 1...

Las curvas de crecimiento que describen patrones de desarrollo de fenómenos a lo largo del tiempo son el resultado de la alineación analítica de series temporales. Alinear una serie utilizando ciertas funciones en la mayoría de los casos resulta ser un medio conveniente para describir datos empíricos. Esta herramienta, si se cumplen una serie de condiciones, también se puede utilizar para realizar previsiones. El proceso de nivelación consta de los siguientes pasos principales:

Seleccionar el tipo de curva cuya forma corresponde a la naturaleza del cambio en la serie temporal;

Determinación de valores numéricos (estimación) de parámetros de curvas;

Control de calidad a posteriori de la tendencia seleccionada.

En las APP modernas, todas las etapas enumeradas se implementan simultáneamente, generalmente en el marco de un solo procedimiento.

El suavizado analítico utilizando una u otra función permite obtener valores nivelados o, como a veces no se les llama con razón, valores teóricos de los niveles de una serie de tiempo, es decir, niveles que se observarían si la dinámica del fenómeno Coincidió completamente con la curva. La misma función, con o sin algún ajuste, se utiliza como modelo de extrapolación (pronóstico).

La cuestión de elegir el tipo de curva es la principal a la hora de alinear una serie. En igualdad de condiciones, un error al resolver este problema resulta tener consecuencias más significativas (especialmente para la previsión) que un error asociado con la estimación estadística de parámetros.

Dado que la forma de una tendencia existe objetivamente, a la hora de identificarla se debe partir de la naturaleza material del fenómeno en estudio, examinando las razones internas de su desarrollo, así como las condiciones y factores externos que influyen en él. Sólo después de un análisis profundo y significativo se puede proceder al uso de técnicas especiales desarrolladas por la estadística.

Una técnica muy común para identificar la forma de una tendencia es la representación gráfica de una serie temporal. Pero al mismo tiempo, la influencia del factor subjetivo es grande, incluso cuando se muestran niveles nivelados.

Los métodos más fiables para seleccionar una ecuación de tendencia se basan en las propiedades de las distintas curvas utilizadas en la alineación analítica. Este enfoque nos permite vincular el tipo de tendencia con ciertas propiedades cualitativas del desarrollo del fenómeno. Nos parece que, en la mayoría de los casos, un método prácticamente aceptable es aquel que se basa en una comparación de las características de los cambios en las tasas de crecimiento de la serie dinámica en estudio con las características correspondientes de las curvas de crecimiento. Para la alineación, se selecciona la curva cuya ley de cambio en el crecimiento es más cercana a la ley de cambio en los datos reales.

A la hora de elegir la forma de la curva hay que tener en cuenta una circunstancia más. Aumentar la complejidad de la curva en varios casos puede aumentar la precisión de la descripción de la tendencia en el pasado; sin embargo, debido al hecho de que las curvas más complejas contienen más parámetros y potencias más altas de la variable independiente, sus intervalos de confianza serán, en general, significativamente más amplias que las de curvas más simples para el mismo período de anticipación.

Hoy en día, cuando el uso de programas especiales sin mucho esfuerzo permite construir simultáneamente varios tipos de ecuaciones, se utilizan ampliamente criterios estadísticos formales para determinar la mejor ecuación de tendencia.

De lo anterior, aparentemente, podemos concluir que elegir la forma de una curva para nivelar es una tarea que no se puede resolver de manera única, sino que se reduce a obtener una serie de alternativas. La elección final no puede residir en el campo del análisis formal, especialmente si, mediante la nivelación, se supone no sólo describir estadísticamente el patrón de comportamiento de niveles en el pasado, sino también extrapolar el patrón encontrado al futuro. Al mismo tiempo, diversas técnicas estadísticas para procesar datos de observación pueden aportar importantes beneficios; al menos con su ayuda, es posible rechazar opciones obviamente inadecuadas y, por lo tanto, limitar significativamente el campo de elección.

Consideremos los tipos de ecuaciones de tendencia más utilizados:

1. Forma de tendencia lineal:

¿Dónde está el nivel de fila obtenido como resultado de la alineación en línea recta? – nivel de tendencia inicial; – aumento absoluto medio, tendencia constante.

La forma lineal de la tendencia se caracteriza por la igualdad de las llamadas primeras diferencias (aumentos absolutos) y cero segundas diferencias, es decir, aceleraciones.

2. Forma de tendencia parabólica (polinomio de segundo grado):

(3.6)

Para este tipo de curva, las segundas diferencias (aceleración) son constantes y las terceras diferencias son cero.

La forma parabólica de la tendencia corresponde a un cambio acelerado o lento en los niveles de la serie con aceleración constante. Si< 0 и >0, entonces la parábola cuadrática tiene un máximo si > 0 y< 0 – минимум. Для отыскания экстремума первую производную параболы по t igualar a 0 y resolver la ecuación para t.

3. Forma de tendencia logarítmica:

, (3.7)

¿Dónde es la tendencia constante?

Una tendencia logarítmica puede describir una tendencia que se manifiesta en una desaceleración en el crecimiento de los niveles de una serie de dinámicas en ausencia de un valor máximo posible. Cuando sea lo suficientemente grande t la curva logarítmica se vuelve indistinguible de una línea recta.

4. Forma de tendencia multiplicativa (potencia):

(3.8)

5. Polinomio de 3er grado:

Naturalmente, hay muchas más curvas que describen las principales tendencias. Sin embargo, el formato del libro de texto no nos permite describir toda su diversidad. Las técnicas para construir modelos que se muestran a continuación permitirán al usuario utilizar de forma independiente otras funciones, en particular las inversas.

Para resolver el problema de suavizado analítico de series temporales en el sistema STATISTICA, necesitaremos crear una variable adicional en la hoja con los datos iniciales de la variable “VG2001-2010”, la cual debe estar activa.

Tenemos que construir una ecuación de tendencia, que es esencialmente una ecuación de regresión en la que el “tiempo” es un factor. Creamos una variable “T” que contiene intervalos de tiempo de 10 años (de 2001 a 2010). La variable "T" estará formada por números naturales del 1 al 10, correspondientes a los años especificados.

El resultado es la siguiente hoja de trabajo (Fig. 3.6)

Arroz. 3.6. Hoja de trabajo con variable de tiempo creada

A continuación, consideraremos un procedimiento que nos permite construir modelos de regresión tanto de tipo lineal como no lineal. Para hacer esto, elija: Estadísticas/Modelos lineales/no lineales avanzados/Estimación no lineal (Figura 3.7). En la ventana que aparece (Fig. 3.8), seleccione la función Regresión especificada por el usuario, mínimos cuadrados (Construcción de modelos de regresión por parte del usuario manualmente, los parámetros de la ecuación se encuentran utilizando el método de mínimos cuadrados (LSM)).

En el siguiente cuadro de diálogo (Fig. 3.9) haga clic en el botón Función a estimar para acceder a la pantalla de especificación manual del modelo (Fig. 3.10).

Arroz. 3.7. Ejecutando un procedimiento Estadística/Lineal Avanzado/

Modelos no lineales/Estimación no lineal

Arroz. 3.8. Ventana de procedimiento Estimación no lineal

Arroz. 3.9 Ventana de procedimiento Regresión especificada por el usuario, mínimos cuadrados

Arroz. 3.10. Ventana para implementar el procedimiento.

especificando manualmente la ecuación de tendencia

En la parte superior de la pantalla hay un campo para ingresar una función, en la parte inferior hay ejemplos de cómo ingresar funciones para diversas situaciones.

Antes de formar los modelos que nos interesan, es necesario aclarar algunas convenciones. Las variables de ecuación se especifican en el formato " v№", donde " v» denota variable ( De inglés « variable"), y "No" es el número de la columna en la que se ubica en la tabla de la hoja de cálculo con los datos de origen. Si hay muchas variables, entonces hay un botón a la derecha. Revisar variables , permitiéndole seleccionarlos de la lista por nombre y ver sus parámetros usando el botón Zoom (Figura 3.11).

Arroz. 3.11. Ventana para seleccionar una variable mediante un botón. Revisar variables

Los parámetros de las ecuaciones se indican con letras latinas que no denotan ninguna operación matemática. Para simplificar el trabajo, se propone denotar los parámetros de la ecuación como en la descripción de ecuaciones de tendencia, con la letra latina " A”, asignándoles secuencialmente números de serie. Los signos de las operaciones matemáticas (resta, suma, multiplicación, etc.) se especifican de la forma habitual. ventanas-formato de solicitud. No se requieren espacios entre los elementos de la ecuación.

Entonces, consideremos el primer modelo de tendencia: lineal.

Por lo tanto, después de escribirlo quedará así:

,

Dónde v 1 es una columna de la hoja con los datos de origen, que contiene los valores de la serie dinámica original; A 0 y A 1 – parámetros de la ecuación; v 2 – columna de la hoja con los datos originales, que contiene los valores de los intervalos de tiempo (variable T) (Fig. 3.12).

Después de esto, presione el botón dos veces. DE ACUERDO .

Arroz. 3.12. Ventana para configurar la ecuación de tendencia lineal

Arroz. 3.13. Marcador Rápido Procedimientos para estimar la ecuación de tendencia.

En la ventana que aparece (Fig. 3.13), puede seleccionar un método para estimar los parámetros de la ecuación de regresión ( Método de estimación ), si necesario. En nuestro caso, debemos ir al marcador. Avanzado y presione el botón Valores iniciales (Figura 3.14). En este cuadro de diálogo, se especifican los valores iniciales de los parámetros de la ecuación para encontrarlos usando el método de mínimos cuadrados, es decir sus valores mínimos. Inicialmente están configurados en 0,1 para todos los parámetros. En nuestro caso, podemos dejar estos valores en la misma forma, pero si los valores en nuestros datos de origen son menores que uno, entonces debemos establecerlos en la forma de 0,001 para todos los parámetros de la ecuación de tendencia ( Figura 3.15). A continuación, presione el botón DE ACUERDO .

Arroz. 3.14. Marcador Avanzado Procedimientos de estimación de ecuaciones de tendencia.

Arroz. 3.15. Ventana para configurar los valores iniciales de los parámetros de la ecuación de tendencia.

Arroz. 3.16. Marcador Rápido ventanas de resultados del análisis de regresión

en el marcador Rápido (Fig. 3.16) el significado de la línea es muy importante Proporción de varianza contabilizada , que corresponde al coeficiente de determinación; Es mejor escribir este valor por separado, ya que no se mostrará en el futuro y el usuario tendrá que calcular el coeficiente manualmente, y tres decimales son suficientes. A continuación, presione el botón Resumen: estimaciones de parámetros para obtener datos sobre los parámetros de la ecuación de tendencia lineal (Fig. 3.17).

Arroz. 3.17. Resultados del cálculo de los parámetros del modelo de tendencia lineal.

Columna Estimar – valores numéricos de los parámetros de la ecuación; Error estándar – error estándar del parámetro; valor t - valor calculado t-criterios; df – número de grados de libertad ( norte-2); nivel p – nivel de significancia calculado; Lo. Conf. Límite Y Arriba. Conf. Límite – límites superior e inferior respectivamente de los intervalos de confianza para los parámetros de la ecuación con una probabilidad especificada (indicada como Nivel de confianza en el campo superior de la tabla).

En consecuencia, la ecuación del modelo de tendencia lineal tiene la forma.

Después de eso, volvemos al análisis y hacemos clic en el botón Análisis de variación (análisis de varianza) en la misma pestaña Rápido (ver figura 3.16).

Arroz. 3.18. Resultados del análisis de varianza del modelo de tendencia lineal.

En la fila superior del encabezado de la tabla se dan cinco calificaciones:

Suma de cuadrados – suma de desviaciones al cuadrado; df – número de grados de libertad; Cuadrados medios – cuadrado medio; valor F – criterio de Fisher; valor p – nivel de significancia calculado F-criterios.

La columna de la izquierda indica la fuente de variación:

Regresión – variación explicada por la ecuación de tendencia; Residual – variación de los residuos – desviaciones de los valores reales de los ajustados (obtenidos de la ecuación de tendencia); Total – variación total de la variable.

En la intersección de columnas y filas, obtenemos indicadores definidos de forma única, cuyas fórmulas de cálculo se presentan en la Tabla. 3.2,

Tabla 3.2

Cálculo de indicadores de variación de modelos de tendencia.

Fuente df Suma de cuadrados Cuadrados medios valor F
Regresión metro
Residual Nuevo Méjico
Total norte
Total corregido n-1
Regresión vs. Total corregido metro RSS MSR

¿Dónde están los valores alineados de los niveles de la serie dinámica? – valores reales de los niveles de la serie dinámica; – valor medio de los niveles de la serie dinámica.

SSR (Suma de cuadrados de regresión) – suma de cuadrados de valores previstos; SSE (suma residual de cuadrados) – la suma de las desviaciones al cuadrado de los valores teóricos y reales (para calcular la varianza residual inexplicable); SST (Suma total de cuadrados) – la suma de la primera y segunda línea (la suma de los cuadrados de los valores reales); SSCT (Suma Total de Cuadrados Corregida) – la suma de las desviaciones al cuadrado de los valores reales del valor promedio (para calcular la dispersión total); Regresión vs. Suma Total de Cuadrados Corregida – repetición de la primera línea; MSR (regresión de cuadrados medios) – varianza explicada; MSE (cuadrados medios residuales) – varianza residual e inexplicable; MSCT (medias cuadráticas totales corregidas) – varianza total ajustada; Regresión vs. Cuadrados medios totales corregidos – repetición de la primera línea; Valor F de regresión - valor calculado F-criterios; Regresión vs. Valor F total corregido – valor calculado ajustado F-criterios; norte– número de niveles de la serie; metro– número de parámetros de la ecuación de tendencia.

Más lejos de nuevo en el marcador. Rápido (ver Fig. 3.16) presione el botón Valores previstos, residuos, etc. . Después de hacer clic en él, el sistema crea una tabla que consta de tres columnas (Fig. 3.19).

Observado – valores observados (es decir, niveles de la serie temporal original);

Según la fórmula (9.29), los parámetros de la tendencia lineal son iguales. un = 1894/11 = 172,2 centavos/ha; b= 486/110 = 4.418 c/ha. La ecuación de tendencia lineal tiene la forma:

y = 172,2 + 4,418t, Dónde t = 0 en 1987. Esto significa que el nivel promedio real y nivelado se refiere a la mitad del período, es decir. en 1991, 172 c/ha por año; el aumento medio anual es de 4.418 c/ha por año;

Los parámetros de la tendencia parabólica según (9.23) son iguales a segundo = 4,418; a = 177,75; c =-0,5571. La ecuación de tendencia parabólica tiene la forma у̃ = 177,75 + 4,418t - 0.5571t2; t= 0 en 1991. Esto significa que el aumento absoluto del rendimiento se desacelera en un promedio de 2,0,56 c/ha por año. El crecimiento absoluto en sí ya no es una constante de la tendencia parabólica, sino un valor medio para el período. En el año tomado como punto de partida, es decir 1991, la tendencia pasa por el punto con ordenadas 77,75 c/ha; El término libre de una tendencia parabólica no es el nivel medio del período. Los parámetros de tendencia exponencial se calculan utilizando las fórmulas (9.32) y (9.33) ln A= 56,5658/11 = 5,1423; potenciando, obtenemos A= 171,1; en k= 2,853:110 = 0,025936; potenciando, obtenemos k = 1,02628.

La ecuación de tendencia exponencial es: y = 171,1 1,02628 t.

Esto significa que la tasa de rendimiento promedio anual del período fue de 102,63%. En el punto K tomado como punto de partida, la tendencia pasa por el punto con ordenada 171,1 c/ha.

Los niveles calculados utilizando las ecuaciones de tendencia están escritos en las últimas tres columnas de la tabla. 9.5. Como se desprende de estos datos. Los valores calculados de los niveles para los tres tipos de tendencias no difieren mucho, ya que tanto la aceleración de la parábola como la tasa de crecimiento exponencial son pequeñas. Una parábola tiene una diferencia significativa: el crecimiento de los niveles se ha detenido desde 1995, mientras que con una tendencia lineal los niveles continúan creciendo y con una tendencia exponencial su ritmo se acelera. Por lo tanto, para los pronósticos para el futuro, estas tres tendencias no son iguales: al extrapolar la parábola a años futuros, los niveles divergirán marcadamente de la línea recta y la exponencial, como se puede ver en la tabla. 9.6. Esta tabla muestra una copia impresa de la solución en una PC usando el programa Statgraphics para las mismas tres tendencias. La diferencia entre sus términos libres y los indicados anteriormente se explica por el hecho de que el programa numera los años no desde el medio, sino desde el principio, de modo que los términos libres de las tendencias se refieren a 1986, para lo cual t = 0. La ecuación exponencial en la impresión se deja en forma logarítmica. La previsión se realiza con 5 años de antelación, es decir. hasta 2001. Cuando cambia el origen de las coordenadas (referencia de tiempo) en la ecuación de la parábola, el aumento absoluto promedio, el parámetro b. ya que, como resultado de la aceleración negativa, el crecimiento disminuye todo el tiempo, y su máximo es al inicio del período. La única constante de una parábola es la aceleración.


La línea “Datos” muestra los niveles de la serie original; "Resumen de previsión" significa un resumen de los datos de previsión. En las siguientes líneas hay ecuaciones de línea recta, parábolas, exponentes, en forma logarítmica. La columna ME significa la diferencia promedio entre los niveles de la serie original y los niveles de tendencia (alineados). Para una línea recta y una parábola, esta discrepancia es siempre cero. Los niveles de exponente son en promedio 0,48852 más bajos que los niveles de la serie original. Es posible una coincidencia exacta si la verdadera tendencia es exponencial; En este caso no hay coincidencia, pero la diferencia es pequeña. La gráfica MAE es la varianza. t 2 - una medida de la variabilidad de los niveles reales en relación con la tendencia, como se analiza en el párrafo 9.7. Columna MAE: desviación lineal promedio de los niveles con respecto a la tendencia en valor absoluto (ver párrafo 5.8); columna MARE: desviación lineal relativa como porcentaje. Aquí se presentan como indicadores de la idoneidad del tipo de tendencia seleccionado. La parábola tiene un módulo de dispersión y desviación menor: para el período 1986 - 1996. más cerca de los niveles reales. Pero la elección del tipo de tendencia no puede reducirse únicamente a este criterio. De hecho, la desaceleración del crecimiento es el resultado de una gran desviación negativa, es decir, una mala cosecha en 1996.

La segunda mitad del cuadro es un pronóstico de los niveles de rendimiento para tres tipos de tendencias durante años; t = 12, 13, 14, 15 y 16 desde el origen (1986). Los niveles previstos para la exponencial hasta el año 16 no son mucho más altos que para la línea recta. Los niveles de la tendencia parabólica están disminuyendo, divergiendo cada vez más de otras tendencias.

Como se puede observar en la tabla. 9.4, al calcular los parámetros de tendencia, los niveles de la serie original se incluyen con diferentes pesos - valores tp y sus plazas. Por lo tanto, la influencia de las fluctuaciones de nivel en los parámetros de tendencia depende de si se trata de un año de cosecha o de escasez. Si se produce una desviación pronunciada en un año con un número cero ( t i = 0), entonces no tendrá ningún efecto sobre los parámetros de tendencia, pero si llega al principio y al final de la serie, tendrá un fuerte efecto. En consecuencia, una única alineación analítica no libera completamente los parámetros de tendencia de la influencia de las fluctuaciones y, en caso de fuertes fluctuaciones, pueden distorsionarse enormemente, como sucedió con la parábola de nuestro ejemplo. Para eliminar aún más la influencia distorsionante de las fluctuaciones en los parámetros de tendencia, se debe aplicar método de alineación deslizante múltiple.

Esta técnica consiste en que los parámetros de tendencia no se calculan inmediatamente para toda la serie, sino mediante un método deslizante, primero para la primera t periodos de tiempo o momentos, luego para el periodo del 2º al t+ 1, del 3 al (t + 2) nivel, etc. Si el número de niveles iniciales de la serie es igual a PAG, y la longitud de cada base deslizante para el cálculo de parámetros es igual a T, entonces el número de dichas bases móviles t o valores de parámetros individuales que se determinarán a partir de ellas será:

l = norte + 1 - T.

El uso de la técnica de alineación múltiple deslizante, como se puede ver en los cálculos anteriores, sólo es posible con un número suficientemente grande de niveles en la serie, normalmente 15 o más. Consideremos esta técnica usando los datos de la Tabla 1 como ejemplo. 9.4 - dinámica de los precios de los bienes distintos de los combustibles en los países en desarrollo, que nuevamente brinda al lector la oportunidad de participar en un pequeño estudio científico. Utilizando el mismo ejemplo, continuaremos con la técnica de pronóstico en la Sección 9.10.

Si calculamos los parámetros de nuestra serie en períodos de 11 años (en 11 niveles), entonces t= 17 + 1 - 11 = 7. El significado de alineación deslizante múltiple es que con cambios sucesivos en la base para calcular los parámetros, en los extremos y en el medio habrá diferentes niveles con desviaciones de la tendencia de diferente signo y magnitud. Por lo tanto, con algunos cambios en la base, los parámetros se sobreestimarán, con otros, se subestimarán y con el posterior promedio de los valores de los parámetros sobre todos los cambios de la base de cálculo, habrá una mayor cancelación mutua de distorsiones. en los parámetros de tendencia por fluctuaciones en los niveles.

La alineación deslizante múltiple no solo le permite obtener una estimación más precisa y confiable de los parámetros de tendencia, sino también controlar la elección correcta del tipo de ecuación de tendencia. Si resulta que el parámetro de tendencia principal, su constante cuando se calcula utilizando bases móviles, no fluctúa aleatoriamente, sino que cambia sistemáticamente su valor de manera significativa, entonces el tipo de tendencia se eligió incorrectamente, este parámetro no es una constante .

En cuanto al término libre durante la ecualización múltiple, no es necesario y, además, es simplemente incorrecto calcular su valor como el promedio de todos los cambios de base, porque con este método los niveles individuales de la serie original se incluirían en el cálculo. del promedio con pesos diferentes, y la suma de los niveles igualados divergiría con la suma de los términos de la serie original. El término libre de la tendencia es el valor promedio del nivel para el período, siempre que el tiempo se cuente desde la mitad del período. Al contar desde el principio, si el primer nivel yo= 1, el término libre será igual a: a 0 = у̅ - b((N-1)/2). Se recomienda que la longitud de la base móvil para calcular los parámetros de tendencia sea de al menos 9 a 11 niveles para amortiguar suficientemente las fluctuaciones de nivel. Si la fila inicial es muy larga, la base puede tener hasta 0,7 - 0,8 de su longitud. Para eliminar la influencia de las fluctuaciones periódicas (cíclicas) largas en los parámetros de tendencia, el número de cambios de base debe ser igual o múltiplo de la duración del ciclo de oscilación. Luego, el principio y el final de la base "recorrerán" secuencialmente todas las fases del ciclo y, al promediar el parámetro en todos los cambios, sus distorsiones por oscilaciones cíclicas se cancelarán entre sí. Otra forma es tomar la longitud de la base móvil igual a la longitud del ciclo, de modo que el inicio y el final de la base siempre caigan en la misma fase del ciclo de oscilación.

Ya que según la tabla. 9.4, ya se ha establecido que la tendencia tiene forma lineal, calculamos el aumento absoluto anual promedio, es decir, el parámetro b ecuaciones de tendencia lineal de forma móvil sobre bases de 11 años (ver Tabla 9.7). También contiene el cálculo de los datos necesarios para el posterior estudio de variabilidad en el apartado 9.7. Echemos un vistazo más de cerca a la técnica de alineación múltiple utilizando bases deslizantes. Calculemos el parámetro. b para todas las bases de datos:


Más amenudo la tendencia está representada por una relación lineal del tipo que se estudia

donde y es la variable de interés (por ejemplo, productividad) o la variable dependiente;
x es un número que determina la posición (segundo, tercero, etc.) del año en el período de pronóstico o una variable independiente.

Cuando se aproxima linealmente la relación entre dos parámetros, el método de mínimos cuadrados se utiliza con mayor frecuencia para encontrar los coeficientes empíricos de una función lineal. La esencia del método es que la función lineal de "mejor ajuste" pasa a través de los puntos del gráfico correspondientes al mínimo de la suma de las desviaciones al cuadrado del parámetro medido. Esta condición se parece a:

donde n es el volumen de la población en estudio (el número de unidades de observación).

Arroz. 5.3. Construyendo una tendencia usando el método de mínimos cuadrados

Los valores de las constantes b y a o el coeficiente de la variable X y el término libre de la ecuación están determinados por la fórmula:

En mesa 5.1 muestra un ejemplo de cálculo de una tendencia lineal a partir de datos.

Tabla 5.1. Cálculo de tendencia lineal

Métodos para suavizar las oscilaciones.

Si existen fuertes discrepancias entre valores vecinos, la tendencia obtenida mediante el método de regresión es difícil de analizar. Al pronosticar, cuando una serie contiene datos con una gran variedad de fluctuaciones en los valores vecinos, se deben suavizar de acuerdo con ciertas reglas y luego buscar el significado en el pronóstico. Al método de suavizar las oscilaciones.
Incluye: método de promedio móvil (se calcula el promedio de n puntos), método de suavizado exponencial. Mirémoslos.

Método de media móvil (MAM).

MSS le permite suavizar una serie de valores para resaltar una tendencia. Este método toma el promedio (normalmente la media aritmética) de un número fijo de valores. Por ejemplo, una media móvil de tres puntos. Se toman los primeros tres valores, recopilados a partir de datos de enero, febrero y marzo (10 + 12 + 13), y se determina que el promedio es 35: 3 = 11,67.

El valor resultante de 11,67 se coloca en el centro del rango, es decir según la línea de febrero. Luego nos “deslizamos un mes” y tomamos los segundos tres números, de febrero a abril (12 + 13 + 16), y calculamos el promedio igual a 41: 3 = 13,67, y de esta manera procesamos los datos para el serie entera. Los promedios resultantes representan una nueva serie de datos para construir una tendencia y su aproximación. Cuantos más puntos se toman para calcular la media móvil, más fuerte se suavizan las fluctuaciones. En la tabla se muestra un ejemplo de MBA de construcción de tendencias. 5.2 y en la Fig. 5.4.

Tabla 5.2 Cálculo de tendencias utilizando el método de media móvil de tres puntos

La naturaleza de las fluctuaciones en los datos originales y los datos obtenidos mediante el método de media móvil se ilustra en la Fig. 5.4. Al comparar los gráficos de la serie de valores iniciales (serie 3) y las medias móviles de tres puntos (serie 4), queda claro que las fluctuaciones se pueden suavizar. Cuanto mayor sea el número de puntos involucrados en el rango de cálculo de la media móvil, más claramente surgirá la tendencia (fila 1). Pero el procedimiento de ampliación del rango conduce a una reducción en el número de valores finales y esto reduce la precisión del pronóstico.

Los pronósticos deben realizarse a partir de estimaciones de la línea de regresión basadas en los valores de los datos iniciales o promedios móviles.

Arroz. 5.4. La naturaleza de los cambios en el volumen de ventas por mes del año:
datos iniciales (fila 3); medias móviles (fila 4); suavizado exponencial (fila 2); tendencia construida mediante el método de regresión (fila 1)

Método de suavizado exponencial.

Un enfoque alternativo para reducir la dispersión de los valores de las series es utilizar el método de suavizado exponencial. El método se denomina “suavizado exponencial” debido a que cada valor de los períodos del pasado se reduce en un factor (1 – α).

Cada valor suavizado se calcula utilizando una fórmula de la forma:

St =aYt +(1−α)St−1,

donde St es el valor suavizado actual;
Yt – valor actual de la serie temporal; St – 1 – valor suavizado anterior; α es una constante de suavizado, 0 ≤ α ≤ 1.

Cuanto menor sea el valor de la constante α, menos sensible será a los cambios de tendencia en una serie de tiempo determinada.

La ecuación de tendencia lineal es y = at + b.

Los parámetros de las ecuaciones de la función de tendencia se encuentran utilizando la teoría de correlación utilizando el método de mínimos cuadrados.

1. Método de mínimos cuadrados.
El método de mínimos cuadrados (LSM) es una de las formas de contrarrestar los errores de medición (como en Física, error de desviación).
Este método se suele utilizar para encontrar los parámetros de ecuaciones (Rectas, hipérbolas, parábolas, etc.)
Este método implica minimizar la suma de las desviaciones al cuadrado.
El significado de MNC se puede expresar a través de este gráfico.

2. Análisis de la precisión de determinar las estimaciones de los parámetros de la ecuación de tendencia (usando la tabla de Student, encontramos la tabla TT y hacemos un pronóstico de intervalo, es decir, identificamos el error cuadrático medio)

3. Probar hipótesis sobre los coeficientes de la ecuación de tendencia lineal (estadística, prueba de Student, prueba de Fisher)

Pruebas de autocorrelación de residuos.
Un requisito previo importante para construir un modelo de regresión cualitativo utilizando MCO es la independencia de los valores de las desviaciones aleatorias de los valores de las desviaciones en todas las demás observaciones. De este modo se garantiza que no exista correlación entre desviaciones eventuales y, en particular, entre desviaciones adyacentes.
Autocorrelación (correlación serial) La autocorrelación de residuos (varianzas) es común en el análisis de regresión cuando se utilizan datos de series de tiempo y muy rara cuando se utilizan datos transversales.
Comprobando la heterocedasticidad.
1) Mediante análisis gráfico de residuos..
En este caso, los valores de la variable explicativa X se trazan a lo largo del eje de abscisas y las desviaciones e i o sus cuadrados e 2 i se trazan a lo largo del eje de ordenadas.
Si existe una cierta conexión entre las desviaciones, entonces se produce heterocedasticidad. La ausencia de dependencia probablemente indicará la ausencia de heterocedasticidad.
2) Utilizando la prueba de correlación de rangos de Spearman.
Coeficiente de correlación de rangos de Spearman.

36. Métodos para medir la estabilidad de las tendencias dinámicas (coeficiente de rango de Spearman).

El concepto de “sostenibilidad” se utiliza de formas muy diferentes. En relación al estudio científico de la dinámica, consideraremos dos aspectos de este concepto: 1) la estabilidad como categoría opuesta a la fluctuación; 2) estabilidad de la dirección del cambio, es decir sostenibilidad de la tendencia.

La estabilidad en el segundo sentido caracteriza no los niveles en sí, sino el proceso de su cambio dirigido. Se puede averiguar, por ejemplo, qué tan sostenible es el proceso de reducción de los costos de recursos específicos para la producción de una unidad de producción, si es sostenible la tendencia a reducir la mortalidad infantil, etc. Desde este punto de vista, la estabilidad total de un cambio direccional en los niveles de una serie dinámica se debe considerar un cambio en el proceso del cual cada nivel siguiente es superior a todos los anteriores (crecimiento sostenido), o inferior a todos los anteriores (disminución sostenida). Cualquier violación de la secuencia estrictamente clasificada de niveles indica una estabilidad incompleta de los cambios.


De la definición del concepto de estabilidad de tendencia también se desprende el método para construir su indicador. Como indicador de estabilidad, se puede utilizar el coeficiente de correlación de rango de Spearman - rx.

donde n es el número de niveles;

I es la diferencia entre los rangos de niveles y el número de períodos de tiempo.

Si hay total coincidencia entre los rangos de niveles, comenzando desde el más bajo, y el número de períodos (momentos) de tiempo en su orden cronológico, el coeficiente de correlación de los rangos es igual a +1. Este valor corresponde al caso de estabilidad total de niveles crecientes. Cuando los rangos de niveles son completamente opuestos a los rangos de años, el coeficiente de Spearman es igual a -1, lo que significa la completa estabilidad del proceso de reducción de niveles. Con una alternancia caótica de rangos de niveles, el coeficiente es cercano a cero, lo que significa inestabilidad de cualquier tendencia.

Un valor de rx negativo indica una tendencia a la baja en los niveles y la sostenibilidad de esta tendencia está por debajo del promedio.

Hay que tener en cuenta que incluso con una estabilidad del 100% de la tendencia, pueden producirse fluctuaciones en los niveles de la dinámica y el coeficiente de su estabilidad será inferior al 100%. Con fluctuaciones débiles, pero una tendencia aún más débil, por el contrario, es posible un coeficiente de estabilidad de alto nivel, pero un coeficiente de estabilidad de tendencia cercano a cero. En general, ambos indicadores, por supuesto, están directamente relacionados: la mayoría de las veces, se observa una mayor estabilidad de los niveles simultáneamente con una mayor estabilidad de la tendencia.

37. Modelar la tendencia de una serie de dinámicas en presencia de cambios estructurales.

Los cambios puntuales en la naturaleza de una tendencia de una serie temporal causados ​​por cambios estructurales en la economía u otros factores deben distinguirse de las fluctuaciones estacionales y cíclicas. En este caso, a partir de un determinado momento t, la naturaleza de la dinámica del indicador en estudio cambia, lo que conduce a un cambio en los parámetros de la tendencia que describe esta dinámica.

El momento t va acompañado de cambios significativos en una serie de factores que tienen un fuerte impacto en el indicador en estudio. Modelar la tendencia de una serie de tiempo en presencia de cambios estructurales. Muy a menudo, estos cambios son causados ​​por cambios en el panorama económico general. situación o eventos globales que llevaron a un cambio en la estructura de la economía. Si la serie temporal en estudio incluye el momento correspondiente, entonces una de las tareas de su estudio es aclarar la cuestión de si los cambios estructurales generales influyeron significativamente en la naturaleza de esta tendencia.

Si esta influencia es significativa, entonces se deben utilizar modelos de regresión lineal por partes para modelar la tendencia de esta serie temporal, es decir, divida la población original en 2 subpoblaciones (antes del tiempo t y después) y construya ecuaciones de regresión lineal por separado para cada subpoblación.

Si los cambios estructurales han tenido un ligero efecto en la naturaleza de la tendencia de la serie, entonces se puede escribir usando una ecuación de tendencia que sea uniforme para todo el conjunto de datos.

Cada uno de los enfoques descritos anteriormente tiene sus lados positivos y negativos. Al construir un modelo lineal por partes, la suma residual de cuadrados se reduce en comparación con la ecuación de tendencia que es uniforme para toda la población. Pero dividir la población en partes conduce a una pérdida del número de observaciones y a una disminución del número de grados de libertad en cada ecuación del modelo lineal por partes. La construcción de una ecuación de tendencia única le permite mantener el número de observaciones en la población original, pero la suma residual de cuadrados de esta ecuación será mayor en comparación con el modelo lineal por partes. Obviamente, la elección del modelo depende de la relación entre la reducción de la varianza residual y la pérdida en el número de grados de libertad al pasar de una ecuación de regresión única a un modelo lineal por partes.

38. Análisis de regresión de series temporales conectadas.

Las series de tiempo multivariadas que muestran la dependencia de una característica efectiva de una o más factoriales se denominan series de dinámica conectada. El uso de métodos de mínimos cuadrados para procesar series de tiempo no requiere hacer suposiciones sobre las leyes de distribución de los datos iniciales. Sin embargo, al utilizar el método de mínimos cuadrados para procesar series conectadas, se debe tener en cuenta la presencia de autocorrelación (autorregresión), que no se tuvo en cuenta al procesar series temporales unidimensionales, ya que su presencia contribuyó a una visualización más densa y clara. identificación de la tendencia de desarrollo del fenómeno socioeconómico considerado a lo largo del tiempo.

Detección de autocorrelación en los niveles de una serie de dinámicas.

En la dinámica de los procesos económicos existe una relación entre niveles, especialmente los que se encuentran muy cerca. Es conveniente presentarlo en forma de correlación entre la serie y1,y2,y3,…..yn h y1+h, y2+h,…, yn+h. El desplazamiento temporal L se denomina desplazamiento y el fenómeno de interconexión en sí se denomina autocorrelación.

La dependencia de la autocorrelación es especialmente significativa entre los niveles anteriores y posteriores de la serie dinámica.

Hay dos tipos de autocorrelación:

Autocorrelación en observaciones de una o más variables;

Autocorrelación de errores o autocorrelación en desviaciones de tendencia.

La presencia de este último conduce a una distorsión de los valores de los errores cuadráticos medios de los coeficientes de regresión, lo que dificulta la construcción de intervalos de confianza para los coeficientes de regresión, así como la comprobación de su significancia.

La autocorrelación se mide utilizando el coeficiente de autocorrelación cíclica, que se puede calcular no sólo entre niveles adyacentes, es decir, desplazados en un período, pero también entre desplazados en cualquier número de unidades de tiempo (L). Este cambio, llamado desfase temporal, también determina el orden de los coeficientes de autocorrelación: primer orden (en L=1), segundo orden (en L=2), etc. Sin embargo, el mayor interés para el estudio es el cálculo del coeficiente no cíclico (primer orden), ya que las distorsiones más severas de los resultados del análisis surgen cuando existe una correlación entre los niveles iniciales de la serie y los mismos niveles desplazados por una unidad de tiempo.

Para juzgar la presencia o ausencia de autocorrelación en la serie en estudio, el valor real de los coeficientes de autocorrelación se compara con el valor tabulado (crítico) para el nivel de significancia del 5% o 1%.

Si el valor real del coeficiente de autocorrelación es menor que el valor tabulado, entonces se puede aceptar la hipótesis sobre la ausencia de autocorrelación en la serie. Cuando el valor real es mayor que el valor tabulado, podemos concluir que existe autocorrelación en la serie dinámica.



¿Te gustó el artículo? ¡Compartir con tus amigos!