Regresión parabólica y polinómica. Regresión parabólica La ecuación de la función de regresión parabólica refleja la dinámica del desarrollo.

Otro tipo de regresión unifactorial es la aproximación mediante polinomios de potencias de la forma:

Es natural querer obtener la dependencia más simple posible, limitándonos a polinomios de potencia de segundo grado, es decir dependencia parabólica:
(5.5.2)

Calculemos las derivadas parciales con respecto a los coeficientes. b 0 , b 1 Y b 2 :



(5.5.3)

Igualando las derivadas a cero, obtenemos un sistema normal de ecuaciones:

(5.5.4)

Resolver el sistema de ecuaciones normales (5.5.2) para un caso específico de valores incógnita i * , y i * ;
obtenemos valores optimos b 0 , b 1 Y b 2 . Para la aproximación por dependencia (5.5.2) y más aún (5.5.1), no se han obtenido fórmulas simples para calcular los coeficientes y, por regla general, se calculan mediante procedimientos estándar en forma matricial:

(5.5.5)

La Figura 5.5.1 muestra un ejemplo típico de aproximación por dependencia parabólica:

9 (5;9)

(1;1)

1

1 2 3 4 5x

Fig.5.5.1. Coordenadas de puntos experimentales y aproximadas.

su dependencia parabólica

Ejemplo 5.1. Aproximar los resultados experimentales dados en la Tabla 5.1.1 con una ecuación de regresión lineal.
.

Tabla 5.1.1

Construyamos puntos experimentales de acuerdo con las coordenadas indicadas en la Tabla 5.1.1 en el gráfico presentado en la Fig. 5.1.1.

en

9

4

1 2 3 4 5x

De acuerdo con la Fig. 5.1.1, sobre la cual trazaremos una línea recta para una evaluación preliminar, concluiremos que existe una no linealidad claramente expresada en la ubicación de los puntos experimentales, pero no es muy significativa y por lo tanto tiene sentido. aproximarlos con una dependencia lineal. Tenga en cuenta que para obtener una conclusión matemática correcta, es necesario construir una línea recta utilizando el método de mínimos cuadrados.

Antes de realizar el análisis de regresión, es aconsejable calcular

coeficiente de correlación lineal entre variables incógnita Y en:

La importancia de la relación de correlación está determinada por el valor crítico del coeficiente de correlación lineal, calculado mediante la fórmula:

Valor crítico del test de Student t Creta encontrado según tablas estadísticas para el nivel de significancia recomendado α=0,05 y para norte-2 grados de libertad. Si el valor calculado r xy no menos que el valor crítico r Creta, entonces la correlación entre las variables incógnita Y y considerado esencial. Hagamos los cálculos:










Debido al hecho de que
Concluimos que la correlación entre las variables. incógnita Y en es significativo y puede ser lineal.

Calculemos los coeficientes de la ecuación de regresión:

Así, obtuvimos una ecuación de regresión lineal:

Usando la ecuación de regresión, trazamos una línea recta en la Fig. 5.1.2.

y (5;9.8)

9

4

(0;-0.2) 1 2 3 4 5x

Fig.5.1.2. Coordenadas de puntos experimentales y aproximadas.

su dependencia lineal

Utilizando la ecuación de regresión, calculamos los valores de la función con base en los puntos experimentales de la Tabla 5.1.1 y la diferencia entre los valores experimentales y calculados de la función, que presentamos en la Tabla 5.1.2.

Tabla 5.1.2


Calculemos el error cuadrático medio y su relación con el valor promedio:

En cuanto a la relación entre el error estándar y el valor medio, se obtuvo un resultado insatisfactorio, ya que se superó el valor recomendado de 0,05.

Evaluamos el nivel de significancia de los coeficientes de la ecuación de regresión utilizando la prueba t de Student:


De la tabla estadística de 3 grados de libertad, escribamos las líneas con el nivel de significancia - y el valor del criterio de Student t al cuadro 5.1.3.

Tabla 5.1.3

Nivel de significancia de los coeficientes de la ecuación de regresión:


Tenga en cuenta que según el nivel de significancia del coeficiente se obtuvo un resultado satisfactorio, y para el coeficiente insatisfactorio.

Evaluamos la calidad de la ecuación de regresión resultante utilizando indicadores calculados sobre la base del análisis de varianza:

Examen:

El resultado de la verificación es positivo, lo que indica la exactitud de los cálculos realizados.

Calculemos el criterio de Fisher:

con dos grados de libertad:

Utilizando tablas estadísticas, encontramos los valores críticos del criterio de Fisher para dos gradaciones recomendadas del nivel de significancia:


Dado que el valor calculado de la prueba de Fisher excede el valor crítico para el nivel de significancia de 0,01, asumiremos que el nivel de significancia según la prueba de Fisher es inferior a 0,01, lo que se considerará satisfactorio.

Calculemos el coeficiente de determinación múltiple:

para dos grados de libertad

Utilizando la tabla estadística para el nivel de significancia recomendado de 0,05 y dos grados de libertad encontrados, encontramos el valor crítico del coeficiente de determinación múltiple:

Dado que el valor calculado del coeficiente de determinación múltiple excede el valor crítico para el nivel de significancia
, entonces el nivel de significancia según el coeficiente de determinación múltiple
y el resultado obtenido para el indicador presentado se considerará satisfactorio.

Por lo tanto, los parámetros calculados obtenidos en términos de la relación entre el error estándar y el valor medio y el nivel de significancia según la prueba de Student son insatisfactorios, por lo que es aconsejable seleccionar otra dependencia aproximada para la aproximación.

Ejemplo 5.2. Aproximación de la distribución experimental de números aleatorios mediante una dependencia matemática.

La distribución experimental de números aleatorios dada en la Tabla 5.1.1, cuando se aproxima mediante una dependencia lineal, no condujo a un resultado satisfactorio, incl. debido a la insignificancia del coeficiente de la ecuación de regresión con término libre, por tanto, para mejorar la calidad de la aproximación intentaremos realizarla utilizando una dependencia lineal sin término libre:

Calculemos el valor del coeficiente de la ecuación de regresión:

Así, obtuvimos la ecuación de regresión:

Utilizando la ecuación de regresión obtenida, calculamos los valores de la función y la diferencia entre los valores experimentales y calculados de la función, que presentamos en forma de tabla 5.2.1.

Tabla 5.2.1

incógnita i

Según la ecuación de regresión
en la Fig. 5.2.1 trazaremos una línea recta.

y (5;9.73 )

(0;0) 1 2 3 4 5x

Fig.5.2.1. Coordenadas de puntos experimentales y aproximadas.

su dependencia lineal

Para evaluar la calidad de la aproximación, realizaremos cálculos de indicadores de calidad similares a los cálculos dados en el ejemplo 5.1.

(sigue siendo viejo);

con 4 grados de libertad;

Para

Con base en los resultados de la aproximación, observamos que en términos del nivel de significancia del coeficiente de la ecuación de regresión se obtuvo un resultado satisfactorio; La relación entre el error estándar y la media ha mejorado, pero aún se mantiene por encima del valor recomendado de 0,05, por lo que se recomienda repetir la aproximación con una relación matemática más compleja.

Ejemplo 5.3. Para mejorar la calidad de la aproximación de los ejemplos 5.1 y 5.2, realizaremos una aproximación no lineal por la dependencia
. Para hacer esto, primero haremos cálculos intermedios y colocaremos sus resultados en la tabla 5.3.1.

Valores

Tabla 5.3.1

incógnita 2

(lnX) 2

lnX lnY

Calculemos adicionalmente:

Aproximaremos la dependencia
. Usando las fórmulas (5.3.7), (5.3.8) calculamos los coeficientes b 0 Y b 1 :

Usando las fórmulas (5.3.11) calculamos los coeficientes. A 0 Y A 1 :


Para calcular el error estándar se realizaron cálculos intermedios, presentados en la Tabla 5.3.2.

Tabla 5.3.2

Y i

y i

Cantidad: 7.5968

El error estándar de aproximación resultó ser mucho mayor que en los dos ejemplos anteriores, por lo que consideramos los resultados de la aproximación inutilizables.

Ejemplo 5.4. Intentemos aproximarnos con otra dependencia no lineal.
. Usando las fórmulas (5.3.9), (5.3.10) según la tabla 5.3.1, calculamos los coeficientes b 0 Y b 1 :

Tenemos una dependencia intermedia:

Usando las fórmulas (5.3.13), calculamos los coeficientes. do 0 Y do 1 :


Obtuvimos la dependencia final:

Para calcular el error estándar realizaremos cálculos intermedios y los ubicaremos en la tabla 5.4.1.

Tabla 5.4.1

Y i

y i

Cantidad: 21.83152

Calculemos el error estándar:

El error estándar de aproximación resultó ser mucho mayor que en el ejemplo anterior, por lo que consideramos los resultados de la aproximación inutilizables.

Ejemplo 5.5. Aproximación de la distribución experimental de números aleatorios mediante una dependencia matemática. y = b · lnx

Los datos iniciales, como en los ejemplos anteriores, se muestran en la Tabla 5.4.1 y la Fig. 5.4.1.

Tabla 5.4.1

Con base en el análisis de la Fig. 5.4.1 y la Tabla 5.4.1, observamos que con valores más pequeños del argumento (al comienzo de la tabla) la función cambia más que con valores más grandes (al final de la tabla), por lo que parece aconsejable cambiar la escala del argumento e introducir una función logarítmica en la ecuación de regresión y aproximarla con la siguiente dependencia matemática:

. Usando la fórmula (5.4.3) calculamos el coeficiente b:

Para evaluar la calidad de la aproximación, realizaremos cálculos intermedios presentados en la Tabla 5.4.2, a partir de los cuales calcularemos la magnitud del error y la relación entre el error estándar y el valor promedio.

Tabla 5.4.2


Dado que la relación entre el error estándar y el valor medio excede el valor recomendado de 0,05, el resultado se considerará insatisfactorio. En particular, observamos que la mayor desviación viene dada por el valor x=1, ya que con este valor lnx=0. Por lo tanto, aproximaremos la dependencia y = b 0 +b 1 lnx

Presentamos cálculos auxiliares en forma de tabla 5.4.3.

Tabla 5.4.3

Usando las fórmulas (5.4.6) y (5.4.7) calculamos los coeficientes b 0 y b 1 :

9 (5;9.12)

4

1 (1;0.93)

1 2 3 4 5x

Para evaluar la calidad de la aproximación, realizaremos cálculos auxiliares y determinaremos el nivel de significancia de los coeficientes encontrados y la relación entre el error estándar y el valor promedio.

Nivel de significancia ligeramente por encima del valor recomendado de 0,05 (
).


Debido al hecho de que según el indicador principal, la relación entre el error estándar y el valor promedio, se obtuvo un exceso de casi el doble del nivel recomendado de 0,05, consideraremos los resultados aceptables. Tenga en cuenta que el valor calculado de la prueba de Student t b 0 =2,922 diferente de crítico
en una cantidad relativamente pequeña.

Ejemplo 5.6. Aproximaremos los datos experimentales del ejemplo 5.1 mediante la dependencia hiperbólica
. Para calcular los coeficientes b 0 y b 1 Llevemos a cabo los cálculos preliminares que figuran en la Tabla 5.6.1.

Tabla 5.6.1

incógnita i

incógnita i =1/X i

incógnita i 2

incógnita i y i

Con base en los resultados de la Tabla 5.6.1 usando las fórmulas (5.4.8) y (5.4.9), calculamos los coeficientes b 0 y b 1 :

Así, se obtiene una ecuación de regresión hiperbólica.

.

Los resultados de los cálculos auxiliares para evaluar la calidad de la aproximación se dan en la Tabla 5.6.2.

Tabla 5.6.2

incógnita i

Con base en los resultados de la Tabla 5.6.2, calculamos el error estándar y la relación entre el error estándar y el valor medio:


Debido a que la relación entre el error estándar y el valor medio excede el valor recomendado de 0,05, concluimos que los resultados de la aproximación no son adecuados.

Ejemplo 5.7.

Para calcular valores específicos de ingresos por la operación de grúas de bandera en función del tiempo de los trabajos de mantenimiento, es necesario obtener una dependencia parabólica.

Calculemos los coeficientes de esta dependencia. b 0 , b 1 , b 11 en forma matricial según la fórmula:

Las ecuaciones de regresión no lineal que conectan el indicador efectivo con los valores óptimos para realizar el mantenimiento preventivo de grúas torre se obtuvieron mediante el procedimiento de regresión múltiple del paquete de aplicación Statistica 6.0. A continuación, presentamos los resultados del análisis de regresión para el indicador de desempeño efectivo según la Tabla 5.7.1.

Tabla 5.7.1

La Tabla 5.7.2 muestra los resultados de la regresión no lineal para el indicador de desempeño efectivo y la Tabla 5.7.3 muestra los resultados del análisis de residuos.

Tabla 5.7.2

Tabla 5.7.3

Arroz. 3.7.36. Análisis de residuos.

Así, obtuvimos una ecuación de regresión múltiple para la variable
:

Relación entre error estándar y media:

14780/1017890=0,0145 < 0,05.

Dado que la relación entre el error estándar y el valor promedio no excede el valor recomendado de 0,05, los resultados de la aproximación pueden considerarse aceptables. Como inconveniente según la Tabla 5.7.2, cabe señalar que todos los coeficientes calculados superan el nivel de significancia recomendado de 0,05.

Trabajo de laboratorio

Previsión de procesos económicos.
utilizando el procesador de hojas de cálculo Excel.

Requisitos de contenido, diseño y orden de ejecución.

Para realizar trabajos de laboratorio, debe crear un nuevo libro de Excel con el nombre "Su nombre, Trabajo de laboratorio No. 1, Opción No._" (por ejemplo: "Ivanov I.P. Trabajo de laboratorio No. 1" Opción No. 4).

Antes de realizar trabajos de laboratorio, estudie la parte teórica y los métodos para realizar las tareas.

Las tareas deben completarse y completarse. según tu opción . Las hojas de trabajo del libro de trabajo deben denominarse Tarea1, Tarea2. Ingrese los resultados de las tareas en un archivo de informe.

Las opciones para el trabajo de laboratorio se distribuyen según el número No. en la lista de grupos, ver tabla

Var. Var. Var. Var. Var. Var. Var.

Después de completar el laboratorio, responda las preguntas del cuestionario. Coloque las respuestas a las preguntas de seguridad en el archivo del informe. Debe entregar su libro de trabajo junto con el archivo del informe al maestro en un disquete, firmándolo “Informe sobre el trabajo de laboratorio No. 2 del estudiante I.P Ivanov, gr. 170404".

parte teorica

Previsión Es un método de investigación científica que tiene como objetivo brindar posibles opciones para aquellos procesos y fenómenos que se eligen como tema de análisis.

Tareas previsión económica son: anticipar la posible distribución de recursos en diversas áreas; determinar los límites inferior y superior de los resultados obtenidos; evaluación de la máxima cantidad posible de recursos necesarios para resolver problemas económicos, científicos y técnicos, etc.

Dependiendo del período de tiempo para el cual se realiza el pronóstico (período de anticipación), los pronósticos pueden ser:



· Corto plazo;

· mediano plazo;

· largo plazo;

· largo plazo.

La gradación temporal de los pronósticos es relativa y depende de la naturaleza y el propósito del pronóstico.

para realizar pronóstico a corto plazo El método más utilizado es la extrapolación.

Método de extrapolación Consiste en encontrar valores que se encuentran fuera de los límites de una serie estadística determinada: a partir de los valores conocidos de la serie estadística se encuentran otros valores que se encuentran fuera de esta serie.

Al extrapolar, las conclusiones extraídas del estudio de las tendencias en el desarrollo de un fenómeno en el pasado y en el presente se transfieren al futuro, es decir, La extrapolación se basa en el supuesto de una cierta estabilidad de las características de los factores que influyen en el desarrollo de este fenómeno.


Fig.1. Designaciones básicas del método de extrapolación.

Al extrapolar (ver Fig. 1), se utiliza la siguiente terminología:

t 1 – profundidad de retrospección;

t 2 – momento de predicción;

t 3 – horizonte de pronóstico;

t 2 – t 1 – intervalo de observación (período de tiempo a partir del cual se estudia la historia del desarrollo del objeto de pronóstico);

t 3 – t 2 – intervalo de anticipación (período de tiempo para el cual se desarrolla el pronóstico).

Cuanto más estables sean los procesos y tendencias previstos, más se podrá retrasar el horizonte de previsión. Como muestra la práctica, el intervalo de observación debe ser tres o más veces más largo que el intervalo inicial. Como regla general, este período es bastante corto. El método de extrapolación no funciona para procesos discontinuos.

El método de extrapolación se implementa fácilmente en una computadora personal. El uso de procesadores de hojas de cálculo modernos como MS Excel le permite pronosticar rápidamente los procesos económicos utilizando el método de extrapolación.

Para aumentar la precisión del pronóstico, es necesario tener en cuenta la dependencia del valor predicho Y de factores externos X. El conjunto de valores en estudio está, por regla general, sujeto a la influencia de factores aleatorios. En este sentido, la dependencia del valor predicho Y de factores externos X suele ser estadística o correlacional.

Estadístico Se llama dependencia de variables aleatorias en la que cada valor de una de ellas corresponde a la ley de distribución de la otra, es decir, un cambio en una de las variables conlleva un cambio en la distribución de la otra.

Correlación Se denomina dependencia estadística de variables aleatorias, en la que un cambio en una de las cantidades implica un cambio en el valor medio de la otra.

Una medida de la dependencia de la correlación de dos variables aleatorias X e Y es el coeficiente de correlación r, que es una cantidad adimensional y, por lo tanto, no depende de la elección de las unidades de medida de las cantidades estudiadas.

Propiedades del coeficiente de correlación:

1) Si dos variables aleatorias X e Y son independientes, entonces su coeficiente de correlación es cero, es decir r=0.

2) El módulo del coeficiente de correlación no excede la unidad, es decir |r|£1, lo que equivale a la doble desigualdad: -1£r£1.

3) La igualdad del coeficiente -1 o +1 indica la presencia de una conexión funcional (directa). El signo "+" indica una relación directa (un aumento o disminución en un atributo va acompañado de un cambio similar en otro atributo), el signo "-" indica una relación inversa (un aumento o disminución en un atributo va acompañado de un cambio en el otro atributo en sentido contrario).

Después de determinar las características de los factores más importantes que influyen en el valor predicho, es igualmente importante establecer su descripción matemática (ecuación), que permite evaluar numéricamente el indicador efectivo a través de las características de los factores.

Se llama una ecuación que expresa el cambio en el valor promedio de un indicador de desempeño dependiendo de los valores de las características de los factores. ecuación de regresión.

Las rectas en el plano coordenado correspondientes a las ecuaciones de regresión se llaman líneas de regresión .

Las dependencias de correlación se pueden expresar mediante ecuaciones de regresión de varios tipos: lineal, parabólica, hiperbólica, exponencial, etc.

Regresión lineal

Ecuación de regresión lineal(selectivo) Y en incógnita se llama dependencia de los valores observados de la cantidad incógnita, expresado por una función lineal:

donde esta el valor r llamado coeficiente de regresión lineal Y en X, segundo- constante.

La aproximación lineal describe bien el cambio de cantidades que se produce a un ritmo constante.

Si el coeficiente de correlación de dos cantidades. incógnita Y Y es igual r=±1, entonces estas cantidades están relacionadas por una relación lineal. El coeficiente de correlación sirve como medida de la fuerza (cercanía) de la dependencia lineal de las cantidades medidas. En la práctica, si el coeficiente de correlación de dos cantidades incógnita Y Y |r|>0,5, entonces creen que hay motivos para suponer la presencia de una relación lineal entre estas cantidades. Sin embargo, al elegir el tipo de línea de regresión (lineal o no lineal), es mejor centrarse en el tipo de dependencia empírica de las cantidades. incógnita Y Y.

Regresión parabólica y polinómica.

Parabólico dependencia del valor Y del tamaño incógnita se llama dependencia expresada por una función cuadrática (parábola de segundo orden):

. (2)

Esta ecuación se llama ecuación de regresión parabólica Y en incógnita. Opciones A, b, Con son llamados coeficientes de regresión parabólica. Calcular los coeficientes de regresión parabólica siempre es engorroso, por lo que se recomienda utilizar una computadora para los cálculos.

La ecuación (2) de regresión parabólica es un caso especial de una regresión más general llamada regresión polinómica. Polinomio dependencia del valor Y del tamaño incógnita se llama dependencia expresada por un polinomio norte-ésimo orden:

donde estan los numeros y yo (i=0,1,…, norte) se llaman coeficientes de regresión polinomial.

La aproximación polinómica se utiliza para describir cantidades que aumentan y disminuyen alternativamente. Es útil, por ejemplo, para analizar un gran conjunto de datos sobre una cantidad inestable.

Regresión de poder.

Fuerza dependencia del valor Y del tamaño incógnita se llama una dependencia de la forma:

Esta ecuación se llama ecuación de regresión de potencia Y en incógnita. Opciones A Y b son llamados coeficientes de regresión de potencia.

La aproximación de la ley de potencias es útil para describir una cantidad monótonamente creciente o monótonamente decreciente, como la distancia recorrida por un automóvil que acelera. La aproximación de la ley de potencias no se puede utilizar si los datos contienen valores cero o negativos.

Regresión exponencial.

Indicativo(o exponencial) dependencia del valor Y del tamaño incógnita se llama una dependencia de la forma:

Esta ecuación se llama ecuación exponencial(o exponencial) regresión y en incógnita. Opciones A(o k) Y b son llamados coeficientes exponenciales(o exponencial) regresión.

La aproximación exponencial es útil cuando la tasa de cambio de los datos aumenta continuamente. Sin embargo, para datos que contienen valores cero o negativos, este tipo de aproximación no es aplicable.

Regresión logarítmica.

logarítmico dependencia del valor Y del tamaño incógnita se llama una dependencia de la forma:

(6)

Esta ecuación se llama ecuación de regresión logarítmica Y en incógnita. Opciones A Y b son llamados coeficientes de regresión logarítmica.

La aproximación logarítmica es útil para describir una cantidad que inicialmente aumenta o disminuye rápidamente y luego se estabiliza gradualmente. La aproximación logarítmica utiliza cantidades tanto negativas como positivas.

Regresión hiperbólica.

Hiperbólico dependencia del valor Y del tamaño incógnita se llama una dependencia de la forma:

Esta ecuación se llama ecuación de regresión hiperbólica Y en incógnita. Opciones A Y b son llamados coeficientes de regresión hiperbólica.

La calidad de la construcción de ecuaciones de regresión se caracteriza por el error promedio de aproximación o error relativo de pronóstico:

(8)

donde Y e es el valor empírico del indicador previsto; Y – valor calculado del indicador previsto.

La realización de un análisis de regresión se puede dividir en tres etapas: elegir la forma de la relación (tipo de ecuación) basándose en datos estadísticos, calcular los coeficientes de la ecuación seleccionada y evaluar la confiabilidad de la ecuación seleccionada.

El uso de un procesador de hojas de cálculo facilita la realización de todas las etapas del análisis de regresión.

Regresión lineal

Una ecuación de regresión lineal es una ecuación de una línea recta que aproxima (describe aproximadamente) la relación entre las variables aleatorias X e Y.

Considere una variable aleatoria bidimensional (X, Y), donde son variables aleatorias dependientes. Imaginemos una de las cantidades en función de la otra. Limitémonos a una representación aproximada de la cantidad en forma de función lineal de la cantidad X:

¿Dónde están los parámetros a determinar? Esto se puede hacer de varias maneras: la más común es el método de mínimos cuadrados. La función g(x) se llama regresión cuadrática media de Y sobre X. La función g(x) se llama regresión cuadrática media de Y sobre X.

donde F es la desviación cuadrada total.

Seleccionemos a y b de modo que la suma de las desviaciones al cuadrado sea mínima. Para encontrar los coeficientes a y b en los que F alcanza su valor mínimo, igualamos las derivadas parciales a cero:

Encuentre a y b. Habiendo realizado transformaciones elementales, obtenemos un sistema de dos ecuaciones lineales para a y b:

¿Dónde está el tamaño de la muestra?

En nuestro caso, A = 3888; B=549; C=8224; D = 1182; N = 100.

Encontremos a y b a partir de esta línea lineal. Obtenemos un punto estacionario para donde 1,9884; 0,8981.

Por tanto, la ecuación tomará la forma:

y = 1,9884x + 0,8981


Arroz. 10

Regresión parabólica

Utilizando datos observacionales, encontremos una ecuación de muestra para la línea curva de regresión cuadrática media (parabólica en nuestro caso). Usemos el método de mínimos cuadrados para determinar p, q, r.

Limitémonos a representar el valor Y en forma de función parabólica del valor X:

donde p, q y r son parámetros a determinar. Esto se puede hacer usando el método de mínimos cuadrados.

Seleccionemos los parámetros p, q y r para que la suma de las desviaciones al cuadrado sea mínima. Dado que cada desviación depende de los parámetros que se buscan, la suma de los cuadrados de las desviaciones es una función F de estos parámetros:

Para encontrar el mínimo, igualamos las derivadas parciales correspondientes a cero:

Encuentre p, q y r. Habiendo realizado transformaciones elementales, obtenemos un sistema de tres ecuaciones lineales para p, q y r:

Resolviendo este sistema mediante el método de la matriz inversa, obtenemos: p = -0,0085; q = 2,0761;

Por tanto, la ecuación de regresión parabólica tomará la forma:

y = -0,0085x 2 + 2,0761x + 0,7462

Construyamos un gráfico de regresión parabólica. Para facilitar la observación, el gráfico de regresión estará contra el fondo del diagrama de dispersión (ver Figura 13).


Arroz. 13

Ahora tracemos las líneas de regresión lineal y de regresión parabólica en un diagrama para una comparación visual (ver Figura 14).


Arroz. 14

La regresión lineal se muestra en rojo y la regresión parabólica en azul. El diagrama muestra que la diferencia en este caso es mayor que cuando se comparan dos líneas de regresión lineal. Se requiere más investigación sobre qué regresión expresa mejor la relación entre xey, es decir, qué tipo de relación entre xey.

En algunos casos, los datos empíricos de una población estadística, representados visualmente mediante un diagrama de coordenadas, muestran que un aumento en un factor va acompañado de un crecimiento más rápido en el resultado. Para describir teóricamente este tipo de correlación entre características, podemos tomar la ecuación de regresión parabólica de segundo orden:

donde , es un parámetro que muestra el valor promedio de la característica resultante bajo la condición de aislamiento completo de la influencia del factor (x=0); – coeficiente de proporcionalidad de la variación del resultado, sujeto a un aumento absoluto del atributo del factor para cada una de sus unidades; c es el coeficiente de aceleración (desaceleración) del crecimiento de la característica efectiva para cada unidad del factor.

Usando el método de mínimos cuadrados como base para calcular los parámetros , , c y tomando condicionalmente el valor medio de la serie clasificada como valor inicial, tendremos Σх = 0, Σх 3 =0. En este caso, el sistema de ecuaciones en forma simplificada será:

De estas ecuaciones podemos encontrar los parámetros , , с, que en forma general se pueden escribir de la siguiente manera:

(11.20)

(11.22)

Esto muestra que para determinar los parámetros , , c es necesario calcular los siguientes valores: Σ y, Σ xy, Σ x 2, Σ x 2 y, Σ x 4. Para ello, puede utilizar el diseño de la tabla. 11.9.

Digamos que hay datos sobre la participación del cultivo de papa en la estructura de todas las áreas sembradas y el rendimiento (cosecha bruta) del cultivo en 30 organizaciones agrícolas. Es necesario crear y resolver una ecuación para la correlación entre estos indicadores.

Tabla 11.9. Cálculo de indicadores auxiliares para la ecuación.

Regresión parabólica

Número de artículo. incógnita en xy x2 x2y x4
x1 a las 1 x 1 y 1
x2 a las 2 x 2 y 2
norte xn y norte xn yn
Σ Σх Σу Σxy Σх 2 Σx 2 y Σx 4

Una representación gráfica del campo de correlación mostró que los indicadores estudiados están relacionados empíricamente entre sí mediante una línea que se aproxima a una parábola de segundo orden. Por lo tanto, calcularemos los parámetros necesarios , , s como parte de la ecuación de regresión parabólica deseada utilizando el diseño de la tabla. 11.10.

Tabla 11.10. Cálculo de datos auxiliares para la ecuación.

Regresión parabólica

Número de artículo. X% y, miles de toneladas xy x2 x2y x4
1,0 5,0 5,0 1,0 5,0 1,0
1,5 7,0 10,5 2,3 15,8 5,0
norte 8,0 20,0 160,0 64,0
Σ

Sustituyamos los valores específicos Σ y = 495, Σ xy = 600, Σ x 2 = 750, Σ x 2 y = 12375, Σ x 4 = 18750, disponibles en la tabla. 11.10, en las fórmulas (11.20), (11.21), (11.22). obtenemos

Así, la ecuación de regresión parabólica que expresa la influencia de la participación de los cultivos de papa en la estructura de las áreas sembradas sobre el rendimiento (rendimiento bruto) del cultivo en las organizaciones agrícolas tiene la siguiente forma:

(11.23)

La ecuación 11.23 muestra que, en las condiciones de una población de muestra determinada, el rendimiento promedio (rendimiento bruto) de papa (10 mil c) se puede obtener sin la influencia del factor en estudio: aumentar la proporción de cultivos en la estructura de sembrados. áreas, es decir bajo esta condición, cuando las fluctuaciones en la gravedad específica de los cultivos no afectarán el tamaño de la cosecha de papa (x = 0). El parámetro (coeficiente de proporcionalidad) b = 0,8 muestra que cada aumento porcentual en la proporción de cultivos proporciona un aumento en el rendimiento en un promedio de 0,8 mil toneladas, y el parámetro c = 0,1 indica que en un uno por ciento (al cuadrado) el aumento en el rendimiento se acelera con una media de 0,1 mil toneladas de patatas.

La relación entre las variables X e Y se puede describir de diferentes maneras. En particular, cualquier forma de conexión puede expresarse mediante una ecuación general. y=f(x), donde y se considera una variable dependiente, o una función de otra - variable independiente x, llamada argumento. La correspondencia entre un argumento y una función se puede especificar mediante una tabla, fórmula, gráfico, etc. Un cambio en una función que depende de los cambios en uno o más argumentos se llama regresión.

Término "regresión"(del latín regressio - movimiento hacia atrás) fue introducido por F. Galton, quien estudió la herencia de rasgos cuantitativos. Él descubrió. que la descendencia de padres altos y bajos regresa (regresa) 1/3 hacia el nivel promedio de este rasgo en una población determinada. Con el mayor desarrollo de la ciencia, este término perdió su significado literal y comenzó a usarse para designar la correlación entre las variables Y y X.

Hay muchas formas y tipos diferentes de correlaciones. La tarea del investigador se reduce a identificar en cada caso concreto la forma de la conexión y expresarla con la ecuación de correlación adecuada, que permita prever posibles cambios en una característica Y a partir de cambios conocidos en otra X, que está correlacionada con la primera. .

Ecuación de una parábola de segundo tipo.

A veces, las conexiones entre las variables Y y X se pueden expresar mediante la fórmula de la parábola.

Donde a,b,c son coeficientes desconocidos que deben encontrarse, dadas las mediciones conocidas de Y y X

Puedes resolver usando el método matricial, pero ya existen fórmulas calculadas que usaremos

N - número de términos de la serie de regresión

Y - valores de la variable Y

X - valores de la variable X

Si usa este bot a través de un cliente XMPP, la sintaxis es la siguiente

regresión fila X; fila Y;2

Donde 2 - muestra que la regresión se calcula como no lineal en forma de parábola de segundo orden

Bueno, es hora de comprobar nuestros cálculos.

Entonces hay una mesa

incógnita Y
1 18.2
2 20.1
3 23.4
4 24.6
5 25.6
6 25.9
7 23.6
8 22.7
9 19.2


¿Te gustó el artículo? ¡Comparte con tus amigos!