¿Qué muestra la serie de variación? Serie de variación y sus características.

Serie de distribución estadística– se trata de una distribución ordenada de unidades de población en grupos según una determinada característica variable.
Dependiendo de la característica que subyace a la formación de la serie de distribución, existen series de distribución atributiva y variacional.

La presencia de una característica común es la base para la formación de una población estadística, que representa los resultados de describir o medir las características generales de los objetos de estudio.

El tema de estudio en estadística son las características cambiantes (variantes) o las características estadísticas.

Tipos de características estadísticas.

Las series de distribución se llaman atributivas. construido según criterios de calidad. Atributivo– este es un signo que tiene un nombre (por ejemplo, profesión: costurera, maestra, etc.).
La serie de distribución suele presentarse en forma de tablas. en la mesa 2.8 muestra la serie de distribución de atributos.
Cuadro 2.8 - Distribución de los tipos de asistencia jurídica brindada por abogados a ciudadanos de una de las regiones de la Federación de Rusia.

Serie de variación– estos son los valores de la característica (o intervalos de valores) y sus frecuencias.
Las series de variación son series de distribución., construido sobre una base cuantitativa. Cualquier serie de variaciones consta de dos elementos: opciones y frecuencias.
Se considera variantes a los valores individuales de una característica que toma en una serie de variaciones.
Las frecuencias son el número de variantes individuales o de cada grupo de una serie de variaciones, es decir Estos son números que muestran con qué frecuencia ocurren ciertas opciones en una serie de distribución. La suma de todas las frecuencias determina el tamaño de toda la población, su volumen.
Las frecuencias son frecuencias expresadas como fracciones de una unidad o como porcentaje del total. En consecuencia, la suma de las frecuencias es igual a 1 o 100%. La serie de variación permite estimar la forma de la ley de distribución basándose en datos reales.

Dependiendo de la naturaleza de la variación del rasgo, existen series de variación discreta y de intervalo.
En la tabla se da un ejemplo de una serie de variación discreta. 2.9.
Cuadro 2.9 - Distribución de familias por número de habitaciones ocupadas en apartamentos individuales en 1989 en la Federación de Rusia.

La primera columna de la tabla presenta opciones para una serie de variación discreta, la segunda columna contiene las frecuencias de la serie de variación y la tercera contiene indicadores de frecuencia.

Serie de variación

Se estudia una determinada característica cuantitativa en la población general. De él se extrae aleatoriamente una muestra de volumen. norte, es decir, el número de elementos de la muestra es igual a norte. En la primera etapa del procesamiento estadístico, rango muestras, es decir orden de números x 1 , x 2 , …, x n Ascendente. Cada valor observado xyo llamado opción. Frecuencia yo yo es el número de observaciones del valor xyo en la muestra. Frecuencia relativa (frecuencia) yo es la relación de frecuencia yo yo al tamaño de la muestra norte: .
Al estudiar series de variación también se utilizan los conceptos de frecuencia acumulada y frecuencia acumulada. Dejar incógnita algún número. Entonces el número de opciones , cuyos valores son menores incógnita, se llama frecuencia acumulada: para x i norte se llama frecuencia acumulada w i max.
Una característica se llama discretamente variable si sus valores individuales (variantes) difieren entre sí en un cierto valor finito (generalmente un número entero). La serie de variación de dicha característica se denomina serie de variación discreta.

Tabla 1. Vista general de una serie de frecuencias de variación discreta

Valores característicosxyo x1 x2 xn
Frecuenciasyo yo metro 1 metros 2 mn

Se dice que una característica varía continuamente si sus valores difieren entre sí en una cantidad arbitrariamente pequeña, es decir, el atributo puede tomar cualquier valor en un intervalo determinado. Una serie de variación continua para tal característica se llama intervalo.

Tabla 2. Vista general de la serie de frecuencias de variación de intervalo.

Tabla 3. Imágenes gráficas de la serie de variación.

FilaPolígono o histogramaFunción de distribución empírica
Discreto
Intervalo
Al revisar los resultados de las observaciones, se determina cuántos valores de las opciones caen en cada intervalo específico. Se supone que cada intervalo pertenece a uno de sus extremos: en todos los casos a la izquierda (más a menudo) o en todos los casos a la derecha, y las frecuencias o frecuencias muestran el número de opciones contenidas dentro de los límites especificados. Diferencias un yo – un yo +1 se llaman intervalos parciales. Para simplificar los cálculos posteriores, la serie de variación del intervalo se puede reemplazar por una condicionalmente discreta. En este caso el valor medio i-el intervalo se toma como una opción xyo, y la frecuencia de intervalo correspondiente yo yo– para la frecuencia de este intervalo.
Para la representación gráfica de series de variación, se utilizan con mayor frecuencia el polígono, el histograma, la curva acumulativa y la función de distribución empírica.

en la mesa 2.3 (Agrupación de la población rusa por ingreso per cápita promedio en abril de 1994) serie de variación de intervalo.
Es conveniente analizar series de distribución utilizando una imagen gráfica, que permite juzgar la forma de la distribución. Una representación visual de la naturaleza de los cambios en las frecuencias de la serie de variación viene dada por polígono e histograma.
El polígono se utiliza para representar series de variación discreta..
Por ejemplo, representemos gráficamente la distribución del parque de viviendas por tipo de apartamento (Cuadro 2.10).
Cuadro 2.10 - Distribución del parque de viviendas del área urbana por tipo de departamento (cifras condicionales).


Arroz. Área de distribución de viviendas


En los ejes de ordenadas se pueden representar no sólo los valores de frecuencia, sino también las frecuencias de las series de variación.
El histograma se utiliza para representar una serie de variación de intervalo.. Al construir un histograma, los valores de los intervalos se trazan en el eje de abscisas y las frecuencias se representan mediante rectángulos construidos en los intervalos correspondientes. La altura de las columnas en el caso de intervalos iguales debe ser proporcional a las frecuencias. Un histograma es un gráfico en el que una serie se representa como barras adyacentes entre sí.
Representemos gráficamente la serie de distribución de intervalos que figura en la tabla. 2.11.
Cuadro 2.11 - Distribución de familias por tamaño de espacio habitable por persona (cifras condicionales).
norte p/p Grupos de familias por tamaño de espacio habitable por persona Número de familias con un tamaño determinado de espacio habitable Número acumulado de familias
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Arroz. 2.2. Histograma de la distribución de familias por tamaño de espacio habitable por persona


Utilizando los datos de la serie acumulada (Tabla 2.11), construimos distribución acumulada.


Arroz. 2.3. Distribución acumulada de familias por tamaño de espacio habitable por persona


La representación de una serie de variación en forma de acumulado es especialmente efectiva para series de variación cuyas frecuencias se expresan como fracciones o porcentajes de la suma de las frecuencias de la serie.
Si cambiamos los ejes al representar gráficamente una serie de variaciones en forma de acumulados, obtenemos ogiva. En la figura. 2.4 muestra una ojiva construida sobre la base de los datos de la tabla. 2.11.
Un histograma se puede convertir en un polígono de distribución encontrando los puntos medios de los lados de los rectángulos y luego conectando estos puntos con líneas rectas. El polígono de distribución resultante se muestra en la Fig. 2.2 con una línea de puntos.
Al construir un histograma de la distribución de una serie de variación con intervalos desiguales, no son las frecuencias las que se trazan a lo largo del eje de ordenadas, sino la densidad de distribución de la característica en los intervalos correspondientes.
La densidad de distribución es la frecuencia calculada por unidad de ancho de intervalo, es decir cuántas unidades de cada grupo hay por unidad de valor de intervalo. En la tabla se presenta un ejemplo de cálculo de la densidad de distribución. 2.12.
Cuadro 2.12 - Distribución de empresas por número de empleados (cifras condicionales)
norte p/p Grupos de empresas por número de empleados, personas. Número de empresas Tamaño del intervalo, gente. Densidad de distribución
A 1 2 3=1/2
1 hasta 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

También se puede utilizar para representar gráficamente series de variaciones. curva acumulada. Utilizando una curva acumulada (curva de suma), se representa una serie de frecuencias acumuladas. Las frecuencias acumuladas se determinan sumando secuencialmente frecuencias entre grupos y muestran cuántas unidades de la población tienen valores de atributos no mayores que el valor considerado.


Arroz. 2.4. Ojiva de distribución de familias por tamaño de espacio habitable por persona

Al construir los acumulados de una serie de variación de intervalo, las variantes de la serie se trazan a lo largo del eje de abscisas y las frecuencias acumuladas a lo largo del eje de ordenadas.

variacional se denominan series de distribución construidas sobre una base cuantitativa. Los valores de las características cuantitativas en unidades individuales de la población no son constantes y difieren más o menos entre sí.

Variación- fluctuación, variabilidad del valor de una característica entre unidades de la población. Los valores numéricos individuales de una característica que se encuentra en la población en estudio se denominan opciones valores. La insuficiencia del valor medio para caracterizar completamente a la población nos obliga a complementar los valores medios con indicadores que permitan evaluar la tipicidad de estos promedios midiendo la variabilidad (variación) de la característica en estudio.

La presencia de variación se debe a la influencia de una gran cantidad de factores en la formación del nivel del rasgo. Estos factores actúan con fuerza desigual y en diferentes direcciones. Los índices de variación se utilizan para describir la medida de la variabilidad de los rasgos.

Objetivos del estudio estadístico de variación:

  • 1) estudio de la naturaleza y grado de variación de las características en unidades individuales de la población;
  • 2) determinar el papel de los factores individuales o sus grupos en la variación de determinadas características de la población.

En estadística se utilizan métodos especiales para estudiar la variación, basados ​​​​en el uso de un sistema de indicadores, Con mediante el cual se mide la variación.

La investigación sobre la variación es importante. Es necesario medir las variaciones al realizar observaciones de muestras, análisis de correlación y varianza, etc. Ermolaev O.Yu. Estadística matemática para psicólogos: libro de texto [Texto]/ O.Yu. Ermolayev. - M.: Editorial Flint del Instituto Psicológico y Social de Moscú, 2012. - 335 p.

Por el grado de variación se puede juzgar la homogeneidad de la población, la estabilidad de los valores individuales de las características y la tipicidad del promedio. Sobre su base, se desarrollan indicadores de la cercanía de la relación entre características e indicadores para evaluar la precisión de la observación de la muestra.

Se hace una distinción entre variación en el espacio y variación en el tiempo.

Se entiende por variación en el espacio la fluctuación de los valores de los atributos entre unidades de población que representan territorios individuales. La variación temporal se refiere a cambios en los valores de una característica durante diferentes períodos de tiempo.

Para estudiar la variación en las filas de distribución, todas las variantes de los valores de los atributos se organizan en orden ascendente o descendente. Este proceso se llama clasificación de series.

Los signos de variación más simples son mínimo y máximo- el valor más pequeño y más grande del atributo en conjunto. El número de repeticiones de variantes individuales de valores característicos se denomina frecuencia de repetición (fi). Es conveniente reemplazar frecuencias con frecuencias - wi. La frecuencia es un indicador relativo de frecuencia, que se puede expresar en fracciones de unidad o porcentaje y permite comparar series de variación con diferentes números de observaciones. Expresado por la fórmula:

donde Xmax, Xmin son los valores máximo y mínimo de la característica en conjunto; n - número de grupos.

Para medir la variación de una característica se utilizan varios indicadores absolutos y relativos. Los indicadores absolutos de variación incluyen el rango de variación, la desviación lineal promedio, la dispersión y la desviación estándar. Los indicadores relativos de oscilación incluyen el coeficiente de oscilación, la desviación lineal relativa y el coeficiente de variación.

Un ejemplo de cómo encontrar una serie de variaciones.

Ejercicio. Para esta muestra:

  • a) Encuentre la serie de variación;
  • b) Construir la función de distribución;

N°=42. Elementos de muestra:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Solución.

  • a) construcción de una serie de variaciones clasificadas:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) construcción de una serie de variación discreta.

Calculemos el número de grupos en la serie de variación usando la fórmula de Sturgess:

Tomemos el número de grupos igual a 7.

Conociendo el número de grupos, calculamos el tamaño del intervalo:

Para facilitar la construcción de la tabla, tomaremos el número de grupos igual a 8, el intervalo será 1.

Arroz. 1 El volumen de ventas de bienes por parte de una tienda durante un cierto período de tiempo.

El método de agrupación también le permite medir variación(variabilidad, fluctuación) de signos. Cuando el número de unidades en una población es relativamente pequeño, la variación se mide con base en el número clasificado de unidades que componen la población. la serie se llama clasificado, si las unidades están dispuestas en orden ascendente (descendente) de la característica.

Sin embargo, las series clasificadas son bastante indicativas cuando se necesita una característica comparativa de variación. Además, en muchos casos tenemos que tratar con poblaciones estadísticas formadas por un gran número de unidades, que son prácticamente difíciles de representar en forma de una serie concreta. En este sentido, para un conocimiento general inicial de los datos estadísticos y especialmente para facilitar el estudio de la variación de las características, los fenómenos y procesos en estudio generalmente se combinan en grupos, y los resultados de la agrupación se presentan en forma de tablas de grupo.

Si una tabla de grupos tiene solo dos columnas: grupos según una característica seleccionada (opciones) y el número de grupos (frecuencia o frecuencia), se llama distribución cercana.

Rango de distribución - el tipo más simple de agrupación estructural según una característica, mostrado en una tabla de grupos con dos columnas que contienen variantes y frecuencias de la característica. En muchos casos, con tal agrupación estructural, es decir, Con la recopilación de series de distribución se inicia el estudio del material estadístico inicial.

Una agrupación estructural en forma de serie de distribución puede convertirse en una auténtica agrupación estructural si los grupos seleccionados se caracterizan no sólo por las frecuencias, sino también por otros indicadores estadísticos. El objetivo principal de las series de distribución es estudiar la variación de las características. La teoría de las series de distribución se desarrolla en detalle mediante la estadística matemática.

Las series de distribución se dividen en atributivo(agrupar según características atributivas, por ejemplo, dividir la población por género, nacionalidad, estado civil, etc.) y variacional(agrupación por características cuantitativas).

Serie de variación Es una tabla de grupos que contiene dos columnas: agrupación de unidades según una característica cuantitativa y el número de unidades en cada grupo. Los intervalos de una serie de variación suelen ser iguales y cerrados. La serie de variación es la siguiente agrupación de la población rusa según el ingreso monetario promedio per cápita (Cuadro 3.10).

Tabla 3.10

Distribución de la población de Rusia por renta media per cápita en 2004-2009.

Grupos de población por ingreso monetario promedio per cápita, rublos/mes

Población del grupo, % del total

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Más de 25.000,0

Toda la población

Las series de variación, a su vez, se dividen en discretas y de intervalo. Discreto Las series de variación combinan variantes de características discretas que varían dentro de límites estrechos. Un ejemplo de serie de variación discreta es la distribución de las familias rusas según el número de hijos que tienen.

Intervalo Las series de variación combinan variantes de características continuas o características discretas que varían en un amplio rango. El intervalo es la serie de variación de la distribución de la población rusa según el ingreso monetario promedio per cápita.

Las series de variación discreta no se utilizan con mucha frecuencia en la práctica. Mientras tanto, compilarlos no es difícil, ya que la composición de los grupos está determinada por las variantes específicas que realmente poseen las características de agrupación estudiadas.

Las series de variación de intervalos están más extendidas. Al compilarlos surge una pregunta difícil sobre el número de grupos, así como el tamaño de los intervalos que deben establecerse.

Los principios para resolver este problema se establecen en el capítulo sobre la metodología para la construcción de agrupaciones estadísticas (ver párrafo 3.3).

Las series de variación son un medio para colapsar o comprimir información diversa en una forma compacta; a partir de ellas se puede hacer un juicio bastante claro sobre la naturaleza de la variación y estudiar las diferencias en las características de los fenómenos incluidos en el conjunto en estudio. Pero el significado más importante de las series de variación es que a partir de ellas se calculan las características generales generalizadoras especiales de la variación (ver Capítulo 7).

La variación determina diferencias en los valores de cualquier característica entre diferentes unidades de una población determinada en el mismo período (punto en el tiempo). La variación es causada por diferentes condiciones de existencia de diferentes unidades de la población. Por ejemplo, incluso los gemelos a lo largo de sus vidas adquieren diferencias en altura, peso, así como en características tales como nivel de educación, ingresos, número de hijos, etc.

La variación surge como resultado del hecho de que los valores del atributo en sí se forman bajo la influencia total de diversas condiciones, que se combinan de diferentes maneras en cada caso individual. Por tanto, el valor de cualquier opción es objetivo.

La variación es característica. a todos los fenómenos de la naturaleza y la sociedad sin excepción, salvo los significados normativos legalmente establecidos de las características sociales individuales. Los estudios de variación en las estadísticas son de gran importancia; ayudan a comprender la esencia del fenómeno en estudio. Encontrar variaciones, descubrir sus causas e identificar la influencia de factores individuales proporciona información importante para la implementación de decisiones de gestión con base científica.

El valor medio da una característica generalizada de las características de la población, pero no revela su estructura. El valor promedio no muestra cómo se ubican a su alrededor las variantes de la característica promediada, si se distribuyen cerca del promedio o se desvían de él. El promedio en dos poblaciones puede ser el mismo, pero en una versión todos los valores individuales difieren ligeramente, y en la otra, estas diferencias son grandes, es decir, en el primer caso la variación de la característica es pequeña y en el segundo es grande; esto es muy importante para caracterizar la importancia del valor promedio;

Para que el jefe de una organización, un gerente o un investigador estudie la variación y la gestione, las estadísticas han desarrollado métodos especiales para estudiar la variación (un sistema de indicadores). Con su ayuda se encuentran variaciones y se caracterizan sus propiedades. Los indicadores de variación incluyen : rango de variación, desviación lineal promedio, coeficiente de variación.

Serie de variación y sus formas.

Serie de variación- se trata de una distribución ordenada de unidades de una población, a menudo según valores crecientes (con menos frecuencia decrecientes) de una característica y contando el número de unidades con un valor particular de la característica. Cuando el número de unidades de población es grande, la serie clasificada se vuelve engorrosa y su construcción lleva mucho tiempo. En tal situación, se construye una serie de variación agrupando unidades de población según los valores de la característica en estudio.

Existen los siguientes formas de series de variación :

  1. Serie clasificada representa una lista de unidades individuales de la población en orden ascendente (descendente) de la característica que se está estudiando.
  2. Serie de variación discreta - esta es una tabla que consta de dos líneas o gráficos: valores específicos de la característica variable x y el número de unidades de la población con un valor dado f - la característica de frecuencia. Se construye cuando el atributo toma el mayor número de valores.
  3. Serie de intervalos.

El rango de variación está determinado como el valor absoluto de la diferencia entre los valores máximo y mínimo (variantes) de la característica:

El rango de variación muestra solo desviaciones extremas de la característica y no refleja desviaciones individuales de todas las opciones de la serie. Caracteriza los límites de cambio en una característica variable y depende de las fluctuaciones de dos opciones extremas y no tiene ninguna relación con las frecuencias en la serie de variación, es decir, con la naturaleza de la distribución, lo que le da a este valor un carácter aleatorio. Para analizar la variación, se necesita un indicador que refleje todas las fluctuaciones en la característica de variación y proporcione una característica general. El indicador más simple de este tipo es la desviación lineal promedio.

(definición de una serie de variación; componentes de una serie de variación; tres formas de una serie de variación; viabilidad de construir una serie de intervalo; conclusiones que se pueden extraer de la serie construida)

Una serie de variación es la secuencia de todos los elementos de la muestra dispuestos en orden no decreciente. Se repiten elementos idénticos

Las series variacionales son series construidas sobre una base cuantitativa.

Las series de distribución variacional constan de dos elementos: opciones y frecuencias:

Las variantes son valores numéricos de una característica cuantitativa en una serie de distribución variacional. Pueden ser positivos y negativos, absolutos y relativos. Entonces, al agrupar empresas según los resultados de la actividad económica, las opciones positivas son ganancias y las negativas son pérdidas.

Las frecuencias son el número de variantes individuales o de cada grupo de una serie de variaciones, es decir Estos son números que muestran con qué frecuencia ocurren ciertas opciones en una serie de distribución. La suma de todas las frecuencias se llama volumen de la población y está determinada por el número de elementos de toda la población.

Las frecuencias son frecuencias expresadas como valores relativos (fracciones de unidades o porcentajes). La suma de las frecuencias es igual a uno o 100%. Reemplazar frecuencias con frecuencias permite comparar series de variación con diferentes números de observaciones.

Hay tres formas de series de variación: series clasificadas, series discretas y series de intervalos.

Una serie clasificada es la distribución de unidades individuales de una población en orden ascendente o descendente de la característica que se está estudiando. La clasificación le permite dividir fácilmente datos cuantitativos en grupos, detectar inmediatamente los valores más pequeños y más grandes de una característica y resaltar los valores que se repiten con mayor frecuencia.

Otras formas de series de variación son tablas de grupos compiladas según la naturaleza de la variación de los valores de la característica en estudio. Según la naturaleza de la variación, se distinguen características discretas (discontinuas) y continuas.

Una serie discreta es una serie variacional, cuya construcción se basa en características con cambio discontinuo (características discretas). Estos últimos incluyen la categoría arancelaria, el número de hijos de la familia, el número de empleados de la empresa, etc. Estas características sólo pueden tomar un número finito de valores específicos.

Una serie de variación discreta representa una tabla que consta de dos columnas. La primera columna indica el valor específico del atributo y la segunda columna indica el número de unidades en la población con un valor específico del atributo.

Si una característica tiene un cambio continuo (cantidad de ingresos, duración del servicio, costo de los activos fijos de una empresa, etc., que puede tomar cualquier valor dentro de ciertos límites), entonces para esta característica es necesario construir una serie de variación de intervalo.



La tabla de grupos aquí también tiene dos columnas. El primero indica el valor del atributo en el intervalo “de - a” (opciones), el segundo indica el número de unidades incluidas en el intervalo (frecuencia).

Frecuencia (frecuencia de repetición): el número de repeticiones de una variante particular de los valores de los atributos se denota por fi, y la suma de frecuencias igual al volumen de la población en estudio se denota

Donde k es el número de opciones para los valores de los atributos.

Muy a menudo, la tabla se complementa con una columna en la que se calculan las frecuencias acumuladas S, que muestran cuántas unidades de la población tienen un valor característico no mayor que este valor.

Una serie de distribución variacional discreta es una serie en la que los grupos se componen de acuerdo con una característica que cambia discretamente y toma solo valores enteros.

Una serie de distribución variacional de intervalo es una serie en la que la característica de agrupación que forma la base de la agrupación puede tomar cualquier valor, incluidos los fraccionarios, en un intervalo determinado.

Una serie de variación de intervalo es un conjunto ordenado de intervalos de variación de los valores de una variable aleatoria con las correspondientes frecuencias o frecuencias de ocurrencia del valor en cada uno de ellos.

Es aconsejable construir una serie de distribución de intervalos, en primer lugar, con una variación continua de una característica, y también si una variación discreta se manifiesta en un rango amplio, es decir, el número de variantes de una característica discreta es bastante grande.

De esta serie ya se pueden sacar varias conclusiones. Por ejemplo, el elemento medio de una serie de variación (mediana) puede ser una estimación del resultado de medición más probable. El primer y último elemento de la serie de variación (es decir, el elemento mínimo y máximo de la muestra) muestran la dispersión de los elementos de la muestra. En ocasiones, si el primer o último elemento es muy diferente del resto de elementos de la muestra, se excluyen de los resultados de la medición, considerando que estos valores se obtuvieron como resultado de algún tipo de falla grave, por ejemplo, tecnológica.



¿Te gustó el artículo? ¡Comparte con tus amigos!