Se da una serie estadística. Serie de distribución

Teoría de la estadística: apuntes de conferencias Burkhanova Inessa Viktorovna

1. Series de distribución estadística

Como resultado del procesamiento y sistematización de datos primarios. observación estadística Se obtienen agrupaciones denominadas series de distribución.

Serie de distribución estadística Representan una disposición ordenada de unidades de la población que se estudia en grupos según sus características de agrupación.

Existen series de distribución atributiva y variacional.

Atributivo es una serie de distribución construida según características cualitativas. Caracteriza la composición de la población según diversas características esenciales.

A partir de criterios cuantitativos se construye Serie de distribución variacional. Consiste en la frecuencia (número) de opciones individuales o de cada grupo de una serie de variaciones. Estos números muestran con qué frecuencia ocurren diferentes opciones (valores de atributos) en la serie de distribución. La suma de todas las frecuencias determina el tamaño de toda la población.

El número de grupos se expresa en términos absolutos y valores relativos Oh. En términos absolutos se expresa por el número de unidades de población de cada grupo seleccionado, y en términos relativos, en forma de participaciones, peso específico, presentado como porcentaje del total.

Dependiendo de la naturaleza de la variación del atributo, se distinguen series de distribución variacional discreta y de intervalo. En una serie de variación discreta, las distribuciones de grupo se componen de acuerdo con una característica que cambia discretamente y toma solo valores enteros.

En una serie de distribución variacional de intervalo, la característica de agrupación que forma la base de la agrupación puede tomar cualquier valor en un intervalo determinado.

Las series de variación constan de dos elementos: frecuencias y variaciones.

Opción llamado significado separado característica variable que toma en la serie de distribución.

Frecuencia– este es el número de variantes individuales o de cada grupo de una serie de variantes. Si las frecuencias se expresan en fracciones de una unidad o como porcentaje del total, entonces se llaman frecuencias.

Las reglas y principios para construir series de distribución de intervalos se basan en reglas y principios similares para construir agrupaciones estadísticas. Si la serie de variación de intervalo de la distribución se construye con intervalos iguales, las frecuencias permiten juzgar en qué medida el intervalo está lleno de unidades de población. para llevar a cabo análisis comparativo la ocupación de los intervalos determina el indicador que caracterizará la densidad de distribución.

Densidad de distribución es la relación entre el número de unidades de población y el ancho del intervalo.

Del libro Compra un restaurante. Vender un restaurante: de la creación a la venta autor Elena Gorelkina

Métodos estadísticos Conteo en multitudes. El método, francamente, es ingenuo, pero muy popular. El organizador de un negocio de restauración coge libreta y lápiz, se sitúa en la puerta de un establecimiento similar de superficie equivalente y cuenta cuántas personas pasan por unidad de tiempo.

Del libro Un siglo de guerra. (La política petrolera angloamericana y el nuevo orden mundial) autor Engdahl Guillermo Federico

Capítulo 6 FILAS CERRADAS INGLOEAMERICANAS Conferencia de Génova El 16 de abril de 1922, en la Villa Genovesa Alberta, la delegación alemana presente en la posguerra conferencia internacional en economía, detonó una bomba, onda de choque de donde rodó a otro

Del libro Teoría de la estadística: notas de clase. autor

1. Series de distribución estadística Como resultado del procesamiento y sistematización de los datos de observación estadística primaria, se obtienen agrupaciones denominadas series de distribución. Las series de distribución estadística representan una disposición ordenada de unidades.

Del libro teoría general estadísticas: notas de clase autor Konik Nina Vladimirovna

3. Tablas estadísticas En forma de tablas estadísticas, se presentan los resultados de un resumen y agrupación de materiales de observación. Una tabla estadística es una forma especial de registrar información breve y clara sobre lo estudiado. fenómenos sociales. tabla estadistica

Del libro Teoría de la estadística. autor Burkhanova Inessa Viktorovna

CONFERENCIA No. 10. Series dinámicas y su estudio en actividades comerciales 1. Conceptos básicos sobre series dinámicas Todos los procesos y fenómenos que ocurren en vida pública los seres humanos son objeto de estudio de la ciencia estadística; movimiento constante Y

Del libro Estadísticas financieras autor Sherstneva Galina Sergeevna

3. Cuadros estadísticos Una vez recopilados e incluso agrupados los datos de observación estadística, es difícil percibirlos y analizarlos sin una cierta sistematización visual. Los resultados de los resúmenes estadísticos y agrupaciones se presentan en la forma

Del libro Teoría general de la estadística. autor Shcherbina Lidiya Vladimirovna

4. Serie de índices agregados con ponderaciones constantes y variables Al estudiar la dinámica fenómenos económicos Los índices se construyen y calculan para varios períodos consecutivos. Forman series de índices básicos o en cadena. En una serie de comparación de índices básicos.

Del libro Plan de Negocios 100%. Estrategia y tácticas comerciales efectivas. por Rhonda Abrams

18. Series de distribución estadística y su representación gráfica Las series de distribución estadística representan una disposición ordenada de unidades de la población en estudio en grupos según características de agrupación. Hay series de atributos y variaciones.

Del libro del autor

19. Tablas estadísticas En forma de tablas estadísticas, se presentan los resultados de un resumen y agrupación de materiales de observación. Una tabla estadística es una forma especial de registrar información breve y clara sobre los fenómenos sociales que se están estudiando. tabla estadistica

Del libro del autor

6. Términos estadísticos La información estadística obtenida como resultado de la observación es necesaria para proporcionarla a las autoridades. administracion publica, proporcionar información a los directivos de empresas, empresas, etc., para informar al público sobre

Del libro del autor

44. Métodos estadísticos Los métodos estadísticos se utilizan especialmente en el estudio de inversiones financieras. El estudio de las inversiones financieras se basa en la construcción de una ecuación de equivalencia, el llamado balance de una transacción financiera. Contenido de este

Del libro del autor

45. Modelos estadísticos para trabajo eficiente En el mercado de valores, es necesario saber cómo se relaciona el rendimiento de una acción en particular (o una cartera de acciones de un inversionista en particular) con el rendimiento promedio del mercado de todo el universo de acciones, es decir, con el índice del mercado. Para

Del libro del autor

15. Tablas estadísticas Una tabla estadística es una tabla que da una característica cuantitativa de una población estadística y es una forma de presentación visual de los resultados obtenidos. resumen estadístico y agrupaciones de números (digitales)

Del libro del autor

19. Mapas estadísticos Los mapas estadísticos son un tipo de representación gráfica de datos estadísticos en un esquema. mapa geografico, caracterizando el nivel o grado de distribución de un fenómeno particular en un territorio determinado.

Del libro del autor

38. Serie de índices agregados con ponderaciones constantes y variables Al estudiar la dinámica de los fenómenos económicos, los índices se construyen y calculan para varios períodos sucesivos. Forman series de índices básicos o en cadena. En una serie de comparación de índices básicos.

Del libro del autor

Estadísticas internacionales Internet ha simplificado enormemente la recopilación de datos a escala global. En la mayoría de los países desarrollados y en muchos países en desarrollo Se proporciona acceso a Internet. información estadística. Publican sus datos y datos internacionales en acceso gratuito.

Objetivo: aprenda a compilar distribuciones estadísticas de muestras, construir polígonos, histogramas, construir funciones de distribución empíricas.

Estadistica matematica Es una rama de las matemáticas aplicadas dedicada a los métodos de recopilación, agrupación y análisis de información estadística obtenida como resultado de observaciones o experimentos.

Población general llamar a un conjunto de objetos que son homogéneos respecto de algún atributo.

Población muestral (muestra) es una colección de objetos seleccionados al azar.

Repetir Se llama muestra en la que el objeto seleccionado (antes de seleccionar el siguiente) se devuelve a la población.

Repetible Se llama muestra en la que el objeto seleccionado no se devuelve a la población.

El número de objetos de una colección se llama volumen.

La muestra se llama representante, si cada elemento de la muestra se selecciona al azar de la población y si todos los elementos tienen la misma probabilidad de ser incluidos en la muestra.

El valor numérico de una característica cuantitativa se llama opción.

Distribución estadística Las muestras se denominan lista de opciones y sus frecuencias correspondientes o frecuencias relativas.

Serie de variación Se denomina a una serie de opciones clasificadas en orden ascendente (o descendente) con sus correspondientes frecuencias.

La serie de variación se llama discreto, si alguna de sus opciones difiere por valor constante, Y - intervalo, si las opciones pueden diferir entre sí en una cantidad arbitrariamente pequeña.

Una serie estadística discreta se especifica mediante una tabla en la que se indican variantes, frecuencias o frecuencias relativas de su aparición. Una representación gráfica de una serie estadística discreta se llama polígono de frecuencias (frecuencias relativas). Esta es una línea discontinua en la que los extremos de los segmentos tienen coordenadas o , .

Ejemplo. La ley de distribución de una serie estadística discreta y el rango de frecuencia.

Serie estadística de intervalo para aleatorio. cantidades continuas y para variables aleatorias discretas en grandes volúmenes muestras. Una serie de intervalos es una tabla que muestra intervalos parciales, densidades de frecuencia o densidades de frecuencia relativas. Una representación gráfica de una serie estadística de intervalo se llama histograma. Es una figura escalonada de rectángulos con bases iguales a los intervalos de los valores de los atributos y alturas. frecuencias iguales intervalos.

Ejemplo. La ley de distribución de series estadísticas de intervalo e histograma.

(55;60) (60;65) (65;70) (70;75) (75;80) (80;85) (85;90)

Algoritmo de construcción serie de intervalos:

Que se dé una muestra con volumen.

1) encuentre el rango de muestra,

2) determine el número de clases de partición usando las fórmulas:

(Fórmula de Sturgess para)

(Fórmula de Brooks para),

3) encuentre el valor del intervalo de clase,

4) fronteras intervalos parciales encontramos usando las fórmulas:

, , , .



5) contar la frecuencia de aparición de la variante en cada intervalo.

Curva acumulada (acumulada)– curva de frecuencias acumuladas. Para serie discreta El acumulado es una línea discontinua que conecta los puntos o , . Para una serie de variación de intervalo, la línea discontinua comienza desde un punto cuya abscisa es igual al inicio del primer intervalo, y la ordenada es igual a la frecuencia acumulada, igual a 0. Otros puntos corresponden a los finales de los intervalos.

Función de distribución empírica se llama frecuencia relativa con la que un signo tomará un valor menor que uno dado, es decir.

Para una serie de variación discreta, la función empírica es una función escalonada discontinua; para una serie de intervalo, coincide con la acumulada.

Características numéricas básicas de una serie de variación.:

Media aritmética serie de variación, donde son variantes de una serie discreta o la mitad de intervalos, y son las frecuencias correspondientes.

Propiedades básicas de la media aritmética.:

6), donde es el promedio general, es el promedio grupal del grupo con volumen y es el número de grupos.

Dispersión serie de variación .

Propiedades básicas de la dispersión.:

2) ,

3) ,

4) ,

5) , donde - varianza total, - dispersión del grupo, - media aritmética variaciones de grupo, - dispersión intergrupal.

6) - dispersión del valor medio.

Desviación estándar .

Coeficiente de variación .

Mediana serie de variación , donde es el comienzo del intervalo mediano, es su longitud, es el tamaño de la muestra, es la suma de las frecuencias de los intervalos que preceden a la mediana, es la frecuencia del intervalo mediano. Para una serie discreta, la mediana es el valor del atributo que se encuentra en el medio de la serie clasificada de observaciones.

Moda , donde es el comienzo del intervalo modal, es su longitud, es la frecuencia del intervalo modal y son las frecuencias de los intervalos modales anteriores y siguientes, respectivamente. Para una serie discreta, el modo es la variante que corresponde a la frecuencia más alta.

Momento inicial -ésimo orden.

momento central-ésimo orden .

Coeficiente de asimetría .

Exceso .

Preguntas de seguridad:

1. Generalidades y población de muestra, su volumen.

2. Distribución estadística muestras. Serie de variaciones.

3. Series estadísticas discretas. Polígono de frecuencia.

4. Series estadísticas de intervalo. Histograma.

5. Algoritmo para la construcción de una serie estadística de intervalo.

6. Función de distribución empírica. Curva acumulativa.

7. La media aritmética de una serie de variaciones y sus propiedades.

8. Dispersión y sus propiedades. RMS.

Tareas de prueba:

1. Como sabes, la escritura de una persona, incluida la inclinación de las letras, está estrechamente relacionada con su carácter. Una pendiente baja (30 - 40 grados) indica el temperamento y la excitabilidad de una persona, una franqueza excesiva y prisa en las acciones; Incline 40 – 50 grados. caracteriza desarrollo armonioso naturaleza; Incline 50 – 90 grados. indica autocontrol, una gama limitada de pasatiempos.

Entre los alumnos del instituto se estudió selectivamente la caligrafía de 50 personas. Resultó que la escritura del 30% de los presentes tenía una pendiente baja, el 50% tenía una pendiente de 40 a 50 grados y el 20% tenía una pendiente de 50 a 90 grados.

Encuentra la distribución de frecuencias, frecuencias relativas, construye un polígono y un histograma.

2. Dada es la distribución de la característica obtenida de las observaciones. Necesario:

4. Se estudió la altura (cm) de hombres de 25 años. Por muestra aleatoria volumen 35: 175, 167, 168, 169, 168, 170, 174, 173, 177, 172, 174, 167, 173, 172, 171, 171, 170, 167, 174, 177, 171, 172, 16 9, 171, 173, 173, 168, 173, 172, 166, 164, 168, 172, 174, encuentre la serie de distribución de intervalos estadísticos y construya un histograma de frecuencia.

Tareas para tarea:

Se da la distribución de la característica obtenida a partir de las observaciones. Necesario:

1) construir (polígono) un histograma, una función de distribución acumulada y empírica;

2) encontrar: media aritmética, moda y mediana, dispersión, desviación estándar y coeficiente de variación, inicial y puntos centrales-ésimo orden.

5-10 10-15 15-20 20-25 25-30 30-35 35-40

Tema No. 12 “Encontrar estimaciones puntuales y de intervalo de parámetros de distribución”

Objetivo: aprender a determinar estimaciones estadísticas puntuales y de intervalo de los parámetros generales de una distribución normal basándose en datos de muestra de la población general.

Breve informacion teorica:

Evaluación estadística (estadísticas) parámetro desconocido q la distribución de la población se llama función de los resultados de las observaciones. q* .

Evaluación estadística q* es una variable aleatoria.

Una estimación determinada por un solo número dependiendo de los datos de la muestra se llama punto.

Requisitos para estimaciones estadísticas puntuales:

1) coherencia (esforzarse según la probabilidad del parámetro estimado en ),

2) no desplazado (ausencia errores sistemáticos para cualquier tamaño de muestra (q*) = q),

3) eficiencia (entre todas las evaluaciones posibles evaluación efectiva tiene la menor dispersión).

Estimaciones puntuales de parámetros generales de una población distribuida normalmente:

Estimación de intervalo Se llama estimación y está determinada por dos números: los extremos del intervalo.

Las estimaciones de intervalo le permiten establecer la precisión y confiabilidad de una estimación puntual.

Exactitud Las estimaciones se llaman desviación del módulo. q* de q.

error final muestras se llama desviación máxima permitida en valor absoluto q* de q.

Fiabilidad (probabilidad de confianza) evaluaciones q* llamada probabilidad , con el que se realiza la desigualdad |q-q*|< . Generalmente = 0,95; 0,99; 0,999…

Probabilidad de que un parámetro desconocido no caiga dentro del intervalo |q-q*|< , es igual a - nivel de significancia.

Confiable se llama intervalo ( q*- ;q*+), que cubre el parámetro desconocido con una confiabilidad dada .

Estimaciones de intervalo de parámetros de distribución normal:

1) Intervalo de confianza para la expectativa matemática en varianza conocida.

, donde se encuentran las funciones de Laplace de la tabla, teniendo en cuenta .

2) Intervalo de confianza para la expectativa matemática con varianza desconocida.

Arroz.:
, donde se encuentran en la tabla de coeficientes de Student.

3) Intervalo de confianza para la varianza cuando .

< < , Dónde , - encontrado cuando con el número de grados de libertad.

4) Intervalo de confianza para la varianza de la incógnita.

, Dónde - encontrado en la tabla de distribución en 1- , - encontrado cuando con el número de grados de libertad.

Ejemplo 1. Calcule estimaciones insesgadas de parámetros poblacionales a partir de datos de muestra: 64 63 71 68 73 71 74 73 70 75 68 67 73.

,

,

.

Ejemplo 2. Encontrar intervalos de confianza para expectativa matemática, varianza y desviación estándar a un nivel de significancia de 0,05, si la muestra utilizada en el ejemplo 1 se extrae de la población.

Solución. Usamos los datos del ejemplo 1 para encontrar el intervalo de confianza para la expectativa matemática con varianza desconocida:

,

.

Usamos los datos del ejemplo 1 para encontrar el intervalo de confianza para la varianza con una expectativa matemática desconocida:

,

Dónde = ()= =4.4 y =

,

Preguntas de seguridad:

1. Valoración estadística del parámetro desconocido de la distribución teórica.

2. Estimación puntual.

3. Requisitos estimaciones puntuales: imparcialidad, coherencia, eficiencia.

4. Promedio general y muestral.

5. Variaciones generales y muestrales.

6. Factor de corrección. Varianza muestral corregida.

7. Desviación estándar general y su estimación puntual.

8. Estimación de la dispersión y desviación estándar de la media muestral.

9. Estimación de intervalo parámetro poblacional desconocido.

10. Probabilidad de confianza y nivel de significancia.

11. Intervalo de confianza.

12. Regla para encontrar el intervalo de confianza.

13. Intervalo de confianza para expectativa matemática con varianza conocida.

14. Intervalo de confianza para expectativa matemática con varianza desconocida.

15. Intervalo de confianza para la varianza con conocida.

16. Intervalo de confianza para la varianza de lo desconocido.

Tareas de prueba:

1. Al verificar el progreso de la facultad, se evaluaron aleatoriamente 50 estudiantes, distribuidos según los resultados de la prueba de la siguiente manera ( - puntuación, - número de estudiantes con una puntuación determinada):

Encuentre la distancia de comunicación promedio de la muestra.

3. Encuentre la distribución del puntaje promedio en la tarea 1 de evaluar a 50 estudiantes.

4. Encuentre una estimación de la distribución de la velocidad de lectura, la distribución presentada en la tabla, habiendo determinado previamente frecuencia relativa velocidad promedio lectura.

5. Encuentre estimaciones insesgadas de la media general, la varianza y el promedio. desviación cuadrada población basada en un tamaño de muestra de 12, que describe la duración en segundos actividad fisica antes del desarrollo de un ataque de angina: 289, 208, 259, 243, 232, 210, 251, 246, 224, 239, 220, 211.

6. Hay un volumen de muestra: estos son los valores de la presión sistólica en hombres en la etapa inicial del shock: 127, 124, 155, 129, 77, 147, 65, 109, 145, 141. Determine la dispersión y desviación estándar de la media muestral.

7. Según el esquema de muestreo sin repetición, de 400 sujetos en los experimentos de Franzen y Offenloch utilizando potenciales evocados, se seleccionaron 100 personas y se midieron los períodos de latencia. Los resultados de la prueba se muestran en la tabla:

Se especifica la desviación estándar. Encontrar:

a) la probabilidad de que el período latente promedio de las 400 personas difiera del período promedio de la muestra en no más de 0,31 ms (según valor absoluto),

b) límites dentro de los cuales es probable que esté contenido el valor medio del período de latencia,

c) el tamaño de muestra para el cual se producirían límites de confianza con un error máximo con una probabilidad de confianza.

8. La distribución de las visitas diarias de Carlson a Baby durante el mes se muestra en la tabla:

Determine los límites dentro de los cuales probablemente se encuentre el número promedio de visitas.

9. Una variable aleatoria tiene distribución normal con desviación estándar conocida =3. Encuentre intervalos de confianza para estimar la expectativa matemática desconocida A según medias muestrales = 24,5, si se especifica el tamaño de la muestra y la confiabilidad de la estimación.

10. Una característica cuantitativa de la población general tiene una distribución normal. Con base en el volumen de muestra, se encontró la media muestral = 20,2 y la desviación estándar corregida. Calcule la expectativa matemática desconocida utilizando un intervalo de confianza con una confiabilidad de 0,95.

11. A 9 postulantes al cargo de gerente se evaluó un indicador profesional que caracteriza la capacidad para liderar personas. Considerando el indicador distribuido ley normal con desviación estándar arb. unidades, determine de manera confiable el intervalo de confianza para la verdadera desviación estándar del indicador.

Asignaciones de tarea:

1. Encuentre estimaciones de la media general, la dispersión y la desviación estándar, si la población se especifica mediante una tabla de distribución:

Estimar con una confiabilidad de 0.95 la expectativa matemática de una característica distribuida normalmente de la población utilizando un intervalo de confianza.

4. Encuentre intervalos de confianza para la expectativa matemática, la dispersión y la desviación estándar en probabilidad de confianza 0,95 si se toma una muestra de la población:

67 70 69 68 74 72 66 66 74 69 72 78 67

Tema No. 13 « Probar hipótesis estadísticas sobre la igualdad de varianzas y expectativas matemáticas»

Objetivo: aprende a comprobar hipótesis estadísticas sobre la igualdad de varianzas y expectativas matemáticas de la normalidad. poblaciones generales.

Breve información teórica:

Estadístico Se llama hipótesis sobre la forma de una distribución desconocida o sobre los parámetros de distribuciones conocidas.

Nulo(principal) se llama hipótesis propuesta.

Competir(alternativa) es una hipótesis que contradice la hipótesis nula.

Error del primer tipo es que la hipótesis correcta será rechazada.

Error del segundo tipo. es que se aceptará la hipótesis equivocada.

La probabilidad de cometer un error tipo II es nivel de significancia.

Criterio estadístico Llamada variable aleatoria que sirve para probar la hipótesis nula.

Valor observado llame al valor de criterio calculado a partir de muestras.

Área crítica es un conjunto de valores de criterio en los que se rechaza la hipótesis nula.

Área de aceptación de hipótesis– un conjunto de valores de criterio en los que se acepta la hipótesis.

Si pertenece al área crítica, la hipótesis se rechaza; si pertenece al área donde se acepta la hipótesis, se acepta la hipótesis.

Puntos críticos Llaman a los puntos que separan la región crítica de la región donde se acepta la hipótesis.

Los puntos críticos se buscan con base en el requisito de que, siempre que la hipótesis nula sea verdadera, la probabilidad de que el criterio caiga en la región crítica sea igual al nivel de significancia aceptado.

Para cada criterio existen tablas correspondientes a partir de las cuales se encuentra el punto crítico que satisface este requisito.

Cuando se encuentre, calcule a partir de los datos de la muestra y, si > (región crítica de la derecha),< (левосторонняя), < < , < (двусторонняя), то отвергается.

Comparando dos varianzas de poblaciones normales:

Que se distribuyan normalmente. Basado en muestras independientes con volúmenes correspondientemente iguales a y , extraídas de estas poblaciones, corregidas varianzas muestrales Y . Se requiere probar la hipótesis nula utilizando varianzas corregidas en un nivel de significancia dado. .

1) presentar una hipótesis competitiva (),

2) encontramos,

3) según la tabla puntos críticos Fischer-Snedekor encontramos (), donde , y es el tamaño de muestra al que corresponde , - ,

4) si , entonces aceptamos la hipótesis nula; en caso contrario, la alternativa.

Introducción

Desde tiempos inmemoriales, la humanidad ha tenido en cuenta muchos fenómenos y objetos asociados con su actividad vital y cálculos relacionados. Las personas recibieron información versátil, aunque variando en su integridad en diferentes etapas. desarrollo social. Datos que se tienen en cuenta diariamente en el proceso de toma de decisiones empresariales, y de forma generalizada en nivel estatal al determinar la dirección de la economía y politica social y la naturaleza de las actividades de política exterior.

Guiado por consideraciones de la dependencia del bienestar de la nación de la cantidad de creación producto útil, intereses de seguridad estratégica de estados y pueblos entre el número de adultos población masculina, los ingresos de tesorería provenientes del tamaño de los recursos imponibles, etc., se reconocen e implementan claramente desde hace mucho tiempo en forma de diversas participaciones contables.

Teniendo en cuenta los logros ciencia económica Se hizo posible calcular indicadores que caracterizan generalmente los resultados del proceso de reproducción a nivel de la sociedad: el producto social total, ingreso nacional, producto nacional bruto.

Toda la información anterior en volúmenes cada vez mayores la proporcionan a la sociedad las estadísticas, que son un accesorio necesario. aparato estatal. Las estadísticas pueden así hablar en un lenguaje indicadores estadísticos sobre muchas cosas de una forma muy vívida y convincente.

Para análisis estadístico datos en mi trabajo utilicé el programa Excel (cálculo de fórmulas y trazado de gráficos).

Series de distribución estadística, su significado y aplicación en estadística.

Como resultado del procesamiento y sistematización de los datos de observación estadística primaria se obtienen agrupaciones denominadas series de distribución. En ellos se conoce el número de unidades de observación en grupos. Presentado en términos absolutos y relativos.

Una serie de distribución estadística es una distribución ordenada de unidades de la población que se estudian en grupos de acuerdo con una determinada característica variable. Caracteriza la composición (estructura) del fenómeno en estudio, nos permite juzgar la homogeneidad de la población, el patrón de distribución y los límites de variación de las unidades de la población.

Las series estadísticas se dividen en:

Atributivo: son series construidas según características atributivas, en orden ascendente o descendente del conocimiento observado.

Es decir, características cualitativas que no tienen. expresión numérica y caracterizar la propiedad, calidad del fenómeno socioeconómico que se estudia.

Las series de distribución atributiva caracterizan la composición de la población según determinadas características esenciales.

Considerados durante varios períodos, estos datos permiten estudiar los cambios estructurales.

El número de grupos de la serie de distribución de atributos es adecuado al número de gradaciones. Variedades de características atributivas.

En la Tabla 1 se ofrece un ejemplo de una serie de distribución de atributos.

Tabla 1. Distribución de estudiantes de 1er año por rendimiento académico

Elementos esta serie Las distribuciones son gradaciones de la característica atributiva "Logro" ("tienen tiempo" - "no tienen tiempo") y el número de cada grupo en términos absolutos (persona) y relativos (%).

Fueron 46 estudiantes que aprobaron el examen en la disciplina. Su peso específico ascendió al 92%.

Las series variacionales son series construidas sobre una base cuantitativa.

Las series de distribución variacional constan de dos elementos: opciones y frecuencias:

Las opciones son valores numéricos característica cuantitativa en la serie de variación de la distribución. Pueden ser positivos y negativos, absolutos y relativos. Así, al agrupar empresas según resultados actividad económica las opciones positivas significan ganancias, y números negativos- esto es una pérdida.

Las frecuencias son el número de opciones individuales o de cada grupo de una serie de variaciones, es decir Estos son números que muestran con qué frecuencia ocurren ciertas opciones en una serie de distribución. La suma de todas las frecuencias se llama volumen de la población y está determinada por el número de elementos de toda la población.

Las frecuencias son frecuencias expresadas como valores relativos (fracciones de unidades o porcentajes). La suma de las frecuencias es igual a uno o 100%. Reemplazar frecuencias con frecuencias permite comparar series de variación con diferentes numeros observaciones.

Las series de variación, según la naturaleza de la variación, se dividen en discretas y de intervalo.

Una serie de distribución variacional discreta es una serie en la que los grupos se componen de acuerdo con una característica que cambia discretamente y toma solo valores enteros.

En la Tabla 2 se proporciona un ejemplo de una serie de distribución variacional discreta.

Tabla 2. Distribución de estudiantes por puntuación de exámenes

En gr. Tabla 1, Tabla 2 presenta opciones para una serie de variación discreta. En gr. 2 - frecuencias, y en gr. 3 - frecuencias. En caso variación continua el valor de una característica para unidades de población puede adquirir dentro de ciertos límites cualquier valor. Se diferencian entre sí en una cantidad arbitrariamente pequeña.

Una serie de distribución variacional de intervalo es una serie en la que la característica de agrupación que forma la base de la agrupación puede tomar cualquier valor, incluidos los fraccionarios, en un intervalo determinado.

Es aconsejable construir una serie de distribución de intervalos, en primer lugar, con una variación continua de una característica, y también si una variación discreta se manifiesta en un rango amplio, es decir, el número de variantes de una característica discreta es bastante grande.

Las reglas y principios para construir series de distribución de intervalos son similares a las reglas y principios para construir agrupaciones estadísticas. Si la serie de distribución de variación de intervalo se construye con intervalos iguales, las frecuencias permiten juzgar el grado en que el intervalo está lleno de unidades de población. Al construir intervalos desiguales, es imposible obtener información sobre el grado de llenado de cada intervalo. Para realizar un análisis comparativo de la ocupación de los intervalos se determina un indicador que caracteriza la densidad de distribución. Esta es la relación entre el número de unidades de población y el ancho del intervalo.

En la Tabla 3 se da un ejemplo de una distribución de variación de intervalo.

Cuadro 3. Distribución de empresas constructoras en la región por número promedio de empleados*

* - Los números son condicionales.

La serie de distribución presentada es un intervalo, cuya formación de grupos se basa en una característica continua.

Para mayor claridad, el análisis de las series de distribución se puede realizar en función de su imagen grafica. Para ello se construyen un polígono, un histograma, una ojiva y un acumulado de distribución.

Parte de cálculo de la tarea número 5.

Hay datos de muestra (muestra mecánica del 5%) sobre el costo promedio anual de los activos fijos de producción y la producción de las empresas del sector económico durante el período del informe.

Tabla 4. Datos iniciales

Producción de productos, millones de rublos.

Según datos iniciales:

1. Construir una serie estadística de distribución de empresas por el costo promedio anual de los activos fijos de producción, formando cuatro grupos de empresas a intervalos iguales, caracterizándolas por el número de empresas y la participación de empresas.

2. Calcular los indicadores generales de la serie de distribución:

a) el costo promedio anual de los activos fijos de producción, ponderando los valores del atributo por el número absoluto de empresas y su participación;

b) moda y mediana;

c) construir gráficas de la serie de distribución y determinar el valor de la moda y la mediana en ellas.

Solución:

1. Primero, determine la duración del intervalo usando la fórmula:

e=(x máx - x mín)/k,

donde k es el número de grupos en la agrupación (de la condición k=4),

x max y x min: valores máximos y mínimos de la serie de distribución,

e=(60 - 20)/4=10 millones de rublos.

Luego definimos los límites de intervalo superior e inferior para cada grupo:

Número de grupo

límite inferior

límite superior

Creemos la hoja de trabajo 5, donde resumiremos los datos iniciales:

Tabla 5. Hoja de trabajo

Grupos de empresas por coste medio anual del fondo de pensiones abierto,

Empresa No.

Costo promedio anual de OPF, millones de rublos.

Lanzamiento del producto,

Calculemos las características de la serie de distribución por participación de empresas mediante la fórmula:

donde d es la participación de la empresa;

f i - número de empresas del grupo;

F i - número total de empresas.

Sustituye los datos en las fórmulas. Los resultados obtenidos se introducen en la tabla final 6.

Todas las fórmulas y cálculos de la Tabla 6 se incluyen en programa excel y se dan en el Apéndice 1.

Cuadro 6. Distribución de empresas por valor medio anual de activos fijos de producción

Esta agrupación muestra que la mayoría de estas empresas (33,3%) tienen un coste medio anual de activos fijos de producción que oscila entre 40 y 50 millones de rublos.

2. a) Calcular el coste medio anual de los activos fijos de producción utilizando la fórmula del promedio aritmético ponderado, ponderando los valores por el número absoluto de empresas:

y por gravedad específica:

Para calcular el promedio de una serie de intervalos, es necesario expresar las opciones en un número (discreto), este es el promedio aritmético simple de los valores superior e inferior del intervalo:

Sustituye los datos en las fórmulas. Registraremos los resultados obtenidos en la Tabla 7.

Todas las fórmulas y cálculos de la Tabla 7 se ingresan en Excel y se dan en el Apéndice 1.

Tabla 7. Cálculo del costo promedio anual del fondo de pensiones abierto

Los valores medios son iguales, lo que demuestra que los cálculos son correctos. El coste medio anual de la OPF es de 41,333 millones de rublos.

b) Calcula la moda y la mediana de esta serie.

La moda es el valor de una característica que ocurre con mayor frecuencia en la población que se estudia. Para intervalo serie de variación La distribución modal se calcula mediante la fórmula:

donde x Mo es el límite inferior del intervalo modal;

i Mo es el valor del intervalo modal;

f Mo - frecuencia del intervalo modal;

f Mo-1 - frecuencia del intervalo anterior al modal;

f Mo+1 - frecuencia del intervalo siguiente al modal.

Originalmente por frecuencia más alta característica definimos el intervalo modal. nai numero mayor empresas - 10 - costo promedio anual de los activos fijos de producción en el rango de 40 a 50 millones de rublos, que es modal.

Sustituye los datos en la fórmula.

Del cálculo queda claro que significado modal El coste de la OPF de las empresas es igual a 44 millones de rublos.

La mediana es una opción ubicada en medio de una serie de variación ordenada, dividiéndola en dos partes iguales. Para las series de variación de intervalo, la mediana se calcula mediante la fórmula:

donde x Me es el límite inferior del intervalo mediano;

i Yo - el valor del intervalo mediano;

F es la suma de las frecuencias de la serie;

S Me-1 es la suma de las frecuencias acumuladas de la serie anterior al intervalo mediano;

f Me - frecuencia del intervalo mediano.

Determinamos el intervalo mediano en el que número de serie medianas. Para ello calculamos la suma de las frecuencias como total acumulado hasta un número superior a la mitad del volumen de la población (30/2 = 15). Ingresamos los datos obtenidos en la tabla de cálculo 8.

Tabla 8. Cálculo de la mediana

En la columna “Suma de frecuencias acumuladas”, el valor 23 corresponde al intervalo 40 - 50. Este es el intervalo mediano en el que se ubica la mediana.

Sustituye los datos en la fórmula.

El cálculo muestra que la mitad de las empresas tienen un coste medio anual de activos fijos de producción de hasta 42 millones de rublos, mientras que la otra mitad supera esta cantidad.

c) Construir gráficas de esta serie de distribución a partir de los datos obtenidos:

Arroz. 1.

Mediana

Arroz. 2. Distribución acumulada de empresas por costo promedio anual del fondo general

Muestra obtenida durante investigación experimental, es un conjunto desordenado de números escritos en la secuencia en la que se realizaron las mediciones. Normalmente, la muestra se elabora en forma de tabla, cuya primera fila (o columna) contiene el número del experimento. i, y en el segundo (segundo), el valor fijo de la variable aleatoria del atributo. De esta forma, la muestra representa la forma principal de registrar material estadístico que puede procesarse. de varias maneras. Como ejemplo, considere los resultados mostrados en las competiciones de atletismo por lanzadores de peso y que se muestran en la Tabla 1. La primera línea de esta tabla contiene los números de medición y la segunda, sus valores numéricos en metros.

Tabla 1

Resultados de la competición de lanzamiento de peso

xyo 16,36 14,91 15,31 14,26 14,77 13,88 14,97 14,01 14,07 14,48
xyo 14,44 14,81 13,81 15,15 15,23 15,69 14,29 14,15 14,57 13,92
xyo 13,62 14,92 15,73 13,22 14,65 14,8 13,04 15,1 13,3

Como puede verse en el Cuadro 1, un agregado estadístico simple deja de ser una forma conveniente de presentar material estadístico incluso con un tamaño de muestra relativamente pequeño: es bastante engorroso y poco visual. Es muy difícil analizar los datos experimentales obtenidos y mucho menos sacar conclusiones basadas en ellos. En base a esto, el material estadístico obtenido debe ser procesado para futuras investigaciones. La forma más sencilla de procesar una muestra es clasificarla. La clasificación es la disposición de las opciones en orden ascendente o descendente de sus valores. El Cuadro 2 a continuación muestra una muestra clasificada, cuyos elementos están ordenados en orden ascendente.

Tabla 2

Resultados de la competición clasificatoria en lanzamiento de peso

xyo 13,04 13,22 13,3 13,62 13,81 13,88 13,92 14,01 14,07 14,15
xyo 14,26 14,29 14,44 14,48 14,57 14,65 14,77 14,8 14,81 14,91
xyo 14,92 14,97 15,1 15,15 15,23 15,31 15,69 15,73 16,36

Pero incluso de esta forma, los datos experimentales obtenidos son poco visibles y de poca utilidad para el análisis directo. Por eso, para que el material estadístico sea más compacto y claro, es necesario someterlo a un procesamiento adicional: se construye la llamada serie estadística. La construcción de una serie estadística comienza con la agrupación.

Agrupamiento Es el proceso de organización y sistematización de los datos obtenidos durante un experimento, encaminado a extraer la información contenida en ellos. En el proceso de agrupación, la muestra se distribuye en grupos o intervalos de agrupación, cada uno de los cuales contiene un determinado rango de valores de la característica en estudio. El proceso de agrupación comienza dividiendo todo el rango de variación de una característica en intervalos de agrupación.

para cada propósito específico investigación estadística, el tamaño de la muestra considerada y el grado de variación de la característica en la misma, existe valor optimo el número de intervalos y el ancho de cada uno de ellos. Valor aproximado del número óptimo de intervalos. k Se puede determinar en función del tamaño de la muestra. norte ya sea utilizando los datos proporcionados en la Tabla 3 o utilizando la fórmula de Sturgess:

k = 1 + 3.322 litros norte.

Tabla 3

Determinar el número de intervalos de agrupación.

El valor obtenido por la fórmula. k casi siempre resulta ser un valor fraccionario que debe redondearse a un número entero, ya que el número de intervalos no puede ser fraccionario. La práctica demuestra que, por regla general, es mejor redondear hacia abajo, porque la fórmula da buenos resultados en valores grandes norte, y cuando es pequeño, algo sobreestimado.

Considere agrupar la opción de muestra en ejemplo específico. Para ello, veamos el ejemplo de los lanzadores de peso (ver tablas 1, 2). Determinaremos el número de intervalos de agrupación en función de los datos proporcionados en la Tabla 3. Con un tamaño de muestra norte=29 es recomendable elegir el número de intervalos igual a k=5 (La fórmula de Sturgess da el valor k =5,9).

Acordemos utilizar intervalos de igual ancho en el ejemplo considerado. En este caso, una vez determinado el número de intervalos de agrupación, se debe calcular el ancho de cada uno de ellos utilizando la relación:

Aquí h- la anchura de los intervalos, y incógnita máximo y incógnita min: respectivamente, el valor máximo y mínimo del atributo en la muestra. Cantidades incógnita máximo y incógnita min se determinan directamente a partir de la tabla de datos de origen (ver Tabla 2). En este caso:

(metro).

Aquí es necesario detenerse en la precisión de determinar el ancho del intervalo. Son posibles dos situaciones: la precisión del valor calculado h coincide con la precisión del experimento o la supera. EN el último caso Es posible utilizar dos enfoques para determinar los límites de los intervalos. CON punto teórico Ver lo más correcto es utilizar el valor obtenido. h para construir intervalos. Este enfoque no introducirá distorsiones adicionales asociadas con el procesamiento de datos experimentales. Sin embargo, para fines prácticos en estudios estadísticos relacionados con cultura fisica y deportes, se acostumbra redondear el valor resultante h a la precisión de la medición de los datos. Esto se debe a que para una representación visual de los resultados obtenidos, es conveniente que los límites de los intervalos sean valores posibles firmar. Por tanto, el valor resultante del ancho del intervalo debe redondearse teniendo en cuenta la precisión del experimento. Observamos especialmente que el redondeo no debe realizarse en el sentido matemático generalmente aceptado, sino hacia arriba, es decir, en exceso, para no reducir el rango general de variación de la característica; la suma del ancho de todos los intervalos no debe ser menor que la diferencia entre los valores máximo y mínimo de la característica. En el ejemplo considerado, los datos experimentales se determinan a la centésima más cercana (0,01 m), por lo que el valor del ancho del intervalo obtenido anteriormente debe redondearse a la centésima más cercana. Como resultado obtenemos:

h= 0,67 (m).

Después de determinar el ancho de los intervalos de agrupación, se deben determinar sus límites. Es aconsejable tomar el límite inferior del primer intervalo igual al valor mínimo del atributo en la muestra. incógnita mín:

incógnita H1 = incógnita mín.

En el ejemplo considerado incógnita H1 = 13,04 (m).

para recibir límite superior primer intervalo ( incógnita B1) debes sumar el valor del ancho del intervalo al valor del límite inferior del primer intervalo:

incógnita B1 = incógnita H1 + h.

Tenga en cuenta que el límite superior de cada intervalo (aquí, el primero) será simultáneamente el límite inferior del siguiente (en en este caso segundo) intervalo: incógnita H2 = incógnita B1.

Los valores de los límites superior e inferior de todos los intervalos restantes se determinan de manera similar:

incógnita B i = incógnita norte yo +1 = incógnita Ni yo + h.

En este ejemplo:

incógnita B1 = incógnita H2 = incógnita H1 + h=13,04+0,67=13,71 (m),

incógnita B2 = incógnita H3 = incógnita H2+ h=13,71+0,67=14,38 (m),

incógnita B3 = incógnita H4 = incógnita H3+ h=14,38+0,67=15,05 (m),

incógnita B4 = incógnita H5 = incógnita H4 + h=15,05+0,67=15,72 (m),

incógnita B5 = incógnita H5+ h=15,72+0,67=16,39 (m).

Antes de agrupar la opción, introducimos el concepto. valor mediano del intervalo xyo, igual al valor característica equidistante de los extremos de este intervalo. Considerando que está espaciado del límite inferior por la cantidad igual a la mitad ancho del intervalo, para determinarlo es conveniente utilizar la relación:

xyo=incógnita norte i+ h/2,

Dónde incógnita N i - límite inferior i-intervalo ro, y h- su ancho. Los valores medianos de los intervalos se utilizarán más adelante al procesar datos agrupados.

Después de determinar los límites de todos los intervalos, las opciones de muestra deben distribuirse entre estos intervalos. Pero primero debe decidir en qué intervalo incluir un valor ubicado exactamente en el borde de dos intervalos, es decir, cuando el valor de las opciones coincide con el límite superior de uno y el límite inferior del intervalo adyacente. En este caso, la opción se puede asignar a cualquiera de los dos intervalos adyacentes y, para eliminar ambigüedad en la agrupación, acordamos en tales casos asignar las opciones al intervalo superior. A favor de este enfoque se puede presentar el siguiente argumento. Dado que el valor mínimo del atributo coincide con el límite inferior del primer intervalo y está incluido en este intervalo, entonces la opción que cae en el límite de dos intervalos debe clasificarse como uno de ellos, cuyo valor del límite inferior es igual a la opción bajo consideración.

Pasemos a considerar la tabla estadística; consulte la tabla 4, que consta de siete columnas.

Tabla 4

Presentación tabular de resultados en lanzamiento de peso.

Las primeras tres columnas de la tabla estadística contienen, respectivamente, los números de intervalos de agrupación. i, sus límites incógnita norte i- incógnita EN i y valores medianos de intervalos incógnita i .

La cuarta columna contiene las frecuencias de los intervalos. Frecuencia intervalo es un número que muestra cuántas opciones hay, es decir Los resultados de la medición se encuentran dentro de este intervalo. Para denotar esta cantidad se acostumbra utilizar el símbolo n yo. La suma de todas las frecuencias de todos los intervalos es siempre igual al tamaño de la muestra. norte, que se puede utilizar para comprobar la exactitud de la agrupación.

La quinta columna del cuadro 4 está destinada a entrar en él. frecuencia acumulada intervalo: número obtenido sumando la frecuencia del intervalo actual con las frecuencias de todos los intervalos anteriores. La frecuencia acumulada generalmente se denota letra latina ni yo. La frecuencia acumulada muestra cuántas opciones tienen valores no mayores que el límite superior del intervalo.

La sexta columna de la tabla contiene la frecuencia. Frecuencia se llama frecuencia presentada en términos relativos, es decir relación entre la frecuencia y el tamaño de la muestra. La suma de todas las frecuencias es siempre igual a 1. El símbolo se utiliza para indicar la frecuencia. f yo:

f yo=n yo / n.

La frecuencia de un intervalo está relacionada con la probabilidad de que una variable aleatoria caiga en ese intervalo. Según el teorema de Bernoulli, con un aumento ilimitado en el número de experimentos, la frecuencia de un evento converge en probabilidad a su probabilidad. Si entendemos por evento que el valor de la cantidad estudiada cae dentro de un cierto intervalo, entonces queda claro que cuando gran número experimentos, la frecuencia del intervalo se aproxima a la probabilidad de que la variable aleatoria medida caiga en este intervalo.

Tanto la frecuencia como la frecuencia describen la repetibilidad de los resultados en una muestra. comparándolos significancia estadística, cabe señalar que el contenido de información de la frecuencia es significativamente mayor que el de la frecuencia. De hecho, si, como, por ejemplo, en la Tabla 4, la frecuencia del segundo intervalo es 8 y, por tanto, 8 resultados cayeron en este intervalo, entonces es difícil entender si esto es poco o mucho; si hay 1000 variantes en la muestra, entonces esta frecuencia es pequeña, y si hay 20, entonces es grande. En este caso, para evaluación objetiva es necesario comparar el valor de la frecuencia con el tamaño de la muestra. Si utiliza la frecuencia, podrá saber inmediatamente qué proporción de los resultados se encuentran dentro del intervalo considerado (aproximadamente el 28% en el ejemplo dado). Por tanto, la frecuencia proporciona una representación más visual de la repetibilidad de una característica en una muestra. Cabe destacar especialmente otra ventaja importante de la frecuencia. Su uso permite comparar muestras de diferentes tamaños. La frecuencia no es aplicable para tales fines.

La séptima columna de la tabla contiene la frecuencia acumulada. Frecuencia acumulada es la relación entre la frecuencia acumulada y el tamaño de la muestra. La frecuencia acumulada está indicada por la letra F yo:

La frecuencia acumulada muestra qué proporción de la variante de la muestra tiene valores que no superan el valor del límite superior del intervalo.

Última línea La tabla estadística se utiliza para controlar la agrupación.

Después de completar la tabla, volvamos a definir la serie estadística. Como regla general, una serie estadística se presenta en forma de tabla, en la primera línea se enumeran los intervalos y en la segunda línea se enumeran las frecuencias o frecuencias correspondientes a ellos. De este modo, estadísticamente cerca llamado doble serie de números, estableciendo una conexión entre valor numérico la característica que se está estudiando y su repetibilidad en la muestra. Ventaja significativa serie estadística es que, a diferencia de los agregados estadísticos, dan una idea clara de rasgos característicos variación de signos.


©2015-2019 sitio
Todos los derechos pertenecen a sus autores. Este sitio no reclama autoría, pero proporciona uso gratuito.
Fecha de creación de la página: 2016-08-20

Con una gran cantidad de observaciones (del orden de cientos), un simple agregado estadístico deja de ser una forma conveniente de registrar material estadístico: se vuelve demasiado engorroso y poco visual. Para hacerlo más compacto y claro, el material estadístico debe someterse a un procesamiento adicional: se construye la llamada "serie estadística".

Supongamos que tenemos a nuestra disposición los resultados de las observaciones de una variable aleatoria continua, presentados en forma de una población estadística simple. Dividamos todo el rango de valores observados en intervalos o “dígitos” y contemos el número de valores por cada dígito. Divida este número por número total observaciones y encuentre la frecuencia correspondiente a esta categoría:

Obviamente, la suma de las frecuencias de todos los dígitos debe ser igual a uno.

Construyamos una tabla que muestre los dígitos en el orden de su ubicación a lo largo del eje de abscisas y las frecuencias correspondientes. Esta tabla se llama serie estadística:

Aquí, la designación de la octava categoría son sus límites; - frecuencia correspondiente; - número de dígitos.

Ejemplo 1. Se realizaron 500 mediciones del error de puntería lateral al disparar desde un avión a un objetivo terrestre. Los resultados de la medición (en milésimas de radianes) se resumen en una serie estadística:

Aquí se indican los rangos de valores de error de puntería; - el número de observaciones en un intervalo determinado, - las frecuencias correspondientes.

Al agrupar los valores observados de una variable aleatoria en dígitos, surge la pregunta de a qué dígito asignarle un valor que esté exactamente en el borde de dos dígitos. En estos casos, se puede recomendar (de forma puramente condicional) considerar que este valor pertenece a igualmente a ambos dígitos y sumar a los números de ambos dígitos de acuerdo con .

El número de dígitos en los que se debe agrupar el material estadístico no debe ser demasiado grande (entonces la serie de distribución se vuelve inexpresiva y las frecuencias en ella exhiben fluctuaciones irregulares); por otro lado, no debería ser demasiado pequeño (con un número pequeño de dígitos, las propiedades de distribución se describen de manera demasiado aproximada en las series estadísticas). La práctica demuestra que en la mayoría de los casos es racional elegir un número de dígitos del orden de 10 a 20. Cuanto más rico y homogéneo sea el material estadístico, mayor será el número de dígitos que se podrán elegir al compilar una serie estadística. Las longitudes de los bits pueden ser iguales o diferentes. Por supuesto, es más fácil tomarlos igual. Sin embargo, al registrar datos sobre variables aleatorias, distribuidos de manera extremadamente desigual, a veces es conveniente elegir descargas más estrechas en la región de mayor densidad de distribución que en la región de baja densidad.

Una serie estadística a menudo se presenta gráficamente en forma del llamado histograma. El histograma se construye de la siguiente manera. Los dígitos se trazan a lo largo del eje de abscisas, y en cada uno de los dígitos, como base, se construye un rectángulo, cuyo área es igual a la frecuencia del dígito dado. Para construir un histograma, debes dividir la frecuencia de cada dígito por su longitud y tomar el número resultante como la altura del rectángulo. En el caso de descargas de igual longitud, las alturas de los rectángulos son proporcionales a las frecuencias correspondientes. Del método de construcción del histograma se deduce que área total es igual a uno.

Como ejemplo, podemos dar un histograma del error de puntería, construido a partir de los datos de la serie estadística considerada en el ejemplo 1 (Fig. 7.3.1).

Obviamente, a medida que aumenta el número de experimentos, se pueden seleccionar categorías cada vez más pequeñas; en este caso, el histograma se acercará cada vez más a una determinada curva que limita el área, igual a uno. Es fácil ver que esta curva es una gráfica de la densidad de distribución de la cantidad.

Utilizando los datos de la serie estadística, es posible construir aproximadamente la función de distribución estadística de la cantidad. Construir una función de distribución estadística precisa con varios cientos de saltos en todos los valores observados requiere demasiado trabajo y no se justifica. Para la práctica, suele ser suficiente construir una función de distribución estadística sobre varios puntos. Conviene tomar como puntos los límites de las categorías que aparecen en las series estadísticas. Entonces obviamente

(7.3.2)

Al conectar los puntos obtenidos con una línea discontinua o una curva suave, obtenemos una gráfica aproximada de la función de distribución estadística.

Ejemplo 2. Construir aproximadamente función estadística Distribución del error de puntería según la serie estadística del ejemplo 1.



¿Te gustó el artículo? ¡Comparte con tus amigos!