Intervalo de confianza muestral. Determinando el intervalo de confianza

Intervalo de confianza

Intervalo de confianza- término utilizado en estadística matemática para la estimación de intervalos (en lugar de puntuales) de parámetros estadísticos, que es preferible cuando el tamaño de la muestra es pequeño. Un intervalo de confianza es aquel que cubre un parámetro desconocido con una confiabilidad determinada.

El método de los intervalos de confianza fue desarrollado por el estadístico estadounidense Jerzy Neumann, basándose en las ideas del estadístico inglés Ronald Fisher.

Definición

Intervalo de confianza del parámetro θ distribución de variables aleatorias X con nivel de confianza 100 pag%, generado por la muestra ( X 1 ,…,X n), se llama intervalo con límites ( X 1 ,…,X norte) y ( X 1 ,…,X n), que son realizaciones de variables aleatorias l(X 1 ,…,X norte) y Ud.(X 1 ,…,X n), tal que

.

Los puntos límite del intervalo de confianza se llaman límites de confianza.

Una interpretación basada en la intuición del intervalo de confianza sería: si pag es grande (digamos 0,95 o 0,99), entonces es casi seguro que el intervalo de confianza contiene el valor verdadero θ .

Otra interpretación del concepto de intervalo de confianza: puede considerarse como un intervalo de valores de parámetros. θ compatible con los datos experimentales y no contradecirlos.

Ejemplos

  • Intervalo de confianza para la expectativa matemática de una muestra normal;
  • Intervalo de confianza para la varianza muestral normal.

Intervalo de confianza bayesiano

En las estadísticas bayesianas, existe una definición similar pero diferente en algunos detalles clave de un intervalo de confianza. Aquí, el parámetro estimado en sí se considera una variable aleatoria con alguna distribución previa dada (en el caso más simple, uniforme), y la muestra es fija (en estadística clásica todo es exactamente al revés). Un intervalo de confianza bayesiano es un intervalo que cubre el valor del parámetro con la probabilidad posterior:

.

En general, los intervalos de confianza clásicos y bayesianos son diferentes. En la literatura en lengua inglesa, el intervalo de confianza bayesiano suele denominarse término intervalo creíble, y el clásico - intervalo de confianza.

Notas

Fuentes

Fundación Wikimedia. 2010.

  • Niños (película)
  • Colono

Vea qué es “intervalo de confianza” en otros diccionarios:

    Intervalo de confianza- un intervalo calculado a partir de datos de muestra, que con una probabilidad dada (confianza) cubre el valor verdadero desconocido del parámetro de distribución estimado. Fuente: GOST 20522 96: Suelos. Métodos para el procesamiento estadístico de resultados... Diccionario-libro de referencia de términos de documentación normativa y técnica.

    intervalo de confianza- para un parámetro escalar de la población, este es un segmento que probablemente contiene este parámetro. Esta frase no tiene sentido sin mayor explicación. Dado que los límites del intervalo de confianza se estiman a partir de la muestra, es natural... ... Diccionario de estadística sociológica

    INTERVALO DE CONFIANZA- un método de estimación de parámetros que difiere de la estimación puntual. Sea la muestra x1, . . ., xn de una distribución con densidad de probabilidad f(x, α), y estimación de densidad de probabilidad a*=a*(x1, . . ., xn) α, g(a*, α). Estan buscando… … Enciclopedia geológica

    INTERVALO DE CONFIANZA- (intervalo de confianza) Intervalo en el que la confiabilidad del valor del parámetro para la población obtenido sobre la base de una encuesta por muestreo tiene un cierto grado de probabilidad, por ejemplo, 95%, lo que se debe a la muestra misma. Ancho… … Diccionario económico

    intervalo de confianza- es el intervalo en el que se ubica el valor real de la cantidad determinada con una probabilidad de confianza dada. Química general: libro de texto / A. V. Zholnin ... términos químicos

    Intervalo de confianza IC- Intervalo de confianza, CI * intervalo de datos, CI * intervalo de confianza intervalo del valor característico, calculado para k.l. parámetro de distribución (por ejemplo, el valor promedio de una característica) en toda la muestra y con una cierta probabilidad (por ejemplo, 95% para 95%... Genética. diccionario enciclopédico

    INTERVALO DE CONFIANZA- un concepto que surge al estimar un parámetro estadístico. distribución por intervalo de valores. D. y. para el parámetro q, correspondiente a este coeficiente. confianza P es igual a un intervalo tal (q1, q2) que para cualquier distribución de probabilidad de desigualdad... ... Enciclopedia física

    intervalo de confianza- - Temas de telecomunicaciones, conceptos básicos EN intervalo de confianza... Guía del traductor técnico

    intervalo de confianza- pasikliovimo intervalos statusas T sritis Standartizacija ir metrologija apibrėžtis Dydžio verčių intervalos, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. atitikmenys: inglés. intervalo de confianza vok. Vertrauensbereich, m rus.… … Penkiakalbis aiškinamasis metrologijos terminų žodynas

    intervalo de confianza- pasikliovimo intervalos statusas T sritis chemija apibrėžtis Dydžio verčių intervalos, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. atitikmenys: inglés. intervalo de confianza ruso. área de confianza; intervalo de confianza... Chemijos terminų aiškinamasis žodynas

Objetivo– enseñar a los estudiantes algoritmos para calcular intervalos de confianza de parámetros estadísticos.

Al procesar datos estadísticamente, la media aritmética calculada, el coeficiente de variación, el coeficiente de correlación, los criterios de diferencia y otras estadísticas puntuales deben recibir límites de confianza cuantitativos, que indican posibles fluctuaciones del indicador en direcciones mayores y menores dentro del intervalo de confianza.

Ejemplo 3.1 . La distribución del calcio en el suero sanguíneo de los monos, como se estableció anteriormente, se caracteriza por los siguientes indicadores de muestra: = 11,94 mg%; = 0,127 mg%; norte= 100. Se requiere determinar el intervalo de confianza para el promedio general ( ) con probabilidad de confianza PAG = 0,95.

El promedio general se ubica con cierta probabilidad en el intervalo:

, Dónde – media aritmética muestral; t– Prueba de estudiante; – error de la media aritmética.

Usando la tabla “Valores de la prueba t de Student” encontramos el valor con una probabilidad de confianza de 0,95 y el número de grados de libertad k= 100-1 = 99. Es igual a 1,982. Junto con los valores de la media aritmética y el error estadístico, lo sustituimos en la fórmula:

o 11.69
12,19

Así, con una probabilidad del 95%, se puede afirmar que el promedio general de esta distribución normal se encuentra entre 11,69 y 12,19 mg%.

Ejemplo 3.2 . Determine los límites del intervalo de confianza del 95% para la varianza general ( ) distribución de calcio en la sangre de los monos, si se sabe que
= 1,60, en norte = 100.

Para resolver el problema puedes utilizar la siguiente fórmula:

Dónde – error estadístico de dispersión.

Encontramos el error de varianza muestral usando la fórmula:
. Es igual a 0,11. Significado t- criterio con una probabilidad de confianza de 0,95 y el número de grados de libertad k= 100–1 = 99 se conoce por el ejemplo anterior.

Usemos la fórmula y obtengamos:

o 1,38
1,82

Más precisamente, el intervalo de confianza de la varianza general se puede construir utilizando (chi-cuadrado) - Prueba de Pearson. Los puntos críticos para este criterio se dan en una tabla especial. Al utilizar el criterio Para construir un intervalo de confianza, se utiliza un nivel de significancia bilateral. Para el límite inferior, el nivel de significancia se calcula mediante la fórmula
, para la cima –
. Por ejemplo, para el nivel de confianza = 0,99= 0,010,= 0,990. En consecuencia, según la tabla de distribución de valores críticos. , con niveles de confianza calculados y número de grados de libertad k= 100 – 1= 99, encuentra los valores
Y
. Obtenemos
es igual a 135,80, y
es igual a 70,06.

Para encontrar límites de confianza para la varianza general usando Usemos las fórmulas: para el límite inferior
, para el límite superior
. Sustituyamos los valores encontrados por los datos del problema. en fórmulas:
= 1,17;
= 2,26. Por lo tanto, con una probabilidad de confianza PAG= 0,99 o 99% de la variación general estará en el rango de 1,17 a 2,26 mg% inclusive.

Ejemplo 3.3 . Entre las 1.000 semillas de trigo del lote recibidas en el ascensor, se encontraron 120 semillas infectadas con cornezuelo de centeno. Es necesario determinar los límites probables de la proporción general de semillas infectadas en un lote determinado de trigo.

Es recomendable determinar los límites de confianza de la participación general para todos sus valores posibles mediante la fórmula:

,

Dónde norte – número de observaciones; metro– tamaño absoluto de uno de los grupos; t– desviación normalizada.

La proporción muestral de semillas infectadas es
o 12%. Con probabilidad de confianza R= 95% de desviación normalizada ( t-Prueba del estudiante en k =
)t = 1,960.

Sustituimos los datos disponibles en la fórmula:

Por tanto, los límites del intervalo de confianza son iguales a = 0,122–0,041 = 0,081, o 8,1%; = 0,122 + 0,041 = 0,163, o 16,3%.

Así, con una probabilidad de confianza del 95% se puede afirmar que la proporción general de semillas infectadas está entre el 8,1 y el 16,3%.

Ejemplo 3.4 . El coeficiente de variación que caracteriza la variación del calcio (mg%) en el suero sanguíneo de los monos fue igual al 10,6%. Tamaño de la muestra norte= 100. Es necesario determinar los límites del intervalo de confianza del 95% para el parámetro general CV.

Límites del intervalo de confianza para el coeficiente general de variación. CV están determinadas por las siguientes fórmulas:

Y
, Dónde k valor intermedio calculado por la fórmula
.

Sabiendo que con probabilidad de confianza R= 95% de desviación normalizada (prueba de Student en k =
)t = 1.960, primero calculemos el valor A:

.

o 9,3%

o 12,3%

Así, el coeficiente general de variación con un nivel de confianza del 95% se sitúa en el rango del 9,3 al 12,3%. Con muestras repetidas, el coeficiente de variación no superará el 12,3% y no será inferior al 9,3% en 95 casos de 100.

Preguntas para el autocontrol:

Problemas para solución independiente.

1. El porcentaje medio de grasa en la leche durante la lactancia de las vacas cruzadas Kholmogory fue el siguiente: 3,4; 3,6; 3.2; 3.1; 2,9; 3,7; 3.2; 3,6; 4,0; 3.4; 4.1; 3,8; 3.4; 4,0; 3.3; 3,7; 3,5; 3,6; 3.4; 3.8. Establecer intervalos de confianza para la media general al 95% de nivel de confianza (20 puntos).

2. En 400 plantas híbridas de centeno, las primeras flores aparecieron en promedio 70,5 días después de la siembra. La desviación estándar fue de 6,9 ​​días. Determinar el error de la media y los intervalos de confianza para la media general y la varianza al nivel de significancia. W.= 0,05 y W.= 0,01 (25 puntos).

3. Al estudiar la longitud de las hojas de 502 ejemplares de fresas de jardín, se obtuvieron los siguientes datos: = 7,86 centímetros; s = 1,32 cm, =± 0.06 cm Determinar intervalos de confianza para la media aritmética poblacional con niveles de significancia de 0.01; 0,02; 0,05. (25 puntos).

4. En un estudio de 150 hombres adultos, la altura promedio fue de 167 cm y σ = 6 cm ¿Cuáles son los límites de la media general y la varianza general con una probabilidad de confianza de 0,99 y 0,95? (25 puntos).

5. La distribución del calcio en el suero sanguíneo de los monos se caracteriza por los siguientes indicadores selectivos: = 11,94 mg%, σ = 1,27, norte = 100. Construya un intervalo de confianza del 95% para la media general de esta distribución. Calcular el coeficiente de variación (25 puntos).

6. Se estudió el contenido de nitrógeno total en el plasma sanguíneo de ratas albinas de 37 y 180 días de edad. Los resultados se expresan en gramos por 100 cm 3 de plasma. A la edad de 37 días, 9 ratas tenían: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. A la edad de 180 días, 8 ratas tenían: 1,20; 1,18; 1,33; 1,21; 1,20; 1,07; 1,13; 1.12. Establezca intervalos de confianza para la diferencia en un nivel de confianza de 0,95 (50 puntos).

7. Determine los límites del intervalo de confianza del 95% para la varianza general de la distribución de calcio (mg%) en el suero sanguíneo de monos, si para esta distribución el tamaño de la muestra es n = 100, error estadístico de la varianza de la muestra s σ 2 = 1,60 (40 puntos).

8. Determine los límites del intervalo de confianza del 95% para la varianza general de la distribución de 40 espiguillas de trigo a lo largo (σ 2 = 40,87 mm 2). (25 puntos).

9. El tabaquismo se considera el principal factor de predisposición a las enfermedades pulmonares obstructivas. El tabaquismo pasivo no se considera un factor de ese tipo. Los científicos dudaron de la inocuidad del tabaquismo pasivo y examinaron la permeabilidad de las vías respiratorias de no fumadores, fumadores pasivos y activos. Para caracterizar el estado del tracto respiratorio, tomamos uno de los indicadores de la función respiratoria externa: el caudal volumétrico máximo en la mitad de la espiración. Una disminución de este indicador es un signo de obstrucción de las vías respiratorias. Los datos de la encuesta se muestran en la tabla.

Número de personas examinadas

Caudal máximo espiratorio medio, l/s

Desviación Estándar

No fumadores

trabajar en un área para no fumadores

trabajando en una habitación llena de humo

De fumar

fumar una pequeña cantidad de cigarrillos

número promedio de fumadores de cigarrillos

fumar una gran cantidad de cigarrillos

Utilizando los datos de la tabla, encuentre intervalos de confianza del 95% para la media general y la varianza general de cada grupo. ¿Cuáles son las diferencias entre los grupos? Presentar los resultados de forma gráfica (25 puntos).

10. Determine los límites de los intervalos de confianza del 95% y 99% para la varianza general en el número de lechones en 64 partos, si el error estadístico de la varianza muestral s σ 2 = 8,25 (30 puntos).

11. Se sabe que el peso medio de los conejos es de 2,1 kg. Determine los límites de los intervalos de confianza del 95% y del 99% para la media general y la varianza en norte= 30, σ = 0,56 kg (25 puntos).

12. Se midió el contenido de grano de la espiga en 100 espigas ( X), longitud de la oreja ( Y) y la masa de grano en la espiga ( z). Encuentre intervalos de confianza para la media general y la varianza en PAG 1 = 0,95, PAG 2 = 0,99, PAG 3 = 0,999 si = 19, = 6,766 cm, = 0,554 g; σ x 2 = 29,153, σ y 2 = 2, 111, σ z 2 = 0, 064. (25 puntos).

13. En 100 espigas de trigo de invierno seleccionadas al azar, se contó el número de espiguillas. La población de la muestra se caracterizó por los siguientes indicadores: = 15 espiguillas y σ = 2,28 uds. Determine con qué precisión se obtuvo el resultado promedio ( ) y construir un intervalo de confianza para la media general y la varianza en niveles de significancia del 95% y 99% (30 puntos).

14. Número de costillas en conchas de moluscos fósiles Ortambonitas caligrama:

Se sabe que norte = 19, σ = 4,25. Determine los límites del intervalo de confianza para la media general y la varianza general en el nivel de significancia. W. = 0,01 (25 puntos).

15. Para determinar la producción de leche en una granja lechera comercial, se determinó diariamente la productividad de 15 vacas. Según datos del año, cada vaca dio en promedio la siguiente cantidad de leche por día (l): 22; 19; 25; 20; 27; 17; treinta; 21; 18; 24; 26; 23; 25; 20; 24. Construya intervalos de confianza para la varianza general y la media aritmética. ¿Podemos esperar que la producción media anual de leche por vaca sea de 10.000 litros? (50 puntos).

16. Para determinar el rendimiento medio de trigo de la empresa agrícola, se siegaron parcelas de prueba de 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 y 2 hectáreas. La productividad (c/ha) de las parcelas fue de 39,4; 38; 35,8; 40; 35; 42,7; 39,3; 41,6; 33; 42; 29 respectivamente. Construya intervalos de confianza para la varianza general y la media aritmética. ¿Podemos esperar que el rendimiento agrícola promedio sea de 42 c/ha? (50 puntos).

Intervalo de confianza para la expectativa matemática - este es un intervalo calculado a partir de datos que, con una probabilidad conocida, contiene la expectativa matemática de la población general. Una estimación natural de la expectativa matemática es la media aritmética de sus valores observados. Por lo tanto, a lo largo de la lección usaremos los términos “promedio” y “valor promedio”. En los problemas de cálculo de un intervalo de confianza, la respuesta que se requiere con mayor frecuencia es algo así como "El intervalo de confianza del número promedio [valor en un problema particular] es de [valor menor] a [valor mayor]". Utilizando un intervalo de confianza, es posible evaluar no solo los valores promedio, sino también la proporción de una característica particular de la población general. En la lección se analizan los valores medios, la dispersión, la desviación estándar y el error, a través de los cuales llegaremos a nuevas definiciones y fórmulas. Características de la muestra y la población. .

Estimaciones puntuales y de intervalo de la media.

Si el valor promedio de la población se estima mediante un número (punto), entonces se toma como estimación del valor promedio desconocido de la población un promedio específico, que se calcula a partir de una muestra de observaciones. En este caso, el valor de la media muestral (una variable aleatoria) no coincide con el valor medio de la población general. Por lo tanto, al indicar la media muestral, se debe indicar simultáneamente el error muestral. La medida del error muestral es el error estándar, que se expresa en las mismas unidades que la media. Por lo tanto, se suele utilizar la siguiente notación: .

Si es necesario asociar la estimación del promedio con una cierta probabilidad, entonces el parámetro de interés en la población debe evaluarse no mediante un número, sino mediante un intervalo. Un intervalo de confianza es un intervalo en el que, con una cierta probabilidad PAG Se encuentra el valor del indicador de población estimada. Intervalo de confianza en el que es probable PAG = 1 - α Se encuentra la variable aleatoria, calculada de la siguiente manera:

,

α = 1 - PAG, que se puede encontrar en el apéndice de casi cualquier libro sobre estadística.

En la práctica, la media poblacional y la varianza no se conocen, por lo que la varianza poblacional se reemplaza por la varianza muestral y la media poblacional por la media muestral. Por tanto, el intervalo de confianza en la mayoría de los casos se calcula de la siguiente manera:

.

La fórmula del intervalo de confianza se puede utilizar para estimar la media poblacional si

  • se conoce la desviación estándar de la población;
  • o se desconoce la desviación estándar de la población, pero el tamaño de la muestra es mayor que 30.

La media muestral es una estimación insesgada de la media poblacional. A su vez, la varianza muestral no es una estimación insesgada de la varianza poblacional. Para obtener una estimación insesgada de la varianza poblacional en la fórmula de varianza muestral, el tamaño de la muestra norte debe ser reemplazado por norte-1.

Ejemplo 1. Se recopiló información de 100 cafés seleccionados al azar en una determinada ciudad de que el número promedio de empleados en ellos es 10,5 con una desviación estándar de 4,6. Determine el intervalo de confianza del 95% para el número de empleados de una cafetería.

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,05 .

Así, el intervalo de confianza del 95% para el número medio de empleados de cafeterías osciló entre 9,6 y 11,4.

Ejemplo 2. Para una muestra aleatoria de una población de 64 observaciones, se calcularon los siguientes valores totales:

suma de valores en observaciones,

suma de desviaciones al cuadrado de valores de la media .

Calcule el intervalo de confianza del 95% para la expectativa matemática.

Calculemos la desviación estándar:

,

Calculemos el valor medio:

.

Sustituimos los valores en la expresión del intervalo de confianza:

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,05 .

Obtenemos:

Así, el intervalo de confianza del 95% para la expectativa matemática de esta muestra osciló entre 7,484 y 11,266.

Ejemplo 3. Para una muestra de población aleatoria de 100 observaciones, la media calculada es 15,2 y la desviación estándar es 3,2. Calcule el intervalo de confianza del 95% para el valor esperado y luego el intervalo de confianza del 99%. Si el poder de la muestra y su variación permanecen sin cambios y el coeficiente de confianza aumenta, ¿se estrechará o ampliará el intervalo de confianza?

Sustituimos estos valores en la expresión del intervalo de confianza:

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,05 .

Obtenemos:

.

Así, el intervalo de confianza del 95% para la media de esta muestra osciló entre 14,57 y 15,82.

Nuevamente sustituimos estos valores en la expresión del intervalo de confianza:

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,01 .

Obtenemos:

.

Así, el intervalo de confianza del 99% para la media de esta muestra osciló entre 14,37 y 16,02.

Como vemos, a medida que aumenta el coeficiente de confianza, el valor crítico de la distribución normal estándar también aumenta y, en consecuencia, los puntos inicial y final del intervalo se ubican más lejos de la media y, por lo tanto, aumenta el intervalo de confianza para la expectativa matemática. .

Estimaciones puntuales y de intervalo de gravedad específica.

La proporción de algún atributo de la muestra se puede interpretar como una estimación puntual de la proporción. pag de la misma característica en la población general. Si es necesario asociar este valor con la probabilidad, entonces se debe calcular el intervalo de confianza de la gravedad específica. pag característica en la población con probabilidad PAG = 1 - α :

.

Ejemplo 4. En alguna ciudad hay dos candidatos. A Y B se postulan para alcalde. Se encuestó aleatoriamente a 200 vecinos de la ciudad, de los cuales el 46% respondió que votaría por el candidato A, 26% - por el candidato B y el 28% no sabe por quién votará. Determine el intervalo de confianza del 95% para la proporción de residentes de la ciudad que apoyan al candidato. A.

Intervalo de confianza– los valores límite de una cantidad estadística que, con una probabilidad de confianza dada γ, estarán en este intervalo al muestrear un volumen mayor. Se denota como P(θ - ε. En la práctica, la probabilidad de confianza γ se elige entre valores bastante cercanos a la unidad: γ = 0,9, γ = 0,95, γ = 0,99.

Objeto del servicio. Con este servicio, puede determinar:

  • intervalo de confianza para la media general, intervalo de confianza para la varianza;
  • intervalo de confianza para la desviación estándar, intervalo de confianza para la participación general;
La solución resultante se guarda en un archivo de Word (ver ejemplo). A continuación se muestra una instrucción en video sobre cómo completar los datos iniciales.

Ejemplo No. 1. En una granja colectiva, de un rebaño total de 1.000 ovejas, 100 fueron sometidas a una esquila de control selectiva. Como resultado se estableció un recorte de lana promedio de 4,2 kg por oveja. Determine con una probabilidad de 0,99 el error cuadrático medio de la muestra al determinar el esquileo promedio de lana por oveja y los límites dentro de los cuales se contiene el valor de esquileo si la varianza es 2,5. La muestra no es repetitiva.
Ejemplo No. 2. De un lote de productos importados en el puesto de Aduanas del Norte de Moscú, se tomaron 20 muestras del producto "A" mediante muestreo aleatorio repetido. Como resultado de la prueba se estableció el contenido de humedad promedio del producto “A” en la muestra, el cual resultó ser igual al 6% con una desviación estándar del 1%.
Determine con probabilidad 0,683 los límites del contenido de humedad promedio del producto en todo el lote de productos importados.
Ejemplo No. 3. Una encuesta de 36 estudiantes mostró que el número promedio de libros de texto leídos por ellos durante el año académico era igual a 6. Suponiendo que el número de libros de texto leídos por un estudiante por semestre tiene una ley de distribución normal con una desviación estándar igual a 6, encuentre : A) con una confiabilidad de 0,99 estimación de intervalo para la expectativa matemática de esta variable aleatoria; B) ¿Con qué probabilidad podemos decir que el número promedio de libros de texto leídos por un estudiante por semestre, calculado a partir de esta muestra, se desviará de la expectativa matemática en valor absoluto en no más de 2?

Clasificación de intervalos de confianza.

Por tipo de parámetro a evaluar:

Por tipo de muestra:

  1. Intervalo de confianza para una muestra infinita;
  2. Intervalo de confianza para la muestra final;
La muestra se llama remuestreo., si el objeto seleccionado se devuelve a la población antes de seleccionar el siguiente. La muestra se llama no repetida., si el objeto seleccionado no se devuelve a la población. En la práctica, normalmente trabajamos con muestras no repetitivas.

Cálculo del error muestral medio para muestreo aleatorio.

La discrepancia entre los valores de los indicadores obtenidos de la muestra y los parámetros correspondientes de la población general se denomina error de representatividad.
Designaciones de los principales parámetros de la población general y muestral.
Fórmulas de error de muestreo promedio
reselecciónrepetir la selección
para promediopara compartirpara promediopara compartir
La relación entre el límite de error muestral (Δ) garantizado con cierta probabilidad Р(t), y el error de muestreo promedio tiene la forma: o Δ = t·μ, donde t– coeficiente de confianza, determinado en función del nivel de probabilidad P(t) según la tabla de la función integral de Laplace.

Fórmulas para calcular el tamaño de la muestra utilizando un método de muestreo puramente aleatorio.

En las subsecciones anteriores consideramos la cuestión de estimar un parámetro desconocido. A un número. Esto se llama estimación “puntual”. En una serie de tareas, no sólo es necesario buscar el parámetro A valor numérico adecuado, sino también para evaluar su precisión y fiabilidad. Necesita saber qué errores puede provocar la sustitución de un parámetro A su estimación puntual A¿Y con qué grado de confianza podemos esperar que estos errores no excedan los límites conocidos?

Los problemas de este tipo son especialmente relevantes con un número pequeño de observaciones, cuando la estimación puntual y en es en gran medida aleatorio y la sustitución aproximada de a por a puede provocar errores graves.

Para dar una idea de la exactitud y fiabilidad de la estimación. A,

En estadística matemática se utilizan los llamados intervalos de confianza y probabilidades de confianza.

Sea el parámetro A estimación insesgada obtenida de la experiencia A. Queremos estimar el posible error en este caso. Asignemos una probabilidad p suficientemente grande (por ejemplo, p = 0,9, 0,95 o 0,99) tal que un evento con probabilidad p pueda considerarse prácticamente confiable, y encontremos un valor s para el cual

Luego, el rango de valores prácticamente posibles del error que surge durante el reemplazo. A en A, será ± s; Los errores grandes en valor absoluto aparecerán sólo con una probabilidad baja a = 1 - p. Reescribamos (14.3.1) como:

La igualdad (14.3.2) significa que con probabilidad p el valor desconocido del parámetro A cae dentro del intervalo

Es necesario señalar una circunstancia. Anteriormente, hemos considerado repetidamente la probabilidad de que una variable aleatoria caiga en un intervalo no aleatorio determinado. Aquí la situación es diferente: la magnitud A no es aleatorio, pero el intervalo /p es aleatorio. Su posición en el eje x es aleatoria, determinada por su centro A; En general, la longitud del intervalo 2s también es aleatoria, ya que el valor de s se calcula, por regla general, a partir de datos experimentales. Por lo tanto, en este caso, sería mejor interpretar el valor p no como la probabilidad de “dar en el blanco” A en el intervalo / p, y como la probabilidad de que un intervalo aleatorio / p cubra el punto A(Figura 14.3.1).

Arroz. 14.3.1

La probabilidad p generalmente se llama probabilidad de confianza, y intervalo / p - intervalo de confianza. Límites de intervalo Si. ax =a- arena un 2 = un + y se llaman límites de confianza.

Demos otra interpretación al concepto de intervalo de confianza: puede considerarse como un intervalo de valores de parámetros. A, compatible con los datos experimentales y no contradecirlos. De hecho, si aceptamos considerar un evento con probabilidad a = 1-p prácticamente imposible, entonces aquellos valores del parámetro a para los cuales un - un> s deben ser reconocidos como datos experimentales contradictorios, y aquellos para los cuales |a - A a t na 2 .

Sea el parámetro A hay una estimación imparcial A. Si conociéramos la ley de distribución de la cantidad A, la tarea de encontrar un intervalo de confianza sería muy sencilla: bastaría con encontrar un valor s para el cual

La dificultad es que la ley de distribución de estimaciones. A Depende de la ley de distribución de la cantidad. X y, por tanto, de sus parámetros desconocidos (en particular, del propio parámetro A).

Para solucionar esta dificultad, puede utilizar la siguiente técnica aproximada: reemplazar los parámetros desconocidos en la expresión para s con sus estimaciones puntuales. Con un número relativamente grande de experimentos. PAG(alrededor de 20...30) esta técnica suele dar resultados satisfactorios en términos de precisión.

Como ejemplo, consideremos el problema de un intervalo de confianza para la expectativa matemática.

Que se produzca PAG X, cuyas características son la expectativa matemática t y varianza D- desconocido. Se obtuvieron las siguientes estimaciones para estos parámetros:

Se requiere construir un intervalo de confianza /p correspondiente a la probabilidad de confianza p para la expectativa matemática. t cantidades X.

Al resolver este problema, usaremos el hecho de que la cantidad t representa la suma PAG variables aleatorias independientes distribuidas idénticamente xh y de acuerdo con el teorema del límite central, para un valor suficientemente grande PAG su ley de distribución es cercana a la normal. En la práctica, incluso con un número relativamente pequeño de términos (alrededor de 10...20), la ley de distribución de la suma puede considerarse aproximadamente normal. Supondremos que el valor t distribuidos según la ley normal. Las características de esta ley (expectativa matemática y varianza) son iguales, respectivamente. t Y

(ver capítulo 13 subsección 13.3). Supongamos que el valor D conocemos y encontraremos un valor Ep para el cual

Usando la fórmula (6.3.5) del Capítulo 6, expresamos la probabilidad en el lado izquierdo de (14.3.5) mediante la función de distribución normal

¿Dónde está la desviación estándar de la estimación? T.

De la ecuación.

encuentre el valor de Sp:

donde arg Ф* (х) es la función inversa de Ф* (X), aquellos. tal valor del argumento para el cual la función de distribución normal es igual a X.

Dispersión D, a través del cual se expresa la cantidad A 1P, no lo sabemos exactamente; como valor aproximado se puede utilizar la estimación D(14.3.4) y poner aproximadamente:

Así, se ha resuelto aproximadamente el problema de construir un intervalo de confianza, que es igual a:

donde gp está determinado por la fórmula (14.3.7).

Para evitar la interpolación inversa en las tablas de la función Ф* (l) al calcular s p, es conveniente compilar una tabla especial (Tabla 14.3.1), que da los valores de la cantidad.

dependiendo de r. El valor (p determina, según la ley normal, el número de desviaciones estándar que deben trazarse hacia la derecha y hacia la izquierda desde el centro de dispersión para que la probabilidad de entrar en el área resultante sea igual a p.

Utilizando el valor 7 p, el intervalo de confianza se expresa como:

Tabla 14.3.1

Ejemplo 1. Se realizaron 20 experimentos sobre la cantidad X; los resultados se muestran en la tabla. 14.3.2.

Tabla 14.3.2

Se requiere encontrar una estimación de la expectativa matemática de la cantidad. X y construir un intervalo de confianza correspondiente a la probabilidad de confianza p = 0,8.

Solución. Tenemos:

Eligiendo l: = 10 como punto de referencia, usando la tercera fórmula (14.2.14) encontramos la estimación insesgada D :

Según la tabla 14.3.1 encontramos

Límites de confianza:

Intervalo de confianza:

Valores paramétricos T, que se encuentran en este intervalo son compatibles con los datos experimentales que figuran en la tabla. 14.3.2.

De manera similar se puede construir un intervalo de confianza para la varianza.

Que se produzca PAG experimentos independientes con una variable aleatoria X con parámetros desconocidos tanto para A como para la dispersión D Se obtuvo una estimación insesgada:

Se requiere construir aproximadamente un intervalo de confianza para la varianza.

De la fórmula (14.3.11) queda claro que la cantidad D representa

cantidad PAG variables aleatorias de la forma . Estos valores no son

independiente, ya que cualquiera de ellos incluye la cantidad T, dependiente de todos los demás. Sin embargo, se puede demostrar que a medida que aumenta PAG la ley de distribución de su suma también se acerca a la normal. Casi en PAG= 20...30 ya se puede considerar normal.

Supongamos que esto es así y encontremos las características de esta ley: expectativa matemática y dispersión. Desde la evaluación D- imparcial, entonces M[D] = D.

Cálculo de varianza D D está asociado con cálculos relativamente complejos, por lo que presentamos su expresión sin derivación:

donde q 4 es el cuarto momento central de la magnitud X.

Para usar esta expresión, debe sustituir los valores \u003d 4 y D(al menos los cercanos). En lugar de D puedes usar su evaluación D. En principio, el cuarto momento central también puede sustituirse por una estimación, por ejemplo, un valor de la forma:

pero tal reemplazo dará una precisión extremadamente baja, ya que en general, con un número limitado de experimentos, los momentos de orden superior se determinan con grandes errores. Sin embargo, en la práctica sucede a menudo que el tipo de ley de distribución de cantidades X conocido de antemano: sólo se desconocen sus parámetros. Entonces puedes intentar expresar μ 4 mediante D.

Tomemos el caso más común, cuando el valor X distribuidos según la ley normal. Luego su cuarto momento central se expresa en términos de dispersión (ver Capítulo 6, subsección 6.2);

y la fórmula (14.3.12) da o

Reemplazo de lo desconocido en (14.3.14) D su evaluación D, obtenemos: de donde

El momento μ 4 se puede expresar mediante D también en algunos otros casos, cuando la distribución del valor X No es normal, pero se conoce su apariencia. Por ejemplo, para la ley de densidad uniforme (ver Capítulo 5) tenemos:

donde (a, P) es el intervalo en el que se especifica la ley.

Por eso,

Usando la fórmula (14.3.12) obtenemos: donde encontramos aproximadamente

En los casos en que se desconoce el tipo de ley de distribución para la cantidad 26, al realizar una estimación aproximada del valor a/) se recomienda utilizar la fórmula (14.3.16), a menos que existan razones especiales para creer que esta ley es muy diferente al normal (tiene una notable curtosis positiva o negativa).

Si el valor aproximado a/) se obtiene de una forma u otra, entonces podemos construir un intervalo de confianza para la varianza de la misma manera que lo construimos para la expectativa matemática:

donde el valor que depende de la probabilidad p dada se encuentra según la tabla. 14.3.1.

Ejemplo 2. Encuentre aproximadamente un intervalo de confianza del 80% para la varianza de una variable aleatoria X en las condiciones del ejemplo 1, si se sabe que el valor X distribuidos según una ley cercana a la normal.

Solución. El valor sigue siendo el mismo que en la tabla. 14.3.1:

Según la fórmula (14.3.16)

Usando la fórmula (14.3.18) encontramos el intervalo de confianza:

El rango correspondiente de valores de desviación estándar: (0,21; 0,29).

14.4. Métodos exactos para construir intervalos de confianza para los parámetros de una variable aleatoria distribuida según una ley normal

En la subsección anterior, examinamos métodos aproximados para construir intervalos de confianza para la expectativa y la varianza matemáticas. Aquí daremos una idea de los métodos exactos para resolver el mismo problema. Destacamos que para encontrar con precisión los intervalos de confianza es absolutamente necesario conocer de antemano la forma de la ley de distribución de la cantidad. X, mientras que para la aplicación de métodos aproximados esto no es necesario.

La idea de métodos precisos para construir intervalos de confianza se reduce a lo siguiente. Cualquier intervalo de confianza se encuentra a partir de una condición que expresa la probabilidad de cumplir ciertas desigualdades, que incluyen la estimación que nos interesa. A. Ley de distribución de valoración. A en el caso general depende de parámetros desconocidos de la cantidad X. Sin embargo, a veces es posible pasar desigualdades de una variable aleatoria A a alguna otra función de los valores observados X p X 2, ..., X pág. cuya ley de distribución no depende de parámetros desconocidos, sino que depende únicamente del número de experimentos y del tipo de ley de distribución de la cantidad X. Este tipo de variables aleatorias juegan un papel importante en la estadística matemática; han sido estudiados con mayor detalle para el caso de una distribución normal de la cantidad X.

Por ejemplo, se ha demostrado que con una distribución normal del valor X valor aleatorio

obedece a los llamados Ley de distribución de estudiantes Con PAG- 1 grado de libertad; la densidad de esta ley tiene la forma

donde G(x) es la función gamma conocida:

También se ha demostrado que la variable aleatoria

tiene una "distribución %2" con PAG- 1 grado de libertad (ver Capítulo 7), cuya densidad se expresa mediante la fórmula

Sin detenernos en las derivaciones de las distribuciones (14.4.2) y (14.4.4), mostraremos cómo se pueden aplicar al construir intervalos de confianza para parámetros. ty d.

Que se produzca PAG experimentos independientes con una variable aleatoria X, Distribución normal con parámetros desconocidos. A. Para estos parámetros se obtuvieron estimaciones

Se requiere construir intervalos de confianza para ambos parámetros correspondientes a la probabilidad de confianza p.

Primero construyamos un intervalo de confianza para la expectativa matemática. Es natural tomar este intervalo simétrico con respecto a t; Sea sp p la mitad de la longitud del intervalo. El valor s p debe elegirse de manera que se cumpla la condición.

Intentemos movernos hacia el lado izquierdo de la igualdad (14.4.5) desde la variable aleatoria. t a una variable aleatoria T, distribuido según la ley de Student. Para hacer esto, multiplica ambos lados de la desigualdad |m-w?|

por un valor positivo: o, usando la notación (14.4.1),

Encontremos un número /p tal que el valor /p se pueda encontrar a partir de la condición

De la fórmula (14.4.2) queda claro que (1) es una función par, por lo tanto (14.4.8) da

La igualdad (14.4.9) determina el valor / p en función de p. Si tienes a tu disposición una tabla de valores integrales

entonces el valor de /p se puede encontrar mediante interpolación inversa en la tabla. Sin embargo, es más conveniente elaborar una tabla de valores /p de antemano. Esta tabla figura en el Apéndice (Tabla 5). Esta tabla muestra los valores en función del nivel de confianza p y del número de grados de libertad. PAG- 1. Habiendo determinado / p de la tabla. 5 y suponiendo

encontraremos la mitad del ancho del intervalo de confianza /p y el intervalo mismo

Ejemplo 1. Se realizaron 5 experimentos independientes con una variable aleatoria. X, Distribución normal con parámetros desconocidos. t y sobre. Los resultados de los experimentos se dan en la tabla. 14.4.1.

Tabla 14.4.1

encontrar calificación t para la expectativa matemática y construya un intervalo de confianza del 90% / p para ella (es decir, el intervalo correspondiente a la probabilidad de confianza p = 0,9).

Solución. Tenemos:

Según el cuadro 5 de la solicitud de PAG - 1 = 4 y p = 0,9 encontramos dónde

El intervalo de confianza será

Ejemplo 2. Para las condiciones del ejemplo 1 del inciso 14.3, asumiendo el valor X distribuida normalmente, encuentre el intervalo de confianza exacto.

Solución. Según la tabla 5 del apéndice encontramos cuando PAG - 1 = 19 ir =

0,8/p = 1,328; de aquí

Comparando con la solución del ejemplo 1 del inciso 14.3 (e p = 0,072), estamos convencidos de que la discrepancia es muy insignificante. Si mantenemos la precisión hasta el segundo decimal, entonces los intervalos de confianza encontrados por los métodos exacto y aproximado coinciden:

Pasemos a construir un intervalo de confianza para la varianza. Considere el estimador de varianza insesgado

y expresar la variable aleatoria D a través de magnitud V(14.4.3), teniendo distribución x 2 (14.4.4):

Conociendo la ley de distribución de la cantidad. V, puedes encontrar el intervalo /(1) en el que cae con una probabilidad dada p.

Ley de distribución kn_x(v) La magnitud I 7 tiene la forma que se muestra en la Fig. 14.4.1.

Arroz. 14.4.1

Surge la pregunta: ¿cómo elegir el intervalo /p? Si la ley de distribución de magnitud. V fuera simétrico (como la ley normal o la distribución de Student), sería natural tomar el intervalo /p simétrico con respecto a la expectativa matemática. En este caso la ley k p_x (v) asimétrico. Acordemos elegir el intervalo /p de modo que la probabilidad de que el valor sea V más allá del intervalo a la derecha y a la izquierda (áreas sombreadas en la Fig. 14.4.1) eran iguales e iguales

Para construir un intervalo /p con esta propiedad, usamos la tabla. 4 aplicaciones: contiene números y) tal que

por el valor V, teniendo x 2 -distribución con r grados de libertad. En nuestro caso r = norte- 1. Vamos a arreglar r = norte- 1 y buscar en la fila correspondiente de la tabla. 4 dos significados x2- uno correspondiente a la probabilidad el otro - probabilidad Denotemos estos

valores a las 2 Y ¿SG? El intervalo tiene y 2, con tu izquierda, y y ~ extremo derecho.

Ahora encontremos a partir del intervalo / p el intervalo de confianza deseado /|, para la dispersión con límites D, y D2, que cubre el punto D con probabilidad p:

Construyamos un intervalo / (, = (?> ь А) que cubra el punto D si y sólo si el valor V cae en el intervalo /r. Demostremos que el intervalo

satisface esta condición. De hecho, las desigualdades son equivalentes a desigualdades

y estas desigualdades se satisfacen con probabilidad p. Por tanto, se ha encontrado el intervalo de confianza para la varianza y se expresa mediante la fórmula (14.4.13).

Ejemplo 3. Encuentre el intervalo de confianza para la varianza en las condiciones del ejemplo 2 de la subsección 14.3, si se sabe que el valor X Normalmente distribuido.

Solución. Tenemos . Según la tabla 4 del apéndice

encontramos en r = norte - 1 = 19

Usando la fórmula (14.4.13) encontramos el intervalo de confianza para la varianza

El intervalo correspondiente para la desviación estándar es (0,21; 0,32). Este intervalo supera sólo ligeramente el intervalo (0,21; 0,29) obtenido en el ejemplo 2 del apartado 14.3 utilizando el método aproximado.

  • La figura 14.3.1 considera un intervalo de confianza simétrico con respecto a a. En general, como veremos más adelante, esto no es necesario.


¿Te gustó el artículo? ¡Compartir con tus amigos!