Lo que se llama intervalo de confianza. Estimaciones puntuales y de intervalo de gravedad específica.

INTERVALOS DE CONFIANZA PARA FRECUENCIAS Y FRACCIONES

© 2008

Instituto Nacional de Salud Pública, Oslo, Noruega

El artículo describe y discute el cálculo de intervalos de confianza para frecuencias y proporciones utilizando los métodos de Wald, Wilson, Clopper - Pearson, utilizando la transformación angular y el método de Wald con corrección de Agresti - Coull. El material presentado proporciona información general sobre los métodos para calcular intervalos de confianza para frecuencias y proporciones y tiene como objetivo despertar el interés de los lectores de revistas no solo en el uso de intervalos de confianza al presentar los resultados de su propia investigación, sino también en la lectura de literatura especializada antes de comenzar a trabajar. sobre futuras publicaciones.

Palabras clave: intervalo de confianza, frecuencia, proporción

Una de las publicaciones anteriores mencionó brevemente la descripción de datos cualitativos e informó que su estimación de intervalo es preferible a la estimación puntual para describir la frecuencia de aparición de la característica que se está estudiando en la población. De hecho, dado que la investigación se realiza utilizando datos de muestra, la proyección de los resultados sobre la población debe contener un elemento de imprecisión muestral. El intervalo de confianza es una medida de la precisión del parámetro que se estima. Es interesante que algunos libros sobre estadística básica para médicos ignoren por completo el tema de los intervalos de confianza para las frecuencias. En este artículo veremos varias formas de calcular intervalos de confianza para frecuencias, lo que implica características de muestra como la no repetición y la representatividad, así como la independencia de las observaciones entre sí. En este artículo, la frecuencia no se entiende como un número absoluto que muestra cuántas veces ocurre un valor particular en el agregado, sino como un valor relativo que determina la proporción de participantes del estudio en quienes ocurre la característica estudiada.

En la investigación biomédica, los intervalos de confianza del 95% son los más utilizados. Este intervalo de confianza es el área dentro de la cual la verdadera proporción cae el 95% de las veces. En otras palabras, podemos decir con un 95% de confiabilidad que el valor real de la frecuencia de aparición de un rasgo en la población estará dentro del intervalo de confianza del 95%.

La mayoría de los manuales de estadística para investigadores médicos informan que el error de frecuencia se calcula mediante la fórmula

donde p es la frecuencia de aparición de la característica en la muestra (valor de 0 a 1). La mayoría de los artículos científicos nacionales indican la frecuencia de aparición de un rasgo en una muestra (p), así como sus errores en la forma p ± s. Sin embargo, es más apropiado presentar un intervalo de confianza del 95% para la frecuencia de aparición de un rasgo en la población, que incluirá valores de

antes.

Algunos manuales recomiendan que, para muestras pequeñas, se reemplace el valor de 1,96 con el valor de t para N – 1 grados de libertad, donde N es el número de observaciones en la muestra. El valor t se encuentra en las tablas de distribución t, disponibles en casi todos los libros de texto de estadística. El uso de la distribución t para el método de Wald no proporciona ventajas visibles en comparación con otros métodos que se analizan a continuación y, por lo tanto, algunos autores no lo recomiendan.

El método presentado anteriormente para calcular intervalos de confianza para frecuencias o proporciones se denomina Wald en honor a Abraham Wald (1902-1950), ya que su uso generalizado comenzó después de la publicación de Wald y Wolfowitz en 1939. Sin embargo, el método en sí fue propuesto por Pierre Simon Laplace (1749-1827) en 1812.

El método Wald es muy popular, pero su aplicación plantea importantes problemas. El método no se recomienda para tamaños de muestra pequeños, así como en los casos en que la frecuencia de aparición de una característica tiende a 0 o 1 (0% o 100%) y es simplemente imposible para frecuencias de 0 y 1. Además, el la aproximación de la distribución normal, que se utiliza al calcular el error, “no funciona” en los casos en que n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Dado que la nueva variable tiene una distribución normal, los límites inferior y superior del intervalo de confianza del 95% para la variable φ serán φ-1,96 y φ+1,96izquierda">

En lugar de 1,96 para muestras pequeñas, se recomienda sustituir el valor t por N – 1 grados de libertad. Este método no produce valores negativos y permite estimaciones más precisas de los intervalos de confianza para las frecuencias que el método de Wald. Además, se describe en muchos libros de referencia nacionales sobre estadísticas médicas, lo que, sin embargo, no ha llevado a su uso generalizado en la investigación médica. No se recomienda el cálculo de intervalos de confianza mediante transformación angular para frecuencias cercanas a 0 o 1.

Aquí suele terminar la descripción de los métodos para estimar intervalos de confianza en la mayoría de los libros sobre conceptos básicos de estadística para investigadores médicos, y este problema es típico no sólo de la literatura nacional sino también de la extranjera. Ambos métodos se basan en el teorema del límite central, lo que implica una muestra grande.

Teniendo en cuenta las deficiencias de estimar intervalos de confianza utilizando los métodos anteriores, Clopper y Pearson propusieron en 1934 un método para calcular el llamado intervalo de confianza exacto, dada la distribución binomial del rasgo en estudio. Este método está disponible en muchas calculadoras en línea, pero los intervalos de confianza obtenidos de esta manera son en la mayoría de los casos demasiado amplios. Al mismo tiempo, se recomienda el uso de este método en los casos en que sea necesaria una evaluación conservadora. El grado de conservadurismo del método aumenta a medida que disminuye el tamaño de la muestra, especialmente cuando N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Según muchos estadísticos, la evaluación más óptima de los intervalos de confianza de las frecuencias se realiza mediante el método de Wilson, propuesto en 1927, pero prácticamente no utilizado en la investigación biomédica nacional. Este método no sólo permite estimar intervalos de confianza para frecuencias muy pequeñas y muy grandes, sino que también es aplicable para un pequeño número de observaciones. En general, el intervalo de confianza según la fórmula de Wilson tiene la forma



donde toma el valor 1,96 al calcular el intervalo de confianza del 95%, N es el número de observaciones y p es la frecuencia de aparición de la característica en la muestra. Este método está disponible en calculadoras online, por lo que su uso no supone ningún problema. y no recomiendo usar este método para n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Además del método de Wilson, también se cree que el método de Wald con corrección de Agresti-Coll proporciona una estimación óptima del intervalo de confianza para las frecuencias. La corrección de Agresti-Coll es una sustitución en la fórmula de Wald de la frecuencia de aparición de una característica en una muestra (p) por p`, al calcular cuál se suma 2 al numerador y 4 al denominador, es decir, p` = (X + 2) / (N + 4), donde X es el número de participantes del estudio que tienen la característica que se está estudiando y N es el tamaño de la muestra. Esta modificación produce resultados muy similares a la fórmula de Wilson, excepto cuando la frecuencia del evento se acerca al 0% o al 100% y la muestra es pequeña. Además de los métodos anteriores para calcular intervalos de confianza para frecuencias, se han propuesto correcciones de continuidad para los métodos de Wald y Wilson para muestras pequeñas, pero los estudios han demostrado que su uso es inadecuado.

Consideremos la aplicación de los métodos anteriores para calcular intervalos de confianza utilizando dos ejemplos. En el primer caso, estudiamos una gran muestra de 1.000 participantes del estudio seleccionados aleatoriamente, de los cuales 450 tienen el rasgo en estudio (este podría ser un factor de riesgo, un resultado o cualquier otro rasgo), lo que representa una frecuencia de 0,45, o 45 %. En el segundo caso, el estudio se lleva a cabo utilizando una muestra pequeña, digamos, solo 20 personas, y solo 1 participante del estudio (5%) tiene el rasgo en estudio. Los intervalos de confianza utilizando el método de Wald, el método de Wald con corrección de Agresti-Coll y el método de Wilson se calcularon utilizando una calculadora en línea desarrollada por Jeff Sauro (http://www./wald.htm). Los intervalos de confianza corregidos por continuidad de Wilson se calcularon utilizando la calculadora proporcionada por Wassar Stats: sitio web para computación estadística (http://faculty.vassar.edu/lowry/prop1.html). Los cálculos de la transformación angular de Fisher se realizaron manualmente utilizando el valor t crítico para 19 y 999 grados de libertad, respectivamente. Los resultados del cálculo se presentan en la tabla para ambos ejemplos.

Intervalos de confianza calculados de seis maneras diferentes para dos ejemplos descritos en el texto

Método de cálculo del intervalo de confianza

P=0,0500, o 5%

IC del 95% para X=450, N=1000, P=0,4500 o 45%

–0,0455–0,2541

Wald con corrección de Agresti-Coll

<,0001–0,2541

Wilson con corrección de continuidad

Clopper-Pearson "método exacto"

transformación angular

<0,0001–0,1967

Como puede verse en la tabla, para el primer ejemplo el intervalo de confianza calculado utilizando el método Wald “generalmente aceptado” entra en la región negativa, lo que no puede ocurrir con las frecuencias. Desafortunadamente, estos incidentes no son infrecuentes en la literatura rusa. La forma tradicional de presentar los datos en términos de frecuencia y su error enmascara parcialmente este problema. Por ejemplo, si la frecuencia de aparición de un rasgo (en porcentaje) se presenta como 2,1 ± 1,4, entonces esto no es tan “ofensivo para la vista” como 2,1% (IC del 95%: –0,7; 4,9), aunque y significa la misma cosa. El método Wald con corrección de Agresti-Coll y cálculo mediante transformación angular da un límite inferior que tiende a cero. El método de Wilson con corrección de continuidad y el "método exacto" producen intervalos de confianza más amplios que el método de Wilson. Para el segundo ejemplo, todos los métodos dan aproximadamente los mismos intervalos de confianza (las diferencias aparecen solo en milésimas), lo cual no es sorprendente, ya que la frecuencia de ocurrencia del evento en este ejemplo no es muy diferente del 50% y el tamaño de la muestra es bastante grande.

Para los lectores interesados ​​en este problema, podemos recomendar los trabajos de R. G. Newcombe y Brown, Cai y Dasgupta, que brindan los pros y los contras de utilizar 7 y 10 métodos diferentes para calcular intervalos de confianza, respectivamente. Entre los manuales nacionales, recomendamos el libro Y, que, además de una descripción detallada de la teoría, presenta los métodos de Wald y Wilson, así como un método para calcular intervalos de confianza teniendo en cuenta la distribución de frecuencia binomial. Además de las calculadoras en línea gratuitas (http://www. /wald. htm y http://faculty. vassar. edu/lowry/prop1.html), se pueden calcular intervalos de confianza para frecuencias (¡y no sólo!) utilizando el Programa CIA (Análisis de Intervalos de Confianza), que se puede descargar desde http://www. escuela de Medicina. sotón. C.A. reino unido/cia/ .

El próximo artículo analizará formas univariadas de comparar datos cualitativos.

Bibliografía

Banerji A. Estadísticas médicas en lenguaje claro: un curso introductorio / A. Banerjee. – M.: Medicina Práctica, 2007. – 287 p. Estadísticas médicas / . – M.: Agencia de Información Médica, 2007. – 475 p. Glanz S. Estadísticas médicas y biológicas / S. Glanz. – M.: Praktika, 1998. Tipos de datos, pruebas de distribución y estadísticas descriptivas // Ecología humana – 2008. – No. 1. – P. 52–58. Zhizhin K. S.. Estadística médica: libro de texto / . – Rostov s/f: Phoenix, 2007. – 160 p. Estadística médica aplicada / , . - San Petersburgo. : Foliot, 2003. – 428 p. Lakin G.F.. Biometría / . – M.: Escuela Superior, 1990. – 350 p. Médico V. A.. Estadística matemática en medicina / , . – M.: Finanzas y Estadísticas, 2007. – 798 p. Estadística matemática en la investigación clínica / , . – M.: GEOTAR-MED, 2001. – 256 p. Junkerov V.. Y. Procesamiento médico y estadístico de datos de investigaciones médicas / , . - San Petersburgo. : VmedA, 2002. – 266 p. Agresti A. Lo aproximado es mejor que lo exacto para la estimación de intervalos de proporciones binomiales / A. Agresti, B. Coull // Estadístico estadounidense. – 1998. – N 52. – P. 119–126. Altman D. Estadísticas con confianza // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – Londres: BMJ Books, 2000. – 240 p. Marrón L.D. Estimación de intervalos para una proporción binomial / L. D. Brown, T. T. Cai, A. Dasgupta // Ciencia estadística. – 2001. – N 2. – P. 101–133. Clopper C.J. El uso de límites de confianza o fiduciales ilustrados en el caso del binomio / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – P. 404–413. García-Pérez M. A. Sobre el intervalo de confianza del parámetro binomial / M. A. García-Pérez // Calidad y cantidad. – 2005. – N 39. – P. 467–481. Motulsky H. Bioestadística intuitiva // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 p. Newcombe R.G. Intervalos de confianza bilaterales para una proporción única: comparación de siete métodos / R. G. Newcombe // Estadística en medicina. – 1998. – N. 17. – P. 857–872. Sauro J. Estimación de tasas de finalización a partir de muestras pequeñas utilizando intervalos de confianza binomiales: comparaciones y recomendaciones / J. Sauro, J. R. Lewis // Actas de la reunión anual de la sociedad de factores humanos y ergonomía. – Orlando, Florida, 2005. Wald A. Límites de confianza para funciones de distribución continua // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – P. 105–118. Wilson EB. Inferencia probable, ley de sucesión e inferencia estadística / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – P. 209–212.

INTERVALOS DE CONFIANZA PARA PROPORCIONES

A. M. Grjibovski

Instituto Nacional de Salud Pública, Oslo, Noruega

El artículo presenta varios métodos para calcular intervalos de confianza para proporciones binomiales, a saber, los métodos de Wald, Wilson, arcoseno, Agresti-Coull y exacto de Clopper-Pearson. El artículo ofrece sólo una introducción general al problema de la estimación del intervalo de confianza de una proporción binomial y su objetivo no es sólo estimular a los lectores a utilizar intervalos de confianza al presentar los resultados de su propia investigación empírica, sino también animarlos a consultar libros de estadística. antes de analizar datos propios y preparar manuscritos.

Palabras clave: intervalo de confianza, proporción

Información del contacto:

Asesor Principal, Instituto Nacional de Salud Pública, Oslo, Noruega

Intervalos de confianza ( Inglés Intervalos de confianza) uno de los tipos de estimaciones de intervalo utilizadas en estadística, que se calculan para un nivel de significancia determinado. Nos permiten afirmar que el valor real de un parámetro estadístico desconocido de la población está dentro del rango de valores obtenido con una probabilidad especificada por el nivel de significancia estadística seleccionado.

Distribución normal

Cuando se conoce la varianza (σ 2) de la población de datos, la puntuación z se puede utilizar para calcular los límites de confianza (los puntos finales del intervalo de confianza). En comparación con el uso de la distribución t, el uso del puntaje z le permitirá construir no solo un intervalo de confianza más estrecho, sino también estimaciones más confiables del valor esperado y la desviación estándar (σ), ya que el puntaje z se basa en una distribución normal.

Fórmula

Para determinar los puntos límite del intervalo de confianza, siempre que se conozca la desviación estándar de la población de datos, se utiliza la siguiente fórmula

L = X - Z α/2 σ
√n

Ejemplo

Supongamos que el tamaño de la muestra es de 25 observaciones, el valor esperado de la muestra es 15 y la desviación estándar de la población es 8. Para un nivel de significancia de α=5%, la puntuación Z es Z α/2 =1,96. En este caso, los límites inferior y superior del intervalo de confianza serán

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Así, podemos decir que con un 95% de probabilidad la expectativa matemática de la población caerá en el rango de 11,864 a 18,136.

Métodos para reducir el intervalo de confianza.

Supongamos que el rango es demasiado amplio para los propósitos de nuestro estudio. Hay dos formas de reducir el rango del intervalo de confianza.

  1. Reducir el nivel de significancia estadística α.
  2. Aumentar el tamaño de la muestra.

Reduciendo el nivel de significación estadística a α=10%, obtenemos una puntuación Z igual a Z α/2 =1,64. En este caso, los límites inferior y superior del intervalo serán

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

Y el intervalo de confianza en sí se puede escribir en la forma

En este caso, podemos suponer que con un 90% de probabilidad la expectativa matemática de la población estará dentro del rango .

Si no queremos reducir el nivel de significancia estadística α, entonces la única alternativa es aumentar el tamaño de la muestra. Aumentándolo a 144 observaciones, obtenemos los siguientes valores de límites de confianza

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

El intervalo de confianza en sí tendrá la siguiente forma

Por lo tanto, reducir el intervalo de confianza sin reducir el nivel de significación estadística sólo es posible aumentando el tamaño de la muestra. Si no es posible aumentar el tamaño de la muestra, entonces se puede reducir el intervalo de confianza únicamente reduciendo el nivel de significancia estadística.

Construir un intervalo de confianza para una distribución distinta de la normal

Si no se conoce la desviación estándar de la población o la distribución es diferente de la normal, se utiliza la distribución t para construir un intervalo de confianza. Esta técnica es más conservadora, lo que se refleja en intervalos de confianza más amplios, en comparación con la técnica basada en el Z-score.

Fórmula

Para calcular los límites inferior y superior del intervalo de confianza basado en la distribución t, utilice las siguientes fórmulas

L = X - t α σ
√n

La distribución de Student o distribución t depende de un solo parámetro: el número de grados de libertad, que es igual al número de valores individuales del atributo (el número de observaciones en la muestra). El valor de la prueba t de Student para un número determinado de grados de libertad (n) y el nivel de significación estadística α se pueden encontrar en las tablas de referencia.

Ejemplo

Supongamos que el tamaño de la muestra es de 25 valores individuales, el valor esperado de la muestra es 50 y la desviación estándar de la muestra es 28. Es necesario construir un intervalo de confianza para el nivel de significancia estadística α=5%.

En nuestro caso, el número de grados de libertad es 24 (25-1), por lo tanto, el valor de la tabla correspondiente de la prueba t de Student para el nivel de significación estadística α=5% es 2,064. Por lo tanto, los límites inferior y superior del intervalo de confianza serán

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

Y el intervalo en sí se puede escribir en la forma

Así, podemos decir que con un 95% de probabilidad la expectativa matemática de la población estará en el rango .

El uso de la distribución t le permite reducir el intervalo de confianza, ya sea reduciendo la significación estadística o aumentando el tamaño de la muestra.

Reduciendo la significancia estadística del 95% al ​​90% en las condiciones de nuestro ejemplo, obtenemos el valor de tabla correspondiente de la prueba t de Student de 1,711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

En este caso, podemos decir que con un 90% de probabilidad la expectativa matemática de la población estará en el rango .

Si no queremos reducir la significación estadística, entonces la única alternativa es aumentar el tamaño de la muestra. Digamos que son 64 observaciones individuales, y no 25 como en la condición original del ejemplo. El valor de la tabla de la prueba t de Student para 63 grados de libertad (64-1) y el nivel de significación estadística α=5% es 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Esto nos permite decir que con un 95% de probabilidad la expectativa matemática de la población estará en el rango .

Muestras grandes

Las muestras grandes son muestras de una población de datos en la que el número de observaciones individuales supera las 100. Los estudios estadísticos han demostrado que las muestras más grandes tienden a distribuirse normalmente, incluso si la distribución de la población no es normal. Además, para tales muestras, el uso de una puntuación z y una distribución t da aproximadamente los mismos resultados al construir intervalos de confianza. Por tanto, para muestras grandes, es aceptable utilizar la puntuación z para la distribución normal en lugar de la distribución t.

resumámoslo

Intervalos de confianza.

El cálculo del intervalo de confianza se basa en el error medio del parámetro correspondiente. Intervalo de confianza muestra dentro de qué límites con probabilidad (1-a) se encuentra el valor real del parámetro estimado. Aquí a es el nivel de significancia, (1-a) también se denomina probabilidad de confianza.

En el primer capítulo mostramos que, por ejemplo, para la media aritmética, la verdadera media poblacional en aproximadamente el 95% de los casos se encuentra dentro de 2 errores estándar de la media. Por lo tanto, los límites del intervalo de confianza del 95% para la media estarán separados de la media muestral por el doble del error medio de la media, es decir multiplicamos el error promedio de la media por un cierto coeficiente dependiendo del nivel de confianza. Para la media y diferencia de medias se toma el coeficiente de Student (valor crítico de la prueba de Student), para la participación y diferencia de participaciones, el valor crítico del criterio z. El producto del coeficiente y el error promedio se puede denominar error máximo de un parámetro dado, es decir lo máximo que podemos obtener al valorarlo.

Intervalo de confianza para significado aritmetico : .

Aquí está la media muestral;

Error promedio de la media aritmética;

s - desviación estándar de la muestra;

norte

f = norte-1 (coeficiente de Student).

Intervalo de confianza para diferencias de medias aritméticas :

Aquí está la diferencia entre las medias muestrales;

- error medio de la diferencia entre medias aritméticas;

s 1 , s 2 – desviaciones estándar muestrales;

n1, n2

El valor crítico de la prueba de Student para un nivel de significancia dado a y el número de grados de libertad f=n 1 +n 2-2 (coeficiente de Student).

Intervalo de confianza para Comparte :

.

Aquí d es la fracción de muestra;

– error de fracción promedio;

norte– tamaño de la muestra (tamaño del grupo);

Intervalo de confianza para diferencia de acciones :

Aquí está la diferencia en las acciones de muestra;

– error medio de la diferencia entre medias aritméticas;

n1, n2– volúmenes de muestra (número de grupos);

El valor crítico del criterio z en un nivel de significancia dado a ( , , ).

Al calcular los intervalos de confianza para la diferencia entre indicadores, en primer lugar, vemos directamente los posibles valores del efecto, y no solo su estimación puntual. En segundo lugar, podemos sacar una conclusión sobre la aceptación o el rechazo de la hipótesis nula y, en tercer lugar, podemos sacar una conclusión sobre la potencia de la prueba.

Al probar hipótesis utilizando intervalos de confianza, se debe cumplir con la siguiente regla:

Si el intervalo de confianza del 100(1-a) por ciento de la diferencia de medias no contiene cero, entonces las diferencias son estadísticamente significativas en el nivel de significancia a; por el contrario, si este intervalo contiene cero, entonces las diferencias no son estadísticamente significativas.

De hecho, si este intervalo contiene cero, significa que el indicador que se compara puede ser mayor o menor en uno de los grupos en comparación con el otro, es decir las diferencias observadas se deben al azar.

La potencia de la prueba se puede juzgar por la ubicación del cero dentro del intervalo de confianza. Si cero está cerca del límite inferior o superior del intervalo, entonces es posible que al comparar un mayor número de grupos, las diferencias alcancen significación estadística. Si cero está cerca de la mitad del intervalo, entonces significa que tanto un aumento como una disminución del indicador en el grupo experimental son igualmente probables y, probablemente, realmente no hay diferencias.

Ejemplos:

Para comparar la mortalidad quirúrgica cuando se utilizan dos tipos diferentes de anestesia: 61 personas fueron operadas con el primer tipo de anestesia, 8 murieron, con el segundo tipo: 67 personas, 10 murieron.

d1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

La diferencia de letalidad de los métodos comparados estará en el rango (-0,018 - 0,122; -0,018 + 0,122) o (-0,14; 0,104) con una probabilidad de 100(1-a) = 95%. El intervalo contiene cero, es decir No se puede rechazar la hipótesis de igual mortalidad con dos tipos diferentes de anestesia.

Por lo tanto, la tasa de mortalidad puede disminuir y disminuirá al 14% y aumentará al 10,4% con una probabilidad del 95%, es decir. cero está aproximadamente en el medio del intervalo, por lo que se puede argumentar que, muy probablemente, estos dos métodos realmente no difieren en letalidad.

En el ejemplo analizado anteriormente, se comparó el tiempo promedio de presión durante la prueba de tapping en cuatro grupos de estudiantes que diferían en las puntuaciones de los exámenes. Calculemos los intervalos de confianza para el tiempo promedio de presión de los estudiantes que aprobaron el examen con calificaciones 2 y 5 y el intervalo de confianza para la diferencia entre estos promedios.

Los coeficientes de Student se calculan utilizando las tablas de distribución de Student (ver apéndice): para el primer grupo: = t(0,05;48) = 2,011; para el segundo grupo: = t(0,05;61) = 2,000. Así, intervalos de confianza para el primer grupo: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), para el segundo grupo (156,55- 2.000*1,88; 156,55+2.000*1,88) = (152,8 ; 160,3). Entonces, para aquellos que aprobaron el examen con 2, el tiempo promedio de presión varía de 157,8 ms a 166,6 ms con una probabilidad del 95%, para aquellos que aprobaron el examen con 5, de 152,8 ms a 160,3 ms con una probabilidad del 95%. .

También puede probar la hipótesis nula utilizando intervalos de confianza para las medias, y no solo para la diferencia de medias. Por ejemplo, como en nuestro caso, si los intervalos de confianza de las medias se superponen, entonces no se puede rechazar la hipótesis nula. Para rechazar una hipótesis en un nivel de significancia elegido, los intervalos de confianza correspondientes no deben superponerse.

Encontremos el intervalo de confianza para la diferencia en el tiempo promedio de presión en los grupos que aprobaron el examen con calificaciones 2 y 5. Diferencia de promedios: 162,19 – 156,55 = 5,64. Coeficiente de Student: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Las desviaciones estándar del grupo serán iguales a: ; . Calculamos el error promedio de la diferencia entre las medias: . Intervalo de confianza: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Así, la diferencia en el tiempo medio de presión en los grupos que aprobaron el examen con 2 y 5 estará en el rango de -0,044 ms a 11,33 ms. Este intervalo incluye cero, es decir El tiempo medio de presión para aquellos que aprobaron bien el examen puede aumentar o disminuir en comparación con aquellos que aprobaron el examen de manera insatisfactoria, es decir, la hipótesis nula no se puede rechazar. Pero cero está muy cerca del límite inferior y es mucho más probable que el tiempo de presión disminuya para aquellos que aprobaron bien. Por lo tanto, podemos concluir que todavía existen diferencias en el tiempo promedio de presión entre aquellos que pasaron 2 y 5, simplemente no pudimos detectarlas dado el cambio en el tiempo promedio, la dispersión del tiempo promedio y los tamaños de muestra.



La potencia de una prueba es la probabilidad de rechazar una hipótesis nula incorrecta, es decir encontrar diferencias donde realmente existen.

El poder de la prueba se determina en función del nivel de significancia, la magnitud de las diferencias entre grupos, la dispersión de valores en los grupos y el tamaño de las muestras.

Para la prueba t de Student y el análisis de varianza, se pueden utilizar diagramas de sensibilidad.

El poder del criterio se puede utilizar para determinar preliminarmente el número requerido de grupos.

El intervalo de confianza muestra dentro de qué límites se encuentra el valor real del parámetro estimado con una probabilidad dada.

Utilizando intervalos de confianza, puede probar hipótesis estadísticas y sacar conclusiones sobre la sensibilidad de los criterios.

LITERATURA.

Glanz S. – Capítulo 6,7.

Rebrova O.Yu. – p.112-114, p.171-173, p.234-238.

Sidorenko E.V. – págs.32-33.

Preguntas para el autoexamen de los estudiantes.

1. ¿Cuál es el poder del criterio?

2. ¿En qué casos es necesario evaluar el poder de los criterios?

3. Métodos de cálculo de potencia.

6. ¿Cómo probar una hipótesis estadística utilizando un intervalo de confianza?

7. ¿Qué se puede decir sobre el poder del criterio al calcular el intervalo de confianza?

Tareas.

A menudo, el tasador tiene que analizar el mercado inmobiliario del segmento en el que se encuentra la propiedad que se está tasando. Si el mercado está desarrollado, puede resultar difícil analizar el conjunto completo de objetos presentados, por lo que se utiliza una muestra de objetos para el análisis. Esta muestra no siempre resulta homogénea; a veces es necesario limpiarla de puntos extremos: ofertas de mercado demasiado altas o demasiado bajas. Para este fin se utiliza intervalo de confianza. El propósito de este estudio es realizar un análisis comparativo de dos métodos para calcular el intervalo de confianza y seleccionar la opción de cálculo óptima cuando se trabaja con diferentes muestras en el sistema estimatica.pro.

El intervalo de confianza es un intervalo de valores de atributos calculado sobre la base de una muestra que, con una probabilidad conocida, contiene el parámetro estimado de la población general.

El objetivo de calcular un intervalo de confianza es construir dicho intervalo basándose en datos de muestra de modo que pueda afirmarse con una probabilidad dada que el valor del parámetro estimado está en este intervalo. En otras palabras, el intervalo de confianza contiene el valor desconocido del valor estimado con una cierta probabilidad. Cuanto más amplio sea el intervalo, mayor será la inexactitud.

Existen diferentes métodos para determinar el intervalo de confianza. En este artículo veremos 2 métodos:

  • a través de la mediana y la desviación estándar;
  • a través del valor crítico del estadístico t (coeficiente de Student).

Etapas de análisis comparativo de diferentes métodos de cálculo de CI:

1. formar una muestra de datos;

2. lo procesamos mediante métodos estadísticos: calculamos el valor medio, la mediana, la varianza, etc.;

3. calcular el intervalo de confianza de dos formas;

4. analizar las muestras limpiadas y los intervalos de confianza resultantes.

Etapa 1. Muestreo de datos

La muestra se formó utilizando el sistema estimatica.pro. La muestra incluyó 91 ofertas para la venta de apartamentos de 1 habitación en la tercera zona de precios con el tipo de diseño "Khrushchev".

Tabla 1. Muestra inicial

Precio 1 m2, unidad

Figura 1. Muestra inicial



Etapa 2. Procesamiento de la muestra inicial.

El procesamiento de una muestra mediante métodos estadísticos requiere calcular los siguientes valores:

1. Media aritmética

2. Mediana: un número que caracteriza la muestra: exactamente la mitad de los elementos de la muestra son mayores que la mediana y la otra mitad son menores que la mediana.

(para una muestra con un número impar de valores)

3. Rango: la diferencia entre los valores máximo y mínimo en la muestra.

4. Varianza: se utiliza para estimar con mayor precisión la variación de los datos.

5. La desviación estándar muestral (en adelante, DE) es el indicador más común de la dispersión de los valores de ajuste alrededor de la media aritmética.

6. Coeficiente de variación: refleja el grado de dispersión de los valores de ajuste.

7. coeficiente de oscilación: refleja la fluctuación relativa de los valores de precios extremos en la muestra alrededor del promedio

Tabla 2. Indicadores estadísticos de la muestra original

El coeficiente de variación, que caracteriza la homogeneidad de los datos, es del 12,29%, pero el coeficiente de oscilación es demasiado alto. Así, podemos decir que la muestra original no es homogénea, por lo que pasemos al cálculo del intervalo de confianza.

Etapa 3. Cálculo del intervalo de confianza

Método 1. Cálculo utilizando la mediana y la desviación estándar.

El intervalo de confianza se determina de la siguiente manera: valor mínimo: la desviación estándar se resta de la mediana; valor máximo: la desviación estándar se suma a la mediana.

Por tanto, el intervalo de confianza (47179 CU; 60689 CU)

Arroz. 2. Valores que se encuentran dentro del intervalo de confianza 1.



Método 2. Construcción de un intervalo de confianza utilizando el valor crítico del estadístico t (coeficiente de Student)

SV Gribovsky en su libro "Métodos matemáticos para estimar el valor de la propiedad" describe un método para calcular el intervalo de confianza utilizando el coeficiente de Student. Al calcular con este método, el propio estimador debe establecer el nivel de significancia ∝, que determina la probabilidad con la que se construirá el intervalo de confianza. Normalmente se utilizan niveles de significancia de 0,1; 0,05 y 0,01. Corresponden a probabilidades de confianza de 0,9; 0,95 y 0,99. Con este método, se supone que los valores verdaderos de la esperanza y la varianza matemáticas son prácticamente desconocidos (lo que casi siempre es cierto cuando se resuelven problemas prácticos de estimación).

Fórmula del intervalo de confianza:

n - tamaño de la muestra;

El valor crítico de la estadística t (distribución de Student) con un nivel de significancia ∝, el número de grados de libertad n-1, que se determina a partir de tablas estadísticas especiales o utilizando MS Excel (→"Estadístico"→ ESTUDIANTE);

∝ - nivel de significancia, tome ∝=0,01.

Arroz. 2. Valores que se encuentran dentro del intervalo de confianza 2.

Etapa 4. Análisis de diferentes métodos para calcular el intervalo de confianza.

Dos métodos para calcular el intervalo de confianza, mediante la mediana y el coeficiente de Student, dieron lugar a diferentes valores de los intervalos. En consecuencia, obtuvimos dos muestras limpias diferentes.

Tabla 3. Estadísticas para tres muestras.

Índice

Muestra inicial

1 opción

opcion 2

Valor promedio

Dispersión

Coef. variaciones

Coef. oscilaciones

Número de objetos retirados, uds.

Con base en los cálculos realizados, podemos decir que los valores del intervalo de confianza obtenidos por diferentes métodos se cruzan, por lo que se puede utilizar cualquiera de los métodos de cálculo a criterio del tasador.

Sin embargo, creemos que cuando se trabaja en el sistema estimatica.pro, es aconsejable elegir un método para calcular el intervalo de confianza en función del grado de desarrollo del mercado:

  • si el mercado no está desarrollado, utilice el método de cálculo utilizando la mediana y la desviación estándar, ya que el número de objetos retirados en este caso es pequeño;
  • si el mercado está desarrollado, aplicar el cálculo mediante el valor crítico del estadístico t (coeficiente de Student), ya que es posible formar una muestra inicial grande.

En la preparación del artículo se utilizó lo siguiente:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Métodos matemáticos para evaluar el valor de la propiedad. Moscú, 2014

2. Datos del sistema estimatica.pro

El intervalo de confianza nos llega del campo de la estadística. Se trata de un rango determinado que sirve para estimar un parámetro desconocido con un alto grado de fiabilidad. La forma más sencilla de explicar esto es con un ejemplo.

Supongamos que necesita estudiar alguna variable aleatoria, por ejemplo, la velocidad de respuesta del servidor a una solicitud de un cliente. Cada vez que un usuario escribe la dirección de un sitio específico, el servidor responde a diferentes velocidades. Por tanto, el tiempo de respuesta estudiado es aleatorio. Entonces, el intervalo de confianza nos permite determinar los límites de este parámetro, y luego podemos decir que con un 95% de probabilidad el servidor estará en el rango que calculamos.

O necesita saber cuántas personas conocen la marca registrada de la empresa. Cuando se calcula el intervalo de confianza, se puede decir, por ejemplo, que con una probabilidad del 95% la proporción de consumidores conscientes de esto se encuentra en el rango del 27% al 34%.

Estrechamente relacionado con este término está el valor de la probabilidad de confianza. Representa la probabilidad de que el parámetro deseado esté incluido en el intervalo de confianza. El tamaño de nuestro rango deseado depende de este valor. Cuanto mayor sea el valor tomado, más estrecho será el intervalo de confianza y viceversa. Normalmente se establece en 90%, 95% o 99%. El valor 95% es el más popular.

Este indicador también está influenciado por la dispersión de las observaciones y su definición se basa en el supuesto de que la característica en estudio obedece a este enunciado también conocido como Ley de Gauss. Según él, la normal es una distribución de todas las probabilidades de una variable aleatoria continua que puede describirse mediante una densidad de probabilidad. Si el supuesto de una distribución normal es incorrecto, entonces la estimación puede ser incorrecta.

Primero, descubramos cómo calcular el intervalo de confianza para Aquí hay dos casos posibles. La dispersión (el grado de dispersión de una variable aleatoria) puede conocerse o no. Si se conoce, entonces nuestro intervalo de confianza se calcula mediante la siguiente fórmula:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - signo,

t - parámetro de la tabla de distribución de Laplace,

σ es la raíz cuadrada de la varianza.

Si se desconoce la varianza, se puede calcular si conocemos todos los valores de la característica deseada. Para ello se utiliza la siguiente fórmula:

σ2 = х2ср - (хср)2, donde

х2ср - valor medio de los cuadrados de la característica estudiada,

(хср)2 es el cuadrado de esta característica.

La fórmula mediante la cual se calcula el intervalo de confianza en este caso cambia ligeramente:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - promedio de la muestra,

α - signo,

t es un parámetro que se encuentra usando la tabla de distribución de Student t = t(ɣ;n-1),

sqrt(n) - raíz cuadrada del tamaño total de la muestra,

s es la raíz cuadrada de la varianza.

Considere este ejemplo. Supongamos que con base en los resultados de 7 mediciones se determina que la característica estudiada es igual a 30 y la varianza muestral es igual a 36. Es necesario encontrar, con una probabilidad del 99%, un intervalo de confianza que contenga la verdadera valor del parámetro medido.

Primero, determinemos a qué es igual t: t = t (0,99; 7-1) = 3,71. Usando la fórmula anterior, obtenemos:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

El intervalo de confianza para la varianza se calcula tanto en el caso de una media conocida como cuando no hay datos sobre la expectativa matemática y solo se conoce el valor de la estimación puntual insesgada de la varianza. No daremos aquí fórmulas para calcularlo, ya que son bastante complejas y, si se desea, siempre se pueden encontrar en Internet.

Solo tengamos en cuenta que es conveniente determinar el intervalo de confianza utilizando Excel o un servicio de red, que se llama así.



¿Te gustó el artículo? ¡Compartir con tus amigos!