Cómo calcular el GPA en Excel. Cómo encontrar el promedio en Excel

Si necesita determinar los ingresos promedio de su departamento durante seis meses o calcular la duración promedio de servicio de los empleados de su empresa, necesitará un promedio aritmético en Excel. Pero si tiene muchos datos, contar manualmente dichas acciones llevará mucho tiempo. Es más rápido hacer esto usando la función especial PROMEDIO(). El dominio de esta fórmula es uno de los elementos fundamentales del análisis de datos inicial.

Por lo general, en la vida cotidiana decimos que necesitamos calcular el valor promedio, queremos decir que necesitamos el valor promedio aritmético en Excel (SA), pero hay bastantes valores promedio en matemáticas.

Intentaremos discutir los más populares:

La opción más sencilla. Media aritmética en Excel. Función PROMEDIO

¿Cómo utilizar una fórmula que involucra PROMEDIO? Todo es simple cuando lo sabes;) Selecciona la celda deseada, pon “=" en ella y comienza a escribir PROMEDIO, aparecerá una fórmula, como en la imagen de arriba. Selecciónelo con el mouse o la tecla TAB. Puede llamar al comando deseado a través del ícono en la barra de tareas, el menú "Inicio", buscar el ícono de autosuma Σ, hacer clic y aparecerá la línea "Promedio" a la derecha.
Ha elegido la fórmula, ahora debe indicar dentro de los corchetes abiertos el rango de valores de celda cuyo promedio desea calcular. Si las celdas participantes están en una matriz continua, basta con seleccionarlas a la vez arrastrando los bordes con el botón izquierdo del mouse. Cuando necesite una selección separada, seleccionando celdas específicas, debe seleccionarlas haciendo clic en cada una y poniendo un punto y coma entre ellas ";"
Otra forma de activar cualquier función es acceder al Asistente de funciones estándar de Excel; el botón fx (debajo de la cinta de tareas) es responsable de ello.

Preseleccione una celda, luego haga clic en el botón fx en la ventana que aparece, busque PROMEDIO y confirme la selección usando el botón "Aceptar" o Enter. Se le solicitarán los argumentos involucrados en el cálculo. Directamente en este modo, se seleccionan las áreas requeridas de la tabla, la selección se confirma presionando "Aceptar", después de lo cual el resultado del cálculo aparecerá inmediatamente en el campo marcado.

Cálculo de CA basado en un conjunto de condiciones.

En primer lugar, para un funcionamiento correcto, es necesario tener en cuenta que las celdas que tienen un valor vacío no se tienen en cuenta (es decir, ni siquiera 0 está escrito allí), están completamente excluidas del cálculo.
En segundo lugar, Excel trabaja directamente con 3 categorías de medias aritméticas:

- promedio simple: el resultado de sumar un conjunto de números y luego dividir la suma por el número de estos números;
— mediana – un valor que caracteriza en promedio todo el conjunto de números;
- moda - el significado que se encuentra con mayor frecuencia entre los seleccionados.

Dependiendo del tipo de datos requeridos, el cálculo cubrirá ciertas celdas con valores. Para ordenar filas, si es necesario, use el comando PROMEDIOIF, donde solo se ingresan las áreas necesarias. Si las fuentes involucran datos filtrados se utiliza la función “TOTAL INTERMEDIO”. En este caso, al completar los parámetros del algoritmo, el indicador se establece en 1, y no en 9, como cuando se suma.

Promedio aritmético ponderado en Excel

Una función que puede calcular con un solo clic un indicador tan utilizado como la media aritmética ponderada se encuentra sólo en la fase de desarrollo en Excel. Por tanto, este cálculo requerirá varios pasos. En particular, primero puede calcular el promedio de cada columna a partir de la tabla detallada y luego derivar el "promedio del promedio".

Sin embargo, existe una buena herramienta auxiliar para reducir los cálculos intermedios: . El comando le permite mostrar el numerador inmediatamente, sin manipulaciones adicionales en columnas adyacentes. Además, en el mismo grupo con un resultado intermedio, basta con complementar la fórmula dividiéndola por la suma de los pesos para obtener el resultado final. O realizar la acción en celdas adyacentes.

Interesante función adicional PROMEDIO()

Hermano menor de la función PROMEDIO, todo se calcula exactamente igual, pero se tienen en cuenta las celdas vacías, el texto y los valores FALSO/VERDADERO. Más precisamente:

  • Las celdas con texto como valor, o vacías (""), se cuentan como cero. Si la expresión no debe contener valores de texto, utilice la función PROMEDIO.
  • Las celdas con el valor VERDADERO se cuentan como 1 y FALSO, respectivamente = 0.

Se puede ver un ejemplo en la imagen:

¡Escribe comentarios con tus preguntas!

Para encontrar el valor promedio en Excel (ya sea numérico, de texto, porcentual u otro valor), existen muchas funciones. Y cada uno de ellos tiene sus propias características y ventajas. De hecho, en esta tarea se pueden establecer ciertas condiciones.

Por ejemplo, los valores promedio de una serie de números en Excel se calculan mediante funciones estadísticas. También puede ingresar manualmente su propia fórmula. Consideremos varias opciones.

¿Cómo encontrar la media aritmética de los números?

Para encontrar la media aritmética, debes sumar todos los números del conjunto y dividir la suma por la cantidad. Por ejemplo, las calificaciones de un estudiante en informática: 3, 4, 3, 5, 5. Lo que se incluye en el trimestre: 4. Hallamos la media aritmética usando la fórmula: =(3+4+3+5+5) /5.

¿Cómo hacer esto rápidamente usando funciones de Excel? Tomemos por ejemplo una serie de números aleatorios en una cadena:

O: cree la celda activa y simplemente ingrese la fórmula manualmente: =PROMEDIO(A1:A8).

Ahora veamos qué más puede hacer la función PROMEDIO.


Encontremos la media aritmética de los dos primeros y los tres últimos números. Fórmula: =PROMEDIO(A1:B1,F1:H1). Resultado:



Condición promedio

La condición para encontrar la media aritmética puede ser un criterio numérico o textual. Usaremos la función: =PROMEDIOSI().

Encuentra la media aritmética de números mayores o iguales a 10.

Función: =PROMEDIOSI(A1:A8,">=10")


El resultado de usar la función PROMEDIOSI bajo la condición ">=10":

Se omite el tercer argumento: “rango promedio”. En primer lugar, no es necesario. En segundo lugar, el rango analizado por el programa contiene SÓLO valores numéricos. Las celdas especificadas en el primer argumento se buscarán de acuerdo con la condición especificada en el segundo argumento.

¡Atención! El criterio de búsqueda se puede especificar en la celda. Y haga un enlace a él en la fórmula.

Encontremos el valor promedio de los números usando el criterio del texto. Por ejemplo, las ventas promedio del producto “mesas”.

La función se verá así: =PROMEDIOSI($A$2:$A$12,A7,$B$2:$B$12). Rango: una columna con nombres de productos. El criterio de búsqueda es un enlace a una celda con la palabra “tablas” (puede insertar la palabra “tablas” en lugar del enlace A7). Rango de promedio: aquellas celdas de las cuales se tomarán datos para calcular el valor promedio.

Como resultado del cálculo de la función, obtenemos el siguiente valor:

¡Atención! Para un criterio de texto (condición), se debe especificar el rango de promedio.

¿Cómo calcular el precio medio ponderado en Excel?

¿Cómo descubrimos el precio medio ponderado?

Fórmula: =SUMPRODUCTO(C2:C12,B2:B12)/SUM(C2:C12).


Usando la fórmula SUMPRODUCT, encontramos los ingresos totales después de vender la cantidad total de bienes. Y la función SUMA resume la cantidad de bienes. Al dividir los ingresos totales por la venta de bienes por el número total de unidades de bienes, encontramos el precio promedio ponderado. Este indicador tiene en cuenta el “peso” de cada precio. Su participación en la masa total de valores.

Desviación estándar: fórmula en Excel

Existen desviaciones estándar para la población general y para la muestra. En el primer caso, ésta es la raíz de la varianza general. En el segundo, de la varianza muestral.

Para calcular este indicador estadístico se elabora una fórmula de dispersión. De él se extrae la raíz. Pero en Excel existe una función preparada para encontrar la desviación estándar.


La desviación estándar está ligada a la escala de los datos fuente. Esto no es suficiente para una representación figurativa de la variación del rango analizado. Para obtener el nivel relativo de dispersión de los datos, se calcula el coeficiente de variación:

desviación estándar / media aritmética

La fórmula en Excel se ve así:

STDEV (rango de valores) / PROMEDIO (rango de valores).

El coeficiente de variación se calcula como porcentaje. Por lo tanto, configuramos el formato de porcentaje en la celda.

Se pierde al calcular el promedio.

Promedio significado conjunto de números es igual a la suma de números S dividida por el número de estos números. Es decir, resulta que promedio significado es igual a: 19/4 = 4,75.

nota

Si necesitas encontrar la media geométrica de solo dos números, entonces no necesitas una calculadora de ingeniería: puedes extraer la segunda raíz (raíz cuadrada) de cualquier número usando la calculadora más común.

Consejo útil

A diferencia de la media aritmética, la media geométrica no se ve tan afectada por grandes desviaciones y fluctuaciones entre valores individuales en el conjunto de indicadores en estudio.

Fuentes:

  • Calculadora online que calcula la media geométrica.
  • fórmula de media geométrica

Promedio El valor es una de las características de un conjunto de números. Representa un número que no puede quedar fuera del rango definido por los valores mayor y menor de ese conjunto de números. Promedio El valor aritmético es el tipo de promedio más utilizado.

Instrucciones

Suma todos los números del conjunto y divídelos por el número de términos para obtener la media aritmética. Dependiendo de las condiciones de cálculo específicas, a veces es más fácil dividir cada uno de los números por el número de valores del conjunto y sumar el resultado.

Utilícelo, por ejemplo, incluido en el sistema operativo Windows si no es posible calcular la media aritmética mentalmente. Puede abrirlo utilizando el cuadro de diálogo de inicio del programa. Para hacer esto, presione las teclas de acceso rápido WIN + R o haga clic en el botón Inicio y seleccione Ejecutar en el menú principal. Luego escriba calc en el campo de entrada y presione Entrar o haga clic en el botón Aceptar. Se puede hacer lo mismo a través del menú principal: ábralo, vaya a la sección "Todos los programas" y a la sección "Estándar" y seleccione la línea "Calculadora".

Ingrese todos los números del conjunto secuencialmente presionando la tecla Más después de cada uno de ellos (excepto el último) o haciendo clic en el botón correspondiente en la interfaz de la calculadora. También puede ingresar números desde el teclado o haciendo clic en los botones de la interfaz correspondientes.

Presione la tecla de barra diagonal o haga clic aquí en la interfaz de la calculadora después de ingresar el último valor establecido y escriba la cantidad de números en la secuencia. Luego presione el signo igual y la calculadora calculará y mostrará la media aritmética.

Puede utilizar el editor de hojas de cálculo de Microsoft Excel para el mismo propósito. En este caso, inicie el editor e ingrese todos los valores de la secuencia de números en las celdas adyacentes. Si, después de ingresar cada número, presiona Enter o la tecla de flecha hacia abajo o hacia la derecha, el editor moverá el foco de entrada a la celda adyacente.

Haga clic en la celda al lado del último número ingresado si no desea ver solo el promedio. Expanda el menú desplegable sigma griego (Σ) para los comandos Editar en la pestaña Inicio. Seleccione la línea " Promedio" y el editor insertará la fórmula deseada para calcular la media aritmética en la celda seleccionada. Presione la tecla Enter y se calculará el valor.

La media aritmética es una de las medidas de tendencia central, muy utilizada en matemáticas y cálculos estadísticos. Encontrar la media aritmética de varios valores es muy sencillo, pero cada tarea tiene sus propios matices, que simplemente es necesario conocer para realizar los cálculos correctos.

¿Qué es una media aritmética?

La media aritmética determina el valor promedio de toda la matriz original de números. En otras palabras, de un determinado conjunto de números se selecciona un valor común a todos los elementos, cuya comparación matemática con todos los elementos es aproximadamente igual. La media aritmética se utiliza principalmente en la preparación de informes financieros y estadísticos o para calcular los resultados de experimentos similares.

Cómo encontrar la media aritmética

Para encontrar la media aritmética de una serie de números se debe comenzar determinando la suma algebraica de estos valores. Por ejemplo, si la matriz contiene los números 23, 43, 10, 74 y 34, entonces su suma algebraica será igual a 184. Al escribir, la media aritmética se denota con la letra μ (mu) o x (x con una bar). A continuación, la suma algebraica debe dividirse por la cantidad de números en la matriz. En el ejemplo considerado había cinco números, por lo que la media aritmética será igual a 184/5 y será 36,8.

Características de trabajar con números negativos.

Si la matriz contiene números negativos, entonces la media aritmética se encuentra utilizando un algoritmo similar. La diferencia sólo existe cuando se calcula en el entorno de programación, o si el problema tiene condiciones adicionales. En estos casos, encontrar la media aritmética de números con diferentes signos se reduce a tres pasos:

1. Encontrar la media aritmética general utilizando el método estándar;
2. Encontrar la media aritmética de números negativos.
3. Cálculo de la media aritmética de números positivos.

Las respuestas para cada acción se escriben separadas por comas.

Fracciones naturales y decimales

Si una matriz de números se representa mediante fracciones decimales, la solución se lleva a cabo utilizando el método de cálculo de la media aritmética de números enteros, pero el resultado se reduce de acuerdo con los requisitos de la tarea en cuanto a la precisión de la respuesta.

Cuando se trabaja con fracciones naturales, se deben reducir a un denominador común, que se multiplica por la cantidad de números en la matriz. El numerador de la respuesta será la suma de los numeradores dados de los elementos fraccionarios originales.

  • Calculadora de ingeniería.

Instrucciones

Tenga en cuenta que, en general, la media geométrica de los números se encuentra multiplicando estos números y sacando de ellos la raíz de la potencia, que corresponde al número de números. Por ejemplo, si necesitas encontrar la media geométrica de cinco números, necesitarás extraer la raíz de la potencia del producto.

Para encontrar la media geométrica de dos números, usa la regla básica. Encuentra su producto, luego sácale la raíz cuadrada, ya que el número es dos, lo que corresponde a la potencia de la raíz. Por ejemplo, para encontrar la media geométrica de los números 16 y 4, encuentra su producto 16 4=64. Del número resultante, extrae la raíz cuadrada √64=8. Este será el valor deseado. Tenga en cuenta que la media aritmética de estos dos números es mayor e igual a 10. Si no se extrae la raíz completa, redondee el resultado al orden deseado.

Para encontrar la media geométrica de más de dos números, usa también la regla básica. Para hacer esto, encuentre el producto de todos los números para los cuales necesita encontrar la media geométrica. Del producto resultante, extraiga la raíz de la potencia igual al número de números. Por ejemplo, para encontrar la media geométrica de los números 2, 4 y 64, encuentra su producto. 2 4 64 = 512. Como necesitas encontrar el resultado de la media geométrica de tres números, saca la tercera raíz del producto. Es difícil hacer esto verbalmente, así que use una calculadora de ingeniería. Para ello dispone de un botón "x^y". Marque el número 512, presione el botón "x^y", luego marque el número 3 y presione el botón "1/x", para encontrar el valor de 1/3, presione el botón "=". Obtenemos el resultado de elevar 512 a la potencia de 1/3, que corresponde a la raíz tercera. Obtenga 512^1/3=8. Esta es la media geométrica de los números 2,4 y 64.

Usando una calculadora de ingeniería, puedes encontrar la media geométrica de otra manera. Busque el botón de registro en su teclado. Después de eso, toma el logaritmo de cada uno de los números, encuentra su suma y divídelo por la cantidad de números. Toma el antilogaritmo del número resultante. Esta será la media geométrica de los números. Por ejemplo, para encontrar la media geométrica de los mismos números 2, 4 y 64, realice una serie de operaciones en la calculadora. Marque el número 2, luego presione el botón de registro, presione el botón "+", marque el número 4 y presione registrar y "+" nuevamente, marque 64, presione registro y "=". El resultado será un número igual a la suma de los logaritmos decimales de los números 2, 4 y 64. Divide el número resultante entre 3, ya que este es el número de números para los que se busca la media geométrica. Del resultado, tome el antilogaritmo cambiando el botón de mayúsculas y minúsculas y use la misma clave de registro. El resultado será el número 8, esta es la media geométrica deseada.

Buenas tardes, queridos teóricos y practicantes del análisis de datos estadísticos.

En este artículo continuaremos la conversación que iniciamos una vez sobre los promedios. Esta vez pasaremos de la teoría a los cálculos prácticos. El tema es vasto incluso teóricamente. Si le añades matices prácticos, se vuelve aún más interesante. Permítanme recordarles que algunas cuestiones sobre los promedios se analizan en artículos sobre la esencia del promedio, su propósito principal y el promedio ponderado. También se consideraron las propiedades del indicador y su comportamiento en función de los datos iniciales: una muestra pequeña y la presencia de valores anómalos.

En general, estos artículos deberían dar una buena idea de las reglas de cálculo y del uso correcto de los promedios. Pero ahora estamos en el siglo XXI (XXI) y el conteo manual es bastante raro, lo que, lamentablemente, no tiene un efecto positivo en las capacidades mentales de los ciudadanos. Ni siquiera las calculadoras están de moda (incluidas las programables y de ingeniería), y mucho menos los ábacos y las reglas de cálculo. En resumen, ahora se realizan todo tipo de cálculos estadísticos en un programa como el procesador de hojas de cálculo Excel. Ya escribí algo sobre Excel, pero luego lo abandoné temporalmente. Por ahora, decidí prestar más atención a las cuestiones teóricas del análisis de datos, de modo que al describir cálculos, por ejemplo, en Excel, pudiera hacer referencia a conocimientos básicos de estadística. En general, hoy hablaremos de cómo calcular el promedio en Excel. Permítanme aclarar que estamos hablando de la media aritmética (sí, sí, hay otros valores medios, pero se utilizan con mucha menos frecuencia).

La media aritmética es uno de los indicadores estadísticos más utilizados. El analista simplemente necesita poder utilizar Excel para calcularlo, así como para calcular otros indicadores. Y en general, un analista sin dominio de Excel es un impostor, no un analista.

Un lector curioso puede preguntarse: ¿qué hay que contar? – Escribí la fórmula y listo. Esto es, por supuesto, cierto, Excel calcula mediante una fórmula, pero el tipo de fórmula y el resultado dependen en gran medida de los datos de origen. Y los datos originales pueden ser muy diferentes, incluso dinámicos, es decir, modificables. Por tanto, ajustar una fórmula para que sea adecuada para todas las ocasiones no es una cuestión tan trivial.

Comencemos con los simples y luego pasemos a los más complejos y, en consecuencia, más interesantes. Lo más sencillo es si necesitas dibujar una tabla con datos, y debajo, en la línea final, mostrar el valor promedio. Para hacer esto, si eres "rubio", puedes usar la suma de celdas individuales usando un signo más (después de ponerlo entre paréntesis) y luego dividir por el número de estas celdas. Si eres "morena", en lugar de marcar las celdas por separado con un signo "+", puedes usar la fórmula de suma SUMA() y luego dividir por el número de valores. Sin embargo, los usuarios más avanzados de Excel saben que existe una fórmula ya preparada: PROMEDIO(). Entre paréntesis se indica el rango de datos iniciales a partir del cual se calcula el valor promedio, lo cual es conveniente hacer con un mouse (computadora).

Fórmula PROMEDIO

La función estadística de Excel PROMEDIO se utiliza con bastante frecuencia. Se parece a esto.

Esta fórmula tiene una propiedad notable que le da valor y la distingue de la suma y división manual por el número de valores. Si el rango por el cual se calcula la fórmula contiene celdas vacías (no cero, sino vacías), entonces este valor se ignora y se excluye del cálculo. Por lo tanto, si faltan datos para algunas observaciones, el valor promedio no se subestimará (al sumar, Excel percibe una celda vacía como cero). Este hecho hace que la fórmula PROMEDIO sea una herramienta valiosa en el arsenal del analista.

Hay diferentes maneras de llegar a la fórmula. Primero, debes seleccionar la celda en la que aparecerá la fórmula. La fórmula en sí se puede ingresar manualmente en la barra de fórmulas, o puede usar su presencia en la barra de tareas: la pestaña "Inicio", en la parte superior derecha hay un botón desplegable con el ícono de autosuma Σ:

Después de llamar a la fórmula, deberá especificar entre paréntesis el rango de datos para los cuales se calculará el valor promedio. Esto se puede hacer con el mouse presionando la tecla izquierda y arrastrando por el rango deseado. Si el rango de datos no es continuo, manteniendo presionada la tecla Ctrl en el teclado, puede seleccionar los lugares necesarios. A continuación, presione “Entrar”. Este método es muy conveniente y se utiliza con frecuencia.

También existe un método de llamada estándar para todas las funciones. Necesitas presionar un botón fx al principio de la línea donde se escriben las funciones (fórmulas) y así llamar al Asistente de funciones. Luego, ya sea usando una búsqueda o simplemente usando la lista, seleccione la función PROMEDIO (puede ordenar previamente la lista completa de funciones por la categoría "estadística").

Después de seleccionar la función, presione “Enter” u “Ok” y luego seleccione el rango o rangos. Haga clic en "Entrar" o "Aceptar" nuevamente. El resultado del cálculo se reflejará en la celda con la fórmula. Es sencillo.

Cálculo de media aritmética ponderada en Excel.

(módulo 111)

Como puedes adivinar, la fórmula PROMEDIO solo puede calcular la media aritmética simple, es decir, suma todo y lo divide por el número de términos (menos el número de celdas vacías). Sin embargo, a menudo hay que lidiar con una media aritmética ponderada. No existe una fórmula preparada en Excel, al menos yo no he encontrado ninguna. Por lo tanto, aquí tendrás que utilizar varias fórmulas. No hay por qué asustarse, no es mucho más difícil que usar PROMEDIO, excepto que necesitarás hacer un par de movimientos adicionales.

Permítanme recordarles que la fórmula del promedio aritmético ponderado asume en el numerador la suma de los productos de los valores del indicador analizado y los pesos correspondientes. Existen diferentes oportunidades para obtener la cantidad requerida. A menudo se realiza un cálculo intermedio en una columna separada, en la que se calcula el producto de cada valor y su peso correspondiente. Luego se calcula la suma de estos productos. Esto da el numerador de la fórmula del promedio ponderado. Luego todo esto se divide por la suma de los pesos, en la misma celda o en una separada. Se parece a esto.

En general, los desarrolladores de Excel claramente no llegaron a concretar este punto. Tienes que esquivar y calcular el promedio ponderado en el modo “semiautomático”. Sin embargo, es posible reducir el número de cálculos. Existe una función SUMPRODUCT maravillosa para esto. Con esta función, puede evitar el cálculo intermedio en la columna adyacente y calcular el numerador con una función. Puedes dividir por la suma de los pesos en la misma celda agregando la fórmula manualmente, o en la siguiente.

Como puedes ver, hay varias opciones. En general, las mismas tareas en Excel se pueden resolver de diferentes maneras, lo que hace que el procesador de hojas de cálculo sea muy flexible y práctico.

Cálculo de la media aritmética por condición.

Al calcular el valor promedio, pueden surgir situaciones en las que no es necesario incluir todos los valores en el cálculo, sino solo los necesarios que cumplen ciertas condiciones (por ejemplo, productos para grupos de productos individuales). Hay una fórmula preparada para esto. PROMEDIOSI.

Sucede que es necesario calcular el valor medio a partir de valores filtrados. También existe esa posibilidad: la función SUBTOTAL. El parámetro de selección de fórmula debe establecerse en 1 (y no en 9, como es el caso de la suma).

Excel ofrece muchas opciones para calcular promedios. Sólo he descrito los métodos principales y más populares. Es imposible clasificar todas las opciones existentes; hay millones de ellas. Sin embargo, lo descrito anteriormente ocurre en el 90% de los casos y es suficiente para un uso exitoso. Lo principal aquí es comprender claramente qué se está haciendo y por qué. Excel no analiza, solo ayuda a realizar cálculos rápidamente. Detrás de cualquier fórmula debe haber un cálculo frío y una comprensión sobria del análisis que se lleva a cabo.

En primer lugar, esto es probablemente todo lo que necesita saber para calcular el promedio aritmético en Excel.

A continuación se muestra un video sobre la función PROMEDIOSI y cómo calcular el promedio aritmético ponderado en Excel.

En la mayoría de los casos, los datos se concentran en torno a algún punto central. Así, para describir cualquier conjunto de datos, basta con indicar el valor medio. Consideremos secuencialmente tres características numéricas que se utilizan para estimar el valor promedio de la distribución: media aritmética, mediana y moda.

Promedio

La media aritmética (a menudo llamada simplemente media) es la estimación más común de la media de una distribución. Es el resultado de dividir la suma de todos los valores numéricos observados entre su número. Para una muestra que consta de números X 1, X 2, …, Xnorte, media muestral (denotada por ) es igual = (X 1 + X 2 + … + Xnorte) / norte, o

¿Dónde está la media muestral? norte- tamaño de la muestra, Xi– i-ésimo elemento de la muestra.

Descarga la nota en formato o, ejemplos en formato

Considere calcular el promedio aritmético de los rendimientos anuales promedio a cinco años de 15 fondos mutuos de muy alto riesgo (Figura 1).

Arroz. 1. Rentabilidad media anual de 15 fondos mutuos de muy alto riesgo

La media muestral se calcula de la siguiente manera:

Este es un buen rendimiento, especialmente en comparación con el rendimiento del 3-4% que recibieron los depositantes de bancos o cooperativas de crédito durante el mismo período. Si clasificamos los rendimientos, es fácil ver que ocho fondos tienen rendimientos superiores al promedio y siete, inferiores al promedio. La media aritmética actúa como punto de equilibrio, de modo que los fondos con rendimientos bajos equilibran los fondos con rendimientos altos. Todos los elementos de la muestra participan en el cálculo del promedio. Ninguna de las otras estimaciones de la media de una distribución tiene esta propiedad.

¿Cuándo se debe calcular la media aritmética? Dado que la media aritmética depende de todos los elementos de la muestra, la presencia de valores extremos afecta significativamente el resultado. En tales situaciones, la media aritmética puede distorsionar el significado de los datos numéricos. Por tanto, al describir un conjunto de datos que contiene valores extremos, es necesario indicar la mediana o la media aritmética y la mediana. Por ejemplo, si eliminamos los rendimientos del fondo RS Emerging Growth de la muestra, el promedio de la muestra de los rendimientos de los 14 fondos disminuye casi un 1% hasta el 5,19%.

Mediana

La mediana representa el valor medio de una matriz ordenada de números. Si la matriz no contiene números repetidos, entonces la mitad de sus elementos serán menores y la otra mitad serán mayores que la mediana. Si la muestra contiene valores extremos, es mejor utilizar la mediana en lugar de la media aritmética para estimar la media. Para calcular la mediana de una muestra, primero se debe ordenarla.

Esta fórmula es ambigua. Su resultado depende de si el número es par o impar. norte:

  • Si la muestra contiene un número impar de elementos, la mediana es (n+1)/2-ésimo elemento.
  • Si la muestra contiene un número par de elementos, la mediana se encuentra entre los dos elementos centrales de la muestra y es igual a la media aritmética calculada sobre estos dos elementos.

Para calcular la mediana de una muestra que contiene los rendimientos de 15 fondos mutuos de muy alto riesgo, primero es necesario ordenar los datos sin procesar (Figura 2). Entonces la mediana estará opuesta al número del elemento medio de la muestra; en nuestro ejemplo No. 8. Excel tiene una función especial =MEDIAN() que también funciona con matrices desordenadas.

Arroz. 2. Mediana de 15 fondos

Por tanto, la mediana es 6,5. Esto significa que el rendimiento de la mitad de los fondos de muy alto riesgo no supera el 6,5 y el rendimiento de la otra mitad lo supera. Tenga en cuenta que la mediana de 6,5 no es mucho mayor que la media de 6,08.

Si eliminamos la rentabilidad del fondo RS Emerging Growth de la muestra, entonces la mediana de los 14 fondos restantes disminuye al 6,2%, es decir, no tan significativamente como la media aritmética (Figura 3).

Arroz. 3. Mediana de 14 fondos

Moda

El término fue acuñado por primera vez por Pearson en 1894. Moda es el número que aparece con mayor frecuencia en una muestra (el más de moda). La moda describe bien, por ejemplo, la reacción típica de los conductores ante una señal de un semáforo para dejar de circular. Un ejemplo clásico del uso de la moda es la elección de la talla del zapato o el color del papel tapiz. Si una distribución tiene varias modas, entonces se dice que es multimodal o multimodal (tiene dos o más “picos”). La multimodalidad de la distribución proporciona información importante sobre la naturaleza de la variable que se estudia. Por ejemplo, en las encuestas sociológicas, si una variable representa una preferencia o actitud hacia algo, entonces la multimodalidad puede significar que hay varias opiniones claramente diferentes. La multimodalidad también sirve como indicador de que la muestra no es homogénea y las observaciones pueden ser generadas por dos o más distribuciones "superpuestas". A diferencia de la media aritmética, los valores atípicos no afectan la moda. Para variables aleatorias distribuidas continuamente, como el rendimiento anual promedio de los fondos mutuos, la moda a veces no existe (o no tiene ningún sentido). Dado que estos indicadores pueden adoptar valores muy diferentes, los valores repetidos son extremadamente raros.

Cuartiles

Los cuartiles son las métricas que se utilizan con mayor frecuencia para evaluar la distribución de datos al describir las propiedades de muestras numéricas grandes. Mientras que la mediana divide la matriz ordenada por la mitad (el 50% de los elementos de la matriz son menores que la mediana y el 50% son mayores), los cuartiles dividen el conjunto de datos ordenados en cuatro partes. Los valores de Q 1 , mediana y Q 3 son los percentiles 25, 50 y 75, respectivamente. El primer cuartil Q 1 es un número que divide la muestra en dos partes: el 25% de los elementos son menores y el 75% son mayores que el primer cuartil.

El tercer cuartil Q 3 es un número que también divide la muestra en dos partes: el 75% de los elementos son menores y el 25% son mayores que el tercer cuartil.

Para calcular cuartiles en versiones de Excel anteriores a 2007, utilice la función =CUARTIL(matriz,parte). A partir de Excel 2010, se utilizan dos funciones:

  • =CUARTIL.ON(matriz,parte)
  • =CUARTIL.EXC(matriz,parte)

Estas dos funciones dan valores ligeramente diferentes (Figura 4). Por ejemplo, al calcular los cuartiles de una muestra que contiene los rendimientos anuales promedio de 15 fondos mutuos de muy alto riesgo, Q 1 = 1,8 o –0,7 para QUARTILE.IN y QUARTILE.EX, respectivamente. Por cierto, la función CUARTIL, utilizada anteriormente, corresponde a la función CUARTIL.ON moderna. Para calcular cuartiles en Excel usando las fórmulas anteriores, no es necesario ordenar la matriz de datos.

Arroz. 4. Calcular cuartiles en Excel

Recalquemos nuevamente. Excel puede calcular cuartiles para un univariado serie discreta, que contiene los valores de una variable aleatoria. El cálculo de cuartiles para una distribución basada en frecuencia se proporciona a continuación en la sección.

Significado geometrico

A diferencia de la media aritmética, la media geométrica permite estimar el grado de cambio de una variable a lo largo del tiempo. La media geométrica es la raíz. norte grado del trabajo norte cantidades (en Excel se utiliza la función =SRGEOM):

GRAMO= (X 1 * X 2 * … * X n) 1/n

Un parámetro similar, el valor medio geométrico de la tasa de beneficio, está determinado por la fórmula:

GRAMO = [(1 + R 1) * (1 + R 2) * … * (1 + R n)] 1/n – 1,

Dónde ri– tasa de ganancia para i décimo período de tiempo.

Por ejemplo, supongamos que la inversión inicial es de $100 000. Al final del primer año, cae a $50 000 y al final del segundo año se recupera al nivel inicial de $100 000. La tasa de rendimiento de esta inversión en dos años. -año es igual a 0, ya que los montos inicial y final de fondos son iguales entre sí. Sin embargo, la media aritmética de las tasas de rendimiento anuales es = (–0,5 + 1) / 2 = 0,25 o 25%, ya que la tasa de rendimiento en el primer año R 1 = (50.000 – 100.000) / 100.000 = –0,5, y en el segundo R 2 = (100.000 – 50.000) / 50.000 = 1. Al mismo tiempo, el valor medio geométrico de la tasa de ganancia para dos años es igual a: G = [(1–0,5) * (1+ 1 )] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Por lo tanto, la media geométrica refleja con mayor precisión el cambio (más precisamente, la ausencia de cambios) en el volumen de inversiones durante un período de dos años que la media aritmética.

Datos interesantes. En primer lugar, la media geométrica siempre será menor que la media aritmética de los mismos números. Excepto en el caso de que todos los números tomados sean iguales entre sí. En segundo lugar, al considerar las propiedades de un triángulo rectángulo, se puede comprender por qué la media se llama geométrica. La altura de un triángulo rectángulo, bajada hasta la hipotenusa, es el promedio proporcional entre las proyecciones de los catetos sobre la hipotenusa, y cada cateto es el promedio proporcional entre la hipotenusa y su proyección sobre la hipotenusa (Fig. 5). Esto proporciona una forma geométrica de construir la media geométrica de dos segmentos (longitudes): es necesario construir un círculo a partir de la suma de estos dos segmentos como diámetro, luego se restablece la altura desde el punto de su conexión hasta la intersección con el círculo. dará el valor deseado:

Arroz. 5. Naturaleza geométrica de la media geométrica (figura de Wikipedia)

La segunda propiedad importante de los datos numéricos es su variación, caracterizando el grado de dispersión de los datos. Dos muestras diferentes pueden diferir tanto en medias como en varianzas. Sin embargo, como se muestra en la Fig. 6 y 7, dos muestras pueden tener las mismas variaciones pero diferentes medias, o las mismas medias y variaciones completamente diferentes. Los datos que corresponden al polígono B de la Fig. 7, cambia mucho menos que los datos sobre los cuales se construyó el polígono A.

Arroz. 6. Dos distribuciones simétricas en forma de campana con la misma extensión y diferentes valores medios

Arroz. 7. Dos distribuciones simétricas en forma de campana con los mismos valores medios y diferenciales diferentes

Hay cinco estimaciones de variación de datos:

  • alcance,
  • rango intercuartil,
  • dispersión,
  • Desviación Estándar,
  • el coeficiente de variación.

Alcance

El rango es la diferencia entre los elementos más grandes y más pequeños de la muestra:

Rango = XMáximo – Xmín.

El rango de una muestra que contiene los rendimientos anuales promedio de 15 fondos mutuos de muy alto riesgo se puede calcular utilizando la matriz ordenada (ver Figura 4): Rango = 18,5 – (–6,1) = 24,6. Esto significa que la diferencia entre la rentabilidad media anual más alta y más baja de los fondos de muy alto riesgo es del 24,6%.

El rango mide la dispersión general de los datos. Aunque el rango de muestra es una estimación muy simple de la dispersión general de los datos, su debilidad es que no tiene en cuenta exactamente cómo se distribuyen los datos entre los elementos mínimo y máximo. Este efecto es claramente visible en la Fig. 8, que ilustra muestras que tienen el mismo rango. La escala B demuestra que si una muestra contiene al menos un valor extremo, el rango de la muestra es una estimación muy imprecisa de la dispersión de los datos.

Arroz. 8. Comparación de tres muestras con el mismo rango; el triángulo simboliza el soporte de la balanza y su ubicación corresponde a la media muestral

Rango intercuartil

El rango intercuartil, o promedio, es la diferencia entre el tercer y el primer cuartil de la muestra:

Rango intercuartil = Q 3 – Q 1

Este valor nos permite estimar la dispersión del 50% de los elementos y no tener en cuenta la influencia de elementos extremos. El rango intercuartil de una muestra que contiene los rendimientos anuales promedio de 15 fondos mutuos de muy alto riesgo se puede calcular utilizando los datos de la figura. 4 (por ejemplo, para la función CUARTIL.EXC): Rango intercuartil = 9,8 – (–0,7) = 10,5. El intervalo delimitado por los números 9,8 y -0,7 a menudo se denomina mitad media.

Cabe señalar que los valores de Q 1 y Q 3, y por tanto el rango intercuartil, no dependen de la presencia de valores atípicos, ya que en su cálculo no se tiene en cuenta ningún valor que sea menor que Q 1 o mayor. que Q 3 . Las medidas de resumen, como la mediana, el primer y tercer cuartil y el rango intercuartil, que no se ven afectadas por valores atípicos, se denominan medidas robustas.

Aunque el rango y el rango intercuartil proporcionan estimaciones de la dispersión general y promedio de una muestra, respectivamente, ninguna de estas estimaciones tiene en cuenta exactamente cómo se distribuyen los datos. Varianza y desviación estándar carecen de este inconveniente. Estos indicadores le permiten evaluar el grado en que los datos fluctúan alrededor del valor promedio. varianza muestral es una aproximación de la media aritmética calculada a partir de los cuadrados de las diferencias entre cada elemento muestral y la media muestral. Para una muestra X 1, X 2, ... X n, la varianza muestral (indicada por el símbolo S 2 viene dada por la siguiente fórmula:

En general, la varianza muestral es la suma de los cuadrados de las diferencias entre los elementos muestrales y la media muestral, dividida por un valor igual al tamaño de la muestra menos uno:

Dónde - significado aritmetico, norte- tamaño de la muestra, X yo - iº elemento de la selección X. En Excel antes de la versión 2007, se usaba la función =VARIN() para calcular la varianza de la muestra; desde la versión 2010, se usa la función =VARIAN().

La estimación más práctica y ampliamente aceptada de la dispersión de datos es desviación estándar de la muestra. Este indicador se denota con el símbolo S y es igual a la raíz cuadrada de la varianza muestral:

En Excel antes de la versión 2007, se usaba la función =DESVEST.() para calcular la desviación estándar de la muestra; desde la versión 2010, se usa la función =DESVEST.V(); Para calcular estas funciones, la matriz de datos puede estar desordenada.

Ni la varianza muestral ni la desviación estándar muestral pueden ser negativas. La única situación en la que los indicadores S 2 y S pueden ser cero es si todos los elementos de la muestra son iguales entre sí. En este caso completamente improbable, el rango y el rango intercuartil también son cero.

Los datos numéricos son inherentemente volátiles. Cualquier variable puede tomar muchos valores diferentes. Por ejemplo, diferentes fondos mutuos tienen diferentes tasas de rendimiento y pérdidas. Debido a la variabilidad de los datos numéricos, es muy importante estudiar no sólo las estimaciones de la media, que son de naturaleza resumida, sino también las estimaciones de la varianza, que caracterizan la dispersión de los datos.

La dispersión y la desviación estándar le permiten evaluar la dispersión de los datos alrededor del valor promedio, en otras palabras, determinar cuántos elementos de muestra son menores que el promedio y cuántos son mayores. La dispersión tiene algunas propiedades matemáticas valiosas. Sin embargo, su valor es el cuadrado de la unidad de medida: porcentaje cuadrado, dólar cuadrado, pulgada cuadrada, etc. Por lo tanto, la medida natural de dispersión es la desviación estándar, que se expresa en unidades comunes de porcentaje de ingreso, dólares o pulgadas.

La desviación estándar le permite estimar la cantidad de variación de los elementos de la muestra alrededor del valor promedio. En casi todas las situaciones, la mayoría de los valores observados se encuentran dentro del rango de más o menos una desviación estándar de la media. En consecuencia, conociendo la media aritmética de los elementos muestrales y la desviación estándar muestral, es posible determinar el intervalo al que pertenece la mayor parte de los datos.

La desviación estándar de los rendimientos de los 15 fondos mutuos de muy alto riesgo es 6,6 (Figura 9). Esto significa que la rentabilidad de la mayor parte de los fondos difiere del valor medio en no más del 6,6% (es decir, fluctúa en el rango de - S= 6,2 – 6,6 = –0,4 a +S= 12,8). De hecho, la rentabilidad anual media a cinco años del 53,3% (8 de 15) de los fondos se sitúa dentro de este rango.

Arroz. 9. Desviación estándar muestral

Tenga en cuenta que al sumar las diferencias al cuadrado, los elementos de la muestra que están más alejados de la media reciben más peso que los elementos que están más cerca de la media. Esta propiedad es la razón principal por la que la media aritmética se utiliza con mayor frecuencia para estimar la media de una distribución.

El coeficiente de variación.

A diferencia de estimaciones anteriores de dispersión, el coeficiente de variación es una estimación relativa. Siempre se mide como porcentaje y no en las unidades de los datos originales. El coeficiente de variación, denotado por los símbolos CV, mide la dispersión de los datos alrededor de la media. El coeficiente de variación es igual a la desviación estándar dividida por la media aritmética y multiplicada por 100%:

Dónde S- desviación estándar de la muestra, - promedio de la muestra.

El coeficiente de variación permite comparar dos muestras cuyos elementos se expresan en diferentes unidades de medida. Por ejemplo, el director de un servicio de reparto de correo pretende renovar su flota de camiones. Al cargar paquetes, hay dos restricciones a considerar: el peso (en libras) y el volumen (en pies cúbicos) de cada paquete. Suponga que en una muestra que contiene 200 bolsas, el peso medio es 26,0 libras, la desviación estándar del peso es 3,9 libras, el volumen medio de la bolsa es 8,8 pies cúbicos y la desviación estándar del volumen es 2,2 pies cúbicos. ¿Cómo comparar la variación de peso y volumen de los paquetes?

Dado que las unidades de medida de peso y volumen difieren entre sí, el gerente debe comparar la dispersión relativa de estas cantidades. El coeficiente de variación de peso es CV W = 3,9/26,0 * 100% = 15%, y el coeficiente de variación de volumen es CV V = 2,2/8,8 * 100% = 25%. Por tanto, la variación relativa en el volumen de los paquetes es mucho mayor que la variación relativa en su peso.

Formulario de distribución

La tercera propiedad importante de una muestra es la forma de su distribución. Esta distribución puede ser simétrica o asimétrica. Para describir la forma de una distribución, es necesario calcular su media y mediana. Si las dos son iguales, la variable se considera distribuida simétricamente. Si el valor medio de una variable es mayor que la mediana, su distribución tiene una asimetría positiva (Fig. 10). Si la mediana es mayor que la media, la distribución de la variable está sesgada negativamente. La asimetría positiva ocurre cuando la media aumenta a valores inusualmente altos. La asimetría negativa ocurre cuando la media disminuye a valores inusualmente pequeños. Una variable está distribuida simétricamente si no toma ningún valor extremo en ninguna dirección, de modo que los valores grandes y pequeños de la variable se cancelen entre sí.

Arroz. 10. Tres tipos de distribuciones

Los datos mostrados en la escala A están sesgados negativamente. Esta figura muestra una cola larga y una inclinación hacia la izquierda causada por la presencia de valores inusualmente pequeños. Estos valores extremadamente pequeños desplazan el valor promedio hacia la izquierda, haciéndolo menor que la mediana. Los datos mostrados en la escala B se distribuyen simétricamente. Las mitades izquierda y derecha de la distribución son imágenes especulares de sí mismas. Los valores grandes y pequeños se equilibran entre sí y la media y la mediana son iguales. Los datos mostrados en la escala B están sesgados positivamente. Esta figura muestra una cola larga y una inclinación hacia la derecha causada por la presencia de valores inusualmente altos. Estos valores demasiado grandes desplazan la media hacia la derecha, haciéndola mayor que la mediana.

En Excel, las estadísticas descriptivas se pueden obtener utilizando un complemento. Paquete de análisis. Pasa por el menú DatosAnálisis de los datos, en la ventana que se abre, seleccione la línea Estadísticas descriptivas y haga clic De acuerdo. En la ventana Estadísticas descriptivas asegúrese de indicar Intervalo de entrada(Figura 11). Si desea ver estadísticas descriptivas en la misma hoja que los datos originales, seleccione el botón de opción Intervalo de salida y especifique la celda donde se debe colocar la esquina superior izquierda de las estadísticas mostradas (en nuestro ejemplo, $C$1). Si desea enviar datos a una nueva hoja o un nuevo libro de trabajo, solo necesita seleccionar el botón de opción apropiado. Marque la casilla junto a Resumen estadístico. Si lo desea, también puede elegir Nivel de dificultad,késimo más pequeño yk-ésimo más grande.

Si en deposito Datos en la zona Análisis no ves el icono Análisis de los datos, primero debes instalar el complemento Paquete de análisis(ver, por ejemplo,).

Arroz. 11. Estadísticas descriptivas de los rendimientos anuales promedio de cinco años de fondos con niveles de riesgo muy altos, calculados utilizando el complemento Análisis de los datos programas excel

Excel calcula una serie de estadísticas analizadas anteriormente: media, mediana, moda, desviación estándar, varianza, rango ( intervalo), mínimo, máximo y tamaño de muestra ( controlar). Excel también calcula algunas estadísticas que son nuevas para nosotros: error estándar, curtosis y asimetría. Error estándar igual a la desviación estándar dividida por la raíz cuadrada del tamaño de la muestra. Asimetría caracteriza la desviación de la simetría de la distribución y es una función que depende del cubo de las diferencias entre los elementos de la muestra y el valor promedio. La curtosis es una medida de la concentración relativa de datos alrededor de la media en comparación con las colas de la distribución y depende de las diferencias entre los elementos de la muestra y la media elevada a la cuarta potencia.

Calcular estadísticas descriptivas de la población.

La media, la dispersión y la forma de la distribución analizada anteriormente son características determinadas a partir de la muestra. Sin embargo, si el conjunto de datos contiene mediciones numéricas de toda la población, se pueden calcular sus parámetros. Dichos parámetros incluyen el valor esperado, la dispersión y la desviación estándar de la población.

Valor esperado igual a la suma de todos los valores de la población dividida por el tamaño de la población:

Dónde µ - valor esperado, Xi- iésima observación de una variable X, norte- volumen de la población general. En Excel, para calcular la expectativa matemática se utiliza la misma función que para la media aritmética: =PROMEDIO().

Variación de la población igual a la suma de los cuadrados de las diferencias entre los elementos de la población general y el mat. expectativa dividida por el tamaño de la población:

Dónde s 2– dispersión de la población general. En Excel anterior a la versión 2007, la función =VARP() se utiliza para calcular la varianza de la población, a partir de la versión 2010 =VARP().

Desviación estándar de población igual a la raíz cuadrada de la varianza poblacional:

En Excel anterior a la versión 2007, la función =DESVEST() se utiliza para calcular la desviación estándar de una población, a partir de la versión 2010 =DESVEST.Y(). Tenga en cuenta que las fórmulas para la varianza de la población y la desviación estándar son diferentes de las fórmulas para calcular la varianza de la muestra y la desviación estándar. Al calcular estadísticas de muestra S 2 Y S el denominador de la fracción es norte – 1, y al calcular los parámetros s 2 Y σ - volumen de la población general norte.

Regla de oro

En la mayoría de las situaciones, una gran proporción de observaciones se concentra alrededor de la mediana, formando un grupo. En conjuntos de datos con asimetría positiva, este grupo se ubica a la izquierda (es decir, debajo) de la expectativa matemática, y en conjuntos con asimetría negativa, este grupo se ubica a la derecha (es decir, arriba) de la expectativa matemática. Para datos simétricos, la media y la mediana son iguales y las observaciones se agrupan alrededor de la media, formando una distribución en forma de campana. Si la distribución no está claramente sesgada y los datos se concentran alrededor de un centro de gravedad, una regla general que se puede utilizar para estimar la variabilidad es que si los datos tienen una distribución en forma de campana, entonces aproximadamente el 68% de las observaciones están dentro de los límites establecidos. una desviación estándar del valor esperado, aproximadamente el 95% de las observaciones no están a más de dos desviaciones estándar de la expectativa matemática y el 99,7% de las observaciones no están a más de tres desviaciones estándar de la expectativa matemática.

Por tanto, la desviación estándar, que es una estimación de la variación promedio alrededor del valor esperado, ayuda a comprender cómo se distribuyen las observaciones y a identificar valores atípicos. La regla general es que para las distribuciones en forma de campana, sólo un valor entre veinte difiere de la expectativa matemática en más de dos desviaciones estándar. Por tanto, valores fuera del intervalo µ ± 2σ, pueden considerarse valores atípicos. Además, sólo tres de cada 1000 observaciones difieren de la expectativa matemática en más de tres desviaciones estándar. Por tanto, valores fuera del intervalo. µ ± 3σ casi siempre son valores atípicos. Para distribuciones muy sesgadas o que no tienen forma de campana, se puede aplicar la regla general de Bienamay-Chebyshev.

Hace más de cien años, los matemáticos Bienamay y Chebyshev descubrieron de forma independiente la útil propiedad de la desviación estándar. Descubrieron que para cualquier conjunto de datos, independientemente de la forma de la distribución, el porcentaje de observaciones que se encuentran dentro de una distancia de k desviaciones estándar de la expectativa matemática, no menos (1 – 1/ k2)*100%.

Por ejemplo, si k= 2, la regla de Bienname-Chebyshev establece que al menos (1 – (1/2) 2) x 100% = 75% de las observaciones deben estar en el intervalo µ ± 2σ. Esta regla es cierta para cualquier k, superando uno. La regla de Bienamay-Chebyshev es muy general y válida para distribuciones de cualquier tipo. Especifica el número mínimo de observaciones, cuya distancia a la expectativa matemática no excede un valor específico. Sin embargo, si la distribución tiene forma de campana, la regla general estima con mayor precisión la concentración de datos alrededor del valor esperado.

Calcular estadísticos descriptivos para una distribución basada en frecuencia

Si los datos de origen no están disponibles, la distribución de frecuencia se convierte en la única fuente de información. En tales situaciones, es posible calcular valores aproximados de indicadores cuantitativos de la distribución, como la media aritmética, la desviación estándar y los cuartiles.

Si los datos de muestra se representan como una distribución de frecuencia, se puede calcular una aproximación de la media aritmética suponiendo que todos los valores dentro de cada clase se concentran en el punto medio de la clase:

Dónde - promedio de la muestra, norte- número de observaciones o tamaño de la muestra, Con- número de clases en la distribución de frecuencias, mj- punto medio j cuarta clase, Fj- frecuencia correspondiente j-ésima clase.

Para calcular la desviación estándar de una distribución de frecuencia, también se supone que todos los valores dentro de cada clase están concentrados en el punto medio de la clase.

Para comprender cómo se determinan los cuartiles de una serie en función de las frecuencias, considere el cálculo del cuartil inferior basado en datos de 2013 sobre la distribución de la población rusa por ingreso monetario promedio per cápita (Fig. 12).

Arroz. 12. Proporción de la población rusa con ingresos medios per cápita en efectivo al mes, rublos

Para calcular el primer cuartil de una serie de variación de intervalo, puede utilizar la fórmula:

donde Q1 es el valor del primer cuartil, xQ1 es el límite inferior del intervalo que contiene el primer cuartil (el intervalo está determinado por la frecuencia acumulada que primero supera el 25%); i – valor del intervalo; Σf – suma de frecuencias de toda la muestra; probablemente siempre sea igual al 100%; SQ1–1 – frecuencia acumulada del intervalo que precede al intervalo que contiene el cuartil inferior; fQ1 – frecuencia del intervalo que contiene el cuartil inferior. La fórmula para el tercer cuartil se diferencia en que en todos los lugares es necesario utilizar Q3 en lugar de Q1 y sustituir ¾ en lugar de ¼.

En nuestro ejemplo (Fig. 12), el cuartil inferior está en el rango 7000,1 – 10 000, cuya frecuencia acumulada es del 26,4%. El límite inferior de este intervalo es 7000 rublos, el valor del intervalo es 3000 rublos, la frecuencia acumulada del intervalo que precede al intervalo que contiene el cuartil inferior es 13,4%, la frecuencia del intervalo que contiene el cuartil inferior es 13,0%. Así: Q1 = 7000 + 3000 * (¼ * 100 – 13,4) / 13 = 9677 rublos.

Errores asociados con la estadística descriptiva

En esta publicación, analizamos cómo describir un conjunto de datos utilizando varias estadísticas que evalúan su media, dispersión y distribución. El siguiente paso es el análisis y la interpretación de los datos. Hasta ahora hemos estudiado las propiedades objetivas de los datos y ahora pasamos a su interpretación subjetiva. El investigador se enfrenta a dos errores: un tema de análisis elegido incorrectamente y una interpretación incorrecta de los resultados.

El análisis de la rentabilidad de 15 fondos mutuos de muy alto riesgo es bastante imparcial. Llegó a conclusiones completamente objetivas: todos los fondos mutuos tienen rendimientos diferentes, el diferencial de rendimientos del fondo oscila entre -6,1 y 18,5 y el rendimiento medio es 6,08. La objetividad del análisis de datos está garantizada por la elección correcta de indicadores cuantitativos resumidos de distribución. Se consideraron varios métodos para estimar la media y la dispersión de los datos y se indicaron sus ventajas y desventajas. ¿Cómo elegir las estadísticas adecuadas que proporcionen un análisis objetivo e imparcial? Si la distribución de los datos está ligeramente sesgada, ¿debería elegir la mediana en lugar de la media? ¿Qué indicador caracteriza con mayor precisión la dispersión de los datos: desviación estándar o rango? ¿Debería señalarse la asimetría positiva de la distribución?

Por otro lado, la interpretación de datos es un proceso subjetivo. Diferentes personas llegan a conclusiones diferentes al interpretar los mismos resultados. Cada uno tiene su propio punto de vista. Alguien considera buena la rentabilidad media anual total de 15 fondos con un nivel de riesgo muy alto y está bastante satisfecho con los ingresos recibidos. Otros pueden sentir que estos fondos tienen rendimientos demasiado bajos. Así, la subjetividad debe ser compensada por la honestidad, la neutralidad y la claridad de conclusiones.

Cuestiones éticas

El análisis de datos está indisolublemente ligado a cuestiones éticas. Debe ser crítico con la información difundida por los periódicos, la radio, la televisión e Internet. Con el tiempo, aprenderá a ser escéptico no sólo ante los resultados, sino también ante los objetivos, el tema y la objetividad de la investigación. El famoso político británico Benjamin Disraeli lo dijo mejor: “Hay tres tipos de mentiras: mentiras, malditas mentiras y estadísticas”.

Como se señala en la nota, surgen cuestiones éticas a la hora de elegir los resultados que deben presentarse en el informe. Deben publicarse tanto los resultados positivos como los negativos. Además, al realizar un informe o informe escrito, los resultados deben presentarse de forma honesta, neutral y objetiva. Hay que hacer una distinción entre presentaciones fallidas y deshonestas. Para ello, es necesario determinar cuáles fueron las intenciones del hablante. A veces, el hablante omite información importante por ignorancia y, a veces, de forma deliberada (por ejemplo, si utiliza la media aritmética para estimar el promedio de datos claramente sesgados para obtener el resultado deseado). También es deshonesto suprimir resultados que no corresponden al punto de vista del investigador.

Se utilizan materiales del libro Levin et al. – M.: Williams, 2004. – pág. 178–209

La función CUARTIL se ha conservado por compatibilidad con versiones anteriores de Excel.



¿Te gustó el artículo? ¡Compartir con tus amigos!