Ejemplos de cálculo de la varianza. Cálculo de varianza grupal, intergrupal y total (según la regla de sumar varianzas)

La topología de la red se refiere a la configuración física o eléctrica del cableado y las conexiones de la red.

Al describir la topología de las redes, se utilizan varios términos especializados: nodo de red: una computadora o dispositivo de conmutación de red; rama de red: una ruta que conecta dos nodos adyacentes; nodo terminal: un nodo ubicado al final de una sola rama; nodo intermedio: un nodo ubicado en los extremos de más de una rama; Los nodos adyacentes son nodos conectados por al menos una ruta que no contiene ningún otro nodo.

Solo existen 5 tipos principales de topologías de red:

1. Topología “Bus Compartido”. En este caso, la conexión y el intercambio de datos se realizan a través de canal común comunicación, llamada bus compartido: Un bus compartido es una topología muy común para las redes de área local. La información transmitida se puede distribuir en ambas direcciones. El uso de un bus común reduce los costes de cableado y unifica la conexión de varios módulos. Las principales ventajas de este esquema son el bajo costo y la facilidad de distribución del cable por todo el local. La desventaja más grave del bus común es su baja fiabilidad: cualquier defecto en el cable o en cualquiera de los numerosos conectores paraliza por completo toda la red. Otra desventaja del bus compartido es su bajo rendimiento, ya que con este método de conexión sólo un ordenador a la vez puede transmitir datos a la red. Por lo tanto, el ancho de banda del canal de comunicación siempre se divide aquí entre todos los nodos de la red.

2. Topología en estrella. En este caso, cada computadora está conectada con un cable separado a dispositivo general, llamado hub, que está ubicado en el centro de la red:

La función de un concentrador es dirigir la información transmitida por una computadora a una o todas las demás computadoras de la red. La principal ventaja de esta topología sobre un bus común es una mayor confiabilidad. Cualquier problema con el cable afecta sólo a la computadora a la que está conectado este cable, y sólo un mal funcionamiento del concentrador puede provocar la caída de toda la red. Además, el hub puede desempeñar el papel de filtro inteligente de la información proveniente de los nodos de la red y, si es necesario, bloquear las transmisiones prohibidas por el administrador. Las desventajas de una topología en estrella incluyen el mayor costo del equipo de red debido a la necesidad de comprar un concentrador. Además, la capacidad de aumentar la cantidad de nodos en la red está limitada por la cantidad de puertos del concentrador. Actualmente, una estrella jerárquica es el tipo más común de topología de conexión tanto en redes locales como globales.

3. Topología en “anillo”. En redes con topología de anillo, los datos de la red se transmiten secuencialmente de una estación a otra a lo largo del anillo, generalmente en una dirección:

Si la computadora reconoce los datos según lo previsto, los copia en su búfer interno. En una red con topología en anillo, es necesario tomar medidas especiales para que en caso de falla o desconexión de alguna estación, el canal de comunicación entre las estaciones restantes no se vea interrumpido. La ventaja de esta topología es la facilidad de gestión, la desventaja es la posibilidad de fallo de toda la red si hay un fallo en el canal entre dos nodos.

4. Topología de malla. La topología de malla se caracteriza por un esquema de conexión de computadoras en el que se establecen líneas de comunicación físicas con todas las computadoras cercanas:

En una red con topología de malla, solo aquellas computadoras entre las cuales se produce un intercambio intensivo de datos están conectadas directamente, y para el intercambio de datos entre computadoras que no están conectadas directamente, se utilizan transmisiones de tránsito a través de nodos intermedios. La topología de malla permite la conexión de una gran cantidad de computadoras y suele ser característica de las redes globales. Las ventajas de esta topología son su resistencia a fallas y sobrecargas, porque Hay varias formas de evitar nodos individuales.

5. Topología mixta. Mientras que las redes pequeñas suelen tener una topología típica de estrella, anillo o bus, las redes grandes suelen tener conexiones aleatorias entre computadoras. En este tipo de redes se pueden identificar subredes individuales con una topología típica, por lo que se denominan redes con topología mixta.

Dispersión variable aleatoria es una medida de la dispersión de valores de esta cantidad. Una varianza baja significa que los valores están agrupados muy juntos. Una gran dispersión indica una fuerte dispersión de valores. El concepto de varianza de una variable aleatoria se utiliza en estadística. Por ejemplo, si compara la varianza de dos valores (por ejemplo, entre pacientes masculinos y femeninos), puede probar la importancia de una variable. La varianza también se utiliza al crear modelos estadísticos, ya que una varianza baja puede ser una señal de que se están sobreajustando los valores.

Pasos

Calcular la varianza de la muestra

  1. Registre los valores de la muestra. En la mayoría de los casos, los estadísticos sólo tienen acceso a muestras de poblaciones específicas. Por ejemplo, como regla general, los estadísticos no analizan los costos de mantenimiento del conjunto de todos los automóviles en Rusia, sino que analizan muestra aleatoria de varios miles de coches. Esta muestra ayudará a determinar el costo promedio de un automóvil, pero lo más probable es que el valor resultante esté lejos del real.

    • Por ejemplo, analicemos el número de bollos vendidos en una cafetería durante 6 días, tomados en Orden aleatorio. La muestra se ve así: 17, 15, 23, 7, 9, 13. Esta es una muestra, no una población, porque no tenemos datos sobre los bollos vendidos cada día que la cafetería está abierta.
    • Si le dan una población en lugar de una muestra de valores, continúe con la siguiente sección.
  2. Escriba una fórmula para calcular la varianza muestral. La dispersión es una medida de la dispersión de valores de una determinada cantidad. Cómo valor más cercano dispersión es cero, más cerca se agrupan los valores entre sí. Cuando trabaje con la selección de valores, utilice la siguiente fórmula para calcular la varianza:

    • s 2 (\displaystyle s^(2)) = ∑[(x yo (\displaystyle x_(i))- X) 2 (\displaystyle ^(2))] / (n - 1)
    • s 2 (\displaystyle s^(2))– esto es dispersión. La dispersión se mide en unidades cuadradas mediciones.
    • x yo (\displaystyle x_(i))– cada valor de la muestra.
    • x yo (\displaystyle x_(i)) necesitas restar x̅, elevarlo al cuadrado y luego sumar los resultados.
    • x̅ – media muestral (media muestral).
    • n – número de valores en la muestra.
  3. Calcular el promedio muestras. Se denota como x̅. La media muestral se calcula como una media aritmética simple: sume todos los valores de la muestra y luego divida el resultado por el número de valores de la muestra.

    • En nuestro ejemplo, suma los valores de la muestra: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Ahora divide el resultado por el número de valores de la muestra (en nuestro ejemplo son 6): 84 ÷ 6 = 14.
      Media muestral x̅ = 14.
    • La media muestral es el valor central alrededor del cual se distribuyen los valores de la muestra. Si los valores de la muestra se agrupan alrededor de la media muestral, entonces la varianza es pequeña; de lo contrario, la variación es grande.
  4. Reste la media muestral de cada valor de la muestra. Ahora calcula la diferencia x yo (\displaystyle x_(i))- x̅, donde x yo (\displaystyle x_(i))– cada valor de la muestra. Cada resultado obtenido indica hasta qué punto un valor particular se desvía de la media muestral, es decir, qué tan lejos está este valor de la media muestral.

    • En nuestro ejemplo:
      x 1 (\displaystyle x_(1))- x̅ = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x̅ = 15 - 14 = 1
      x 3 (\displaystyle x_(3))- x̅ = 23 - 14 = 9
      x 4 (\displaystyle x_(4))- x̅ = 7 - 14 = -7
      x 5 (\displaystyle x_(5))- x̅ = 9 - 14 = -5
      x6 (\displaystyle x_(6))- x̅ = 13 - 14 = -1
    • La exactitud de los resultados obtenidos es fácil de comprobar, ya que su suma debe ser igual a cero. Esto está relacionado con la determinación del valor promedio, ya que valores negativos(distancias desde el promedio hasta valores más bajos) son completamente compensados valores positivos(distancias de valores medios a grandes).
  5. Como se señaló anteriormente, la suma de las diferencias x yo (\displaystyle x_(i))- x̅ debe ser igual a cero. Esto significa que varianza promedio es siempre igual a cero, lo que no da ninguna idea sobre la dispersión de los valores de una determinada cantidad. Para resolver este problema, eleva al cuadrado cada diferencia x yo (\displaystyle x_(i))- X. Esto dará como resultado que solo obtenga números positivos, que nunca sumarán 0.

    • En nuestro ejemplo:
      (x 1 (\displaystyle x_(1))- X) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2))- X) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Encontraste el cuadrado de la diferencia - x̅) 2 (\displaystyle ^(2)) para cada valor de la muestra.
  6. Calcula la suma de los cuadrados de las diferencias. Es decir, encuentra esa parte de la fórmula que se escribe así: ∑[( x yo (\displaystyle x_(i))- X) 2 (\displaystyle ^(2))]. Aquí el signo Σ significa la suma de diferencias al cuadrado para cada valor x yo (\displaystyle x_(i)) en la muestra. Ya has encontrado las diferencias al cuadrado. (x yo (\displaystyle (x_(i))- X) 2 (\displaystyle ^(2)) para cada valor x yo (\displaystyle x_(i)) en la muestra; ahora solo suma estos cuadrados.

    • En nuestro ejemplo: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Divida el resultado por n - 1, donde n es el número de valores de la muestra. Hace algún tiempo, para calcular la varianza muestral, los estadísticos simplemente dividían el resultado entre n; en este caso obtendrás la media de la varianza al cuadrado, que es ideal para describir la varianza de una muestra determinada. Pero recuerda que cualquier muestra es sólo una pequeña parte. población valores. Si toma otra muestra y realiza los mismos cálculos, obtendrá un resultado diferente. Resulta que dividir por n - 1 (en lugar de solo n) da una estimación más precisa de la varianza de la población, que es lo que le interesa. La división por n – 1 se ha vuelto común, por lo que se incluye en la fórmula para calcular la varianza muestral.

    • En nuestro ejemplo, la muestra incluye 6 valores, es decir, n = 6.
      Varianza muestral = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. La diferencia entre varianza y desviación estándar. Tenga en cuenta que la fórmula contiene un exponente, por lo que la dispersión se mide en unidades cuadradas del valor que se analiza. A veces es bastante difícil operar con tal magnitud; en tales casos, utilice la desviación estándar, que es igual a raíz cuadrada de la dispersión. Es por eso que la varianza muestral se denota como s 2 (\displaystyle s^(2)), A Desviación Estándar muestras - como s (\displaystyle s).

    • En nuestro ejemplo, la desviación estándar de la muestra es: s = √33,2 = 5,76.

    Calcular la varianza de la población

    1. Analizar algún conjunto de valores. El conjunto incluye todos los valores de la cantidad considerada. Por ejemplo, si estás estudiando la edad de los residentes Región de Leningrado, entonces la población incluye las edades de todos los residentes de esta área. Cuando se trabaja con una población, se recomienda crear mesa y sumarle los valores de la totalidad. Considere el siguiente ejemplo:

      • En cierta habitación hay 6 acuarios. Cada acuario contiene la siguiente cantidad de peces:
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x6 = 18 (\displaystyle x_(6)=18)
    2. Escribe una fórmula para calcular la varianza poblacional. Dado que la totalidad incluye todos los valores de una determinada cantidad, la siguiente fórmula nos permite obtener valor exacto variaciones poblacionales. Para distinguir la varianza de la población de la varianza de la muestra (que es sólo una estimación), los estadísticos utilizan varias variables:

      • σ 2 (\displaystyle ^(2)) = (∑(x yo (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)))/norte
      • σ 2 (\displaystyle ^(2))– dispersión de la población (léase “sigma cuadrado”). La dispersión se mide en unidades cuadradas.
      • x yo (\displaystyle x_(i))– cada valor en total.
      • Σ – signo de suma. Es decir, de cada valor x yo (\displaystyle x_(i)) necesitas restar μ, elevarlo al cuadrado y luego sumar los resultados.
      • μ – media poblacional.
      • n – número de valores en la población.
    3. Calcula la media poblacional. Cuando se trabaja con una población, su media se denota como μ (mu). La media poblacional se calcula como una media aritmética simple: suma todos los valores de la población y luego divide el resultado por el número de valores de la población.

      • Tenga en cuenta que los promedios no siempre se calculan como media aritmética.
      • En nuestro ejemplo, la media poblacional: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Reste la media poblacional de cada valor de la población. Cuanto más cercana a cero sea la diferencia, más cercana significado específico a la media poblacional. Encuentra la diferencia entre cada valor de la población y su media y tendrás una primera idea de la distribución de valores.

      • En nuestro ejemplo:
        x 1 (\displaystyle x_(1))- µ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- µ = 5 - 10,5 = -5,5
        x 3 (\displaystyle x_(3))- µ = 8 - 10,5 = -2,5
        x 4 (\displaystyle x_(4))- µ = 12 - 10,5 = 1,5
        x 5 (\displaystyle x_(5))- µ = 15 - 10,5 = 4,5
        x6 (\displaystyle x_(6))- µ = 18 - 10,5 = 7,5
    5. Cuadra cada resultado obtenido. Los valores de diferencia serán tanto positivos como negativos; Si estos valores se trazan en una recta numérica, estarán a la derecha y a la izquierda de la media poblacional. Esto no es adecuado para calcular la varianza, ya que los valores positivos y números negativos compensarnos unos a otros. Así que eleva al cuadrado cada diferencia para obtener números exclusivamente positivos.

      • En nuestro ejemplo:
        (x yo (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2)) para cada valor de población (de i = 1 a i = 6):
        (-5,5)2 (\displaystyle ^(2)) = 30,25
        (-5,5)2 (\displaystyle ^(2)), Dónde x norte (\displaystyle x_(n))último valor en la población general.
      • Para calcular el valor promedio de los resultados obtenidos, es necesario encontrar su suma y dividirla por n:(( x 1 (\displaystyle x_(1)) - μ) 2 (\displaystyle ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\displaystyle ^(2)) + ... + (x norte (\displaystyle x_(n)) - μ) 2 (\displaystyle ^(2)))/norte
      • Ahora escribamos la explicación anterior usando variables: (∑( x yo (\displaystyle x_(i)) - μ) 2 (\displaystyle ^(2))) / n y obtenga una fórmula para calcular la varianza poblacional.

.

Por el contrario, si es un a.e. no negativo. funcionar de tal manera que , entonces existe una medida de probabilidad absolutamente continua tal que es su densidad.

    Reemplazando la medida en la integral de Lebesgue:

,

donde es cualquier función de Borel que sea integrable con respecto a la medida de probabilidad.

Dispersión, tipos y propiedades de dispersión El concepto de dispersión.

Dispersión en las estadísticas se calcula como la desviación estándar de los valores individuales de la característica al cuadrado de la media aritmética. Dependiendo de los datos iniciales, se determina mediante fórmulas de varianza simple y ponderada:

1. varianza simple(para datos no agrupados) se calcula mediante la fórmula:

2. Varianza ponderada (para series de variación):

donde n es la frecuencia (repetibilidad del factor X)

Un ejemplo de cómo encontrar varianza

Esta página describe un ejemplo estándar de búsqueda de varianza; también puede consultar otros problemas para encontrarla.

Ejemplo 1. Definición de grupo, promedio de grupo, intergrupo y varianza total

Ejemplo 2. Encontrar la varianza y el coeficiente de variación en una tabla de agrupación

Ejemplo 3. Encontrar la varianza en una serie discreta

Ejemplo 4. Los siguientes datos están disponibles para un grupo de 20 estudiantes. Departamento de correspondencia. necesidad de construir serie de intervalos distribución de una característica, calcular el valor medio de la característica y estudiar su varianza

Construyamos una agrupación de intervalos. Determinemos el rango del intervalo usando la fórmula:

donde X máx– valor máximo característica de agrupación; X min – valor mínimo de la característica de agrupación; n – número de intervalos:

Aceptamos n=5. El paso es: h = (192 - 159)/ 5 = 6,6

Creemos una agrupación de intervalos.

Para más cálculos, construiremos una tabla auxiliar:

X"i – la mitad del intervalo. (por ejemplo, la mitad del intervalo 159 – 165,6 = 162,3)

Determinamos la altura promedio de los estudiantes utilizando la fórmula del promedio aritmético ponderado:

Determinemos la varianza usando la fórmula:

La fórmula se puede transformar así:

De esta fórmula se deduce que la varianza es igual a la diferencia entre el promedio de los cuadrados de las opciones y el cuadrado y el promedio.

Variación en serie de variación con intervalos iguales usando el método de los momentos se puede calcular de la siguiente manera usando la segunda propiedad de dispersión (dividiendo todas las opciones por el valor del intervalo). Determinando la varianza, calculado mediante el método de los momentos, utilizando la siguiente fórmula es menos laborioso:

donde i es el valor del intervalo; A es un cero convencional, para lo cual conviene utilizar la mitad del intervalo de mayor frecuencia; m1 es el cuadrado del momento de primer orden; m2 - momento de segundo orden

Variación de rasgos alternativos (si en una población estadística una característica cambia de tal manera que solo hay dos opciones mutuamente excluyentes, entonces dicha variabilidad se llama alternativa) se puede calcular mediante la fórmula:

Sustituyendo en esta fórmula varianza q =1- p, obtenemos:

Tipos de variación

varianza total Mide la variación de una característica en toda la población bajo la influencia de todos los factores que causan esta variación. Es igual al cuadrado medio de las desviaciones. valores individuales característica x del valor promedio general de x y puede definirse como varianza simple o varianza ponderada.

Variación dentro del grupo caracteriza la variación aleatoria, es decir Parte de la variación se debe a la influencia de factores no contabilizados y no depende del factor-atributo que forma la base del grupo. Dicha dispersión es igual al cuadrado medio de las desviaciones de los valores individuales del atributo dentro del grupo X de la media aritmética del grupo y puede calcularse como dispersión simple o como dispersión ponderada.

De este modo, medidas de varianza dentro del grupo variación de un rasgo dentro de un grupo y está determinada por la fórmula:

donde xi es el promedio del grupo; ni es el número de unidades del grupo.

Por ejemplo, las variaciones intragrupo que es necesario determinar en la tarea de estudiar la influencia de las calificaciones de los trabajadores en el nivel de productividad laboral en un taller muestran variaciones en la producción en cada grupo causadas por todos los factores posibles (estado técnico del equipo, disponibilidad de herramientas y materiales, edad de los trabajadores, intensidad laboral, etc.), salvo diferencias en la categoría de cualificación (dentro de un grupo todos los trabajadores tienen las mismas cualificaciones).

El promedio de las varianzas dentro del grupo refleja la variación aleatoria, es decir, la parte de la variación que ocurrió bajo la influencia de todos los demás factores, con excepción del factor de agrupación. Se calcula mediante la fórmula:

Varianza intergrupal caracteriza la variación sistemática de la característica resultante, que se debe a la influencia del factor-signo, que forma la base del grupo. Es igual al cuadrado medio de las desviaciones de las medias grupales de la media general. La varianza entre grupos se calcula mediante la fórmula:



¿Te gustó el artículo? ¡Compartir con tus amigos!