Exemples de calcul de variance. Calcul de la variance de groupe, intergroupe et totale (selon la règle d'addition des variances)

La topologie du réseau fait référence à la configuration physique ou électrique du câblage et des connexions du réseau.

Pour décrire la topologie des réseaux, plusieurs termes spécialisés sont utilisés : nœud de réseau – un ordinateur ou un dispositif de commutation réseau ; branche réseau - un chemin reliant deux nœuds adjacents ;

nœud terminal - un nœud situé à l'extrémité d'une seule branche ;

nœud intermédiaire - un nœud situé aux extrémités de plusieurs branches ; les nœuds adjacents sont des nœuds connectés par au moins un chemin qui ne contient aucun autre nœud. Il n'existe que 5 principaux types de topologies de réseau :

1. Topologie « Bus partagé ». Dans ce cas, la connexion et l'échange de données s'effectuent via canal commun communication, appelée bus partagé : un bus partagé est une topologie très courante pour les réseaux locaux. Les informations transmises peuvent être distribuées dans les deux sens. L'utilisation d'un bus commun réduit les coûts de câblage et unifie la connexion des différents modules. Les principaux avantages de ce système sont le faible coût et la facilité de distribution par câble dans l'ensemble des locaux. L'inconvénient le plus grave du bus commun est sa faible fiabilité : tout défaut du câble ou de l'un des nombreux connecteurs paralyse complètement l'ensemble du réseau. Un autre inconvénient du bus partagé est sa faible performance, puisqu'avec cette méthode de connexion, un seul ordinateur à la fois peut transmettre des données au réseau. Par conséquent, la bande passante du canal de communication est toujours divisée ici entre tous les nœuds du réseau.

La fonction d'un hub est de diriger les informations transmises par un ordinateur vers un ou tous les autres ordinateurs du réseau. Le principal avantage de cette topologie par rapport à un bus commun est une plus grande fiabilité. Tout problème avec le câble n'affecte que l'ordinateur auquel ce câble est connecté, et seul un dysfonctionnement du hub peut faire tomber l'ensemble du réseau. De plus, le hub peut jouer le rôle de filtre intelligent des informations provenant des nœuds du réseau et, si nécessaire, bloquer les transmissions interdites par l'administrateur. Les inconvénients d'une topologie en étoile incluent le coût plus élevé de l'équipement réseau en raison de la nécessité d'acheter un hub. De plus, la possibilité d'augmenter le nombre de nœuds dans le réseau est limitée par le nombre de ports hub. Actuellement, une étoile hiérarchique constitue le type de topologie de connexion le plus courant dans les réseaux locaux et mondiaux.

3. Topologie « en anneau ». Dans les réseaux à topologie en anneau, les données du réseau sont transmises séquentiellement d'une station à l'autre le long de l'anneau, généralement dans un sens :

Si l'ordinateur reconnaît les données comme celles qui lui sont destinées, il les copie dans sa mémoire tampon interne. Dans un réseau à topologie en anneau, il est nécessaire de prendre des mesures particulières pour qu'en cas de panne ou de déconnexion d'une station, le canal de communication entre les stations restantes ne soit pas interrompu. L'avantage de cette topologie est la facilité de gestion, l'inconvénient est la possibilité de panne de l'ensemble du réseau en cas de panne du canal entre deux nœuds.

4. Topologie maillée. La topologie maillée est caractérisée par un schéma de connexion informatique dans lequel des lignes de communication physiques sont établies avec tous les ordinateurs adjacents :

Dans un réseau avec une topologie maillée, seuls les ordinateurs entre lesquels un échange de données intensif a lieu sont directement connectés, et pour l'échange de données entre des ordinateurs qui ne sont pas directement connectés, des transmissions de transit via des nœuds intermédiaires sont utilisées. La topologie maillée permet la connexion d’un grand nombre d’ordinateurs et est typiquement caractéristique des réseaux mondiaux. Les avantages de cette topologie sont sa résistance aux pannes et aux surcharges, car Il existe plusieurs façons de contourner des nœuds individuels.

5. Topologie mixte. Alors que les petits réseaux ont généralement une topologie en étoile, en anneau ou en bus, les grands réseaux ont généralement des connexions aléatoires entre les ordinateurs. Dans de tels réseaux, des sous-réseaux individuels avec une topologie typique peuvent être identifiés, c'est pourquoi on les appelle réseaux à topologie mixte.

Dispersion variable aléatoire est une mesure de la répartition des valeurs de cette quantité. Une faible variance signifie que les valeurs sont regroupées à proximité. Une grande dispersion indique une forte dispersion des valeurs. La notion de variance d'une variable aléatoire est utilisée en statistique. Par exemple, si vous comparez la variance de deux valeurs (par exemple entre des patients de sexe masculin et féminin), vous pouvez tester la signification d'une variable. La variance est également utilisée lors de la création de modèles statistiques, car une faible variance peut être le signe que vous surajustez les valeurs.

Mesures

Calcul de la variance de l'échantillon

  1. Enregistrez les exemples de valeurs. Dans la plupart des cas, les statisticiens n’ont accès qu’à des échantillons de populations spécifiques. Par exemple, en règle générale, les statisticiens n'analysent pas les coûts d'entretien de l'ensemble de toutes les voitures en Russie - ils analysent échantillon aléatoire de plusieurs milliers de voitures. Un tel échantillon aidera à déterminer le coût moyen d'une voiture, mais la valeur résultante sera très probablement loin de la valeur réelle.

    • Par exemple, analysons le nombre de petits pains vendus dans un café sur 6 jours, pris en ordre aléatoire. L'échantillon ressemble à ceci : 17, 15, 23, 7, 9, 13. Il s'agit d'un échantillon, pas d'une population, car nous ne disposons pas de données sur les petits pains vendus pour chaque jour d'ouverture du café.
    • Si vous recevez une population plutôt qu’un échantillon de valeurs, passez à la section suivante.
  2. Écrivez une formule pour calculer la variance de l’échantillon. La dispersion est une mesure de la propagation des valeurs d'une certaine quantité. Comment valeur plus proche dispersion à zéro, plus les valeurs sont regroupées les unes aux autres. Lorsque vous travaillez avec la sélection de valeurs, utilisez la formule suivante pour calculer l'écart :

    • s 2 (\displaystyle s^(2)) = ∑[(x je (\ displaystyle x_ (i))-x̅) 2 (\style d'affichage ^(2))] / (n-1)
    • s 2 (\displaystyle s^(2))– c’est la dispersion. La dispersion est mesurée en unités carrées mesures.
    • x je (\ displaystyle x_ (i))– chaque valeur de l'échantillon.
    • x je (\ displaystyle x_ (i)) vous devez soustraire x̅, le mettre au carré, puis ajouter les résultats.
    • x̅ – moyenne de l’échantillon (moyenne de l’échantillon).
    • n – nombre de valeurs dans l'échantillon.
  3. Calculer la moyenne des échantillons. Il est noté x̅. La moyenne de l'échantillon est calculée comme une simple moyenne arithmétique : additionnez toutes les valeurs de l'échantillon, puis divisez le résultat par le nombre de valeurs de l'échantillon.

    • Dans notre exemple, additionnez les valeurs de l'échantillon : 15 + 17 + 23 + 7 + 9 + 13 = 84
      Divisez maintenant le résultat par le nombre de valeurs dans l'échantillon (dans notre exemple il y en a 6) : 84 ÷ 6 = 14.
      Moyenne de l'échantillon x̅ = 14.
    • La moyenne de l'échantillon est la valeur centrale autour de laquelle les valeurs de l'échantillon sont distribuées. Si les valeurs de l'échantillon se regroupent autour de la moyenne de l'échantillon, alors la variance est faible ; sinon, la variance est grande.
  4. Soustrayez la moyenne de l’échantillon de chaque valeur de l’échantillon. Calculons maintenant la différence x je (\ displaystyle x_ (i))- x̅, où x je (\ displaystyle x_ (i))– chaque valeur de l'échantillon. Chaque résultat obtenu indique le degré d'écart d'une valeur particulière par rapport à la moyenne de l'échantillon, c'est-à-dire la distance entre cette valeur et la moyenne de l'échantillon.

    • Dans notre exemple :
      x 1 (\style d'affichage x_(1))- x = 17 - 14 = 3
      x 2 (\displaystyle x_(2))- x = 15 - 14 = 1
      x 3 (\style d'affichage x_(3))- x = 23 - 14 = 9
      x 4 (\style d'affichage x_(4))- x̅ = 7 - 14 = -7
      x 5 (\style d'affichage x_(5))- x̅ = 9 - 14 = -5
      x 6 (\style d'affichage x_(6))- x̅ = 13 - 14 = -1
    • L'exactitude des résultats obtenus est facile à vérifier, puisque leur somme doit être égale à zéro. Ceci est lié à la détermination de la valeur moyenne, puisque valeurs négatives(distances de la moyenne à valeurs inférieures) sont entièrement indemnisés valeurs positives(distances des valeurs moyennes aux valeurs élevées).
  5. Comme indiqué ci-dessus, la somme des différences x je (\ displaystyle x_ (i))- x̅ doit être égal à zéro. Cela signifie que écart moyen est toujours égal à zéro, ce qui ne donne aucune idée de la répartition des valeurs d'une certaine quantité. Pour résoudre ce problème, mettez au carré chaque différence x je (\ displaystyle x_ (i))- x̅. Vous obtiendrez ainsi uniquement des nombres positifs, dont la somme ne sera jamais égale à 0.

    • Dans notre exemple :
      (x 1 (\style d'affichage x_(1))-x̅) 2 = 3 2 = 9 (\displaystyle ^(2)=3^(2)=9)
      (x 2 (\displaystyle (x_(2))-x̅) 2 = 1 2 = 1 (\displaystyle ^(2)=1^(2)=1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Vous avez trouvé le carré de la différence - x̅) 2 (\style d'affichage ^(2)) pour chaque valeur de l’échantillon.
  6. Calculez la somme des carrés des différences. Autrement dit, trouvez la partie de la formule qui s'écrit comme ceci : ∑[( x je (\ displaystyle x_ (i))-x̅) 2 (\style d'affichage ^(2))]. Ici, le signe Σ signifie la somme des carrés des différences pour chaque valeur x je (\ displaystyle x_ (i)) dans l'échantillon. Vous avez déjà trouvé les carrés des différences (x je (\displaystyle (x_(i))-x̅) 2 (\style d'affichage ^(2)) pour chaque valeur x je (\ displaystyle x_ (i)) dans l'échantillon ; maintenant, ajoutez simplement ces carrés.

    • Dans notre exemple : 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Divisez le résultat par n - 1, où n est le nombre de valeurs dans l'échantillon. Il y a quelque temps, pour calculer la variance d’un échantillon, les statisticiens divisaient simplement le résultat par n ; dans ce cas, vous obtiendrez la moyenne de la variance au carré, ce qui est idéal pour décrire la variance d'un échantillon donné. Mais rappelez-vous que tout échantillon n'est qu'une petite partie population valeurs. Si vous prenez un autre échantillon et effectuez les mêmes calculs, vous obtiendrez un résultat différent. Il s'avère que diviser par n - 1 (plutôt que par n) donne une estimation plus précise de la variance de la population, ce qui vous intéresse. La division par n – 1 est devenue courante, elle est donc incluse dans la formule de calcul de la variance de l’échantillon.

    • Dans notre exemple, l'échantillon comprend 6 valeurs, soit n = 6.
      Variance de l'échantillon = s 2 = 166 6 − 1 = (\displaystyle s^(2)=(\frac (166)(6-1))=) 33,2
  8. La différence entre la variance et l'écart type. Notez que la formule contient un exposant, la dispersion est donc mesurée en unités carrées de la valeur analysée. Parfois, une telle ampleur est assez difficile à exploiter ; dans de tels cas, utilisez l’écart type, qui est égal à racine carrée de la dispersion. C'est pourquoi la variance de l'échantillon est notée s 2 (\displaystyle s^(2)), UN écart typeéchantillons - comment s (style d'affichage s).

    • Dans notre exemple, l'écart type de l'échantillon est : s = √33,2 = 5,76.

    Calcul de la variance de la population

    1. Analysez un ensemble de valeurs. L'ensemble comprend toutes les valeurs de la quantité considérée. Par exemple, si vous étudiez l'âge des résidents Région de Léningrad, alors la population comprend l'âge de tous les résidents de cette zone. Lorsqu'on travaille avec une population, il est recommandé créer un tableau et ajoutez-y les valeurs de la totalité. Prenons l'exemple suivant :

      • Dans une certaine pièce, il y a 6 aquariums. Chaque aquarium contient le nombre de poissons suivant :
        x 1 = 5 (\displaystyle x_(1)=5)
        x 2 = 5 (\displaystyle x_(2)=5)
        x 3 = 8 (\displaystyle x_(3)=8)
        x 4 = 12 (\displaystyle x_(4)=12)
        x 5 = 15 (\displaystyle x_(5)=15)
        x 6 = 18 (\displaystyle x_(6)=18)
    2. Écrivez une formule pour calculer la variance de la population. Puisque la totalité comprend toutes les valeurs d'une certaine quantité, la formule ci-dessous permet d'obtenir valeur exacte les écarts de population. Pour distinguer la variance de la population de la variance de l'échantillon (qui n'est qu'une estimation), les statisticiens utilisent diverses variables :

      • σ 2 (\style d'affichage ^(2)) = (∑(x je (\ displaystyle x_ (i)) - μ) 2 (\style d'affichage ^(2)))/n
      • σ 2 (\style d'affichage ^(2))– la dispersion de la population (lire « sigma au carré »). La dispersion est mesurée en unités carrées.
      • x je (\ displaystyle x_ (i))– chaque valeur dans son intégralité.
      • Σ – signe somme. Autrement dit, à partir de chaque valeur x je (\ displaystyle x_ (i)) vous devez soustraire μ, le mettre au carré, puis ajouter les résultats.
      • μ – moyenne de la population.
      • n – nombre de valeurs dans la population.
    3. Calculez la moyenne de la population. Lorsque l’on travaille avec une population, sa moyenne est notée μ (mu). La moyenne de la population est calculée comme une moyenne arithmétique simple : additionnez toutes les valeurs de la population, puis divisez le résultat par le nombre de valeurs de la population.

      • Gardez à l’esprit que les moyennes ne sont pas toujours calculées comme moyenne arithmétique.
      • Dans notre exemple, la moyenne de la population : μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\displaystyle (\frac (5+5+8+12+15+18)(6))) = 10,5
    4. Soustrayez la moyenne de la population de chaque valeur de la population. Plus la différence est proche de zéro, plus signification spécifiqueà la moyenne de la population. Trouvez la différence entre chaque valeur de la population et sa moyenne, et vous aurez une première idée de la distribution des valeurs.

      • Dans notre exemple :
        x 1 (\style d'affichage x_(1))- µ = 5 - 10,5 = -5,5
        x 2 (\displaystyle x_(2))- µ = 5 - 10,5 = -5,5
        x 3 (\style d'affichage x_(3))- µ = 8 - 10,5 = -2,5
        x 4 (\style d'affichage x_(4))- µ = 12 - 10,5 = 1,5
        x 5 (\style d'affichage x_(5))- µ = 15 - 10,5 = 4,5
        x 6 (\style d'affichage x_(6))- µ = 18 - 10,5 = 7,5
    5. Mettez au carré chaque résultat obtenu. Les valeurs de différence seront à la fois positives et négatives ; Si ces valeurs sont tracées sur une droite numérique, elles se situeront à droite et à gauche de la moyenne de la population. Cela ne convient pas au calcul de la variance, car les valeurs positives et positives nombres négatifs se compenser. Mettez donc au carré chaque différence pour obtenir des nombres exclusivement positifs.

      • Dans notre exemple :
        (x je (\ displaystyle x_ (i)) - μ) 2 (\style d'affichage ^(2)) pour chaque valeur de population (de i = 1 à i = 6) :
        (-5,5)2 (\style d'affichage ^(2)) = 30,25
        (-5,5)2 (\style d'affichage ^(2)), Où x n (\style d'affichage x_(n))dernière valeur dans la population générale.
      • Pour calculer la valeur moyenne des résultats obtenus, il faut trouver leur somme et la diviser par n :(( x 1 (\style d'affichage x_(1)) - μ) 2 (\style d'affichage ^(2)) + (x 2 (\displaystyle x_(2)) - μ) 2 (\style d'affichage ^(2)) + ... + (x n (\style d'affichage x_(n)) - μ) 2 (\style d'affichage ^(2)))/n
      • Écrivons maintenant l'explication ci-dessus en utilisant des variables : (∑( x je (\ displaystyle x_ (i)) - μ) 2 (\style d'affichage ^(2))) / n et obtenez une formule pour calculer la variance de la population.

.

À l’inverse, si est un a.e non négatif. fonctionner de telle sorte que , alors il existe une mesure de probabilité absolument continue sur telle que c'est sa densité.

    Remplacement de la mesure dans l'intégrale de Lebesgue :

,

où est toute fonction Borel intégrable par rapport à la mesure de probabilité.

Dispersion, types et propriétés de dispersion Le concept de dispersion

Dispersion dans les statistiques se trouve comme l'écart type des valeurs individuelles de la caractéristique au carré de la moyenne arithmétique. En fonction des données initiales, elle est déterminée à l'aide des formules de variance simples et pondérées :

1. Variation simple(pour les données non groupées) est calculé à l'aide de la formule :

2. Variance pondérée (pour les séries de variations) :

où n est la fréquence (répétabilité du facteur X)

Un exemple de recherche de variance

Cette page décrit un exemple standard de recherche de variance, vous pouvez également examiner d'autres problèmes pour la trouver.

Exemple 1. Définition de groupe, moyenne de groupe, intergroupe et écart total

Exemple 2. Recherche de la variance et du coefficient de variation dans un tableau de regroupement

Exemple 3. Trouver la variance dans une série discrète

Exemple 4. Les données suivantes sont disponibles pour un groupe de 20 étudiants service de correspondance. Il faut construire série d'intervalles distribution d'une caractéristique, calculer la valeur moyenne de la caractéristique et étudier sa variance

Construisons un regroupement d'intervalles. Déterminons la plage de l'intervalle à l'aide de la formule :

où X max– valeur maximale fonction de regroupement ; X min – valeur minimale de la caractéristique de regroupement ; n – nombre d'intervalles :

Nous acceptons n=5. Le pas est : h = (192 - 159)/ 5 = 6,6

Créons un regroupement d'intervalles

Pour d'autres calculs, nous construirons un tableau auxiliaire :

X"i – le milieu de l'intervalle. (par exemple, le milieu de l'intervalle 159 – 165,6 = 162,3)

Nous déterminons la taille moyenne des élèves à l'aide de la formule de moyenne arithmétique pondérée :

Déterminons la variance à l'aide de la formule :

La formule peut être transformée comme ceci :

De cette formule il résulte que la variance est égale à la différence entre la moyenne des carrés des options et le carré et la moyenne.

Variation dans série de variations à intervalles égaux en utilisant la méthode des moments peut être calculé de la manière suivante en utilisant la deuxième propriété de dispersion (en divisant toutes les options par la valeur de l'intervalle). Détermination de l'écart, calculé selon la méthode des moments, la formule suivante est moins laborieuse :

où i est la valeur de l'intervalle ; A est un zéro conventionnel, pour lequel il convient d'utiliser le milieu de l'intervalle de fréquence la plus élevée ; m1 est le carré du moment du premier ordre ; m2 - moment du deuxième ordre

Variance des traits alternatifs (si dans une population statistique une caractéristique change de telle manière qu'il n'y a que deux options mutuellement exclusives, alors cette variabilité est appelée alternative) peut être calculée à l'aide de la formule :

Remplacer dans cette formule variance q =1- p, on obtient :

Types de variance

Écart total mesure la variation d’une caractéristique dans l’ensemble de la population sous l’influence de tous les facteurs qui provoquent cette variation. Il est égal au carré moyen des écarts valeurs individuelles caractéristique x à partir de la valeur moyenne globale de x et peut être définie comme écart simple ou variance pondérée.

Variation au sein du groupe caractérise la variation aléatoire, c'est-à-dire partie de la variation qui est due à l'influence de facteurs non pris en compte et ne dépend pas de l'attribut facteur qui constitue la base du groupe. Une telle dispersion est égale au carré moyen des écarts des valeurs individuelles de l'attribut au sein du groupe X par rapport à la moyenne arithmétique du groupe et peut être calculée comme une dispersion simple ou comme une dispersion pondérée.

Ainsi, mesures de variance au sein du groupe variation d'un trait au sein d'un groupe et est déterminé par la formule :

où xi est la moyenne du groupe ; ni est le nombre d'unités dans le groupe.

Par exemple, les variances intragroupe qui doivent être déterminées dans le cadre de l'étude de l'influence des qualifications des travailleurs sur le niveau de productivité du travail dans un atelier montrent des variations de production dans chaque groupe causées par tous les facteurs possibles (état technique de l'équipement, disponibilité des équipements). outils et matériaux, âge des travailleurs, intensité de travail, etc.), à l'exception des différences de catégorie de qualification (au sein d'un groupe, tous les travailleurs ont les mêmes qualifications).

La moyenne des variances au sein d'un groupe reflète la variation aléatoire, c'est-à-dire la partie de la variation qui s'est produite sous l'influence de tous les autres facteurs, à l'exception du facteur de regroupement. Il est calculé à l'aide de la formule :

Variance intergroupe caractérise la variation systématique de la caractéristique résultante, qui est due à l'influence du facteur-attribut qui constitue la base du groupe. Il est égal au carré moyen des écarts des moyennes de groupe par rapport à la moyenne globale. La variance intergroupe est calculée à l'aide de la formule :



Avez-vous aimé l'article? Partagez avec vos amis !