Comment calculer l'intervalle de confiance de 95. Intervalle de confiance pour estimer la moyenne (la variance est connue) dans MS EXCEL

Intervalle de confiance pour l'espérance mathématique - il s'agit d'un intervalle calculé à partir de données qui, avec une probabilité connue, contiennent l'espérance mathématique de la population générale. Une estimation naturelle de l'espérance mathématique est la moyenne arithmétique de ses valeurs observées. Par conséquent, tout au long de la leçon, nous utiliserons les termes « moyenne » et « valeur moyenne ». Dans les problèmes de calcul d'un intervalle de confiance, une réponse la plus souvent requise est quelque chose comme « L'intervalle de confiance de la moyenne [valeur dans un problème particulier] va de [valeur plus petite] à [valeur plus grande] ». À l'aide d'un intervalle de confiance, vous pouvez évaluer non seulement les valeurs moyennes, mais également la proportion d'une caractéristique particulière dans la population générale. Les valeurs moyennes, la dispersion, l'écart type et l'erreur, grâce auxquels nous arriverons à de nouvelles définitions et formules, sont abordés dans la leçon. Caractéristiques de l'échantillon et de la population .

Estimations ponctuelles et par intervalles de la moyenne

Si la valeur moyenne de la population est estimée par un nombre (point), alors une moyenne spécifique, calculée à partir d'un échantillon d'observations, est considérée comme une estimation de la valeur moyenne inconnue de la population. Dans ce cas, la valeur de la moyenne de l’échantillon – une variable aléatoire – ne coïncide pas avec la valeur moyenne de la population générale. Par conséquent, lorsque vous indiquez la moyenne de l’échantillon, vous devez simultanément indiquer l’erreur d’échantillonnage. La mesure de l’erreur d’échantillonnage est l’erreur type, qui est exprimée dans les mêmes unités que la moyenne. Par conséquent, la notation suivante est souvent utilisée : .

Si l'estimation de la moyenne doit être associée à une certaine probabilité, alors le paramètre d'intérêt dans la population doit être estimé non pas par un nombre, mais par un intervalle. Un intervalle de confiance est un intervalle dans lequel, avec une certaine probabilité P. la valeur de l'indicateur de population estimé est trouvée. Intervalle de confiance dans lequel il est probable P. = 1 - α on trouve la variable aléatoire, calculée comme suit :

,

α = 1 - P., que l’on peut trouver en annexe de presque tous les livres de statistiques.

En pratique, la moyenne et la variance de la population ne sont pas connues, donc la variance de la population est remplacée par la variance de l'échantillon et la moyenne de la population par la moyenne de l'échantillon. Ainsi, l'intervalle de confiance est dans la plupart des cas calculé comme suit :

.

La formule de l'intervalle de confiance peut être utilisée pour estimer la moyenne de la population si

  • l'écart type de la population est connu ;
  • ou l'écart type de la population est inconnu, mais la taille de l'échantillon est supérieure à 30.

La moyenne de l'échantillon est une estimation impartiale de la moyenne de la population. À son tour, la variance de l'échantillon n’est pas une estimation impartiale de la variance de la population. Pour obtenir une estimation impartiale de la variance de la population dans la formule de variance de l'échantillon, la taille de l'échantillon n devrait être remplacé par n-1.

Exemple 1. Des informations ont été recueillies auprès de 100 cafés sélectionnés au hasard dans une certaine ville, selon lesquelles le nombre moyen d'employés est de 10,5 avec un écart type de 4,6. Déterminez l'intervalle de confiance à 95 % pour le nombre d'employés du café.

où est la valeur critique de la distribution normale standard pour le niveau de signification α = 0,05 .

Ainsi, l'intervalle de confiance à 95 % pour le nombre moyen d'employés de café variait entre 9,6 et 11,4.

Exemple 2. Pour un échantillon aléatoire d'une population de 64 observations, les valeurs totales suivantes ont été calculées :

somme des valeurs dans les observations,

somme des carrés des écarts des valeurs par rapport à la moyenne .

Calculez l’intervalle de confiance à 95 % pour l’espérance mathématique.

Calculons l'écart type :

,

Calculons la valeur moyenne :

.

Nous substituons les valeurs dans l'expression de l'intervalle de confiance :

où est la valeur critique de la distribution normale standard pour le niveau de signification α = 0,05 .

On obtient :

Ainsi, l'intervalle de confiance à 95 % pour l'espérance mathématique de cet échantillon variait de 7,484 à 11,266.

Exemple 3. Pour un échantillon de population aléatoire de 100 observations, la moyenne calculée est de 15,2 et l'écart type est de 3,2. Calculez l'intervalle de confiance à 95 % pour la valeur attendue, puis l'intervalle de confiance à 99 %. Si la puissance de l’échantillon et sa variation restent inchangées et que le coefficient de confiance augmente, l’intervalle de confiance se rétrécira-t-il ou s’élargira-t-il ?

Nous substituons ces valeurs dans l'expression de l'intervalle de confiance :

où est la valeur critique de la distribution normale standard pour le niveau de signification α = 0,05 .

On obtient :

.

Ainsi, l'intervalle de confiance à 95 % pour la moyenne de cet échantillon variait entre 14,57 et 15,82.

Nous substituons à nouveau ces valeurs dans l'expression de l'intervalle de confiance :

où est la valeur critique de la distribution normale standard pour le niveau de signification α = 0,01 .

On obtient :

.

Ainsi, l'intervalle de confiance à 99 % pour la moyenne de cet échantillon variait de 14,37 à 16,02.

Comme nous le voyons, à mesure que le coefficient de confiance augmente, la valeur critique de la distribution normale standard augmente également et, par conséquent, les points de début et de fin de l'intervalle sont situés plus loin de la moyenne, et donc l'intervalle de confiance pour l'espérance mathématique augmente .

Estimations ponctuelles et d'intervalles de la gravité spécifique

La part de certains attributs de l'échantillon peut être interprétée comme une estimation ponctuelle de la part p la même caractéristique dans la population générale. Si cette valeur doit être associée à une probabilité, alors l'intervalle de confiance de la densité doit être calculé p caractéristique dans la population avec probabilité P. = 1 - α :

.

Exemple 4. Dans certaines villes, il y a deux candidats UN Et B sont candidats à la mairie. 200 habitants de la ville ont été interrogés au hasard, dont 46 % ont répondu qu'ils voteraient pour le candidat UN, 26% - pour le candidat B et 28 % ne savent pas pour qui ils voteront. Déterminer l'intervalle de confiance de 95 % pour la proportion d'habitants de la ville soutenant le candidat UN.

Cet article décrit la syntaxe de la formule et l'utilisation des fonctions CONFIANCE dans Microsoft Excel.

Description

Renvoie l'intervalle de confiance pour une moyenne de population normalement distribuée.

Un intervalle de confiance est une plage de valeurs. La moyenne de l'échantillon x est le point médian de cette plage, donc l'intervalle de confiance est défini comme x ± CONFIANCE. Par exemple, si x est la moyenne d’échantillon des délais de livraison des produits vendus par correspondance, alors les attentes de la population se situent dans l’intervalle x ± CONFIANCE. Pour toute valeur de l’espérance de population μ0 dans cet intervalle, la probabilité que la moyenne de l’échantillon diffère de μ0 de plus de x dépasse le niveau de signification alpha. Pour toute attente μ0 en dehors de cet intervalle, la probabilité que la moyenne de l’échantillon diffère de μ0 de plus de x ne dépasse pas le niveau de signification alpha. Par exemple, supposons que, étant donné la moyenne de l'échantillon x, l'écart type de la population et la taille de l'échantillon, vous souhaitiez créer un test à deux échantillons au niveau de signification alpha pour tester l'hypothèse selon laquelle la valeur attendue est μ0. Dans ce cas, l’hypothèse n’est pas rejetée si μ0 appartient à l’intervalle de confiance, et est rejetée si μ0 n’y appartient pas. L'intervalle de confiance ne permet pas de supposer qu'avec une probabilité (1 - alpha) le délai de livraison du prochain colis se situera dans l'intervalle de confiance.

Important: Cette fonctionnalité a été remplacée par une ou plusieurs nouvelles fonctionnalités offrant une plus grande précision et portant des noms qui reflètent mieux leur objectif. Bien que cette fonctionnalité soit toujours utilisée à des fins de compatibilité descendante, elle pourrait ne plus être disponible dans les futures versions d'Excel. Nous vous recommandons donc d'utiliser les nouvelles fonctionnalités.

Pour en savoir plus sur les nouvelles fonctions, voir Fonction CONFIDENCE NORM et Fonction CONFIDENCE STUDENT.

Syntaxe

CONFIANCE(alpha, standard_off, taille)

Les arguments de la fonction TRUST sont décrits ci-dessous.

    Alpha- argument requis. Le niveau de signification utilisé pour calculer le niveau de confiance. Le niveau de confiance est de 100*(1 - alpha) pour cent, ou en d’autres termes, une valeur alpha de 0,05 correspond à un niveau de confiance de 95 pour cent.

    Standard_off- argument requis. L’écart type de la population pour une plage de données est supposé connu.

    Taille- argument requis. Taille de l'échantillon.

Remarques

Exemple

Copiez les exemples de données du tableau suivant et collez-les dans la cellule A1 d'une nouvelle feuille de calcul Excel. Pour afficher les résultats des formules, sélectionnez-les et appuyez sur F2, puis appuyez sur Entrée. Si nécessaire, modifiez la largeur des colonnes pour voir toutes les données.

L’intelligence ne consiste pas seulement en connaissances, mais aussi en capacité à appliquer les connaissances dans la pratique. (Aristote)

Intervalles de confiance

Aperçu général

En prenant un échantillon de la population, nous obtenons une estimation ponctuelle du paramètre d'intérêt et calculons l'erreur type pour indiquer la précision de l'estimation.

Cependant, dans la plupart des cas, l’erreur type en tant que telle n’est pas acceptable. Il est beaucoup plus utile de combiner cette mesure de précision avec une estimation d'intervalle pour le paramètre de population.

Cela peut être fait en utilisant la connaissance de la distribution de probabilité théorique de la statistique d'échantillon (paramètre) afin de calculer un intervalle de confiance (CI - Confidence Interval, CI - Confidence Interval) pour le paramètre.

En général, un intervalle de confiance étend les estimations dans les deux sens d'un certain multiple de l'erreur type (d'un paramètre donné) ; les deux valeurs (limites de confiance) définissant l'intervalle sont généralement séparées par une virgule et mises entre parenthèses.

Intervalle de confiance pour la moyenne

Utilisation de la distribution normale

La moyenne de l'échantillon est normalement distribuée si la taille de l'échantillon est grande, vous pouvez donc appliquer la connaissance de la distribution normale lors de l'examen de la moyenne de l'échantillon.

Plus précisément, 95 % de la distribution des moyennes de l’échantillon se situe à moins de 1,96 écart-type (ET) de la moyenne de la population.

Lorsque nous n’avons qu’un seul échantillon, nous l’appelons l’erreur type de la moyenne (SEM) et calculons l’intervalle de confiance à 95 % pour la moyenne comme suit :

Si nous répétons cette expérience plusieurs fois, l’intervalle contiendra la véritable moyenne de la population dans 95 % des cas.

Il s'agit généralement d'un intervalle de confiance, tel que l'intervalle de valeurs dans lequel se situe la véritable moyenne de la population (moyenne générale) avec une probabilité de confiance de 95 %.

Bien qu’il ne soit pas entièrement rigoureux (la moyenne de la population est une valeur fixe et ne peut donc pas être associée à une probabilité) d’interpréter un intervalle de confiance de cette façon, il est conceptuellement plus facile à comprendre.

Usage t- distribution

Vous pouvez utiliser la distribution normale si vous connaissez la valeur de la variance dans la population. De plus, lorsque la taille de l’échantillon est petite, la moyenne de l’échantillon suit une distribution normale si les données de population sous-jacentes sont normalement distribuées.

Si les données sous-jacentes à la population ne sont pas distribuées normalement et/ou si la variance de la population est inconnue, la moyenne de l'échantillon obéit Distribution t de Student.

Nous calculons l’intervalle de confiance à 95 % pour la moyenne de la population générale comme suit :

Où est le point de pourcentage (centile) t- Distribution t de Student avec (n-1) degrés de liberté, ce qui donne une probabilité bilatérale de 0,05.

En général, elle offre une plage plus large que l'utilisation de la distribution normale, car elle prend en compte l'incertitude supplémentaire introduite par l'estimation de l'écart type de la population et/ou en raison de la petite taille de l'échantillon.

Lorsque la taille de l'échantillon est grande (de l'ordre de 100 ou plus), la différence entre les deux distributions ( t-Étudiant et normal) est insignifiant. Cependant, ils utilisent toujours t- distribution lors du calcul des intervalles de confiance, même si la taille de l’échantillon est grande.

Généralement, l'IC à 95 % est indiqué. D'autres intervalles de confiance peuvent être calculés, comme l'IC à 99 % pour la moyenne.

Au lieu du produit de l'erreur standard et de la valeur du tableau t- distribution, qui correspond à une probabilité bilatérale de 0,05, multipliez-la (erreur type) par la valeur qui correspond à une probabilité bilatérale de 0,01. Il s’agit d’un intervalle de confiance plus large que l’intervalle de confiance de 95 %, car il reflète une confiance accrue dans le fait que l’intervalle inclut réellement la moyenne de la population.

Intervalle de confiance pour la proportion

La distribution d'échantillonnage des proportions a une distribution binomiale. Cependant, si la taille de l'échantillon n est raisonnablement grande, alors la distribution d'échantillonnage de la proportion est approximativement normale avec la moyenne .

Nous évaluons par rapport sélectif p=r/n(Où r- le nombre d'individus dans l'échantillon présentant les traits caractéristiques qui nous intéressent), et l'erreur type est estimée :

L'intervalle de confiance à 95 % pour la proportion est estimé :

Si la taille de l'échantillon est petite (généralement lorsque n.p. ou n(1-p) moins 5 ), il est alors nécessaire d'utiliser la distribution binomiale afin de calculer des intervalles de confiance précis.

Notez que si p exprimé en pourcentage, alors (1 pièce) remplacé par (100-p).

Interprétation des intervalles de confiance

Lors de l’interprétation d’un intervalle de confiance, nous nous intéressons aux questions suivantes :

Quelle est la largeur de l’intervalle de confiance ?

Un intervalle de confiance large indique que l’estimation est imprécise ; étroit indique une estimation précise.

La largeur de l'intervalle de confiance dépend de la taille de l'erreur type, qui à son tour dépend de la taille de l'échantillon et, lorsqu'on considère une variable numérique, la variabilité des données produit des intervalles de confiance plus larges que les études portant sur un vaste ensemble de données comportant peu de variables. .

Le CI inclut-il des valeurs particulièrement intéressantes ?

Vous pouvez vérifier si la valeur probable d'un paramètre de population se situe dans l'intervalle de confiance. Si tel est le cas, les résultats sont cohérents avec cette valeur probable. Dans le cas contraire, il est peu probable (pour un intervalle de confiance de 95 %, la probabilité est de près de 5 %) que le paramètre ait cette valeur.

Et d'autres. Tous sont des estimations de leurs analogues théoriques, qui pourraient être obtenues si ce n'était pas un échantillon, mais une population générale. Mais hélas, la population en général coûte très cher et est souvent inaccessible.

Le concept d'estimation d'intervalle

Toute estimation par échantillon comporte une certaine dispersion, car est une variable aléatoire dépendant des valeurs d'un échantillon particulier. Par conséquent, pour obtenir des conclusions statistiques plus fiables, il convient de connaître non seulement l'estimation ponctuelle, mais également l'intervalle qui, avec une forte probabilité γ (gamma) couvre l’indicateur évalué θ (thêta).

Formellement, ce sont deux de ces valeurs (statistiques) T1 (X) Et T2 (X), Quoi T1< T 2 , pour lequel à un niveau de probabilité donné γ la condition est remplie :

Bref, il est probable γ ou plus le véritable indicateur est entre les points T1 (X) Et T2 (X), appelées limites inférieure et supérieure intervalle de confiance.

L'une des conditions de construction des intervalles de confiance est leur étroitesse maximale, c'est-à-dire il doit être le plus court possible. L'envie est tout à fait naturelle, car... le chercheur tente de localiser plus précisément l'emplacement du paramètre souhaité.

Il s'ensuit que l'intervalle de confiance doit couvrir les probabilités maximales de la distribution. et l'évaluation elle-même devrait être au centre.

Autrement dit, la probabilité d'un écart (du véritable indicateur par rapport à l'estimation) vers le haut est égale à la probabilité d'un écart vers le bas. Il convient également de noter que pour les distributions asymétriques, l'intervalle de droite n'est pas égal à l'intervalle de gauche.

La figure ci-dessus montre clairement que plus la probabilité de confiance est grande, plus l'intervalle est large – une relation directe.

Il s'agissait d'une brève introduction à la théorie de l'estimation par intervalles de paramètres inconnus. Passons à la recherche des limites de confiance pour l'espérance mathématique.

Intervalle de confiance pour l'espérance mathématique

Si les données originales sont réparties sur , alors la moyenne sera une valeur normale. Cela découle de la règle selon laquelle une combinaison linéaire de valeurs normales a également une distribution normale. Par conséquent, pour calculer les probabilités, nous pourrions utiliser l’appareil mathématique de la loi de distribution normale.

Cependant, cela nécessitera de connaître deux paramètres : l’espérance et la variance, qui sont généralement inconnus. Vous pouvez bien sûr utiliser des estimations à la place des paramètres (moyenne arithmétique et ), mais alors la distribution de la moyenne ne sera pas tout à fait normale, elle sera légèrement aplatie vers le bas. Ce fait a été intelligemment noté par le citoyen irlandais William Gosset, publiant sa découverte dans le numéro de mars 1908 de la revue Biometrica. Pour des raisons de secret, Gosset s'est signé Étudiant. C'est ainsi qu'est apparue la distribution t de Student.

Cependant, la distribution normale des données, utilisée par K. Gauss pour analyser les erreurs dans les observations astronomiques, est extrêmement rare dans la vie terrestre et assez difficile à établir (environ 2 000 observations sont nécessaires pour une grande précision). Par conséquent, il est préférable d’abandonner l’hypothèse de normalité et d’utiliser des méthodes qui ne dépendent pas de la distribution des données originales.

La question se pose : quelle est la distribution de la moyenne arithmétique si elle est calculée à partir des données d'une distribution inconnue ? La réponse est donnée par la théorie bien connue des probabilités Théorème central limite(CPT). Il en existe plusieurs variantes en mathématiques (les formulations ont été affinées au fil des années), mais toutes, grosso modo, se résument à l'affirmation selon laquelle la somme d'un grand nombre de variables aléatoires indépendantes obéit à une loi de distribution normale.

Lors du calcul de la moyenne arithmétique, la somme des variables aléatoires est utilisée. De là, il s'avère que la moyenne arithmétique a une distribution normale, dans laquelle l'espérance est l'espérance des données originales et la variance est .

Les gens intelligents savent comment prouver le CLT, mais nous le vérifierons à l'aide d'une expérience menée dans Excel. Simulons un échantillon de 50 variables aléatoires uniformément distribuées (en utilisant la fonction Excel RANDBETWEEN). Ensuite, nous réaliserons 1 000 échantillons de ce type et calculerons la moyenne arithmétique pour chacun. Regardons leur distribution.

On constate que la distribution de la moyenne est proche de la loi normale. Si la taille et le nombre de l’échantillon sont encore plus grands, la similarité sera encore meilleure.

Maintenant que nous avons vu de nos propres yeux la validité du CLT, nous pouvons, à l'aide de , calculer des intervalles de confiance pour la moyenne arithmétique, qui couvrent la vraie moyenne ou l'espérance mathématique avec une probabilité donnée.

Pour établir les limites supérieure et inférieure, vous devez connaître les paramètres de la distribution normale. En règle générale, il n'y en a pas, c'est pourquoi des estimations sont utilisées : moyenne arithmétique Et variance de l'échantillon. Je le répète, cette méthode ne donne une bonne approximation qu'avec de grands échantillons. Lorsque les échantillons sont petits, il est souvent recommandé d’utiliser la distribution Student. N'y croyez pas ! La distribution de Student pour la moyenne se produit uniquement lorsque les données d'origine sont distribuées normalement, c'est-à-dire presque jamais. Par conséquent, il est préférable de fixer immédiatement une limite minimale sur la quantité de données requises et d'utiliser des méthodes asymptotiquement correctes. On dit que 30 observations suffisent. Prenez-en 50, vous ne vous tromperez pas.

T1.2– limites inférieure et supérieure de l’intervalle de confiance

– exemple de moyenne arithmétique

s 0– écart type de l’échantillon (impartial)

n – taille de l'échantillon

γ – probabilité de confiance (généralement égale à 0,9, 0,95 ou 0,99)

c γ =Φ -1 ((1+γ)/2)– la valeur inverse de la fonction de distribution normale standard. En termes simples, il s'agit du nombre d'erreurs types depuis la moyenne arithmétique jusqu'à la limite inférieure ou supérieure (ces trois probabilités correspondent aux valeurs de 1,64, 1,96 et 2,58).

L'essence de la formule est que la moyenne arithmétique est prise, puis un certain montant en est mis de côté ( avec γ) erreurs types ( s 0 /√n). Tout est connu, prenez-le et réfléchissez-y.

Avant l'utilisation généralisée des ordinateurs personnels, ils obtenaient les valeurs de la fonction de distribution normale et de son inverse. Ils sont encore utilisés aujourd'hui, mais il est plus efficace d'utiliser des formules Excel toutes faites. Tous les éléments de la formule ci-dessus ( , et ) peuvent être facilement calculés dans Excel. Mais il existe une formule toute faite pour calculer l'intervalle de confiance - NORME DE CONFIANCE. Sa syntaxe est la suivante.

CONFIDENCE.NORM(alpha;standard_off;size)

alpha– le niveau de signification ou niveau de confiance, qui dans la notation adoptée ci-dessus est égal à 1- γ, soit la probabilité que le résultat mathématiquel'espérance sera en dehors de l'intervalle de confiance. Avec un niveau de confiance de 0,95, l'alpha est de 0,05, etc.

standard_off– écart type des données de l'échantillon. Il n'est pas nécessaire de calculer l'erreur type ; Excel lui-même divisera par la racine de n.

taille– taille de l'échantillon (n).

Le résultat de la fonction CONFIDENCE NORM est le deuxième terme de la formule de calcul de l'intervalle de confiance, c'est-à-dire demi-intervalle En conséquence, les points inférieur et supérieur sont la moyenne ± la valeur obtenue.

Ainsi, il est possible de construire un algorithme universel de calcul des intervalles de confiance pour la moyenne arithmétique, qui ne dépend pas de la distribution des données d'origine. Le prix de l’universalité est sa nature asymptotique, c’est-à-dire la nécessité d'utiliser des échantillons relativement grands. Cependant, à l’ère de la technologie moderne, il n’est généralement pas difficile de collecter la quantité de données requise.

Tester des hypothèses statistiques à l’aide d’intervalles de confiance

(module 111)

L'un des principaux problèmes résolus dans les statistiques est. Son essence est brièvement la suivante. On suppose par exemple que les attentes de la population générale sont égales à une certaine valeur. Ensuite, la distribution des moyennes d'échantillon pouvant être observées pour une attente donnée est construite. Ensuite, ils examinent où se situe la moyenne réelle dans cette distribution conditionnelle. Si cela dépasse les limites admissibles, l'apparition d'une telle moyenne est très improbable et, avec une seule répétition de l'expérience, elle est presque impossible, ce qui contredit l'hypothèse avancée, qui a été rejetée avec succès. Si la moyenne ne dépasse pas le niveau critique, alors l'hypothèse n'est pas rejetée (mais pas non plus prouvée !).

Ainsi, à l’aide d’intervalles de confiance, dans notre cas des attentes, vous pouvez également tester certaines hypothèses. C'est très facile à faire. Disons que la moyenne arithmétique d'un certain échantillon est égale à 100. L'hypothèse est testée que la valeur attendue est, disons, 90. Autrement dit, si nous posons primitivement la question, cela ressemble à ceci : est-il possible qu'avec le la vraie valeur de la moyenne est égale à 90, la moyenne observée s'est avérée être de 100 ?

Pour répondre à cette question, vous aurez également besoin d’informations sur l’écart type et la taille de l’échantillon. Supposons que l'écart type soit de 30 et que le nombre d'observations soit de 64 (pour extraire facilement la racine). L’erreur type de la moyenne est alors de 30/8 ou 3,75. Pour calculer un intervalle de confiance de 95 %, vous devrez ajouter deux erreurs types de chaque côté de la moyenne (plus précisément 1,96). L'intervalle de confiance sera d'environ 100 ± 7,5 ou de 92,5 à 107,5.

Le raisonnement supplémentaire est le suivant. Si la valeur testée se situe dans l’intervalle de confiance, elle ne contredit pas l’hypothèse, car se situe dans les limites des fluctuations aléatoires (avec une probabilité de 95 %). Si le point vérifié se situe en dehors de l'intervalle de confiance, alors la probabilité qu'un tel événement se produise est très faible, en tout cas inférieure au niveau acceptable. Cela signifie que l’hypothèse est rejetée car contredisant les données observées. Dans notre cas, l’hypothèse sur la valeur attendue se situe en dehors de l’intervalle de confiance (la valeur testée de 90 n’est pas incluse dans l’intervalle 100 ± 7,5), elle doit donc être rejetée. En répondant à la question primitive ci-dessus, il faut dire : non, cela ne peut en aucun cas, cela arrive extrêmement rarement. Souvent, ils indiquent la probabilité spécifique de rejeter par erreur l'hypothèse (niveau p), et non pas le niveau spécifié sur lequel l'intervalle de confiance a été construit, mais nous y reviendrons une autre fois.

Comme vous pouvez le constater, construire un intervalle de confiance pour la moyenne (ou l’espérance mathématique) n’est pas difficile. L’essentiel est d’en saisir l’essence, et ensuite les choses avanceront. En pratique, la plupart des cas utilisent un intervalle de confiance de 95 %, soit environ deux erreurs types de part et d’autre de la moyenne.

C'est tout pour l'instant. Tous mes vœux!

Intervalle de confiance

Intervalle de confiance- terme utilisé en statistique mathématique pour l'estimation par intervalles (par opposition à ponctuelle) de paramètres statistiques, ce qui est préférable lorsque la taille de l'échantillon est petite. Un intervalle de confiance couvre un paramètre inconnu avec une fiabilité donnée.

La méthode des intervalles de confiance a été développée par le statisticien américain Jerzy Neumann, sur la base des idées du statisticien anglais Ronald Fisher.

Définition

Intervalle de confiance du paramètre θ distribution de variables aléatoires X avec un niveau de confiance 100 p%, généré par l'échantillon ( x 1 ,…,x n), est appelé un intervalle avec des limites ( x 1 ,…,x n) et ( x 1 ,…,x n), qui sont des réalisations de variables aléatoires L(X 1 ,…,X n) et U(X 1 ,…,X n), tel que

.

Les points limites de l’intervalle de confiance sont appelés limites de confiance.

Une interprétation intuitive de l’intervalle de confiance serait : si p est grand (disons 0,95 ou 0,99), alors l'intervalle de confiance contient presque certainement la vraie valeur θ .

Autre interprétation de la notion d'intervalle de confiance : il peut être considéré comme un intervalle de valeurs de paramètres θ compatibles avec les données expérimentales et ne les contredisent pas.

Exemples

  • Intervalle de confiance pour l'espérance mathématique d'un échantillon normal ;
  • Intervalle de confiance pour la variance normale de l'échantillon.

Intervalle de confiance bayésien

Dans les statistiques bayésiennes, il existe une définition similaire mais différente dans certains détails clés d'un intervalle de confiance. Ici, le paramètre estimé lui-même est considéré comme une variable aléatoire avec une distribution a priori donnée (dans le cas le plus simple, uniforme), et l'échantillon est fixe (dans les statistiques classiques, tout est exactement le contraire). Un intervalle de confiance bayésien est un intervalle couvrant la valeur du paramètre avec la probabilité a posteriori :

.

En général, les intervalles de confiance classiques et bayésiens sont différents. Dans la littérature anglophone, l'intervalle de confiance bayésien est généralement appelé le terme intervalle crédible, et le classique - intervalle de confiance.

Remarques

Sources

Fondation Wikimédia.

  • 2010.
  • Enfants (film)

Colon

    Intervalle de confiance Voyez ce qu'est « Intervalle de confiance » dans d'autres dictionnaires : - un intervalle calculé à partir de données d'échantillon, qui, avec une probabilité donnée (confiance), couvre la vraie valeur inconnue du paramètre de distribution estimé. Source : GOST 20522 96 : Sols. Méthodes de traitement statistique des résultats...

    Dictionnaire-ouvrage de référence des termes de la documentation normative et technique intervalle de confiance - pour un paramètre scalaire de la population, il s'agit d'un segment qui contient très probablement ce paramètre. Cette phrase n’a aucun sens sans plus de précisions. Puisque les limites de l’intervalle de confiance sont estimées à partir de l’échantillon, il est naturel de... ...

    Dictionnaire de statistiques sociologiques INTERVALLE DE CONFIANCE - une méthode d'estimation des paramètres différente de l'estimation ponctuelle. Soit l'échantillon x1, . . ., xn à partir d'une distribution de densité de probabilité f(x, α), et a*=a*(x1, . . ., xn) estime α, g(a*, α) estimation de la densité de probabilité. Nous recherchons......

    Dictionnaire de statistiques sociologiques Encyclopédie géologique - (intervalle de confiance) Un intervalle dans lequel la fiabilité de la valeur du paramètre pour la population obtenue sur la base d'une enquête par sondage a un certain degré de probabilité, par exemple 95 %, qui est dû à l'échantillon lui-même. Largeur… …

    Dictionnaire-ouvrage de référence des termes de la documentation normative et technique Dictionnaire économique - – est l'intervalle dans lequel se situe la vraie valeur de la quantité déterminée avec une probabilité de confiance donnée. Chimie générale : manuel / A. V. Zholnin...

    Termes chimiques Intervalle de confiance IC Génétique. Dictionnaire encyclopédique

    Dictionnaire de statistiques sociologiques- une notion qui surgit lors de l'estimation d'un paramètre statistique. répartition par intervalle de valeurs. D. et. pour le paramètre q, correspondant à ce coefficient. trust P, est égal à un intervalle tel (q1, q2) que pour toute distribution de probabilité d'inégalité... ... Encyclopédie physique

    Dictionnaire-ouvrage de référence des termes de la documentation normative et technique- - Thèmes de télécommunications, concepts de base FR intervalle de confiance... Guide du traducteur technique

    Dictionnaire-ouvrage de référence des termes de la documentation normative et technique- Pasikliovimo intervalas statusas T sritis Standartizacija ir metrologija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. atitikmenys : engl. intervalle de confiance vok. Vertrauensbereich, m rus.… … Penkiakalbis aiškinamasis metrologijos terminų žodynas

    Dictionnaire-ouvrage de référence des termes de la documentation normative et technique- pasikliovimo intervalas statusas T sritis chemija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. atitikmenys : engl. intervalle de confiance russe. zone de confiance ; intervalle de confiance... Chemijos terminų aiškinamasis žodynas



Avez-vous aimé l'article? Partagez avec vos amis !