Tableaux des valeurs de la fonction de distribution de Poisson. Distribution de Poisson

Brève théorie

Faisons des essais indépendants, dans chacun desquels la probabilité qu'un événement se produise est égale à . Pour déterminer la probabilité qu'un événement se produise dans ces tests, la formule de Bernoulli est utilisée. S'il est grand, utilisez ou. Toutefois, cette formule ne convient pas si elle est petite. Dans ces cas (grands, petits), ils recourent à des méthodes asymptotiques La formule de Poisson.

Fixons-nous pour tâche de trouver la probabilité que, pour très grand nombre tests, dans chacun desquels la probabilité de l'événement est très faible, l'événement se produira exactement une fois. Faisons une hypothèse importante : l'œuvre conserve une valeur constante, à savoir . Cela signifie que le nombre moyen d'occurrences d'un événement dans différentes séries d'essais, c'est-à-dire à différentes significations, reste inchangé.

Exemple de solution de problème

Problème 1

La base a reçu 10 000 lampes électriques. La probabilité que la lampe se brise pendant le trajet est de 0,0003. Trouvez la probabilité que parmi les lampes reçues, cinq lampes soient cassées.

Solution

Condition d'applicabilité de la formule de Poisson :

Si la probabilité qu'un événement se produise dans un essai individuel est suffisamment proche de zéro, alors même pour des valeurs élevées du nombre d'essais, la probabilité calculée par théorème local Laplace s’avère insuffisamment précis. Dans de tels cas, utilisez la formule dérivée de Poisson.

Que l'événement - 5 lampes soient cassées

Utilisons la formule de Poisson :

Dans notre cas :

Répondre

Problème 2

L'entreprise dispose de 1000 équipements certain type. La probabilité qu’un équipement tombe en panne en une heure est de 0,001. Etablir une loi de répartition du nombre de pannes d'équipements par heure. Trouvez des caractéristiques numériques.

Solution

Variable aléatoire - le nombre de pannes d'équipement, peut prendre des valeurs

Utilisons la loi de Poisson :

Trouvons ces probabilités :

.

L'espérance mathématique et la variance d'une variable aléatoire distribuée selon la loi de Poisson sont égales au paramètre de cette distribution :

Moyenne coût de la solution travail d'essai 700 - 1 200 roubles (mais pas moins de 300 roubles pour la totalité de la commande). Le prix est fortement influencé par l'urgence de la décision (d'une journée à plusieurs heures). Le coût de l'aide en ligne pour un examen/test est de 1 000 roubles. pour résoudre le ticket.

Vous pouvez déposer une demande directement dans le chat, après avoir préalablement envoyé les conditions des tâches et vous avoir informé du délai de solution dont vous avez besoin. Le temps de réponse est de quelques minutes.

Distribution de Poisson.

Considérons le plus situation typique, dans lequel apparaît la distribution de Poisson. Laissez l'événement UN apparaît un certain nombre de fois dans une zone fixe de l'espace (intervalle, surface, volume) ou une période de temps à intensité constante. Pour être plus précis, considérons l’apparition séquentielle d’événements au fil du temps, appelée flux d’événements. Graphiquement, le flux des événements peut être illustré par de nombreux points situés sur l'axe du temps.

Il peut s'agir d'un flux d'appels dans le secteur des services (réparation d'appareils électroménagers, appel d'une ambulance, etc.), d'un flux d'appels vers un central téléphonique, d'une panne de certaines parties du système, désintégration radioactive, des morceaux de tissu ou des tôles et le nombre de défauts sur chacun d'eux, etc. La distribution de Poisson est plus utile dans les problèmes où il est nécessaire de déterminer uniquement le nombre de résultats positifs (« succès »).

Imaginez un petit pain aux raisins, divisé en petits morceaux taille égale. En raison de distribution aléatoire on ne peut pas s'attendre à ce que tous les morceaux en contiennent même numéro. Lorsque le nombre moyen de raisins secs contenus dans ces morceaux est connu, alors la distribution de Poisson donne la probabilité qu'un morceau donné contienne X=k(k= 0,1,2,...,)nombre de raisins secs.

En d'autres termes, la distribution de Poisson détermine quelle partie d'une longue série de pièces contiendra égal à 0, ou 1, ou 2, ou etc. nombre de faits saillants.

Faisons les hypothèses suivantes.

1. La probabilité qu'un certain nombre d'événements se produisent dans un intervalle de temps donné dépend uniquement de la longueur de cet intervalle, et non de sa position sur l'axe du temps. C'est la propriété de la stationnarité.

2. La survenance de plus d'un événement dans un laps de temps suffisamment court est pratiquement impossible, c'est-à-dire probabilité conditionnelle l'apparition d'un autre événement dans le même intervalle tend vers zéro à ® 0. C'est la propriété de l'ordinaire.

3. Probabilité d'occurrence numéro donné les événements survenus dans une période de temps déterminée ne dépendent pas du nombre d'événements apparaissant dans d'autres périodes de temps. C'est la propriété de l'absence de séquelles.

Un flux d'événements qui satisfait les propositions ci-dessus est appelé le plus simple.

Considérons une période de temps assez courte. En fonction de la propriété 2, l'événement peut apparaître une fois dans cet intervalle ou ne pas apparaître du tout. Notons la probabilité qu'un événement se produise par r, et non-apparence – à travers q = 1-p. Probabilité r est constante (propriété 3) et dépend uniquement de la valeur (propriété 1). L'espérance mathématique du nombre d'occurrences d'un événement dans l'intervalle sera égale à 0× q+ 1× p = p. Ensuite, le nombre moyen d'occurrences d'événements par unité de temps est appelé intensité du flux et est noté un, ceux. un = .

Considérons segment final temps t et divisez-le par n parties = . Les occurrences d'événements dans chacun de ces intervalles sont indépendantes (propriété 2). Déterminons la probabilité que dans une période de temps tà intensité de débit constante UN l'événement apparaîtra exactement X = k n'apparaîtra plus n-k. Puisqu'un événement peut dans chacun des n les lacunes n'apparaissent pas plus d'une fois, puis pour son apparition k une fois dans un segment de durée t il devrait apparaître dans n'importe quel k entre nombre total n. Il existe un total de telles combinaisons et la probabilité de chacune est égale. Par conséquent, par le théorème d'addition des probabilités on obtient pour la probabilité souhaitée formule bien connue Bernoulli

Cette égalité s'écrit comme une égalité approximative, puisque la prémisse initiale pour sa dérivation était la propriété 2, qui est remplie avec plus de précision si la valeur est plus petite. Pour obtenir l'égalité exacte, passons à la limite en ® 0 ou, ce qui revient au même, n® . Nous l'obtiendrons après remplacement.

P. = un= et q = 1 – .

Présentons nouveau paramètre = à, c'est-à-dire le nombre moyen d'occurrences d'un événement dans un segment t. Après transformations simples et passage à la limite dans les facteurs, on obtient.

= 1, = ,

Finalement on obtient

, k = 0, 1, 2, ...

e = 2.718... – base logarithme népérien.

Définition. Variable aléatoire X, qui n'accepte que les entiers, valeurs positives 0, 1, 2, ... a une distribution de Poisson de paramètre si

Pour k = 0, 1, 2, ...

La distribution de Poisson a été proposée mathématicien français S.D. Poisson (1781-1840). Il est utilisé pour résoudre des problèmes de calcul de probabilités relativement rares et mutuellement aléatoires. événements indépendants par unité de temps, de longueur, de surface et de volume.

Pour le cas où a) est grand et b) k= , la formule de Stirling est valide :

Pour calculer les valeurs ultérieures, une formule récurrente est utilisée

P.(k + 1) = P.(k).

Exemple 1. Quelle est la probabilité que sur 1000 personnes un jour donné : a) aucune, b) une, c) deux, d) trois personnes soient nées ?

Solution. Parce que p= 1/365, alors q= 1 – 1/365 = 364/365 "1.

Alors

UN) ,

b) ,

V) ,

G) .

Par conséquent, s'il existe des échantillons de 1 000 personnes, le nombre moyen de personnes nées un jour donné sera donc de 65 ; 178 ; 244 ; 223.

Exemple 2. Déterminez la valeur à laquelle avec probabilité R. l'événement est apparu au moins une fois.

Solution. Événement UN= (apparaître au moins une fois) et = (ne pas apparaître une seule fois). Ainsi .

D'ici Et .

Par exemple, pour R.= 0,5, pour R.= 0,95 .

Exemple 3. Sur les métiers à tisser exploités par un seul tisserand, 90 cassures de fil se produisent en une heure. Trouvez la probabilité qu'au moins une rupture de fil se produise en 4 minutes.

Solution. Par condition t = 4 minutes. et le nombre moyen de pauses par minute, d'où . La probabilité requise est .

Propriétés. L'espérance mathématique et la variance d'une variable aléatoire ayant une distribution de Poisson avec paramètre sont égales à :

M(X) = D(X) = .

Ces expressions sont obtenues par calculs directs :

C'est ici que le remplacement a été effectué n = k– 1 et le fait que .

En effectuant des transformations similaires à celles utilisées dans la sortie M(X), on obtient

La distribution de Poisson est utilisée pour approximer la distribution binomiale dans son ensemble n

Rappelons encore une fois la situation que l'on a appelée le schéma de Bernoulli : n essais indépendants, dont chacun contient un événement UN peut apparaître avec la même probabilité r. Ensuite, pour déterminer la probabilité que dans ces névénement de test UN apparaîtra exactement k fois (cette probabilité était notée P. n (k) ) peut être calculé exactement en utilisant la formule de Bernoulli, où q=1− p. Cependant, avec un grand nombre de tests n Les calculs utilisant la formule de Bernoulli deviennent très gênants car ils conduisent à des opérations avec de très grands nombres. Donc (si vous vous souvenez cela a déjà été abordé lors de l'étude du schéma et de la formule de Bernoulli lors de l'étude de la première partie de la théorie des probabilités « Événements aléatoires » pour les grands n des formules beaucoup plus pratiques (quoique approximatives) ont été proposées, qui se sont révélées d'autant plus précises que plus n(Formule Poisson, formule Moivre-Laplace locale et intégrale). Si dans le schéma de Bernoulli le nombre d'expériences n est élevée et la probabilité r survenance d'un événement UN est petit dans chaque test, alors la formule de Poisson mentionnée donne une bonne approximation
, où le paramètre une =np. Cette formule conduit à la distribution de Poisson. Donnons des définitions précises

Variable aléatoire discrète X a Distribution de Poisson, s'il prend des valeurs 0, 1, 2, ... avec probabilités r 0 , p 1 , ... , qui sont calculés par la formule

et le numéro UN est un paramètre de la distribution de Poisson. Veuillez noter que les valeurs possibles de r.v. X une infinité de Ce sont tous des entiers non négatifs. Ainsi, d.s.v X avec la distribution de Poisson a la loi de distribution suivante :

Lors du calcul espérance mathématique(selon leur définition du d.r.v. avec une loi de distribution connue) il faudra désormais considérer non montants finaux, et les sommes des séries infinies correspondantes (puisque le tableau de la loi de distribution comporte une infinité de colonnes). Si l'on calcule les sommes de ces séries, il s'avère que l'espérance mathématique et la variance de la variable aléatoire X avec la distribution de Poisson coïncide avec le paramètre UN de cette répartition :

,
.

Trouvons la mode d(X) Variable aléatoire distribuée par Poisson X. Appliquons la même technique que celle utilisée pour calculer le mode d'une variable aléatoire distribuée binomialement. Par définition de la mode d(X)= k, si probabilité
la plus grande de toutes les probabilités r 0 , p 1 , ... . Trouvons un tel numéro k (c'est un entier non négatif). Avec ça k probabilité p k ne doit pas être inférieure à ses probabilités voisines : p k −1 p k p k +1 . En substituant la formule correspondante pour chaque probabilité, on obtient que le nombre k doit satisfaire la double inégalité :

.

Si nous écrivons les formules des factorielles et effectuons des transformations simples, nous pouvons obtenir cela gauche inégalité donne k≤ un, et le droit k≥ une −1. Donc le numéro k satisfait la double inégalité une −1 ≤k≤ un, c'est-à-dire appartient au segment [ une −1, une] . Puisque la longueur de ce segment est évidemment égale à 1 , alors il peut contenir un ou deux entiers. Si le numéro UN entier, puis dans le segment [ une −1, une] il y a 2 entiers aux extrémités du segment. Si le numéro UN n'est pas un entier, alors il n'y a qu'un seul entier dans ce segment.

Ainsi, si le nombre UN entier, alors le mode de la variable aléatoire distribuée de Poisson X prend 2 valeurs adjacentes : d(X)=a−1 Et d(X)=un. Si le numéro UN pas le tout, alors la mode a une valeur d(X)= k, Où k est le seul entier qui satisfait l'inégalité une −1 ≤k≤ un, c'est-à-dire d(X)= [UN] .

Exemple. L'usine a envoyé 5 000 produits à la base. La probabilité que le produit soit endommagé pendant le transport est de 0,0002. Quelle est la probabilité que 18 produits soient endommagés ? Quelle est la valeur moyenne des produits endommagés ? Quel est le nombre le plus probable de produits endommagés et quelle est sa probabilité ?

Par exemple, le nombre d'accidents de la route par semaine sur un certain tronçon de route est enregistré. Ce nombre est une variable aléatoire qui peut prendre les valeurs suivantes : ( limite supérieure Non). Le nombre d’accidents de la route peut être aussi important que vous le souhaitez. Si l’on considère une courte période de temps au cours d’une semaine, disons une minute, alors soit un incident se produira pendant cette période, soit il ne se produira pas. La probabilité d’un accident de la route en une seule minute est très faible et elle est à peu près la même pour toutes les minutes.

La distribution de probabilité du nombre d'incidents est décrite par la formule :

où m est le nombre moyen d'accidents par semaine sur un certain tronçon de route ; e est une constante égale à 2,718...

Caractéristiques caractéristiques des données pour lesquelles de la meilleure façon possible La distribution de Poisson appropriée est la suivante :

1. Chaque petit intervalle de temps peut être considéré comme une expérience dont le résultat est l'une des deux choses suivantes : soit un incident (« succès »), soit son absence (« échec »). Les intervalles sont si petits qu’il ne peut y avoir qu’un seul « succès » dans un intervalle, dont la probabilité est faible et constante.

2. Nombre de « succès » en un grand intervalle ne dépend pas de leur nombre dans un autre, c'est-à-dire Les « succès » sont dispersés de manière aléatoire à travers les périodes.

3. Le nombre moyen de « succès » est constant tout au long de la période. La distribution de probabilité de Poisson peut être utilisée non seulement pour travailler avec des variables aléatoires sur des intervalles de temps, mais également pour prendre en compte les défauts de la chaussée par kilomètre parcouru ou les fautes de frappe par page de texte. Formule générale Distributions de probabilité de Poisson :

où m est le nombre moyen de « succès » par unité.

Dans les tableaux de distribution de probabilité de Poisson, les valeurs sont tabulées pour certaines valeurs de m et

Exemple 2.7. En moyenne par central téléphonique ordonner trois conversations téléphoniques dans un délai de cinq minutes. Quelle est la probabilité que 0, 1, 2, 3, 4 ou plus de quatre appels soient ordonnés dans un délai de cinq minutes ?

Appliquons la distribution de probabilité de Poisson, puisque :

1. Il existe un nombre illimité d'expériences, c'est-à-dire de courtes périodes de temps pendant lesquelles un ordre de conversation téléphonique peut apparaître, dont la probabilité est faible et constante.

2. La demande de conversations téléphoniques est supposée être répartie de manière aléatoire dans le temps.

3. On pense que la moyenne conversations téléphoniques dans n’importe quelle minute, c’est la même chose.

Dans cet exemple, le nombre moyen de commandes est de 3 en 5 minutes. D’où la distribution de Poisson :

Avec la distribution de probabilité de Poisson, connaissant le nombre moyen de « succès » sur une période de 5 minutes (par exemple, comme dans l'exemple 2.7), pour connaître le nombre moyen de « succès » sur une heure, il suffit de multipliez par 12. Dans l'exemple 2.7, le nombre moyen de commandes par heure sera : 3 x 12 = 36. De même, si vous souhaitez déterminer le nombre moyen de commandes par minute :

Exemple 2.8. En moyenne en cinq jours semaine de travail 3.4 dysfonctionnements surviennent sur la ligne automatique. Quelle est la probabilité de deux dysfonctionnements par jour de fonctionnement ? Solution.

Vous pouvez appliquer la distribution de Poisson :

1. Il existe un nombre illimité d'expériences, c'est-à-dire de petites périodes de temps, pendant chacune desquelles un dysfonctionnement peut survenir ou non sur la ligne automatique. La probabilité que cela se produise pour chaque période de temps est faible et constante.

2. On suppose que les problèmes sont répartis de manière aléatoire dans le temps.

3. Le nombre moyen de pannes sur cinq jours est supposé constant.

Le nombre moyen de problèmes est de 3,4 en cinq jours. D'où le nombre de problèmes par jour :

Ainsi,

Dans de nombreuses applications pratiquement importantes, la distribution de Poisson joue un rôle important. Beaucoup de chiffres quantités discrètes sont des implémentations d'un processus de Poisson avec les propriétés suivantes :

  • Nous nous intéressons au nombre de fois qu'un certain événement se produit dans une gamme donnée de résultats possibles. expérience aléatoire. La zone de résultats possibles peut être un intervalle de temps, un segment, une surface, etc.
  • La probabilité d’un événement donné est la même pour tous les domaines de résultats possibles.
  • Le nombre d'événements se produisant dans un domaine de résultats possibles est indépendant du nombre d'événements se produisant dans d'autres domaines.
  • La probabilité que dans le même domaine des résultats possibles cet événement se produit plus d’une fois, tend vers zéro à mesure que l’éventail des résultats possibles diminue.

Pour mieux comprendre la signification du processus de Poisson, supposons que nous examinions le nombre de clients visitant une agence bancaire située dans un centre quartier des affaires, pendant le déjeuner, c'est-à-dire de 12 à 13 heures. Supposons que vous souhaitiez déterminer le nombre de clients arrivant en une minute. Cette situation présente-t-elle les caractéristiques énumérées ci-dessus ? Premièrement, l'événement qui nous intéresse est l'arrivée d'un client, et l'éventail des résultats possibles est un intervalle d'une minute. Combien de clients viendront à la banque en une minute - aucun, un, deux ou plus ? Deuxièmement, il est raisonnable de supposer que la probabilité qu’un client arrive dans la minute est la même pour tous les intervalles d’une minute. Troisièmement, l’arrivée d’un client au cours d’un intervalle d’une minute est indépendante de l’arrivée de tout autre client au cours de tout autre intervalle d’une minute. Et enfin, la probabilité que plus d'un client vienne à la banque tend vers zéro si l'intervalle de temps tend vers zéro, par exemple, devient inférieur à 0,1 s. Ainsi, le nombre de clients venant à la banque pendant le déjeuner en une minute est décrit par la distribution de Poisson.

La distribution de Poisson a un paramètre, noté λ ( lettre grecque« lambda ») est le nombre moyen d’essais réussis dans un domaine donné de résultats possibles. La variance de la distribution de Poisson est également λ et son écart type est . Nombre d'essais réussis X La variable aléatoire de Poisson varie de 0 à l'infini. La distribution de Poisson est décrite par la formule :

P(X)- probabilité X essais réussis, λ - nombre attendu de succès, e- base du logarithme népérien égale à 2,71828, X- nombre de réussites par unité de temps.

Revenons à notre exemple. Disons que pendant la pause déjeuner, en moyenne, trois clients viennent à la banque par minute. Quelle est la probabilité que deux clients se présentent à la banque à un instant donné ? Quelle est la probabilité que plus de deux clients viennent à la banque ?

Appliquons la formule (1) avec le paramètre λ = 3. Alors la probabilité que deux clients viennent à la banque dans une minute donnée est égale à

La probabilité que plus de deux clients viennent à la banque est égale à P(X > 2) = P(X = 3) + P(X = 4) + … + P(X = ∞) . Puisque la somme de toutes les probabilités doit être égale à 1, les termes de la série à droite de la formule représentent la probabilité d'addition à l'événement X ≤ 2. Autrement dit, la somme de cette série est égale à 1 – P(X ≤ 2). Ainsi, P(X>2) = 1 – P(X≤2) = 1 – [P(X = 0) + P(X = 1) + P(X = 2)]. Maintenant, en utilisant la formule (1), nous obtenons :

Ainsi, la probabilité que pas plus de deux clients viennent à la banque en une minute est de 0,423 (ou 42,3 %), et la probabilité que plus de deux clients viennent à la banque en une minute est de 0,577 (ou 57,7 %).

De tels calculs peuvent paraître fastidieux, surtout si le paramètre λ est suffisamment grand. A éviter calculs complexes, de nombreuses probabilités de Poisson peuvent être trouvées dans des tableaux spéciaux (Fig. 1). Par exemple, la probabilité que deux clients viennent à la banque à une minute donnée, si en moyenne trois clients viennent à la banque par minute, se situe à l'intersection de la ligne X= 2 et colonne λ = 3. Ainsi, elle est égale à 0,2240 soit 22,4 %.

Riz. 1. Probabilité de Poisson à λ = 3

De nos jours, il est peu probable que quiconque utilise des tableaux s’il dispose d’Excel avec sa fonction =POISSON.DIST() (Fig. 2). Cette fonction possède trois paramètres : nombre d'essais réussis X, nombre moyen attendu d'essais réussis λ, paramètre Intégral, en prenant deux valeurs : FALSE – dans ce cas, la probabilité du nombre d'essais réussis est calculée X(X uniquement), VRAI – dans ce cas, la probabilité du nombre d'essais réussis de 0 à X.

Riz. 2. Calcul en Probabilités Excel Distribution de Poisson à λ = 3

Approximation de la distribution binomiale à l'aide de la distribution de Poisson

Si le numéro n est grand et le nombre r- peu, distribution binomiale peut être approximée en utilisant la distribution de Poisson. Comment plus grand nombre n et moins de nombre r, plus la précision de l'approximation est élevée. Le modèle de Poisson suivant est utilisé pour approximer la distribution binomiale.

P(X)- probabilité X succès avec paramètres donnés n Et r, n- taille de l'échantillon, r- vraie probabilité de succès, e- la base du logarithme népérien, X- nombre de réussites dans l'échantillon (X = 0, 1, 2, …, n).

Théoriquement variable aléatoire, qui a une distribution de Poisson, prend des valeurs de 0 à ∞. Cependant, dans les situations où la distribution de Poisson est utilisée pour approximer la distribution binomiale, la variable aléatoire de Poisson est le nombre de réussites parmi n observations - ne peut pas dépasser le nombre n. De la formule (2), il s'ensuit qu'avec un nombre croissant n et une diminution du nombre r probabilité de détection grand nombre le taux de réussite diminue et tend vers zéro.

Comme mentionné ci-dessus, l'espérance µ et la variance σ 2 de la distribution de Poisson sont égales à λ. Par conséquent, lors de l'approximation de la distribution binomiale à l'aide de la distribution de Poisson, la formule (3) doit être utilisée pour approximer l'espérance mathématique.

(3) µ = E(X) = λ =n.p.

Pour approximer l'écart type, la formule (4) est utilisée.

Veuillez noter que l'écart type calculé à l'aide de la formule (4) a tendance à écart type dans le modèle binomial – lorsque la probabilité de succès p tend vers zéro et, par conséquent, la probabilité de défaillance 1-p tend à l’unité.

Supposons que 8 % des pneus produits dans une usine donnée soient défectueux. Pour illustrer l'utilisation de la distribution de Poisson pour approximer la distribution binomiale, calculons la probabilité de trouver un pneu défectueux dans un échantillon de 20 pneus. Appliquons la formule (2), on obtient

Si nous devions calculer la vraie distribution binomiale plutôt que son approximation, nous obtiendrions le résultat suivant :

Cependant, ces calculs sont assez fastidieux. Cependant, si vous utilisez Excel pour calculer les probabilités, l'utilisation de l'approximation de la distribution de Poisson devient redondante. Sur la fig. La figure 3 montre que la complexité des calculs dans Excel est la même. Cependant, cette section, à mon avis, est utile pour comprendre que sous certaines conditions la distribution binomiale et la distribution de Poisson donnent des résultats similaires.

Riz. 3. Comparaison de la complexité des calculs dans Excel : (a) distribution de Poisson ; (b) distribution binomiale

Ainsi, dans cette note et dans les deux précédentes, trois distributions numériques: , et Poisson. Pour mieux comprendre les relations entre ces distributions, nous présentons un petit arbre de questions (Fig. 4).

Riz. 4. Classement distributions discrètes probabilités

Des documents du livre Levin et al. Statistics for Managers sont utilisés. – M. : Williams, 2004. – p. 320-328



Avez-vous aimé l'article? Partagez avec vos amis !