Sürekli bir rastgele değişkenin düzgün olasılık dağılımı. Düzgün dağılım

Sürekli bir rastgele değişkenin olasılık dağılımı X, segmentteki tüm değerleri alarak , isminde üniforma Olasılık yoğunluğu bu segmentte sabitse ve onun dışında sıfıra eşitse. Böylece sürekli bir rastgele değişkenin olasılık yoğunluğu X segment üzerinde eşit olarak dağıtılmış , şu forma sahiptir:

Hadi tanımlayalım matematiksel beklenti, dağılım ve düzgün dağılıma sahip bir rastgele değişken için.

, , .

Örnek. Düzgün dağıtılmış bir rastgele değişkenin tüm değerleri aralıkta yer alır . Bir rastgele değişkenin aralığa düşme olasılığını bulun (3;5) .

a=2, b=8, .

Binom dağılımı

Üretilsin N Testler ve olayın meydana gelme olasılığı A her denemede eşittir P ve diğer araştırmaların (bağımsız araştırmaların) sonuçlarından bağımsızdır. Bir olayın gerçekleşme olasılığı olduğundan A bir testte eşittir P, o zaman oluşmama olasılığı eşittir q=1-p.

Hadi olay A içeri girdi N testler M bir kere. Bu karmaşık olay bir ürün olarak yazılabilir:

.

O halde olasılık N test olayı A gelecek M formülle hesaplanan zamanlar:

veya (1)

Formül (1) denir Bernoulli'nin formülü.

İzin vermek X– olayın meydana gelme sayısına eşit bir rastgele değişken A V N olasılıklarla değer alan testler:

Rastgele bir değişkenin ortaya çıkan dağılım yasasına denir binom dağılım kanunu.

X M N
P

Beklenti, dağılım Ve standart sapma Binom yasasına göre dağıtılan rastgele değişkenler aşağıdaki formüllerle belirlenir:

, , .

Örnek. Hedefe üç atış yapılır ve her atışta isabet olasılığı 0,8'dir. Rastgele bir değişken düşünün X– hedefteki isabet sayısı. Dağıtım yasasını, matematiksel beklentiyi, dağılımını ve standart sapmasını bulun.

p=0,8, q=0,2, n=3, , , .

- 0 isabet olasılığı;



Tek vuruş şansı;

İki vuruş şansı;

- üç vuruş olasılığı.

Dağıtım yasasını elde ederiz:

X
P 0,008 0,096 0,384 0,512

Görevler

1. Bir madeni para 7 kez atılıyor. Arması 4 kez yukarı bakacak şekilde yere inme olasılığını bulun.

2. Bir madeni para 8 kez atılıyor. Armanın en fazla üç kez görünme olasılığını bulun.

3. Silahtan ateş edildiğinde hedefi vurma olasılığı p=0,6. 10 atış yapıldığında toplam isabet sayısının matematiksel beklentisini bulun.

4. 20 bilet alınırsa kazanılacak piyango bileti sayısının matematiksel beklentisini bulun ve bir bilette kazanma olasılığı 0,3'tür.

Bu konu uzun süredir ayrıntılı olarak çalışılmaktadır ve en yaygın kullanılan yöntem, George Box, Mervyn Muller ve George Marsaglia tarafından 1958'de önerilen kutupsal koordinat yöntemidir. Bu yöntem, matematiksel beklentisi 0 ve varyansı 1 olan bir çift bağımsız normal dağılımlı rastgele değişken elde etmenizi sağlar:

Z 0 ve Z 1 istenen değerler olduğunda, s = u 2 + v 2 ve u ve v, (-1, 1) aralığında düzgün şekilde dağıtılan ve 0 koşulu sağlanacak şekilde seçilen rastgele değişkenlerdir.< s < 1.
Pek çok kişi bu formülleri hiç düşünmeden kullanıyor ve çoğu hazır uygulamaları kullandığı için varlığından bile şüphelenmiyor. Ancak şu soruyu soranlar da var: “Bu formül nereden çıktı? Peki neden aynı anda birkaç miktar alıyorsunuz?” Daha sonra bu sorulara net bir cevap vermeye çalışacağım.


Başlangıç ​​olarak olasılık yoğunluğunun, rastgele değişkenin dağılım fonksiyonunun ve ters fonksiyonun ne olduğunu hatırlatayım. Dağılımı f(x) yoğunluk fonksiyonu ile belirlenen ve aşağıdaki forma sahip olan belirli bir rastgele değişkenin olduğunu varsayalım:

Bu, belirli bir rastgele değişkenin değerinin (A, B) aralığında olma olasılığının taralı alanın alanına eşit olduğu anlamına gelir. Ve sonuç olarak, tüm gölgeli alanın alanı bire eşit olmalıdır, çünkü her durumda rastgele değişkenin değeri f fonksiyonunun tanım alanına girecektir.
Bir rastgele değişkenin dağılım fonksiyonu yoğunluk fonksiyonunun integralidir. Ve bu durumda yaklaşık görünümü şöyle olacaktır:

Buradaki anlam, rasgele değişkenin değerinin B olasılığı ile A'dan küçük olacağıdır. Sonuç olarak fonksiyon asla azalmaz ve değerleri aralıkta yer alır.

Ters fonksiyon, orijinal fonksiyonun değeri kendisine iletildiğinde orijinal fonksiyona bir argüman döndüren bir fonksiyondur. Örneğin, x 2 fonksiyonu için bunun tersi kök çıkarma fonksiyonudur, sin(x) için ise arcsin(x), vb.'dir.

Sahte rasgele sayı üreteçlerinin çoğu çıktı olarak yalnızca tekdüze bir dağılım ürettiğinden, genellikle onu başka bir dağılıma dönüştürme ihtiyacı vardır. Bu durumda normal Gaussian'a göre:

Düzgün bir dağılımı diğerine dönüştürmeye yönelik tüm yöntemlerin temeli, ters dönüşüm yöntemidir. Aşağıdaki gibi çalışır. Gerekli dağılımın fonksiyonuna ters olan bir fonksiyon bulunur ve (0, 1) aralığında düzgün bir şekilde dağıtılan bir rastgele değişken argüman olarak ona iletilir. Çıktıda gerekli dağılıma sahip bir değer elde ederiz. Netlik sağlamak için aşağıdaki resmi sunuyorum.

Böylece, yeni dağılıma göre tekdüze bir parça sanki bulaşmış gibi, ters bir fonksiyonla başka bir eksene yansıtılıyor. Ancak sorun şu ki, Gauss dağılımının yoğunluğunun integralini hesaplamak kolay olmadığından yukarıdaki bilim adamları hile yapmak zorunda kaldı.

K bağımsız normal rastgele değişkenin karelerinin toplamının dağılımı olan bir ki-kare dağılımı (Pearson dağılımı) vardır. Ve k = 2 durumunda bu dağılım üsteldir.

Bu, dikdörtgen koordinat sistemindeki bir noktanın normal olarak dağıtılmış rastgele X ve Y koordinatlarına sahip olması durumunda, bu koordinatları kutup sistemine (r, θ) dönüştürdükten sonra, yarıçapın karesinin (başlangıç ​​noktasından noktaya olan mesafe) olduğu anlamına gelir. Yarıçapın karesi koordinatların karelerinin toplamı olduğundan (Pisagor yasasına göre) üstel yasaya göre dağıtılacaktır. Düzlemdeki bu tür noktaların dağılım yoğunluğu şöyle görünecektir:


Tüm yönlerde eşit olduğundan, θ açısı 0 ila 2π aralığında düzgün bir dağılıma sahip olacaktır. Bunun tersi de doğrudur: Kutupsal koordinat sisteminde iki bağımsız rastgele değişken (bir açı düzgün olarak dağıtılmış ve bir yarıçap üstel olarak dağıtılmış) kullanarak bir nokta tanımlarsanız, o zaman bu noktanın dikdörtgen koordinatları bağımsız normal rastgele değişkenler olacaktır. Ve aynı ters dönüşüm yöntemini kullanarak tekdüze bir dağılımdan üstel bir dağılım elde etmek çok daha kolaydır. Polar Box-Muller yönteminin özü budur.
Şimdi formülleri türetelim.

(1)

r ve θ'yı elde etmek için, (0, 1) aralığında eşit olarak dağılmış iki rastgele değişken üretmemiz gerekir (bunlara u ve v diyelim), bunlardan birinin dağılımının (diyelim v) üstel değişkene dönüştürülmesi gerekir: yarıçapı elde edin. Üstel dağılım fonksiyonu şuna benzer:

Ters fonksiyonu:

Düzgün dağılım simetrik olduğundan dönüşüm, fonksiyonla benzer şekilde çalışacaktır.

Ki-kare dağılım formülünden λ = 0,5 sonucu çıkar. Bu fonksiyonda λ, v'yi yerine koyun ve yarıçapın karesini ve ardından yarıçapın kendisini alın:

Birim parçasını 2π'ye kadar uzatarak açıyı elde ederiz:

Şimdi r ve θ'yı formül (1)'de yerine koyarız ve şunu elde ederiz:

(2)

Bu formüller zaten kullanıma hazır. X ve Y bağımsız olacak ve varyansı 1 ve matematiksel beklentisi 0 olacak şekilde normal dağılacaktır. Diğer özelliklere sahip bir dağılım elde etmek için fonksiyonun sonucunu standart sapma ile çarpmak ve matematiksel beklentiyi eklemek yeterlidir.
Ancak açıyı doğrudan değil, daire içindeki rastgele bir noktanın dikdörtgen koordinatları üzerinden dolaylı olarak belirleyerek trigonometrik fonksiyonlardan kurtulmak mümkündür. Daha sonra bu koordinatlar aracılığıyla yarıçap vektörünün uzunluğunu hesaplamak ve ardından sırasıyla x ve y'yi buna bölerek kosinüs ve sinüsü bulmak mümkün olacaktır. Nasıl ve neden çalışıyor?
Birim yarıçaplı bir çemberde düzgün dağılmış noktalardan rastgele bir nokta seçelim ve bu noktanın yarıçap vektörünün uzunluğunun karesini s harfiyle gösterelim:

Seçim, (-1, 1) aralığında eşit olarak dağıtılmış rastgele dikdörtgen x ve y koordinatları belirtilerek ve daireye ait olmayan noktaların yanı sıra yarıçap vektörünün açısının bulunduğu merkezi nokta atılarak yapılır. tanımlanmamıştır. Yani koşul 0'ın karşılanması gerekir< s < 1. Тогда, как и в случае с Гауссовским распределением на плоскости, угол θ будет распределен равномерно. Это очевидно - количество точек в каждом направлении одинаково, значит каждый угол равновероятен. Но есть и менее очевидный факт - s тоже будет иметь равномерное распределение. Полученные s и θ будут независимы друг от друга. Поэтому мы можем воспользоваться значением s для получения экспоненциального распределения, не генерируя третью случайную величину. Подставим теперь s в формулы (2) вместо v, а вместо тригонометрических функций - их расчет делением координаты на длину радиус-вектора, которая в данном случае является корнем из s:

Formülleri yazının başındaki gibi alıyoruz. Bu yöntemin dezavantajı daireye dahil olmayan noktaların atılmasıdır. Yani, oluşturulan rastgele değişkenlerin yalnızca %78,5'i kullanılıyor. Eski bilgisayarlarda trigonometri fonksiyonlarının olmaması hâlâ büyük bir avantajdı. Şimdi, bir işlemci komutu hem sinüs hem de kosinüsü anında hesapladığında, bu yöntemlerin hâlâ rekabet edebileceğini düşünüyorum.

Kişisel olarak hala iki sorum var:

  • S'nin değeri neden eşit olarak dağıtılıyor?
  • İki normal rastgele değişkenin karelerinin toplamı neden üstel olarak dağıtılıyor?
s yarıçapın karesi olduğundan (basitlik açısından, yarıçapı rastgele bir noktanın konumunu tanımlayan yarıçap vektörünün uzunluğu olarak adlandırıyorum), önce yarıçapların nasıl dağıldığını buluyoruz. Daire eşit olarak doldurulduğu için yarıçapı r olan noktaların sayısının r yarıçaplı dairenin uzunluğuyla orantılı olduğu açıktır. Ve dairenin çevresi yarıçapıyla orantılıdır. Bu, yarıçapların dağılım yoğunluğunun dairenin merkezinden kenarlarına doğru eşit şekilde arttığı anlamına gelir. Yoğunluk fonksiyonu ise (0, 1) aralığında f(x) = 2x formundadır. Katsayı 2, böylece grafiğin altındaki şeklin alanı bire eşit olur. Bu yoğunluğun karesi alındığında tekdüze hale gelir. Teorik olarak bu durumda yoğunluk fonksiyonunu dönüşüm fonksiyonunun türevine (yani x 2) bölmek gerekir. Ve açıkça şu şekilde oluyor:

Normal bir rastgele değişken için benzer bir dönüşüm yapılırsa, karesinin yoğunluk fonksiyonu bir hiperbole benzer olacaktır. Ve normal rastgele değişkenlerin iki karesinin eklenmesi zaten çift entegrasyonla ilişkili çok daha karmaşık bir süreçtir. Ve kişisel olarak sonucun üstel bir dağılım olacağı gerçeğinin pratik bir yöntemle doğrulanması veya bir aksiyom olarak kabul edilmesi gerekiyor. Ve ilgilenenler için konuya daha yakından bakmanızı, şu kitaplardan bilgi edinmenizi öneririm:

  • Ventzel E.S. Olasılık teorisi
  • Knut D.E. Programlama Sanatı, Cilt 2

Sonuç olarak, burada normal olarak dağıtılmış bir rastgele sayı üretecinin JavaScript'te uygulanmasına bir örnek verilmiştir:

Function Gauss() ( var hazır = false; var saniye = 0,0; this.next = function(mean, dev) ( ortalama = ortalama == tanımsız ? 0,0: ortalama; dev = dev == tanımsız ? 1,0: dev; if ( this.ready) ( this.ready = false; return this.second * dev + ortalama; ) else ( var u, v, s; do ( u = 2,0 * Math.random() - 1,0; v = 2,0 * Math. rastgele() - 1.0; s = u * u + v * v; while (s > 1.0 || s == 0.0); this.second = r * u; return r * v * dev + ortalama ) ) g = yeni Gauss(); // bir nesne yarat a = g.next(); // bir değer çifti oluşturup ilkini elde ediyoruz b = g.next(); // ikinciyi al c = g.next(); // tekrar bir değer çifti oluşturup ilkini elde ediyoruz
Ortalama (matematiksel beklenti) ve dev (standart sapma) parametreleri isteğe bağlıdır. Logaritmanın doğal olduğuna dikkatinizi çekerim.

Düzgün bir sürekli dağılım düşünün. Matematiksel beklenti ve varyansı hesaplayalım. MS EXCEL fonksiyonunu kullanarak rastgele değerler üretelimRAND() ve Analiz Paketi eklentileri ile ortalama değeri ve standart sapmayı tahmin edeceğiz.

Eşit olarak dağıtılmış segmentte rastgele değişkenin sahip olduğu:

Aralıktan 50 sayıdan oluşan bir dizi oluşturalım)

Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!