Sürekli bir rastgele değişkenin düzgün dağılımının grafiği. Sürekli bir rastgele değişkenin tekdüze ve üstel dağılım yasaları

Bu konu uzun süredir ayrıntılı olarak çalışılmaktadır ve en yaygın kullanılan yöntem, George Box, Mervyn Muller ve George Marsaglia tarafından 1958'de önerilen kutupsal koordinat yöntemidir. Bu yöntem, matematiksel beklentisi 0 ve varyansı 1 olan bir çift bağımsız normal dağılımlı rastgele değişken elde etmenizi sağlar:

Z 0 ve Z 1 istenen değerler olduğunda, s = u 2 + v 2 ve u ve v, (-1, 1) aralığında düzgün şekilde dağıtılan ve 0 koşulu sağlanacak şekilde seçilen rastgele değişkenlerdir.< s < 1.
Pek çok kişi bu formülleri hiç düşünmeden kullanıyor ve çoğu da hazır uygulamaları kullandığı için varlığından bile şüphelenmiyor. Ancak şu soruyu soranlar da var: “Bu formül nereden çıktı? Peki neden aynı anda birkaç miktar alıyorsunuz?” Daha sonra bu sorulara net bir cevap vermeye çalışacağım.


Başlangıç ​​olarak olasılık yoğunluğunun, rastgele değişkenin dağılım fonksiyonunun ve ters fonksiyonun ne olduğunu hatırlatayım. Dağılımı f(x) yoğunluk fonksiyonu ile belirlenen ve aşağıdaki forma sahip olan belirli bir rastgele değişkenin olduğunu varsayalım:

Bu, belirli bir rastgele değişkenin değerinin (A, B) aralığında olma olasılığının taralı alanın alanına eşit olduğu anlamına gelir. Ve sonuç olarak, tüm gölgeli alanın alanı bire eşit olmalıdır, çünkü her durumda rastgele değişkenin değeri f fonksiyonunun tanım alanına girecektir.
Bir rastgele değişkenin dağılım fonksiyonu yoğunluk fonksiyonunun integralidir. Ve bu durumda yaklaşık görünümü şöyle olacaktır:

Buradaki anlam, rasgele değişkenin değerinin B olasılığı ile A'dan küçük olacağıdır. Sonuç olarak fonksiyon asla azalmaz ve değerleri aralıkta yer alır.

Ters fonksiyon, orijinal fonksiyonun değeri kendisine iletildiğinde orijinal fonksiyona bir argüman döndüren bir fonksiyondur. Örneğin, x 2 fonksiyonu için bunun tersi kök çıkarma fonksiyonudur, sin(x) için ise arcsin(x), vb.'dir.

Sahte rasgele sayı üreteçlerinin çoğu çıktı olarak yalnızca tekdüze bir dağılım ürettiğinden, genellikle onu başka bir dağılıma dönüştürme ihtiyacı vardır. Bu durumda normal Gaussian'a göre:

Düzgün bir dağılımı diğerine dönüştürmeye yönelik tüm yöntemlerin temeli, ters dönüşüm yöntemidir. Aşağıdaki gibi çalışır. Gerekli dağılımın fonksiyonuna ters olan bir fonksiyon bulunur ve (0, 1) aralığında düzgün bir şekilde dağıtılan bir rastgele değişken argüman olarak ona iletilir. Çıktıda gerekli dağılıma sahip bir değer elde ederiz. Netlik sağlamak için aşağıdaki resmi sunuyorum.

Böylece, yeni dağılıma göre tekdüze bir parça sanki bulaşmış gibi, ters bir fonksiyonla başka bir eksene yansıtılıyor. Ancak sorun şu ki, Gauss dağılımının yoğunluğunun integralini hesaplamak kolay olmadığından yukarıdaki bilim adamları hile yapmak zorunda kaldı.

K bağımsız normal rastgele değişkenin karelerinin toplamının dağılımı olan bir ki-kare dağılımı (Pearson dağılımı) vardır. Ve k = 2 durumunda bu dağılım üsteldir.

Bu, dikdörtgen koordinat sistemindeki bir noktanın normal olarak dağıtılmış rastgele X ve Y koordinatlarına sahip olması durumunda, bu koordinatları kutup sistemine (r, θ) dönüştürdükten sonra, yarıçapın karesinin (başlangıç ​​noktasından noktaya olan mesafe) olduğu anlamına gelir. Yarıçapın karesi koordinatların karelerinin toplamı olduğundan (Pisagor yasasına göre) üstel yasaya göre dağıtılacaktır. Düzlemdeki bu tür noktaların dağılım yoğunluğu şöyle görünecektir:


Tüm yönlerde eşit olduğundan, θ açısı 0 ila 2π aralığında düzgün bir dağılıma sahip olacaktır. Bunun tersi de doğrudur: Kutupsal koordinat sisteminde iki bağımsız rastgele değişken (bir açı düzgün olarak dağıtılmış ve bir yarıçap üstel olarak dağıtılmış) kullanarak bir nokta tanımlarsanız, o zaman bu noktanın dikdörtgen koordinatları bağımsız normal rastgele değişkenler olacaktır. Ve aynı ters dönüşüm yöntemini kullanarak tekdüze bir dağılımdan üstel bir dağılım elde etmek çok daha kolaydır. Polar Box-Muller yönteminin özü budur.
Şimdi formülleri türetelim.

(1)

r ve θ'yı elde etmek için, (0, 1) aralığında eşit olarak dağılmış iki rastgele değişken üretmemiz gerekir (bunlara u ve v diyelim), bunlardan birinin dağılımının (diyelim v) üstel değişkene dönüştürülmesi gerekir: yarıçapı elde edin. Üstel dağılım fonksiyonu şuna benzer:

Ters fonksiyonu:

Düzgün dağılım simetrik olduğundan dönüşüm, fonksiyonla benzer şekilde çalışacaktır.

Ki-kare dağılım formülünden λ = 0,5 sonucu çıkar. Bu fonksiyonda λ, v'yi yerine koyun ve yarıçapın karesini ve ardından yarıçapın kendisini alın:

Birim parçasını 2π'ye kadar uzatarak açıyı elde ederiz:

Şimdi r ve θ'yı formül (1)'de yerine koyarız ve şunu elde ederiz:

(2)

Bu formüller zaten kullanıma hazır. X ve Y bağımsız olacak ve varyansı 1 ve matematiksel beklentisi 0 olacak şekilde normal dağılacaktır. Diğer özelliklere sahip bir dağılım elde etmek için fonksiyonun sonucunu standart sapma ile çarpmak ve matematiksel beklentiyi eklemek yeterlidir.
Ancak açıyı doğrudan değil, daire içindeki rastgele bir noktanın dikdörtgen koordinatları üzerinden dolaylı olarak belirleyerek trigonometrik fonksiyonlardan kurtulmak mümkündür. Daha sonra bu koordinatlar aracılığıyla yarıçap vektörünün uzunluğunu hesaplamak ve ardından sırasıyla x ve y'yi buna bölerek kosinüs ve sinüsü bulmak mümkün olacaktır. Nasıl ve neden çalışıyor?
Birim yarıçaplı bir çemberde düzgün dağılmış noktalardan rastgele bir nokta seçelim ve bu noktanın yarıçap vektörünün uzunluğunun karesini s harfiyle gösterelim:

Seçim, (-1, 1) aralığında eşit olarak dağıtılmış rastgele dikdörtgen x ve y koordinatları belirtilerek ve daireye ait olmayan noktaların yanı sıra yarıçap vektörünün açısının bulunduğu merkezi nokta atılarak yapılır. tanımlanmamıştır. Yani koşul 0'ın karşılanması gerekir< s < 1. Тогда, как и в случае с Гауссовским распределением на плоскости, угол θ будет распределен равномерно. Это очевидно - количество точек в каждом направлении одинаково, значит каждый угол равновероятен. Но есть и менее очевидный факт - s тоже будет иметь равномерное распределение. Полученные s и θ будут независимы друг от друга. Поэтому мы можем воспользоваться значением s для получения экспоненциального распределения, не генерируя третью случайную величину. Подставим теперь s в формулы (2) вместо v, а вместо тригонометрических функций - их расчет делением координаты на длину радиус-вектора, которая в данном случае является корнем из s:

Formülleri yazının başındaki gibi alıyoruz. Bu yöntemin dezavantajı daireye dahil olmayan noktaların atılmasıdır. Yani, oluşturulan rastgele değişkenlerin yalnızca %78,5'i kullanılıyor. Eski bilgisayarlarda trigonometri fonksiyonlarının olmaması hâlâ büyük bir avantajdı. Şimdi, bir işlemci komutu hem sinüs hem de kosinüsü anında hesapladığında, bu yöntemlerin hâlâ rekabet edebileceğini düşünüyorum.

Kişisel olarak hâlâ iki sorum var:

  • S'nin değeri neden eşit olarak dağıtılıyor?
  • İki normal rastgele değişkenin karelerinin toplamı neden üstel olarak dağıtılıyor?
s yarıçapın karesi olduğundan (basitlik açısından, yarıçapı rastgele bir noktanın konumunu belirten yarıçap vektörünün uzunluğu olarak adlandırıyorum), önce yarıçapların nasıl dağıldığını buluyoruz. Daire eşit olarak doldurulduğu için yarıçapı r olan noktaların sayısının r yarıçaplı dairenin uzunluğuyla orantılı olduğu açıktır. Ve dairenin çevresi yarıçapıyla orantılıdır. Bu, yarıçapların dağılım yoğunluğunun dairenin merkezinden kenarlarına doğru eşit şekilde arttığı anlamına gelir. Yoğunluk fonksiyonu ise (0, 1) aralığında f(x) = 2x formundadır. Katsayı 2, böylece grafiğin altındaki şeklin alanı bire eşit olur. Böyle bir yoğunluğun karesi alındığında tekdüze hale gelir. Teorik olarak bu durumda yoğunluk fonksiyonunu dönüşüm fonksiyonunun türevine (yani x 2) bölmek gerekir. Ve açıkça şu şekilde oluyor:

Normal bir rastgele değişken için benzer bir dönüşüm yapılırsa, karesinin yoğunluk fonksiyonu bir hiperbole benzer olacaktır. Ve normal rastgele değişkenlerin iki karesinin eklenmesi, çift entegrasyonla ilişkili çok daha karmaşık bir süreçtir. Ve sonucun üstel bir dağılım olacağı gerçeğini şahsen sadece pratik bir yöntem kullanarak kontrol etmem veya bir aksiyom olarak kabul etmem gerekiyor. İlgilenenler için konuya daha yakından bakmanızı, şu kitaplardan bilgi edinmenizi öneririm:

  • Ventzel E.S. Olasılık teorisi
  • Knut D.E. Programlama Sanatı, Cilt 2

Sonuç olarak, burada normal olarak dağıtılmış bir rastgele sayı üretecinin JavaScript'te uygulanmasına bir örnek verilmiştir:

Function Gauss() ( var hazır = false; var saniye = 0,0; this.next = function(mean, dev) ( ortalama = ortalama == tanımsız ? 0,0: ortalama; dev = dev == tanımsız ? 1,0: dev; if ( this.ready) ( this.ready = false; return this.second * dev + ortalama; ) else ( var u, v, s; do ( u = 2,0 * Math.random() - 1,0; v = 2,0 * Math. rastgele() - 1.0; s = u * u + v * v; while (s > 1.0 || s == 0.0); this.second = r * u; return r * v * dev + ortalama )) g = yeni Gauss(); // bir nesne yarat a = g.next(); // bir değer çifti oluşturup ilkini elde ediyoruz b = g.next(); // ikinciyi al c = g.next(); // tekrar bir değer çifti oluşturup ilkini elde ediyoruz
Ortalama (matematiksel beklenti) ve dev (standart sapma) parametreleri isteğe bağlıdır. Logaritmanın doğal olduğuna dikkatinizi çekerim.

Sürekli rastgele değişkene örnek olarak, (a; b) aralığı boyunca düzgün şekilde dağılmış bir X rastgele değişkenini düşünün. Rastgele değişken X'in olduğu söyleniyor eşit olarak dağıtılmış (a; b) aralığında, eğer dağılım yoğunluğu bu aralıkta sabit değilse:

Normalleştirme koşulundan c sabitinin değerini belirleriz. Dağılım yoğunluk eğrisinin altındaki alan birliğe eşit olmalıdır, ancak bizim durumumuzda tabanı (b - α) ve yüksekliği c olan bir dikdörtgenin alanıdır (Şekil 1).

Pirinç. 1 Düzgün dağıtım yoğunluğu
Buradan c sabitinin değerini buluruz:

Dolayısıyla, düzgün dağılmış bir rastgele değişkenin yoğunluğu şuna eşittir:

Şimdi aşağıdaki formülü kullanarak dağıtım fonksiyonunu bulalım:
1) için
2) için
3) 0+1+0=1 için.
Böylece,

Dağıtım fonksiyonu süreklidir ve azalmaz (Şekil 2).

Pirinç. 2 Düzgün dağıtılmış bir rastgele değişkenin dağılım fonksiyonu

bulacağız düzgün dağılmış bir rastgele değişkenin matematiksel beklentisi formüle göre:

Düzgün dağılımın dağılımı formülle hesaplanır ve eşittir

Örnek No.1. Ölçüm cihazının ölçek bölme değeri 0,2'dir. Cihaz okumaları en yakın tam bölüme yuvarlanır. Sayım sırasında hata yapılma olasılığını bulun: a) 0,04'ten az; b) büyük 0,02
Çözüm. Yuvarlama hatası, bitişik tamsayı bölümleri arasındaki aralığa eşit olarak dağıtılan rastgele bir değişkendir. (0; 0.2) aralığını böyle bir bölme olarak ele alalım (Şekil a). Yuvarlama hem sol kenarlığa doğru - 0, hem de sağa - 0,2 yapılabilir; bu, 0,04'ten küçük veya ona eşit bir hatanın iki kez yapılabileceği anlamına gelir; bu, olasılık hesaplanırken dikkate alınmalıdır:



P = 0,2 + 0,2 = 0,4

İkinci durumda ise hata değeri her iki bölme sınırında da 0,02'yi aşabilir, yani 0,02'den büyük veya 0,18'den küçük olabilir.


O zaman şöyle bir hata olasılığı:

Örnek No. 2. Ülkedeki ekonomik durumun son 50 yıldaki istikrarının (savaşların olmaması, doğal afetler vb.), yaşa göre nüfus dağılımının niteliğine göre değerlendirilebileceği varsayılmıştır: sakin bir durumda olması gerekir üniforma. Çalışma sonucunda ülkelerden biri için aşağıdaki veriler elde edildi.

Ülkede istikrarsızlık olduğuna inanmak için herhangi bir neden var mı?

Çözümü bir hesap makinesi kullanarak hipotezleri test ediyoruz.. Göstergelerin hesaplanması için tablo.

GruplarAralığın orta noktası, x iMiktar, f ix ben * f benBirikmiş frekans, S|x - x ort |*f(x - x ort.) 2 *fFrekans, f i / n
0 - 10 5 0.14 0.7 0.14 5.32 202.16 0.14
10 - 20 15 0.09 1.35 0.23 2.52 70.56 0.09
20 - 30 25 0.1 2.5 0.33 1.8 32.4 0.1
30 - 40 35 0.08 2.8 0.41 0.64 5.12 0.08
40 - 50 45 0.16 7.2 0.57 0.32 0.64 0.16
50 - 60 55 0.13 7.15 0.7 1.56 18.72 0.13
60 - 70 65 0.12 7.8 0.82 2.64 58.08 0.12
70 - 80 75 0.18 13.5 1 5.76 184.32 0.18
1 43 20.56 572 1
Dağıtım merkezi göstergeleri.
Ağırlıklı ortalama


Değişim göstergeleri.
Mutlak varyasyonlar.
Değişim aralığı, birincil seri karakteristiğinin maksimum ve minimum değerleri arasındaki farktır.
R = X maks - X min
R = 70 - 0 = 70
Dağılım- ortalama değeri etrafındaki dağılım ölçüsünü karakterize eder (bir dağılım ölçüsü, yani ortalamadan sapma).


Standart sapma.

Serinin her değeri ortalama 43 değerinden 23,92'den fazla farklılık göstermez.
Dağıtım türüne ilişkin hipotezlerin test edilmesi.
4. Hipotezin test edilmesi düzgün dağılım genel nüfus.
X'in düzgün dağılımı hakkındaki hipotezi test etmek için, yani. kanuna göre: (a,b) aralığında f(x) = 1/(b-a)
gerekli:
1. a ve b parametrelerini tahmin edin - formülleri kullanarak olası X değerlerinin gözlemlendiği aralığın uçları (* işareti parametre tahminlerini gösterir):

2. Beklenen f(x) = 1/(b * - a *) dağılımının olasılık yoğunluğunu bulun.
3. Teorik frekansları bulun:
n 1 = nP 1 = n = n*1/(b * - a *)*(x 1 - a *)
n 2 = n 3 = ... = n s-1 = n*1/(b * - a *)*(x i - x i-1)
n s = n*1/(b * - a *)*(b * - x s-1)
4. Serbestlik derecesi sayısını k = s-3 alarak Pearson kriterini kullanarak ampirik ve teorik frekansları karşılaştırın; burada s, başlangıçtaki örnekleme aralıklarının sayısıdır; küçük frekansların ve dolayısıyla aralıkların bir kombinasyonu gerçekleştirilmişse, o zaman s, kombinasyondan sonra kalan aralıkların sayısıdır.

Çözüm:
1. Aşağıdaki formülleri kullanarak düzgün dağılımın a * ve b * parametrelerinin tahminlerini bulun:


2. Varsayılan tekdüze dağılımın yoğunluğunu bulun:
f(x) = 1/(b * - a *) = 1/(84,42 - 1,58) = 0,0121
3. Teorik frekansları bulalım:
n 1 = n*f(x)(x 1 - a *) = 1 * 0,0121(10-1,58) = 0,1
n 8 = n*f(x)(b * - x 7) = 1 * 0,0121(84,42-70) = 0,17
Geriye kalan n'ler şuna eşit olacaktır:
n s = n*f(x)(x i - x i-1)

Benn benhayırn ben - n * ben(n ben - n* ben) 2(n ben - n * i) 2 /n * i
1 0.14 0.1 0.0383 0.00147 0.0144
2 0.09 0.12 -0.0307 0.000943 0.00781
3 0.1 0.12 -0.0207 0.000429 0.00355
4 0.08 0.12 -0.0407 0.00166 0.0137
5 0.16 0.12 0.0393 0.00154 0.0128
6 0.13 0.12 0.0093 8.6E-5 0.000716
7 0.12 0.12 -0.000701 0 4.0E-6
8 0.18 0.17 0.00589 3.5E-5 0.000199
Toplam 1 0.0532
Kritik bölgenin sınırını belirleyelim. Pearson istatistiği ampirik ve teorik dağılımlar arasındaki farkı ölçtüğünden, gözlemlenen K obs değeri ne kadar büyük olursa, ana hipoteze karşı argüman o kadar güçlü olur.
Bu nedenle, bu istatistik için kritik bölge her zaman sağ taraftadır: eğer bu segmentte rastgele değişkenin olasılık dağılım yoğunluğu sabitse, yani diferansiyel dağılım fonksiyonu ise f(x) aşağıdaki forma sahiptir:

Bu dağıtıma bazen denir düzgün yoğunluk kanunu. Belirli bir segmentte düzgün bir dağılıma sahip bir miktar hakkında, bu segmentte düzgün bir şekilde dağıldığını söyleyeceğiz.

c sabitinin değerini bulalım. Alan dağılım eğrisi ve eksen tarafından sınırlandığından Ah, 1'e eşitse, o zaman

Neresi İle=1/(B-A).

Şimdi fonksiyon f(x)şeklinde temsil edilebilir

Dağıtım fonksiyonunu oluşturalım F(x ), neden için bir ifade buluyoruz? F(x) aralığında [ a, b]:


f(x) ve F(x) fonksiyonlarının grafikleri şöyle görünür:


Sayısal özelliklerini bulalım.

NSV'nin matematiksel beklentisini hesaplamak için formülü kullanarak şunları elde ederiz:

Böylece, bir rastgele değişkenin matematiksel beklentisi [a, b] bu segmentin ortasıyla çakışıyor.

Düzgün dağılmış bir rastgele değişkenin varyansını bulalım:

buradan standart sapmanın hemen takip ettiği sonuç:

Şimdi düzgün dağılıma sahip bir rastgele değişkenin değerinin aralığa düşme olasılığını bulalım.(a, b), tamamen segmente ait [A,B ]:


Geometrik olarak bu olasılık, gölgeli dikdörtgenin alanıdır. Sayılar A VeBdenir dağıtım parametreleri Ve tekdüze bir dağılımı benzersiz bir şekilde belirler.

Örnek 1. Bazı güzergahlardaki otobüsler kesinlikle programa göre çalışır. Hareket aralığı 5 dakikadır. Bir yolcunun durağa yaklaşma olasılığını bulunuz. Bir sonraki otobüsün bekleme süresi 3 dakikadan az olacaktır.

Çözüm:

CB-bus bekleme süresi düzgün bir dağılıma sahiptir. O zaman gerekli olasılık şuna eşit olacaktır:

Örnek 2. Küp x'in kenarı yaklaşık olarak ölçülür. Dahası

Bir küpün kenarının aralıkta düzgün dağılmış bir rastgele değişken olarak ele alınması (A,B), küpün hacminin matematiksel beklentisini ve varyansını bulun.

Çözüm:

Bir küpün hacmi Y = X 3 ifadesiyle belirlenen rastgele bir değişkendir. O halde matematiksel beklenti şudur:

Dağılım:

Çevrimiçi hizmet:

Rastgele bir değişkenin tüm değerlerinin (var olduğu bölgede, örneğin aralıkta) eşit derecede muhtemel olduğu bir dağılım tekdüze kabul edilir. Böyle bir rastgele değişkenin dağılım fonksiyonu şu şekildedir:

Dağıtım yoğunluğu:

1

Pirinç. Dağıtım fonksiyonunun (solda) ve dağıtım yoğunluğunun (sağda) grafikleri.

Düzgün dağıtım - kavram ve türleri. "Tek tip dağıtım" kategorisinin sınıflandırılması ve özellikleri 2017, 2018.

  • - Düzgün dağıtım

    Rastgele değişkenlerin temel ayrık dağılımları Tanım 1. 1, 2, ..., n değerlerini alan bir X rastgele değişkeni, Pm = P(X = m) = 1/n, m = 1 ise düzgün bir dağılıma sahiptir, ..., N.


  • - Düzgün dağıtım

    Açıkça. Aşağıdaki problemi düşünün. Torbada M'si beyaz olan N top var... .


  • - Düzgün dağıtım

    Sürekli rastgele değişkenlerin dağılım yasaları Tanım 5. Aralıkta bir değer alan sürekli bir rastgele değişken X, eğer dağılım yoğunluğu şu şekilde ise düzgün bir dağılıma sahiptir. (1) Bunu doğrulamak kolaydır, .


  • - Düzgün dağıtım

    Eğer rastgele bir değişkense... .< b; a и b – это параметры равномерного закона. Найдем функцию распределения F(x)... .


  • - Düzgün dağıtım

    Rastgele bir değişkenin tüm değerlerinin (var olduğu bölgede, örneğin aralıkta) eşit derecede muhtemel olduğu bir dağılım tekdüze kabul edilir. Böyle bir rastgele değişken için dağılım fonksiyonu şu şekildedir: Dağılım yoğunluğu: F(x) f(x) 1 0 a b x 0 a b x ... .


  • - Düzgün dağıtım

    Normal dağılım kanunları Düzgün, üstel ve Tekdüze kanunun olasılık yoğunluk fonksiyonu aşağıdaki gibidir: (10.17) a ve b sayıları verildiğinde, a

  • Düzgün olasılık dağılımı en basit olanıdır ve kesikli veya sürekli olabilir. Ayrık bir düzgün dağılım, SV değerlerinin her birinin olasılığının aynı olduğu bir dağılımdır, yani: burada N sayıdır... .Tanım 16. Sürekli bir rastgele değişken, eğer bu rastgele değişkenin dağılım yoğunluğu bu parça üzerinde sabitse ve onun dışında sıfıra eşitse, yani (45) parça üzerinde düzgün bir dağılıma sahiptir. Düzgün bir dağılım için yoğunluk grafiği gösterilmektedir... Düzgün bir sürekli dağılım düşünün. Matematiksel beklenti ve varyansı hesaplayalım. MS EXCEL fonksiyonunu kullanarak rastgele değerler üretelim

    RAND() ve Analiz Paketi eklentileri ile ortalama değeri ve standart sapmayı tahmin edeceğiz.

    Eşit olarak dağıtılmış

    segmentte rastgele değişkenin sahip olduğu: Aralıktan 50 sayıdan oluşan bir dizi oluşturalım)