Olasılık dağılımının normal kanunu. Normal dağılım

Normal dağılım(Gauss dağılımı) her zaman oynandı merkezi rol Olasılık teorisinde, birçok faktörün etkisi sonucu çok sık meydana geldiğinden, herhangi birinin katkısı ihmal edilebilir düzeydedir. Merkezi Limit Teoremi (CLT) hemen hemen her alanda uygulama bulur. uygulamalı bilimler istatistiksel aygıtı evrensel hale getiriyor. Bununla birlikte, kullanımının imkansız olduğu çok sık durumlar vardır ve araştırmacılar, sonuçların Gaussian'a uygunluğunu mümkün olan her şekilde organize etmeye çalışırlar. bu yaklaşık alternatif yaklaşım Eğer dağılım birçok faktörden etkileniyorsa şimdi anlatacağım.

CPT'nin kısa tarihi. Newton hala hayattayken Abraham de Moivre, bir dizideki bir olayın merkezlenmiş ve normalleştirilmiş gözlem sayısının yakınsamasına ilişkin bir teoremi kanıtladı. bağımsız testler normal bir dağılıma 19. yüzyıl boyunca ve 20. yüzyılın başlarında bu teorem genellemeler için bilimsel bir model olarak hizmet etti. Laplace davayı kanıtladı düzgün dağılım, Poisson – yerel teorem Farklı olasılıklara sahip bir durum için. Poincaré, Legendre ve Gauss zengin bir gözlem hataları teorisi ve bir yöntem geliştirdiler en küçük kareler hataların normal dağılıma yakınsamasına dayanır. Chebyshev toplam için daha da güçlü bir teorem kanıtladı rastgele değişkenler, anlar yöntemini geliştirdik. 1900 yılında Lyapunov, Chebyshev ve Markov'a dayanarak CLT'nin şu anki haliyle kanıtladı, ancak yalnızca üçüncü dereceden momentlerin varlığıyla. Ve ancak 1934'te Feller, ikinci dereceden anların varlığının hem gerekli hem de gerekli olduğunu göstererek buna son verdi. yeterli koşul.

CLT şu şekilde formüle edilebilir: Eğer rastgele değişkenler bağımsızsa, aynı şekilde dağılmışsa ve sıfırdan farklı sonlu bir varyansa sahipse, bu değişkenlerin toplamları (merkezlenmiş ve normalleştirilmiş) normal yasaya yakınsar. Bu teorem üniversitelerde bu biçimde öğretilmekte ve matematikte profesyonel olmayan gözlemciler ve araştırmacılar tarafından sıklıkla kullanılmaktadır. Bunda yanlış olan ne? Aslında teorem, Gauss, Poincaré, Chebyshev ve 19. yüzyılın diğer dehalarının üzerinde çalıştığı alanlara, yani gözlem hataları teorisine, istatistiksel fizik, çokuluslu şirketler, demografik araştırmalar ve belki başka bir şey. Ancak keşifler için özgünlükten yoksun bilim adamları, genellemelerle meşguller ve bu teoremi her şeye uygulamak istiyorlar ya da normal dağılımı, var olamayacağı bir yere sürüklemek istiyorlar. Örnek istersen bende var.

Zeka bölümü IQ. Başlangıçta insanların zekasının normal şekilde dağıldığını ima eder. Olağanüstü yeteneklerin dikkate alınmadığı, aynı pay faktörleriyle ayrı ayrı dikkate alındığı şekilde önceden hazırlanmış bir test yapılır: mantıksal düşünme zihinsel tasarım, hesaplama yetenekleri, soyut düşünme ve başka bir şey. Çoğu kişinin erişemediği sorunları çözme yeteneği veya bir testi süper hızlı bir sürede geçme yeteneği hiçbir şekilde dikkate alınmaz ve testi daha erken geçmek, gelecekte sonucu (ancak zekayı değil) artırır. Ve sonra cahiller "hiç kimsenin onlardan iki kat daha akıllı olamayacağına" inanıyorlar, "hadi bunu akıllı insanlardan alıp bölelim."

İkinci örnek: finansal göstergelerdeki değişiklikler. Hisse senedi fiyatlarındaki, döviz kurlarındaki ve emtia opsiyonlarındaki değişiklikleri araştırmak bir cihazın kullanımını gerektirir matematiksel istatistik ve özellikle burada dağıtım türü konusunda hata yapmamak önemlidir. Önemli bir durum: 1997'de Nobel Ödülü Ekonomi alanında, stok göstergelerinin büyüme normal dağılımı varsayımına dayanan Black-Scholes modelinin önerisi için ödeme yapıldı (sözde beyaz gürültü). Ancak yazarlar şunu açıkça belirtmişlerdir: bu model açıklığa kavuşturulması gerekiyor, ancak sonraki araştırmacıların çoğunun yapmaya karar verdiği tek şey Poisson dağılımını normal dağılıma eklemekti. Burada, uzun zaman serilerini incelerken açıkçası yanlışlıklar olacaktır, çünkü Poisson dağılımı CLT'yi çok iyi karşılamaktadır ve zaten 20 terimle normal dağılımdan ayırt edilemez. Aşağıdaki resme bakın (ve bu çok ciddi bir ekonomi dergisindendir), epeyce olmasına rağmen şunu gösteriyor: büyük sayı gözlemler ve bariz çarpıklıklar nedeniyle, dağılımın normalliği hakkında bir varsayımda bulunulur.

Dağılımların normal olmayacağı çok açık ücretlerşehrin nüfusu, diskteki dosyaların boyutu, şehirlerin ve ülkelerin nüfusu arasında.

Bu örneklerdeki dağılımların ortak noktası, "ağır kuyruk" olarak adlandırılan, yani ortalamanın çok uzağında yer alan değerlerin ve genellikle sağa doğru gözle görülür bir asimetrinin varlığıdır. Normalin yanı sıra başka dağılımların neler olabileceğini düşünelim. Daha önce bahsedilen Poisson ile başlayalım: bir kuyruğu var, ancak yasanın her birinde gözlemlendiği bir grup grup için tekrarlanmasını istiyoruz (bir işletme için dosyaların boyutunu, birkaç şehir için maaşları hesaplayın) veya ölçekli (Black - Scholes model aralığını keyfi olarak artırın veya azaltın), gözlemlerin gösterdiği gibi, kuyruklar ve asimetri kaybolmaz, ancak CLP'ye göre Poisson dağılımı normal hale gelmelidir. Aynı nedenlerden dolayı Erlang, beta, lognormal ve dağılım dağılımlarına sahip diğerlerinin tümü uygun değildir. Geriye kalan tek şey Pareto dağılımını kesmektir ancak modun ile çakışması nedeniyle uygun değildir. minimum değerÖrnek verileri analiz ederken neredeyse hiç oluşmayan bir durum.

Sahip olan dağılımlar gerekli özellikler, mevcut ve kararlı dağılımlar olarak adlandırılıyor. Tarihleri ​​de çok ilginçtir ve ana teorem, Feller'in çalışmasından bir yıl sonra, 1935'te ortak çabalarla kanıtlanmıştır. Fransız matematikçi Paul Levy ve Sovyet matematikçi A.Ya. Khinchin. CLT genelleştirildi; dağılımın varlığı koşulu kaldırıldı. Normalin aksine, kararlı rastgele değişkenlerin ne yoğunluğu ne de dağılım fonksiyonu ifade edilir (aşağıda tartışılan nadir istisnalar dışında, onlar hakkında bilinen tek şey karakteristik fonksiyondur (); ters dönüşüm Fourier dağılım yoğunluğu, ancak özünü anlamak için bu bilinmeyebilir).
Yani teorem şu: Rastgele değişkenler bağımsız ve aynı şekilde dağılmışsa, bu değişkenlerin toplamları şuna yakınsar: istikrarlı yasa.

Şimdi tanım. Rastgele değişken X ancak ve ancak logaritması durumunda kararlı olacaktır karakteristik fonksiyonŞeklinde sunalım:

Aslında burada çok karmaşık bir şey yok, sadece dört parametrenin anlamını açıklamanız gerekiyor. Sigma ve mu parametreleri olağan ölçek ve ofsettir, normal dağılımda olduğu gibi, mu varsa matematiksel beklentiye eşit olacaktır ve alfa birden büyük olduğunda mevcuttur. Beta parametresi asimetridir; sıfıra eşitse dağılım simetriktir. Ancak alfa karakteristik bir parametredir; bir niceliğin momentlerinin hangi büyüklükte olduğunu, ikiye ne kadar yakınsa, o kadar büyük olduğunu gösterir. daha fazla dağıtım normale benzer, ikiye eşit olduğunda dağılım normal hale gelir ve yalnızca bu durumda büyük dereceli momentlere sahiptir, ayrıca normal dağılım durumunda asimetri dejenere olur. Alfanın bire, betanın sıfıra eşit olması durumunda Cauchy dağılımı elde edilir, alfanın yarıya ve betanın bire eşit olması durumunda Lévy dağılımı elde edilir, diğer durumlarda temsil yoktur. bu tür miktarların yoğunluk dağılımı için kareler halinde.
20. yüzyılda, kararlı niceliklere ve süreçlere (Lévy süreçleri olarak anılır) ilişkin zengin bir teori geliştirildi ve bunların birbirleriyle olan bağlantıları kesirli integraller, tanıtıldı çeşitli yollar Parametreleştirme ve modelleme ile parametreler çeşitli şekillerde tahmin edilmiş ve tahminlerin tutarlılığı ve kararlılığı gösterilmiştir. Resme bakın, Levy sürecinin simüle edilmiş bir yörüngesini 15 kat büyütülmüş bir parçayla gösteriyor.

Benoit Mandelbrot, bu tür süreçleri ve bunların finanstaki uygulamalarını incelerken fraktalları ortaya çıkardı. Ancak her yerde durum pek iyi değildi. 20. yüzyılın ikinci yarısı uygulamalı ve sibernetik bilimlerin genel eğilimi altında geçti ve bu, saf matematikte bir kriz anlamına geliyordu, herkes üretmek istiyordu ama düşünmek istemiyordu, hümanistler gazetecilikleriyle matematiksel alanları işgal ediyordu. Örnek: American Mosteller'in “Çözümlü Elli Eğlenceli Olasılık Problemi” kitabı, görev No. 11:

Yazarın bu soruna getirdiği çözüm sağduyunun yenilgisinden başka bir şey değil:

ÜÇ çelişkili cevabın verildiği 25. problemde de durum aynıdır.

Ancak istikrarlı dağılımlara dönelim. Yazının geri kalanında onlarla çalışırken herhangi bir ek zorluk yaşanmaması gerektiğini göstermeye çalışacağım. Yani, parametreleri tahmin etmenize, dağıtım fonksiyonunu hesaplamanıza ve bunları modellemenize, yani diğer dağıtımlarla aynı şekilde çalışmanıza olanak tanıyan sayısal ve istatistiksel yöntemler vardır.

Kararlı rastgele değişkenlerin modellenmesi. Her şey karşılaştırma yoluyla öğrenildiği için, öncelikle hesaplama açısından en uygun olanı, normal bir değer üretme yöntemini (Box-Muller yöntemi) hatırlayacağım: eğer temel rastgele değişkenler (üzerinde düzgün bir şekilde dağılmışsa)

Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!