Büyük sayılar kanununun 3 sonucu. Merkezi limit teoremi kavramı

Kanun büyük sayılar düzenlilik ve rastgelelik arasındaki temel bağlantıyı formüle etmesi nedeniyle olasılık teorisinin merkezi yasasıdır. Yani çok sayıda kazanın bir kalıba yol açtığını, bunun da olayların gidişatını tahmin etmeyi mümkün kıldığını savunuyor. En çok genel form kendini ifade ediyor Chebyshev'in teoremi:

İzin vermek ( Χ 1; X2; …Xn; ...) bağımsız rastgele değişkenler (oldukları varsayılır) sonsuz sayı). Ve onların varyansları tekdüze olarak sınırlı olsun (yani tüm bu değişkenlerin varyansları) rastgele değişkenler bazı sabitleri aşmayın İLE):

O zaman ne kadar az olursa olsun pozitif sayı, sınırlayıcı olasılık ilişkisi sağlanır:

Rastgele değişkenlerin sayısı yeterince büyükse. Veya aynı şey olan olasılık

Dolayısıyla Chebyshev'in teoremi şunu belirtir: Yeterince büyük bir sayıyı düşünürsek N bağımsız rastgele değişkenler ( Χ 1; X2; …Xn), o zaman olay neredeyse güvenilir kabul edilebilir (birliğe yakın bir olasılıkla), bu rastgele değişkenlerin aritmetik ortalamasının matematiksel beklentilerinin aritmetik ortalamasından sapması şuna göre olacaktır: mutlak değer istediğin kadar küçük

Kanıt. Χ 1; X2; …Xn):

(4)

; (5)

Koşulları (1) dikkate alarak şunu tespit ederiz:

(6)

Böylece, varyans olduğunda. Yani bir rastgele değişkenin değerlerinin onun etrafına yayılması matematiksel beklenti süresiz olarak azalır. Bu da şu anlama geliyor: değer ne zaman, yani, . Veya daha kesin bir ifadeyle, bir rastgele değişkenin en azından bir şekilde matematiksel beklentisinden (bir sabit) sapma olasılığı sıfıra yaklaşır. Yani, keyfi olarak küçük herhangi bir pozitif sayı için

Yani kanıtlanmış Chebyshev teoremine göre, çok sayıda bağımsız rastgele değişkenin aritmetik ortalaması ( Χ 1; X2; …Xn), rastgele bir değişken olduğundan, aslında rastgelelik karakterini kaybeder ve aslında değiştirilemez bir sabit haline gelir. Bu sabit, değerlerin matematiksel beklentilerinin aritmetik ortalamasına eşittir ( Χ 1; X2; …Xn). Bu büyük sayılar kanunudur.

Chebyshev teoreminin bir başka kanıtı da verilebilir. Bunu yapmak için Chebyshev eşitsizliğini kullanıyoruz. Hem kesikli hem de sürekli rastgele değişkenler için geçerlidir ve kendi başına bir değere sahiptir. Chebyshev eşitsizliği, bir rastgele değişkenin matematiksel beklentisinden sapmasının mutlak değerde pozitif bir sayıyı aşmama olasılığını tahmin etmemizi sağlar. Ayrık rastgele değişkenler için Chebyshev eşitsizliğinin bir kanıtını sunalım.



Chebyshev eşitsizliği: Rastgele bir değişkenin sapma olasılığı X Mutlak değerdeki matematiksel beklentisi pozitif bir sayıdan azdır, aşağıdakilerden daha az değildir:

.

Kanıt: Eşitsizliklerin uygulanmasından oluşan olaylar Ve , zıt ise olasılıklarının toplamı 1'e eşittir, yani. . Dolayısıyla ilgilendiğimiz olasılık. (*)

bulacağız . Bunun için varyansı bulalım rastgele değişken X.

Bu toplamın tüm terimleri negatif değildir. Bu terimleri bir kenara bırakalım (kalan şartlar için ), bunun sonucunda miktar yalnızca azalabilir. Kesin olarak şunu varsaymayı kabul edelim: k ilk terimler (dağıtım tablosunda olası değerlerin tam olarak bu sıraya göre numaralandırıldığını varsayacağız). Böylece,

Eşitsizliğin her iki tarafı da pozitiftir, dolayısıyla bunların karesini alırsak eşdeğer eşitsizliği elde ederiz . Bu açıklamayı kullanalım ve çarpanların her birini kalan toplamda yerine koyalım. sayısını (bu durumda eşitsizlik yalnızca artabilir) elde ederiz. (**)

Toplama teoremine göre olasılıkların toplamı olasılıktır. X hangisi olursa olsun değerini alacak ve bunlardan herhangi biri için sapma eşitsizliği karşılar . Toplamın olasılığı ifade ettiği sonucu çıkar . Bu, eşitsizliği (**) şu şekilde yeniden yazmamızı sağlar: . (***).

Hadi değiştirelim (***) V (*) ve alıyoruz Kanıtlanması gereken şey buydu.

Chebyshev Teoremi 2'nin Kanıtı:

Yeni bir rastgele değişkeni dikkate alalım: rastgele değişkenlerin aritmetik ortalaması ( Χ 1; X2; …Xn):

Matematiksel beklenti ve dağılım özelliklerini kullanarak şunu elde ederiz:

; . (*)

Chebyshev eşitsizliğini miktara uygularsak, elimizdeki sonuç elde edilir.

Oran (*) dikkate alındığında,

Koşullu olarak şu anlama gelir: . (***) Sağ tarafı (***) eşitsizliğe (**) koyarsak, şunu elde ederiz:

Buradan, 'deki limite geçerek şunu elde ederiz:

Olasılık bir'i geçemeyeceğinden, sonunda şunu elde ederiz:

Kanıtlamamız gereken şey de buydu.

Chebyshev teoreminin önemli bir özel durumu üzerinde duralım. Yani, bağımsız rastgele değişkenlerin ( Χ 1; X2; …Xn) sahip olmak aynı kanunlar dağılımlar ve dolayısıyla aynı sayısal özellikler:

(8)

O zaman (5)'e göre rastgele değişken için elimizde:

(9)

Bu durumda sınırlayıcı olasılık ilişkisi (7) şu şekli alacaktır:

(10)

(10)’dan çıkan sonuç büyük değerÇeşitli ölçüm türlerini yaparken rastgele hatalarla mücadele etmek.

Örneğin belirli bir miktarı ölçmeniz gerektiğini varsayalım. A. Bir değil birkaç tane üreteceğiz ( N) bu miktarın değerinin bağımsız olarak tekrarlanan ölçümleri. Herhangi bir ölçüm, ölçüm cihazının kusuru, ölçümdeki her türlü rastgele girişim vb. ile ilişkili rastgele bir hatanın doğasında vardır. Bu nedenle sonuçlar ( Χ 1; X2; …Xn) istenilen değerin bireysel ardışık ölçümleri A genel anlamda verilmeyecektir - bunlar rastgele değişkenler olacaktır. Ayrıca, sahip olunan miktarlarla özdeş dağılımlarÇünkü ölçümler tekrar tekrar yani sabit aralıklarla yapılır. dış koşullar. Daha sonra miktar için - tüm sonuçların aritmetik ortalaması Nölçümler - sınırlayıcı olasılık ilişkisi (10) yerine getirilecektir. Bu, bu aritmetik ortalamanın rastgelelik özelliğini yitirdiği ve A– ölçülen büyüklüğün gerçek değeri. Bu arada, bu, formül (9) ile kanıtlanmıştır, buna göre:

(11)

Yani, istenen miktarın yeterince çok sayıda tekrarlanan ölçümünü gerçekleştirmiş olmak A her birinde rastgele bir ölçüm hatasının mümkün olduğu ve ardından ortalamanın bulunması aritmetik sonuçlar bu ölçümler için aşağıdaki formülü kullanırız

A(12)

değerini alabiliriz ve neredeyse rastgele hatalar olmadan.

Bu sonuç büyük sayılar kanununun bir sonucudur. İÇİNDE bu durumda bu yasa, ölçüm sonuçlarını özetlerken (4)'ün ortaya çıkmasıyla ortaya çıkar. rastgele hatalar Prensipte hem artı hem de eksi işaretiyle eşit sıklıkta ortaya çıkan bireysel boyutlar genellikle birbirini iptal edecektir. Ve kalan hata yine de bölünecek N yani daha da azalacak N bir kere. Peki ne zaman büyük değerler N değer ölçülen değere neredeyse tam olarak eşit olacaktır A. Bu sonuç doğal olarak pratikte yaygın olarak kullanılmaktadır.

Not. Büyüklük bakımından yalnızca birbirlerini iptal ederler rastgele hatalarölçümler, yani rastgele faktörlerin (parazit) eylemiyle ilişkili hatalar. Ancak sistematik (kalıcı) hatalar, yani her ölçümün doğasında bulunan hatalar doğal olarak . Örneğin, bir cihazda yere düşen (ayarlanmayan) bir ok, her ölçümde sabit (sistematik) bir hataya neden olur ve dolayısıyla bu ölçüm sonuçlarının aritmetik ortalamasında buna neden olur. Sistematik hatalar, ölçümler alınmadan önce ortadan kaldırılmalı ve ölçüm sürecinde izin verilmemelidir.

Daha sonra, ölçüm cihazının bölme değeri α ise, tekrarlanan tüm ölçümler α doğruluğu ile yapılır. Ancak o zaman, doğal olarak, tüm ölçümlerin sonuçlarının aritmetik ortalaması yalnızca α doğruluğuyla, yani cihazın doğruluğu tarafından belirlenen bir doğrulukla gösterilebilir.

Bu nedenle, miktarın yeterince fazla sayıda tekrarlanan ölçümünü yaptıktan sonra şunu düşünmemek gerekir: A ve sonra bu ölçümlerin sonuçlarının aritmetik ortalamasını bularak şunu elde ederiz: bire bir aynı Anlam A. Bunu yalnızca ölçüm cihazının doğruluğu dahilinde elde edeceğiz. Ve o zaman bile, eğer hariç tutarsak sistematik hataölçümler.

İşte önemli bir şey daha özel durum büyük sayılar kanunu. İzin vermek X=k– bazı olayların gerçekleşme sayısı A V N tekrarlanan testler ( X– rastgele değişken). Ve izin ver ve - Bir olayın gerçekleşme ve gerçekleşmeme olasılığı A tek bir testte. Rastgele bir değişken düşünün - bir olayın göreceli görülme sıklığı A V N testler. Biz de tanıtalım N rastgele değişkenler ( X 1, X 2, …X n), olayın gerçekleşme sayısını temsil eder A birincisinde, ikincisinde... N-th testleri. Daha sonra k = X 1 + X 2 +…+ X p ve bir olayın meydana gelmesi A pratik olarak olayın meydana gelme olasılığı ile örtüşmektedir A tek bir testte. Bu sonuç birçok olasılığın bulunmasına dayanmaktadır. rastgele olaylar olasılıkları başka bir şekilde (teorik olarak) bulunamayan.

Örneğin, testin deforme olmuş (asimetrik) bir madeni paranın atılması olduğunu varsayalım ve olay A bu meydan okuma için bu bir zirve düşüşü. Olayın olasılığı Aİle klasik formül veya başka bir şekilde teorik formül bulmak zordur, çünkü böyle bir formülün madalyonun deformasyonunun özelliklerini bir şekilde yansıtması gerekir. Bu nedenle, hedefe giden gerçek yol tektir: parayı tekrar tekrar atın (atış sayısı ne kadar fazla olursa) N, daha iyi) ve armanın görünümünün göreceli sıklığını ampirik olarak belirleyin. Eğer N büyükse, büyük sayılar kanununa göre şu şekilde mümkündür: yüksek olasılıkşunu iddia et .

Büyük sayılar kanunu birçok doğal ve sosyal olayda kendini gösterir.

Örnek 1. Bilindiği gibi kapalı bir kap içine konulan gaz, kabın duvarlarına basınç uygular. Gaz durumu kanunlarına göre sabit bir gaz sıcaklığında bu basınç sabittir. Gaz basıncı, bireysel moleküllerin kabın duvarlarına kaotik etkilerinden kaynaklanır. Tüm moleküllerin hızları ve hareket yönleri farklıdır, bu nedenle farklı moleküllerin damar duvarlarına çarpma kuvvetleri de farklıdır. Bununla birlikte, kabın duvarlarındaki gaz basıncı, tek tek moleküllerin darbe kuvvetiyle değil, onların etkisiyle belirlenir. ortalama zorla. Ama o ortalama biri gibi çok büyük sayı ne olursa olsun aktif kuvvetler Büyük sayılar kanununa göre pratikte değişmeden kalacaktır. Bu nedenle, kabın duvarlarındaki gaz basıncı pratikte değişmeden kalır.

Örnek 2. Örneğin otomobil sigortasıyla ilgilenen bir sigorta şirketi, sigortalı farklı olaylar (araba kazaları ve trafik kazaları) için farklı sigorta tutarları öder. Ancak bu sigorta tutarının ortalama değeri, birçok farklı ortalama olarak N Büyük sayılar kanununa göre bağımsız sigorta tutarları pratikte değişmeyecektir. Sigorta tazminat taleplerinin gerçek istatistikleri incelenerek belirlenebilir. Bir sigorta şirketinin zarara uğramaması için müşterilerinden kesilen ortalama sigorta priminin, şirketin müşterilerine ödediği ortalama primden yüksek olması gerekir. Ancak şirketin rekabetçi olabilmesi (diğer sigorta şirketleriyle çekicilik konusunda rekabet edebilmesi) için bu primin çok yüksek olmaması gerekir.

Bu ispatı iki aşamada gerçekleştiriyoruz. İlk olarak, var olduğunu varsayalım ve bu durumda toplam dağılım teoremine göre D(S") olduğuna dikkat edin. Chebyshev eşitsizliğine göre herhangi bir t > 0 için

t > n için sol taraf küçüktür ve ikinci değer sıfıra doğru yönelir. Bu ispatın ilk kısmını tamamlar.

Şimdi D()'nin varlığına ilişkin kısıtlayıcı koşulu bir kenara bırakalım. Bu durum kesme yöntemiyle bir önceki duruma indirgenir.

Aşağıdaki gibi iki yeni rastgele değişken kümesini tanımlayalım:

U k =, V k =0, eğer (2.2)

U k =0, V k =, eğer

Burada k=1,…, n ve sabittir. Daha sonra

hepsi için k.

(f(j)) rastgele değişkenlerin olasılık dağılımı olsun (tüm j için aynı). = M()'nin var olduğunu varsaydık, dolayısıyla toplam

sonlu. Sonra da var

burada toplama tüm j'ler üzerinde gerçekleştirilir. N'ye bağlı olmasına rağmen, bunun için aynı olduğunu unutmayın.

U 1, U 2, ..., U n. Ek olarak, için ve dolayısıyla keyfi > 0 ve yeterince büyük n'lerin tümü için

U k karşılıklı olarak bağımsızdır ve bunların toplamları U 1 +U 2 +…+U n, sonlu dağılım durumunda X k ile tamamen aynı şekilde ele alınabilir, Chebyshev eşitsizliği uygulanarak, (2.1)'e benzer şekilde elde edilir


(2.6)’dan dolayı şu sonuç çıkıyor

(2.4) serisi yakınsak olduğundan, n arttıkça son toplam sıfıra doğru yönelir. Bu nedenle, yeterince büyük bir n için

ve bu nedenle

P(V 1 +…+V n 0). (2.12)

Ancak hem (2.9) hem de (2.12)'den şunu elde ederiz:

Bunlar keyfi oldukları için sağ taraf istenildiği kadar küçük yapılabilir, bu da ispatı tamamlar.

"Zararsız" oyunlar teorisi

Büyük sayılar yasasının özünü daha ayrıntılı analiz ederken, geleneksel oyuncu terminolojisini kullanacağız, ancak düşüncelerimiz buna izin veriyor. eşit olarak ve daha ciddi uygulamalardır ve iki temel varsayımımız istatistik ve fizikte, kumar. Öncelikle oyuncunun sınırsız sermayeye sahip olduğunu varsayalım, böylece hiçbir kayıp oyunun bitmesine neden olamaz. (Bu varsayımın reddedilmesi, olasılık teorisi öğrencilerinin her zaman ilgisini çeken oyuncunun mahvolma problemine yol açar.) İkinci olarak, oyuncunun oyunu istediği zaman yarıda kesecek mizaca sahip olmadığını varsayalım: n deneme sayısı önceden belirlenmeli ve sıra oyunlarına bağlı olmamalıdır. Aksi takdirde sınırsız sermayeye sahip olan oyuncu bir dizi başarıyı bekleyecek ve doğru anda oyunu durduracaktır. Böyle bir oyuncu, belirli bir andaki olası dalgalanmayla değil, büyük sayılar kanunundan çok yinelenen logaritma kanunuyla tanımlanan uzun bir oyun serisindeki maksimum dalgalanmalarla ilgilenir.

Rastgele değişken k'yi (pozitif veya negatif) getirisi olarak tanıtalım. k. tekrar oyunlar. O halde S n = 1 +…+ k toplamı, oyunun n tekrarından sonraki toplam kazançtır. Eğer oyuncu her tekrardan önce oyuna katılım hakkı için (mutlaka olumlu olmasa da) bir katkı öderse, o zaman n ödediği toplam katkıyı temsil eder ve Sn de toplam net kazançtır. Büyük sayılar kanunu p=M(k) mevcutsa geçerlidir. Kabaca söylemek gerekirse, büyük n için S n - farkının n'ye göre küçük görünmesi oldukça makuldür. Bu nedenle, eğer p'den küçükse, o zaman büyük n için oyuncu muhtemelen büyüklük sırasına göre bir getiri elde edecektir. Aynı şekilde, bir katkının da neredeyse kesin olarak kayıpla sonuçlanması muhtemeldir. Kısaca şans oyuncunun lehinedir, şans ise aleyhinedir.

Davayla ilgili henüz bir şey söylemediğimizi unutmayın. Bu durumda mümkün olan tek sonuç, eğer ve yeterince büyükse, toplam kazanç veya kayıp S n - n'nin n'ye kıyasla çok yüksek olasılıkla küçük olacağıdır. Ancak S n - n'nin ortaya çıkıp çıkmayacağı bilinmiyor. Olumlu ya da olumsuz olması, yani oyunun karlı mı yoksa yıkıcı mı olacağı. Bu dikkate alınmadı klasik teori zararsız bir fiyat ve "zararsız" bir oyun olarak adlandırılan. "Zararsız" bir oyunun aslında hem açıkça karlı hem de yıkıcı olabileceğini anlamalısınız.

“Normal durumda” sadece M(k)'nin değil aynı zamanda D(k)'nin de mevcut olduğu açıktır. Bu durumda, büyük sayılar yasası, merkezi limit teoremi ile desteklenmektedir ve ikincisi, "zararsız" bir oyunda, uzun bir S n - n oyununun sonucu olarak net kazancın şu şekilde olacağının çok makul olduğunu söylemektedir: n 1/2 mertebesindedir ve yeterince büyük n için bu kazanç yaklaşık olarak olacaktır. eşit şanslar olumlu veya olumsuz. Dolayısıyla, merkezi limit teoremi geçerliyse, o zaman "zararsız" oyun terimi haklı çıkar, ancak bu durumda bile "uzun bir oyunun sonucu" sözleriyle vurgulanan bir limit teoremi ile karşı karşıyayız. Kapsamlı Analiz dağılım arttıkça (1.3)'teki yakınsamanın kötüleştiğini gösterir. Eğer büyükse, o zaman normal yaklaşım yalnızca son derece büyük n için etkili olacaktır.

Daha spesifik olmak gerekirse, içine bir ruble koyarken oyuncunun 10 olasılıkla (10-1) ruble kazanabileceği ve diğer durumlarda düşen rubleyi kaybettiği bir makine hayal edelim. Burada Bernoulli testleri var ve oyun "zararsız". Bir milyon testi tamamlayan oyuncu bunun için bir milyon ruble ödeyecek. Bu süre zarfında 0, 1,2,... kez kazanabilir. Poisson yaklaşımına göre binom dağılımı, birkaç ondalık basamağa kadar doğru, tam olarak k kez kazanma olasılığı e -1 /k!'ye eşittir. Yani 0,368 olasılıkla. . . oyuncu bir milyon kaybedecek ve aynı olasılıkla sadece masraflarını karşılayacaktır; 0,184... tam olarak bir milyon kazanma olasılığı var, vb. Burada, 10 6 deneme, getirisi Poisson dağılımı olan bir oyundaki tek bir denemeye eşdeğerdir.

Açıkçası bu tür durumlarda büyük sayılar kanununu uygulamanın hiçbir anlamı yoktur. Bu plan yangına, araba kazalarına vb. karşı sigortayı içermektedir. Büyük bir kısmı riske maruzdur, ancak buna karşılık gelen olasılık çok küçüktür. Ancak burada genellikle yılda yalnızca bir test yapılır, dolayısıyla testlerin sayısı hiçbir zaman büyük olmaz. Sigortalı için oyun her ne kadar ekonomik açıdan oldukça karlı olsa da mutlaka “zararsız” değildir. Büyük sayılar kanununun bununla hiçbir ilgisi yoktur. Sigorta şirketine gelince, çok sayıda oyunla ilgileniyor, ancak büyük farklılıklar nedeniyle rastgele dalgalanmalar hala ortaya çıkıyor. Sigorta primlerinin belirli yıllarda büyük kayıpları önleyecek şekilde ayarlanması gerekiyor ve bu nedenle şirket büyük rakamlar kanunundan ziyade yıkım sorunuyla ilgileniyor.

Varyans sonsuz olduğunda "zararsız" oyun terimi anlamsız hale gelir; toplam net kazanç S n - n'nin sıfır civarında dalgalandığına inanmak için hiçbir neden yok. Gerçekten mi. Oyuncunun sonuç olarak net bir kayıp yaşama olasılığının bire düştüğü "zararsız" oyun örnekleri vardır. Büyük sayılar kanunu sadece bu kaybın n'den daha küçük olacağını belirtir. Ancak daha fazlası söylenemez. Eğer bir n keyfi bir dizi oluşturuyorsa ve bir n /n0 ise, oyunun n tekrarı sonucunda toplam net kaybın bir n'yi aşma olasılığının bire yöneldiği "zararsız" bir oyun düzenlemek mümkündür.

Olasılık teorisindeki "büyük sayılar kanunu", her biri belirli koşullar altında çok sayıda deneyin ortalama özelliklerinin belirli sabitlere yaklaştığı gerçeğini ortaya koyan bir dizi matematik teoremi olarak anlaşılır.

Chebyshev eşitsizliğine dayanmaktadır:

Bir X rastgele değişkeninin mutlak değerdeki matematiksel beklentisinden sapmasının pozitif bir ε sayısından küçük olma olasılığı aşağıdakilerden daha az değildir:

Ayrık ve sürekli r.v. için geçerlidir.

53. Chebyshev teoremi.

Sonsuz sayıda bağımsız rastgele değişken dizisi olsun aynı matematiksel beklenti ve aynı C sabitiyle sınırlı varyanslarla:

O halde pozitif sayı ne olursa olsun olayın olasılığı bire doğru yönelir.

54. Bernoulli teoremi.

N üretilsin bağımsız testler Her birinde A olayının gerçekleşme olasılığı p'ye eşittir.

55. Lyapunov'un merkezi limit teoremi kavramı.

Çok sayıda bağımsız rastgele değişkenin toplamının çok genel koşullar altında dağılımı normal dağılıma yakındır.

Normal dağılıma sahip rastgele değişkenlerin pratikte geniş dağılım gösterdiği bilinmektedir. Bunun açıklaması A.M. Lyapunov tarafından merkezi limit teoreminde verilmiştir: Eğer bir rastgele değişken, her birinin toplamın tamamı üzerindeki etkisi ihmal edilebilir olan çok sayıda karşılıklı bağımsız rastgele değişkenin toplamı ise, o zaman bir rastgele değişkene sahiptir. dağılım normale yakın.

56. Genel popülasyon ve örneklem: temel tanımlar ve kavramlar.

Matematiksel istatistik, rastgele kütle olaylarının modellerini incelemek amacıyla deneysel verileri elde etmek, tanımlamak ve işlemek için yöntemlerin geliştirilmesiyle ilgilenen bir bilimdir.

Matematiksel istatistik sorunları:

    Bilinmeyen bir dağılım fonksiyonunun ölçüm sonuçlarına göre tahmini.

    Seviye bilinmeyen parametreler dağıtımlar.

    Statik hipotez testi.

Bazı niceliksel karakteristik x'i inceleyelim.

O zaman bütünlük, onun tüm olası değerlerinin kümesi olarak anlaşılır.

Özellikleri incelemek bu özelliğin itibaren nüfus elemanların bir kısmı, bir örnek popülasyonu veya örneği oluşturan Xi varyantları tarafından rastgele seçilir.

Bir koleksiyonun eleman sayısına nesnesi n denir.

Örnekleme: 1) seçilen nesnenin (bir sonrakini seçmeden önce) genel popülasyona döndürüldüğü tekrarlanan örnekleme.

2) seçilen nesnenin genel popülasyona iade edildiği tekrarlanmayan örnekleme.

Bizi ilgilendiren genel popülasyonun özellikleri hakkında yeterli güvenle yargıya varmak amacıyla örnek verileri kullanmak için, örneğin temsili olması gerekir)

Büyük sayılar kanunu uyarınca, eğer rastgele yapılırsa bir numunenin temsili olacağı ileri sürülebilir: popülasyondaki her nesnenin numuneye dahil edilme olasılığı aynı olmalıdır.

Popülasyon nesnesi yeterince büyükse ve numune bu popülasyonun yalnızca küçük bir bölümünü oluşturuyorsa tekrarlanan ve tekrarlanmayan numuneler arasındaki ayrım silinir.

Artan sırada düzenlenen seçenekler listesine varyasyon serisi denir.

Belirli bir seçeneğin gözlem sayısına onun frekansı ni denir ve frekansın ni'nin örnek nesneye oranı n-bağıl frekans wi'dir.

Planı:

1. Merkezi limit teoremi kavramı (Lyapunov teoremi)

2. Büyük sayılar kanunu, olasılık ve frekans (Chebyshev ve Bernoulli teoremleri)

1. Merkezi limit teoremi kavramı.

Olasılık teorisinde normal olasılık dağılımı büyük önem taşımaktadır. Normal hukuk olasılık, bir hedefe ateş ederken, ölçümlerde vs. uyulur. Özellikle, yeterince büyük sayıda bağımsız rastgele değişkenin toplamının dağılım yasasının keyfi yasalar dağıtım yakın normal dağılım. Bu gerçeğe merkezi limit teoremi veya Lyapunov teoremi denir.

Normal dağılım gösteren rastgele değişkenlerin pratikte yaygın olarak kullanıldığı bilinmektedir. Bunu ne açıklıyor? Bu sorunun cevabı verildi

Merkezi limit teoremi. Bir rastgele değişken X, çok sayıda karşılıklı bağımsız rastgele değişkenin toplamıysa ve bunların her birinin toplamın tamamı üzerindeki etkisi ihmal edilebilirse, bu durumda X, normal dağılıma yakın bir dağılıma sahiptir.

Örnek. Biraz ölçelim fiziksel miktar. Ölçüm sonucu birçok bağımsız rastgele faktörden (sıcaklık, cihaz dalgalanmaları, nem vb.) etkilendiğinden, herhangi bir ölçüm ölçülen değerin yalnızca yaklaşık değerini verir. Bu faktörlerin her biri ihmal edilebilir bir "kısmi hata" üretir. Ancak bu faktörlerin sayısı çok fazla olduğundan, bunların birleşik etkisi fark edilebilir bir “toplam hataya” yol açmaktadır.

Toplam hatayı birbirinden bağımsız çok sayıda kısmi hatanın toplamı olarak düşünürsek, toplam hatanın normal dağılıma yakın bir dağılıma sahip olduğu sonucuna varabiliriz. Deneyim bu sonucun geçerliliğini doğrulamaktadır.

“Merkezi limit teoreminin” sağlandığı koşulları ele alalım

X1,X2, ..., XN– bağımsız rastgele değişkenlerin dizisi,

M(X1),M(X2), ...,M(XN) - bu miktarların nihai matematiksel beklentileri sırasıyla eşit M(Xk)= tamam

D (X1),D(X2), ...,D(XN) - son varyansları sırasıyla eşittir D(X k)= bk2

Aşağıdaki gösterimi tanıtalım: S= X1+X2 + ...+Xn;

A k= X1+X2 + ...+Xn=; B2=D (X1)+D(Х2)+ ...+D(XN) =

Normalleştirilmiş toplamın dağılım fonksiyonunu yazalım:

Bunu tutarlılık için söylüyorlar X1,X2, ..., XN Merkezi limit teoremi herhangi bir durum için geçerlidir. X n ® ¥ olarak normalleştirilmiş toplamın dağılım fonksiyonu şu eğilimdedir: normal fonksiyon dağılımlar:

Sağ " stil = "kenar-çöküşü:çöktür;kenarlık:yok;kenar-sol:6,75pt;sağkenar: 6,75pt">

Ayrık bir rastgele değişken düşünün X, dağıtım tablosu tarafından belirtilir:

Rastgele bir değişkenin matematiksel beklentisinden sapmasının mutlak değerde pozitif bir sayıyı aşmama olasılığını tahmin etme görevini kendimize koyalım. ε

Eğer ε yeterince küçükse, o zaman olasılığını tahmin edeceğiz X matematiksel beklentisine oldukça yakın değerler alacaktır. ilgilendiğimiz tahmini vermemize olanak tanıyan bir eşitsizliği kanıtladı.

Chebyshev'in Lemması. Matematiksel beklenti M(X) ile yalnızca negatif olmayan değerleri alan rastgele bir X değişkeni verildiğinde. Herhangi bir α>0 sayısı için ifade şu anlama gelir:

Chebyshev eşitsizliği. Bir X rastgele değişkeninin mutlak değerdeki matematiksel beklentisinden sapmasının pozitif bir sayıdan küçük olma olasılığı ε , en az 1 – D(X) / ε 2:

P(|X-M(X)|< ε ) ³ 1 - D(X) / ε 2.

Yorum. Chebyshev eşitsizliğinin pratik önemi sınırlıdır, çünkü çoğu zaman kaba ve bazen önemsiz (ilgisiz) bir tahmin verir.

Chebyshev eşitsizliğinin teorik önemi çok büyüktür. Aşağıda Chebyshev teoremini türetmek için bu eşitsizliği kullanacağız.

2.2. Chebyshev'in teoremi

Eğer X1, X2, ..., Xn.. ikili bağımsız rasgele değişkenlerse ve varyansları eşit biçimde sınırlıysa (sabit bir C sayısını aşmayın), bu durumda pozitif sayı ne kadar küçük olursa olsun ε eşitsizlik olasılığı

÷ (X1+X2 + ...+Xn) / n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε

Rastgele değişkenlerin sayısı yeterince büyükse birliğe istenildiği kadar yakın olacaktır.

P (÷ (X1+X2 + ...+Xn) / n - (M(X1)+M(X2)+ ...+M(Xn))/n |< ε )=1.

Chebyshev'in teoremi şunu belirtir:

1. Sınırlı varyansa sahip yeterince fazla sayıda bağımsız rastgele değişken dikkate alınır,

Chebyshev teoremini formüle ederken rastgele değişkenlerin farklı matematiksel beklentilere sahip olduğunu varsaydık. Uygulamada, rastgele değişkenlerin aynı matematiksel beklentiye sahip olduğu sıklıkla görülür. Açıkçası, eğer yine bu niceliklerin dağılımlarının sınırlı olduğunu varsayarsak, o zaman Chebyshev teoremi bunlara uygulanabilir olacaktır.

Rastgele değişkenlerin her birinin matematiksel beklentisini şu şekilde gösterelim: A;

Söz konusu durumda, matematiksel beklentilerin aritmetik ortalaması da, görülmesi kolay olduğu gibi, şuna eşittir: A.

Söz konusu özel durum için Chebyshev teoremini formüle etmek mümkündür.

"Eğer X1, X2, ..., Xn.. aynı matematiksel beklenti a'ya sahip ikili bağımsız rastgele değişkenlerse ve bu değerlerin varyansları tekdüze olarak sınırlıysa bu durumda sayı ne kadar küçük olursa olsun ε >Ah, eşitsizlik olasılığı

÷ (X1+X2 + ...+Xn) / n - A | < ε

Rastgele değişkenlerin sayısı yeterince büyükse birliğe istendiği kadar yakın olacaktır" .

Başka bir deyişle, teoremin koşulları altında

P (÷ (X1+X2 + ...+Xn) / n - a |< ε ) = 1.

2.3. Chebyshev teoreminin özü

Bireysel bağımsız rastgele değişkenler matematiksel beklentilerinden uzak değerler alabilse de, yeterince fazla sayıda rastgele değişkenin aritmetik ortalamasının belirli bir değere yakın değerler alması çok muhtemeldir. sabit sayı yani sayıya

(M (Xj) + M (X2)+... + M (Х))/п veya numaraya ve içindeözel durum.

Başka bir deyişle, bireysel rastgele değişkenler önemli bir dağılıma sahip olabilir ve aritmetik ortalamaları da oldukça küçük olabilir.

Bu nedenle hangisini kesin olarak tahmin etmek mümkün değildir olası anlam rastgele değişkenlerin her biri alacaktır, ancak aritmetik ortalamalarının hangi değeri alacağını tahmin edebilirsiniz.

Bu nedenle, yeterince büyük sayıda bağımsız rastgele değişkenin (varyansları tekdüze olarak sınırlı olan) aritmetik ortalaması, rastgele değişken karakterini kaybeder.

Bu, niceliklerin her birinin matematiksel beklentilerinden sapmalarının hem pozitif hem de negatif olabileceği ve aritmetik ortalamada birbirlerini iptal ettikleri gerçeğiyle açıklanmaktadır.

Chebyshev teoremi yalnızca kesikli değil aynı zamanda sürekli rastgele değişkenler için de geçerlidir; tesadüf ile zorunluluk arasındaki bağlantı öğretisinin geçerliliğini doğrulayan bir örnektir.

2.4. Chebyshev teoreminin uygulama açısından önemi

Chebyshev teoreminin pratik problemlerin çözümüne uygulanmasına ilişkin örnekler verelim.

Genellikle belirli bir fiziksel miktarı ölçmek için çeşitli ölçümler yapılır ve bunların aritmetik ortalaması istenilen büyüklükte alınır. Bu ölçüm yöntemi hangi koşullar altında doğru kabul edilebilir? Bu sorunun cevabı Chebyshev teoremi (özel durumu) ile verilmektedir.

Aslında, her ölçümün sonuçlarını rastgele değişkenler olarak düşünün

X1, X2, ..., Xn

Chebyshev teoremi şu durumlarda bu miktarlara uygulanabilir:

1) İkili bağımsızdırlar.

2) aynı matematiksel beklentiye sahip olmak,

3) varyansları eşit olarak sınırlıdır.

Her ölçümün sonucu diğerlerinin sonuçlarına bağlı değilse ilk gereklilik karşılanır.

Ölçümlerin sistematik (aynı işaret) hatalar olmadan yapılması durumunda ikinci gereklilik karşılanır. Bu durumda tüm rastgele değişkenlerin matematiksel beklentileri aynı ve eşittir. gerçek boyut A.

Cihazın belirli bir ölçüm doğruluğu sağlaması durumunda üçüncü gereklilik karşılanır. Bireysel ölçümlerin sonuçları farklı olsa da saçılmaları sınırlıdır.

Belirtilen tüm gereklilikler karşılanırsa Chebyshev teoremini ölçüm sonuçlarına uygulama hakkına sahibiz: yeterince büyük bir değer için N eşitsizlik olasılığı

| (X1 + Xa+...+X")/n - a |< ε birliğe dilediğiniz kadar yakın.

Başka bir deyişle, yeterli büyük sayıölçümlerin aritmetik ortalamalarının istenilen kadar az farklı olduğu neredeyse kesindir. gerçek anlamölçülen miktar.

Chebyshev teoremi, açıklanan ölçüm yönteminin uygulanabileceği koşulları gösterir. Ancak ölçüm sayısını artırarak keyfi yüksek doğruluk elde edilebileceğini düşünmek yanlıştır. Gerçek şu ki, cihazın kendisi yalnızca ± α doğruluğunda okumalar verir, bu nedenle ölçüm sonuçlarının her biri ve dolayısıyla aritmetik ortalamaları yalnızca cihazın doğruluğunu aşmayan bir doğrulukla elde edilecektir.

İstatistikte yaygın olarak kullanılan örnekleme yöntemi, Chebyshev teoremine dayanmaktadır; bunun özü, nispeten küçük bir örneklem için geçerlidir. rastgele örnek incelenen nesnelerin tüm setini (genel popülasyon) yargılayın.

Örneğin bir pamuk balyasının kalitesi, balyanın farklı kısımlarından rastgele seçilen liflerden oluşan küçük bir demet tarafından belirlenir. Bir demetteki lif sayısı bir balyadakinden çok daha az olmasına rağmen, demetin kendisi yeterli lif içerir. büyük sayı sayıları yüzlerce olan lifler.

Başka bir örnek olarak, tahılın kalitesinin küçük bir numuneden belirlenmesini gösterebiliriz. Ve bu durumda, rastgele seçilen tanelerin sayısı, tanenin tüm kütlesine kıyasla küçük, ancak kendi içinde oldukça büyüktür.

Zaten verilen örneklerden Chebyshev teoreminin pratik için paha biçilemez bir öneme sahip olduğu sonucuna varabiliriz.

2.5. TeoremBernoulli

Üretildi N bağımsız testler (olaylar değil, testler). Her birinde bir olayın meydana gelme olasılığı A eşit R.

Soru ortaya çıkıyor yaklaşık olarak ne olacak? bağıl frekans olayın oluşumları? Bu sorunun cevabı Bernoulli'nin kanıtladığı, "büyük sayılar kanunu" olarak adlandırılan ve bir bilim olarak olasılık teorisinin temelini atan teorem ile cevaplanmaktadır.

Bernoulli teoremi. Eğer her birinde N bağımsız test olasılığı R bir olayın meydana gelmesi A sabitse, o zaman bağıl frekansın olasılıktan sapmasının keyfi olarak birliğe yakın olma olasılığı R Test sayısı yeterince büyükse mutlak değer keyfi olarak küçük olacaktır.

Başka bir deyişle, eğer ε >0 keyfi olarak küçük bir sayı ise, o zaman teoremin koşullarına bağlı olarak eşitlik geçerlidir

P(|M / p - p|< ε)= 1

Yorum. Bernoulli teoremine dayanarak, deneme sayısı arttıkça bağıl frekansın sürekli olarak olasılığa doğru yöneldiği sonucuna varmak yanlış olur. P; başka bir deyişle Bernoulli teoremi eşitliği ima etmiyor (t/p) = p,

İÇİNDE teorem hakkında konuşuyoruz yalnızca yeterince fazla sayıda testle bağıl frekansın istenenden az farklı olacağı olasılığıyla ilgilidir. sabit olasılık Her denemede bir olayın meydana gelmesi.

Görev 7-1.

1. 3600 zar atışında 6 sayının en az 900 olma olasılığını tahmin edin.

Çözüm. 3600 yazı-tura atışında 6 noktanın oluşma sayısı x olsun. Tek atışta 6 puan alma olasılığı p=1/6, bu durumda M(x)=3600·1/6=600 olur. Belirli bir α = 900 için Chebyshev eşitsizliğini (lemma) kullanalım

= P(X³ 900) £ 600 / 900 =2 / 3

Cevap 2 / 3.

2. 1000 bağımsız test gerçekleştirildi, p=0,8. Bu denemelerde A olayının matematiksel beklentisinden 50'den küçük mutlak değerde sapan gerçekleşme sayısının olasılığını bulun.

Çözüm. x, A olayının n – 1000 denemede meydana gelme sayısıdır.

M(X)= 1000·0,8=800. D(x)=100·0,8·0,2=160

Belirli bir ε = 50 için Chebyshev eşitsizliğini kullanalım

P(|x-M(X)|< ε) ³ 1 - D(x)/ ε 2

R(|x-800|< 50) ³ / 50 2 = 1-160 / 2500 = 0,936.

Cevap. 0,936

3. Chebyshev eşitsizliğini kullanarak olasılığı tahmin edin: |X - M(X)|< 0,1, если D (X) = 0,001. Ответ Р³0,9.

4. Verilen: P(|X- M(X)\< ε)³ 0,9; D (X)= 0.004. Chebyshev eşitsizliğini kullanarak ε'yi bulun . Cevap. 0,2.

Test soruları ve ödevler

1. Merkezi Limit Teoreminin Amacı

2. Lyapunov teoreminin uygulanabilirliği için koşullar.

3. Lemma ile Chebyshev teoremi arasındaki fark.

4. Chebyshev teoreminin uygulanabilirliği için koşullar.

5. Bernoulli teoreminin uygulanabilirliği için koşullar (büyük sayılar kanunu)

Bilgi ve beceriler için gereklilikler

Öğrenci merkezi limit teoreminin genel anlamsal formülasyonunu bilmelidir. Bağımsız, aynı şekilde dağılmış rastgele değişkenler için özel teoremleri formüle edebilme. Chebyshev eşitsizliğini ve büyük sayılar yasasını Chebyshev formunda anlayın. Bir olayın sıklığı, “olasılık” ve “frekans” kavramları arasındaki ilişki hakkında fikir sahibi olur. Bernoulli formunda büyük sayılar yasasını anlayın.

(1857-1918), seçkin Rus matematikçi



Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!