Chebyshev'in büyük sayılar yasasının ekonomide uygulanması. Lyapunov'un merkezi limit teoremi kavramı

Kanun büyük sayılar dır-dir merkezi kanun olasılık teorisi, düzenlilik ve rastgelelik arasında temel bir bağlantıyı formüle etmesi nedeniyle. Yani çok sayıda kazanın bir kalıba yol açtığını, bunun da olayların gidişatını tahmin etmeyi mümkün kıldığını savunuyor. En genel haliyle ifade edilir Chebyshev'in teoremi:

İzin vermek ( Χ 1; X2; …Xn; ...) bağımsız rastgele değişkenler (oldukları varsayılır) sonsuz sayı). Ve varyanslarının düzgün sınırlı olmasına izin verin (yani tüm bu rastgele değişkenlerin varyansları bazı sabitleri aşmasın) İLE):

O zaman pozitif sayı ne kadar küçük olursa olsun sınırlayıcı olasılık ilişkisi sağlanır:

Rastgele değişkenlerin sayısı yeterince büyükse. Veya aynı şey nedir, olasılık

Dolayısıyla Chebyshev'in teoremi şunu belirtir: Yeterince büyük bir sayıyı düşünürsek N bağımsız rastgele değişkenler ( Χ 1; X2; …Xn), o zaman olay neredeyse güvenilir kabul edilebilir (birliğe yakın bir olasılıkla), bu rastgele değişkenlerin aritmetik ortalamasının matematiksel beklentilerinin aritmetik ortalamasından sapması şuna göre olacaktır: mutlak değer istediğin kadar küçük

Kanıt. Χ 1; X2; …Xn):

(4)

; (5)

Koşulları (1) dikkate alarak şunu tespit ederiz:

(6)

Böylece, varyans olduğunda. Yani bir rastgele değişkenin değerlerinin onun etrafına yayılması matematiksel beklenti süresiz olarak azalır. Ve bu şu anlama gelir: değer ne zaman, yani, . Veya daha kesin bir ifadeyle, bir rastgele değişkenin en azından bir şekilde matematiksel beklentisinden (bir sabit) sapma olasılığı sıfıra yaklaşır. Yani, keyfi olarak küçük herhangi bir pozitif sayı için

Kanıtlanmış Chebyshev teoremine göre aritmetik ortalama çok sayıda bağımsız rastgele değişkenler ( Χ 1; X2; …Xn), rastgele bir değişken olduğundan, aslında rastgelelik karakterini kaybeder ve aslında değiştirilemez bir sabit haline gelir. Bu sabit, değerlerin matematiksel beklentilerinin aritmetik ortalamasına eşittir ( Χ 1; X2; …Xn). Bu büyük sayılar kanunudur.

Chebyshev teoreminin bir başka kanıtı da verilebilir. Bunu yapmak için Chebyshev eşitsizliğini kullanıyoruz. Hem kesikli hem de sürekli rastgele değişkenler için geçerlidir ve kendi başına bir değere sahiptir. Chebyshev eşitsizliği, bir rastgele değişkenin matematiksel beklentisinden sapmasının mutlak değeri aşmama olasılığını tahmin etmemizi sağlar. pozitif sayı. Ayrık rastgele değişkenler için Chebyshev eşitsizliğinin bir kanıtını sunalım.



Chebyshev eşitsizliği: Rastgele bir değişkenin sapma olasılığı X Mutlak değerdeki matematiksel beklentisi pozitif bir sayıdan azdır, aşağıdakilerden daha az değildir:

.

Kanıt: Eşitsizliklerin uygulanmasından oluşan olaylar Ve , zıt ise olasılıklarının toplamı 1'e eşittir, yani. . Dolayısıyla ilgilendiğimiz olasılık. (*)

Bulacağız . Bunun için varyansı bulalım rastgele değişken X.

Bu toplamın tüm terimleri negatif değildir. Bu terimleri bir kenara bırakalım (kalan şartlar için ), bunun sonucunda miktar yalnızca azalabilir. Kesin olarak şunu varsaymayı kabul edelim: k ilk terimler (dağıtım tablosunda olduğunu varsayacağız) olası değerler bu sıraya göre numaralandırılmıştır). Böylece,

Eşitsizliğin her iki tarafı da pozitiftir, dolayısıyla bunların karesini alırsak eşdeğer eşitsizliği elde ederiz . Bu açıklamayı kullanalım ve çarpanların her birini kalan toplamda yerine koyalım. sayısını (bu durumda eşitsizlik yalnızca artabilir) elde ederiz. (**)

Toplama teoremine göre olasılıkların toplamı olasılıktır. X hangisi olursa olsun değerini alacak ve bunlardan herhangi biri için sapma eşitsizliği karşılar . Toplamın olasılığı ifade ettiği sonucu çıkar . Bu, eşitsizliği (**) şu şekilde yeniden yazmamızı sağlar: . (***).

Hadi değiştirelim (***) V (*) ve alıyoruz Kanıtlanması gereken şey buydu.

Chebyshev Teoremi 2'nin Kanıtı:

Yeni bir tanesini tanıtalım rastgele değişken- rastgele değişkenlerin aritmetik ortalaması ( Χ 1; X2; …Xn):

Matematiksel beklenti ve dağılım özelliklerini kullanarak şunu elde ederiz:

; . (*)

Chebyshev eşitsizliğini miktara uygularsak, elimizdeki sonuç elde edilir.

Oran (*) dikkate alındığında,

Koşul olarak şu anlama gelir . (***) Değiştirme Sağ Taraf(***) eşitsizliğe (**) dönüştürdük

Buradan, 'deki limite geçerek şunu elde ederiz:

Olasılık bir'i geçemeyeceğinden, sonunda şunu elde ederiz:

Kanıtlamamız gereken şey de buydu.

Chebyshev teoreminin önemli bir özel durumu üzerinde duralım. Yani, bağımsız rastgele değişkenlerin ( Χ 1; X2; …Xn) aynı dağıtım yasalarına sahiptir ve dolayısıyla aynı sayısal özellikler:

(8)

O zaman (5)'e göre rastgele değişken için elimizde:

(9)

Bu durumda sınırlayıcı olasılık ilişkisi (7) şu şekli alacaktır:

(10)

(10)’dan çıkan sonuç büyük önemÇeşitli ölçüm türlerini yaparken rastgele hatalarla mücadele etmek.

Örneğin belirli bir miktarı ölçmeniz gerektiğini varsayalım. A. Bir değil birkaç tane üreteceğiz ( N) bu miktarın değerinin bağımsız olarak tekrarlanan ölçümleri. Herhangi bir ölçüm, ölçüm cihazının kusurlu olması, ölçümdeki her türlü rastgele girişim vb. ile ilişkili rastgele bir hatanın doğasında vardır. Bu nedenle sonuçlar ( Χ 1; X2; …Xn) istenilen değerin bireysel ardışık ölçümleri A genel anlamda verilmeyecektir - bunlar rastgele değişkenler olacaktır. Ayrıca, sahip olunan miktarlarla özdeş dağılımlarÇünkü ölçümler tekrar tekrar yani sabit aralıklarla yapılır. dış koşullar. Daha sonra miktar için - tüm sonuçların aritmetik ortalaması Nölçümler - sınırlayıcı olasılık ilişkisi (10) yerine getirilecektir. Bu, bu aritmetik ortalamanın rastgelelik özelliğini yitirdiği ve Agerçek anlamölçülen miktar. Bu arada, bu, formül (9) ile kanıtlanmıştır, buna göre:

(11)

Yani, istenen miktarın yeterince çok sayıda tekrarlanan ölçümünü gerçekleştirmiş olmak A her birinde rastgele bir ölçüm hatasının mümkün olduğu ve ardından bu ölçümlerin sonuçlarının aritmetik ortalamasını bulduktan sonra formülü kullanırız

A(12)

değerini alabiliriz ve neredeyse rastgele hatalar olmadan.

Bu sonuç büyük sayılar kanununun bir sonucudur. İÇİNDE bu durumda bu yasa, ölçüm sonuçlarını özetlerken (4)'ün ortaya çıkmasıyla ortaya çıkar. rastgele hatalar Prensipte hem artı hem de eksi işaretiyle eşit sıklıkta ortaya çıkan bireysel boyutlar genellikle birbirini iptal edecektir. Ve kalan hata yine de bölünecek P yani daha da azalacak P bir kere. Öyleyse ne zaman büyük değerler N değer ölçülen değere neredeyse tam olarak eşit olacaktır A. Bu sonuç doğal olarak pratikte yaygın olarak kullanılmaktadır.

Not. Büyüklük bakımından yalnızca birbirlerini iptal ederler rastgele hatalarölçümler, yani rastgele faktörlerin (parazit) eylemiyle ilişkili hatalar. Ancak sistematik (kalıcı) hatalar, yani her ölçümün doğasında bulunan hatalar doğal olarak . Örneğin, bir cihazda yere düşen (ayarlanmayan) bir ok, her ölçümde sabit (sistematik) bir hataya neden olur ve dolayısıyla bu ölçüm sonuçlarının aritmetik ortalamasında buna neden olur. Sistematik hatalar, ölçümler alınmadan önce ortadan kaldırılmalı ve ölçüm sürecinde izin verilmemelidir.

Daha sonra, ölçüm cihazının bölme değeri α ise, tekrarlanan tüm ölçümler α doğruluğu ile yapılır. Ancak o zaman, doğal olarak, tüm ölçümlerin sonuçlarının aritmetik ortalaması yalnızca α doğruluğuyla, yani cihazın doğruluğu tarafından belirlenen bir doğrulukla gösterilebilir.

Bu nedenle, miktarın yeterince fazla sayıda tekrarlanan ölçümünü yaptıktan sonra şunu düşünmemek gerekir: A ve sonra bu ölçümlerin sonuçlarının aritmetik ortalamasını bularak şunu elde ederiz: bire bir aynı Anlam A. Bunu yalnızca ölçüm cihazının doğruluğu dahilinde elde edeceğiz. Ve o zaman bile sistematik ölçüm hatasını hariç tutarsak.

İşte önemli bir şey daha özel durum büyük sayılar kanunu. İzin vermek X=k– bazı olayların gerçekleşme sayısı A V P tekrarlanan testler ( X- rastgele değer). Ve izin ver ve - Bir olayın gerçekleşme ve gerçekleşmeme olasılığı A tek bir testte. Rastgele bir değişken düşünün - bir olayın göreceli görülme sıklığı A V P testler. Biz de tanıtalım N rastgele değişkenler ( X 1, X 2, …X n), olayın gerçekleşme sayısını temsil eder A birincisinde, ikincisinde... P-th testleri. Daha sonra k = X 1 + X 2 +…+ X p ve bir olayın meydana gelmesi A pratik olarak olayın meydana gelme olasılığı ile örtüşmektedir A tek bir testte. Bu sonuç, olasılıkları başka bir yolla (teorik olarak) bulunamayan birçok rastgele olayın olasılıklarını bulmanın temelini oluşturur.

Örneğin, testin deforme olmuş (asimetrik) bir madeni paranın atılması olduğunu varsayalım ve olay A bu meydan okuma için bu bir zirve düşüşü. Olayın olasılığı Aİle klasik formül veya başka bir şekilde teorik formül bulmak zordur çünkü böyle bir formülün madalyonun deformasyonunun özelliklerini bir şekilde yansıtması gerekir. Bu nedenle, hedefe giden gerçek yol tektir: parayı tekrar tekrar atın (atış sayısı ne kadar fazla olursa) N, daha iyi) ve armanın görünümünün göreceli sıklığını ampirik olarak belirleyin. Eğer N büyükse, büyük sayılar kanununa göre bu mümkündür yüksek olasılıkşunu iddia et .

Büyük sayılar kanunu birçok doğal ve sosyal olayda kendini gösterir.

Örnek 1. Bilindiği gibi kapalı bir kap içine konulan gaz, kabın duvarlarına basınç uygular. Gaz durumu kanunlarına göre sabit bir gaz sıcaklığında bu basınç sabittir. Gaz basıncı, bireysel moleküllerinin kabın duvarlarına kaotik etkilerinden kaynaklanır. Tüm moleküllerin hızları ve hareket yönleri farklıdır, bu nedenle farklı moleküllerin damar duvarlarına çarpma kuvvetleri de farklıdır. Bununla birlikte, kabın duvarlarındaki gaz basıncı, tek tek moleküllerin darbe kuvvetiyle değil, onların etkisiyle belirlenir. ortalama zorla. Ama o ortalama biri gibi çok büyük sayı ne olursa olsun aktif kuvvetler Büyük sayılar kanununa göre pratikte değişmeden kalacaktır. Bu nedenle, kabın duvarlarındaki gaz basıncı pratikte değişmeden kalır.

Örnek 2. Örneğin otomobil sigortasıyla ilgilenen bir sigorta şirketi, sigortalı farklı olaylar (araba kazaları ve trafik kazaları) için farklı sigorta tutarları öder. Ancak bu sigorta tutarının ortalama değeri, birçok farklı ortalama olarak N Büyük sayılar kanununa göre bağımsız sigorta tutarları pratikte değişmeyecektir. Sigorta tazminat taleplerinin gerçek istatistikleri incelenerek belirlenebilir. Bir sigorta şirketinin zarara uğramaması için müşterilerinden kesilen ortalama sigorta priminin, şirketin müşterilerine ödediği ortalama primden yüksek olması gerekir. Ancak şirketin rekabetçi olabilmesi (diğer sigorta şirketleriyle çekicilik konusunda rekabet edebilmesi) için bu primin çok yüksek olmaması gerekir.

Kursun başında zaten bundan bahsetmiştik. matematik yasaları olasılık teorileri, kütlesel rastgele olayların doğasında bulunan gerçek istatistiksel kalıpların soyutlanmasıyla elde edilir. Bu modellerin varlığı, tam olarak olayın kitlesel doğasıyla, yani gerçekleştirilen çok sayıda homojen deneyle veya bütünlükleri içinde bir rastgele değişkene tabi olan çok sayıda kümülatif rastgele etkilerle ilişkilidir. iyi tanımlanmış bir yasa. Kütlesel rastgele olayların kararlılık özelliği, eski çağlardan beri insanlık tarafından bilinmektedir. Hangi alanda kendini gösterirse göstersin, özü şu şekilde özetlenebilir: spesifik özellikler her bir rastgele olgunun, kitlelerin ve bu tür olayların ortalama sonucu üzerinde neredeyse hiçbir etkisi yoktur; Her bir olguda kaçınılmaz olan ortalamadan rastgele sapmalar, kütle içinde karşılıklı olarak iptal edilir, dengelenir, dengelenir. Kelimenin geniş anlamıyla anlaşılan "büyük sayılar yasasının" fiziksel içeriğini temsil eden şey, ortalamaların bu kararlılığıdır: çok sayıda rastgele olayla, bunların ortalama sonuçları pratikte rastgele olmaktan çıkar ve tahmin edilebilir. yüksek derecede bir kesinlikle.

İÇİNDE dar anlamda Olasılık teorisinde “büyük sayılar kanunu” kelimesi bir dizi anlamına gelir matematik teoremleri, her birinde, belirli koşullar için, çok sayıda deneyin ortalama özelliklerinin belirli sabitlere yaklaştığı gerçeği belirlenir.

2.3'te bu teoremlerin en basitini, J. Bernoulli'nin teoremini zaten formüle etmiştik. Çok sayıda deneyle, bir olayın sıklığının bu olayın olasılığına yaklaştığını (daha doğrusu olasılık açısından yakınsadığını) iddia ediyor. Başkalarıyla daha fazla genel formlar Bu bölümde büyük sayılar yasasını tanıtacağız. Hepsi, belirli rastgele değişkenlerin sabit, rastgele olmayan değişkenlere olasılığındaki yakınsama olgusunu ve koşullarını ortaya koyar.

Büyük sayılar kanunu önemli bir rol oynar. pratik uygulamalar olasılık teorisi. Rastgele değişkenlerin belirli koşullar altında pratik olarak rastgele olmayanlar gibi davranma özelliği, kişinin bu niceliklerle güvenle çalışmasına ve kütlesel rastgele olayların sonuçlarını neredeyse tam bir kesinlikle tahmin etmesine olanak tanır.

Kütle rastgele fenomeni alanındaki bu tür tahminlerin olanakları, rastgele değişkenlerin sınırlayıcı değerleri ile değil, dağıtımın sınırlayıcı yasalarıyla ilgili başka bir grup sınır teoreminin varlığıyla daha da genişletilir. Hakkında"Merkezi limit teoremi" olarak bilinen bir grup teorem hakkında. Yeterince fazla sayıda rastgele değişken toplandığında, toplamın dağılım yasasının belirli koşullara bağlı olarak süresiz olarak normale yaklaştığını söylemiştik. Matematiksel olarak çeşitli yollarla - az ya da çok genel bir biçimde - formüle edilebilen bu koşullar, esas olarak, bireysel terimlerin toplamı üzerindeki etkinin eşit derecede küçük olması, yani toplamın aşağıdaki üyeleri içermemesi gerekliliğine indirgenir. miktarın dağılımı üzerindeki etkilerine göre bütünlüğe açıkça hakimdirler. Merkezi limit teoreminin çeşitli biçimleri, rastgele değişkenlerin toplamının bu sınırlayıcı özelliğinin oluşturulduğu koşullar altında birbirinden farklılık gösterir.

Büyük sayılar yasasının çeşitli biçimleri ve çeşitli formlar Merkezi limit teoremi olasılık teorisinin limit teoremleri olarak adlandırılan bir dizi oluşturur. Limit teoremleri Rastgele olaylar alanında yalnızca bilimsel tahminler yapmayı değil, aynı zamanda bu tahminlerin doğruluğunu da değerlendirmeyi mümkün kılar.

Bu bölümde sadece en çok bazılarını ele alacağız. basit şekiller sınır teoremleri. Öncelikle “büyük sayılar kanunu” grubuna ait teoremleri, ardından “merkezi limit teoremi” grubuna ait teoremleri ele alacağız.

()

Chebyshev'in büyük sayılar yasasının anlamı aşağıdaki gibidir. Bireysel bir rastgele değişken, matematiksel beklentisinin çok uzağında değerler alabilirken, olasılığı birliğe yakın olan çok sayıda rastgele değişkenin aritmetik ortalaması, matematiksel beklentilerinin aritmetik ortalamasından çok az farklı bir değer alır.
Chebyshev'in büyük sayılar yasasının özel bir durumu. İzin vermek - ortaklaşa sınırlı varyansa sahip olan ikili bağımsız rastgele değişkenler dizisi; ve aynı matematiksel beklentiler . O zaman ne olursa olsun , ilişki geçerlidir

Bu doğrudan formül ()'den gelir, çünkü

Yorum. Rastgele bir değişken olduğunu söylüyorlar olasılıkta birleşir numaraya A Artan oranlarda keyfi olarak küçük eşitsizlik olasılığı için ise N sınırsız birliğe yaklaşır. Olasılıktaki yakınsama bu anlama gelmez. Gerçekten de ikinci durum eşitsizlik yeterince büyük tüm değerler için geçerlidir N. Olasılıktaki yakınsama durumunda, bireysel keyfi büyük değerler için bu eşitsizlik N Belki Gerçekleştirilemedi. Ancak büyük değerler için eşitsizliğin sağlanamaması NÇok nadir (olası olmayan) bir olay var. Bunu dikkate alarak Chebyshev'in büyük sayılar yasasının özel bir durumu aşağıdaki gibi formüle edilebilir.
Aritmetik ortalama ikili bağımsız rastgele değişkenler ortaklaşa sınırlı varyanslara ve aynı matematiksel beklentilere sahip olan , olasılık olarak bire yakınsar.
Chebyshev'in büyük sayılar yasasının özel durumunun anlamını açıklayalım. Diyelim ki gerçek değeri bulmak istiyoruz A bazı fiziksel miktar(örneğin, bir parçanın boyutu). Bunu yapmak için birbirinden bağımsız bir dizi ölçüm yapacağız. Her ölçüme bazı hatalar eşlik eder (). Bu nedenle mümkün olan her ölçüm sonucu rastgele bir değişkendir (indeks Ben- ölçüm numarası). Her ölçümde sistematik bir hatanın, yani gerçek değerden sapmanın olmadığını varsayalım. AÖlçülen miktarın her iki yönde de eşit olması muhtemeldir. Bu durumda tüm rastgele değişkenlerin matematiksel beklentileri aynı ve ölçülen değere eşittir. A, yani
Son olarak ölçümlerin garantili bir doğrulukla yapıldığını varsayalım. Bu, tüm ölçümler için anlamına gelir. Dolayısıyla, Chebyshev'in büyük sayılar yasası koşullarındayız ve bu nedenle, eğer boyutların sayısı yeterince büyükse, o zaman pratik kesinlikle şunu söyleyebiliriz: ne olursa olsun, ortalama aritmetik sonuçlarölçüm gerçek değerden farklı A daha az

1. /PB-MS-teorisi/Dersler-1(4 sayfa).doc
2. /PB-MS-teorisi/Lectures-2(4 sayfa).doc
3. /PB-MS-teorisi/Lectures-3(4p.).doc
4. /PB-MS-teorisi/Lectures-4 (4 s.).doc
5. /PB-MS-teorisi/İçindekiler.doc
Ders 1
Ders 19. İstatistiksel hipotezlerin istatistiksel olarak test edilmesi. Hipotez testinin genel ilkeleri. İstatistiksel hipotez kavramları (basit ve karmaşık), boş ve rakip hipotezler,
Büyük sayılar kanunu. Chebyshev eşitsizliği. Chebyshev ve Bernoulli Teoremleri
Ders Kesikli ve sürekli rastgele değişkenlerin temel sayısal özellikleri: matematiksel beklenti, dağılım ve standart sapma. Özellikleri ve örnekleri
Ders Olasılık teorisinin konusu. Rastgele olaylar. Olayların cebiri. Rastgele bir olayın bağıl frekansı ve olasılığı. Etkinlik grubunu tamamlayın. Olasılığın klasik tanımı. Olasılığın temel özellikleri. Kombinatoriklerin temel formülleri

Ders 13.

Büyük sayılar kanunu. Chebyshev eşitsizliği. Chebyshev ve Bernoulli Teoremleri.
İstatistiksel kalıpların incelenmesi, belirli koşullar altında genel davranışın belirlenmesini mümkün kıldı. büyük miktar Rastgele değişkenler neredeyse rastgele karakterlerini kaybeder ve doğal hale gelir (başka bir deyişle, bazı ortalama davranışlardan rastgele sapmalar birbirini iptal eder). Özellikle, bireysel terimlerin toplamı üzerindeki etki eşit derecede küçükse, toplamın dağılım yasası normale yaklaşır. Matematiksel formülasyon Bu ifade, adı verilen bir grup teoremde verilmiştir. büyük sayılar kanunu.

Chebyshev eşitsizliği.
Diğer teoremleri kanıtlamak için kullanılan Chebyshev eşitsizliği hem sürekli hem de kesikli rastgele değişkenler için geçerlidir. Bunu kesikli rastgele değişkenler için kanıtlayalım.
Teorem 13.1 (Chebyshev eşitsizliği). P( | XM(X)| D( X) / ε². (13.1)

Kanıt. İzin vermek X dağıtım serisi tarafından verilir


X

X 1

X 2



X P

R

R 1

R 2



R P

Olaylardan bu yana | XM(X)| X M(X)| ≥ ε zıttır, o zaman R (|XM(X)| p(| XM(X)| ≥ ε) = 1, dolayısıyla, R (|XM(X)| p(| XM(X)| ≥ ε). Bulacağız R (|XM(X)| ≥ ε).

D(X) = (X 1 – M(X))² P 1 + (X 2 – M(X))² P 2 + … + (X N M(X))² P N . Bu toplamın dışında, | XM(X)| k şartlar. Daha sonra

D(X) ≥ (X k + 1 – M(X))² P k + 1 + (X k + 2 – M(X))² P k +2 + … + (X N M(X))² P N ≥ ε² ( P k + 1 + P k + 2 + … + P N).

Dikkat P k + 1 + P k + 2 + … + P N bir ihtimal var | XM(X)| ≥ ε, çünkü bu tüm olası değerlerin olasılıklarının toplamıdır X, bunun için bu eşitsizlik doğrudur. Buradan, D(X) ≥ ε² R(|XM(X)| ≥ ε) veya R (|XM(X)| ≥ ε) ≤ D(X) / ε². O halde tam tersi olayın olasılığı P( | XM(X)| D( X) / ε², kanıtlanması gereken şey buydu.
Chebyshev ve Bernoulli Teoremleri.

Teorem 13.2 (Chebyshev teoremi). Eğer X 1 , X 2 ,…, X P– varyansları eşit şekilde sınırlı olan ikili bağımsız rastgele değişkenler ( D(X Ben) ≤ C), o zaman keyfi olarak küçük bir sayı için ε eşitsizlik olasılığı

Rastgele değişkenlerin sayısı yeterince büyükse keyfi olarak 1'e yakın olacaktır.

Yorum. Başka bir deyişle, bu koşullar yerine getirilirse

Kanıt. Yeni bir rastgele değişken düşünün
ve matematiksel beklentisini bulun. Matematiksel beklentinin özelliklerini kullanarak bunu elde ederiz. Başvurmak Chebyshev eşitsizliği: Söz konusu rastgele değişkenler bağımsız olduğundan, teoremin koşullarını dikkate alarak şunu elde ederiz: Bu sonucu kullanarak önceki eşitsizliği şu şekilde sunuyoruz:

Hadi sınıra gidelim
: Olasılık 1'den büyük olamayacağından şu şekilde ifade edilebilir:

Teorem kanıtlandı.
Sonuçlar.

Eğer X 1 , X 2 , …, X P– eşit olarak sınırlı varyanslara sahip, aynı matematiksel beklentiye eşit olan ikili bağımsız rastgele değişkenler A, o zaman herhangi bir keyfi küçük ε > 0 için eşitsizlik olasılığı
Rastgele değişkenlerin sayısı yeterince büyükse 1'e istenildiği kadar yakın olacaktır. Başka bir deyişle,
.

Çözüm: Yeterince fazla sayıda rastgele değişkenin aritmetik ortalaması, matematiksel beklentilerinin toplamına yakın değerler alır, yani rastgele değişken karakterini kaybeder. Örneğin, herhangi bir fiziksel niceliğe ilişkin bir dizi ölçüm gerçekleştiriliyorsa ve: a) her ölçümün sonucu diğerlerinin sonuçlarına bağlı değilse, yani tüm sonuçlar ikili olarak bağımsız rastgele değişkenlerdir; b) Ölçümlerin sistematik hata olmadan yapılması (matematiksel beklentileri birbirine eşit ve gerçek değere eşit olması) Aölçülen miktar); c) belirli bir ölçüm doğruluğu sağlanır, dolayısıyla söz konusu rastgele değişkenlerin dağılımları eşit şekilde sınırlıdır; daha sonra, yeterince çok sayıda ölçümle, bunların aritmetik ortalamaları, ölçülen miktarın gerçek değerine keyfi olarak yakın olacaktır.
Bernoulli teoremi.
Teorem 13.3 (Bernoulli teoremi). Eğer her birinde P bağımsız deney olasılığı R bir olayın meydana gelmesi A sabitse, yeterince fazla sayıda testle, olayların bağıl sıklığının sapma modülünün olasılığı A V P gelen deneyler Rİstenildiği kadar küçük, istenildiği kadar 1'e yakın olacaktır:

(13.2)

Kanıt. Rastgele değişkenleri tanıtalım X 1 , X 2 , …, X P, Nerede X Ben görünüşe sayısı A V Ben-tecrübem. burada X Ben yalnızca iki değer alabilir: 1 (olasılıkla R) ve 0 (olasılıkla Q = 1 – P). Ek olarak, ele alınan rastgele değişkenler ikili olarak bağımsızdır ve varyansları düzgün şekilde sınırlıdır (çünkü D(X Ben) = pq, P + Q = 1, nereden pq ≤ ¼). Sonuç olarak Chebyshev teoremi aşağıdaki durumlarda onlara uygulanabilir: M Ben = P:

.

Ancak
, Çünkü X Ben göründüğünde 1 değerini alır A V bu deneyim ve eğer 0'a eşit bir değer A Olmadı. Böylece,

Q.E.D.
Yorum. Bernoulli teoreminden bunu yapma, Ne
Bu sadece olasılıklar bağıl frekans ile mutlak olasılık arasındaki farkın keyfi olarak küçük olabileceği. Fark şu şekildedir: olağan yakınsama dikkate alındığında matematiksel analiz, hepsi için P, bir değerden başlayarak eşitsizlik
her zaman idam edildi; bizim durumumuzda böyle değerler olabilir P, bu eşitsizlik doğru değil. Bu tür yakınsamaya denir olasılıkta yakınsama.

Ders 14.

Lyapunov'un merkezi limit teoremi. Moivre-Laplace limit teoremi.
Büyük sayılar kanunu formu incelemez sınır kanunu rastgele değişkenlerin toplamının dağılımı. Bu soru, adı verilen bir grup teorem içinde ele alınmaktadır. Merkezi Limit Teoremi. Her biri farklı dağılımlara sahip olabilen rastgele değişkenlerin toplamının dağılım yasasının, terim sayısı yeterince büyük olduğunda normale yaklaştığını ileri sürmektedirler. Bu, normal hukukun pratik uygulamalar için önemini açıklamaktadır.
Karakteristik fonksiyonlar.

Merkezi limit teoremini kanıtlamak için karakteristik fonksiyonlar yöntemi kullanılır.
Tanım 14.1.Karakteristik fonksiyon rastgele değişken Xçağrılan fonksiyon

G(T) = M (e itX ) (14.1)

Böylece, G (T) bazı karmaşık rastgele değişkenlerin matematiksel beklentisini temsil eder sen = e itX, değerle ilişkili X. Özellikle eğer X- Ayrık rassal değişken, yakınlarda verildi dağıtımlar daha sonra

. (14.2)

Dağıtım yoğunluğuna sahip sürekli bir rastgele değişken için F(X)

(14.3)

Örnek 1. Let X– tek atışta 6 sayı zar. Daha sonra formül (14.2)'ye göre G(T) =

Örnek 2. Dağıtılmış normalleştirilmiş sürekli bir rastgele değişken için karakteristik fonksiyonu bulalım. normal hukuk
. Formül (14.3)'e göre (formülü kullandık)
Ve ne Ben² = -1).

Karakteristik fonksiyonların özellikleri.
1. İşlev F(X) adresinde bulunabilir bilinen fonksiyon G(T) formüle göre

(14.4)

(dönüşüm (14.3) denir Fourier dönüşümü ve dönüşüm (14.4) – ters dönüşüm Fourier).

2. Rastgele değişkenler ise X Ve e ilişkiyle ilgili e = balta, o zaman karakteristik fonksiyonları ilişkiyle ilişkilidir.

G sen (T) = G X (en). (14.5)

3. Bağımsız rastgele değişkenlerin toplamının karakteristik fonksiyonu, terimlerin karakteristik fonksiyonlarının çarpımına eşittir: için

(14.6)
Teorem 14.1 (aynı şekilde dağıtılan terimler için merkezi limit teoremi). Eğer X 1 , X 2 ,…, X P,… - bağımsız rastgele değişkenler aynı kanun dağılım, matematiksel beklenti T ve varyans σ 2, ardından sınırsız artışla P toplam dağıtım kanunu
sonsuza kadar normale yaklaşır.

Kanıt.

Sürekli rastgele değişkenler için teoremi kanıtlayalım X 1 , X 2 ,…, X P(için kanıt ayrık miktarlar benzer şekilde). Teoremin koşullarına göre terimlerin karakteristik fonksiyonları aynıdır:
Daha sonra, özellik 3'e göre toplamın karakteristik fonksiyonu e N irade
Fonksiyonu genişletelim G X (T) Maclaurin serisinde:

, Nerede
en
.

Bunu varsayarak T= 0 (yani orijini noktaya taşıyın) T), O
.

(Çünkü T= 0). Elde edilen sonuçları Maclaurin formülünde yerine koyarsak şunu buluruz:

.

Yeni bir rastgele değişken düşünün
, dan farklı e N herhangi bir dağılım için P 0'a eşittir. e N Ve Z N bağlı doğrusal bağımlılık bunu kanıtlamak yeterli Z N normal yasaya göre dağıtılır veya aynı şey olan karakteristik fonksiyonu yaklaşır karakteristik fonksiyon normal yasa (bkz. örnek 2). Karakteristik fonksiyonların özelliğine göre

Ortaya çıkan ifadenin logaritmasını alalım:

Nerede

Haydi ayrıştıralım
arka arkaya P→ ∞, kendimizi açılımın iki terimiyle sınırlandırırsak ln(1 - k) ≈ - k. Buradan

Son limitin 0 olduğu yer, çünkü . Buradan,
, yani
- karakteristik fonksiyon normal dağılım. Yani terim sayısında sınırsız bir artışla miktarın karakteristik fonksiyonu Z N normal yasanın karakteristik işlevine sınırsız bir şekilde yaklaşır; bu nedenle dağıtım kanunu Z N (Ve e N) sınırsız normale yaklaşır. Teorem kanıtlandı.

A.M Lyapunov koşullar için merkezi limit teoremini kanıtladı. Genel görünüm:
Teorem 14.2 (Lyapunov teoremi). Rastgele değişken ise X aşağıdaki koşulun sağlandığı çok sayıda karşılıklı bağımsız rastgele değişkenin toplamıdır:

, (14.7)

Nerede B k – üçüncü mutlak merkezi büyüklük momenti X İle, A D k o zaman onun varyansı X normale yakın bir dağılıma sahiptir (Lyapunov koşulu, her terimin toplam üzerindeki etkisinin ihmal edilebilir olduğu anlamına gelir).
Uygulamada, merkezi limit teoremi yeterli düzeyde kullanılabilir. az miktarda olasılıksal hesaplamalar nispeten düşük doğruluk gerektirdiğinden. Deneyimler, on veya daha az terimin toplamı için dağılım yasasının normal bir yasayla değiştirilebileceğini göstermektedir.

Ayrık rastgele değişkenler için merkezi limit teoreminin özel bir durumu Moivre-Laplace teoremidir.

Teorem 14.3 (Moivre-Laplace teoremi). Üretilirse P bağımsız deneyler; her birinde bir olay A olasılıkla ortaya çıkar R ise aşağıdaki ilişki geçerlidir:

(14.8)

Nerede e – olayın gerçekleşme sayısı A V P deneyler, Q = 1 – P.

Kanıt.

Bunu varsayacağız
, Nerede X Ben– olayın gerçekleşme sayısı A V Ben-tecrübem. Daha sonra rastgele değişken
(bkz. Teorem 14.1) normal dağılmış ve normalleştirilmiş kabul edilebilir, bu nedenle (α, β) aralığına düşme olasılığı formülle bulunabilir;

Çünkü e Var Binom dağılımı, . Daha sonra
. Bu ifadeyi önceki formülde yerine koyarsak eşitlik (14.8) elde ederiz.

Sonuçlar.

Moivre-Laplace teoreminin koşulları altında olasılık
olay A içinde görünecek P tam olarak deneyler k kez, çok sayıda deneyle aşağıdaki formül kullanılarak bulunabilir:

(14.9)

Nerede
, A
(bu fonksiyonun değerleri özel tablolarda verilmiştir).

Örnek 3. 100 yazı tura atıldığında arma sayısının 40 ila 60 arasında olma olasılığını bulun.

Bunu dikkate alarak formül (14.8)'i uygulayalım. P= 0,5. Daha sonra vesaire= 100·0,5 = 50, O halde, eğer
Buradan,

Örnek 4. Önceki örneğin koşulları altında 45 arma ortaya çıkma olasılığını bulun.

Bulacağız
, Daha sonra

Ders 15.

Temel konseptler matematiksel istatistik. Nüfus ve örnek. Varyasyon serileri, istatistiksel seriler. Gruplandırılmış örnek. Gruplandırılmış istatistiksel seriler. Frekans poligonu. Örnek dağılım fonksiyonu ve histogram.
Matematiksel istatistik kütleyi yöneten kalıpların oluşturulmasıyla ilgilenir rastgele olaylar gözlemler sonucunda elde edilen istatistiksel verilerin işlenmesine dayanmaktadır. Matematiksel istatistiğin iki ana görevi şunlardır:

Bu istatistiklerin nasıl toplanıp gruplandırılacağının belirlenmesi;

Çalışmanın amaçlarına bağlı olarak elde edilen verileri analiz etmek için yöntemlerin geliştirilmesi:

a) bir olayın bilinmeyen olasılığının değerlendirilmesi; bilinmeyen dağılım fonksiyonunun tahmini; türü bilinen dağıtım parametrelerinin tahmini; diğer rastgele değişkenlere vb. bağımlılığın değerlendirilmesi;

b) kontrol et istatistiksel hipotezler görünüm hakkında bilinmeyen dağıtım veya bilinen bir dağılımın parametrelerinin değerleri hakkında.

Bu sorunları çözmek için seçim yapmanız gerekir. büyük nüfus homojen nesneler sınırlı miktarÇalışmanın sonuçlarına dayanarak, bu nesnelerin çalışılan özelliklerine ilişkin bir tahminde bulunmanın mümkün olduğu nesneler.

Matematiksel istatistiğin temel kavramlarını tanımlayalım.

Nüfus – mevcut nesnelerin tamamı.

Örnek– rastgele seçilen bir dizi nesne nüfus.

Popülasyon boyutuN ve örneklem büyüklüğüN – dikkate alınan popülasyondaki nesnelerin sayısı.

Örnekleme türleri:

Tekrarlandı– seçilen her nesne, bir sonrakini seçmeden önce genel popülasyona geri gönderilir;

Tekrarsız– seçilen nesne genel popülasyona geri gönderilmez.
Yorum. Numunenin incelenmesinden bizi ilgilendiren genel popülasyonun özelliğinin davranışı hakkında sonuçlar çıkarabilmek için, numunenin genel popülasyonun oranlarını doğru bir şekilde temsil etmesi, yani temsilci(temsilci). Büyük sayılar kanunu dikkate alındığında, her nesnenin rastgele seçilmesi durumunda bu koşulun sağlandığı ve herhangi bir nesnenin örneğe dahil edilme olasılığının aynı olduğu ileri sürülebilir.
Sonuçların birincil işlenmesi.

İlgilendiğimiz rastgele değişken olsun Xörnekteki değeri alır X 1 P 1 kez, X 2 – P 2 kez, …, X İle - P İle zamanlar ve
Nerede P- örnek boyut. Daha sonra rastgele değişkenin gözlenen değerleri X 1 , X 2 ,…, X İle isminde seçenekler, A P 1 , P 2 ,…, P İlefrekanslar. Her frekansı örnek boyutuna bölersek, şunu elde ederiz: bağıl frekanslar
Artan sırada yazılan seçenekler dizisine denir varyasyonel yanında seçeneklerin bir listesi ve bunlara karşılık gelen frekanslar veya bağıl frekanslaristatistiksel seri:


X Ben

X 1

X 2



X k

N Ben

N 1

N 2



N k

w Ben

w 1

w 2



w k

10 zar atışından oluşan 20 seri gerçekleştirildiğinde, altı puanın sayısı 1,1,4,0,1,2,1,2,2,0,5,3,3,1,0,2 oldu, 2,3 ,4,1.Hadi yazalım varyasyon serisi: 0,1,2,3,4,5. İstatistik serisi mutlak ve bağıl frekanslar için şu forma sahiptir:


X Ben

0

1

2

3

4

5

N Ben

3

6

5

3

2

1

w Ben

0,15

0,3

0,25

0,15

0,1

0,05

Sürekli bir özellik inceleniyorsa varyasyon serisi çok büyük sayıda sayıdan oluşabilir. Bu durumda kullanmak daha uygundur gruplandırılmış örnek. Bunu elde etmek için, özelliğin gözlemlenen tüm değerlerini içeren aralık, birkaç eşit kısmi uzunluk aralığına bölünür. H ve ardından her kısmi aralığı bulun N Ben– dahil edilen varyantın frekanslarının toplamı Ben aralık. Bu sonuçlardan derlenen tabloya denir gruplandırılmış istatistiksel olarak yakın :

Frekans poligonu. Örnek dağılım fonksiyonu ve histogram.
Örnekte incelenen rastgele değişkenin davranışını görselleştirmek için çeşitli grafikler oluşturabilirsiniz. Onlardan biri - Frekans aralığı: parçaları noktaları koordinatlara bağlayan kesikli bir çizgi ( X 1 , N 1), (X 2 , N 2),…, (X k , N k), Nerede X Ben x ekseni üzerinde çizilir ve N Ben – ordinat ekseninde. Mutlak olmayan değerler ordinat ekseninde çizilirse ( N Ben) ve göreceli ( w Ben) frekansı elde ederiz bağıl frekans poligonu(Şekil 1) . Pirinç. 1.

Rastgele bir değişkenin dağılım fonksiyonuna benzetilerek, belirli bir fonksiyonu, olayın bağıl sıklığını belirleyebilirsiniz. X X.

Tanım 15.1.Örnek (ampirik) dağılım fonksiyonu işlevi çağır F* (X), her değer için tanımlama X olayın göreceli sıklığı X X. Böylece,

, (15.1)

Nerede P X– seçenek sayısı, daha küçük X, P- örnek boyut.
Yorum. Deneysel olarak bulunan ampirik dağılım fonksiyonunun aksine, dağılım fonksiyonu F(X) genel popülasyona denir teorik fonksiyon dağıtım. F(X) bir olayın olasılığını belirler X X, A F* (X) – göreceli frekansı. Yeterince büyük P Bernoulli teoreminden şu şekilde, F* (X) olasılık eğilimindedir F(X).

Ampirik dağılım fonksiyonunun tanımından, özelliklerinin aşağıdaki özelliklerle örtüştüğü açıktır: F(X), yani:


  1. 0 ≤F* (X) ≤ 1.

  2. F* (X) azalmayan bir fonksiyondur.

  3. Eğer X 1 en küçük seçenektir, o halde F* (X) = 0 XX 1; Eğer X İle – o zaman en iyi seçenek F* (X) = 1 X> X İle .
Sürekli bir özellik için grafiksel bir gösterim grafik çubuğu yani tabanları dikdörtgenlerden oluşan basamaklı bir şekil kısmi aralıklar uzunluk H ve yükseklikler uzunluklar N Ben / H(frekans histogramı) veya w Ben / H (göreceli frekansların histogramı). İlk durumda, histogramın alanı örnek hacmine eşittir, ikincisinde birliktir (Şekil 2). İncir. 2.

Ders 16.

Sayısal özellikler istatistiksel dağılım: Örnek ortalama, varyans tahminleri, mod ve medyan tahminler, başlangıç ​​ve merkezi moment tahminleri. İstatistiksel Açıklama ve iki boyutlu bir rastgele vektörün parametrelerinin tahminlerinin hesaplanması.
Matematiksel istatistiğin görevlerinden biri, mevcut örnek kullanılarak incelenen rastgele değişkenin sayısal özelliklerinin değerlerini tahmin etmektir.

Tanım 16.1.Örnek ortalama ortalama denir aritmetik değerlerörneklemde kabul edilen rastgele değişken:

, (16.1)

Nerede X Ben- seçenekler, N Ben- frekanslar.

Yorum.Örnek ortalama, incelenen rastgele değişkenin matematiksel beklentisini tahmin etmeye yarar. Böyle bir tahminin ne kadar doğru olduğu sorusu daha sonra tartışılacaktır.

Tanım 16.2.Örnek varyans isminde

, (16.2)

A Numune standart sapması

(16.3)

Tıpkı rastgele değişkenler teorisinde olduğu gibi, kanıtlanabilir ki aşağıdaki formülörnek varyansını hesaplamak için:

. (16.4)

Örnek 1. Bir istatistiksel seri tarafından verilen bir örneğin sayısal özelliklerini bulalım.


X Ben

2

5

7

8

N Ben

3

8

7

2

Varyasyon serisinin diğer özellikleri şunlardır:

- modaM 0 – seçeneği olan en yüksek frekans(önceki örnekte M 0 = 5).

- medyanT e - varyasyon serisini seçenek sayısı eşit olan iki parçaya bölen seçenek. Sayı seçeneği tek ise ( N = 2k+1), o zaman M e = X k + 1 ve çift için N = 2k
. Özellikle örnek 1'de

Başlangıç ​​ve merkezi momentlerin (ampirik momentler olarak adlandırılan) tahminleri, karşılık gelen teorik momentlere benzer şekilde belirlenir:

- düzenin ilk ampirik anık isminde

. (16.5)

Özellikle,
yani birinci dereceden başlangıç ​​ampirik momenti numune ortalamasına eşittir.

- merkezi ampirik düzen momentik isminde

. (16.6)

Özellikle,
yani ikinci dereceden merkezi ampirik moment örnek varyansa eşittir.
İstatistiksel açıklama ve özelliklerin hesaplanması

iki boyutlu rastgele vektör.
İki boyutlu rastgele değişkenlerin istatistiksel çalışmasında asıl görev genellikle bileşenler arasındaki ilişkiyi tanımlamaktır.

İki boyutlu bir örnek, rastgele vektör değerlerinin bir kümesidir: ( X 1 , en 1), (X 2 , en 2), …, (X P , sen P). Bunun için bileşenlerin örnek ortalamalarını belirleyebilirsiniz:

ve karşılık gelen örnek varyansları ve standart sapmalar. Ek olarak hesaplanabilir koşullu ortalamalar: - gözlemlenen değerlerin aritmetik ortalaması e, karşılık gelen X = x, Ve - gözlemlenen değerlerin ortalaması X, karşılık gelen e = sen.

İki boyutlu bir rastgele değişkenin bileşenleri arasında bir bağımlılık varsa, farklı tip: her olası değer varsa fonksiyonel bağımlılık X bir değerle eşleşir e ve istatistiksel, bir miktardaki değişikliğin diğerinin dağılımında da değişikliğe yol açtığı. Bir değerdeki değişiklik sonucunda diğerinin ortalama değeri değişirse, aralarındaki istatistiksel bağımlılığa korelasyon denir.

Ders 17.

Dağılım parametrelerinin istatistiksel özelliklerinin temel özellikleri: tarafsızlık, tutarlılık, verimlilik. Örneklem ortalamasının tarafsızlığı ve tutarlılığı, matematiksel beklentinin bir tahminidir. Örnekleme varyans önyargısı. Tarafsız bir varyans tahmincisine bir örnek. Asimptotik olarak tarafsız tahminler. Tahmin oluşturma yöntemleri: maksimum olabilirlik yöntemi, moment yöntemi, nicelik yöntemi, yöntem en küçük kareler Tahminde Bayes yaklaşımı.
Dağılım parametrelerinin (örnek ortalaması, örnek varyansı, vb.) istatistiksel tahminlerini elde ettikten sonra, bunların popülasyonun karşılık gelen özelliklerine yeterince yakın bir tahmin olarak hizmet ettiğinden emin olmanız gerekir. Karşılanması gereken şartları belirleyelim.

Θ* olsun - istatistiksel değerlendirme bilinmeyen parametre Θ teorik dağılım. Genel popülasyondan aynı büyüklükte birkaç örnek çıkaralım P ve her biri için Θ parametresinin tahminini hesaplayın:
O halde Θ* tahmini, olası değerleri alan rastgele bir değişken olarak düşünülebilir. Θ*'nın matematiksel beklentisi, tahmin edilen parametreye eşit değilse, tahminleri hesaplarken elde ederiz. sistematik hatalar bir işaret (fazlasıyla birlikte) M(Θ*) >Θ ve bir dezavantajı varsa: M(Θ*) М (Θ*) = Θ.
Tanım 17.2.İstatistiksel tahmin Θ* denir tarafsız, eğer matematiksel beklentisi herhangi bir örneklem büyüklüğü için tahmin edilen Θ parametresine eşitse:

M(Θ*) = Θ. (17.1)

Yerinden edilmiş Matematiksel beklentisi tahmin edilen parametreye eşit olmayan tahmine tahmin denir.

Ancak tarafsızlık söz konusu değil yeterli koşul Tahmin edilen parametrenin gerçek değerine iyi bir yaklaşım. Bu durumda, olası Θ* değerleri ortalama değerden önemli ölçüde sapabilirse, yani Θ* dağılımı büyükse, o zaman bir numunenin verilerinden bulunan değer, tahmin edilen parametreden önemli ölçüde farklı olabilir. Bu nedenle dağılıma kısıtlamalar getirilmesi gerekmektedir.
Tanım 17.2.İstatistiksel değerlendirme denir etkili, eğer belirli bir örneklem büyüklüğü içinse P mümkün olan en küçük varyansa sahiptir.
Büyük örneklemler dikkate alınırken istatistiksel tahminler de tutarlılık şartına tabidir.
Tanım 17.3.Zengin istatistiksel tahmin denir, ne zaman P→∞ olasılık açısından tahmin edilen parametreye yönelir (eğer bu tahmin tarafsızsa, o zaman şu durumda tutarlı olacaktır: P→∞ varyansı 0'a eğilimlidir).
Bundan emin olalım matematiksel beklentinin tarafsız bir tahminini temsil eder M(X).

Bunu rastgele bir değişken olarak ele alacağız ve X 1 , X 2 ,…, X P yani, örneklemi oluşturan, incelenen rastgele değişkenin değerleri, – bağımsız, aynı şekilde dağıtılmış rastgele değişkenler olarak X 1 , X 2 ,…, X P, matematiksel beklentisi olan A. Matematiksel beklentinin özelliklerinden şu sonuç çıkar:

Ancak her bir miktardan dolayı X 1 , X 2 ,…, X P genel nüfusla aynı dağılıma sahip, A = M(X), yani M(
) = M(X), kanıtlanması gereken şey buydu. Örnek ortalama yalnızca tarafsız değil, aynı zamanda matematiksel beklentinin tutarlı bir tahminidir. Bunu varsayarak X 1 , X 2 ,…, X P sınırlı varyanslara sahipse, Chebyshev teoreminden bunların aritmetik ortalamaları, yani artan oranlarda olduğu sonucu çıkar. P olasılık açısından matematiksel beklentiye yönelir A değerlerinin her biri, yani M(X). Sonuç olarak, örneklem ortalaması matematiksel beklentinin tutarlı bir tahminidir.

Örnek ortalamasından farklı olarak örnek varyansı, popülasyon varyansının taraflı bir tahminidir. Kanıtlanabilir ki

, (17.2)

Nerede D G – popülasyon varyansının gerçek değeri. Dağılımın başka bir tahmini önerilebilir: düzeltilmiş varyansS ² , formülle hesaplanır

. (17.3)

Böyle bir tahmin tarafsız olacaktır. Şuna karşılık gelir düzeltilmiş ortalama standart sapma

. (17.4)

Tanım 17.4. Bazı niteliklerin değerlendirilmesine denir asimptotik olarak tarafsızörnek için ise X 1 , X 2 , …, X P

, (17.5)

Nerede X– incelenen miktarın gerçek değeri.
Değerlendirme oluşturma yöntemleri.
1. Maksimum olabilirlik yöntemi.
İzin vermek X– sonuç olarak ayrık rastgele değişken P testler değerler aldı X 1 , X 2 , …, X P. Θ parametresi tarafından belirlenen bu miktarın dağılım yasasını bildiğimizi ancak bilmediğimizi varsayalım. Sayısal değer bu parametre. Nokta tahminini bulalım.

İzin vermek R(X Ben, Θ) test sonucunda değerin ortaya çıkma olasılığıdır. X değerini alacak X Ben. Hadi arayalım olasılık fonksiyonu Ayrık rassal değişken X bağımsız değişken işlevi Θ, aşağıdaki formülle belirlenir:

L (X 1 , X 2 , …, X P ; Θ) = P(X 1,Θ) P(X 2,Θ)… P(X N ,Θ).

Daha sonra Θ parametresinin nokta tahmini olarak Θ* = Θ( değerini alırız. X 1 , X 2 , …, X P olabilirlik fonksiyonunun maksimuma ulaştığı noktadır. Tahmini Θ* denir maksimum olasılık tahmini.

Fonksiyonlardan beri L ve ln L Aynı Θ değerinde bir maksimuma ulaşıldığında, maksimum ln'yi aramak daha uygundur. Llogaritmik fonksiyon güvenilirlik. Bunu yapmak için ihtiyacınız var:


Maksimum olabilirlik yönteminin avantajları: elde edilen tahminler tutarlıdır (önyargılı olabilmelerine rağmen), büyük değerler için asimptotik olarak normal şekilde dağıtılır P ve diğer asimptotik olarak normal tahminlerle karşılaştırıldığında en küçük varyansa sahiptir; tahmin edilen parametre Θ için varsa etkili değerlendirmeΘ*, o zaman olabilirlik denklemi tek kararΘ*; yöntem, numune verilerinden en eksiksiz şekilde faydalanılmasını sağlar ve bu nedenle özellikle küçük numuneler durumunda kullanışlıdır.

Maksimum olabilirlik yönteminin dezavantajı: hesaplama karmaşıklığı.
Bilinen bir dağılım yoğunluğuna sahip sürekli bir rastgele değişken için F(X) ve bilinmeyen bir parametre Θ varsa, olabilirlik fonksiyonu şu şekildedir:

L (X 1 , X 2 , …, X P ; Θ) = F(X 1,Θ) F(X 2,Θ)… F(X N ,Θ).

Bilinmeyen bir parametre için maksimum olasılık tahmini, ayrık bir rastgele değişkenle aynı şekilde gerçekleştirilir.
2. Momentler yöntemi.
Momentler yöntemi, başlangıç ​​ve merkezi ampirik momentlerin sırasıyla başlangıç ​​ve merkezi teorik momentlerin tutarlı tahminleri olduğu gerçeğine dayanmaktadır. teorik noktalar aynı düzende karşılık gelen ampirik momentler.

Dağıtım yoğunluk tipi belirtilmişse F(X, Θ), bilinmeyen bir parametre Θ tarafından belirleniyorsa, bu parametreyi tahmin etmek için bir denklemin olması yeterlidir. Örneğin, biri eşit olabilir ilk anlar birinci derece:

,

böylece Θ'yi belirlemek için bir denklem elde edilir. Çözümü Θ*, örnek ortalamasının ve dolayısıyla örnek değişkeninin bir fonksiyonu olan parametrenin bir nokta tahmini olacaktır:

Θ = ψ ( X 1 , X 2 , …, X P).

Eğer bilinen türler dağıtım yoğunluğu F(X, Θ 1, Θ 2) iki bilinmeyen parametre Θ 1 ve Θ 2 tarafından belirlenirse, o zaman iki denklem oluşturmak gerekir, örneğin

v 1 = M 1 , μ 2 = T 2 .

Buradan
- iki bilinmeyeni Θ 1 ve Θ 2 olan iki denklemden oluşan bir sistem. Çözümleri, örnekleme seçeneğinin nokta tahminleri Θ 1 * ve Θ 2 * - fonksiyonları olacaktır:

Θ 1 = ψ 1 ( X 1 , X 2 , …, X P),

Θ 2 = ψ 2 ( X 1 , X 2 , …, X P).
3. En küçük kareler yöntemi.

Miktarların bağımlılığını tahmin etmeniz gerekiyorsa en Ve X ve bunları bağlayan fonksiyonun şekli bilinmektedir, ancak içerdiği katsayıların değerleri bilinmemektedir; değerleri, en küçük kareler yöntemi kullanılarak mevcut örnekten tahmin edilebilir. Bu amaçla fonksiyon en = φ ( X) gözlemlenen değerlerin sapmalarının karelerinin toplamı olacak şekilde seçilir en 1 , en 2 ,…, en Pφ'den ( X Ben) minimum düzeydeydi:

Bu durumda bulmak gerekir sabit nokta fonksiyonlar φ( X; A, B, C), yani sistemi çözün:

(Çözüm elbette ancak bilindiği takdirde mümkündür) spesifik tip fonksiyonlar φ).

Örnek olarak parametrelerin seçimini ele alalım. doğrusal fonksiyon en küçük kareler yöntemi.

Parametreleri değerlendirmek için A Ve B işlevde sen = balta + B, bulacağız
Daha sonra
. Buradan
. Ortaya çıkan her iki denklemi de bölmek P ve ampirik momentlerin tanımlarını hatırlayarak, aşağıdaki ifadeleri elde edebiliriz: A Ve B gibi:

. Bu nedenle aralarındaki bağlantı X Ve en formda belirtilebilir:


4. Tahminlerin elde edilmesine Bayes yaklaşımı.
İzin vermek ( e, X) – yoğunluğunun bilindiği rastgele vektör R(en|X) koşullu dağıtım e her değerde X = x. Deneme yalnızca değerlerle sonuçlanırsa e ve karşılık gelen değerler X bilinmiyor, sonra bazılarını tahmin etmek için verilen fonksiyon φ( X) yaklaşık değeri olarak koşullu matematiksel beklentinin aranması önerilmektedir. M (φ‌‌( X)‌‌‌‌‌‌|e), aşağıdaki formülle hesaplanır:

, Nerede , R(X X, Q(sen) – koşulsuz dağılımın yoğunluğu e. Bir sorun ancak bilindiği zaman çözülebilir R(X). Ancak bazen tutarlı bir tahmin oluşturmak mümkündür. Q(sen), yalnızca numunede elde edilen değerlere bağlı olarak e.

Ders 18.

Bilinmeyen parametrelerin aralık tahmini. Tahmin doğruluğu, güven olasılığı(güvenilirlik), güven aralığı. Bilinen ve bilinmeyen varyanslı normal bir dağılımın matematiksel beklentisini tahmin etmek için güven aralıklarının oluşturulması. Normal bir dağılımın standart sapmasını tahmin etmek için güven aralıkları.
Küçük bir hacimden numune alırken Nokta tahmini tahmini parametreden önemli ölçüde farklı olabilir, bu da büyük hatalara yol açar. Bu nedenle bu durumda kullanmak daha iyidir aralık tahminleri yani hangi aralıkta olduğunu gösterir verilen olasılık tahmin edilen parametrenin gerçek değeri düşer. Elbette bu aralığın uzunluğu ne kadar kısa olursa parametre tahmini o kadar doğru olur. Bu nedenle eşitsizlik | Θ* - Θ | 0 karakterize eder tahmin doğruluğu(δ ne kadar küçük olursa tahmin o kadar doğru olur). Ancak istatistiksel yöntemler sadece bu eşitsizliğin belirli bir olasılıkla karşılandığını söylememize izin verin.

Tanım 18.1.Güvenilirlik (güven olasılığı) Θ parametresinin Θ* tahmini, γ eşitsizliğinin karşılanma olasılığıdır | Θ* - Θ |
P (Θ* - δ
Dolayısıyla γ, Θ'nin (Θ* - δ, Θ* + δ) aralığına düşme olasılığıdır.

Tanım 18.2.Güvenilir düştüğü aralığa denir bilinmeyen parametre belirli bir güvenilirlikle γ.
Güven aralıklarının oluşturulması.
1. Bilinen bir varyansa sahip normal bir dağılımın matematiksel beklentisini tahmin etmek için güven aralığı.

Rastgele değişkenin çalışılmasına izin verin X bilinen ortalama karesi σ olan normal bir yasaya göre dağıtılır ve örnek ortalamanın değerine dayalı olarak matematiksel beklentisinin tahmin edilmesi gerekir. A. Örnek ortalamasını rastgele bir değişken olarak ele alacağız ve değerler örnek seçenektir X 1 , X 2 ,…, X P aynı şekilde dağıtılmış bağımsız rastgele değişkenler olarak X 1 , X 2 ,…, X P her birinin matematiksel bir beklentisi var A ve standart sapma σ. burada M() = A,
(matematiksel beklenti ve bağımsız rastgele değişkenlerin toplamının dağılımının özelliklerini kullanıyoruz). Eşitsizliğin olasılığını tahmin edelim
. Normal dağılmış bir rastgele değişkenin belirli bir aralığa düşme olasılığı için formülü uygulayalım:

R (
) = 2F
. Daha sonra şu gerçeği dikkate alarak, R() = 2F
=

2F( T), Nerede
. Buradan
ve önceki eşitlik şu şekilde yeniden yazılabilir:

. (18.1)

Yani matematiksel beklentinin değeri A olasılık (güvenilirlik) ile γ aralığına düşer
, değer nerede T Laplace fonksiyonu tablolarından eşitlik 2Ф( olacak şekilde belirlenir. T) = γ.
Örnek. Örneklem büyüklüğü normal ise, normal dağılmış bir rastgele değişkenin matematiksel beklentisi için güven aralığını bulalım. P = 49,
σ = 1,4 ve güven olasılığı γ = 0,9.

Hadi tanımlayalım T, hangi noktada Ф( T) = 0,9:2 = 0,45: T= 1,645. Daha sonra

veya 0,9 güvenirlik ile 2,471 a a.
2. Varyansı bilinmeyen normal bir dağılımın matematiksel beklentisini tahmin etmek için güven aralığı.

Eğer incelenen rastgele değişkenin biliniyorsa X Bilinmeyen bir standart sapma ile normal yasaya göre dağıtılır, daha sonra aramak için güven aralığı matematiksel beklentisi için yeni bir rastgele değişken oluşturuyoruz

, (18.2)

Nerede - örnek ortalaması, S– düzeltilmiş varyans, P- örnek boyut. Olası değerleri şu şekilde gösterilecek olan bu rastgele değişken: T, bir Öğrenci dağılımına sahiptir (bkz. Ders 12) ve k = N– 1 serbestlik derecesi.

Öğrenci dağılım yoğunluğundan beri
, Nerede
açıkça bağlı değildir A ve σ, belirli bir aralığa düşme olasılığını ayarlayabilirsiniz (- T γ , T γ ), dağıtım yoğunluğunun düzgünlüğü dikkate alınarak aşağıdaki şekilde:
. Buradan şunu anlıyoruz:

(18.3)

Böylece bir güven aralığı elde edildi. A, Nerede T γ verilen ilgili tablodan bulunabilir P ve γ.

Örnek. Örnek boyutunun P = 25, = 3, S= 1,5. için güven aralığını bulalım. Aγ = 0,99'da. Tablodan bunu buluyoruz T γ (P= 25, γ = 0,99) = 2,797. Daha sonra
veya 0,99 olasılıkla 2,161a a.
3. Normal bir dağılımın standart sapmasını tahmin etmek için güven aralıkları.

Formun güven aralığını arayacağız ( S – δ, S), Nerede S düzeltilmiş örnek standart sapmasıdır ve δ için aşağıdaki koşul sağlanır: P (|σ – S|
Bu eşitsizliği şu şekilde yazalım:
veya, belirleme
,

Formülle belirlenen rastgele değişken χ'yi ele alalım.

,

ki-kare kanununa göre dağıtılır P-1 serbestlik derecesi (bkz. ders 12). Dağıtım yoğunluğu

tahmin edilen parametre σ'ya bağlı değildir, yalnızca örneklem büyüklüğüne bağlıdır P. Eşitsizliği (18.4) χ 1 formunu alacak şekilde dönüştürelim. Q

,

veya ile çarpıldıktan sonra
,
. Buradan,
. Daha sonra
Bulabileceğiniz ki-kare dağılımına ilişkin tablolar bulunmaktadır. Q verilene göre P ve γ bu denklemi çözmeden. Böylece numuneden alınan değer hesaplandıktan sonra S ve tablodan değerin belirlenmesi Qσ değerinin belirli bir γ olasılığıyla düştüğü güven aralığını (18.4) bulabiliriz.
Yorum. Eğer Q> 1 ise, σ > 0 koşulu dikkate alındığında, σ için güven aralığının sınırları olacaktır.

. (18.5)

İzin vermek P = 20, S= 1.3. Belirli bir güvenilirlik γ = 0,95 için σ'nun güven aralığını bulalım. Bulduğumuz ilgili tablodan Q (N= 20, γ = 0,95) = 0,37. Dolayısıyla güven aralığının sınırları şöyledir: 1,3(1-0,37) = 0,819 ve 1,3(1+0,37) = 1,781. Yani 0,819



Makaleyi beğendin mi? Arkadaşlarınla ​​paylaş!