Onay kriterlerine neden ihtiyaç duyuluyor? Pearson χ2 uyum iyiliği testi (Ki-kare)

İŞİN AMACI

Bu laboratuvar çalışmasının amacı:

· deney sonuçlarına göre dağıtım yasalarının oluşturulması rastgele değişken telsiz dirençlerin parametrelerinin dağılımı;

· hakkındaki hipotezin test edilmesi normal hukuk eleman parametrelerinin sapmalarının dağılımı;

· deneysel çalışma sıcaklığa maruz kaldığında telsiz dirençlerin parametrelerindeki değişiklikler.

ÇALIŞMA SÜRESİ

Laboratuvar çalışması, öğrencilerin teorik kısım hakkındaki bilgilerini değerlendirmek için bir kolokyum için 1 saat olmak üzere 4 saatlik bir ders boyunca gerçekleştirilir.

TEORİK BÖLÜM

Radyo-elektronik ekipman, cihaz elemanlarının parametrelerinin değiştiği etkisi altında sürekli olarak dış ve iç rahatsız edici rastgele faktörlerin etkisi altındadır. Elemanların (dirençler, kapasitörler, yarı iletken cihazlar, entegre devreler vb.) parametrelerinin değiştirilmesi çeşitli işlemlerle ilişkilidir. fiziksel süreçler nedeniyle malzemelerde meydana gelen dış etkiler ve yaşlanma. Ek olarak, RES elemanlarının parametreleri, imalatları sırasında rastgele faktörlerin etkisinin bir sonucu olan bir üretim dağılımına sahiptir. Bu tür elemanlardan tasarlanan ekipman, çıkış parametrelerini değiştirerek tüm değişikliklere tepki verir. RES'in güvenilirliğini tahmin etmek için, üretimleri ve rahatsız edici dış koşullar (özellikle ortam sıcaklığı) tarafından belirlenen elementlerin parametrelerinin dağılımının rastgele değerinin dağılımına ilişkin yasaların oluşturulmasına ihtiyaç vardır.

İÇİNDE laboratuvar çalışması Uyum iyiliği kriterleri (Pearson veya Kolmogorov) kullanılarak, rastgele değişken X'in (elementlerin parametrelerinin dağılımı) normal dağılım yasası hakkındaki hipotez test edilir.

İSTATİSTİK HİPOTEZLERİNİ TEST ETMEK İÇİN KULLANILAN ANLAŞMA KRİTERLERİ

Uyum iyiliği kriterleri, deneyden elde edilen numunenin, söz konusu rastgele değişkenin önceden seçilmiş dağılım yasasıyla çelişmediği varsayımının olasılığını değerlendirmemize olanak tanır. Bu problemin çözümü matematiksel istatistiğin temel konumunun kullanılmasına dayanmaktadır. Deneysel (istatistiksel) dağılım fonksiyonu, numunenin söz konusu önceki dağılıma ait olması koşuluyla, numune boyutu sınırsız arttığında olasılık açısından önceki (karşılaştırılabilir teorik) dağılım fonksiyonuna yakınsar. Şu tarihte: nihai değerÖrneklerde ampirik ve a priori dağılım fonksiyonları genel anlamda birbirinden farklı olacaktır. Bu nedenle örnek için X 1 , X 2 ,… xn rastgele değişken X Ampirik dağılım fonksiyonunun belirli bir sayısal tutarsızlık ölçüsü (uyum iyiliği kriteri) () tanıtıldı

, ben =1, 2, …, N , (1)

Nerede

= X 1 , X 2 ,… xn– deneysel veri örneği

ve a priori – dağıtım fonksiyonu.

A priori ve ampirik dağılımlar arasındaki uyum hakkındaki hipotezi test etme kuralı şu şekilde formüle edilmiştir:

daha sonra numunenin ait olduğu önceki dağılımın hipotezi X 1 , X 2 ,…,xn eşit F(X) reddedilmelidir. Eşik değerini belirlemek için İLEÖrneklemin dağılıma ait olduğu hipotezini reddetmenin kabul edilebilir belirli bir olasılığının belirlenmesi F. Olasılık a'ya uyum iyiliği kriterinin anlamlılık düzeyi denir. Daha sonra

onlar. İLEeşik değeri kriter, sapma ölçüsünün dağılım fonksiyonunun a-yüzde noktasına eşittir.

Olay, dağıtım yasasıyla ilgili ileri sürülen hipotezin doğru olması durumunda da gerçekleşebilir. Ancak a yeterince küçükse bu tür durumların olasılığı pratikte ihmal edilebilir. a için genel olarak belirtilen değerler a = 0,05 ve a = 0,01'dir.

Uzaklaşma ölçüsünün dağıtım yasası () bağlı değilse F, daha sonra anlaşma hipotezini reddetme kuralı ve F

(4)

önceki dağıtıma bağlı değildir. Bu tür kriterlere parametrik olmayan denir (bkz. bölüm 3.1.2).

Dağılımın doğası hakkındaki hipotez, uyum iyiliği kriteri kullanılarak farklı bir sırayla test edilebilir: elde edilen değerden a olasılığını belirlemek gerekir. N= R{ N). Ortaya çıkan değer ise N < a , то отклонения значимые; если aN³ a, o zaman sapmalar anlamlı değildir. Değerler N 1'e çok yakın (çok iyi uyum) numunenin kalitesinin düşük olduğunu gösterebilir (örneğin, ortalamadan büyük sapmalar veren unsurlar orijinal numuneden sebepsiz yere atılmıştır).

İstatistiklerde kullanılan uyum iyiliği kriterleri, istatistiksel ve teorik dağılım yasaları arasındaki çeşitli tutarsızlık ölçümlerinde birbirinden farklılık gösterir (). Bunlardan bazıları aşağıda tartışılmaktadır.

3.1.1. Anlaşma kriteri c 2

Uyum iyiliği kriteri c 2 (Pearson kriteri) kullanıldığında ampirik ve önceki dağılımlar arasındaki tutarsızlığın ölçüsü aşağıdaki şekilde belirlenir.

Bölge olası değerler, üzerinde tanımlandığı F(X) - önceki dağıtım fonksiyonu bölünmüştür son sayıörtüşmeyen aralıklar – , i = 1, 2,…, L.

Gösterimi tanıtalım: – önceki olasılıkörnek değer isabetleri aralıkta

Şurası açık ki. Gözlemlenen örneğin elemanlarına izin verin X 1 , X 2 ,…, xn aralığa aittir.

Bu açıktır.

Ampirik ve a priori dağılımlar arasındaki tutarsızlığın bir ölçüsü olarak değeri alalım.

, (5)

rastgele değişken değerlerinin deneysel isabet sayısı nerede X aralıkta,

L– miktarın tüm deneysel değerlerinin bölündüğü aralıkların sayısı X,

N– numune büyüklüğü,

ben– rastgele bir değişkene çarpma olasılığı X-th aralığında, teorik dağılım yasası için hesaplanır (ürün, teorik yasa için - aralığındaki isabet sayısını belirler).

Pearson'un kanıtladığı gibi, N® ¥ miktarın dağıtım kanunu (5) şu eğilimdedir: - ile dağıtım S = L- Dağılımla ilgili hipotez doğru olmadığı sürece 1 serbestlik derecesi.

İşaretliyse karmaşık hipotezörneğin dağılıma ait olduğu, dağılımın bilinmeyen parametresinin (skaler veya vektör) olduğu, daha sonra deneyden (sonuç alınan örneğe dayanarak) tahmin belirlenir bilinmeyen parametre– . Bu durumda S - serbestlik derecesi sayısı c 2 - dağılımı şuna eşittir: Sol – sağ – 1, Nerede R– tahmini dağılım parametrelerinin sayısı. .

Bir örneğin bir dağılıma ait olup olmadığına ilişkin hipotezi test etme kuralı şu şekilde formüle edilebilir: yeterince büyük bir N(n> 50) ve belirli bir anlamlılık seviyesi a için, eğer hipotez reddedilir:

burada - a - yüzdelik nokta - serbestlik derecesine sahip dağılımlar.

Kolmogorov kriteri

İstatistiklerin a priori ve ampirik dağılımları arasındaki tutarsızlığın bir ölçüsü olarak alalım.

().= , (7)

Nerede - üst sınır Elde edilen tüm değerler için fark modülü X.

Bu istatistiğin (rastgele değişken) herhangi bir N bağlı değil

Keşke bir örnek olsaydı X 1 , X 2 ,… xn inşa edildiğine göre bu sonuncusu da ona ait - sürekli fonksiyon. Ancak sonlu bir değerde dağılım fonksiyonunun tam ifadesi Nçok hantal . BİR. Kolmogorov, fonksiyonlar için oldukça basit bir asimptotik ifade (için) buldu:

, z> 0. (8) Dolayısıyla, büyük boyutlarörnekler (ile N> 50), (8)'i kullanarak şunu elde ederiz:

Anlaşma kriterleri (uyumluluk)

Ampirik dağılımın teorik dağılım yasasına uygunluğu hakkındaki hipotezi test etmek için, özel istatistiksel göstergeler- anlaşma kriterleri (veya uygunluk kriterleri). Bunlar arasında Pearson, Kolmogorov, Romanovsky, Yastremsky vb. kriterleri yer almaktadır. Anlaşma kriterlerinin çoğu ampirik frekansların teorik olanlardan sapmalarının kullanımına dayanmaktadır. Açıkçası, bu sapmalar ne kadar küçük olursa, teorik dağılım ampirik dağılıma o kadar iyi karşılık gelir (veya onu tanımlar).

Onay kriterleri - bunlar ampirik dağılımın teorik olasılık dağılımına uygunluğu hakkındaki hipotezleri test etmek için kullanılan kriterlerdir. Bu tür kriterler iki sınıfa ayrılır: genel ve özel. Genel uyum iyiliği testleri, bir hipotezin en genel formülasyonuna, yani gözlemlenen sonuçların önceden varsayılan herhangi bir olasılık dağılımıyla uyumlu olduğu hipotezine uygulanır. Özel uyum iyiliği testleri, uyumun formüle edildiği özel sıfır hipotezlerini gerektirir. belli bir biçim olasılık dağılımları.

Onay kriterlerine dayalı yerleşik yasa dağılımlar, teorik ve ampirik frekanslar arasındaki tutarsızlıkların ne zaman önemsiz (rastgele) ve ne zaman önemli (rastgele olmayan) olarak kabul edilmesi gerektiğini belirlemeyi mümkün kılar. Bundan, anlaşma kriterlerinin, ampirik serilerdeki dağılımın doğası hakkındaki serileri hizalarken ileri sürülen hipotezin doğruluğunu reddetmeyi veya onaylamayı ve belirli bir ampirik dağılım için kabul etmenin mümkün olup olmadığını cevaplamayı mümkün kıldığı sonucu çıkmaktadır. Bazı teorik dağıtım yasalarıyla ifade edilen bir model.

Pearson'un χ 2 (ki-kare) uyum iyiliği testi, temel uyum iyiliği testlerinden biridir. İngiliz matematikçi Karl Pearson (1857-1936) tarafından ampirik ve teorik dağılımların frekansları arasındaki tutarsızlıkların rastgeleliğini (anlamını) değerlendirmek için önerilmiştir:

Nerede k- ampirik dağılımın bölündüğü grupların sayısı; fi- bir özelliğin ampirik frekansı Ben-inci grup; / ts °р - oturum açmanın teorik sıklığı i-th grup.

Kriteri uygulama şeması e) Teorik ve ampirik dağılımların tutarlılığını değerlendirmek aşağıdakilere gelir.

  • 1. Hesaplanan tutarsızlık ölçüsü % 2 ach belirlenir.
  • 2. Serbestlik derecesi sayısı belirlenir.
  • 3. Serbestlik derecesi v sayısına göre %^bl özel bir tablo kullanılarak belirlenir
  • 4. Eğer % 2 asch > x 2 abl ise, belirli bir a önem seviyesi ve serbestlik derecesi sayısı v için, tutarsızlıkların önemsizliği (rastgelelik) hakkındaki hipotez reddedilir. Aksi takdirde, hipotezin elde edilen deneysel verilerle çelişmediği kabul edilebilir ve (1 - a) olasılığıyla teorik ve ampirik frekanslar arasındaki tutarsızlıkların rastgele olduğu iddia edilebilir.

Önem düzeyi - bu, ileri sürülen hipotezin yanlışlıkla reddedilme olasılığıdır, yani. Doğru bir hipotezin reddedilme olasılığı. İÇİNDE istatistiksel araştırmaÇözülen görevlerin önemine ve sorumluluğuna bağlı olarak aşağıdaki üç önem düzeyi kullanılır:

  • 1) a = 0,1 ise P = 0,9;
  • 2) a = 0,05 ise P = 0,95;
  • 3) a = 0,01 ise P = 0,99.

Uyum iyiliği kriterinin kullanılması y), Aşağıdaki koşulların karşılanması gerekir.

  • 1. İncelenen popülasyonun hacmi koşulu karşılamalıdır p> 50, frekans veya grup büyüklüğü ise en az 5 olmalıdır. Bu koşul ihlal edilirse, öncelikle küçük frekansların (5'ten az) birleştirilmesi gerekir.
  • 2. Ampirik dağılım, rastgele örnekleme sonucunda elde edilen verilerden oluşmalıdır; bağımsız olmaları gerekir.

Pearson uyum iyiliği kriterinin dezavantajı, gözlem sonuçlarını aralıklar halinde gruplandırma ve bireysel aralıkları az sayıda gözlemle birleştirme ihtiyacıyla ilişkili orijinal bilginin bir kısmının kaybıdır. Bu bağlamda, dağıtım uygunluğunun kontrolünün kritere eklenmesi tavsiye edilir. e) diğer kriterler. Bu özellikle örneklem büyüklüğünün küçük olduğu durumlarda gereklidir. N ~ 100.

İstatistiklerde, Kolmogorov uyum iyiliği testi (Kolmogorov-Smirnov uyum iyiliği testi olarak da bilinir), iki ampirik dağılımın aynı yasaya uyup uymadığını veya sonuçta ortaya çıkan bir dağılımın varsayılan bir modele uyup uymadığını belirlemek için kullanılır. . Kolmogorov kriteri, birikmiş frekanslar veya ampirik veya teorik dağılımların frekansları arasındaki maksimum tutarsızlığın belirlenmesine dayanmaktadır. Kolmogorov kriteri aşağıdaki formüller kullanılarak hesaplanır:

Nerede D Ve D- buna göre, birikmiş frekanslar (/-/") ile birikmiş frekanslar ( rr") ampirik ve teorik dağılım serileri; N- toplamdaki birim sayısı.

Değeri hesapladıktan X, Ampirik frekansların teorik olanlardan sapmalarının rastgele olduğunun belirtilme olasılığını belirlemek için özel bir tablo kullanılır. İşaret 0,3'e kadar değerler alıyorsa, bu, frekansların tamamen çakıştığı anlamına gelir. Çok sayıda gözlem ile Kolmogorov testi hipotezden herhangi bir sapmayı tespit edebilir. Bu, yeterince fazla sayıda gözlem olması durumunda örneklem dağılımı ile teorik dağılım arasındaki herhangi bir farkın bunun yardımıyla tespit edileceği anlamına gelir. Bu mülkün pratik önemi önemsizdir, çünkü çoğu durumda elde edilmeye güvenmek zordur. büyük sayı Sabit koşullar altında yapılan gözlemlerde, numunenin uyması gereken dağılım yasasının teorik fikri her zaman yaklaşıktır ve istatistiksel testlerin doğruluğu, seçilen modelin doğruluğunu aşmamalıdır.

Romanovsky uyum iyiliği testi Pearson kriterinin kullanımına dayanmaktadır; zaten bulunan değerler x 2 > ve serbestlik derecesi sayısı:

burada v, varyasyon serbestliği derecesinin sayısıdır.

Romanovsky kriteri, x2 tablolarının yokluğunda uygundur. Eğer KrİLE? > 3 ise bunlar rastgele değildir ve teorik dağılım, incelenen ampirik dağılım için bir model olarak hizmet edemez.

B. S. Yastremsky, anlaşma kriterinde serbestlik derecesi sayısını değil, grup sayısını kullandı ( k), grup sayısına bağlı olarak özel bir değer olan 0 ve bir ki-kare değeri. Yastremsky anlaşması kriteri, Romanovsky kriteri ile aynı anlama sahiptir ve aşağıdaki formülle ifade edilir:

burada x 2 Pearson'un uyum iyiliği testidir; /e gr - grup sayısı; 0 - katsayı, 20'den az grup sayısı için 0,6'ya eşittir.

Eğer 1ph etkisi > 3 ise, teorik ve ampirik dağılımlar arasındaki tutarsızlıklar rastgele değildir; ampirik dağılım normal dağılımın gereksinimlerini karşılamıyor. 1f hareket ederse

Bu bölümde hipotezlerin inandırıcılığının test edilmesiyle ilgili konulardan biri olan teorik ve istatistiksel dağılımın tutarlılığı konusunu ele alacağız.

Bu istatistiksel dağılımın bazı teorik eğriler kullanılarak hizalandığını varsayalım. f(x)(Şekil 7.6.1). Teorik eğri ne kadar iyi seçilirse seçilsin istatistiksel dağılımla arasında bazı farklılıklar olması kaçınılmazdır. Doğal olarak şu soru ortaya çıkıyor: Bu tutarsızlıklar yalnızca sınırlı sayıda gözlemle ilişkili rastgele koşullarla mı açıklanıyor, yoksa bunlar önemli mi ve seçtiğimiz eğrinin verilen istatistiksel dağılımı iyi bir şekilde düzeltmemesi gerçeğiyle ilişkili mi? Bu soruyu cevaplamak için “onay kriterleri” olarak adlandırılanlar kullanılır.

RASTGELE DEĞİŞKENLERİN DAĞILIMI YASALARI



Onay kriterlerini uygulamanın ardındaki fikir aşağıdaki gibidir.

Bu istatistiksel materyale dayanarak hipotezi test etmemiz gerekiyor. N, rastgele değişkenin olması gerçeğinden oluşur X bazı özel dağıtım kanunlarına uyar. Bu yasa şu veya bu biçimde belirtilebilir: örneğin bir dağıtım işlevi biçiminde F(x) veya dağıtım yoğunluğu olarak f(x), veya bir dizi olasılık olarak p t, Nerede p t- değerin olasılığı X içine düşecek ben bir şey deşarj.

Bu formlardan dolayı dağıtım fonksiyonu F(x) en genel olanıdır ve diğerlerini belirler, bir hipotez formüle edeceğiz N, miktarın olması gerçeğinden ibaret olarak X^(q:) dağıtım fonksiyonuna sahiptir.

Bir hipotezi kabul etmek veya reddetmek için N, bir miktar düşünün sen, Teorik ve teorik arasındaki tutarsızlık derecesini karakterize eden istatistiksel dağılımlar. Büyüklük sen seçilebilir çeşitli şekillerde; örneğin şu şekilde sen teorik olasılıkların karesel sapmalarının toplamını alabilirsiniz p t karşılık gelen frekanslardan P* veya bazı katsayılar (“ağırlıklar”) ile aynı karelerin toplamı veya maksimum sapma istatistiksel fonksiyon dağıtım F*(x) teorikten F(x) vb. Değerin olduğunu varsayalım. senöyle ya da böyle seçilmiştir. Açıkçası biraz var rastgele değişken. Bu rastgele değişkenin dağılım yasası, rastgele değişkenin dağılım yasasına bağlıdır X, hangi deneylerin yapıldığı ve deney sayısı hakkında P. Eğer hipotez N doğruysa miktarın dağılım yasası sen miktarın dağılım kanunu ile belirlenir X(işlev F(x)) ve sayı P.

Bu dağıtım yasasını bildiğimizi varsayalım. Bu deney dizisinin sonucunda seçtiğimiz ölçünün



ONAY KRİTERLERİ


tutarsızlıklar sen bir anlam kazandı A. Soru, bunun rastgele nedenlerle açıklanıp açıklanamayacağı veya bu farklılığın çok büyük olup, teorik ve istatistiksel dağılımlar arasında anlamlı bir farkın varlığına ve dolayısıyla hipotezin uygunsuzluğuna işaret edip etmediğidir. N? Bu soruyu cevaplamak için hipotezin olduğunu varsayalım. N doğrudur ve bu varsayım altında, yetersiz miktarda deneysel materyalle ilişkili rastgele nedenlerden dolayı tutarsızlık ölçüsünün ortaya çıkma olasılığını hesaplıyoruz. sen deneysel olarak gözlemlediğimiz değerden daha az olmayacak Ve, yani olayın olasılığını hesaplıyoruz:

Bu olasılık çok küçükse, o zaman hipotez N daha az makul olduğu için reddedilmelidir; eğer bu olasılık anlamlı ise deneysel verilerin hipotezle çelişmediği kabul edilmelidir. N.

Şu soru ortaya çıkıyor: Farklılığın ölçüsü £/ nasıl seçilmelidir? Bazı seçme yöntemleriyle miktarın dağılım yasasının ortaya çıktığı ortaya çıktı. sençok var basit özellikler ve yeterince büyük N pratik olarak fonksiyondan bağımsız F(x). Kullanılan tam olarak bu tutarsızlık ölçümleridir. matematiksel istatistik onay kriterleri olarak.

En sık kullanılan anlaşma kriterlerinden birini - sözde "kriter"i ele alalım. sen?" Pearson.

Her biri bir rastgele değişken içeren hektarlarca bağımsız deneyin yapıldığını varsayalım. X belli bir anlam kazandı. Deney sonuçları şu şekilde özetlenmiştir: k kategoriler halinde ve istatistiksel bir seri halinde sunulmaktadır.

Bu notta χ2 dağılımı, sabit olasılık dağılımına sahip bir veri setinin tutarlılığını test etmek için kullanılır. Anlaşma kriteri sıklıkla O Belirli bir kategoriye ait olduğunuz veriler, gerçekte belirtilen dağılıma sahip olsaydı teorik olarak beklenen frekanslarla karşılaştırılır.

χ2 uyum iyiliği kriterini kullanan testler birkaç aşamada gerçekleştirilir. Öncelikle belirli bir olasılık dağılımı belirlenerek orijinal verilerle karşılaştırılır. İkinci olarak, seçilen olasılık dağılımının parametreleri (örneğin matematiksel beklentisi) hakkında bir hipotez ortaya atılır veya bunların değerlendirmesi yapılır. Üçüncüsü, dayalı teorik dağılım Her kategoriye karşılık gelen teorik olasılık belirlenir. Son olarak verilerin ve dağılımın tutarlılığını kontrol etmek için χ2 test istatistiği kullanılır:

Nerede f 0- gözlemlenen frekans, f e- teorik veya beklenen frekans, k- birleştirme sonrasında kalan kategori sayısı, R- tahmin edilecek parametre sayısı.

Notu veya formatında indirin, formattaki örnekler

Poisson dağılımı için χ 2 uyum iyiliği testinin kullanılması

Excel'de bu formülü kullanarak hesaplama yapmak için =SUMproduct() işlevini kullanmak uygundur (Şekil 1).

Parametreyi tahmin etmek için λ tahmini kullanabilirsiniz . Teorik frekans X parametreye karşılık gelen başarılar (X = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ve daha fazlası) λ = 2,9 =POISSON.DAĞ(X;;YANLIŞ) fonksiyonu kullanılarak belirlenebilir. Poisson olasılığının örneklem büyüklüğüyle çarpılması N teorik frekansı elde ederiz f e(Şekil 2).

Pirinç. 2. Gerçek ve teorik frekanslar dakika başına gelenler

Şekil 2'den aşağıdaki gibi. 2'de dokuz veya daha fazla varışın teorik sıklığı 1,0'ı geçmez. Her kategorinin 1,0 veya daha yüksek bir sıklık içerdiğinden emin olmak için "9 veya daha fazla" kategorisi "8" kategorisiyle birleştirilmelidir. Yani geriye dokuz kategori kalır (0, 1, 2, 3, 4, 5, 6, 7, 8 ve daha fazlası). O zamandan beri matematiksel beklenti Poisson dağılımı örnek verilere dayanarak belirlenir, serbestlik derecesi sayısı k – p – 1 = 9 – 1 – 1 = 7'ye eşittir. 0,05'e eşit bir anlamlılık düzeyi kullanarak şunu buluruz: kritik değerχ 2 istatistik, =HI2.OBR(1-0.05;7) = 14.067 formülüne göre 7 serbestlik derecesine sahiptir. Belirleyici kuralşu şekilde formüle edilmiştir: hipotez H 0χ 2 > 14,067 ise reddedilir, aksi takdirde hipotez reddedilir H 0 sapma yapmaz.

χ 2'yi hesaplamak için formül (1)'i kullanıyoruz (Şekil 3).

Pirinç. 3. Poisson dağılımı için χ2 -uygunluk kriterinin hesaplanması

χ 2 = 2,277 olduğundan< 14,067, следует, что гипотезу H 0 reddedilemez. Başka bir deyişle, müşterilerin bankaya gelişinin Poisson dağılımına uymadığını iddia etmek için hiçbir nedenimiz yok.

Normal dağılım için χ 2 -uygunluk testinin uygulanması

Önceki notlarda, sayısal değişkenlerle ilgili hipotezleri test ederken, incelenen popülasyonun normal şekilde dağıldığını varsaymıştık. Bu varsayımı kontrol etmek için kutu grafiği veya normal dağılım grafiği gibi grafik araçlarını kullanabilirsiniz (daha fazla ayrıntı için bkz.). Şu tarihte: büyük hacimlerÖrnekler için bu varsayımları test etmek amacıyla normal dağılım için χ 2 uyum iyiliği testini kullanabilirsiniz.

Örnek olarak 158 yatırım fonunun 5 yıllık getiri verilerini ele alalım (Şekil 4). Verilerin normal şekilde dağılıp dağılmadığına inanmak istediğinizi varsayalım. Boş ve alternatif hipotezler şu şekilde formüle edilmiştir: H 0: 5 yıllık getiri uyuyor normal dağılım, H 1: 5 yıllık getiri normal dağılıma uymuyor. Normal dağılımın iki parametresi vardır: matematiksel beklenti μ ve standart sapmaσ, örnek verilere dayanarak tahmin edilebilir. İÇİNDE bu durumda = 10,149 ve S = 4,773.

Pirinç. 4. 158 fonun beş yıllık ortalama yıllık getirisine ilişkin verileri içeren sıralı bir dizi

Fon getirilerine ilişkin veriler örneğin %5 genişliğinde sınıflara (aralıklara) göre gruplandırılabilir (Şekil 5).

Pirinç. 5. 158 fonun beş yıllık ortalama yıllık getirisinin frekans dağılımı

Normal dağılım sürekli olduğundan normal dağılım eğrisinin sınırladığı şekillerin alanının ve her aralığın sınırlarının belirlenmesi gerekir. Ayrıca normal dağılım teorik olarak –∞ ile +∞ arasında değiştiği için sınıf sınırlarının dışında kalan şekillerin alanlarının da hesaba katılması gerekir. Yani -10 noktasının solundaki normal eğrinin altındaki alan, Z değerinin solundaki standartlaştırılmış normal eğrinin altında yatan şeklin alanına eşittir:

Z = (–10 – 10,149) / 4,773 = –4,22

Z = –4,22 değerinin solundaki standartlaştırılmış normal eğrinin altında kalan şeklin alanı =NORM.DAĞ(-10;10.149;4.773;DOĞRU) formülü ile belirlenir ve yaklaşık olarak 0,00001'e eşittir. Normal eğrinin altında kalan şeklin –10 ile –5 noktaları arasındaki alanını hesaplamak için öncelikle –5 noktasının solunda kalan şeklin alanını hesaplamanız gerekir: =NORM.DAĞ( -5,10.149,4.773,DOĞRU) = 0,00075 . Yani şeklin –10 ve –5 noktaları arasındaki normal eğrinin altında kalan alanı 0,00075 – 0,00001 = 0,00074'tür. Benzer şekilde, her sınıfın sınırlarıyla sınırlı olan şeklin alanını hesaplayabilirsiniz (Şekil 6).

Pirinç. 6. 5 yıllık getirilerin her bir sınıfı için alanlar ve beklenen sıklıklar

Dört uç sınıftaki (iki minimum ve iki maksimum) teorik frekansların 1'den küçük olduğu görülebilir, dolayısıyla sınıfları Şekil 7'de gösterildiği gibi birleştireceğiz.

Pirinç. 7. Normal dağılım için χ2 uyum iyiliği testinin kullanımına ilişkin hesaplamalar

Veriler ile normal dağılım arasındaki uyum için formül (1)'i kullanarak χ2 testini kullanıyoruz. Örneğimizde birleştirme sonrasında geriye altı sınıf kalıyor. Beklenen değer ve standart sapma örnek verilerden tahmin edildiği için serbestlik derecesi sayısı kP – 1 = 6 – 2 – 1 = 3. 0,05 anlamlılık düzeyini kullanarak, üç serbestlik derecesine sahip χ 2 istatistiğinin kritik değerinin = CI2.OBR(1-0.05;F3) = 7,815 olduğunu buluyoruz. χ2 uyum iyiliği kriterinin kullanımına ilişkin hesaplamalar Şekil 2'de gösterilmektedir. 7.

χ 2 -istatistik = 3,964 olduğu görülebilir.< χ U 2 7,815, следовательно гипотезу H 0 reddedilemez. Yani yüksek büyümeye odaklı yatırım fonlarının 5 yıllık getirilerinin normal dağılıma tabi olmadığını iddia edecek bir dayanağımız yok.

Birkaç son notlar dikkate alınan farklı yaklaşımlar kategorik verilerin analizi. İki veya daha fazla bağımsız örneğin analizinden elde edilen kategorik verilerle ilgili hipotezleri test etmeye yönelik yöntemler açıklanmaktadır. Ki-kare testlerine ek olarak parametrik olmayan prosedürler de dikkate alınır. Uygulama koşullarının sağlanamadığı durumlarda kullanılan Wilcoxon sıra testi anlatılmaktadır. T-iki bağımsız grubun matematiksel beklentilerinin eşitliğine ilişkin hipotezin test edilmesine yönelik kriterlerin yanı sıra tek faktörlü varyans analizine alternatif olan Kruskal-Wallis testi (Şekil 8).

Pirinç. 8. Blok şeması Kategorik verilerle ilgili hipotezleri test etme yöntemleri

Levin ve diğerleri İstatistikleri kitabından materyaller kullanılmıştır. – M.: Williams, 2004. – s. 763–769

Tanım 51. Değerlerin tutarlı olup olmadığına karar vermenizi sağlayan kriterler X 1 , X 2 ,…, xn rastgele değişken X dağıtım fonksiyonuna ilişkin bir hipotez ile denir rıza kriterleri.

Onay kriterlerini kullanma fikri

Bu istatistiksel materyale dayanarak bir hipotezin test edilmesine izin verin N, SV'nin olması gerçeğinden oluşur X bazı özel dağıtım kanunlarına uyar. Bu yasa bir dağıtım fonksiyonu olarak belirtilebilir. F(X) veya dağıtım yoğunluğu şeklinde F(X) veya bir olasılıklar kümesi olarak ben. Tüm bu formlardan dolayı dağıtım fonksiyonu F(X) en genel olanıdır (hem DSV hem de NSV için mevcuttur) ve diğerlerini belirlerse, bir hipotez formüle edeceğiz N miktarın olması gerçeğinden ibaret olarak X bir dağıtım işlevi vardır F(X).

Bir hipotezi kabul etmek veya reddetmek için N, bir miktar düşünün sen teorik ve istatistiksel dağılımların farklılık (sapma) derecesini karakterize eden. Büyüklüksen çeşitli şekillerde seçilebilir: 1) Teorik olasılıkların karesel sapmalarının toplamı ben karşılık gelen frekanslardan, 2) bazı katsayılar (ağırlıklar) ile aynı karelerin toplamı, 3) istatistiksel (ampirik) dağılım fonksiyonunun teorikten maksimum sapması F(X).

Değere izin ver senöyle ya da böyle seçilmiştir. Açıkçası, bu bir tür rastgele değişkendir. Dağıtım kanunu sen rastgele değişkenin dağılım yasasına bağlıdır X Hangi deneylerin yapıldığı ve deney sayısı N. Eğer hipotez N doğruysa miktarın dağılım yasası sen miktarın dağılım kanunu ile belirlenir X(işlev F(X)) ve sayı N.

Bu dağıtım yasasının bilindiğini varsayalım. Bu deney dizisinin sonucunda, seçilen tutarsızlık ölçüsünün sen bir anlam kazandı sen. Soru: Bu rastgele nedenlerle açıklanabilir mi yoksa bu çelişki de büyüktür ve teorik ve istatistiksel (ampirik) dağılımlar arasında anlamlı bir farkın varlığını ve dolayısıyla hipotezin uygun olmadığını gösterir. N? Bu soruyu cevaplamak için hipotezin olduğunu varsayalım. N doğrudur ve bu varsayım altında, yetersiz miktarda deneysel materyalle ilişkili rastgele nedenlerden dolayı tutarsızlık ölçüsünün ortaya çıkma olasılığını hesaplıyoruz. sen deneysel olarak gözlemlenen değerden daha az olmayacaktır sen yani olayın olasılığını hesaplıyoruz: .

Bu olasılık küçükse, hipotez N pek inandırıcı olmadığı için reddedilmelidir, ancak bu olasılık önemliyse o zaman deneysel verilerin hipotezle çelişmediği sonucuna varırız. N.

Şu soru ortaya çıkıyor: Farklılığın (sapmanın) ölçüsü nasıl seçilmelidir? sen? Bazı seçme yöntemleriyle miktarın dağılım yasasının ortaya çıktığı ortaya çıktı. sençok basit özelliklere sahip ve yeterince büyük N pratik olarak fonksiyondan bağımsız F(X). Matematiksel istatistiklerde anlaşma kriteri olarak kullanılan tam da bu tutarsızlık ölçümleridir.

Tanım 51/. Anlaşma kriteri, bilinmeyen bir dağılımın varsayılan yasası hakkındaki hipotezi test etme kriteridir.

Normale yakın dağılımlara sahip niceliksel veriler için şunu kullanın: parametrik matematiksel beklenti ve standart sapma gibi göstergelere dayalı yöntemler. Özellikle, iki örnek için ortalamalar arasındaki farkın güvenilirliğini belirlemek için Öğrenci yöntemi (kriter) kullanılır ve üç veya çok sayıdaörnekler, - test F, veya varyans analizi. Niceliksel olmayan verilerle uğraşıyorsak veya örnekler, alındıkları popülasyonların normal bir dağılım izlediğinden emin olamayacak kadar küçükse, o zaman şunu kullanın: parametrik olmayan yöntemler - kriter χ2 niteliksel veriler için (ki-kare) veya Pearson ve sıralı veriler için işaretler, sıralar, Mann-Whitney, Wilcoxon vb. testleri.

Ayrıca seçim istatistiksel yöntem ortalamaları karşılaştırılan örneklerin bağımsız(örneğin iki farklı denek grubundan alınmış) veya bağımlı(yani aynı denek grubunun maruziyet öncesi ve sonrası veya iki farklı maruziyet sonrasındaki sonuçlarını yansıtır).

s. 1. Pearson testi (- ki-kare)

Üretilsin N her birinde rastgele değişken X'in belirli bir değer aldığı bağımsız deneyler, yani rastgele değişkenin gözlemlerinin bir örneği verildi X (nüfus) hacim N. Teorik ve ampirik dağılım fonksiyonlarının yakınlığını kontrol etme problemini ele alalım. ayrık dağıtım yani deneysel verilerin hipotezle tutarlı olup olmadığını kontrol etmek gerekir N 0, rastgele değişkenin olduğunu belirten X bir dağıtım kanunu var F(X) anlamlılık seviyesinde α . Bu yasaya “teorik” diyelim.

Bir hipotezi test etmek için uyum iyiliği kriterini elde ederken, ölçüyü belirleyin. D belirli bir numunenin ampirik dağılım fonksiyonunun tahmini (teorik) dağılım fonksiyonundan sapmaları F(X).

En sık kullanılan ölçü Pearson tarafından ortaya atılan ölçüdür. Bu tedbiri ele alalım. Rasgele değişken değerleri kümesini bölelim X Açık R kümeler - gruplar S 1 , S 2 ,…, efendim, olmadan ortak noktalar. Pratikte böyle bir bölüm ( R- 1) sayılar C 1 < C 2 < … < c r-1. Bu durumda, her aralığın sonu karşılık gelen kümenin dışında bırakılır ve soldaki dahil edilir.

S 1 S 2 S 3 …. efendim -1 efendim

C 1 C 2 C 3 c r -1

İzin vermek ben, , - SV olasılığı X sete ait ben(açıkça ). İzin vermek n ben, , - gözlenenler arasından büyüklüklerin (varyant) sayısı, birçok kişiye ait ben(ampirik frekanslar). Daha sonra SV vuruşlarının göreceli sıklığı Xçoğunda ben en N gözlemler. Açıktır ki, .

Yukarıdaki bölünme için ben bir artış var F(X) sette ben ve artış aynı settedir. Deneylerin sonuçlarını gruplandırılmış istatistiksel seriler halinde bir tablo halinde özetleyelim.

Grup Sınırları Bağıl frekans
S 1:X 1 – X 2
S 2: X 2 – X 3
efendim: x rx r +1

bilmek teorik hukuk dağılımda, her gruba düşen bir rastgele değişkenin teorik olasılıklarını bulabilirsiniz: R 1 , R 2 , …, pr. Teorik ve ampirik (istatistiksel) dağılımların tutarlılığını kontrol ederken teorik olasılıklar arasındaki tutarsızlıklardan yola çıkacağız. ben ve gözlemlenen frekanslar.

Ölçü için D ampirik dağılım fonksiyonunun teorik olandan farklılıkları (sapmaları) teorik olasılıkların sapmalarının karelerinin toplamını alır ben belirli "ağırlıklar" ile alınan karşılık gelen frekanslardan ben: .

Oranlar ben tanıtıldı çünkü genel durum ile ilgili sapmalar farklı gruplar, önem bakımından eşit kabul edilemez: aynı mutlak değer olasılığın kendisi varsa sapma önemsiz olabilir ben büyüktür ve küçükse çok fark edilir. Bu nedenle doğal olarak “ağırlıklar” ben olasılıklarla ters orantılıdır. Bu katsayı nasıl seçilir?

K. Pearson şunu gösterdi: koyarsak o zaman büyük N miktar dağılım kanunu sençok basit özelliklere sahiptir: pratik olarak dağıtım fonksiyonundan bağımsızdır F(X) ve deney sayısına ilişkin N ancak yalnızca grup sayısına bağlıdır R yani bu yasanın giderek artması N ki-kare dağılımı olarak adlandırılan dağılıma yaklaşır .

Eğer ihtiyacın olursa ek malzeme Bu konuyla ilgili veya aradığınızı bulamadıysanız, çalışma veritabanımızdaki aramayı kullanmanızı öneririz:

Alınan materyalle ne yapacağız:

Bu materyal sizin için yararlı olduysa, onu sosyal ağlardaki sayfanıza kaydedebilirsiniz:



Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!