Anlaşmanın kriteri şudur. Pearson uyum iyiliği testi

İstatistiksel hipotezler. Onay kriterleri.

Hükümsüz(temel) tür hakkında ileri sürülen hipotezi çağırın bilinmeyen dağıtım veya bilinen dağılımların parametreleri hakkında. Rekabet (alternatif) sıfır hipoteziyle çelişen hipotez denir.

Örneğin sıfır hipotezi rastgele değişkenin X yasaya göre dağıtılıyorsa, o zaman rakip bir hipotez, rastgele değişkenin X farklı bir kanuna göre dağıtılmaktadır.

İstatistiksel kriter(veya sadece kriter) rastgele değişken olarak adlandırılır İLE, sıfır hipotezini test etmeye hizmet eder.

Seçimden sonra belirli kriterörneğin bir kriter, tüm kriterlerin kümesi olası değerler iki ayrı alt kümeye bölünmüştür: bunlardan biri sıfır hipotezinin reddedildiği kriter değerlerini, diğeri ise kabul edildiği kriter değerlerini içerir.

Kritik alan sıfır hipotezinin reddedildiği bir dizi kriter değeridir. Hipotez Kabul Alanı hipotezin kabul edildiği kriter değerleri kümesini çağırın. Kritik noktalar Kritik bölgeyi sıfır hipotezinin kabul edildiği bölgeden ayıran noktalara denir.

Örneğimiz için, değeri ile numuneden hesaplanan değer, hipotezin kabul alanına karşılık gelir: rastgele değişken yasaya göre dağıtılır. Hesaplanan değer ise kritik bölgeye yani dağılıma ilişkin hipoteze düşer. rastgele değişken yasal olarak reddedildi.

Dağılım durumunda kritik bölge eşitsizlik tarafından belirlenir, sıfır hipotezinin kabul edildiği bölge ise eşitsizlik tarafından belirlenir.

2.6.3. Anlaşma kriteri Pearson.

Hayvan bilimi ve veteriner genetiğinin görevlerinden biri de gerekli özelliklere sahip yeni ırk ve türlerin yetiştirilmesidir. Örneğin bağışıklığın arttırılması, hastalıklara karşı direncin arttırılması veya kürkün renginin değiştirilmesi.

Uygulamada, sonuçları analiz ederken, çoğu zaman gerçek sonuçların az çok bazı sonuçlara karşılık geldiği ortaya çıkar. teorik yasa dağıtımlar. Gerçek (ampirik) veriler ile teorik (varsayımsal) veriler arasındaki yazışma derecesinin değerlendirilmesine ihtiyaç vardır. Bunu yapmak için boş bir hipotez öne sürün: Ortaya çıkan nüfus “A” yasasına göre dağıtılır. Beklenen dağılım yasasına ilişkin hipotez, özel olarak seçilmiş bir rastgele değişken olan uyum iyiliği kriteri kullanılarak test edilir.

Anlaşma kriteri bilinmeyen bir dağılımın varsayılan yasasına ilişkin bir hipotezi test etmek için bir kriter olarak adlandırılır.

Çeşitli anlaşma kriterleri vardır: Pearson, Kolmogorov, Smirnov, vb. Pearson uyum iyiliği testi en yaygın kullanılanıdır.

Nüfusun normal dağılımına ilişkin hipotezin test edilmesi örneğini kullanarak Pearson kriterinin uygulanmasını ele alalım. Bu amaçla ampirik ve teorik (normal dağılımın devamında hesaplanan) frekansları karşılaştıracağız.

Teorik ve ampirik frekanslar arasında genellikle bir miktar fark vardır. Örneğin:

Ampirik frekanslar 7 15 41 93 113 84 25 13 5

Teorik frekanslar 5 13 36 89 114 91 29 14 6

İki durumu ele alalım:

Teorik ve ampirik frekanslar arasındaki tutarsızlık rastgeledir (önemsizdir), yani. göre ampirik frekansların dağılımı hakkında bir öneride bulunmak mümkündür. normal hukuk;

Teorik ve ampirik frekanslar arasındaki tutarsızlık tesadüfi (önemli) değildir; teorik frekanslar, normal popülasyon dağılımının yanlış hipotezine dayanarak hesaplandı.

Pearson uyum iyiliği testini kullanarak teorik ve ampirik frekanslar arasındaki tutarsızlığın tesadüfi olup olmadığını belirleyebilirsiniz; verilen ile güven olasılığı Dağıtılmış olanı belirle nüfus normal yasalara göre olsun ya da olmasın.

O halde ampirik dağılım n büyüklüğündeki bir örneklemden elde edilsin:

Seçenekler......

Ampirik frekanslar…….

Teorik frekansların normal dağılım varsayımı altında hesaplandığını varsayalım. Anlamlılık düzeyinde boş hipotezi test etmek gerekir: popülasyon normal olarak dağılmıştır.

Sıfır hipotezini test etmek için bir kriter olarak rastgele bir değişken alacağız.

(*)

Bu değer rastgeledir, çünkü çeşitli deneyimler daha önce bilinmeyen farklı değerler alır. Ampirik ve teorik frekanslar ne kadar az farklılık gösterirse, kriterin değeri de o kadar küçük olur ve bu nedenle şu şekildedir: belli bir dereceye kadar Ampirik ve teorik dağılımların yakınlığını karakterize eder.

Bir rastgele değişkenin (*) dağılım yasasının, genel popülasyonun hangi dağılım yasasına tabi olduğuna bakılmaksızın, serbestlik dereceli bir dağılım yasasına yöneldiği kanıtlanmıştır. Bu nedenle rastgele değişken (*) ile gösterilir ve kriterin kendisi de “ki-kare” uyum iyiliği kriteri olarak adlandırılır.

Gözlemsel verilerden hesaplanan kriterin değerini ile gösterelim. Tablolanmış kritik değerler için kriterler bu seviye serbestlik derecesinin önemi ve sayısı ifade edilir. Bu durumda serbestlik derecesi sayısı eşitlikten belirlenir, burada grup sayısı ( kısmi aralıklar) örnekler veya sınıflar; - beklenen dağılımın parametre sayısı. Normal dağılımın iki parametresi vardır: matematiksel beklenti ve ortalama standart sapma. Bu nedenle normal dağılım için serbestlik derecesi sayısı eşitlikten bulunur.

Hesaplanan değer için ise tablo değeri eşitsizlik geçerli ise popülasyonun normal dağılımına ilişkin sıfır hipotezi kabul edilir. Eğer sıfır hipotezi reddedilir ve alternatif hipotez kabul edilir (popülasyon normal dağılmamıştır).

Yorum. Pearson uyum iyiliği testi kullanıldığında örneklem büyüklüğü en az 30 olmalıdır. Her grup en az 5 seçenek içermelidir. Gruplar 5'ten az frekans içeriyorsa komşu gruplarla birleştirilir.

İÇİNDE genel durum ki-kare dağılımı için serbestlik derecesi sayısı şu şekilde verilir: toplam sayı karşılık gelen göstergelerin hesaplandığı miktarlardan bu miktarları birbirine bağlayan koşulların sayısı çıkarıldığında, yani; aralarındaki farklılık olasılığını azaltır. En basit durumlarda, hesaplama sırasında serbestlik derecesi sayısı bir azaltılmış sınıf sayısına eşit olacaktır. Yani, örneğin dihibrit bölme ile 4 sınıf elde edilir, ancak yalnızca birinci sınıf ilgisizdir, sonrakiler zaten öncekilerle ilişkilidir. Bu nedenle dihibrit bölünme için serbestlik derecesi sayısıdır.



Örnek 1. Tüberkülozlu inek sayısına göre grupların gerçek dağılımının, normal dağılım dikkate alınarak hesaplanan teorik olarak beklenen dağılımla uygunluk derecesini belirleyin. Kaynak veriler tabloda özetlenmiştir:

Çözüm.

Anlamlılık düzeyine ve tablodan serbestlik derecesine göre kritik noktalar dağıtımda (bkz. Ek 4) değeri buluyoruz . Çünkü teorik ve gerçek frekanslar arasındaki farkın rastgele olduğu sonucuna varabiliriz. Dolayısıyla, tüberkülozlu ineklerin sayısına göre grupların gerçek dağılımı teorik olarak beklenene karşılık gelmektedir.

Örnek 2. Teorik dağılım Mendel yasasına göre tavşanların dihibrit melezlemesi ile ikinci nesilde elde edilen bireylerin fenotipine göre 9: 3: 3: 1'dir. Tavşanların ampirik dağılımının siyah bireylerin normal bireylerle melezlenmesinden yazışmalarının hesaplanması gerekmektedir. tüylü hayvanların saçları - albino. İkinci nesilde melezleme yapıldığında, 45'i kısa tüylü siyah, 30'u siyah tüylü tavşan, 25'i kısa saçlı beyaz, 20'si beyaz tüylü tavşan olmak üzere 120 torun elde edildi.

Çözüm. Teorik olarak yavrularda beklenen ayrışma, dört fenotipin oranına (9: 3: 3: 1) karşılık gelmelidir. Her ders için teorik frekansları (hedef sayısını) hesaplayalım:

9+3+3+1=16, bu da siyah kısa tüylülerin olmasını bekleyebileceğimiz anlamına geliyor ; siyah tüylü - ; beyaz kısa saçlı - ; beyaz tüylü - .

Fenotiplerin ampirik (gerçek) dağılımı şu şekildeydi: 45; 30; 25; 20.

Tüm bu verileri aşağıdaki tabloda özetleyelim:

Pearson uyum iyiliği testini kullanarak değeri hesaplıyoruz:

Dihibrit geçişte serbestlik derecesi sayısı. Anlamlılık düzeyi için değeri bul . Çünkü teorik ve gerçek frekanslar arasındaki farkın rastgele olmadığı sonucuna varabiliriz. Sonuç olarak, ortaya çıkan tavşan grubu, dihibrit çaprazlama sırasında fenotiplerin dağılımında Mendel yasasından sapar ve ikinci nesil melezlerde fenotipik ayrışma tipini değiştiren belirli faktörlerin etkisini yansıtır.

Pearson'un ki-kare uyum iyiliği testi aynı zamanda iki homojen nesneyi birbiriyle karşılaştırmak için de kullanılabilir. ampirik dağılımlar yani aynı sınıf sınırlarına sahip olanlar. Sıfır hipotezi, iki bilinmeyen dağılım fonksiyonunun eşit olduğu hipotezidir. Bu gibi durumlarda ki-kare testi aşağıdaki formülle belirlenir:

(**)

dağılımların hacimleri nerede ve nerede karşılaştırılıyor; ve - karşılık gelen sınıfların frekansları.

Aşağıdaki örneği kullanarak iki ampirik dağılımın karşılaştırmasını düşünün.

Örnek 3. Guguk kuşu yumurtalarının uzunluğu iki kullanılarak ölçüldü bölgesel bölgeler. Birinci bölgede 76 yumurta (), ikinci bölgede ise 54 () yumurta örneği incelendi. Aşağıdaki sonuçlar elde edildi:

Uzunluk (mm)
Frekanslar
Frekanslar - - -

Anlamlılık düzeyinde, her iki yumurta örneğinin de aynı guguk kuşu popülasyonuna ait olduğu boş hipotezini test etmemiz gerekir.

Resmi Kalkınma Yardımı Bilinmeyen bir dağılımın varsayılan yasasına ilişkin hipotezi test etme kriterine uyum iyiliği kriteri denir.

Birkaç uyum iyiliği testi vardır: $\chi ^2$ (ki-kare) K. Pearson, Kolmogorov, Smirnov, vb. tarafından yapılmıştır.

Genellikle teorik ve ampirik frekanslarçeşitli. Tutarsızlık durumu tesadüfi olmayabilir, bu da hipotezin doğru seçilmemesiyle açıklandığı anlamına gelir. Pearson kriteri sorulan soruyu yanıtlar, ancak herhangi bir kriter gibi hiçbir şeyi kanıtlamaz, yalnızca kabul edilen önem düzeyinde gözlemsel verilerle uyumunu veya anlaşmazlığını ortaya koyar.

Resmi Kalkınma Yardımı Bir olayın neredeyse imkansız olarak değerlendirilebileceği yeterince küçük bir olasılığa önem düzeyi denir.

Uygulamada anlamlılık düzeyleri genellikle 0,01 ile 0,05 arasında alınır, $\alpha =0,05$ $5 ( \% ) $ anlamlılık düzeyidir.

Hipotezi test etmek için bir kriter olarak \begin(equation) \label ( eq1 ) \chi ^2=\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) değerini alacağız. \qquad (1) \ end(denklem)

burada örneklemden elde edilen $n_i -$ ampirik frekanslar, teorik olarak bulunan $n_i" -$ teorik frekanslar.

$n\ ila \infty $ arasında, rastgele değişkenin (1) dağılım yasasının, popülasyonun dağıtıldığı yasaya bakılmaksızın, $\chi ^2$ yasasına (ki-kare) eğilimli olduğu kanıtlanmıştır. $k$ serbestlik derecesine sahip.

Resmi Kalkınma Yardımı Serbestlik derecesi sayısı $k=S-1-r$ eşitliği ile bulunur; burada $S-$ aralık gruplarının sayısıdır, $r-$ parametre sayısıdır.

1) düzgün dağılım: $r=2, k=S-3 $

2) normal dağılım: $r=2, k=S-3 $

3) üstel dağılım: $r=1, k=S-2$.

Kural . Pearson testi kullanılarak hipotezin test edilmesi.

  1. Hipotezi test etmek için teorik frekansları hesaplayın ve $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $'ı bulun.
  2. Belirli bir önem seviyesi $\alpha $ ve serbestlik derecesi sayısı için $\chi ^2$ dağılımının kritik noktaları tablosunu kullanma $k$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$ bulunur.
  3. Eğer $\chi _ ( gözlem ) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

Yorum Hesaplamaları kontrol etmek için $\chi ^2$ formülünü $\chi _ (gözlenen) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $ biçiminde kullanın.

Düzgün dağılım hipotezinin test edilmesi

$X$ miktarının düzgün dağılımının yoğunluk fonksiyonu $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$ biçimindedir.

Sürekli bir rastgele değişkenin tekdüze bir yasaya göre $\alpha $ anlamlılık seviyesinde dağıldığı hipotezini test etmek için aşağıdakiler gereklidir:

1) Belirli bir ampirik dağılımdan $\overline ( x_b ) $ ve $\sigma _b =\sqrt ( D_b ) $ örnek ortalamasını bulun. $a$ ve $b$ parametrelerinin tahmini miktarlarını alın

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) $X$ rastgele değişkeninin $(( x_i ,x_ ( i+1 ) ))$ kısmi aralıklara düşme olasılığını $ P_i =P(( x_i) formülünü kullanarak bulun

3) $n_i" =np_i $ formülünü kullanarak teorik (seviyeleme) frekanslarını bulun.

4) $\chi ^2$ tablolarından serbestlik derecesi sayısını $k=S-3$ ve anlamlılık düzeyini $\alpha =0.05$ alarak, verilen için $\chi _ ( cr ) ^2 $'ı buluruz. $\alpha $ ve $k$, $\chi _ ( kr ) ^2 (( \alpha ,k ))$.

5) $\chi _ (gözlenen) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" )) $ formülünü kullanarak burada $n_i -$ deneysel frekanslardır, şunu buluruz: gözlemlenen değer $\ chi _ ( obs ) ^2 $.

6) Eğer $\chi _ ( obs ) ^2 ise<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Örneğimizi kullanarak hipotezi test edelim.

1) $\overline x _b =13,00\,\,\sigma _b =\sqrt ( D_b ) = 6,51$

2) $a=13.00-\sqrt 3 \cdot 6.51=13.00-1.732\cdot 6.51=1.72468$

$b=13,00+1,732\cdot 6,51=24,27532$

$b-a=24.27532-1.72468=22.55064$

3) $P_i =P(( x_i

$P_2 =(( 3

$P_3 =(( 7

$P_4 =(( 11

$P_5 =(( 15

$P_6 =(( 19

Düzgün bir dağılımda, aralığın uzunluğu aynıysa $P_i -$ aynıdır.

4) $n_i" =np_i $'ı bulun.

5) $\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" )) $'ı bulun ve $\chi _ ( obs ) ^2 $'ı bulun.

Elde edilen tüm değerleri tabloya girelim

\begin(array) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i" ))^2& \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) & Kontrol~ \frac ( n_i^2 ) ( n_i" ) \\ \hline 1& 1& 4.43438& -3.43438& 11.7950& 2.659898& 0.22551 \\ \hline 2& 6& 4.43438& 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 3& 3& 4.43438& -1.43438& 2.05744& 0.471463& 2.0296 \\ \hline 4& 3& 4 ,43438 & -1.43438& 2.05744& 0.471463& 2.0296 \\ \hline 5& 6& 4.43438 & 1,56562& 2,45117& 0,552765& 8,11838 \\ \hline 6& 6& 4,43438& 1,56562& 2, 45117& 0,552765& 8,11838 \\ \hline & & & & & \sum = \chi _ ( obs ) ^2 =3,2 61119& \chi _ ( obs ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) =3.63985 \\ \hline \end(array)

$\chi _ ( cr ) ^2 (( 0.05.3 ))=7.8$

$\chi _ ( gözlem ) ^2<\chi _ { кр } ^2 =3,26<7,8$

Çözüm hipotezi reddetmek için hiçbir neden yoktur.

İŞİN AMACI

Bu laboratuvar çalışmasının amacı:

· deney sonuçlarına dayalı olarak, telsiz dirençlerin parametrelerinin dağılımının rastgele değişkeni için dağıtım yasalarının oluşturulması;

· element parametrelerindeki sapmaların normal dağılım yasası hakkındaki hipotezin test edilmesi;

· Sıcaklığa maruz kaldığında telsiz dirençlerin parametrelerindeki değişikliklerin deneysel çalışması.

ÇALIŞMA SÜRESİ

Laboratuvar çalışması, öğrencilerin teorik kısım hakkındaki bilgilerini değerlendirmek için bir kolokyum için 1 saat olmak üzere 4 saatlik bir ders boyunca gerçekleştirilir.

TEORİK BÖLÜM

Radyo-elektronik cihazlar, cihaz elemanlarının parametrelerinin değiştiği etkisi altında sürekli olarak dış ve iç rahatsız edici rastgele faktörlerin etkisi altındadır. Elemanların (dirençler, kapasitörler, yarı iletken cihazlar, entegre devreler vb.) parametrelerindeki değişiklikler, dış etkiler ve yaşlanma nedeniyle malzemelerde meydana gelen çeşitli fiziksel işlemlerle ilişkilidir. Ek olarak, RES elemanlarının parametreleri, imalatları sırasında rastgele faktörlerin etkisinin bir sonucu olan bir üretim dağılımına sahiptir. Bu tür elemanlardan tasarlanan ekipman, çıkış parametrelerini değiştirerek tüm değişikliklere tepki verir. RES'in güvenilirliğini tahmin etmek için, üretimleri ve rahatsız edici dış koşullar (özellikle ortam sıcaklığı) tarafından belirlenen elementlerin parametrelerinin dağılımının rastgele değerinin dağılımına ilişkin yasaların oluşturulmasına ihtiyaç vardır.

Laboratuvar çalışmasında, uyum iyiliği testleri (Pearson veya Kolmogorov) kullanılarak, rastgele değişken X'in normal dağılım yasasına (elementlerin parametrelerinin dağılımı) ilişkin hipotez test edilir.

İSTATİSTİK HİPOTEZLERİNİ TEST ETMEK İÇİN KULLANILAN ANLAŞMA KRİTERLERİ

Uyum iyiliği kriterleri, deneyden elde edilen numunenin, söz konusu rastgele değişkenin önceden seçilmiş dağılım yasasıyla çelişmediği varsayımının olasılığını değerlendirmemize olanak tanır. Bu problemin çözümü matematiksel istatistiğin temel konumunun kullanılmasına dayanmaktadır. Deneysel (istatistiksel) dağılım fonksiyonu, numunenin söz konusu önceki dağılıma ait olması koşuluyla, numune boyutu sınırsız arttığında olasılık açısından önceki (karşılaştırılabilir teorik) dağılım fonksiyonuna yakınsar. Sonlu bir örnek değer için ampirik ve a priori dağılım fonksiyonları genel anlamda birbirinden farklı olacaktır. Bu nedenle örnek için X 1 , X 2 ,… xn rastgele değişken X ampirik dağılım fonksiyonunun belirli bir sayısal tutarsızlık ölçüsü (uyum iyiliği kriteri) () tanıtıldı

, ben =1, 2, …, N , (1)

Nerede

= X 1 , X 2 ,… xn– deneysel veri örneği

ve a priori – dağıtım fonksiyonu.

A priori ve ampirik dağılımlar arasındaki uyum hakkındaki hipotezi test etme kuralı şu şekilde formüle edilmiştir:

daha sonra numunenin ait olduğu önceki dağılımın hipotezi X 1 , X 2 ,…,xn eşit F(X) reddedilmelidir. Eşik değerini belirlemek için İLEörneğin dağılıma ait olduğu hipotezini reddetmenin belirli bir kabul edilebilir olasılığı kurulur F. Olasılık a'ya uyum iyiliği kriterinin anlamlılık düzeyi denir. Daha sonra

onlar. İLE– kriterin eşik değeri, sapma ölçüsünün dağılım fonksiyonunun a yüzdelik noktasına eşittir.

Olay, dağıtım yasasıyla ilgili ileri sürülen hipotezin doğru olması durumunda da gerçekleşebilir. Ancak a yeterince küçükse bu tür durumların olasılığı pratikte ihmal edilebilir. a için genel olarak belirtilen değerler a = 0,05 ve a = 0,01'dir.

Iraksama ölçüsünün dağıtım yasası () bağlı değilse F, daha sonra anlaşma hipotezini reddetme kuralı ve F

(4)

önceki dağıtıma bağlı değildir. Bu tür kriterlere parametrik olmayan denir (bkz. bölüm 3.1.2).

Dağılımın doğası hakkındaki hipotez, uyum iyiliği testi kullanılarak farklı bir sırayla test edilebilir: elde edilen değeri kullanarak, a olasılığını belirlemek gerekir. N= R{ N). Ortaya çıkan değer ise N < a , то отклонения значимые; если aN³ a, o zaman sapmalar anlamlı değildir. Değerler N 1'e çok yakın (çok iyi uyum) numunenin kalitesinin düşük olduğunu gösterebilir (örneğin, ortalamadan büyük sapmalar veren unsurlar orijinal numuneden sebepsiz yere atılmıştır).

İstatistiklerde kullanılan uyum iyiliği kriterleri, istatistiksel ve teorik dağılım yasaları arasındaki çeşitli tutarsızlık ölçümlerinde birbirinden farklılık gösterir (). Bunlardan bazıları aşağıda tartışılmaktadır.

3.1.1. Anlaşma kriteri c 2

Uyum iyiliği kriteri c 2 (Pearson kriteri) kullanıldığında ampirik ve önceki dağılımlar arasındaki tutarsızlığın ölçüsü aşağıdaki şekilde belirlenir.

Tanımlandığı olası değerlerin aralığı F(X) - a priori dağılım fonksiyonu sınırlı sayıda örtüşmeyen aralığa bölünür - , i = 1, 2,…, L.

Gösterimi tanıtalım: – örnek bir değere ulaşma a priori olasılığı aralıkta

Şurası açık ki. Gözlemlenen örneğin elemanlarına izin verin X 1 , X 2 ,…, xn aralığa aittir.

Bu açıktır.

Ampirik ve a priori dağılımlar arasındaki tutarsızlığın bir ölçüsü olarak değeri alalım.

, (5)

rastgele değişken değerlerinin deneysel isabet sayısı nerede X aralıkta,

L– miktarın tüm deneysel değerlerinin bölündüğü aralıkların sayısı X,

N– numune büyüklüğü,

ben– rastgele bir değişkene çarpma olasılığı X-th aralığında, teorik dağılım yasası için hesaplanır (ürün, teorik yasa için - aralığındaki isabet sayısını belirler).

Pearson'un kanıtladığı gibi, N® ¥ miktarın dağıtım kanunu (5) şu eğilimdedir: - ile dağıtım S = L- Dağılımla ilgili hipotez doğru olmadığı sürece 1 serbestlik derecesi.

Örneğin, dağılımın bilinmeyen parametresinin (skaler veya vektör) olduğu dağılıma ait olduğuna dair karmaşık bir hipotez test ediliyorsa, o zaman deneyden bilinmeyen parametrenin bir tahmini belirlenir (sonuçtaki örneğe dayanarak). Bu durumda S - serbestlik derecesi sayısı c 2 - dağılım şuna eşittir: Sol – sağ – 1, Nerede R– tahmini dağılım parametrelerinin sayısı. .

Bir örneğin bir dağılıma ait olup olmadığına ilişkin hipotezi test etme kuralı şu şekilde formüle edilebilir: yeterince büyük bir N(n> 50) ve belirli bir anlamlılık seviyesi a için, eğer hipotez reddedilir:

burada - a - yüzdelik nokta - serbestlik derecesine sahip dağılımlar.

Kolmogorov kriteri

İstatistiklerin a priori ve ampirik dağılımları arasındaki tutarsızlığın bir ölçüsü olarak alalım.

().= , (7)

elde edilen tüm değerler için fark modülünün üst sınırı nerede X.

Bu istatistiğin (rastgele değişken) herhangi bir N bağlı değil

Keşke bir örnek olsaydı X 1 , X 2 ,… xnüzerine inşa edildiği yere aittir ve bu ikincisi sürekli bir fonksiyondur. Ancak sonlu bir değerde dağılım fonksiyonunun tam ifadesi Nçok hantal . BİR. Kolmogorov, fonksiyonlar için oldukça basit bir asimptotik ifade (için) buldu:

, z> 0. (8) Bu nedenle, büyük örneklem büyüklükleri için (ile N> 50), (8)'i kullanarak şunu elde ederiz:

Teorik ve ampirik frekanslar. Normal dağılım kontrol ediliyor

Varyasyon dağılım serilerini analiz ederken, nasıl olduğu büyük önem taşımaktadır. ampirik dağılım işaret karşılık gelir normal. Bunu yapmak için gerçek dağılımın frekansları, normal dağılımın özelliği olan teorik frekanslarla karşılaştırılmalıdır. Bu, gerçek verilere dayanarak normalleştirilmiş sapmaların bir fonksiyonu olan normal dağılım eğrisinin teorik frekanslarını hesaplamanın gerekli olduğu anlamına gelir.

Başka bir deyişle ampirik dağılım eğrisinin normal dağılım eğrisiyle aynı hizada olması gerekir.

Uyumluluğun nesnel özellikleri teorik Ve ampirik frekanslar adı verilen özel istatistiksel göstergeler kullanılarak elde edilebilir. onay kriterleri.

Anlaşma kriteri tutarsızlığın olup olmadığını belirlemenizi sağlayan bir kriter denir ampirik Ve teorik dağılımlar rastgele veya anlamlıdır, yani gözlemsel verilerin öne sürülen istatistiksel hipotezle uyumlu olup olmadığı. Öne sürülen hipotez nedeniyle sahip olduğu nüfus dağılımına teorik denir.

Kuruluma ihtiyaç var kriter(kural) ampirik ve teorik dağılımlar arasındaki tutarsızlığın rastgele mi yoksa anlamlı mı olduğuna karar verilmesini sağlar. Eğer tutarsızlık ortaya çıkarsa rastgele, gözlem verilerinin (örneklem) genel popülasyonun dağılım yasasına ilişkin öne sürülen hipotezle tutarlı olduğuna inanıyorlar ve dolayısıyla hipotez kabul ediliyor; eğer tutarsızlık ortaya çıkarsa önemli ise gözlemsel veriler hipotezle uyuşmuyor ve reddediliyor.

Tipik olarak ampirik ve teorik frekanslar farklıdır çünkü:

    tutarsızlık rastgeledir ve sınırlı sayıda gözlemden kaynaklanmaktadır;

    tutarsızlık tesadüfi değildir ve nüfusun normal şekilde dağıldığına dair istatistiksel hipotezin hatalı olmasıyla açıklanmaktadır.

Böylece, onay kriterleri ampirik serilerdeki dağılımın doğasına ilişkin serileri hizalarken ileri sürülen hipotezin doğruluğunu reddetmeyi veya onaylamayı mümkün kılar.

Ampirik frekanslar gözlem sonucunda elde edilmiştir. Teorik frekanslar formüller kullanılarak hesaplanır.

İçin normal dağılım kanunu aşağıdaki gibi bulunabilirler:

    Σƒ i- birikmiş (kümülatif) ampirik frekansların toplamı

    h - iki komşu seçenek arasındaki fark

    σ - numune standart sapması

    t-normalleştirilmiş (standartlaştırılmış) sapma

    φ(t)–normal dağılımın olasılık yoğunluk fonksiyonu (karşılık gelen t değeri için yerel Laplace fonksiyonunun değerler tablosundan bulunur)

Birkaç uyum iyiliği testi vardır ve bunlardan en yaygın olanları şunlardır: ki-kare testi (Pearson), Kolmogorov testi, Romanovsky testi.

Pearson χ uyum iyiliği testi 2 – teorik (f T) ve ampirik (f) frekanslar arasındaki farkların karelerinin teorik frekanslara oranlarının toplamı olarak temsil edilebilecek ana olanlardan biri:

    k ampirik dağılımın bölündüğü grupların sayısıdır,

    f i – özelliğin i. gruptaki gözlemlenen sıklığı,

    f T – teorik frekans.

χ2 dağılımı için, seçilen anlamlılık seviyesi α ve serbestlik dereceleri df (veya ν) için χ2 uyum iyiliği kriterinin kritik değerini gösteren tablolar derlenmiştir. Anlamlılık düzeyi α, önerilen hipotezin yanlışlıkla reddedilme olasılığıdır; Doğru bir hipotezin reddedilme olasılığı. R - istatistiksel anlamlılık Doğru hipotezi kabul etmek. İstatistiklerde en sık üç anlamlılık düzeyi kullanılır:

α=0,10, ardından P=0,90 (100 vakanın 10'unda)

α=0,05, ardından P=0,95 (100 üzerinden 5 vakada)

α=0,01, sonra P=0,99 (100 vakadan 1'inde) doğru hipotez reddedilebilir

Serbestlik derecesi sayısı df, dağılım serisindeki grup sayısından bağlantı sayısı çıkarılarak tanımlanır: df = k –z. Bağlantı sayısı, teorik frekansların hesaplanmasında kullanılan ampirik serilerin göstergelerinin sayısı olarak anlaşılmaktadır; ampirik ve teorik frekansları birbirine bağlayan göstergeler. Örneğin çan eğrisi ile hizalandığında üç ilişki vardır. Bu nedenle, hizalandığında çan eğrisi serbestlik derecesi sayısı df =k–3 olarak tanımlanır. Anlamlılığı değerlendirmek için hesaplanan değer tablo χ 2 tablosuyla karşılaştırılır.

Teorik ve ampirik dağılımlar tamamen örtüşüyorsa, χ 2 =0, aksi halde χ 2 >0. Eğer χ 2 hesap > χ 2 sekmesi ise, belirli bir önem seviyesi ve serbestlik derecesi sayısı için, tutarsızlıkların önemsizliği (rastgelelik) hakkındaki hipotezi reddederiz. χ 2 hesaplanırsa< χ 2 табл то гипотезу принимаем и с вероятностью Р=(1-α) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняетсяnormal dağılım. Pearson'un uyum iyiliği testi, popülasyon büyüklüğü yeterince büyükse (N>50) kullanılır ve her grubun frekansı en az 5 olmalıdır.

Kolmogorov uyum iyiliği testi birikmiş ampirik ve teorik frekanslar arasındaki maksimum tutarsızlığın belirlenmesine dayanır:

burada D ve d sırasıyla ampirik ve teorik dağılımların birikmiş frekansları ile birikmiş frekansları arasındaki maksimum farktır. Kolmogorov istatistiklerinin dağılım tablosunu kullanarak, 0'dan 1'e kadar değişebilen olasılık belirlenir. P(λ) = 1 olduğunda, frekansların tam bir çakışması vardır, P(λ) = 0 - tam bir tutarsızlık. Olasılık değeri P, bulunan λ değerine göre anlamlıysa, teorik ve ampirik dağılımlar arasındaki tutarsızlıkların önemsiz olduğunu, yani rastgele olduklarını varsayabiliriz. Kolmogorov kriterini kullanmanın temel koşulu, yeterince fazla sayıda gözlemdir.

Kolmogorov uyum iyiliği testi

Kolmogorov kriterinin (λ) aşağıdaki durumlarda nasıl uygulandığını ele alalım: normal dağılım hipotezinin test edilmesi genel nüfus. Gerçek dağılımı çan eğrisiyle hizalamak birkaç adımdan oluşur:

    Gerçek ve teorik frekansları karşılaştırın.

    Gerçek verilere dayanarak, normalleştirilmiş sapmanın bir fonksiyonu olan normal dağılım eğrisinin teorik frekansları belirlenir.

    Karakteristiğin dağılımının ne ölçüde normale karşılık geldiğini kontrol ederler.

Tablonun IV sütunu için:

MS Excel'de normalleştirilmiş sapma (t), NORMALİZASYON işlevi kullanılarak hesaplanır. Seçenek sayısına (elektronik tablo satırları) göre bir dizi boş hücre seçmek gerekir. Seçimi kaldırmadan NORMALLEŞTİRME işlevini çağırın. Görünen iletişim kutusunda, sırasıyla gözlemlenen değerleri (X i), ortalama (X) ve standart sapma Ϭ'yi içeren aşağıdaki hücreleri belirtin. Operasyonun tamamlanması gerekiyor eşzamanlı Ctrl+Shift+Enter tuşlarına basarak

Tablonun V sütunu için:

Normal dağılım φ(t)'nin olasılık yoğunluk fonksiyonu, normalleştirilmiş sapmanın (t) karşılık gelen değeri için yerel Laplace fonksiyonunun değerler tablosundan bulunur.

Tablonun VI. sütunu için:

Kolmogorov uyum iyiliği testi (λ) modülün bölünmesiyle belirlenir maksimum fark gözlem sayısının kareköküne göre ampirik ve teorik kümülatif frekanslar arasında:

Uyum kriteri λ için özel bir olasılık tablosu kullanarak, λ = 0,59 değerinin 0,88 olasılığa karşılık geldiğini belirleriz (λ

Ampirik ve teorik frekansların dağılımı, teorik dağılımın olasılık yoğunluğu

Gözlemlenen (ampirik) dağılımın teorik dağılıma uyup uymadığını kontrol etmek için uyum iyiliği testleri uygulanırken, basit ve karmaşık hipotezlerin test edilmesi arasında ayrım yapılmalıdır.

Tek örnekli Kolmogorov-Smirnov normallik testi, maksimum farkörneğin kümülatif ampirik dağılımı ile tahmini (teorik) kümülatif dağılım arasında. Kolmogorov-Smirnov D istatistiği anlamlı ise, ilgili dağılımın normal olduğu hipotezi reddedilmelidir.

Test edilen hipoteze genellikle sıfır hipotezi denir. H 0 Bir hipotezin kabul edilmesini veya reddedilmesini sağlayan kurala istatistiksel kriter denir. Dağıtım yasalarının türüne ilişkin hipotezleri test etmek için kullanılan istatistiksel kriterlere uyum iyiliği kriterleri denir. Onlar. Anlaşma kriterleri, varsayılan teorik ve deneysel dağılımlar arasında gerçekte elde edilen tutarsızlıkların ne zaman olduğunu belirler: önemsiz - rastgele ve önemli olduğunda - rastgele olmayan.

Özelliğin beklenen teorik ve deneysel dağılımı arasındaki tutarsızlığın türünü veya işlevini karakterize eden bir rastgele değişkeni ele alalım, ardından mevcut deneysel dağılımdan değeri belirleyebiliriz. A Rastgele değişkenin almış olduğu dağılım kanunu biliniyorsa, rasgele değişkenin aşağıdakilerden daha az olmayan bir değer alma olasılığını bulmak zor değildir. A. Eğer değer A Rastgele bir değişkenin gözlemlenmesi sonucu elde edilen X yani Söz konusu karakteristik varsayılan teorik yasaya göre dağıtıldığında olasılık küçük olmamalıdır. Olasılık küçük çıkarsa bu, elde edilen gerçek değerin rastgele bir değişken olmamasıyla açıklanır. X ve bazıları farklı bir dağıtım yasasına sahip, yani. incelenen karakteristik beklenen yasaya göre dağıtılmamıştır. Bu nedenle, ampirik ve teorik dağılımlar arasındaki farkın küçük olmaması durumunda, bunun anlamlı olmadığı - rastgele olduğu ve deneysel ve teorik dağılımların çelişkili olmadığı, yani. birbiriyle tutarlıdır.

Olasılık düşükse, deneysel ve teorik dağılımlar arasındaki farklar önemlidir, tesadüfen açıklanamazlar ve özelliğin varsayılan teorik yasaya göre dağılımına ilişkin hipotezin doğrulanmadığı düşünülmelidir, kabul edilmemektedir. deneysel verilerle. Deneysel verileri dikkatlice inceledikten sonra, önerilen özelliğin kalitesine ilişkin, deneysel dağılımın özelliklerini daha iyi ve daha tam olarak yansıtacak yeni bir yasa bulmaya çalışmak gerekir; bu tür olasılıklar küçük kabul edilir ve dikkate alınmaz; 0,1'i aşar.

Pearson'un uyum iyiliği testleri veya kriterleric2.

Deneysel verilerin analizinin, söz konusu karakteristik için varsayılan olarak belirli bir dağılım yasasının seçilmesine yol açmasına izin verin ve n-gözlem sonucunda deneysel verilere göre parametreler bulundu (eğer daha önce bilinmiyorlarsa). ile belirtelim n ben- rastgele bir değişkenin ampirik frekansları X.

n×P ben-gözlem sayısının çarpımını temsil eden teorik frekanslar N olasılık üzerine P ben- varsayılan teorik dağılıma göre hesaplanır. Onay kriterleri c2 teorik ve ampirik frekans serileri arasındaki tutarsızlığın ölçüsü şu şekilde alınır:


;

c2- çağrılan miktar c2 dağıtım veya Pearson dağıtımı. Yalnızca tüm ampirik ve teorik frekanslar çakıştığında 0'a eşittir, diğer durumlarda 0'dan farklıdır ve belirtilen frekanslar arasındaki fark ne kadar büyük olursa o kadar büyük olur. Seçilen özelliğin kanıtlanmış olduğu kanıtlanmıştır. c2 veya n®¥ istatistikleri serbestlik dereceli bir Pearson dağılımına sahiptir

k=m-s- 1.

Nerede M-varyasyon serisinin ampirik dağılımının aralık sayısı veya grup sayısı.

S-Deneysel verilerden belirlenen teorik dağılımın parametre sayısı (örneğin, normal dağılım durumunda, numuneden tahmin edilen parametre sayısı 2'dir).

Kriterin uygulama şeması aşağıdaki gibidir:

1. Deneysel verilere dayanarak, karakteristik dağılım yasasını beklenen yasa olarak seçin ve parametrelerini bulun.

2. Ortaya çıkan dağılım kullanılarak deneysel frekanslara karşılık gelen teorik frekanslar belirlenir.

3. Varsa küçük deneysel frekanslar komşu frekanslarla birleştirilir ve ardından formül kullanılarak değer belirlenir. c2 .

4. Serbestlik derecesi sayısını belirleyin k .

5. Seçilen önem düzeyine ilişkin uygulama tablolarından A Serbestlik derecesi sayısı eşit olduğunda kritik değeri bulun k .

6. Anlaşma kriterlerini uygulama genel ilkesinin rehberliğinde bir sonuç formüle ediyoruz, yani olasılık >0,01 ise, teorik ve deneysel frekanslar arasındaki mevcut tutarsızlıklar önemsiz kabul edilir.

Gözlemlenen gerçek değer kritik değerden büyükse, o zaman H 0 hipotez deneysel verilerle çelişmiyorsa reddedilir. Kriter c2 Her gruplandırma aralığında yeterli sayıda gözlem varsa tatmin edici sonuçlar verir n ben .

Not: Herhangi bir aralıkta gözlem sayısı varsa<5, то имеет смысл объединить соседние интервалы с тем, чтобы в объединенных интервалах n ben 5'ten az değildi. Üstelik serbestlik derecesi sayısını hesaplarken k gibi M- buna uygun olarak azaltılmış sayıda aralık alınır.

Raporlama yılında 100 atölye çalışanının üretime göre aşağıdaki dağılımı elde edildi

(önceki yılın %'si olarak).



Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!