Susitarimo kriterijus yra. Pearsono tinkamumo testas

Statistinės hipotezės. Sutikimo kriterijai.

Null(pagrindinis) vadinkite iškeltą hipotezę apie rūšį nežinomas platinimas, arba apie žinomų skirstinių parametrus. Konkuruojantis (alternatyva) vadinama hipoteze, kuri prieštarauja nulinei hipotezei.

Pavyzdžiui, jei nulinė hipotezė yra ta, kad atsitiktinis kintamasis X yra pasiskirstęs pagal dėsnį, tada konkuruojanti hipotezė gali būti, kad atsitiktinis kintamasis X platinami pagal kitą įstatymą.

Statistinis kriterijus(arba tiesiog kriterijus) vadinamas atsitiktiniu dydžiu KAM, kuri padeda patikrinti nulinę hipotezę.

Po atrankos tam tikras kriterijus, pavyzdžiui, kriterijus, visų jo aibė galimas vertes yra suskirstyti į du nevienodus poaibius: viename iš jų yra kriterijų reikšmės, pagal kurias nulinė hipotezė atmetama, o kitame - pagal kurią ji priimama.

Kritinė sritis yra kriterijų reikšmių rinkinys, kuriam esant nulinė hipotezė atmetama. Hipotezės priėmimo sritis Iškvieskite kriterijų verčių rinkinį, pagal kurį hipotezė priimta. Kritiniai taškai Jie vadina taškus, skiriančius kritinę sritį nuo regiono, kuriame priimta nulinė hipotezė.

Mūsų pavyzdyje, kai reikšmė yra , iš imties apskaičiuota reikšmė atitinka hipotezės priėmimo sritį: atsitiktinis dydis paskirstomas pagal įstatymą. Jei apskaičiuota reikšmė yra , tada ji patenka į kritinę sritį, tai yra hipotezė apie pasiskirstymą atsitiktinis kintamasis teisiškai atmesta.

Pasiskirstymo atveju kritinė sritis nustatoma pagal nelygybę, o sritis, kurioje priimta nulinė hipotezė, – pagal nelygybę.

2.6.3. Susitarimo kriterijus Pearsonas.

Vienas iš gyvūnų mokslo ir veterinarinės genetikos uždavinių – naujų veislių ir rūšių, turinčių reikiamų savybių, išveisimas. Pavyzdžiui, imuniteto didinimas, atsparumas ligoms ar kailio spalvos pasikeitimas.

Praktikoje, analizuojant rezultatus, labai dažnai paaiškėja, kad realūs rezultatai daugiau ar mažiau atitinka kai kuriuos teorinė teisė paskirstymus. Reikia įvertinti faktinių (empirinių) ir teorinių (hipotetinių) duomenų atitikimo laipsnį. Norėdami tai padaryti, iškelkite nulinę hipotezę: gauta populiacija paskirstoma pagal „A“ dėsnį. Hipotezė apie numatomą pasiskirstymo dėsnį tikrinama naudojant specialiai parinktą atsitiktinį dydį – tinkamumo kriterijų.

Susitarimo kriterijus vadinamas hipotezės apie tariamą nežinomo skirstinio dėsnį tikrinimo kriterijumi.

Yra keli susitarimo kriterijai: Pearsonas, Kolmogorovas, Smirnovas ir kt. Dažniausiai naudojamas Pearsono tinkamumo testas.

Panagrinėkime Pirsono kriterijaus taikymą hipotezės apie normalųjį populiacijos pasiskirstymo dėsnį patikrinimo pavyzdžiu. Tuo tikslu palyginsime empirinius ir teorinius (skaičiuojamus normaliojo skirstinio tęsinyje) dažnius.

Paprastai teoriniai ir empiriniai dažniai skiriasi. Pavyzdžiui:

Empiriniai dažniai 7 15 41 93 113 84 25 13 5

Teoriniai dažniai 5 13 36 89 114 91 29 14 6

Panagrinėkime du atvejus:

Neatitikimas tarp teorinių ir empirinių dažnių yra atsitiktinis (nereikšmingas), t.y. galima pateikti pasiūlymą dėl empirinių dažnių pasiskirstymo pagal normalus įstatymas;

Neatitikimas tarp teorinių ir empirinių dažnių nėra atsitiktinis (reikšmingas), t.y. teoriniai dažniai buvo apskaičiuoti remiantis neteisinga normalaus populiacijos pasiskirstymo hipoteze.

Naudodami Pearsono tinkamumo testą galite nustatyti, ar teorinių ir empirinių dažnių neatitikimas yra atsitiktinis, ar ne, t.y. su duotu pasitikėjimo tikimybė nustatyti paskirstytą gyventojų pagal įprastą įstatymą ar ne.

Taigi, empirinis skirstinys gaunamas iš n dydžio imties:

Variantai......

Empiriniai dažniai……

Tarkime, kad teoriniai dažniai apskaičiuojami remiantis normaliojo skirstinio prielaida. Reikšmingumo lygmenyje reikia patikrinti nulinę hipotezę: populiacija yra normaliai pasiskirstyta.

Nulinės hipotezės tikrinimo kriteriju imsime atsitiktinį kintamąjį

(*)

Ši vertė yra atsitiktinė, nes įvairių patirčių ji įgauna kitokias, anksčiau nežinomas vertybes. Akivaizdu, kad kuo mažiau skiriasi empiriniai ir teoriniai dažniai, tuo mažesnė kriterijaus reikšmė, todėl jis yra tam tikru mastu apibūdina empirinio ir teorinio skirstinių artumą.

Įrodyta, kad kai atsitiktinio dydžio (*) pasiskirstymo dėsnis, nepriklausomai nuo to, kuriam skirstymo dėsniui priklauso bendroji visuma, yra linkęs į laisvės laipsnius turintį skirstymo dėsnį. Todėl atsitiktinis dydis (*) žymimas , o pats kriterijus vadinamas „chi kvadrato“ tinkamumo kriterijumi.

Iš stebėjimo duomenų apskaičiuotą kriterijaus reikšmę pažymėkime . Lentelė kritines vertes kriterijai šis lygis reikšmė ir laisvės laipsnių skaičius reiškia . Šiuo atveju laisvės laipsnių skaičius nustatomas iš lygybės , kur grupių ( daliniai intervalai) pavyzdžiai ar klasės; - laukiamo skirstinio parametrų skaičius. Normalus skirstinys turi du parametrus - matematinis lūkestis ir vidutinis standartinis nuokrypis. Todėl iš lygybės randamas normalaus skirstinio laisvės laipsnių skaičius

Jei už apskaičiuotą vertę ir lentelės vertė nelygybė galioja , priimta nulinė hipotezė apie normalų populiacijos pasiskirstymą. Jeigu , nulinė hipotezė atmetama, o alternatyvi hipotezė priimama (populiacija normaliai nepasiskirsto).

komentuoti. Naudojant Pearsono tinkamumo testą, imties dydis turi būti bent 30. Kiekvienoje grupėje turi būti bent 5 parinktys. Jei grupėse yra mažiau nei 5 dažniai, jie sujungiami su kaimyninėmis grupėmis.

IN bendras atvejis chi kvadrato skirstinio laisvės laipsnių skaičius pateikiamas pagal bendras skaičius dydžiai, pagal kuriuos skaičiuojami atitinkami rodikliai, atėmus šiuos dydžius jungiančių sąlygų skaičių, t.y. sumažinti jų skirtumo galimybę. Paprasčiausiais atvejais, skaičiuojant, laisvės laipsnių skaičius bus lygus klasių skaičiui, sumažintam vienu. Taigi, pavyzdžiui, suskaidant dihibridą, gaunamos 4 klasės, tačiau tik pirmoji klasė yra nesusijusi, kitos jau yra susijusios su ankstesnėmis. Todėl dihibridiniam skaidymui laisvės laipsnių skaičius yra .



1 pavyzdys. Nustatykite faktinio grupių pasiskirstymo pagal tuberkulioze sergančių karvių skaičių atitikimo laipsniui su teoriškai numatomu, kuris buvo apskaičiuotas atsižvelgiant į normalųjį pasiskirstymą. Šaltiniai duomenys apibendrinti lentelėje:

Sprendimas.

Pagal reikšmingumo lygį ir laisvės laipsnių skaičių iš lentelės kritinius taškus pasiskirstymas (žr. 4 priedą) randame reikšmę . Nes , galime daryti išvadą, kad skirtumas tarp teorinių ir faktinių dažnių yra atsitiktinis. Taigi tikrasis grupių pasiskirstymas pagal tuberkulioze sergančių karvių skaičių atitinka teoriškai tikėtiną.

2 pavyzdys. Teorinis skirstymas pagal individų fenotipą, gautą antroje kartoje dihibridiniu triušių kryžminimo būdu pagal Mendelio dėsnį, yra 9: 3: 3: 1. Reikia apskaičiuoti triušių empirinio pasiskirstymo atitiktį kryžminus juodaodžius individus su normaliais. plaukai su pūkuotais gyvūnais - albinosai. Kryžminant antroje kartoje, buvo gauta 120 palikuonių, iš jų 45 juodi trumpaplaukiai, 30 juodi pūkuoti triušiai, 25 balti trumpaplaukiai, 20 balti pūkuoti triušiai.

Sprendimas. Teoriškai numatoma palikuonių segregacija turėtų atitikti keturių fenotipų santykį (9: 3: 3: 1). Apskaičiuokime teorinius dažnius (įvarčių skaičių) kiekvienai klasei:

9+3+3+1=16, vadinasi, galime tikėtis, kad bus juodų trumpaplaukių ; juodas pūkas - ; balta trumpaplaukė - ; balta pūkinė - .

Empirinis (faktinis) fenotipų pasiskirstymas buvo toks: 45; 30; 25; 20.

Visus šiuos duomenis apibendrinkime šioje lentelėje:

Naudodami Pearsono tinkamumo testą, apskaičiuojame vertę:

Dihibridinio kryžminimo laisvės laipsnių skaičius. Dėl reikšmingumo lygio rasti vertę . Nes , galime daryti išvadą, kad skirtumas tarp teorinių ir faktinių dažnių nėra atsitiktinis. Vadinasi, gauta triušių grupė fenotipų pasiskirstymu nukrypsta nuo Mendelio dėsnio dihibridinio kryžminimo metu ir atspindi tam tikrų faktorių, keičiančių fenotipinės segregacijos tipą antroje mišrūnų kartoje, įtaką.

Pirsono chi kvadrato tinkamumo testą taip pat galima naudoti norint palyginti du vienalyčius objektus. empiriniai skirstiniai, t.y. tie, kurie turi tas pačias klasių ribas. Nulinė hipotezė yra hipotezė, kad dvi nežinomos pasiskirstymo funkcijos yra lygios. Chi kvadrato testas tokiais atvejais nustatomas pagal formulę

(**)

kur ir yra lyginamų skirstinių tūriai; ir - atitinkamų klasių dažniai.

Apsvarstykite dviejų empirinių skirstinių palyginimą naudodami šį pavyzdį.

3 pavyzdys. Gegutės kiaušinių ilgis buvo matuojamas naudojant du teritorinės zonos. Pirmoje zonoje buvo ištirtas 76 kiaušinių () mėginys, antrojoje – 54 (). Buvo gauti šie rezultatai:

Ilgis (mm)
Dažniai
Dažniai - - -

Reikšmingumo lygmenyje turime patikrinti nulinę hipotezę, kad abu kiaušinių mėginiai priklauso tai pačiai gegutės populiacijai.

OPV Kriterijus, kuriuo tikrinama hipotezė apie tariamą nežinomo skirstinio dėsnį, vadinamas tinkamumo kriterijumi.

Yra keli tinkamumo testai: $\chi ^2$ (chi kvadratas) K. Pearsono, Kolmogorovo, Smirnovo ir kt.

Paprastai teoriniai ir empiriniai dažniai skirtis. Neatitikimo atvejis gali būti neatsitiktinis, o tai reiškia, kad jis paaiškinamas tuo, kad hipotezė buvo pasirinkta neteisingai. Pearsono kriterijus atsako į užduotą klausimą, bet kaip ir bet kuris kriterijus nieko neįrodo, o tik nustato jo sutikimą ar nesutikimą su stebėjimo duomenimis priimtame reikšmingumo lygyje.

OPV Pakankamai maža tikimybė, kai įvykis gali būti laikomas praktiškai neįmanomu, vadinama reikšmingumo lygiu.

Praktiškai reikšmingumo lygiai paprastai laikomi nuo 0,01 iki 0,05, $\alpha =0,05$ yra $5 (\% ) $ reikšmingumo lygis.

Kaip hipotezės tikrinimo kriterijų imsime reikšmę \begin(equation) \label (eq1 ) \chi ^2=\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) \qquad (1) \ pabaiga (lygtis)

čia $n_i -$ empiriniai dažniai, gauti iš imties, $n_i" -$ teoriniai dažniai rasti teoriškai.

Įrodyta, kad $n\to \infty $ atsitiktinio dydžio (1) pasiskirstymo dėsnis, neatsižvelgiant į dėsnį, pagal kurį pasiskirsto populiacija, yra linkęs į $\chi ^2$ dėsnį (chi kvadratas) su $k$ laisvės laipsniais.

OPV Laisvės laipsnių skaičius randamas lygybe $k=S-1-r$, kur $S-$ – intervalų grupių skaičius, $r-$ – parametrų skaičius.

1) vienodas paskirstymas: $r=2, k=S-3 $

2) normalusis pasiskirstymas: $r=2, k=S-3 $

3) eksponentinis pasiskirstymas: $r=1, k=S-2$.

Taisyklė . Hipotezės tikrinimas naudojant Pearsono testą.

  1. Norėdami patikrinti hipotezę, apskaičiuokite teorinius dažnius ir raskite $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $
  2. Naudojant kritinių skirstinio $\chi ^2$ taškų lentelę duotam reikšmingumo lygiui $\alpha $ ir laisvės laipsnių $k$, $\chi _ ( cr ) ^2 (( \alpha ,k) ))$ rasti.
  3. Jei $\chi _ ( obs ) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

komentuoti Norėdami valdyti skaičiavimus, naudokite $\chi ^2$ formulę formoje $\chi _ (stebėta) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $

Vienodo pasiskirstymo hipotezės tikrinimas

Tolygaus dydžio $X$ pasiskirstymo tankio funkcija yra $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$.

Norint patikrinti hipotezę, kad nuolatinis atsitiktinis kintamasis pasiskirsto pagal vienodą dėsnį reikšmingumo lygyje $\alpha $, reikia:

1) Raskite imties vidurkį $\overline ( x_b ) $ ir $\sigma _b =\sqrt ( D_b ) $ iš nurodyto empirinio skirstinio. Apskaičiuokite parametrų $a$ ir $b$ kiekius

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) Raskite tikimybę, kad atsitiktinis dydis $X$ pateks į dalinius intervalus $(( x_i ,x_ ( i+1 ) ))$ naudojant formulę $ P_i =P(( x_i

3) Raskite teorinius (niveliavimo) dažnius naudodami formulę $n_i" =np_i $.

4) Iš lentelių $\chi ^2$ paėmę laisvės laipsnių skaičių $k=S-3$ ir reikšmingumo lygį $\alpha =0.05$ duotajam randame $\chi _ ( cr ) ^2 $ $\alpha $ ir $k$, $\chi _ ( kr ) ^2 (( \alpha ,k ))$.

5) Naudodami formulę $\chi _ (stebėtas) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ kur $n_i -$ yra empiriniai dažniai, randame pastebėta vertė $\ chi _ ( obs ) ^2 $.

6) Jei $\chi _ ( obs ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Patikrinkime hipotezę naudodami mūsų pavyzdį.

1) $\overline x _b =13,00\,\,\sigma _b =\sqrt ( D_b ) = 6,51 $

2) $a = 13,00-\sqrt 3 \cdot 6,51=13,00-1,732\cdot 6,51 = 1,72468 $

$b = 13,00 + 1,732\cdot 6,51 = 24,27532 $

$b-a = 24,27532-1,72468 = 22,55064 $

3) $P_i =P((x_i

$P_2 =(( 3

$P_3 =(( 7

$P_4 =(( 11

$P_5 =(( 15

$P_6 =(( 19

Esant vienodai paskirstymui, jei intervalo ilgis yra vienodas, tai $P_i -$ yra vienodi.

4) Raskite $n_i" =np_i $.

5) Raskite $\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ ir raskite $\chi _ ( obs ) ^2 $.

Įveskime visas gautas reikšmes į lentelę

\begin(masyvas) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i" ))^2& \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) & Control~ \frac ( n_i^2 ) ( n_i" ) \\ \hline 1& 1& 4.43438& -3.43438& 11.7950 & 2.650 2 \950 & 2.650 2 6& 4,43438& 1,56562& 2,45117& 0,552765& 8,11838 \\ \hline 3& 3& 4,43438& -1,43438& 2,05744& 2,05744& \3&4 .0, 4714 3438& -1,43438& 2,05744& 0,471463& 2,0296 \\ \hline 5& 6& 4,43438 & 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& 1.56562& 2, 45117& 0.552765& \s & 8,1183 ^2 =3,261119& \chi _ ( obs ) ^2 =\suma ( \frac ( n_i^2 ) ( n_i" ) -n ) =3.63985 \\ \hline \end(masyvas)

$\chi _ ( cr ) ^2 (( 0,05,3 )) = 7,8 $

$\chi _ ( obs ) ^2<\chi _ { кр } ^2 =3,26<7,8$

Išvada nėra pagrindo atmesti hipotezę.

DARBO TIKSLAS

Šio laboratorinio darbo tikslas:

· Nelaidinių rezistorių parametrų sklaidos atsitiktinio dydžio pasiskirstymo dėsnių konstravimas, remiantis eksperimento rezultatais;

· hipotezės apie normaliojo elementų parametrų nuokrypių pasiskirstymo dėsnio tikrinimas;

· eksperimentinis nelaidinių rezistorių parametrų kitimo, veikiant temperatūrai, tyrimas.

DARBO TRUKMĖ

Laboratoriniai darbai atliekami per 4 valandas trunkančią pamoką, iš kurių 1 valanda skiriama koliokviumui įvertinti mokinių teorinės dalies žinias.

TEORINĖ DALIS

Radioelektroninę įrangą nuolat veikia išoriniai ir vidiniai trikdantys atsitiktiniai veiksniai, kurių įtakoje kinta įrenginio elementų parametrai. Elementų (rezistorių, kondensatorių, puslaidininkinių įtaisų, integrinių grandynų ir kt.) parametrų pokyčiai yra susiję su įvairiais fizikiniais procesais, vykstančiais medžiagose dėl išorinių poveikių ir senėjimo. Be to, AEI elementų parametrai turi gamybos sklaidą, kuri yra atsitiktinių veiksnių įtakos jų gamybos metu rezultatas. Iš tokių elementų sukonstruota įranga į visas variacijas reaguoja keisdama savo išėjimo parametrus. Norint numatyti AEI patikimumą, reikia nustatyti elementų parametrų sklaidos atsitiktinės vertės pasiskirstymo dėsnius, nulemtus jų susidarymo ir trikdančių išorinių sąlygų (ypač aplinkos temperatūros).

Laboratoriniuose darbuose, naudojant tinkamumo testus (Pearson arba Kolmogorov), tikrinama hipotezė apie atsitiktinio dydžio X normaliojo skirstinio dėsnį – elementų parametrų sklaidą.

SUTARTIES KRITERIJAI, NAUDOJAMI STATISTINĖMS HIPOZEMS TIKRINTI

Tinkamumo kriterijai leidžia įvertinti prielaidos, kad eksperimento metu gauta imtis neprieštarauja a priori pasirinktam nagrinėjamo atsitiktinio dydžio pasiskirstymo dėsniui, tikimybę. Šios problemos sprendimas pagrįstas matematinės statistikos pamatinės pozicijos panaudojimu, pagal kurią empirinė (statistinė) pasiskirstymo funkcija suartėja su ankstesne (palyginama teorine) pasiskirstymo funkcija, kai imties dydis be apribojimų didėja, su sąlyga, kad imtis priklauso ankstesniam aptariamam skirstiniui. Kalbant apie baigtinę imties reikšmę, empirinės ir apriorinės skirstymo funkcijos paprastai skirsis viena nuo kitos. Todėl pavyzdžiui X 1 , X 2 ,… x n atsitiktinis kintamasis Xįvedamas tam tikras skaitinis empirinio pasiskirstymo funkcijos neatitikimo matas (tinkamumo kriterijus) ()

, l =1, 2, …, n , (1)

Kur

= X 1 , X 2 ,… x n– eksperimentinių duomenų pavyzdys

o a priori – paskirstymo funkcija.

Hipotezės apie apriorinio ir empirinio skirstinio sutapimo tikrinimo taisyklė formuluojama taip: jei

tada hipotezė, kad išankstinis skirstinys, kuriam priklauso imtis X 1 , X 2 ,…,x n lygus F(X) turi būti atmestas. Norėdami nustatyti slenkstinę vertę SU nustatoma tam tikra priimtina tikimybė a atmesti hipotezę, kad imtis priklauso skirstiniui F. Tikimybė a vadinama tinkamumo kriterijaus reikšmingumo lygiu. Tada

tie. SU– kriterijaus slenkstinė reikšmė lygi divergencijos mato pasiskirstymo funkcijos a-procentiniam taškui.

Įvykis taip pat gali įvykti, jei iškelta hipotezė apie paskirstymo dėsnį yra teisinga. Tačiau jei a yra pakankamai mažas, tada tokių situacijų galimybę praktiškai galima nepaisyti. Paprastai nurodytos a reikšmės yra a = 0,05 ir a = 0,01.

Jei divergencijos mato () skirstymo dėsnis nepriklauso nuo F, tada susitarimo hipotezės atmetimo taisyklė ir F

(4)

nepriklauso nuo ankstesnio paskirstymo. Tokie kriterijai vadinami neparametriniais (žr. 3.1.2 skyrių).

Hipotezė apie pasiskirstymo pobūdį gali būti patikrinta naudojant tinkamumo testą kitokia seka: naudojant gautą reikšmę, reikia nustatyti tikimybę a n= R{ n). Jei gauta reikšmė a n < a , то отклонения значимые; если an³ a, tada nuokrypiai nėra reikšmingi. Vertės a n, labai arti 1 (labai geras sutapimas) gali reikšti prastą imties kokybę (pavyzdžiui, elementai, duodantys didelius nukrypimus nuo vidurkio, be priežasties buvo išmesti iš pradinės imties).

Statistikoje naudojami tinkamumo kriterijai skiriasi vienas nuo kito įvairiais statistinio ir teorinio pasiskirstymo dėsnių neatitikimo matais (). Kai kurie iš jų aptariami toliau.

3.1.1. Sutarties kriterijus c 2

Naudojant tinkamumo kriterijų c 2 (Pirsono kriterijus), empirinio ir ankstesnio skirstinio neatitikimo matas nustatomas taip.

Galimų verčių diapazonas, pagal kurį jis apibrėžiamas F(x) - a priori skirstinio funkcija yra padalinta į baigtinį skaičių nepersidengiančių intervalų – , i = 1, 2,…, L.

Įveskime žymėjimą: – a priori tikimybė pataikyti į imties reikšmę intervale

Akivaizdu, kad. Tegul stebimos imties elementai X 1 , X 2 ,…, x n priklauso intervalui.

Aišku, kad.

Paimkime vertės neatitikimo tarp empirinio ir a priori skirstinių matą

, (5)

kur yra eksperimentinis atsitiktinių kintamųjų reikšmių skaičius x intervale,

L– intervalų, į kuriuos padalijamos visos eksperimentinės kiekio reikšmės, skaičius x,

n- mėginio dydis,

p i– tikimybė pataikyti į atsitiktinį kintamąjį x-tajame intervale, skaičiuojant teoriniam pasiskirstymo dėsniui (produktas nustato pataikymo skaičių - intervale teoriniam dėsniui).

Kaip įrodė Pearsonas, kai n® ¥ kiekio paskirstymo dėsnis (5) linkęs - paskirstymas su S = L- 1 laisvės laipsnis, nebent hipotezė apie pasiskirstymą yra teisinga.

Jei tikrinama sudėtinga hipotezė, kad imtis priklauso skirstiniui , kur nežinomas skirstinio parametras (skaliarinis arba vektorius) yra , tada iš eksperimento (remiantis gauta imtimi) nustatomas nežinomo parametro įvertis. Šiuo atveju S – laisvės laipsnių skaičius c 2 – pasiskirstymas lygus L – R – 1, Kur r– įvertintų pasiskirstymo parametrų skaičius. .

Hipotezės apie tai, ar imtis priklauso skirstiniui tikrinimo taisyklę galima suformuluoti taip: su pakankamai dideliu n(n> 50) ir tam tikram reikšmingumo lygiui a hipotezė atmetama, jei

kur - a - procentinis taškas - skirstiniai su laisvės laipsniais.

Kolmogorovo kriterijus

Paimkime statistikos neatitikimo tarp apriorinio ir empirinio skirstinio matą

().= , (7)

kur yra visų gautų verčių skirtumo modulio viršutinė riba X.

Šios statistikos (atsitiktinio kintamojo) pasiskirstymas bet kuriai n nepriklauso nuo

Jei tik pavyzdys X 1 , X 2 ,… x n ant kurios ji pastatyta, priklauso ir pastaroji yra nuolatinė funkcija. Tačiau tiksli paskirstymo funkcijos išraiška esant baigtinei vertei n labai sudėtinga . A.N. Kolmogorovas nustatė gana paprastą asimptotinę išraišką (for ) funkcijoms:

, z> 0. (8) Taigi, esant dideliems imčių dydžiams (su n> 50), naudodami (8) gauname

Teoriniai ir empiriniai dažniai. Normalaus pasiskirstymo tikrinimas

Analizuojant variacijų pasiskirstymo eilutes, labai svarbu, kaip empirinis pasiskirstymasženklas atitinka normalus. Tam reikia lyginti tikrojo skirstinio dažnius su teoriniais, kurie būdingi normaliajam skirstiniui. Tai reiškia, kad remiantis faktiniais duomenimis reikia apskaičiuoti teorinius normaliojo pasiskirstymo kreivės dažnius, kurie yra normalizuotų nuokrypių funkcija.

Kitaip tariant, empirinio pasiskirstymo kreivė turi būti suderinta su normaliojo pasiskirstymo kreive.

Objektyvios atitikties charakteristikos teorinis Ir empirinis dažnius galima gauti naudojant specialius statistinius rodiklius, vadinamus sutikimo kriterijai.

Susitarimo kriterijus vadinamas kriterijumi, leidžiančiu nustatyti, ar neatitikimas yra empirinis Ir teorinis pasiskirstymai yra atsitiktiniai arba reikšmingi, t. y. ar stebėjimo duomenys sutampa su iškelta statistine hipoteze, ar nesutampa. Populiacijos pasiskirstymas, kurį jis turi dėl iškeltos hipotezės, vadinamas teoriniu.

Yra poreikis įdiegti kriterijus(taisyklė), kuri leistų spręsti, ar empirinio ir teorinio skirstinio neatitikimas yra atsitiktinis, ar reikšmingas. Jei paaiškėja, kad neatitikimas yra atsitiktinis, tada jie mano, kad stebėjimo duomenys (imtis) atitinka iškeltą hipotezę apie bendrosios populiacijos pasiskirstymo dėsnį, todėl hipotezė yra priimta; jei paaiškėtų, kad neatitikimas yra reikšmingas, tada stebėjimo duomenys nesutampa su hipoteze ir ji atmetama.

Paprastai empiriniai ir teoriniai dažniai skiriasi, nes:

    neatitikimas yra atsitiktinis ir dėl riboto stebėjimų skaičiaus;

    neatitikimas nėra atsitiktinis ir paaiškinamas tuo, kad statistinė hipotezė, kad populiacija pasiskirsto normaliai, yra klaidinga.

Taigi, sutikimo kriterijai leidžia atmesti arba patvirtinti hipotezės, iškeltos derinant eilutes apie pasiskirstymo pobūdį empirinėje eilutėje, teisingumą.

Empiriniai dažniai gautas kaip stebėjimo rezultatas. Teoriniai dažniai apskaičiuojamas pagal formules.

normalaus paskirstymo dėsnis juos galima rasti taip:

    Σƒ i- sukauptų (kaupiamųjų) empirinių dažnių suma

    h - skirtumas tarp dviejų gretimų variantų

    σ – imties standartinis nuokrypis

    t–normalizuotas (standartizuotas) nuokrypis

    φ(t) – normalaus skirstinio tikimybės tankio funkcija (rasta iš vietinės Laplaso funkcijos reikšmių lentelės atitinkamai t reikšmei)

Yra keletas tinkamumo testų, iš kurių dažniausiai naudojami: chi kvadrato testas (Pearson), Kolmogorovo testas, Romanovskio testas.

Pearsono χ tinkamumo testas 2 – vienas iš pagrindinių, kurį galima pavaizduoti kaip teorinių (f T) ir empirinių (f) dažnių skirtumų kvadratų santykio su teoriniais dažniais sumą:

    k yra grupių, į kurias padalintas empirinis skirstinys, skaičius,

    f i – pastebėtas požymio dažnis i-toje grupėje,

    f T – teorinis dažnis.

χ 2 skirstiniui buvo sudarytos lentelės, kuriose nurodoma kritinė χ 2 tinkamumo kriterijaus reikšmė pasirinktam reikšmingumo lygiui α ir laisvės laipsniams df (arba ν). Reikšmingumo lygis α – tai tikimybė klaidingai atmesti pasiūlytą hipotezę, t.y. tikimybė, kad teisinga hipotezė bus atmesta. R - statistinis reikšmingumas priimdamas teisingą hipotezę. Statistikoje dažniausiai naudojami trys reikšmingumo lygiai:

α=0,10, tada P=0,90 (10 atvejų iš 100)

α=0,05, tada P=0,95 (5 atvejais iš 100)

α=0,01, tada P=0,99 (1 atveju iš 100) teisinga hipotezė gali būti atmesta

Laisvės laipsnių skaičius df apibrėžiamas kaip pasiskirstymo serijos grupių skaičius atėmus jungčių skaičių: df = k –z. Jungčių skaičius suprantamas kaip empirinės eilutės rodiklių skaičius, naudojamas skaičiuojant teorinius dažnius, t.y. empirinius ir teorinius dažnius jungiantys rodikliai. Pavyzdžiui, sulygiavus su varpo kreive, yra trys ryšiai. Todėl suderinus pagal varpo kreivė laisvės laipsnių skaičius apibrėžiamas kaip df =k–3. Norint įvertinti reikšmingumą, apskaičiuota vertė lyginama su lentelės χ 2 lentele

Jei teorinis ir empirinis skirstiniai visiškai sutampa, χ 2 =0, kitu atveju χ 2 >0. Jei χ 2 calc > χ 2 tab, tai esant tam tikram reikšmingumo lygiui ir laisvės laipsnių skaičiui, atmetame hipotezę apie neatitikimų nereikšmingumą (atsitiktinumą). Jei χ 2 apskaičiuojamas< χ 2 табл то гипотезу принимаем и с вероятностью Р=(1-α) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняетсяnormalusis pasiskirstymas. Pirsono tinkamumo testas naudojamas, jei populiacijos dydis yra pakankamai didelis (N>50), o kiekvienos grupės dažnis turi būti bent 5.

Kolmogorovo tinkamumo testas yra pagrįstas didžiausio neatitikimo tarp sukauptų empirinių ir teorinių dažnių nustatymu:

kur D ir d yra atitinkamai didžiausias skirtumas tarp sukauptų dažnių ir sukauptų empirinių ir teorinių skirstinių dažnių. Naudojant Kolmogorovo statistikos pasiskirstymo lentelę, nustatoma tikimybė, kuri gali svyruoti nuo 0 iki 1. Kai P(λ) = 1, yra visiškas dažnių sutapimas, P(λ) = 0 - visiškas neatitikimas. Jei tikimybės reikšmė P yra reikšminga rastosios reikšmės λ atžvilgiu, tai galime daryti prielaidą, kad teorinio ir empirinio skirstinių neatitikimai yra nereikšmingi, tai yra atsitiktiniai. Pagrindinė Kolmogorovo kriterijaus naudojimo sąlyga yra pakankamai didelis stebėjimų skaičius.

Kolmogorovo tinkamumo testas

Panagrinėkime, kaip taikomas Kolmogorovo kriterijus (λ), kai tikrinant normaliojo pasiskirstymo hipotezę bendros populiacijos. Faktinio pasiskirstymo suderinimas su varpo kreive susideda iš kelių žingsnių:

    Palyginkite faktinius ir teorinius dažnius.

    Remiantis faktiniais duomenimis, nustatomi normalaus pasiskirstymo kreivės, kuri yra normalizuoto nuokrypio funkcija, teoriniai dažniai.

    Jie tikrina, kiek charakteristikos pasiskirstymas atitinka normalųjį.

IV lentelės stulpelyje:

Programoje MS Excel normalizuotas nuokrypis (t) apskaičiuojamas naudojant NORMALIZAVIMO funkciją. Būtina pasirinkti laisvų langelių diapazoną pagal parinkčių skaičių (skaičiuoklės eilutės). Nepašalindami pasirinkimo, iškvieskite funkciją NORMALIZE. Pasirodžiusiame dialogo lange nurodykite šiuos langelius, kuriuose yra atitinkamai stebimos reikšmės (X i), vidurkis (X) ir standartinis nuokrypis Ϭ. Operacija turi būti baigta vienu metu paspausdami Ctrl+Shift+Enter

Lentelės V stulpelyje:

Normaliojo skirstinio φ(t) tikimybės tankio funkcija randama iš vietinės Laplaso funkcijos reikšmių lentelės atitinkamai normalizuoto nuokrypio vertei (t)

Lentelės VI stulpelyje:

Kolmogorovo tinkamumo testas (λ) nustatoma dalijant modulį maksimalus skirtumas tarp empirinių ir teorinių kaupiamųjų dažnių pagal stebėjimų skaičiaus kvadratinę šaknį:

Naudodami specialią tikimybių lentelę susitarimo kriterijui λ nustatome, kad reikšmė λ = 0,59 atitinka tikimybę 0,88 (λ

Empirinių ir teorinių dažnių pasiskirstymas, teorinio pasiskirstymo tikimybių tankis

Taikant tinkamumo testus, siekiant patikrinti, ar stebimas (empirinis) skirstinys atitinka teorinį, reikia atskirti paprastų ir sudėtingų hipotezių tikrinimą.

Vieno imties Kolmogorovo-Smirnovo normalumo testas pagrįstas maksimalus skirtumas tarp kumuliacinio imties empirinio skirstinio ir įvertinto (teorinio) kaupiamojo skirstinio. Jei Kolmogorovo-Smirnovo D statistika yra reikšminga, tai hipotezę, kad atitinkamas skirstinys yra normalus, reikia atmesti.

Tikrinama hipotezė paprastai vadinama nuline hipoteze. H0, taisyklė, pagal kurią hipotezė priimama arba atmetama, vadinama statistiniu kriterijumi. Statistiniai kriterijai, naudojami hipotezėms apie pasiskirstymo dėsnių tipą patikrinti, vadinami tinkamumo kriterijais. Tie. susitarimo kriterijai nustato, kada faktiškai gauti neatitikimai tarp numanomų teorinių ir eksperimentinių skirstinių yra: nereikšmingi – atsitiktiniai, o kai reikšmingi – neatsitiktiniai.

Panagrinėkime atsitiktinį kintamąjį, apibūdinantį neatitikimo tarp numatomo teorinio ir eksperimentinio požymio skirstinio tipą arba funkciją, tada iš esamo eksperimentinio skirstinio galime nustatyti reikšmę. a, kurią pasirinko atsitiktinis dydis, jei žinomas jo pasiskirstymo dėsnis, tada nesunku rasti tikimybę, kad atsitiktinis dydis įgis ne mažesnę kaip a. Jei vertė a gautas kaip atsitiktinio dydžio stebėjimo rezultatas x, t.y. kai nagrinėjama charakteristika pasiskirsto pagal tariamą teorinį dėsnį, tada tikimybė neturėtų būti maža. Jei tikimybė pasirodo maža, tai paaiškinama tuo, kad gauta tikroji vertė nėra atsitiktinis dydis x, o kai kurios kitos su skirtingu skirstymo dėsniu, t.y. tiriama charakteristika pasiskirsto ne pagal numatomą dėsnį. Taigi tuo atveju, kai neatitikimas tarp empirinio ir teorinio skirstinio nėra mažas, jis laikytinas nereikšmingu – atsitiktiniu, o eksperimentinis ir teorinis skirstiniai nėra prieštaringi, t.y. suderinami vienas su kitu.

Jei tikimybė maža, tai neatitikimai tarp eksperimentinio ir teorinio skirstinio yra reikšmingi, jų negalima paaiškinti atsitiktinumu, o hipotezė apie charakteristikos pasiskirstymą pagal tariamą teorinį dėsnį laikytina nepasitvirtinta, ji nesutampa. su eksperimentiniais duomenimis. Atidžiai ištyrus eksperimentinius duomenis, būtina pabandyti rasti naują siūlomos charakteristikos kokybės dėsnį, kuris geriau ir visapusiškiau atspindėtų eksperimentinio pasiskirstymo ypatybes, tokios tikimybės laikomos mažomis ir jų nelaikomos viršyti 0,1.

Pearsono tinkamumo testai arba kriterijaic 2 .

Tegul eksperimentinių duomenų analizė lemia tam tikro pasiskirstymo dėsnio parinkimą, kaip manoma nagrinėjamai charakteristikai, o pagal eksperimentinius duomenis n-stebėjimų metu buvo rasti parametrai (jei jie nebuvo žinomi anksčiau). Pažymėkime pagal n i- atsitiktinio dydžio empiriniai dažniai x.

n × P i-teoriniai dažniai, atspindintys stebėjimų skaičiaus sandaugą n apie tikimybę P i- skaičiuojama pagal numanomą teorinį skirstinį. Sutikimo kriterijai c 2 imamas teorinės ir empirinės dažnių eilučių neatitikimo matas


;

c 2- vadinamas kiekis c 2 paskirstymas arba Pearsono paskirstymas. Jis lygus 0 tik tada, kai sutampa visi empiriniai ir teoriniai dažniai, kitais atvejais skiriasi nuo 0 ir kuo didesnis, tuo didesnis neatitikimas tarp nurodytų dažnių. Įrodyta, kad pasirinkta savybė c 2 arba n®¥ statistika turi Pearsono skirstinį su laisvės laipsniais

k=m-s- 1.

Kur m-variacijų eilučių empirinio skirstinio intervalų skaičius arba grupių skaičius.

s-teorinio skirstinio parametrų skaičius, nustatytas iš eksperimentinių duomenų (pavyzdžiui, esant normaliajam skirstiniui, iš imties įvertintų parametrų skaičius yra 2).

Kriterijaus taikymo schema yra tokia:

1. Remdamiesi eksperimentiniais duomenimis, pasirinkite charakteristikos pasiskirstymo dėsnį kaip tikėtiną ir suraskite jo parametrus.

2. Naudojant gautą skirstinį, nustatomi eksperimentinius dažnius atitinkantys teoriniai dažniai.

3. Maži eksperimentiniai dažniai, jei tokių yra, derinami su kaimyniniais, tada reikšmė nustatoma pagal formulę c 2 .

4. Nustatykite laisvės laipsnių skaičių k .

5. Iš pasirinkto reikšmingumo lygio taikymo lentelių a rasti kritinę reikšmę, kai laisvės laipsnių skaičius yra lygus k .

6. Suformuluojame išvadą, vadovaujantis bendruoju susitarimo kriterijų taikymo principu, ty jei tikimybė yra >0,01, tai esantys teorinių ir eksperimentinių dažnių neatitikimai laikomi nereikšmingais.

Jei faktinė stebima vertė yra didesnė už kritinę vertę, tada H0 atmetamas, jei hipotezė neprieštarauja eksperimentiniams duomenims. Kriterijus c 2 duoda patenkinamus rezultatus, jei kiekviename grupavimo intervale yra pakankamai stebėjimų n i .

Pastaba: jei bet kuriame intervale stebėjimų skaičius<5, то имеет смысл объединить соседние интервалы с тем, чтобы в объединенных интервалах n i buvo ne mažesnis kaip 5. Be to, skaičiuojant laisvės laipsnių skaičių k kaip m- imamas atitinkamai sumažintas intervalų skaičius.

Gautas toks 100 cechų darbuotojų pasiskirstymas pagal produkciją ataskaitiniais metais

(% praėjusių metų).



Ar jums patiko straipsnis? Pasidalinkite su draugais!