Kriteri për marrëveshje është. Testi i përshtatshmërisë së Pearson

Hipoteza statistikore. Kriteret e pëlqimit.

Nul(bazë) quaj hipotezën e paraqitur për speciet shpërndarje e panjohur, ose rreth parametrave të shpërndarjeve të njohura. Konkurruese (alternativë) quhet hipotezë që bie ndesh me hipotezën zero.

Për shembull, nëse hipoteza zero është se ndryshorja e rastësishme X shpërndahet sipas ligjit, atëherë një hipotezë konkurruese mund të jetë se ndryshorja e rastësishme X shpërndahet sipas një ligji tjetër.

Kriteri statistikor(ose thjesht kriter) quhet ndryshore e rastësishme TE, e cila shërben për të testuar hipotezën zero.

Pas përzgjedhjes kriter i caktuar, për shembull, një kriter, grupi i të gjithave të tij vlerat e mundshme ndahen në dy nëngrupe të ndara: njëra prej tyre përmban vlerat e kriterit në të cilat hidhet poshtë hipoteza zero, dhe tjetra - në të cilën pranohet.

Zonë kritikeështë një grup vlerash kriteri në të cilat hidhet poshtë hipoteza zero. Zona e pranimit të hipotezave thirrni grupin e vlerave të kriterit në të cilat pranohet hipoteza. Pikat kritike Ata i quajnë pikat që ndajnë rajonin kritik nga rajoni ku pranohet hipoteza zero.

Për shembullin tonë, me një vlerë prej , vlera e llogaritur nga kampioni korrespondon me zonën e pranimit të hipotezës: ndryshorja e rastësishme shpërndahet sipas ligjit. Nëse vlera e llogaritur është , atëherë ajo bie në rajonin kritik, domethënë hipotezën për shpërndarjen ndryshore e rastësishme refuzuar ligjërisht.

Në rastin e shpërndarjes, rajoni kritik përcaktohet nga pabarazia, rajoni ku pranohet hipoteza zero përcaktohet nga pabarazia.

2.6.3. Kriteri i marrëveshjes Pearson.

Një nga detyrat e shkencës së kafshëve dhe gjenetikës veterinare është mbarështimi i racave dhe specieve të reja me karakteristikat e kërkuara. Për shembull, rritja e imunitetit, rezistenca ndaj sëmundjeve ose ndryshimi i ngjyrës së leshit.

Në praktikë, kur analizohen rezultatet, shumë shpesh rezulton se rezultatet aktuale pak a shumë korrespondojnë me disa ligji teorik shpërndarjet. Ekziston nevoja për të vlerësuar shkallën e korrespondencës midis të dhënave aktuale (empirike) dhe të dhënave teorike (hipotetike). Për ta bërë këtë, parashtroni një hipotezë zero: popullsia që rezulton shpërndahet sipas ligjit "A". Hipoteza rreth ligjit të shpërndarjes së pritshme testohet duke përdorur një variabël të rastësishëm të zgjedhur posaçërisht - kriteri i përshtatshmërisë.

Kriteri i marrëveshjes quhet kriter për testimin e një hipoteze për ligjin e supozuar të një shpërndarjeje të panjohur.

Ekzistojnë disa kritere të marrëveshjes: Pearson, Kolmogorov, Smirnov, etj. Testi Pearson i mirësisë së përshtatjes është më i përdoruri.

Le të shqyrtojmë zbatimin e kriterit Pearson duke përdorur shembullin e testimit të hipotezës për shpërndarjen normale të popullsisë. Për këtë qëllim, ne do të krahasojmë frekuencat empirike dhe teorike (të llogaritura në vazhdimësi të shpërndarjes normale).

Zakonisht ka një ndryshim midis frekuencave teorike dhe empirike. Për shembull:

Frekuencat empirike 7 15 41 93 113 84 25 13 5

frekuencat teorike 5 13 36 89 114 91 29 14 6

Le të shqyrtojmë dy raste:

Mospërputhja midis frekuencave teorike dhe empirike është e rastësishme (e parëndësishme), d.m.th. është e mundur të bëhet një propozim rreth shpërndarjes së frekuencave empirike sipas ligj normal;

Mospërputhja midis frekuencave teorike dhe empirike nuk është e rastësishme (e rëndësishme), d.m.th. frekuencat teorike janë llogaritur bazuar në hipotezën e gabuar të një shpërndarjeje normale të popullsisë.

Duke përdorur testin e "mirësisë së përshtatjes së Pearson", mund të përcaktoni nëse mospërputhja midis frekuencave teorike dhe empirike është aksidentale apo jo, d.m.th. me një të dhënë probabiliteti i besimit përcaktojnë të shpërndara popullsia sipas ligjit normal ose jo.

Pra, le të merret shpërndarja empirike nga një mostër e madhësisë n:

Opsionet......

Frekuencat empirike…….

Le të supozojmë se frekuencat teorike llogariten nën supozimin e një shpërndarjeje normale. Në nivelin e rëndësisë, është e nevojshme të testohet hipoteza zero: popullsia është e shpërndarë normalisht.

Si kriter për testimin e hipotezës zero do të marrim një ndryshore të rastësishme

(*)

Kjo vlerë është e rastësishme, pasi në përvoja të ndryshme merr vlera të ndryshme, të panjohura më parë. Është e qartë se sa më pak të ndryshojnë frekuencat empirike dhe teorike, aq më e vogël është vlera e kriterit dhe, për rrjedhojë, është në një masë të caktuar karakterizon afërsinë e shpërndarjeve empirike dhe teorike.

Është vërtetuar se kur ligji i shpërndarjes së një ndryshoreje të rastësishme (*), pavarësisht se cilit ligj të shpërndarjes i nënshtrohet popullata e përgjithshme, priret drejt një ligji shpërndarjeje me shkallë lirie. Prandaj, ndryshorja e rastësishme (*) shënohet me , dhe vetë kriteri quhet kriteri i përshtatshmërisë së "chi-square".

Le të shënojmë vlerën e kriterit të llogaritur nga të dhënat e vëzhgimit me . Tabeluar vlerat kritike kriteret për këtë nivel rëndësia dhe numri i shkallëve të lirisë tregojnë . Në këtë rast, numri i shkallëve të lirisë përcaktohet nga barazia, ku numri i grupeve ( intervale të pjesshme) mostrat ose klasat; - numri i parametrave të shpërndarjes së pritshme. Shpërndarja normale ka dy parametra - pritje matematikore dhe mesatare devijimi standard. Prandaj, numri i shkallëve të lirisë për një shpërndarje normale gjendet nga barazia

Nëse për vlerën e llogaritur dhe vlera e tabelës pabarazia qëndron , pranohet hipoteza zero për shpërndarjen normale të popullsisë. Nëse , hipoteza zero hidhet poshtë dhe hipoteza alternative pranohet (popullsia nuk shpërndahet normalisht).

Komentoni. Kur përdorni testin e Pearson-it të përshtatshmërisë, madhësia e kampionit duhet të jetë së paku 30. Secili grup duhet të përmbajë të paktën 5 opsione. Nëse grupet përmbajnë më pak se 5 frekuenca, ato kombinohen me grupet fqinje.

rast i përgjithshëm numri i shkallëve të lirisë për shpërndarjen chi-katrore jepet nga numri total sasitë me të cilat llogariten treguesit përkatës, minus numrin e kushteve që lidhin këto sasi, d.m.th. zvogëlojnë mundësinë e ndryshimit midis tyre. Në rastet më të thjeshta, gjatë llogaritjes, numri i shkallëve të lirisë do të jetë i barabartë me numrin e klasave të reduktuara me një. Kështu, për shembull, me ndarjen dihibride, fitohen 4 klasa, por vetëm klasa e parë është e palidhur, ato të mëvonshme janë tashmë të lidhura me ato të mëparshme. Prandaj, për ndarjen dihibride, numri i shkallëve të lirisë është .



Shembulli 1. Përcaktoni shkallën e përputhshmërisë së shpërndarjes aktuale të grupeve sipas numrit të lopëve me tuberkuloz me atë të pritur teorikisht, e cila është llogaritur kur merret parasysh shpërndarjen normale. Të dhënat burimore janë përmbledhur në tabelë:

Zgjidhje.

Sipas nivelit të rëndësisë dhe numrit të shkallëve të lirisë nga tabela pikat kritike shpërndarja (shih Shtojcën 4) gjejmë vlerën . Që nga viti , mund të konkludojmë se ndryshimi midis frekuencave teorike dhe aktuale është i rastësishëm. Kështu, shpërndarja aktuale e grupeve sipas numrit të lopëve të sëmura me tuberkuloz korrespondon me atë të pritur teorikisht.

Shembulli 2. Shpërndarja teorike sipas fenotipit të individëve të marrë në gjeneratën e dytë nga kryqëzimi dihibrid i lepujve sipas ligjit të Mendelit, është 9: 3: 3: 1. Kërkohet të llogaritet korrespondenca e shpërndarjes empirike të lepujve nga kryqëzimi i individëve të zinj me normale. qime me kafshe me push - albino. Gjatë kryqëzimit në gjeneratën e dytë, u morën 120 pasardhës, duke përfshirë 45 të zinj me flokë të shkurtër, 30 lepuj të zinj me push, 25 të bardhë me flokë të shkurtër, 20 lepuj të bardhë me push.

Zgjidhje. Teorikisht, ndarja e pritur tek pasardhësit duhet të korrespondojë me raportin e katër fenotipeve (9: 3: 3: 1). Le të llogarisim frekuencat teorike (numri i qëllimeve) për secilën klasë:

9+3+3+1=16, që do të thotë se mund të presim që do të ketë flokë të shkurtra të zeza ; push i zi - ; me flokë të shkurtër të bardhë - ; me push të bardhë - .

Shpërndarja empirike (aktuale) e fenotipeve ishte si më poshtë: 45; 30; 25; 20.

Le t'i përmbledhim të gjitha këto të dhëna në tabelën e mëposhtme:

Duke përdorur testin e mirësisë së përshtatjes së Pearson, ne llogarisim vlerën:

Numri i shkallëve të lirisë në kryqëzimin dihibrid. Për nivelin e rëndësisë gjeni vlerën . Që nga viti , mund të konkludojmë se ndryshimi midis frekuencave teorike dhe aktuale nuk është i rastësishëm. Për rrjedhojë, grupi i lepujve që rezulton devijon në shpërndarjen e fenotipeve nga ligji i Mendelit gjatë kryqëzimit dihibrid dhe pasqyron ndikimin e disa faktorëve që ndryshojnë llojin e ndarjes fenotipike në brezin e dytë të kryqëzimeve.

Testi chi-katror i Pearson-it i përshtatshmërisë së mirësisë mund të përdoret gjithashtu për të krahasuar dy objekte homogjene me njëri-tjetrin. shpërndarjet empirike, d.m.th. ato që kanë të njëjtat kufij klasash. Hipoteza zero është hipoteza se dy funksione të panjohura të shpërndarjes janë të barabarta. Testi chi-square në raste të tilla përcaktohet nga formula

(**)

ku dhe janë vëllimet e shpërndarjeve që krahasohen; dhe - frekuencat e klasave përkatëse.

Merrni parasysh një krahasim të dy shpërndarjeve empirike duke përdorur shembullin e mëposhtëm.

Shembulli 3. Gjatësia e vezëve të qyqes u mat duke përdorur dy zonave territoriale. Në zonën e parë, u ekzaminua një mostër prej 76 vezësh (), në të dytën nga 54 (). Janë marrë rezultatet e mëposhtme:

Gjatësia (mm)
Frekuencat
Frekuencat - - -

Në nivelin e rëndësisë, ne duhet të testojmë hipotezën zero se të dy mostrat e vezëve i përkasin të njëjtës popullatë qyqe.

ODA Kriteri për testimin e hipotezës për ligjin e supozuar të një shpërndarjeje të panjohur quhet kriteri i përshtatshmërisë.

Ekzistojnë disa teste të përshtatshmërisë: $\chi ^2$ (chi-square) nga K. Pearson, Kolmogorov, Smirnov, etj.

Zakonisht teorike dhe frekuencat empirike ndryshojnë. Rasti i mospërputhjes mund të mos jetë i rastësishëm, që do të thotë se shpjegohet me faktin se hipoteza nuk është zgjedhur saktë. Kriteri Pearson i përgjigjet pyetjes së parashtruar, por si çdo kriter ai nuk vërteton asgjë, por vetëm vendos pajtimin ose mospajtimin e tij me të dhënat e vëzhgimit në nivelin e pranuar të rëndësisë.

ODA Një probabilitet mjaft i vogël në të cilin një ngjarje mund të konsiderohet praktikisht e pamundur quhet niveli i rëndësisë.

Në praktikë, nivelet e rëndësisë zakonisht merren të jenë midis 0.01 dhe 0.05, $\alfa =0.05$ është niveli i rëndësisë $5 ( \% ) $.

Si kriter për testimin e hipotezës, do të marrim vlerën \begin(ekuacioni) \label (eq1) \chi ^2=\sum ( \frac ((( n_i -n_i" ))^2) (n_i") ) \qquad (1) \ fund (ekuacion)

këtu $n_i -$ frekuencat empirike të marra nga kampioni, $n_i" -$ frekuencat teorike të gjetura teorikisht.

Është vërtetuar se për $n\në \infty $ ligji i shpërndarjes së ndryshores së rastësishme (1), pavarësisht nga ligji me të cilin shpërndahet popullata, priret në ligjin $\chi ^2$ (chi-katror) me $k$ shkallë lirie.

ODA Numri i shkallëve të lirisë gjendet nga barazia $k=S-1-r$ ku $S-$ është numri i grupeve të intervalit, $r-$ është numri i parametrave.

1) shpërndarje uniforme: $r=2, k=S-3 $

2) shpërndarje normale: $r=2, k=S-3 $

3) shpërndarja eksponenciale: $r=1, k=S-2$.

Rregulli . Testimi i hipotezës duke përdorur testin Pearson.

  1. Për të testuar hipotezën, llogaritni frekuencat teorike dhe gjeni $\chi _ ( obs ) ^2 =\sum ( \frac ( ( ( n_i -n_i " )) ^ 2 ) ( n_i " ) ) $
  2. Përdorimi i tabelës së pikave kritike të shpërndarjes $\chi ^2$ për një nivel të caktuar rëndësie $\alpha $ dhe numrin e shkallëve të lirisë $k$, $\chi _ ( cr ) ^2 (( \alfa ,k ))$ janë gjetur.
  3. Nëse $\chi _ ( obs ) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

Komentoni Për të kontrolluar llogaritjet, përdorni formulën për $\chi ^2$ në formën $\chi _ (vërejtur) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $

Testimi i hipotezës së shpërndarjes uniforme

Funksioni i dendësisë së shpërndarjes uniforme të sasisë $X$ ka formën $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$.

Për të testuar hipotezën se një variabël e rastësishme e vazhdueshme shpërndahet sipas një ligji uniform në nivelin e rëndësisë $\alpha $, kërkohet:

1) Gjeni mesataren e mostrës $\overline (x_b) $ dhe $\sigma _b =\sqrt (D_b) $ nga një shpërndarje e dhënë empirike. Merrni si vlerësim të parametrave $a$ dhe $b$ sasitë

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) Gjeni probabilitetin që një ndryshore e rastësishme $X$ të bjerë në intervale të pjesshme $(( x_i ,x_ ( i+1 ) ))$ duke përdorur formulën $ P_i =P(( x_i

3) Gjeni frekuencat teorike (niveluese) duke përdorur formulën $n_i" =np_i $.

4) Duke marrë numrin e shkallëve të lirisë $k=S-3$ dhe nivelin e rëndësisë $\alfa =0,05$ nga tabelat $\chi ^2$ gjejmë $\chi _ ( cr ) ^2 $ për të dhënën $\alfa $ dhe $k$, $\chi _ ( kr ) ^2 (( \alfa ,k ))$.

5) Duke përdorur formulën $\chi _ (vërejtur) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ ku $n_i -$ janë frekuenca empirike, gjejmë vlera e vrojtuar $\ chi _ ( obs ) ^2 $.

6) Nëse $\chi _ ( obs ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Le të testojmë hipotezën duke përdorur shembullin tonë.

1) $\overline x _b =13,00\,\,\sigma _b =\sqrt (D_b) = 6,51$

2) $a=13,00-\sqrt 3 \cdot 6,51=13,00-1,732\cdot 6,51=1,72468$

$b=13,00+1,732\cdot 6,51=24,27532$

$b-a=24,27532-1,72468=22,55064$

3) $P_i =P(( x_i

$P_2 =(( 3

$P_3 =(( 7

$P_4 =(( 11

$P_5 =(( 15

$P_6 =(( 19

Në një shpërndarje uniforme, nëse gjatësia e intervalit është e njëjtë, atëherë $P_i -$ janë të njëjta.

4) Gjeni $n_i" =np_i $.

5) Gjeni $\sum ( \frac ( (( n_i -n_i" ))^2 ) (n_i" ) ) $ dhe gjeni $\chi _ ( obs ) ^2 $.

Le të fusim të gjitha vlerat e marra në tabelë

\begin(array) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i" ))^2& \frac ( (( n_i -n_i" ))^2) (n_i") & Kontroll~ \frac (n_i^2) (n_i") \\ \hline 1& 1& 4.43438& -3.43438& 11.7950& 2.651\25898 6& 4,43438& 1,56562& 2,45117& 0,552765& 8,11838 \\ \hline 3& 3& 4,43438& -1,43438& 2,05744& 4,3& 4,3& 4,3& 4,3& 4&8& & -1,43438& 2,05744& 0,471463& 2,0296 \\ \hline 5& 6& 4,43438 & 1,56562& 2,45117& 0,552765& 8,11838 \\ \hlina 6& 6& 4,43438& 1,56562& 2, 45117& 0,552765& 8,11838 & 2 & h 1119& \chi _ (obs) ^2 =\sum (\frac (n_i^2) (n_i") -n) =3.63985 \\ \hline \end(array)

$\chi _ ( kr ) ^2 (( 0.05.3 ))=7.8$

$\chi _ ( obs ) ^2<\chi _ { кр } ^2 =3,26<7,8$

konkluzioni nuk ka asnjë arsye për të hedhur poshtë hipotezën.

QËLLIMI I PUNËS

Qëllimi i kësaj pune laboratorike është:

· ndërtimi, bazuar në rezultatet e eksperimentit, të ligjeve të shpërndarjes për variablin e rastësishëm të shpërndarjes së parametrave të rezistorëve jo tela;

· testimi i hipotezës për ligjin normal të shpërndarjes së devijimeve të parametrave të elementit;

· Studimi eksperimental i ndryshimeve në parametrat e rezistorëve jo tela kur ekspozohen ndaj temperaturës.

KOHËZGJATJA E PUNËS

Puna laboratorike kryhet gjatë një mësimi 4 orësh, duke përfshirë 1 orë për një kolokium për vlerësimin e njohurive të studentëve për pjesën teorike.

PJESA TEORIKE

Pajisjet radio-elektronike janë vazhdimisht nën ndikimin e faktorëve të rastësishëm shqetësues të jashtëm dhe të brendshëm, nën ndikimin e të cilëve ndryshojnë parametrat e elementeve të pajisjes. Ndryshimet në parametrat e elementeve (rezistorët, kondensatorët, pajisjet gjysmëpërçuese, qarqet e integruara, etj.) shoqërohen me procese të ndryshme fizike që ndodhin në materiale për shkak të ndikimeve të jashtme dhe plakjes. Për më tepër, parametrat e elementeve të BRE kanë një shpërndarje prodhimi, e cila është rezultat i ndikimit të faktorëve të rastësishëm gjatë prodhimit të tyre. Pajisjet e krijuara nga elementë të tillë reagojnë ndaj të gjitha ndryshimeve duke ndryshuar parametrat e daljes së tyre. Për të parashikuar besueshmërinë e BRE-ve, ekziston nevoja për të vendosur ligje për shpërndarjen e vlerës së rastësishme të shpërndarjes së parametrave të elementeve, të përcaktuara nga prodhimi i tyre dhe kushtet e jashtme shqetësuese (në veçanti, temperatura e ambientit).

Në punën laboratorike, duke përdorur testet e përshtatshmërisë (Pearson ose Kolmogorov), testohet hipoteza për ligjin e shpërndarjes normale të ndryshores së rastësishme X - shpërndarjen e parametrave të elementeve.

KRITERET E MARREVESHJES TE PERDORUR PER TE TESTUAR HIPOTEZAT STATISTIKE

Kriteret e përshtatshmërisë na lejojnë të vlerësojmë probabilitetin e supozimit që kampioni i marrë nga eksperimenti nuk bie në kundërshtim me ligjin e zgjedhur a priori të shpërndarjes të ndryshores së rastësishme në shqyrtim. Zgjidhja e këtij problemi bazohet në përdorimin e pozicionit themelor të statistikave matematikore, sipas të cilit Funksioni i shpërndarjes empirike (statistikore) konvergjon sipas probabilitetit me funksionin e mëparshëm (teorik të krahasueshëm) të shpërndarjes kur madhësia e kampionit rritet pa kufi, me kusht që kampioni t'i përkasë shpërndarjes së mëparshme në fjalë.. Për një vlerë të caktuar të mostrës, funksionet empirike dhe apriori të shpërndarjes, në përgjithësi, do të ndryshojnë nga njëri-tjetri. Prandaj, për mostrën X 1 , X 2 ,… x n ndryshore e rastësishme Xështë paraqitur një masë e caktuar numerike e mospërputhjes (kriteri i përshtatshmërisë) () i funksionit të shpërndarjes empirike

, l =1, 2, …, n , (1)

Ku

= X 1 , X 2 ,… x n– mostër e të dhënave eksperimentale

dhe a priori – funksioni i shpërndarjes.

Rregulli për testimin e hipotezës për marrëveshjen ndërmjet shpërndarjeve apriori dhe empirike formulohet si më poshtë: nëse

atëherë hipoteza se shpërndarja paraprake të cilës i përket kampioni X 1 , X 2 ,…,x n e barabartë me F(X) duhet të refuzohet. Për të përcaktuar vlerën e pragut ME vendoset një probabilitet i caktuar i pranueshëm a për të hedhur poshtë hipotezën se kampioni i përket shpërndarjes F. Probabiliteti a quhet niveli i rëndësisë së kriterit të përshtatshmërisë. Pastaj

ato. ME– vlera e pragut të kriterit është e barabartë me pikën a-përqindje të funksionit të shpërndarjes së masës së divergjencës.

Ngjarja mund të ndodhë gjithashtu nëse hipoteza e paraqitur për ligjin e shpërndarjes është e vërtetë. Megjithatë, nëse a është mjaft e vogël, atëherë mundësia e situatave të tilla praktikisht mund të neglizhohet. Vlerat e specifikuara zakonisht për a janë a = 0.05 dhe a = 0.01.

Nëse ligji i shpërndarjes së masës së divergjencës () nuk varet nga F, pastaj rregulli për refuzimin e hipotezës së marrëveshjes dhe F

(4)

nuk varet nga shpërndarja paraprake. Kritere të tilla quhen joparametrike (shih seksionin 3.1.2).

Hipoteza për natyrën e shpërndarjes mund të testohet duke përdorur testin e përshtatshmërisë në një sekuencë të ndryshme: duke përdorur vlerën e marrë, është e nevojshme të përcaktohet probabiliteti a n= R{ n). Nëse vlera që rezulton a n < a , то отклонения значимые; если an³ a, atëherë devijimet nuk janë të rëndësishme. Vlerat e a n, shumë afër 1 (marrëveshje shumë e mirë) mund të tregojë cilësi të dobët të kampionit (për shembull, elementët që japin devijime të mëdha nga mesatarja u hodhën jashtë nga kampioni origjinal pa arsye).

Kriteret e përshtatshmërisë së përdorur në statistika ndryshojnë nga njëri-tjetri nga matje të ndryshme të mospërputhjes midis ligjeve të shpërndarjes statistikore dhe teorike (). Disa prej tyre janë diskutuar më poshtë.

3.1.1. Kriteri i marrëveshjes c 2

Kur përdoret kriteri i përshtatshmërisë c 2 (kriteri i Pearson-it), masa e mospërputhjes midis shpërndarjeve empirike dhe atyre të mëparshme përcaktohet si më poshtë.

Gama e vlerave të mundshme mbi të cilat është përcaktuar F(x) - funksioni i shpërndarjes a priori është i ndarë në një numër të fundëm intervalesh jo të mbivendosura – , i = 1, 2,…, L.

Le të prezantojmë shënimin: – probabiliteti apriori për të goditur një vlerë të mostrës në interval

Është e qartë se. Lërini elementet e kampionit të vëzhguar X 1 , X 2 ,…, x n i përkasin intervalit.

Është e qartë se.

Le të marrim si masë të mospërputhjes midis shpërndarjes empirike dhe apriori vlerën

, (5)

ku është numri i goditjes eksperimentale i vlerave të variablave të rastësishme x në interval,

L- numri i intervaleve në të cilat ndahen të gjitha vlerat eksperimentale të sasisë x,

n- madhësia e mostrës,

p i– probabiliteti i goditjes së një ndryshoreje të rastësishme x në intervalin -të, i llogaritur për ligjin teorik të shpërndarjes (produkti përcakton numrin e goditjeve në intervalin - për ligjin teorik).

Siç vërtetoi Pearson, kur n® ¥ ligji i shpërndarjes së sasisë (5) tenton të - shpërndarja me S = L- 1 shkallë lirie, përveç nëse hipoteza për shpërndarjen është e vërtetë.

Nëse po testohet një hipotezë komplekse se kampioni i përket shpërndarjes , ku parametri i panjohur (skalar ose vektor) i shpërndarjes është , atëherë nga eksperimenti përcaktohet një vlerësim i parametrit të panjohur (bazuar në mostrën që rezulton). Në këtë rast, S - numri i shkallëve të lirisë c 2 - shpërndarja është e barabartë me L – r – 1, Ku r– numri i parametrave të shpërndarjes së vlerësuar. .

Rregulli për testimin e hipotezës nëse një kampion i përket një shpërndarjeje mund të formulohet si më poshtë: me një n(n> 50) dhe për një nivel të caktuar rëndësie a, hipoteza refuzohet nëse

ku - një - pikë përqindje - shpërndarjet me shkallë lirie.

Kriteri Kolmogorov

Le të marrim si masë të mospërputhjes midis shpërndarjeve apriori dhe empirike statistikat

().= , (7)

ku është kufiri i sipërm i modulit të diferencës për të gjitha vlerat e marra X.

Shpërndarja e kësaj statistike (ndryshore e rastësishme) për çdo n nuk varet nga

Nëse vetëm një mostër X 1 , X 2 ,… x n mbi të cilën është ndërtuar i përket dhe ky i fundit është një funksion i vazhdueshëm. Megjithatë, shprehja e saktë për funksionin e shpërndarjes në një vlerë të fundme n shumë i rëndë . A.N. Kolmogorov gjeti një shprehje mjaft të thjeshtë asimptotike (për ) për funksionet:

, z> 0. (8) Kështu, për madhësi të mëdha të mostrës (me n> 50), duke përdorur (8) marrim

Frekuencat teorike dhe empirike. Kontrollimi për shpërndarje normale

Kur analizohen seritë e variacioneve të shpërndarjeve, ka rëndësi të madhe se si shpërndarja empirike shenja korrespondon normale. Për ta bërë këtë, frekuencat e shpërndarjes aktuale duhet të krahasohen me ato teorike, të cilat janë karakteristike për një shpërndarje normale. Kjo do të thotë se, bazuar në të dhënat aktuale, është e nevojshme të llogariten frekuencat teorike të lakores së shpërndarjes normale, të cilat janë funksion i devijimeve të normalizuara.

Me fjalë të tjera, kurba empirike e shpërndarjes duhet të përafrohet me kurbën e shpërndarjes normale.

Karakteristikat objektive të pajtueshmërisë teorike Dhe empirike frekuencave mund të merren duke përdorur tregues të veçantë statistikorë të quajtur kriteret e pëlqimit.

Kriteri i marrëveshjes quhet një kriter që ju lejon të përcaktoni nëse mospërputhja është empirike Dhe teorike shpërndarjet janë të rastësishme ose domethënëse, d.m.th. nëse të dhënat e vëzhgimit pajtohen me hipotezën statistikore të paraqitur ose nuk pajtohen. Shpërndarja e popullsisë, që ajo ka për shkak të hipotezës së paraqitur, quhet teorike.

Ekziston nevoja për të instaluar kriter(rregull) që do të lejonte dikë të gjykonte nëse mospërputhja midis shpërndarjeve empirike dhe teorike është e rastësishme apo domethënëse. Nëse mospërputhja rezulton të jetë e rastit, atëherë ata besojnë se të dhënat e vëzhgimit (kampioni) janë në përputhje me hipotezën e paraqitur për ligjin e shpërndarjes së popullatës së përgjithshme dhe, për rrjedhojë, hipoteza pranohet; nëse mospërputhja rezulton të jetë domethënëse, atëherë të dhënat e vëzhgimit nuk përputhen me hipotezën dhe ajo refuzohet.

Në mënyrë tipike, frekuencat empirike dhe teorike ndryshojnë sepse:

    mospërputhja është e rastësishme dhe për shkak të një numri të kufizuar vëzhgimesh;

    mospërputhja nuk është e rastësishme dhe shpjegohet me faktin se hipoteza statistikore se popullsia është e shpërndarë normalisht është e gabuar.

Kështu, kriteret e pëlqimit bëjnë të mundur që të refuzohet ose të konfirmohet korrektësia e hipotezës së paraqitur kur përafrohet seria për natyrën e shpërndarjes në serinë empirike.

Frekuencat empirike të marra si rezultat i vëzhgimit. Frekuencat teorike llogaritet duke përdorur formula.

Për ligji normal i shpërndarjes ato mund të gjenden si më poshtë:

    Σƒ i- shuma e frekuencave empirike të grumbulluara (kumulative).

    h - ndryshimi midis dy opsioneve fqinje

    σ - devijimi standard i mostrës

    t–devijimi i normalizuar (i standardizuar).

    φ(t)–funksioni i densitetit të probabilitetit të shpërndarjes normale (i gjetur nga tabela e vlerave të funksionit lokal Laplace për vlerën përkatëse të t)

Ekzistojnë disa teste të përshtatshmërisë, më të zakonshmet prej të cilave janë: testi chi-square (Pearson), testi Kolmogorov, testi Romanovsky.

Testi Pearson χ i mirësisë së përshtatjes 2 - një nga ato kryesore, i cili mund të përfaqësohet si shuma e raporteve të katrorëve të diferencave midis frekuencave teorike (f T) dhe empirike (f) me frekuencat teorike:

    k është numri i grupeve në të cilat ndahet shpërndarja empirike,

    f i – frekuenca e vëzhguar e tiparit në grupin e i-të,

    f T – frekuenca teorike.

Për shpërndarjen χ 2, janë përpiluar tabela që tregojnë vlerën kritike të kriterit të përshtatshmërisë χ 2 për nivelin e zgjedhur të rëndësisë α dhe shkallët e lirisë df (ose ν). Niveli i rëndësisë α është probabiliteti për të refuzuar gabimisht hipotezën e propozuar, d.m.th. probabiliteti që një hipotezë e saktë të refuzohet. R - rëndësi statistikore duke pranuar hipotezën e saktë. Në statistika, tre nivele të rëndësisë përdoren më shpesh:

α=0.10, pastaj P=0.90 (në 10 raste nga 100)

α=0.05, pastaj P=0.95 (në 5 raste nga 100)

α=0.01, atëherë P=0.99 (në 1 rast nga 100) hipoteza e saktë mund të hidhet poshtë.

Numri i shkallëve të lirisë df përcaktohet si numri i grupeve në serinë e shpërndarjes minus numrin e lidhjeve: df = k –z. Numri i lidhjeve kuptohet si numri i treguesve të serisë empirike të përdorur në llogaritjen e frekuencave teorike, d.m.th. tregues që lidhin frekuencat empirike dhe teorike. Për shembull, kur përafrohet me një kurbë zile, ekzistojnë tre marrëdhënie. Prandaj, kur përafrohet nga kurba e ziles numri i shkallëve të lirisë përcaktohet si df =k–3. Për të vlerësuar rëndësinë, vlera e llogaritur krahasohet me tabelën χ 2 të tabelës

Nëse shpërndarjet teorike dhe empirike përputhen plotësisht, χ 2 =0, përndryshe χ 2 >0. Nëse χ 2 kalc > χ 2 tab, atëherë për një nivel të caktuar të rëndësisë dhe numrit të shkallëve të lirisë, ne hedhim poshtë hipotezën për parëndësinë (rastësinë) e mospërputhjeve. Nëse llogaritet χ 2< χ 2 табл то гипотезу принимаем и с вероятностью Р=(1-α) можно утверждать, что расхождение между теоретическими и эмпирическими частотами случайно. Следовательно, есть основания утверждать, что эмпирическое распределение подчиняетсяshpërndarje normale. Testi i përshtatshmërisë së Pearson-it përdoret nëse madhësia e popullsisë është mjaft e madhe (N>50) dhe frekuenca e secilit grup duhet të jetë së paku 5.

Testi i mirësisë së Kolmogorov bazohet në përcaktimin e mospërputhjes maksimale midis frekuencave të akumuluara empirike dhe teorike:

ku D dhe d janë, përkatësisht, diferenca maksimale ndërmjet frekuencave të grumbulluara dhe frekuencave të grumbulluara të shpërndarjeve empirike dhe teorike. Duke përdorur tabelën e shpërndarjes së statistikave Kolmogorov, përcaktohet probabiliteti, i cili mund të ndryshojë nga 0 në 1. Kur P(λ) = 1, ka një koincidencë të plotë të frekuencave, P(λ) = 0 - një mospërputhje e plotë. Nëse vlera e probabilitetit P është e rëndësishme në lidhje me vlerën e gjetur λ, atëherë mund të supozojmë se mospërputhjet midis shpërndarjeve teorike dhe empirike janë të parëndësishme, domethënë ato janë të rastësishme. Kushti kryesor për përdorimin e kriterit Kolmogorov është një numër mjaft i madh i vëzhgimeve.

Testi i mirësisë së Kolmogorov

Le të shqyrtojmë se si zbatohet kriteri Kolmogorov (λ) kur testimi i hipotezës së shpërndarjes normale popullata e përgjithshme. Përafrimi i shpërndarjes aktuale me kurbën e ziles përbëhet nga disa hapa:

    Krahasoni frekuencat aktuale dhe teorike.

    Bazuar në të dhënat aktuale, përcaktohen frekuencat teorike të kurbës së shpërndarjes normale, e cila është funksion i devijimit të normalizuar.

    Ata kontrollojnë deri në çfarë mase shpërndarja e karakteristikës korrespondon me normalen.

Për kolonën IV të tabelës:

Në MS Excel, devijimi i normalizuar (t) llogaritet duke përdorur funksionin NORMALIZATION. Është e nevojshme të zgjidhni një sërë qelizash të lira sipas numrit të opsioneve (rreshtat e fletëllogaritjes). Pa hequr përzgjedhjen, thirrni funksionin NORMALIZE. Në kutinë e dialogut që shfaqet, tregoni qelizat e mëposhtme, të cilat përmbajnë, përkatësisht, vlerat e vëzhguara (X i), mesataren (X) dhe devijimin standard Ϭ. Operacioni duhet të përfundojë të njëkohshme duke shtypur Ctrl+Shift+Enter

Për kolonën V të tabelës:

Funksioni i densitetit të probabilitetit të shpërndarjes normale φ(t) gjendet nga tabela e vlerave të funksionit lokal Laplace për vlerën përkatëse të devijimit të normalizuar (t)

Për kolonën VI të tabelës:

Testi i përshtatshmërisë Kolmogorov (λ) përcaktohet duke ndarë modulin diferenca maksimale ndërmjet frekuencave kumulative empirike dhe teorike me rrënjën katrore të numrit të vëzhgimeve:

Duke përdorur një tabelë të veçantë probabiliteti për kriterin e marrëveshjes λ, ne përcaktojmë se vlera λ = 0,59 korrespondon me një probabilitet prej 0,88 (λ

Shpërndarja e frekuencave empirike dhe teorike, dendësia e probabilitetit të shpërndarjes teorike

Kur aplikoni teste të përshtatshmërisë për të kontrolluar nëse shpërndarja e vëzhguar (empirike) korrespondon me atë teorike, duhet bërë dallimi midis testimit të hipotezave të thjeshta dhe komplekse.

Testi i normalitetit Kolmogorov-Smirnov me një mostër bazohet në diferenca maksimale ndërmjet shpërndarjes kumulative empirike të kampionit dhe shpërndarjes kumulative të vlerësuar (teorike). Nëse statistika Kolmogorov-Smirnov D është domethënëse, atëherë hipoteza se shpërndarja përkatëse është normale duhet të hidhet poshtë.

Hipoteza që testohet zakonisht quhet hipoteza zero. H0, rregulli me të cilin një hipotezë pranohet ose refuzohet quhet kriter statistikor Kriteret statistikore që përdoren për të testuar hipotezat rreth llojit të ligjeve të shpërndarjes quhen kritere të përshtatshmërisë. Ato. kriteret e marrëveshjes përcaktojnë kur mospërputhjet e përftuara në të vërtetë ndërmjet shpërndarjeve të supozuara teorike dhe eksperimentale janë: të parëndësishme - të rastësishme dhe kur në mënyrë domethënëse - jo të rastësishme.

Le të shqyrtojmë një variabël të rastësishëm që karakterizon llojin ose funksionin e mospërputhjes midis shpërndarjes së pritshme teorike dhe eksperimentale të atributit, pastaj nga shpërndarja ekzistuese eksperimentale, ne mund të përcaktojmë vlerën a, që ka marrë ndryshorja e rastësishme, nëse dihet ligji i shpërndarjes së saj, atëherë nuk është e vështirë të gjesh probabilitetin që ndryshorja e rastit të marrë një vlerë jo më të vogël se a. Nëse vlera a të marra si rezultat i vëzhgimit të një ndryshoreje të rastësishme x, d.m.th. kur karakteristika në shqyrtim shpërndahet sipas ligjit të supozuar teorik, atëherë probabiliteti nuk duhet të jetë i vogël. Nëse probabiliteti rezulton i vogël, atëherë kjo shpjegohet me faktin se vlera aktuale e marrë nuk është një ndryshore e rastësishme x, dhe disa të tjera me ligj tjetër të shpërndarjes, d.m.th. karakteristika që studiohet nuk shpërndahet sipas ligjit të pritshëm. Kështu, në rastin kur mospërputhja midis shpërndarjeve empirike dhe teorike nuk është e vogël, ajo duhet të konsiderohet jo e rëndësishme - e rastësishme, dhe shpërndarjet eksperimentale dhe teorike nuk janë kontradiktore, d.m.th. në përputhje me njëra-tjetrën.

Nëse probabiliteti është i ulët, atëherë mospërputhjet midis shpërndarjeve eksperimentale dhe teorike janë të rëndësishme, ato nuk mund të shpjegohen rastësisht, dhe hipoteza për shpërndarjen e karakteristikës sipas ligjit të supozuar teorik duhet të konsiderohet e pa konfirmuar, nuk pajtohet. me të dhënat eksperimentale. Është e nevojshme, pas studimit të kujdesshëm të të dhënave eksperimentale, të përpiqemi të gjejmë një ligj të ri për cilësinë e karakteristikës së propozuar, i cili do të pasqyronte më mirë dhe më plotësisht karakteristikat e shpërndarjes eksperimentale, probabilitete të tilla konsiderohen të vogla dhe nuk merren parasysh tejkalojnë 0.1.

Testet ose kriteret e përshtatshmërisë së Pearson-itc 2 .

Le të çojë analiza e të dhënave eksperimentale në zgjedhjen e një ligji të caktuar të shpërndarjes, siç supozohet për karakteristikën në shqyrtim, dhe sipas të dhënave eksperimentale si rezultat i n-vëzhgimeve, u gjetën parametra (nëse nuk njiheshin më parë). Le të shënojmë me n i- frekuencat empirike të një ndryshoreje të rastësishme x.

n×P i-frekuencat teorike që përfaqësojnë produktin e numrit të vëzhgimeve n sipas probabilitetit P i- llogaritur sipas shpërndarjes së supozuar teorike. Kriteret e pëlqimit c 2është marrë të jetë masa e mospërputhjes midis serisë teorike dhe empirike të frekuencave


;

c 2- sasia e thirrur c 2 shpërndarje ose shpërndarje Pearson. Është e barabartë me 0 vetëm kur të gjitha frekuencat empirike dhe teorike përkojnë, në raste të tjera është e ndryshme nga 0 dhe sa më e madhe, aq më e madhe është mospërputhja midis frekuencave të treguara. Është vërtetuar se karakteristika e përzgjedhur c 2 ose statistikat për n®¥ kanë një shpërndarje Pearson me shkallë lirie

k=m-s- 1.

Ku m-numri i intervaleve të shpërndarjes empirike të serisë së variacionit ose numri i grupeve.

s- numri i parametrave të shpërndarjes teorike të përcaktuar nga të dhënat eksperimentale (për shembull, në rastin e një shpërndarjeje normale, numri i parametrave të vlerësuar nga kampioni është 2).

Skema për zbatimin e kriterit është si më poshtë:

1. Bazuar në të dhënat eksperimentale, zgjidhni ligjin e shpërndarjes së karakteristikës si të pritshëm dhe gjeni parametrat e saj.

2. Duke përdorur shpërndarjen që rezulton, përcaktohen frekuencat teorike që korrespondojnë me frekuencat eksperimentale.

3. Frekuencat e vogla eksperimentale, nëse ka, kombinohen me ato fqinje, atëherë vlera përcaktohet duke përdorur formulën c 2 .

4. Përcaktoni numrin e shkallëve të lirisë k .

5. Nga tabelat e aplikimit për nivelin e zgjedhur të rëndësisë a gjeni vlerën kritike kur numri i shkallëve të lirisë është i barabartë k .

6. Ne formulojmë një përfundim, të udhëhequr nga parimi i përgjithshëm i aplikimit të kritereve të marrëveshjes, përkatësisht, nëse probabiliteti është >0.01, atëherë mospërputhjet ekzistuese midis frekuencave teorike dhe eksperimentale konsiderohen të parëndësishme.

Nëse vlera aktuale e vëzhguar është më e madhe se vlera kritike, atëherë H0 refuzohet nëse hipoteza nuk bie ndesh me të dhënat eksperimentale. Kriteri c 2 jep rezultate të kënaqshme nëse ka një numër të mjaftueshëm vëzhgimesh në çdo interval grupimi n i .

Shënim: Nëse në ndonjë interval numri i vëzhgimeve<5, то имеет смысл объединить соседние интервалы с тем, чтобы в объединенных интервалах n i ishte jo më pak se 5. Për më tepër, gjatë llogaritjes së numrit të shkallëve të lirisë k si m- merret një numër përkatësisht i reduktuar intervalesh.

Është marrë shpërndarja e mëposhtme e 100 punëtorëve të punëtorisë sipas prodhimit në vitin raportues

(në % të një viti më parë).



Ju pëlqeu artikulli? Ndani me miqtë tuaj!