Zgjidhja e problemeve në lidhje me probabilitetin e goditjeve gjatë të shtënave. Përcaktimi i probabilitetit të ngjarjes dhe shpërndarjes statistikore

Përshkrimi i kriterit

Qëllimi i kriterit

Testi chi-square i Pearson

Materiale leksioni

Tema 6. Identifikimi i ndryshimeve në shpërndarjen e një tipari

Kriteri Pearson: qëllimi i kriterit, përshkrimi i tij, fusha e zbatimit, algoritmi i llogaritjes.

Testi Kolmogorov–Smirnov për krahasimin e rezultateve matje sasiore: qëllimi i kriterit, përshkrimi i tij, shtrirja, algoritmi i llogaritjes.

Gjatë studimit të kësaj teme, është e nevojshme të merret parasysh që të dy kriteret janë joparametrike, ato funksionojnë me frekuenca. Ju lutemi paguani Vëmendje e veçantë mbi rregullat e vendimmarrjes për kriteret e konsideruara: këto rregulla mund të jenë të kundërta. Ju lutemi rishikoni me kujdes kufizimet në zbatimin e kritereve.

Pasi të keni studiuar materialin e leksionit, përgjigjuni Pyetje kontrolli, shkruani përgjigjet tuaja në shënimet tuaja.

Testi chi-square Pearson mund të zgjidhë disa probleme, duke përfshirë krahasimin e shpërndarjeve.

Testi χ 2 përdoret për dy qëllime;

1) për krahasim empirike shpërndarja e karakteristikës me teorike - uniforme, normale ose ndryshe;

2) për krahasim dy, tre ose më shumë empirike shpërndarjet e së njëjtës karakteristikë, domethënë për të kontrolluar homogjenitetin e tyre;

3) për të vlerësuar pavarësinë stokastike (probabiliste) në sistem ngjarje të rastësishme etj.

Kriteri χ 2 i përgjigjet pyetjes nëse ato ndodhin me frekuencë të barabartë kuptime të ndryshme shenjë në empirike dhe shpërndarjet teorike ose në dy ose më shumë shpërndarje empirike.

Avantazhi i metodës është se ajo lejon të krahasohen shpërndarjet e veçorive të paraqitura në çdo shkallë, duke filluar nga shkalla e emrave. Në shumë rast i thjeshtë shpërndarja alternative ("po - jo", "lejuar një defekt - nuk lejoi një defekt", "zgjidhi problemin - nuk e zgjidh problemin", etj.), tashmë mund të zbatojmë kriterin χ 2.

1. Madhësia e kampionit duhet të jetë mjaft e madhe: N>30. Kur N<30 критерий χ 2 дает весьма приближенные значения. Точность крите­рия повышается при больших N.

2. Frekuenca teorike për secilën qelizë të tabelës nuk duhet të jetë më e vogël se 5: f ≥ 5 . Kjo do të thotë se nëse numri i shifrave është i paracaktuar dhe nuk mund të ndryshohet, atëherë nuk mund të zbatojmë metodën χ 2 , pa grumbulluar një numër minimal të caktuar vëzhgimesh. Nëse, për shembull, duam të testojmë supozimet tona se frekuenca e thirrjeve në shërbimin telefonik Trust shpërndahet në mënyrë të pabarabartë gjatë 7 ditëve të javës, atëherë do të na duhen 5-7 = 35 thirrje. Kështu, nëse numri i shifrave (k) dhënë paraprakisht, si në këtë rast, numri minimal i vëzhgimeve (N min) përcaktohet nga formula: .



3. Kategoritë e përzgjedhura duhet të "përfshijnë" të gjithë shpërndarjen, domethënë të mbulojnë të gjithë gamën e ndryshueshmërisë së karakteristikave. Në këtë rast, grupimi në kategori duhet të jetë i njëjtë në të gjitha shpërndarjet e krahasuara.

4. Është e nevojshme të bëhet një “korrigjim i vazhdimësisë” kur krahasohen shpërndarjet e veçorive që marrin vetëm 2 vlera. Kur bëni një korrigjim, vlera e χ 2 zvogëlohet (shih shembullin me korrigjimin e vazhdimësisë).

5. Kategoritë duhet të jenë të pa mbivendosura: nëse një vëzhgim i caktohet një kategorie, atëherë ai nuk mund të caktohet më në asnjë kategori tjetër. Shuma e vëzhgimeve sipas renditjes duhet të jetë gjithmonë e barabartë me numrin total të vëzhgimeve.

Algoritmi për llogaritjen e kriterit χ 2

1. Krijoni një tabelë të konjugacionit të ndërsjellë të vlerave të veçorive të llojit të mëposhtëm (në thelb, kjo është një seri variacionesh dydimensionale në të cilën tregohen frekuencat e shfaqjes së vlerave të veçorive të përbashkëta) - tabela 19. Tabela përmban frekuencat e kushtëzuara, të cilat do t'i shënojmë në formë të përgjithshme si f ij. Për shembull, numri i gradimeve të një karakteristike Xështë e barabartë me 3 (k=3), numri i gradimeve të karakteristikës barazohet me 4 (m=4); Pastaj i varion nga 1 në k, dhe j varion nga 1 në m.

Tabela 19

x i y j x 1 x 2 x 3
në 1 f 11 f 21 f 31 f –1
në 2 f 12 f 22 f 32 f –2
në 3 f 13 f 23 f 33 f –3
në 4 f 14 f 24 f 34 f –4
f 1- f 2- f 3- N

2. Më pas, për lehtësinë e llogaritjeve, transformojmë tabelën origjinale të kontingjentit të ndërsjellë në një tabelë të formës së mëposhtme (Tabela 20), duke vendosur kolonat me frekuenca të kushtëzuara njëra poshtë tjetrës: Vendosni në tabelë emrat e kategorive. (kolona 1 dhe 2) dhe frekuencat empirike përkatëse (kolona 3).

Tabela 20

x i y j f ij f ij * f ij – f ij * (f ij – f ij *) 2 (f ij – f ij *) 2 / f ij *
1 2 3 4 5 6 7
x 1 në 1 f 11 f 11*
x 1 në 2 f 12 f 12*
x 1 në 3 f 13 f 13*
x 1 në 4 f 14 f 14*
x 2 në 1 f 21 f 21 *
x 2 në 2 f 22 f 22 *
x 2 në 3 f 23 f 23 *
x 2 në 4 f 24 f 24 *
x 3 në 1 f 31 f 31 *
x 3 në 2 f 32 f 32 *
x 3 në 3 f 33 f 33 *
x 3 në 4 f 34 f 34*
∑=………….

3. Pranë secilës frekuencë empirike, shkruani frekuencën teorike (kolona e 4-të), e cila llogaritet duke përdorur formulën e mëposhtme (frekuencat totale në rreshtin përkatës shumëzohen me frekuencën totale në kolonën përkatëse dhe pjesëtohen me numrin total të vëzhgime):

5. Përcaktoni numrin e shkallëve të lirisë duke përdorur formulën: ν=(k-1)(m-1) , Ku k- numri i shifrave të atributeve X, m - numri i shifrave të shenjës .

Nëse ν=1, bëni një korrigjim për “vazhdimësinë” dhe shkruajeni në kolonën 5a.

Korrigjimi i vazhdimësisë konsiston në zbritjen e 0,5 të tjera nga diferenca midis frekuencave të kushtëzuara dhe teorike. Atëherë titujt e kolonave në tabelën tonë do të duken kështu (Tabela 21):

Tabela 21

X f ij f ij * f ij – f ij * f ij – f ij * – 0,5 (f ij – f ij * – 0,5) 2 (f ij – f ij * – 0,5) 2 / f ij *
1 2 3 4 5 5a 6 7

6. Sheshoni dallimet që rezultojnë dhe futini ato në kolonën e 6-të.

7. Ndani dallimet në katror që rezultojnë me frekuencën teorike dhe shkruajini rezultatet në kolonën e 7-të.

8. Mblidhni vlerat e kolonës së 7-të. Shuma që rezulton caktohet si χ 2 em.

9. Rregulli i vendimit:

Vlera e llogaritur e kriterit duhet të krahasohet me vlerën kritike (ose të tabelës). Vlera kritike varet nga numri i shkallëve të lirisë sipas tabelës së vlerave kritike të kriterit Pearson χ 2 (shih Shtojcën 1.6).

Nëse χ 2 kalc ≥ χ 2 tabelë, atëherë mospërputhjet midis shpërndarjeve janë statistikisht të rëndësishme, ose karakteristikat ndryshojnë vazhdimisht, ose marrëdhënia midis karakteristikave është statistikisht e rëndësishme.

Nëse llogaritet χ 2< χ 2 табл, то расхождения между рас­пределениями статистически недостоверны, или признаки изменяются несогласованно, или связи между признаками нет.

23. Koncepti i chi-square dhe shpërndarjes studentore, dhe pamje grafike

1) Një shpërndarje (chi-katror) me n shkallë lirie është shpërndarja e shumës së katrorëve të n variablave standarde të pavarura të rastit.

Shpërndarja (chi-katror)– shpërndarja ndryshore e rastësishme(dhe pritshmëria matematikore e secilit prej tyre është 0, dhe devijimi standard është 1)

ku janë variablat e rastësishëm të pavarura dhe kanë të njëjtën shpërndarje. Në këtë rast, numri i termave, d.m.th., quhet "numri i shkallëve të lirisë" të shpërndarjes chi-square. Numri chi-katror përcaktohet nga një parametër, numri i shkallëve të lirisë. Ndërsa numri i shkallëve të lirisë rritet, shpërndarja ngadalë i afrohet normales.

Pastaj shuma e katrorëve të tyre

është një ndryshore e rastësishme e shpërndarë sipas të ashtuquajturit ligj chi-katror me k = n shkallë lirie; nëse termat lidhen me ndonjë relacion (për shembull, ), atëherë numri i shkallëve të lirisë k = n – 1.

Dendësia e kësaj shpërndarjeje

Këtu - funksioni gama; në veçanti, Г(n + 1) = n! .

Prandaj, shpërndarja e katrorit chi përcaktohet nga një parametër - numri i shkallëve të lirisë k.

Vërejtje 1. Me rritjen e numrit të shkallëve të lirisë, shpërndarja chi-katror gradualisht i afrohet normales.

Vërejtje 2. Duke përdorur shpërndarjen chi-square, përcaktohen shumë shpërndarje të tjera të hasura në praktikë, p.sh., shpërndarja e një ndryshoreje të rastësishme - gjatësia e një vektori të rastit (X1, X2,..., Xn), koordinatat e të cilat janë të pavarura dhe të shpërndara sipas ligjit normal.

Shpërndarja χ2 u konsiderua për herë të parë nga R. Helmert (1876) dhe K. Pearson (1900).

Math.prit.=n; D=2n

2) Shpërndarja e nxënësve

Konsideroni dy variabla të rastësishme të pavarura: Z, i cili ka një shpërndarje normale dhe është i normalizuar (d.m.th., M(Z) = 0, σ(Z) = 1) dhe V, i cili shpërndahet sipas ligjit chi-katror me k. shkallët e lirisë. Pastaj vlera

ka një shpërndarje të quajtur shpërndarje t ose shpërndarje Studenti me k shkallë lirie. Në këtë rast, k quhet "numri i shkallëve të lirisë" të shpërndarjes Student.

Ndërsa numri i shkallëve të lirisë rritet, shpërndarja e Studentëve i afrohet shpejt normales.

Kjo shpërndarje u prezantua në vitin 1908 nga statisticieni anglez W. Gosset, i cili punonte në një fabrikë birre. Për marrjen e vendimeve ekonomike dhe teknike në këtë fabrikë u përdorën metoda probabiliste dhe statistikore, ndaj drejtuesit e saj e ndaluan V. Gosset të botonte artikuj shkencorë me emrin e tij. Në këtë mënyrë mbroheshin sekretet tregtare dhe “know-how” në formën e metodave probabiliste dhe statistikore të zhvilluara nga V. Gosset. Megjithatë, ai pati mundësinë të botonte me pseudonimin “Studenti”. Historia Gosset-Student tregon se edhe njëqind vjet më parë, menaxherët e Mbretërisë së Bashkuar ishin të vetëdijshëm për efikasitetin më të madh ekonomik të metodave të vendimmarrjes probabilistiko-statistikore.

Chi-katror Pearson është testi më i thjeshtë për testimin e rëndësisë së një marrëdhënieje midis dy variablave të kategorizuar. Kriteri Pearson bazohet në faktin se në një tabelë me dy hyrje pritet frekuencat sipas hipotezës "nuk ka varësi midis variablave" mund të llogariten drejtpërdrejt. Imagjinoni që 20 burra dhe 20 gra të pyeten për zgjedhjen e ujit të gazuar (markë A ose markë B). Nëse nuk ka lidhje midis preferencës dhe gjinisë, atëherë natyrisht presin zgjedhje e barabartë e markës A dhe markave B për çdo gjini.

Kuptimi i statistikave chi-katror dhe niveli i rëndësisë së tij varet nga numri i përgjithshëm i vëzhgimeve dhe numri i qelizave në tabelë. Sipas parimeve të diskutuara në seksion , devijimet relativisht të vogla të frekuencave të vëzhguara nga ato të pritura do të jenë të rëndësishme nëse numri i vëzhgimeve është i madh.

Ekziston vetëm një kufizim domethënës në përdorimin e kriterit chi-katror(përveç supozimit të qartë të përzgjedhjes së rastësishme të vëzhgimeve), që është se frekuencat e pritura nuk duhet të jenë shumë të vogla. Kjo për faktin se kriteri chi-katror nga natyra kontrollet probabilitetet në çdo qelizë; dhe nëse frekuencat e pritura në qeliza bëhen të vogla, për shembull më pak se 5, atëherë këto probabilitete nuk mund të vlerësohen me saktësi të mjaftueshme duke përdorur frekuencat e disponueshme. Për diskutim të mëtejshëm, shih Everitt (1977), Hays (1988), ose Kendall dhe Stuart (1979).

Testi Chi-square (metoda e gjasave maksimale).Katrori chi i gjasave maksimale synohet të testojë të njëjtën hipotezë në lidhje me marrëdhëniet në tabelat e kontigjencës si kriter chi-katror Pearson. Megjithatë, llogaritja e tij bazohet në metodën e gjasave maksimale. Në praktikë, statistikat e MP chi-katror shumë afër në madhësi me statistikën e rregullt të Pearson chi-katror. Më shumë informacion rreth këtyre statistikave mund të gjenden në Bishop, Fienberg, and Holland (1975) ose Fienberg (1977). Në kapitull Analiza loglineare këto statistika diskutohen më në detaje.

Amendamenti i Yates. Përafrimi i statistikave chi-katror për tabelat 2x2 me një numër të vogël vëzhgimesh në qeliza mund të përmirësohet duke zvogëluar vlerën absolute të diferencave midis frekuencave të pritura dhe të vëzhguara me 0,5 përpara se të kuadrohet (e ashtuquajtura Amendamenti i Yates). Korrigjimi Yates, i cili e bën vlerësimin më të moderuar, zakonisht zbatohet në rastet kur tabelat përmbajnë vetëm frekuenca të vogla, për shembull, kur disa frekuenca të pritshme bëhen më pak se 10 (për diskutim të mëtejshëm, shih Conover, 1974; Everitt, 1977; Hays , 1988; Kendall dhe Stuart, 1979 dhe Mantel, 1974).

Testi i saktë i Fisher. Ky kriter është i zbatueshëm vetëm për tabelat 2x2. Kriteri bazohet në arsyetimin e mëposhtëm. Duke pasur parasysh frekuencat margjinale në tabelë, supozoni se të dy variablat e tabelës janë të pavarura. Le t'i bëjmë vetes pyetjen: sa është probabiliteti i marrjes së frekuencave të vëzhguara në tabelë, bazuar në ato margjinale të dhëna? Rezulton se kjo probabilitet është llogaritur pikërisht duke numëruar të gjitha tabelat që mund të ndërtohen në bazë të atyre margjinale. Kështu, kriteri i Fisher-it llogarit të sakta probabiliteti i shfaqjes së frekuencave të vëzhguara sipas hipotezës zero (nuk ka lidhje midis variablave të tabelës). Tabela e rezultateve tregon nivelet e njëanshme dhe të dyanshme.

McNemar chi-square. Ky kriter zbatohet kur përfaqësojnë frekuencat në tabelën 2x2 i varur mostrat. Për shembull, vëzhgimet e të njëjtëve individë para dhe pas një eksperimenti. Në veçanti, mund të numëroni numrin e studentëve që kanë arritje minimale në matematikë në fillim dhe në fund të semestrit, ose preferencat e të njëjtëve të anketuar para dhe pas shpalljes. Janë llogaritur dy vlera chi-katror: A/D Dhe B/C. A/D chi-square teston hipotezën se frekuencat në qeliza A Dhe D(lart majtas, poshtë djathtas) janë të njëjta. B/C chi-square teston hipotezën për barazinë e frekuencave në qeliza B Dhe C(sipër djathtas, poshtë majtas).

Koeficienti Phi.Sheshi Phi përfaqëson një masë të marrëdhënies midis dy variablave në një tabelë 2x2. Vlerat e tij variojnë nga 0 (nuk ka varësi midis variablave; chi-katror = 0.0 ) më parë 1 (lidhja absolute midis dy faktorëve në tabelë). Për detaje, shih Castellan dhe Siegel (1988, f. 232).

Korrelacioni tetrakorik. Kjo statistikë llogaritet (dhe zbatohet) vetëm për tabelat e kryqëzimit 2x2. Nëse një tabelë 2x2 mund të shihet si rezultat i një ndarjeje (artificiale) të vlerave të dy ndryshoreve të vazhdueshme në dy klasa, atëherë koeficienti i korrelacionit tetrakorik na lejon të vlerësojmë marrëdhënien midis këtyre dy variablave.

Koeficienti i konjugimit. Koeficienti i kontigjencës është i bazuar statistikisht chi-katror një masë e marrëdhënies së veçorive në tabelën e kontigjencës (propozuar nga Pearson). Avantazhi i këtij koeficienti ndaj statistikave konvencionale chi-katrorështë se është më e lehtë të interpretohet, sepse diapazoni i ndryshimit të tij është në intervalin nga 0 përpara 1 (ku 0 korrespondon me rastin e pavarësisë së karakteristikave në tabelë, dhe rritja e koeficientit tregon një rritje të shkallës së lidhjes). Disavantazhi i koeficientit të kontingjentit është se vlera maksimale e tij "varet" nga madhësia e tabelës. Ky koeficient mund të arrijë vlerën 1 vetëm nëse numri i klasave nuk është i kufizuar (shih Siegel, 1956, f. 201).

Interpretimi i masave të komunikimit. Një pengesë e rëndësishme e masave të lidhjes (diskutuar më sipër) është vështirësia e interpretimit të tyre në terma konvencionale të probabilitetit ose "proporcioni i variancës i shpjeguar", si në rastin e koeficientit të korrelacionit. r Pearson (shih Korrelacionet). Prandaj, nuk ka asnjë masë të pranuar përgjithësisht ose koeficient asociimi.

Statistikat në bazë të gradave. Në shumë probleme që dalin në praktikë, ne kemi matje vetëm në rendore shkallë (shih Konceptet bazë të statistikës). Kjo veçanërisht vlen për matjet në fushën e psikologjisë, sociologjisë dhe disiplinave të tjera që lidhen me studimin e njeriut. Supozoni se keni intervistuar një numër të anketuarish për të zbuluar qëndrimin e tyre ndaj sporteve të caktuara. Ju përfaqësoni matjet në një shkallë me pozicionet e mëposhtme: (1) Gjithmonë, (2) zakonisht, (3) Ndonjehere dhe (4) kurrë. Natyrisht përgjigja ndonjëherë pyes veten tregon më pak interes të të anketuarit sesa përgjigja Zakonisht jam i interesuar etj. Kështu, është e mundur të renditësh (rendit) shkallën e interesit të të anketuarve. Ky është një shembull tipik i një shkalle rendore. Variablat e matur në një shkallë rendore kanë llojet e tyre të korrelacioneve që e lejojnë njeriun të vlerësojë varësitë.

R Spearman. Statistikat R Spearman mund të interpretohet në të njëjtën mënyrë si korrelacioni Pearson ( r Pearson) për sa i përket proporcionit të shpjeguar të variancës (duke pasur parasysh, megjithatë, se statistika e Spearman llogaritet sipas renditjes). Supozohet se variablat maten të paktën në rendore shkallë. Diskutime gjithëpërfshirëse të korrelacionit të gradave të Spearman, fuqisë dhe efektivitetit të tij mund të gjenden, për shembull, në Gibbons (1985), Hays (1981), McNemar (1969), Siegel (1956), Siegel dhe Castellan (1988), Kendall (1948) , Olds (1949) dhe Hotelling dhe Pabst (1936).

Tau Kendall. Statistikat tau Ekuivalenti i Kendall-it R Spearman sipas disa supozimeve themelore. Fuqitë e tyre janë gjithashtu ekuivalente. Megjithatë, zakonisht vlerat R Spearman dhe tau Kendall's janë të ndryshëm sepse ndryshojnë si në logjikën e brendshme ashtu edhe në mënyrën e llogaritjes. Në Siegel dhe Castellan (1988), autorët shprehën lidhjen midis këtyre dy statistikave si më poshtë:

1 < = 3 * Тау Кендалла - 2 * R Спирмена < = 1

Më e rëndësishmja, statistikat e Kendall tau dhe Spearman R kanë interpretime të ndryshme: ndërsa statistikat R Spearman mund të konsiderohet si një analog i drejtpërdrejtë i statistikave r Pearson, e llogaritur sipas gradave, statistikat e Kendall tau më tepër bazuar në probabilitetet. Më saktësisht, teston se ka një ndryshim midis probabilitetit që të dhënat e vëzhguara të jenë në të njëjtin rend për dy sasi dhe probabilitetit që ato të jenë në një rend të ndryshëm. Kendall (1948, 1975), Everitt (1977) dhe Siegel dhe Castellan (1988) diskutojnë me shumë detaje tau Kendall. Zakonisht llogariten dy statistika tau Kendall: tau b Dhe tau c. Këto masa ndryshojnë vetëm në mënyrën se si trajtojnë renditjet e përputhshme. Në shumicën e rasteve kuptimet e tyre janë mjaft të ngjashme. Nëse lindin dallime, atëherë duket se mënyra më e sigurt është të merret parasysh më e vogla nga dy vlerat.

Koeficienti d i Sommer-it: d(X|Y), d(Y|X). Statistikat d Masa e Sommer-it është një masë jo-simetrike e marrëdhënies midis dy variablave. Kjo statistikë është afër tau b(shih Siegel dhe Castellan, 1988, f. 303-310).

Statistikat e gamës. Nëse ka shumë vlera që përputhen në të dhëna, statistika gama e preferueshme R Spearman ose tau Kendall. Për sa i përket supozimeve bazë, statistikave gama ekuivalente me statistikat R Spearman ose tau i Kendall-it. Interpretimi dhe llogaritjet e tij janë më të ngjashme me statistikat e Kendall's Tau sesa me statistikat R të Spearman. Për ta thënë shkurt, gama gjithashtu përfaqëson probabiliteti; më saktë, diferenca midis probabilitetit që renditja e renditjes së dy variablave përputhet, minus probabilitetin që nuk përputhet, pjesëtuar me një minus probabilitetin e ndeshjeve. Pra statistikat gama në thelb ekuivalente tau Kendall, përveç që ndeshjet janë marrë në konsideratë shprehimisht në normalizim. Diskutim i detajuar i statistikave gama mund të gjenden në Goodman dhe Kruskal (1954, 1959, 1963, 1972), Siegel (1956) dhe Siegel dhe Castellan (1988).

Koeficientët e pasigurisë. Këta koeficientë matin komunikimi i informacionit ndërmjet faktorëve (rreshtave dhe kolonave të tabelës). Koncepti varësia nga informacioni e ka origjinën në qasjen teoriko-informative për analizën e tabelave të frekuencave, mund t'u referohemi manualeve përkatës për sqarimin e kësaj çështjeje (shih Kullback, 1959; Ku dhe Kullback, 1968; Ku, Varner, dhe Kullback, 1971; shih gjithashtu Bishop , Fienberg dhe Holland, 1975, fq. 344-348). Statistikat S(Y, X) është simetrik dhe mat sasinë e informacionit në një variabël Y në lidhje me variablin X ose në një ndryshore X në lidhje me variablin Y. Statistikat S(X|Y) Dhe S(Y|X) shprehin varësinë e drejtimit.

Përgjigjet shumëdimensionale dhe dikotomitë. Variabla të tilla si përgjigja me shumë variacione dhe dikotomitë me shumë variacione lindin në situata kur studiuesi është i interesuar jo vetëm për frekuencat "e thjeshta" të ngjarjeve, por edhe për disa veti cilësore (shpesh të pastrukturuara) të këtyre ngjarjeve. Natyra e variablave (faktorëve) shumëdimensionale kuptohet më së miri përmes shembujve.

  • · Përgjigjet shumëdimensionale
  • · Dikotomitë shumëdimensionale
  • · Kryqëzimi i përgjigjeve dhe dikotomive me shumë variacione
  • Tabelimi i dyfishtë i variablave me përgjigje shumëvariate
  • · Komenti përfundimtar

Përgjigjet shumëdimensionale. Imagjinoni që në procesin e një kërkimi të madh marketingu, ju i keni kërkuar klientëve të përmendin 3 pijet joalkoolike më të mira nga këndvështrimi i tyre. Një pyetje tipike mund të duket kështu.

Konsideroni aplikacionin nëZNJEXCELTesti chi-square Pearson për testimin e hipotezave të thjeshta.

Pas marrjes së të dhënave eksperimentale (d.m.th. kur ka disa mostër) zakonisht bëhet zgjedhja e ligjit të shpërndarjes që përshkruan më së miri variablin e rastësishëm të përfaqësuar nga një e dhënë marrjen e mostrave. Kontrollimi se sa mirë janë përshkruar të dhënat eksperimentale nga ligji i përzgjedhur i shpërndarjes teorike kryhet duke përdorur kriteret e marrëveshjes. Asnje hipoteze, zakonisht ekziston një hipotezë për barazinë e shpërndarjes së një ndryshoreje të rastësishme në disa ligje teorike.

Le të shohim së pari aplikacionin Testi i përshtatshmërisë së Pearson X 2 (chi-katror) në lidhje me hipotezat e thjeshta (parametrat e shpërndarjes teorike konsiderohen të njohura). Pastaj - , kur specifikohet vetëm forma e shpërndarjes, dhe parametrat e kësaj shpërndarjeje dhe vlera statistikat X 2 vlerësohen/llogariten në bazë të të njëjtës mostrat.

shënim: Në literaturën në gjuhën angleze, procedura e aplikimit Testi i përshtatshmërisë së Pearson X 2 ka një emër Testi i mirësisë së chi-katrorit të përshtatjes.

Le të kujtojmë procedurën për testimin e hipotezave:

  • bazuar mostrat llogaritet vlera statistikat, që korrespondon me llojin e hipotezës që testohet. Për shembull, për të përdorur t-statistikat(nëse nuk dihet);
  • subjekt i së vërtetës asnje hipoteze, shpërndarja e kësaj statistikatështë i njohur dhe mund të përdoret për të llogaritur probabilitetet (për shembull, për t-statistikat Kjo);
  • llogaritur në bazë të mostrat kuptimi statistikat krahasuar me vlerën kritike për një vlerë të caktuar ();
  • asnje hipoteze refuzo nëse vlera statistikat më e madhe se kritike (ose nëse probabiliteti për të marrë këtë vlerë statistikat() më pak niveli i rëndësisë, e cila është një qasje ekuivalente).

Le të kryejmë testimi i hipotezave për shpërndarje të ndryshme.

Rast diskrete

Supozoni se dy njerëz janë duke luajtur zare. Secili lojtar ka grupin e tij të zareve. Lojtarët hedhin me radhë 3 zare në të njëjtën kohë. Çdo raund fitohet nga ai që hedh më shumë gjashtëshe në të njëjtën kohë. Rezultatet regjistrohen. Pas 100 raundeve, njëri nga lojtarët dyshoi se zari i kundërshtarit të tij ishte asimetrik, sepse ai shpesh fiton (ai shpesh hedh gjashtëshe). Ai vendosi të analizojë se sa i mundshëm ishte një numër i tillë i rezultateve të armikut.

shënim: Sepse Ka 3 kube, atëherë mund të rrotulloni 0 në të njëjtën kohë; 1; 2 ose 3 gjashtëshe, d.m.th. një ndryshore e rastësishme mund të marrë 4 vlera.

Nga teoria e probabilitetit ne e dimë se nëse zari është simetrik, atëherë probabiliteti për të marrë gjashtëshe bindet. Prandaj, pas 100 raundesh, frekuencat e gjashtëshe mund të llogariten duke përdorur formulën
=BINOM.DIST(A7,3,1/6,FALSE)*100

Formula supozon se në qelizë A7 përmban numrin përkatës të gjashtëshe të mbështjellë në një raund.

shënim: Llogaritjet janë dhënë në skedar shembull në fletën diskrete.

Per krahasim vëzhguar(Vëzhguar) dhe frekuencat teorike(Pritet) i përshtatshëm për t'u përdorur.

Nëse frekuencat e vëzhguara devijojnë ndjeshëm nga shpërndarja teorike, asnje hipoteze në lidhje me shpërndarjen e një ndryshoreje të rastësishme sipas një ligji teorik duhet të refuzohet. Kjo do të thotë, nëse zari i kundërshtarit është asimetrik, atëherë frekuencat e vëzhguara do të jenë "dukshëm të ndryshme" nga shpërndarja binomiale.

Në rastin tonë, në shikim të parë, frekuencat janë mjaft të afërta dhe pa llogaritje është e vështirë të nxirret një përfundim i paqartë. E aplikueshme Testi i përshtatshmërisë së Pearson X 2, kështu që në vend të pohimit subjektiv “thelbësisht i ndryshëm”, i cili mund të bëhet në bazë të krahasimit histogramet, përdorni një pohim të saktë matematikisht.

Ne përdorim faktin se për shkak të ligji i numrave të mëdhenj frekuenca e vëzhguar (Vëzhguar) me rritjen e vëllimit mostrat n tenton në probabilitetin që korrespondon me ligjin teorik (në rastin tonë, ligji binom). Në rastin tonë, madhësia e mostrës n është 100.

Le të prezantojmë provë statistikat, të cilin e shënojmë me X 2:

ku O l është frekuenca e vëzhguar e ngjarjeve që ndryshorja e rastësishme ka marrë vlera të caktuara të pranueshme, E l është frekuenca teorike përkatëse (E pritshme). L është numri i vlerave që mund të marrë një ndryshore e rastësishme (në rastin tonë është 4).

Siç shihet nga formula, kjo statistikatështë një masë e afërsisë së frekuencave të vëzhguara me ato teorike, d.m.th. mund të përdoret për të vlerësuar “distancat” ndërmjet këtyre frekuencave. Nëse shuma e këtyre "distancave" është "shumë e madhe", atëherë këto frekuenca janë "dukshëm të ndryshme". Është e qartë se nëse kubi ynë është simetrik (d.m.th. i zbatueshëm ligji binom), atëherë probabiliteti që shuma e "distancave" të jetë "shumë e madhe" do të jetë e vogël. Për të llogaritur këtë probabilitet duhet të dimë shpërndarjen statistikat X 2 ( statistikat X 2 llogaritur në bazë të rastësishme mostrat, prandaj është një ndryshore e rastësishme dhe, për rrjedhojë, ka të sajën shpërndarja e probabilitetit).

Nga analogu shumëdimensional Teorema integrale Moivre-Laplace dihet se për n->∞ ndryshorja jonë e rastësishme X 2 është asimptotike me L - 1 shkallë lirie.

Pra, nëse vlera e llogaritur statistikat X 2 (shuma e "distancave" midis frekuencave) do të jetë më e madhe se një vlerë e caktuar kufizuese, atëherë do të kemi arsye për të refuzuar asnje hipoteze. Njësoj si kontrolli hipoteza parametrike, vlera kufi vendoset nëpërmjet niveli i rëndësisë. Nëse probabiliteti që statistika X 2 do të marrë një vlerë më të vogël ose të barabartë me atë të llogaritur ( fq- kuptimi), do të jetë më pak niveli i rëndësisë, Kjo asnje hipoteze mund të refuzohet.

Në rastin tonë, vlera statistikore është 22.757. Probabiliteti që statistika X2 të marrë një vlerë më të madhe ose të barabartë me 22.757 është shumë e vogël (0.000045) dhe mund të llogaritet duke përdorur formulat
=CHI2.DIST.PH(22.757,4-1) ose
=CHI2.TEST (I vëzhguar; i pritshëm)

shënim: Funksioni CHI2.TEST() është krijuar posaçërisht për të testuar marrëdhëniet midis dy variablave kategorike (shih).

Probabiliteti 0.000045 është dukshëm më i vogël se zakonisht niveli i rëndësisë 0.05. Pra, lojtari ka çdo arsye për të dyshuar kundërshtarin e tij për pandershmëri ( asnje hipoteze i mohohet ndershmëria).

Kur përdorni kriteri X 2është e nevojshme të sigurohet që vëllimi mostrat n ishte mjaft i madh, përndryshe përafrimi i shpërndarjes nuk do të ishte i vlefshëm statistikat X 2. Zakonisht konsiderohet se për këtë mjafton që frekuencat e vëzhguara të jenë më të mëdha se 5. Nëse nuk është kështu, atëherë frekuencat e vogla kombinohen në një ose shtohen në frekuenca të tjera dhe caktohet vlera e kombinuar. probabiliteti total dhe, në përputhje me rrethanat, numri i shkallëve të lirisë zvogëlohet X 2 shpërndarje.

Për të përmirësuar cilësinë e aplikimit kriteri X 2(), është e nevojshme të zvogëlohen intervalet e ndarjes (rritja e L dhe, në përputhje me rrethanat, rritja e numrit shkallët e lirisë), megjithatë, kjo parandalohet nga kufizimi i numrit të vëzhgimeve të përfshira në çdo interval (db>5).

Rasti i vazhdueshëm

Testi i përshtatshmërisë së Pearson X 2 mund të aplikohet edhe në rast të .

Le të konsiderojmë një të caktuar mostër, i përbërë nga 200 vlera. Asnje hipoteze Shtetet që mostër bërë nga .

shënim: Variabla të rastësishme në shembull skedari në fletën Continuous gjeneruar duke përdorur formulën =NORM.ST.INV(RAND()). Prandaj, vlera të reja mostrat gjenerohen sa herë që fleta rillogaritet.

Nëse grupi ekzistues i të dhënave është i përshtatshëm mund të vlerësohet vizualisht.

Siç mund të shihet nga diagrami, vlerat e mostrës përshtaten mjaft mirë përgjatë vijës së drejtë. Megjithatë, si në për testimi i hipotezave të zbatueshme Testi i përshtatshmërisë së Pearson X 2.

Për ta bërë këtë, ne e ndajmë gamën e ndryshimit të ndryshores së rastësishme në intervale me një hap prej 0.5. Le të llogarisim të vëzhguarit dhe frekuencat teorike. Frekuencat e vëzhguara i llogarisim duke përdorur funksionin FREQUENCY() dhe ato teorike duke përdorur funksionin NORM.ST.DIST().

shënim: Njësoj si për rast diskrete, është e nevojshme të sigurohet që mostër ishte mjaft i madh dhe intervali përfshinte >5 vlera.

Le të llogarisim statistikën X2 dhe ta krahasojmë atë me vlerën kritike për një të dhënë niveli i rëndësisë(0.05). Sepse ne e ndajmë diapazonin e ndryshimit të një ndryshoreje të rastësishme në 10 intervale, atëherë numri i shkallëve të lirisë është 9. Vlera kritike mund të llogaritet duke përdorur formulën
=CHI2.OBR.PH(0.05;9) ose
=CHI2.OBR(1-0,05;9)

Grafiku i mësipërm tregon se vlera statistikore është 8.19, që është dukshëm më e lartë vlerë kritike asnje hipoteze nuk refuzohet.

Më poshtë është se ku mostër mori një rëndësi të pamundur dhe bazuar në kriteret Pëlqimi i Pearson X 2 hipoteza zero u hodh poshtë (edhe pse vlerat e rastësishme janë krijuar duke përdorur formulën =NORM.ST.INV(RAND()), duke siguruar mostër nga shpërndarje normale standarde).

Asnje hipoteze refuzohet, edhe pse vizualisht të dhënat janë të vendosura mjaft afër vijës së drejtë.

Le të marrim edhe si shembull mostër nga U(-3; 3). Në këtë rast edhe nga grafiku duket qartë se asnje hipoteze duhet të refuzohet.

Kriteri Pëlqimi i Pearson X 2 po ashtu e konfirmon atë asnje hipoteze duhet të refuzohet.



Ju pëlqeu artikulli? Ndani me miqtë tuaj!