Vlera e funksionit të shpërndarjes chi katror. MS EXCEL funksionon duke përdorur shpërndarjen CH2

Chi-katror Pearson është testi më i thjeshtë për testimin e rëndësisë së një marrëdhënieje midis dy variablave të kategorizuar. Kriteri Pearson bazohet në faktin se në një tabelë me dy hyrje pritet frekuencat sipas hipotezës "nuk ka varësi midis variablave" mund të llogariten drejtpërdrejt. Imagjinoni që 20 burra dhe 20 gra të pyeten për zgjedhjen e ujit të gazuar (markë A ose markë B). Nëse nuk ka lidhje midis preferencës dhe gjinisë, atëherë natyrisht presin zgjedhje e barabartë e markës A dhe markave B për çdo gjini.

Kuptimi i statistikave chi-katror dhe niveli i rëndësisë së tij varet nga numri i përgjithshëm i vëzhgimeve dhe numri i qelizave në tabelë. Sipas parimeve të diskutuara në seksion , devijimet relativisht të vogla të frekuencave të vëzhguara nga ato të pritura do të jenë të rëndësishme nëse numri i vëzhgimeve është i madh.

Ekziston vetëm një kufizim domethënës në përdorimin e kriterit chi-katror(përveç supozimit të qartë të përzgjedhjes së rastësishme të vëzhgimeve), që është se frekuencat e pritura nuk duhet të jenë shumë të vogla. Kjo për faktin se kriteri chi-katror nga natyra kontrollet probabilitetet në çdo qelizë; dhe nëse frekuencat e pritura në qeliza bëhen të vogla, për shembull më pak se 5, atëherë këto probabilitete nuk mund të vlerësohen me saktësi të mjaftueshme duke përdorur frekuencat e disponueshme. Për diskutim të mëtejshëm, shih Everitt (1977), Hays (1988), ose Kendall dhe Stuart (1979).

Testi Chi-square (metoda e gjasave maksimale).Katrori chi i gjasave maksimale synohet të testojë të njëjtën hipotezë në lidhje me marrëdhëniet në tabelat e kontigjencës si kriter chi-katror Pearson. Megjithatë, llogaritja e tij bazohet në metodën e gjasave maksimale. Në praktikë, statistikat e MP chi-katror shumë afër në madhësi me statistikën e rregullt të Pearson chi-katror. Më shumë informacion rreth këtyre statistikave mund të gjenden në Bishop, Fienberg, and Holland (1975) ose Fienberg (1977). Në kapitull Analiza loglineare këto statistika diskutohen më në detaje.

Amendamenti i Yates. Përafrimi i statistikave chi-katror për tabelat 2x2 me një numër të vogël vëzhgimesh në qeliza mund të përmirësohet duke zvogëluar vlerën absolute të diferencave midis frekuencave të pritura dhe të vëzhguara me 0,5 përpara se të kuadrohet (e ashtuquajtura Amendamenti i Yates). Korrigjimi Yates, i cili e bën vlerësimin më të moderuar, zakonisht zbatohet në rastet kur tabelat përmbajnë vetëm frekuenca të vogla, për shembull, kur disa frekuenca të pritshme bëhen më pak se 10 (për diskutim të mëtejshëm, shih Conover, 1974; Everitt, 1977; Hays , 1988; Kendall dhe Stuart, 1979 dhe Mantel, 1974).

Testi i saktë i Fisher. Ky kriter është i zbatueshëm vetëm për tabelat 2x2. Kriteri bazohet në arsyetimin e mëposhtëm. Duke pasur parasysh frekuencat margjinale në tabelë, supozoni se të dy variablat e tabelës janë të pavarura. Le t'i bëjmë vetes pyetjen: sa është probabiliteti i marrjes së frekuencave të vëzhguara në tabelë, bazuar në ato margjinale të dhëna? Rezulton se kjo probabilitet është llogaritur pikërisht duke numëruar të gjitha tabelat që mund të ndërtohen në bazë të atyre margjinale. Kështu, kriteri i Fisher-it llogarit të sakta probabiliteti i shfaqjes së frekuencave të vëzhguara sipas hipotezës zero (nuk ka lidhje midis variablave të tabelës). Tabela e rezultateve tregon nivelet e njëanshme dhe të dyanshme.

chi-square McNemar. Ky kriter zbatohet kur përfaqësojnë frekuencat në tabelën 2x2 i varur mostrat. Për shembull, vëzhgimet e të njëjtëve individë para dhe pas një eksperimenti. Në veçanti, mund të numëroni numrin e studentëve që kanë arritje minimale në matematikë në fillim dhe në fund të semestrit ose preferencën e të njëjtit të anketuar para dhe pas shpalljes. Janë llogaritur dy vlera chi-katror: A/D Dhe B/C. A/D chi-square teston hipotezën se frekuencat në qeliza A Dhe D(lart majtas, poshtë djathtas) janë të njëjta. B/C chi-square teston hipotezën për barazinë e frekuencave në qeliza B Dhe C(sipër djathtas, poshtë majtas).

Koeficienti Phi.Sheshi Phi përfaqëson një masë të marrëdhënies midis dy variablave në një tabelë 2x2. Vlerat e tij variojnë nga 0 (nuk ka varësi midis variablave; chi-katror = 0.0 ) më parë 1 (lidhja absolute midis dy faktorëve në tabelë). Për detaje, shih Castellan dhe Siegel (1988, f. 232).

Korrelacioni tetrakorik. Kjo statistikë llogaritet (dhe zbatohet) vetëm për tabelat e kryqëzimit 2x2. Nëse një tabelë 2x2 mund të shihet si rezultat i një ndarjeje (artificiale) të vlerave të dy ndryshoreve të vazhdueshme në dy klasa, atëherë koeficienti i korrelacionit tetrakorik na lejon të vlerësojmë marrëdhënien midis këtyre dy variablave.

Koeficienti i konjugimit. Koeficienti i kontigjencës është i bazuar statistikisht chi-katror një masë e marrëdhënies së veçorive në tabelën e kontigjencës (propozuar nga Pearson). Avantazhi i këtij koeficienti ndaj statistikave konvencionale chi-katrorështë se është më e lehtë të interpretohet, sepse diapazoni i ndryshimit të tij është në intervalin nga 0 përpara 1 (ku 0 korrespondon me rastin e pavarësisë së karakteristikave në tabelë, dhe rritja e koeficientit tregon një rritje të shkallës së lidhjes). Disavantazhi i koeficientit të kontingjentit është se vlera maksimale e tij "varet" nga madhësia e tabelës. Ky koeficient mund të arrijë vlerën 1 vetëm nëse numri i klasave nuk është i kufizuar (shih Siegel, 1956, f. 201).

Interpretimi i masave të komunikimit. Një pengesë e rëndësishme e masave të lidhjes (diskutuar më sipër) është vështirësia e interpretimit të tyre në terma konvencionale të probabilitetit ose "proporcioni i variancës i shpjeguar", si në rastin e koeficientit të korrelacionit. r Pearson (shih Korrelacionet). Prandaj, nuk ka asnjë masë të pranuar përgjithësisht ose koeficient asociimi.

Statistikat në bazë të gradave. Në shumë probleme që dalin në praktikë, ne kemi matje vetëm në rendore shkallë (shih Konceptet bazë të statistikës). Kjo veçanërisht vlen për matjet në fushën e psikologjisë, sociologjisë dhe disiplinave të tjera që lidhen me studimin e njeriut. Supozoni se keni intervistuar një numër të anketuarish për të zbuluar qëndrimin e tyre ndaj sporteve të caktuara. Ju përfaqësoni matjet në një shkallë me pozicionet e mëposhtme: (1) Gjithmonë, (2) zakonisht, (3) Ndonjehere dhe (4) kurrë. Natyrisht përgjigja ndonjëherë pyes veten tregon më pak interes të të anketuarit sesa përgjigja Zakonisht jam i interesuar etj. Kështu, është e mundur të renditësh (rendit) shkallën e interesit të të anketuarve. Ky është një shembull tipik i një shkalle rendore. Variablat e matur në një shkallë rendore kanë llojet e tyre të korrelacioneve që e lejojnë njeriun të vlerësojë varësitë.

R Spearman. Statistikat R Spearman mund të interpretohet në të njëjtën mënyrë si korrelacioni Pearson ( r Pearson) për sa i përket proporcionit të shpjeguar të variancës (duke pasur parasysh, megjithatë, se statistika e Spearman llogaritet sipas renditjes). Supozohet se variablat maten të paktën në rendore shkallë. Një diskutim gjithëpërfshirës i korrelacionit të gradës së Spearman, fuqisë dhe efektivitetit të tij mund të gjendet, për shembull, në Gibbons (1985), Hays (1981), McNemar (1969), Siegel (1956), Siegel and Castellan (1988), Kendall (1948). ), Olds (1949) dhe Hotelling dhe Pabst (1936).

Tau Kendall. Statistikat tau Ekuivalenti i Kendall-it R Spearman sipas disa supozimeve themelore. Fuqitë e tyre janë gjithashtu ekuivalente. Megjithatë, zakonisht vlerat R Spearman dhe tau Kendall's janë të ndryshëm sepse ndryshojnë si në logjikën e brendshme ashtu edhe në mënyrën e llogaritjes. Në Siegel dhe Castellan (1988), autorët shprehën lidhjen midis këtyre dy statistikave si më poshtë:

1 < = 3 * Тау Кендалла - 2 * R Спирмена < = 1

Më e rëndësishmja, statistikat e Kendall tau dhe Spearman R kanë interpretime të ndryshme: ndërsa statistikat R Spearman mund të konsiderohet si një analog i drejtpërdrejtë i statistikave r Pearson, e llogaritur sipas gradave, statistikat e Kendall tau më tepër bazuar në probabilitetet. Më saktësisht, teston se ka një ndryshim midis probabilitetit që të dhënat e vëzhguara të jenë në të njëjtin rend për dy sasi dhe probabilitetit që ato të jenë në një rend të ndryshëm. Kendall (1948, 1975), Everitt (1977) dhe Siegel dhe Castellan (1988) diskutojnë me shumë detaje tau Kendall. Zakonisht llogariten dy statistika tau Kendall: tau b Dhe tau c. Këto masa ndryshojnë vetëm në mënyrën se si trajtojnë renditjet e përputhshme. Në shumicën e rasteve kuptimet e tyre janë mjaft të ngjashme. Nëse lindin dallime, atëherë duket se mënyra më e sigurt është të merret parasysh më e vogla nga dy vlerat.

Koeficienti d i Sommer-it: d(X|Y), d(Y|X). Statistikat d Masa e Sommer-it është një masë jo-simetrike e marrëdhënies midis dy variablave. Kjo statistikë është afër tau b(shih Siegel dhe Castellan, 1988, f. 303-310).

Statistikat e gamës. Nëse ka shumë vlera që përputhen në të dhëna, statistika gama e preferueshme R Spearman ose tau Kendall. Për sa i përket supozimeve bazë, statistikave gama ekuivalente me statistikat R Spearman ose tau i Kendall-it. Interpretimi dhe llogaritjet e tij janë më të ngjashme me statistikat e Kendall's Tau sesa me statistikat R të Spearman. Për ta thënë shkurt, gama gjithashtu përfaqëson probabiliteti; më saktë, diferenca midis probabilitetit që renditja e renditjes së dy variablave përputhet, minus probabilitetin që nuk përputhet, pjesëtuar me një minus probabilitetin e ndeshjeve. Pra statistikat gama në thelb ekuivalente tau Kendall, përveç që ndeshjet janë marrë në konsideratë shprehimisht në normalizim. Diskutim i detajuar i statistikave gama mund të gjenden në Goodman dhe Kruskal (1954, 1959, 1963, 1972), Siegel (1956) dhe Siegel dhe Castellan (1988).

Koeficientët e pasigurisë. Këta koeficientë matin komunikimi i informacionit ndërmjet faktorëve (rreshtave dhe kolonave të tabelës). Koncepti varësia nga informacioni e ka origjinën në qasjen teoriko-informative për analizën e tabelave të frekuencave, mund të konsultohen manualet përkatëse për sqarimin e kësaj çështjeje (shih Kullback, 1959; Ku dhe Kullback, 1968; Ku, Varner, dhe Kullback, 1971; shih gjithashtu Bishop, Fienberg , dhe Holland, 1975, fq. 344-348). Statistikat S(Y, X) është simetrik dhe mat sasinë e informacionit në një variabël Y në lidhje me variablin X ose në një ndryshore X në lidhje me variablin Y. Statistikat S(X|Y) Dhe S(Y|X) shprehin varësinë e drejtimit.

Përgjigjet shumëdimensionale dhe dikotomitë. Variabla të tilla si përgjigja me shumë variacione dhe dikotomitë me shumë variacione lindin në situata kur studiuesi është i interesuar jo vetëm për frekuencat "e thjeshta" të ngjarjeve, por edhe për disa veti cilësore (shpesh të pastrukturuara) të këtyre ngjarjeve. Natyra e variablave (faktorëve) shumëdimensionale kuptohet më së miri përmes shembujve.

  • · Përgjigjet shumëdimensionale
  • · Dikotomitë shumëdimensionale
  • · Kryqëzimi i përgjigjeve dhe dikotomive me shumë variacione
  • Tabelimi i dyfishtë i variablave me përgjigje shumëvariate
  • · Komenti përfundimtar

Përgjigjet shumëdimensionale. Imagjinoni që në procesin e një kërkimi të madh marketingu, ju i keni kërkuar klientëve të përmendin 3 pijet joalkoolike më të mira nga këndvështrimi i tyre. Një pyetje tipike mund të duket kështu.

). Formulimi specifik i hipotezës që testohet do të ndryshojë nga rasti në rast.

Në këtë postim do të përshkruaj se si funksionon kriteri \(\chi^2\) duke përdorur një shembull (hipotetik) nga imunologjia. Le të imagjinojmë se kemi kryer një eksperiment për të përcaktuar efektivitetin e shtypjes së zhvillimit të një sëmundjeje mikrobike kur antitrupat e duhur futen në trup. Gjithsej 111 minj u përfshinë në eksperiment, të cilët i ndamë në dy grupe, duke përfshirë përkatësisht 57 dhe 54 kafshë. Grupi i parë i minjve mori injeksione të baktereve patogjene, të ndjekur nga futja e serumit të gjakut që përmban antitrupa kundër këtyre baktereve. Kafshët nga grupi i dytë shërbyen si kontrolle - ata morën vetëm injeksione bakteriale. Pas disa kohësh inkubimi, rezultoi se 38 minj ngordhën dhe 73 mbijetuan. Nga të vdekurit, 13 i përkisnin grupit të parë, dhe 25 të dytit (kontrolli). Hipoteza zero e testuar në këtë eksperiment mund të formulohet si më poshtë: administrimi i serumit me antitrupa nuk ka asnjë efekt në mbijetesën e minjve. Me fjalë të tjera, ne argumentojmë se ndryshimet e vërejtura në mbijetesën e miut (77.2% në grupin e parë kundrejt 53.7% në grupin e dytë) janë krejtësisht të rastësishme dhe nuk lidhen me efektin e antitrupave.

Të dhënat e marra në eksperiment mund të paraqiten në formën e një tabele:

Total

Bakteret + serum

Vetëm bakteret

Total

Tabelat si kjo e paraqitur quhen tabela të paparashikuara. Në shembullin në shqyrtim, tabela ka një dimension 2x2: ekzistojnë dy klasa objektesh (“Bakteret + serum” dhe “Vetëm bakteret”), të cilat shqyrtohen sipas dy kritereve (“Të vdekur” dhe “Të mbijetuar”). Ky është rasti më i thjeshtë i një tabele të paparashikuar: sigurisht, si numri i klasave që studiohen ashtu edhe numri i veçorive mund të jenë më të mëdha.

Për të testuar hipotezën zero të përmendur më sipër, duhet të dimë se cila do të ishte situata nëse antitrupat në të vërtetë nuk do të kishin asnjë efekt në mbijetesën e minjve. Me fjalë të tjera, ju duhet të llogaritni frekuencat e pritura për qelizat përkatëse të tabelës së kontigjencës. Si ta bëjmë atë? Në eksperiment, gjithsej 38 minj ngordhën, që është 34.2% e numrit të përgjithshëm të kafshëve të përfshira. Nëse administrimi i antitrupave nuk ndikon në mbijetesën e minjve, duhet të vërehet e njëjta përqindje e vdekshmërisë në të dy grupet eksperimentale, përkatësisht 34,2%. Duke llogaritur se sa është 34,2% e 57 dhe 54, marrim 19,5 dhe 18,5. Këto janë normat e pritshme të vdekshmërisë në grupet tona eksperimentale. Normat e pritshme të mbijetesës llogariten në mënyrë të ngjashme: meqenëse mbijetuan gjithsej 73 minj, ose 65.8% e numrit të përgjithshëm, normat e pritshme të mbijetesës do të jenë 37.5 dhe 35.5. Le të krijojmë një tabelë të re të emergjencës, tani me frekuencat e pritura:

I vdekur

Të mbijetuarit

Total

Bakteret + serum

Vetëm bakteret

Total

Siç mund ta shohim, frekuencat e pritura janë mjaft të ndryshme nga ato të vëzhguara, d.m.th. administrimi i antitrupave duket se ka një efekt në mbijetesën e minjve të infektuar me patogjenin. Ne mund ta përcaktojmë sasinë e kësaj përshtypjeje duke përdorur testin e mirësisë së përshtatjes së Pearson \(\chi^2\):

\[\chi^2 = \sum_()\frac((f_o - f_e)^2)(f_e),\]


ku \(f_o\) dhe \(f_e\) janë respektivisht frekuencat e vëzhguara dhe të pritura. Përmbledhja kryhet në të gjitha qelizat e tabelës. Pra, për shembullin në shqyrtim kemi

\[\chi^2 = (13 – 19,5)^2/19,5 + (44 – 37,5)^2/37,5 + (25 – 18,5)^2/18,5 + (29 – 35,5)^2/35,5 = \]

A është vlera rezultuese e \(\chi^2\) mjaft e madhe për të hedhur poshtë hipotezën zero? Për t'iu përgjigjur kësaj pyetjeje është e nevojshme të gjendet vlera kritike përkatëse e kriterit. Numri i shkallëve të lirisë për \(\chi^2\) llogaritet si \(df = (R - 1)(C - 1)\), ku \(R\) dhe \(C\) janë numri të rreshtave dhe kolonave në konjugacionin e tabelës. Në rastin tonë \(df = (2 -1) (2 - 1) = 1\). Duke ditur numrin e shkallëve të lirisë, tani mund të zbulojmë lehtësisht vlerën kritike \(\chi^2\) duke përdorur funksionin standard R qchisq():


Kështu, me një shkallë lirie, vetëm në 5% të rasteve vlera e kriterit \(\chi^2\) kalon 3.841. Vlera që kemi marrë, 6.79, e tejkalon ndjeshëm këtë vlerë kritike, gjë që na jep të drejtën të hedhim poshtë hipotezën zero se nuk ka asnjë lidhje midis administrimit të antitrupave dhe mbijetesës së minjve të infektuar. Duke hedhur poshtë këtë hipotezë, rrezikojmë të gabojmë me një probabilitet më të vogël se 5%.

Duhet të theksohet se formula e mësipërme për kriterin \(\chi^2\) jep vlera pak të fryra kur punoni me tabela kontingjente të madhësisë 2x2. Arsyeja është se vetë shpërndarja e kriterit \(\chi^2\) është e vazhdueshme, ndërsa frekuencat e veçorive binare (“vdiq” / “mbijetuar”) janë sipas definicionit diskrete. Në këtë drejtim, gjatë llogaritjes së kriterit, është zakon të prezantohet i ashtuquajturi korrigjimi i vazhdimësisë, ose Amendamenti i Yates :

\[\chi^2_Y = \sum_()\frac((|f_o - f_e| - 0.5)^2)(f_e).\]

Të dhënat e korrigjimit të vazhdimësisë "s Chi-squared with Yates": minj X-katror = 5,7923, df = 1, p-vlera = 0,0161


Siç mund ta shohim, R automatikisht aplikon korrigjimin e vazhdimësisë së Yates ( Testi Chi-squared i Pearson me korrigjimin e vazhdimësisë së Yates). Vlera e \(\chi^2\) e llogaritur nga programi ishte 5.79213. Ne mund të hedhim poshtë hipotezën zero të mungesës së efektit të antitrupave në rrezik për të qenë të gabuar me një probabilitet prej pak më shumë se 1% (p-vlera = 0.0161).

Deri në fund të shekullit të 19-të, shpërndarja normale konsiderohej ligji universal i ndryshimit të të dhënave. Megjithatë, K. Pearson vuri në dukje se frekuencat empirike mund të ndryshojnë shumë nga shpërndarja normale. U ngrit pyetja se si të vërtetohet kjo. Kërkohej jo vetëm një krahasim grafik, i cili është subjektiv, por edhe një justifikim i rreptë sasior.

Kështu u shpik kriteri χ 2(chi-square), i cili teston rëndësinë e ndryshimit midis frekuencave empirike (të vëzhguara) dhe teorike (të pritshme). Kjo ndodhi në vitin 1900, por kriteri është ende në përdorim sot. Për më tepër, ai është përshtatur për të zgjidhur një gamë të gjerë problemesh. Para së gjithash, kjo është analiza e të dhënave nominale, d.m.th. ato që shprehen jo nga sasia, por nga përkatësia në ndonjë kategori. Për shembull, klasa e makinës, gjinia e pjesëmarrësit në eksperiment, lloji i bimës, etj. Veprimet matematikore si mbledhja dhe shumëzimi nuk mund të aplikohen në frekuenca të tilla;

Ne shënojmë frekuencat e vëzhguara Rreth (vëzhguar), e pritshme - E (E pritshme). Si shembull, le të marrim rezultatin e rrokullisjes së një bilete 60 herë. Nëse është simetrike dhe uniforme, probabiliteti për të marrë ndonjë anë është 1/6 dhe për këtë arsye numri i pritshëm i marrjes së secilës anë është 10 (1/6∙60). Frekuencat e vëzhguara dhe të pritura i shkruajmë në një tabelë dhe vizatojmë një histogram.

Hipoteza zero është se frekuencat janë të qëndrueshme, domethënë, të dhënat aktuale nuk kundërshtojnë të dhënat e pritura. Një hipotezë alternative është se devijimet në frekuenca shkojnë përtej luhatjeve të rastësishme, domethënë mospërputhjet janë statistikisht të rëndësishme. Për të nxjerrë një përfundim rigoroz, na duhet.

  1. Një masë përmbledhëse e mospërputhjes midis frekuencave të vëzhguara dhe të pritshme.
  2. Shpërndarja e kësaj mase nëse hipoteza se nuk ka dallime është e vërtetë.

Le të fillojmë me distancën midis frekuencave. Nëse merrni vetëm ndryshimin O - E, atëherë një masë e tillë do të varet nga shkalla e të dhënave (frekuencave). Për shembull, 20 - 5 = 15 dhe 1020 - 1005 = 15. Në të dyja rastet, ndryshimi është 15. Por në rastin e parë, frekuencat e pritura janë 3 herë më pak se ato të vëzhguara, dhe në rastin e dytë - vetëm 1.5 %. Ne kemi nevojë për një masë relative që nuk varet nga shkalla.

Le t'i kushtojmë vëmendje fakteve të mëposhtme. Në përgjithësi, numri i shkallëzimeve në të cilat maten frekuencat mund të jetë shumë më i madh, kështu që gjasat që një vëzhgim i vetëm të bjerë në një kategori ose në një tjetër është mjaft i vogël. Nëse po, atëherë shpërndarja e një ndryshoreje të tillë të rastësishme do t'i bindet ligjit të ngjarjeve të rralla, i njohur si Ligji i Poisson-it. Në ligjin e Poisson-it, siç dihet, vlera e pritjes matematikore dhe varianca përputhen (parametri λ ). Kjo do të thotë se frekuenca e pritur për disa kategori të ndryshores nominale E i do të jetë i njëkohshëm dhe shpërndarja e tij. Më tej, ligji i Poisson-it priret në normalitet me një numër të madh vëzhgimesh. Duke kombinuar këto dy fakte, marrim se nëse hipoteza për marrëveshjen midis frekuencave të vëzhguara dhe të pritura është e saktë, atëherë, me një numër të madh vëzhgimesh, shprehje

Do të ketë.

Është e rëndësishme të mbani mend se normaliteti do të shfaqet vetëm në frekuenca mjaft të larta. Në statistika, përgjithësisht pranohet se numri i përgjithshëm i vëzhgimeve (shuma e frekuencave) duhet të jetë së paku 50 dhe frekuenca e pritur në çdo gradim duhet të jetë së paku 5. Vetëm në këtë rast, vlera e treguar më sipër do të ketë një normale standarde shpërndarja. Le të supozojmë se plotësohet ky kusht.

Shpërndarja normale standarde ka pothuajse të gjitha vlerat brenda ±3 (rregulli tre-sigma). Kështu, ne morëm ndryshimin relativ në frekuenca për një gradim. Ne kemi nevojë për një masë të përgjithësueshme. Ju nuk mund të shtoni vetëm të gjitha devijimet - ne marrim 0 (mendoni pse). Pearson sugjeroi mbledhjen e katrorëve të këtyre devijimeve.

Kjo është shenja kriteri χ 2 Pearson. Nëse frekuencat vërtet korrespondojnë me ato të pritura, atëherë vlera e kriterit do të jetë relativisht e vogël (pasi shumica e devijimeve janë rreth zeros). Por nëse kriteri rezulton i madh, atëherë kjo tregon dallime të rëndësishme midis frekuencave.

Kriteri bëhet "i madh" kur shfaqja e një vlere të tillë apo edhe më të madhe bëhet e pamundur. Dhe për të llogaritur një probabilitet të tillë, është e nevojshme të dihet shpërndarja e kriterit kur eksperimenti përsëritet shumë herë, kur hipoteza e marrëveshjes së frekuencës është e saktë.

Siç mund të shihet lehtë, vlera chi-katror varet gjithashtu nga numri i termave. Sa më shumë të ketë, aq më e madhe është vlera që duhet të ketë kriteri, sepse çdo term do të kontribuojë në total. Prandaj, për çdo sasi të pavarur kushtet, do të ketë shpërndarjen e vet. Rezulton se χ 2është një familje e tërë shpërndarjesh.

Dhe këtu kemi ardhur në një moment delikat. Çfarë është një numër të pavarur kushtet? Duket sikur çdo term (d.m.th. devijim) është i pavarur. Kështu mendoi edhe K. Pearson, por ai doli të ishte gabim. Në fakt, numri i termave të pavarur do të jetë një më pak se numri i gradimeve të ndryshores nominale n. Pse? Sepse nëse kemi një mostër për të cilën shuma e frekuencave tashmë është llogaritur, atëherë njëra nga frekuencat mund të përcaktohet gjithmonë si diferencë midis numrit total dhe shumës së të gjitha të tjerave. Prandaj ndryshimi do të jetë disi më i vogël. Ronald Fisher e vuri re këtë fakt 20 vjet pasi Pearson zhvilloi kriterin e tij. Edhe tavolinat duhej të ribëheshin.

Me këtë rast, Fisher prezantoi një koncept të ri në statistika - shkalla e lirisë(gradat e lirisë), që paraqet numrin e termave të pavarur në shumë. Koncepti i shkallëve të lirisë ka një shpjegim matematikor dhe shfaqet vetëm në shpërndarjet që lidhen me normalen (Student's, Fisher-Snedecor dhe vetë chi-square).

Për të kuptuar më mirë kuptimin e shkallëve të lirisë, le t'i drejtohemi një analoge fizike. Le të imagjinojmë një pikë që lëviz lirshëm në hapësirë. Ka 3 shkallë lirie, sepse mund të lëvizë në çdo drejtim në hapësirën tredimensionale. Nëse një pikë lëviz përgjatë ndonjë sipërfaqeje, atëherë ajo tashmë ka dy shkallë lirie (para dhe mbrapa, majtas dhe djathtas), megjithëse vazhdon të jetë në hapësirën tredimensionale. Një pikë që lëviz përgjatë një burimi është përsëri në hapësirën tre-dimensionale, por ka vetëm një shkallë lirie, sepse mund të lëvizë përpara ose prapa. Siç mund ta shihni, hapësira ku ndodhet objekti nuk korrespondon gjithmonë me lirinë reale të lëvizjes.

Përafërsisht në të njëjtën mënyrë, shpërndarja e një kriteri statistikor mund të varet nga një numër më i vogël elementësh sesa termat e nevojshëm për llogaritjen e tij. Në përgjithësi, numri i shkallëve të lirisë është më i vogël se numri i vëzhgimeve nga numri i varësive ekzistuese. Kjo është matematikë e pastër, pa magji.

Pra shpërndarja χ 2është një familje shpërndarjesh, secila prej të cilave varet nga parametri i shkallës së lirisë. Dhe përkufizimi zyrtar i testit chi-square është si më poshtë. Shpërndarja χ 2(chi-katror) s k shkallët e lirisë është shpërndarja e shumës së katrorëve k variablat e pavarur standarde normale të rastit.

Më pas, mund të kalojmë në vetë formulën me të cilën llogaritet funksioni i shpërndarjes chi-square, por, për fat, gjithçka është llogaritur prej kohësh për ne. Për të marrë probabilitetin e interesit, mund të përdorni ose tabelën statistikore përkatëse ose një funksion të gatshëm në softuer të specializuar, i cili është i disponueshëm edhe në Excel.

Është interesante të shihet se si ndryshon forma e shpërndarjes chi-katrore në varësi të numrit të shkallëve të lirisë.

Me rritjen e shkallës së lirisë, shpërndarja e katrorit chi priret të jetë normale. Kjo shpjegohet me veprimin e teoremës së kufirit qendror, sipas së cilës shuma e një numri të madh të ndryshoreve të rastësishme të pavarura ka një shpërndarje normale. Nuk thotë asgjë për katrorët)).

Testimi i hipotezave duke përdorur testin chi-square

Tani kemi ardhur në testimin e hipotezave duke përdorur metodën chi-square. Në përgjithësi, teknologjia mbetet. Hipoteza zero është se frekuencat e vëzhguara korrespondojnë me ato të pritura (d.m.th. nuk ka asnjë ndryshim midis tyre sepse ato janë marrë nga e njëjta popullatë). Nëse është kështu, atëherë shpërndarja do të jetë relativisht e vogël, brenda kufijve të luhatjeve të rastësishme. Masa e dispersionit përcaktohet duke përdorur testin chi-square. Më pas, ose krahasohet vetë kriteri me vlerën kritike (për nivelin përkatës të rëndësisë dhe shkallët e lirisë), ose, çfarë është më e sakta, llogaritet niveli p i vëzhguar, d.m.th. probabiliteti i përftimit të vlerës së njëjtë apo edhe më të madhe të kriterit nëse hipoteza zero është e vërtetë.

Sepse ne jemi të interesuar për pajtimin e frekuencave, atëherë hipoteza do të hidhet poshtë kur kriteri është më i madh se niveli kritik. Ato. kriteri është i njëanshëm. Sidoqoftë, ndonjëherë (ndonjëherë) është e nevojshme të testohet hipoteza e dorës së majtë. Për shembull, kur të dhënat empirike janë shumë të ngjashme me të dhënat teorike. Atëherë kriteri mund të bjerë në një rajon të pamundur, por në të majtë. Fakti është se në kushte natyrore, nuk ka gjasa të merren frekuenca që praktikisht përkojnë me ato teorike. Gjithmonë ka ndonjë rastësi që jep një gabim. Por nëse nuk ka një gabim të tillë, atëherë ndoshta të dhënat janë falsifikuar. Por megjithatë, hipoteza e anës së djathtë zakonisht testohet.

Le të kthehemi te problemi i zareve. Le të llogarisim vlerën e testit chi-square duke përdorur të dhënat e disponueshme.

Tani le të gjejmë vlerën tabelare të kriterit në 5 gradë lirie ( k) dhe niveli i rëndësisë 0.05 ( α ).

Kjo eshte χ 2 0,05; 5 = 11,1.

Le të krahasojmë vlerat aktuale dhe të tabeluara. 3.4 ( χ 2) < 11,1 (χ 2 0,05; 5). Kriteri i llogaritur doli të jetë më i vogël, që do të thotë se hipoteza e barazisë (marrëveshjes) e frekuencave nuk hidhet poshtë. Në figurë, situata duket kështu.

Nëse vlera e llogaritur bie brenda rajonit kritik, hipoteza zero do të refuzohej.

Do të ishte më e saktë të llogaritet edhe niveli p. Për ta bërë këtë, duhet të gjeni vlerën më të afërt në tabelë për një numër të caktuar të shkallëve të lirisë dhe të shikoni nivelin përkatës të rëndësisë. Por ky është shekulli i fundit. Ne do të përdorim një kompjuter personal, në veçanti MS Excel. Excel ka disa funksione që lidhen me chi-square.

Më poshtë është një përshkrim i shkurtër i tyre.

CH2.OBR- vlera kritike e kriterit me një probabilitet të caktuar në të majtë (si në tabelat statistikore)

CH2.OBR.PH– vlera kritike e kriterit për një probabilitet të caktuar në të djathtë. Funksioni në thelb kopjon atë të mëparshëm. Por këtu mund të tregoni menjëherë nivelin α , në vend që ta zbresim atë nga 1. Kjo është më e përshtatshme, sepse në shumicën e rasteve, është bishti i djathtë i shpërndarjes që nevojitet.

CH2.DIST– P-niveli në të majtë (dendësia mund të llogaritet).

CH2.DIST.PH– P-niveli në të djathtë.

CHI2.TESTI– kryen menjëherë një test chi-square për dy diapazon frekuencash të dhëna. Numri i shkallëve të lirisë merret të jetë një më pak se numri i frekuencave në kolonë (siç duhet të jetë), duke kthyer vlerën e nivelit p.

Le të llogarisim për eksperimentin tonë vlerën kritike (tabelore) për 5 shkallë lirie dhe alfa 0,05. Formula Excel do të duket si kjo:

CH2.OBR(0.95;5)

CH2.OBR.PH(0.05;5)

Rezultati do të jetë i njëjtë - 11.0705. Kjo është vlera që shohim në tabelë (e rrumbullakosur në 1 dhjetor).

Le të llogarisim përfundimisht nivelin p për kriterin 5 gradë lirie χ 2= 3.4. Ne kemi nevojë për një probabilitet në të djathtë, kështu që marrim një funksion me shtimin e HH (bishti i djathtë)

CH2.DIST.PH(3.4;5) = 0.63857

Kjo do të thotë se me 5 gradë lirie probabiliteti për të marrë vlerën e kriterit është χ 2= 3.4 dhe më shumë është pothuajse 64%. Natyrisht, hipoteza nuk hidhet poshtë (niveli p është më i madh se 5%), frekuencat janë në përputhje shumë të mirë.

Tani le të kontrollojmë hipotezën rreth marrëveshjes së frekuencës duke përdorur funksionin CH2.TEST.

Pa tabela, pa llogaritje të rënda. Duke specifikuar kolonat me frekuenca të vëzhguara dhe të pritshme si argumente funksioni, marrim menjëherë nivelin p. Bukuria.

Tani imagjinoni se po luani zare me një djalë të dyshimtë. Shpërndarja e pikëve nga 1 në 5 mbetet e njëjtë, por ai rrotullon 26 gjashtëshe (numri i përgjithshëm i gjuajtjeve bëhet 78).

Niveli P në këtë rast rezulton të jetë 0.003, që është shumë më pak se 0.05. Ka arsye të mira për të dyshuar në vlefshmërinë e zareve. Ja se si duket kjo probabilitet në një grafik të shpërndarjes chi-square.

Vetë kriteri chi-square këtu rezulton të jetë 17.8, i cili, natyrisht, është më i madh se ai i tabelës (11.1).

Shpresoj se kam qenë në gjendje të shpjegoj se cili është kriteri i marrëveshjes χ 2(Pearson chi-square) dhe si mund të përdoret për të testuar hipotezat statistikore.

Më në fund, edhe një herë për një kusht të rëndësishëm! Testi chi-square funksionon si duhet vetëm kur numri i të gjitha frekuencave kalon 50, dhe vlera minimale e pritur për çdo gradim nuk është më e vogël se 5. Nëse në ndonjë kategori frekuenca e pritur është më e vogël se 5, por shuma e të gjitha frekuencave tejkalon 50, atëherë kategoria e tillë kombinohet me atë më të afërt në mënyrë që frekuenca e tyre totale të kalojë 5. Nëse kjo nuk është e mundur, ose shuma e frekuencave është më e vogël se 50, atëherë duhet të përdoren metoda më të sakta të testimit të hipotezave. Ne do të flasim për ta një herë tjetër.

Më poshtë është një video se si të testoni një hipotezë në Excel duke përdorur testin chi-square.

Testi chi-square është një metodë universale për të kontrolluar përputhjen midis rezultateve të një eksperimenti dhe modelit statistikor të përdorur.

Distanca Pearson X 2

Pyatnitsky A.M.

Universiteti Shtetëror i Mjekësisë Ruse

Në vitin 1900, Karl Pearson propozoi një mënyrë të thjeshtë, universale dhe efektive për të testuar marrëveshjen midis parashikimeve të modelit dhe të dhënave eksperimentale. “Testi chi-square” që ai propozoi është testi statistikor më i rëndësishëm dhe më i përdorur. Shumica e problemeve që lidhen me vlerësimin e parametrave të modelit të panjohur dhe kontrollimin e marrëveshjes midis modelit dhe të dhënave eksperimentale mund të zgjidhen me ndihmën e tij.

Le të ketë një model apriori ("para-eksperimental") të objektit ose procesit që studiohet (në statistikë ata flasin për "hipotezën zero" H 0), dhe rezultatet e një eksperimenti me këtë objekt. Është e nevojshme të vendoset nëse modeli është adekuat (a korrespondon me realitetin)? A kundërshtojnë rezultatet eksperimentale me idetë tona se si funksionon realiteti, apo me fjalë të tjera, H0 duhet të refuzohet? Shpesh kjo detyrë mund të reduktohet në krahasimin e frekuencave mesatare të shfaqjes së ngjarjeve të caktuara të vëzhguara (O i = Vëzhguar) dhe të pritura sipas modelit (E i = e pritshme). Besohet se frekuencat e vëzhguara janë marrë në një seri vëzhgimesh N të pavarura (!) të bëra në kushte konstante (!). Si rezultat i çdo vëzhgimi, regjistrohet një nga ngjarjet M. Këto ngjarje nuk mund të ndodhin njëkohësisht (janë të papajtueshme në çift) dhe njëra prej tyre ndodh domosdoshmërisht (kombinimi i tyre formon një ngjarje të besueshme). Tërësia e të gjitha vëzhgimeve reduktohet në një tabelë (vektor) të frekuencave (O i )=(O 1 ,… O M ), e cila përshkruan plotësisht rezultatet e eksperimentit. Vlera O 2 =4 do të thotë se ngjarja numër 2 ka ndodhur 4 herë. Shuma e frekuencave O 1 +… O M =N. Është e rëndësishme të bëhet dallimi midis dy rasteve: N – fikse, jo e rastësishme, N – variabli i rastësishëm. Për një numër total fiks të eksperimenteve N, frekuencat kanë një shpërndarje polinomiale. Le ta ilustrojmë këtë skemë të përgjithshme me një shembull të thjeshtë.

Përdorimi i testit chi-square për të testuar hipoteza të thjeshta.

Le të jetë modeli (hipoteza zero H 0) që koka është e drejtë - të gjitha fytyrat shfaqen njësoj shpesh me probabilitet p i =1/6, i =, M=6. U krye një eksperiment në të cilin kaldaja u hodh 60 herë (N = 60 prova të pavarura u kryen). Sipas modelit, presim që të gjitha frekuencat e vëzhguara O i të shfaqjes 1,2,... 6 pikë duhet të jenë afër vlerave mesatare të tyre E i =Np i =60∙(1/6)=10. Sipas H 0, vektori i frekuencave mesatare (E i )=(Np i )=(10, 10, 10, 10, 10, 10). (Hipotezat në të cilat frekuencat mesatare janë plotësisht të njohura para fillimit të eksperimentit quhen të thjeshta.) Nëse vektori i vëzhguar (O i ) ishte i barabartë me (34,0,0,0,0,26), atëherë është menjëherë e qartë se modeli është i pasaktë - kocka nuk mund të jetë e saktë, pasi vetëm 1 dhe 6 janë hedhur 60 herë Probabiliteti i një ngjarjeje të tillë për një zare të saktë është i papërfillshëm: P = (2/6) 60 =2.4*10 -29. Sidoqoftë, shfaqja e mospërputhjeve të tilla të dukshme midis modelit dhe përvojës është një përjashtim. Le të jetë vektori i frekuencave të vëzhguara (O i ) i barabartë me (5, 15, 6, 14, 4, 16). A është kjo në përputhje me H0? Pra, duhet të krahasojmë dy vektorë të frekuencës (E i) dhe (O i). Në këtë rast, vektori i frekuencave të pritura (Ei) nuk është i rastësishëm, por vektori i frekuencave të vëzhguara (Oi) është i rastësishëm - gjatë eksperimentit tjetër (në një seri të re prej 60 hedhjesh) do të rezultojë i ndryshëm. Është e dobishme të prezantohet një interpretim gjeometrik i problemit dhe të supozohet se në hapësirën e frekuencës (në këtë rast 6-dimensionale) jepen dy pika me koordinatat (5, 15, 6, 14, 4, 16) dhe (10, 10, 10, 10, 10, 10). A janë mjaft larg njëri-tjetrit për ta konsideruar këtë të papajtueshme me H 0? Me fjalë të tjera, na duhen:

  1. mësoni të matni distancat midis frekuencave (pikat në hapësirën e frekuencës),
  2. kanë një kriter për atë se cila distancë duhet të konsiderohet shumë ("pabesueshme") e madhe, domethënë e papajtueshme me H 0 .

Katrori i distancës së zakonshme Euklidiane do të ishte i barabartë me:

X 2 Euklidi = S(O i -E i) 2 = (5-10) 2 +(15-10) 2 + (6-10) 2 +(14-10) 2 +(4-10) 2 +(16-10) 2

Në këtë rast, sipërfaqet X 2 Euklid = konst janë gjithmonë sfera nëse rregullojmë vlerat e E i dhe ndryshojmë O i. Karl Pearson vuri në dukje se përdorimi i distancës Euklidiane në hapësirën e frekuencës nuk duhet të përdoret. Kështu, është e gabuar të supozohet se pikat (O = 1030 dhe E = 1000) dhe (O = 40 dhe E = 10) janë në distancë të barabartë nga njëra-tjetra, megjithëse në të dyja rastet diferenca është O -E = 30. Në fund të fundit, sa më e lartë të jetë frekuenca e pritshme, aq më të mëdha devijime nga ajo duhet të konsiderohen të mundshme. Prandaj, pikat (O =1030 dhe E =1000) duhet të konsiderohen "të afërta", dhe pikat (O =40 dhe E =10) "larg" nga njëra-tjetra. Mund të tregohet se nëse hipoteza H 0 është e vërtetë, atëherë luhatjet e frekuencës O i në raport me E i janë të rendit të rrënjës katrore(!) të E i. Prandaj, Pearson propozoi, gjatë llogaritjes së distancës, të shënohen jo diferencat (O i -E i), por diferencat e normalizuara (O i -E i)/E i 1/2. Pra, këtu është formula për të llogaritur distancën e Pearson (në fakt është katrori i distancës):

X 2 Pearson = S((O i -E i )/E i 1/2) 2 = S(O i -E i ) 2 /E i

Në shembullin tonë:

X 2 Pearson = (5-10) 2 /10+(15-10) 2 /10 +(6-10) 2 /10+(14-10) 2 /10+(4-10) 2 /10+( 16-10) 2 /10=15.4

Për një dietë të rregullt, të gjitha frekuencat e pritura E i janë të njëjta, por zakonisht ato janë të ndryshme, kështu që sipërfaqet në të cilat distanca e Pearson është konstante (X 2 Pearson =konst) dalin të jenë elipsoidë, jo sfera.

Tani që është zgjedhur formula për llogaritjen e distancave, është e nevojshme të zbulohet se cilat distanca duhet të konsiderohen "jo shumë të mëdha" (në përputhje me H 0 Pra, për shembull, çfarë mund të themi për distancën që kemi llogaritur 15.4). ? Në cilën përqindje të rasteve (ose me çfarë probabiliteti) do të merrnim një distancë më të madhe se 15.4 kur kryenim eksperimente me një llak të rregullt? Nëse kjo përqindje është e vogël (<0.05), то H 0 надо отвергнуть. Иными словами требуется найти распределение длярасстояния Пирсона. Если все ожидаемые частоты E i не слишком малы (≥5), и верна H 0 , то нормированные разности (O i - E i )/E i 1/2 приближенно эквивалентны стандартным гауссовским случайным величинам: (O i - E i )/E i 1/2 ≈N (0,1). Это, например, означает, что в 95% случаев| (O i - E i )/E i 1/2 | < 1.96 ≈ 2 (правило “двух сигм”).

Shpjegim. Numri i matjeve O i që bie në qelizën e tabelës me numër i ka një shpërndarje binomiale me parametrat: m =Np i =E i,σ =(Np i (1-p i)) 1/2, ku N është numri i matjeve (N "1), p i është probabiliteti që një matje të bjerë në një qelizë të caktuar (kujtoni se matjet janë të pavarura dhe kryhen në kushte konstante). Nëse p i është i vogël, atëherë: σ≈(Np i ) 1/2 =E i dhe shpërndarja binomiale është afër Poissonit, në të cilin numri mesatar i vëzhgimeve E i =λ, dhe devijimi standard σ=λ 1/2 = E i 1/2. Për λ≥5, shpërndarja Poisson është afër normales N (m =E i =λ, σ=E i 1/2 =λ 1/2), dhe vlera e normalizuar (O i - E i )/E i 1 /2 ≈ N (0 ,1).

Pearson përcaktoi variablin e rastësishëm χ 2 n – “chi-katror me n shkallë lirie”, si shumën e katrorëve të n variablave normale standarde të pavarura të rastit:

χ 2 n = T 1 2 + T 2 2 + …+ T n 2 , ku janë të gjithë T i = N(0,1) - n. O. R. Me. V.

Le të përpiqemi të kuptojmë qartë kuptimin e këtij variabli të rastësishëm më të rëndësishëm në statistika. Për ta bërë këtë, në rrafsh (me n = 2) ose në hapësirë ​​(me n = 3) paraqesim një re pikash, koordinatat e të cilave janë të pavarura dhe kanë një shpërndarje normale standardef T (x) ~exp (-x 2 /2 ). Në një rrafsh, sipas rregullit "dy sigma", i cili zbatohet në mënyrë të pavarur për të dyja koordinatat, 90% (0,95*0,95≈0,90) e pikave përmbahen brenda një katrori (-2

f χ 2 2 (a) = Сexp(-a/2) = 0,5exp(-a/2).

Me një numër mjaft të madh të shkallëve të lirisë n (n > 30), shpërndarja chi-katrore i afrohet normales: N (m = n; σ = (2n) ½). Kjo është pasojë e "teoremës së kufirit qendror": shuma e sasive të shpërndara identike me variancë të fundme i afrohet ligjit normal ndërsa numri i termave rritet.

Në praktikë, duhet të mbani mend se katrori mesatar i distancës është i barabartë me m (χ 2 n) = n, dhe varianca e tij është σ 2 (χ 2 n) = 2n. Nga këtu është e lehtë të konkludohet se cilat vlera katrore chi duhet të konsiderohen shumë të vogla dhe shumë të mëdha: shumica e shpërndarjes shtrihet në intervalin nga n -2∙(2n) ½ deri në n +2∙(2n) ½.

Pra, distancat e Pearson-it që tejkalojnë dukshëm n +2∙ (2n) ½ duhet të konsiderohen në mënyrë të pabesueshme të mëdha (në kundërshtim me H 0). Nëse rezultati është afër n +2∙(2n) ½, atëherë duhet të përdorni tabela në të cilat mund të zbuloni saktësisht se në çfarë përqindje rastesh mund të shfaqen vlera të tilla dhe të mëdha chi-katrore.

Është e rëndësishme të dini se si të zgjidhni vlerën e duhur për numrin e shkallëve të lirisë (shkurtuar n.d.f.). Dukej e natyrshme të supozohej se n ishte thjesht e barabartë me numrin e shifrave: n =M. Në artikullin e tij, Pearson sugjeroi po aq. Në shembullin e zarit, kjo do të thotë se n =6. Megjithatë, disa vite më vonë u tregua se Pearson kishte gabuar. Numri i shkallëve të lirisë është gjithmonë më i vogël se numri i shifrave nëse ka lidhje ndërmjet ndryshoreve të rastësishme O i. Për shembullin e zarit, shuma O i është 60, dhe vetëm 5 frekuenca mund të ndryshohen në mënyrë të pavarur, kështu që vlera e saktë është n = 6-1 = 5. Për këtë vlerë të n-së marrim n +2∙(2n) ½ =5+2∙(10) ½ =11.3. Meqenëse 15.4>11.3, atëherë hipoteza H 0 - dieta është e saktë, duhet të refuzohet.

Pas sqarimit të gabimit, tabelat ekzistuese χ 2 duhej të plotësoheshin, pasi fillimisht nuk kishin rastin n = 1, pasi numri më i vogël i shifrave = 2. Tani rezulton se mund të ketë raste kur distanca Pearson ka shpërndarje χ 2 n =1.

Shembull. Me 100 hedhje monedhash, numri i kokave është O 1 = 65, dhe i bishtave O 2 = 35. Numri i shifrave është M = 2. Nëse monedha është simetrike, atëherë frekuencat e pritura janë E 1 =50, E 2 =50.

X 2 Pearson = S(O i -E i) 2 /E i = (65-50) 2 /50 + (35-50) 2 /50 = 2*225/50 = 9.

Vlera që rezulton duhet të krahasohet me ato që mund të marrë ndryshorja e rastësishme χ 2 n =1, e përcaktuar si katrori i vlerës normale standard χ 2 n =1 =T 1 2 ≥ 9 ó T 1 ≥3 ose T 1 ≤-3. Probabiliteti i një ngjarjeje të tillë është shumë i ulët P (χ 2 n =1 ≥9) = 0,006. Prandaj, monedha nuk mund të konsiderohet simetrike: H 0 duhet të refuzohet. Fakti që numri i shkallëve të lirisë nuk mund të jetë i barabartë me numrin e shifrave është i dukshëm nga fakti se shuma e frekuencave të vëzhguara është gjithmonë e barabartë me shumën e atyre të pritura, për shembull O 1 +O 2 =65+ 35 = E 1 +E 2 =50+50=100. Prandaj, pikat e rastësishme me koordinatat O 1 dhe O 2 janë të vendosura në një vijë të drejtë: O 1 +O 2 =E 1 +E 2 =100 dhe distanca nga qendra rezulton të jetë më e vogël se nëse ky kufizim nuk do të ekzistonte dhe ato ndodheshin në të gjithë aeroplanin. Në të vërtetë, për dy ndryshore të pavarura të rastësishme me pritshmëri matematikore E 1 =50, E 2 =50, shuma e realizimeve të tyre nuk duhet të jetë gjithmonë e barabartë me 100 - për shembull, vlerat O 1 =60, O 2 =55 do të të jetë i pranueshëm.

Shpjegim. Le të krahasojmë rezultatin e kriterit Pearson në M = 2 me atë që jep formula Moivre-Laplace kur vlerësojmë luhatjet e rastësishme në frekuencën e shfaqjes së një ngjarjeje ν =K /N që ka një probabilitet p në një seri N testesh të pavarura Bernoulli ( K është numri i sukseseve):

χ 2 n =1 = S(O i -E i) 2 /E i = (O 1 -E 1) 2 /E 1 + (O 2 -E 2) 2 /E 2 = (Nν -Np) 2 /(Np) + (N ( 1-ν )-N (1-p )) 2 /(N (1-p ))=

=(Nν-Np) 2 (1/p + 1/(1-p))/N=(Nν-Np) 2 /(Np(1-p))=((K-Np)/(Npq) ½ ) 2 = T 2

Vlera T =(K -Np)/(Npq) ½ = (K -m (K))/σ(K) ≈N (0.1) me σ(K)=(Npq) ½ ≥3. Ne shohim se në këtë rast rezultati i Pearson-it përkon saktësisht me atë që jep përafrimi normal për shpërndarjen binomiale.

Deri më tani kemi shqyrtuar hipoteza të thjeshta për të cilat frekuencat mesatare të pritura E i janë plotësisht të njohura paraprakisht. Për informacion se si të zgjidhni numrin e saktë të shkallëve të lirisë për hipoteza komplekse, shihni më poshtë.

Përdorimi i testit chi-square për të testuar hipoteza komplekse

Në shembujt me një prerje dhe monedhë të rregullt, frekuencat e pritura mund të përcaktohen përpara(!) eksperimentit. Hipoteza të tilla quhen "të thjeshta". Në praktikë, "hipotezat komplekse" janë më të zakonshme. Për më tepër, për të gjetur frekuencat e pritshme E i është e nevojshme që fillimisht të vlerësohen një ose disa sasi (parametrat e modelit), dhe kjo mund të bëhet vetëm duke përdorur të dhëna eksperimentale. Si rezultat, për "hipotezat komplekse" frekuencat e pritshme E i rezultojnë të varen nga frekuencat e vëzhguara O i dhe për këtë arsye bëhen vetë variabla të rastësishme, që ndryshojnë në varësi të rezultateve të eksperimentit. Në procesin e zgjedhjes së parametrave, distanca e Pearson zvogëlohet - parametrat zgjidhen në mënyrë që të përmirësojnë marrëveshjen midis modelit dhe eksperimentit. Prandaj, numri i shkallëve të lirisë duhet të ulet.

Si të vlerësoni parametrat e modelit? Ka shumë metoda të ndryshme të vlerësimit - "metoda e gjasave maksimale", "metoda e momenteve", "metoda e zëvendësimit". Sidoqoftë, nuk mund të përdorni fonde shtesë dhe të gjeni vlerësime të parametrave duke minimizuar distancën Pearson. Në epokën para kompjuterit, kjo qasje përdorej rrallë: është e papërshtatshme për llogaritjet manuale dhe, si rregull, nuk mund të zgjidhet në mënyrë analitike. Gjatë llogaritjes në një kompjuter, minimizimi numerik është zakonisht i lehtë për t'u kryer, dhe avantazhi i kësaj metode është shkathtësia e saj. Pra, sipas "metodës së minimizimit chi-square", ne zgjedhim vlerat e parametrave të panjohur në mënyrë që distanca Pearson të bëhet më e vogla. (Meqë ra fjala, duke studiuar ndryshimet në këtë distancë me zhvendosje të vogla në raport me minimumin e gjetur, mund të vlerësoni masën e saktësisë së vlerësimit: ndërtoni intervale besimi.) Pasi të jenë gjetur parametrat dhe vetë kjo distancë minimale, është përsëri e nevojshme për t'iu përgjigjur pyetjes nëse është mjaft e vogël.

Sekuenca e përgjithshme e veprimeve është si më poshtë:

  1. Zgjedhja e modelit (hipoteza H 0).
  2. Zgjedhja e biteve dhe përcaktimi i vektorit të frekuencave të vëzhguara O i.
  3. Vlerësimi i parametrave të modelit të panjohur dhe ndërtimi i intervaleve të besimit për to (për shembull, duke kërkuar distancën minimale të Pearson).
  4. Llogaritja e frekuencave të pritura E i .
  5. Krahasimi i vlerës së gjetur të distancës Pearson X 2 me vlerën kritike të chi-square χ 2 crit - më i madhi, i cili ende konsiderohet i besueshëm, i pajtueshëm me H 0. Vlerën χ 2 crit e gjejmë nga tabelat duke zgjidhur ekuacionin

P (χ 2 n > χ 2 crit) = 1-α,

ku α është "niveli i rëndësisë" ose "madhësia e kriterit" ose "madhësia e gabimit të tipit të parë" (vlera tipike α = 0.05).

Zakonisht numri i shkallëve të lirisë n llogaritet duke përdorur formulën

n = (numri i shifrave) – 1 – (numri i parametrave që do të vlerësohen)

Nëse X 2 > χ 2 crit, atëherë hipoteza H 0 hidhet poshtë, përndryshe pranohet. Në α∙100% të rasteve (d.m.th., mjaft rrallë), kjo metodë e kontrollit të H 0 do të çojë në një "gabim të llojit të parë": hipoteza H 0 do të refuzohet gabimisht.

Shembull. Gjatë studimit të 10 serive me 100 fara, u numërua numri i atyre të infektuara nga miza me sy të gjelbër. Të dhënat e marra: O i =(16, 18, 11, 18, 21, 10, 20, 18, 17, 21);

Këtu vektori i frekuencave të pritura është i panjohur paraprakisht. Nëse të dhënat janë homogjene dhe merren për një shpërndarje binomiale, atëherë një parametër është i panjohur: proporcioni p i farave të infektuara. Vini re se në tabelën origjinale në fakt nuk janë 10 por 20 frekuenca që plotësojnë 10 lidhje: 16+84=100, ... 21+79=100.

X 2 = (16-100p) 2 /100p +(84-100(1-p)) 2 /(100(1-p))+…+

(21-100p) 2 /100p +(79-100(1-p)) 2 /(100(1-p))

Duke kombinuar termat në çift (si në shembullin me një monedhë), marrim formën e shkrimit të kriterit Pearson, i cili zakonisht shkruhet menjëherë:

X 2 = (16-100p) 2 /(100p(1-p))+…+ (21-100p) 2 /(100p(1-p)).

Tani, nëse distanca minimale Pearson përdoret si metodë për vlerësimin e p, atëherë është e nevojshme të gjendet një p për të cilën X 2 =min. (Modeli përpiqet, nëse është e mundur, të "përshtatet" me të dhënat eksperimentale.)

Kriteri Pearson është më universali nga të gjithë të përdorur në statistika. Mund të aplikohet për të dhëna njëvariante dhe multivariate, veçori sasiore dhe cilësore. Megjithatë, pikërisht për shkak të shkathtësisë së tij, duhet pasur kujdes që të mos gabohen.

Pika të rëndësishme

1.Përzgjedhja e kategorive.

  • Nëse shpërndarja është diskrete, atëherë zakonisht nuk ka arbitraritet në zgjedhjen e shifrave.
  • Nëse shpërndarja është e vazhdueshme, atëherë arbitrariteti është i pashmangshëm. Mund të përdoren blloqe statistikisht ekuivalente (të gjitha O janë të njëjta, për shembull =10). Megjithatë, gjatësitë e intervaleve janë të ndryshme. Kur bënin llogaritjet manuale, ata u përpoqën të bënin të njëjtat intervale. A duhet të jenë të barabarta intervalet gjatë studimit të shpërndarjes së një tipari njëndryshor? Nr.
  • Shifrat duhet të kombinohen në mënyrë të tillë që frekuencat e pritura (të pavëzhguara!) të mos jenë shumë të vogla (≥5). Le të kujtojmë se janë ata (E i) që janë në emërues gjatë llogaritjes së X 2! Kur analizohen karakteristikat njëdimensionale, lejohet të shkelet ky rregull në dy shifrat ekstreme E 1 =E max =1. Nëse numri i shifrave është i madh dhe frekuencat e pritura janë të afërta, atëherë X 2 është një përafrim i mirë i χ 2 edhe për E i =2.

Vlerësimi i parametrave. Përdorimi i metodave të vlerësimit "të bëra në shtëpi", joefikase mund të çojë në vlera të fryra të distancës Pearson.

Zgjedhja e numrit të duhur të shkallëve të lirisë. Nëse vlerësimet e parametrave nuk bëhen nga frekuencat, por drejtpërdrejt nga të dhënat (për shembull, mesatarja aritmetike merret si një vlerësim i mesatares), atëherë numri i saktë i shkallëve të lirisë n është i panjohur. Dimë vetëm se plotëson pabarazinë:

(numri i shifrave – 1 – numri i parametrave që vlerësohen)< n < (число разрядов – 1)

Prandaj, është e nevojshme të krahasohet X 2 me vlerat kritike të χ 2 crit të llogaritura në të gjithë këtë interval prej n.

Si të interpretohen vlerat e pabesueshme të vogla chi? A duhet të konsiderohet simetrike një monedhë nëse, pas 10,000 hedhjesh, ajo ulet në stemë 5,000 herë? Më parë, shumë statisticien besonin se H 0 gjithashtu duhet të refuzohej. Tani propozohet një qasje tjetër: pranoni H 0, por nënshtroni të dhënat dhe metodologjinë e analizës së tyre në verifikim shtesë. Ekzistojnë dy mundësi: ose një distancë shumë e vogël Pearson do të thotë që rritja e numrit të parametrave të modelit nuk u shoqërua me një ulje të duhur të numrit të shkallëve të lirisë, ose vetë të dhënat u falsifikuara (ndoshta pa dashje janë përshtatur me rezultatin e pritur).

Shembull. Dy studiues A dhe B llogaritën proporcionin e homozigoteve recesive aa në gjeneratën e dytë të një kryq monohibrid AA * aa. Sipas ligjeve të Mendelit, kjo pjesë është 0.25. Secili studiues kreu 5 eksperimente dhe 100 organizma u studiuan në secilin eksperiment.

Rezultatet A: 25, 24, 26, 25, 24. Përfundimi i studiuesit: Ligji i Mendelit është i vërtetë(?).

Rezultatet B: 29, 21, 23, 30, 19. Përfundimi i studiuesit: Ligji i Mendelit nuk është i drejtë(?).

Megjithatë, ligji i Mendelit është i një natyre statistikore, dhe analiza sasiore e rezultateve i kthen konkluzionet! Duke kombinuar pesë eksperimente në një, arrijmë në një shpërndarje chi-katrore me 5 gradë lirie (testohet një hipotezë e thjeshtë):

X 2 A = ((25-25) 2 +(24-25) 2 +(26-25) 2 +(25-25) 2 +(24-25) 2)/(100∙0,25∙0,75)=0,16

X 2 B = ((29-25) 2 +(21-25) 2 +(23-25) 2 +(30-25) 2 +(19-25) 2)/(100∙0,25∙0,75)=5,17

Vlera mesatare m [χ 2 n =5 ]=5, devijimi standard σ[χ 2 n =5 ]=(2∙5) 1/2 =3.2.

Prandaj, pa iu referuar tabelave, është e qartë se vlera e X 2 B është tipike, dhe vlera e X 2 A është jashtëzakonisht e vogël. Sipas tabelave P (χ 2 n =5<0.16)<0.0001.

Ky shembull është një përshtatje e një rasti real që ka ndodhur në vitet 1930 (shih veprën e Kolmogorov "Mbi një tjetër provë të ligjeve të Mendelit"). Është interesante se studiuesi A ishte një ithtar i gjenetikës, ndërsa studiuesi B ishte kundër saj.

Konfuzion në shënim.Është e nevojshme të dallojmë distancën Pearson, e cila kërkon konventa shtesë në llogaritjen e saj, nga koncepti matematikor i një ndryshoreje të rastësishme chi-square. Distanca e Pearson në kushte të caktuara ka një shpërndarje afër chi-squarit me n shkallë lirie. Prandaj, këshillohet MOS të shënoni distancën e Pearson me simbolin χ 2 n, por të përdorni një shënim të ngjashëm, por të ndryshëm X 2. .

Kriteri Pearson nuk është i gjithëfuqishëm. Ka një numër të pafund alternativash për H 0 që ai nuk është në gjendje t'i marrë parasysh. Supozoni se po testoni hipotezën se tipari kishte një shpërndarje uniforme, ju keni 10 shifra dhe vektori i frekuencave të vëzhguara është i barabartë me (130,125,121,118,116,115,114,113,111,110). Kriteri Pearson nuk mund të "vërejë" se frekuencat janë në rënie monotonike dhe H 0 nuk do të refuzohet. Nëse do të plotësohej me një kriter serie, atëherë po!

Në praktikën e kërkimit biologjik, shpesh është e nevojshme të testohet një ose një hipotezë tjetër, domethënë, të zbulohet se në çfarë mase materiali faktik i marrë nga eksperimentuesi konfirmon supozimin teorik dhe në çfarë mase të dhënat e analizuara përkojnë me teorikisht të pritura. ato. Detyra lind për të vlerësuar statistikisht diferencën midis të dhënave aktuale dhe pritshmërisë teorike, duke përcaktuar se në cilat raste dhe me çfarë shkalle probabiliteti ky ndryshim mund të konsiderohet i besueshëm dhe, anasjelltas, kur duhet të konsiderohet i parëndësishëm, i parëndësishëm, brenda kufijve të rastësisë. Në rastin e fundit, ruhet hipoteza, mbi bazën e së cilës llogariten të dhënat ose treguesit e pritshëm teorikisht. Një teknikë e tillë variacional-statistikore për testimin e një hipoteze është metoda chi-katror (χ 2). Kjo masë shpesh quhet "kriteri i përshtatjes" ose "testi i përshtatshmërisë së Pearson". Me ndihmën e tij, me probabilitet të ndryshëm mund të gjykohet shkalla e korrespondencës së të dhënave të marra në mënyrë empirike me ato të pritura teorikisht.

Nga pikëpamja formale, krahasohen dy seri variacionesh, dy popullata: njëra është një shpërndarje empirike, tjetra është një mostër me të njëjtat parametra ( n, M, S etj.) është e njëjtë me atë empirike, por shpërndarja e saj e frekuencës është ndërtuar në përputhje të plotë me ligjin teorik të zgjedhur (normal, Poisson, binom, etj.), të cilit supozohet t'i bindet sjellja e ndryshores së rastësishme në studim. .

Në përgjithësi, formula për kriterin e pajtueshmërisë mund të shkruhet si më poshtë:

Ku a – shpeshtësia aktuale e vëzhgimeve,

A - frekuenca e pritur teorikisht për një klasë të caktuar.

Hipoteza zero supozon se nuk ka dallime të rëndësishme midis shpërndarjeve të krahasuara. Për të vlerësuar rëndësinë e këtyre dallimeve, duhet t'i referoheni një tabele të veçantë të vlerave kritike chi-square (Tabela 9 P) dhe, duke krahasuar vlerën e llogaritur χ 2 me tabelën, vendosni nëse shpërndarja empirike devijon në mënyrë të besueshme apo jo të besueshme nga ajo teorike. Kështu, hipoteza për mungesën e këtyre dallimeve ose do të hidhet poshtë ose do të lihet në fuqi. Nëse vlera e llogaritur χ 2 është e barabartë ose e tejkalon tabelën χ ² ( α , df), vendosin që shpërndarja empirike ndryshon ndjeshëm nga ajo teorike. Kështu, hipoteza për mungesën e këtyre dallimeve do të hidhet poshtë. Nëse χ ² < χ ² ( α , df), hipoteza zero mbetet e vlefshme. Në përgjithësi pranohet se niveli i pranueshëm i rëndësisë α = 0.05, sepse në këtë rast ka vetëm 5% mundësi që hipoteza zero të jetë e saktë dhe, për rrjedhojë, ka arsye të mjaftueshme (95%) për ta refuzuar atë.


Një problem i caktuar është përcaktimi i saktë i numrit të shkallëve të lirisë ( df), për të cilat vlerat e kriterit janë marrë nga tabela. Për të përcaktuar numrin e shkallëve të lirisë nga numri i përgjithshëm i klasave k ju duhet të zbritni numrin e kufizimeve (d.m.th. numrin e parametrave të përdorur për të llogaritur frekuencat teorike).

Në varësi të llojit të shpërndarjes së karakteristikës që studiohet, formula për llogaritjen e numrit të shkallëve të lirisë do të ndryshojë. Për alternativë shpërndarjet ( k= 2) vetëm një parametër (madhësia e mostrës) është i përfshirë në llogaritjet, prandaj, numri i shkallëve të lirisë është df= k−1=2−1=1. Për polinom Formula e shpërndarjes është e ngjashme: df= k−1. Për të kontrolluar korrespondencën e serisë së variacionit me shpërndarjen Poisson dy parametra janë përdorur tashmë - madhësia e mostrës dhe vlera mesatare (numerikisht që përkon me shpërndarjen); numri i shkallëve të lirisë df= k−2. Kur kontrolloni qëndrueshmërinë e shpërndarjes empirike, opsioni normale ose binom Sipas ligjit, numri i shkallëve të lirisë merret si numri i klasave aktuale minus tre kushte për ndërtimin e serive - madhësia e kampionit, mesatarja dhe varianca, df= k−3. Vlen të përmendet menjëherë se kriteri χ² funksionon vetëm për mostrat vëllim prej të paktën 25 variante, dhe frekuencat e klasave individuale duhet të jenë jo më i ulët se 4.

Së pari, ne ilustrojmë përdorimin e testit chi-square duke përdorur një shembull analize ndryshueshmëria alternative. Në një eksperiment për të studiuar trashëgiminë e domateve, u gjetën 3629 fruta të kuqe dhe 1176 të verdha. Raporti teorik i frekuencave për ndarjen e karaktereve në gjeneratën e dytë hibride duhet të jetë 3:1 (75% deri në 25%). A po zbatohet? Me fjalë të tjera, a është marrë ky kampion nga një popullatë në të cilën raporti i frekuencës është 3:1 apo 0.75:0.25?

Le të krijojmë një tabelë (Tabela 4), duke plotësuar vlerat e frekuencave empirike dhe rezultatet e llogaritjes së frekuencave teorike duke përdorur formulën:

A = n∙p,

Ku fq- frekuencat teorike (fraksionet e një lloji të caktuar),

n - Madhësia e mostrës.

Për shembull, A 2 = n∙p 2 = 4805∙0.25 = 1201.25 ≈ 1201.



Ju pëlqeu artikulli? Ndani me miqtë tuaj!