Pse nevojiten kriteret e pëlqimit? Testi i përshtatshmërisë Pearson χ2 (Chi-katror)

QËLLIMI I PUNËS

Qëllimi i kësaj pune laboratorike është:

· ndërtimi i ligjeve të shpërndarjes bazuar në rezultatet e eksperimentit ndryshore e rastësishme shpërndarja e parametrave të rezistorëve jo tela;

· testimi i hipotezës rreth ligj normal shpërndarja e devijimeve të parametrave të elementit;

· studim eksperimental ndryshimet në parametrat e rezistorëve pa tela kur ekspozohen ndaj temperaturës.

KOHËZGJATJA E PUNËS

Puna laboratorike kryhet gjatë një mësimi 4 orësh, duke përfshirë 1 orë për një kolokium për vlerësimin e njohurive të studentëve për pjesën teorike.

PJESA TEORIKE

Pajisjet radio-elektronike janë vazhdimisht nën ndikimin e faktorëve të rastësishëm shqetësues të jashtëm dhe të brendshëm, nën ndikimin e të cilëve ndryshojnë parametrat e elementeve të pajisjes. Ndryshimi i parametrave të elementeve (rezistorë, kondensatorë, pajisje gjysmëpërçuese, qarqe të integruara, etj.) shoqërohet me të ndryshme proceset fizike, që ndodhin në materiale për shkak të ndikimet e jashtme dhe plakjes. Për më tepër, parametrat e elementeve të BRE kanë një shpërndarje prodhimi, e cila është rezultat i ndikimit të faktorëve të rastësishëm gjatë prodhimit të tyre. Pajisjet e krijuara nga elementë të tillë reagojnë ndaj të gjitha ndryshimeve duke ndryshuar parametrat e daljes së tyre. Për të parashikuar besueshmërinë e BRE-ve, ekziston nevoja për të vendosur ligje për shpërndarjen e vlerës së rastësishme të shpërndarjes së parametrave të elementeve, të përcaktuara nga prodhimi i tyre dhe kushtet e jashtme shqetësuese (në veçanti, temperatura e ambientit).

punë laboratorike Duke përdorur kriterin e përshtatshmërisë (Pearson ose Kolmogorov), testohet hipoteza për ligjin e shpërndarjes normale të ndryshores së rastësishme X - shpërndarja e parametrave të elementeve.

KRITERET E MARREVESHJES TE PERDORUR PER TE TESTUAR HIPOTEZAT STATISTIKE

Kriteret e përshtatshmërisë na lejojnë të vlerësojmë probabilitetin e supozimit që kampioni i marrë nga eksperimenti nuk bie në kundërshtim me ligjin e zgjedhur a priori të shpërndarjes të ndryshores së rastësishme në shqyrtim. Zgjidhja e këtij problemi bazohet në përdorimin e pozicionit themelor të statistikave matematikore, sipas të cilit Funksioni i shpërndarjes empirike (statistikore) konvergjon sipas probabilitetit me funksionin e mëparshëm (teorik të krahasueshëm) të shpërndarjes kur madhësia e kampionit rritet pa kufi, me kusht që kampioni t'i përkasë shpërndarjes së mëparshme në fjalë.. Në vlera përfundimtare mostrat, funksionet empirike dhe a priori të shpërndarjes, në përgjithësi, do të ndryshojnë nga njëri-tjetri. Prandaj, për mostrën X 1 , X 2 ,… x n ndryshore e rastësishme Xështë paraqitur një masë e caktuar numerike e mospërputhjes (kriteri i përshtatshmërisë) () i funksionit të shpërndarjes empirike

, l =1, 2, …, n , (1)

Ku

= X 1 , X 2 ,… x n– mostër e të dhënave eksperimentale

dhe a priori – funksioni i shpërndarjes.

Rregulli për testimin e hipotezës për marrëveshjen ndërmjet shpërndarjeve apriori dhe empirike formulohet si më poshtë: nëse

atëherë hipoteza se shpërndarja paraprake të cilës i përket kampioni X 1 , X 2 ,…,x n e barabartë me F(X) duhet të refuzohet. Për të përcaktuar vlerën e pragut ME vendoset një probabilitet i caktuar i pranueshëm a për të hedhur poshtë hipotezën se kampioni i përket shpërndarjes F. Probabiliteti a quhet niveli i rëndësisë së kriterit të përshtatshmërisë. Pastaj

ato. MEvlera e pragut kriteri është i barabartë me pikën a-përqindje të funksionit të shpërndarjes së masës së divergjencës.

Ngjarja mund të ndodhë gjithashtu nëse hipoteza e paraqitur për ligjin e shpërndarjes është e vërtetë. Megjithatë, nëse a është mjaft e vogël, atëherë mundësia e situatave të tilla praktikisht mund të neglizhohet. Vlerat e specifikuara zakonisht për a janë a = 0.05 dhe a = 0.01.

Nëse ligji i shpërndarjes së masës së divergjencës () nuk varet nga F, pastaj rregulli për refuzimin e hipotezës së marrëveshjes dhe F

(4)

nuk varet nga shpërndarja paraprake. Kritere të tilla quhen joparametrike (shih seksionin 3.1.2).

Hipoteza për natyrën e shpërndarjes mund të testohet duke përdorur testin e përshtatshmërisë në një sekuencë të ndryshme: duke përdorur vlerën e marrë, është e nevojshme të përcaktohet probabiliteti a n= R{ n). Nëse vlera që rezulton a n < a , то отклонения значимые; если an³ a, atëherë devijimet nuk janë të rëndësishme. Vlerat e a n, shumë afër 1 (marrëveshje shumë e mirë) mund të tregojë cilësi të dobët të kampionit (për shembull, elementët që japin devijime të mëdha nga mesatarja u hodhën jashtë nga kampioni origjinal pa arsye).

Kriteret e përshtatshmërisë së përdorur në statistika ndryshojnë nga njëri-tjetri në matje të ndryshme të mospërputhjes midis ligjeve të shpërndarjes statistikore dhe teorike (). Disa prej tyre diskutohen më poshtë.

3.1.1. Kriteri i marrëveshjes c 2

Kur përdoret kriteri i përshtatshmërisë c 2 (kriteri i Pearson-it), masa e mospërputhjes midis shpërndarjeve empirike dhe atyre të mëparshme përcaktohet si më poshtë.

Rajoni vlerat e mundshme, mbi të cilën është përcaktuar F(x) - funksioni i shpërndarjes paraprake ndahet në numri përfundimtar intervale jo të mbivendosura – , i = 1, 2,…, L.

Le të prezantojmë shënimin: - probabilitet paraprak hitet e vlerës së mostrës në interval

Është e qartë se. Lërini elementet e kampionit të vëzhguar X 1 , X 2 ,…, x n i përkasin intervalit.

Është e qartë se.

Le të marrim si masë të mospërputhjes midis shpërndarjes empirike dhe apriori vlerën

, (5)

ku është numri i goditur eksperimental i vlerave të variablave të rastësishme x në interval,

L- numri i intervaleve në të cilat ndahen të gjitha vlerat eksperimentale të sasisë x,

n- madhësia e mostrës,

p i– probabiliteti i goditjes së një ndryshoreje të rastësishme x në intervalin -të, i llogaritur për ligjin teorik të shpërndarjes (produkti përcakton numrin e goditjeve në intervalin - për ligjin teorik).

Siç vërtetoi Pearson, kur n® ¥ ligji i shpërndarjes së sasisë (5) tenton të - shpërndarja me S = L- 1 shkallë lirie, përveç nëse hipoteza për shpërndarjen është e vërtetë.

Nëse kontrollohet hipoteza komplekse se kampioni i përket shpërndarjes , ku parametri i panjohur (skalar ose vektor) i shpërndarjes është , atëherë nga eksperimenti (bazuar në mostrën që rezulton) përcaktohet vlerësimi parametër i panjohur– . Në këtë rast, S - numri i shkallëve të lirisë c 2 - shpërndarja është e barabartë me L – r – 1, Ku r– numri i parametrave të shpërndarjes së vlerësuar. .

Rregulli për testimin e hipotezës nëse një kampion i përket një shpërndarjeje mund të formulohet si më poshtë: me një n(n> 50) dhe për një nivel të caktuar rëndësie a, hipoteza refuzohet nëse

ku - një - pikë përqindje - shpërndarjet me shkallë lirie.

Kriteri Kolmogorov

Le të marrim si masë të mospërputhjes midis shpërndarjeve apriori dhe empirike statistikat

().= , (7)

ku - kufiri i sipërm moduli i diferencës për të gjitha vlerat e marra X.

Shpërndarja e kësaj statistike (ndryshore e rastësishme) për çdo n nuk varet nga

Nëse vetëm një mostër X 1 , X 2 ,… x n sipas të cilit është ndërtuar i përket edhe ky i fundit - funksion të vazhdueshëm. Megjithatë, shprehja e saktë për funksionin e shpërndarjes në një vlerë të fundme n shumë i rëndë . A.N. Kolmogorov gjeti një shprehje mjaft të thjeshtë asimptotike (për ) për funksionet:

, z> 0. (8) Kështu, për madhësive të mëdha mostrat (me n> 50), duke përdorur (8) marrim

Kriteret për marrëveshje (përputhshmëri)

Për të testuar hipotezën për korrespondencën e shpërndarjes empirike me ligjin teorik të shpërndarjes, speciale tregues statistikor- kriteret e marrëveshjes (ose kriteret e pajtueshmërisë). Këtu përfshihen kriteret e Pearson, Kolmogorov, Romanovsky, Yastremsky, etj. Shumica e kritereve të marrëveshjes bazohen në përdorimin e devijimeve të frekuencave empirike nga ato teorike. Natyrisht, sa më të vogla të jenë këto devijime, aq më mirë shpërndarja teorike korrespondon me atë empirike (ose e përshkruan atë).

Kriteret e pëlqimit - këto janë kritere për testimin e hipotezave për korrespondencën e shpërndarjes empirike me shpërndarjen teorike të probabilitetit. Kriteret e tilla ndahen në dy klasa: të përgjithshme dhe të veçanta. Testet e përgjithshme të përshtatshmërisë zbatohen për formulimin më të përgjithshëm të një hipoteze, përkatësisht hipotezën që rezultatet e vëzhguara pajtohen me çdo shpërndarje probabiliteti të supozuar a priori. Testet speciale të përshtatshmërisë kërkojnë hipoteza të veçanta zero që formulojnë marrëveshje me një formë të caktuar shpërndarjet e probabilitetit.

Kriteret e pëlqimit bazuar në ligji i vendosur shpërndarjet bëjnë të mundur përcaktimin se kur mospërputhjet midis frekuencave teorike dhe empirike duhet të konsiderohen të parëndësishme (të rastësishme), dhe kur - të rëndësishme (jo të rastësishme). Nga kjo rrjedh se kriteret e marrëveshjes bëjnë të mundur që të refuzohet ose të konfirmohet korrektësia e hipotezës së paraqitur kur përafrohet seria në lidhje me natyrën e shpërndarjes në serinë empirike dhe të përgjigjet nëse është e mundur të pranohet për një shpërndarje të caktuar empirike një model i shprehur nga disa ligje teorike të shpërndarjes.

Testi i mirësisë së përshtatjes χ2 (chi-katror) i Pearson-it është një nga testet kryesore të përshtatshmërisë. Propozuar nga matematikani anglez Karl Pearson (1857-1936) për të vlerësuar rastësinë (rëndësinë) e mospërputhjeve midis frekuencave të shpërndarjeve empirike dhe teorike:

Ku k- numri i grupeve në të cilat ndahet shpërndarja empirike; fi- frekuenca empirike e një tipari në i-grupi; / ts °р - frekuenca teorike e hyrjes i-të grup.

Skema e zbatimit të kriterit y) për të vlerësuar konsistencën e shpërndarjeve teorike dhe empirike zbret në vijim.

  • 1. Përcaktohet masa e llogaritur e mospërputhjes % 2 asc.
  • 2. Përcaktohet numri i shkallëve të lirisë.
  • 3. Bazuar në numrin e shkallëve të lirisë v, %^bl përcaktohet duke përdorur një tabelë të veçantë
  • 4. Nëse % 2 asch >x 2 abl, atëherë për një nivel të caktuar rëndësie a dhe numrin e shkallëve të lirisë v, hidhet poshtë hipoteza për parëndësinë (rastësinë) e mospërputhjeve. Përndryshe, hipoteza mund të njihet si jo në kundërshtim me të dhënat eksperimentale të marra dhe me probabilitetin (1 - a) mund të argumentohet se mospërputhjet midis frekuencave teorike dhe empirike janë të rastësishme.

Niveli i rëndësisë - kjo është probabiliteti për të refuzuar gabimisht hipotezën e paraqitur, d.m.th. probabiliteti që një hipotezë e saktë të refuzohet. NË hulumtim statistikor Në varësi të rëndësisë dhe përgjegjësisë së detyrave që zgjidhen, përdoren tre nivelet e mëposhtme të rëndësisë:

  • 1) a = 0.1, atëherë P = 0,9;
  • 2) a = 0.05, atëherë P = 0,95;
  • 3) a = 0.01, atëherë P = 0,99.

Duke përdorur kriterin e përshtatshmërisë y), Duhet të plotësohen kushtet e mëposhtme.

  • 1. Vëllimi i popullsisë në studim duhet të plotësojë kushtin p> 50, ndërsa frekuenca ose madhësia e grupit duhet të jetë së paku 5. Nëse shkelet ky kusht, duhet së pari të kombinohen frekuenca të vogla (më pak se 5).
  • 2. Shpërndarja empirike duhet të përbëhet nga të dhëna të marra si rezultat i kampionimit të rastësishëm, d.m.th. ato duhet të jenë të pavarura.

Disavantazhi i kriterit të përshtatshmërisë së Pearson-it është humbja e një pjese të informacionit origjinal që lidhet me nevojën për të grupuar rezultatet e vëzhgimit në intervale dhe për të kombinuar intervale individuale me një numër të vogël vëzhgimesh. Në këtë drejtim, rekomandohet plotësimi i kontrollit të përputhshmërisë së shpërndarjes me kriterin y) kritere të tjera. Kjo është veçanërisht e nevojshme kur madhësia e mostrës është n ~ 100.

Në statistika, testi i përshtatshmërisë Kolmogorov (i njohur gjithashtu si testi i përshtatshmërisë Kolmogorov-Smirnov) përdoret për të përcaktuar nëse dy shpërndarje empirike i binden të njëjtit ligj ose për të përcaktuar nëse një shpërndarje që rezulton i bindet një modeli të supozuar. . Kriteri Kolmogorov bazohet në përcaktimin e mospërputhjes maksimale midis frekuencave të grumbulluara ose frekuencave të shpërndarjeve empirike ose teorike. Kriteri Kolmogorov llogaritet duke përdorur formulat e mëposhtme:

Ku D Dhe d- në përputhje me rrethanat, diferenca maksimale midis frekuencave të akumuluara (/-/") dhe midis frekuencave të grumbulluara ( rr") seritë empirike dhe teorike të shpërndarjeve; N- numri i njësive në total.

Duke llogaritur vlerën X, përdoret një tabelë e veçantë për të përcaktuar probabilitetin me të cilin mund të thuhet se devijimet e frekuencave empirike nga ato teorike janë të rastësishme. Nëse shenja merr vlera deri në 0.3, atëherë kjo do të thotë se ka një koincidencë të plotë të frekuencave. Me një numër të madh vëzhgimesh, testi Kolmogorov është në gjendje të zbulojë çdo devijim nga hipoteza. Kjo do të thotë që çdo ndryshim në shpërndarjen e mostrës nga ai teorik do të zbulohet me ndihmën e tij nëse ka një numër mjaft të madh vëzhgimesh. Rëndësia praktike e kësaj prone është e parëndësishme, pasi në shumicën e rasteve është e vështirë të llogaritet në marrjen e numër i madh Vëzhgimet në kushte konstante, ideja teorike e ligjit të shpërndarjes të cilit duhet t'i bindet kampioni është gjithmonë e përafërt, dhe saktësia e testeve statistikore nuk duhet të kalojë saktësinë e modelit të zgjedhur.

Testi i përshtatshmërisë së Romanovsky-t bazohet në përdorimin e kriterit Pearson, d.m.th. vlerat e gjetura tashmë x 2 > dhe numri i shkallëve të lirisë:

ku v është numri i shkallëve të lirisë së variacionit.

Kriteri Romanovsky është i përshtatshëm në mungesë të tabelave për x2. Nëse K r TE? > 3, atëherë ato janë jo të rastësishme dhe shpërndarja teorike nuk mund të shërbejë si model për shpërndarjen empirike që studiohet.

B. S. Yastremsky përdori në kriterin e marrëveshjes jo numrin e shkallëve të lirisë, por numrin e grupeve ( k), një vlerë e veçantë 0, në varësi të numrit të grupeve, dhe një vlerë chi-katrore. Kriteri i marrëveshjes Yastremsky ka të njëjtin kuptim si kriteri Romanovsky dhe shprehet me formulën

ku x 2 është testi i përshtatshmërisë së Pearson; /e gr - numri i grupeve; 0 - koeficienti, për numrin e grupeve më pak se 20 i barabartë me 0.6.

Nëse akti 1ph > 3, mospërputhjet midis shpërndarjeve teorike dhe empirike nuk janë të rastësishme, d.m.th. shpërndarja empirike nuk i plotëson kërkesat e një shpërndarjeje normale. Nëse 1f veprojnë

Në këtë pjesë, ne do të shqyrtojmë një nga çështjet që lidhen me testimin e besueshmërisë së hipotezave, përkatësisht çështjen e konsistencës së shpërndarjes teorike dhe statistikore.

Le të supozojmë se kjo shpërndarje statistikore është përafruar duke përdorur një kurbë teorike f(x)(Fig. 7.6.1). Pavarësisht se sa mirë është përzgjedhur kurba teorike, disa mospërputhje janë të pashmangshme midis saj dhe shpërndarjes statistikore. Natyrisht lind pyetja: a shpjegohen këto mospërputhje vetëm nga rrethana të rastësishme që lidhen me një numër të kufizuar vëzhgimesh, apo janë të rëndësishme dhe shoqërohen me faktin se kurba që zgjodhëm nuk e zbut mirë shpërndarjen e dhënë statistikore. Për t'iu përgjigjur kësaj pyetjeje, përdoren të ashtuquajturat "kritere të pëlqimit".

LIGJET E SHPËRNDARJES SË NDRYSHOREVE TË RASTËSISHME



Ideja pas aplikimit të kritereve të pëlqimit është si më poshtë.

Bazuar në këtë material statistikor, ne duhet të testojmë hipotezën N, që konsiston në faktin se ndryshorja e rastit X i bindet disa ligjeve specifike të shpërndarjes. Ky ligj mund të specifikohet në një formë ose në një tjetër: për shembull, në formën e një funksioni shpërndarjeje F(x) ose si dendësi e shpërndarjes f (x), ose si një grup probabiliteti p t , Ku p t- probabiliteti që vlera X do të bien brenda Unë diçka shkarkimi.

Meqenëse prej këtyre formave funksioni i shpërndarjes F(x)është më e përgjithshme dhe përcakton ndonjë tjetër, ne do të formulojmë një hipotezë N, pasi konsiston në faktin se sasia X ka një funksion të shpërndarjes ^(q:).

Për të pranuar ose hedhur poshtë një hipotezë N, konsideroni një sasi U, duke karakterizuar shkallën e mospërputhjes midis teorike dhe shpërndarjet statistikore. Madhësia U mund të zgjidhen në mënyra të ndryshme; për shembull, si U ju mund të merrni shumën e devijimeve në katror të probabiliteteve teorike p t nga frekuencat përkatëse p* ose shuma e katrorëve të njëjtë me disa koeficientë (“pesha”), ose devijimi maksimal funksion statistikor shpërndarja F*(x) nga teorike F(x) etj. Le të supozojmë se vlera U zgjedhur në një mënyrë ose në një tjetër. Është e qartë se ka disa ndryshore e rastësishme. Ligji i shpërndarjes së kësaj ndryshoreje të rastësishme varet nga ligji i shpërndarjes së ndryshores së rastit X, mbi të cilat u kryen eksperimentet dhe mbi numrin e eksperimenteve fq. Nëse hipoteza Nështë e vërtetë, atëherë ligji i shpërndarjes së sasisë U të përcaktuar me ligjin e shpërndarjes së sasisë X(funksioni F(x)) dhe numri fq.

Le të supozojmë se e njohim këtë ligj të shpërndarjes. Si rezultat i kësaj serie eksperimentesh, u zbulua se masa që ne zgjodhëm



KRITERET E Pëlqimit


mospërputhjet U mori njëfarë kuptimi A. Pyetja është nëse kjo mund të shpjegohet me shkaqe të rastësishme apo nëse kjo mospërputhje është shumë e madhe dhe tregon praninë e një ndryshimi domethënës midis shpërndarjeve teorike dhe statistikore dhe, për rrjedhojë, papërshtatshmërinë e hipotezës. N? Për t'iu përgjigjur kësaj pyetjeje, supozojmë se hipoteza Nështë e saktë, dhe sipas këtij supozimi ne llogarisim probabilitetin që, për arsye të rastësishme që lidhen me një sasi të pamjaftueshme të materialit eksperimental, masa e mospërputhjes U do të jetë jo më pak se vlera që kemi vëzhguar eksperimentalisht Dhe, d.m.th., ne llogarisim probabilitetin e ngjarjes:

Nëse ky probabilitet është shumë i vogël, atëherë hipoteza N duhet të refuzohet si më pak e besueshme; nëse ky probabilitet është i rëndësishëm, duhet pranuar se të dhënat eksperimentale nuk kundërshtojnë hipotezën N.

Shtrohet pyetja: si duhet zgjedhur masa e divergjencës £/? Rezulton se me disa metoda të zgjedhjes së tij, ligji i shpërndarjes së sasisë U ka shumë veti të thjeshta dhe me një mjaft të madhe n praktikisht i pavarur nga funksioni F(x). Janë pikërisht këto masa të mospërputhjes që përdoren në statistika matematikore si kriter pëlqimi.

Le të shqyrtojmë një nga kriteret më të përdorura të marrëveshjes - të ashtuquajturin "kriter y?" Pearson.

Le të supozojmë se janë kryer hektarë eksperimentesh të pavarura, secila prej të cilave përmban një ndryshore të rastit X mori një kuptim të caktuar. Rezultatet eksperimentale janë përmbledhur në k kategoritë dhe të paraqitura në formën e një serie statistikore.

Në këtë shënim, shpërndarja χ 2 përdoret për të testuar konsistencën e një grupi të dhënash me një shpërndarje probabiliteti fiks. Kriteri i marrëveshjes shpesh O Ju që i përkisni një kategorie të caktuar krahasoheni me frekuencat që priten teorikisht nëse të dhënat në të vërtetë kishin shpërndarjen e specifikuar.

Testimi duke përdorur kriterin e përshtatshmërisë χ 2 kryhet në disa faza. Së pari, përcaktohet një shpërndarje specifike probabiliteti dhe krahasohet me të dhënat origjinale. Së dyti, parashtrohet një hipotezë në lidhje me parametrat e shpërndarjes së probabilitetit të zgjedhur (për shembull, pritshmëria e saj matematikore) ose kryhet vlerësimi i tyre. Së treti, bazuar në shpërndarja teorike Përcaktohet probabiliteti teorik që i përgjigjet secilës kategori. Së fundi, statistika e testit χ2 përdoret për të kontrolluar konsistencën e të dhënave dhe shpërndarjes:

Ku f 0- frekuenca e vëzhguar, f e- frekuenca teorike ose e pritshme, k- numri i kategorive të mbetura pas bashkimit, r- numri i parametrave që do të vlerësohen.

Shkarkoni shënimin në ose format, shembuj në format

Përdorimi i testit χ2 të mirësisë së përshtatjes për shpërndarjen Poisson

Për të llogaritur duke përdorur këtë formulë në Excel, është e përshtatshme të përdorni funksionin =SUMPRODUCT() (Fig. 1).

Për të vlerësuar parametrin λ ju mund të përdorni vlerësimin . Frekuenca teorike X suksese (X = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 dhe më shumë) që korrespondojnë me parametrin λ = 2.9 mund të përcaktohet duke përdorur funksionin =POISSON.DIST(X;;FALSE). Duke shumëzuar probabilitetin Poisson me madhësinë e kampionit n, marrim frekuencën teorike f e(Fig. 2).

Oriz. 2. Aktuale dhe frekuencat teorike mbërritjet në minutë

Siç vijon nga Fig. 2, frekuenca teorike e nëntë ose më shumë mbërritjeve nuk kalon 1.0. Për të siguruar që çdo kategori të përmbajë një frekuencë prej 1.0 ose më shumë, kategoria "9 ose më shumë" duhet të kombinohet me kategorinë "8". Kjo do të thotë, mbeten nëntë kategori (0, 1, 2, 3, 4, 5, 6, 7, 8 dhe më shumë). Sepse pritje matematikore Shpërndarja Poisson përcaktohet në bazë të të dhënave të mostrës, numri i shkallëve të lirisë është i barabartë me k – p – 1 = 9 – 1 – 1 = 7. Duke përdorur një nivel të rëndësisë të barabartë me 0,05 gjejmë vlerë kritike statistika χ 2, e cila ka 7 shkallë lirie sipas formulës =HI2.OBR(1-0.05;7) = 14.067. Rregulli vendimtar formuluar si më poshtë: hipotezë H 0 refuzohet nëse χ 2 > 14.067, përndryshe hipoteza H 0 nuk devijon.

Për të llogaritur χ 2 përdorim formulën (1) (Fig. 3).

Oriz. 3. Llogaritja e kriterit χ 2 -mirësia e përshtatjes për shpërndarjen Poisson

Meqenëse χ 2 = 2,277< 14,067, следует, что гипотезу H 0 nuk mund të refuzohet. Me fjalë të tjera, nuk kemi arsye të pohojmë se ardhja e klientëve në bankë nuk i bindet shpërndarjes Poisson.

Zbatimi i testit χ2 -mirësisë së përshtatjes për shpërndarje normale

Në shënimet e mëparshme, gjatë testimit të hipotezave rreth variablave numerikë, supozuam se popullsia në studim ishte e shpërndarë normalisht. Për të kontrolluar këtë supozim, mund të përdorni mjete grafike, për shembull, një grafik kutie ose një grafik të shpërndarjes normale (për më shumë detaje, shihni). Në vëllime të mëdha mostra, për të testuar këto supozime, ju mund të përdorni testin e mirësisë së përshtatjes χ 2 për shpërndarje normale.

Le të shqyrtojmë, si shembull, të dhënat për kthimet 5-vjeçare të 158 fondeve investuese (Fig. 4). Supozoni se doni të besoni nëse të dhënat shpërndahen normalisht. Hipotezat zero dhe alternative janë formuluar si më poshtë: H 0: Rendimenti 5-vjeçar bindet shpërndarje normale, H 1: Rendimenti 5-vjeçar nuk ndjek një shpërndarje normale. Shpërndarja normale ka dy parametra - pritshmërinë matematikore μ dhe devijimi standardσ, e cila mund të vlerësohet bazuar në të dhënat e mostrës. NË në këtë rast = 10,149 dhe S = 4,773.

Oriz. 4. Një grup i porositur që përmban të dhëna për kthimin mesatar vjetor pesëvjeçar prej 158 fondesh

Të dhënat mbi kthimet e fondeve mund të grupohen, për shembull, në klasa (intervale) me një gjerësi prej 5% (Fig. 5).

Oriz. 5. Shpërndarja e frekuencës për kthimet mesatare vjetore pesëvjeçare prej 158 fondesh

Meqenëse shpërndarja normale është e vazhdueshme, është e nevojshme të përcaktohet zona e shifrave të kufizuara nga kurba e shpërndarjes normale dhe kufijtë e secilit interval. Për më tepër, duke qenë se shpërndarja normale teorikisht varion nga –∞ në +∞, është e nevojshme të merret parasysh zona e formave që bien jashtë kufijve të klasës. Pra, zona nën lakoren normale në të majtë të pikës –10 është e barabartë me sipërfaqen e figurës që shtrihet nën kurbën normale të standardizuar në të majtë të vlerës Z e barabartë me

Z = (–10 – 10,149) / 4,773 = –4,22

Zona e figurës që shtrihet nën lakoren normale të standardizuar në të majtë të vlerës Z = –4.22 përcaktohet me formulën =NORM.DIST(-10;10.149;4.773; E VËRTETË) dhe është afërsisht e barabartë me 0.00001. Për të llogaritur sipërfaqen e figurës që shtrihet nën kurbën normale midis pikave –10 dhe –5, së pari duhet të llogaritni sipërfaqen e figurës që shtrihet në të majtë të pikës –5: =NORM.DIST( -5,10,149,4,773, E VËRTETË) = 0,00075 . Pra, zona e figurës që shtrihet nën lakoren normale midis pikave –10 dhe –5 është 0,00075 – 0,00001 = 0,00074. Në mënyrë të ngjashme, ju mund të llogarisni sipërfaqen e figurës të kufizuar nga kufijtë e secilës klasë (Fig. 6).

Oriz. 6. Zonat dhe frekuencat e pritura për çdo klasë të kthimeve 5-vjeçare

Mund të shihet se frekuencat teorike në katër klasat ekstreme (dy minimale dhe dy maksimale) janë më të vogla se 1, kështu që ne do t'i kombinojmë klasat, siç tregohet në figurën 7.

Oriz. 7. Llogaritjet e lidhura me përdorimin e testit të mirësisë χ 2 për shpërndarjen normale

Ne përdorim kriterin χ 2 për përputhjen e të dhënave me një shpërndarje normale duke përdorur formulën (1). Në shembullin tonë, pas bashkimit, mbeten gjashtë klasa. Meqenëse vlera e pritur dhe devijimi standard vlerësohen nga të dhënat e mostrës, numri i shkallëve të lirisë është kfq – 1 = 6 – 2 – 1 = 3. Duke përdorur një nivel të rëndësisë prej 0,05, gjejmë se vlera kritike e statistikave χ 2, e cila ka tre shkallë lirie = CI2.OBR(1-0,05;F3) = 7,815. Llogaritjet e lidhura me përdorimin e kriterit χ 2 të përshtatshmërisë janë paraqitur në Fig. 7.

Mund të shihet se χ 2 -statistika = 3,964< χ U 2 7,815, следовательно гипотезу H 0 nuk mund të refuzohet. Me fjalë të tjera, nuk kemi asnjë bazë për të pohuar se kthimet 5-vjeçare të fondeve të investimeve të fokusuara në rritje të lartë nuk i nënshtrohen një shpërndarjeje normale.

Në disa shënimet e fundit konsiderohen qasje të ndryshme për analizën e të dhënave kategorike. Përshkruhen metodat për testimin e hipotezave rreth të dhënave kategorike të marra nga analiza e dy ose më shumë mostrave të pavarura. Përveç testeve chi-square, merren parasysh procedurat joparametrike. Përshkruhet testi i gradës Wilcoxon, i cili përdoret në situatat kur nuk plotësohen kushtet e aplikimit t-kriteret për testimin e hipotezës për barazinë e pritjeve matematikore të dy grupeve të pavarura, si dhe testin Kruskal-Wallis, i cili është një alternativë ndaj analizës së variancës njëfaktoriale (Fig. 8).

Oriz. 8. Diagrami i bllokut metodat për testimin e hipotezave rreth të dhënave kategorike

Përdoren materiale nga libri Levin et al. – M.: Williams, 2004. – f. 763–769

Përkufizimi 51. Kriteret që ju lejojnë të gjykoni nëse vlerat janë të qëndrueshme X 1 , X 2 ,…, x n ndryshore e rastësishme X me një hipotezë në lidhje me funksionin e shpërndarjes së tij quhen kriteret e pëlqimit.

Ideja e përdorimit të kritereve të pëlqimit

Le të testohet një hipotezë bazuar në këtë material statistikor N, që konsiston në faktin se SV X i bindet disa ligjeve specifike të shpërndarjes. Ky ligj mund të specifikohet ose si funksion shpërndarjeje F(x), ose në formën e densitetit të shpërndarjes f(x), ose si një grup probabiliteti p i. Meqenëse nga të gjitha këto forma funksioni i shpërndarjes F(x) është më e përgjithshme (ekziston si për DSV ashtu edhe për NSV) dhe përcakton ndonjë tjetër, ne do të formulojmë një hipotezë N, pasi konsiston në faktin se sasia X ka një funksion shpërndarjeje F(x).

Për të pranuar ose hedhur poshtë një hipotezë N, merrni parasysh një sasi U, duke karakterizuar shkallën e divergjencës (devijimit) të shpërndarjeve teorike dhe statistikore. MadhësiaU mund të zgjidhen në mënyra të ndryshme: 1) shuma e devijimeve në katror të probabiliteteve teorike p i nga frekuencat përkatëse, 2) shuma e katrorëve të njëjtë me disa koeficientë (pesha), 3) devijimi maksimal i funksionit të shpërndarjes statistikore (empirike) nga ai teorik. F(x).

Lëreni vlerën U zgjedhur në një mënyrë ose në një tjetër. Natyrisht, kjo është një ndryshore e rastësishme. Ligji i shpërndarjes U varet nga ligji i shpërndarjes së ndryshores së rastit X, mbi të cilat u kryen eksperimentet dhe mbi numrin e eksperimenteve n. Nëse hipoteza Nështë e vërtetë, atëherë ligji i shpërndarjes së sasisë U të përcaktuar me ligjin e shpërndarjes së sasisë X(funksioni F(x)) dhe numri n.

Le të supozojmë se ky ligj i shpërndarjes është i njohur. Si rezultat i kësaj serie eksperimentesh, u zbulua se masa e zgjedhur e mospërputhjes U mori njëfarë kuptimi u. Pyetje: a mund të shpjegohet kjo me arsye të rastësishme apo kjo mospërputhje është gjithashtu është i madh dhe tregon praninë e një ndryshimi të rëndësishëm midis shpërndarjeve teorike dhe statistikore (empirike) dhe, për rrjedhojë, papërshtatshmërinë e hipotezës N? Për t'iu përgjigjur kësaj pyetjeje, supozojmë se hipoteza Nështë e saktë, dhe sipas këtij supozimi ne llogarisim probabilitetin që, për arsye të rastësishme që lidhen me një sasi të pamjaftueshme të materialit eksperimental, masa e mospërputhjes U do të jetë jo më pak se vlera e vëzhguar eksperimentalisht u, pra llogarisim probabilitetin e ngjarjes: .

Nëse ky probabilitet është i vogël, atëherë hipoteza N duhet të refuzohet si pak e besueshme, por nëse ky probabilitet është i rëndësishëm, atëherë arrijmë në përfundimin se të dhënat eksperimentale nuk kundërshtojnë hipotezën N.

Shtrohet pyetja: si duhet zgjedhur masa e mospërputhjes (devijimit)? U? Rezulton se me disa metoda të zgjedhjes së tij, ligji i shpërndarjes së sasisë U ka veti shumë të thjeshta dhe me një mjaft të madhe n praktikisht i pavarur nga funksioni F(x). Janë pikërisht këto masa të mospërputhjes që përdoren në statistikat matematikore si kritere për marrëveshje.

Përkufizimi 51/. Kriteri i marrëveshjes është kriteri për testimin e hipotezës për ligjin e supozuar të një shpërndarjeje të panjohur.

Për të dhëna sasiore me shpërndarje afër normales, përdorni parametrike metodat e bazuara në tregues të tillë si pritshmëria matematikore dhe devijimi standard. Në veçanti, për të përcaktuar besueshmërinë e diferencës në mesatare për dy mostra, përdoret metoda (kriteri) Student dhe për të gjykuar dallimet midis tre ose një numër i madh mostra, - test F, ose analiza e variancës. Nëse kemi të bëjmë me të dhëna jo sasiore ose mostrat janë shumë të vogla për të qenë të sigurt se popullatat nga të cilat janë marrë ndjekin një shpërndarje normale, atëherë përdorni joparametrike metoda - kriter χ 2(chi-square) ose Pearson për të dhënat dhe shenjat cilësore, renditjet, testet Mann-Whitney, Wilcoxon etj për të dhënat rendore.

Përveç kësaj, zgjedhja metodë statistikore varet nëse mostrat, vlerat e të cilave krahasohen janë të pavarur(d.m.th., për shembull, marrë nga dy grupe të ndryshme lëndësh) ose i varur(d.m.th., duke pasqyruar rezultatet e të njëjtit grup subjektesh para dhe pas ekspozimit ose pas dy ekspozimeve të ndryshme).

fq. 1. Testi Pearson (- chi-square)

Le të prodhohet n eksperimente të pavarura, në secilën prej të cilave ndryshorja e rastësishme X mori një vlerë të caktuar, domethënë, u dha një mostër e vëzhgimeve të ndryshores së rastësishme X (popullsia) vëllimi n. Le të shqyrtojmë problemin e kontrollit të afërsisë së funksioneve të shpërndarjes teorike dhe empirike për shpërndarje diskrete, domethënë është e nevojshme të kontrollohet nëse të dhënat eksperimentale janë në përputhje me hipotezën N 0, duke deklaruar se ndryshorja e rastësishme X ka një ligj të shpërndarjes F(x) në nivelin e rëndësisë α . Le ta quajmë këtë ligj "teorik".

Kur merrni një kriter të përshtatshmërisë për testimin e një hipoteze, përcaktoni masën D devijimet e funksionit të shpërndarjes empirike të një kampioni të caktuar nga funksioni i vlerësuar (teorik) i shpërndarjes F(x).

Masa më e përdorur është ajo e prezantuar nga Pearson. Le të shqyrtojmë këtë masë. Le të ndajmë grupin e vlerave të ndryshoreve të rastësishme Xr grupe - grupe S 1 , S 2 ,…, Sr, pa pikat e përbashkëta. Në praktikë, një ndarje e tillë kryhet duke përdorur ( r- 1) numrat c 1 < c 2 < … < c r-1. Në këtë rast, fundi i çdo intervali përjashtohet nga grupi përkatës, dhe ai i majtë përfshihet.

S 1 S 2 S 3 …. Sr -1 Sr

c 1 c 2 c 3 c r -1

Le p i, , - probabiliteti që SV X i përket grupit S i(qartësisht). Le n i, , - numri i sasive (variant) nga ato të vëzhguara, që i përket shumë S i(frekuencat empirike). Pastaj frekuenca relative e goditjeve SV X në shumë S in vëzhgimet. Është e qartë se,.

Për ndarjen e mësipërme, p i ka një rritje F(x) në set S i, dhe rritja është në të njëjtin grup. Le të përmbledhim rezultatet e eksperimenteve në një tabelë në formën e një serie statistikore të grupuar.

Kufijtë e grupit Frekuenca relative
S 1:x 1 – x 2
S 2: x 2 – x 3
Sr: xrxr +1

Duke ditur ligji teorik shpërndarja, ju mund të gjeni probabilitetet teorike të një ndryshoreje të rastësishme që bie në secilin grup: r 1 , r 2 , …, p r. Kur kontrollojmë konsistencën e shpërndarjeve teorike dhe empirike (statistikore), do të vazhdojmë nga mospërputhjet midis probabiliteteve teorike. p i dhe frekuencat e vëzhguara.

Për masë D mospërputhjet (devijimet) e funksionit të shpërndarjes empirike nga ai teorik marrin shumën e devijimeve në katror të probabiliteteve teorike p i nga frekuencat përkatëse të marra me "pesha" të caktuara c i: .

Shanset c i janë futur sepse rast i përgjithshëm devijimet që lidhen me grupe të ndryshme, nuk mund të konsiderohet i barabartë për nga rëndësia: i njëjtë në vlerë absolute devijimi mund të jetë i parëndësishëm nëse vetë probabiliteti p iështë i madh dhe shumë i dukshëm nëse është i vogël. Prandaj, natyrisht "peshat" c i marrin në përpjesëtim të zhdrejtë me probabilitetet. Si të zgjidhni këtë koeficient?

K. Pearson tregoi se nëse vendosim , atëherë për të mëdha n ligji i shpërndarjes së sasisë U ka veti shumë të thjeshta: praktikisht është i pavarur nga funksioni i shpërndarjes F(x) dhe mbi numrin e eksperimenteve n, por varet vetëm nga numri i grupeve r, përkatësisht, ky ligj me rritje n i afrohet të ashtuquajturës shpërndarje chi-square .

Nëse keni nevojë material shtesë për këtë temë, ose nuk e gjetët atë që po kërkoni, ju rekomandojmë të përdorni kërkimin në bazën e të dhënave tona të veprave:

Çfarë do të bëjmë me materialin e marrë:

Nëse ky material ishte i dobishëm për ju, mund ta ruani në faqen tuaj në rrjetet sociale:



Ju pëlqeu artikulli? Ndani me miqtë tuaj!