Testi statistikor i përshtatshmërisë së Pearson me fjalët tuaja. Kriteri i marrëveshjes

Kur analizon seri variacionesh shpërndarja vlerë të madhe ka sa shpërndarja empirike shenja korrespondon normale. Për ta bërë këtë, frekuencat e shpërndarjes aktuale duhet të krahasohen me ato teorike, të cilat janë karakteristike për një shpërndarje normale. Kjo do të thotë se, bazuar në të dhënat aktuale, është e nevojshme të llogariten frekuencat teorike të lakores së shpërndarjes normale, të cilat janë funksion i devijimeve të normalizuara.

Me fjalë të tjera, kurba empirike e shpërndarjes duhet të përafrohet me kurbën e shpërndarjes normale.

Karakteristikat objektive të pajtueshmërisë teorike Dhe empirike frekuencave mund të merret duke përdorur të veçanta tregues statistikor të cilat quhen kriteret e pëlqimit.

Kriteri i marrëveshjes quhet një kriter që ju lejon të përcaktoni nëse mospërputhja është empirike Dhe teorike shpërndarjet janë të rastësishme ose domethënëse, d.m.th. nëse të dhënat e vëzhgimit pajtohen me hipotezën statistikore të paraqitur ose nuk pajtohen. Shpërndarja popullsia, të cilën e ka për shkak të hipotezës së paraqitur, quhet teorike.

Ka nevojë për instalim kriter(rregull) që do të lejonte dikë të gjykonte nëse mospërputhja midis empirike dhe shpërndarjet teorike rastësore ose domethënëse. Nëse mospërputhja rezulton të jetë e rastit, atëherë ata besojnë se të dhënat (mostra) vëzhguese janë në përputhje me hipotezën e paraqitur për ligjin e shpërndarjes së popullatës së përgjithshme dhe, për rrjedhojë, hipoteza pranohet; nëse mospërputhja rezulton të jetë domethënëse, atëherë të dhënat e vëzhgimit nuk përputhen me hipotezën dhe ajo refuzohet.

Në mënyrë tipike, frekuencat empirike dhe teorike ndryshojnë sepse:

  • mospërputhja është e rastësishme dhe për shkak të sasi e kufizuar vëzhgime;
  • mospërputhja nuk është e rastësishme dhe shpjegohet me faktin se hipoteza statistikore se popullsia është e shpërndarë normalisht është e gabuar.

Kështu, kriteret e pëlqimit bëjnë të mundur që të refuzohet ose të konfirmohet korrektësia e hipotezës së paraqitur kur përafrohet seria për natyrën e shpërndarjes në serinë empirike.

Frekuencat empirike të marra si rezultat i vëzhgimit. Frekuencat teorike llogaritur duke përdorur formula.

Për ligji normal i shpërndarjes ato mund të gjenden si më poshtë:

  • Σƒ i - shuma e frekuencave empirike të grumbulluara (kumulative).
  • h - ndryshimi midis dy opsioneve fqinje
  • σ - devijimi standard i mostrës
  • t–devijimi i normalizuar (i standardizuar).
  • φ(t)–funksioni i densitetit të probabilitetit të shpërndarjes normale (i gjetur për vlerën korresponduese të t)

Ekzistojnë disa teste të përshtatshmërisë, më të zakonshmet prej të cilave janë: testi chi-square (Pearson), testi Kolmogorov, testi Romanovsky.

Testi i përshtatshmërisë së Pearson χ 2- një nga ato kryesore, i cili mund të përfaqësohet si shuma e raporteve të katrorëve të diferencave midis frekuencave teorike (f T) dhe empirike (f) me frekuencat teorike:

  • k është numri i grupeve në të cilat ndahet shpërndarja empirike,
  • f i -frekuenca e vëzhguar e tiparit në grupin e i-të,
  • f T – frekuenca teorike.

Për shpërndarjen χ 2, janë përpiluar tabela që tregojnë vlerën kritike të kriterit të përshtatshmërisë χ 2 për nivelin e zgjedhur të rëndësisë α dhe shkallët e lirisë df (ose ν).
Niveli i rëndësisë α është probabiliteti për të refuzuar gabimisht hipotezën e propozuar, d.m.th. probabiliteti që një hipotezë e saktë të refuzohet. R - rëndësi statistikore adoptimi hipoteza e saktë. Në statistika, tre nivele të rëndësisë përdoren më shpesh:

α=0.10, pastaj P=0.90 (në 10 raste nga 100)

α=0.05, pastaj P=0.95 (në 5 raste nga 100)

α=0.01, atëherë P=0.99 (në 1 rast nga 100) hipoteza e saktë mund të hidhet poshtë.

Numri i shkallëve të lirisë df përcaktohet si numri i grupeve në serinë e shpërndarjes minus numrin e lidhjeve: df = k –z. Numri i lidhjeve kuptohet si numri i treguesve të serisë empirike të përdorur në llogaritjen e frekuencave teorike, d.m.th. tregues që lidhin frekuencat empirike dhe teorike.Për shembull, kur përafrohet me një kurbë zile, ekzistojnë tre marrëdhënie.Prandaj, kur përafrohet ngakurba e zilesnumri i shkallëve të lirisë përcaktohet si df =k–3.Për të vlerësuar rëndësinë, vlera e llogaritur krahasohet me tabelën χ 2 tavolina

Me koincidencë të plotë të shpërndarjeve teorike dhe empirike χ 2 =0, përndryshe χ 2 > 0. Nëse χ 2 kalc > χ 2 tab , atëherë për një nivel të caktuar rëndësie dhe numër të shkallëve të lirisë, ne hedhim poshtë hipotezën për parëndësinë (rastësinë) e mospërputhjeve. Nëse llogaritet χ 2< χ 2 табл то ne e pranojmë hipotezën dhe me probabilitet P = (1-α) mund të argumentohet se mospërputhja midis teorisë dhe frekuencat empirike rastësisht. Prandaj, ka arsye për të pohuar se shpërndarja empirike bindet shpërndarje normale. Testi i përshtatshmërisë së Pearson-it përdoret nëse madhësia e popullsisë është mjaft e madhe (N>50) dhe frekuenca e secilit grup duhet të jetë së paku 5.

Bazuar në përcaktimin e mospërputhjes maksimale midis frekuencave të akumuluara empirike dhe teorike:

ku D dhe d janë, përkatësisht, diferenca maksimale ndërmjet frekuencave të grumbulluara dhe frekuencave të grumbulluara të shpërndarjeve empirike dhe teorike.
Duke përdorur tabelën e shpërndarjes së statistikave Kolmogorov, përcaktohet probabiliteti, i cili mund të ndryshojë nga 0 në 1. Kur P(λ) = 1, ka një koincidencë të plotë të frekuencave, P(λ) = 0 - një mospërputhje e plotë. Nëse vlera e probabilitetit P është e rëndësishme në lidhje me vlerën e gjetur λ, atëherë mund të supozojmë se mospërputhjet midis shpërndarjeve teorike dhe empirike janë të parëndësishme, domethënë ato janë të rastësishme.
Kushti kryesor për përdorimin e kriterit Kolmogorov është se numër i madh vëzhgimet.

Testi i mirësisë së Kolmogorov

Le të shqyrtojmë se si zbatohet kriteri Kolmogorov (λ) kur testimi i hipotezës së shpërndarjes normale popullata e përgjithshme.Përafrimi i shpërndarjes aktuale me kurbën e ziles përbëhet nga disa hapa:

  1. Krahasoni frekuencat aktuale dhe teorike.
  2. Bazuar në të dhënat aktuale, përcaktohen frekuencat teorike të kurbës së shpërndarjes normale, e cila është funksion i devijimit të normalizuar.
  3. Ata kontrollojnë deri në çfarë mase shpërndarja e karakteristikës korrespondon me normalen.

PërIVkolonat e tabelës:

Në MS Excel, devijimi i normalizuar (t) llogaritet duke përdorur funksionin NORMALIZATION. Është e nevojshme të zgjidhni një sërë qelizash të lira sipas numrit të opsioneve (rreshta fletëllogaritëse). Pa hequr përzgjedhjen, telefononi funksionin NORMALIZE. Në kutinë e dialogut që shfaqet, tregoni qelizat e mëposhtme, të cilat përmbajnë, përkatësisht, vlerat e vëzhguara (X i), mesataren (X) dhe devijimin standard Ϭ. Operacioni duhet të përfundojë të njëkohshme duke shtypur Ctrl+Shift+Enter

PërVkolonat e tabelës:

Funksioni i densitetit të probabilitetit të shpërndarjes normale φ(t) gjendet nga tabela e vlerave të funksionit lokal Laplace për vlerën përkatëse të devijimit të normalizuar (t)

PërVIkolonat e tabelës:

Testi i përshtatshmërisë Kolmogorov (λ) përcaktohet duke ndarë modulindiferenca maksimalendërmjet frekuencave kumulative empirike dhe teorike me rrënjën katrore të numrit të vëzhgimeve:

Duke përdorur një tabelë të veçantë probabiliteti për kriterin e marrëveshjes λ, ne përcaktojmë se vlera λ = 0,59 korrespondon me një probabilitet prej 0,88 (λ

Shpërndarja e frekuencave empirike dhe teorike, dendësia e probabilitetit të shpërndarjes teorike

Kur aplikoni teste të përshtatshmërisë për të kontrolluar nëse shpërndarja e vëzhguar (empirike) korrespondon me atë teorike, duhet bërë dallimi midis testimit të hipotezave të thjeshta dhe komplekse.

Testi i normalitetit Kolmogorov-Smirnov me një mostër bazohet në diferenca maksimale ndërmjet kumulative shpërndarja empirike mostra dhe shpërndarjen e supozuar (teorike) kumulative. Nëse statistika Kolmogorov-Smirnov D është domethënëse, atëherë hipoteza se shpërndarja përkatëse është normale duhet të hidhet poshtë.

Shihni gjithashtu

Kriteret për testimin e rastësisë dhe vlerësimin e vëzhgimeve të jashtme Literatura Hyrje Në praktikë analiza statistikore të dhënat eksperimentale, interesi kryesor nuk është vetë llogaritja e statistikave të caktuara, por përgjigjet e pyetjeve të këtij lloji. Në përputhje me rrethanat, janë zhvilluar shumë kritere për të verifikuar parashtruara hipoteza statistikore. Të gjitha kriteret për testimin e hipotezave statistikore ndahen në dy grupe të mëdha: parametrike dhe joparametrike.


Ndani punën tuaj në rrjetet sociale

Nëse kjo punë nuk ju përshtatet, në fund të faqes ka një listë të veprave të ngjashme. Ju gjithashtu mund të përdorni butonin e kërkimit


Test

Përdorimi i kritereve të pëlqimit

Hyrje

Letërsia

Hyrje

Në praktikën e analizës statistikore të të dhënave eksperimentale, interesi kryesor nuk është vetë llogaritja e statistikave të caktuara, por përgjigjet e pyetjeve të këtij lloji. A është me të vërtetë mesatarja e popullsisë e barabartë me një numër të caktuar? A është koeficienti i korrelacionit dukshëm i ndryshëm nga zero? A janë variancat e dy mostrave të barabarta? Dhe shumë pyetje të tilla mund të lindin, në varësi të problemit specifik të kërkimit. Prandaj, janë zhvilluar shumë kritere për të testuar hipotezat e propozuara statistikore. Ne do të shqyrtojmë disa nga më të zakonshmet prej tyre. Këto do të lidhen kryesisht me mesataret, variancat, koeficientët e korrelacionit dhe shpërndarjet e bollëkut.

Të gjitha kriteret për testimin e hipotezave statistikore ndahen në dy grupe të mëdha: parametrike dhe joparametrike. Testet parametrike bazohen në supozimin se të dhënat e mostrës janë nxjerrë nga një popullatë me një shpërndarje të njohur dhe detyra kryesore është të vlerësohen parametrat e kësaj shpërndarjeje. Testet joparametrike nuk kërkojnë ndonjë supozim për natyrën e shpërndarjes, përveç supozimit se ajo është e vazhdueshme.

Le të shohim së pari kriteret parametrike. Sekuenca e testit do të përfshijë formulimin e hipotezës zero dhe hipotezën alternative, formulimin e supozimeve që do të bëhen, përcaktimin e statistikave të mostrës së përdorur në test dhe, formimin e shpërndarjes së mostrës së statistikave që testohen, identifikimi i rajoneve kritike për kriterin e përzgjedhur dhe ndërtimi i një intervali besimi për statistikat e mostrës.

1 Kriteret e përshtatshmërisë për mjetet

Le të jetë hipoteza që testohet se parametri i popullsisë. Nevoja për një kontroll të tillë mund të lindë, për shembull, në situatën e mëposhtme. Supozoni se, bazuar në kërkime të gjera, është përcaktuar diametri i guaskës së një molusku fosil në sedimente nga një vend fiks. Le të kemi në dispozicion edhe një numër të caktuar predhash të gjetura në një vend tjetër, dhe bëjmë supozimin se një vend i caktuar nuk ndikon në diametrin e guaskës, d.m.th. se vlera mesatare e diametrit të guaskës për të gjithë popullsinë e molusqeve që dikur jetonin në një vend të ri është e barabartë me vlerën e njohur të marrë më herët gjatë studimit të këtij lloji të molusqeve në habitatin e parë.

Nëse kjo vlera e njohurështë e barabartë, atëherë hipoteza zero dhe hipoteza alternative shkruhen si më poshtë: Le të supozojmë se ndryshorja x në popullatën në shqyrtim ka shpërndarje normale, dhe sasia e variancës së popullsisë është e panjohur.

Ne do të testojmë hipotezën duke përdorur statistikat:

, (1)
ku është devijimi standard i mostrës.

U tregua se nëse është e vërtetë, atëherë t në shprehjen (1) ka një shpërndarje t Studenti me n-1 shkallë lirie. Nëse zgjedhim nivelin e rëndësisë (probabilitetin e refuzimit të hipotezës së saktë) të barabartë, atëherë në përputhje me atë që u diskutua në kapitulli i mëparshëm, mund të përcaktoni vlerat kritike për kontrollin =0.

në këtë rast, meqenëse shpërndarja Studenti është simetrike, atëherë (1-) një pjesë e sipërfaqes nën lakoren e kësaj shpërndarjeje me n-1 shkallë lirie do të përmbahet midis pikave dhe, të cilat janë të barabarta me njëra-tjetrën në vlerë absolute. Prandaj, të gjitha vlerat janë më pak se negative dhe më të mëdha se pozitive për shpërndarjen t me numri i dhënë shkallët e lirisë në nivelin e zgjedhur të rëndësisë do të përbëjnë rajonin kritik. Nëse vlera t mostrës bie brenda këtij rajoni, hipoteza alternative pranohet.

Intervali i besimit for është ndërtuar sipas metodës së përshkruar më parë dhe përcaktohet nga shprehja e mëposhtme

(2)

Pra, na tregoni në rastin tonë se diametri i guaskës së një molusku fosil është 18.2 mm. Ne kishim në dispozicion një mostër prej 50 predhash të gjetura rishtazi, për të cilat mm, a = 2,18 mm. Le të kontrollojmë: =18.2 kundër Ne kemi

Nëse niveli i rëndësisë zgjidhet =0.05 atëherë vlerë kritike. Nga kjo rrjedh se mund të refuzohet në favor në nivelin e rëndësisë =0.05. Kështu, për shembullin tonë hipotetik mund të thuhet (me njëfarë probabiliteti, sigurisht) se diametri i guaskës së molusqeve fosile lloj i caktuar varet nga vendet ku ata kanë jetuar.

Për shkak të faktit se shpërndarja t është simetrike, vetëm vlerat pozitive t të kësaj shpërndarjeje në nivele të zgjedhura të rëndësisë dhe numrin e shkallëve të lirisë. Për më tepër, merret parasysh jo vetëm pjesa e zonës nën kurbën e shpërndarjes në të djathtë të vlerës t, por edhe në të majtë të vlerës -t në të njëjtën kohë. Kjo për faktin se në shumicën e rasteve gjatë testimit të hipotezave na intereson rëndësia e devijimeve në vetvete, pavarësisht nëse këto devijime janë më të mëdha apo më të vogla, d.m.th. ne kontrollojmë kundër, jo kundër: >a ose:

Le të kthehemi tani në shembullin tonë. Intervali i besimit 100(1-)% për është

18,92,01

Le të shqyrtojmë tani rastin kur është e nevojshme të krahasohen mesataret e dy popullsive të përgjithshme. Hipoteza që testohet duket si kjo: : =0, : 0. Gjithashtu supozohet se ajo ka një shpërndarje normale me një mesatare dhe variancë, dhe - një shpërndarje normale me një mesatare dhe të njëjtën variancë. Përveç kësaj, supozojmë se mostrat nga të cilat vlerësohen popullatat e përgjithshme janë nxjerrë në mënyrë të pavarur nga njëra-tjetra dhe kanë një vëllim, përkatësisht, dhe nga pavarësia e mostrave rezulton se nëse marrim një numër më të madh të tyre dhe llogarisim mesataren vlerat për çdo çift, atëherë grupi i këtyre çifteve mesatare do të jetë plotësisht i pakorreluar.

Testimi i hipotezës zero bëhet duke përdorur statistika

(3)

ku dhe janë vlerësimet e variancës për kampionin e parë dhe të dytë, respektivisht. Është e lehtë të shihet se (3) është një përgjithësim i (1).

U tregua se statistikat (3) kanë një shpërndarje t studentore me shkallë lirie. Nëse dhe janë të barabarta, d.m.th. = = formula (3) është thjeshtuar dhe ka formën

(4)

Le të shohim një shembull. Le të supozojmë se gjatë matjes së gjetheve të kërcellit të së njëjtës popullatë bimore në dy sezone, fitohen këto rezultate: Supozojmë se kushtet për përdorimin e testit të Studentit, d.m.th. normaliteti i popullatave nga të cilat janë marrë kampionet, ekzistenca e një variance të panjohur por të njëjtë për këto popullata dhe pavarësia e mostrave janë të kënaqur. Le të vlerësojmë në nivelin e rëndësisë =0.01. ne kemi

Vlera e tabelës t = 2,58. Prandaj, hipoteza për barazinë e vlerave mesatare të gjatësisë së gjetheve të kërcellit për një popullatë bimore gjatë dy sezoneve duhet të hidhet poshtë në nivelin e zgjedhur të rëndësisë.

Kujdes! Hipoteza zero në statistikat matematikore është hipoteza se nuk ka dallime domethënëse midis treguesve të krahasuar, pavarësisht nëse bëhet fjalë për mesatare, varianca apo statistika të tjera. Dhe në të gjitha këto raste, nëse vlera empirike (e llogaritur me formulë) e kriterit është më e madhe se ajo teorike (e zgjedhur nga tabelat), ai refuzohet. Nëse vlera empirike është më e vogël se vlera e tabelës, atëherë ajo pranohet.

Për të ndërtuar një interval besimi për diferencën midis mesatareve të këtyre dy popullatave, le t'i kushtojmë vëmendje faktit që testi i Studentit, siç shihet nga formula (3), vlerëson rëndësinë e diferencës midis mesatareve relative. ndaj gabimit standard të këtij ndryshimi. Është e lehtë të verifikohet se emëruesi në (3) përfaqëson pikërisht këtë gabim standard duke përdorur marrëdhëniet e diskutuara më parë dhe supozimet e bëra. Në fakt, ne e dimë se në rastin e përgjithshëm

Nëse x dhe y janë të pavarura, atëherë edhe janë

Duke marrë vlerat e mostrës dhe në vend të x dhe y dhe duke kujtuar supozimin e bërë që të dy popullatat kanë të njëjtën variancë, ne marrim

(5)

Vlerësimi i variancës mund të merret nga relacioni i mëposhtëm

(6)

(Ne ndajmë me sepse dy sasi vlerësohen nga mostrat dhe, për rrjedhojë, numri i shkallëve të lirisë duhet të reduktohet me dy.)

Nëse tani e zëvendësojmë (6) në (5) dhe marrim rrënjën katrore, marrim emëruesin në shprehjen (3).

Pas këtij digresioni, le të kthehemi në ndërtimin e një intervali besimi për përmes -.

ne kemi

Le të bëjmë disa komente në lidhje me supozimet e përdorura në ndërtimin e testit t. Para së gjithash, u tregua se shkeljet e supozimit të normalitetit për kanë një efekt të parëndësishëm në nivelin e rëndësisë dhe fuqisë së testit për 30. Shkeljet e supozimit të homogjenitetit të variancave të të dy popullatave nga të cilat janë marrë mostrat janë gjithashtu i parëndësishëm, por vetëm në rastin kur madhësitë e mostrës janë të barabarta. Nëse variancat e të dy popullatave ndryshojnë nga njëra-tjetra, atëherë probabilitetet e gabimeve të tipit të parë dhe të dytë do të ndryshojnë ndjeshëm nga ato të pritshme.

Në këtë rast, kriteri duhet të përdoret për të kontrolluar

(7)

me numrin e shkallëve të lirisë

. (8)

Si rregull, rezulton të jetë një numër i pjesshëm, prandaj, kur përdorni tabelat e shpërndarjes t, është e nevojshme të merren vlerat e tabelës për vlerat më të afërta të numrit të plotë dhe të interpolohen për të gjetur t që korrespondon me mori një.

Le të shohim një shembull. Gjatë studimit të dy nëngrupeve të bretkosës së liqenit, u llogarit raporti i gjatësisë së trupit me gjatësinë e tibisë. Janë marrë dy mostra me vëllime =49 dhe =27. Mjetet dhe variancat e marrëdhënies që na intereson rezultuan të barabarta, përkatësisht =2,34; =2,08; =0,21; =0,35. Nëse tani testojmë hipotezën duke përdorur formulën (2), marrim atë

Në një nivel të rëndësisë prej =0.05, ne duhet të hedhim poshtë hipotezën zero (vlera e tabelës t = 1.995) dhe të supozojmë se ka dallime statistikisht domethënëse në nivelin e zgjedhur të rëndësisë midis vlerave mesatare të parametrave të matur për dy nënspeciet e bretkosave. .

Kur përdorim formulat (6) dhe (7) kemi

Në këtë rast, për të njëjtin nivel rëndësie =0.05, vlera e tabelës është t=2.015 dhe hipoteza zero pranohet.

Ky shembull tregon qartë se neglizhimi i kushteve të pranuara gjatë nxjerrjes së një kriteri të caktuar mund të çojë në rezultate që janë drejtpërdrejt të kundërta me ato që ndodhin në të vërtetë. Natyrisht, në këtë rast, duke pasur mostra të madhësive të ndryshme në mungesë të një fakti të paracaktuar se variancat e treguesit të matur në të dy popullatat janë statistikisht të barabarta, ishte e nevojshme të përdoren formulat (7) dhe (8), të cilat tregoi mungesën e dallimeve statistikisht të rëndësishme.

Prandaj, dëshiroj të përsëris edhe një herë se kontrolli i pajtueshmërisë me të gjitha supozimet e bëra gjatë nxjerrjes së një kriteri të caktuar është një kusht absolutisht i nevojshëm për përdorimin e saktë të tij.

Kërkesa konstante në të dy modifikimet e mësipërme të testit t ishte kërkesa që mostrat të jenë të pavarura nga njëri-tjetri. Megjithatë, në praktikë shpesh ka situata kur kjo kërkesë nuk mund të përmbushet për arsye objektive. Për shembull, disa tregues maten në të njëjtën kafshë ose zonë të territorit para dhe pas veprimit të një faktori të jashtëm, etj. Dhe në këto raste ne mund të jemi të interesuar të testojmë hipotezën kundër. Ne do të vazhdojmë të supozojmë se të dy mostrat janë nxjerrë nga popullata normale me të njëjtën variancë.

Në këtë rast, mund të përfitojmë nga fakti se diferencat midis sasive të shpërndara normalisht kanë gjithashtu një shpërndarje normale dhe për këtë arsye mund të përdorim testin t Studentit në formën (1). Kështu, do të testohet hipoteza që n dallime janë një kampion nga një popullatë e shpërndarë normalisht me një mesatare të barabartë me zero.

Duke treguar ndryshimin i-të me, kemi

, (9)
Ku

Le të shohim një shembull. Le të kemi në dispozicion të dhëna për numrin e impulseve të një qelize nervore individuale gjatë një intervali të caktuar kohor para () dhe pas () veprimit të stimulit:

Prandaj, duke pasur parasysh se (9) ka një shpërndarje t, dhe duke zgjedhur një nivel rëndësie prej =0.01, nga tabela përkatëse në Shtojcë gjejmë se vlera kritike e t për n-1=10-1=9 gradë e lirisë është 3.25. Krahasimi i statistikave t teorike dhe empirike tregon se hipoteza zero e mungesës së dallimeve statistikisht domethënëse midis shkallëve të qitjes para dhe pas stimulit duhet të refuzohet. Mund të konkludohet se stimuli i përdorur në mënyrë statistikore ndryshon ndjeshëm frekuencën e impulseve.

Në studimet eksperimentale, siç u përmend më lart, mostrat e varura shfaqen mjaft shpesh. Megjithatë, ky fakt ndonjëherë injorohet dhe testi t përdoret gabimisht në formën (3).

Papërshtatshmëria e kësaj mund të shihet duke marrë parasysh gabimet standarde të ndryshimit midis mjeteve të pakorreluara dhe të korreluara. Në rastin e parë

Dhe në të dytën

Gabimi standard i diferencës d është

Duke marrë parasysh këtë, emëruesi në (9) do të ketë formën

Tani le t'i kushtojmë vëmendje faktit që numëruesit e shprehjeve (4) dhe (9) përkojnë:

prandaj diferenca në vlerën e t në to varet nga emëruesit.

Kështu, nëse formula (3) përdoret në një problem me mostrat e varura, dhe mostrat kanë një korrelacion pozitiv, atëherë vlerat t që rezultojnë do të jenë më të vogla se sa duhet kur përdorni formulën (9) dhe mund të lindë një situatë ku hipoteza zero do të pranohet kur ajo është e rreme. Situata e kundërt mund të lindë kur ka një korrelacion negativ midis mostrave, d.m.th. në këtë rast, dallimet do të njihen si të rëndësishme që në fakt nuk janë.

Le t'i kthehemi përsëri shembullit me aktivitet impuls dhe të llogarisim vlerën t për të dhënat e dhëna duke përdorur formulën (3), duke mos i kushtuar vëmendje faktit që mostrat janë të lidhura. Ne kemi: Për numrin e shkallëve të lirisë të barabartë me 18, dhe nivelin e rëndësisë = 0,01, vlera e tabelës është t = 2,88 dhe, në shikim të parë, duket se asgjë nuk ka ndodhur, edhe kur përdoret një formulë që është e papërshtatshme për kushtet e dhëna. Dhe në këtë rast, vlera e llogaritur t çon në refuzimin e hipotezës zero, d.m.th. në të njëjtin përfundim që është bërë duke përdorur formulën (9), i saktë në këtë situatë.

Megjithatë, le të riformatojmë të dhënat ekzistuese dhe t'i paraqesim në formën e mëposhtme (2):

Këto janë të njëjtat vlera dhe ato mund të merren në një nga eksperimentet. Meqenëse të gjitha vlerat në të dy mostrat janë ruajtur, përdorimi i testit t Studentit në formulën (3) jep vlerën e fituar më parë = 3.32 dhe të çon në të njëjtin përfundim që është bërë tashmë.

Tani le të llogarisim vlerën e t duke përdorur formulën (9), e cila duhet të përdoret në këtë rast. Kemi: Vlera kritike e t në nivelin e zgjedhur të rëndësisë dhe nëntë shkallë lirie është 3.25. Rrjedhimisht, ne nuk kemi asnjë arsye për të hedhur poshtë hipotezën zero, ne e pranojmë atë dhe rezulton se ky përfundim është drejtpërdrejt i kundërt me atë që është bërë gjatë përdorimit të formulës (3).

Duke përdorur këtë shembull, ne u bindëm edhe një herë se sa e rëndësishme është të merren përfundime të sakta gjatë analizimit të të dhënave eksperimentale për t'u përputhur rreptësisht me të gjitha kërkesat që ishin bazë për përcaktimin e një kriteri të veçantë.

Modifikimet e konsideruara të testit të Studentit synojnë të testojnë hipotezat në lidhje me mesataren e dy mostrave. Megjithatë, lindin situata kur bëhet e nevojshme të nxirren përfundime në lidhje me barazinë e k mesatareve në të njëjtën kohë. Për këtë rast është zhvilluar edhe një procedurë e caktuar statistikore, e cila do të diskutohet më vonë gjatë diskutimit të çështjeve që kanë të bëjnë me analizën e variancës.

2 Testet e përshtatshmërisë për variancat

Testimi i hipotezave statistikore në lidhje me variancat e popullsisë kryhet në të njëjtën sekuencë si për mesataret. Le të kujtojmë shkurtimisht këtë sekuencë.

1. Formulohet një hipotezë zero (për mungesën e dallimeve statistikisht të rëndësishme midis variancave të krahasuara).

2. Janë bërë disa supozime lidhur me shpërndarjen kampione të statistikave me të cilat planifikohet të vlerësohet parametri i përfshirë në hipotezë.

3. Përzgjidhet niveli i rëndësisë për testimin e hipotezës.

4. Llogaritet vlera e statistikave me interes për ne dhe merret një vendim lidhur me vërtetësinë e hipotezës zero.

Tani le të fillojmë duke testuar hipotezën se varianca e popullatës =a, d.m.th. kundër. Nëse supozojmë se ndryshorja x ka një shpërndarje normale dhe se një kampion me madhësi n është nxjerrë nga popullata në mënyrë të rastësishme, atëherë statistikat përdoren për të testuar hipotezën zero.

(10)

Duke kujtuar formulën për llogaritjen e dispersionit, ne rishkruajmë (10) si më poshtë:

. (11)

Nga kjo shprehje është e qartë se numëruesi është shuma e katrorëve të devijimeve të vlerave të shpërndara normalisht nga mesatarja e tyre. Secila prej këtyre devijimeve gjithashtu shpërndahet normalisht. Prandaj, në përputhje me shpërndarjen e njohur për ne, shumat e katrorëve të vlerave të statistikave të shpërndara normalisht (10) dhe (11) kanë një - shpërndarje me n-1 shkallë lirie.

Në analogji me përdorimin e shpërndarjes t, kur kontrollohet për nivelin e zgjedhur të rëndësisë, pikat kritike përcaktohen nga tabela e shpërndarjes, që korrespondojnë me probabilitetet e pranimit të hipotezës zero dhe. Intervali i besimit për në të zgjedhur është ndërtuar si më poshtë:

. (12)

Le të shohim një shembull. Le të supozojmë, në bazë të një kërkimi të gjerë eksperimental, se shpërndarja e përmbajtjes së alkaloideve të një specie bimore nga një zonë e caktuar është e barabartë me 4,37 njësi konvencionale. Specialisti ka në dispozicion një kampion prej n = 28 bimë të tilla, me sa duket nga e njëjta zonë. Analiza tregoi se për këtë kampion =5.01 dhe ne duhet të sigurohemi që kjo dhe variancat e njohura më parë janë statistikisht të padallueshme në nivelin e sinjifikancës =0.1.

Sipas formulës (10) kemi

Vlera që rezulton duhet të krahasohet me vlerat kritike /2=0.05 dhe 1--/2=0.95. Nga tabela e Shtojcës për me 27 gradë lirie kemi përkatësisht 40.1 dhe 16.2, që do të thotë se hipoteza zero mund të pranohet. Intervali përkatës i besimit për është 3.37<<8,35.

Në ndryshim nga testimi i hipotezave në lidhje me mjetet e kampionit duke përdorur testin Studenti, kur gabimet e tipit të parë dhe të dytë nuk ndryshuan ndjeshëm kur shkelej supozimi i shpërndarjes normale të popullatave, në rastin e hipotezave për variancat kur kushtet e normalitetit nuk ishin u plotësuan, gabimet ndryshuan ndjeshëm.

Problemi i konsideruar më sipër në lidhje me barazinë e variancës me një vlerë fikse është me interes të kufizuar, pasi situatat janë mjaft të rralla kur dihet varianca e popullatës. Me interes shumë më të madh është rasti kur duhet të kontrolloni nëse variancat e dy popullatave janë të barabarta, d.m.th. testimi i një hipoteze kundrejt një alternative. Supozohet se mostrat e madhësisë dhe janë nxjerrë rastësisht nga popullatat e përgjithshme me varianca dhe.

Për të testuar hipotezën zero, përdoret testi i raportit të variancës së Fisher

(13)

Meqenëse shumat e devijimeve në katror të ndryshoreve të rastësishme të shpërndara normalisht nga mesatarja e tyre kanë një shpërndarje, si numëruesi ashtu edhe emëruesi i (13) janë vlera të shpërndara të pjesëtuara me dhe përkatësisht, dhe për këtë arsye raporti i tyre ka një shpërndarje F me -1 dhe -1 shkallë lirie.

Në përgjithësi pranohet - dhe kështu janë ndërtuar tabelat e shpërndarjes F - që variancat më të mëdha merret si numërues në (13), dhe për këtë arsye përcaktohet vetëm një pikë kritike, që korrespondon me nivelin e zgjedhur të rëndësisë.

Le të kemi në dispozicion dy mostra me vëllim =11 dhe =28 nga popullatat e kërmijve të zakonshëm dhe ovale të pellgjeve, për të cilët raportet lartësi-gjerësi kanë varianca =0,59 dhe =0,38. Është e nevojshme të testohet hipoteza për barazinë e këtyre variancave të këtyre treguesve për popullatat që studiohen në një nivel sinjifikance =0.05. ne kemi

Në literaturë, ndonjëherë mund të gjeni një deklaratë se testimi i hipotezës së barazisë së mesatareve duke përdorur testin e Studentit t-test duhet të paraprihet nga testimi i hipotezës së barazisë së variancave. Ky është rekomandim i gabuar. Për më tepër, mund të çojë në gabime që mund të shmangen nëse nuk ndiqen.

Në të vërtetë, rezultatet e testimit të hipotezës së barazisë së variancave duke përdorur testin e Fisher varen në masë të madhe nga supozimi se mostrat janë nxjerrë nga popullata me një shpërndarje normale. Në të njëjtën kohë, testi i Studentit është i pandjeshëm ndaj shkeljeve të normalitetit, dhe nëse është e mundur të merren mostra me madhësi të barabartë, atëherë supozimi i barazisë së variancave nuk është gjithashtu i rëndësishëm. Në rastin e n të pabarabartë, formulat (7) dhe (8) duhet të përdoren për verifikim.

Kur testohen hipotezat për barazinë e variancave, lindin disa veçori në llogaritjet që lidhen me mostrat e varura. Në këtë rast, statistikat përdoren për të testuar një hipotezë kundrejt një alternative

(14)

Nëse hipoteza zero është e vërtetë, atëherë statistikat (14) kanë një shpërndarje t Student me n-2 shkallë lirie.

Gjatë matjes së shkëlqimit të 35 mostrave të veshjes, është marrë një dispersion prej =134.5. Matjet e përsëritura dy javë më vonë treguan =199.1. Në këtë rast, koeficienti i korrelacionit midis matjeve të çiftuara doli të jetë i barabartë me =0.876. Nëse neglizhojmë faktin që mostrat janë të varura dhe përdorim testin Fisher për të testuar hipotezën, do të marrim F=1.48. Nëse zgjidhni nivelin e rëndësisë =0.05, atëherë hipoteza zero do të pranohet, pasi vlera kritike e shpërndarjes F për =35-1=34 dhe =35-1=34 gradë lirie është 1.79.

Në të njëjtën kohë, nëse përdorim formulën (14) të përshtatshme për këtë rast, fitojmë t = 2,35, ndërsa vlera kritike e t për 33 gradë lirie dhe niveli i zgjedhur i rëndësisë = 0,05 është i barabartë me 2,03. Prandaj, hipoteza zero e variancave të barabarta në të dy mostrat duhet të refuzohet. Kështu, nga ky shembull është e qartë se, si në rastin e testimit të hipotezës së barazisë së mjeteve, përdorimi i një kriteri që nuk merr parasysh specifikat e të dhënave eksperimentale çon në një gabim.

Në literaturën e rekomanduar mund të gjeni testin Bartlett, i cili përdoret për të testuar hipotezat rreth barazisë së njëkohshme të k variancave. Përveç faktit që llogaritja e statistikave të këtij kriteri është mjaft e mundimshme, disavantazhi kryesor i këtij kriteri është se është jashtëzakonisht i ndjeshëm ndaj devijimeve nga supozimi i shpërndarjes normale të popullatave nga të cilat janë nxjerrë mostrat. Kështu, kur e përdorni, nuk mund të jeni kurrë i sigurt se hipoteza zero refuzohet në të vërtetë sepse variancat janë statistikisht dukshëm të ndryshme dhe jo sepse mostrat nuk shpërndahen normalisht. Prandaj, nëse lind problemi i krahasimit të disa variancave, është e nevojshme të kërkohet një formulim i problemit ku do të jetë e mundur të përdoret kriteri Fisher ose modifikimet e tij.

3 Kriteret për marrëveshje lidhur me aksionet

Shumë shpesh është e nevojshme të analizohen popullatat në të cilat objektet mund të klasifikohen në njërën nga dy kategoritë. Për shembull, sipas gjinisë në një popullatë të caktuar, nga prania e një mikroelementi të caktuar në tokë, nga ngjyra e errët ose e hapur e vezëve në disa lloje zogjsh, etj.

Përpjesëtimin e elementeve që kanë një cilësi të caktuar e shënojmë me P, ku P përfaqëson raportin e objekteve me cilësinë që na intereson me të gjitha objektet në agregat.

Le të testojmë hipotezën se në një popullsi mjaft të madhe pjesa P është e barabartë me një numër a (0

Për variablat dikotomikë (që kanë dy shkallëzime), si në rastin tonë, P luan të njëjtin rol si mesatarja e popullsisë së variablave të matur në mënyrë sasiore. Nga ana tjetër, më parë është thënë se gabimi standard i fraksionit P mund të paraqitet si

Pastaj, nëse hipoteza është e vërtetë, atëherë statistikat

, (19)
ku p është vlera P e mostrës, ka një shpërndarje normale njësi. Duhet të theksohet menjëherë se një përafrim i tillë është i vlefshëm nëse më i vogli i produkteve np ose (1-p)n është më i madh se 5.

Le të dihet nga literatura se në popullatën e bretkosave të liqenit përqindja e individëve me një shirit gjatësor në shpinë është 62% ose 0,62. Ne kishim në dispozicion një kampion prej 125 (n) individësh, 93 (f) prej të cilëve kanë një shirit gjatësor në anën e pasme. Është e nevojshme të zbulohet nëse përqindja e individëve me tiparin me interes për ne në popullatën nga e cila është marrë kampioni korrespondon me të dhënat e njohura. Kemi: p=f/n=93/125=0.744, a=0.62, n(1-p)=125(1-0.744)=32>5 dhe

Prandaj, si për nivelin e rëndësisë = 0,05 dhe = 0,01, hipoteza zero duhet të refuzohet, pasi vlera kritike për = 0,05 është 1,96, dhe për = 0,01 - 2,58.

Nëse ka dy popullata të mëdha në të cilat proporcionet e objekteve me pronën që na intereson janë përkatësisht dhe, atëherë testimi i hipotezës: = kundër alternativës: është me interes. Për testim, dy mostra me vëllime dhe janë nxjerrë në mënyrë të rastësishme dhe të pavarur. Në bazë të këtyre mostrave, statistikat vlerësohen dhe përcaktohen.

(20)

ku dhe është numri i objekteve që posedojnë këtë karakteristikë, përkatësisht, në mostrat e para dhe të dyta.

Nga formula (20) mund të kuptohet se në derivimin e saj është përdorur i njëjti parim që e kemi hasur më herët. Përkatësisht, për të testuar hipotezat statistikore, përcaktohet numri i devijimeve standarde që përbëjnë diferencën midis treguesve me interes për ne, në fakt, vlera (+)/(+) përfaqëson proporcionin e objekteve me një karakteristikë të dhënë në të dyja; mostrat në të njëjtën kohë. Nëse e shënojmë me, atëherë shprehja në kllapin e dytë të emëruesit (20) përfaqëson (1-) dhe bëhet e qartë se shprehja (20) është ekuivalente me formulën për testimin e hipotezës zero:

Sepse.

Nga ana tjetër, është një gabim standard. Kështu, (20) mund të shkruhet si

. (21)

I vetmi ndryshim midis kësaj statistike dhe statistikës së përdorur në testimin e hipotezave rreth mesatareve është se z ka një shpërndarje normale njësi dhe jo një shpërndarje t.

Le të tregojë studimi i një grupi njerëzish (=82) se përqindja e njerëzve që kanë një ritëm në elektroencefalogramin e tyre është 0.84 ose 84%. Një studim i një grupi njerëzish në një zonë tjetër (=51) zbuloi se ky raport ishte 0.78. Për një nivel rëndësie prej =0.05, është e nevojshme të kontrollohet që proporcionet e individëve me aktivitet alfa të trurit në popullatat e përgjithshme nga të cilat janë marrë mostrat janë të njëjta.

Para së gjithash, le të sigurohemi që të dhënat eksperimentale të disponueshme të na lejojnë të përdorim statistikat (20). Ne kemi:

dhe meqenëse z ka një shpërndarje normale, për të cilën pika kritike në =0.05 është 1.96, atëherë hipoteza zero pranohet.

Kriteri i konsideruar është i vlefshëm nëse mostrat për të cilat janë krahasuar proporcionet e objekteve me karakteristikën që na intereson janë të pavarura. Nëse kjo kërkesë nuk plotësohet, për shembull, kur një popullatë konsiderohet në intervale të njëpasnjëshme kohore, atëherë i njëjti objekt mund ose nuk mund ta ketë këtë karakteristikë në këto intervale.

Le të shënojmë praninë e një objekti të një atributi që na intereson me 1 dhe mungesën e tij me 0. Më pas vijmë në tabelën 3, ku (a+c) është numri i objekteve në kampionin e parë që kanë ndonjë atribut , (a+c) është numri i objekteve me këtë karakteristikë në kampionin e dytë, dhe n është numri i përgjithshëm i objekteve të ekzaminuara. Natyrisht, kjo tashmë është një tabelë e njohur me katër fusha, marrëdhënia në të cilën vlerësohet duke përdorur koeficientin

Për një tryezë të tillë dhe të vogël (<10) значений в каждой клетке Р.Фишером было найдено точное распределение для, которое позволяет проверять гипотезу: =. Это распределение имеет довольно сложный вид, и его критические точки приводятся в специальных таблицах. В реальных ситуациях, как правило, значения в каждой клетке больше 10, и было показано, что в этих случаях для проверки нулевой гипотезы можно использовать статистику

(22)
e cila, nëse hipoteza zero është e vërtetë, ka një shpërndarje chi-katrore me një shkallë lirie.

Le të shohim një shembull. Le të testohet efektiviteti i vaksinimeve kundër malaries, të dhëna në periudha të ndryshme të vitit, gjatë dy viteve. ne kemi

Vlera e tabelës për =0.05 është 3.84, dhe për =0.01 është 6.64. Prandaj, në cilindo nga këto nivele të rëndësisë, hipoteza zero duhet të hidhet poshtë dhe në këtë shembull hipotetik (sado i lidhur me realitetin), mund të konkludohet se bastet e bëra në gjysmën e dytë të vitit janë dukshëm më efektive.

Një përgjithësim natyror i koeficientit të bashkimit për një tabelë me katër fusha është, siç u përmend më herët, koeficienti i konjugimit të ndërsjellë të Chuprov. Shpërndarja e saktë për këtë koeficient është e panjohur, kështu që vlefshmëria e hipotezës gjykohet duke krahasuar vlerën e llogaritur dhe nivelin e zgjedhur të rëndësisë me pikat kritike për këtë shpërndarje. Numri i shkallëve të lirisë përcaktohet nga shprehja (r-1)(c-1), ku r dhe c janë numri i gradimeve për secilën nga karakteristikat.

Le të kujtojmë formulat e llogaritjes

Paraqiten të dhënat e marra nga studimi i diapazonit të shikimit në syrin e djathtë dhe të majtë te njerëzit pa anomali vizuale. Në mënyrë konvencionale, kjo gamë ndahet në katër kategori, dhe ne jemi të interesuar për besueshmërinë e marrëdhënies midis diapazonit vizual të syve të majtë dhe të djathtë. Së pari, le të gjejmë të gjithë termat në shumën e dyfishtë. Për ta bërë këtë, katrori i secilës vlerë të dhënë në tabelë ndahet me shumën e rreshtit dhe kolonës së cilës i përket numri i zgjedhur. ne kemi

Duke përdorur këtë vlerë marrim =3303.6 dhe T=0.714.

4 Kriteret për krahasimin e shpërndarjeve të popullsisë

Në eksperimentet klasike të mbarështimit të bizeleve që shënuan fillimin e gjenetikës, G. Mendel vëzhgoi frekuencat e llojeve të ndryshme të farave të marra nga kryqëzimi i bimëve me farat e verdha të rrumbullakëta dhe farat jeshile të rrudhura.

Në këtë dhe raste të ngjashme, është me interes të testohet hipoteza zero për barazinë e funksioneve të shpërndarjes së popullatave të përgjithshme nga të cilat janë nxjerrë mostrat, d.m.th. Llogaritjet teorike kanë treguar se statistikat mund të përdoren për të zgjidhur një problem të tillë

= (23)

Kriteri që përdor këtë statistikë u propozua nga K. Pearson dhe mban emrin e tij. Testi Pearson përdoret për të dhëna të grupuara pavarësisht nëse ka një shpërndarje të vazhdueshme apo diskrete. Në (23), k është numri i intervaleve të grupimit, është numrat empirikë dhe është numrat e pritshëm ose teorik (=n). Nëse hipoteza zero është e vërtetë, statistikat (23) kanë një shpërndarje me k-1 shkallë lirie.

Për të dhënat e dhëna në tabelë

Pikat kritike të shpërndarjes me 3 shkallë lirie për =0.05 dhe =0.01 janë përkatësisht të barabarta me 7.81 dhe 11.3. Prandaj, hipoteza zero pranohet dhe nxirret përfundimi se ndarja në pasardhës korrespondon mjaft mirë me modelet teorike.

Le të shohim një shembull tjetër. Në një koloni derrash gini, numri i mëposhtëm i lindjeve meshkuj u mor nga viti në muaj, duke filluar nga janari: 65, 64, 65, 41, 72, 80, 88, 114, 80, 129, 112, 99. konsiderojmë se të dhënat e marra korrespondojnë me një shpërndarje uniforme, d.m.th. shpërndarja në të cilën numri i meshkujve të lindur në muajt individualë është mesatarisht i njëjtë? Nëse e pranojmë këtë hipotezë, atëherë numri mesatar i pritshëm i meshkujve të lindur do të jetë i barabartë. Pastaj

Vlera kritike e një shpërndarjeje me 11 gradë lirie dhe = 0.01 është 24.7, kështu që në nivelin e zgjedhur të rëndësisë hipoteza zero hidhet poshtë. Analiza e mëtejshme e të dhënave eksperimentale tregon se gjasat që derrat meshkuj të lindin në gjysmën e dytë të vitit rriten.

Në rastin kur shpërndarja teorike supozohet të jetë uniforme, nuk ka probleme me llogaritjen e numrave teorikë. Në rastin e shpërndarjeve të tjera, llogaritjet bëhen më të ndërlikuara. Le të shohim shembuj se si llogariten numrat teorikë për shpërndarjet normale dhe Poisson, të cilat janë mjaft të zakonshme në praktikën kërkimore.

Le të fillojmë me përcaktimin e numrave teorikë për shpërndarjen normale. Ideja është të transformojmë shpërndarjen tonë empirike në një shpërndarje me zero mesatare dhe variancë njësi. Natyrisht, në këtë rast, kufijtë e intervaleve të klasës do të shprehen në njësi të devijimit standard, dhe më pas, duke kujtuar se zona nën seksionin e kurbës e kufizuar nga vlerat e sipërme dhe të poshtme të çdo intervali është e barabartë me probabilitetin të rënies në një interval të caktuar, duke e shumëzuar këtë probabilitet me kampionimin e numrit total do të marrim numrin teorik të dëshiruar.

Supozojmë se kemi një shpërndarje empirike për gjatësinë e gjetheve të dushkut dhe duhet të kontrollojmë nëse mund të konsiderohet me një nivel sinjifikance =0.05 që kjo shpërndarje nuk ndryshon ndjeshëm nga normalja.

Le të shpjegojmë se si janë llogaritur vlerat e dhëna në tabelë. Së pari, duke përdorur metodën standarde për të dhënat e grupuara, u llogarit mesatarja dhe devijimi standard, i cili rezultoi të jetë i barabartë me =10.3 dhe =2.67. Duke përdorur këto vlera, kufijtë e intervaleve u gjetën në njësi të devijimit standard, d.m.th. janë gjetur vlera të standardizuara Për shembull, për kufijtë e intervalit (46) kemi: (4-10.3)/2.67=-2.36; (6-10.3)/2.67=-1.61. Më pas, për çdo interval është llogaritur probabiliteti i rënies në të. Për shembull, për intervalin (-0.110.64) nga tabela e shpërndarjes normale, kemi që në të majtë të pikës (-0.11) ka 0.444 të sipërfaqes së njësisë së shpërndarjes normale, dhe në të majtë të pika (0.64) është 0.739 e kësaj sipërfaqeje. Kështu, probabiliteti për të rënë në këtë interval është 0,739-0,444=0,295. Pjesa tjetër e llogaritjeve janë të qarta. Dallimi midis n dhe... duhet shpjeguar. Ajo lind për shkak të faktit se shpërndarja teorike normale mund të konsiderohet, për qëllime praktike, të përqendrohet në një interval. Në eksperiment, nuk ka vlera që devijojnë më shumë se mesatarja. Prandaj, zona nën kurbën e shpërndarjes empirike nuk është e barabartë me unitetin, për shkak të së cilës lind një gabim. Megjithatë, ky gabim nuk ndryshon ndjeshëm rezultatet përfundimtare.

Kur krahasohen shpërndarjet empirike dhe teorike, numri i shkallëve të lirisë për shpërndarjen - gjendet nga relacioni f=m-1-l, ku m është numri i intervaleve të klasës dhe l është numri i parametrave të shpërndarjes së pavarur të vlerësuar nga mostrën. Për një shpërndarje normale l=2, pasi varet nga dy parametra: dhe.

Numri i shkallëve të lirisë gjithashtu zvogëlohet me 1, pasi për çdo shpërndarje ekziston një kusht që = 1, dhe për rrjedhojë, numri i probabiliteteve të përcaktuara në mënyrë të pavarur është i barabartë me k-1, dhe jo k.

Për shembullin e dhënë, f = 8-2-1 = 5 dhe vlera kritike në =0,05 për shpërndarjen - me 5 gradë lirie është 11,07. Prandaj, hipoteza zero pranohet.

Le të shqyrtojmë teknikën e krahasimit të shpërndarjes empirike me shpërndarjen Poisson duke përdorur një shembull klasik të numrit të vdekjeve të dragonjve në muaj në ushtrinë prusiane nga thundra e një kali. Të dhënat datojnë në shekullin e 19-të, dhe numri i vdekjeve është 0, 1, 2, etj. karakterizojnë këto ngjarje të trishtueshme, por për fat të mirë relativisht të rralla në kalorësinë prusiane gjatë pothuajse 20 viteve të vëzhgimit.

Siç dihet, shpërndarja Poisson ka formën e mëposhtme:

ku është parametri i shpërndarjes i barabartë me mesataren,

K =0,1,2,...,n.

Meqenëse shpërndarja është diskrete, probabilitetet që na interesojnë gjenden drejtpërdrejt nga formula.

Le të tregojmë, për shembull, se si përcaktohet numri teorik për k=3. Në mënyrën e zakonshme gjejmë se mesatarja në këtë shpërndarje është 0.652. Duke pasur parasysh këtë vlerë, ne gjejmë

Nga këtu

Nëse zgjedhim =0.05, atëherë vlera kritike për shpërndarjen -me dy shkallë lirie është 5.99, dhe për këtë arsye hipoteza se shpërndarja empirike në nivelin e zgjedhur të rëndësisë nuk është e ndryshme nga shpërndarja Poisson pranohet. Numri i shkallëve të lirisë në këtë rast është dy, sepse shpërndarja Poisson varet nga një parametër, dhe për rrjedhojë, në relacionin f = m-1-l, numri i parametrave të vlerësuar nga kampioni është l = 1, dhe f = 4-1-1 = 2.

Ndonjëherë në praktikë është e rëndësishme të dihet nëse dy shpërndarje janë të ndryshme nga njëra-tjetra, edhe nëse është e vështirë të vendosësh se cila shpërndarje teorike mund t'i përafrojë ato. Kjo është veçanërisht e rëndësishme në rastet kur, për shembull, mesataret dhe/ose variancat e tyre nuk ndryshojnë dukshëm statistikisht nga njëri-tjetri. Gjetja e dallimeve të rëndësishme në modelet e shpërndarjes mund ta ndihmojë studiuesin të bëjë parashikime rreth faktorëve të mundshëm që çojnë në këto dallime.

Në këtë rast, statistikat (23) mund të përdoren, dhe vlerat e një shpërndarjeje përdoren si sasi empirike, dhe vlerat e një tjetri si ato teorike. Natyrisht, në këtë rast, ndarja në intervale të klasave duhet të jetë e njëjtë për të dy shpërndarjet. Kjo do të thotë që për të gjitha të dhënat nga të dy mostrat, zgjidhen vlerat minimale dhe maksimale, pavarësisht se cilës kampion i përkasin, dhe më pas, në përputhje me numrin e zgjedhur të intervaleve të klasës, përcaktohet gjerësia e tyre dhe numri i objekteve. që bie në intervale të veçanta llogaritet për çdo kampion veç e veç.

Në këtë rast, mund të rezultojë se disa klasa nuk përmbajnë ose vetëm disa (35) vlera bien në to. Përdorimi i kriterit Pearson jep rezultate të kënaqshme nëse të paktën 35 vlera bien në çdo interval. Prandaj, nëse kjo kërkesë nuk plotësohet, intervalet ngjitur duhet të bashkohen. Sigurisht, kjo bëhet për të dy shpërndarjet.

Dhe së fundi, një shënim më shumë në lidhje me krahasimin e vlerës së llogaritur dhe pikave kritike për të në nivelin e rëndësisë së zgjedhur. Ne tashmë e dimë se nëse >, atëherë hipoteza zero refuzohet. Sidoqoftë, vlerat afër pikës kritike 1- në të djathtë duhet të ngjallin dyshimet tona, sepse një koincidencë kaq e mirë e shpërndarjeve empirike dhe teorike ose dy shpërndarjeve empirike (në fund të fundit, në këtë rast numrat do të ndryshojnë shumë pak nga njëri-tjetrin) nuk ka gjasa të ndodhë për shpërndarje të rastësishme. Në këtë rast, janë të mundshme dy shpjegime alternative: ose kemi të bëjmë me një ligj, dhe më pas rezultati i marrë nuk është befasues, ose të dhënat eksperimentale, për disa arsye, janë "përshtatur" me njëra-tjetrën, gjë që kërkon riverifikimin e tyre. .

Meqë ra fjala, në shembullin me bizelet kemi pikërisht rastin e parë, d.m.th. shfaqja e farave me butësi dhe ngjyra të ndryshme tek pasardhësit përcaktohet me ligj, dhe për këtë arsye nuk është për t'u habitur që vlera e llogaritur doli të jetë kaq e vogël.

Tani le të kthehemi te testimi i hipotezës statistikore për identitetin e dy shpërndarjeve empirike. Janë paraqitur të dhëna për shpërndarjen e numrit të petaleve të luleve anemone të marra nga habitate të ndryshme.

Nga të dhënat tabelare është e qartë se dy intervalet e para dhe dy të fundit duhet të kombinohen, pasi numri i vlerave që bien në to nuk është i mjaftueshëm për përdorimin e saktë të kriterit Pearson. Nga ky shembull është gjithashtu e qartë se nëse do të analizohej vetëm shpërndarja nga habitati A, atëherë nuk do të kishte fare interval klase që përmban 4 petale. U shfaq si rezultat i faktit se dy shpërndarje konsiderohen njëkohësisht, dhe në shpërndarjen e dytë ekziston një klasë e tillë.

Pra, le të kontrollojmë hipotezën se këto dy shpërndarje nuk ndryshojnë nga njëra-tjetra. ne kemi

Për një numër shkallësh lirie prej 4 dhe një nivel rëndësie madje të barabartë me 0,001, hipoteza zero hidhet poshtë.

Për të krahasuar dy shpërndarje mostrash, mund të përdorni gjithashtu kriterin joparametrik të propozuar nga N.V. Smirnov dhe bazuar në statistikat e prezantuara më herët nga A.N. (Kjo është arsyeja pse ky test nganjëherë quhet test Kolmogorov-Smirnov.) Ky test bazohet në një krahasim të serive të frekuencave të grumbulluara. Statistikat e këtij kriteri gjenden si

maksimumi, (24)
ku dhe janë kurbat e shpërndarjes së frekuencave të grumbulluara.

Pikat kritike për statistikat (24) janë gjetur nga relacioni

, (25)
ku dhe janë vëllimet e kampionit të parë dhe të dytë.

Vlerat kritike për =0.1;=0.05; dhe =0.01 janë të barabarta me 1.22, përkatësisht; 1,36; 1.63. Le të ilustrojmë përdorimin e kriterit Smirnov duke përdorur të dhëna të grupuara që përfaqësojnë lartësinë e nxënësve të së njëjtës moshë nga dy rajone të ndryshme.

Diferenca maksimale midis kthesave të akumuluara të frekuencës është 0.124. Nëse zgjedhim nivelin e rëndësisë =0.05, atëherë nga formula (25) kemi

0,098.

Kështu, diferenca maksimale empirike është më e madhe se ajo e pritur teorikisht, prandaj, në nivelin e pranuar të rëndësisë, hipoteza zero për identitetin e dy shpërndarjeve në shqyrtim hidhet poshtë.

Testi Smirnov mund të përdoret gjithashtu për të dhëna jo të grupuara, kërkesa e vetme është që të dhënat të nxirren nga një popullatë me një shpërndarje të vazhdueshme. Është gjithashtu e dëshirueshme që numri i vlerave në çdo mostër të jetë së paku 40-50.

Për të testuar hipotezën zero, sipas së cilës dy mostra të pavarura të madhësive n dhe m korrespondojnë me të njëjtat funksione shpërndarjeje, F. Wilcoxon propozoi një kriter joparametrik, i cili u justifikua në veprat e G. Mann dhe F. Whitney. Prandaj, në literaturë ky kriter quhet ose kriteri Wilcoxon ose kriteri Mann-Whitney. Ky kriter këshillohet të përdoret kur madhësitë e mostrave të marra janë të vogla dhe përdorimi i kritereve të tjera është i papërshtatshëm.

Llogaritjet më poshtë ilustrojnë qasjen për ndërtimin e kritereve që përdorin statistika të lidhura jo me vlerat e vetë kampionit, por me gradat e tyre.

Le të kemi në dispozicion dy mostra të vlerave të madhësive n dhe m. Le të ndërtojmë një seri të përgjithshme variacionesh prej tyre dhe të krahasojmë secilën prej këtyre vlerave me gradën e saj (), d.m.th. numrin serial që zë në serinë e renditur. Nëse hipoteza zero është e vërtetë, atëherë çdo shpërndarje e rangjeve është po aq e mundshme, dhe numri i përgjithshëm i kombinimeve të mundshme të rangjeve për n dhe m të dhënë është i barabartë me numrin e kombinimeve të elementeve N=n+m me m.

Testi Wilcoxon bazohet në statistika

. (26)

Formalisht, për të testuar hipotezën zero, është e nevojshme të numërohen të gjitha kombinimet e mundshme të gradave për të cilat statistika W merr vlera të barabarta ose më të vogla se ajo e marrë për një seri specifike të renditur dhe të gjejë raportin e këtij numri me totalin. numri i kombinimeve të mundshme të gradave për të dy mostrat. Krahasimi i vlerës së marrë me nivelin e zgjedhur të rëndësisë do t'ju lejojë të pranoni ose refuzoni hipotezën zero. Arsyeja pas kësaj qasjeje është se nëse një shpërndarje është e njëanshme në raport me një tjetër, ajo do të shfaqet në faktin se renditjet e vogla duhet të korrespondojnë kryesisht me një kampion dhe ato të mëdha me një tjetër. Në varësi të kësaj, shumat përkatëse të renditjes duhet të jenë të vogla ose të mëdha në varësi të cilës alternativë ndodh.

Është e nevojshme të testohet hipoteza për identitetin e funksioneve të shpërndarjes që karakterizojnë të dyja metodat e matjes me një nivel rëndësie prej =0.05.

Në këtë shembull n = 3, m = 2, N = 2+3 = 5, dhe shuma e gradave që korrespondojnë me matjet duke përdorur metodën B është e barabartë me 1+3 = 4.

Le të shkruajmë të gjitha = 10 shpërndarjet e mundshme të gradave dhe shumat e tyre:

Renditjet: 1,2 1,3 1,4 1,5 2,3 2,4 2,5 3,4 3,5 4,5

Shumat: 3 4 5 6 5 6 7 7 8 9

Raporti i numrit të kombinimeve të renditjes, shuma e të cilave nuk e kalon vlerën e fituar prej 4 për metodën B, me numrin total të kombinimeve të mundshme të renditjes është 2/10=0.2>0.05, kështu që për këtë shembull hipoteza zero është pranuar.

Për vlerat e vogla të n dhe m, hipoteza zero mund të testohet duke numëruar drejtpërdrejt numrin e kombinimeve të shumave përkatëse të renditjes. Mirëpo, për mostrat e mëdha kjo bëhet praktikisht e pamundur, ndaj u arrit një përafrim për statistikën W, e cila, siç doli, në mënyrë asimptotike tenton në shpërndarjen normale me parametrat e duhur. Ne do t'i llogarisim këto parametra për të ilustruar qasjen ndaj sintetizimit të testeve statistikore të bazuara në rang. Për ta bërë këtë, ne do të përdorim rezultatet e paraqitura në Kapitullin 37.

Le të jetë W shuma e gradave që korrespondojnë me një nga mostrat, për shembull, atë me vëllim m. Le të jetë mesatarja aritmetike e këtyre renditjeve. Pritshmëria matematikore e vlerës është

meqenëse sipas hipotezës zero renditjet e elementeve në një kampion me madhësi m përfaqësojnë një kampion nga një popullsi e fundme 1, 2,...,N (N=n+m). Dihet se

Kjo është arsyeja pse.

Gjatë llogaritjes së variancës, përfitojmë nga fakti se shuma e katrorëve të gradave të serisë së përgjithshme të renditur, e përbërë nga vlerat e të dy mostrave, është e barabartë me

Duke marrë parasysh marrëdhëniet e marra më parë për vlerësimin e variancave të popullatave të përgjithshme dhe mostrave, kemi

Nga kjo rrjedh se

Është treguar se statistikat

(27)

për n dhe m të mëdhenj ka një shpërndarje normale njësi asimptotike.

Le të shohim një shembull. Le të merren të dhëna për aktivitetin polarografik të filtratit të serumit të gjakut për dy grupmosha. Është e nevojshme të testohet hipoteza me një nivel rëndësie prej =0.05 se mostrat janë marrë nga popullata të përgjithshme që kanë funksione të njëjta shpërndarjeje. Shuma e gradave për kampionin e parë është 30, për të dytën - 90. Kontrollimi i saktësisë së llogaritjes së shumave të gradave është plotësimi i kushtit. Në rastin tonë, 30+90=(7+8)(7+8+1):

:2=120. Sipas formulës (27), duke përdorur shumën e gradave të kampionit të dytë, kemi

Nëse përdorim shumën e renditjeve për mostrën e parë, marrim vlerën = -3.01. Duke qenë se statistikat e llogaritura kanë një shpërndarje normale njësi, është e natyrshme që si në rastin e parë ashtu edhe në rastin e dytë hipoteza zero të hidhet poshtë, pasi vlera kritike për nivelin e rëndësisë 5% është moduli 1.96.

Kur përdorni testin Wilcoxon, vështirësi të caktuara lindin kur në të dy mostrat gjenden të njëjtat vlera, pasi përdorimi i formulës së mësipërme çon në një ulje të fuqisë së testit, ndonjëherë shumë të konsiderueshme.

Për të reduktuar gabimet në minimum në raste të tilla, këshillohet të përdorni rregullin e mëposhtëm. Herën e parë kur hasen vlera identike që i përkasin mostrave të ndryshme, cila prej tyre të vendoset e para në serinë e variacioneve përcaktohet në mënyrë të rastësishme, për shembull, duke hedhur një monedhë. Nëse ka disa vlera të tilla, atëherë, pasi të keni përcaktuar të parën rastësisht, vlerat e mbetura të barabarta nga të dy mostrat alternohen. Në ato raste kur gjenden vlera të tjera të barabarta, bëjeni këtë. Nëse në grupin e parë të vlerave të barabarta, vlera e parë u zgjodh rastësisht nga një mostër e veçantë, atëherë në grupin tjetër të vlerave të barabarta, së pari zgjidhet vlera nga një kampion tjetër, etj.

5. Kriteret për kontrollin e rastësisë dhe vlerësimin e vëzhgimeve të jashtme

Shumë shpesh, të dhënat merren në seri përgjatë kohës ose hapësirës. Për shembull, në procesin e kryerjes së eksperimenteve psikofiziologjike, të cilat mund të zgjasin disa orë, disa dhjetëra ose qindra herë, matet latente (periudha latente) e reagimit ndaj një stimuli vizual të paraqitur, ose në vrojtimet gjeografike, kur në vendet e vendosura. në vende të caktuara, p.sh., buzë pyjeve, numërohet numri i bimëve të një lloji të caktuar, etj. Nga ana tjetër, gjatë llogaritjes së statistikave të ndryshme, supozohet se të dhënat burimore janë të pavarura dhe të shpërndara në mënyrë identike. Prandaj, është me interes të testohet ky supozim.

Së pari, merrni parasysh një kriter për testimin e hipotezës zero të pavarësisë së vlerave të shpërndara normalisht identike. Pra, ky kriter është parametrik. Ai bazohet në llogaritjen e katrorëve mesatarë të diferencave të njëpasnjëshme

. (28)

Nëse prezantojmë statistika të reja, atëherë, siç dihet nga teoria, nëse hipoteza zero është e vërtetë, statistikat

(29)
për n>10 shpërndahet në mënyrë asimptotike sipas shpërndarjes normale standarde.

Le të shohim një shembull. Janë dhënë kohët e reagimit () të subjektit në një nga eksperimentet psikofiziologjike.

Kemi: nga ku

Meqenëse për =0.05 vlera kritike është 1.96, hipoteza zero për pavarësinë e serisë rezultuese pranohet me nivelin e zgjedhur të rëndësisë.

Një pyetje tjetër që shpesh lind kur analizohen të dhënat eksperimentale është se çfarë të bëjmë me disa vëzhgime që ndryshojnë ndjeshëm nga pjesa më e madhe e vëzhgimeve. Vëzhgime të tilla të jashtme mund të ndodhin për shkak të gabimeve metodologjike, gabimeve në llogaritje, etj. Në të gjitha rastet kur eksperimentuesi e di se një gabim ka hyrë në vëzhgim, ai duhet ta përjashtojë këtë vlerë, pavarësisht nga madhësia e tij. Në raste të tjera, ekziston vetëm dyshimi për gabim, dhe atëherë është e nevojshme të përdoren kriteret e duhura për të marrë një vendim të caktuar, d.m.th. përjashtojnë ose lënë vëzhgime të jashtme.

Në përgjithësi, pyetja shtrohet si më poshtë: a janë vëzhgimet e bëra për të njëjtën popullatë, apo disa pjesë ose vlera individuale i përkasin një popullate të ndryshme?

Natyrisht, mënyra e vetme e besueshme për të përjashtuar vëzhgimet individuale është të studiohen me kujdes kushtet në të cilat janë marrë këto vëzhgime. Nëse për ndonjë arsye kushtet ndryshonin nga ato standarde, atëherë vëzhgimet duhet të përjashtohen nga analiza e mëtejshme. Por në raste të caktuara kriteret ekzistuese, edhe pse të papërsosura, mund të jenë me përfitim të konsiderueshëm.

Ne do të paraqesim këtu, pa prova, disa marrëdhënie që mund të përdoren për të testuar hipotezën se vëzhgimet janë bërë rastësisht në të njëjtën popullatë. ne kemi

(30)

(31)

(32)

ku është vëzhgimi i dyshuar “i jashtëzakonshëm”. Nëse renditen të gjitha vlerat e një serie, atëherë vëzhgimi më i spikatur në të do të zërë vendin e n-të.

Për statistikat (30), funksioni i shpërndarjes është i tabeluar. Janë dhënë pikat kritike të kësaj shpërndarjeje për disa n.

Vlerat kritike për statistikat (31) në varësi të n janë

4,0; 6

4,5; 100

5.0; n>1000.

Formula (31) supozon se dhe janë llogaritur pa marrë parasysh vëzhgimin e dyshuar.

Me statistikat (32), situata është më e ndërlikuar. Tregohet se nëse ato shpërndahen në mënyrë uniforme, atëherë pritshmëria dhe varianca matematikore kanë formën:

Rajoni kritik formohet nga vlera të vogla që korrespondojnë me vlera të mëdha. Nëse jeni të interesuar të kontrolloni për një "të jashtëm" të vlerës më të vogël, atëherë së pari transformoni të dhënat në mënyrë që ato të kenë një shpërndarje uniforme gjatë intervalit, dhe më pas merrni shtimin e këtyre vlerave uniforme në 1 dhe kontrolloni duke përdorur formulën ( 32).

Merrni parasysh përdorimin e kritereve të mësipërme për seritë e mëposhtme të renditura të vëzhgimeve: 3,4,5,5,6,7,8,9,9,10,11,17. Ju duhet të vendosni nëse vlera më e lartë 17 duhet të refuzohet.

Kemi: Sipas formulës (30) =(17-11)/3.81=1.57, dhe hipoteza zero duhet të pranohet në =0.01. Sipas formulës (31) = (17-7.0)/2.61 = 3.83, dhe hipoteza zero gjithashtu duhet të pranohet. Për të përdorur kriterin e tretë, gjejmë =5.53, atëherë

Statistika w zakonisht shpërndahet me zero mesatare dhe variancë njësi, dhe kështu hipoteza zero në =0.05 pranohet.

Vështirësia e përdorimit të statistikave (32) është nevoja për të pasur informacion apriori në lidhje me ligjin e shpërndarjes së vlerave të mostrës, dhe më pas transformimin analitik të kësaj shpërndarjeje në një shpërndarje uniforme gjatë intervalit.

Letërsia

1. Eliseeva I.I. Teoria e përgjithshme e statistikave: tekst shkollor për universitetet / I.I. Eliseeva, M.M. Yuzbashev; redaktuar nga I.I. Eliseeva. M.: Financa dhe Statistika, 2009. 656 f.

2. Efimova M.R. Workshop mbi teorinë e përgjithshme të statistikave: tekst shkollor për universitetet / M.R. Efimova dhe të tjerët M.: Financa dhe statistika, 2007. 368 f.

3. Melkumov Y.S. Statistikat socio-ekonomike: manual arsimor dhe metodologjik. M.: IMPE-PUBLISH, 2007. 200 f.

4. Teoria e përgjithshme e statistikave: Metodologjia statistikore në studimin e veprimtarisë tregtare: tekst shkollor për universitetet / O.E. Bashina e të tjerë; redaktuar nga O.E. Bashina, A.A. Spirina. - M.: Financa dhe Statistikat, 2008. 440 f.

5. Salin V.N. Një kurs në teorinë e statistikave për trajnimin e specialistëve në profilet financiare dhe ekonomike: tekst shkollor / V.N. Salin, E.Yu. Çurilova. M.: Financa dhe Statistika, 2007. 480 f.

6. Statistikat socio-ekonomike: punëtori: tekst shkollor / V.N. Salin et al.; redaktuar nga V.N. Salina, E.P. Shpakovskaya. M.: Financa dhe statistika, 2009. 192 f.

7. Statistikat: tekst shkollor / A.V. Bagat etj.; redaktuar nga V.M. Simchers. M.: Financa dhe statistika, 2007. 368 f.

8. Statistikat: tekst shkollor / I.I. Eliseeva dhe të tjerët; redaktuar nga I.I. Eliseeva. M.: Arsimi i Lartë, 2008. - 566 f.

9. Teoria e statistikave: tekst shkollor për universitetet / R.A. Shmoilova dhe të tjerët; redaktuar nga R.A. Shmoilova. - M.: Financa dhe statistika, 2007. 656 f.

10. Shmoilova R.A. Workshop mbi teorinë e statistikave: tekst shkollor për universitetet / R.A. Shmoilova dhe të tjerët; redaktuar nga R.A. Shmoilova. - M.: Financa dhe Statistikat, 2007. 416 f.

FAQJA \* SHKRIMI 1

Vepra të tjera të ngjashme që mund t'ju interesojnë.vshm>

17926. Analiza e kritereve të kompaktësisë për robotikën industriale 1.77 MB
Zgjidhje softuerike për vlerësimin e kompaktësisë së një roboti. Robotët në miniaturë mund të depërtojnë dhe të lëvizin nëpër vrima të ngushta, gjë që i lejon ata të përdoren për të kryer detyra të ndryshme në hapësira të kufizuara, siç janë tubacionet me diametër të vogël me përmasa disa milimetra. Pothuajse në të gjitha industritë, çështjet e miniaturizimit të aktivizuesve dhe mekanizmave janë ndër prioritetet; ato janë të një rëndësie të madhe për proceset teknologjike me burime të ulëta...
1884. Zhvillimi i kritereve për menaxhimin efektiv të personelit në OJSC Kazan-Orgsintez për QMS 204,77 KB
Aspektet themelore teorike të sistemit të menaxhimit të personelit. Personeli si objekt i menaxhimit. Metodat e kërkimit për sistemet e menaxhimit të personelit për QMS. Mënyrat për të përmirësuar efikasitetin e menaxhimit të personelit.
16316. dhe kjo teori e zgjidh këtë dilemë; b zgjidhja e kësaj dileme kërkon ekzistimin e kritereve për këtë teori. 12.12 KB
Autori argumenton se arsyeja themelore e dilemës së politikës makroekonomike në kushtet e një kursi fiks të këmbimit nuk është shkelje e rregullit të Tinbergen, që në fakt është pasojë dhe jo shkak, por mungesa e parakushteve të nevojshme ekonomike për rregullimin e këmbimit. norma e paraqitur në teorinë e zonave optimale të monedhës. Shkak për këtë dilemë zakonisht konsiderohet shkelja e rregullit Tinbergen, sipas të cilit, për të arritur një numër të caktuar qëllimesh ekonomike, shteti duhet të ketë...
18273. Analiza e statusit juridik të Presidentit të Republikës së Kazakistanit nga pikëpamja e kritereve të pranuara përgjithësisht të shtetit të së drejtës dhe parimit të ndarjes së pushteteve 73,64 KB
Thelbi i qasjes së Presidentit ishte që vendi të zhvillohej në një mënyrë të natyrshme, evolucionare. Rregulli presidencial - i parashikuar me Kushtetutën e shtetit, është ndërprerja e veprimtarisë së institucioneve të vetëqeverisjes së një subjekti të caktuar administrativ rajonal dhe zbatimi i menaxhimit të këtij të fundit nëpërmjet personave të autorizuar të emëruar nga kreu i shtetit - presidenti dhe presidenti dhe personat përgjegjës ndaj tij; e parashikuar nga Kushtetuta, veshja e kreut të shtetit - presidentit - me kompetenca emergjente në shkallë globale...
5713. Duke përdorur DotNetNuke 1,87 MB
Në këtë punë kursi do të studiojmë DotNetNuke. DotNetNuke (emri i shkurtuar DNN) është një sistem i menaxhimit të përmbajtjes së faqes në internet (Web Content Management System, shkurtuar WCMS), i cili ka thithur të gjitha arritjet më të mira në fushën e teknologjive për ndërtimin e projekteve në ueb.
7073. PËRDORIMI I NDËRFAQJEVE 56,59 KB
Fjala ndërfaqe është një fjalë polisemantike dhe ka kuptime të ndryshme në kontekste të ndryshme. Ekziston koncepti i një ndërfaqe softueri ose hardueri, por në shumicën e rasteve fjala ndërfaqe shoqërohet me një lloj lidhjeje midis objekteve ose proceseve.
6471. Regjistro strukturën dhe përdorimin 193.04 KB
Struktura dhe përdorimi i regjistrave Regjistrat janë krijuar për të ruajtur dhe konvertuar numra binarë shumë-bitësh. Regjistrat janë ndërtuar si një sekuencë e renditur e flip-flops. Në mikroprocesorët, regjistrat janë mjeti kryesor për të kujtuar dhe ruajtur shpejt informacionin dixhital. Elementet nga të cilët janë ndërtuar regjistrat janë flip-flops D RS JK me ndërprerje dinamike të pulsit ose kontroll statik.
6472. Struktura dhe përdorimi i sporteleve 318,58 KB
Klasifikimi dhe parimi i ndërtimit të numëruesve asinkron Një numërues është një pajisje, daljet e së cilës gjenerojnë një kod binar që shpreh numrin e pulseve të marra në hyrjen e numëruesit. Numri i gjendjeve të mundshme të një numëruesi quhet moduli i tij ose koeficienti i numërimit dhe përcaktohet. Karakteristikat kryesore të kohës së numëruesve: frekuenca maksimale e mbërritjes së pulseve të numërimit; koha e kalimit nga një gjendje në tjetrën; Ekzistojnë vetë mikroqarqe kundër dhe qarqe të ndërtuara mbi bazën e një ose më shumë...
7066. PËRDORIMI I MENUËS NË APLIKACION 240.2 KB
Menyja e programit Menyja e programit duhet të korrespondojë me mënyrat kryesore të funksionimit të programit, prandaj, zgjedhja e artikujve të menysë dhe komandat e artikujve individualë duhet të trajtohet me kujdes të veçantë. Për të kuptuar më mirë teknologjinë e përdorimit të menuve në programe, merrni parasysh sekuencën e veprimeve kur zgjidhni programin e mëposhtëm të trajnimit. Të gjitha veprimet duhet të kryhen duke përdorur menunë.
7067. PËRDORIMI I MENUVE TË DIALOGUT 73.13 KB
Duke vazhduar zhvillimin e një aplikacioni me një menu dhe një shirit veglash, duhet të shkruajmë kodin për mbajtësit e mesazheve për komandat për krijimin e një matrice 6*6 dhe nxjerrjen (printimin) e matricës në zonën e klientit të aplikacionit tonë. Krijimi i matricës duhet të përfundojë duke shfaqur një mesazh në ekran që tregon përfundimin me sukses të mbajtësit, për shembull, "Matrica është krijuar".

Hipoteza statistikore. Kriteret e pëlqimit.

Nul(bazë) quaj një hipotezë të paraqitur për formën e një shpërndarjeje të panjohur, ose për parametrat e shpërndarjeve të njohura. Konkurruese (alternativë) quhet hipotezë që bie ndesh me hipotezën zero.

Për shembull, nëse hipoteza zero është se ndryshorja e rastësishme X shpërndahet sipas ligjit, atëherë një hipotezë konkurruese mund të jetë se ndryshorja e rastësishme X shpërndahet sipas një ligji tjetër.

Kriteri statistikor(ose thjesht kriter) quhet ndryshore e rastit TE, e cila shërben për të testuar hipotezën zero.

Pas zgjedhjes së një kriteri të caktuar, për shembull kriteri, grupi i të gjitha vlerave të tij të mundshme ndahet në dy nëngrupe të ndara: njëra prej tyre përmban vlerat e kriterit në të cilat hidhet poshtë hipoteza zero, dhe tjetra - në të cilën ajo pranohet.

Zonë kritikeështë një grup vlerash kriteri në të cilat hidhet poshtë hipoteza zero. Zona e pranimit të hipotezave thirrni grupin e vlerave të kriterit në të cilat pranohet hipoteza. Pikat kritike Ata i quajnë pikat që ndajnë rajonin kritik nga rajoni ku pranohet hipoteza zero.

Për shembullin tonë, me një vlerë prej , vlera e llogaritur nga kampioni korrespondon me zonën e pranimit të hipotezës: ndryshorja e rastësishme shpërndahet sipas ligjit. Nëse vlera e llogaritur është , atëherë ajo bie në rajonin kritik, domethënë, hipoteza për shpërndarjen e ndryshores së rastësishme sipas ligjit hidhet poshtë.

Në rastin e shpërndarjes, rajoni kritik përcaktohet nga pabarazia, rajoni ku pranohet hipoteza zero përcaktohet nga pabarazia.

2.6.3. Kriteri i marrëveshjes Pearson.

Një nga detyrat e shkencës së kafshëve dhe gjenetikës veterinare është mbarështimi i racave dhe specieve të reja me karakteristikat e kërkuara. Për shembull, rritja e imunitetit, rezistenca ndaj sëmundjeve ose ndryshimi i ngjyrës së leshit.

Në praktikë, kur analizohen rezultatet, shumë shpesh rezulton se rezultatet aktuale pak a shumë korrespondojnë me disa ligje teorike të shpërndarjes. Ekziston nevoja për të vlerësuar shkallën e korrespondencës midis të dhënave aktuale (empirike) dhe të dhënave teorike (hipotetike). Për ta bërë këtë, parashtroni një hipotezë zero: popullsia që rezulton shpërndahet sipas ligjit "A". Hipoteza rreth ligjit të shpërndarjes së pritshme testohet duke përdorur një variabël të rastësishëm të zgjedhur posaçërisht - kriteri i përshtatshmërisë.

Kriteri i marrëveshjes quhet kriter për testimin e një hipoteze për ligjin e supozuar të një shpërndarjeje të panjohur.

Ekzistojnë disa kritere të marrëveshjes: Pearson, Kolmogorov, Smirnov, etj. Testi Pearson i mirësisë së përshtatjes është më i përdoruri.

Le të shqyrtojmë zbatimin e kriterit Pearson duke përdorur shembullin e testimit të hipotezës për shpërndarjen normale të popullsisë. Për këtë qëllim, ne do të krahasojmë frekuencat empirike dhe teorike (të llogaritura në vazhdimësi të shpërndarjes normale).

Zakonisht ka një ndryshim midis frekuencave teorike dhe empirike. Për shembull:

Frekuencat empirike 7 15 41 93 113 84 25 13 5

frekuencat teorike 5 13 36 89 114 91 29 14 6

Le të shqyrtojmë dy raste:

Mospërputhja midis frekuencave teorike dhe empirike është e rastësishme (e parëndësishme), d.m.th. është e mundur të bëhet një propozim për shpërndarjen e frekuencave empirike sipas ligjit normal;

Mospërputhja midis frekuencave teorike dhe empirike nuk është e rastësishme (e rëndësishme), d.m.th. frekuencat teorike janë llogaritur bazuar në hipotezën e gabuar të një shpërndarjeje normale të popullsisë.

Duke përdorur testin e "mirësisë së përshtatjes së Pearson", mund të përcaktoni nëse mospërputhja midis frekuencave teorike dhe empirike është aksidentale apo jo, d.m.th. me një probabilitet të caktuar besimi, përcaktoni nëse popullsia është e shpërndarë sipas një ligji normal apo jo.

Pra, le të merret shpërndarja empirike nga një mostër e madhësisë n:

Opsionet......

Frekuencat empirike…….

Le të supozojmë se frekuencat teorike llogariten nën supozimin e një shpërndarjeje normale. Në nivelin e rëndësisë, është e nevojshme të testohet hipoteza zero: popullsia është e shpërndarë normalisht.

Si kriter për testimin e hipotezës zero, do të marrim një ndryshore të rastësishme

(*)

Kjo sasi është e rastësishme, pasi në eksperimente të ndryshme merr vlera të ndryshme, të panjohura më parë. Është e qartë se sa më pak të ndryshojnë frekuencat empirike dhe teorike, aq më e vogël është vlera e kriterit dhe, për rrjedhojë, në një farë mase karakterizon afërsinë e shpërndarjeve empirike dhe teorike.

Është vërtetuar se kur ligji i shpërndarjes së një ndryshoreje të rastësishme (*), pavarësisht se cilit ligj të shpërndarjes i nënshtrohet popullata e përgjithshme, priret drejt një ligji shpërndarjeje me shkallë lirie. Prandaj, ndryshorja e rastësishme (*) shënohet me , dhe vetë kriteri quhet testi i përshtatshmërisë së "chi-square".

Le të shënojmë vlerën e kriterit të llogaritur nga të dhënat e vëzhgimit me . Vlerat kritike të tabeluara të kriterit për një nivel të caktuar rëndësie dhe numrin e shkallëve të lirisë shënohen me . Në këtë rast, numri i shkallëve të lirisë përcaktohet nga barazia, ku është numri i grupeve (intervaleve të pjesshme) të mostrës ose klasave; - numri i parametrave të shpërndarjes së pritshme. Shpërndarja normale ka dy parametra - pritjet matematikore dhe devijimi standard. Prandaj, numri i shkallëve të lirisë për një shpërndarje normale gjendet nga barazia

Nëse vlera e llogaritur dhe vlera e tabelës plotësojnë pabarazinë , pranohet hipoteza zero për shpërndarjen normale të popullsisë. Nëse , hipoteza zero hidhet poshtë dhe hipoteza alternative pranohet (popullsia nuk shpërndahet normalisht).

Komentoni. Kur përdorni testin e Pearson-it të përshtatshmërisë, madhësia e kampionit duhet të jetë së paku 30. Secili grup duhet të përmbajë të paktën 5 opsione. Nëse grupet përmbajnë më pak se 5 frekuenca, ato kombinohen me grupet fqinje.

Në përgjithësi, numri i shkallëve të lirisë për shpërndarjen chi-square përcaktohet si numri total i vlerave nga të cilat llogariten treguesit përkatës, minus numrin e atyre kushteve që lidhin këto vlera, d.m.th. zvogëlojnë mundësinë e ndryshimit midis tyre. Në rastet më të thjeshta, gjatë llogaritjes, numri i shkallëve të lirisë do të jetë i barabartë me numrin e klasave të reduktuara me një. Kështu, për shembull, me ndarjen dihibride, fitohen 4 klasa, por vetëm klasa e parë është e palidhur, ato të mëvonshme janë tashmë të lidhura me ato të mëparshme. Prandaj, për ndarjen dihibride, numri i shkallëve të lirisë është .



Shembulli 1. Përcaktoni shkallën e korrespondencës së shpërndarjes aktuale të grupeve sipas numrit të lopëve me tuberkuloz me atë të pritur teorikisht, e cila është llogaritur kur merret parasysh shpërndarjen normale. Të dhënat burimore janë përmbledhur në tabelë:

Zgjidhje.

Bazuar në nivelin e rëndësisë dhe numrin e shkallëve të lirisë nga tabela e pikave kritike të shpërndarjes (shih Shtojcën 4), gjejmë vlerën . Sepse , mund të konkludojmë se ndryshimi midis frekuencave teorike dhe aktuale është i rastësishëm. Kështu, shpërndarja aktuale e grupeve sipas numrit të lopëve me tuberkuloz korrespondon me atë që pritet teorikisht.

Shembulli 2. Shpërndarja teorike sipas fenotipit të individëve të marrë në gjeneratën e dytë nga kryqëzimi dihibrid i lepujve sipas ligjit të Mendelit është 9: 3: 3: 1. Kërkohet të llogaritet korrespondenca e shpërndarjes empirike të lepujve nga kryqëzimi i individëve të zinj me qime normale. me kafshë me push - albino. Gjatë kryqëzimit në gjeneratën e dytë, u morën 120 pasardhës, duke përfshirë 45 të zinj me flokë të shkurtër, 30 lepuj të zinj me push, 25 të bardhë me flokë të shkurtër, 20 lepuj të bardhë me push.

Zgjidhje. Teorikisht, ndarja e pritur tek pasardhësit duhet të korrespondojë me raportin e katër fenotipeve (9: 3: 3: 1). Le të llogarisim frekuencat teorike (numri i qëllimeve) për secilën klasë:

9+3+3+1=16, që do të thotë se mund të presim që do të ketë flokë të shkurtra të zeza ; push i zi - ; me flokë të shkurtër të bardhë - ; me push të bardhë - .

Shpërndarja empirike (aktuale) e fenotipeve ishte si më poshtë: 45; 30; 25; 20.

Le t'i përmbledhim të gjitha këto të dhëna në tabelën e mëposhtme:

Duke përdorur testin e mirësisë së përshtatjes së Pearson, ne llogarisim vlerën:

Numri i shkallëve të lirisë në kryqëzimin dihibrid. Për nivelin e rëndësisë gjeni vlerën . Sepse , mund të konkludojmë se ndryshimi midis frekuencave teorike dhe aktuale nuk është i rastësishëm. Për rrjedhojë, grupi i lepujve që rezulton devijon në shpërndarjen e fenotipeve nga ligji i Mendelit gjatë kryqëzimit dihibrid dhe pasqyron ndikimin e disa faktorëve që ndryshojnë llojin e ndarjes fenotipike në brezin e dytë të kryqëzimeve.

Testi i mirësisë së përshtatjes së chi-square Pearson mund të përdoret gjithashtu për të krahasuar dy shpërndarje empirike homogjene me njëra-tjetrën, d.m.th. ato që kanë të njëjtat kufij klasash. Hipoteza zero është hipoteza se dy funksione të panjohura të shpërndarjes janë të barabarta. Testi chi-square në raste të tilla përcaktohet nga formula

(**)

ku dhe janë vëllimet e shpërndarjeve që krahasohen; dhe - frekuencat e klasave përkatëse.

Le të shqyrtojmë një krahasim të dy shpërndarjeve empirike duke përdorur shembullin e mëposhtëm.

Shembulli 3. Gjatësia e vezëve të qyqes u mat në dy zona territoriale. Në zonën e parë, u ekzaminua një mostër prej 76 vezësh (), në të dytën nga 54 (). Janë marrë rezultatet e mëposhtme:

Gjatësia (mm)
Frekuencat
Frekuencat - - -

Në nivelin e rëndësisë, ne duhet të testojmë hipotezën zero se të dy mostrat e vezëve i përkasin të njëjtës popullatë qyqe.

Për të testuar hipotezën për korrespondencën e shpërndarjes empirike me ligjin teorik të shpërndarjes, përdoren tregues të veçantë statistikorë - kriteret e përshtatshmërisë (ose kriteret e pajtueshmërisë). Këtu përfshihen kriteret e Pearson, Kolmogorov, Romanovsky, Yastremsky, etj. Shumica e kritereve të marrëveshjes bazohen në përdorimin e devijimeve të frekuencave empirike nga ato teorike.

Natyrisht, sa më të vogla të jenë këto devijime, aq më mirë shpërndarja teorike korrespondon me atë empirike (ose e përshkruan atë). Kriteret e pëlqimit

- këto janë kritere për testimin e hipotezave për korrespondencën e shpërndarjes empirike me shpërndarjen teorike të probabilitetit. Kriteret e tilla ndahen në dy klasa: të përgjithshme dhe të veçanta. Testet e përgjithshme të përshtatshmërisë zbatohen për formulimin më të përgjithshëm të një hipoteze, përkatësisht hipotezën që rezultatet e vëzhguara pajtohen me çdo shpërndarje probabiliteti të supozuar a priori. Testet speciale të përshtatshmërisë përfshijnë hipoteza të veçanta zero që përputhen me një formë të caktuar të shpërndarjes së probabilitetit.

Kriteret e marrëveshjes, bazuar në ligjin e vendosur të shpërndarjes, bëjnë të mundur përcaktimin kur mospërputhjet midis frekuencave teorike dhe empirike duhet të konsiderohen të parëndësishme (të rastësishme), dhe kur - të rëndësishme (jo të rastësishme). Nga kjo rrjedh se kriteret e marrëveshjes bëjnë të mundur që të refuzohet ose të konfirmohet korrektësia e hipotezës së paraqitur kur përafrohet seria në lidhje me natyrën e shpërndarjes në serinë empirike dhe të përgjigjet nëse është e mundur të pranohet për një shpërndarje të caktuar empirike një model i shprehur nga disa ligje teorike të shpërndarjes. Testi i përshtatshmërisë së Pearson

c 2 (chi-square) është një nga kriteret kryesore për marrëveshje. Propozuar nga matematikani anglez Karl Pearson (1857-1936) për të vlerësuar rastësinë (rëndësinë) e mospërputhjeve midis frekuencave të shpërndarjeve empirike dhe teorike:

Skema për zbatimin e kriterit c 2 për vlerësimin e konsistencës së shpërndarjeve teorike dhe empirike zbret në sa vijon:

1. Përcaktohet masa e llogaritur e mospërputhjes.

2. Përcaktohet numri i shkallëve të lirisë.

3. Në bazë të numrit të shkallëve të lirisë n, duke përdorur një tabelë të veçantë, përcaktohet.

Niveli i rëndësisëështë probabiliteti për të refuzuar gabimisht hipotezën e paraqitur, d.m.th. probabiliteti që një hipotezë e saktë të refuzohet. Në studimet statistikore, në varësi të rëndësisë dhe përgjegjësisë së problemeve që zgjidhen, përdoren tre nivelet e mëposhtme të rëndësisë:

1) a = 0.1, atëherë R = 0,9;

2) a = 0,05, atëherë R = 0,95;

3) a = 0.01, atëherë R = 0,99.

Duke përdorur kriterin e marrëveshjes c 2, duhet të plotësohen kushtet e mëposhtme:

1. Vëllimi i popullsisë në studim duhet të jetë mjaft i madh ( N≥ 50), ndërsa frekuenca ose madhësia e grupit duhet të jetë së paku 5. Nëse shkelet ky kusht, duhet së pari të kombinohen frekuenca të vogla (më pak se 5).

2. Shpërndarja empirike duhet të përbëhet nga të dhëna të marra si rezultat i kampionimit të rastësishëm, d.m.th. ato duhet të jenë të pavarura.

Disavantazhi i kriterit të përshtatshmërisë së Pearson-it është humbja e një pjese të informacionit origjinal që lidhet me nevojën për të grupuar rezultatet e vëzhgimit në intervale dhe për të kombinuar intervale individuale me një numër të vogël vëzhgimesh. Në këtë drejtim rekomandohet plotësimi i kontrollit të përputhshmërisë së shpërndarjes sipas kriterit me 2 kritere të tjera. Kjo është veçanërisht e nevojshme me një madhësi relativisht të vogël kampioni ( n ≈ 100).

Në statistika Testi i mirësisë së Kolmogorov(i njohur gjithashtu si testi i përshtatshmërisë Kolmogorov-Smirnov) përdoret për të përcaktuar nëse dy shpërndarje empirike i binden të njëjtit ligj, ose për të përcaktuar nëse një shpërndarje që rezulton i bindet një modeli të supozuar. Kriteri Kolmogorov bazohet në përcaktimin e mospërputhjes maksimale midis frekuencave të akumuluara ose frekuencave të shpërndarjeve empirike ose teorike. Kriteri Kolmogorov llogaritet duke përdorur formulat e mëposhtme:

Ku D Dhe d- në përputhje me rrethanat, diferenca maksimale midis frekuencave të grumbulluara ( ff¢) dhe midis frekuencave të grumbulluara ( fqfq¢) seritë empirike dhe teorike të shpërndarjeve; N- numri i njësive në agregat.

Pas llogaritjes së vlerës së λ, përdoret një tabelë e veçantë për të përcaktuar probabilitetin me të cilin mund të thuhet se devijimet e frekuencave empirike nga ato teorike janë të rastësishme. Nëse shenja merr vlera deri në 0.3, atëherë kjo do të thotë se ka një koincidencë të plotë të frekuencave. Me një numër të madh vëzhgimesh, testi Kolmogorov është në gjendje të zbulojë çdo devijim nga hipoteza. Kjo do të thotë që çdo ndryshim në shpërndarjen e mostrës nga ai teorik do të zbulohet me ndihmën e tij nëse ka një numër mjaft të madh vëzhgimesh. Rëndësia praktike e kësaj vetie nuk është e rëndësishme, pasi në shumicën e rasteve është e vështirë të llogaritet në marrjen e një numri të madh vëzhgimesh në kushte konstante, ideja teorike e ligjit të shpërndarjes të cilit duhet t'i bindet kampioni është gjithmonë i përafërt, dhe saktësia e testeve statistikore nuk duhet të kalojë saktësinë e modelit të përzgjedhur.

Testi i përshtatshmërisë së Romanovsky bazohet në përdorimin e kriterit Pearson, d.m.th. vlerat e gjetura tashmë të c 2, dhe numri i shkallëve të lirisë:

ku n është numri i shkallëve të lirisë së variacionit.

Kriteri Romanovsky është i përshtatshëm në mungesë të tabelave për. Nëse< 3, то расхождения распределений случайны, если же >3, atëherë ato nuk janë të rastësishme dhe shpërndarja teorike nuk mund të shërbejë si model për shpërndarjen empirike që studiohet.

B. S. Yastremsky përdori në kriterin e marrëveshjes jo numrin e shkallëve të lirisë, por numrin e grupeve ( k), një vlerë e veçantë e q, në varësi të numrit të grupeve, dhe një vlerë chi-katrore. Testi i përshtatshmërisë së Yastremskit ka të njëjtin kuptim si kriteri Romanovsky dhe shprehet me formulën

ku c 2 është kriteri i përshtatshmërisë së Pearson-it; - numri i grupeve; q - koeficienti, për numrin e grupeve më pak se 20, i barabartë me 0,6.

Nëse L fakt > 3, mospërputhjet midis shpërndarjeve teorike dhe empirike nuk janë të rastësishme, d.m.th. shpërndarja empirike nuk i plotëson kërkesat e një shpërndarjeje normale. Nëse L fakt< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.

Përkufizimi 51. Kriteret që ju lejojnë të gjykoni nëse vlerat janë të qëndrueshme X 1 , X 2 ,…, x n ndryshore e rastësishme X me një hipotezë në lidhje me funksionin e shpërndarjes së tij quhen kriteret e pëlqimit.

Ideja e përdorimit të kritereve të pëlqimit

Le të testohet një hipotezë bazuar në këtë material statistikor N, që konsiston në faktin se SV X i bindet disa ligjeve specifike të shpërndarjes. Ky ligj mund të specifikohet ose si funksion shpërndarjeje F(x), ose në formën e densitetit të shpërndarjes f(x), ose si një grup probabiliteti p i. Meqenëse nga të gjitha këto forma funksioni i shpërndarjes F(x) është më e përgjithshme (ekziston si për DSV ashtu edhe për NSV) dhe përcakton ndonjë tjetër, ne do të formulojmë një hipotezë N, pasi konsiston në faktin se sasia X ka një funksion shpërndarjeje F(x).

Për të pranuar ose hedhur poshtë një hipotezë N, merrni parasysh një sasi U, duke karakterizuar shkallën e divergjencës (devijimit) të shpërndarjeve teorike dhe statistikore. MadhësiaU mund të zgjidhen në mënyra të ndryshme: 1) shuma e devijimeve në katror të probabiliteteve teorike p i nga frekuencat përkatëse, 2) shuma e katrorëve të njëjtë me disa koeficientë (pesha), 3) devijimi maksimal i funksionit të shpërndarjes statistikore (empirike) nga ai teorik. F(x).

Lëreni vlerën U zgjedhur në një mënyrë ose në një tjetër. Natyrisht, kjo është një lloj ndryshoreje e rastësishme. Ligji i shpërndarjes U varet nga ligji i shpërndarjes së ndryshores së rastësishme X, mbi të cilat u kryen eksperimentet dhe mbi numrin e eksperimenteve n. Nëse hipoteza Nështë e vërtetë, atëherë ligji i shpërndarjes së sasisë U të përcaktuara nga ligji i shpërndarjes së sasisë X(funksioni F(x)) dhe numri n.

Le të supozojmë se ky ligj i shpërndarjes është i njohur. Si rezultat i kësaj serie eksperimentesh, u zbulua se masa e zgjedhur e mospërputhjes U mori njëfarë kuptimi u. Pyetje: a mund të shpjegohet kjo me arsye të rastësishme apo kjo mospërputhje është gjithashtu është i madh dhe tregon praninë e një ndryshimi të rëndësishëm midis shpërndarjeve teorike dhe statistikore (empirike) dhe, për rrjedhojë, papërshtatshmërinë e hipotezës N? Për t'iu përgjigjur kësaj pyetjeje, le të supozojmë se hipoteza Nështë e saktë, dhe sipas këtij supozimi ne llogarisim probabilitetin që, për arsye të rastësishme që lidhen me një sasi të pamjaftueshme të materialit eksperimental, masa e mospërputhjes U do të jetë jo më pak se vlera e vëzhguar eksperimentalisht u, pra llogarisim probabilitetin e ngjarjes: .

Nëse ky probabilitet është i vogël, atëherë hipoteza N duhet të refuzohet si pak e besueshme, por nëse ky probabilitet është i rëndësishëm, atëherë arrijmë në përfundimin se të dhënat eksperimentale nuk kundërshtojnë hipotezën N.

Shtrohet pyetja: si duhet zgjedhur masa e mospërputhjes (devijimit)? U? Rezulton se me disa metoda të zgjedhjes së tij, ligji i shpërndarjes së sasisë U ka veti shumë të thjeshta dhe me një mjaft të madhe n praktikisht i pavarur nga funksioni F(x). Janë pikërisht këto masa të mospërputhjes që përdoren në statistikat matematikore si kritere për marrëveshje.

Përkufizimi 51/. Kriteri i marrëveshjes është kriteri për testimin e hipotezës për ligjin e supozuar të një shpërndarjeje të panjohur.

Për të dhënat sasiore me shpërndarje afër normales, përdorni parametrike metodat e bazuara në tregues të tillë si pritshmëria matematikore dhe devijimi standard. Në veçanti, për të përcaktuar besueshmërinë e diferencës në mesatare për dy mostra, përdoret metoda (kriteri) Student dhe për të gjykuar dallimet midis tre ose më shumë mostrave, testi F, ose analiza e variancës. Nëse kemi të bëjmë me të dhëna jo sasiore ose mostrat janë shumë të vogla për të qenë të sigurt se popullatat nga të cilat janë marrë ndjekin një shpërndarje normale, atëherë përdorni joparametrike metoda - kriter χ 2(chi-square) ose Pearson për të dhënat dhe shenjat cilësore, renditjet, testet Mann-Whitney, Wilcoxon etj për të dhënat rendore.

Për më tepër, zgjedhja e metodës statistikore varet nga fakti nëse janë mostrat, vlerat e të cilave po krahasohen të pavarur(d.m.th., për shembull, marrë nga dy grupe të ndryshme lëndësh) ose i varur(d.m.th., duke pasqyruar rezultatet e të njëjtit grup subjektesh para dhe pas ekspozimit ose pas dy ekspozimeve të ndryshme).

fq. 1. Testi Pearson (- chi-square)

Le të prodhohet n eksperimente të pavarura, në secilën prej të cilave ndryshorja e rastësishme X mori një vlerë të caktuar, domethënë u dha një mostër e vëzhgimeve të ndryshores së rastësishme X vëllimi (popullsia e përgjithshme). n. Le të shqyrtojmë detyrën e kontrollit të afërsisë së funksioneve të shpërndarjes teorike dhe empirike për një shpërndarje diskrete, domethënë, kërkohet të kontrollohet nëse të dhënat eksperimentale janë në përputhje me hipotezën N 0, duke deklaruar se ndryshorja e rastësishme X ka një ligj të shpërndarjes F(x) në nivelin e rëndësisë α . Le ta quajmë këtë ligj "teorik".

Kur merrni një kriter të përshtatshmërisë për testimin e një hipoteze, përcaktoni masën D devijimet e funksionit të shpërndarjes empirike të një kampioni të caktuar nga funksioni i vlerësuar (teorik) i shpërndarjes F(x).

Masa më e përdorur është ajo e prezantuar nga Pearson. Le të shqyrtojmë këtë masë. Le të ndajmë grupin e vlerave të ndryshoreve të rastësishme Xr grupe - grupe S 1 , S 2 ,…, Sr, pa pika të përbashkëta. Në praktikë, një ndarje e tillë kryhet duke përdorur ( r- 1) numrat c 1 < c 2 < … < c r-1. Në këtë rast, fundi i çdo intervali përjashtohet nga grupi përkatës, dhe ai i majtë përfshihet.

S 1 S 2 S 3 …. Sr -1 Sr

c 1 c 2 c 3 c r -1

Le p i, , - probabiliteti që SV X i përket grupit S i(qartësisht). Le n i, , - numri i vlerave (variant) nga mesi i vëzhguesve që i përkasin grupit S i(frekuencat empirike). Pastaj frekuenca relative e goditjeve SV X në shumë S in vëzhgimet. Është e qartë se,.

Për ndarjen e mësipërme, p i ka një rritje F(x) në set S i, dhe rritja është në të njëjtin grup. Le të përmbledhim rezultatet e eksperimenteve në një tabelë në formën e një serie statistikore të grupuar.

Kufijtë e grupit Frekuenca relative
S 1:x 1 – x 2
S 2: x 2 – x 3
Sr: x rx r +1

Duke ditur ligjin teorik të shpërndarjes, mund të gjeni probabilitetet teorike të një ndryshoreje të rastësishme që bie në secilin grup: r 1 , r 2 , …, p r. Kur kontrollojmë konsistencën e shpërndarjeve teorike dhe empirike (statistikore), do të vazhdojmë nga mospërputhjet midis probabiliteteve teorike. p i dhe frekuencat e vëzhguara.

Për masë D mospërputhjet (devijimet) e funksionit të shpërndarjes empirike nga ai teorik marrin shumën e devijimeve në katror të probabiliteteve teorike p i nga frekuencat përkatëse të marra me "pesha" të caktuara c i: .

Shanset c i janë futur sepse, në rastin e përgjithshëm, devijimet që u përkasin grupeve të ndryshme nuk mund të konsiderohen të barabarta në rëndësi: një devijim i së njëjtës vlerë absolute mund të jetë pak i rëndësishëm nëse vetë probabiliteti p iështë i madh dhe shumë i dukshëm nëse është i vogël. Prandaj, natyrisht "peshat" c i marrin në përpjesëtim të zhdrejtë me probabilitetet. Si të zgjidhni këtë koeficient?

K. Pearson tregoi se nëse vendosim , atëherë për të mëdha n ligji i shpërndarjes së sasisë U ka veti shumë të thjeshta: është praktikisht i pavarur nga funksioni i shpërndarjes F(x) dhe mbi numrin e eksperimenteve n, por varet vetëm nga numri i grupeve r, përkatësisht, ky ligj me rritje n i afrohet të ashtuquajturës shpërndarje chi-square .

Nëse keni nevojë për materiale shtesë për këtë temë, ose nuk keni gjetur atë që po kërkoni, ju rekomandojmë të përdorni kërkimin në bazën e të dhënave tona të veprave:

Çfarë do të bëjmë me materialin e marrë:

Nëse ky material ishte i dobishëm për ju, mund ta ruani në faqen tuaj në rrjetet sociale:



Ju pëlqeu artikulli? Ndani me miqtë tuaj!