Analiza e variancës bën të mundur vlerësimin. Analiza e variancës

Për çfarë përdoret analiza e variancës? Qëllimi i analizës së variancës është të studiojë praninë ose mungesën e një ndikimi të rëndësishëm të çdo faktori cilësor ose sasior në ndryshimet në karakteristikën rezultante që studiohet. Për ta bërë këtë, një faktor që besohet se ka ose nuk ka një efekt të rëndësishëm ndahet në klasa gradimi (me fjalë të tjera, grupe) dhe përcaktohet nëse ndikimi i faktorit është i njëjtë duke ekzaminuar rëndësinë midis mjeteve. në grupet e të dhënave që korrespondojnë me gradimet e faktorit. Shembuj: studiohet varësia e fitimit të ndërmarrjes nga lloji i lëndëve të para të përdorura (atëherë klasat e gradimit janë llojet e lëndëve të para), varësia e kostos së prodhimit për njësi të prodhimit nga madhësia e ndarjes së ndërmarrjes (pastaj Klasat e gradimit janë karakteristikat e madhësisë së ndarjes: të mëdha, të mesme, të vogla).

Numri minimal i klasave të gradimit (grupeve) është dy. Klasat e diplomimit mund të jenë cilësore ose sasiore.

Pse analiza e variancës quhet analizë e variancës? Analiza e variancës shqyrton marrëdhënien midis dy variancave. Dispersioni, siç e dimë, është një karakteristikë e shpërndarjes së të dhënave rreth vlerës mesatare. E para është shpërndarja e shpjeguar nga ndikimi i faktorit, i cili karakterizon shpërndarjen e vlerave midis shkallëzimeve të faktorit (grupeve) rreth mesatares së të gjitha të dhënave. E dyta është varianca e pashpjegueshme, e cila karakterizon shpërndarjen e të dhënave brenda gradimeve (grupeve) rreth vlerave mesatare të vetë grupeve. Varianca e parë mund të quhet ndërmjet grupeve, dhe e dyta - brenda grupeve. Raporti i këtyre variancave quhet raporti aktual Fisher dhe krahasohet me vlerën kritike të raportit Fisher. Nëse raporti aktual Fisher është më i madh se ai kritik, atëherë mesataret e klasave të gradimit ndryshojnë nga njëra-tjetra dhe faktori në studim ndikon ndjeshëm në ndryshimin e të dhënave. Nëse është më pak, atëherë klasat e gradimit mesatar nuk ndryshojnë nga njëra-tjetra dhe faktori nuk ka një ndikim të rëndësishëm.

Si formulohen, pranohen dhe refuzohen hipotezat në ANOVA? Në analizën e variancës, përcaktohet pesha specifike e ndikimit total të një ose më shumë faktorëve. Rëndësia e ndikimit të një faktori përcaktohet duke testuar hipotezat:

  • H0 : μ 1 = μ 2 = ... = μ a, Ku a- numri i klasave të gradimit - të gjitha klasat e gradimit kanë të njëjtën vlerë mesatare,
  • H1 : Jo të gjithë μ i e barabartë - jo të gjitha klasat e gradimit kanë të njëjtën vlerë mesatare.

Nëse ndikimi i një faktori nuk është i rëndësishëm, atëherë diferenca midis klasave të gradimit të këtij faktori është gjithashtu e parëndësishme dhe gjatë analizës së variancës hipoteza zero H0 nuk refuzohet. Nëse ndikimi i faktorit është i rëndësishëm, atëherë hipoteza zero H0 refuzuar: jo të gjitha klasat e gradimit kanë të njëjtën vlerë mesatare, domethënë, midis ndryshimeve të mundshme midis klasave të gradimit, një ose më shumë janë të rëndësishme.

Disa koncepte të tjera të analizës së variancës. Një kompleks statistikor në analizën e variancës është një tabelë e të dhënave empirike. Nëse të gjitha klasat e gradimeve kanë të njëjtin numër opsionesh, atëherë kompleksi statistikor quhet homogjen (homogjen), nëse numri i opsioneve është i ndryshëm - heterogjen (heterogjen).

Në varësi të numrit të faktorëve që vlerësohen, dallohen analiza e variancës me një faktor, dy faktorë dhe shumëfaktorë.

Analiza e variancës me një faktor: thelbi i metodës, formula, shembuj

Thelbi i metodës, formula

bazohet në faktin se shuma e devijimeve në katror të një kompleksi statistikor mund të ndahet në komponentë:

SS = SS a+ SS e,

SS

SSa a shuma e devijimeve në katror,

SSe- shuma e pashpjegueshme e devijimeve në katror ose shuma e devijimeve të gabimit në katror.

Nëse përmes ni tregoni numrin e opsioneve në çdo klasë gradimi (grup) dhe aështë numri i përgjithshëm i gradimeve të faktorit (grupeve), atëherë është numri i përgjithshëm i vëzhgimeve dhe mund të merren formulat e mëposhtme:

numri total i devijimeve në katror: ,

shpjegohet me ndikimin e faktorit a shuma e devijimeve në katror: ,

shuma e pashpjegueshme e devijimeve në katror ose shuma e devijimeve të gabimit në katror: ,

- mesatarja e përgjithshme e vëzhgimeve,

(grupi).

Përveç kësaj,

ku është varianca e gradimit të faktorit (grupit).

Për të kryer një analizë të njëanshme të variancës së të dhënave nga një kompleks statistikor, duhet të gjeni raportin aktual të Fisher - raporti i variancës i shpjeguar nga ndikimi i faktorit (ndërgrupi) dhe varianca e pashpjegueshme (intragrupi):

dhe krahasojeni atë me vlerën kritike të Fisher.

Variacionet llogariten si më poshtë:

Varianca e shpjeguar,

Variancë e pashpjegueshme

va = a − 1 - numri i shkallëve të lirisë së variancës së shpjeguar,

ve = na - numri i shkallëve të lirisë së variancës së pashpjegueshme,

v = n

Vlera kritike e raportit Fisher me vlera të caktuara të nivelit të rëndësisë dhe shkallëve të lirisë mund të gjendet në tabela statistikore ose të llogaritet duke përdorur funksionin MS Excel F.OBR (figura më poshtë, për ta zmadhuar, klikoni mbi të me butoni i majtë i miut).


Funksioni kërkon që të futni të dhënat e mëposhtme:

Probabiliteti - niveli i rëndësisë α ,

Gradë_liri1 - numri i shkallëve të lirisë së variancës së shpjeguar va,

Gradë_liri2 - numri i shkallëve të lirisë së variancës së pashpjegueshme ve.

Nëse vlera aktuale e raportit Fisher është më e madhe se vlera kritike (), atëherë hipoteza zero refuzohet në nivelin e rëndësisë α . Kjo do të thotë se faktori ndikon ndjeshëm në ndryshimin e të dhënave dhe të dhënat varen nga faktori me probabilitet P = 1 − α .

Nëse vlera aktuale e raportit Fisher është më e vogël se vlera kritike (), atëherë hipoteza zero nuk mund të refuzohet në nivelin e rëndësisë α . Kjo do të thotë se faktori nuk ndikon ndjeshëm në të dhënat me probabilitet P = 1 − α .

ANOVA Njëkahëshe: Shembuj

Shembulli 1.Është e nevojshme të zbulohet nëse lloji i lëndëve të para të përdorura ndikon në fitimin e ndërmarrjes. Në gjashtë klasa (grupe) të gradimit të faktorit (lloji i parë, lloji i dytë, etj.) mblidhen të dhëna për fitimet nga prodhimi i 1000 njësive të produktit në miliona rubla gjatë 4 viteve.

Lloji i lëndës së parë2014 2015 2016 2017
17,21 7,55 7,29 7,6
27,89 8,27 7,39 8,18
37,25 7,01 7,37 7,53
47,75 7,41 7,27 7,42
57,7 8,28 8,55 8,6
6-të7,56 8,05 8,07 7,84
Mesatare
Dispersion
7,413 0,0367
7,933 0,1571
7,290 0,0480
7,463 0,0414
8,283 0,1706
7,880 0,0563

a= 6 dhe në secilën klasë (grup) ni=4 vëzhgimet. Numri i përgjithshëm i vëzhgimeve n = 24 .

Numri i shkallëve të lirisë:

va = a − 1 = 6 − 1 = 5 ,

ve = na = 24 − 6 = 18 ,

v = n − 1 = 24 − 1 = 23 .

Le të llogarisim variancat:

.

.

Meqenëse raporti aktual Fischer është më i madh se ai kritik:

me nivel rëndësie α = 0,05 konkludojmë se fitimi i ndërmarrjes, në varësi të llojit të lëndëve të para të përdorura në prodhim, ndryshon dukshëm.

Ose, çfarë është e njëjta gjë, ne hedhim poshtë hipotezën kryesore për barazinë e mesatareve në të gjitha klasat (grupet) e gradimit të faktorëve.

Në shembullin e sapo shqyrtuar, çdo klasë e gradimit të faktorëve kishte të njëjtin numër opsionesh. Por, siç u përmend në pjesën hyrëse, numri i opsioneve mund të ndryshojë. Dhe kjo në asnjë mënyrë nuk e komplikon procedurën e analizës së variancës. Ky është shembulli tjetër.

Shembulli 2. Kërkohet të zbulohet nëse ka një varësi të kostos së prodhimit për njësi të prodhimit nga madhësia e ndarjes së ndërmarrjes. Faktori (madhësia e njësisë) ndahet në tre klasa gradimi (grupe): i vogël, i mesëm, i madh. Përmblidhen të dhënat që korrespondojnë me këto grupe për koston e prodhimit të një njësie të të njëjtit lloj produkti për një periudhë të caktuar.

i vogëlmesatarei madh
48 47 46
50 61 57
63 63 57
72 47 55
43 32
59 59
58
Mesatare58,6 54,0 51,0
Dispersion128,25 65,00 107,60

Numri i klasave të gradimit të faktorëve (grupe) a= 3, numri i vëzhgimeve në klasa (grupe) n1 = 4 , n2 = 7 , n3 = 6 . Numri i përgjithshëm i vëzhgimeve n = 17 .

Numri i shkallëve të lirisë:

va = a − 1 = 2 ,

ve = na = 17 − 3 = 14 ,

v = n − 1 = 16 .

Le të llogarisim shumën e devijimeve në katror:

Le të llogarisim variancat:

,

.

Le të llogarisim raportin aktual të Fisher:

.

Vlera kritike e raportit Fisher:

Meqenëse vlera aktuale e raportit Fisher është më e vogël se ajo kritike: , konkludojmë se madhësia e divizionit të ndërmarrjes nuk ka një ndikim të rëndësishëm në koston e prodhimit.

Ose, çfarë është e njëjta, me një probabilitet prej 95% pranojmë hipotezën kryesore se kostoja mesatare e prodhimit të një njësie të të njëjtit produkt në divizionet e vogla, të mesme dhe të mëdha të ndërmarrjes nuk ndryshon ndjeshëm.

ANOVA njëkahëshe në MS Excel

Analiza njëkahëshe e variancës mund të kryhet duke përdorur procedurën MS Excel ANOVA me një drejtim. Ne e përdorim atë për të analizuar të dhënat mbi marrëdhënien midis llojit të lëndëve të para të përdorura dhe fitimit të ndërmarrjes nga shembulli 1.

Shërbimi/Analiza e të Dhënave dhe zgjidhni një mjet analize ANOVA me një drejtim.

Në dritare Intervali i hyrjes tregoni zonën e të dhënave (në rastin tonë është $A$2:$E$7). Ne tregojmë se si grupohet faktori - sipas kolonave ose rreshtave (në rastin tonë, sipas rreshtave). Nëse kolona e parë përmban emrat e klasave të faktorëve, shënoni kutinë Etiketat në kolonën e parë. Në dritare Alfa tregojnë nivelin e rëndësisë α = 0,05 .

Tabela e dytë - Analiza e variancës - përmban të dhëna për vlerat për faktorin midis grupeve dhe brenda grupeve dhe totaleve. Kjo është shuma e devijimeve në katror (SS), numri i shkallëve të lirisë (df), dispersioni (MS). Tre kolonat e fundit përmbajnë vlerën aktuale të raportit Fisher (F), nivelit p (P-vlera) dhe vlerën kritike të raportit Fisher (F crit).

ZNJ F P-vlera F crit
0,58585 6,891119 0,000936 2,77285
0,085017

Meqenëse vlera aktuale e raportit Fisher (6.89) është më e madhe se ajo kritike (2.77), me një probabilitet prej 95% ne hedhim poshtë hipotezën zero për barazinë e produktivitetit mesatar kur përdorim të gjitha llojet e lëndëve të para, d.m.th. arrijnë në përfundimin se lloji i lëndëve të para të përdorura ndikon në ndërmarrjet fitimprurëse.

Analiza me dy faktorë të variancës pa përsëritje: thelbi i metodës, formula, shembull

Analiza e variancës me dy faktorë përdoret për të kontrolluar varësinë e mundshme të karakteristikës që rezulton nga dy faktorë - A Dhe B. Pastaj a- numri i shkallëzimeve të faktorëve A Dhe b- numri i shkallëzimeve të faktorëve B. Në kompleksin statistikor, shuma e mbetjeve në katror ndahet në tre komponentë:

SS = SS a+ SS b+ SS e,

- shuma totale e devijimeve në katror,

- shpjegohet me ndikimin e faktorit A shuma e devijimeve në katror,

- shpjegohet me ndikimin e faktorit B shuma e devijimeve në katror,

- mesatarja e përgjithshme e vëzhgimeve,

Mesatarja e vëzhgimeve në çdo shkallëzim faktori A ,

B .

A ,

Varianca shpjegohet me ndikimin e faktorit B ,

va = a − 1 A ,

vb = b − 1 - numri i shkallëve të lirisë së shpërndarjes shpjegohet me ndikimin e faktorit B ,

ve = ( a − 1)(b − 1)

v = ab− 1 - numri i përgjithshëm i shkallëve të lirisë.

Nëse faktorët nuk varen nga njëri-tjetri, atëherë për të përcaktuar rëndësinë e faktorëve, parashtrohen dy hipoteza zero dhe hipotezat përkatëse alternative:

për faktor A :

H0 : μ 1A = μ 2A = ... = μ aA,

H1 : Jo të gjithë μ iA të barabartë;

për faktor B :

H0 : μ 1B = μ 2B = ... = μ aB,

H1 : Jo të gjithë μ iB janë të barabartë.

A

Për të përcaktuar ndikimin e një faktori B, ju duhet të krahasoni qëndrimin aktual të Fischer-it me qëndrimin kritik të Fischer-it.

α P = 1 − α .

α P = 1 − α .

ANOVA dykahëshe pa përsëritje: një shembull

Shembulli 3. Informacioni jepet për konsumin mesatar të karburantit për 100 kilometra në litra në varësi të madhësisë së motorit dhe llojit të karburantit.

Është e nevojshme të kontrollohet nëse konsumi i karburantit varet nga madhësia e motorit dhe lloji i karburantit.

Zgjidhje. Për faktor A numri i klasave të gradimit a= 3, për faktorin B numri i klasave të gradimit b = 3 .

Ne llogarisim shumën e devijimeve në katror:

,

,

,

.

Ndryshimet përkatëse:

,

,

.

A . Meqenëse raporti aktual i Fisher është më i vogël se ai kritik, me një probabilitet prej 95% pranojmë hipotezën se vëllimi i motorit nuk ndikon në konsumin e karburantit. Megjithatë, nëse zgjedhim nivelin e rëndësisë α = 0.1, pastaj vlera aktuale e raportit Fisher dhe më pas me një probabilitet prej 95% mund të pranojmë që vëllimi i motorit të ndikojë në konsumin e karburantit.

Raporti aktual Fisher për faktorin B , vlera kritike e raportit Fisher: . Duke qenë se raporti aktual Fisher është më i madh se vlera kritike e raportit Fisher, ne pranojmë me probabilitet 95% që lloji i karburantit të ndikojë në konsumin e tij.

ANOVA dykahëshe pa përsëritje në MS Excel

Analiza e variancës me dy faktorë pa përsëritje mund të kryhet duke përdorur procedurën MS Excel. Ne e përdorim atë për të analizuar të dhënat mbi lidhjen midis llojit të karburantit dhe konsumit të tij nga shembulli 3.

Në menynë MS Excel, ekzekutoni komandën Shërbimi/Analiza e të Dhënave dhe zgjidhni një mjet analize ANOVA dykahëshe pa përsëritje.

Ne i plotësojmë të dhënat në të njëjtën mënyrë si në rastin e analizës së variancës në një drejtim.


Si rezultat i procedurës, shfaqen dy tabela. Tabela e parë është Totalet. Ai përmban të dhëna për të gjitha klasat e gradimit të faktorëve: numrin e vëzhgimeve, vlerën totale, vlerën mesatare dhe variancën.

Tabela e dytë - Analiza e variancës - përmban të dhëna për burimet e variacionit: dispersioni ndërmjet rreshtave, dispersioni ndërmjet kolonave, shpërndarja e gabimit, shpërndarja totale, shuma e devijimeve në katror (SS), shkallët e lirisë (df), dispersioni (MS). Tre kolonat e fundit përmbajnë vlerën aktuale të raportit Fisher (F), nivelit p (P-vlera) dhe vlerën kritike të raportit Fisher (F crit).

ZNJ F P-vlera F crit
3,13 5,275281 0,075572 6,94476
8,043333 13,55618 0,016529 6,944276
0,593333

Faktori A(zhvendosja e motorit) grupohet në vija. Meqenëse raporti aktual Fisher prej 5.28 është më i vogël se ai kritik prej 6.94, ne pranojmë me probabilitet 95% që konsumi i karburantit të mos varet nga madhësia e motorit.

Faktori B(lloji i karburantit) grupohet në kolona. Raporti aktual i Fisher prej 13.56 është më i madh se raporti kritik prej 6.94, kështu që ne pranojmë me probabilitet 95% që konsumi i karburantit varet nga lloji i tij.

Analiza me dy faktorë të variancës me përsëritje: thelbi i metodës, formula, shembull

Analiza me dy faktorë të variancës me përsëritje përdoret për të kontrolluar jo vetëm varësinë e mundshme të karakteristikës që rezulton nga dy faktorë - A Dhe B, por edhe ndërveprimin e mundshëm të faktorëve A Dhe B. Pastaj a- numri i shkallëzimeve të faktorëve A Dhe b- numri i shkallëzimeve të faktorëve B, r- numri i përsëritjeve. Në kompleksin statistikor, shuma e mbetjeve në katror ndahet në katër komponentë:

SS = SS a+ SS b+ SS ab + SS e,

- shuma totale e devijimeve në katror,

- shpjegohet me ndikimin e faktorit A shuma e devijimeve në katror,

- shpjegohet me ndikimin e faktorit B shuma e devijimeve në katror,

- shpjegohet me ndikimin e ndërveprimit të faktorëve A Dhe B shuma e devijimeve në katror,

- shuma e pashpjegueshme e devijimeve në katror ose shuma e devijimeve të gabimit në katror,

- mesatarja e përgjithshme e vëzhgimeve,

- mesatarja e vrojtimeve në çdo shkallëzim faktori A ,

- numri mesatar i vëzhgimeve në çdo shkallëzim faktori B ,

Numri mesatar i vëzhgimeve në secilin kombinim të shkallëzimeve të faktorëve A Dhe B ,

n = abr- numri i përgjithshëm i vëzhgimeve.

Variacionet llogariten si më poshtë:

Varianca shpjegohet me ndikimin e faktorit A ,

Varianca shpjegohet me ndikimin e faktorit B ,

- varianca e shpjeguar nga bashkëveprimi i faktorëve A Dhe B ,

- variancë e pashpjegueshme ose variancë gabimi,

va = a − 1 - numri i shkallëve të lirisë së shpërndarjes shpjegohet me ndikimin e faktorit A ,

vb = b − 1 - numri i shkallëve të lirisë së shpërndarjes shpjegohet me ndikimin e faktorit B ,

vab = ( a − 1)(b − 1) - numri i shkallëve të lirisë së variancës i shpjeguar nga bashkëveprimi i faktorëve A Dhe B ,

ve = ab(r − 1) - numri i shkallëve të lirisë së variancës së pashpjegueshme ose variancës së gabimit,

v = abr− 1 - numri i përgjithshëm i shkallëve të lirisë.

Nëse faktorët nuk varen nga njëri-tjetri, atëherë për të përcaktuar rëndësinë e faktorëve, parashtrohen tre hipoteza zero dhe hipotezat përkatëse alternative:

për faktor A :

H0 : μ 1A = μ 2A = ... = μ aA,

H1 : Jo të gjithë μ iA të barabartë;

për faktor B :

Për të përcaktuar ndikimin e bashkëveprimit të faktorëve A Dhe B, ju duhet të krahasoni qëndrimin aktual të Fischer-it me qëndrimin kritik të Fischer-it.

Nëse raporti aktual Fisher është më i madh se raporti kritik Fisher, atëherë hipoteza zero duhet të refuzohet në nivelin e rëndësisë α . Kjo do të thotë se faktori ndikon ndjeshëm në të dhënat: të dhënat varen nga faktori me probabilitet P = 1 − α .

Nëse raporti aktual Fisher është më i vogël se raporti kritik Fisher, atëherë hipoteza zero duhet të pranohet në nivelin e rëndësisë α . Kjo do të thotë se faktori nuk ndikon ndjeshëm në të dhënat me probabilitet P = 1 − α .

ANOVA dykahëshe me përsëritje: një shembull

në lidhje me ndërveprimin e faktorëve A Dhe B: Raporti aktual i Fisher është më pak se kritik, prandaj, ndërveprimi i fushatës reklamuese dhe një dyqani specifik nuk është i rëndësishëm.

Analiza e dyanshme e variancës me përsëritje në MS Excel

Analiza e dyanshme e variancës me replikat mund të kryhet duke përdorur procedurën MS Excel. Ne e përdorim atë për të analizuar të dhënat mbi marrëdhënien midis të ardhurave të dyqanit dhe zgjedhjes së një dyqani specifik dhe fushatës reklamuese nga shembulli 4.

Në menynë MS Excel, ekzekutoni komandën Shërbimi/Analiza e të Dhënave dhe zgjidhni një mjet analize ANOVA dykahëshe me përsëritje.

Ne i plotësojmë të dhënat në të njëjtën mënyrë si në rastin e analizës së variancës me dy faktorë pa përsëritje, me shtimin se në numrin e rreshtave për dritaren e mostrës duhet të vendosni numrin e përsëritjeve.

Si rezultat i procedurës, shfaqen dy tabela. Tabela e parë përbëhet nga tre pjesë: dy të parat korrespondojnë me secilën nga dy fushatat reklamuese, e treta përmban të dhëna për të dyja fushatat reklamuese. Kolonat e tabelës përmbajnë informacion për të gjitha klasat e gradimit të faktorit të dytë - ruajtja: numri i vëzhgimeve, vlera totale, vlera mesatare dhe shpërndarja.

Tabela e dytë përmban të dhëna për shumën e devijimeve në katror (SS), numrin e shkallëve të lirisë (df), dispersionin (MS), vlerën aktuale të raportit Fisher (F), nivelin p (vlera P) dhe vlera kritike e raportit Fisher (F crit) për burime të ndryshme variacioni: dy faktorë, të cilët jepen në rreshta (kampion) dhe kolona, ​​bashkëveprimi i faktorëve, gabimi (brenda) dhe treguesit total (totali).

ZNJ F P-vlera F crit
8,013339 0,500252 0,492897 4,747221
189,1904 11,81066 0,001462 3,88529
6,925272 0,432327 0,658717 3,88529
16,01861

Për faktor B Raporti aktual i Fisher është më i madh se raporti kritik, prandaj ekziston një probabilitet 95% që të ardhurat të ndryshojnë ndjeshëm midis dyqaneve.

Për bashkëveprimin e faktorëve A Dhe B Raporti aktual i Fisher është më pak se kritik, prandaj, me një probabilitet prej 95%, ndërveprimi i fushatës reklamuese dhe një dyqani specifik nuk është i rëndësishëm.

Gjithçka në temën "Statistikat matematikore"

Ky artikull diskuton analizën e variancës. Janë analizuar tiparet karakteristike të aplikimit të tij, jepen metodat e analizës së variancës dhe kushtet për përdorimin e analizës së variancës. Nevoja për të përdorur këtë metodë është identifikuar dhe justifikuar. Në bazë të hulumtimit të kryer jepen fazat e analizës klasike të variancës.

  • Për çështjen e sigurimit të kontrollit të cilësisë së makinave pas riparimeve në ndërmarrjet e shërbimit të automobilave, duke marrë parasysh kërkesat e sistemit të certifikimit
  • Problemet e zbatimit të teknologjive të informacionit në logjistikë duke përdorur shembullin e organizatave ruse
  • Përmirësimi i efikasitetit të një impianti gjenerues të valëve
  • Manuali edukativo-metodologjik “Sistemi Tokë-Hënë” në sistemin e mësimit në distancë Moodle

Qëllimi kryesor i analizës së variancës është të ekzaminojë rëndësinë e dallimeve midis mesatareve. Nëse thjesht po krahasoni mesataret e dy mostrave, analiza e variancës do të japë të njëjtin rezultat si analiza e zakonshme. t- test për mostra të pavarura (kjo është nëse krahasohen dy grupe të pavarura objektesh ose vëzhgimesh) ose t-test për mostra të varura (kjo është nëse dy variabla krahasohen në të njëjtin grup objektesh ose vëzhgimesh).

Analiza e variancës ka këtë emër për shkak të disa faktorëve. Mund të duket e çuditshme që procedura për krahasimin e mesatareve quhet analiza e variancës. Në realitet, kjo ndodh sepse kur shqyrtojmë rëndësinë statistikore të një ndryshimi midis mesatareve të dy (ose më shumë) grupeve, ne në fakt po krahasojmë (d.m.th., analizojmë) variancat e mostrës. Koncepti themelor i analizës së variancës u propozua nga Fisher në 1920. Ndoshta termi më i natyrshëm do të ishte analiza e shumës së katrorëve ose analiza e variacionit, por për shkak të traditës, përdoret termi analizë e variancës.

Analiza e variancës është një metodë në statistikat matematikore që synon kërkimin e varësive në të dhënat eksperimentale duke ekzaminuar rëndësinë e dallimeve në vlerat mesatare. Ndryshe nga testi t, ju lejon të krahasoni vlerat mesatare të tre ose më shumë grupeve. Zhvilluar nga R. Fischer për analizimin e rezultateve të studimeve eksperimentale. Në literaturë gjendet edhe emërtimi ANOVA. Analiza e Variancës).

Gjatë kryerjes së hulumtimit të tregut, shpesh lind pyetja e krahasueshmërisë së rezultateve. Për shembull, kur kryhen anketa mbi konsumin e një produkti në rajone të ndryshme të vendit, është e nevojshme të nxirren përfundime se në çfarë mase ndryshojnë ose nuk ndryshojnë të dhënat e anketës nga njëra-tjetra. Nuk ka kuptim të krahasohen treguesit individualë, dhe për këtë arsye procedura e krahasimit dhe vlerësimit pasues kryhet duke përdorur disa vlera mesatare dhe devijime nga ky vlerësim mesatar. Studohet variacioni i tiparit. Dispersioni mund të merret si një masë ndryshimi. Dispersioni σ 2 është një masë e variacionit, e përcaktuar si mesatare e devijimeve të një karakteristike në katror.

Në praktikë, shpesh lindin probleme të një natyre më të përgjithshme - problemi i kontrollit të rëndësisë së dallimeve në mesataret e disa popullsive të mostrës. Për shembull, është e nevojshme të vlerësohet ndikimi i lëndëve të para të ndryshme në cilësinë e produkteve të prodhuara, për të zgjidhur problemin e ndikimit të sasisë së plehrave në rendimentet bujqësore. produkteve.

Ndonjëherë analiza e variancës përdoret për të përcaktuar homogjenitetin e disa popullatave (variencat e këtyre popullatave janë të njëjta sipas supozimit; nëse analiza e variancës tregon se pritjet matematikore janë të njëjta, atëherë në këtë kuptim popullatat janë homogjene). Popullatat homogjene mund të kombinohen në një dhe në këtë mënyrë të marrin informacion më të plotë për të, dhe për këtë arsye përfundime më të besueshme.

Analiza e metodave të variancës

  1. Metoda Fisher - F test; Metoda përdoret në analizën e variancës në një drejtim, ku varianca totale e të gjitha vlerave të vëzhguara zbërthehet në variancë brenda grupeve individuale dhe variancë midis grupeve.
  2. Metoda e "modelit të përgjithshëm linear". Ai bazohet në analizën e korrelacionit ose regresionit të përdorur në analizën multivariate.

Modeli i dispersionit me një faktor ka formën: x ij = μ + F j + ε ij ,
ku x ij është vlera e ndryshores në studim e marrë në nivelin i-të të faktorit (i=1,2,...,t) me numrin e serisë j-të (j=1,2,.. .,n); F i – efekti i shkaktuar nga ndikimi i nivelit të i-të të faktorit; ε ij – komponent i rastësishëm, ose shqetësim i shkaktuar nga ndikimi i faktorëve të pakontrollueshëm, d.m.th. ndryshim brenda një niveli të caktuar.

Rasti më i thjeshtë i analizës së variancës është analiza e njëanshme e njëanshme për dy ose më shumë grupe të pavarura, kur të gjitha grupet kombinohen sipas një karakteristike. Gjatë analizës testohet hipoteza zero e barazisë së mesatareve. Kur analizohen dy grupe, analiza e variancës është identike me analizën me dy mostra t-Testi i studentit për mostrat e pavarura, dhe vlera F-statistika është e barabartë me katrorin e përkatëses t-statistikat.

Për të konfirmuar barazinë e variancave, zakonisht përdoret kriteri Lievene ( Testi i Levene). Nëse hipoteza e barazisë së variancave refuzohet, analiza kryesore nuk është e zbatueshme. Nëse variancat janë të barabarta, atëherë për të vlerësuar raportin e ndryshueshmërisë ndërgrupore dhe ndërgrupore, ne përdorim F- Kriteri Fisher Nëse F-statistikat e kalojnë vlerën kritike, pastaj hidhet poshtë hipoteza zero dhe nxirret përfundimi për pabarazinë e mjeteve. Kur analizoni mesataret e dy grupeve, rezultatet mund të interpretohen drejtpërdrejt pas aplikimit të testit Fisher.

Shumë faktorë. Bota është komplekse dhe shumëdimensionale në natyrë. Situatat kur një fenomen i caktuar përshkruhet plotësisht nga një variabël janë jashtëzakonisht të rralla. Për shembull, nëse përpiqemi të mësojmë se si të rritim domate të mëdha, duhet të kemi parasysh faktorët që lidhen me strukturën gjenetike të bimës, llojin e tokës, dritën, temperaturën, etj. Kështu, kur kryhet një eksperiment tipik, duhet të merret me një numër të madh faktorësh. Arsyeja kryesore pse përdorimi i ANOVA është i preferueshëm se krahasimet e përsëritura të dy mostrave në nivele të ndryshme faktorësh duke përdorur seri t- kriter është që analiza e variancës është dukshëm më e madhe efektive dhe, për mostrat e vogla, më informuese. Ju duhet të bëni disa përpjekje për të zotëruar teknikën ANOVA të zbatuar në STATISTICA dhe të përjetoni përfitimet e saj të plota në studime specifike.

Modeli i variancës me dy faktorë ka formën:

x ijk =μ+F i +G j +I ij +ε ijk ,

ku x ijk është vlera e vëzhgimit në qelizën ij me numër k; μ - mesatarja e përgjithshme; F i - efekti i shkaktuar nga ndikimi i nivelit të i-të të faktorit A; G j - efekti i shkaktuar nga ndikimi i nivelit j të faktorit B; I ij - efekt i shkaktuar nga bashkëveprimi i dy faktorëve, d.m.th. devijimi nga mesatarja e vëzhgimit në qelizën ij nga shuma e tre termave të parë në model; ε ijk është një shqetësim i shkaktuar nga ndryshimi i një ndryshoreje brenda një qelize të vetme. Supozohet se ε ijk ka një ligj të shpërndarjes normale N(0; c 2), dhe të gjitha pritjet matematikore F *, G *, I i *, I * j janë të barabarta me zero.

Ekzistojnë kushte për përdorimin e analizës së variancës:

  1. Objektivi i studimit është të përcaktojë fuqinë e ndikimit të një (deri në 3) faktorë në rezultat ose të përcaktojë forcën e ndikimit të kombinuar të faktorëve të ndryshëm (gjinia dhe mosha, aktiviteti fizik dhe ushqimi, etj.).
  2. Faktorët që studiohen duhet të jenë të pavarur (të palidhur) me njëri-tjetrin. Për shembull, është e pamundur të studiohet ndikimi i përbashkët i përvojës së punës dhe moshës, lartësisë dhe peshës së fëmijëve, etj. mbi sëmundshmërinë e popullsisë.
  3. Përzgjedhja e grupeve për studim kryhet në mënyrë të rastësishme (përzgjedhja e rastësishme). Organizimi i një kompleksi dispersioni me zbatimin e parimit të rastësisë në zgjedhjen e opsioneve quhet randomizim (përkthyer nga anglishtja - i rastësishëm), d.m.th. zgjedhur në mënyrë të rastësishme.
  4. Mund të përdoren si karakteristikat sasiore ashtu edhe ato cilësore (atributive).

Gjatë kryerjes së analizës së variancës në një drejtim, rekomandohet (kusht i domosdoshëm për përdorim):

  1. Normaliteti i shpërndarjes së grupeve të analizuara ose korrespondenca e grupeve të mostrës me popullatat e përgjithshme me shpërndarje normale.
  2. Pavarësia (jo lidhje) e shpërndarjes së vëzhgimeve në grupe.
  3. Disponueshmëria e shpeshtësisë (përsëritjes) e vëzhgimeve.

Normaliteti i shpërndarjes përcaktohet nga kurba e Gausit (De Mavoor), e cila mund të përshkruhet me funksionin y=f(x), pasi është një nga ligjet e shpërndarjes që përdoret për të përafruar përshkrimin e dukurive që janë të rastësishme, probabiliste. në natyrë. Lënda e hulumtimit biomjekësor është fenomeni probabilist që gjendet mjaft shpesh në hulumtime të tilla.

Analiza klasike e variancës kryhet në fazat e mëposhtme:

  1. Ndërtimi i një kompleksi dispersioni.
  2. Llogaritja e devijimeve mesatare katrore.
  3. Llogaritja e variancës.
  4. Krahasimi i variancave të faktorëve dhe atyre të mbetur.
  5. Vlerësimi i rezultateve duke përdorur vlerat teorike të shpërndarjes Fisher-Snedecor
  6. Aplikimet moderne të analizës së variancës mbulojnë një gamë të gjerë problemesh në ekonomi, biologji dhe teknologji dhe zakonisht interpretohen në termat e teorisë statistikore të identifikimit të dallimeve sistematike midis rezultateve të matjeve direkte të bëra në kushte të caktuara ndryshimi.
  7. Falë automatizimit të analizës së variancës, një studiues mund të kryejë studime të ndryshme statistikore duke përdorur një kompjuter, duke shpenzuar më pak kohë dhe përpjekje për llogaritjet e të dhënave. Aktualisht, ka shumë paketa softuerësh aplikativë që zbatojnë aparatin e analizës së dispersionit. Produktet softuerike më të zakonshme janë: MS Excel, Statistica; Stadia; SPSS.

Shumica e metodave statistikore zbatohen në produktet moderne të softuerit statistikor. Me zhvillimin e gjuhëve të programimit algoritmik, u bë e mundur krijimi i blloqeve shtesë për përpunimin e të dhënave statistikore.

Analiza e variancës është një metodë e fuqishme moderne statistikore për përpunimin dhe analizimin e të dhënave eksperimentale në psikologji, biologji, mjekësi dhe shkenca të tjera. Ai lidhet shumë ngushtë me metodologjinë specifike për hartimin dhe kryerjen e kërkimit eksperimental.

Analiza e variancës përdoret në të gjitha fushat e kërkimit shkencor ku është e nevojshme të analizohet ndikimi i faktorëve të ndryshëm në variablin në studim.

Bibliografi

  1. Ableeva, A. M. Formimi i një fondi të mjeteve të vlerësimit në kushtet e Standardit Federal të Arsimit të Shtetit [Tekst] / A. M. Ableeva, G. A. Salimova // Problemet aktuale të mësimdhënies së disiplinave sociale, humanitare, shkencave natyrore dhe teknike në kontekstin e modernizimit të arsimit të lartë edukimi: materiale konferencë shkencore dhe metodologjike ndërkombëtare, 4-5 prill 2014 / Universiteti Shtetëror Agrare i Bashkirit, Fakulteti i Teknologjive të Informacionit dhe Menaxhimit. - Ufa, 2014. - fq 11-14.
  2. Ganieva, A.M. Analiza statistikore e punësimit dhe papunësisë [Teksti] / A.M. Ganieva, T.N. Lubova // Çështjet aktuale të kërkimit ekonomiko-statistikor dhe teknologjive të informacionit: koleksion artikujsh. shkencore Art.: kushtuar 40-vjetorit të krijimit të departamentit të "Statistikave dhe Sistemeve të Informacionit në Ekonomi" / Universiteti Shtetëror Agrare Bashkir. - Ufa, 2011. - fq 315-316.
  3. Ismagilov, R. R. Grupi krijues - një formë efektive e organizimit të kërkimit shkencor në arsimin e lartë [Tekst] / R. R. Ismagilov, M. Kh Urazlin, D. R. Islamgulov // Komplekset shkencore, teknike dhe shkencore-arsimore të rajonit: materialet e një konference shkencore-praktike / Akademia e Shkencave e Republikës së Bjellorusisë, UGATU. - Ufa, 1999. - F. 105-106.
  4. Islamgulov, D.R. Qasja e bazuar në kompetenca në mësimdhënie: vlerësimi i cilësisë së arsimit [Tekst] / D.R. Islamgulov, T.N. Lubova, I.R. Islamgulova // Buletini shkencor modern. – 2015. – T. 7. – Nr.1. – F. 62-69.
  5. Islamgulov, D. R. Puna kërkimore e studentëve është elementi më i rëndësishëm i trajnimit të specialistëve në një universitet bujqësor [Tekst] / D. R. Islamgulov // Problemet e trajnimit praktik të studentëve në një universitet në fazën aktuale dhe mënyrat për t'i zgjidhur ato: mbledhja. materialet shkencore-metodë. Konf., 24 Prill 2007 / Universiteti Shtetëror Agrare Bashkir. - Ufa, 2007. - fq 20-22.
  6. Lubova, T.N. Baza për zbatimin e standardit arsimor shtetëror federal është qasja e bazuar në kompetenca [Tekst] / T.N. Lubova, D.R. Islamgulov, I.R. Islamgulova // BODEST RESEARCH - 2016: Materiale për Konferencën XII Ndërkombëtare Shkencore dhe Praktike, 15-22 shkurt 2016. - Sofje: Byal GRAD-BG OOD, 2016. - Vëllimi 4 Shkencat pedagogjike. – fq 80-85.
  7. Lubova, T.N. Standardet e reja arsimore: veçoritë e zbatimit [Tekst] / T.N. Lubova, D.R. Islamgulov // Buletini shkencor modern. – 2015. – T. 7. – Nr. 1. – F. 79-84.
  8. Lubova, T.N. Organizimi i punës së pavarur të studentëve [Teksti] / T.N. Lubova, D.R. Islamgulov // Zbatimi i programeve arsimore të arsimit të lartë në kuadrin e Standardit Federal Shtetëror Arsimor të Arsimit të Lartë: materialet e konferencës shkencore dhe metodologjike gjithë-ruse në kuadër të takimit vizitues të Këshillit Kombëtar Mjekësor për menaxhimin e mjedisit dhe ujit përdorimi i Institucionit Arsimor Federal në sistemin e arsimit të lartë. / Universiteti Shtetëror Agrare i Bashkirit. - Ufa, 2016. - fq 214-219.
  9. Lubova, T.N. Baza për zbatimin e standardit arsimor shtetëror federal është qasja e bazuar në kompetenca [Tekst] / T.N. Lubova, D.R. Islamgulov, I.R. Islamgulova // Buletini shkencor modern. – 2015. – T. 7. – Nr.1. – F. 85-93.
  10. Saubanova, L.M. Niveli i ngarkesës demografike [Tekst] / L.M. Saubanova, T.N. Lubova // Çështjet aktuale të kërkimit ekonomiko-statistikor dhe teknologjive të informacionit: koleksion artikujsh. shkencore Art.: kushtuar 40-vjetorit të krijimit të departamentit të "Statistikave dhe Sistemeve të Informacionit në Ekonomi" / Universiteti Shtetëror Agrare Bashkir. - Ufa, 2011. - fq 321-322.
  11. Fakhrullina, A.R. Analiza statistikore e inflacionit në Rusi [Tekst] / A.R. Fakhrullina, T.N. Lubova // Çështjet aktuale të kërkimit ekonomiko-statistikor dhe teknologjive të informacionit: koleksion artikujsh. shkencore Art.: kushtuar 40 vjetorit të krijimit të departamentit të "Statistikës dhe Sistemeve të Informacionit në Ekonomi" / Universiteti Shtetëror Agrare i Bashkir. - Ufa, 2011. - fq 323-324.
  12. Farkhutdinova, A.T. Tregu i punës në Republikën e Bashkortostanit në 2012 [Burimi Elektronik] / A.T. Farkhutdinova, T.N. Lubova // Forumi shkencor studentor. Materialet e Konferencës V Ndërkombëtare Shkencore Elektronike Studentore: konferencë shkencore elektronike (mbledhja elektronike). Akademia Ruse e Shkencave të Natyrës. 2013.

Analiza e variancës

1. Koncepti i analizës së variancës

Analiza e variancësështë një analizë e ndryshueshmërisë së një tipari nën ndikimin e çdo faktori të ndryshueshëm të kontrolluar. Në literaturën e huaj, analiza e variancës shpesh quhet ANOVA, e cila përkthehet si analiza e ndryshueshmërisë (Analysis of Variance).

Problemi ANOVA konsiston në izolimin e ndryshueshmërisë së një lloji të ndryshëm nga ndryshueshmëria e përgjithshme e një tipari:

a) ndryshueshmëria për shkak të veprimit të secilit prej variablave të pavarur në studim;

b) ndryshueshmëria për shkak të ndërveprimit të variablave të pavarur që studiohen;

c) ndryshueshmëria e rastësishme për shkak të të gjithë variablave të tjerë të panjohur.

Ndryshueshmëria për shkak të veprimit të variablave në studim dhe ndërveprimit të tyre lidhet me ndryshueshmërinë e rastësishme. Një tregues i kësaj marrëdhënieje është testi F Fisher.

Formula për llogaritjen e kriterit F përfshin vlerësimet e variancave, domethënë parametrat e shpërndarjes së karakteristikës, prandaj kriteri F është një kriter parametrik.

Sa më shumë ndryshueshmëria e një tipari të jetë për shkak të variablave (faktorëve) në studim ose ndërveprimit të tyre, aq më i lartë vlerat e kriterit empirik.

Zero hipoteza në analizën e variancës do të thotë se vlerat mesatare të karakteristikës efektive të studiuar janë të njëjta në të gjitha gradimet.

Alternativa hipoteza do të thotë se vlerat mesatare të karakteristikës që rezulton në shkallëzime të ndryshme të faktorit në studim janë të ndryshme.

Analiza e variancës na lejon të deklarojmë një ndryshim në një karakteristikë, por nuk tregon drejtimin këto ndryshime.

Le të fillojmë shqyrtimin tonë të analizës së variancës me rastin më të thjeshtë, kur studiojmë veprimin e vetëm një variabël (një faktor).

2. Analiza njëkahëshe e variancës për mostrat e palidhura

2.1. Qëllimi i metodës

Metoda e analizës së variancës me një faktor përdoret në rastet kur ndryshimet në një karakteristikë efektive studiohen nën ndikimin e ndryshimit të kushteve ose shkallëzimeve të një faktori. Në këtë version të metodës, ndikimi i secilit prej gradimeve të faktorit është të ndryshme mostrat e lëndëve. Duhet të ketë të paktën tre shkallëzime të faktorit. (Mund të ketë dy shkallëzime, por në këtë rast nuk do të arrijmë të vendosim varësi jolineare dhe duket më e arsyeshme të përdorim më të thjeshta).

Një version joparametrik i këtij lloji analize është testi Kruskal-Wallis H.

Hipotezat

H 0: Dallimet midis notave të faktorëve (kushte të ndryshme) nuk janë më të mëdha se dallimet e rastësishme brenda secilit grup.

H 1: Dallimet midis notave të faktorëve (kushte të ndryshme) janë më të mëdha se dallimet e rastësishme brenda secilit grup.

2.2. Kufizimet e analizës njëkahëshe të variancës për mostrat e palidhura

1. Analiza njëkahëshe e variancës kërkon të paktën tre shkallëzime të faktorit dhe të paktën dy lëndë në çdo gradim.

2. Karakteristika që rezulton duhet të shpërndahet normalisht në kampionin në studim.

Vërtetë, zakonisht nuk tregohet nëse po flasim për shpërndarjen e karakteristikës në të gjithë kampionin e anketuar ose në atë pjesë të saj që përbën kompleksin e shpërndarjes.

3. Një shembull i zgjidhjes së një problemi duke përdorur metodën e analizës së njëanshme të variancës për mostrat e palidhura duke përdorur shembullin:

Tre grupeve të ndryshme me gjashtë lëndë iu dhanë lista me dhjetë fjalë. Fjalët iu prezantuan grupit të parë me një shpejtësi të ulët - 1 fjalë për 5 sekonda, grupit të dytë me një shpejtësi mesatare - 1 fjalë për 2 sekonda, dhe grupit të tretë me shpejtësi të lartë - 1 fjalë në sekondë. Performanca e riprodhimit ishte parashikuar të varej nga shpejtësia e prezantimit të fjalës. Rezultatet janë paraqitur në tabelë. 1.

Numri i fjalëve të riprodhuara Tabela 1

Subjekti Nr.

shpejtësi të ulët

Shpejtësia mesatare

shpejtësi e lartë

shuma totale

H 0: Dallimet në hapësirën e prodhimit të fjalëve ndërmjet grupet nuk janë më të theksuara se dallimet e rastësishme brendaçdo grup.

H1: Dallimet në vëllimin e prodhimit të fjalëve ndërmjet grupet janë më të theksuara se dallimet e rastësishme brendaçdo grup. Duke përdorur vlerat eksperimentale të paraqitura në tabelë. 1, ne do të vendosim disa vlera që do të jenë të nevojshme për të llogaritur kriterin F.

Llogaritja e sasive kryesore për analizën njëkahëshe të variancës është paraqitur në tabelë:

tabela 2

Tabela 3

Sekuenca e operacioneve në analizën e njëanshme të variancës për mostrat e palidhura

Shpesh gjendet në këtë dhe në tabelat pasuese, përcaktimi SS është një shkurtim për "shuma e katrorëve". Ky shkurtim përdoret më shpesh në burimet e përkthyera.

SS fakt nënkupton ndryshueshmërinë e karakteristikës për shkak të veprimit të faktorit në studim;

SS përgjithësisht- ndryshueshmëria e përgjithshme e tiparit;

S C.A.-ndryshueshmëria për shkak të faktorëve të pa llogaritur, ndryshueshmëria "të rastësishme" ose "mbetëse".

ZNJ- “katrori mesatar”, ose pritshmëria matematikore e shumës së katrorëve, vlera mesatare e SS përkatëse.

df - numri i shkallëve të lirisë, të cilin, kur marrim parasysh kriteret joparametrike, e shënuam me një shkronjë greke v.

Përfundim: H 0 refuzohet. H 1 pranohet. Dallimet në rikujtimin e fjalëve ndërmjet grupeve ishin më të mëdha se dallimet e rastësishme brenda secilit grup (α=0.05). Pra, shpejtësia e paraqitjes së fjalëve ndikon në vëllimin e riprodhimit të tyre.

Një shembull i zgjidhjes së problemit në Excel është paraqitur më poshtë:

Të dhënat fillestare:

Duke përdorur komandën: Tools->Data Analysis->One-way ANOVA, ne marrim rezultatet e mëposhtme:

Analiza njëkahëshe e variancës.

Koncepti dhe modelet e analizës së variancës.

Tema 13. Analiza e variancës

Leksioni 1. Pyetje:

Analiza e variancës, si metodë kërkimore, u shfaq në punimet e R. Fischer (1918-1935) në lidhje me kërkimet në bujqësi për të identifikuar kushtet në të cilat varieteti i testuar i kulturës bujqësore prodhon rendimentin maksimal. Analiza e variancës u zhvillua më tej në veprat e Yeats. Analiza e variancës na lejon t'i përgjigjemi pyetjes nëse faktorë të caktuar kanë një ndikim të rëndësishëm në ndryshueshmërinë e një faktori, vlerat e të cilit mund të merren si rezultat i përvojës. Gjatë testimit të hipotezave statistikore, supozohen ndryshime të rastësishme në faktorët që studiohen. Në analizën e variancës, një ose më shumë faktorë ndryshohen në një mënyrë të caktuar dhe këto ndryshime mund të ndikojnë në rezultatet e vëzhgimeve. Studimi i një ndikimi të tillë është qëllimi i analizës së variancës.

Aktualisht, ka një përdorim gjithnjë e më të gjerë të analizës së variancës në ekonomi, sociologji, biologji, etj., veçanërisht pas ardhjes së softuerit që eliminoi problemet e rëndimit të llogaritjeve statistikore.

Në veprimtaritë praktike, në fusha të ndryshme të shkencës, shpesh përballemi me nevojën për të vlerësuar ndikimin e faktorëve të ndryshëm në tregues të caktuar. Shpesh këta faktorë janë të një natyre cilësore (për shembull, një faktor cilësor që ndikon në efektin ekonomik mund të jetë futja e një sistemi të ri të menaxhimit të prodhimit) dhe më pas analiza e variancës merr një vlerë të veçantë, pasi bëhet e vetmja metodë statistikore e hulumtimit që jep një një vlerësim.

Analiza e variancës bën të mundur përcaktimin nëse njëri ose tjetri nga faktorët në shqyrtim ka një ndikim të rëndësishëm në ndryshueshmërinë e një tipari, si dhe të përcaktojë sasinë e "peshës specifike" të secilit burim të ndryshueshmërisë në tërësinë e tyre. Por analiza e variancës na lejon të japim një përgjigje pozitive vetëm për praninë e një ndikimi domethënës, përndryshe pyetja mbetet e hapur dhe kërkon kërkime shtesë (më shpesh, një rritje në numrin e eksperimenteve).

Termat e mëposhtëm përdoren në analizën e variancës.

Faktori (X) është diçka që ne besojmë se duhet të ndikojë në rezultatin (atributin rezultativ) Y.

Niveli i faktorit (ose metoda e përpunimit, ndonjëherë fjalë për fjalë, për shembull, metoda e kultivimit të tokës) - vlerat (X, i = 1.2,...I) që mund të marrë faktori.

Përgjigja – vlera e karakteristikës së matur (vlera e rezultatit Y).

Teknika ANOVA ndryshon në varësi të numrit të faktorëve të pavarur që studiohen. Nëse faktorët që shkaktojnë ndryshueshmëri në vlerën mesatare të një karakteristike i përkasin një burimi, atëherë kemi një grupim të thjeshtë, ose analizë njëfaktori të variancës dhe më pas, në përputhje me rrethanat, një grupim të dyfishtë - analizë dyfaktorësh të variancës, me tre faktorë. analiza e variancës, ..., m-faktori. Faktorët në analizën multivariate zakonisht shënohen me shkronja latine: A, B, C, etj.



Detyra e analizës së variancës është të studiojë ndikimin e disa faktorëve (ose niveleve të faktorëve) në ndryshueshmërinë e vlerave mesatare të variablave të rastit të vëzhguar.

Thelbi i analizës së variancës. Analiza e variancës konsiston në izolimin dhe vlerësimin e faktorëve individualë që shkaktojnë ndryshueshmëri. Për këtë qëllim, varianca totale e popullsisë së pjesshme të vëzhguar (varianca totale e tiparit), e shkaktuar nga të gjitha burimet e ndryshueshmërisë, zbërthehet në komponentë të variancës të krijuar nga faktorë të pavarur. Secili prej këtyre komponentëve ofron një vlerësim të variancës , ,..., të shkaktuar nga një burim i veçantë ndryshueshmërie, në popullatën e përgjithshme. Për të testuar rëndësinë e këtyre vlerësimeve të variancës së komponentëve, ato krahasohen me variancën totale në popullatë (testi i Fisher-it).

Për shembull, në analizën me dy faktorë marrim një zbërthim të formës:

Varianca totale e tiparit të studiuar C;

Pjesa e variancës e shkaktuar nga ndikimi i faktorit A;

Pjesa e variancës e shkaktuar nga ndikimi i faktorit B;

Përqindja e variancës e shkaktuar nga ndërveprimi i faktorëve A dhe B;

Pjesa e variancës e shkaktuar nga shkaqe të rastësishme të pa llogaritura (variancë e rastësishme);

Në analizën e variancës merret në konsideratë hipoteza: H 0 - asnjë nga faktorët në shqyrtim nuk ka ndikim në ndryshueshmërinë e tiparit. Rëndësia e çdo vlerësimi të variancës kontrollohet nga vlera e raportit të tij me vlerësimin e variancës së rastësishme dhe krahasohet me vlerën kritike përkatëse, në nivelin e rëndësisë a, duke përdorur tabelat e vlerave kritike të shpërndarjes Fisher-Snedecor F (Shtojca 4) . Hipoteza H 0 në lidhje me një ose një burim tjetër të ndryshueshmërisë refuzohet nëse llogaritet F. > F kr. (për shembull, për faktorin B: S B 2 /S ε 2 >F kr.).

Analiza e variancës merr në konsideratë eksperimentet e 3 llojeve:

a) eksperimente në të cilat të gjithë faktorët kanë nivele sistematike (fikse);

b) eksperimente në të cilat të gjithë faktorët kanë nivele të rastësishme;

c) eksperimente në të cilat ka faktorë që kanë nivele të rastësishme, si dhe faktorë që kanë nivele fikse.

Rastet a), b), c) korrespondojnë me tre modele që merren parasysh në analizën e variancës.

Të dhënat hyrëse për analizën e variancës zakonisht paraqiten në formën e tabelës së mëposhtme:

Numri i vëzhgimit j Nivelet e faktorëve
A 1 A 2 Një r
X 11 X 21 X p1
X 12 X 22 Xp2
X 13 X 23 X p3
. . .
. . .
. . .
n X 1n X2n Xpn
REZULTATET

Konsideroni një faktor të vetëm që merr p nivele të ndryshme dhe supozoni se në çdo nivel bëhen n vëzhgime, duke dhënë N=np vëzhgime. (Ne do të kufizohemi në marrjen në konsideratë të modelit të parë të analizës së variancës - të gjithë faktorët kanë nivele fikse.)

Rezultatet le të paraqiten në formën X ij (i=1,2…,р; j=1,2,…,n).

Supozohet se për çdo nivel prej n vëzhgimesh ka një mesatare, e cila është e barabartë me shumën e mesatares së përgjithshme dhe ndryshimin e saj për shkak të nivelit të zgjedhur:

ku m është mesatarja e përgjithshme;

A i - efekti i shkaktuar nga niveli i – m i faktorit;

e ij – variacioni i rezultateve brenda një niveli faktor individual. Termi e ij merr parasysh të gjithë faktorët e pakontrollueshëm.

Lërini vëzhgimet në një nivel faktori fiks të shpërndahen normalisht rreth mesatares m + A i me një variancë të përbashkët s 2 .

Pastaj (pika në vend të indeksit tregon mesataren e vëzhgimeve përkatëse mbi këtë indeks):

A.X ij – X.. = (X i . – X..) + (X ij – X i .). (12.3)

Pasi të kemi në katror të dy anët e ekuacionit dhe të mbledhim mbi i dhe j, marrim:

që, por

Përndryshe, shuma e katrorëve mund të shkruhet: S = S 1 + S 2. Vlera e S 1 llogaritet nga devijimet e mesatareve p nga mesatarja e përgjithshme X.., prandaj S 1 ka (p-1) shkallë lirie. Vlera e S 2 llogaritet nga devijimet e N vëzhgimeve nga p mesataret e mostrës dhe, për rrjedhojë, ka N-р = np - p=p(n-1) shkallë lirie. S ka (N-1) shkallë lirie. Bazuar në rezultatet e llogaritjes, ndërtohet një tabelë e analizës së variancës.

Tabela ANOVA

Nëse hipoteza se ndikimi i të gjitha niveleve është i barabartë është i vërtetë, atëherë si M 1 ashtu edhe M 2 (katroret mesatare) do të jenë vlerësime të paanshme të s 2. Kjo do të thotë se hipoteza mund të testohet duke llogaritur raportin (M 1 / M 2) dhe duke e krahasuar atë me F cr. me ν 1 = (p-1) dhe ν 2 = (N-p) shkallë lirie.

Nëse llogaritet F > F kr. , atëherë hipoteza për ndikimin e parëndësishëm të faktorit A në rezultatin e vëzhgimeve nuk pranohet.

Për të vlerësuar rëndësinë e dallimeve në F kalc. Tabela F llogarit:

a) gabim eksperimental

b) gabimi i diferencës së mjeteve

c) dallimi më i vogël domethënës

Duke krahasuar ndryshimin në vlerat mesatare për opsionet me NSR, ata konkludojnë se ndryshimet në nivelin e mesatareve janë të rëndësishme.

Komentoni. Përdorimi i analizës së variancës supozon se:

2) D(ε ij)=σ 2 = konst,

3) ε ij → N (0, σ) ose x ij → N (a, σ).

Analiza e variancës

Lëndë në disiplinën: "Analiza e sistemeve"

Interpretues studenti gr. 99 ISE-2 Zhbanov V.V.

Universiteti Shtetëror i Orenburgut

Fakulteti i Teknologjisë së Informacionit

Departamenti i Informatikës së Aplikuar

Orenburg-2003

Prezantimi

Qëllimi i punës: të njiheni me një metodë të tillë statistikore si analiza e variancës.

Analiza e dispersionit (nga latinishtja Dispersio - dispersion) është një metodë statistikore që ju lejon të analizoni ndikimin e faktorëve të ndryshëm në variablin në studim. Metoda u zhvillua nga biologu R. Fischer në vitin 1925 dhe fillimisht u përdor për të vlerësuar eksperimentet në prodhimin e bimëve. Më pas u bë e qartë rëndësia e përgjithshme shkencore e analizës së variancës për eksperimentet në psikologji, pedagogji, mjekësi, etj.

Qëllimi i analizës së variancës është të testojë rëndësinë e dallimeve ndërmjet mesatareve duke krahasuar variancat. Varianca e karakteristikës së matur zbërthehet në terma të pavarur, secila prej të cilave karakterizon ndikimin e një faktori të veçantë ose ndërveprimin e tyre. Krahasimi i mëvonshëm i termave të tillë na lejon të vlerësojmë rëndësinë e secilit faktor në studim, si dhe kombinimin e tyre /1/.

Nëse hipoteza zero (që mesataret janë të barabarta në disa grupe vëzhgimesh të zgjedhura nga popullata) është e vërtetë, vlerësimi i variancës së lidhur me ndryshueshmërinë brenda grupit duhet të jetë afër vlerësimit të variancës ndërmjet grupeve.

Gjatë kryerjes së hulumtimit të tregut, shpesh lind pyetja e krahasueshmërisë së rezultateve. Për shembull, kur kryhen anketa mbi konsumin e një produkti në rajone të ndryshme të vendit, është e nevojshme të nxirren përfundime se në çfarë mase ndryshojnë ose nuk ndryshojnë të dhënat e anketës nga njëra-tjetra. Nuk ka kuptim të krahasohen treguesit individualë, dhe për këtë arsye procedura e krahasimit dhe vlerësimit pasues kryhet duke përdorur disa vlera mesatare dhe devijime nga ky vlerësim mesatar. Studohet variacioni i tiparit. Dispersioni mund të merret si një masë ndryshimi. Dispersioni σ 2 është një masë e variacionit, e përcaktuar si mesatare e devijimeve të një karakteristike në katror.

Në praktikë, shpesh lindin probleme të një natyre më të përgjithshme - problemi i kontrollit të rëndësisë së dallimeve në mesataret e disa popullsive të mostrës. Për shembull, është e nevojshme të vlerësohet ndikimi i lëndëve të para të ndryshme në cilësinë e produkteve të prodhuara, për të zgjidhur problemin e ndikimit të sasisë së plehrave në rendimentin e produkteve bujqësore.

Ndonjëherë analiza e variancës përdoret për të përcaktuar homogjenitetin e disa popullatave (variencat e këtyre popullatave janë të njëjta sipas supozimit; nëse analiza e variancës tregon se pritjet matematikore janë të njëjta, atëherë në këtë kuptim popullatat janë homogjene). Popullatat homogjene mund të kombinohen në një dhe në këtë mënyrë të marrin informacion më të plotë për të, dhe për këtë arsye përfundime më të besueshme /2/.

1 Analiza e variancës

1.1 Konceptet bazë të analizës së variancës

Në procesin e vëzhgimit të objektit në studim, faktorët cilësorë ndryshojnë në mënyrë arbitrare ose në një mënyrë të caktuar. Zbatimi specifik i një faktori (për shembull, një regjim i caktuar i temperaturës, pajisje ose material i zgjedhur) quhet niveli i faktorit ose metoda e përpunimit. Një model i analizës së variancës me nivele fikse faktorësh quhet modeli I, një model me faktorë të rastësishëm quhet modeli II. Duke ndryshuar faktorin, është e mundur të studiohet ndikimi i tij në madhësinë e përgjigjes. Aktualisht, teoria e përgjithshme e analizës së variancës është zhvilluar për modelet I.

Në varësi të numrit të faktorëve që përcaktojnë ndryshimin e karakteristikës që rezulton, analiza e variancës ndahet në njëfaktor dhe shumëfaktor.

Skemat kryesore për organizimin e të dhënave burimore me dy ose më shumë faktorë janë:

Klasifikimi i kryqëzuar, karakteristikë e modeleve I, në të cilat çdo nivel i një faktori kombinohet kur planifikohet një eksperiment me çdo gradim të një faktori tjetër;

Klasifikimi hierarkik (klaster), karakteristik i modelit II, në të cilin çdo vlerë e rastësishme, e zgjedhur rastësisht e një faktori korrespondon me nëngrupin e vet të vlerave të faktorit të dytë.

Nëse varësia e përgjigjes nga faktorët cilësorë dhe sasiorë studiohet njëkohësisht, d.m.th. faktorë të natyrës së përzier, më pas përdoret analiza e kovariancës /3/.

Kështu, këto modele ndryshojnë nga njëri-tjetri në mënyrën se si zgjedhin nivelet e faktorëve, gjë që padyshim ndikon kryesisht në mundësinë e përgjithësimit të rezultateve eksperimentale të marra. Për analizën e variancës në eksperimentet me një faktor, ndryshimi midis këtyre dy modeleve nuk është aq i rëndësishëm, por në analizën multivariate të variancës mund të jetë mjaft i rëndësishëm.

Gjatë kryerjes së analizës së variancës, duhet të përmbushen supozimet e mëposhtme statistikore: pavarësisht nga niveli i faktorit, vlerat e përgjigjes kanë një ligj të shpërndarjes normale (Gaussian) dhe të njëjtën variancë. Kjo barazi variancash quhet homogjenitet. Kështu, një ndryshim në metodën e përpunimit ndikon vetëm në pozicionin e ndryshores së përgjigjes së rastësishme, e cila karakterizohet nga vlera mesatare ose mesatare. Prandaj, të gjitha vëzhgimet e përgjigjeve i përkasin familjes së zhvendosjes së shpërndarjeve normale.

Teknika ANOVA thuhet se është "e fortë". Ky term, i përdorur nga statisticienët, do të thotë se supozimet e dhëna mund të shkelen në një farë mase, por teknika mund të përdoret ende.

Kur ligji i shpërndarjes së vlerave të përgjigjes është i panjohur, përdoren metoda të analizës joparametrike (më shpesh të renditura).

Analiza e variancës bazohet në ndarjen e variancës në pjesë ose përbërës. Variacioni për shkak të ndikimit të faktorit që qëndron në themel të grupimit karakterizohet nga dispersioni ndërgrupor σ 2 . Është një masë e ndryshimit të mesatareve të pjesshme në grupe

rreth mesatares së përgjithshme dhe përcaktohet nga formula: ,

ku k është numri i grupeve;

n j - numri i njësive në grupin j;

- mesatare e pjesshme për grupin j; - mesatarja e përgjithshme për një grup njësish.

Variacioni për shkak të ndikimit të faktorëve të tjerë karakterizohet në secilin grup nga varianca brendagrupore σ j 2 .

.

Midis variancës totale σ 0 2 , variancës brenda grupit σ 2 dhe variancës ndërmjet grupit

1.2 Analiza njëkahëshe e variancës

Modeli i variancës me një faktor ka formën:

x ij = μ + F j + ε ij , (1)

ku x ij është vlera e ndryshores në studim e marrë në nivelin i-të të faktorit (i=1,2,...,t) me numrin e serisë j-të (j=1,2,.. .,n);

F i – efekti i shkaktuar nga ndikimi i nivelit të i-të të faktorit;

ε ij – komponent i rastësishëm, ose shqetësim i shkaktuar nga ndikimi i faktorëve të pakontrollueshëm, d.m.th. ndryshim brenda një niveli të caktuar.

Parakushtet bazë për analizën e variancës:

Pritja matematikore e shqetësimit ε ij është e barabartë me zero për çdo i, d.m.th.

M(ε ij) = 0; (2)

Çrregullimet ε ij janë reciprokisht të pavarura;

Varianca e ndryshores x ij (ose shqetësimi ε ij) është konstante për

çdo i, j, d.m.th.

D(ε ij) = σ 2 ; (3)

Ndryshorja x ij (ose shqetësimi ε ij) ka një ligj normal

shpërndarja N(0;σ 2).

Ndikimi i niveleve të faktorëve mund të jetë ose fiks ose sistematik (Modeli I) ose i rastësishëm (Modeli II).

Supozoni, për shembull, është e nevojshme të zbuloni nëse ka dallime domethënëse midis grupeve të produkteve për sa i përket ndonjë treguesi të cilësisë, d.m.th. kontrolloni ndikimin në cilësinë e një faktori - një grup produktesh. Nëse përfshijmë të gjitha grupet e lëndëve të para në studim, atëherë ndikimi i nivelit të një faktori të tillë është sistematik (modeli I), dhe përfundimet e marra janë të zbatueshme vetëm për ato grupe individuale që janë përfshirë në studim. Nëse përfshijmë vetëm një pjesë të zgjedhur rastësisht të palëve, atëherë ndikimi i faktorit është i rastësishëm (modeli II). Në komplekset me shumë faktorë, është i mundur një model i përzier III, në të cilin disa faktorë kanë nivele të rastësishme, ndërsa të tjerët kanë nivele fikse.



Ju pëlqeu artikulli? Ndani me miqtë tuaj!