Bazuar në të dhënat e tabelës së korrelacionit, ndërtoni një fushë korrelacioni. Shihni faqet ku përmendet termi fushë korrelacioni

Analiza e regresionit dhe korrelacionit janë metoda kërkimore statistikore. Këto janë mënyrat më të zakonshme për të treguar varësinë e një parametri nga një ose më shumë variabla të pavarur.

Më poshtë, duke përdorur shembuj konkretë praktikë, do të shqyrtojmë këto dy analiza shumë të njohura midis ekonomistëve. Ne gjithashtu do të japim një shembull të marrjes së rezultateve kur i kombinojmë ato.

Analiza e regresionit në Excel

Tregon ndikimin e disa vlerave (të pavarura, të pavarura) në variablin e varur. Për shembull, si varet numri i popullsisë ekonomikisht aktive nga numri i ndërmarrjeve, pagat dhe parametrat e tjerë. Ose: si ndikojnë në nivelin e PBB-së investimet e huaja, çmimet e energjisë etj.

Rezultati i analizës ju lejon të nënvizoni përparësitë. Dhe bazuar në faktorët kryesorë, parashikoni, planifikoni zhvillimin e fushave prioritare dhe merrni vendime menaxheriale.

Regresioni ndodh:

  • lineare (y = a + bx);
  • parabolike (y = a + bx + cx 2);
  • eksponencial (y = a * exp(bx));
  • fuqia (y = a*x^b);
  • hiperbolike (y = b/x + a);
  • logaritmike (y = b * 1n(x) + a);
  • eksponencial (y = a * b^x).

Le të shohim një shembull të ndërtimit të një modeli regresioni në Excel dhe interpretimit të rezultateve. Le të marrim llojin linear të regresionit.

Detyrë. Në 6 ndërmarrje u analizua paga mesatare mujore dhe numri i punonjësve të larguar nga puna. Është e nevojshme të përcaktohet varësia e numrit të punonjësve që largohen nga paga mesatare.

Modeli i regresionit linear duket si ky:

Y = a 0 + a 1 x 1 +…+a k x k.

Ku a janë koeficientët e regresionit, x janë variabla ndikues, k është numri i faktorëve.

Në shembullin tonë, Y është treguesi i largimit nga punonjësit. Faktori ndikues është paga (x).

Excel ka funksione të integruara që mund t'ju ndihmojnë të llogaritni parametrat e një modeli të regresionit linear. Por shtesa "Paketa e analizës" do ta bëjë këtë më shpejt.

Ne aktivizojmë një mjet të fuqishëm analitik:

Pasi të aktivizohet, shtesa do të jetë e disponueshme në skedën e të dhënave.

Tani le të bëjmë vetë analizën e regresionit.



Para së gjithash, ne i kushtojmë vëmendje katrorit R dhe koeficientëve.

R-katror është koeficienti i përcaktimit. Në shembullin tonë - 0,755, ose 75,5%. Kjo do të thotë se parametrat e llogaritur të modelit shpjegojnë 75.5% të marrëdhënies ndërmjet parametrave të studiuar. Sa më i lartë të jetë koeficienti i përcaktimit, aq më i mirë është modeli. Mirë - mbi 0.8. E keqe - më pak se 0.5 (një analizë e tillë vështirë se mund të konsiderohet e arsyeshme). Në shembullin tonë - "jo keq".

Koeficienti 64.1428 tregon se çfarë do të jetë Y nëse të gjitha variablat në modelin në shqyrtim janë të barabartë me 0. Kjo do të thotë, vlera e parametrit të analizuar ndikohet edhe nga faktorë të tjerë që nuk janë përshkruar në model.

Koeficienti -0,16285 tregon peshën e variablit X në Y. Kjo do të thotë se paga mesatare mujore brenda këtij modeli ndikon në numrin e të larguarve me peshën -0,16285 (kjo është një shkallë e vogël ndikimi). Shenja "-" tregon një ndikim negativ: sa më e lartë të jetë paga, aq më pak njerëz e lënë. E cila është e drejtë.



Analiza e korrelacionit në Excel

Analiza e korrelacionit ndihmon në përcaktimin nëse ka një lidhje midis treguesve në një ose dy mostra. Për shembull, midis kohës së funksionimit të një makinerie dhe kostos së riparimeve, çmimit të pajisjeve dhe kohëzgjatjes së funksionimit, gjatësisë dhe peshës së fëmijëve, etj.

Nëse ka një lidhje, atëherë rritja e njërit parametër a çon në një rritje (korrelacion pozitiv) ose një ulje (negative) të tjetrit. Analiza e korrelacionit e ndihmon analistin të përcaktojë nëse vlera e një treguesi mund të përdoret për të parashikuar vlerën e mundshme të një tjetri.

Koeficienti i korrelacionit shënohet me r. Ndryshon nga +1 në -1. Klasifikimi i korrelacioneve për fusha të ndryshme do të jetë i ndryshëm. Kur koeficienti është 0, nuk ka lidhje lineare midis mostrave.

Le të shohim se si të gjejmë koeficientin e korrelacionit duke përdorur Excel.

Për të gjetur koeficientët e çiftuar, përdoret funksioni CORREL.

Objektivi: Përcaktoni nëse ka një lidhje midis kohës së funksionimit të një torno dhe kostos së mirëmbajtjes së saj.

Vendosni kursorin në çdo qelizë dhe shtypni butonin fx.

  1. Në kategorinë "Statistikore", zgjidhni funksionin CORREL.
  2. Argumenti "Array 1" - diapazoni i parë i vlerave - koha e funksionimit të makinës: A2:A14.
  3. Argumenti "Array 2" - diapazoni i dytë i vlerave - kostoja e riparimit: B2:B14. Klikoni OK.

Për të përcaktuar llojin e lidhjes, duhet të shikoni numrin absolut të koeficientit (çdo fushë e veprimtarisë ka shkallën e vet).

Për analizën e korrelacionit të disa parametrave (më shumë se 2), është më i përshtatshëm të përdoret "Analiza e të dhënave" (shtesa "Paketa e Analizës"). Ju duhet të zgjidhni korrelacionin nga lista dhe të caktoni grupin. Të gjitha.

Koeficientët rezultues do të shfaqen në matricën e korrelacionit. Si kjo:

Analiza e korrelacionit dhe e regresionit

Në praktikë, këto dy teknika shpesh përdoren së bashku.

Shembull:


Tani të dhënat e analizës së regresionit janë bërë të dukshme.

Për studimin eksperimental të varësive ndërmjet variablave të rastësishëm x dhe y të kryejë një sërë eksperimentesh të pavarura. Rezultati i- eksperimenti jep një çift vlerash (x r, y g), i = 1, 2,..., P.

Sasitë që karakterizojnë veti të ndryshme të objekteve mund të jenë të pavarura ose të ndërlidhura. Format e manifestimit të marrëdhënieve janë shumë të ndryshme. Dy llojet më të zakonshme janë lidhjet funksionale (të plota) dhe korrelacioni (jo të plota).

Kur dy sasi janë funksionalisht të varura nga vlera e njërës -x h domosdoshmërisht korrespondon me një ose më shumë vlera të përcaktuara saktë të një sasie tjetër -y (. Shumë shpesh, lidhjet funksionale shfaqen në fizikë dhe kimi. Në situata reale, ekziston një numër pafundësisht i madh i vetive të vetë objektit dhe mjedisit të jashtëm që ndikojnë njëri-tjetrin, kështu që kjo lloj lidhjeje nuk ekziston, me fjalë të tjera, lidhjet funksionale janë abstraksione matematikore.

Ndikimi i faktorëve të përgjithshëm dhe prania e modeleve objektive në sjelljen e objekteve çojnë vetëm në shfaqjen e varësisë statistikore. Statistikore është një varësi në të cilën një ndryshim në njërën nga sasitë sjell një ndryshim në shpërndarjen e të tjerëve (një tjetri), dhe këto sasi të tjera marrin vlera të caktuara me probabilitete të caktuara. Në këtë rast, varësia funksionale duhet të konsiderohet një rast i veçantë i varësisë statistikore: vlera e një faktori korrespondon me vlerat e faktorëve të tjerë me një probabilitet të barabartë me një. Një rast më i rëndësishëm i veçantë i varësisë statistikore është varësia e korrelacionit, e cila karakterizon marrëdhënien midis vlerave të disa variablave të rastësishëm dhe vlerës mesatare të të tjerëve, megjithëse në çdo rast individual çdo vlerë e ndërlidhur mund të marrë vlera të ndryshme.

Një marrëdhënie korrelacioni (e cila quhet edhe jo e plotë, ose statistikore) shfaqet mesatarisht për vëzhgimet masive, kur vlerat e dhëna të ndryshores së varur korrespondojnë me një numër të caktuar vlerash të mundshme të ndryshores së pavarur. Shpjegimi - kompleksiteti i marrëdhënieve ndërmjet faktorëve të analizuar, ndërveprimi i të cilëve ndikohet nga variabla të rastësishëm të pa llogaritur. Prandaj, lidhja midis shenjave shfaqet vetëm mesatarisht, në masën e rasteve. Në një marrëdhënie korrelacioni, çdo vlerë argumenti korrespondon me vlerat e funksionit të shpërndara rastësisht në një interval të caktuar.

Termi "korrelacion" u përdor për herë të parë nga paleontologu francez J. Cuvier, i cili nxori "ligjin e korrelacionit të pjesëve dhe organeve të kafshëve" (ky ligj lejon që dikush të rindërtojë pamjen e të gjithë kafshës nga pjesët e gjetura të trupit) . Ky term u fut në statistikë nga biologu dhe statisticieni anglez F. Galton (jo thjesht një lidhje, por një "sikur një lidhje" - korrelacion).

Varësitë e korrelacionit gjenden kudo. Për shembull, në bujqësi, kjo mund të jetë lidhja midis rendimentit dhe sasisë së plehut të aplikuar. Natyrisht, këta të fundit janë të përfshirë në formimin e të korrave. Por për çdo fushë ose parcelë specifike, e njëjta sasi e plehut të aplikuar do të shkaktojë një rritje të ndryshme të rendimentit, pasi ndërveprojnë një sërë faktorësh të tjerë (moti, gjendja e tokës, etj.), të cilët formojnë rezultatin përfundimtar. Sidoqoftë, mesatarisht, vërehet një marrëdhënie e tillë - një rritje në masën e plehrave të aplikuara çon në një rritje të rendimentit.

Metoda më e thjeshtë për identifikimin e lidhjeve ndërmjet karakteristikave që studiohen është ndërtimi i një tabele korrelacioni; paraqitja vizuale e tij është fusha e korrelacionit. Është një grafik ku vlerat jq janë paraqitur në boshtin e abshisës dhe në boshtin e ordinatave y x. Nga vendndodhja e pikave dhe përqendrimi i tyre në një drejtim të caktuar, mund të gjykohet cilësisht prania e një lidhjeje.

Oriz. 7.3.

Një korrelacion pozitiv midis variablave të rastësishëm, afër një funksional parabolik, është paraqitur në Fig. 6.1 , A. Në Fig. 6.1, b tregon një shembull të një korrelacioni të dobët negativ, dhe në Fig. 6.1, V - një shembull i variablave të rastësishëm praktikisht të pakorreluara. Korrelacioni është i lartë nëse varësia "mund të përfaqësohet" në grafik me një vijë të drejtë (me një pjerrësi pozitive ose negative).

1. Tema e veprës.

2. Informacion i shkurtër teorik.

3. Rendi i punës.

4. Të dhënat fillestare për zhvillimin e një modeli matematikor.

5. Rezultatet e zhvillimit të një modeli matematikor.

6. Rezultatet e studimit model. Ndërtimi i një parashikimi.

7. Përfundime.

Në detyrat 2-4, mund të përdorni Excel PPP për të llogaritur karakteristikat e modelit.

Puna nr. 1.

Ndërtimi i modeleve të regresionit të çiftuar. Kontrollimi i mbetjeve për heteroskedasticitet.

Për 15 ndërmarrje që prodhojnë të njëjtin lloj produkti, janë të njohura vlerat e dy karakteristikave:

X - prodhimi i prodhimit, mijë njësi;

y - kostot e prodhimit, milion rubla.

x y
5,3 18,4
15,1 22,0
24,2 32,3
7,1 16,4
11,0 22,2
8,5 21,7
14,5 23,6
10,2 18,5
18,6 26,1
19,7 30,2
21,3 28,6
22,1 34,0
4,1 14,2
12,0 22,1
18,3 28,2

Kërkohet:

1. Ndërtoni një fushë korrelacioni dhe formuloni një hipotezë për formën e lidhjes.

2. Ndërtoni modele:

Regresioni i çiftit linear.

Regresioni gjysmëlogaritmik në çift.

2.3 Regresioni i çiftit të fuqisë.
Për këtë:


2. Vlerësoni afërsinë e lidhjes duke përdorur një koeficient (indeks)
korrelacionet.

3. Vlerësoni cilësinë e modelit duke përdorur koeficientin (indeksin)
përcaktimi dhe gabimi mesatar i përafrimit
.

4. Jepni duke përdorur koeficientin mesatar të elasticitetit
vlerësimi krahasues i fuqisë së marrëdhënies ndërmjet faktorit dhe rezultatit
.

5. Me F-Kriteri Fisher për të vlerësuar besueshmërinë statistikore të rezultateve të modelimit të regresionit.

Bazuar në vlerat e karakteristikave të llogaritura në paragrafët 2-5, zgjidhni ekuacionin më të mirë të regresionit.

Duke përdorur metodën Golfreld-Quandt, kontrolloni mbetjet për heteroskedasticitet.

Ne ndërtojmë një fushë korrelacioni.

Duke analizuar vendndodhjen e pikave të fushës së korrelacionit, supozojmë se marrëdhënia midis shenjave X Dhe mund të jetë linear, d.m.th. y=a+bx, ose lloji jolinear: y=a+blnx, y = sëpatë b.

Bazuar në teorinë e marrëdhënies që studiohet, supozojmë të marrim marrëdhënien nga X lloj y=a+bx, sepse kostot e prodhimit y mund të ndahet në dy lloje: konstante, e pavarur nga vëllimi i prodhimit - a, si qiraja, mirëmbajtja e administratës etj.; dhe variabla që ndryshojnë proporcionalisht me prodhimin bx, si konsumi i materialit, energjia elektrike etj.


2.1.Modeli i regresionit të çiftit linear.

2.1.1. Le të llogarisim parametrat a Dhe b regresionit linear y=a+bx.

Ne ndërtojmë tabelën e llogaritjes 1.

Tabela 1

Opsione a Dhe b ekuacionet

Y x = a + bx


I ndarë nga n b:

Ekuacioni i regresionit:

=11,591+0,871x

Me një rritje të prodhimit të produktit me 1 mijë rubla. kostot e prodhimit rriten me 0.871 milion rubla. mesatarisht, kostot fikse janë të barabarta me 11.591 milion rubla.

2.1.2. Ne do të vlerësojmë afërsinë e lidhjes duke përdorur koeficientin e korrelacionit të çiftit linear.

Le të përcaktojmë fillimisht devijimet standarde të karakteristikave.

Devijimet standarde:

Koeficienti i korrelacionit:

Mes shenjave X Dhe Y vihet re një korrelacion linear shumë i ngushtë.

2.1.3. Le të vlerësojmë cilësinë e modelit të ndërtuar.

dmth ky model shpjegon 90.5% të variancës totale , pesha e variancës së pashpjegueshme përbën 9.5%.

Prandaj, cilësia e modelit është e lartë.

A i .

Së pari, nga ekuacioni i regresionit, ne përcaktojmë vlerat teorike për çdo vlerë faktori.

Gabim përafrimi A i, i=1…15:

Gabim mesatar i përafrimit:

2.1.4. Le të përcaktojmë koeficientin mesatar të elasticitetit:

Ai tregon se me një rritje të prodhimit me 1%, kostot e prodhimit rriten mesatarisht me 0,515%.

2.1.5. Le të vlerësojmë rëndësinë statistikore të ekuacionit që rezulton.
Le të kontrollojmë hipotezën H 0 se varësia e identifikuar nga Xështë i rastësishëm në natyrë, pra ekuacioni që rezulton është statistikisht i parëndësishëm. Le të marrim α=0,05. Le të gjejmë vlerën e tabelës (kritike). F- Testi Fisher:

Le të gjejmë vlerën aktuale F- Kriteri Fisher:

pra hipoteza H 0 H 1 x Dhe y nuk është e rastësishme.

Le të ndërtojmë ekuacionin që rezulton.

2.2. Modeli i regresionit gjysmë log.

2.2.1. Le të llogarisim parametrat A Dhe b në regresion:

y x =a +blnх.

Le ta linearizojmë këtë ekuacion, duke treguar:

y=a + bz.

Opsione a Dhe b ekuacionet

= a+bz

përcaktohet me metodën e katrorëve më të vegjël:


Ne llogarisim tabelën 2.

tabela 2

I ndarë nga n dhe duke zgjidhur me metodën e Cramer-it, marrim një formulë për përcaktimin b:

Ekuacioni i regresionit:

= -1,136 + 9,902z

2.2.2. Le të vlerësojmë afërsinë e lidhjes midis karakteristikave Dhe X.

Sepse ekuacioni y = a + miliardë x lineare në lidhje me parametrat A Dhe b dhe linearizimi i tij nuk lidhej me transformimin e ndryshores së varur _ , pastaj afërsia e marrëdhënies ndërmjet variablave Dhe X, e vlerësuar duke përdorur indeksin e korrelacionit të çiftit Rxy, mund të përcaktohet gjithashtu duke përdorur koeficientin e korrelacionit të çiftit linear r yz

devijimi standard z:

Vlera e indeksit të korrelacionit është afër 1, pra, midis variablave Dhe X ka një korrelacion shumë të ngushtë të llojit = a + bz.

2.2.3. Le të vlerësojmë cilësinë e modelit të ndërtuar.

Le të përcaktojmë koeficientin e përcaktimit:

dmth ky model shpjegon 83.8% të variacionit total në rezultat , pesha e variacionit të pashpjegueshëm zë 16.2%. Prandaj, cilësia e modelit është e lartë.

Le të gjejmë gabimin mesatar të përafrimit A i .

Së pari, nga ekuacioni i regresionit, ne përcaktojmë vlerat teorike për çdo vlerë faktori. Gabim përafrimi A unë,:

, i=1…15.

Gabim mesatar i përafrimit:

.

Gabimi është i vogël, cilësia e modelit është e lartë.

2.2.4 Le të përcaktojmë koeficientin mesatar të elasticitetit:

Ai tregon se me një rritje të prodhimit me 1%, kostot e prodhimit rriten mesatarisht me 0,414%.

2.2.5. Le të vlerësojmë rëndësinë statistikore të ekuacionit që rezulton.
Le të kontrollojmë hipotezën H 0 se varësia e identifikuar nga Xështë i rastësishëm në natyrë, d.m.th. ekuacioni që rezulton është statistikisht i parëndësishëm. Le të marrim α=0,05.

Le të gjejmë vlerën e tabelës (kritike). F-Kriteri Fisher:

Le të gjejmë vlerën aktuale F-Kriteri Fisher:

pra hipoteza H 0 refuzuar, hipoteza alternative e pranuar H 1: me probabilitet 1-α=0.95, ekuacioni që rezulton është statistikisht i rëndësishëm, lidhja ndërmjet variablave x Dhe y nuk është e rastësishme.

Le të ndërtojmë një ekuacion regresioni në fushën e korrelacionit

2.3. Modeli i regresionit të çiftit të fuqisë.

2.3.1. Le të llogarisim parametrat A Dhe b regresioni i fuqisë:

Llogaritjes së parametrave i paraprin procedura e linearizimit të këtij ekuacioni:

dhe ndryshimi i variablave:

Y=lny, X=lnx, A=lna

Parametrat e ekuacionit:

përcaktohet me metodën e katrorëve më të vegjël:


Ne llogarisim tabelën 3.

Ne përcaktojmë b:

Ekuacioni i regresionit:

Le të ndërtojmë një ekuacion regresioni në fushën e korrelacionit:

2.3.2. Le të vlerësojmë afërsinë e lidhjes midis karakteristikave Dhe X duke përdorur indeksin e korrelacionit të çiftit Ryx.

Le të llogarisim së pari vlerën teorike për çdo vlerë faktori x, dhe pastaj:

Vlera e indeksit të korrelacionit Rxy afër 1, pra midis variablave Dhe X Ekziston një lidhje shumë e ngushtë e formës:

2.3.3. Le të vlerësojmë cilësinë e modelit të ndërtuar.

Le të përcaktojmë indeksin e përcaktimit:

R 2=0,936 2 =0,878,

dmth ky model shpjegon 87.6% të variacionit total në rezultat y, dhe variacionet e pashpjegueshme përbëjnë 12.4%.

Cilësia e modelit është e lartë.

Le të gjejmë vlerën e gabimit mesatar të përafrimit.

Gabim përafrimi A i, i=1…15:

Gabim mesatar i përafrimit:

Gabimi është i vogël, cilësia e modelit është e lartë.

2.3.4. Le të përcaktojmë koeficientin mesatar të elasticitetit:

Ai tregon se me një rritje të prodhimit me 1%, kostot e prodhimit rriten mesatarisht me 0,438%.

2.3.5 Le të vlerësojmë rëndësinë statistikore të ekuacionit që rezulton.

Le të kontrollojmë hipotezën H 0 se varësia e identifikuar nga Xështë i rastësishëm në natyrë, pra ekuacioni që rezulton është statistikisht i parëndësishëm. Le të marrim α=0,05.

vlera e tabelës (kritike). F-Kriteri Fisher:

vlera aktuale F-Kriteri Fisher:

pra hipoteza H 0 refuzuar, hipoteza alternative e pranuar H 1: me probabilitet 1-α=0.95, ekuacioni që rezulton është statistikisht i rëndësishëm, lidhja ndërmjet variablave x Dhe y nuk është e rastësishme.

Tabela 3

3. Zgjedhja e ekuacionit më të mirë.

Le të bëjmë një tabelë të rezultateve të marra nga hulumtimi.

Tabela 4

Ne analizojmë tabelën dhe nxjerrim përfundime.

ú Të tre ekuacionet rezultuan të jenë statistikisht domethënëse dhe të besueshme, kanë një koeficient korrelacioni (indeks) afër 1, një koeficient të lartë (afër 1) përcaktimi (indeks) dhe një gabim përafrimi brenda kufijve të pranueshëm.

ú Në të njëjtën kohë, karakteristikat e modelit linear tregojnë se ai përshkruan marrëdhënien midis karakteristikave disi më mirë se modelet semilogaritmike dhe të fuqisë. x Dhe u.

ú Prandaj, ne zgjedhim një model linear si ekuacion të regresionit.

Kur shtrohet pyetja e korrelacionit midis dy karakteristikave statistikore X dhe Y, kryhet një eksperiment me regjistrimin paralel të vlerave të tyre.

Shembulli 8.1.

Përcaktoni nëse rezultati i një kërcimi së gjati vrapimi (shenja X) varet nga vlera e shpejtësisë përfundimtare të vrapimit (shenja Y). Për t'iu përgjigjur kësaj pyetjeje, paralelisht me regjistrimin e rezultatit X të çdo kërcimi të një atleti ose grupi atletësh, regjistrohet edhe vlera e shpejtësisë përfundimtare të ngritjes Y. Le të jenë kështu:

Tabela 5

I
xi (cm)
yi (m/s) 10,7 10,5 10,1 9,8 10,1 10,5 9,1 9,6

Le të paraqesim tabelën 5 në formën e një grafiku në një sistem koordinativ drejtkëndor, ku do të vizatojmë gjatësinë e kërcimit (X) në boshtin horizontal dhe vlerën e shpejtësisë përfundimtare të ngritjes në këtë kërcim (Y) në boshtin vertikal.
funksioni PlayMyFlash(cmd)( Corel_.TPlay(cmd); )

№1 !!! №2 !!! №3 !!! №4 !!! №5!!! №6 !!! №7 !!! №8!!!

Oriz. 8. Grafiku i fushës së korrelacionit.

Fushën e korrelacionit do ta quajmë zonën e shpërndarjes së pikave të marra në këtë mënyrë në grafik. Duke analizuar vizualisht fushën e korrelacionit në Figurën 8, mund të shihni se ajo duket të jetë e zgjatur përgjatë një vije të drejtë. Kjo pamje është tipike për të ashtuquajturën marrëdhënie korrelacioni linear midis karakteristikave. Në këtë rast, përgjithësisht mund të supozohet se me një rritje të shpejtësisë përfundimtare të ngritjes, gjatësia e kërcimit gjithashtu rritet, dhe anasjelltas. Ato. Ekziston një marrëdhënie e drejtpërdrejtë (pozitive) midis karakteristikave në shqyrtim.

Së bashku me këtë shembull, nga shumë fusha të tjera të mundshme korrelacioni, mund të dallohen sa vijon (Fig. 9-11):

Figura 9 tregon gjithashtu një marrëdhënie lineare, por me rritjen e vlerave të një atributi, vlerat e tjetrit zvogëlohen dhe anasjelltas, d.m.th. reagime ose negative. Mund të supozohet se në figurën 11 pikat e fushës së korrelacionit janë të shpërndara rreth një lloj vije të lakuar. Në këtë rast, ata thonë se ekziston një korrelacion lakor midis karakteristikave.

Për sa i përket fushës së korrelacionit të paraqitur në figurën 10, nuk mund të thuhet se pikat janë të vendosura përgjatë ndonjë vije të drejtë ose të lakuar. Në këtë rast, ata thonë se karakteristikat X dhe Y nuk varen nga njëra-tjetra.

Përveç kësaj, fusha e korrelacionit mund të përdoret për të gjykuar afërsisht afërsinë e lidhjes së korrelacionit, nëse kjo lidhje ekziston. Këtu thonë: sa më pak pika të shpërndahen rreth vijës mesatare imagjinare, aq më i ngushtë është korrelacioni midis karakteristikave në shqyrtim.

Analiza vizuale e fushave të korrelacionit ndihmon për të kuptuar thelbin e marrëdhënies së korrelacionit dhe na lejon të bëjmë supozime për praninë, drejtimin dhe afërsinë e lidhjes. Por është e pamundur të thuhet me siguri nëse ka një lidhje midis shenjave apo jo, një lidhje lineare apo një lakuar, një lidhje e ngushtë (e besueshme) apo e dobët (jo e besueshme), duke përdorur këtë metodë. Metoda më e saktë për identifikimin dhe vlerësimin e marrëdhënies lineare midis karakteristikave është metoda e përcaktimit të treguesve të ndryshëm të korrelacionit nga të dhënat statistikore.

3. Koeficientët e korrelacionit dhe vetitë e tyre

Shpesh për të përcaktuar besueshmërinë e marrëdhënies midis dy karakteristikave (X, Y) përdorni Koeficienti i korrelacionit joparametrik (rang) Spearman dhe koeficienti parametrik i korrelacionit Pearson . Vlera e këtyre treguesve të korrelacionit përcaktohet nga formulat e mëposhtme:

(1)

Ku: dx - renditjet e të dhënave statistikore të karakteristikës x;

dy - renditjet e të dhënave statistikore të karakteristikës y.

(2)

Ku: - të dhëna statistikore të karakteristikës x,

Të dhënat statistikore të karakteristikës y.

Këta koeficientë kanë karakteristikat e mëposhtme të fuqishme:

1. Bazuar në koeficientët e korrelacionit, mund të gjykohet vetëm një korrelacion linear midis karakteristikave. Asgjë nuk mund të thuhet për një lidhje lakuar me ndihmën e tyre.
2. Vlerat e koeficientëve të korrelacionit janë një sasi pa dimension që nuk mund të jetë më e vogël se -1 ose më shumë se +1, d.m.th.
3.
4. Nëse vlerat e koeficientëve të korrelacionit janë zero, d.m.th. = 0 ose = 0, pastaj lidhja midis karakteristikave x, y mungon.
5. Nëse vlerat e koeficientëve të korrelacionit janë negative, d.m.th.< 0 или < 0, то связь между признаками Х и Y e kundërta.
6. Nëse vlerat e koeficientëve të korrelacionit janë pozitive, d.m.th. > 0 ose y> 0, pastaj marrëdhënia midis veçorive X dhe Y drejt(pozitive).
7. Nëse koeficientët e korrelacionit marrin vlera +1 ose -1, d.m.th. = ± 1 ose = ± 1, pastaj lidhja midis karakteristikave X dhe Y lineare (funksionale).
8. Besueshmëria e korrelacionit ndërmjet karakteristikave nuk mund të gjykohet vetëm nga madhësia e koeficientëve të korrelacionit. Kjo besueshmëri varet gjithashtu nga numri i shkallëve të lirisë.

Ku: n është numri i çifteve të ndërlidhura të të dhënave statistikore të karakteristikave X dhe Y.

Sa më i madh n, aq më i lartë është besueshmëria e marrëdhënies me të njëjtin koeficient korrelacioni.

Përveç vetive të përbashkëta të listuara, koeficientët e korrelacionit në shqyrtim kanë gjithashtu ndryshime. Dallimi kryesor i tyre është se koeficienti Pearson ( mund të përdoret vetëm nëse shpërndarja e karakteristikave X dhe Y është normale, koeficienti Spearman () mund të përdoret për karakteristika me çdo lloj shpërndarjeje. Nëse karakteristikat në fjalë kanë një shpërndarje normale, atëherë është më e përshtatshme të përcaktohet prania e një lidhjeje korrelacioni duke përdorur koeficientin Pearson (), pasi në këtë rast do të ketë një gabim më të vogël se koeficienti Spearman ().

Shembulli 8.2.

Duke përdorur koeficientin e korrelacionit të rangut të Spearman, përcaktoni nëse ka një lidhje midis rezultateve të vrapimit të kërcimit së gjati (X) dhe shpejtësisë përfundimtare të vrapimit (Y) të një grupi atletësh (të dhënat nga Shembulli 8.1, Tabela 5).

Në formulën (1) dx dhe dy janë radhët e të dhënave statistikore, d.m.th. opsionin e vendeve në grupin e tyre të renditur. Nëse në total ka disa të dhëna identike, atëherë gradat e tyre janë të barabarta dhe përcaktohen si vlera mesatare e vendeve të zëna nga këto opsione. Për shembull,

Të dhënat xi
dx renditet 4,5 4,5 4,5 4,5 7,5 7,5
3 + 4 + 5 + 6 7 + 8

Duke përdorur këtë rregull, ne do të përcaktojmë radhët e të dhënave në tabelën 5. Për lehtësi, ne do të shkruajmë gjithçka në formën e tabelës 6.

Tabela 6

dx dy dx-dy
9,1 1 - 1 = 0 02 = 0
9,6 2 - 2 = 0 02 = 0
9,8 3 - 3 = 0 02 = 0
10,1 4 - 4 = 0 02 = 0
10,5 6,5 5 - 6,5 = - 1,5 (- 1,5)2 = 2,25
10,5 6,5 6 - 6,5 = - 0,5 (- 0,5)2 = 0,25
10,3 7 - 5 = 2 22 = 4
10,7 8 - 8 = 0 02 = 0
(dx-dy) = 0

Në këtë rast kemi 8 çifte vlerash, d.m.th. 8 çifte të ndërlidhura. Kjo do të thotë n = 8. Duke zëvendësuar rezultatin në formulën (1), do të kemi:

konkluzioni:

(0,92 > 0) , pastaj midis shenjave X dhe Y U X), dhe anasjelltas - me një ulje të shpejtësisë së ngritjes, gjatësia e kërcimit zvogëlohet. Besueshmëria e koeficientit të korrelacionit Spearman përcaktohet nga tabela e vlerave kritike të koeficientit të korrelacionit të renditjes.

b) sepse vlera rezultuese e koeficientit të korrelacionit = 0,9 është më e madhe se vlera e tabelës = 0,88, që korrespondon me nivelin b = 99%, atëherë besimi në korrektësinë e përfundimit (a) është më i madh se 99%. Një besueshmëri e tillë na lejon të shtrijmë përfundimin (a) në të gjithë popullsinë, d.m.th. për të gjithë kërcyesit së gjati.

Nëse nuk ka kontroll paraprak të popullatave në shqyrtim për normalitetin e shpërndarjes, atëherë, nëse koeficienti i korrelacionit Pearson nuk është i besueshëm, prania e një lidhjeje duhet të kontrollohet gjithashtu duke përdorur koeficientin Spearman.

Shembulli 8.3.

Koeficienti i korrelacionit të renditjes mund të përdoret për të identifikuar marrëdhëniet midis variablave që kanë ndonjë shpërndarje statistikore. Por nëse këto variabla kanë një shpërndarje normale (Gaussian), atëherë lidhja mund të vendoset më saktë duke përdorur koeficientin e korrelacionit të normalizuar (Bravais-Pearson).

Le të supozojmë se në shembullin tonë dhe - korrespondojnë me ligjin e shpërndarjes normale, dhe të kontrollojmë ekzistencën e një lidhjeje midis rezultateve të testit X dhe Y duke përdorur llogaritjen e koeficientit të normalizuar të korrelacionit.

Nga formula (1) është e qartë se për llogaritjen është e nevojshme të gjenden vlerat mesatare të karakteristikave X, Y dhe devijimin e secilës të dhënë statistikore nga mesatarja e saj. Duke ditur këto vlera, mund të gjeni shumat për të cilat nuk është e vështirë të llogaritni

Bazuar në të dhënat në Tabelën 5, plotësoni Tabelën 7:

Tabela 7

962 = 9216 10,7 0,6 0,62 = 0,36 96 · 0,6 = 57,6
262 = 676 10,5 0,4 0,42 = 0,16 26 · 0,4 = 10,4
10,3 0,2 0,04 5,4
- 4 9,8 - 0,3 0,09 1,2
10,1 0,00 1,0
10,5 0,4 0,16 3,2
- 92 9,1 - 1,0 1,00 9,2
- 64 9,6 - 0,5 0,25 32,0
= 23262 = 2,06 = 201

Duke zëvendësuar shumën e kolonës 7 në numëruesin e formulës (1), dhe shumat e kolonave 3 dhe 6 në emërues, marrim:

konkluzioni:

a) sepse vlera e koeficientit të korrelacionit është pozitive (0.92>0) , pastaj ndërmjet X dhe Y ka një lidhje të drejtpërdrejtë, d.m.th. me rritjen e shpejtësisë së ngritjes (shenjë Y) rritet gjatësia e kërcimit (shenja X) dhe anasjelltas - me një ulje të shpejtësisë së ngritjes, gjatësia e kërcimit zvogëlohet. Është shumë e rëndësishme të dihet besimi në korrektësinë e përfundimit të marrë.

Pjesa teorike

Për të dalluar drejtimin e ndikimit të një karakteristike në një tjetër, u prezantuan konceptet e lidhjeve pozitive dhe negative.

Nëse me një rritje (ulje) në një atribut, vlerat e një tjetri përgjithësisht rriten (zvogëlohen), atëherë një korrelacion i tillë quhet i drejtpërdrejtë ose pozitiv.

Nëse me një rritje (ulje) në një atribut, vlerat e një tjetri përgjithësisht zvogëlohen (rriten), atëherë një korrelacion i tillë quhet i kundërt ose negativ.

Fushat e korrelacionit dhe përdorimi i tyre në analizën paraprake të korrelacionit

Kur shtrohet pyetja e korrelacionit midis dy karakteristikave statistikore X dhe Y, kryhet një eksperiment me regjistrimin paralel të vlerave të tyre.

Shembull -
Fushën e korrelacionit do ta quajmë zonën e shpërndarjes së pikave të marra në këtë mënyrë në grafik. Duke analizuar vizualisht fushën e korrelacionit në Figurën 8, mund të shihni se ajo duket të jetë e zgjatur përgjatë një vije të drejtë. Kjo pamje është tipike për të ashtuquajturën marrëdhënie korrelacioni linear midis karakteristikave. Në këtë rast, përgjithësisht mund të supozohet se me një rritje të shpejtësisë përfundimtare të ngritjes, gjatësia e kërcimit gjithashtu rritet, dhe anasjelltas. Ato. Ekziston një marrëdhënie e drejtpërdrejtë (pozitive) midis karakteristikave në shqyrtim.

Së bashku me këtë shembull, nga shumë fusha të tjera të mundshme korrelacioni, mund të dallohen sa vijon (Fig. 9-11):

Figura 9 tregon gjithashtu një marrëdhënie lineare, por me rritjen e vlerave të një atributi, vlerat e tjetrit zvogëlohen dhe anasjelltas, d.m.th. reagime ose negative. Mund të supozohet se në figurën 11 pikat e fushës së korrelacionit janë të shpërndara rreth një lloj vije të lakuar. Në këtë rast, ata thonë se ekziston një korrelacion lakor midis karakteristikave.

Për sa i përket fushës së korrelacionit të paraqitur në figurën 10, nuk mund të thuhet se pikat janë të vendosura përgjatë ndonjë vije të drejtë ose të lakuar. Në këtë rast, ata thonë se karakteristikat X dhe Y nuk varen nga njëra-tjetra.



Përveç kësaj, fusha e korrelacionit mund të përdoret për të gjykuar afërsisht afërsinë e lidhjes së korrelacionit, nëse kjo lidhje ekziston. Këtu thonë: sa më pak pika të shpërndahen rreth vijës mesatare imagjinare, aq më i ngushtë është korrelacioni midis karakteristikave në shqyrtim.

Analiza vizuale e fushave të korrelacionit ndihmon për të kuptuar thelbin e marrëdhënies së korrelacionit dhe na lejon të bëjmë supozime për praninë, drejtimin dhe afërsinë e lidhjes. Por është e pamundur të thuhet me siguri nëse ka një lidhje midis shenjave apo jo, një lidhje lineare apo një lakuar, një lidhje e ngushtë (e besueshme) apo e dobët (jo e besueshme), duke përdorur këtë metodë. Metoda më e saktë për identifikimin dhe vlerësimin e marrëdhënies lineare midis karakteristikave është metoda e përcaktimit të treguesve të ndryshëm të korrelacionit nga të dhënat statistikore.

3. Koeficientët e korrelacionit dhe vetitë e tyre

Shpesh për të përcaktuar besueshmërinë e marrëdhënies midis dy karakteristikave (X, Y) përdorni Koeficienti i korrelacionit joparametrik (rang) Spearman dhe koeficienti parametrik i korrelacionit Pearson . Vlera e këtyre treguesve të korrelacionit përcaktohet nga formulat e mëposhtme:

(1)

Ku: dx - renditjet e të dhënave statistikore të karakteristikës x;

dy - renditjet e të dhënave statistikore të karakteristikës y.

(2)

Ku: - të dhëna statistikore të karakteristikës x,

Të dhënat statistikore të karakteristikës y.

Këta koeficientë kanë karakteristikat e mëposhtme të fuqishme:

1. Bazuar në koeficientët e korrelacionit, mund të gjykohet vetëm një korrelacion linear midis karakteristikave. Asgjë nuk mund të thuhet për një lidhje lakuar me ndihmën e tyre.
2. Vlerat e koeficientëve të korrelacionit janë një sasi pa dimension që nuk mund të jetë më e vogël se -1 ose më shumë se +1, d.m.th.
3.
4. Nëse vlerat e koeficientëve të korrelacionit janë zero, d.m.th. = 0 ose = 0, pastaj lidhja midis karakteristikave x, y mungon.
5. Nëse vlerat e koeficientëve të korrelacionit janë negative, d.m.th.< 0 или < 0, то связь между признаками Х и Y e kundërta.
6. Nëse vlerat e koeficientëve të korrelacionit janë pozitive, d.m.th. > 0 ose y> 0, pastaj marrëdhënia midis veçorive X dhe Y drejt(pozitive).
7. Nëse koeficientët e korrelacionit marrin vlera +1 ose -1, d.m.th. = ± 1 ose = ± 1, pastaj lidhja midis karakteristikave X dhe Y lineare (funksionale).
8. Besueshmëria e korrelacionit ndërmjet karakteristikave nuk mund të gjykohet vetëm nga madhësia e koeficientëve të korrelacionit. Kjo besueshmëri varet gjithashtu nga numri i shkallëve të lirisë.

Pjesa praktike.

Përcaktoni koeficientin e korrelacionit midis temperaturës së trupit dhe shkallës së pulsit dhe vlerësoni marrëdhënien e identifikuar.



Ju pëlqeu artikulli? Ndani me miqtë tuaj!