Si të ndërtoni një fushë korrelacioni. Fusha e korrelacionit

Për studimin eksperimental të varësive ndërmjet variablave të rastësishëm x dhe y të kryejë një sërë eksperimentesh të pavarura. Rezultati i- eksperimenti jep një palë vlerash (x r, y g), i = 1, 2,..., fq.

Sasitë që karakterizojnë veti të ndryshme të objekteve mund të jenë të pavarura ose të ndërlidhura. Format e manifestimit të marrëdhënieve janë shumë të ndryshme. Dy llojet më të zakonshme janë lidhjet funksionale (të plota) dhe korrelacioni (jo të plota).

Kur dy sasi janë funksionalisht të varura nga vlera e njërës -x h domosdoshmërisht korrespondon me një ose më shumë vlera të përcaktuara saktë të një sasie tjetër -y (. Shumë shpesh, lidhjet funksionale shfaqen në fizikë dhe kimi. Në situata reale, ekziston një numër pafundësisht i madh i vetive të vetë objektit dhe mjedisit të jashtëm që ndikojnë njëri-tjetrin, kështu që kjo lloj lidhjeje nuk ekziston, me fjalë të tjera, lidhjet funksionale janë abstraksione matematikore.

Ndikimi i faktorëve të përgjithshëm dhe prania e modeleve objektive në sjelljen e objekteve çojnë vetëm në shfaqjen e varësisë statistikore. Statistikore është një varësi në të cilën një ndryshim në njërën nga sasitë sjell një ndryshim në shpërndarjen e të tjerëve (një tjetri), dhe këto sasi të tjera marrin vlera të caktuara me probabilitete të caktuara. Në këtë rast, varësia funksionale duhet të konsiderohet një rast i veçantë i varësisë statistikore: vlera e një faktori korrespondon me vlerat e faktorëve të tjerë me një probabilitet të barabartë me një. Një rast më i rëndësishëm i veçantë i varësisë statistikore është varësia e korrelacionit, e cila karakterizon marrëdhënien midis vlerave të disa variablave të rastësishëm dhe vlerës mesatare të të tjerëve, megjithëse në çdo rast individual çdo vlerë e ndërlidhur mund të marrë vlera të ndryshme.

Një marrëdhënie korrelacioni (e cila quhet edhe jo e plotë, ose statistikore) shfaqet mesatarisht për vëzhgimet masive, kur vlerat e dhëna të ndryshores së varur korrespondojnë me një numër të caktuar vlerash të mundshme të ndryshores së pavarur. Shpjegimi - kompleksiteti i marrëdhënieve ndërmjet faktorëve të analizuar, ndërveprimi i të cilëve ndikohet nga variabla të rastësishëm të pa llogaritur. Prandaj, lidhja midis shenjave shfaqet vetëm mesatarisht, në masën e rasteve. Në një lidhje korrelacioni, çdo vlerë argumenti korrespondon me vlerat e funksionit të shpërndara rastësisht në një interval të caktuar.

Termi "korrelacion" u përdor për herë të parë nga paleontologu francez J. Cuvier, i cili nxori "ligjin e korrelacionit të pjesëve dhe organeve të kafshëve" (ky ligj lejon që dikush të rindërtojë pamjen e të gjithë kafshës nga pjesët e gjetura të trupit). Ky term u fut në statistikë nga biologu dhe statisticieni anglez F. Galton (jo thjesht një lidhje, por një "sikur një lidhje" - korrelacion).

Varësitë e korrelacionit gjenden kudo. Për shembull, në bujqësi, kjo mund të jetë lidhja midis rendimentit dhe sasisë së plehut të aplikuar. Natyrisht, këta të fundit janë të përfshirë në formimin e të korrave. Por për çdo fushë ose parcelë specifike, e njëjta sasi e plehut të aplikuar do të shkaktojë një rritje të ndryshme të rendimentit, pasi ndërveprojnë një sërë faktorësh të tjerë (moti, gjendja e tokës, etj.), të cilët formojnë rezultatin përfundimtar. Sidoqoftë, mesatarisht, vërehet një marrëdhënie e tillë - një rritje në masën e plehrave të aplikuara çon në një rritje të rendimentit.

Metoda më e thjeshtë për identifikimin e lidhjeve ndërmjet karakteristikave që studiohen është ndërtimi i një tabele korrelacioni; paraqitja vizuale e tij është fusha e korrelacionit. Është një grafik ku vlerat jq janë paraqitur në boshtin e abshisës dhe përgjatë boshtit të ordinatave y x. Nga vendndodhja e pikave dhe përqendrimi i tyre në një drejtim të caktuar, mund të gjykohet cilësisht prania e një lidhjeje.

Oriz. 7.3.

Një korrelacion pozitiv midis variablave të rastësishëm, afër një funksional parabolik, është paraqitur në Fig. 6.1 , A. Në Fig. 6.1, b tregon një shembull të një korrelacioni të dobët negativ, dhe në Fig. 6.1, V - një shembull i variablave të rastësishëm praktikisht të pakorreluara. Korrelacioni është i lartë nëse varësia "mund të përfaqësohet" në grafik me një vijë të drejtë (me një pjerrësi pozitive ose negative).

Zgjidhja sistematike e problemeve Lapygin Yuri Nikolaevich

7.3. Fusha e korrelacionit

7.3. Fusha e korrelacionit

Logjika është një këmishë e fantazisë.

Helmar Nahr

Grafikët zakonisht përdoren për të vendosur marrëdhënie midis dy variablave.

Nëse të dy variablat ndryshojnë në mënyrë sinkrone, kjo mund të nënkuptojë se ka lidhje midis tyre dhe ato ndikojnë në njëri-tjetrin. Një shembull është dinamika e rritjes së pjesës së pagave në strukturën e kostove të produktit dhe dinamika e produktivitetit të punës. Vëzhgimet tregojnë se me rritjen e ndryshores së parë, rritet edhe e dyta.

Edhe pse duhet pasur parasysh se edhe nëse ka një shkallë të caktuar sinkroniteti në ndryshimet e variablave, kjo nuk do të thotë prani e pakushtëzuar e një marrëdhënieje shkak-pasojë midis tyre (ndoshta ekziston një variabël i tretë që shkakton një një efekt).

Shembuj të fushave të korrelacionit janë paraqitur në Fig. 7.2.

Një përshkrim i komplotit është paraqitur më poshtë.

1. Për analizë zgjidhen dy variabla: njëra e pavarur, tjetra e varur.

2. Për çdo vlerë të ndryshores së pavarur, matni vlerën përkatëse të ndryshores së varur. Këto dy vlera formojnë një çift të dhënash që vizatohen si pikë në grafik. Në mënyrë tipike, ju duhet të merrni të paktën 30 pikë, por për të krijuar një grafik kuptimplotë, numri i pikëve duhet të jetë së paku 100.

3. Vlera e variablit të pavarur që karakterizon shkakun e pritshëm paraqitet përgjatë boshtit X, dhe vlera e ndryshores së varur që karakterizon problemin është përgjatë boshtit .

4. Çiftet e të dhënave që rezultojnë paraqiten si pika në grafik dhe rezultati analizohet. Nëse korrelacioni nuk shfaqet në diagram, atëherë mund të përpiqeni të ndërtoni një grafik në një shkallë logaritmike.

Nga libri Luftërat e Marketingut nga Rajs Al

Nga libri Teksti reklamues. Metodologjia për përpilim dhe dizajn autor Berdyshev Sergej Nikolaevich

5.2. Fusha onomastike A.V. Superanskaya, N.V. Podolskaya dhe gjuhëtarë të tjerë priren të identifikojnë klasat e mëposhtme të objekteve të emërtuara dhe kategoritë përkatëse onomastike që janë domethënëse për emërtimin dhe tregtinë në përgjithësi: emrat e dokumenteve dhe ligjeve - dokumentonime,

Nga libri Ju duhet ta përdorni këtë autore Slovtsova Irina

A ka siguri në shifra? Për disa vite kam punuar në shtypin rajonal dhe kam shkruar për problemet e pushtetit vendor. Më duhet të them se aparati burokratik është aq i strukturuar, i ndërtuar sipas një skeme hierarkike, përshkon të gjitha sferat e jetës sonë, sa një person (madje

Nga libri Jeta ime në reklamë nga Claude Hopkins

Nga libri iPrezantimi. Mësime në Bindje nga Udhëheqësi i Apple, Steve Jobs nga Gallo Carmine

"Reality Warp Field" Sculley dëshmoi atë që Zëvendëspresidenti i Apple Bud Tribble e përshkroi dikur si një "fushë e shtrembërimit të realitetit" - aftësia për të bindur këdo për pothuajse çdo gjë. Shumë njerëz nuk mund t'i rezistojnë kësaj tërheqjeje magnetike dhe

Nga libri Menaxhimi i ekspozitës: Strategjitë e menaxhimit dhe komunikimet e marketingut autor Filonenko Igor

9. Marrëdhëniet me publikun në fushën e ekspozitës 9.1. Qëllimet, objektivat, mjetet e marrëdhënieve me publikun në fushën e ekspozitës Në një kuptim të gjerë, marrëdhëniet me publikun (në tekstin e mëtejmë - PR) përkufizohen si "përpjekje të planifikuara dhe të zbatuara që synojnë krijimin dhe ruajtjen e vullnetit të mirë.

Nga libri Menaxheri frymëzues autor Leary-Joyce Judith

"Fusha e mrekullive" Unë personalisht mendoj se kjo është një perspektivë e shkëlqyer: as nuk mund të ëndërroja për asgjë më të mirë. Në fakt, kjo është arsyeja pse e shkrova këtë libër. E keni parë filmin “Fusha e ëndrrave”? Atje, personazhi i Kevin Costner vendos të ndërtojë mbi plantacionin e tij të misrit

Nga libri Agjencia e Reklamimit: ku të filloni, si të keni sukses autor Golovanov Vasily Anatolievich

"Në fushë!" Në këtë kapitull do të shqyrtojmë të gjitha çështjet kryesore që lidhen me fazën kryesore të punës për negocimin dhe lidhjen e kontratave për shërbimet që ju do të shisni Të gjithë sipërmarrësit në 80% të rasteve janë lehtësisht të disponueshëm për negociata - unë e di

Nga libri i Apple. Fenomeni i besimit autor Vasiliev Yuri Nikolaevich

Fusha e Realitetit të Ndryshuar Një nga zhvilluesit kryesorë të Mac-it të parë, Andy Herzwild, tha si më poshtë për Steve Jobs: “Fusha e Realitetit të Ndryshuar ishte një përzierje e mahnitshme e stilit oratorik karizmatik, kokëfortësisë dhe dëshirës për të shtrembëruar çdo fakt në mënyrë që të

Nga libri Etiketa. Një grup i plotë rregullash për komunikimin social dhe biznes. Si të silleni në situata të njohura dhe të pazakonta autor Belousova Tatyana

Nga libri Çfarë nuk e vrau kompaninë LEGO, por e bëri atë më të fortë. Tullë më tullë nga Bryn Bill

Nga libri Tre rrethet e lidershipit autor Sudarkin Alexander

Ka siguri në numra. Përfshirja e një specialisti të burimeve njerëzore në punë Disa kohë më parë, në mesin e viteve 2000, tema "HR si partner strategjik i menaxherit" u diskutua në mënyrë aktive në forumet e menaxherëve të burimeve njerëzore. Mosmarrëveshjet ia lanë vendin konsensuseve të përkohshme, të ftuarve për të folur

Nga libri Launch! Fillimi i shpejtë për biznesin tuaj nga Walker Jeff

Nga libri The Big Book of the Store Director 2.0. Teknologjitë e reja nga Krok Gulfira

Nga libri Përqafoni klientët tuaj. Praktikë e shquar e shërbimit nga Mitchell Jack

Nga libri Udhëzime për organizimin e punës së shërbimit të shtypit dioqezan autori E Zhukovskaya E

Ne ndërtojmë një fushë korrelacioni për komponentët kryesorë dhe të lidhur. Në boshtin e abshisës vizatojmë përmbajtjen e komponentit kryesor, në këtë rast Hg, dhe në boshtin e ordinatave paraqesim përmbajtjen e komponentit të shoqëruar, d.m.th. Sn.

Për të bërë një vlerësim paraprak të forcës së lidhjes në fushën e korrelacionit, është e nevojshme të vizatoni linja që korrespondojnë me vlerat mesatare të përbërësve kryesorë dhe të lidhur, duke e ndarë fushën në katër sheshe.

Një masë sasiore e fuqisë së një lidhjeje është koeficienti i korrelacionit. Vlerësimi i përafërt i tij llogaritet duke përdorur formulën:

ku n1 është numri i përgjithshëm i pikëve në I dhe III, n2 = numri i përgjithshëm i pikëve në II dhe IV.

I = 4 II = 8 III = 7 IV = 5

Më pas, duke përdorur të dhënat fillestare të llogaritura nga kompjuteri (Хср, Yср, variancat Dx, Dy dhe kovarianca e tyre cov(x,y)), ne llogarisim vlerën e koeficientit të korrelacionit r dhe parametrat e ekuacioneve të regresionit linear të lidhjeve të lidhura. komponenti nga principali dhe komponenti kryesor nga komponenti shoqërues.

Ne llogarisim duke përdorur formulat e mëposhtme:

Të dhënat fillestare:

cov(x, y) = 163,86

r = cov(x, y)/√Dx * Dy = 163,86/√157,27* 645,61= 0,51

b = cov(x, y)/Dx = 163.86/157.27= 1.04

a = Yavg – b * Xavg = 153,13– (-0,08) * 36,75 = 150,19

d = cov(x, y)/ Dy = 163.86/645.61= 0.25

c = Хср – d * Yср = 36,75– (0,25) * 153,13= -1,5

y =150,19+1,04x x = -1,5+0,25y

Ne ndërtojmë linja regresioni në fushën e korrelacionit.

Faza 7. Testimi i hipotezës për praninë e një marrëdhënie korrelacioni

Testimi i hipotezës për praninë e një korrelacioni bazohet në faktin se për një ndryshore të rastësishme dydimensionale të shpërndarë normalisht X, Y, në mungesë të korrelacionit midis x dhe y, koeficienti i korrelacionit është "0". Për të testuar hipotezën për mungesën e një korrelacioni, është e nevojshme të llogaritet vlera e kriterit:

t = r * √(N – 2)/√(1 – r2) = 0,51* √(24-2)/√(1 – (0,51) 2) = 2,65

Për vlerat tona t = 2.65

Vlera e tabelës ttab = 2,02

Meqenëse vlera e llogaritur t tejkalon vlerën e tabelës, hipoteza për mungesën e një korrelacioni hidhet poshtë. Ka një lidhje.

Faza 8. Ndërtimi i linjave të regresionit empirik. Llogaritja e raportit të korrelacionit

Të dhënat e përzgjedhura grupohen në klasa sipas vlerave të përmbajtjes së komponentit kryesor, në këtë rast Hg. Për ta bërë këtë, i gjithë diapazoni i vlerave nga përmbajtja minimale e përbërësit kryesor të dobishëm deri në përmbajtjen maksimale ndahet në 6 intervale. Për çdo interval:

    Përcaktohet numri i vlerave që bien në këtë interval n(i).

    Është llogaritur numri i vlerave të përmbajtjes së komponentëve të lidhur që korrespondojnë me vlerat e komponentit kryesor (y(I, av)) dhe ky numër pjesëtohet me n(i)

Tabela 3

Kufiri i intervalit

Ne ndërtojmë një linjë regresioni empirik në fushën e korrelacionit.

dtotal = √Dy = 25.4

dkusht = /N = 66,14

Vlera e raportit të korrelacionit të komponentit të lidhur me r kryesore llogaritet duke përdorur formulën:

r = dkusht/ dtotal = 66,14/25,4 = 2,6

Kur shtrohet pyetja e korrelacionit midis dy karakteristikave statistikore X dhe Y, kryhet një eksperiment me regjistrimin paralel të vlerave të tyre.

Shembulli 8.1.

Përcaktoni nëse rezultati i një kërcimi së gjati vrapimi (shenja X) varet nga vlera e shpejtësisë përfundimtare të vrapimit (shenja Y). Për t'iu përgjigjur kësaj pyetjeje, paralelisht me regjistrimin e rezultatit X të çdo kërcimi të një atleti ose grupi atletësh, regjistrohet edhe vlera e shpejtësisë përfundimtare të ngritjes Y. Le të jenë kështu:

Tabela 5

I
xi (cm)
yi (m/s) 10,7 10,5 10,1 9,8 10,1 10,5 9,1 9,6

Le të paraqesim tabelën 5 në formën e një grafiku në një sistem koordinativ drejtkëndor, ku do të vizatojmë gjatësinë e kërcimit (X) në boshtin horizontal dhe vlerën e shpejtësisë përfundimtare të ngritjes në këtë kërcim (Y) në boshtin vertikal.
funksioni PlayMyFlash(cmd)( Corel_.TPlay(cmd); )

№1 !!! №2 !!! №3 !!! №4 !!! №5!!! №6 !!! №7 !!! №8!!!

Oriz. 8. Grafiku i fushës së korrelacionit.

Fushën e korrelacionit do ta quajmë zonën e shpërndarjes së pikave të marra në këtë mënyrë në grafik. Duke analizuar vizualisht fushën e korrelacionit në Figurën 8, mund të shihni se ajo duket të jetë e zgjatur përgjatë një vije të drejtë. Kjo pamje është tipike për të ashtuquajturën marrëdhënie korrelacioni linear midis karakteristikave. Në këtë rast, përgjithësisht mund të supozohet se me një rritje të shpejtësisë përfundimtare të ngritjes, gjatësia e kërcimit gjithashtu rritet, dhe anasjelltas. Ato. Ekziston një marrëdhënie e drejtpërdrejtë (pozitive) midis karakteristikave në shqyrtim.

Së bashku me këtë shembull, nga shumë fusha të tjera të mundshme korrelacioni, mund të dallohen sa vijon (Fig. 9-11):

Figura 9 tregon gjithashtu një marrëdhënie lineare, por me rritjen e vlerave të një atributi, vlerat e tjetrit zvogëlohen dhe anasjelltas, d.m.th. reagime ose negative. Mund të supozohet se në figurën 11 pikat e fushës së korrelacionit janë të shpërndara rreth një lloj vije të lakuar. Në këtë rast, ata thonë se ekziston një korrelacion lakor midis karakteristikave.

Për sa i përket fushës së korrelacionit të paraqitur në figurën 10, nuk mund të thuhet se pikat janë të vendosura përgjatë ndonjë vije të drejtë ose të lakuar; Në këtë rast, ata thonë se karakteristikat X dhe Y nuk varen nga njëra-tjetra.

Përveç kësaj, fusha e korrelacionit mund të përdoret për të gjykuar afërsisht afërsinë e lidhjes së korrelacionit, nëse kjo lidhje ekziston. Këtu thonë: sa më pak pika të shpërndahen rreth vijës mesatare imagjinare, aq më i ngushtë është korrelacioni midis karakteristikave në shqyrtim.

Analiza vizuale e fushave të korrelacionit ndihmon për të kuptuar thelbin e marrëdhënies së korrelacionit dhe na lejon të bëjmë supozime për praninë, drejtimin dhe afërsinë e lidhjes. Por është e pamundur të thuhet me siguri nëse ka një lidhje midis shenjave apo jo, një lidhje lineare apo një lakuar, një lidhje e ngushtë (e besueshme) apo e dobët (jo e besueshme), duke përdorur këtë metodë. Metoda më e saktë për identifikimin dhe vlerësimin e marrëdhënies lineare midis karakteristikave është metoda e përcaktimit të treguesve të ndryshëm të korrelacionit nga të dhënat statistikore.

3. Koeficientët e korrelacionit dhe vetitë e tyre

Shpesh për të përcaktuar besueshmërinë e marrëdhënies midis dy shenjave (X, Y) përdorni Koeficienti i korrelacionit joparametrik (rang) Spearman dhe koeficienti parametrik i korrelacionit Pearson . Vlera e këtyre treguesve të korrelacionit përcaktohet nga formulat e mëposhtme:

(1)

Ku: dx - renditjet e të dhënave statistikore të karakteristikës x;

dy - renditjet e të dhënave statistikore të karakteristikës y.

(2)

Ku: - të dhëna statistikore të karakteristikës x,

Të dhënat statistikore të karakteristikës y.

Këta koeficientë kanë karakteristikat e mëposhtme të fuqishme:

1. Bazuar në koeficientët e korrelacionit, mund të gjykohet vetëm një korrelacion linear midis karakteristikave. Asgjë nuk mund të thuhet për një lidhje lakuar me ndihmën e tyre.
2. Vlerat e koeficientëve të korrelacionit janë një sasi pa dimension që nuk mund të jetë më e vogël se -1 ose më shumë se +1, d.m.th.
3.
4. Nëse vlerat e koeficientëve të korrelacionit janë të barabarta me zero, d.m.th. = 0 ose = 0, pastaj lidhja ndërmjet karakteristikave x, y mungon.
5. Nëse vlerat e koeficientëve të korrelacionit janë negative, d.m.th.< 0 или < 0, то связь между признаками Х и Y e kundërta.
6. Nëse vlerat e koeficientëve të korrelacionit janë pozitive, d.m.th. > 0 ose y> 0, pastaj marrëdhënia midis veçorive X dhe Y drejt(pozitive).
7. Nëse koeficientët e korrelacionit marrin vlera +1 ose -1, d.m.th. = ± 1 ose = ± 1, pastaj lidhja midis karakteristikave X dhe Y lineare (funksionale).
8. Besueshmëria e korrelacionit ndërmjet karakteristikave nuk mund të gjykohet vetëm nga madhësia e koeficientëve të korrelacionit. Kjo besueshmëri varet gjithashtu nga numri i shkallëve të lirisë.

Ku: n është numri i çifteve të korreluara të të dhënave statistikore të karakteristikave X dhe Y.

Sa më i madh n, aq më i lartë është besueshmëria e marrëdhënies me të njëjtin koeficient korrelacioni.

Përveç vetive të përbashkëta të listuara, koeficientët e korrelacionit në shqyrtim kanë gjithashtu ndryshime. Dallimi kryesor i tyre është se koeficienti Pearson ( mund të përdoret vetëm nëse shpërndarja e karakteristikave X dhe Y është normale, koeficienti Spearman () mund të përdoret për karakteristika me çdo lloj shpërndarjeje. Nëse karakteristikat në fjalë kanë një shpërndarje normale, atëherë është më e përshtatshme të përcaktohet prania e një lidhjeje korrelacioni duke përdorur koeficientin Pearson (), pasi në këtë rast do të ketë një gabim më të vogël se koeficienti Spearman ().

Shembulli 8.2.

Duke përdorur koeficientin e korrelacionit të rangut të Spearman, përcaktoni nëse ka një lidhje midis rezultateve të vrapimit të kërcimit së gjati (X) dhe shpejtësisë përfundimtare të vrapimit (Y) të një grupi atletësh (të dhënat nga Shembulli 8.1, Tabela 5).

Në formulën (1) dx dhe dy janë radhët e të dhënave statistikore, d.m.th. opsionin e vendeve në grupin e tyre të renditur. Nëse në total ka disa të dhëna identike, atëherë gradat e tyre janë të barabarta dhe përcaktohen si vlera mesatare e vendeve të zëna nga këto opsione. Për shembull,

Të dhënat xi
dx renditet 4,5 4,5 4,5 4,5 7,5 7,5
3 + 4 + 5 + 6 7 + 8

Duke përdorur këtë rregull, ne do të përcaktojmë radhët e të dhënave në tabelën 5. Për lehtësi, ne do të shkruajmë gjithçka në formën e tabelës 6.

Tabela 6

dx dy dx-dy
9,1 1 - 1 = 0 02 = 0
9,6 2 - 2 = 0 02 = 0
9,8 3 - 3 = 0 02 = 0
10,1 4 - 4 = 0 02 = 0
10,5 6,5 5 - 6,5 = - 1,5 (- 1,5)2 = 2,25
10,5 6,5 6 - 6,5 = - 0,5 (- 0,5)2 = 0,25
10,3 7 - 5 = 2 22 = 4
10,7 8 - 8 = 0 02 = 0
(dx-dy) = 0

Në këtë rast kemi 8 çifte vlerash, d.m.th. 8 çifte të ndërlidhura. Kjo do të thotë n = 8. Duke zëvendësuar rezultatin në formulën (1), do të kemi:

konkluzioni:

(0,92 > 0) , pastaj midis shenjave X dhe Y U X), dhe anasjelltas - me një ulje të shpejtësisë së ngritjes, gjatësia e kërcimit zvogëlohet. Besueshmëria e koeficientit të korrelacionit Spearman përcaktohet nga tabela e vlerave kritike të koeficientit të korrelacionit të renditjes.

b) sepse vlera rezultuese e koeficientit të korrelacionit = 0,9 është më e madhe se vlera e tabelës = 0,88, që korrespondon me nivelin b = 99%, atëherë besimi në korrektësinë e përfundimit (a) është më i madh se 99%. Një besueshmëri e tillë na lejon të shtrijmë përfundimin (a) në të gjithë popullsinë, d.m.th. për të gjithë kërcyesit së gjati.

Nëse nuk kryhet një kontroll paraprak i popullatave në shqyrtim për normalitetin e shpërndarjes, atëherë, nëse koeficienti i korrelacionit Pearson nuk është i besueshëm, prania e një lidhjeje duhet të kontrollohet gjithashtu duke përdorur koeficientin Spearman.

Shembulli 8.3.

Koeficienti i korrelacionit të renditjes mund të përdoret për të identifikuar marrëdhëniet midis variablave që kanë ndonjë shpërndarje statistikore. Por nëse këto variabla kanë një shpërndarje normale (Gaussian), atëherë lidhja mund të vendoset më saktë duke përdorur koeficientin e korrelacionit të normalizuar (Bravais-Pearson).

Le të supozojmë se në shembullin tonë dhe - korrespondojnë me ligjin e shpërndarjes normale, dhe të kontrollojmë ekzistencën e një lidhjeje midis rezultateve të testit X dhe Y duke përdorur llogaritjen e koeficientit të normalizuar të korrelacionit.

Nga formula (1) është e qartë se për llogaritjen është e nevojshme të gjenden vlerat mesatare të karakteristikave X, Y dhe devijimin e secilës të dhënë statistikore nga mesatarja e saj. Duke ditur këto vlera, mund të gjeni shumat për të cilat nuk është e vështirë të llogaritni

Bazuar në të dhënat në Tabelën 5, plotësoni Tabelën 7:

Tabela 7

962 = 9216 10,7 0,6 0,62 = 0,36 96 · 0,6 = 57,6
262 = 676 10,5 0,4 0,42 = 0,16 26 · 0,4 = 10,4
10,3 0,2 0,04 5,4
- 4 9,8 - 0,3 0,09 1,2
10,1 0,00 1,0
10,5 0,4 0,16 3,2
- 92 9,1 - 1,0 1,00 9,2
- 64 9,6 - 0,5 0,25 32,0
= 23262 = 2,06 = 201

Duke zëvendësuar shumën e kolonës 7 në numëruesin e formulës (1), dhe shumat e kolonave 3 dhe 6 në emërues, marrim:

konkluzioni:

a) sepse vlera e koeficientit të korrelacionit është pozitive (0.92>0) , pastaj ndërmjet X dhe Y ka një lidhje të drejtpërdrejtë, d.m.th. me rritjen e shpejtësisë së ngritjes (shenjë Y) rritet gjatësia e kërcimit (shenjë X) dhe anasjelltas - me një ulje të shpejtësisë së ngritjes, gjatësia e kërcimit zvogëlohet. Është shumë e rëndësishme të dihet besimi në korrektësinë e përfundimit të marrë.

Korrelacioni studiohet në bazë të të dhënave eksperimentale, të cilat janë vlerat e matura (xi, yi) të dy karakteristikave. Nëse ka pak të dhëna eksperimentale, atëherë shpërndarja empirike dydimensionale përfaqësohet si një seri e dyfishtë vlerash xi dhe yi. Në të njëjtën kohë, varësia e korrelacionit midis karakteristikave mund të përshkruhet në mënyra të ndryshme. Korrespondenca midis një argumenti dhe një funksioni mund të jepet nga një tabelë, formulë, grafik etj.

Analiza e korrelacionit, si metodat e tjera statistikore, bazohet në përdorimin e modeleve probabiliste që përshkruajnë sjelljen e karakteristikave në studim në një popullatë të caktuar të përgjithshme nga e cila janë marrë vlerat eksperimentale xi dhe yi. Kur studiohet korrelacioni midis karakteristikave sasiore, vlerat e të cilave mund të maten me saktësi në njësi të shkallëve metrike (metra, sekonda, kilogramë, etj.), Shumë shpesh miratohet një model popullsie dydimensionale e shpërndarë normalisht. Një model i tillë shfaq grafikisht marrëdhënien midis ndryshoreve xi dhe yi në formën e një vendndodhjeje gjeometrike të pikave në një sistem koordinativ drejtkëndor. Kjo marrëdhënie grafike quhet edhe një fushë shpërndarjeje ose korrelacioni.

Ky model i një shpërndarjeje normale dydimensionale (fushë korrelacioni) na lejon të japim një interpretim të qartë grafik të koeficientit të korrelacionit, sepse shpërndarja në total varet nga pesë parametra: μx, μy - vlera mesatare (pritshmëritë matematikore); σx,σy – devijimet standarde të variablave të rastësishëm X dhe Y dhe p – koeficienti i korrelacionit, i cili është një masë e marrëdhënies midis ndryshoreve të rastësishme X dhe Y.

Nëse p = 0, atëherë vlerat, xi, yi, të marra nga popullata normale dydimensionale, janë të vendosura në grafik në koordinatat x, y brenda zonës së kufizuar nga rrethi (Figura 5, a). Në këtë rast, nuk ka korrelacion midis variablave të rastësishëm X dhe Y dhe ato quhen të pakorreluara. Për një shpërndarje normale dydimensionale, jokorrelacioni nënkupton njëkohësisht pavarësinë e variablave të rastësishëm X dhe Y.

Nëse p = 1 ose p = -1, atëherë ekziston një marrëdhënie funksionale lineare midis ndryshoreve të rastësishme X dhe Y (Y = c + dX). Në këtë rast, ata flasin për korrelacion të plotë. Kur p = 1, vlerat e xi, yi përcaktojnë pikat që shtrihen në një vijë të drejtë që ka një pjerrësi pozitive (me një rritje në xi, vlerat e yi gjithashtu rriten kur p = -1, e drejta); vija ka një pjerrësi negative (Figura 5, b). Në rastet e ndërmjetme (-1< p < 1) точки, соответствующие значениям xi, yi, попадают в область, ограниченную некоторым эллипсом (рисунок 5, в, г), причем при p >0 ka një korrelacion pozitiv (me një rritje në xi vlerat e yi priren të rriten), me p< 0 корреляция отрицательная. Чем ближе р к, тем уже эллипс и тем теснее экспериментальные значения группируются около прямой линии. Здесь же следует обратить внимание на то, что линия, вдоль которой группируются точки, может быть не только прямой, а иметь любую другую форму: парабола, гипербола и т. д. В этих случаях мы рассматривали бы так называемую, нелинейную (или криволинейную) корреляцию.



Kështu, analiza vizuale e fushës së korrelacionit ndihmon për të identifikuar jo vetëm praninë e një marrëdhënie statistikore (lineare ose jolineare) midis karakteristikave në studim, por edhe afërsinë dhe formën e saj. Kjo është thelbësore për hapin tjetër në analizë - zgjedhjen dhe llogaritjen e koeficientit të duhur të korrelacionit.

Lidhja midis karakteristikave mund të përshkruhet në mënyra të ndryshme. Në veçanti, çdo formë lidhjeje mund të shprehet me një ekuacion të përgjithshëm Y = f(X), ku atributi Y është një ndryshore e varur, ose një funksion i një ndryshoreje të pavarur X, i quajtur argument. Korrespondenca midis një argumenti dhe një funksioni mund të jepet nga një tabelë, formulë, grafik etj.



Ju pëlqeu artikulli? Ndani me miqtë tuaj!