Analiza e korrelacionit Spearman në psikologji. Koeficienti i korrelacionit biserial i pikës

37. Koeficienti i korrelacionit të gradës Spearman.

S. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Koeficienti i korrelacionit të gradës Spearman përdoret në rastet kur:
- variablat kanë shkalla e renditjes matje;
- shpërndarja e të dhënave është shumë e ndryshme nga normale ose nuk dihet fare;
- mostrat kanë një vëllim të vogël (N< 30).

Interpretimi i koeficientit të korrelacionit të gradës Spearman nuk është i ndryshëm nga koeficienti Pearson, por kuptimi i tij është disi i ndryshëm. Për të kuptuar ndryshimin midis këtyre metodave dhe për të justifikuar logjikisht fushat e tyre të aplikimit, le të krahasojmë formulat e tyre.

Koeficienti i korrelacionit Pearson:

Koeficienti i korrelacionit Spearman:

Siç mund ta shihni, formulat ndryshojnë ndjeshëm. Le të krahasojmë formulat

Formula e korrelacionit Pearson përdor mesataren aritmetike dhe devijimin standard të serisë së korreluar, por formula Spearman jo. Kështu, për të marrë një rezultat adekuat duke përdorur formulën Pearson, është e nevojshme që seria e korreluar të jetë afër shpërndarjes normale (devijimi mesatar dhe standard janë parametrat e shpërndarjes normale). Kjo nuk është e rëndësishme për formulën Spearman.

Një element i formulës Pearson është standardizimi i secilës seri në z-shkallë.

Siç mund ta shihni, konvertimi i variablave në shkallën Z është i pranishëm në formulën për koeficientin e korrelacionit Pearson. Prandaj, për koeficientin Pearson, shkalla e të dhënave nuk ka fare rëndësi: për shembull, ne mund të lidhim dy variabla, njëra prej të cilave ka një min. = 0 dhe maksimumi. = 1, dhe min e dytë. = 100 dhe maksimumi. = 1000. Pavarësisht se sa i ndryshëm është diapazoni i vlerave, të gjitha ato do të konvertohen në vlera standarde z që janë të njëjta në shkallë.

Prandaj, një normalizim i tillë nuk ndodh në koeficientin Spearman

KUSHT I DETYRUAR PËR PËRDORIM KOEFICIENTIN SPEARMAN ËSHTË BARAZIA E GAMEVE TË DY NDRYSHOREVE.

Përpara përdorimit të koeficientit Spearman për seritë e të dhënave me diapazon të ndryshëm, është e nevojshme që gradë. Renditja rezulton në vlerat e këtyre serive që fitojnë të njëjtin minimum = 1 (grada minimale) dhe një maksimum të barabartë me numrin e vlerave (maksimumi, renditja e fundit = N, d.m.th., numri maksimal i rasteve në mostër) .

Në cilat raste mund të bëni pa renditje?

Këto janë raste kur të dhënat janë fillimisht shkalla e renditjes. Për shembull, testi i Rokeach për orientimet e vlerave.

Gjithashtu, këto janë raste kur numri i opsioneve të vlerës është i vogël dhe kampioni përmban një minimum dhe maksimum fiks. Për shembull, në një diferencial semantik, minimumi = 1, maksimumi = 7.

Shembull i llogaritjes së koeficientit të korrelacionit të gradës së Spearman

Testi i Rokeach i orientimeve të vlerave u krye në dy mostra X dhe Y. Detyra: të zbuloni se sa afër janë hierarkitë e vlerave të këtyre mostrave (fjalë për fjalë, sa të ngjashme janë ato).

Vlera që rezulton r=0.747 kontrollohet nga tabela e vlerave kritike. Sipas tabelës, me N=18, vlera e fituar është e rëndësishme në nivelin p<=0,005

Spearman dhe Kendal renditin koeficientët e korrelacionit

Për variablat që i përkasin një shkalle rendore ose për variablat që nuk i nënshtrohen një shpërndarjeje normale, si dhe për variablat që i përkasin një shkalle intervali, në vend të koeficientit Pearson llogaritet korrelacioni i rangut të Spearman. Për ta bërë këtë, vlerave individuale të variablave u caktohen renditje, të cilat më pas përpunohen duke përdorur formulat e duhura. Për të zbuluar korrelacionin e renditjes, pastroni kutinë e zgjedhjes së parazgjedhur të korrelacionit Pearson në kutinë e dialogut Korrelacionet Bivariate.... Në vend të kësaj, aktivizoni llogaritjen e korrelacionit Spearman. Kjo llogaritje do të japë rezultatet e mëposhtme. Koeficientët e korrelacionit të renditjes janë shumë afër vlerave përkatëse të koeficientëve Pearson (variablat origjinalë kanë një shpërndarje normale).

titkova-matmetody.pdf fq. 45

Metoda e korrelacionit të rangut të Spearman ju lejon të përcaktoni ngushtësinë (forcën) dhe drejtimin

korrelacioni ndërmjet dy shenja ose dy profile (hierarki) shenjat.

Për të llogaritur korrelacionin e renditjes, është e nevojshme të kemi dy rreshta vlerash,

të cilat mund të renditen. Një seri vlerash të tilla mund të jenë:

1) dy shenja matur në të njëjtën grup lëndët;

2) dy hierarki individuale të karakteristikave, identifikuar në dy subjekte duke përdorur të njëjtën

grup karakteristikash;

3) dy hierarkitë grupore të karakteristikave,

4) individuale dhe grupore hierarkia e veçorive.

Së pari, treguesit renditen veçmas për secilën nga karakteristikat.

Si rregull, një gradë më e ulët i caktohet një vlere më të ulët të atributit.

Në rastin e parë (dy karakteristika), vlerat individuale renditen sipas së parës

karakteristikë e marrë nga lëndë të ndryshme, dhe më pas vlera individuale për të dytën

shenjë.

Nëse dy karakteristika janë të lidhura pozitivisht, atëherë subjektet me gradë të ulëta

njëri prej tyre do të ketë gradë të ulët në tjetrin dhe subjektet që kanë gradë të larta në

njëra nga karakteristikat do të ketë gradë të larta edhe për karakteristikën tjetër. Për të llogaritur rs

duhet të përcaktohen dallimet (d) ndërmjet gradave të marra nga një lëndë e caktuar në të dyja

shenjat. Pastaj këta tregues d transformohen në një mënyrë të caktuar dhe i zbriten 1. Se

Sa më i vogël të jetë diferenca midis rangjeve, aq më i madh do të jetë rs, aq më afër +1 do të jetë.

Nëse nuk ka korrelacion, atëherë të gjitha gradat do të jenë të përziera dhe nuk do të ketë

asnjë korrespondencë. Formula është krijuar në mënyrë që në këtë rast rs të jetë afër 0.

Në rast të korrelacionit negativ gradat e ulëta të lëndëve në një bazë

gradat e larta në një bazë tjetër do të korrespondojnë, dhe anasjelltas. Sa më e madhe të jetë mospërputhja

ndërmjet radhëve të lëndëve në dy variabla, rs më afër është -1.

Në rastin e dytë (dy profile individuale), renditen ato individuale

vlerat e marra nga secila prej 2 lëndëve sipas një të caktuar (e njëjta gjë për ta

të dyja) grup veçorish. Renditja e parë do t'i jepet veçorisë me vlerën më të ulët; renditja e dytë -

një shenjë me vlerë më të lartë etj. Natyrisht, të gjitha karakteristikat duhet të maten në

të njëjtat njësi, përndryshe renditja është e pamundur. Për shembull, është e pamundur

renditni treguesit në Inventarin e Personalitetit Cattell (16PF), nëse ato shprehen në

Pikat "të papërpunuara", pasi vargjet e vlerave janë të ndryshme për faktorë të ndryshëm: nga 0 në 13, nga 0 në

20 dhe nga 0 në 26. Nuk mund të themi se cili faktor do të zërë vendin e parë

shprehje derisa të sjellim të gjitha vlerat në një shkallë të vetme (më shpesh kjo është shkalla e murit).

Nëse hierarkitë individuale të dy subjekteve janë të lidhura pozitivisht, atëherë shenjat

duke pasur gradë të ulëta në njërën prej tyre do të ketë gradë të ulëta në tjetrën, dhe anasjelltas.

Për shembull, nëse faktori E (dominimi) i një subjekti ka gradën më të ulët, atëherë

një subjekt tjetër testues, ai duhet të ketë një gradë të ulët nëse një subjekt testues ka faktorin C

(stabiliteti emocional) ka gradën më të lartë, atëherë duhet të ketë edhe subjekti tjetër

ky faktor ka një rang të lartë etj.

Në rastin e tretë (dy profile grupesh), renditen vlerat mesatare të grupit,

të marra në 2 grupe lëndësh sipas një grupi specifik, identik për të dy grupet

shenjat. Në vijim, linja e arsyetimit është e njëjtë si në dy rastet e mëparshme.

Në rastin 4 (profile individuale dhe grupore), ato renditen veçmas

vlerat individuale të lëndës dhe vlerat mesatare të grupit për të njëjtin grup

shenjat që fitohen, si rregull, duke përjashtuar këtë subjekt individual - ai

nuk merr pjesë në profilin mesatar të grupit me të cilin do të krahasohet profili i tij individual

profili. Korrelacioni i renditjes do t'ju lejojë të kontrolloni se sa i qëndrueshëm është individi dhe

profilet e grupit.

Në të katër rastet, përcaktohet rëndësia e koeficientit të korrelacionit që rezulton

nga numri i vlerave të renditura N. Në rastin e parë, kjo sasi do të përkojë me

madhësia e mostrës n. Në rastin e dytë, numri i vëzhgimeve do të jetë numri i veçorive,

duke përbërë hierarkinë. Në rastin e tretë dhe të katërt, N është edhe numri i krahasuar

karakteristikat, dhe jo numri i lëndëve në grupe. Shpjegimet e hollësishme janë dhënë në shembuj. Nëse

vlera absolute e rs arrin ose tejkalon një vlerë kritike, korrelacion

të besueshme.

Hipotezat.

Ka dy hipoteza të mundshme. E para vlen për rastin 1, e dyta për tre të tjerët

Versioni i parë i hipotezave

H0: Korrelacioni midis variablave A dhe B nuk është i ndryshëm nga zero.

H2: Korrelacioni midis variablave A dhe B është dukshëm i ndryshëm nga zero.

Versioni i dytë i hipotezave

H0: Lidhja midis hierarkive A dhe B nuk është e ndryshme nga zero.

H2: Lidhja midis hierarkive A dhe B është dukshëm e ndryshme nga zero.

Kufizimet e koeficientit të korrelacionit të rangut

1. Për çdo variabël duhet të paraqiten të paktën 5 vëzhgime. E sipërme

kufiri i kampionimit përcaktohet nga tabelat e disponueshme të vlerave kritike .

2. Koeficienti i korrelacionit të rangut të Spearman-it rs për një numër të madh identike

renditet për një ose të dy variablat e krahasuar jep vlera të përafërta. Në mënyrë ideale

të dy seritë e ndërlidhura duhet të përfaqësojnë dy sekuenca divergjente

vlerat. Nëse ky kusht nuk plotësohet, duhet të bëhet një ndryshim

të njëjtat gradë.

Koeficienti i korrelacionit të rangut të Spearman llogaritet duke përdorur formulën:

Nëse të dyja seritë e gradave të krahasuara përmbajnë grupe të të njëjtave rang,

para llogaritjes së koeficientit të korrelacionit të renditjes, është e nevojshme të bëhen korrigjime për të njëjtën

Renditja e Ta dhe TV:

Ta = Σ (a3 – a)/12,

Tv = Σ (v3 – v)/12,

Ku A - vëllimi i çdo grupi të gradave identike në serinë e renditjes A, në – vëllimi i secilit

grupe të gradave identike në serinë e rangut B.

Për të llogaritur vlerën empirike të rs, përdorni formulën:

38. Koeficienti i korrelacionit pikë-biserial.

Për korrelacionin në përgjithësi, shihni pyetjen nr. 36 Me. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Le të matet ndryshorja X në një shkallë të fortë dhe ndryshorja Y në një shkallë dikotomike. Koeficienti i korrelacionit biserial i pikës rpb llogaritet duke përdorur formulën:

Këtu x 1 është vlera mesatare mbi X objekte me një vlerë "një" mbi Y;

x 0 – vlera mesatare mbi X objekte me vlerë “zero” mbi Y;

s x - devijimi standard i të gjitha vlerave përgjatë X;

n 1 – numri i objekteve “një” në Y, n 0 – numri i objekteve “zero” në Y;

n = n 1 + n 0 – madhësia e mostrës.

Koeficienti i korrelacionit biserial i pikës mund të llogaritet gjithashtu duke përdorur shprehje të tjera ekuivalente:

Këtu x– vlera mesatare e përgjithshme për variablin X.

Koeficienti i korrelacionit biserial i pikës rpb varion nga –1 në +1. Vlera e tij është zero nëse ndryshoret me një Y kanë një mesatare Y, e barabartë me mesataren e variablave me zero mbi Y.

Ekzaminimi hipotezat e rëndësisë pikë koeficienti i korrelacionit biserial është për të kontrolluar hipoteza zeroh 0 për barazinë e koeficientit të korrelacionit të përgjithshëm në zero: ρ = 0, i cili kryhet duke përdorur testin t Studentit. Rëndësia empirike

krahasuar me vlerat kritike t a (df) për numrin e shkallëve të lirisë df = n– 2

Nëse kushti | t| ≤ tα(df), hipoteza zero ρ = 0 nuk hidhet poshtë. Koeficienti i korrelacionit biserial i pikës ndryshon ndjeshëm nga zero nëse vlera empirike | t| bie në rajonin kritik, domethënë nëse gjendja | t| > tα(n– 2). Besueshmëria e marrëdhënies llogaritet duke përdorur koeficientin e korrelacionit biserial pikë rpb, mund të përcaktohet edhe duke përdorur kriterin χ 2 për numrin e shkallëve të lirisë df= 2.

Korrelacioni biserial i pikës

Modifikimi i mëvonshëm i koeficientit të korrelacionit të produktit të momenteve u pasqyrua në pikën biseriale r. Kjo statistikë. tregon marrëdhënien midis dy variablave, njëra prej të cilave supozohet se është e vazhdueshme dhe normalisht e shpërndarë, dhe tjetra është diskrete në kuptimin e ngushtë të fjalës. Koeficienti i korrelacionit biserial i pikës shënohet me r pbis Që në r pbis dikotomia pasqyron natyrën e vërtetë të ndryshores diskrete, dhe jo artificiale, si në rastin r bis, shenja e tij përcaktohet në mënyrë arbitrare. Prandaj, për të gjitha qëllimet praktike. qëllimet r pbis konsiderohet në intervalin nga 0.00 në +1.00.

Ekziston edhe rasti kur dy variabla supozohen të jenë të vazhdueshëm dhe të shpërndarë normalisht, por të dy janë të dikotomizuar artificialisht, si në rastin e korrelacionit biserial. Për të vlerësuar lidhjen ndërmjet variablave të tillë, përdoret koeficienti i korrelacionit tetrakorik r tet, e cila u edukua gjithashtu nga Pearson. bazë formula (të sakta) dhe procedura për llogaritjen r tet mjaft komplekse. Prandaj, me praktike Kjo metodë përdor përafrime r tet, të marra në bazë të procedurave dhe tabelave të shkurtuara.

/on-line/dictionary/dictionary.php?term=511

KOEFICIENTI BISERIAL I PIKËSështë koeficienti i korrelacionit midis dy variablave, njëra e matur në një shkallë dikotomike dhe tjetra në një shkallë intervali. Përdoret në testimin klasik dhe modern si një tregues i cilësisë së një detyre testimi - besueshmëria dhe konsistenca me rezultatin e përgjithshëm të testit.

Për të korreluar variablat e matur në shkallë dikotomike dhe intervale përdorni koeficienti i korrelacionit pikë-biserial.
Koeficienti i korrelacionit pikë-biserial është një metodë e analizës së korrelacionit të marrëdhënies së variablave, njëra prej të cilave matet në një shkallë emrash dhe merr vetëm 2 vlera (për shembull, burra / gra, përgjigje e saktë / përgjigje e rreme, veçori i pranishëm/jo i pranishëm), dhe i dyti në një shkallë të raporteve ose shkallës së intervalit. Formula për llogaritjen e koeficientit të korrelacionit pikë-biserial:

Ku:
m1 dhe m0 janë vlerat mesatare të X me një vlerë 1 ose 0 në Y.
σx - devijimi standard i të gjitha vlerave me X
n1,n0 - numri i vlerave X nga 1 ose 0 në Y.
n – numri total i çifteve të vlerave

Më shpesh, ky lloj koeficienti korrelacioni përdoret për të llogaritur marrëdhënien midis artikujve të testit dhe shkallës totale. Ky është një lloj kontrolli i vlefshmërisë.

39. Koeficienti i korrelacionit rang-biserial.

Për korrelacionin në përgjithësi, shihni pyetjen nr. 36 Me. 56 (64) 063.JPG

harchenko-korranaliz.pdf f. 28

Rank koeficienti i korrelacionit biserial, i përdorur në rastet kur një nga variablat ( X) paraqitet në një shkallë rendore, dhe tjetra ( Y) – dikotomike, e llogaritur me formulë

Këtu është renditja mesatare e objekteve që kanë një in Y; – renditja mesatare e objekteve me zero deri Y, n- madhësia e mostrës.

Ekzaminimi hipotezat e rëndësisë Koeficienti i korrelacionit rang-biserial kryhet në mënyrë të ngjashme me koeficientin e korrelacionit biserial të pikës duke përdorur testin e Studentit me zëvendësim në formula rpb në rrb.

Në rastet kur një variabël matet në një shkallë dikotomike (ndryshore X), dhe tjetra në shkallën e rangut (variabli Y), përdoret koeficienti i korrelacionit rang-biserial. Kujtojmë se ndryshorja X, i matur në një shkallë dikotomike, merr vetëm dy vlera (kode) 0 dhe 1. Theksojmë veçanërisht: përkundër faktit se ky koeficient varion në intervalin nga –1 në +1, shenja e tij nuk ka rëndësi për interpretimin e rezultatet. Ky është një tjetër përjashtim nga rregulli i përgjithshëm.

Ky koeficient llogaritet duke përdorur formulën:

ku ` X 1– renditja mesatare për ato elemente të ndryshores Y, që korrespondon me kodin (shenjën) 1 në variabël X;

`X 0 – renditja mesatare për ato elemente të ndryshores Y, që i përgjigjet kodit (shenjës) 0 në variabël X\

N - numri total i elementeve në variabël X.

Për të aplikuar koeficientin e korrelacionit rang-biserial, duhet të plotësohen kushtet e mëposhtme:

1. Variablat që krahasohen duhet të maten në shkallë të ndryshme: një X - në një shkallë dikotomike; tjera Y- në një shkallë renditjeje.

2. Numri i karakteristikave të ndryshme në variablat e krahasuar X Dhe Y duhet të jetë e njëjtë.

3. Për të vlerësuar nivelin e besueshmërisë së koeficientit të korrelacionit rang-biserial, duhet të përdorni formulën (11.9) dhe tabelën e vlerave kritike për testin Studenti k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Rastet kur një nga variablat përfaqësohet në shkallë dikotomike, dhe tjetra në gradë (rendore), kërkojnë aplikim koeficienti i korrelacionit rang-biserial:

rpb=2 / n * (m1 - m0)

Ku:
n – numri i objekteve matëse
m1 dhe m0 - renditja mesatare e objekteve me 1 ose 0 në variablin e dytë.
Ky koeficient përdoret gjithashtu kur kontrollohet vlefshmëria e testeve.

40. Koeficienti linear i korrelacionit.

Për korrelacionin në përgjithësi (dhe korrelacionin linear në veçanti), shihni pyetjen nr. 36 Me. 56 (64) 063.JPG

KOEFICIENTI I Z. PEARSON

r-Pearson (Pearson r) përdoret për të studiuar marrëdhënien midis dy metrikavevariabla të ndryshëm të matur në të njëjtin kampion. Ka shumë situata në të cilat përdorimi i tij është i përshtatshëm. A ndikon inteligjenca në performancën akademike në vitet e larta të universitetit? A lidhet madhësia e pagës së një punonjësi me mirëdashjen e tij ndaj kolegëve? A ndikon gjendja shpirtërore e një studenti në suksesin e zgjidhjes së një problemi kompleks aritmetik? Për t'iu përgjigjur pyetjeve të tilla, studiuesi duhet të matë dy tregues me interes për secilin anëtar të kampionit. Të dhënat për të studiuar marrëdhënien më pas paraqiten në tabelë, si në shembullin e mëposhtëm.

SHEMBULL 6.1

Tabela tregon një shembull të të dhënave fillestare për matjen e dy treguesve të inteligjencës (verbale dhe joverbale) për 20 nxënës të klasës së 8-të.

Marrëdhënia midis këtyre variablave mund të përshkruhet duke përdorur një skicë shpërhapëse (shih Figurën 6.3). Diagrami tregon se ka një lidhje midis treguesve të matur: sa më e madhe të jetë vlera e inteligjencës verbale, aq më e madhe (kryesisht) është vlera e inteligjencës joverbale.

Para se të japim formulën për koeficientin e korrelacionit, le të përpiqemi të gjurmojmë logjikën e shfaqjes së tij duke përdorur të dhënat nga shembulli 6.1. Pozicioni i secilës /-pikë (subjekt me numër /) në diagramin e shpërndarjes në lidhje me pikat e tjera (Fig. 6.3) mund të specifikohet nga vlerat dhe shenjat e devijimeve të vlerave të ndryshueshme përkatëse nga vlerat mesatare të tyre. : (xj - MJ Dhe (mendje në ). Nëse shenjat e këtyre devijimeve përkojnë, atëherë kjo tregon një marrëdhënie pozitive (vlera më të mëdha për X vlerat e mëdha korrespondojnë me në ose vlera më të ulëta X vlerat më të vogla korrespondojnë me y).

Për lëndën nr.1, devijimi nga mesatarja X dhe nga në pozitive, dhe për lëndën nr. 3 të dyja devijimet janë negative. Rrjedhimisht, të dhënat nga të dyja tregojnë një lidhje pozitive midis tipareve të studiuara. Përkundrazi, nëse shenjat e devijimeve nga mesatarja X dhe nga në ndryshojnë, kjo do të tregojë një marrëdhënie negative midis karakteristikave. Kështu, për lëndën nr.4, devijimi nga mesatarja Xështë negative, nga y - pozitive, dhe për lëndën nr.9 - anasjelltas.

Kështu, nëse produkti i devijimeve (x,- M X ) X (mendje në ) pozitive, atëherë të dhënat e /-subjektit tregojnë një marrëdhënie të drejtpërdrejtë (pozitive), dhe nëse negative, atëherë një marrëdhënie të kundërt (negative). Prandaj, nëse Xwy y në përgjithësi janë të lidhura në proporcion të drejtë, atëherë shumica e produkteve të devijimeve do të jenë pozitive, dhe nëse janë të lidhura anasjelltas, atëherë shumica e produkteve do të jenë negative. Prandaj, një tregues i përgjithshëm për forcën dhe drejtimin e marrëdhënies mund të jetë shuma e të gjitha produkteve të devijimeve për një mostër të caktuar:

Me një marrëdhënie proporcionale të drejtpërdrejtë midis variablave, kjo vlerë është e madhe dhe pozitive - për shumicën e subjekteve, devijimet përkojnë në shenjë (vlerat e mëdha të një ndryshoreje korrespondojnë me vlerat e mëdha të një ndryshoreje tjetër dhe anasjelltas). Nëse X Dhe në keni reagime, atëherë për shumicën e subjekteve, vlerat më të mëdha të një ndryshoreje do të korrespondojnë me vlerat më të vogla të një ndryshoreje tjetër, d.m.th., shenjat e produkteve do të jenë negative, dhe shuma e produkteve në tërësi do të jetë gjithashtu e madhe në vlerë absolute, por në shenjë negative. Nëse nuk ka lidhje sistematike midis variablave, atëherë termat pozitivë (produktet e devijimeve) do të balancohen me terma negativë dhe shuma e të gjitha produkteve të devijimeve do të jetë afër zeros.

Për të siguruar që shuma e produkteve të mos varet nga madhësia e kampionit, mjafton që të mesatarizohet. Por ne jemi të interesuar për masën e ndërlidhjes jo si një parametër i përgjithshëm, por si një vlerësim i llogaritur i tij - statistika. Prandaj, sa i përket formulës së dispersionit, në këtë rast do të bëjmë të njëjtën gjë, do ta ndajmë shumën e produkteve të devijimeve jo me N, dhe në TV - 1. Rezultati është një masë e lidhjes, e përdorur gjerësisht në fizikë dhe shkenca teknike, e cila quhet kovarianca (Covahance):

NË

Në psikologji, ndryshe nga fizika, shumica e variablave maten në shkallë arbitrare, pasi psikologët nuk janë të interesuar për vlerën absolute të një shenje, por për pozicionin relativ të subjekteve në një grup. Përveç kësaj, kovarianca është shumë e ndjeshme ndaj shkallës së shkallës (variancës) në të cilën maten tiparet. Për ta bërë masën e lidhjes të pavarur nga njësitë matëse të të dy karakteristikave, mjafton të ndajmë kovariancën në devijimet standarde përkatëse. Kështu u përftua per-Mushka e koeficientit të korrelacionit K. Pearson:

ose, pas zëvendësimit të shprehjeve për o x dhe

Nëse vlerat e të dy variablave janë konvertuar në vlera r duke përdorur formulën

atëherë formula për koeficientin e korrelacionit r-Pearson duket më e thjeshtë (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

KORELACIONI LINEAR- marrëdhënia lineare statistikore e natyrës jo shkakësore ndërmjet dy variablave sasiorë X Dhe në. Matur duke përdorur "koeficientin K.L." Pearson, i cili është rezultat i pjesëtimit të kovariancës me devijimet standarde të të dy variablave:

Ku s xy- kovarianca ndërmjet variablave X Dhe në;

s x , s y- devijimet standarde për variablat X Dhe në;

x i , y i- vlerat e ndryshueshme X Dhe në për objektin me numër i;

x, y- mesataret aritmetike për variablat X Dhe në.

Koeficienti Pearson r mund të marrë vlera nga intervali [-1; +1]. Kuptimi r = 0 do të thotë se nuk ka lidhje lineare midis variablave X Dhe në(por nuk përjashton një marrëdhënie statistikore jolineare). Vlerat e koeficientit pozitiv ( r> 0) tregoni një lidhje direkte lineare; sa më afër të jetë vlera e tij me +1, aq më e fortë është lidhja linja statistikore. Vlerat e koeficientit negativ ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения r= ±1 nënkupton praninë e një lidhjeje të plotë lineare, të drejtpërdrejtë ose të kundërt. Në rastin e lidhjes së plotë, të gjitha pikat me koordinata ( x i , y i) shtrihuni në vijë të drejtë y = a + bx.

"Koeficienti K.L." Pearson përdoret gjithashtu për të matur fuqinë e lidhjes në një model regresioni linear çift.

41. Matrica e korrelacionit dhe grafiku i korrelacionit.

Për korrelacionin në përgjithësi, shihni pyetjen nr. 36 Me. 56 (64) 063.JPG

Matrica e korrelacionit. Shpesh, analiza e korrelacionit përfshin studimin e lidhjeve midis jo dy, por shumë variablave të matur në një shkallë sasiore në një kampion. Në këtë rast, korrelacionet llogariten për çdo çift të këtij grupi variablash. Llogaritjet zakonisht kryhen në një kompjuter, dhe rezultati është një matricë korrelacioni.

Matrica e korrelacionit(Korrelacioni Matricë) është rezultat i llogaritjes së korrelacioneve të një lloji për çdo çift nga grupi R variabla të matur në një shkallë sasiore në një kampion.

SHEMBULL

Supozoni se po studiojmë marrëdhëniet midis 5 variablave (vl, v2,..., v5; P= 5), e matur në një kampion prej N=30 Njerëzore. Më poshtë është një tabelë e të dhënave burimore dhe një matricë korrelacioni.

DHE
të dhëna të ngjashme:

Matrica e korrelacionit:

Është e lehtë të vërehet se matrica e korrelacionit është katror, simetrike në lidhje me diagonalen kryesore (takkak,y = /) y), me njësi në diagonalen kryesore (pasi G Dhe = Gu = 1).

Matrica e korrelacionit është katror: numri i rreshtave dhe kolonave është i barabartë me numrin e variablave. Ajo simetrike në lidhje me diagonalen kryesore, që nga korrelacioni X Me në e barabartë me korrelacionin në Me X. Njësitë janë të vendosura në diagonalen e saj kryesore, pasi korrelacioni i veçorisë me vetveten është i barabartë me një. Për rrjedhojë, jo të gjithë elementët e matricës së korrelacionit i nënshtrohen analizës, por ato që ndodhen sipër ose poshtë diagonales kryesore.

Numri i koeficientëve të korrelacionit, Karakteristikat që do të analizohen gjatë studimit të marrëdhënieve përcaktohen nga formula: P(P- 1)/2. Në shembullin e mësipërm, numri i koeficientëve të tillë të korrelacionit është 5(5 - 1)/2 = 10.

Detyra kryesore e analizimit të matricës së korrelacionit është identifikimi i strukturës së marrëdhënieve ndërmjet shumë veçorive. Në këtë rast, analiza vizuale është e mundur galaktikat e korrelacionit- imazh grafik strukturat statistikishtlidhje kuptimplote, nëse nuk ka shumë lidhje të tilla (deri në 10-15). Një mënyrë tjetër është përdorimi i metodave me shumë variacione: regresioni i shumëfishtë, analiza e faktorëve ose grupimeve (shih seksionin "Metodat e shumëndryshuara..."). Duke përdorur analizën e faktorëve ose grupimeve, është e mundur të identifikohen grupime të variablave që janë më të lidhur me njëri-tjetrin sesa me variabla të tjerë. Një kombinim i këtyre metodave është gjithashtu shumë efektiv, për shembull, nëse ka shumë shenja dhe ato nuk janë homogjene.

Krahasimi i korrelacioneve - një detyrë shtesë e analizës së matricës së korrelacionit, e cila ka dy opsione. Nëse është e nevojshme të krahasohen korrelacionet në një nga rreshtat e matricës së korrelacionit (për një nga variablat), përdoret metoda e krahasimit për mostrat e varura (f. 148-149). Kur krahasohen korrelacionet me të njëjtin emër të llogaritura për mostra të ndryshme, përdoret metoda e krahasimit për mostrat e pavarura (f. 147-148).

Metodat e krahasimit korrelacionet në diagonale matrica e korrelacionit (për të vlerësuar stacionaritetin e një procesi të rastësishëm) dhe krahasimi disa matricat e korrelacionit të marra për mostra të ndryshme (për homogjenitetin e tyre) kërkojnë punë intensive dhe përtej qëllimit të këtij libri. Ju mund të njiheni me këto metoda nga libri i G.V. Sukhodolsky 1.

Problemi i rëndësisë statistikore të korrelacioneve. Problemi është se procedura për testimin e hipotezave statistikore supozon nje-të shumëfishta testi i kryer në një mostër. Nëse aplikohet e njëjta metodë në mënyrë të përsëritur, edhe nëse në lidhje me variabla të ndryshëm, probabiliteti për të marrë një rezultat thjesht rastësisht rritet. Në përgjithësi, nëse përsërisim të njëjtën metodë të testimit të hipotezës një herë në lidhje me variabla ose mostra të ndryshme, atëherë me vlerën e vendosur a jemi të garantuar të marrim konfirmimin e hipotezës në ahk numri i rasteve.

Supozoni se një matricë korrelacioni është analizuar për 15 variabla, domethënë janë llogaritur 15(15-1)/2 = 105 koeficientë korrelacioni. Për të testuar hipotezat vendoset niveli a = 0.05 Duke e kontrolluar hipotezën 105 herë, do të marrim konfirmimin e saj pesë herë (!), pavarësisht nëse lidhja ekziston. Duke e ditur këtë dhe duke pasur, të themi, 15 koeficientë korrelacioni “statistikisht domethënës”, a mund të themi se cilët prej tyre janë marrë rastësisht dhe cili prej tyre pasqyron një marrëdhënie reale?

Në mënyrë rigoroze, për të marrë një vendim statistikor është e nevojshme të zvogëlohet niveli a me aq herë sa numri i hipotezave që testohen. Por kjo vështirë se këshillohet, pasi probabiliteti për të injoruar një lidhje vërtet ekzistuese (duke bërë një gabim të tipit II) rritet në një mënyrë të paparashikueshme.

Vetëm matrica e korrelacionit nuk është një bazë e mjaftueshmepër konkluzionet statistikore në lidhje me koeficientët individualë të përfshirë në tëkorrelacione!

Ekziston vetëm një mënyrë vërtet bindëse për të zgjidhur këtë problem: ndani kampionin rastësisht në dy pjesë dhe merrni parasysh vetëm ato korrelacione që janë statistikisht të rëndësishme në të dyja pjesët e kampionit. Një alternativë mund të jetë përdorimi i metodave me shumë variacione (analiza e faktorit, grupimit ose e regresionit të shumëfishtë) për të identifikuar dhe interpretuar më pas grupet e variablave statistikisht të lidhura dukshëm.

Problem me vlerat që mungojnë. Nëse mungojnë vlerat në të dhëna, atëherë dy opsione janë të mundshme për llogaritjen e matricës së korrelacionit: a) heqja rresht pas rreshti i vlerave (Përjashtonirastetnë mënyrë të listuar); b) fshirjen në çift të vlerave (Përjashtonirastetnë çift). Në fshirje rresht pas rreshti vrojtimet me vlera që mungojnë, fshihet i gjithë rreshti për një objekt (subjekt) që ka të paktën një vlerë që mungon për njërën nga variablat. Kjo metodë çon në një matricë korrelacioni "korrekt" në kuptimin që të gjithë koeficientët llogariten nga i njëjti grup objektesh. Sidoqoftë, nëse vlerat që mungojnë shpërndahen rastësisht në variabla, atëherë kjo metodë mund të çojë në faktin se nuk ka mbetur asnjë objekt i vetëm në grupin e të dhënave në shqyrtim (do të ketë të paktën një vlerë që mungon në çdo rresht) . Për të shmangur këtë situatë, përdorni një metodë tjetër të quajtur heqja në çift. Kjo metodë merr në konsideratë vetëm boshllëqet në çdo çift kolonë-ndryshore të zgjedhur dhe injoron boshllëqet në variablat e tjerë. Korrelacioni për një palë variablash llogaritet për ato objekte ku nuk ka boshllëqe. Në shumë situata, veçanërisht kur numri i boshllëqeve është relativisht i vogël, le të themi 10%, dhe boshllëqet shpërndahen krejt rastësisht, kjo metodë nuk çon në gabime serioze. Megjithatë, ndonjëherë nuk është kështu. Për shembull, një paragjykim (zhvendosje) sistematike në vlerësim mund të "fsheh" një rregullim sistematik të lëshimeve, gjë që është arsyeja e ndryshimit në koeficientët e korrelacionit të ndërtuar për nëngrupe të ndryshme (për shembull, për nëngrupe të ndryshme objektesh). Një problem tjetër që lidhet me matricën e korrelacionit të llogaritur me në çift heqja e boshllëqeve ndodh kur përdoret kjo matricë në lloje të tjera analizash (për shembull, në analizën e regresionit të shumëfishtë ose të faktorëve). Ata supozojnë se matrica e korrelacionit "korrekt" përdoret me një nivel të caktuar konsistence dhe "përputhshmërie" të koeficientëve të ndryshëm. Përdorimi i një matrice me vlerësime "të këqija" (të njëanshme) çon në faktin se programi ose nuk është në gjendje të analizojë një matricë të tillë, ose rezultatet do të jenë të gabuara. Prandaj, nëse përdoret metoda në çift për përjashtimin e të dhënave që mungojnë, është e nevojshme të kontrollohet nëse ka modele sistematike në shpërndarjen e të dhënave që mungojnë.

Nëse fshirja në çift e të dhënave që mungojnë nuk çon në ndonjë zhvendosje sistematike në mesataret dhe variancat (devijimet standarde), atëherë këto statistika do të jenë të ngjashme me ato të llogaritura duke përdorur metodën rresht pas rreshti të fshirjes së të dhënave që mungojnë. Nëse vërehet një ndryshim domethënës, atëherë ka arsye për të supozuar se ka një ndryshim në vlerësimet. Për shembull, nëse mesatarja (ose devijimi standard) i vlerave të një ndryshoreje A, e cila është përdorur në llogaritjen e korrelacionit të saj me variablin NË, shumë më pak se mesatarja (ose devijimi standard) i të njëjtave vlera të ndryshores A, të cilat janë përdorur në llogaritjen e korrelacionit të tij me variablin C, atëherë ka të gjitha arsyet për të pritur që këto dy korrelacione (A-Bne) bazuar në nëngrupe të ndryshme të dhënash. Do të ketë një paragjykim në korrelacionet e shkaktuara nga vendosja jo e rastësishme e boshllëqeve në vlerat e variablave.

Analiza e galaktikave të korrelacionit. Pas zgjidhjes së problemit të rëndësisë statistikore të elementeve të matricës së korrelacionit, korrelacionet statistikisht domethënëse mund të paraqiten grafikisht në formën e një galaktike ose galaktike korrelacioni. galaktika e korrelacionit - Kjo është një figurë e përbërë nga kulme dhe linja që i lidhin ato. Kulmet korrespondojnë me karakteristikat dhe zakonisht përcaktohen me numra - numra të ndryshueshëm. Linjat korrespondojnë me lidhje statistikisht domethënëse dhe shprehin grafikisht shenjën dhe ndonjëherë edhe nivelin j të rëndësisë së lidhjes.

Galaktika e korrelacionit mund të reflektojë Të gjitha lidhjet statistikisht të rëndësishme të matricës së korrelacionit (ndonjëherë të quajtura grafiku i korrelacionit ) ose vetëm pjesa e tyre e zgjedhur në mënyrë kuptimplote (për shembull, që korrespondon me një faktor sipas rezultateve të analizës së faktorëve).

SHEMBULL I NDËRTIMIT TË NJË PLEJADE KORELACIONI

Përgatitja për certifikimin shtetëror (përfundimtar) të të diplomuarve: formimi i bazës së të dhënave të Provimit të Unifikuar të Shtetit (lista e përgjithshme e pjesëmarrësve të Provimit të Unifikuar të Shtetit të të gjitha kategorive, duke treguar lëndët) - duke marrë parasysh ditët e rezervës në rastin e të njëjtave lëndë;

Plani i punës (27)

Zgjidhje

2. Aktivitetet e institucionit arsimor për përmirësimin e përmbajtjes dhe vlerësimin e cilësisë në lëndët e arsimit shkencor dhe matematikor Institucioni arsimor komunal shkolla e mesme nr. 4, Litvinovskaya, Chapaevskaya,

Korrelacioni i gradës Spearman(korrelacion i rangut). Korrelacioni i gradës së Spearman është mënyra më e thjeshtë për të përcaktuar shkallën e marrëdhënies midis faktorëve. Emri i metodës tregon se marrëdhënia përcaktohet midis gradave, domethënë serive të vlerave sasiore të marra, të renditura në rend zbritës ose në rritje. Duhet të kihet parasysh se, së pari, korrelacioni i renditjes nuk rekomandohet nëse lidhja midis çifteve është më pak se katër dhe më shumë se njëzet; së dyti, korrelacioni i renditjes bën të mundur përcaktimin e marrëdhënies në një rast tjetër, nëse vlerat janë të natyrës gjysmë sasiore, domethënë ato nuk kanë një shprehje numerike dhe pasqyrojnë një rend të qartë të shfaqjes së këtyre vlerave; së treti, këshillohet përdorimi i korrelacionit të renditjes në rastet kur mjafton të merren të dhëna të përafërta. Një shembull i llogaritjes së koeficientit të korrelacionit të gradës për të përcaktuar pyetjen: pyetësori mat X dhe Y cilësitë personale të ngjashme të subjekteve. Duke përdorur dy pyetësorë (X dhe Y), të cilët kërkojnë përgjigje alternative "po" ose "jo", u morën rezultatet parësore - përgjigjet e 15 subjekteve (N = 10). Rezultatet janë paraqitur si shuma e përgjigjeve pozitive veçmas për pyetësorin X dhe për pyetësorin B. Këto rezultate janë përmbledhur në tabelë. 5.19.

Tabela 5.19. Tabelimi i rezultateve parësore për të llogaritur koeficientin e korrelacionit të gradës Spearman (p) *

Analiza e matricës përmbledhëse të korrelacionit. Metoda e korrelacionit të galaktikave.

Shembull. Në tabelë Figura 6.18 tregon interpretimet e njëmbëdhjetë variablave që janë testuar duke përdorur metodën Wechsler. Të dhënat janë marrë nga një kampion homogjen i moshës 18 deri në 25 vjeç (n = 800).

Para shtresimit, është e këshillueshme që të renditet matrica e korrelacionit. Për ta bërë këtë, vlerat mesatare të koeficientëve të korrelacionit të secilës variabël me të gjitha të tjerat llogariten në matricën origjinale.

Pastaj sipas tabelës. 5.20 përcaktojnë nivelet e pranueshme të shtresimit të matricës së korrelacionit me një probabilitet besimi të dhënë prej 0.95 dhe n - sasi

Tabela 6.20. Matrica e korrelacionit rritës

Variablat	1	2	3	4	do	0	7	8	0	10	11	M(rij)	Rendit
1	1	0,637	0,488	0,623	0,282	0,647	0,371	0,485	0,371	0,365	0,336	0,454	1
2		1	0,810	0,557	0,291	0,508	0,173	0,486	0,371	0,273	0,273	0,363	4
3			1	0,346	0,291	0,406	0,360	0,818	0,346	0,291	0,282	0,336	7
4				1	0,273	0,572	0,318	0,442	0,310	0,318	0,291	0,414	3
5					1	0,354	0,254	0,216	0,236	0,207	0,149	0,264	11
6						1	0,365	0,405	0,336	0,345	0,282	0,430	2
7							1	0,310	0,388	0,264	0,266	0,310	9
8								1	0,897	0,363	0,388	0,363	5
9									1	0,388	0,430	0,846	6
10										1	0,336	0,310	8
11											1	0,300	10

Emërtimet: 1 - vetëdije e përgjithshme; 2 - konceptualiteti; 3 - vëmendje; 4 - vdatnost K përgjithësim; b - memorizimi i drejtpërdrejtë (në numra) 6 - niveli i zotërimit të gjuhës amtare; 7 - shpejtësia e zotërimit të aftësive sensoromotore (kodimi i simboleve) 8 - vëzhgimi; 9 - aftësi kombinuese (për analizë dhe sintezë) 10 - aftësi për të organizuar pjesët në një tërësi kuptimplote; 11 - aftësia për sintezë heuristike; M (rij) - vlera mesatare e koeficientëve të korrelacionit të ndryshores me variablat e tjerë të vëzhgimit (në rastin tonë n = 800): r (0) - vlera e rrafshit zero "Disektimi" - vlera minimale absolute e rëndësishme e koeficienti i korrelacionit (n - 120, r (0) = 0,236; n = 40, r (0) = 0,407) | Δr | - hapi i lejueshëm i shtresimit (n = 40, | Δr | = 0,558) në - numri i lejuar i niveleve të shtresimit (n = 40, s = 1; n = 120, s = 2); r (1), r (2), ..., r (9) - vlera absolute e planit të prerjes (n = 40, r (1) = 0,965).

Për n = 800, gjejmë vlerën e gtype dhe kufijtë e gi, pas së cilës shtresojmë matricën e korrelacionit, duke theksuar galaktikat e korrelacionit brenda shtresave, ose pjesë të veçanta të matricës së korrelacionit, duke tërhequr shoqatat e galaktikave të korrelacionit për shtresat mbivendosje (Fig. 5.5).

Një analizë kuptimplotë e galaktikave që rezultojnë shkon përtej statistikave matematikore. Duhet të theksohet se ekzistojnë dy tregues formalë që ndihmojnë në interpretimin kuptimplotë të Plejadave. Një tregues domethënës është shkalla e një kulmi, domethënë numri i skajeve ngjitur me një kulm. Variabla me numrin më të madh të skajeve është "bërthama" e galaktikës dhe mund të konsiderohet si një tregues i variablave të mbetur të kësaj galaktike. Një tregues tjetër i rëndësishëm është dendësia e komunikimit. Një variabël mund të ketë më pak lidhje në një galaktikë, por më të afërt, dhe më shumë lidhje në një galaktikë tjetër, por më pak të afërta.

Parashikimet dhe vlerësimet. Ekuacioni y = b1x + b0 quhet ekuacion i përgjithshëm i drejtëzës. Tregon se çiftet e pikave (x, y), të cilat

Oriz. 5.5. Galaktikat e korrelacionit të përftuara nga shtresimi i matricës

shtrihet në një vijë të caktuar, të lidhur në atë mënyrë që për çdo vlerë x, vlera b në çift me të mund të gjendet duke shumëzuar x me një numër të caktuar b1 dhe duke i shtuar së dyti numrin b0 këtij produkti.

Koeficienti i regresionit ju lejon të përcaktoni shkallën e ndryshimit në faktorin hetues kur faktori shkakësor ndryshon me një njësi. Vlerat absolute karakterizojnë lidhjen midis faktorëve të ndryshueshëm me vlerat e tyre absolute. Koeficienti i regresionit llogaritet duke përdorur formulën:

Hartimi dhe analiza e eksperimenteve. Dizajni dhe analiza e eksperimenteve është dega e tretë e rëndësishme e metodave statistikore të zhvilluara për të gjetur dhe testuar marrëdhëniet shkakësore midis variablave.

Për të studiuar varësitë multifaktoriale, kohët e fundit janë përdorur gjithnjë e më shumë metodat e projektimit eksperimental matematikor.

Aftësia për të ndryshuar njëkohësisht të gjithë faktorët ju lejon: a) të zvogëloni numrin e eksperimenteve;

b) të zvogëlojë gabimin eksperimental në minimum;

c) të thjeshtojë përpunimin e të dhënave të marra;

d) të sigurojë qartësi dhe lehtësi në krahasimin e rezultateve.

Çdo faktor mund të fitojë një numër të caktuar korrespondues vlerash të ndryshme, të cilat quhen nivele dhe shënohen -1, 0 dhe 1. Një grup fiks i niveleve të faktorëve përcakton kushtet e njërit prej eksperimenteve të mundshme.

Tërësia e të gjitha kombinimeve të mundshme llogaritet duke përdorur formulën:

Një eksperiment i plotë faktorial është një eksperiment në të cilin zbatohen të gjitha kombinimet e mundshme të niveleve të faktorëve. Eksperimentet e plota faktoriale mund të kenë vetinë e ortogonalitetit. Me planifikimin ortogonal, faktorët në eksperiment janë të pakorreluar koeficientët e regresionit që llogariten përfundimisht përcaktohen në mënyrë të pavarur nga njëri-tjetri.

Një avantazh i rëndësishëm i metodës së planifikimit eksperimental matematikor është shkathtësia dhe përshtatshmëria e saj në shumë fusha të kërkimit.

Le të shqyrtojmë një shembull të krahasimit të ndikimit të disa faktorëve në formimin e nivelit të stresit mendor në kontrollorët e TV me ngjyra.

Eksperimenti bazohet në një dizajn ortogonal 2 tre (tre faktorë ndryshojnë në dy nivele).

Eksperimenti u krye me një pjesë të plotë 2 + 3 me tre përsëritje.

Planifikimi ortogonal bazohet në ndërtimin e një ekuacioni regresioni. Për tre faktorë duket kështu:

Përpunimi i rezultateve në këtë shembull përfshin:

a) ndërtimi i një plani ortogonal 2 +3 tabelë për llogaritje;

b) llogaritjen e koeficientëve të regresionit;

c) kontrollimin e rëndësisë së tyre;

d) interpretimi i të dhënave të marra.

Për koeficientët e regresionit të ekuacionit të përmendur, ishte e nevojshme të vendoseshin N = 2 3 = 8 opsione në mënyrë që të mund të vlerësohej rëndësia e koeficientëve, ku numri i përsëritjeve K ishte 3.

Matrica për planifikimin e eksperimentit dukej kështu:

Ky kalkulator më poshtë llogarit koeficientin e korrelacionit të rangut të Spearman-it ndërmjet dy variablave të rastësishëm. Pjesa teorike është tradicionale poshtë kalkulatorit.

shtoni import_eksporti mode_edit fshij

Ndryshimet e variablave të rastit

	shigjeta_lartshigjeta_poshtë	shigjeta_lartshigjeta_poshtë
			mode_edit

Artikujt për faqe: 5 10 20 50 100 chevron_majtas chevron_djathtas

Ndryshimet e variablave të rastit

Të dhënat e importit Gabim në import

"Një nga karakteret e mëposhtme përdoret për të ndarë fushat e të dhënave: tab, pikëpresje (;) ose presje (,)" Shembull: -50.5;-50.5

Anulo kthimin e importit

Shifrat pas presjes dhjetore: 4

Llogaritni

Koeficienti i korrelacionit të Spearman-it

Ruaj ndajnë shtrirje

Metoda e llogaritjes së koeficientit të korrelacionit të rangut të Spearman është në të vërtetë mjaft e thjeshtë. vlerat e renditjes.

Mbetet vetëm të kuptojmë se cila është vlera e gradës dhe pse e gjithë kjo është e nevojshme.

Nëse elementet e një serie variacionale renditen në rend rritës ose zbritës, atëherë gradë i elementit do të jetë numri i tij në seri të renditura.

Për shembull, ne kemi një seri të ndryshme (17,26,5,14,21). Le t'i renditim elementet e tij në një rend zbritës (26,21,17,14,5). 26 ka një gradë 1, 21 - renditje 2 e kështu me radhë, seritë variacionale të vlerave të renditjes do të duken kështu (3,1,5,4,2).

d.m.th. kur llogaritet seritë e variacionit fillestar të koeficientit të Spearman konvertohen në seri variacionale të vlerave të renditjes dhe më pas formula e Pearson zbatohet për to.
.
Ekziston një hollësi - renditja e vlerave të përsëritura merret si mesatare e gradave. Kjo do të thotë, për një seri (17, 15, 14, 15) seritë e renditjes do të duken si (1, 2.5, 4, 2.5), pasi elementi i parë është 15 ka një gradë 2, dhe i dyti - renditja 3, dhe.

Nëse nuk i keni vlerat përsëritëse, domethënë të gjitha vlerat e serive të renditjes - numrat midis 1 dhe n, formula e Pearson mund të thjeshtohet në

Nga rruga, kjo formulë shpesh jepet si formulë për llogaritjen e koeficientit të Spearman.

Cili është thelbi i kalimit nga vetë vlerat në vlerën e tyre të gradës?
Kur hulumtoni korrelacionin e vlerave të renditjes, mund të zbuloni se sa mirë përshkruhet varësia e dy variablave nga një funksion monoton.

Shenja e koeficientit tregon drejtimin e marrëdhënies ndërmjet variablave. Nëse shenja është pozitive, vlerat e Y kanë tendencë të rriten me rritjen e X. Nëse shenja është negative, vlerat e Y kanë një tendencë të ulen me rritjen e X. Nëse koeficienti është 0 atje atëherë nuk ka tendencë. Nëse koeficienti është i barabartë me 1 ose -1, marrëdhënia midis X dhe Y ka një pamje të funksionit monoton, d.m.th. me rritjen e X rritet edhe Y dhe anasjelltas.

Kjo do të thotë, ndryshe nga koeficienti i korrelacionit të Pearson-it, i cili mund të zbulojë vetëm marrëdhënien lineare të një ndryshoreje nga tjetra, koeficienti i korrelacionit të Spearman-it mund të zbulojë varësinë monotonike, ku marrëdhënia direkte lineare nuk mund të zbulohet.

Ja një shembull.
Më lejoni të shpjegoj me një shembull. Le të supozojmë, ne shqyrtojmë funksionin y=10/x.
Kemi matjet e mëposhtme të X dhe Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Për këtë të dhënë, koeficienti i korrelacionit Pearson është i barabartë me -0.4686, d.m.th. marrëdhënia është e dobët ose mungon. Dhe koeficienti i korrelacionit të Spearman është rreptësisht i barabartë me -1, sikur t'i lë të kuptohet studiuesit se Y ka një varësi monotonike të fortë negative nga X.

Teori e shkurtër

Korrelacioni i renditjes është një metodë e analizës së korrelacionit që pasqyron marrëdhëniet e variablave të renditura me vlerë në rritje.

Renditjet janë numrat serialë të njësive agregate në një seri të renditur. Nëse e renditim një popullsi sipas dy karakteristikave, marrëdhënia ndërmjet të cilave po studiohet, atëherë rastësia e plotë e gradave nënkupton lidhjen më të ngushtë të mundshme të drejtpërdrejtë, dhe e kundërta e plotë e gradave nënkupton reagimin më të afërt të mundshëm. Është e nevojshme të renditen të dyja karakteristikat në të njëjtën mënyrë: ose nga vlerat më të vogla të karakteristikës në ato më të mëdha, ose anasjelltas.

Për qëllime praktike, përdorimi i korrelacionit të rangut është shumë i dobishëm. Për shembull, nëse vendoset një korrelacion i rangut të lartë midis dy karakteristikave cilësore të produkteve, atëherë mjafton të kontrollohen produktet vetëm nga një nga karakteristikat, gjë që ul koston dhe përshpejton kontrollin.

Koeficienti i korrelacionit të rangut, i propozuar nga K. Spearman, i referohet një mase joparametrike të marrëdhënies midis variablave të matur në një shkallë të renditjes. Gjatë llogaritjes së këtij koeficienti, nuk kërkohen supozime për natyrën e shpërndarjes së karakteristikave në popullatë. Ky koeficient përcakton shkallën e afërsisë së lidhjes ndërmjet karakteristikave rendore, të cilat në këtë rast paraqesin radhët e sasive të krahasuara.

Vlera e koeficientit të korrelacionit Spearman qëndron në intervalin +1 dhe -1. Mund të jetë pozitiv ose negativ, duke karakterizuar drejtimin e marrëdhënies midis dy karakteristikave të matura në një shkallë të renditjes.

Koeficienti i korrelacionit të rangut të Spearman llogaritet duke përdorur formulën:

Dallimi midis renditjeve në dy variabla

– numri i çifteve të përputhura

Hapi i parë në llogaritjen e koeficientit të korrelacionit të renditjes është renditja e serisë së variablave. Procedura e renditjes fillon duke renditur variablat në rend rritës të vlerave të tyre. Vlerave të ndryshme u caktohen renditje, të shënuara me numra natyrorë. Nëse ka disa variabla me vlerë të barabartë, atyre u caktohet një renditje mesatare.

Avantazhi i koeficientit të korrelacionit të gradës Spearman është se është e mundur të renditet sipas karakteristikave që nuk mund të shprehen numerikisht: është e mundur të renditen kandidatët për një pozicion të caktuar sipas nivelit profesional, nga aftësia për të udhëhequr një ekip, nga sharmi personal, etj. Me vlerësimet e ekspertëve është e mundur të renditen vlerësimet e ekspertëve të ndryshëm dhe të gjenden korrelacionet e tyre me njëri-tjetrin, në mënyrë që më pas të përjashtohen nga shqyrtimi vlerësimet e ekspertëve që janë të lidhura dobët me vlerësimet e ekspertëve të tjerë. Koeficienti i korrelacionit të rangut të Spearman përdoret për të vlerësuar stabilitetin e trendit. Disavantazhi i koeficientit të korrelacionit të renditjes është se të njëjtat dallime në renditje mund të korrespondojnë me ndryshime krejtësisht të ndryshme në vlerat e karakteristikave (në rastin e karakteristikave sasiore). Prandaj, për këtë të fundit, korrelacioni i gradave duhet të konsiderohet një masë e përafërt e afërsisë së lidhjes, e cila është më pak informuese se koeficienti i korrelacionit të vlerave numerike të karakteristikave.

Shembull i zgjidhjes së problemit

Gjendja problematike

Një anketë me 10 studentë të përzgjedhur rastësisht që jetojnë në një konvikt universitar zbulon lidhjen midis rezultatit mesatar nga sesioni i mëparshëm dhe numrit të orëve në javë të shpenzuara nga studenti për vetë-studim.

Përcaktoni forcën e marrëdhënies duke përdorur koeficientin e korrelacionit të gradës Spearman.

Nëse keni vështirësi në zgjidhjen e problemeve, faqja ofron ndihmë online për studentët në statistikat me testet ose provimet në shtëpi.

Zgjidhja e problemit

Le të llogarisim koeficientin e korrelacionit të renditjes.

№

Rangimi

Krahasimi i renditjes

Diferenca në rang

4.7

3.1

-2

4.4

3.6

-2

3.8

3.7

-3

3.7

3.8

4.2

3.9

-3

4.3

3.6

4.2

4.3

3.1

4.4

3.9

4.7

Shuma

Koeficienti i korrelacionit të gradës së Spearman:

Duke zëvendësuar vlerat numerike, marrim:

Përfundimi i problemit

Marrëdhënia midis notës mesatare të sesionit të mëparshëm dhe numrit të orëve në javë të shpenzuara nga studenti në studime të pavarura është mesatarisht e fortë.

Nëse po ju mbaron koha për të përfunduar një test, gjithmonë mund të porosisni një zgjidhje urgjente për problemet e statistikave në faqen e internetit.

Mesatare kostoja e zgjidhjes së një testi është 700 - 1200 rubla (por jo më pak se 300 rubla për të gjithë porosinë). Çmimi ndikohet shumë nga urgjenca e vendimit (nga një ditë në disa orë). Kostoja e ndihmës në internet për një provim/test është nga 1000 rubla. për zgjidhjen e biletës.

Ju mund t'i bëni të gjitha pyetjet në lidhje me koston direkt në chat, pasi keni dërguar më parë kushtet e detyrës dhe ju keni informuar për kornizën kohore të kërkuar për zgjidhjen. Koha e përgjigjes është disa minuta.

Shembuj të problemeve të lidhura

raporti Fechner
Jepet një teori e shkurtër dhe merret parasysh një shembull i zgjidhjes së problemit të llogaritjes së koeficientit të korrelacionit të shenjës Fechner.

Koeficientët e ndërsjellë të kontingjentit të Chuprov dhe Pearson
Faqja përmban informacione mbi metodat për studimin e marrëdhënieve midis karakteristikave cilësore duke përdorur koeficientët Chuprov dhe Pearson të kontingjentit të ndërsjellë.

Koeficienti i korrelacionit të rangut të Spearman është një metodë joparametrike që përdoret për të studiuar statistikisht marrëdhëniet midis fenomeneve. Në këtë rast, përcaktohet shkalla aktuale e paralelizmit midis dy serive sasiore të karakteristikave të studiuara dhe një vlerësim i afërsisë së lidhjes së vendosur jepet duke përdorur një koeficient të shprehur në mënyrë sasiore.

1. Historia e zhvillimit të koeficientit të korrelacionit të rangut

Ky kriter u zhvillua dhe u propozua për analizë korrelacioni në 1904 Charles Edward Spearman, psikolog anglez, profesor në Universitetet e Londrës dhe Chesterfield.

2. Për çfarë përdoret koeficienti Spearman?

Koeficienti i korrelacionit të rangut të Spearman përdoret për të identifikuar dhe vlerësuar afërsinë e marrëdhënies midis dy serive të krahasuara tregues sasior. Në rast se radhët e treguesve, të renditura sipas shkallës së rritjes ose uljes, në shumicën e rasteve përkojnë (një vlerë më e madhe e një treguesi korrespondon me një vlerë më të madhe të një treguesi tjetër - për shembull, kur krahasojmë gjatësinë dhe peshën trupore të pacientit), konstatohet se ka e drejtpërdrejtë lidhje korrelacioni. Nëse radhët e treguesve kanë drejtim të kundërt (një vlerë më e lartë e një treguesi korrespondon me një vlerë më të ulët të një tjetri - për shembull, kur krahasojmë moshën dhe rrahjet e zemrës), pastaj ata flasin për e kundërta lidhjet ndërmjet treguesve.

Koeficienti i korrelacionit Spearman ka këto karakteristika:

Koeficienti i korrelacionit mund të marrë vlera nga minus një në një, dhe me rs=1 ka një marrëdhënie rreptësisht të drejtpërdrejtë, dhe me rs= -1 ka një marrëdhënie rreptësisht reagime.
Nëse koeficienti i korrelacionit është negativ, atëherë ekziston një marrëdhënie kthyese nëse është pozitive, atëherë ka një marrëdhënie të drejtpërdrejtë.
Nëse koeficienti i korrelacionit është zero, atëherë praktikisht nuk ka asnjë lidhje midis sasive.
Sa më afër unitetit të jetë moduli i koeficientit të korrelacionit, aq më e fortë është marrëdhënia midis sasive të matura.

3. Në cilat raste mund të përdoret koeficienti Spearman?

Për faktin se koeficienti është një metodë analiza joparametrike, testimi për shpërndarje normale nuk kërkohet.

Treguesit e krahasueshëm mund të maten si në shkallë e vazhdueshme(për shembull, numri i qelizave të kuqe të gjakut në 1 μl gjak), dhe në rendore(për shembull, pikët e vlerësimit të ekspertëve nga 1 deri në 5).

Efektiviteti dhe cilësia e vlerësimit të Spearman zvogëlohet nëse diferenca midis vlerave të ndryshme të cilësdo prej sasive të matura është mjaft e madhe. Nuk rekomandohet përdorimi i koeficientit Spearman nëse ka një shpërndarje të pabarabartë të vlerave të sasisë së matur.

4. Si llogaritet koeficienti Spearman?

Llogaritja e koeficientit të korrelacionit të gradës Spearman përfshin hapat e mëposhtëm:

5. Si të interpretohet vlera e koeficientit Spearman?

Kur përdorni koeficientin e korrelacionit të renditjes, afërsia e lidhjes midis karakteristikave vlerësohet me kusht, duke marrë parasysh vlerat e koeficientit të barabartë me 0.3 ose më pak si tregues të lidhjes së dobët; vlerat më shumë se 0.4, por më pak se 0.7 janë tregues të afërsisë së moderuar të lidhjes, dhe vlerat prej 0.7 ose më shumë janë tregues të afërsisë së lartë të lidhjes.

Rëndësia statistikore e koeficientit të marrë vlerësohet duke përdorur testin t Student. Nëse vlera e llogaritur e testit t është më e vogël se vlera e tabeluar për një numër të caktuar të shkallëve të lirisë, marrëdhënia e vëzhguar nuk është statistikisht e rëndësishme. Nëse është më i madh, atëherë korrelacioni konsiderohet statistikisht i rëndësishëm.