Opis metode Spearmanove rang korelacije. Ocena Spearmanovega rang korelacijskega koeficienta

Pearsonov korelacijski koeficient

Koeficient r- Pearson se uporablja za preučevanje razmerja med dvema metričnima spremenljivkama, izmerjenima na istem vzorcu. Obstaja veliko situacij, v katerih je njegova uporaba primerna. Ali inteligenca vpliva na akademsko uspešnost v višjih letnikih univerze? Ali je višina plače zaposlenega povezana z njegovo prijaznostjo do sodelavcev? Ali učenčevo razpoloženje vpliva na uspešnost reševanja zapletene aritmetične naloge? Za odgovor na takšna vprašanja mora raziskovalec izmeriti dva zanimiva indikatorja za vsakega člana vzorca.

Na vrednost korelacijskega koeficienta ne vplivajo merske enote, v katerih so značilnosti predstavljene. Posledično morebitne linearne transformacije značilnosti (množenje s konstanto, dodajanje konstante) ne spremenijo vrednosti korelacijskega koeficienta. Izjema je množenje enega od predznakov z negativno konstanto: korelacijski koeficient spremeni predznak v nasprotno.

Uporaba Spearmanove in Pearsonove korelacije.

Pearsonova korelacija je merilo linearne povezave med dvema spremenljivkama. Omogoča vam, da ugotovite, kako sorazmerna je variabilnost dveh spremenljivk. Če sta spremenljivki med seboj sorazmerni, potem lahko odnos med njima grafično predstavimo kot ravno črto s pozitivnim (direktno sorazmerje) ali negativnim (obratno sorazmerje) naklonom.

V praksi je razmerje med dvema spremenljivkama, če obstaja, verjetnostno in grafično izgleda kot elipsoidni disperzijski oblak. Ta elipsoid pa lahko predstavimo (približno) kot premico ali regresijsko črto. Regresijska črta je ravna črta, sestavljena z uporabo metode najmanjših kvadratov: vsota kvadratov razdalj (izračunanih vzdolž osi Y) od vsake točke na razpršenem grafu do ravne črte je najmanjša.

Posebej pomembna za oceno točnosti napovedi je varianca ocen odvisne spremenljivke. V bistvu je varianca ocen odvisne spremenljivke Y tisti del njene celotne variance, ki je posledica vpliva neodvisne spremenljivke X. Z drugimi besedami, razmerje med varianco ocen odvisne spremenljivke in njeno pravo varianco je enaka kvadratu korelacijskega koeficienta.

Kvadrat korelacijskega koeficienta med odvisno in neodvisno spremenljivko predstavlja delež variance v odvisni spremenljivki, ki je posledica vpliva neodvisne spremenljivke in se imenuje koeficient determinacije. Koeficient determinacije torej kaže, v kolikšni meri je variabilnost ene spremenljivke povzročena (določena) z vplivom druge spremenljivke.

Determinacijski koeficient ima pomembno prednost pred korelacijskim koeficientom. Korelacija ni linearna funkcija odnosa med dvema spremenljivkama. Zato aritmetična sredina korelacijskih koeficientov za več vzorcev ne sovpada s korelacijo, izračunano takoj za vse osebe iz teh vzorcev (tj. korelacijski koeficient ni aditiven). Nasprotno, koeficient determinacije odraža razmerje linearno in je zato aditiven: lahko ga povprečimo za več vzorcev.

Dodatno informacijo o jakosti povezave daje vrednost korelacijskega koeficienta na kvadrat – koeficient determinacije: to je del variance ene spremenljivke, ki ga lahko razložimo z vplivom druge spremenljivke. Za razliko od korelacijskega koeficienta se koeficient determinacije linearno povečuje z naraščajočo močjo povezave.

Spearmanovi korelacijski koeficienti in τ - Kendall ( rang korelacije )

Če sta obe spremenljivki, med katerima proučujemo razmerje, predstavljeni na ordinalni lestvici ali je ena od njiju na ordinalni lestvici, druga pa na metrični lestvici, potem uporabimo rang korelacijske koeficiente: Spearman ali τ - Kendella. Oba koeficienta zahtevata predhodno rangiranje obeh spremenljivk za njihovo uporabo.

Spearmanov rang korelacijski koeficient je neparametrična metoda, ki se uporablja za namen statističnega preučevanja povezanosti med pojavi. V tem primeru se ugotovi dejanska stopnja vzporednosti med obema kvantitativnima nizoma preučevanih značilnosti in s kvantitativno izraženim koeficientom poda ocena tesnosti vzpostavljene povezave.

Če so bili člani velikostne skupine najprej razvrščeni po spremenljivki x, nato po spremenljivki y, potem lahko korelacijo med spremenljivkama x in y dobimo preprosto z izračunom Pearsonovega koeficienta za dve seriji uvrstitev. Pod pogojem, da za nobeno od spremenljivk ni nobenih rangov (tj. brez ponavljajočih se rangov), je mogoče Pearsonovo formulo močno računsko poenostaviti in pretvoriti v tisto, kar je znano kot Spearmanova formula.

Moč Spearmanovega rang korelacijskega koeficienta je nekoliko slabša od moči parametričnega korelacijskega koeficienta.

Ko je opazovanj malo, je priporočljivo uporabiti korelacijski koeficient ranga. Ta metoda se lahko uporablja ne samo za kvantitativne podatke, ampak tudi v primerih, ko so zapisane vrednosti določene z opisnimi značilnostmi različne intenzivnosti.

Spearmanov rang korelacijski koeficient z velikim številom enakih rangov za eno ali obe primerjani spremenljivki daje grobe vrednosti. V idealnem primeru bi morali obe korelirani seriji predstavljati dve zaporedji različnih vrednosti

Alternativa Spearmanovi korelaciji za uvrstitve je korelacija τ - Kendall. Korelacija, ki jo je predlagal M. Kendall, temelji na ideji, da je mogoče smer povezave oceniti s primerjavo subjektov v parih: če ima par subjektov spremembo v x, ki sovpada v smeri s spremembo v y, potem to kaže pozitivna povezava, če se ne ujema - potem o negativni povezavi.

Korelacijski koeficienti so bili posebej zasnovani za kvantificiranje moči in smeri razmerja med dvema lastnostma, izmerjenima na številčnih lestvicah (metričnih ali rangiranih). Kot je bilo že omenjeno, največja moč povezave ustreza vrednostim korelacije +1 (stroga direktna ali neposredno sorazmerna povezava) in -1 (stroga inverzna ali obratno sorazmerna povezava); odsotnost povezave ustreza korelaciji, ki je enaka nič . Dodatne informacije o moči razmerja zagotavlja koeficient determinacije: to je delež variance v eni spremenljivki, ki ga je mogoče razložiti z vplivom druge spremenljivke.

9. Parametrične metode za primerjavo podatkov


Metode parametrične primerjave se uporabljajo, če so bile vaše spremenljivke izmerjene na metrični lestvici.

Primerjava varianc 2- x vzorcev po Fisherjevem testu .


Ta metoda vam omogoča, da preizkusite hipotezo, da se variance 2 splošnih populacij, iz katerih so izločeni primerjani vzorci, med seboj razlikujejo. Omejitve metode - porazdelitev značilnosti v obeh vzorcih se ne sme razlikovati od normalne.

Alternativa primerjavi varianc je Levenov test, za katerega ni potrebe po testiranju normalnosti porazdelitve. To metodo lahko uporabimo za preverjanje predpostavke o enakosti (homogenosti) varianc pred preverjanjem pomembnosti razlik v povprečjih s pomočjo Studentovega testa za neodvisne vzorce različnih velikosti.

Korelacijski koeficient ranga, ki ga je predlagal K. Spearman, se nanaša na neparametrično mero razmerja med spremenljivkami, izmerjenimi na rang lestvici. Pri izračunu tega koeficienta niso potrebne predpostavke o naravi porazdelitve značilnosti v populaciji. Ta koeficient določa stopnjo tesnosti povezanosti ordinalnih karakteristik, ki v tem primeru predstavljajo range primerjanih količin.

Tudi Spearmanov korelacijski koeficient je v območju +1 in -1. Tako kot Pearsonov koeficient je lahko pozitiven in negativen, kar označuje smer razmerja med dvema značilnostma, izmerjenima na rang lestvici.

Načeloma je lahko število rangiranih lastnosti (kakovosti, lastnosti itd.) poljubno, vendar je postopek rangiranja več kot 20 lastnosti težaven. Možno je, da je bila zato tabela kritičnih vrednosti korelacijskega koeficienta ranga izračunana samo za štirideset razvrščenih značilnosti (n< 40, табл. 20 приложения 6).

Spearmanov rang korelacijski koeficient se izračuna po formuli:

kjer je n število rangiranih lastnosti (indikatorjev, predmetov);

D je razlika med rangi za dve spremenljivki za vsak predmet;

Vsota kvadratov razlik v rangu.

Z uporabo korelacijskega koeficienta ranga upoštevajte naslednji primer.

Primer: Psihologinja ugotavlja, kako so posamezni kazalniki pripravljenosti na šolo, pridobljeni pred začetkom šolanja med 11 prvošolci, povezani med seboj in njihovim povprečnim uspehom ob koncu šolskega leta.

Da bi rešili ta problem, smo najprej razvrstili vrednosti kazalnikov šolske pripravljenosti, pridobljene ob sprejemu v šolo, in drugič, končne kazalnike učne uspešnosti ob koncu leta za te iste učence v povprečju. Rezultate predstavljamo v tabeli. 13.

Tabela 13

Študent št.

Rangi kazalnikov pripravljenosti na šolo

Povprečna letna uspešnost

Dobljene podatke nadomestimo v formulo in izvedemo izračun. Dobimo:

Če želite najti stopnjo pomembnosti, glejte tabelo. 20 Dodatka 6, ki prikazuje kritične vrednosti za korelacijske koeficiente ranga.

To poudarjamo v tabeli. 20 Dodatka 6, tako kot v tabeli za linearno Pearsonovo korelacijo, so vse vrednosti korelacijskih koeficientov podane v absolutni vrednosti. Zato se predznak korelacijskega koeficienta upošteva le pri interpretaciji.

Iskanje stopenj pomembnosti v tej tabeli se izvaja s številom n, to je s številom subjektov. V našem primeru n = 11. Za to številko najdemo:

0,61 za P 0,05

0,76 za P 0,01

Konstruiramo ustrezno ``os pomembnosti``:

Dobljeni korelacijski koeficient je sovpadal s kritično vrednostjo za stopnjo pomembnosti 1 %. Posledično lahko trdimo, da so kazalniki pripravljenosti za šolanje in končne ocene prvošolcev povezani s pozitivno korelacijo – z drugimi besedami, višji kot je kazalnik pripravljenosti za šolanje, bolje se prvošolec uči. Z vidika statističnih hipotez mora psiholog zavrniti ničelno hipotezo o podobnosti in sprejeti alternativno hipotezo o razlikah, ki nakazuje, da je razmerje med indikatorji pripravljenosti za šolanje in povprečnim učnim uspehom različno od nič.

Primer enakih (enakih) rangov

Če so rangi enaki, bo formula za izračun Spearmanovega linearnega korelacijskega koeficienta nekoliko drugačna. V tem primeru sta v formulo za izračun korelacijskih koeficientov dodana dva nova člena, ki upoštevata iste range. Imenujejo se popravki enakega ranga in se dodajo k števcu formule za izračun.

kjer je n število enakih rangov v prvem stolpcu,

k je število enakih rangov v drugem stolpcu.

Če sta v kateremkoli stolpcu dve skupini enakih rangov, postane korekcijska formula nekoliko bolj zapletena:

kjer je n število enakih rangov v prvi skupini rangiranega stolpca,

k je število enakih rangov v drugi skupini rangiranega stolpca. Sprememba formule v splošnem primeru je naslednja:

Primer: Psihologinja s testom duševnega razvoja (MDT) izvede študijo inteligence pri 12 učencih 9. razreda. Obenem prosi učitelje književnosti in matematike, da te iste učence razvrstijo po kazalcih duševne razvitosti. Naloga je ugotoviti, kako so med seboj povezani objektivni kazalci duševne razvitosti (podatki SHTUR) in strokovne ocene učiteljev.

Eksperimentalne podatke tega problema in dodatne stolpce, potrebne za izračun Spearmanovega korelacijskega koeficienta, predstavljamo v obliki tabele. 14.

Tabela 14

Študent št.

Uvrstitve testiranja z uporabo SHTURA

Strokovne ocene učiteljev matematike

Strokovne ocene učiteljev o književnosti

D (drugi in tretji stolpec)

D (drugi in četrti stolpec)

(drugi in tretji stolpec)

(drugi in četrti stolpec)

Ker so bili pri razvrščanju uporabljeni enaki rangi, je potrebno preveriti pravilnost razvrščanja v drugem, tretjem in četrtem stolpcu tabele. Če seštejemo vsakega od teh stolpcev, dobimo enako vsoto - 78.

Preverjamo z uporabo formule za izračun. Ček daje:

V petem in šestem stolpcu tabele so prikazane vrednosti razlik v rangih med strokovnimi ocenami psihologa na testu SHTUR za posameznega učenca in vrednosti strokovnih ocen učiteljev pri matematiki oziroma književnosti. Vsota vrednosti razlike v rangu mora biti enaka nič. Seštevanje vrednosti D v petem in šestem stolpcu je dalo želeni rezultat. Zato je bilo odštevanje rangov izvedeno pravilno. Podobno preverjanje je treba opraviti vsakič, ko izvajate zapletene vrste razvrščanja.

Pred začetkom izračuna po formuli je treba izračunati popravke za iste uvrstitve za drugi, tretji in četrti stolpec tabele.

V našem primeru sta v drugem stolpcu tabele dva enaka ranga, zato bo po formuli vrednost popravka D1:

Tretji stolpec ima tri enake range, zato bo po formuli vrednost popravka D2:

V četrtem stolpcu tabele sta dve skupini treh enakih rangov, zato bo po formuli vrednost popravka D3:

Preden nadaljujemo z rešitvijo problema, se spomnimo, da psiholog pojasnjuje dve vprašanji - kako so vrednosti uvrstitev na testu SHTUR povezane s strokovnimi ocenami v matematiki in literaturi. Zato se izračun izvede dvakrat.

Koeficient prvega ranga izračunamo z upoštevanjem dodatkov po formuli. Dobimo:

Izračunajmo brez upoštevanja dodatka:

Kot lahko vidimo, se je razlika v vrednostih korelacijskih koeficientov izkazala za zelo nepomembno.

Drugi rangni koeficient izračunamo z upoštevanjem dodatkov po formuli. Dobimo:

Izračunajmo brez upoštevanja dodatka:

Spet so bile razlike zelo majhne. Ker je število študentov v obeh primerih enako, glede na tabelo. 20 Dodatka 6 najdemo kritične vrednosti pri n = 12 za oba korelacijska koeficienta hkrati.

0,58 za P 0,05

0,73 za P 0,01

Prvo vrednost narišemo na ``os pomembnosti``:

V prvem primeru je dobljeni korelacijski koeficient ranga v coni pomembnosti. Zato mora psiholog zavrniti ničelno hipotezo, da je korelacijski koeficient podoben nič, in sprejeti alternativno hipotezo, da je korelacijski koeficient pomembno drugačen od nič. Z drugimi besedami, dobljeni rezultat nakazuje, da višje kot so strokovne ocene učencev na testu SHTUR, višje so njihove strokovne ocene pri matematiki.

Drugo vrednost narišemo na ``os pomembnosti``:

V drugem primeru je korelacijski koeficient ranga v območju negotovosti. Zato lahko psiholog sprejme ničelno hipotezo, da je korelacijski koeficient podoben nič, in zavrne alternativno hipotezo, da je korelacijski koeficient bistveno drugačen od nič. V tem primeru dobljeni rezultat nakazuje, da strokovne ocene učencev na testu SHTUR niso povezane s strokovnimi ocenami literature.

Za uporabo Spearmanovega korelacijskega koeficienta morajo biti izpolnjeni naslednji pogoji:

1. Primerjane spremenljivke je treba pridobiti na ordinalni (rangirani) lestvici, lahko pa jih merimo tudi na intervalni in razmerni lestvici.

2. Narava porazdelitve koreliranih količin ni pomembna.

3. Število spremenljivih karakteristik v primerjanih spremenljivkah X in Y mora biti enako.

Tabele za določanje kritičnih vrednosti Spearmanovega korelacijskega koeficienta (tabela 20, priloga 6) so izračunane iz števila značilnosti, ki je enako n = 5 do n = 40, pri večjem številu primerjanih spremenljivk pa tabela za Uporabiti je treba Pearsonov korelacijski koeficient (Tabela 19, Dodatek 6). Iskanje kritičnih vrednosti se izvede pri k = n.

V primerih, ko se meritve preučevanih značilnosti izvajajo na vrstni lestvici ali se oblika razmerja razlikuje od linearne, se preučevanje razmerja med dvema naključnima spremenljivkama izvede z uporabo rang korelacijskih koeficientov. Upoštevajte korelacijski koeficient Spearmanovega ranga. Pri izračunu je potrebno vzorčne možnosti rangirati (vrstiti). Razvrstitev je združevanje eksperimentalnih podatkov v določenem vrstnem redu, bodisi naraščajoče bodisi padajoče.

Postopek razvrščanja poteka po naslednjem algoritmu:

1. Nižji vrednosti je dodeljen nižji rang. Najvišji vrednosti je dodeljen rang, ki ustreza številu razvrščenih vrednosti. Najmanjši vrednosti je dodeljen rang 1. Na primer, če je n=7, bo največja vrednost prejela rang 7, razen v primerih, predvidenih v drugem pravilu.

2. Če je več vrednosti enakih, se jim dodeli rang, ki je povprečje rangov, ki bi jih prejeli, če ne bi bile enake. Kot primer razmislite o naraščajočem urejenem vzorcu, sestavljenem iz 7 elementov: 22, 23, 25, 25, 25, 28, 30. Vrednosti 22 in 23 se pojavita po enkrat, tako da sta njuna ranga R22=1 in R23=2 . Vrednost 25 se pojavi 3-krat. Če se te vrednosti ne bi ponovile, bi bili njihovi rangi 3, 4, 5. Zato je njihov rang R25 enak aritmetični sredini 3, 4 in 5: . Vrednosti 28 in 30 se ne ponavljata, zato sta njuna ranga R28=6 oziroma R30=7. Končno imamo naslednjo korespondenco:

3. Skupna vsota rangov mora sovpadati z izračunano, ki je določena s formulo:

kjer je n skupno število razvrščenih vrednosti.

Neskladje med dejanskim in izračunanim seštevkom uvrstitev bo pomenilo napako pri izračunu uvrstitev ali njihovem seštevanju. V tem primeru morate poiskati in odpraviti napako.

Spearmanov rang korelacijski koeficient je metoda, ki omogoča določitev moči in smeri odnosa med dvema lastnostma ali dvema hierarhijama lastnosti. Uporaba korelacijskega koeficienta ranga ima številne omejitve:

  • a) Predpostavljena korelacijska odvisnost mora biti monotona.
  • b) Prostornina vsakega vzorca mora biti večja ali enaka 5. Za določitev zgornje meje vzorca uporabite tabele kritičnih vrednosti (tabela 3 v dodatku). Največja vrednost n v tabeli je 40.
  • c) Med analizo se lahko pojavi veliko število enakih rangov. V tem primeru je treba narediti spremembo. Najbolj ugoden primer je, ko oba proučevana vzorca predstavljata dve zaporedji divergentnih vrednosti.

Za izvedbo korelacijske analize mora imeti raziskovalec dva vzorca, ki ju je mogoče rangirati, na primer:

  • - dve lastnosti, izmerjeni pri isti skupini preiskovancev;
  • - dve individualni hierarhiji lastnosti, ugotovljeni pri dveh subjektih z uporabo istega nabora lastnosti;
  • - dve skupinski hierarhiji značilnosti;
  • - individualne in skupinske hierarhije lastnosti.

Izračun začnemo z rangiranjem proučevanih kazalnikov posebej za vsako od značilnosti.

Analizirajmo primer z dvema znakoma, izmerjenima v isti skupini subjektov. Najprej se posamezne vrednosti, ki jih pridobijo različni subjekti, razvrstijo po prvi značilnosti, nato pa se posamezne vrednosti razvrstijo po drugi značilnosti. Če nižji rangi enega indikatorja ustrezajo nižjim rangom drugega indikatorja in višji rangi enega indikatorja ustrezajo višjim rangom drugega indikatorja, potem sta značilnosti pozitivno povezani. Če višji rangi enega kazalnika ustrezajo nižjim rangom drugega indikatorja, potem sta obe značilnosti negativno povezani. Za iskanje rs določimo razlike med rangi (d) za vsak subjekt. Manjša ko je razlika med rangi, bližje bo rang korelacijski koeficient rs »+1«. Če razmerja ni, potem med njima ne bo korespondence, zato bo rs blizu nič. Večja ko je razlika med rangi subjektov na dveh spremenljivkah, bližje »-1« bo vrednost koeficienta rs. Tako je korelacijski koeficient Spearmanovega ranga merilo kakršnega koli monotonega razmerja med dvema proučevanima karakteristikama.

Oglejmo si primer dveh individualnih hierarhij lastnosti, identificiranih pri dveh subjektih z uporabo istega niza lastnosti. V tej situaciji so posamezne vrednosti, ki jih pridobi vsak od obeh subjektov, razvrščene glede na določen nabor značilnosti. Lastnosti z najnižjo vrednostjo je treba dodeliti prvi rang; značilnost z višjo vrednostjo je drugi rang itd. Posebno pozornost je treba posvetiti zagotavljanju, da so vsi atributi izmerjeni v istih enotah. Na primer, nemogoče je razvrstiti kazalnike, če so izraženi v različnih "cenovnih" točkah, saj je nemogoče določiti, kateri od dejavnikov bo zasedel prvo mesto v smislu resnosti, dokler se vse vrednosti ne prenesejo na eno lestvico. Če imajo lastnosti, ki imajo nizke range pri enem od predmetov, tudi nizke range pri drugem in obratno, potem so posamezne hierarhije pozitivno povezane.

V primeru dveh skupinskih hierarhij značilnosti so povprečne skupinske vrednosti, dobljene v dveh skupinah subjektov, razvrščene glede na isti nabor značilnosti za proučevane skupine. Nato sledimo algoritmu, podanemu v prejšnjih primerih.

Analizirajmo primer z individualno in skupinsko hierarhijo značilnosti. Začnejo z ločenim razvrščanjem individualnih vrednosti subjekta in povprečnih skupinskih vrednosti glede na isti nabor značilnosti, ki so bile pridobljene, pri čemer se izključi subjekt, ki ne sodeluje v hierarhiji povprečne skupine, saj bo njegova individualna hierarhija v primerjavi z njim. Korelacija ranga nam omogoča, da ocenimo stopnjo skladnosti individualne in skupinske hierarhije lastnosti.

Poglejmo, kako se določi pomembnost korelacijskega koeficienta v zgoraj navedenih primerih. V primeru dveh značilnosti bo določena z velikostjo vzorca. V primeru dveh posameznih hierarhij funkcij je pomembnost odvisna od števila funkcij, vključenih v hierarhijo. V zadnjih dveh primerih je pomembnost določena s številom preučevanih značilnosti in ne s številom skupin. Tako je pomembnost rs v vseh primerih določena s številom razvrščenih vrednosti n.

Pri preverjanju statistične pomembnosti rs se uporabljajo tabele kritičnih vrednosti korelacijskega koeficienta ranga, sestavljene za različno število rangiranih vrednosti in različne stopnje pomembnosti. Če absolutna vrednost rs doseže ali preseže kritično vrednost, potem je korelacija zanesljiva.

Pri obravnavi prve možnosti (primer z dvema znakoma, izmerjenima v isti skupini oseb) so možne naslednje hipoteze.

H0: Korelacija med spremenljivkama x in y se ne razlikuje od nič.

H1: Korelacija med spremenljivkama x in y se bistveno razlikuje od nič.

Če delamo s katerim koli od treh preostalih primerov, potem je treba postaviti še en par hipotez:

H0: Korelacija med hierarhijami x in y se ne razlikuje od nič.

H1: Korelacija med hierarhijami x in y se bistveno razlikuje od nič.

Zaporedje dejanj pri izračunu Spearmanovega korelacijskega koeficienta rs je naslednje.

  • - Določite, kateri dve značilnosti ali dve hierarhiji značilnosti bosta sodelovali v primerjavi kot spremenljivki x in y.
  • - Razvrstite vrednosti spremenljivke x, pri čemer najmanjši vrednosti dodelite rang 1 v skladu s pravili razvrščanja. Postavite range v prvi stolpec tabele po vrstnem redu preiskovancev ali lastnosti.
  • - Razvrstite vrednosti spremenljivke y. Postavite range v drugi stolpec tabele po vrstnem redu preiskovancev ali lastnosti.
  • - Izračunajte razlike d med rangoma x in y za vsako vrstico tabele. Rezultate postavite v naslednji stolpec tabele.
  • - Izračunaj kvadrat razlike (d2). Dobljene vrednosti postavite v četrti stolpec tabele.
  • - Izračunati vsoto kvadratov razlik? d2.
  • - Če pride do enakih uvrstitev, izračunajte popravke:

kjer je tx prostornina vsake skupine enakih rangov v vzorcu x;

ty je obseg vsake skupine enakih rangov v vzorcu y.

Izračunajte korelacijski koeficient ranga glede na prisotnost ali odsotnost enakih rangov. Če ni enakih rangov, izračunajte rang korelacijski koeficient rs po formuli:

Če so rangi enaki, izračunajte korelacijski koeficient rs po formuli:

kjer je?d2 vsota kvadratov razlik med rangi;

Tx in Ty - popravki za enake range;

n je število predmetov ali značilnosti, ki sodelujejo pri razvrščanju.

Določite kritične vrednosti rs iz tabele 3 v dodatku za določeno število subjektov n. Opaziti bo pomembno razliko od nič korelacijskega koeficienta pod pogojem, da rs ni manjši od kritične vrednosti.

Pearsonova korelacija je merilo linearne povezave med dvema spremenljivkama. Omogoča vam, da ugotovite, kako sorazmerna je variabilnost dveh spremenljivk. Če sta spremenljivki med seboj sorazmerni, potem lahko odnos med njima grafično predstavimo kot ravno črto s pozitivnim (direktno sorazmerje) ali negativnim (obratno sorazmerje) naklonom.

V praksi je razmerje med dvema spremenljivkama, če obstaja, verjetnostno in grafično izgleda kot elipsoidni disperzijski oblak. Ta elipsoid pa lahko predstavimo (približno) kot premico ali regresijsko črto. Regresijska črta je ravna črta, zgrajena z uporabo metode najmanjših kvadratov: vsota kvadratov razdalj (izračunanih vzdolž osi Y) od vsake točke na razpršenem grafu do ravne črte je najmanjša

Posebej pomembna za oceno točnosti napovedi je varianca ocen odvisne spremenljivke. V bistvu je varianca ocen odvisne spremenljivke Y tisti del njene celotne variance, ki je posledica vpliva neodvisne spremenljivke X. Z drugimi besedami, razmerje med varianco ocen odvisne spremenljivke in njeno pravo varianco je enaka kvadratu korelacijskega koeficienta.

Kvadrat korelacijskega koeficienta med odvisno in neodvisno spremenljivko predstavlja delež variance v odvisni spremenljivki, ki je posledica vpliva neodvisne spremenljivke in se imenuje koeficient determinacije. Koeficient determinacije torej kaže, v kolikšni meri je variabilnost ene spremenljivke povzročena (določena) z vplivom druge spremenljivke.

Determinacijski koeficient ima pomembno prednost pred korelacijskim koeficientom. Korelacija __________ ni linearna funkcija razmerja med dvema spremenljivkama. Zato aritmetična sredina korelacijskih koeficientov za več vzorcev ne sovpada s korelacijo, izračunano takoj za vse osebe iz teh vzorcev (tj. korelacijski koeficient ni aditiven). Nasprotno, koeficient determinacije odraža razmerje linearno in je zato aditiven: lahko ga povprečimo za več vzorcev.

Dodatno informacijo o jakosti povezave daje vrednost korelacijskega koeficienta na kvadrat – koeficient determinacije: to je del variance ene spremenljivke, ki ga lahko razložimo z vplivom druge spremenljivke. Za razliko od korelacijskega koeficienta se koeficient determinacije linearno povečuje z naraščajočo močjo povezave.

Spearmanova in τ-Kendallova korelacijska koeficienta (rank korelacije)

Če sta obe spremenljivki, med katerima proučujemo razmerje, predstavljeni na ordinalni lestvici ali je ena od njiju na ordinalni lestvici, druga pa na metrični lestvici, potem uporabimo korelacijske koeficiente ranga: Spearman ali τ-Kendell. Oba koeficienta zahtevata predhodno rangiranje obeh spremenljivk za njihovo uporabo.

Spearmanov rang korelacijski koeficient je neparametrična metoda, ki se uporablja za namen statističnega preučevanja povezanosti med pojavi. V tem primeru se ugotovi dejanska stopnja vzporednosti med obema kvantitativnima nizoma preučevanih značilnosti in s kvantitativno izraženim koeficientom poda ocena tesnosti vzpostavljene povezave.

Če so bili člani velikosti skupine najprej razvrščeni po spremenljivki x, nato po spremenljivki y, potem lahko korelacijo med spremenljivkama x in y dobimo preprosto z izračunom Pearsonovega koeficienta za dve seriji uvrstitev. Pod pogojem, da za nobeno od spremenljivk ni nobenih rangov (tj. brez ponavljajočih se rangov), je mogoče Pearsonovo formulo močno računsko poenostaviti in pretvoriti v tisto, kar je znano kot Spearmanova formula.

Moč Spearmanovega rang korelacijskega koeficienta je nekoliko slabša od moči parametričnega korelacijskega koeficienta.

Ko je opazovanj malo, je priporočljivo uporabiti korelacijski koeficient ranga. Ta metoda se lahko uporablja ne samo za kvantitativne podatke, ampak tudi v primerih, ko so zapisane vrednosti določene z opisnimi značilnostmi različne intenzivnosti.

Spearmanov rang korelacijski koeficient z velikim številom enakih rangov za eno ali obe primerjani spremenljivki daje grobe vrednosti. V idealnem primeru bi morali obe korelirani seriji predstavljati dve zaporedji različnih vrednosti.

Alternativa Spearmanovi korelaciji za uvrstitve je τ-Kendallova korelacija. Korelacija, ki jo je predlagal M. Kendall, temelji na ideji, da je mogoče smer povezave oceniti s primerjavo subjektov v parih: če ima par subjektov spremembo v x, ki sovpada v smeri s spremembo v y, potem to kaže pozitivna povezava, če se ne ujema - potem o negativni povezavi.

Spearmanova metoda rangiranja vam omogoča, da določite bližino (moč) in smer korelacije med dvema karakteristikama ali dvema profiloma (hierarhijami) značilnosti.

Za izračun rang korelacije je potrebno imeti dve vrstici vrednosti,

ki se lahko rangirajo. Tak niz vrednosti je lahko:

1) dva znaka, izmerjena v isti skupini subjektov;

2) dve individualni hierarhiji lastnosti, identificirani pri dveh subjektih z uporabo istega niza lastnosti;

3) dve skupinski hierarhiji značilnosti,

4) individualne in skupinske hierarhije značilnosti.

Prvič, kazalniki so razvrščeni ločeno za vsako od značilnosti.

Praviloma je nižji rang dodeljen nižji vrednosti atributa.

V prvem primeru (dve značilnosti) se rangirajo posamezne vrednosti za prvo lastnost, ki so jih pridobili različni subjekti, nato pa posamezne vrednosti za drugo lastnost.

Če sta dve značilnosti pozitivno povezani, bodo subjekti, ki imajo nizke range v eni od njih, imeli nizke range v drugi, subjekti, ki imajo visoke range v

ena od značilnosti bo imela visoke uvrstitve tudi za drugo značilnost. Za izračun rs je treba določiti razlike (d) med rangi, ki jih je dani subjekt pridobil za obe značilnosti. Nato se ti indikatorji d na določen način transformirajo in odštejejo od 1. Than

Manjša kot je razlika med rangi, večji bo rs, bližje bo +1.

Če korelacije ni, bodo vsi rangi pomešani in ne bo

brez dopisovanja. Formula je zasnovana tako, da bo v tem primeru rs blizu 0.

V primeru negativne korelacije med nizkimi rangi subjektov na enem atributu

bodo ustrezali visoki čini na drugi podlagi in obratno. Večje kot je odstopanje med rangi subjektov na dveh spremenljivkah, bližje je rs vrednosti -1.

V drugem primeru (dva individualna profila) posam

vrednosti, ki jih pridobi vsak od dveh subjektov za določen (identičen za oba) nabor značilnosti. Prvo mesto bo dalo lastnosti z najnižjo vrednostjo; drugi rang je značilnost z višjo vrednostjo itd. Očitno morajo biti vsi atributi izmerjeni v istih enotah, sicer je razvrščanje nemogoče. Na primer, nemogoče je rangirati indikatorje na Cattellovem osebnostnem popisu (16PF), če so izraženi v "surovih" točkah, saj so razponi vrednosti za različne dejavnike različni: od 0 do 13, od 0 do

20 in od 0 do 26. Ne moremo reči, kateri dejavnik bo zasedel prvo mesto glede na resnost, dokler ne združimo vseh vrednosti na eno lestvico (najpogosteje je to stenska lestvica).

Če sta posamezni hierarhiji dveh subjektov pozitivno povezani, potem bodo lastnosti, ki imajo nizke range pri enem od njiju, imele nizke range pri drugem in obratno. Na primer, če ima faktor E (dominantnost) enega subjekta najnižji rang, potem mora imeti faktor drugega subjekta tudi nizek rang, če je faktor C enega subjekta

(čustvena stabilnost) ima najvišji rang, potem mora imeti tudi drugi subjekt

ta dejavnik ima visok rang itd.

V tretjem primeru (dva skupinska profila) so skupinske povprečne vrednosti, dobljene v 2 skupinah subjektov, razvrščene glede na določen nabor značilnosti, enak za obe skupini. V nadaljevanju je sklepanje enako kot v prejšnjih dveh primerih.

V primeru 4 (individualni in skupinski profili) so individualne vrednosti subjekta in skupinske povprečne vrednosti razvrščene ločeno po istem naboru značilnosti, ki jih dobimo praviloma z izključitvijo tega posameznega subjekta - ne sodeluje v skupinskem povprečnem profilu, s katerim se bo primerjal posamezni profil. Korelacija ranga bo preverila, kako dosledni sta profil posameznika in skupine.

V vseh štirih primerih je pomembnost nastalega korelacijskega koeficienta določena s številom rangiranih vrednosti N. V prvem primeru bo to število sovpadalo z velikostjo vzorca n. V drugem primeru bo število opazovanj število funkcij, ki sestavljajo hierarhijo. V tretjem in četrtem primeru je N tudi število primerjanih lastnosti in ne število subjektov v skupinah. Podrobna pojasnila so podana v primerih. Če absolutna vrednost rs doseže ali preseže kritično vrednost, je korelacija zanesljiva.

Hipoteze.

Možni sta dve hipotezi. Prvo velja za primer 1, drugo pa za ostale tri primere.

Prva različica hipotez

H0: Korelacija med spremenljivkama A in B se ne razlikuje od nič.

H1: Korelacija med spremenljivkama A in B se bistveno razlikuje od nič.

Druga različica hipotez

H0: Korelacija med hierarhijama A in B se ne razlikuje od nič.

H1: Korelacija med hierarhijama A in B se znatno razlikuje od nič.

Omejitve korelacijskega koeficienta ranga

1. Za vsako spremenljivko je treba predložiti vsaj 5 opazovanj. Zgornjo mejo vzorca določajo razpoložljive tabele kritičnih vrednosti.

2. Spearmanov rang korelacijski koeficient rs z velikim številom enakih rangov za eno ali obe primerjani spremenljivki daje grobe vrednosti. V idealnem primeru bi morali obe korelirani seriji predstavljati dve zaporedji različnih vrednosti. Če ta pogoj ni izpolnjen, je treba izvesti prilagoditev za enake range.

Spearmanov rang korelacijski koeficient se izračuna po formuli:

Če sta v obeh primerjanih serijah rangov skupine enakih rangov, je treba pred izračunom korelacijskega koeficienta ranga opraviti popravke za enaka ranga Ta in Tb:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

kjer je a prostornina vsake skupine enakih rangov v nizu rangov A, b je prostornina vsakega

skupine enakih rangov v nizu rangov B.

Za izračun empirične vrednosti rs uporabite formulo:

Izračun Spearmanovega korelacijskega koeficienta rs

1. Določite, kateri dve značilnosti ali dve hierarhiji značilnosti bosta sodelovali

primerjava kot spremenljivki A in B.

2. Razvrstite vrednosti spremenljivke A, tako da najmanjši vrednosti dodelite rang 1 v skladu s pravili za razvrščanje (glejte P.2.3). V prvi stolpec tabele vnesite uvrstitve po vrstnem redu testirancev ali lastnosti.

3. Razvrstite vrednosti spremenljivke B v skladu z istimi pravili. V drugi stolpec tabele vnesite range po vrstnem redu številk predmetov ali lastnosti.

5. Kvadriraj vsako razliko: d2. Vnesite te vrednosti v četrti stolpec tabele.

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

kjer je a obseg vsake skupine enakih rangov v nizu rangov A; c – obseg vsake skupine

enaka mesta na lestvici serije B.

a) če ni enakih rangov

rs  1 − 6 ⋅

b) v prisotnosti enakih rangov

Σd 2  T  T

r  1 − 6 ⋅ a in,

kjer je Σd2 vsota kvadratov razlik med rangi; Ta in TV - popravki za isto

N – število predmetov ali lastnosti, ki sodelujejo pri rangiranju.

9. Iz tabele (glej prilogo 4.3) določite kritične vrednosti rs za dani N. Če rs presega kritično vrednost ali ji je vsaj enak, je korelacija bistveno drugačna od 0.

Primer 4.1 Pri določanju stopnje odvisnosti reakcije uživanja alkohola od okulomotorne reakcije v testni skupini so bili pridobljeni podatki pred in po uživanju alkohola. Ali je reakcija subjekta odvisna od stanja alkoholiziranosti?

Rezultati poskusa:

Prej: 16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. Po: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Postavimo hipoteze:

H0: korelacija med stopnjo odvisnosti reakcije pred in po pitju alkohola se ne razlikuje od nič.

H1: korelacija med stopnjo odvisnosti reakcije pred in po pitju alkohola se bistveno razlikuje od nič.

Tabela 4.1. Izračun d2 za Spearmanov rang korelacijski koeficient rs pri primerjavi indikatorjev okulomotorne reakcije pred in po eksperimentu (N=17)

vrednote

vrednote

Ker imamo ponavljajoče se range, bomo v tem primeru uporabili formulo, prilagojeno za enake range:

Ta= ((23-2)+(33-3)+(23-2)+(33-3)+(23-2)+(23-2))/12=6

Тb =((23-2)+(23-2)+(33-3))/12=3

Poiščimo empirično vrednost Spearmanovega koeficienta:

rs = 1- 6*((767,75+6+3)/(17*(172-1)))=0,05

S tabelo (Dodatek 4.3) najdemo kritične vrednosti korelacijskega koeficienta

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Dobimo

rs=0,05∠rcr(0,05)=0,48

Zaključek: hipoteza H1 je zavrnjena in H0 sprejeta. Tisti. korelacija med diplomo

odvisnost reakcije pred in po pitju alkohola se ne razlikuje od nič.



Vam je bil članek všeč? Delite s prijatelji!