Koreliacinės analizės rezultate jie apskaičiuojami. Koreliacijos priklausomybės skaitinė išraiška

KURSINIS DARBAS

Tema: Koreliacinė analizė

Įvadas

1. Koreliacinė analizė

1.1 Koreliacijos samprata

1.2 Bendroji koreliacijų klasifikacija

1.3 Koreliacijos laukai ir jų sudarymo paskirtis

1.4 Koreliacinės analizės etapai

1.5 Koreliacijos koeficientai

1.6 Normalizuotas Bravais-Pearson koreliacijos koeficientas

1.7 Spearmano rango koreliacijos koeficientas

1.8 Pagrindinės koreliacijos koeficientų savybės

1.9 Koreliacijos koeficientų reikšmingumo tikrinimas

1.10 Poros koreliacijos koeficiento kritinės reikšmės

2. Daugiafaktorinio eksperimento planavimas

2.1 Problemos būklė

2.2 Plano centro (pagrindinio lygio) ir faktoriaus kitimo lygio nustatymas

2.3 Planavimo matricos sudarymas

2.4. Dispersijos homogeniškumo ir matavimo lygiavertiškumo tikrinimas skirtingose ​​serijose

2.5 Regresijos lygties koeficientai

2.6 Atkuriamumo dispersija

2.7 Regresijos lygčių koeficientų reikšmingumo tikrinimas

2.8 Regresijos lygties adekvatumo tikrinimas

Išvada

Nuorodos

ĮVADAS

Eksperimentinis planavimas – tai matematinė ir statistinė disciplina, tirianti racionalaus eksperimentinio tyrimo organizavimo metodus – nuo ​​optimalaus tiriamų veiksnių pasirinkimo ir tikrojo eksperimento plano nustatymo pagal jo paskirtį iki rezultatų analizės metodų. Eksperimentinis planavimas prasidėjo nuo anglų statistiko R. Fisherio (1935) darbų, kurie pabrėžė, kad racionalus eksperimentinis planavimas suteikia ne mažiau reikšmingų įverčių tikslumo laimėjimo nei optimalus matavimo rezultatų apdorojimas. XX amžiaus šeštajame dešimtmetyje atsirado moderni eksperimentinio planavimo teorija. Jos metodai yra glaudžiai susiję su funkcijų aproksimacijos teorija ir matematiniu programavimu. Buvo sudaryti optimalūs planai ir ištirtos jų savybės plačiajai modelių klasei.

Eksperimento planavimas – tai nurodytus reikalavimus atitinkančio eksperimentinio plano parinkimas, veiksmų visuma, skirta eksperimentavimo strategijai sukurti (nuo a priori informacijos gavimo iki veiksmingo matematinio modelio gavimo ar optimalių sąlygų nustatymo). Tai tikslinga eksperimento kontrolė, vykdoma neišsamių žinių apie tiriamo reiškinio mechanizmą sąlygomis.

Atliekant matavimus, vėliau apdorojant duomenis, taip pat įforminant rezultatus matematinio modelio forma, atsiranda klaidų ir prarandama dalis pirminiuose duomenyse esančios informacijos. Eksperimentinio planavimo metodų naudojimas leidžia nustatyti matematinio modelio paklaidą ir spręsti apie jo tinkamumą. Jeigu modelio tikslumas pasirodo nepakankamas, tai eksperimentinio planavimo metodų panaudojimas leidžia modernizuoti matematinį modelį papildomais eksperimentais neprarandant ankstesnės informacijos ir su minimaliomis sąnaudomis.

Eksperimento planavimo tikslas – surasti tokias eksperimentų vykdymo sąlygas ir taisykles, kurioms esant būtų galima gauti patikimą ir patikimą informaciją apie objektą su minimaliu darbo krūviu, taip pat pateikti šią informaciją kompaktiška ir patogia forma. su kiekybiniu tikslumo įvertinimu.

Tarp pagrindinių planavimo metodų, naudojamų įvairiuose tyrimo etapuose:

Suplanuoti atrankos eksperimentą, kurio pagrindinė reikšmė yra reikšmingų veiksnių grupės, kuriai taikomas tolesnis išsamus tyrimas, atranka iš viso veiksnių rinkinio;

Eksperimentinis dizainas ANOVA, t.y. objektų planų sudarymas su kokybiniais veiksniais;

Regresijos eksperimento planavimas, leidžiantis gauti regresijos modelius (polinominius ir kitus);

Ekstremalaus eksperimento planavimas, kurio pagrindinė užduotis yra eksperimentinis tiriamojo objekto optimizavimas;

Planavimas studijuojant dinaminius procesus ir kt.

Dalykos studijų tikslas – parengti studentus gamybinei ir techninei veiklai pagal specialybę, taikant planavimo teorijos metodus ir šiuolaikines informacines technologijas.

Dalykos uždaviniai: šiuolaikinių mokslinių ir pramoninių eksperimentų planavimo, organizavimo ir optimizavimo metodų studijavimas, eksperimentų vykdymas ir gautų rezultatų apdorojimas.

1. KORELIACIJOS ANALIZĖ

1.1 Koreliacijos samprata

Tyrėjas dažnai domisi, kaip du ar daugiau kintamųjų yra susiję vienas su kitu vienoje ar keliose tiriamose imtyse. Pavyzdžiui, ar ūgis gali turėti įtakos žmogaus svoriui, ar kraujospūdis gali turėti įtakos produkto kokybei?

Tokia priklausomybė tarp kintamųjų vadinama koreliacija arba koreliacija. Koreliacija yra nuoseklus dviejų savybių pokytis, atspindintis tai, kad vienos charakteristikos kintamumas atitinka kitos charakteristikos kintamumą.

Pavyzdžiui, žinoma, kad vidutiniškai yra teigiamas ryšys tarp žmonių ūgio ir jų svorio, ir kuo didesnis ūgis, tuo didesnis žmogaus svoris. Tačiau yra šios taisyklės išimčių, kai santykinai žemo ūgio žmonės turi antsvorio, o, atvirkščiai, aukšto ūgio asteniški žmonės turi mažą svorį. Tokių išimčių priežastis yra ta, kad kiekvieną biologinį, fiziologinį ar psichologinį požymį lemia daugelio veiksnių įtaka: aplinkos, genetinių, socialinių, aplinkos ir kt.

Koreliaciniai ryšiai yra tikimybiniai pokyčiai, kuriuos galima tirti tik reprezentatyviose imtyse, naudojant matematinės statistikos metodus. Abu terminai – koreliacijos ryšys ir priklausomybė nuo koreliacijos – dažnai vartojami pakaitomis. Priklausomybė reiškia įtaką, ryšį – bet kokius suderintus pokyčius, kuriuos galima paaiškinti šimtais priežasčių. Koreliaciniai ryšiai negali būti laikomi priežasties ir pasekmės ryšio įrodymu, jie tik rodo, kad vienos charakteristikos pokyčius dažniausiai lydi tam tikri kiti pokyčiai.

Koreliacinė priklausomybė - Tai yra pokyčiai, kurie įveda vienos charakteristikos reikšmes į tikimybę, kad kitos charakteristikos skirtingos reikšmės atsiras.

Koreliacinės analizės užduotis yra nustatyti ryšio tarp kintančių charakteristikų kryptį (teigiama ar neigiama) ir formą (tiesinė, netiesinė), išmatuoti jo artumą ir, galiausiai, patikrinti gautų koreliacijos koeficientų reikšmingumo lygį.

Koreliaciniai ryšiai skiriasi forma, kryptimi ir laipsniu (stiprumu) .

Koreliacijos ryšio forma gali būti linijinė arba kreivinė. Pavyzdžiui, ryšys tarp treniruočių treniruokliu skaičiaus ir teisingai išspręstų problemų skaičiaus kontrolinės sesijos metu gali būti aiškus. Pavyzdžiui, motyvacijos lygio ir užduoties efektyvumo ryšys gali būti kreivinis (1 pav.). Didėjant motyvacijai, pirmiausia didėja užduoties atlikimo efektyvumas, tada pasiekiamas optimalus motyvacijos lygis, atitinkantis maksimalų užduoties atlikimo efektyvumą; Tolesnį motyvacijos didėjimą lydi efektyvumo mažėjimas.

1 pav. Ryšys tarp problemų sprendimo efektyvumo ir motyvacinių tendencijų stiprumo

Krypties atžvilgiu koreliacijos ryšys gali būti teigiamas („tiesioginis“) ir neigiamas („atvirkštinis“). Esant teigiamai tiesinei koreliacijai, didesnės vienos charakteristikos vertės atitinka didesnes kitos charakteristikos reikšmes, o mažesnės vienos charakteristikos vertės – žemas kitos (2 pav.). Esant neigiamai koreliacijai, santykiai yra atvirkštiniai (3 pav.). Esant teigiamai koreliacijai, koreliacijos koeficientas turi teigiamą ženklą, esant neigiamam – neigiamą.

2 pav. Tiesioginė koreliacija

3 paveikslas – atvirkštinė koreliacija


4 pav. Koreliacijos nėra

Koreliacijos laipsnį, stiprumą ar artumą lemia koreliacijos koeficiento reikšmė. Ryšio stiprumas nepriklauso nuo jo krypties ir nustatomas pagal absoliučią koreliacijos koeficiento reikšmę.

1.2 Bendroji koreliacijų klasifikacija

Priklausomai nuo koreliacijos koeficiento, išskiriamos šios koreliacijos:

Stiprus arba artimas su koreliacijos koeficientu r>0,70;

Vidutinis (0,50

Vidutinis (0.30 val

Silpnas (0.20

Labai silpnas (prie r<0,19).

1.3 Koreliacijos laukai ir jų sudarymo paskirtis

Koreliacija tiriama remiantis eksperimentiniais duomenimis, kurie yra dviejų charakteristikų išmatuotos vertės (x i, y i). Jei eksperimentinių duomenų yra mažai, dvimatis empirinis pasiskirstymas vaizduojamas kaip dviguba reikšmių x i ir y i eilutė. Tuo pačiu metu charakteristikų koreliacijos priklausomybę galima apibūdinti įvairiai. Argumento ir funkcijos atitikimą galima pateikti lentele, formule, grafiku ir kt.

Koreliacinė analizė, kaip ir kiti statistiniai metodai, yra pagrįsta tikimybinių modelių, apibūdinančių tiriamų charakteristikų elgesį tam tikroje bendrojoje populiacijoje, iš kurios gaunamos eksperimentinės reikšmės xi ir y i, naudojimu. Tiriant koreliaciją tarp kiekybinių charakteristikų, kurių reikšmes galima tiksliai išmatuoti metrinių skalių vienetais (metrais, sekundėmis, kilogramais ir kt.), labai dažnai imamasi dvimatis normaliai pasiskirstęs populiacijos modelis. Toks modelis atvaizduoja ryšį tarp kintamųjų x i ir y i grafiškai kaip geometrinę taškų vietą stačiakampių koordinačių sistemoje. Šis grafinis ryšys taip pat vadinamas sklaidos diagrama arba koreliacijos lauku.
Šis dvimačio normaliojo skirstinio (koreliacijos lauko) modelis leidžia aiškiai grafiškai interpretuoti koreliacijos koeficientą, nes pasiskirstymas iš viso priklauso nuo penkių parametrų: μ x, μ y – vidutinės reikšmės (matematiniai lūkesčiai); σ x ,σ y – atsitiktinių dydžių X ir Y standartiniai nuokrypiai ir p – koreliacijos koeficientas, kuris yra atsitiktinių dydžių X ir Y ryšio matas.
Jei p = 0, tai reikšmės x i , y i, gautos iš dvimatės normaliosios populiacijos, yra grafike x, y koordinatėse apskritimo apribotoje srityje (5 pav., a). Šiuo atveju tarp atsitiktinių dydžių X ir Y nėra koreliacijos ir jie vadinami nekoreliuojančiais. Dvimačio normaliojo pasiskirstymo atveju nekoreliacija vienu metu reiškia atsitiktinių dydžių X ir Y nepriklausomybę.

Tiriant visuomenės sveikatą ir sveikatos priežiūrą moksliniais ir praktiniais tikslais, tyrėjui dažnai tenka atlikti statistinę statistinės visumos veiksnių ir veiklos charakteristikų ryšių analizę (priežastinį ryšį) arba nustatyti lygiagrečių pokyčių priklausomybę nuo kelių šios populiacijos charakteristikų. dėl kokios nors trečiosios vertės (dėl jų bendros priežasties). Būtina mokėti ištirti šio ryšio ypatybes, nustatyti jo dydį ir kryptį, taip pat įvertinti jo patikimumą. Šiuo tikslu naudojami koreliacijos metodai.

  1. Kiekybinių ryšių tarp požymių pasireiškimo tipai
    • funkcinis ryšys
    • koreliacinis ryšys
  2. Funkcinio ir koreliacinio ryšio apibrėžimai

    Funkcinis ryšys- tokio tipo ryšys tarp dviejų charakteristikų, kai kiekviena vienos iš jų reikšmė atitinka griežtai apibrėžtą kitos reikšmę (apskritimo plotas priklauso nuo apskritimo spindulio ir pan.). Funkcinis ryšys būdingas fizikiniams ir matematiniams procesams.

    Koreliacija- toks ryšys, kai kiekviena konkreti vienos charakteristikos reikšmė atitinka keletą su ja susijusių kitos charakteristikos reikšmių (žmogaus ūgio ir svorio santykis; kūno temperatūros ir pulso dažnio santykis ir kt.). Koreliacija būdinga medicininiams ir biologiniams procesams.

  3. Praktinė koreliacinio ryšio nustatymo reikšmė. Priežastinių ir pasekmių sąsajų tarp veiksnio ir sukeliamų savybių nustatymas (vertinant fizinį išsivystymą, nustatyti ryšį tarp darbo sąlygų, gyvenimo sąlygų ir sveikatos būklės, nustatant susirgimų dažnio priklausomybę nuo amžiaus, darbo stažo, profesinių pavojų buvimas ir kt.)

    Lygiagrečių kelių charakteristikų pokyčių priklausomybė nuo kokios nors trečiosios reikšmės. Pavyzdžiui, veikiant aukštai temperatūrai dirbtuvėse, pakinta kraujospūdis, kraujo klampumas, pulso dažnis ir kt.

  4. Vertė, apibūdinanti charakteristikų santykio kryptį ir stiprumą. Koreliacijos koeficientas, kuris viename skaičiuje leidžia suprasti ryšio tarp ženklų (reiškinių) kryptį ir stiprumą, jo svyravimų ribas nuo 0 iki ± 1
  5. Koreliacijų pateikimo metodai
    • grafikas (taškinė diagrama)
    • koreliacijos koeficientas
  6. Koreliacijos kryptis
    • tiesiai
    • atvirkščiai
  7. Koreliacijos stiprumas
    • stiprus: ±0,7–±1
    • vidurkis: ±0,3–±0,699
    • silpnas: nuo 0 iki ±0,299
  8. Koreliacijos koeficiento nustatymo metodai ir formulės
    • kvadratų metodas (Pearson metodas)
    • rango metodas (Spearman metodas)
  9. Koreliacijos koeficiento naudojimo metodiniai reikalavimai
    • Išmatuoti ryšį galima tik kokybiškai homogeniškose populiacijose (pavyzdžiui, išmatuoti ūgio ir svorio santykį populiacijose, kurios yra vienalytės pagal lytį ir amžių).
    • apskaičiavimas gali būti atliekamas naudojant absoliučias arba išvestines vertes
    • koreliacijos koeficientui apskaičiuoti naudojamos negrupuotos variacijų eilutės (šis reikalavimas galioja tik skaičiuojant koreliacijos koeficientą kvadratų metodu)
    • stebėjimų skaičius ne mažesnis kaip 30
  10. Rekomendacijos naudoti rangų koreliacijos metodą (Spearmano metodas)
    • kai nereikia tiksliai nustatyti ryšio stiprumo, bet pakanka apytikslių duomenų
    • kai charakteristikos vaizduojamos ne tik kiekybinėmis, bet ir atributinėmis reikšmėmis
    • kai charakteristikų paskirstymo serijoje yra atvirų pasirinkimų (pavyzdžiui, darbo patirtis iki 1 metų ir kt.)
  11. Kvadratų metodo naudojimo rekomendacijos (Pirsono metodas)
    • kai reikia tiksliai nustatyti ryšio tarp charakteristikų stiprumą
    • kai ženklai turi tik kiekybinę išraišką
  12. Koreliacijos koeficiento apskaičiavimo metodika ir tvarka

    1) Kvadratų metodas

    2) Reitingo metodas

  13. Koreliacijos ryšio įvertinimo naudojant koreliacijos koeficientą schema
  14. Koreliacijos koeficiento paklaidos skaičiavimas
  15. Koreliacijos koeficiento, gauto ranginės koreliacijos metodu ir kvadratų metodu, patikimumo įvertinimas

    1 būdas
    Patikimumas nustatomas pagal formulę:

    Kriterijus t vertinamas naudojant t reikšmių lentelę, atsižvelgiant į laisvės laipsnių skaičių (n - 2), kur n yra suporuotų variantų skaičius. Kriterijus t turi būti lygus arba didesnis nei lentelėje vienas, atitinkantis tikimybę p ≥99%.

    2 metodas
    Patikimumas vertinamas naudojant specialią standartinių koreliacijos koeficientų lentelę. Šiuo atveju koreliacijos koeficientas laikomas patikimu, kai, esant tam tikram laisvės laipsnių skaičiui (n - 2), jis yra lygus arba didesnis nei lentelės koeficientas, atitinkantis prognozės be klaidų laipsnį p ≥95%. .

naudoti kvadratų metodą

Pratimas: apskaičiuokite koreliacijos koeficientą, nustatykite kalcio kiekio vandenyje ir vandens kietumo ryšio kryptį ir stiprumą, jei žinomi šie duomenys (1 lentelė). Įvertinkite santykių patikimumą. Padarykite išvadą.

1 lentelė

Metodo pasirinkimo pagrindimas. Problemai išspręsti buvo pasirinktas kvadratų metodas (Pearson), nes kiekvienas iš ženklų (vandens kietumas ir kalcio kiekis) turi skaitinę išraišką; nėra atviro varianto.

Sprendimas.
Skaičiavimų seka aprašyta tekste, rezultatai pateikti lentelėje. Sukūrę suporuotų palyginamų charakteristikų serijas, pažymėkite jas x (vandens kietumas laipsniais) ir y (kalcio kiekis vandenyje mg/l).

Vandens kietumas
(laipsniais)
Kalcio kiekis vandenyje
(mg/l)
d x d m d x x d y d x 2 d y 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
M x =Σ x / n M y = Σ y / n Σ d x x d y =7078 Σ d x 2 = 982 Σ d y 2 =51056
M x = 120/6 = 20 M y = 852/6 = 142
  1. Nustatykite vidutines M x reikšmes eilutės variante „x“ ir M y eilutėje „y“ naudodami formules:
    M x = Σх/n (1 stulpelis) ir
    M y = Σу/n (2 stulpelis)
  2. Raskite kiekvieno varianto nuokrypį (d x ir d y) nuo apskaičiuoto vidurkio reikšmės eilutėse „x“ ir „y“ serijose
    d x = x - M x (3 stulpelis) ir d y = y - M y (4 stulpelis).
  3. Raskite nuokrypių d x x d y sandaugą ir susumuokite: Σ d x x d y (5 stulpelis)
  4. Kiekvieną nuokrypį d x ir d y padėkite kvadratu ir susukite jų reikšmes išilgai „x“ ir „y“ eilučių: Σ d x 2 = 982 (6 stulpelis) ir Σ d y 2 = 51056 (7 stulpelis).
  5. Nustatykite sandaugą Σ d x 2 x Σ d y 2 ir iš jo išimkite kvadratinę šaknį
  6. Gautos reikšmės Σ (d x x d y) ir √ (Σd x 2 x Σd y 2) koreliacijos koeficiento apskaičiavimo formulę pakeiskite:
  7. Nustatykite koreliacijos koeficiento patikimumą:
    1-as metodas. Raskite koreliacijos koeficiento (mr xy) ir t kriterijaus paklaidą naudodami formules:

    Kriterijus t = 14,1, o tai atitinka beklaidės prognozės tikimybę p > 99,9%.

    2-as metodas. Koreliacijos koeficiento patikimumas vertinamas naudojant lentelę „Standartiniai koreliacijos koeficientai“ (žr. 1 priedą). Kai laisvės laipsnių skaičius (n - 2) = 6 - 2 = 4, mūsų apskaičiuotas koreliacijos koeficientas r xу = + 0,99 yra didesnis už pateiktą lentelėje (r lentelė = + 0,917, kai p = 99%).

    Išvada. Kuo daugiau kalcio vandenyje, tuo jis kietesnis (ryšys tiesioginis, stiprus ir autentiškas: r xy = + 0,99, p > 99,9 %).

    naudoti reitingavimo metodą

    Pratimas: rango metodu nustatyti ryšio tarp metų darbo stažo ir traumų dažnio kryptį ir stiprumą, jei gaunami šie duomenys:

    Metodo pasirinkimo pagrindimas: Problemai išspręsti galima pasirinkti tik rangų koreliacijos metodą, nes Pirmoje atributo „darbo patirtis metais“ eilutėje yra atviros galimybės (darbo patirtis iki 1 metų ir 7 ar daugiau metų), kurios neleidžia ryšiui užmegzti naudoti tikslesnio metodo - kvadratų metodo. tarp lyginamų charakteristikų.

    Sprendimas. Skaičiavimų seka pateikta tekste, rezultatai pateikti lentelėje. 2.

    2 lentelė

    Darbo patirtis metų Sužalojimų skaičius Eiliniai skaičiai (gretai) Reitingų skirtumas Kvadratinis rangų skirtumas
    X Y d(x-y) d 2
    Iki 1 metų 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 ar daugiau 6 5 1 +4 16
    Σ d 2 = 38,5

    Standartiniai koreliacijos koeficientai, kurie laikomi patikimais (pagal L.S. Kaminsky)

    Laisvės laipsnių skaičius – 2 Tikimybės lygis p (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Vlasovas V.V. Epidemiologija. - M.: GEOTAR-MED, 2004. - 464 p.
    2. Lisitsyn Yu.P. Visuomenės sveikata ir sveikatos priežiūra. Vadovėlis universitetams. - M.: GEOTAR-MED, 2007. - 512 p.
    3. Medikas V.A., Jurjevas V.K. Visuomenės sveikatos ir sveikatos priežiūros paskaitų kursas: 1 dalis. Visuomenės sveikata. - M.: Medicina, 2003. - 368 p.
    4. Minyajevas V.A., Višniakovas N.I. ir kt. Socialinės medicinos ir sveikatos priežiūros organizavimas (vadovas 2 tomai). - Sankt Peterburgas, 1998. -528 p.
    5. Kučerenko V.Z., Agarkovas N.M. ir kt. Socialinės higienos ir sveikatos priežiūros organizavimas (Mokomoji medžiaga) - Maskva, 2000. - 432 p.
    6. S. Glanzas. Medicinos ir biologijos statistika. Vertimas iš anglų kalbos - M., Praktika, 1998. - 459 p.

Regresinė ir koreliacinė analizė yra statistinio tyrimo metodai. Tai yra dažniausiai pasitaikantys būdai parodyti parametro priklausomybę nuo vieno ar kelių nepriklausomų kintamųjų.

Toliau, naudodamiesi konkrečiais praktiniais pavyzdžiais, apsvarstysime šias dvi labai populiarias ekonomistų analizes. Taip pat pateiksime rezultatų gavimo pavyzdį juos derinant.

Regresinė analizė programoje Excel

Rodo kai kurių reikšmių (nepriklausomų, nepriklausomų) įtaką priklausomam kintamajam. Pavyzdžiui, kaip ekonomiškai aktyvių gyventojų skaičius priklauso nuo įmonių skaičiaus, darbo užmokesčio ir kitų parametrų. Arba: kaip BVP lygį veikia užsienio investicijos, energijos kainos ir pan.

Analizės rezultatas leidžia išryškinti prioritetus. Ir pagal pagrindinius veiksnius numatyti, planuoti prioritetinių sričių plėtrą ir priimti valdymo sprendimus.

Regresija vyksta:

  • tiesinis (y = a + bx);
  • parabolinis (y = a + bx + cx 2);
  • eksponentinis (y = a * exp(bx));
  • galia (y = a*x^b);
  • hiperbolinis (y = b/x + a);
  • logaritminis (y = b * 1n(x) + a);
  • eksponentinis (y = a * b^x).

Pažiūrėkime į regresijos modelio kūrimo Excel programoje ir rezultatų interpretavimo pavyzdį. Paimkime tiesinį regresijos tipą.

Užduotis. 6 įmonėse buvo analizuojamas vidutinis mėnesinis atlyginimas ir išeinančių iš darbuotojų skaičius. Būtina nustatyti išeinančių iš darbuotojų skaičiaus priklausomybę nuo vidutinio darbo užmokesčio.

Linijinės regresijos modelis atrodo taip:

Y = a 0 + a 1 x 1 +…+a k x k.

Kur a yra regresijos koeficientai, x yra įtakojantys kintamieji, k yra veiksnių skaičius.

Mūsų pavyzdyje Y yra darbuotojų išėjimo iš darbo rodiklis. Įtakos veiksnys yra darbo užmokestis (x).

„Excel“ turi integruotas funkcijas, kurios gali padėti apskaičiuoti tiesinės regresijos modelio parametrus. Tačiau „Analytics Package“ priedas tai padarys greičiau.

Suaktyviname galingą analitinį įrankį:

Suaktyvinus priedą bus galima rasti skirtuke Duomenys.

Dabar atlikime pačią regresinę analizę.



Pirmiausia atkreipiame dėmesį į R kvadratą ir koeficientus.

R kvadratas yra determinacijos koeficientas. Mūsų pavyzdyje – 0,755, arba 75,5%. Tai reiškia, kad skaičiuojami modelio parametrai paaiškina 75,5 % ryšio tarp tiriamų parametrų. Kuo didesnis determinacijos koeficientas, tuo geresnis modelis. Gerai – virš 0,8. Blogai – mažiau nei 0,5 (tokia analizė vargu ar gali būti laikoma pagrįsta). Mūsų pavyzdyje – „neblogai“.

Koeficientas 64,1428 parodo, koks bus Y, jei visi nagrinėjamo modelio kintamieji yra lygūs 0. Tai yra, analizuojamo parametro reikšmei įtakos turi ir kiti modelyje neaprašyti veiksniai.

Koeficientas -0,16285 rodo kintamojo X svorį Y. Tai reiškia, kad vidutinis mėnesinis atlyginimas pagal šį modelį įtakoja išstojusiųjų skaičių, kurio svoris yra -0,16285 (tai yra nedidelis įtakos laipsnis). „-“ ženklas rodo neigiamą poveikį: kuo didesnis atlyginimas, tuo mažiau žmonių išeina iš darbo. Kas yra sąžininga.



Koreliacijos analizė programoje Excel

Koreliacinė analizė padeda nustatyti, ar yra ryšys tarp rodiklių vienoje ar dviejose imtyse. Pavyzdžiui, tarp mašinos veikimo laiko ir remonto išlaidų, įrangos kainos ir eksploatacijos trukmės, vaikų ūgio ir svorio ir kt.

Jei ryšys yra, ar vieno parametro padidėjimas lemia kito padidėjimą (teigiama koreliacija) ar sumažėjimą (neigiama). Koreliacinė analizė padeda analitikui nustatyti, ar vieno rodiklio reikšmė gali būti naudojama prognozuojant galimą kito rodiklio vertę.

Koreliacijos koeficientas žymimas r. Varijuoja nuo +1 iki -1. Skirtingų sričių koreliacijų klasifikacija bus skirtinga. Kai koeficientas yra 0, tarp imčių nėra tiesinio ryšio.

Pažiūrėkime, kaip rasti koreliacijos koeficientą naudojant „Excel“.

Norint rasti suporuotus koeficientus, naudojama funkcija CORREL.

Tikslas: nustatyti, ar yra ryšys tarp tekinimo staklių veikimo laiko ir jos priežiūros išlaidų.

Perkelkite žymeklį į bet kurį langelį ir paspauskite fx mygtuką.

  1. Kategorijoje „Statistika“ pasirinkite funkciją CORREL.
  2. Argumentas „1 masyvas“ - pirmasis reikšmių diapazonas - mašinos veikimo laikas: A2:A14.
  3. Argumentas „Array 2“ - antrasis verčių diapazonas - remonto kaina: B2:B14. Spustelėkite Gerai.

Norint nustatyti ryšio tipą, reikia pažvelgti į absoliutų koeficiento skaičių (kiekviena veiklos sritis turi savo skalę).

Kelių parametrų (daugiau nei 2) koreliacinei analizei patogiau naudoti „Duomenų analizę“ (priedas „Analysis Package“). Iš sąrašo turite pasirinkti koreliaciją ir nurodyti masyvą. Visi.

Gauti koeficientai bus rodomi koreliacijos matricoje. kaip tai:

Koreliacinė ir regresinė analizė

Praktikoje šie du būdai dažnai naudojami kartu.

Pavyzdys:


Dabar regresinės analizės duomenys tapo matomi.

Bet koks gamtos ar visuomenės vystymosi dėsnis gali būti pavaizduotas santykių visumos aprašymu. Jei šios priklausomybės yra stochastinės, o analizė atliekama naudojant imtį iš bendros populiacijos, tada ši tyrimų sritis yra susijusi su statistinio priklausomybių tyrimo užduotimis, apimančiomis koreliacijos, regresijos, dispersijos, kovariacijos analizę ir analizę. nenumatytų atvejų lentelės.

    Ar yra ryšys tarp tiriamų kintamųjų?

    Kaip išmatuoti ryšių glaudumą?

Bendra parametrų ryšio diagrama statistiniame tyrime parodyta fig. 1.

S paveiksle yra tiriamo realaus objekto modelis Aiškinamieji (nepriklausomi, faktoriniai) kintamieji apibūdina objekto veikimo sąlygas. Atsitiktiniai veiksniai yra veiksniai, į kurių įtaką sunku atsižvelgti arba kurių įtaka šiuo metu nepaisoma. Gauti (priklausomi, paaiškinami) kintamieji apibūdina objekto funkcionavimo rezultatą.

Ryšio analizės metodas pasirenkamas atsižvelgiant į analizuojamų kintamųjų pobūdį.

Koreliacinė analizė yra statistinių duomenų apdorojimo metodas, kurio metu tiriamas ryšys tarp kintamųjų.

Koreliacinės analizės tikslas yra pateikti tam tikrą informaciją apie vieną kintamąjį naudojant kitą kintamąjį. Tais atvejais, kai įmanoma pasiekti tikslą, sakoma, kad kintamieji yra koreliuojami. Koreliacija atspindi tik tiesinę verčių priklausomybę, bet neatspindi jų funkcinio ryšio. Pavyzdžiui, jei apskaičiuosite koreliacijos koeficientą tarp dydžių A = sin(x) ir B = cos(x), tai jis bus artimas nuliui, t.y. nėra ryšio tarp kiekių.

Tiriant koreliaciją, naudojami grafiniai ir analitiniai metodai.

Grafinė analizė prasideda nuo koreliacijos lauko konstravimo. Koreliacijos laukas (arba sklaidos diagrama) yra grafinis ryšys tarp dviejų charakteristikų matavimo rezultatų. Norėdami jį sukurti, pradiniai duomenys nubraižyti grafike, kuriame kiekviena reikšmių pora (xi, yi) rodoma kaip taškas su koordinatėmis xi ir yi stačiakampėje koordinačių sistemoje.

Vizuali koreliacijos lauko analizė leidžia daryti prielaidą apie dviejų tiriamų rodiklių ryšio formą ir kryptį. Pagal ryšio formą koreliacinės priklausomybės dažniausiai skirstomos į tiesines (žr. 1 pav.) ir netiesines (žr. 2 pav.). Esant tiesinei priklausomybei, koreliacijos lauko gaubė yra artima elipsei. Dviejų atsitiktinių dydžių linijinis ryšys yra tas, kad vienam atsitiktiniam dydžiui didėjant, kitas atsitiktinis dydis didėja (arba mažėja) pagal tiesinį dėsnį.

Ryšio kryptis yra teigiama, jei vieno požymio vertės padidėjimas lemia antrojo požymio vertės padidėjimą (žr. 3 pav.), o neigiamas, jei vieno požymio vertės padidėjimas lemia vertės sumažėjimą. antrojo (žr. 4 pav.).

Priklausomybės, turinčios tik teigiamas arba tik neigiamas kryptis, vadinamos monotoninėmis.

Statistinių metodų panaudojimas apdorojant psichologinių tyrimų medžiagą suteikia puikią galimybę iš eksperimentinių duomenų išgauti naudingos informacijos. Vienas iš labiausiai paplitusių statistinių metodų yra koreliacinė analizė.

Terminą „koreliacija“ pirmasis pavartojo prancūzų paleontologas J. Cuvier, išvedęs „gyvūnų dalių ir organų koreliacijos dėsnį“ (šis dėsnis leidžia atkurti viso gyvūno išvaizdą iš rastų kūno dalių). Šį terminą į statistiką įvedė anglų biologas ir statistikas F. Galtonas (ne tik „ryšys“ - santykį, ir „tarsi būtų ryšys“ – koreliacija).

Koreliacinė analizė – tai hipotezių apie ryšius tarp kintamųjų tikrinimas naudojant koreliacijos koeficientus, dvimatę aprašomąją statistiką, kiekybinį dviejų kintamųjų ryšio (jungtinio kintamumo) matą. Taigi, tai yra atsitiktinių dydžių ar charakteristikų koreliacijų nustatymo metodų rinkinys.

Dviejų atsitiktinių dydžių koreliacinė analizė apima:

  • koreliacijos lauko sudarymas ir koreliacijos lentelės sudarymas;
  • imties koreliacijos koeficientų ir koreliacinių ryšių skaičiavimas;
  • tikrinant statistinę ryšio reikšmingumo hipotezę.

Pagrindinis koreliacinės analizės tikslas yra nustatyti ryšį tarp dviejų ar daugiau tiriamų kintamųjų, kurie yra laikomi jungtiniu koordinuotu dviejų tiriamų charakteristikų pokyčiu. Šis kintamumas turi tris pagrindines charakteristikas: formą, kryptį ir stiprumą.

Koreliacijos forma gali būti tiesinė arba netiesinė. Linijinė forma yra patogesnė koreliacijos ryšiui nustatyti ir interpretuoti. Linijinio koreliacinio ryšio atveju galima išskirti dvi pagrindines kryptis: teigiamą („tiesioginis ryšys“) ir neigiamą („grįžtamasis ryšys“).

Ryšio stiprumas tiesiogiai parodo, kiek ryškus yra tirtų kintamųjų bendras kintamumas. Psichologijoje funkcinis reiškinių ryšys gali būti empiriškai identifikuojamas tik kaip tikimybinis atitinkamų savybių ryšys. Aiškią idėją apie tikimybinio ryšio pobūdį suteikia sklaidos diagrama - grafikas, kurio ašys atitinka dviejų kintamųjų reikšmes, o kiekvienas subjektas reiškia tašką.

Kaip skaitinė tikimybinio ryšio charakteristika, naudojami koreliacijos koeficientai, kurių reikšmės svyruoja nuo –1 iki +1. Atlikęs skaičiavimus, tyrėjas, kaip taisyklė, atrenka tik stipriausias koreliacijas, kurios toliau aiškinamos (1 lentelė).

„Pakankamai stiprių“ koreliacijų pasirinkimo kriterijus gali būti arba paties koreliacijos koeficiento absoliuti reikšmė (nuo 0,7 iki 1), arba santykinė šio koeficiento reikšmė, nustatoma pagal statistinio reikšmingumo lygį (nuo 0,01 iki 0,1), priklausomai nuo pagal imties dydį. Mažose imtyse teisingiau atrinkti stiprias koreliacijas tolimesniam aiškinimui remiantis statistinio reikšmingumo lygiu. Atliekant tyrimus su dideliais mėginiais, geriau naudoti absoliučias koreliacijos koeficientų vertes.

Taigi koreliacinės analizės uždavinys yra nustatyti ryšio tarp kintamų charakteristikų kryptį (teigiama ar neigiama) ir formą (tiesinė, netiesinė), išmatuoti jo sandarumą ir, galiausiai, patikrinti gautų koreliacijos koeficientų reikšmingumo lygį. .

Šiuo metu sukurta daug įvairių koreliacijos koeficientų. Dažniausiai naudojami yra r- Pearsonas, r-Spirmenas ir τ -Kendall. Šiuolaikinės kompiuterinės statistikos programos meniu „Koreliacijos“ siūlo būtent šiuos tris koeficientus, o kitų tyrimo problemų sprendimui siūlomi grupių palyginimo metodai.

Koreliacijos koeficiento skaičiavimo metodo pasirinkimas priklauso nuo skalės, kuriai priklauso kintamieji, tipo (2 lentelė).

Intervaliniams ir vardiniams skalės kintamiesiems naudojamas Pirsono koreliacijos koeficientas (produkto momento koreliacija). Jei bent vienas iš dviejų kintamųjų yra eilės skalėje arba nėra normaliai pasiskirstęs, naudojama Spearmano rango koreliacija arba

t-Kendall. Jei vienas iš dviejų kintamųjų yra dvilypis, galima naudoti taškinę dviserialę koreliaciją (ši funkcija nėra statistinėje kompiuterinėje programoje SPSS, vietoje jos gali būti naudojami rangų koreliacijos skaičiavimai). Jei abu kintamieji yra dichotominiai, naudojama keturių laukų koreliacija (šio tipo koreliaciją apskaičiuoja SPSS, remdamasis atstumo matų ir panašumo matų apibrėžimu). Koreliacijos koeficiento tarp dviejų nedichotominių kintamųjų skaičiavimas galimas tik tada, kai ryšys tarp jų yra tiesinis (vienkryptis). Jei ryšys, pvz. U-formos (dviprasmiškas), koreliacijos koeficientas netinka naudoti kaip ryšio stiprumo matas: jo reikšmė linkusi į nulį.

Taigi koreliacijos koeficientų taikymo sąlygos bus tokios:

  • kintamieji, išmatuoti kiekybine (rangos, metrine) skale toje pačioje objektų imtyje;
  • ryšys tarp kintamųjų yra monotoniškas.

Pagrindinė statistinė hipotezė, kuri tikrinama koreliacine analize, yra nekryptinė ir apima teiginį, kad koreliacija populiacijoje yra lygi nuliui. H 0: r xy= 0. Jei ji atmetama, alternatyvi hipotezė priimama H 1: r xy≠ 0 rodo teigiamos arba neigiamos koreliacijos buvimą, priklausomai nuo apskaičiuoto koreliacijos koeficiento ženklo.

Remiantis hipotezių priėmimu arba atmetimu, daromos prasmingos išvados. Jei pagal statistinio testavimo rezultatus H 0: r xy= 0 nenukrypsta lygiu a, tada prasminga išvada bus tokia: ryšys tarp X Ir Y nerasta. Jei pas H 0 r xy= 0 nukrypsta lygiu a, o tai reiškia, kad buvo aptiktas teigiamas (neigiamas) ryšys X Ir Y. Tačiau į nustatytų koreliacijų aiškinimą reikia žiūrėti atsargiai. Moksliniu požiūriu, vien tik dviejų kintamųjų ryšio nustatymas nereiškia, kad egzistuoja priežasties ir pasekmės ryšys. Be to, koreliacijos buvimas nenustato sekos ryšio tarp priežasties ir pasekmės. Tai tiesiog rodo, kad du kintamieji yra susiję vienas su kitu labiau, nei būtų galima tikėtis atsitiktinai. Tačiau jei elgiamasi atsargiai, koreliacinių metodų naudojimas tiriant priežasties ir pasekmės ryšius yra pagrįstas. Turėtumėte vengti kategoriškų frazių, tokių kaip „kintamasis X yra rodiklio padidėjimo priežastis Y“ Tokie teiginiai turėtų būti suformuluoti kaip prielaidos, kurios turi būti teoriškai griežtai pagrįstos.

Išsamus kiekvieno koreliacijos koeficiento matematinės procedūros aprašymas pateiktas matematinės statistikos vadovėliuose; ; ; tt Apsiribosime šių koeficientų naudojimo galimybe, priklausomai nuo matavimo skalės tipo.

Metrinių kintamųjų koreliacija

Jis naudojamas dviejų toje pačioje imtyje išmatuotų metrinių kintamųjų santykiams tirti koreliacijos koeficientas r- Pearsonas. Pats koeficientas apibūdina tik linijinį ryšį tarp charakteristikų, paprastai žymimų simboliais. X Ir Y. Tiesinės koreliacijos koeficientas yra parametrinis metodas ir teisingai jį naudoti galima tik tuo atveju, jei matavimo rezultatai pateikiami intervalų skalėje, o reikšmių pasiskirstymas analizuojamuose kintamuosiuose nuo įprasto skiriasi tik nežymiai. Yra daug situacijų, kai jo naudojimas yra tinkamas. Pavyzdžiui: ryšio tarp studento intelekto ir jo akademinių rezultatų užmezgimas; tarp nuotaikos ir sėkmės išbristi iš probleminės situacijos; tarp pajamų lygio ir temperamento ir kt.

Pirsono koeficientas plačiai naudojamas psichologijoje ir pedagogikoje. Pavyzdžiui, I. Ya Kaplunovičiaus ir P. D. Rabinovičiaus, M. P. Nuzhdinos darbuose hipotezėms patvirtinti buvo naudojamas Pirsono tiesinės koreliacijos koeficientas.

Apdorojant duomenis rankiniu būdu, būtina apskaičiuoti koreliacijos koeficientą ir tada nustatyti p-reikšmingumo lygis (siekdami supaprastinti duomenų patikrinimą, naudokite kritinių verčių lenteles r xy, kurie sudaromi taikant šį kriterijų). Pirsono tiesinės koreliacijos koeficiento reikšmė negali viršyti +1 ir būti mažesnė nei –1. Šie du skaičiai +1 ir –1 yra koreliacijos koeficiento ribos. Kai apskaičiavimo rezultatas yra didesnis nei +1 arba mažesnė nei –1, tai reiškia, kad skaičiavimuose įvyko klaida.

Skaičiuojant kompiuteriu, statistinė programa (SPSS, Statistica) paskaičiuotą koreliacijos koeficientą pateikia tikslesnę reikšmę. p- lygis.

Dėl statistinio sprendimo priimti ar atmesti H 0 paprastai montuojamas α = 0,05, o esant dideliam stebėjimų kiekiui (100 ar daugiau) α = 0,01. Jeigu p ≤ α, H 0 atmetamas ir daroma prasminga išvada, kad tarp tiriamų kintamųjų rastas statistiškai patikimas (reikšmingas) ryšys (teigiamas arba neigiamas, priklausomai nuo koreliacijos ženklo). Kada p > α, H 0 nėra atmestas, prasminga išvada apsiribojama teiginiu, kad (statistiškai reikšmingas) ryšys nerastas.

Jei ryšys nerastas, bet yra pagrindo manyti, kad ryšys iš tikrųjų yra, turėtumėte patikrinti galimas ryšio nepatikimumo priežastis.

Komunikacijos netiesiškumas– Norėdami tai padaryti, išanalizuokite dvimatę sklaidos diagramą. Jei ryšys yra netiesinis, bet monotoniškas, pereikite prie rangų koreliacijų. Jei ryšys nėra monotoniškas, tada padalykite imtį į dalis, kuriose ryšys yra monotoniškas, ir apskaičiuokite koreliacijas kiekvienai imties daliai atskirai arba padalykite imtį į kontrastingas grupes ir palyginkite jas pagal pavyzdžio išraiškos lygį. bruožas.

Nukrypimų buvimas ir ryškus vienos ar abiejų savybių pasiskirstymo asimetrija. Norėdami tai padaryti, turite pažvelgti į abiejų ypatybių dažnio pasiskirstymo histogramas. Jei yra nuokrypių arba asimetrijų, išskirkite iškrypimus arba pereikite prie koreliacijų reitingavimo.

Imties nevienalytiškumas(analizuokite 2D sklaidos diagramą). Pabandykite suskirstyti imtį į dalis, kuriose santykiai gali turėti skirtingas kryptis.

Jei ryšys yra statistiškai reikšmingas, prieš darant prasmingą išvadą, būtina atmesti klaidingos koreliacijos galimybę:

  • ryšys yra dėl emisijų. Jei yra nuokrypių, pereikite prie rango koreliacijų arba neįtraukite iškrypėlių;
  • ryšys atsiranda dėl trečiojo kintamojo įtakos. Jei toks reiškinys yra, reikia skaičiuoti koreliaciją ne tik visai imčiai, bet ir kiekvienai grupei atskirai. Jei „trečiasis“ kintamasis yra metrinis, apskaičiuokite dalinę koreliaciją.

Dalinės koreliacijos koeficientas r xy -z skaičiuojamas, kai reikia patikrinti prielaidą, kad ryšys tarp dviejų kintamųjų X Ir Y nepriklauso nuo trečiojo kintamojo įtakos Z. Labai dažnai du kintamieji koreliuoja vienas su kitu tik todėl, kad jie abu kartu keičiasi veikiant trečiajam kintamajam. Kitaip tariant, iš tikrųjų nėra jokio ryšio tarp atitinkamų savybių, tačiau jis atsiranda statistiniame santykyje, veikiamas bendros priežasties. Pavyzdžiui, amžius gali būti dažna dviejų kintamųjų kintamumo priežastis tiriant įvairių psichologinių savybių ryšį skirtingo amžiaus grupėje. Aiškinant dalinę koreliaciją priežastinio ryšio požiūriu, reikia būti atsargiems, nes jei Z taip pat koreliuoja su X ir su Y, ir dalinė koreliacija r xy -z yra artimas nuliui, nebūtinai iš to išplaukia, kas tiksliai Z yra dažna priežastis X Ir Y.

Rango kintamųjų koreliacija

Jeigu koreliacijos koeficientas kiekybiniams duomenims nepriimtinas r- Pearsonas, tada norint patikrinti hipotezę apie ryšį tarp dviejų kintamųjų po preliminaraus reitingavimo, galima taikyti koreliacijas r-Ietmenas arba τ -Kendall. Pavyzdžiui, I. A. Lavočkinui tiriant muzikaliai gabių paauglių psichofizines savybes, buvo naudojamas Spearman kriterijus.

Norint teisingai apskaičiuoti abu koeficientus (Spearman ir Kendall), matavimo rezultatai turi būti pateikti rango arba intervalo skalėje. Esminių skirtumų tarp šių kriterijų nėra, tačiau visuotinai pripažįstama, kad Kendall koeficientas yra „prasmingesnis“, nes jis išsamiau ir detaliau analizuoja kintamųjų ryšius, išnagrinėja visus galimus atitikmenis tarp reikšmių porų. Spearmano koeficientas tiksliau atsižvelgia į kiekybinį ryšio tarp kintamųjų laipsnį.

Spearmano rango koreliacijos koeficientas yra neparametrinis klasikinio Pirsono koreliacijos koeficiento analogas, tačiau jį apskaičiuojant atsižvelgiama ne į lyginamų kintamųjų pasiskirstymo rodiklius (aritmetinį vidurkį ir dispersiją), o į rangus. Pavyzdžiui, būtina nustatyti ryšį tarp asmenybės savybių, įtrauktų į asmens „tikrojo savęs“ ir „idealaus savęs“ idėją, reitingavimo.

Spearmano koeficientas plačiai naudojamas psichologiniuose tyrimuose. Pavyzdžiui, Yu V. Bushov ir N. N. Nesmelova darbuose: jis buvo naudojamas tiriant garso signalų trukmės įvertinimo ir atkūrimo tikslumo priklausomybę nuo individualių žmogaus savybių.

Kadangi šis koeficientas yra analogiškas r-Pearson, tada jo naudojimas hipotezėms tikrinti yra panašus į koeficiento naudojimą r- Pearsonas. Tai yra, tikrinama statistinė hipotezė, statistinio sprendimo priėmimo procedūra ir prasmingos išvados formulavimas yra vienodi. Kompiuterinėse programose (SPSS, Statistica) tų pačių koeficientų reikšmingumo lygiai r- Pearsonas ir r-Spirmenas visada sutampa.

Koeficiento pranašumas r-Spearman ir santykis r-Pearson – didesnis jautrumas bendravimui. Naudojame šiais atvejais:

  • reikšmingas bent vieno kintamojo pasiskirstymo nuokrypis nuo įprastos formos (asimetrija, išskirtiniai rodikliai);
  • kreivinio (monotoninio) ryšio atsiradimas.

Koeficiento taikymo apribojimas r- Spearman yra:

  • kiekvienam kintamajam bent 5 stebėjimai;
  • vieno ar abiejų kintamųjų daugelio vienodų rangų koeficientas suteikia apytikslę reikšmę.

Rangų koreliacijos koeficientas τ -Kendall yra nepriklausomas originalus metodas, pagrįstas dviejų imčių, turinčių vienodas arba skirtingas tendencijas (didėjančias arba mažėjančias reikšmes), verčių porų santykio apskaičiavimu. Šis koeficientas taip pat vadinamas atitikimo koeficientas. Taigi, pagrindinė šio metodo idėja yra ta, kad ryšio kryptį galima spręsti lyginant tiriamuosius poromis: jei tiriamųjų poroje pasikeičia X kryptis sutampa su pasikeitimu Y, tai rodo teigiamą ryšį, jei nesutampa, tai rodo neigiamą ryšį, pavyzdžiui, tiriant asmenines savybes, kurios turi lemiamos reikšmės šeimos gerovei. Taikant šį metodą, vienas kintamasis vaizduojamas kaip monotoniška seka (pavyzdžiui, vyro duomenys) didėjimo tvarka; kitam kintamajam (pavyzdžiui, žmonos duomenims) priskiriamos atitinkamos reitingo vietos. Koreliacijos koeficientų formulėje naudojamas inversijų skaičius (monotoniškumo pažeidimai, palyginti su pirmąja eilute).

Skaičiuojant τ- Kendall „rankiniu būdu“ duomenys pirmiausia sutvarkomi pagal kintamąjį X. Tada kiekvienam dalykui skaičiuojama, kiek kartų jo rangas pagal Y pasirodo esantis mažesnis už žemiau pateiktų tiriamųjų rangą. Rezultatas įrašomas stulpelyje „Rungtynės“. Visų stulpelio „Atitiktis“ reikšmių suma yra P– bendras atitikmenų skaičius pakeičiamas į formulę, kad būtų galima apskaičiuoti Kendall koeficientą, kuris skaičiavimo požiūriu yra paprastesnis, tačiau, imčiai didėjant, skirtingai r-Spearman, skaičiavimų apimtis didėja ne proporcingai, o eksponentiškai. Taigi, pavyzdžiui, kada N= 12 reikia surūšiuoti 66 dalykų poras ir kada N= 489 – jau 1128 poros, t.y. skaičiavimų apimtis padidėja daugiau nei 17 kartų. Skaičiuojant kompiuteriu statistine programa (SPSS, Statistica), Kendall koeficientas skaičiuojamas panašiai kaip koeficientai r-Spirmenas ir r- Pearsonas. Apskaičiuotas koreliacijos koeficientas τ -Kendall pasižymi tikslesne verte p- lygis.

Jei šaltinio duomenyse yra nukrypimų, geriau naudoti Kendall koeficientą.

Rango koreliacijos koeficientų ypatybė yra ta, kad maksimalios absoliučios rango koreliacijos (+1, –1) nebūtinai atitinka griežtus tiesiogiai arba atvirkščiai proporcingus ryšius tarp pradinių kintamųjų. X Ir Y: pakanka tik monotoniško funkcinio ryšio tarp jų. Reitingų koreliacijos pasiekia maksimalią absoliučią vertę, jei didesnė vieno kintamojo reikšmė visada atitinka didesnę kito kintamojo reikšmę (+1), arba didesnė vieno kintamojo reikšmė visada atitinka mažesnę kito kintamojo reikšmę ir atvirkščiai (–1 ).

Tikrinama statistinė hipotezė, statistinio sprendimo priėmimo procedūra ir prasmingos išvados formulavimas yra tokie patys kaip ir šiuo atveju. r-Spearman arba r- Pearsonas.

Jei statistiškai reikšmingas ryšys nerastas, bet yra pagrindo manyti, kad ryšys iš tikrųjų yra, pirmiausia turėtumėte pereiti nuo koeficiento

r-Spearmanas iki koeficiento τ -Kendall (arba atvirkščiai), tada patikrinkite galimas nepatikimo ryšio priežastis:

  • komunikacijos netiesiškumas: Norėdami tai padaryti, pažiūrėkite į 2D sklaidos diagramą. Jei ryšys nėra monotoniškas, tada padalykite imtį į dalis, kuriose ryšys yra monotoniškas, arba padalykite imtį į kontrastingas grupes ir tada palyginkite jas pagal požymio raiškos lygį;
  • imties nevienalytiškumas: Pažiūrėkite į dvimatę sklaidos diagramą, pabandykite padalyti imtį į dalis, kuriose ryšys gali turėti skirtingas kryptis.

Jei ryšys statistiškai reikšmingas, tai prieš darant prasmingą išvadą būtina atmesti klaidingos koreliacijos galimybę (analogiškai su metrinių koreliacijos koeficientų).

Dichotominių kintamųjų koreliacija

Lyginant du kintamuosius, išmatuotus dichotomine skale, koreliacijos matas yra vadinamasis koeficientas j, kuris yra dichotominių duomenų koreliacijos koeficientas.

Didumas koeficientas φ yra intervale nuo +1 iki –1. Jis gali būti teigiamas arba neigiamas, apibūdinantis dviejų dichotomiškai išmatuotų bruožų santykio kryptį. Tačiau φ aiškinimas gali sukelti specifinių problemų. Dichotominiai duomenys, naudojami skaičiuojant koeficientą φ, neprimena dvimačio normalaus paviršiaus, todėl neteisinga manyti, kad interpretuojamos reikšmės r xy=0,60 ir φ = 0,60 yra vienodi. Koeficientas φ gali būti skaičiuojamas kodavimo metodu, taip pat naudojant vadinamąją keturių laukų lentelę arba nenumatytų atvejų lentelę.

Norint taikyti koreliacijos koeficientą φ, turi būti įvykdytos šios sąlygos:

  • lyginamos charakteristikos turi būti matuojamos dichotomine skale;
  • X Ir Y turėtų būti tas pats.

Šio tipo koreliacija skaičiuojama SPSS kompiuterinėje programoje, remiantis atstumo matų ir panašumo matų apibrėžimu. Kai kurios statistinės procedūros, tokios kaip faktorių analizė, klasterių analizė, daugiamatis mastelio keitimas, yra pagrįstos šių priemonių naudojimu ir kartais pačios suteikia papildomų galimybių skaičiuojant panašumo matmenis.

Tais atvejais, kai vienas kintamasis matuojamas dichotomine skale (kintamasis X), o kitas – intervalo arba santykio skalėje (kintamasis Y), naudotas biserinės koreliacijos koeficientas, pavyzdžiui, tikrinant hipotezes apie vaiko lyties įtaką ūgiui ir svoriui. Šis koeficientas svyruoja nuo –1 iki +1, tačiau jo ženklas rezultatų interpretavimui neturi reikšmės. Norint jį naudoti, turi būti įvykdytos šios sąlygos:

  • Lyginamos charakteristikos turi būti matuojamos skirtingomis skalėmis: viena X– dichotominiu mastu; kitas Y– intervalų arba santykių skalėje;
  • kintamasis Y turi normalų paskirstymo dėsnį;
  • kintamų charakteristikų skaičius lyginamuosiuose kintamuosiuose X Ir Y turėtų būti tas pats.

Jei kintamasis X matuojamas dichotomine skale, ir kintamasis Y rango skalėje (kintamasis Y), galima naudoti rango dvieilis koreliacijos koeficientas, kuris yra glaudžiai susijęs su Kendall τ ir savo apibrėžime naudoja sutapimo ir inversijos sąvokas. Rezultatų interpretacija yra tokia pati.

Koreliacinės analizės atlikimas kompiuterinėmis programomis SPSS ir Statistica yra paprastas ir patogus darbas. Norėdami tai padaryti, iškvietus dialogo langą Bivariate Correlations (Analyze>Correlate>Bivariate...), reikia perkelti tiriamus kintamuosius į lauką Kintamieji ir pasirinkti metodą, kuriuo bus nustatyta koreliacija tarp kintamųjų. Kiekvieno apskaičiuoto kriterijaus išvesties faile yra kvadratinė lentelė (koreliacijos). Kiekviename lentelės langelyje rodoma: paties koreliacijos koeficiento reikšmė (Correlation Coefficient), apskaičiuoto koeficiento Sig statistinė reikšmė, tiriamųjų skaičius.

Gautos koreliacijos lentelės antraštėje ir šoniniuose stulpeliuose yra kintamųjų pavadinimai. Lentelės įstrižainė (viršutinis kairysis - apatinis dešinysis kampas) susideda iš vienetų, nes bet kurio kintamojo koreliacija su savimi yra didžiausia. Lentelė yra simetriška šios įstrižainės atžvilgiu. Jei programoje pažymėtas žymimasis langelis „Pažymėti reikšmingas koreliacijas“, tada galutinėje koreliacijos lentelėje statistiškai reikšmingi koeficientai bus pažymėti: 0,05 ir mažesnio lygio - viena žvaigždute (*), o 0,01 lygiu - su dvi žvaigždutes (**).

Taigi, apibendrinant: pagrindinis koreliacinės analizės tikslas yra nustatyti ryšį tarp kintamųjų. Ryšio matas yra koreliacijos koeficientai, kurių pasirinkimas tiesiogiai priklauso nuo skalės, kurioje matuojami kintamieji, tipo, kintamų charakteristikų skaičiaus lyginamuosiuose kintamuosiuose ir kintamųjų pasiskirstymo. Koreliacijos tarp dviejų kintamųjų buvimas nereiškia, kad tarp jų yra priežastinis ryšys. Nors koreliacija tiesiogiai nenurodo priežastinio ryšio, ji gali būti priežastis. Remiantis tuo, galima susidaryti hipotezes. Kai kuriais atvejais koreliacijos trūkumas turi didesnę įtaką priežastinio ryšio hipotezei. Nulinė koreliacija tarp dviejų kintamųjų gali reikšti, kad vienas kintamasis neturi įtakos kitam.



Ar jums patiko straipsnis? Pasidalinkite su draugais!