Reitingų statistika. Neparametrinės statistikos teorijos esmė

Mėginio elemento rangas yra šio elemento eilės numeris variantų serijoje arba, kitaip tariant, pavyzdžio elementų skaičius, mažesnis arba lygus

Vadinasi, imties reikšmė atitinka variacijų eilučių eilės statistiką.

Imties rango vektorius yra skaičių 1, 2 permutacija, kuri gaunama pakeitus imties elementus jų rangais. Rango statistika yra savavališka rango vektoriaus funkcija. Reitingavimo algoritmas reikalauja palyginti tam tikrą reitingavimo statistiką su slenksčiu.

Pradinę imtį galima atkurti, jei yra žinomi eilės statistikos vektoriai ir rango vektorius R. Atskirai vienas iš šių dviejų vektorių reiškia negrįžtamą netiesinę pradinės imties transformaciją. Vienalytės nepriklausomos imties atveju atsitiktiniai vektoriai ir R yra nepriklausomi.

Imties dydžio elemento rangas naudojant vieneto šuolio funkciją arba ženklo funkciją gali būti pavaizduotas taip:

(13.168 a)

Iš (13.168 a ir b) matyti, kad rangai yra pasirašyta imties reikšmių skirtumų statistika.

Vienalytės nepriklausomos imties tikimybės funkcija yra nekintama argumentų permutacijų grupei. Iš to išplaukia, kad tam tikros imties visi rango vektoriai yra vienodai tikėtini, nesvarbu, kokiam skirstiniui priklauso imtis. Bendras galimų rangų vektorių skaičius, atitinkantis dydžio imtį, yra lygus skaičių permutacijų skaičiui, t. Tikimybė, kad stebimos imties rango vektorius R pateks į bet kurį šios diskrečios aibės tašką, yra lygi , t. y. bet kokiam homogeninės nepriklausomos imties skirstiniui

Taigi reitingavimo algoritmas yra neparametrinis, atsižvelgiant į hipotezę H, kad imtis iš savavališko skirstinio yra vienalytė ir nepriklausoma. Alternatyvai K, kad nepriklausoma imtis yra nevienalytė, eilės nebėra vienodos tikėtinos. Norint nustatyti rango vektoriaus pasiskirstymo funkciją pagal alternatyvą K, reikia apskaičiuoti integralą

kur sritis apima tuos pavyzdinės erdvės taškus, kuriuos užsakius atitinka duotas vektorius

Šis integralas

(13.170)

Praktinis formulės (13.170) naudojimas, išskyrus ypatingus atvejus, reikalauja sudėtingų skaičiavimų. Dėl paskirstymo sudėtingumo (13.170) optimalaus rango algoritmo hipotezėms su baigtiniu imties dydžiu tikrinti pagal Neyman-Pearson kriterijų praktiškai neįmanoma įgyvendinti. Tai taip pat yra viena iš priežasčių, kodėl ši sintezė atliekama euristiniu pagrindu (žr. 13.7.4 pastraipą).

Atkreipkite dėmesį, kad vienalytės nepriklausomos imties rango vektorius yra invariantas imties transformacijai be inercijos

kadangi tokia transformacija nekeičia santykinės imties elementų vietos. Iš (13.171) matyti, kad rango algoritmas išlaiko neparametrinę savybę net po nurodytos netiesinės transformacijos.

Tiriant visuomenės sveikatą ir sveikatos priežiūrą moksliniais ir praktiniais tikslais, tyrėjui dažnai tenka atlikti statistinę statistinės visumos veiksnių ir veiklos charakteristikų ryšių analizę (priežastinį ryšį) arba nustatyti lygiagrečių pokyčių priklausomybę nuo kelių šios populiacijos charakteristikų. dėl kokios nors trečiosios vertės (dėl jų bendros priežasties). Būtina mokėti ištirti šio ryšio ypatybes, nustatyti jo dydį ir kryptį, taip pat įvertinti jo patikimumą. Šiuo tikslu naudojami koreliacijos metodai.

  1. Kiekybinių ryšių tarp požymių pasireiškimo tipai
    • funkcinis ryšys
    • koreliacinis ryšys
  2. Funkcinio ir koreliacinio ryšio apibrėžimai

    Funkcinis ryšys- tokio tipo ryšys tarp dviejų charakteristikų, kai kiekviena vienos iš jų reikšmė atitinka griežtai apibrėžtą kitos reikšmę (apskritimo plotas priklauso nuo apskritimo spindulio ir pan.). Funkcinis ryšys būdingas fizikiniams ir matematiniams procesams.

    Koreliacija- toks ryšys, kai kiekviena konkreti vienos charakteristikos reikšmė atitinka keletą su ja susijusių kitos charakteristikos reikšmių (žmogaus ūgio ir svorio santykis; kūno temperatūros ir pulso dažnio santykis ir kt.). Koreliacija būdinga medicininiams ir biologiniams procesams.

  3. Praktinė koreliacinio ryšio nustatymo reikšmė. Priežastinių ir pasekmių sąsajų tarp veiksnio ir sukeliamų savybių nustatymas (vertinant fizinį išsivystymą, nustatyti ryšį tarp darbo sąlygų, gyvenimo sąlygų ir sveikatos būklės, nustatant susirgimų dažnio priklausomybę nuo amžiaus, darbo stažo, profesinių pavojų buvimas ir kt.)

    Lygiagrečių kelių charakteristikų pokyčių priklausomybė nuo kokios nors trečiosios reikšmės. Pavyzdžiui, veikiant aukštai temperatūrai dirbtuvėse, pakinta kraujospūdis, kraujo klampumas, pulso dažnis ir kt.

  4. Vertė, apibūdinanti charakteristikų santykio kryptį ir stiprumą. Koreliacijos koeficientas, kuris viename skaičiuje leidžia suprasti ryšio tarp ženklų (reiškinių) kryptį ir stiprumą, jo svyravimų ribas nuo 0 iki ± 1
  5. Koreliacijų pateikimo metodai
    • grafikas (taškinė diagrama)
    • koreliacijos koeficientas
  6. Koreliacijos kryptis
    • tiesiai
    • atvirkščiai
  7. Koreliacijos stiprumas
    • stiprus: ±0,7–±1
    • vidurkis: ±0,3–±0,699
    • silpnas: nuo 0 iki ±0,299
  8. Koreliacijos koeficiento nustatymo metodai ir formulės
    • kvadratų metodas (Pearson metodas)
    • rango metodas (Spearman metodas)
  9. Koreliacijos koeficiento naudojimo metodiniai reikalavimai
    • Išmatuoti ryšį galima tik kokybiškai homogeniškose populiacijose (pavyzdžiui, išmatuoti ūgio ir svorio santykį populiacijose, kurios yra vienalytės pagal lytį ir amžių).
    • apskaičiavimas gali būti atliekamas naudojant absoliučias arba išvestines vertes
    • koreliacijos koeficientui apskaičiuoti naudojamos negrupuotos variacijų eilutės (šis reikalavimas galioja tik skaičiuojant koreliacijos koeficientą kvadratų metodu)
    • stebėjimų skaičius ne mažesnis kaip 30
  10. Rekomendacijos naudoti rangų koreliacijos metodą (Spearmano metodas)
    • kai nereikia tiksliai nustatyti ryšio stiprumo, bet pakanka apytikslių duomenų
    • kai charakteristikos vaizduojamos ne tik kiekybinėmis, bet ir atributinėmis reikšmėmis
    • kai charakteristikų paskirstymo serijoje yra atvirų pasirinkimų (pavyzdžiui, darbo patirtis iki 1 metų ir kt.)
  11. Kvadratų metodo naudojimo rekomendacijos (Pirsono metodas)
    • kai reikia tiksliai nustatyti ryšio tarp charakteristikų stiprumą
    • kai ženklai turi tik kiekybinę išraišką
  12. Koreliacijos koeficiento apskaičiavimo metodika ir tvarka

    1) Kvadratų metodas

    2) Reitingo metodas

  13. Koreliacijos ryšio įvertinimo naudojant koreliacijos koeficientą schema
  14. Koreliacijos koeficiento paklaidos skaičiavimas
  15. Koreliacijos koeficiento, gauto ranginės koreliacijos metodu ir kvadratų metodu, patikimumo įvertinimas

    1 būdas
    Patikimumas nustatomas pagal formulę:

    Kriterijus t vertinamas naudojant t reikšmių lentelę, atsižvelgiant į laisvės laipsnių skaičių (n - 2), kur n yra suporuotų variantų skaičius. Kriterijus t turi būti lygus arba didesnis nei lentelėje vienas, atitinkantis tikimybę p ≥99%.

    2 metodas
    Patikimumas vertinamas naudojant specialią standartinių koreliacijos koeficientų lentelę. Šiuo atveju koreliacijos koeficientas laikomas patikimu, kai, esant tam tikram laisvės laipsnių skaičiui (n - 2), jis yra lygus arba didesnis nei lentelės koeficientas, atitinkantis prognozės be klaidų laipsnį p ≥95%. .

naudoti kvadratų metodą

Pratimas: apskaičiuokite koreliacijos koeficientą, nustatykite kalcio kiekio vandenyje ir vandens kietumo ryšio kryptį ir stiprumą, jei žinomi šie duomenys (1 lentelė). Įvertinkite santykių patikimumą. Padarykite išvadą.

1 lentelė

Metodo pasirinkimo pagrindimas. Problemai išspręsti buvo pasirinktas kvadratų metodas (Pearson), nes kiekvienas iš ženklų (vandens kietumas ir kalcio kiekis) turi skaitinę išraišką; nėra atviro varianto.

Sprendimas.
Skaičiavimų seka aprašyta tekste, rezultatai pateikti lentelėje. Sukūrę suporuotų palyginamų charakteristikų serijas, pažymėkite jas x (vandens kietumas laipsniais) ir y (kalcio kiekis vandenyje mg/l).

Vandens kietumas
(laipsniais)
Kalcio kiekis vandenyje
(mg/l)
d x d m d x x d y d x 2 d y 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
M x =Σ x / n M y = Σ y / n Σ d x x d y =7078 Σ d x 2 = 982 Σ d y 2 =51056
M x = 120/6 = 20 M y = 852/6 = 142
  1. Nustatykite vidutines M x reikšmes eilutės variante „x“ ir M y eilutėje „y“ naudodami formules:
    M x = Σх/n (1 stulpelis) ir
    M y = Σу/n (2 stulpelis)
  2. Raskite kiekvieno varianto nuokrypį (d x ir d y) nuo apskaičiuoto vidurkio reikšmės eilutėse „x“ ir „y“ serijose
    d x = x - M x (3 stulpelis) ir d y = y - M y (4 stulpelis).
  3. Raskite nuokrypių d x x d y sandaugą ir susumuokite: Σ d x x d y (5 stulpelis)
  4. Kiekvieną nuokrypį d x ir d y padėkite kvadratu ir susukite jų reikšmes išilgai „x“ ir „y“ eilučių: Σ d x 2 = 982 (6 stulpelis) ir Σ d y 2 = 51056 (7 stulpelis).
  5. Nustatykite sandaugą Σ d x 2 x Σ d y 2 ir iš jo išimkite kvadratinę šaknį
  6. Gautos reikšmės Σ (d x x d y) ir √ (Σd x 2 x Σd y 2) koreliacijos koeficiento apskaičiavimo formulę pakeiskite:
  7. Nustatykite koreliacijos koeficiento patikimumą:
    1-as metodas. Raskite koreliacijos koeficiento (mr xy) ir t kriterijaus paklaidą naudodami formules:

    Kriterijus t = 14,1, o tai atitinka beklaidės prognozės tikimybę p > 99,9%.

    2-as metodas. Koreliacijos koeficiento patikimumas vertinamas naudojant lentelę „Standartiniai koreliacijos koeficientai“ (žr. 1 priedą). Kai laisvės laipsnių skaičius (n - 2) = 6 - 2 = 4, mūsų apskaičiuotas koreliacijos koeficientas r xу = + 0,99 yra didesnis už pateiktą lentelėje (r lentelė = + 0,917, kai p = 99%).

    Išvada. Kuo daugiau kalcio vandenyje, tuo jis kietesnis (ryšys tiesioginis, stiprus ir autentiškas: r xy = + 0,99, p > 99,9 %).

    naudoti reitingavimo metodą

    Pratimas: rango metodu nustatyti ryšio tarp darbo stažo ir traumų dažnio kryptį ir stiprumą, jei gaunami šie duomenys:

    Metodo pasirinkimo pagrindimas: Problemai išspręsti galima pasirinkti tik rangų koreliacijos metodą, nes Pirmoje atributo „darbo patirtis metais“ eilutėje yra atviros galimybės (darbo patirtis iki 1 metų ir 7 ar daugiau metų), kurios neleidžia ryšiui užmegzti naudoti tikslesnio metodo - kvadratų metodo. tarp lyginamų charakteristikų.

    Sprendimas. Skaičiavimų seka pateikta tekste, rezultatai pateikti lentelėje. 2.

    2 lentelė

    Darbo patirtis metų Sužalojimų skaičius Eiliniai skaičiai (gretai) Reitingų skirtumas Kvadratinis rangų skirtumas
    X Y d(x-y) d 2
    Iki 1 metų 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 ar daugiau 6 5 1 +4 16
    Σ d 2 = 38,5

    Standartiniai koreliacijos koeficientai, kurie laikomi patikimais (pagal L.S. Kaminsky)

    Laisvės laipsnių skaičius – 2 Tikimybės lygis p (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Vlasovas V.V. Epidemiologija. - M.: GEOTAR-MED, 2004. - 464 p.
    2. Lisitsyn Yu.P. Visuomenės sveikata ir sveikatos priežiūra. Vadovėlis universitetams. - M.: GEOTAR-MED, 2007. - 512 p.
    3. Medikas V.A., Jurjevas V.K. Visuomenės sveikatos ir sveikatos priežiūros paskaitų kursas: 1 dalis. Visuomenės sveikata. - M.: Medicina, 2003. - 368 p.
    4. Minyajevas V.A., Višniakovas N.I. ir kt. Socialinės medicinos ir sveikatos priežiūros organizavimas (vadovas 2 tomai). - Sankt Peterburgas, 1998. -528 p.
    5. Kučerenko V.Z., Agarkovas N.M. ir kt. Socialinės higienos ir sveikatos priežiūros organizavimas (Mokomoji medžiaga) - Maskva, 2000. - 432 p.
    6. S. Glanzas. Medicinos ir biologijos statistika. Vertimas iš anglų kalbos - M., Praktika, 1998. - 459 p.

Apytiksliai R.s. T, ir skirtumas yra nereikšmingas, kai . Jei hipotezė H 0 yra teisinga, pagal pjūvio komponentą X 1 , ... , Xn atsitiktinis vektorius X yra nepriklausomi atsitiktiniai dydžiai, R.s projekcija. Nustatoma pagal formulę

kur (žr.).

Tarp R. s yra vidinis ryšys. Ir . Kaip parodyta , jei hipotezė H 0 yra teisinga, projekcija Kendall koreliacijos koeficientas į linijinių tiesinių sistemų šeimą. iki pastovaus koeficiento sutampa su Spearman rango koreliacijos koeficientu, būtent:


Iš šios lygybės išplaukia, kad koreliacijos koeficientas corr tarp ir yra lygus


y., didelėje pr. Su. ir yra asimptotiškai lygiaverčiai (žr.).

Lit.: G a e k Ya., Sh i d a k Z., Rango kriterijų teorija, vert. iš anglų k., M., 1971; K e n d a l l M. G., Rangų koreliacijos metodai, 4ed., L., 1970 m. M. S. Nikulinas.


Matematinė enciklopedija. - M.: Tarybinė enciklopedija.

I. M. Vinogradovas.

    reitingų statistika- [A.S. Goldbergas. Anglų-rusų energetikos žodynas. 2006] Energetikos temos bendroje EN reitingo statistikoje... Techninis vertėjo vadovas

    Šis terminas turi kitas reikšmes, žr. „Statistika (reikšmės). Statistika (siaurąja prasme) yra išmatuojama skaitinė imties funkcija, nepriklausoma nuo nežinomų pasiskirstymo parametrų. Plačiąja prasme terminas (matematinis) ... ... Vikipedija

    - (statistika) 1. Duomenų ir matematinių metodų rinkinys, naudojamas įvairių kintamųjų santykiams tirti. Tai apima tokius metodus kaip tiesinė regresija ir rangų koreliacija. 2. Naudojamos reikšmės...... Ekonomikos žodynas

    STATISTIKA- 1. Veiklos rūšis, skirta gauti, apdoroti ir analizuoti informaciją, apibūdinančią kiekybinius gyvenimo modelius visoje jos įvairovėje, neatsiejamai susijusioje su jos kokybiniu turiniu. Siaurąja to žodžio prasme...... Rusijos sociologinė enciklopedija

    - (ne parametrinė statistika) Statistiniai metodai, neleidžiantys naudoti specialių funkcinių formų ryšiams tarp kintamųjų. To pavyzdys yra dviejų kintamųjų rangų koreliacija. Tokių techninių...... Ekonomikos žodynas- K. m., kuri gavo savo vardą. Dėl to, kad jie yra pagrįsti „co-relation“ kintamaisiais, tai yra statistiniai metodai, kurių pradžia buvo padaryta Karlo Pearsono darbuose apie XIX amžiaus pabaigą. Jie glaudžiai susiję su...... Psichologinė enciklopedija

    Kūrėjas Digital Illusions CE Publisher ... Vikipedija

    Karlas Pearsonas Karlas (Carl) Pearsonas Gimimo data ... Vikipedija

Ryšio tarp charakteristikų glaudumo koeficientas, aptartas ankstesniame skyriuje, gali būti naudojamas, jei tiriamos charakteristikos yra kiekybinės. Šiuo atveju naudojamas pagrindinių pasiskirstymo parametrų (vidutinių reikšmių, dispersijų) skaičiavimas, t.y. parametrinis metodas.

Statistinėje socialinių ekonominių reiškinių ir procesų tyrimo praktikoje tenka susidurti su kokybinių charakteristikų ryšio matavimo problemomis, kurioms parametriniai analizės metodai įprastine forma netaikomi. Tokiu atveju naudokite vadinamąjį neparametriniai metodai.

Analizuojant socialinius ir ekonominius reiškinius, ranginės koreliacijos koeficientai (rangų koreliacijos koeficientai) plačiai naudojami, kai netiesioginės x ir y, ir jų gretas, tie. jų vietų skaičius kiekvienoje reikšmių eilutėje didėjančia arba mažėjančia tvarka. Tokie neparametriniai koeficientai apima Spearmano rango koeficientai Ir Kendall.

Jeigu n Parinktys serijoje išdėstomos pagal charakteristikos x padidėjimą arba sumažėjimą, tada sakoma, kad objektai reitinguojami pagal šią charakteristiką. X reitingas rodo vietą, kurią jis užima i-e atributo vertė, be kita ko n atributo x reikšmės (/ = 1,2,___, p).

Pavyzdžiui, tirdami rinką, galite išsikelti tikslą išsiaiškinti vartotojų pageidavimus renkantis prekę (perkant akcijas, ledus, automobilį ir pan.) taip, kad jie prekę paskirstytų didėjančia tvarka ( arba mažėjančia tvarka) pagal jų vartotojų pageidavimus. Jei turite du reitinguotų duomenų rinkinius, galite nustatyti tiesinio ryšio tarp jų laipsnį.

6.7 pavyzdys. Tarkime, kad yra 5 produktai (6.7 lentelė), kurie yra suskirstyti į pirmenybę nuo 1 iki 5 pagal dvi charakteristikas Oi V.

Originalūs reitingai

6 lentelė.7

Būtina ištirti statistinio ryšio tarp charakteristikų glaudumą.

Sprendimas. Naudoti Pirsono koeficientą charakteristikų santykio intensyvumui nustatyti bus neteisinga, nes šis koeficientas naudojamas charakteristikoms, kurios matuojamos kiekybiškai. Taigi, pavyzdžiui, nustatydami ūgio ir svorio santykį, ūgį matuojame centimetrais, o svorį kilogramais, tuo tarpu matavimo skalėje galima tiksliai nustatyti šių charakteristikų verčių skirtumą bet kuriam asmeniui (į kitaip tariant, atstumas tarp jų matavimo skalėje). Paimkime reitingavimo skalėje išmatuotą charakteristiką – egzamino pažymį. Ar tai reiškia, kad studentas, gavęs D, turi perpus mažiau žinių nei tas, kuris gavo B? O gal du mokiniai, gavę C pažymius, turi lygiai tokį patį žinių lygį? Atsakymas yra ne, mokytojas savo žinių lygį išdėsto tam tikra seka, vadovaudamasis konkretaus dalyko žinių vertinimo kriterijais, tačiau atstumas tarp ženklų verčių tokioje skalėje nėra griežtai fiksuotas.

Norint nustatyti, ar yra ryšys tarp reitingo balų, jis naudojamas Spearmano rango koreliacijos koeficientas. Jos apskaičiavimas pagrįstas rangų skirtumais.

Pažymime rangų skirtumą d = rangas A~ rangas IN.

Spearman koeficientas

Kur n- reitinguotų stebėjimų porų skaičius.

IN Pavyzdžiui, turime penkias rangų poras, todėl p- 5. Suma ct lygus

Tada Spearman koeficientas

Spearmano koeficientas kinta intervale [-1; 1] ir interpretuojamas taip pat, kaip ir Pirsono koeficientas. Skirtumas tas, kad jis apskaičiuojamas pagal reitinguotus duomenis.

Vertė 0,6 leidžia daryti išvadą, kad tarp dviejų produkto savybių yra reikšmingas tiesinis ryšys.

Spearmano koeficiento reikšmė tikrinama remiantis t Studento t testas naudojant formulę

Koeficiento reikšmė laikoma reikšminga, jei t calc > > 6fit;a (ir - 2) tam tikram reikšmingumo lygiui a.

Rangų koreliacijos koeficientą (su sąlyga, kad rangai nesikartoja) taip pat galima apskaičiuoti naudojant anglų statistiko M. Kendallo pasiūlytą formulę:


Kur S- faktinis rangų skirtumas; ~n(n- l) – maksimali rangų suma.

Šis koeficientas svyruoja nuo [-1; 1] ir yra interpretuojamas taip pat, kaip ir Pirsono koeficientas, tačiau suteikia griežtesnį

santykio vertinimas nei Spearman koeficientas, o p = - m. Šis ryšys galioja daugeliui stebėjimų (n> 30) ir silpni arba vidutiniškai glaudūs ryšiai.

Skaičiuojant Kendall koeficientą, stebima tokia veiksmų seka:

  • 1. X reikšmės yra išdėstytos didėjančia tvarka.
  • 2. Vertybės adresu yra išdėstyti taip, kad atitiktų reikšmes X.
  • 3. Kiekvienam rangui y nustatomas po jo einančių ir jo vertę viršijančių rango reikšmių skaičius. Rezultatas rašomas stulpelyje „+“.
  • 4. Už kiekvieną rangą adresu nustatomas po jo sekančių mažesnių rangų reikšmių skaičius. Rezultatas rašomas stulpelyje „-“.
  • 5. Suma yra „+“ stulpelyje ir yra nurodyta R, stulpelyje „-“ ir yra pažymėtas K. Pasiryžęs S = P-Q.

Kendall rango koreliacijos koeficiento reikšmingumas tikrinamas naudojant formulę


Kur sch_ a/2 (p- 2) - kvantilis, nustatytas iš normaliojo pasiskirstymo lentelės pasirinktam reikšmingumo lygiui a ir duotajam p.

6.8 pavyzdys. Apskaičiuokime Kendall koeficientą pagal 6.7 pavyzdžio duomenis.

Sprendimas. Atlikime reikiamus skaičiavimus lentelėje. 6.8.

Išties, gautą reikšmę m padauginus iš 1,5, gauname 0,6 – Spearmano koeficiento reikšmę, apskaičiuotą 6.7 pavyzdyje.

Skaičiavimo lentelė

Panagrinėkime alternatyvių požymių koreliaciją, t. y. ypatybes, kurios turi tik dvi galimas reikšmes. Jų koreliacijos tyrimas pagrįstas rodikliais, sudarytais keturių langelių lentelėse, kurios apibendrina nurodytų charakteristikų verčių vienetų skaičių:

Sprendimas. Norint išmatuoti charakteristikų santykio glaudumą, sąlyginis koeficientas apskaičiuojamas naudojant formulę

Kontingentinis koeficientas paima reikšmes intervale [-1; 1]. Aiškinimas panašus į koreliacijos koeficientą. Turime silpną neigiamą ryšį.

Kitas asociacijos matavimo metodas yra pagrįstas asociacijos koeficiento apskaičiavimu:

„l 30x5-20x15 l“

Mes gauname: K =-= -0,33

Minuso ženklas prieš koeficientą rodo, kad kuo daugiau mokinių buvo paskiepyti nuo gripo, tuo mažesnis sergamumas.

Kontingentinis koeficientas visada yra mažesnis už asociacijos koeficientą ir leidžia teisingiau įvertinti ryšio glaudumą.

Norint įvertinti charakteristikų, turinčių bet kokį variantų reikšmių skaičių (kategorines, vardines charakteristikas), ryšio glaudumą, naudojamas Pirsono abipusio atsitiktinumo koeficientas. Kategorinių charakteristikų santykio tyrimo pagrindas yra nenumatytų atvejų lentelė – dvimatis populiacijos vienetų pasiskirstymas pagal požymius. Visa informacija apie ryšio buvimą ar nebuvimą yra bendruose funkcijų derinių dažniuose.

Informacija, skirta įvertinti šį ryšį, yra sugrupuota lentelės pavidalu (pavyzdžiui, trims pirmosios charakteristikos reikšmėms ir dviem antrosios charakteristikos reikšmėms), lentelė. 6.10.

6.10 lentelė

Nenumatytų atvejų lentelės pavyzdys

Pasirašyti

Iš viso

bgpc

bjgpc

Pavadinimai: kad- dviejų atributų charakteristikų tarpusavio derinimo dažnis; n = YLmy- stebėjimų skaičius.

Pirsono kryžminio atsitiktinumo koeficientas nustatomas pagal formulę

kur cf yra vidutinės kvadratinės konjugacijos indeksas:

Kryžminio atsitiktinumo koeficientas paima reikšmes intervale ir yra interpretuojamas panašiai kaip Pirsono poros tiesinės koreliacijos koeficientas.

6.10 pavyzdys. Siekiant ištirti darbo sąlygų įtaką santykiams komandoje, buvo atlikta 250 įmonės darbuotojų atrankinė apklausa, kurių atsakymai buvo paskirstyti taip, kaip pateikti lentelėje. 6.11.

6.11 lentelė

Pirminiai duomenys apie darbo sąlygas ir santykius komandoje

Santykį tarp tiriamų rodiklių reikia apibūdinti naudojant Pirsono tarpusavio atsitiktinumo koeficientą.

Sprendimas.

Gauta atsitiktinumo koeficiento reikšmė rodo, kad santykis tarp darbo sąlygų ir santykių kolektyve yra vidutiniškas.



Ar jums patiko straipsnis? Pasidalinkite su draugais!