Analizë e thjeshtë korrelacioni. Analiza e regresionit në Excel

Kur studion shëndetin publik dhe kujdesin shëndetësor për qëllime shkencore dhe praktike, studiuesi shpesh duhet të kryejë një analizë statistikore të marrëdhënieve midis faktorëve dhe karakteristikave të performancës së një popullate statistikore (marrëdhënie shkakësore) ose të përcaktojë varësinë e ndryshimeve paralele në disa karakteristika të kësaj popullate. në një vlerë të tretë (për shkakun e tyre të përbashkët). Është e nevojshme të jeni në gjendje të studioni tiparet e kësaj lidhjeje, të përcaktoni madhësinë dhe drejtimin e saj, si dhe të vlerësoni besueshmërinë e saj. Për këtë qëllim përdoren metoda korrelacioni.

  1. Llojet e manifestimit të marrëdhënieve sasiore ndërmjet karakteristikave
    • lidhje funksionale
    • lidhje korrelacioni
  2. Përkufizime të lidhjes funksionale dhe korrelative

    Lidhje funksionale- ky lloj marrëdhënieje midis dy karakteristikave kur secila vlerë e njërës prej tyre korrespondon me një vlerë të përcaktuar rreptësisht të tjetrës (sipërfaqja e një rrethi varet nga rrezja e rrethit, etj.). Lidhja funksionale është karakteristikë e proceseve fizike dhe matematikore.

    Korrelacioni- një marrëdhënie e tillë në të cilën secila vlerë specifike e një karakteristike korrespondon me disa vlera të një karakteristike tjetër të ndërlidhur me të (lidhja midis lartësisë dhe peshës së një personi; marrëdhënia midis temperaturës së trupit dhe pulsit, etj.). Korrelacioni është tipik për proceset mjekësore dhe biologjike.

  3. Rëndësia praktike e krijimit të një lidhjeje korrelacioni. Identifikimi i marrëdhënieve shkak-pasojë midis faktorëve dhe karakteristikave rezultante (kur vlerësohet zhvillimi fizik, për të përcaktuar marrëdhënien midis kushteve të punës, kushteve të jetesës dhe gjendjes shëndetësore, kur përcaktohet varësia e shpeshtësisë së rasteve të sëmundjes nga mosha, kohëzgjatja e shërbimit; prania e rreziqeve në punë, etj.)

    Varësia e ndryshimeve paralele në disa karakteristika nga ndonjë vlerë e tretë. Për shembull, nën ndikimin e temperaturës së lartë në punishte, ndodhin ndryshime në presionin e gjakut, viskozitetin e gjakut, pulsin etj.

  4. Një vlerë që karakterizon drejtimin dhe forcën e marrëdhënies midis karakteristikave. Koeficienti i korrelacionit, i cili në një numër jep një ide për drejtimin dhe forcën e lidhjes midis shenjave (dukurive), kufijtë e luhatjeve të tij nga 0 në ± 1
  5. Metodat e paraqitjes së korrelacioneve
    • grafiku (grafiku i shpërndarjes)
    • koeficienti i korrelacionit
  6. Drejtimi i korrelacionit
    • drejt
    • e kundërta
  7. Forca e korrelacionit
    • i fortë: ±0.7 deri në ±1
    • mesatare: ±0,3 deri në ±0,699
    • i dobët: 0 deri në ±0.299
  8. Metodat për përcaktimin e koeficientit të korrelacionit dhe formulat
    • metoda e katrorëve (metoda Pearson)
    • metoda e renditjes (metoda Spearman)
  9. Kërkesat metodologjike për përdorimin e koeficientit të korrelacionit
    • matja e lidhjes është e mundur vetëm në popullata cilësore homogjene (për shembull, matja e marrëdhënies ndërmjet gjatësisë dhe peshës në popullatat homogjene sipas gjinisë dhe moshës)
    • llogaritja mund të bëhet duke përdorur vlera absolute ose të prejardhura
    • për të llogaritur koeficientin e korrelacionit, përdoren seritë e pagrupuara të variacionit (kjo kërkesë zbatohet vetëm kur llogaritet koeficienti i korrelacionit duke përdorur metodën e katrorëve)
    • numri i vëzhgimeve të paktën 30
  10. Rekomandime për përdorimin e metodës së korrelacionit të rangut (metoda e Spearman)
    • kur nuk ka nevojë të përcaktohet me saktësi fuqia e lidhjes, por të dhënat e përafërta janë të mjaftueshme
    • kur karakteristikat përfaqësohen jo vetëm me vlera sasiore, por edhe me vlera atributive
    • kur seritë e shpërndarjes së karakteristikave kanë opsione të hapura (për shembull, përvojë pune deri në 1 vit, etj.)
  11. Rekomandime për përdorimin e metodës së katrorëve (metoda e Pearson)
    • kur kërkohet një përcaktim i saktë i forcës së lidhjes ndërmjet karakteristikave
    • kur shenjat kanë vetëm shprehje sasiore
  12. Metodologjia dhe procedura e llogaritjes së koeficientit të korrelacionit

    1) Metoda e katrorëve

    2) Metoda e renditjes

  13. Skema për vlerësimin e marrëdhënies së korrelacionit duke përdorur koeficientin e korrelacionit
  14. Llogaritja e gabimit të koeficientit të korrelacionit
  15. Vlerësimi i besueshmërisë së koeficientit të korrelacionit të marrë me metodën e korrelacionit të rangut dhe metodën e katrorëve

    Metoda 1
    Besueshmëria përcaktohet nga formula:

    Kriteri t vlerësohet duke përdorur një tabelë me vlera t, duke marrë parasysh numrin e shkallëve të lirisë (n - 2), ku n është numri i opsioneve të çiftuara. Kriteri t duhet të jetë i barabartë ose më i madh se ai i tabelës, që i korrespondon një probabiliteti p ≥99%.

    Metoda 2
    Besueshmëria vlerësohet duke përdorur një tabelë të veçantë të koeficientëve standardë të korrelacionit. Në këtë rast, një koeficient korrelacioni konsiderohet i besueshëm kur, me një numër të caktuar shkallësh lirie (n - 2), është i barabartë ose më shumë se ai tabelor, që korrespondon me shkallën e parashikimit pa gabime p ≥95% .

për të përdorur metodën e katrorëve

Ushtrimi: llogaritni koeficientin e korrelacionit, përcaktoni drejtimin dhe forcën e marrëdhënies midis sasisë së kalciumit në ujë dhe ngurtësisë së ujit, nëse dihen të dhënat e mëposhtme (Tabela 1). Vlerësoni besueshmërinë e marrëdhënies. Nxirrni një përfundim.

Tabela 1

Arsyetimi për zgjedhjen e metodës. Për zgjidhjen e problemit u zgjodh metoda e katrorëve (Pearson), sepse secila prej shenjave (fortësia e ujit dhe sasia e kalciumit) ka një shprehje numerike; asnjë opsion i hapur.

Zgjidhje.
Sekuenca e llogaritjeve përshkruhet në tekst, rezultatet janë paraqitur në tabelë. Pasi të keni ndërtuar seri karakteristikash të çiftëzuara të krahasueshme, shënojini ato me x (fortësia e ujit në gradë) dhe me y (sasia e kalciumit në ujë në mg/l).

Fortësia e ujit
(në gradë)
Sasia e kalciumit në ujë
(në mg/l)
d x d y d x x d y d x 2 d 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
M x =Σ x / n M y =Σ y / n Σ d x x d y =7078 Σ d x 2 =982 Σ d y 2 =51056
M x =120/6=20 M y =852/6=142
  1. Përcaktoni vlerat mesatare të M x në opsionin e rreshtit "x" dhe M y në opsionin e rreshtit "y" duke përdorur formulat:
    M x = Σх/n (kolona 1) dhe
    M y = Σου/n (kolona 2)
  2. Gjeni devijimin (d x dhe d y) të secilit opsion nga vlera e mesatares së llogaritur në serinë "x" dhe në serinë "y"
    d x = x - M x (kolona 3) dhe d y = y - M y (kolona 4).
  3. Gjeni produktin e devijimeve d x x d y dhe përmblidhni ato: Σ d x x d y (kolona 5)
  4. Sheshoni çdo devijim d x dhe d y dhe mblidhni vlerat e tyre përgjatë serisë "x" dhe serisë "y": Σ d x 2 = 982 (kolona 6) dhe Σ d y 2 = 51056 (kolona 7).
  5. Përcaktoni produktin Σ d x 2 x Σ d y 2 dhe nxirrni rrënjën katrore nga ky produkt
  6. Vlerat që rezultojnë Σ (d x x d y) dhe √ (Σd x 2 x Σd y 2) zëvendësoni në formulën për llogaritjen e koeficientit të korrelacionit:
  7. Përcaktoni besueshmërinë e koeficientit të korrelacionit:
    Metoda 1. Gjeni gabimin e koeficientit të korrelacionit (mr xy) dhe kriterin t duke përdorur formulat:

    Kriteri t = 14.1, që korrespondon me probabilitetin e një parashikimi pa gabime p > 99.9%.

    Metoda e 2-të. Besueshmëria e koeficientit të korrelacionit vlerësohet duke përdorur tabelën "Koeficientët standardë të korrelacionit" (shih Shtojcën 1). Me numrin e shkallëve të lirisë (n - 2)=6 - 2=4, koeficienti ynë i llogaritur i korrelacionit r xу = + 0,99 është më i madh se ai i tabeluar (r tabela = + 0,917 në p = 99%).

    konkluzioni. Sa më shumë kalcium në ujë, aq më e vështirë është (lidhja i drejtpërdrejtë, i fortë dhe autentik: r xy = + 0,99, p > 99,9%).

    për të përdorur metodën e renditjes

    Ushtrimi: duke përdorur metodën e renditjes, përcaktoni drejtimin dhe forcën e marrëdhënies midis viteve të përvojës së punës dhe shpeshtësisë së lëndimeve nëse merren të dhënat e mëposhtme:

    Arsyetimi për zgjedhjen e metodës: Për të zgjidhur problemin, mund të zgjidhet vetëm metoda e korrelacionit të rangut, sepse Rreshti i parë i atributit "përvoja e punës në vite" ka opsione të hapura (përvojë pune deri në 1 vit dhe 7 ose më shumë vjet), e cila nuk lejon përdorimin e një metode më të saktë - metodën e katrorëve - për të krijuar një lidhje ndërmjet karakteristikave të krahasuara.

    Zgjidhje. Sekuenca e llogaritjeve është paraqitur në tekst, rezultatet janë paraqitur në tabelë. 2.

    tabela 2

    Eksperiencë pune në vite Numri i lëndimeve Numrat rendorë (gradat) Diferenca në rang Diferenca në katror e gradave
    X Y d (x-y) d 2
    Deri në 1 vit 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 ose më shumë 6 5 1 +4 16
    Σ d 2 = 38,5

    Koeficientët standardë të korrelacionit që konsiderohen të besueshëm (sipas L.S. Kaminsky)

    Numri i shkallëve të lirisë - 2 Niveli i probabilitetit p (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Vlasov V.V. Epidemiologjia. - M.: GEOTAR-MED, 2004. - 464 f.
    2. Lisitsyn Yu.P. Shëndeti publik dhe kujdesi shëndetësor. Libër mësuesi për universitetet. - M.: GEOTAR-MED, 2007. - 512 f.
    3. Mjek V.A., Yuryev V.K. Lënda e leksioneve për shëndetin publik dhe kujdesin shëndetësor: Pjesa 1. Shëndeti publik. - M.: Mjekësi, 2003. - 368 f.
    4. Minyaev V.A., Vishnyakov N.I. dhe organizata të tjera të mjekësisë sociale dhe të kujdesit shëndetësor (Manuali në 2 vëllime). - Shën Petersburg, 1998. -528 f.
    5. Kucherenko V.Z., Agarkov N.M. dhe të tjerët Organizata e higjienës sociale dhe kujdesit shëndetësor (Tutorial) - Moskë, 2000. - 432 f.
    6. S. Glanz. Statistikat mjekësore dhe biologjike. Përkthim nga anglishtja - M., Praktika, 1998. - 459 f.

PUNA KURSI

Tema: Analiza e korrelacionit

Prezantimi

1. Analiza e korrelacionit

1.1 Koncepti i korrelacionit

1.2 Klasifikimi i përgjithshëm i korrelacioneve

1.3 Fushat e korrelacionit dhe qëllimi i ndërtimit të tyre

1.4 Fazat e analizës së korrelacionit

1.5 Koeficientët e korrelacionit

1.6 Koeficienti i korrelacionit Bravais-Pearson i normalizuar

1.7 Koeficienti i korrelacionit të gradës Spearman

1.8 Vetitë themelore të koeficientëve të korrelacionit

1.9 Kontrollimi i rëndësisë së koeficientëve të korrelacionit

1.10 Vlerat kritike të koeficientit të korrelacionit të çiftit

2. Planifikimi i një eksperimenti shumëfaktorial

2.1 Gjendja e problemit

2.2 Përcaktimi i qendrës së planit (niveli bazë) dhe niveli i variacionit të faktorëve

2.3 Ndërtimi i matricës së planifikimit

2.4 Kontrollimi i homogjenitetit të dispersionit dhe ekuivalencës së matjeve në seri të ndryshme

2.5 Koeficientët e ekuacionit të regresionit

2.6 Varianca e riprodhueshmërisë

2.7 Kontrollimi i rëndësisë së koeficientëve të ekuacionit të regresionit

2.8 Kontrollimi i përshtatshmërisë së ekuacionit të regresionit

konkluzioni

Bibliografi

PREZANTIMI

Planifikimi eksperimental është një disiplinë matematikore dhe statistikore që studion metodat për organizimin racional të kërkimit eksperimental - nga zgjedhja optimale e faktorëve në studim dhe përcaktimi i planit aktual eksperimental në përputhje me qëllimin e tij deri te metodat për analizimin e rezultateve. Planifikimi eksperimental filloi me punën e statisticienit anglez R. Fisher (1935), i cili theksoi se planifikimi eksperimental racional siguron përfitime jo më pak të rëndësishme në saktësinë e vlerësimeve sesa përpunimi optimal i rezultateve të matjes. Në vitet 60 të shekullit të 20-të, u shfaq teoria moderne e planifikimit eksperimental. Metodat e saj janë të lidhura ngushtë me teorinë e përafrimit të funksioneve dhe programimin matematikor. U ndërtuan plane optimale dhe u studiuan vetitë e tyre për një klasë të gjerë modelesh.

Planifikimi eksperimental është zgjedhja e një plani eksperimental që plotëson kërkesat e specifikuara, një grup veprimesh që synojnë zhvillimin e një strategjie eksperimentimi (nga marrja e informacionit apriori deri te marrja e një modeli matematikor të zbatueshëm ose përcaktimi i kushteve optimale). Ky është kontroll i qëllimshëm i një eksperimenti, i zbatuar në kushte të njohjes jo të plotë të mekanizmit të fenomenit që studiohet.

Në procesin e matjeve, përpunimit pasues të të dhënave, si dhe formalizimi i rezultateve në formën e një modeli matematikor, lindin gabime dhe një pjesë e informacionit që përmban të dhënat origjinale humbet. Përdorimi i metodave eksperimentale të planifikimit bën të mundur përcaktimin e gabimit të modelit matematik dhe gjykimin e përshtatshmërisë së tij. Nëse saktësia e modelit rezulton e pamjaftueshme, atëherë përdorimi i metodave të planifikimit eksperimental bën të mundur modernizimin e modelit matematik me eksperimente shtesë pa humbur informacionin e mëparshëm dhe me kosto minimale.

Qëllimi i planifikimit të një eksperimenti është gjetja e kushteve dhe rregullave të tilla për kryerjen e eksperimenteve sipas të cilave është e mundur të merret informacion i besueshëm dhe i besueshëm për një objekt me sasinë më të vogël të punës, si dhe të paraqitet ky informacion në një formë kompakte dhe të përshtatshme. me një vlerësim sasior të saktësisë.

Ndër metodat kryesore të planifikimit të përdorura në faza të ndryshme të studimit janë:

Planifikimi i një eksperimenti depistues, kuptimi kryesor i të cilit është përzgjedhja nga e gjithë grupi i faktorëve të një grupi faktorësh të rëndësishëm që i nënshtrohen studimit të mëtejshëm të detajuar;

Dizajni eksperimental për ANOVA, d.m.th. hartimi i planeve për objekte me faktorë cilësor;

Planifikimi i një eksperimenti regresioni që ju lejon të merrni modele regresioni (polinom dhe të tjerë);

Planifikimi i një eksperimenti ekstrem në të cilin detyra kryesore është optimizimi eksperimental i objektit të kërkimit;

Planifikimi gjatë studimit të proceseve dinamike etj.

Qëllimi i studimit të disiplinës është përgatitja e studentëve për aktivitete prodhuese dhe teknike në specialitetin e tyre duke përdorur metoda të teorisë së planifikimit dhe teknologjive moderne të informacionit.

Objektivat e disiplinës: studimi i metodave moderne të planifikimit, organizimit dhe optimizimit të eksperimenteve shkencore dhe industriale, kryerja e eksperimenteve dhe përpunimi i rezultateve të marra.

1. ANALIZA KORELACIONI

1.1 Koncepti i korrelacionit

Një studiues shpesh është i interesuar se si dy ose më shumë variabla lidhen me njëri-tjetrin në një ose më shumë mostra që studiohen. Për shembull, a mund të ndikojë gjatësia në peshën e një personi, apo presioni i gjakut mund të ndikojë në cilësinë e produktit?

Kjo lloj varësie midis variablave quhet korrelacion, ose korrelacion. Një korrelacion është një ndryshim i qëndrueshëm në dy karakteristika, duke reflektuar faktin se ndryshueshmëria e një karakteristike është në përputhje me ndryshueshmërinë e tjetrës.

Dihet, për shembull, se mesatarisht ekziston një lidhje pozitive midis gjatësisë së njerëzve dhe peshës së tyre, dhe e tillë që sa më e madhe të jetë gjatësia, aq më e madhe është pesha e personit. Megjithatë, ka përjashtime nga ky rregull, kur njerëzit relativisht të shkurtër janë mbipeshë, dhe, anasjelltas, njerëzit asthenikë me shtat të lartë kanë peshë të ulët. Arsyeja për përjashtime të tilla është se çdo shenjë biologjike, fiziologjike ose psikologjike përcaktohet nga ndikimi i shumë faktorëve: mjedisor, gjenetik, social, mjedisor etj.

Lidhjet e korrelacionit janë ndryshime probabiliste që mund të studiohen vetëm në mostrat përfaqësuese duke përdorur metodat e statistikave matematikore. Të dy termat - lidhje korrelacioni dhe varësia e korrelacionit - shpesh përdoren në mënyrë të ndërsjellë. Varësia nënkupton ndikim, lidhje - çdo ndryshim i koordinuar që mund të shpjegohet me qindra arsye. Lidhjet korrelacionale nuk mund të konsiderohen si dëshmi e një marrëdhënieje shkak-pasojë ato vetëm tregojnë se ndryshimet në një karakteristikë zakonisht shoqërohen me ndryshime të caktuara në një tjetër.

Varësia e korrelacionit - Këto janë ndryshime që futin vlerat e një karakteristike në probabilitetin e shfaqjes së vlerave të ndryshme të një karakteristike tjetër.

Detyra e analizës së korrelacionit zbret në përcaktimin e drejtimit (pozitiv ose negativ) dhe formës (lineare, jolineare) të marrëdhënies midis karakteristikave të ndryshme, matjen e afërsisë së saj dhe, së fundi, kontrollimin e nivelit të rëndësisë së koeficientëve të korrelacionit të marrë.

Lidhjet e korrelacionit ndryshojnë në formë, drejtim dhe shkallë (fortësi) .

Forma e marrëdhënies së korrelacionit mund të jetë lineare ose lakuar. Për shembull, marrëdhënia midis numrit të seancave të trajnimit në simulator dhe numrit të problemeve të zgjidhura saktë në seancën e kontrollit mund të jetë e drejtpërdrejtë. Për shembull, marrëdhënia midis nivelit të motivimit dhe efektivitetit të një detyre mund të jetë lakor (Figura 1). Me rritjen e motivimit, fillimisht rritet efektiviteti i kryerjes së një detyre, pastaj arrihet niveli optimal i motivimit, i cili korrespondon me efektivitetin maksimal të përfundimit të detyrës; Një rritje e mëtejshme e motivimit shoqërohet me një ulje të efikasitetit.

Figura 1 - Marrëdhënia midis efektivitetit të zgjidhjes së problemeve dhe fuqisë së tendencave motivuese

Në drejtim, marrëdhënia e korrelacionit mund të jetë pozitive ("drejtpërdrejt") dhe negative ("inverse"). Me një korrelacion linear pozitiv, vlerat më të larta të një karakteristike korrespondojnë me vlerat më të larta të një tjetër dhe vlerat më të ulëta të një karakteristike korrespondojnë me vlerat e ulëta të një tjetre (Figura 2). Me një korrelacion negativ, marrëdhëniet janë të kundërta (Figura 3). Me një korrelacion pozitiv, koeficienti i korrelacionit ka një shenjë pozitive, me një korrelacion negativ, ka një shenjë negative.

Figura 2 – Korrelacioni i drejtpërdrejtë

Figura 3 – Korrelacioni invers


Figura 4 – Nuk ka korrelacion

Shkalla, forca ose afërsia e korrelacionit përcaktohet nga vlera e koeficientit të korrelacionit. Forca e lidhjes nuk varet nga drejtimi i saj dhe përcaktohet nga vlera absolute e koeficientit të korrelacionit.

1.2 Klasifikimi i përgjithshëm i korrelacioneve

Në varësi të koeficientit të korrelacionit, dallohen korrelacionet e mëposhtme:

E fortë, ose e ngushtë me një koeficient korrelacioni r>0.70;

Mesatarja (në 0.50

E moderuar (në 0.30

I dobët (në 0.20

Shumë i dobët (në r<0,19).

1.3 Fushat e korrelacionit dhe qëllimi i ndërtimit të tyre

Korrelacioni studiohet në bazë të të dhënave eksperimentale, të cilat janë vlerat e matura (x i, y i) të dy karakteristikave. Nëse ka pak të dhëna eksperimentale, atëherë shpërndarja empirike dydimensionale përfaqësohet si një seri e dyfishtë vlerash x i dhe y i. Në të njëjtën kohë, varësia e korrelacionit midis karakteristikave mund të përshkruhet në mënyra të ndryshme. Korrespondenca midis një argumenti dhe një funksioni mund të jepet nga një tabelë, formulë, grafik etj.

Analiza e korrelacionit, si metodat e tjera statistikore, bazohet në përdorimin e modeleve probabiliste që përshkruajnë sjelljen e karakteristikave në studim në një popullatë të caktuar të përgjithshme nga e cila janë marrë vlerat eksperimentale xi dhe y i. Kur studiohet korrelacioni midis karakteristikave sasiore, vlerat e të cilave mund të maten me saktësi në njësi të shkallëve metrike (metra, sekonda, kilogramë, etj.), Shumë shpesh miratohet një model popullsie dydimensionale e shpërndarë normalisht. Një model i tillë shfaq grafikisht marrëdhënien midis ndryshoreve x i dhe y i në formën e një vendndodhjeje gjeometrike të pikave në një sistem koordinatash drejtkëndëshe. Kjo marrëdhënie grafike quhet gjithashtu një fushë shpërndarjeje ose korrelacioni.
Ky model i një shpërndarjeje normale dydimensionale (fushë korrelacioni) na lejon të japim një interpretim të qartë grafik të koeficientit të korrelacionit, sepse shpërndarja në total varet nga pesë parametra: μ x, μ y - vlerat mesatare (pritshmëritë matematikore); σ x,σ y – devijimet standarde të variablave të rastësishëm X dhe Y dhe p – koeficienti i korrelacionit, i cili është një masë e marrëdhënies midis ndryshoreve të rastësishme X dhe Y.
Nëse p = 0, atëherë vlerat x i, y i të marra nga një popullsi normale dydimensionale janë të vendosura në grafik në koordinatat x, y brenda zonës së kufizuar nga rrethi (Figura 5, a). Në këtë rast, nuk ka korrelacion midis variablave të rastësishëm X dhe Y dhe ato quhen të pakorreluara. Për një shpërndarje normale dydimensionale, jokorrelacioni nënkupton njëkohësisht pavarësinë e ndryshoreve të rastësishme X dhe Y.

Nëse janë renditur dy seri vlerash, është racionale të llogaritet korrelacioni i renditjes së Spearman.

Seri të tilla mund të përfaqësohen:

  • një palë karakteristikash të përcaktuara në të njëjtin grup objektesh në studim;
  • një çift karakteristikash individuale vartëse, të përcaktuara në 2 objekte të studiuara sipas të njëjtit grup karakteristikash;
  • një çift karakteristikash vartëse të grupit;
  • vartësi individuale dhe grupore e karakteristikave.

Metoda përfshin renditjen e treguesve veçmas për secilën nga karakteristikat.

Vlera më e vogël ka gradën më të vogël.

Kjo metodë i referohet një metode statistikore joparametrike të krijuar për të vendosur ekzistencën e një marrëdhënieje midis fenomeneve që studiohen:

  • përcaktimi i shkallës aktuale të paralelizmit ndërmjet dy serive të të dhënave sasiore;
  • vlerësimi i afërsisë së lidhjes së identifikuar, i shprehur në mënyrë sasiore.

Analiza e korrelacionit

Një metodë statistikore e krijuar për të identifikuar ekzistencën e një marrëdhënieje midis 2 ose më shumë vlerave të rastësishme (variablave), si dhe fuqisë së saj, quhet analiza e korrelacionit.

Emrin e ka marrë nga correlation (lat.) - raport.

Kur e përdorni, skenarët e mëposhtëm janë të mundshëm:

  • prania e korrelacionit (pozitiv ose negativ);
  • nuk ka korrelacion (zero).

Nëse vendoset një marrëdhënie midis variablave, flasim për korrelacionin e tyre. Me fjalë të tjera, mund të themi se kur vlera e X ndryshon, domosdoshmërisht do të vërehet një ndryshim proporcional në vlerën e Y.

Si mjete përdoren masa të ndryshme komunikimi (koeficientë).

Zgjedhja e tyre ndikohet nga:

  • një metodë për matjen e numrave të rastit;
  • natyra e lidhjes ndërmjet numrave të rastit.

Ekzistenca e një marrëdhënie korrelacioni mund të shfaqet grafikisht (grafikë) dhe duke përdorur një koeficient (shfaqje numerike).

Marrëdhënia e korrelacionit karakterizohet nga karakteristikat e mëposhtme:

  • forca e lidhjes (me një koeficient korrelacioni nga ±0,7 në ±1 - e fortë; nga ±0,3 në ±0,699 - mesatare; nga 0 në ±0,299 - e dobët);
  • drejtimi i komunikimit (i drejtpërdrejtë ose i kundërt).

Qëllimet e analizës së korrelacionit

Analiza e korrelacionit nuk na lejon të vendosim një lidhje shkakësore midis variablave në studim.

Ajo kryhet me qëllim të:

  • vendosja e marrëdhënieve ndërmjet variablave;
  • marrjen e informacionit të caktuar për një variabël bazuar në një variabël tjetër;
  • përcaktimi i afërsisë (lidhjes) së kësaj varësie;
  • përcaktimi i drejtimit të lidhjes së vendosur.

Metodat e analizës së korrelacionit


Kjo analizë mund të kryhet duke përdorur:

  • metoda e katrorëve ose Pearson;
  • metoda e rangut ose Spearman.

Metoda Pearson është e zbatueshme për llogaritjet që kërkojnë një përcaktim të saktë të forcës që ekziston midis variablave. Karakteristikat e studiuara me ndihmën e tij duhet të shprehen vetëm në mënyrë sasiore.

Për të aplikuar metodën Spearman ose korrelacionin e rangut nuk ka kërkesa strikte për shprehjen e karakteristikave - mund të jetë edhe sasiore dhe atributive. Falë kësaj metode, informacioni nuk merret për përcaktimin e saktë të forcës së lidhjes, por është i një natyre të përafërt.

Rreshtat e ndryshueshëm mund të përmbajnë variante të hapura. Për shembull, kur përvoja e punës shprehet në vlera të tilla si deri në 1 vit, më shumë se 5 vjet, etj.

Koeficienti i korrelacionit

Një sasi statistikore që karakterizon natyrën e ndryshimeve në dy variabla quhet koeficienti i korrelacionit ose koeficienti i korrelacionit të çiftit. Në terma sasiorë, varion nga -1 në +1.

Shanset më të zakonshme janë:

  • Pearson– i zbatueshëm për variablat që i përkasin shkallës së intervalit;
  • Shtizëri– për variablat e shkallës rendore.

Kufizimet e përdorimit të koeficientit të korrelacionit

Marrja e të dhënave jo të besueshme gjatë llogaritjes së koeficientit të korrelacionit është e mundur në rastet kur:

  • ka një numër të mjaftueshëm vlerash të ndryshueshme të disponueshme (25-100 palë vëzhgime);
  • ndërmjet variablave që studiohen, për shembull, vendoset një marrëdhënie kuadratike dhe jo një lidhje lineare;
  • në çdo rast të dhënat përmbajnë më shumë se një vëzhgim;
  • prania e vlerave anormale (të jashtme) të variablave;
  • të dhënat në studim përbëhen nga nëngrupe vëzhgimesh të dallueshme qartë;
  • prania e një korrelacioni nuk na lejon të përcaktojmë se cili nga variablat mund të konsiderohet si shkak dhe cili si pasojë.

Kontrollimi i rëndësisë së korrelacionit

Për të vlerësuar sasitë statistikore, përdoret koncepti i rëndësisë ose besueshmërisë së tyre, i cili karakterizon probabilitetin e një shfaqjeje të rastësishme të një sasie ose vlerat ekstreme të saj.

Metoda më e zakonshme për përcaktimin e rëndësisë së një korrelacioni është testi i Studentit.

Vlera e tij krahasohet me vlerën e tabelës, numri i shkallëve të lirisë merret si 2. Kur merret vlera e llogaritur e kriterit është më e madhe se vlera e tabelës, kjo tregon rëndësinë e koeficientit të korrelacionit.

Gjatë kryerjes së llogaritjeve ekonomike, një nivel besimi prej 0,05 (95%) ose 0,01 (99%) konsiderohet i mjaftueshëm.

Radhët Spearman

Koeficienti i korrelacionit të gradës së Spearman ju lejon të përcaktoni statistikisht praninë e një marrëdhënieje midis fenomeneve. Llogaritja e tij përfshin vendosjen e një numri serik - rang - për çdo atribut. Rangu mund të jetë në rritje ose në zbritje.

Numri i veçorive që i nënshtrohen renditjes mund të jetë çdo. Ky është një proces mjaft intensiv i punës që kufizon numrin e tyre. Vështirësitë fillojnë kur arrini 20 shenja.

Për të llogaritur koeficientin Spearman, përdorni formulën:

ku:

n – tregon numrin e veçorive të renditura;

d nuk është gjë tjetër veçse diferenca ndërmjet renditjeve në dy variabla;

dhe ∑(d2) është shuma e diferencave në katror të gradave.

Zbatimi i analizës së korrelacionit në psikologji

Mbështetja statistikore e kërkimit psikologjik bën të mundur që ai të bëhet më objektiv dhe shumë përfaqësues. Përpunimi statistikor i të dhënave të marra gjatë eksperimenteve psikologjike ndihmon në nxjerrjen e informacionit maksimal të dobishëm.

Metoda më e përdorur për përpunimin e rezultateve të tyre është analiza e korrelacionit.

Është e përshtatshme të kryhet një analizë korrelacioni e rezultateve të marra gjatë hulumtimit:

  • ankthi (sipas testeve të R. Temml, M. Dorca, V. Amen);
  • marrëdhëniet familjare (pyetësori "Analiza e marrëdhënieve familjare" (AFV) nga E.G. Eidemiller, V.V. Yustitskis);
  • niveli i brendësisë-eksternalitetit (pyetësori nga E.F. Bazhin, E.A. Golynkina dhe A.M. Etkind);
  • niveli i djegies emocionale te mësuesit (pyetësor nga V.V. Boyko);
  • lidhjet midis elementeve të inteligjencës verbale të studentëve gjatë trajnimit multidisiplinar (metodologjia nga K.M. Gurevich dhe të tjerët);
  • lidhjet ndërmjet nivelit të empatisë (metoda e V.V. Bojkos) dhe kënaqësisë martesore (pyetësori nga V.V. Stolin, T.L. Romanova, G.P. Butenko);
  • lidhjet midis statusit sociometrik të adoleshentëve (testi Jacob L. Moreno) dhe karakteristikave të stilit të edukimit familjar (pyetësori nga E.G. Eidemiller, V.V. Yustitskis);
  • strukturat e synimeve të jetës së adoleshentëve të rritur në familje me dy prindër dhe me një prind (pyetësori Edward L. Deci, Richard M. Ryan Ryan).

Udhëzime të shkurtra për kryerjen e analizës së korrelacionit duke përdorur kriterin Spearman

Është kryer analiza e korrelacionit duke përdorur metodën e Spearman sipas algoritmit të mëposhtëm:

  • karakteristikat e krahasueshme të çiftuara janë rregulluar në 2 rreshta, njëra prej të cilave përcaktohet nga X dhe tjetra nga Y;
  • vlerat e serisë X janë renditur në rend rritës ose zbritës;
  • sekuenca e rregullimit të vlerave të serisë Y përcaktohet nga korrespondenca e tyre me vlerat e serisë X;
  • për secilën vlerë në serinë X, përcaktoni gradën - caktoni një numër serial nga vlera minimale në maksimum;
  • për secilën nga vlerat në serinë Y, përcaktoni gjithashtu gradën (nga minimumi në maksimum);
  • njehsoni diferencën (D) ndërmjet rangut të X dhe Y, duke përdorur formulën D=X-Y;
  • vlerat e diferencës që rezultojnë janë në katror;
  • të kryejë mbledhjen e katrorëve të dallimeve të rangut;
  • kryeni llogaritjet duke përdorur formulën:

Shembull i korrelacionit Spearman

Është e nevojshme të përcaktohet ekzistenca e një korrelacioni midis përvojës së punës dhe shkallës së lëndimeve nëse disponohen të dhënat e mëposhtme:

Metoda më e përshtatshme e analizës është metoda e renditjes, sepse një nga karakteristikat paraqitet në formën e opsioneve të hapura: përvojë pune deri në 1 vit dhe përvojë pune 7 vjet ose më shumë.

Zgjidhja e problemit fillon me renditjen e të dhënave, e cila përpilohet në një tabelë pune dhe mund të bëhet me dorë, sepse vëllimi i tyre nuk është i madh:

Eksperience pune Numri i lëndimeve Numrat serialë (gradat) Diferenca në rang Diferenca në katror e gradave
d (x-y)
deri në 1 vit 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 ose më shumë 6 5 1 +4 16
Σ d2 = 38,5

Shfaqja e rangjeve thyesore në kolonë është për faktin se nëse shfaqen variante me madhësi të barabartë, gjendet mesatarja aritmetike e renditjes. Në këtë shembull, treguesi i lëndimit 12 ndodh dy herë dhe i caktohet renditja 2 dhe 3, gjeni mesataren aritmetike të këtyre renditjeve (2+3)/2= 2.5 dhe vendoseni këtë vlerë në fletën e punës për 2 tregues.
Duke zëvendësuar vlerat e marra në formulën e punës dhe duke bërë llogaritje të thjeshta, marrim koeficientin Spearman të barabartë me -0.92

Vlera e koeficientit negativ tregon praninë e një marrëdhënieje të kundërt midis karakteristikave dhe na lejon të pohojmë se një përvojë e shkurtër pune shoqërohet me një numër të madh dëmtimesh. Për më tepër, forca e lidhjes midis këtyre treguesve është mjaft e madhe.
Faza tjetër e llogaritjeve është përcaktimi i besueshmërisë së koeficientit të marrë:
llogaritet gabimi i tij dhe testi i Studentit

Metodat matematikore të analizës dhe parashikimit

Analiza e korrelacionit

Prezantimi

2. Analiza e regresionit

3. Analiza faktoriale

4. Analiza e grupeve

5. Analiza e dinamikës dhe parashikimi i proceseve shoqërore dhe juridike

konkluzioni

Dy lloje të varësisë janë të mundshme ndërmjet dukurive dhe proceseve socio-ekonomike: funksionale dhe stokastike. At ose parametra të tjerë që karakterizojnë fenomene të ndryshme. Shembuj të kësaj lloj varësie praktikisht nuk gjenden kurrë në mjedisin shoqëror.

Me një varësi stokastike (probabiliste), një vlerë specifike e ndryshores së varur korrespondon me një grup vlerash të ndryshores shpjeguese. Kjo, para së gjithash, për faktin se variabla e varur ndikohet nga një sërë faktorësh të pakontabilizuar. Për më tepër, gabimet në matjen e variablave kanë një ndikim: për shkak të shpërndarjes së rastësishme të vlerave, vlerat e tyre mund të tregohen vetëm me një probabilitet të caktuar.

Në sferën socio-ekonomike kemi të bëjmë me shumë dukuri që kanë natyrë probabiliste. Kështu, numri i krimeve të kryera dhe të zbardhura për një periudhë të caktuar kohore, numri i aksidenteve rrugore në çdo rajon për një kohë të caktuar janë të gjitha variabla të rastësishme.

Për të studiuar marrëdhëniet stokastike, ekzistojnë metoda të veçanta, në veçanti analiza e korrelacionit ("korrelacioni" është një marrëdhënie, një lidhje midis fenomeneve dhe proceseve ekzistuese).

Analiza e korrelacionit- ky është përdorimi në një sekuencë të caktuar të një grupi metodash statistikore të përpunimit të informacionit, i cili bën të mundur studimin e marrëdhënieve midis karakteristikave të ndryshme.

Detyra e analizës së korrelacionit si metodë e statistikave matematikore është vendosja e formës dhe drejtimit të lidhjes, si dhe matja e afërsisë së kësaj lidhjeje ndërmjet karakteristikave të rastësishme që studiohen.

Në statistikë, madhësia e marrëdhënies lineare midis dy karakteristikave matet duke përdorur një të thjeshtë (kampion) koeficienti i korrelacionit. Madhësia e varësisë lineare të një ndryshoreje nga disa të tjera matet me koeficientin e shumëfishtë pas eliminimit të pjesës së varësisë lineare për shkak të marrëdhënies së këtyre variablave me variablat e tjerë.

Në formë, korrelacionet mund të jenë lineare (drejtvizore) dhe jolineare (lakore), dhe në drejtim

Lidhje direkte tregon se me një rritje (ulje) të vlerave të një karakteristike, vlerat e një karakteristike tjetër rriten (zvogëlohen). Në reagime Një rritje (ulje) në vlerat e një karakteristike çon në një ulje (rritje) të vlerave të një karakteristike tjetër.



Detyra kryesore e analizës së korrelacionit- matja e ngushtësisë së lidhjes - zgjidhet duke llogaritur koeficientët e ndryshëm të korrelacionit dhe duke kontrolluar rëndësinë e tyre.

Koeficienti i korrelacionit mund të marrë vlera nga 0 në +1 për një marrëdhënie të drejtpërdrejtë, dhe nga -1 në 0 për një marrëdhënie të kundërt, me koeficientët afër 0, konsiderohet se nuk ka lidhje statistikore lineare midis karakteristikave. me vlera absolute të koeficientëve më pak se 0.3, marrëdhënia është e dobët; në vlerat 0.3...0.5 lidhja është e moderuar; në 0.5...0.7 - marrëdhënia është e rëndësishme; në 0.7...0.9 - lidhja është e fortë; nëse vlerat e koeficientit janë më të mëdha se 0.9, atëherë marrëdhënia konsiderohet shumë e fortë; nëse koeficientët janë të barabartë me +1 ose -1, atëherë flasim për një lidhje funksionale (që praktikisht nuk ndodh në studimet statistikore).

Sidoqoftë, një vlerësim i tillë i thjeshtuar i forcës së marrëdhënies nuk është gjithmonë i saktë, pasi shkalla e besimit në praninë e një marrëdhënieje statistikore varet nga madhësia e popullsisë që studiohet. Sa më i vogël të jetë vëllimi i popullsisë, aq më e madhe duhet të jetë vlera e koeficientit të korrelacionit për të pranuar hipotezën për ekzistencën e një marrëdhënieje midis karakteristikave. Për të matur në mënyrë sasiore shkallën e besimit në ekzistencën e një marrëdhënie statistikore lineare midis karakteristikave, konceptet niveli i rëndësisë Dhe vlerat e pragut (kritike). koeficienti i korrelacionit.

Kontrolli i rëndësisë Koeficienti i korrelacionit që rezulton konsiston në krahasimin e vlerës së llogaritur me vlerën kritike. Për një numër të caktuar matjesh dhe një nivel të caktuar rëndësie, gjendet një vlerë kritike dhe krahasohet me vlerën e llogaritur. Nëse vlera e llogaritur është më e madhe se ajo kritike, atëherë lidhja është e rëndësishme nëse është më e vogël, atëherë lidhja ose mungon (dhe kjo vlerë e koeficientit të korrelacionit shpjegohet me devijime të rastësishme), ose mostra është e vogël për t'u identifikuar; atë.

Për përcaktimi i ekzistencës dhe madhësisë së një marrëdhënie lineare ndërmjet dy variablave X dhe Y është e nevojshme të kryhen dy procedura. E para është të shfaqen grafikisht pikat [(Xi,Yi),i=1,n] në plan. Grafiku që rezulton quhet pranueshmëria e supozimit të një marrëdhënie lineare midis variablave. Nëse një supozim i tillë është i pranueshëm, atëherë është e nevojshme të shprehet në formë sasiore madhësia e marrëdhënies lineare. Për ta bërë këtë, përdoret koeficienti i korrelacionit të mostrës:

ku n është numri i matjeve, Xi,Yi janë vlerat i-të, X,Y janë vlerat mesatare, sx, sy janë devijimet standarde të variablave X dhe Y, përkatësisht.

Në teorinë e analizës statistikore, një marrëdhënie korrelacioni përkufizohet si një varësi lineare në kushtet e shpërndarjes normale të variablave të analizuar. Prandaj, për zbatimin e saktë të metodave të korrelacionit, është e nevojshme të justifikohet afërsia e shpërndarjes së variablave me normalen dhe forma e marrëdhënies me atë lineare. Përndryshe, është e nevojshme të përdoren teknika më komplekse të analizës ose koeficientë të tjerë të bashkimit.

Një mënyrë mjaft e thjeshtë llogaritëse e thjeshtë për të kontrolluar normalitetin e një shpërndarjeje empirike është të vlerësoni raportin e mëposhtëm:

,

ku C është devijimi mesatar absolut, s është devijimi standard.

Nëse plotësohet pabarazia e treguar, atëherë mund të flasim për normalitetin e shpërndarjeve empirike dhe korrektësinë e përdorimit të koeficientit të korrelacionit si masë e një marrëdhënieje statistikore lineare midis variablave.

Në përgjithësi, shkalla e krimit ndikohet nga shumë faktorë. Këto përfshijnë socio-ekonomike, gjeografike dhe klimatike, demografike, etj., Si dhe shenjat që karakterizojnë forcat dhe mjetet, shkallën e organizimit të organit të punëve të brendshme.

Megjithatë, edhe nëse ekziston një lidhje e fortë statistikisht e rëndësishme midis dy variablave, nuk mund të jetë plotësisht i sigurt për shkakësinë e tyre, pasi mund të ketë arsye (faktorë) të tjerë që përcaktojnë lidhjen e tyre të përbashkët statistikore. Përfundimet statistikore duhet të mbështeten gjithmonë nga një kornizë e shëndoshë teorike.

Në të njëjtën kohë, mungesa e një lidhjeje të rëndësishme statistikore nuk tregon mungesën e një marrëdhënieje shkak-pasojë, por e detyron njeriun të kërkojë mënyra dhe mjete të tjera për ta identifikuar atë, nëse koncepti thelbësor dhe përvoja praktike tregojnë mundësinë e tij. ekzistencës.

ANALIZA KORELACIONI- një grup metodash për vlerësimin e marrëdhënieve midis dukurive dhe ngjarjeve të rastësishme, bazuar në teorinë matematikore të korrelacionit. Në këtë rast, përdoren karakteristikat më të thjeshta, që kërkojnë një minimum llogaritjesh. Termi "korrelacion" zakonisht identifikohet me konceptet e "lidhjes" dhe "ndërvarësisë". Megjithatë, ato nuk janë adekuate. Korrelacioni është vetëm një lloj lidhjeje ndërmjet karakteristikave, ai shfaqet mesatarisht dhe ka natyrë lineare. Nëse ekziston një marrëdhënie e qartë midis dy madhësive, atëherë një marrëdhënie e tillë quhet funksionale dhe nga njëra nga madhësitë (shkaku) është e mundur të përcaktohet pa mëdyshje vlera e sasisë tjetër (efektit). Varësia funksionale është një shprehje e veçantë e një varësie të rastësishme (probabiliste, stokastike), kur marrëdhënia nuk shfaqet për çdo vlerë të dy sasive, por vetëm mesatarisht.

K. a. përdoret kur studiohen dy ose më shumë ndryshore të rastësishme për të identifikuar dy karakteristika sasiore më të rëndësishme: një ekuacion matematik për marrëdhënien midis këtyre madhësive dhe një vlerësim të afërsisë së lidhjes midis tyre. Të dhënat fillestare për përcaktimin e këtyre karakteristikave janë rezultatet sinkrone të vëzhgimit (matje, eksperiment), d.m.th., të marra njëkohësisht nga përvoja statistikore mbi karakteristikat, marrëdhënia ndërmjet të cilave po studiohet. Të dhënat fillestare mund të specifikohen në formën e tabelave me të dhënat e rezultateve të vëzhgimit ose paraqitjet e tyre ekuivalente në shirit magnetik, shirit me grusht ose karta me grusht.

K. a. ka gjetur aplikim të gjerë në mjekësi dhe biologji për të përcaktuar ekuacionet e afërsisë dhe marrëdhënieve midis shenjave të ndryshme, për shembull, rezultatet e analizave të pykës, shenjave ose ekzaminimeve speciale të kryera te njerëz të shëndetshëm ose të sëmurë (shiko Korrelacioni i funksioneve të trupit). Rezultatet K. a. përdoren për të bërë parashikime objektive të sëmundjeve, për të vlerësuar gjendjen e pacientit dhe rrjedhën e sëmundjes (shih Parashikimi). A priori, bazuar vetëm në rezultatet e biolit teorik dhe mjaltit. hulumtimi, është e vështirë apo edhe e pamundur të parashikohet se si karakteristikat që studiohen lidhen me njëra-tjetrën. Për t'iu përgjigjur kësaj pyetjeje, kryhet një vëzhgim ose një eksperiment i veçantë.

Analiza e korrelacionit dydimensional përdoret kur përpunohen të dhënat eksperimentale për manifestimin e çdo dy karakteristikash.

TABELA KORELACIONI. Shënim. Tabela tregon intervalet e shenjave X dhe Y, si dhe frekuencat e shfaqjes së tyre (në qendër të tabelës), të llogaritura nga rezultatet e një analize morfometrike të mikrovaskulaturës së rajonit bulbokonjuktival, ku Y është diametri i venula, dhe X është diametri i arteriolës (në mmk).

Çdo rezultat eksperimental është një ndryshore e rastësishme dhe modelet objektive shfaqen vetëm në të gjithë grupin e rezultateve të matjes. Prandaj, përfundimet bëhen bazuar në rezultatet e përpunimit të të gjithë grupit të të dhënave eksperimentale, dhe jo në vlerat individuale që janë të rastësishme. Për të zvogëluar ndikimin e një ngjarjeje të rastësishme, të dhënat fillestare kombinohen në grupe, gjë që arrihet duke përpiluar një tabelë korrelacioni (shih tabelën). Një tabelë e tillë përmban intervale (ose pikat e mesit të tyre) të vlerave të dy karakteristikave - Y dhe X, si dhe frekuencën e shfaqjes së vlerave X dhe Y në intervalin përkatës të këtyre vlerave. Këto frekuenca, të llogaritura nga rezultatet e eksperimentit, përfaqësojnë një vlerësim praktik të probabilitetit të bashkëshfaqjes së vlerave X dhe Y të një intervali të caktuar. Ndërtimi i një tabele korrelacioni është faza e parë e përpunimit të informacionit fillestar. Ndërtimi i tabelave të korrelacionit dhe përpunimi i mëtejshëm i plotë i tyre kryhen shpejt në kompjuterë universalë ose të specializuar (shiko Kompjuter elektronik). Duke përdorur të dhënat e grupuara të tabelës së korrelacionit, llogariten karakteristikat empirike të ekuacionit dhe forca e lidhjes. Për të përcaktuar ekuacionin e marrëdhënies midis Y dhe X, vlerat mesatare të karakteristikës Y llogariten në çdo interval të karakteristikës X. Kështu. merrni për çdo interval të i-të vlerën Yxi, lidhja e së cilës për të gjitha intervalet i jep një vijë regresioni empirik që karakterizon formën e lidhjes midis atributit Y dhe atributit X mesatarisht - një grafik i funksionit Yx= f(x) . Nëse do të kishte një lidhje të paqartë midis karakteristikave Y dhe X, ekuacioni i lidhjes do të ishte i mjaftueshëm për të zgjidhur problemet praktike dhe teorike, pasi me ndihmën e tij është gjithmonë e mundur të përcaktohet vlera e karakteristikës Y nëse është dhënë vlera e X. Në praktikë, marrëdhënia midis Y dhe X nuk është e paqartë, kjo marrëdhënie është e rastësishme dhe një vlerë e X korrespondon me një numër vlerash të Y. Prandaj, nevojitet një karakteristikë tjetër që mat forcën dhe afërsinë e marrëdhënies midis Y dhe X. Karakteristika të tilla janë relacioni i dispersionit (korrelacionit) ηух dhe koeficienti i korrelacionit ryx. E para nga këto sasi karakterizon afërsinë e lidhjes midis Y dhe X në një funksion arbitrar f, dhe ryx përdoret vetëm në rastin kur f është një funksion linear.

Vlerat e ηyx dhe ryx gjithashtu përcaktohen thjesht nga tabela e korrelacionit. Llogaritja zakonisht kryhet në rendin e mëposhtëm: përcaktohen vlerat mesatare të të dy karakteristikave X dhe Y, devijimet e tyre standarde σx dhe σy, dhe më pas ηxy sipas formulës:

dhe ryx sipas formulës:

ku n është numri total i eksperimenteve, Xcpi është vlera mesatare e X e intervalit të i-të, Ycpj është vlera mesatare e Y e intervalit të j-të, k, l është numri i intervaleve të veçorive X dhe Y, përkatësisht, mi(x) është frekuenca (numri) i vlerave Xcpi . Karakteristikat sasiore të saktësisë së përcaktimit të ηyx dhe ryx janë devijimet standarde të tyre, të cilat janë të barabarta me

Vlerat e koeficientit η shtrihen midis zeros dhe një (0=<ηyx=<1). Если ηyx= 0 (рис., а), то это свидетельствует о том, что признаки Y и X недисперсированы, т. е. регрессия Yx = f(x) не дает связи между признаками Y и X, а при ηyx = 1 существует однозначная связь между Y и X (рис., б, ж). Для ηyx<1 признак Y только частично определяется признаком X, и необходимо изучение дополнительных признаков для повышения достоверности определения Y (рис., г, д, е, и).

Vlera e koeficientit r qëndron ndërmjet -1 dhe +1 (-1=

Analiza e korrelacionit multivariate - përcaktimi i ekuacionit dhe afërsisë së marrëdhënies në rastet kur numri i karakteristikave që studiohen është më shumë se dy. Pra, nëse Y është një tipar kompleks dhe rezultati i tij varet nga shfaqja e një grupi tiparesh X1, X2, ..., Xn, atëherë, sipas të dhënave eksperimentale, duhet të përcaktohet: a) ekuacioni për lidhjen. të tiparit Y me bashkësinë e tipareve X1, X2,.. ., Xn, d.m.th. Yx1x2...xn = F(x1, x2...,xn) ; b) afërsinë e lidhjes ndërmjet Y dhe grupit X1, X2,..., Xn.

Përpunimi paraprak i vëzhgimit rezulton në CA shumëdimensionale. është që për çdo çift karakteristikash përcaktohen vlerat e marrëdhënieve të dispersionit ηyxi (i = 1,2,..., n) dhe ηxixj (i!=j) koeficientët e korrelacionit ryxi dhe rxixj, si dhe regresionet e çiftëzuara Yxi. = fi (xi ). Nga këto të dhëna, më pas përcaktohen ekuacionet e regresionit të shumëfishtë Yx1x2...xn = F (x1,x2,...,xn), relacioni i dispersionit të shumëfishtë ηyx1x2...xn dhe koeficienti i korrelacionit të shumëfishtë Ryx1x2...xn. Ekuacioni i regresionit të shumëfishtë bën të mundur përcaktimin e vlerës së karakteristikës Y bazuar në grupin e vlerave X1, X2, ..., Xn, d.m.th., me këtë ekuacion, është e mundur të parashikohen vlerat e Y. bazuar në rezultatet e vlerave specifike të grupit që rezulton (për shembull, rezultatet e analizës mbi karakteristikat X1, X2...Xn). Vlera ηyx1x2...xn përdoret si karakteristikë e afërsisë së lidhjes midis Y dhe grupit të karakteristikave X1, X2, ...Xn për një funksion arbitrar F, dhe Ryx1x2...xn - për rastin kur funksioni F është linear. Koeficientët ηyx1x2....xn dhe Ryx1x2...xn marrin vlera ndërmjet zeros dhe një. Përfshirja në konsideratë për AK shumëdimensionale. veçoritë shtesë bëjnë të mundur marrjen e vlerave ηyx1x2...xn, Ryx1x2...xn më afër unitetit dhe kështu rritjen e saktësisë së parashikimit të veçorisë Y duke përdorur një ekuacion të regresionit të shumëfishtë.

Si shembull, merrni parasysh rezultatet e CA të çiftëzuar, si dhe ekuacionin e regresionit të shumëfishtë dhe koeficientin e korrelacionit të shumëfishtë midis shenjave: Y - pseudoparezë e qëndrueshme, X1 - lateralizimi i defektit motorik në gjymtyrët në të djathtë, X2 - i njëjtë në gjymtyrët në të majtë, X3 - kriza autonome. Vlerat e marrëdhënieve të shpërndarjes dhe koeficientët e korrelacionit në çift për to do të jenë, përkatësisht, ηyx1 = 0,429, ηyx2 = 0,616, ηyx3 = -0,334, dhe ryx1 = 0,320, ryx2 = 0,586, ryx2 = 0,586, ryx3 = -0. Sipas ekuacionit të regresionit të shumëfishtë linear, Yx1x2x3 = 0,638 x1 + 0,839 x2 - 0,195 x3. Koeficienti i korrelacionit të shumëfishtë do të shprehet si Ryx1x2x3 =0.721. Shembulli tregon se sipas të dhënave X1, X2 dhe X3, pseudopareza e qëndrueshme mund të parashikohet me saktësi të mjaftueshme për praktikë.

Metodat e K. a. Ato gjithashtu ofrojnë mundësinë për të marrë karakteristika dinamike dhe. Në këtë rast, tiparet e studiuara (p.sh. EKG, EEG, etj.) konsiderohen si funksione të rastësishme të Y(t) dhe X(t). Në bazë të rezultateve të vëzhgimit të këtyre funksioneve, përcaktohen edhe dy karakteristika më të rëndësishme: a) vlerësimi i operatorit të telekomit (ekuacioni matematik) ndërmjet Y (t) dhe X (t); b) vlerësimi i afërsisë së lidhjes ndërmjet tyre. Si karakteristika të ngushtësisë së lidhjes merren funksionet e dispersionit dhe të korrelacionit të funksioneve të rastësishme Y (t) dhe X(t). Këto funksione janë një përgjithësim i marrëdhënieve të variancës dhe koeficientëve të korrelacionit. Kështu, funksioni i normalizuar i shpërndarjes reciproke ηyx(t) i secilës vlerë fikse t është lidhja e shpërndarjes midis vlerave të veçorive Y (t) dhe X(t). Në mënyrë të ngjashme, funksioni i normalizuar i ndërlidhjes Ryx(t) përfaqëson, për çdo vlerë fikse t, koeficientin e korrelacionit midis veçorive Y(t) dhe X(t). Karakteristika e një marrëdhënieje lineare (varësi) për të njëjtën vlerë në studim në momente të ndryshme kohore quhet autokorrelacion.

K. a. është një nga metodat për zgjidhjen e problemit të identifikimit, e cila ka gjetur përdorim të gjerë në marrjen e modeleve matematikore dhe automatizimin e biolit mjekësor, kërkimit dhe trajtimit.

Bibliografi: Sistemet kompjuterike dhe diagnostikimi automatik i sëmundjeve të zemrës, ed. C. Caceres dhe L. Dreyfus, përkth. nga anglishtja, M., 1974; Gutman S.R. Rreth dy modeleve të elektroencefalogramit që konvergojnë në një proces normal të rastësishëm, në libër: Menaxhimi dhe informacioni. proceset në natyrën e gjallë, bot. V. V. Larina, f. 205, M., 1971; Zaslavskaya R. M., Perepel-kin E. G. dhe Akhmetov K. Zh. Lidhjet e korrelacionit midis treguesve të hemokoagulimit dhe metabolizmit të lipideve në pacientët me anginë pectoris gjatë ditës, Kardiologjia, v. 17, nr. 111, 1977; Kramer G. Metodat matematikore të statistikës, përkth. nga anglishtja, M., 1975; Pasternak E. B. et al. 50, 1977; Sinitsyn B.S. Korrelatorët automatikë dhe aplikimi i tyre, Novosibirsk, 1964, bibliogr. U r b a x V. Yu. Analiza statistikore në kërkimin biologjik dhe mjekësor, M., 1975, bibliogr.

V. N. Raibman, N. S. Raibman.



Ju pëlqeu artikulli? Ndani me miqtë tuaj!