Pse nevojitet analiza e korrelacionit? Kushtet për përdorimin e metodës

Gjatë studimit të natyrës, shoqërisë dhe ekonomisë, është e nevojshme të merret parasysh ndërlidhja e proceseve dhe fenomeneve të vëzhguara. Për më tepër, plotësia e përshkrimit përcaktohet në një mënyrë ose në një tjetër nga karakteristikat sasiore të marrëdhënieve shkak-pasojë midis tyre. Vlerësimi i më domethënësve prej tyre, si dhe ndikimi i disa faktorëve në të tjerët, është një nga detyrat kryesore të statistikave.

Format e manifestimit të marrëdhënieve janë shumë të ndryshme. Si dy llojet më të zakonshme të tyre nxjerr në pah funksionale(i plotë) dhe korrelacioni lidhje (e paplotë). Në rastin e parë, vlera e karakteristikës së faktorit korrespondon rreptësisht me një ose më shumë vlera funksioni. Shumë shpesh, lidhjet funksionale shfaqen në fizikë dhe kimi. Në ekonomi, një shembull është marrëdhënia drejtpërdrejt proporcionale midis produktivitetit të punës dhe rritjes së prodhimit.

Një marrëdhënie korrelacioni (e cila quhet edhe jo e plotë, ose statistikore) shfaqet mesatarisht për vëzhgimet masive, kur vlerat e dhëna të ndryshores së varur korrespondojnë me një numër të caktuar vlerash të mundshme të ndryshores së pavarur. Shpjegimi për këtë është kompleksiteti i marrëdhënieve ndërmjet faktorëve të analizuar, ndërveprimi i të cilëve ndikohet nga variabla të rastësishëm të pa llogaritur. Prandaj, lidhja midis shenjave shfaqet vetëm mesatarisht, në masën e rasteve. Në një marrëdhënie korrelacioni, çdo vlerë argumenti korrespondon me vlerat e funksionit të shpërndara rastësisht në një interval të caktuar.

Për shembull, një rritje e lehtë e argumentit do të sjellë vetëm një rritje ose ulje mesatare (në varësi të drejtimit) të funksionit, ndërsa vlerat specifike për njësitë individuale të vëzhgimit do të ndryshojnë nga mesatarja. Varësi të tilla gjenden kudo. Për shembull, në bujqësi, kjo mund të jetë lidhja midis rendimentit dhe sasisë së plehut të aplikuar. Natyrisht, këta të fundit janë të përfshirë në formimin e të korrave. Por për çdo fushë ose parcelë specifike, e njëjta sasi e plehut të aplikuar do të shkaktojë një rritje të ndryshme të rendimentit, pasi ndërveprojnë një sërë faktorësh të tjerë (moti, gjendja e tokës, etj.), të cilët formojnë rezultatin përfundimtar. Sidoqoftë, mesatarisht, vërehet një marrëdhënie e tillë - një rritje në masën e plehrave të aplikuara çon në një rritje të rendimentit.

Sipas drejtimit të komunikimit ekzistojnë drejt, kur ndryshorja e varur rritet me rritjen e atributit të faktorit, dhe anasjelltas, në të cilat rritja e kësaj të fundit shoqërohet me ulje të funksionit. Lidhje të tilla mund të quhen gjithashtu pozitive dhe negative, përkatësisht.

Përsa i përket formës analitike të tyre, lidhjet janë lineare Dhe jolineare. Në rastin e parë, marrëdhëniet lineare shfaqen mesatarisht midis karakteristikave. Një marrëdhënie jolineare shprehet me një funksion jolinear dhe variablat janë mesatarisht të lidhur me njëri-tjetrin në mënyrë jolineare.

Ekziston një karakteristikë tjetër mjaft e rëndësishme e lidhjeve nga pikëpamja e faktorëve ndërveprues. Nëse lidhja ndërmjet dy karakteristikave karakterizohet, atëherë zakonisht quhet dhomë me avull. Nëse studiohen më shumë se dy variabla − të shumëfishta.

Kriteret e mësipërme të klasifikimit gjenden më shpesh në analizat statistikore. Por përveç atyre të listuara, ka edhe direkt, indirekt Dhe e rreme komunikimet. Në fakt, thelbi i secilit prej tyre është i qartë nga emri. Në rastin e parë, faktorët ndërveprojnë drejtpërdrejt me njëri-tjetrin. Një lidhje indirekte karakterizohet nga pjesëmarrja e një variabli të tretë që ndërmjetëson marrëdhënien midis karakteristikave që studiohen. Një lidhje e rreme është një lidhje e krijuar zyrtarisht dhe, si rregull, e konfirmuar vetëm nga vlerësimet sasiore. Nuk ka bazë cilësore ose është e pakuptimtë.

Ndryshojnë në forcë i dobët Dhe të fortë komunikimet. Kjo karakteristikë formale shprehet në sasi specifike dhe interpretohet në përputhje me kriteret e pranuara përgjithësisht për fuqinë e lidhjes për tregues të veçantë.

Në formën më të përgjithshme, detyra e statistikave në fushën e studimit të marrëdhënieve është të përcaktojë sasinë e pranisë dhe drejtimit të tyre, si dhe të karakterizojë forcën dhe formën e ndikimit të disa faktorëve mbi të tjerët. Për ta zgjidhur atë, përdoren dy grupe metodash, njëra prej të cilave përfshin metodat e analizës së korrelacionit, dhe tjetra - analizën e regresionit. Në të njëjtën kohë, një numër studiuesish i kombinojnë këto metoda në analizën e korrelacionit-regresionit, e cila ka një bazë: praninë e një numri procedurash të përgjithshme llogaritëse, komplementaritetin në interpretimin e rezultateve, etj.

Prandaj, në këtë kontekst, mund të flasim për analizën e korrelacionit në një kuptim të gjerë - kur marrëdhënia karakterizohet në mënyrë gjithëpërfshirëse. Në të njëjtën kohë, ekziston një analizë korrelacioni në kuptimin e ngushtë - kur shqyrtohet forca e lidhjes - dhe analiza e regresionit, gjatë së cilës vlerësohet forma e saj dhe ndikimi i disa faktorëve në të tjerët.

Vetë detyrat analiza e korrelacionit bazohet në matjen e afërsisë së marrëdhënies midis karakteristikave të ndryshme, përcaktimin e marrëdhënieve të panjohura shkakësore dhe vlerësimin e faktorëve që kanë ndikimin më të madh në karakteristikën që rezulton.

Detyrat analiza e regresionit shtrihen në fushën e vendosjes së formës së varësisë, përcaktimit të funksionit të regresionit dhe përdorimit të një ekuacioni për të vlerësuar vlerat e panjohura të ndryshores së varur.

Zgjidhja e këtyre problemeve bazohet në teknika, algoritme, indikatorë të përshtatshëm, përdorimi i të cilëve jep bazë për të folur për studimin statistikor të marrëdhënieve.

Duhet të theksohet se metodat tradicionale të korrelacionit dhe regresionit janë të përfaqësuara gjerësisht në paketa të ndryshme softuerike statistikore për kompjuterë. Studiuesi mund të përgatisë vetëm informacionin në mënyrë korrekte, të zgjedhë një paketë softuerike që plotëson kërkesat e analizës dhe të jetë i gatshëm të interpretojë rezultatet e marra. Ka shumë algoritme për llogaritjen e parametrave të komunikimit, dhe për momentin vështirë se është e këshillueshme që të kryhet një lloj analize kaq komplekse me dorë. Procedurat llogaritëse janë me interes të pavarur, por njohja e parimeve të studimit të marrëdhënieve, mundësive dhe kufizimeve të metodave të caktuara të interpretimit të rezultateve është një parakusht për kërkime.

Metodat për vlerësimin e fuqisë së një lidhjeje ndahen në korrelacion (parametrik) dhe joparametrik. Metodat parametrike bazohen në përdorimin, si rregull, të vlerësimeve të shpërndarjes normale dhe përdoren në rastet kur popullsia që studiohet përbëhet nga vlera që i binden ligjit të shpërndarjes normale. Në praktikë, ky pozicion më së shpeshti pranohet apriori. Në fakt, këto metoda janë parametrike dhe zakonisht quhen metoda korrelacioni.

Metodat joparametrike nuk vendosin kufizime në ligjin e shpërndarjes së sasive të studiuara. Avantazhi i tyre është thjeshtësia e llogaritjeve.

Metodat matematikore të analizës dhe parashikimit

Analiza e korrelacionit

Hyrje

2. Analiza e regresionit

3. Analiza faktoriale

4. Analiza e grupeve

5. Analiza e dinamikës dhe parashikimi i proceseve shoqërore dhe juridike

konkluzioni

Dy lloje të varësisë janë të mundshme ndërmjet dukurive dhe proceseve socio-ekonomike: funksionale dhe stokastike. At ose parametra të tjerë që karakterizojnë fenomene të ndryshme. Shembuj të kësaj lloj varësie praktikisht nuk gjenden kurrë në mjedisin shoqëror.

Me një varësi stokastike (probabiliste), një vlerë specifike e ndryshores së varur korrespondon me një grup vlerash të ndryshores shpjeguese. Kjo, para së gjithash, për faktin se variabla e varur ndikohet nga një sërë faktorësh të pa llogaritur. Për më tepër, gabimet në matjen e variablave kanë një ndikim: për shkak të shpërndarjes së rastësishme të vlerave, vlerat e tyre mund të tregohen vetëm me një probabilitet të caktuar.

Në sferën socio-ekonomike kemi të bëjmë me shumë dukuri që kanë natyrë probabiliste. Kështu, numri i krimeve të kryera dhe të zbardhura për një periudhë të caktuar kohore, numri i aksidenteve rrugore në çdo rajon për një kohë të caktuar janë të gjitha variabla të rastësishme.

Për të studiuar marrëdhëniet stokastike, ekzistojnë metoda të veçanta, në veçanti analiza e korrelacionit (marrëdhënia "korrelacion", lidhja midis fenomeneve dhe proceseve ekzistuese).

Analiza e korrelacionit- ky është përdorimi në një sekuencë të caktuar të një grupi metodash statistikore të përpunimit të informacionit, i cili bën të mundur studimin e marrëdhënieve midis karakteristikave të ndryshme.

Detyra e analizës së korrelacionit si metodë e statistikave matematikore është vendosja e formës dhe drejtimit të lidhjes, si dhe matja e afërsisë së kësaj lidhjeje ndërmjet karakteristikave të rastësishme që studiohen.

Në statistikë, madhësia e marrëdhënies lineare midis dy karakteristikave matet duke përdorur një të thjeshtë (kampion) koeficienti i korrelacionit. Madhësia e varësisë lineare të një ndryshoreje nga disa të tjera matet me koeficientin e shumëfishtë pas eliminimit të pjesës së varësisë lineare për shkak të marrëdhënies së këtyre variablave me variablat e tjerë.

Në formë, korrelacionet mund të jenë lineare (drejtvizore) dhe jolineare (lakore), dhe në drejtim

Lidhje direkte tregon se me një rritje (ulje) të vlerave të një karakteristike, vlerat e një karakteristike tjetër rriten (zvogëlohen). Në reagime Një rritje (ulje) e vlerave të një karakteristike çon në një ulje (rritje) të vlerave të një karakteristike tjetër.



Detyra kryesore e analizës së korrelacionit- matja e ngushtësisë së lidhjes - zgjidhet duke llogaritur koeficientët e ndryshëm të korrelacionit dhe duke kontrolluar rëndësinë e tyre.

Koeficienti i korrelacionit mund të marrë vlera nga 0 në +1 për një marrëdhënie të drejtpërdrejtë, dhe nga -1 në 0 për një marrëdhënie të kundërt, me koeficientët afër 0, konsiderohet se nuk ka lidhje statistikore lineare midis karakteristikave. me vlera absolute të koeficientëve më të vogël se 0.3, marrëdhënia është e dobët; në vlerat 0.3...0.5 lidhja është e moderuar; në 0.5...0.7 - marrëdhënia është e rëndësishme; në 0.7...0.9 - lidhja është e fortë; nëse vlerat e koeficientit janë më të mëdha se 0.9, atëherë marrëdhënia konsiderohet shumë e fortë; nëse koeficientët janë të barabartë me +1 ose -1, atëherë flasim për një lidhje funksionale (që praktikisht nuk ndodh në studimet statistikore).

Sidoqoftë, një vlerësim i tillë i thjeshtuar i forcës së marrëdhënies nuk është gjithmonë i saktë, pasi shkalla e besimit në praninë e një marrëdhënieje statistikore varet nga madhësia e popullsisë që studiohet. Sa më i vogël të jetë vëllimi i popullsisë, aq më e madhe duhet të jetë vlera e koeficientit të korrelacionit për të pranuar hipotezën për ekzistencën e një marrëdhënieje midis karakteristikave. Për të matur në mënyrë sasiore shkallën e besimit në ekzistencën e një marrëdhënie statistikore lineare midis karakteristikave, konceptet niveli i rëndësisë Dhe vlerat e pragut (kritike). koeficienti i korrelacionit.

Kontrolli i rëndësisë Koeficienti i korrelacionit që rezulton konsiston në krahasimin e vlerës së llogaritur me vlerën kritike. Për një numër të caktuar matjesh dhe një nivel të caktuar rëndësie, gjendet një vlerë kritike dhe krahasohet me vlerën e llogaritur. Nëse vlera e llogaritur është më e madhe se ajo kritike, atëherë lidhja është e rëndësishme nëse është më e vogël, atëherë lidhja ose mungon (dhe kjo vlerë e koeficientit të korrelacionit shpjegohet me devijime të rastësishme), ose mostra është e vogël për t'u identifikuar; atë.

Për përcaktimi i ekzistencës dhe madhësisë së një marrëdhënie lineare ndërmjet dy variablave X dhe Y është e nevojshme të kryhen dy procedura. E para është të shfaqen grafikisht pikat [(Xi,Yi),i=1,n] në plan. Grafiku që rezulton quhet vlefshmëria e supozimit të një marrëdhënieje lineare midis variablave. Nëse një supozim i tillë është i pranueshëm, atëherë është e nevojshme të shprehet në formë sasiore madhësia e marrëdhënies lineare. Për ta bërë këtë, përdoret koeficienti i korrelacionit të mostrës:

ku n është numri i matjeve, Xi,Yi janë vlerat i-të, X,Y janë vlerat mesatare, sx, sy janë devijimet standarde të variablave X dhe Y, përkatësisht.

Në teorinë e analizës statistikore, një marrëdhënie korrelacioni përkufizohet si një varësi lineare në kushtet e shpërndarjes normale të variablave të analizuar. Prandaj, për zbatimin e saktë të metodave të korrelacionit, është e nevojshme të justifikohet afërsia e shpërndarjes së variablave me normalen dhe forma e marrëdhënies me atë lineare. Përndryshe, është e nevojshme të përdoren teknika më komplekse të analizës ose koeficientë të tjerë të bashkimit.

Një mënyrë mjaft e thjeshtë llogaritëse e thjeshtë për të kontrolluar normalitetin e një shpërndarjeje empirike është të vlerësoni raportin e mëposhtëm:

,

ku C është devijimi mesatar absolut, s është devijimi standard.

Nëse kjo pabarazi plotësohet, atëherë mund të flasim për normalitetin e shpërndarjeve empirike dhe korrektësinë e përdorimit të koeficientit të korrelacionit si masë e një marrëdhënieje statistikore lineare midis variablave.

Në përgjithësi, shkalla e krimit ndikohet nga shumë faktorë. Këto përfshijnë socio-ekonomike, gjeografike dhe klimatike, demografike, etj., Si dhe shenjat që karakterizojnë forcat dhe mjetet, shkallën e organizimit të organit të punëve të brendshme.

Megjithatë, edhe nëse ekziston një lidhje e fortë statistikisht e rëndësishme midis dy variablave, nuk mund të jetë plotësisht i sigurt për shkakësinë e tyre, pasi mund të ketë arsye (faktorë) të tjerë që përcaktojnë lidhjen e tyre të përbashkët statistikore. Përfundimet statistikore duhet të mbështeten gjithmonë nga një kornizë e shëndoshë teorike.

Në të njëjtën kohë, mungesa e një lidhjeje të rëndësishme statistikore nuk tregon mungesën e një marrëdhënieje shkak-pasojë, por e detyron njeriun të kërkojë mënyra dhe mjete të tjera për ta identifikuar atë, nëse koncepti thelbësor dhe përvoja praktike tregojnë mundësinë e tij. ekzistencës.

Koncepti i ndërlidhjes është mjaft i zakonshëm në kërkimin psikologjik. Një psikolog duhet të operojë me të kur bëhet e nevojshme të krahasohen matjet e dy ose më shumë treguesve të shenjave ose fenomeneve për të nxjerrë ndonjë përfundim.

Natyra e marrëdhënies ndërmjet dukurive që studiohen mund të jetë e paqartë, d.m.th. të tilla kur një vlerë e caktuar e një karakteristike korrespondon me një vlerë të qartë dhe të caktuar të një tjetre. Kështu, për shembull, në nëntestin për kërkimin e modeleve në testet e funksioneve mendore, numri i pikëve "të papërpunuara" të shënuara përcaktohet nga formula:
Xi = Stz - Soz / Stz + Spz * Sbc,
ku Xi është vlera e opsionit, Stz është numri i modeleve (korrespondencave) të specifikuara a priori në nëntest, Soz është numri i korrespondencave të treguara gabimisht për testuesit, Sz është numri i ndeshjeve të paspecifikuara (të humbura) me testuesit, Sbc është numri i të gjitha fjalëve të shikuara nga testuesit në test.

Kjo marrëdhënie quhet funksionale: këtu një tregues është funksion i një tjetri, i cili është një argument në lidhje me të parin.

Sidoqoftë, një marrëdhënie e qartë dhe e qartë nuk gjendet gjithmonë. Më shpesh hasim një situatë në të cilën një vlerë e një karakteristike mund të korrespondojë me disa vlera të një tjetre. Këto vlera ndryshojnë brenda kufijve pak a shumë të përcaktuar. Ky lloj marrëdhënieje quhet korrelativ ose korrelativ.

Përdoren disa lloje të shprehjes së marrëdhënieve të korrelacionit. Kështu, për të shprehur marrëdhënien midis karakteristikave që kanë një natyrë sasiore të ndryshimit të vlerave të tyre, përdoren masat e tendencës qendrore: tabela me llogaritjen e mëvonshme të koeficientit të korrelacionit të çiftit, koeficientit të korrelacionit të shumëfishtë dhe të pjesshëm, koeficientit të përcaktimit të shumëfishtë, raportit të korrelacionit.

Nëse është e nevojshme të studiohet marrëdhënia midis karakteristikave, ndryshimi i të cilave është i një natyre cilësore (rezultatet e metodave projektuese të hulumtimit të personalitetit, studimet duke përdorur metodën diferenciale semantike, studimet duke përdorur shkallët e hapura, etj.), atëherë përdorni cilësinë koeficienti alternativ i korrelacionit (treguesi tetrakorik), kriteri Pearson x2, treguesit e kontigjencës Pearson dhe Chuprov.

Për të përcaktuar korrelacionin cilësor-sasior, d.m.th. një korrelacion i tillë, kur një karakteristikë ka një variacion cilësor, dhe tjetra - një variacion sasior.

Koeficienti i korrelacionit (termi u prezantua për herë të parë nga F. Galton në 1888) është një tregues i fuqisë së lidhjes midis dy opsioneve të krahasuara të mostrës (mostrave). Pavarësisht nga formula e përdorur për llogaritjen e koeficientit të korrelacionit, vlera e tij varion nga -1 në +1. Në rastin e një korrelacioni plotësisht pozitiv, ky koeficient është plus 1, dhe në rastin e një korrelacioni krejtësisht negativ, është minus 1. Në mënyrë tipike, kjo është një vijë e drejtë që kalon nëpër pikat e kryqëzimit të vlerave të secilit. palë të dhënash.

Nëse vlerat e variantit nuk rreshtohen në një vijë të drejtë, por formojnë një "re", atëherë koeficienti i korrelacionit në vlerë absolute bëhet më i vogël se një dhe, ndërsa "reja" rrumbullakohet, i afrohet zeros. Nëse koeficienti i korrelacionit është 0, të dy opsionet janë plotësisht të pavarura nga njëri-tjetri.

Çdo vlerë e llogaritur (empirike) e koeficientit të korrelacionit duhet të kontrollohet për besueshmërinë (rëndësinë statistikore) duke përdorur tabelat përkatëse të vlerave kritike të koeficientit të korrelacionit. Nëse vlera empirike është më e vogël ose e barabartë me vlerën e tabelës në nivelin 5 përqind (P = 0.05), korrelacioni nuk është i rëndësishëm. Nëse vlera e llogaritur e koeficientit të korrelacionit është më e madhe se vlera e tabelës për P = 0.01, korrelacioni është statistikisht i rëndësishëm (i besueshëm).

Në rastin kur vlera e koeficientit qëndron ndërmjet 0.05 > P > 0.01, në praktikë ata flasin për rëndësinë e korrelacionit për P = 0.05.

Koeficienti i korrelacionit Bravais-Pearson (r) është një tregues parametrik i propozuar në 1896, për llogaritjen e të cilit krahasohen mesataret aritmetike dhe vlerat mesatare të katrorit. Për të llogaritur këtë koeficient, përdorni formulën e mëposhtme (mund të duket ndryshe për autorë të ndryshëm):
r= (E Xi Xi1) - NXap X1ap / N-1 Qx Qx1,

ku E Xi Xi1 është shuma e produkteve të vlerave të opsioneve të krahasueshme në çift, n është numri i çifteve që krahasohen, NXap, X1ap janë mesataret aritmetike të opsionit Xi, Xi; përkatësisht, Qx, Qx, janë devijimet standarde të shpërndarjeve x dhe x.

Koeficienti i korrelacionit të rangut të Spearman-it Rs (koeficienti i korrelacionit të rangut, koeficienti i Spearman-it) është forma më e thjeshtë e koeficientit të korrelacionit dhe mat marrëdhënien midis gradave (vendeve) të një opsioni të caktuar sipas karakteristikave të ndryshme, pa marrë parasysh vlerën e tij. Ajo që po eksplorohet këtu është një marrëdhënie cilësore dhe jo sasiore.

Në mënyrë tipike, ky kriter joparametrik përdoret në rastet kur është e nevojshme të nxirren përfundime jo aq shumë për intervalet midis të dhënave, por për radhët e tyre, dhe gjithashtu kur kurbat e shpërndarjes janë jashtëzakonisht asimetrike dhe nuk lejojnë përdorimin e kritereve të tilla parametrike si p.sh. koeficienti i korrelacionit Bravais-Pearson (në këto në disa raste, mund të jetë e nevojshme të konvertohen të dhënat sasiore në të dhëna rendore). Nëse koeficienti Rs është afër +1, atëherë kjo do të thotë se dy rreshtat e kampionit të renditur sipas karakteristikave të caktuara praktikisht përputhen, dhe nëse ky koeficient është afër - 1, mund të flasim për një marrëdhënie të kundërt të plotë.

Ashtu si llogaritja e koeficientit të korrelacionit Bravais-Pearson, llogaritjet e koeficientit Rs janë paraqitur më mirë në formë tabelare.

Regresioni përgjithëson konceptin e një marrëdhënieje funksionale në rastin e një natyre stokastike (probabiliste) të varësisë midis vlerave të një varianti. Qëllimi i zgjidhjes së kategorisë së problemeve të regresionit është të vlerësohet vlera e ndryshueshmërisë së prodhimit të vazhdueshëm bazuar në vlerat e opsioneve të hyrjes.

Analiza e korrelacionit

Korrelacioni- marrëdhënie statistikore ndërmjet dy ose më shumë variablave të rastësishëm (ose variablave që mund të konsiderohen si të tillë me një shkallë të pranueshme saktësie). Në këtë rast, ndryshimet në një ose më shumë nga këto sasi çojnë në një ndryshim sistematik në një tjetër ose në sasi të tjera. Një masë matematikore e korrelacionit midis dy ndryshoreve të rastit është koeficienti i korrelacionit.

Korrelacioni mund të jetë pozitiv dhe negativ (është gjithashtu e mundur që të mos ketë lidhje statistikore - për shembull, për variablat e pavarur të rastësishëm). Korrelacion negativ - korrelacioni, në të cilin një rritje në një variabël shoqërohet me një rënie në një variabël tjetër, dhe koeficienti i korrelacionit është negativ. Korrelacion pozitiv - korrelacioni, në të cilin një rritje në një variabël shoqërohet me një rritje në një variabël tjetër dhe koeficienti i korrelacionit është pozitiv.

Autokorrelacioni - marrëdhënie statistikore midis variablave të rastësishëm nga e njëjta seri, por të marra me një zhvendosje, për shembull, për një proces të rastësishëm - me një zhvendosje kohore.

Le X,Y- dy ndryshore të rastësishme të përcaktuara në një hapësirë ​​probabiliteti. Pastaj koeficienti i korrelacionit të tyre jepet me formulën:

,

ku cov tregon kovariancë, dhe D është variancë, ose ekuivalente,

,

ku simboli tregon pritjen matematikore.

Për të paraqitur grafikisht një marrëdhënie të tillë, mund të përdorni një sistem koordinativ drejtkëndor me boshte që korrespondojnë me të dy variablat. Çdo palë vlerash shënohet me një simbol specifik. Ky grafik quhet “scatterplot”.

Metoda për llogaritjen e koeficientit të korrelacionit varet nga lloji i shkallës së cilës i përkasin variablat. Kështu, për të matur variablat me shkallë intervali dhe sasiore, është e nevojshme të përdoret koeficienti i korrelacionit Pearson (korrelacioni i momentit të produktit). Nëse të paktën një nga dy variablat është në një shkallë rendore ose nuk shpërndahet normalisht, duhet të përdoret korrelacioni i gradës së Spearman ose τ (tau) i Kendalit. Në rastin kur një nga dy variablat është dikotomike, përdoret një korrelacion pikë-biserial, dhe nëse të dy variablat janë dikotomikë: një korrelacion me katër fusha. Llogaritja e koeficientit të korrelacionit ndërmjet dy ndryshoreve jo dikotomike ka kuptim vetëm kur marrëdhënia ndërmjet tyre është lineare (njëdrejtimshe).

Koeficienti i korrelacionit Kendell

Përdoret për të matur çrregullimin e ndërsjellë.

Koeficienti i korrelacionit Spearman

Vetitë e koeficientit të korrelacionit

nëse marrim kovariancën si produkt skalar të dy ndryshoreve të rastit, atëherë norma e ndryshores së rastit do të jetë e barabartë me , dhe pasoja e pabarazisë Cauchy-Bunyakovsky do të jetë: . , Ku. Për më tepër, në këtë rast shenjat dhe k ndeshje: .

Analiza e korrelacionit

Analiza e korrelacionit- metoda e përpunimit të të dhënave statistikore, e cila konsiston në studimin e koeficientëve ( korrelacionet) ndërmjet variablave. Në këtë rast, koeficientët e korrelacionit midis një çifti ose shumë çiftesh karakteristikash krahasohen për të vendosur marrëdhënie statistikore midis tyre.

Synimi analiza e korrelacionit- jepni disa informacione për një variabël duke përdorur një variabël tjetër. Në rastet kur është e mundur të arrihet një qëllim, variablat thuhet se janë korrelojnë. Në formën e tij më të përgjithshme, pranimi i hipotezës së një korrelacioni do të thotë se një ndryshim në vlerën e ndryshores A do të ndodhë njëkohësisht me një ndryshim proporcional në vlerën e B: nëse të dy variablat rriten, atëherë korrelacioni është pozitiv, nëse një ndryshore rritet dhe tjetra zvogëlohet, korrelacioni është negativ.

Korrelacioni pasqyron vetëm varësinë lineare të vlerave, por nuk pasqyron lidhjen funksionale të tyre. Për shembull, nëse llogaritni koeficientin e korrelacionit midis sasive A = sin(x) Dhe B = cos(x) , atëherë do të jetë afër zeros, d.m.th. nuk ka varësi ndërmjet sasive. Ndërkohë, sasitë A dhe B janë dukshëm të lidhura funksionalisht sipas ligjit sin 2 (x) + cos 2 (x) = 1 .

Kufizimet e analizës së korrelacionit

Grafikët e shpërndarjeve të çifteve (x,y) me koeficientët përkatës të korrelacionit x dhe y për secilën prej tyre. Vini re se koeficienti i korrelacionit pasqyron një marrëdhënie lineare (vija e sipërme), por nuk përshkruan një kurbë marrëdhëniesh (vija e mesme) dhe nuk është aspak i përshtatshëm për të përshkruar marrëdhënie komplekse, jolineare (vija e poshtme).

  1. Aplikimi është i mundur nëse ka një numër të mjaftueshëm rastesh për studim: për një lloj të veçantë, koeficienti i korrelacionit varion nga 25 në 100 palë vëzhgimesh.
  2. Kufizimi i dytë rrjedh nga hipoteza e analizës së korrelacionit, e cila përfshin varësia lineare e variablave. Në shumë raste, kur dihet me besueshmëri se ekziston një marrëdhënie, analiza e korrelacionit mund të mos japë rezultate thjesht sepse marrëdhënia është jolineare (e shprehur, për shembull, si një parabolë).
  3. Thjesht fakti i korrelacionit nuk ofron bazë për të pohuar se cili nga variablat i paraprin ose shkakton ndryshime, ose se variablat në përgjithësi janë të lidhura me njëri-tjetrin në mënyrë shkakësore, për shembull, për shkak të veprimit të një faktori të tretë.

Fusha e zbatimit

Kjo metodë e përpunimit të të dhënave statistikore është shumë e popullarizuar në shkencat ekonomike dhe sociale (në veçanti në psikologji dhe sociologji), megjithëse fushëveprimi i aplikimit të koeficientëve të korrelacionit është i gjerë: kontrolli i cilësisë së produkteve industriale, metalurgjia, agrokimia, hidrobiologjia, biometria dhe të tjera.

Popullariteti i metodës është për shkak të dy faktorëve: koeficientët e korrelacionit janë relativisht të lehtë për t'u llogaritur, dhe përdorimi i tyre nuk kërkon trajnim të veçantë matematikor. Kombinuar me lehtësinë e tij në interpretim, lehtësia e aplikimit të koeficientit ka bërë që ai të përdoret gjerësisht në fushën e analizës së të dhënave statistikore.

Korrelacion i rremë

Shpesh, thjeshtësia joshëse e kërkimit të korrelacionit e inkurajon studiuesin të nxjerrë përfundime intuitive të rreme për praninë e një marrëdhënieje shkak-pasojë midis çifteve të karakteristikave, ndërsa koeficientët e korrelacionit vendosin vetëm marrëdhënie statistikore.

Në metodologjinë sasiore moderne të shkencave sociale, në fakt, ka pasur një braktisje të përpjekjeve për të vendosur marrëdhënie shkak-pasojë midis variablave të vëzhguar duke përdorur metoda empirike. Prandaj, kur studiuesit në shkencat sociale flasin për vendosjen e marrëdhënieve midis variablave që studiohen, nënkuptohet ose një supozim i përgjithshëm teorik ose një varësi statistikore.

Shihni gjithashtu

Fondacioni Wikimedia.

2010.

    Shih ANALIZA KORELACIONI. Antinazi. Enciklopedia e Sociologjisë, 2009 ... Enciklopedia e Sociologjisë

    Një degë e statistikave matematikore që kombinon metoda praktike për studimin e korrelacionit midis dy (ose më shumë) karakteristikave ose faktorëve të rastësishëm. Shih Korrelacionin (në statistikat matematikore)... Fjalori i madh enciklopedik

    ANALIZA KORELACIONI, një pjesë e statistikave matematikore që kombinon metoda praktike për studimin e korrelacionit midis dy (ose më shumë) karakteristikave ose faktorëve të rastësishëm. Shih Korrelacionin (shih KORELACIONIN (marrëdhënie reciproke ... Fjalor Enciklopedik

    Analiza e korrelacionit- (në ekonomi) një degë e statistikave matematikore që studion marrëdhëniet ndërmjet ndryshimit të sasive (korrelacioni është një raport, nga fjala latine correlatio). Marrëdhënia mund të jetë e plotë (d.m.th. funksionale) dhe jo e plotë,... ... Fjalor ekonomik dhe matematikor

    analiza e korrelacionit- (në psikologji) (nga latinishtja correlation ratio) një metodë statistikore për vlerësimin e formës, shenjës dhe afërsisë së lidhjes midis karakteristikave ose faktorëve që studiohen. Kur përcaktohet forma e një lidhjeje, merret parasysh lineariteti ose jolineariteti i saj (d.m.th., si mesatarisht... ... Enciklopedi e madhe psikologjike

    analiza e korrelacionit- - [L.G. Sumenko. Fjalor anglisht-rusisht për teknologjinë e informacionit. M.: Ndërmarrja Shtetërore TsNIIS, 2003.] Temat e teknologjisë së informacionit në përgjithësi analiza e korrelacionit EN ... Udhëzues teknik i përkthyesit

    analiza e korrelacionit- koreliacinė analizė statusas T sritis Kūno kultūra ir sportas apibrėžtis Statistikos metodas, kuriuo įvertinami tiriamųjų asmenų, reiškinių požymiai arba veiksnių santykiai. atitikmenys: angl. studimet e korrelacionit vok. Analizo korrelacionin, f;… … Përfundimi sportiv

    Një grup metodash të bazuara në teorinë matematikore të korrelacionit (Shih Korrelacionin) për zbulimin e një korrelacioni midis dy karakteristikave ose faktorëve të rastësishëm. K. a. të dhënat eksperimentale përfshijnë sa vijon... ... Enciklopedia e Madhe Sovjetike

    Seksioni i matematikës statistikat, duke kombinuar praktike Metodat korrelative të kërkimit. varësitë midis dy (ose më shumë) karakteristikave ose faktorëve të rastësishëm. Shih Korrelacionin... Fjalori i madh enciklopedik politeknik



Ju pëlqeu artikulli? Ndani me miqtë tuaj!