Kodėl reikalinga koreliacinė analizė? Metodo naudojimo sąlygos

Tiriant gamtą, visuomenę, ekonomiką, būtina atsižvelgti į stebimų procesų ir reiškinių tarpusavio ryšį. Be to, aprašymo išsamumą vienaip ar kitaip lemia jų tarpusavio priežasties ir pasekmės santykių kiekybinės charakteristikos. Įvertinti reikšmingiausius iš jų, taip pat vienų veiksnių įtaką kitiems – vienas pagrindinių statistikos uždavinių.

Santykių pasireiškimo formos yra labai įvairios. Kaip du dažniausiai pasitaikantys jų tipai pabrėžti funkcinį(pilnas) ir koreliacija(neužbaigtas) ryšys. Pirmuoju atveju faktoriaus charakteristikos reikšmė griežtai atitinka vieną ar kelias funkcijos reikšmes. Gana dažnai funkciniai ryšiai atsiranda fizikoje ir chemijoje. Ekonomikoje pavyzdys yra tiesiogiai proporcingas ryšys tarp darbo našumo ir padidėjusios gamybos.

Koreliacijos ryšys (kuris taip pat vadinamas neišsamiu arba statistiniu) atsiranda vidutiniškai masiniams stebėjimams, kai nurodytos priklausomo kintamojo reikšmės atitinka tam tikrą skaičių tikėtinų nepriklausomo kintamojo verčių. Tai paaiškinama ryšių tarp analizuojamų veiksnių, kurių sąveikai įtakos turi neapskaityti atsitiktiniai dydžiai, sudėtingumas. Todėl ryšys tarp ženklų atsiranda tik vidutiniškai, bylų masėje. Koreliaciniame ryšyje kiekviena argumento reikšmė atitinka funkcijų reikšmes, atsitiktinai paskirstytas tam tikru intervalu.

Pavyzdžiui, šiek tiek padidinus argumentą, funkcija vidutiniškai padidės arba sumažins (priklausomai nuo krypties), o konkrečios atskirų stebėjimo vienetų reikšmės skirsis nuo vidurkio. Tokios priklausomybės yra visur. Pavyzdžiui, žemės ūkyje tai gali būti derliaus ir įterptų trąšų kiekio santykis. Akivaizdu, kad pastarieji dalyvauja formuojant derlių. Tačiau kiekviename konkrečiame lauke ar sklype tas pats įterptų trąšų kiekis skirtingai padidins derlių, nes sąveikauja daugybė kitų veiksnių (orai, dirvožemio būklė ir kt.), kurie ir sudaro galutinį rezultatą. Tačiau vidutiniškai pastebimas toks ryšys – padidėjus tręštų trąšų masei, didėja derlius.

Pagal bendravimo kryptį yra tiesiai, kai priklausomasis kintamasis didėja didėjant faktoriaus požymiui, ir atvirkščiai, kurioje pastarųjų augimą lydi funkcijos sumažėjimas. Tokius ryšius taip pat galima vadinti atitinkamai teigiamais ir neigiamais.

Kalbant apie jų analitinę formą, ryšiai yra linijinis Ir netiesinis. Pirmuoju atveju tiesiniai ryšiai atsiranda vidutiniškai tarp charakteristikų. Netiesinis ryšys išreiškiamas netiesine funkcija, o kintamieji yra tarpusavyje susiję vidutiniškai netiesiškai.

Yra dar viena gana svarbi sąsajų savybė sąveikaujančių veiksnių požiūriu. Jei charakterizuojamas ryšys tarp dviejų charakteristikų, tada jis paprastai vadinamas garinė pirtis. Jeigu tiriami daugiau nei du kintamieji − daugkartinis.

Minėti klasifikavimo kriterijai dažniausiai sutinkami atliekant statistinę analizę. Tačiau, be išvardytų, yra ir tiesioginis, netiesioginis Ir klaidinga komunikacijos. Tiesą sakant, kiekvieno iš jų esmė yra akivaizdi iš pavadinimo. Pirmuoju atveju veiksniai tiesiogiai sąveikauja vienas su kitu. Netiesioginiam ryšiui būdingas kažkokio trečiojo kintamojo, kuris tarpininkauja santykiui tarp tiriamų charakteristikų, dalyvavimas. Klaidingas ryšys – formaliai nustatytas ir, kaip taisyklė, tik kiekybiniais įvertinimais patvirtintas ryšys. Jis neturi kokybinio pagrindo arba yra beprasmis.

Skiriasi stiprumu silpnas Ir stiprus komunikacijos. Ši formali charakteristika išreiškiama konkrečiais kiekiais ir aiškinama pagal visuotinai priimtus konkrečių rodiklių ryšio stiprumo kriterijus.

Bendriausia forma statistikos uždavinys santykių tyrimo srityje yra kiekybiškai įvertinti jų buvimą ir kryptį, taip pat apibūdinti kai kurių veiksnių įtakos stiprumą ir formą kitiems. Jai išspręsti naudojamos dvi metodų grupės, iš kurių viena apima koreliacinės analizės, o kita – regresinės analizės metodus. Tuo pačiu metu nemažai tyrėjų šiuos metodus sujungia į koreliacinę-regresinę analizę, kuri turi tam tikrą pagrindą: daugybės bendrųjų skaičiavimo procedūrų buvimas, rezultatų interpretavimo papildomumas ir kt.

Todėl šiame kontekste apie koreliacinę analizę galima kalbėti plačiąja prasme – kai santykis yra visapusiškai charakterizuojamas. Kartu atliekama koreliacinė analizė siaurąja prasme – kai nagrinėjamas ryšio stiprumas – ir regresinė analizė, kurios metu vertinama jo forma ir vienų veiksnių įtaka kitiems.

Pačios užduotys koreliacinė analizė apsiriboja kintančių savybių ryšio glaudumo matavimu, nežinomų priežastinių ryšių nustatymu ir veiksnių, turinčių didžiausią įtaką gaunamai charakteristikai, įvertinimu.

Užduotys regresinė analizė yra priklausomybės formos nustatymo, regresijos funkcijos nustatymo ir lygties naudojimo nežinomoms priklausomo kintamojo reikšmėms įvertinti.

Šių problemų sprendimas grindžiamas atitinkamomis technikomis, algoritmais, rodikliais, kurių naudojimas suteikia pagrindo kalbėti apie statistinį ryšių tyrimą.

Pažymėtina, kad tradiciniai koreliacijos ir regresijos metodai yra plačiai atstovaujami įvairiuose kompiuteriams skirtuose statistinės programinės įrangos paketuose. Tyrėjas gali tik teisingai paruošti informaciją, parinkti analizės reikalavimus atitinkantį programinį paketą ir būti pasiruošęs interpretuoti gautus rezultatus. Ryšio parametrų skaičiavimo algoritmų yra daug, ir šiuo metu vargu ar patartina tokio sudėtingo tipo analizę atlikti rankiniu būdu. Skaičiavimo procedūros yra savarankiškos, tačiau tyrimų principų, tam tikrų rezultatų interpretavimo metodų galimybių ir apribojimų išmanymas yra būtina sąlyga atliekant tyrimą.

Ryšio stiprumo vertinimo metodai skirstomi į koreliacinius (parametrinius) ir neparametrinius. Parametriniai metodai paprastai yra pagrįsti normaliojo pasiskirstymo įverčių naudojimu ir yra naudojami tais atvejais, kai tiriama populiacija susideda iš verčių, kurios atitinka normalaus pasiskirstymo dėsnį. Praktikoje ši pozicija dažniausiai priimama a priori. Tiesą sakant, šie metodai yra parametriniai ir paprastai vadinami koreliacijos metodais.

Neparametriniai metodai neapriboja tiriamų dydžių pasiskirstymo dėsnio. Jų pranašumas yra skaičiavimų paprastumas.

Matematiniai analizės ir prognozavimo metodai

Koreliacinė analizė

Įvadas

2. Regresinė analizė

3. Faktorinė analizė

4. Klasterinė analizė

5. Socialinių ir teisinių procesų dinamikos analizė ir prognozavimas

Išvada

Tarp socialinių ir ekonominių reiškinių ir procesų galimos dvi priklausomybės rūšys: funkcinė ir stochastinė. Prie ar kitus įvairius reiškinius apibūdinančius parametrus. Tokios priklausomybės pavyzdžių socialinėje aplinkoje praktiškai nėra.

Esant stochastinei (tikimybinei) priklausomybei, konkreti priklausomo kintamojo reikšmė atitinka aiškinamojo kintamojo verčių rinkinį. Taip yra visų pirma dėl to, kad priklausomą kintamąjį įtakoja daugybė neatsižvelgtų veiksnių. Be to, įtakos turi ir kintamųjų matavimo paklaidos: dėl atsitiktinės reikšmių sklaidos jų reikšmes galima nurodyti tik su tam tikra tikimybe.

Socialinėje ir ekonominėje srityje turime susidurti su daugybe tikimybinio pobūdžio reiškinių. Taigi per nustatytą laikotarpį padarytų ir išaiškintų nusikaltimų skaičius, eismo įvykių skaičius bet kuriame regione per tam tikrą laiką yra atsitiktiniai dydžiai.

Stochastiniams ryšiams tirti naudojami specialūs metodai, ypač koreliacinė analizė („koreliacijos“ ryšys, ryšys tarp esamų reiškinių ir procesų).

Koreliacinė analizė- tai yra statistinių informacijos apdorojimo metodų rinkinio naudojimas tam tikra seka, leidžianti ištirti įvairių charakteristikų ryšius.

Koreliacinės analizės užduotis kaip matematinės statistikos metodas yra nustatyti ryšio formą ir kryptį, taip pat išmatuoti šio ryšio glaudumą tarp tiriamų atsitiktinių charakteristikų.

Statistikoje tiesinio ryšio tarp dviejų charakteristikų dydis matuojamas naudojant paprastą (imtį) koreliacijos koeficientas. Vieno kintamojo tiesinės priklausomybės nuo kelių kitų dydis matuojamas kartotiniu koeficientu, pašalinus tiesinės priklausomybės dalį dėl šių kintamųjų ryšio su kitais kintamaisiais.

Formos koreliacijos gali būti linijinės (tiesios) ir netiesinės (kreivinės) ir krypties.

Tiesioginis ryšys rodo, kad padidėjus (sumažėjus) vienos charakteristikos reikšmėms, kitos charakteristikos reikšmės didėja (sumažėja). At atsiliepimai Vienos charakteristikos reikšmių padidėjimas (sumažėjimas) sumažina (padidėja) kitos charakteristikos reikšmes.



Pagrindinis koreliacinės analizės uždavinys- jungties sandarumo matavimas - sprendžiamas skaičiuojant įvairius koreliacijos koeficientus ir tikrinant jų reikšmingumą.

Tiesioginiam ryšiui koreliacijos koeficientas gali būti nuo 0 iki +1, o atvirkštiniam ryšiui - nuo -1 iki 0, kai koeficientai yra artimi 0, laikoma, kad tarp charakteristikų nėra statistinio tiesinio ryšio. kai absoliučios koeficientų vertės yra mažesnės nei 0,3, ryšys yra silpnas; esant reikšmėms 0,3...0,5 ryšys vidutinis; ties 0,5...0,7 - ryšys reikšmingas; ties 0,7...0,9 - ryšys stiprus; jei koeficiento reikšmės yra didesnės nei 0,9, tada ryšys laikomas labai stipriu; jei koeficientai lygūs +1 arba -1, tai kalbame apie funkcinį ryšį (ko statistiniuose tyrimuose praktiškai nebūna).

Tačiau toks supaprastintas ryšio stiprumo įvertinimas ne visada yra teisingas, nes pasitikėjimo laipsnis esant statistiniam ryšiui priklauso nuo tiriamos populiacijos dydžio. Kuo mažesnė populiacijos apimtis, tuo didesnė turi būti koreliacijos koeficiento reikšmė, kad būtų priimta hipotezė apie ryšį tarp charakteristikų. Siekiant kiekybiškai išmatuoti pasitikėjimo laipsnį tiesinio statistinio ryšio tarp charakteristikų egzistavimu, sąvokos reikšmingumo lygis Ir slenkstinės (kritinės) reikšmės koreliacijos koeficientas.

Reikšmingumo patikrinimas Gautas koreliacijos koeficientas susideda iš apskaičiuotos vertės palyginimo su kritine verte. Tam tikram matavimų skaičiui ir nurodytam reikšmingumo lygiui randama kritinė vertė ir palyginama su apskaičiuota verte. Jei apskaičiuota vertė yra didesnė už kritinę, tada ryšys yra reikšmingas, jei jis mažesnis, tada ryšio arba nėra (ir ši koreliacijos koeficiento reikšmė paaiškinama atsitiktiniais nuokrypiais), arba imtis yra maža, kad būtų galima nustatyti; tai.

nustatantis tiesinio ryšio egzistavimą ir dydį tarp dviejų kintamųjų X ir Y būtina atlikti dvi procedūras. Pirmasis yra grafiškai atvaizduoti taškus [(Xi,Yi),i=1,n] plokštumoje. Gautas grafikas vadinamas tiesinio ryšio tarp kintamųjų prielaidos priimtinumu. Jei tokia prielaida yra priimtina, būtina kiekybine forma išreikšti tiesinio ryšio dydį. Tam naudojamas imties koreliacijos koeficientas:

čia n – matavimų skaičius, Xi,Yi – i-osios reikšmės, X,Y – vidutinės reikšmės, sx, sy – atitinkamai kintamųjų X ir Y standartiniai nuokrypiai.

Statistinės analizės teorijoje koreliacinis ryšys apibrėžiamas kaip tiesinė priklausomybė analizuojamų kintamųjų normalaus pasiskirstymo sąlygomis. Todėl norint teisingai taikyti koreliacijos metodus, būtina pagrįsti kintamųjų skirstinio artumą normaliajam ir ryšio formą tiesiniam. Priešingu atveju būtina naudoti sudėtingesnius analizės metodus ar kitus sujungimo koeficientus.

Gana paprastas skaičiavimais paprastas būdas patikrinti empirinio skirstinio normalumą yra įvertinti šį santykį:

,

kur C yra vidutinis absoliutus nuokrypis, s yra standartinis nuokrypis.

Jeigu nurodyta nelygybė tenkinama, tai galime kalbėti apie empirinių skirstinių normalumą ir koreliacijos koeficiento, kaip tiesinio statistinio ryšio tarp kintamųjų matą, naudojimo teisingumą.

Apskritai nusikalstamumo lygiui įtakos turi daug veiksnių. Tai apima socialinius ir ekonominius, geografinius ir klimatinius, demografinius ir kt., Taip pat ženklus, apibūdinančius pajėgas ir priemones, vidaus reikalų įstaigos organizavimo laipsnį.

Tačiau net jei tarp dviejų kintamųjų yra stiprus statistiškai reikšmingas ryšys, negali būti visiškai tikras dėl jų priežastingumo, nes gali būti ir kitų priežasčių (veiksnių), lemiančių jų bendrą statistinį ryšį. Statistinės išvados visada turi būti paremtos patikima teorine sistema.

Tuo pačiu statistiškai reikšmingo ryšio nebuvimas nerodo priežasties-pasekmės ryšio nebuvimo, o verčia ieškoti kitų būdų ir priemonių jį nustatyti, jei esminė samprata ir praktinė patirtis rodo, kad tai įmanoma. egzistavimą.

Tarpusavio ryšio samprata gana paplitusi psichologiniuose tyrimuose. Psichologui tenka operuoti, kai reikia palyginti dviejų ar daugiau požymių ar reiškinių rodiklių matavimus, kad padarytų kokias nors išvadas.

Santykio tarp tiriamų reiškinių pobūdis gali būti vienareikšmis, t.y. toks, kai tam tikra vienos charakteristikos reikšmė atitinka aiškią ir apibrėžtą kitos. Taigi, pavyzdžiui, atliekant psichinių funkcijų testų modelių paieškos subtestą, surinktų „neapdorotų“ taškų skaičius nustatomas pagal formulę:
Xi = Stz - Soz / Stz + Spz * Sbc,
kur Xi yra pasirinkimo reikšmė, Stz yra a priori nurodytų šablonų (atitikimų) skaičius subteste, Soz yra klaidingai nurodytų atitikmenų skaičius testo dalyviams, Sz yra nenurodytų (praleistų) atitikčių skaičius. testo dalyviai, Sbc yra visų testo dalyvių peržiūrėtų žodžių skaičius.

Šis ryšys vadinamas funkciniu: čia vienas rodiklis yra kito funkcija, o tai yra argumentas pirmojo atžvilgiu.

Tačiau ne visada randamas nedviprasmiškas, aiškus ryšys. Dažniau susiduriame su situacija, kai viena charakteristikos reikšmė gali atitikti kelias kitos reikšmes. Šios vertės skiriasi daugiau ar mažiau apibrėžtose ribose. Šis santykių tipas vadinamas koreliaciniu arba koreliaciniu.

Naudojami keli koreliacinių ryšių išraiškos tipai. Taigi, norint išreikšti ryšį tarp charakteristikų, turinčių kiekybinį pobūdį keičiant jų reikšmes, naudojami centrinės tendencijos matai: lentelė su vėlesniu poros koreliacijos koeficiento, dauginės ir dalinės koreliacijos koeficiento, daugkartinio nustatymo koeficiento, koreliacijos koeficiento skaičiavimu.

Jei reikia tirti ryšį tarp savybių, kurių kitimas yra kokybinio pobūdžio (asmenybės tyrimo projekcinių metodų rezultatai, tyrimai taikant semantinio diferencialo metodą, tyrimai naudojant Atviras skales ir kt.), tuomet naudokite kokybinį alternatyvus koreliacijos koeficientas (tetrachorinis rodiklis), Pirsono kriterijus x2, Pirsono ir Chuprovo nenumatytų atvejų rodikliai.

Kokybinei-kiekybinei koreliacijai nustatyti, t.y. tokia koreliacija, kai viena charakteristika turi kokybinį kitimą, o kita – kiekybinį.

Koreliacijos koeficientas (terminą pirmą kartą įvedė F. Galtonas 1888 m.) yra dviejų lyginamų imties variantų (imčių) ryšio stiprumo rodiklis. Nepriklausomai nuo formulės, naudojamos koreliacijos koeficientui apskaičiuoti, jo reikšmė svyruoja nuo -1 iki +1. Esant visiškai teigiamai koreliacijai, šis koeficientas yra plius 1, o visiškai neigiamos koreliacijos atveju - minus 1. Paprastai tai yra tiesė, einanti per kiekvienos iš jų reikšmių susikirtimo taškus. duomenų pora.

Jei varianto reikšmės nesutampa tiesioje linijoje, o sudaro „debesį“, tada koreliacijos koeficientas absoliučia verte tampa mažesnis už vieną ir, suapvalinus „debesį“, artėja prie nulio. Jei koreliacijos koeficientas yra 0, abu variantai yra visiškai nepriklausomi vienas nuo kito.

Bet kuri apskaičiuota (empirinė) koreliacijos koeficiento vertė turi būti patikrinta dėl patikimumo (statistinio reikšmingumo), naudojant atitinkamas koreliacijos koeficiento kritinių verčių lenteles. Jei empirinė reikšmė yra mažesnė arba lygi lentelei 5 procentų lygyje (P = 0,05), koreliacija nėra reikšminga. Jei apskaičiuota koreliacijos koeficiento reikšmė yra didesnė už lentelės reikšmę, kai P = 0,01, koreliacija yra statistiškai reikšminga (patikima).

Tuo atveju, kai koeficiento reikšmė yra tarp 0,05 > P > 0,01, praktikoje kalbama apie koreliacijos reikšmę, kai P = 0,05.

Bravais-Pearson koreliacijos koeficientas (r) yra 1896 m. pasiūlytas parametrinis rodiklis, kurio skaičiavimui lyginami aritmetiniai vidurkiai ir vidutinės kvadratinės reikšmės. Norėdami apskaičiuoti šį koeficientą, naudokite šią formulę (skirtingiems autoriams ji gali atrodyti skirtingai):
r= (E Xi Xi1) – NXap X1ap / N-1 Qx Qx1,

kur E Xi Xi1 yra porų palyginamų variantų reikšmių sandaugų suma, n yra lyginamų porų skaičius, NXap, X1ap yra Xi, Xi varianto aritmetiniai vidurkiai; atitinkamai Qx, Qx yra skirstinių x ir x standartiniai nuokrypiai.

Spearmano rango koreliacijos koeficientas Rs (rank koreliacijos koeficientas, Spearmano koeficientas) yra paprasčiausia koreliacijos koeficiento forma ir matuoja santykį tarp nurodyto pasirinkimo rangų (vietų) pagal įvairias charakteristikas, neatsižvelgiant į jo paties vertę. Čia nagrinėjamas kokybinis, o ne kiekybinis ryšys.

Paprastai šis neparametrinis kriterijus naudojamas tais atvejais, kai reikia daryti išvadas ne tiek apie intervalus tarp duomenų, bet apie jų eiles, taip pat kai pasiskirstymo kreivės yra itin asimetrinės ir neleidžia naudoti tokių parametrinių kriterijų kaip Bravais-Pearson koreliacijos koeficientas (šiais Kai kuriais atvejais gali prireikti kiekybinius duomenis konvertuoti į eilės duomenis). Jei koeficientas Rs yra artimas +1, tai reiškia, kad dvi imties eilutės, surikiuotos pagal tam tikras charakteristikas, praktiškai sutampa, o jei šis koeficientas artimas -1, galime kalbėti apie visišką atvirkštinį ryšį.

Kaip ir Bravais-Pearson koreliacijos koeficiento apskaičiavimas, Rs koeficiento skaičiavimai patogiau pateikiami lentelės forma.

Regresija apibendrina funkcinio ryšio sampratą stochastinio (tikimybinio) priklausomybės tarp varianto verčių atveju. Regresijos uždavinių kategorijos sprendimo tikslas yra įvertinti nuolatinio išėjimo kintamumo vertę, remiantis įvesties parinkčių reikšmėmis.

Koreliacinė analizė

Koreliacija- statistinis ryšys tarp dviejų ar daugiau atsitiktinių dydžių (arba kintamųjų, kurie gali būti laikomi tokiais su tam tikru priimtinu tikslumu). Be to, pasikeitus vienam ar daugiau šių dydžių, sistemingai keičiasi kiti ar kiti kiekiai. Matematinis koreliacijos tarp dviejų atsitiktinių dydžių matas yra koreliacijos koeficientas.

Koreliacija gali būti teigiama ir neigiama (taip pat gali būti, kad nėra statistinio ryšio – pavyzdžiui, nepriklausomiems atsitiktiniams dydžiams). Neigiama koreliacija - koreliacija, kai vieno kintamojo padidėjimas siejamas su kito kintamojo sumažėjimu, o koreliacijos koeficientas yra neigiamas. Teigiama koreliacija - koreliacija, kai vieno kintamojo padidėjimas siejamas su kito kintamojo padidėjimu, o koreliacijos koeficientas yra teigiamas.

Autokoreliacija - statistinis ryšys tarp atsitiktinių dydžių iš tos pačios serijos, bet paimtas su poslinkiu, pavyzdžiui, atsitiktiniam procesui - su laiko poslinkiu.

Leiskite X,Y- du atsitiktiniai dydžiai, apibrėžti vienoje tikimybių erdvėje. Tada jų koreliacijos koeficientas apskaičiuojamas pagal formulę:

,

kur cov reiškia kovariaciją, o D yra dispersija arba lygiaverčiai,

,

kur simbolis reiškia matematinį lūkestį.

Norėdami grafiškai pavaizduoti tokį ryšį, galite naudoti stačiakampę koordinačių sistemą su ašimis, atitinkančiomis abu kintamuosius. Kiekviena verčių pora pažymėta konkrečiu simboliu. Ši diagrama vadinama „sklaidos diagrama“.

Koreliacijos koeficiento apskaičiavimo metodas priklauso nuo skalės, kuriai priklauso kintamieji, tipo. Taigi, norint matuoti kintamuosius intervalinėmis ir kiekybinėmis skalėmis, būtina naudoti Pirsono koreliacijos koeficientą (produkto momentų koreliaciją). Jei bent vienas iš dviejų kintamųjų yra eilės skalėje arba nėra normaliai pasiskirstęs, reikia naudoti Spearmano rango koreliaciją arba Kendalo τ (tau). Tuo atveju, kai vienas iš dviejų kintamųjų yra dvilypis, naudojama taško ir biserijos koreliacija, o jei abu kintamieji yra dichotominiai: keturių laukų koreliacija. Koreliacijos koeficiento tarp dviejų nedichotominių kintamųjų skaičiavimas prasmingas tik tada, kai ryšys tarp jų yra tiesinis (vienkryptis).

Kendell koreliacijos koeficientas

Naudojamas tarpusavio sutrikimams matuoti.

Spearmano koreliacijos koeficientas

Koreliacijos koeficiento savybės

jei laikysime kovariaciją kaip dviejų atsitiktinių dydžių skaliarinę sandaugą, tada atsitiktinio dydžio norma bus lygi , o Koši-Buniakovskio nelygybės pasekmė bus: . , Kur. Be to, šiuo atveju ženklai ir k rungtynės: .

Koreliacinė analizė

Koreliacinė analizė- statistinių duomenų apdorojimo metodas, kurį sudaro koeficientų tyrimas ( koreliacijos) tarp kintamųjų. Šiuo atveju koreliacijos koeficientai tarp vienos poros ar daugelio charakteristikų porų yra lyginami, siekiant nustatyti statistinius ryšius tarp jų.

Tikslas koreliacinė analizė- Pateikite šiek tiek informacijos apie vieną kintamąjį naudodami kitą kintamąjį. Tais atvejais, kai įmanoma pasiekti tikslą, sakoma, kad kintamieji yra koreliuoti. Bendriausia forma koreliacijos hipotezės priėmimas reiškia, kad kintamojo A reikšmė pasikeis kartu su proporcingu B vertės pokyčiu: jei abu kintamieji didėja, tada koreliacija teigiama, jei vienas kintamasis didėja, o kitas mažėja, koreliacija yra neigiama.

Koreliacija atspindi tik tiesinę verčių priklausomybę, bet neatspindi jų funkcinio ryšio. Pavyzdžiui, jei apskaičiuojate koreliacijos koeficientą tarp dydžių A = sin(x) Ir B = cos(x) , tada jis bus artimas nuliui, t.y., nėra priklausomybės tarp dydžių. Tuo tarpu dydžiai A ir B yra akivaizdžiai funkciškai susiję pagal įstatymą sin 2 (x) + cos 2 (x) = 1 .

Koreliacinės analizės apribojimai

Porų (x,y) skirstinių grafikai su atitinkamais koreliacijos koeficientais x ir y kiekvienai iš jų. Atkreipkite dėmesį, kad koreliacijos koeficientas atspindi tiesinį ryšį (viršutinė linija), bet neaprašo ryšio kreivės (vidurinė linija) ir visiškai netinka sudėtingiems, netiesiniams ryšiams apibūdinti (apatinė eilutė).

  1. Taikymas galimas, jei yra pakankamai tyrimų atvejų: tam tikro tipo koreliacijos koeficientas svyruoja nuo 25 iki 100 stebėjimų porų.
  2. Antrasis apribojimas išplaukia iš koreliacinės analizės hipotezės, kuri apima kintamųjų tiesinė priklausomybė. Daugeliu atvejų, kai patikimai žinoma, kad ryšys egzistuoja, koreliacinė analizė gali neduoti rezultatų vien todėl, kad ryšys yra netiesinis (išreikštas, pavyzdžiui, parabole).
  3. Vien koreliacijos faktas nesudaro pagrindo teigti, kuris iš kintamųjų yra prieš ar sukelia pokyčius, arba kad kintamieji paprastai yra vienas su kitu priežastiniu ryšiu, pavyzdžiui, dėl trečiojo veiksnio veikimo.

Taikymo sritis

Šis statistinių duomenų apdorojimo būdas yra labai populiarus ekonomikos ir socialiniuose moksluose (ypač psichologijoje ir sociologijoje), nors koreliacijos koeficientų taikymo sritis yra plati: pramonės gaminių kokybės kontrolė, metalurgija, agrochemija, hidrobiologija, biometrija ir kt.

Metodo populiarumą lėmė du veiksniai: koreliacijos koeficientus palyginti nesunku apskaičiuoti, o jų naudojimas nereikalauja specialaus matematinio pasirengimo. Kartu su jo aiškinimo paprastumu, koeficiento taikymo paprastumas paskatino jį plačiai naudoti statistinių duomenų analizės srityje.

Klaidinga koreliacija

Dažnai viliojantis koreliacijos tyrimo paprastumas skatina tyrėją daryti klaidingas intuityvias išvadas apie priežasties ir pasekmės ryšio buvimą tarp charakteristikų porų, o koreliacijos koeficientai nustato tik statistinius ryšius.

Šiuolaikinėje socialinių mokslų kiekybinėje metodikoje iš tikrųjų buvo atsisakyta bandymų nustatyti priežasties ir pasekmės ryšius tarp stebimų kintamųjų naudojant empirinius metodus. Todėl kai socialinių mokslų tyrėjai kalba apie santykių tarp tiriamų kintamųjų nustatymą, numanoma arba bendra teorinė prielaida, arba statistinė priklausomybė.

Taip pat žr

Wikimedia fondas.

2010 m.

    Žr. KORELIACIJOS ANALIZĖ. Antinazi. Sociologijos enciklopedija, 2009 ... Sociologijos enciklopedija

    Matematinės statistikos šaka, jungianti praktinius dviejų (ar daugiau) atsitiktinių charakteristikų ar veiksnių koreliacijos tyrimo metodus. Žr. Koreliacija (matematinėje statistikoje)... Didysis enciklopedinis žodynas

    KORELIACIJOS ANALIZĖ – matematinės statistikos skyrius, kuriame apjungiami praktiniai dviejų (ar daugiau) atsitiktinių charakteristikų ar veiksnių koreliacijos tyrimo metodai. Žr. Koreliaciją (žr. KORRELACIJA (abipusis ryšys... Enciklopedinis žodynas

    Koreliacinė analizė- (ekonomikoje) matematinės statistikos šaka, tirianti kintančių dydžių ryšius (koreliacija – santykis, iš lotyniško žodžio correlatio). Santykiai gali būti užbaigti (t. y. funkciniai) ir neišsamūs,... ... Ekonomikos ir matematikos žodynas

    koreliacinė analizė- (psichologijoje) (iš lot. correlatio ratio) statistinis metodas, skirtas įvertinti ryšio tarp tiriamų savybių ar veiksnių formą, požymį ir glaudumą. Nustatant ryšio formą, atsižvelgiama į jo tiesiškumą arba netiesiškumą (t.y. kaip vidutiniškai... ... Puiki psichologinė enciklopedija

    koreliacinė analizė- - [L.G. Sumenko. Anglų-rusų informacinių technologijų žodynas. M.: Valstybės įmonė TsNIIS, 2003.] Temos informacinės technologijos apskritai EN koreliacijos analizė ... Techninis vertėjo vadovas

    koreliacinė analizė- koreliacinė analizė statusas T sritis Kūno kultūra ir sportas apibrėžtis Statistikos metodas, kuriuo įvertinami tiriamųjų asmenų, reiškinių gali arba veiksnių santykiai. atitikmenys: angl. koreliacijos tyrimai vok. Analyze der Correlation, f;… … Sporto terminų žodynas

    Metodų rinkinys, pagrįstas matematine koreliacijos teorija (žr. Koreliaciją), skirtą dviejų atsitiktinių charakteristikų arba veiksnių koreliacijai nustatyti. K. a. eksperimentiniai duomenys apima šiuos...... Didžioji sovietinė enciklopedija

    Matematikos skyrius statistiką, derinant praktinius Koreliacinio tyrimo metodai. dviejų (ar daugiau) atsitiktinių charakteristikų ar veiksnių priklausomybės. Žiūrėti koreliaciją... Didysis enciklopedinis politechnikos žodynas



Ar jums patiko straipsnis? Pasidalinkite su draugais!