Koreliacijos lauko konstravimas iš lentelės duomenų. Koreliacijos ir regresijos duomenų analizė

Vaizdinis koreliacijos lentelės vaizdas yra koreliacijos laukas. Tai grafikas, kuriame X reikšmės pavaizduotos ant abscisių ašies, Y reikšmės vaizduojamos ant ordinačių ašies, o X ir Y deriniai rodomi taškais pagal taškų vietą ryšio.

Naudojant grafinį metodą.

Šis metodas naudojamas vizualiai pavaizduoti tiriamų ekonominių rodiklių ryšio formą. Norėdami tai padaryti, stačiakampėje koordinačių sistemoje nubraižytas grafikas, atskiros gautos charakteristikos Y reikšmės brėžiamos išilgai ordinačių ašies, o individualios faktoriaus charakteristikos X reikšmės - išilgai abscisių ašies.

Rezultato ir faktoriaus charakteristikų taškų rinkinys vadinamas koreliacijos lauku.

Remdamiesi koreliacijos lauku, galime daryti hipotezę (visai populiacijai), kad ryšys tarp visų galimų X ir Y reikšmių yra tiesinis.

Tiesinės regresijos lygtis yra y = bx + a + ε

Čia ε yra atsitiktinė paklaida (nukrypimas, trikdymas).

Atsitiktinės klaidos priežastys:

1. Reikšmingų aiškinamųjų kintamųjų neįtraukimas į regresijos modelį;

2. Kintamųjų agregavimas. Pavyzdžiui, viso vartojimo funkcija yra bandymas bendrai išreikšti atskirų sprendimų dėl išlaidų visumą. Tai tik apytikslis individualių santykių, turinčių skirtingus parametrus, apskaičiavimas.

3. Neteisingas modelio struktūros aprašymas;

4. Neteisinga funkcinė specifikacija;

21. Koreliacinė ir regresinė analizė.

Koreliacinė-regresinė analizė, kaip bendroji sąvoka, apima ryšio artumo ir krypties matavimą bei ryšio analitinės išraiškos (formos) nustatymą (regresinė analizė).

Regresinės analizės tikslas – įvertinti gaunamos charakteristikos (Y) sąlyginės vidutinės reikšmės funkcinę priklausomybę nuo faktorių faktorių (x1, x2, ..., xk).

Regresijos lygtis arba statistinis socialinių ir ekonominių reiškinių ryšio modelis išreiškiamas funkcija:

Yx = f(x1, x2, …, xn),

čia „n“ yra į modelį įtrauktų veiksnių skaičius;

Хi – rezultatui įtakos turintys veiksniai Y.

Koreliacinės ir regresinės analizės etapai:

Preliminari (a priori) analizė. Tai duoda gerų rezultatų, jei atlieka pakankamai kvalifikuotas tyrėjas.

Informacijos rinkimas ir pirminis jos apdorojimas.

Modelio kūrimas (regresijos lygtys). Paprastai ši procedūra atliekama kompiuteryje naudojant standartines programas.

Ryšių tarp požymių glaudumo vertinimas, regresijos lygties įvertinimas ir modelio analizė.

Analizuojamos sistemos raidos prognozavimas naudojant regresijos lygtį.

Pirmajame etape suformuluojama tyrimo problema, nustatoma rodiklių matavimo ar informacijos rinkimo metodika, faktorių skaičius, pašalinami pasikartojantys arba į griežtai apibrėžtą sistemą susieti veiksniai.

Antrame etape analizuojama vienetų apimtis: populiacija turi būti pakankamai didelė pagal vienetų ir stebėjimų skaičių (N>>50), faktorių skaičius „n“ turi atitikti stebėjimų skaičių „N“. “. Duomenys turi būti kiekybiškai ir kokybiškai vienarūšiai.

Trečiajame etape nustatoma ryšio forma ir analitinės funkcijos tipas (parabolė, hiperbolė, tiesė) ir nustatomi jos parametrai.

Ketvirtajame etape Fišerio arba Stjudento patikimumo kriterijumi įvertinamas visų koreliacinio ryšio charakteristikų ir regresijos lygties patikimumas, atliekama ekonominė ir technologinė parametrų analizė.

Penktajame etape numatomos galimos rezultato vertės, remiantis geriausiomis į modelį įtrauktų faktorių charakteristikų reikšmėmis. Čia parenkamos geriausios ir blogiausios veiksnių reikšmės ir rezultatas.

22. Regresijos lygčių tipai.

Ekonominių kintamųjų santykiams kiekybiškai apibūdinti statistikoje naudojami regresijos ir koreliacijos metodai.

Regresija yra dydis, išreiškiantis atsitiktinio dydžio y vidutinės reikšmės priklausomybę nuo atsitiktinio dydžio x reikšmių.

Regresijos lygtis išreiškia vidutinę vienos charakteristikos reikšmę kaip kitos funkcijos funkciją.

Regresijos funkcija yra y = l formos modelis, kur y yra priklausomasis kintamasis (rezultatinis požymis); x yra nepriklausomas arba aiškinamasis kintamasis (ypatybės faktorius).

Regresijos tiesė – funkcijos y = f (x) grafikas.

2 santykių tipai tarp x ir y:

1) gali būti nežinoma, kuris iš dviejų kintamųjų yra nepriklausomas, o kuris priklausomas, kintamieji yra lygūs, tai yra koreliacijos tipo ryšys;

2) jeigu x ir y yra nelygūs ir vienas iš jų laikomas aiškinamuoju (nepriklausomu) kintamuoju, o kitas – priklausomu kintamuoju, tai yra regresijos tipo ryšys.

Regresijos tipai:

1) hiperbolinė – lygiakraštės hiperbolės regresija: y = a + b / x + E;

2) tiesinė – statistikoje naudojama regresija aiškios ekonominės jos parametrų interpretacijos forma: y = a+b*x+E;

3) logaritmiškai tiesinė – formos regresija: In y = In a + b * In x + In E

4) daugkartinė - regresija tarp kintamųjų y ir x1, x2 ...xm, t.y. formos modelis: y = f(x1, x2 ...xm)+E, kur y yra priklausomas kintamasis (rezultatinis požymis), x1 , x2 ...xm - nepriklausomi aiškinamieji kintamieji (ypatumai-veiksniai), E - trikdžių arba stochastinis kintamasis, įskaitant neįskaitomų veiksnių įtaką modelyje;

5) netiesinė - regresija, kuri yra netiesinė analizei įtrauktų aiškinamųjų kintamųjų atžvilgiu, bet tiesinė įvertinamų parametrų atžvilgiu; arba regresija, kuri vertinamų parametrų atžvilgiu yra netiesinė.

6) atvirkštinė - regresija, redukuota į tiesinę formą, realizuota standartiniuose formos paketuose: y = 1/a + b*x+E;

    suporuotas - regresija tarp dviejų kintamųjų y ir x, t.y. formos modelis: y = f (x) + E, kur y yra priklausomas kintamasis (rezultatinis požymis), x yra nepriklausomas, aiškinamasis kintamasis (atributas - veiksnys) , E – trikdymas, arba stochastinis kintamasis, įskaitant neįtrauktų faktorių įtaką modelyje.

    Dinaminės serijos ir jų tipai

Laiko eilutė visada susideda iš 2 elementų: 1) laiko momento arba laikotarpio, kurio atžvilgiu pateikiami statistiniai duomenys, 2) statistinio rodiklio, vadinamo laiko eilutės lygiu.

Priklausomai nuo laiko indikatoriaus turinio, dinamikos eilutės gali būti momentinės arba intervalinės

Priklausomai nuo statistinio rodiklio tipo, laiko eilutės skirstomos į absoliučių, santykinių ir vidutinių reikšmių eilutes

Absoliutus rodo tikslias reikšmes

Santykiniai rodo rodiklio savitųjų svorių pokyčius bendroje populiacijoje

Vidutinės vertės apima rodiklio pokytį laikui bėgant, tai yra vidutinis reiškinio lygis

    Dinamikos serijos rodikliai. Vidutinis dinamikos serijos lygis.

Rodikliai: 1) vidutinis dinaminių eilučių lygis, 2) absoliutus augimas, grandinė ir bazinis, vidutinis absoliutus augimas, 3) augimo ir augimo tempai, grandinė ir bazinis, vidutinis augimo ir prieaugio greitis, 4) fmcjk.nyst reikšmės 1 % padidinti

Vidutinė dinamika

Daugelio dinamikų apibendrintos charakteristikos, kurių pagalba lyginamas reiškinio vystymosi intensyvumas skirtingų objektų atžvilgiu, pavyzdžiui, pagal šalį, pramonės šaką, įmonę

Vidutinis lygis dabartiniu laiku ui. Vidutinio lygio apskaičiavimo metodas priklauso nuo serijos tipo (momentinis / intervalas) (su vienodais / skirtingais intervalais). Jei pateikiama absoliučių arba vidutinių verčių dinamikos intervalų serija su vienodais laiko intervalais, tada vidutiniam lygiui apskaičiuoti naudojama vidutinės paprastosios vertės apskaičiavimo formulė. Jei intervalų eilučių laiko intervalai nelygūs, tai vidutinis lygis randamas naudojant svertinį aritmetinį vidurkį. Usr=smmUi*Ti/smmTi

25. Absoliutus padidėjimas(delta ir) yra dviejų dinaminės serijos lygių skirtumas, parodantis, kiek tam tikras serijos lygis viršija lygį, kuris buvo lyginamas. Delta u = Ui-U0

Delta u = Ui-Ui-1

Absoliutus pagreitis- skirtumas tarp tam tikro laikotarpio absoliutaus augimo ir ankstesnio tos pačios trukmės laikotarpio absoliutaus augimo: Delta ir su linija = delta ir - delta ir -1. Absoliutus pagreitis parodo, kiek padidėjo (sumažėjo) rodiklio kitimo greitis. Pagreičio indikatorius naudojamas grandinės absoliutiesiems žingsniams. Neigiama pagreičio reikšmė rodo augimo sulėtėjimą arba serijų lygių mažėjimo pagreitį.

    Dinamikos serijos lygių santykinių pokyčių rodikliai.

Augimo tempas (augimo greitis)- tai dviejų lyginamų lygių santykis, parodantis, kiek kartų šis lygis viršija bazinio laikotarpio lygį. Atspindi dinamikos serijos lygių pokyčių intensyvumą ir parodo, kiek kartų lygis padidėjo lyginant su baziniu lygiu, o mažėjimo atveju – kokia bazinio lygio dalis yra lyginamasis lygis.

Augimo greičio apskaičiavimo formulė: lyginant su pastovia baze: K i .=y i /y 0 , lyginant su kintama baze: K i .=y i /y i -1 .

Augimo tempas yra augimo greitis, išreikštas procentais:

T r = KAM 100 %.

Bet kurios laiko eilutės augimo tempai yra intervaliniai rodikliai, t.y. apibūdinti tam tikrą laiko tarpą (intervalą).

Padidėjimo greitis- santykinis augimo dydis, t. y. absoliutaus augimo ir ankstesnio arba pradinio lygio santykis. Apibūdina, kiek procentų tam tikro laikotarpio lygis yra didesnis (arba mažesnis) už bazinį lygį.

Padidėjimo greitis- absoliutaus augimo ir lygio, kuris buvo lyginamas, santykis:

Tpr = Ui-U0 / U0 * 100 %

Padidėjimo greitis- skirtumas tarp augimo tempo (procentais) ir 100,

Jums reikės

  • - paskirstymo eilutės iš priklausomo ir nepriklausomo kintamojo;
  • - popierius, pieštukas;
  • - kompiuterinė ir skaičiuoklių programa.

Instrukcijos

Pasirinkite du, kurie, jūsų manymu, sieja santykius, dažniausiai tuos, kurie laikui bėgant keičiasi. Atkreipkite dėmesį, kad vienas iš kintamųjų turi būti nepriklausomas; Kartu su juo turėtų keistis ir antrasis – mažėti, didėti arba keistis atsitiktinai.

Išmatuokite kiekvieno nepriklausomo kintamojo priklausomo kintamojo reikšmę. Įrašykite rezultatus į lentelę, dvi eilutes arba du stulpelius. Norint nustatyti ryšį, reikia bent 30 rodmenų, tačiau norint gauti tikslesnį rezultatą, įsitikinkite, kad yra bent 100 taškų.

Sukurkite koordinačių plokštumą ir nubrėžkite priklausomo kintamojo reikšmes ordinačių ašyje, o nepriklausomo kintamojo - ant abscisių ašies. Pažymėkite ašis ir nurodykite kiekvieno rodiklio matavimo vienetus.

Grafike pažymėkite koreliacijos lauko taškus. X ašyje raskite pirmąją nepriklausomo kintamojo reikšmę, o y ašyje raskite atitinkamą priklausomo kintamojo reikšmę. Sukurkite statmenas šioms projekcijoms ir raskite pirmąjį tašką. Pažymėkite, apibraukite minkštu pieštuku ar rašikliu. Tokiu pat būdu sukonstruokite visus kitus taškus.

Gautas taškų rinkinys vadinamas koreliacija lauke. Išanalizuokite gautą grafiką, padarykite išvadas apie stipraus ar silpno priežasties ir pasekmės ryšio buvimą arba jo nebuvimą.

Atkreipkite dėmesį į kartais pasitaikančius nukrypimus nuo tvarkaraščio. Jei apskritai galima atsekti linijinį ar kitokį ryšį, bet visą „vaizdą“ sugadina vienas ar du taškai, kurie skiriasi nuo bendrosios populiacijos, tai gali atsirasti dėl atsitiktinių klaidų ir į tai neatsižvelgta aiškinant grafiką.

Jei reikia sukurti ir analizuoti lauką koreliacijos Jei norite gauti daug duomenų, naudokite skaičiuoklių programas, pvz., „Excel“, arba įsigykite specialias programas.

Kelių dydžių ryšys, kurio metu pasikeitus vienam lemia ir kitų pokyčius, vadinamas koreliacija. Jis gali būti paprastas, daugybinis arba dalinis. Ši sąvoka priimta ne tik matematikoje, bet ir biologijoje.

Žodis koreliacija kilęs iš lotyniško žodžio correlatio, santykis. Visi reiškiniai, įvykiai ir objektai bei juos apibūdinantys dydžiai yra tarpusavyje susiję. Koreliacinė priklausomybė nuo funkcinės priklausomybės skiriasi tuo, kad esant tokiai priklausomybei, bet kurią galima išmatuoti tik vidutiniškai, koreliacinė priklausomybė daro prielaidą, kad kintamoji reikšmė atitinka nepriklausomos reikšmės pokyčius tik su tam tikru tikimybe. Priklausomybės laipsnis vadinamas koreliacijos koeficientu. Koreliacijos sąvoka yra ryšys tarp atskirų kūno dalių struktūros ir funkcijų koreliacija naudojo statistikai. Statistikoje tai ryšys tarp statistinių dydžių, eilučių ir grupių. Norint nustatyti koreliacijos buvimą ar nebuvimą ar egzistavimą, naudojamas specialus metodas. Koreliacijos metodas naudojamas tiesioginiams arba atvirkštiniams skaičių pokyčiams lyginamoje eilutėje nustatyti. Kai randama, tada pats paralelizmo matas arba laipsnis. Tačiau vidiniai priežasties-pasekmės veiksniai tokiu būdu nerandami. Pagrindinis statistikos, kaip mokslo, uždavinys yra aptikti tokias priežastines priklausomybes kitiems mokslams. Kai vienas iš kintamųjų didėja arba mažėja, kitas taip pat didėja arba mažėja, tada ryšys yra tiesinis. Jei pasikeitus vienam dydžiui, kito pokyčių pobūdis yra netiesinis, tada tai koreliacija netiesinis.Teigiamas koreliacija Tai laikoma, kai vienos vertės lygio padidėjimas kartu su kitos vertės padidėjimu. Pavyzdžiui, kai garso padidėjimą lydi jo aukščio padidėjimo jausmas, koreliacija, kai vieno kintamojo lygio padidėjimą lydi kito lygio sumažėjimas, vadinama neigiama. Bendruomenėse dėl padidėjusio individo nerimo sumažėja tikimybė, kad šis individas užims dominuojančią nišą tarp savo kolegų, kai nėra ryšio tarp kintamųjų, koreliacija vadinamas nuliu.

Video tema

Šaltiniai:

  • Netiesinė koreliacija 2019 m

Koreliacija – tai dviejų atsitiktinių dydžių (dažniausiai dviejų reikšmių grupių) tarpusavio priklausomybė, kai pasikeitus vienam iš jų pasikeičia ir kitas. Koreliacijos koeficientas parodo, kokia tikimybė, kad pasikeis antroji reikšmė, kai pasikeis pirmosios reikšmės, t.y. jos priklausomybės laipsnis. Lengviausias būdas apskaičiuoti šią vertę yra naudoti atitinkamą funkciją, integruotą Microsoft Office Excel skaičiuoklių rengyklėje.

Jums reikės

  • Microsoft Office Excel skaičiuoklių rengyklė.

Instrukcijos

Paleiskite „Excel“ ir atidarykite dokumentą, kuriame yra duomenų grupių, tarp kurių norite apskaičiuoti koreliacijos koeficientą. Jei toks dokumentas dar nesukurtas, tuomet įveskite duomenis – skaičiuoklių rengyklė juos sukuria automatiškai, kai paleidžiate programą. Į atskirą stulpelį įveskite kiekvieną reikšmių grupę, kurios koreliacija jus domina. Tai nebūtinai turi būti gretimi stulpeliai, galite laisvai kurti lentelę patogiausiu būdu – pridėti papildomų stulpelių su duomenų paaiškinimais, stulpelių antraštėmis, suvestinės ląstelėmis su bendromis ar vidutinėmis reikšmėmis ir pan. Jūs netgi galite išdėstyti duomenis ne vertikalia kryptimi (stulpeliais), o horizontalia kryptimi (eilelėmis). Vienintelis reikalavimas, kurį reikia įvykdyti, yra tai, kad langeliai su kiekvienos grupės duomenimis turi būti išdėstyti nuosekliai vienas po kito, kad tokiu būdu būtų sukurtas ištisinis masyvas.

Eikite į langelį, kuriame turėtų būti dviejų masyvų duomenų koreliacijos reikšmė, ir „Excel“ meniu spustelėkite skirtuką „Formulės“. Komandų grupėje „Funkcijų biblioteka“ spustelėkite naujausią piktogramą – „Daugiau funkcijų“. Atsidarys išskleidžiamasis sąrašas, kuriame turėtumėte eiti į skyrių „Statistika“ ir pasirinkti funkciją CORREL. Dėl to atsidarys Funkcijų vedlio langas su užpildyta forma. Tą patį langą galima iškviesti be skirtuko „Formulės“, tiesiog spustelėjus įterpimo funkcijos piktogramą, esančią formulės juostos kairėje.

Formulės vedlio lauke Array1 nurodykite pirmąją koreliuojančių duomenų grupę. Norėdami rankiniu būdu įvesti langelių diapazoną, įveskite pirmosios ir paskutinės langelių adresus, atskirdami juos dvitaškiu (be tarpų). Kitas variantas – tiesiog pele pasirinkti norimą diapazoną ir Excel pati įdės reikiamą įrašą šiame formos laukelyje. Ta pati operacija turi būti atlikta su antrąja duomenų grupe lauke „Array2“.

Spustelėkite Gerai. Skaičiuoklės rengyklė apskaičiuos ir parodys koreliacijos reikšmę langelyje su formule. Jei reikia, galite išsaugoti šį dokumentą naudoti ateityje (spartusis klavišas Ctrl + S).

Sukuriame pagrindinių ir susijusių komponentų koreliacijos lauką. Ant abscisių ašies braižome pagrindinio komponento, šiuo atveju Hg, turinį, o ordinačių ašyje – susijusio komponento turinį, t.y. Sn.

Norint atlikti preliminarų ryšio stiprumo koreliacijos lauke įvertinimą, būtina nubrėžti linijas, atitinkančias pagrindinių ir susijusių komponentų medianines vertes, padalijant lauką į keturis kvadratus.

Kiekybinis ryšio stiprumo matas yra koreliacijos koeficientas. Apytikslis jo įvertinimas apskaičiuojamas pagal formulę:

čia n1 yra bendras I ir III taškų skaičius, n2 = bendras II ir IV taškų skaičius.

I = 4 II = 8 III = 7 IV = 5

Toliau, naudodami kompiuteriu apskaičiuotus pradinius duomenis (Хср, Yср, dispersijas Dx, Dy ir jų kovariaciją cov(x,y)), apskaičiuojame koreliacijos koeficiento r reikšmę ir su jais susijusių tiesinės regresijos lygčių parametrus. pagrindinis komponentas, o pagrindinis komponentas – susijęs komponentas.

Skaičiuojame pagal šias formules:

Pradiniai duomenys:

cov(x, y) = 163,86

r = cov(x, y)/√Dx * Dy = 163,86/√157,27* 645,61 = 0,51

b = cov(x, y)/Dx = 163,86/157,27 = 1,04

a = Yavg – b * Xavg = 153,13 – (-0,08) * 36,75 = 150,19

d = cov(x, y)/ Dy = 163,86/645,61 = 0,25

c = Хср – d * Yср = 36,75– (0,25) * 153,13 = -1,5

y = 150,19 + 1,04x x = -1,5 + 0,25 m

Regresijos linijas sudarome koreliacijos lauke.

7 etapas. Hipotezės apie koreliacinio ryšio egzistavimą tikrinimas

Hipotezės apie koreliacijos buvimą tikrinimas grindžiamas tuo, kad dvimačio normaliai pasiskirstyto atsitiktinio dydžio X, Y, nesant koreliacijos tarp x ir y, koreliacijos koeficientas yra „0“. Norint patikrinti hipotezę apie koreliacijos nebuvimą, reikia apskaičiuoti kriterijaus reikšmę:

t = r * √(N – 2)/√(1 – r2) = 0,51* √(24-2)/√(1 – (0,51) 2) = 2,65

Mūsų vertėms t = 2,65

Lentelės reikšmė ttab = 2,02

Kadangi apskaičiuota t reikšmė viršija lentelės reikšmę, hipotezė apie koreliacijos nebuvimą atmetama. Yra ryšys.

8 etapas. Empirinės regresijos tiesių konstravimas. Koreliacijos santykio apskaičiavimas

Pasirinkti duomenys sugrupuojami į klases pagal pagrindinio komponento, šiuo atveju Hg, turinio reikšmes. Norėdami tai padaryti, visas verčių diapazonas nuo minimalaus pagrindinio naudingo komponento turinio iki didžiausio turinio yra padalintas į 6 intervalus. Kiekvienam intervalui:

    Nustatomas reikšmių, patenkančių į šį intervalą n(i), skaičius

    Apskaičiuojamas susietų komponentų turinio reikšmių skaičius, atitinkantis pagrindines komponentų reikšmes (y(I, av)), ir šis skaičius padalytas iš n(i)

3 lentelė

Intervalo riba

Koreliacijos lauke sukuriame empirinę regresijos liniją.

dviso = √Dy = 25,4

dbūklė = /N = 66,14

Susieto komponento ir pagrindinio r koreliacijos santykio reikšmė apskaičiuojama naudojant formulę:

r = dsąlyga / dvisa = 66,14 / 25,4 = 2,6

Eksperimentiniam atsitiktinių dydžių priklausomybių tyrimui x ir y atlikti keletą nepriklausomų eksperimentų. Rezultatas i- eksperimentas pateikia reikšmių porą (x r, y g), i = 1, 2,..., p.

Įvairias objektų savybes apibūdinantys kiekiai gali būti nepriklausomi arba tarpusavyje susiję. Santykių pasireiškimo formos yra labai įvairios. Du dažniausiai pasitaikantys tipai yra funkciniai (užbaigti) ir koreliaciniai (neužbaigti) ryšiai.

Kai du dydžiai funkciškai priklauso nuo vieno vertės -x val būtinai atitinka vieną ar daugiau tiksliai apibrėžtų kito dydžio verčių -y (. Gana dažnai funkciniai ryšiai atsiranda fizikoje ir chemijoje. Realiose situacijose egzistuoja be galo daug paties objekto ir išorinės aplinkos savybių, kurios viena kitą veikia, todėl tokio pobūdžio ryšys neegzistuoja, kitaip tariant, funkcinės jungtys yra matematinės abstrakcijos.

Bendrųjų veiksnių įtaka ir objektyvių modelių buvimas objektų elgesyje lemia tik statistinės priklausomybės pasireiškimą. Statistinis yra priklausomybė, kai pasikeitus vienam iš dydžių pasikeičia kitų (kito) pasiskirstymas, o šie kiti dydžiai įgauna tam tikras reikšmes su tam tikra tikimybe. Šiuo atveju funkcinė priklausomybė turėtų būti laikoma ypatingu statistinės priklausomybės atveju: vieno veiksnio reikšmė atitinka kitų veiksnių reikšmes, kurių tikimybė yra lygi vienetui. Svarbesnis specialus statistinės priklausomybės atvejis yra koreliacinė priklausomybė, kuri apibūdina ryšį tarp kai kurių atsitiktinių dydžių verčių ir kitų vidutinės reikšmės, nors kiekvienu atskiru atveju bet kuri tarpusavyje susijusi reikšmė gali įgauti skirtingas reikšmes.

Koreliacijos ryšys (kuris taip pat vadinamas neišsamiu arba statistiniu) atsiranda vidutiniškai masiniams stebėjimams, kai nurodytos priklausomo kintamojo reikšmės atitinka tam tikrą skaičių tikėtinų nepriklausomo kintamojo verčių. Paaiškinimas – ryšių tarp analizuojamų veiksnių, kurių sąveikai įtakos turi neapskaityti atsitiktiniai dydžiai, sudėtingumas. Todėl ryšys tarp ženklų atsiranda tik vidutiniškai, bylų masėje. Koreliaciniame ryšyje kiekviena argumento reikšmė atitinka funkcijų reikšmes, atsitiktinai paskirstytas tam tikru intervalu.

Terminą „koreliacija“ pirmasis pavartojo prancūzų paleontologas J. Cuvier, išvedęs „gyvūnų dalių ir organų koreliacijos dėsnį“ (šis dėsnis leidžia atkurti viso gyvūno išvaizdą iš rastų kūno dalių). Šį terminą į statistiką įvedė anglų biologas ir statistikas F. Galtonas (ne tik ryšys, o „tarsi ryšys“ – koreliacija).

Koreliacinės priklausomybės randamos visur. Pavyzdžiui, žemės ūkyje tai gali būti derliaus ir įterptų trąšų kiekio santykis. Akivaizdu, kad pastarieji dalyvauja formuojant derlių. Tačiau kiekviename konkrečiame lauke ar sklype tas pats įterptų trąšų kiekis skirtingai padidins derlių, nes sąveikauja daugybė kitų veiksnių (orai, dirvožemio būklė ir kt.), kurie ir sudaro galutinį rezultatą. Tačiau vidutiniškai pastebimas toks ryšys – padidėjus tręštų trąšų masei, didėja derlius.

Paprasčiausias būdas nustatyti ryšius tarp tiriamų charakteristikų yra koreliacijos lentelės sudarymas; jo vizualinis vaizdas yra koreliacijos laukas. Tai grafikas, kuriame jq reikšmės pavaizduotos abscisių ašyje ir ordinačių ašyje y x. Pagal taškų vietą ir jų koncentraciją tam tikra kryptimi galima kokybiškai spręsti apie ryšio buvimą.

Ryžiai. 7.3.

Teigiama koreliacija tarp atsitiktinių dydžių, artima parabolinei funkcinei, parodyta Fig. 6.1 , A. Fig. 6.1, b parodytas silpnos neigiamos koreliacijos pavyzdys, o fig. 6.1, V - praktiškai nesusijusių atsitiktinių dydžių pavyzdys. Koreliacija yra didelė, jei priklausomybę „galima pavaizduoti“ grafike tiesia linija (su teigiamu arba neigiamu nuolydžiu).

Yra du tipai priklausomybės tarp ekonominių reiškinių: funkcinis ir statistinis. Ryšys tarp dviejų dydžių X Ir Y, atspindintis atitinkamai du reiškinius, vadinamas funkcinis, jei kiekviena dydžio x reikšmė atitinka vieną dydžio reikšmę Y ir atvirkščiai. Ekonomikos funkcinio ryšio pavyzdys – darbo našumo priklausomybė nuo pagaminamos produkcijos apimties ir darbo laiko sąnaudų. Pažymėtina, kad jei X yra deterministinis, neatsitiktinis dydis, tada nuo jo funkciškai priklausomas dydis Y taip pat yra deterministinis. Jeigu X tada yra atsitiktinė reikšmė Y taip pat atsitiktinis dydis.

Tačiau daug dažniau ekonomikoje yra ne funkcinis, o statistinė priklausomybė, kai kiekviena fiksuota reikšmė yra nepriklausomas kintamasis X atitinka ne vieną, o daugelį priklausomo kintamojo Y reikšmių, ir neįmanoma iš anksto pasakyti, kokios reikšmės ji užims Y. Taip yra dėl to, kad ant Y išskyrus kintamąjį X Taip pat turi įtakos daugybė nekontroliuojamų atsitiktinių veiksnių. Šioje situacijoje Y yra atsitiktinis dydis, ir kintamasis X gali būti deterministinis arba atsitiktinis.

Ypatingas statistinės priklausomybės atvejis yra koreliacinė priklausomybė, kurioje veiksniai yra susiję funkcine priklausomybe X ir efektyvaus rodiklio vidutinė reikšmė (matematinis lūkestis). Y. Statistinė priklausomybė gali būti atskleista tik iš pakankamai didelio stebėjimų skaičiaus. Grafiškai dviejų charakteristikų statistinę priklausomybę galima pavaizduoti naudojant koreliacijos lauką, sukūrus faktoriaus charakteristikos reikšmė brėžiama ant abscisių ašies X, o išilgai ordinačių ašies – rezultatas Y.

Koreliacija– ypatingas statistinio ryšio atvejis, kai skirtingos kintamojo reikšmės atitinka skirtingas kito kintamojo vidutines reikšmes. Koreliacija daro prielaidą, kad tiriami kintamieji turi kiekybinę išraišką.

Jei tiriamas ryšys tarp dviejų požymių, yra porinė koreliacija; jei tiriamas ryšys tarp daugelio charakteristikų – daugybinė koreliacija.

Kaip pavyzdį pav.

1 pateikti duomenys, iliustruojantys tiesioginį ryšį tarp X Ir adresu(1 pav., a) ir atvirkštinį ryšį (1 pav., b). „a“ atveju tai yra tiesioginis ryšys tarp, pavyzdžiui, vidutinių pajamų vienam gyventojui ( X) ir santaupas ( adresu) šeimoje. „b“ atveju kalbame apie atvirkštinį ryšį. Tai yra mūsų pavyzdys, santykis tarp darbo našumo ( X) ir gamybos vieneto savikaina ( adresu). Fig. 1 kiekvienas taško simbolis tiria stebėjimo objektą su savo vertėmis X Ir adresu.

Ryžiai. 1. Koreliacijos laukas

Fig. 1 taip pat rodomos tiesios linijos, linijinės regresijos lygtys, apibūdinančios funkcinį ryšį tarp nepriklausomo kintamojo X ir efektyvaus rodiklio vidutinė reikšmė adresu. Taigi, pagal regresijos lygtį, žinant X, galima atkurti tik vidutinę vertę adresu.



Ar jums patiko straipsnis? Pasidalinkite su draugais!