Kokią reikšmę gali turėti daugialypės koreliacijos koeficientas? Daugialypė tiesinė koreliacija

7.1. Tiesinės regresijos analizė susideda iš grafiko pritaikymo stebėjimų rinkiniui naudojant mažiausių kvadratų metodą. Regresinė analizė leidžia nustatyti funkcinį ryšį tarp tam tikro atsitiktinio dydžio Y ir tam tikra įtaka Y vertybes X. Ši priklausomybė vadinama regresijos lygtimi. Yra paprastų ( y=m*x+b) ir daugiskaita ( y=m 1 *x 1 +m 2 *x 2 +... + m k *x k +b) tiesinio ir netiesinio tipo regresija.
Norint įvertinti dydžių ryšio laipsnį, jis naudojamas Pearsono R daugybinės koreliacijos koeficientas(koreliacijos santykis), kurio reikšmės gali būti nuo 0 iki 1. R=0, jei nėra ryšio tarp dydžių, ir R=1, jei tarp dydžių yra funkcinis ryšys. Daugeliu atvejų R užima tarpines reikšmes nuo 0 iki 1. Reikšmė R 2 paskambino determinacijos koeficientas.
Regresijos priklausomybės konstravimo uždavinys – rasti koeficientų vektorių M daugkartinės tiesinės regresijos modelis, kuriame koeficientas R paima didžiausią vertę.
Norėdami įvertinti reikšmingumą R taikoma Fišerio F testas, apskaičiuojamas pagal formulę:

Kur n– eksperimentų skaičius; k– modelio koeficientų skaičius. Jeigu F viršija tam tikrą kritinę duomenų vertę n Ir k ir priimta pasitikėjimo tikimybė, tada vertė R laikomas reikšmingu.

7.2. Įrankis RegresijaAnalizės paketas leidžia apskaičiuoti šiuos duomenis:

· tiesinės regresijos funkcijos koeficientai– mažiausių kvadratų metodas; regresijos funkcijos tipą lemia pirminių duomenų struktūra;

· determinacijos koeficientas ir susiję dydžiai(lentelė Regresijos statistika);

· dispersijos lentelė ir kriterijų statistika regresijos reikšmingumui patikrinti(lentelė Dispersijos analizė);

· standartinis nuokrypis ir kitos jo statistinės charakteristikos kiekvienam regresijos koeficientui, leidžiančios patikrinti šio koeficiento reikšmingumą ir sudaryti jam pasikliautinuosius intervalus;

· regresijos funkcijos reikšmės ir liekanos– skirtumai tarp pradinių kintamojo reikšmių Y ir apskaičiuotos regresijos funkcijos reikšmės (lentelė Balanso panaikinimas);

· tikimybės, atitinkančios kintamojo Y reikšmes, išdėstytas didėjančia tvarka(lentelė Tikimybių išvestis).

7.3. Paskambinkite pasirinkimo įrankiui per Duomenys > Duomenų analizė > Regresija.

7.4. Lauke Įvesties intervalas Yįveskite diapazono, kuriame yra priklausomo kintamojo Y reikšmės, adresą. Diapazoną turi sudaryti vienas stulpelis.
Lauke Įvesties intervalas Xįveskite diapazono, kuriame yra kintamojo X reikšmės, adresą. Diapazoną turi sudaryti vienas ar daugiau stulpelių, bet ne daugiau kaip 16 stulpelių. Jei nurodyta laukeliuose Įvesties intervalas Y Ir Įvesties intervalas X diapazonuose yra stulpelių antraštės, tada turite pažymėti parinkčių laukelį Žymos– šios antraštės bus naudojamos įrankio sugeneruotose išvesties lentelėse Regresija.
Parinkčių žymimasis laukelis Konstanta – nulis turėtų būti nustatyta, jei regresijos lygtis turi konstantą b yra priverstinis lygus nuliui.
Variantas Patikimumo lygis nustatomas, kai reikia sudaryti regresijos koeficientų, kurių patikimumo lygis yra kitoks nei 0,95, pasikliovimo intervalus, kuris naudojamas pagal numatytuosius nustatymus. Pažymėję parinkčių langelį Patikimumo lygis Atsiranda įvesties laukas, kuriame įvedama nauja patikimumo lygio reikšmė.
Teritorijoje Likučiai Yra keturi variantai: Likučiai, Standartizuoti likučiai, Balanso diagrama Ir Atrankos grafikas. Jei bent vienas iš jų yra įdiegtas, lentelė bus rodoma išvesties rezultatuose Balanso panaikinimas, kuriame bus rodomos regresijos funkcijos ir likučių reikšmės - skirtumai tarp pradinių kintamojo Y verčių ir apskaičiuotų regresijos funkcijos verčių. Teritorijoje Normali tikimybė Yra vienas variantas – ; jos įdiegimas generuoja lentelę išvesties rezultatuose Tikimybių išvestis ir veda prie atitinkamo grafiko konstravimo.


7.5. Nustatykite parametrus pagal paveikslėlį. Įsitikinkite, kad Y reikšmė yra pirmasis kintamasis (įskaitant langelį su pavadinimu), o X reikšmė yra kiti du kintamieji (įskaitant langelius su pavadinimais). Spustelėkite Gerai.

7.6. Lentelėje Regresijos statistika Pateikiami šie duomenys.

Daugiskaita R– kitoje eilutėje pateikto determinacijos koeficiento R 2 šaknis. Kitas šio rodiklio pavadinimas yra koreliacijos indeksas arba daugkartinis koreliacijos koeficientas.

R kvadratas– determinacijos koeficientas R 2 ; apskaičiuojamas kaip santykis regresinė kvadratų suma(ląstelė C12) į bendra kvadratų suma(ląstelė C14).

Normalizuotas R kvadratas apskaičiuojamas pagal formulę

kur n yra kintamojo Y reikšmių skaičius, k yra stulpelių skaičius kintamojo X įvesties intervale.

Standartinė klaida– liekamosios dispersijos šaknis (ląstelė D13).

Stebėjimai– kintamojo Y reikšmių skaičius.

7.7. IN Dispersijos lentelė stulpelyje SS stulpelyje pateiktos kvadratų sumos df– laisvės laipsnių skaičius. stulpelyje MS– dispersija. Eilėje Regresija stulpelyje f Regresijos reikšmingumui patikrinti buvo apskaičiuota kriterijų statistikos reikšmė. Ši vertė apskaičiuojama kaip regresijos dispersijos ir liekamosios dispersijos santykis (ląstelės D12 ir D13). Stulpelyje Reikšmė F apskaičiuojama gautos kriterijų statistikos reikšmės tikimybė. Jei ši tikimybė mažesnė už, pavyzdžiui, 0,05 (duotas reikšmingumo lygis), tada hipotezė apie regresijos nereikšmingumą (t. y. hipotezė, kad visi regresijos funkcijos koeficientai lygūs nuliui) atmetama ir regresija yra lygi. laikomas reikšmingu. Šiame pavyzdyje regresija nėra reikšminga.

7.8. Tolesnėje lentelėje, stulpelyje Šansai, o eilutėje užrašomos apskaičiuotos regresijos funkcijos koeficientų reikšmės Y sankirta parašyta laisvo termino vertė b. Stulpelyje Standartinė klaida Apskaičiuoti koeficientų standartiniai nuokrypiai.
Stulpelyje t-statistika Užregistruojami koeficientų verčių ir jų standartinių nuokrypių santykiai. Tai yra kriterijų statistikos reikšmės hipotezėms apie regresijos koeficientų reikšmę tikrinti.
Stulpelyje P vertė apskaičiuojami reikšmingumo lygiai, atitinkantys kriterijų statistikos reikšmes. Jei apskaičiuotas reikšmingumo lygis yra mažesnis už nurodytą reikšmingumo lygį (pvz., 0,05). tada priimama hipotezė, kad koeficientas labai skiriasi nuo nulio; kitu atveju hipotezė, kad koeficientas nuo nulio skiriasi nežymiai, yra priimta. Šiame pavyzdyje tik koeficientas b gerokai skiriasi nuo nulio, likusieji – nežymiai.
Stulpeliais Apatinis 95 proc. Ir 95 % geriausi pateiktos pasikliautinųjų intervalų ribos, kurių pasikliovimo lygis yra 0,95. Šios ribos apskaičiuojamos naudojant formules
Mažesnis 95 % = koeficientas – standartinė klaida * t α;
Viršutinė 95 % = koeficientas + standartinė klaida * t α.
Čia t α– eilės kvantilis α Studento t skirstiniai su (n-k-1) laisvės laipsniais. Šiuo atveju α = 0,95. Taip pat apskaičiuojamos pasikliautinųjų intervalų ribos stulpeliuose Apatinė 90,0 % Ir Top 90,0 %.

7.9. Apsvarstykite lentelę Balanso panaikinimas iš išvesties rezultatų. Ši lentelė išvesties rezultatuose rodoma tik tada, kai nustatyta bent viena parinktis šioje srityje Likučiai dialogo langas Regresija.

Stulpelyje Stebėjimas pateikiami kintamųjų reikšmių eilės numeriai Y.
Stulpelyje Numatė Y toms kintamojo reikšmėms apskaičiuojamos regresijos funkcijos y i = f(x i) reikšmės X, kuris atitinka serijos numerį i stulpelyje Stebėjimas.
Stulpelyje Likučiai yra skirtumai (likučiai) ε i =Y-y i , ir stulpelis Standartiniai likučiai– normalizuoti likučiai, kurie apskaičiuojami kaip santykiai ε i / s ε. čia s ε – likučių standartinis nuokrypis. Reikšmės s ε kvadratas apskaičiuojamas pagal formulę

kur yra likučių vidurkis. Vertė gali būti apskaičiuojama kaip dviejų dydžių iš dispersijos lentelės santykis: likučių kvadratų suma (ląstelė C13) ir laisvės laipsnių iš eilutės. Iš viso(ląstelė B14).

7.10. Pagal lentelės reikšmes Balanso panaikinimas sudaromi dviejų tipų grafikai: likutinės diagramos Ir atrankos tvarkaraščiai(jei srityje nustatytos atitinkamos parinktys Likučiai dialogo langas Regresija). Jie sukurti kiekvienam kintamajam komponentui X atskirai.

Įjungta balanso diagramos rodomi likučiai, t.y. skirtumai tarp pradinių verčių Y ir apskaičiuojamas pagal regresijos funkciją kiekvienai kintamojo komponento vertei X.

Įjungta atrankos tvarkaraščiai rodomos ir pradinės Y reikšmės, ir apskaičiuotos regresijos funkcijos reikšmės kiekvienai kintamojo komponento vertei X.

7.11. Paskutinė išvesties rezultatų lentelė yra lentelė Tikimybių išvestis. Rodoma, jei dialogo lange Regresijaįdiegta parinktis Įprasta tikimybių diagrama.
Stulpelių reikšmės Percentilis apskaičiuojami taip. Apskaičiuojamas žingsnis h = (1/n)*100 %, pirmoji reikšmė yra h/2, pastarasis yra lygus 100 val./2. Pradedant nuo antrosios reikšmės, kiekviena paskesnė reikšmė yra lygi ankstesnei, prie kurios pridedamas žingsnis h.
Stulpelyje Y pateikiamos kintamųjų reikšmės Y, surūšiuota didėjimo tvarka. Remiantis šios lentelės duomenimis, vadinamasis normalaus pasiskirstymo grafikas. Tai leidžia vizualiai įvertinti kintamųjų ryšio tiesiškumo laipsnį X Ir Y.


8. D dispersijos analizė

8.1. Analizės paketas leidžia atlikti trijų tipų dispersinę analizę. Konkretaus instrumento pasirinkimą lemia veiksnių skaičius ir mėginių skaičius tiriamame duomenų rinkinyje.
naudojamas norint patikrinti hipotezę, kad dviejų ar daugiau tai pačiai populiacijai priklausančių imčių vidurkiai yra panašūs.
Dviejų krypčių ANOVA su pakartojimais yra sudėtingesnė vienmatės analizės versija, apimanti daugiau nei vieną kiekvienos duomenų grupės pavyzdį.
Dviejų krypčių ANOVA be pasikartojimo yra dvipusė dispersijos analizė, apimanti ne daugiau kaip vieną mėginį vienoje grupėje. Jis naudojamas norint patikrinti hipotezę, kad dviejų ar daugiau imčių vidurkiai yra vienodi (imtys priklauso tai pačiai populiacijai).

8.2. Vienpusė ANOVA

8.2.1. Paruoškime duomenis analizei. Sukurkite naują lapą ir nukopijuokite į jį stulpelius A, B, C, D. Pašalinkite pirmas dvi eilutes. Parengti duomenys gali būti naudojami atlikti Vienpusė dispersinė analizė.

8.2.2. Paskambinkite pasirinkimo įrankiui per Duomenys > Duomenų analizė > Vienpusė ANOVA. Užpildykite pagal paveikslėlį. Spustelėkite Gerai.

8.2.3. Apsvarstykite lentelę Rezultatai: Patikrinkite- pakartojimų skaičius, Suma- rodiklių reikšmių suma pagal eilutes, Sklaida– dalinė rodiklio dispersija.

8.2.4. Lentelė Dispersijos analizė: pirmas stulpelis Variacijos šaltinis yra dispersijų pavadinimai, SS– nuokrypių kvadratu suma, df- laisvės laipsnis, MS- vidutinis kvadratas, F testas faktinis F pasiskirstymas. P vertė– tikimybė, kad lygties atkuriama dispersija yra lygi likučių dispersijai. Ji nustato tikimybę, kad gautas kiekybinis veiksnių ir rezultato ryšio nustatymas gali būti laikomas atsitiktiniu. F-kritinis yra teorinė F vertė, kuri vėliau lyginama su faktine F reikšme.

8.2.5. Nulinė hipotezė apie visų imčių matematinių lūkesčių lygybę yra priimta, jei nelygybė tenkinama F testas < F-kritinis. ši hipotezė turėtų būti atmesta. Šiuo atveju vidutinės mėginių vertės labai skiriasi.

Regresinė analizė – tai statistinio tyrimo metodas, leidžiantis parodyti konkretaus parametro priklausomybę nuo vieno ar kelių nepriklausomų kintamųjų. Ikikompiuterinėje eroje jį naudoti buvo gana sunku, ypač kai buvo kalbama apie didelius duomenų kiekius. Šiandien, išmokę kurti regresiją programoje Excel, galite išspręsti sudėtingas statistines problemas vos per kelias minutes. Žemiau pateikiami konkretūs pavyzdžiai iš ekonomikos srities.

Regresijos tipai

Pati ši sąvoka buvo įvesta į matematiką 1886 m. Regresija vyksta:

  • linijinis;
  • parabolinis;
  • raminantis;
  • eksponentinis;
  • hiperbolinis;
  • parodomasis;
  • logaritminis.

1 pavyzdys

Panagrinėkime išeinančių iš komandos narių skaičiaus priklausomybės nuo vidutinio atlyginimo 6 pramonės įmonėse problemą.

Užduotis. Šešiose įmonėse buvo analizuojamas vidutinis mėnesinis atlyginimas ir savo noru išeinančių darbuotojų skaičius. Lentelės pavidalu turime:

Žmonių, kurie metė rūkyti, skaičius

Atlyginimas

30 000 rublių

35 000 rublių

40 000 rublių

45 000 rublių

50 000 rublių

55 000 rublių

60 000 rublių

Norint nustatyti išeinančių iš darbuotojų skaičiaus priklausomybę nuo vidutinio atlyginimo 6 įmonėse, regresijos modelis turi lygtį Y = a 0 + a 1 x 1 +...+a k x k, kur x i yra įtakojantys kintamieji, a i – regresijos koeficientai, o k – veiksnių skaičius.

Šiai problemai Y yra išeinančių iš darbuotojų rodiklis, o įtakojantis veiksnys yra atlyginimas, kurį žymime X.

Naudojant Excel skaičiuoklių procesoriaus galimybes

Prieš regresinę analizę programoje „Excel“ reikia taikyti įtaisytąsias funkcijas esamiems lentelės duomenims. Tačiau šiems tikslams geriau naudoti labai naudingą „Analysis Pack“ priedą. Norėdami jį suaktyvinti, jums reikia:

  • iš skirtuko „Failas“ eikite į skyrių „Parinktys“;
  • atsidariusiame lange pasirinkite eilutę „Priedai“;
  • spustelėkite mygtuką „Eiti“, esantį žemiau, eilutės „Valdymas“ dešinėje;
  • pažymėkite langelį šalia pavadinimo „Analizinis paketas“ ir patvirtinkite savo veiksmus spustelėdami „Gerai“.

Jei viskas bus padaryta teisingai, reikiamas mygtukas atsiras dešinėje skirtuko „Duomenys“ pusėje, esančioje virš „Excel“ darbalapio.

programoje Excel

Dabar, kai turime visus reikalingus virtualius įrankius ekonometriniams skaičiavimams atlikti, galime pradėti spręsti savo problemą. Norėdami tai padaryti:

  • Spustelėkite mygtuką „Duomenų analizė“;
  • atsidariusiame lange spustelėkite mygtuką „Regresija“;
  • pasirodžiusiame skirtuke įveskite Y (išeinančių iš darbo darbuotojų skaičius) ir X (jų atlyginimų) verčių diapazoną;
  • Savo veiksmus patvirtiname paspausdami mygtuką „Gerai“.

Dėl to programa automatiškai užpildys naują skaičiuoklę regresinės analizės duomenimis. Atkreipkite dėmesį! „Excel“ leidžia rankiniu būdu nustatyti norimą vietą šiam tikslui. Pavyzdžiui, tai gali būti tas pats lapas, kuriame yra Y ir X reikšmės, arba net nauja darbaknygė, specialiai sukurta tokiems duomenims saugoti.

R kvadrato regresijos rezultatų analizė

Programoje „Excel“ duomenys, gauti apdorojant nagrinėjamo pavyzdžio duomenis, yra tokios formos:

Visų pirma, turėtumėte atkreipti dėmesį į R kvadrato reikšmę. Tai reiškia determinacijos koeficientą. Šiame pavyzdyje R kvadratas = 0,755 (75,5%), t.y., apskaičiuoti modelio parametrai paaiškina ryšį tarp nagrinėjamų parametrų 75,5%. Kuo didesnė determinacijos koeficiento reikšmė, tuo pasirinktas modelis tinkamesnis konkrečiai užduočiai. Manoma, kad ji teisingai apibūdina realią situaciją, kai R kvadrato reikšmė yra didesnė nei 0,8. Jei R kvadratas<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Šansų analizė

Skaičius 64,1428 rodo, kokia bus Y reikšmė, jei visi svarstomo modelio kintamieji xi bus atstatyti į nulį. Kitaip tariant, galima teigti, kad analizuojamo parametro reikšmei įtakos turi ir kiti veiksniai, kurie nėra aprašyti konkrečiame modelyje.

Kitas koeficientas -0,16285, esantis langelyje B18, parodo kintamojo X įtakos svorį Y. Tai reiškia, kad vidutinis darbuotojų mėnesinis atlyginimas nagrinėjamo modelio ribose įtakoja išeinančių iš darbo skaičių, kurio svoris yra -0,16285, t.y. jo įtakos laipsnis visiškai mažas. „-“ ženklas rodo, kad koeficientas yra neigiamas. Tai akivaizdu, nes visi žino, kad kuo didesnis atlyginimas įmonėje, tuo mažiau žmonių pareiškia norą nutraukti darbo sutartį ar išeiti iš darbo.

Daugkartinė regresija

Šis terminas reiškia santykių lygtį su keliais nepriklausomais formos kintamaisiais:

y=f(x 1 +x 2 +…x m) + ε, kur y yra gaunama charakteristika (priklausomas kintamasis), o x 1, x 2,…x m yra faktorių charakteristikos (nepriklausomi kintamieji).

Parametrų įvertinimas

Daugkartinei regresijai (MR) ji atliekama naudojant mažiausių kvadratų metodą (OLS). Y = a + b 1 x 1 +…+b m x m + ε formos tiesinėms lygtims sudarome normaliųjų lygčių sistemą (žr. toliau)

Norėdami suprasti metodo principą, apsvarstykite dviejų veiksnių atvejį. Tada turime situaciją, aprašytą formule

Iš čia gauname:

kur σ yra atitinkamo požymio, atsispindinčio indekse, dispersija.

OLS taikomas MR lygčiai standartizuotoje skalėje. Šiuo atveju gauname lygtį:

kuriuose t y, t x 1, … t xm yra standartizuoti kintamieji, kurių vidutinės reikšmės yra lygios 0; β i yra standartizuoti regresijos koeficientai, o standartinis nuokrypis yra 1.

Atkreipkite dėmesį, kad visi β i šiuo atveju nurodomi kaip normalizuoti ir centralizuoti, todėl jų palyginimas vienas su kitu laikomas teisingu ir priimtinu. Be to, įprasta pašalinti veiksnius, atmetant tuos, kurių βi reikšmės yra mažiausios.

Problema naudojant tiesinės regresijos lygtį

Tarkime, kad turime konkretaus produkto N kainų dinamikos lentelę per pastaruosius 8 mėnesius. Būtina apsispręsti, ar tikslinga įsigyti jo partiją už 1850 rub./t.

mėnesio numeris

mėnesio pavadinimas

Prekės kaina N

1750 rublių už toną

1755 rubliai už toną

1767 rubliai už toną

1760 rublių už toną

1770 rublių už toną

1790 rublių už toną

1810 rublių už toną

1840 rublių už toną

Norėdami išspręsti šią problemą „Excel“ skaičiuoklių procesoriuje, turite naudoti „Duomenų analizės“ įrankį, jau žinomą iš aukščiau pateikto pavyzdžio. Tada pasirinkite skyrių „Regresija“ ir nustatykite parametrus. Reikia atsiminti, kad lauke „Įvesties intervalas Y“ reikia įvesti priklausomo kintamojo reikšmių diapazoną (šiuo atveju prekių kainos konkrečiais metų mėnesiais), o lauke „Įvesties intervalas X“ - nepriklausomam kintamajam (mėnesio skaičius). Patvirtinkite veiksmą spustelėdami „Gerai“. Naujame lape (jei taip nurodyta) gauname regresijos duomenis.

Naudodamiesi jais sukonstruojame y=ax+b formos tiesinę lygtį, kur parametrai a ir b yra eilutės su mėnesio numerio pavadinimu koeficientai ir koeficientai bei tiesės „Y-susikirta“ iš lapo su regresinės analizės rezultatai. Taigi 3 užduoties tiesinės regresijos lygtis (LR) parašyta taip:

Prekės kaina N = 11.714* mėn numeris + 1727.54.

arba algebriniu žymėjimu

y = 11,714 x + 1727,54

Rezultatų analizė

Norint nuspręsti, ar gauta tiesinės regresijos lygtis yra adekvati, naudojami daugkartinės koreliacijos (MCC) ir determinacijos koeficientai, taip pat Fišerio testas ir Stjudento t testas. „Excel“ skaičiuoklėje su regresijos rezultatais jie atitinkamai vadinami daugybiniais R, R kvadratu, F-statistika ir t-statistika.

KMC R leidžia įvertinti tikimybinio ryšio tarp nepriklausomų ir priklausomų kintamųjų glaudumą. Didelė jo reikšmė rodo gana stiprų ryšį tarp kintamųjų „Mėnesių skaičius“ ir „Produkto N kaina rubliais už 1 toną“. Tačiau šių santykių pobūdis lieka nežinomas.

Determinacijos koeficiento kvadratas R2 (RI) yra skaitinė bendros sklaidos proporcijos charakteristika ir parodo, kurios eksperimentinių duomenų dalies sklaida, t.y. priklausomo kintamojo reikšmės atitinka tiesinės regresijos lygtį. Nagrinėjamoje užduotyje ši reikšmė lygi 84,8 %, t.y. gautu SD statistinius duomenis apibūdina labai tiksliai.

F-statistika, dar vadinama Fišerio testu, naudojama tiesinio ryšio reikšmingumui įvertinti, paneigiant arba patvirtinant jo egzistavimo hipotezę.

(Studento testas) padeda įvertinti koeficiento reikšmingumą su nežinomu arba laisvuoju tiesinio ryšio nariu. Jei t-testo reikšmė > tcr, tai hipotezė apie tiesinės lygties laisvojo nario nereikšmingumą atmetama.

Nagrinėjamoje laisvojo termino uždavinyje, naudojant Excel įrankius, buvo gauta, kad t = 169,20903, o p = 2,89E-12, t.y., mes turime nulinę tikimybę, kad teisinga hipotezė apie laisvojo termino nereikšmingumą bus atmesta. . Nežinomo koeficientui t=5,79405, o p=0,001158. Kitaip tariant, tikimybė, kad teisinga hipotezė apie koeficiento nereikšmiškumą nežinomam bus atmesta yra 0,12%.

Taigi galima teigti, kad gauta tiesinės regresijos lygtis yra adekvati.

Akcijų paketo įsigijimo galimybių problema

Daugkartinė regresija programoje „Excel“ atliekama naudojant tą patį duomenų analizės įrankį. Panagrinėkime konkrečią taikymo problemą.

Bendrovės NNN vadovybė turi nuspręsti, ar tikslinga įsigyti 20% MMM JSC akcijų. Paketo (SP) kaina yra 70 milijonų JAV dolerių. NNN specialistai surinko duomenis apie panašius sandorius. Nutarta akcijų paketo vertę vertinti pagal tokius parametrus, išreikštus milijonais JAV dolerių, kaip:

  • mokėtinos sumos (VK);
  • metinė apyvartos apimtis (VO);
  • gautinos sumos (VD);
  • ilgalaikio turto savikaina (COF).

Be to, naudojamas įmonės darbo užmokesčio įsiskolinimo (V3 P) parametras tūkstančiais JAV dolerių.

Sprendimas naudojant „Excel“ skaičiuoklės procesorių

Pirmiausia turite sukurti šaltinio duomenų lentelę. Tai atrodo taip:

  • iškviesti langą „Duomenų analizė“;
  • pasirinkite skyrių „Regresija“;
  • Lauke „Įvesties intervalas Y“ įveskite priklausomų kintamųjų verčių diapazoną iš G stulpelio;
  • Spustelėkite piktogramą su raudona rodykle lango „Įvesties intervalas X“ dešinėje ir pažymėkite visų verčių diapazoną iš lapo stulpelių B, C, D, F.

Pažymėkite elementą „Naujas darbalapis“ ir spustelėkite „Gerai“.

Gaukite tam tikros problemos regresinę analizę.

Rezultatų tyrimas ir išvados

Regresijos lygtį „renkame“ iš aukščiau pateiktų suapvalintų duomenų „Excel“ skaičiuoklėje:

SP = 0,103 * SOF + 0,541 * VO - 0,031 * VK + 0,405 * VD + 0,691 * VZP - 265,844.

Labiau pažįstama matematine forma jis gali būti parašytas taip:

y = 0,103*x1 + 0,541*x2 – 0,031*x3 +0,405*x4 +0,691*x5 – 265,844

MMM UAB duomenys pateikti lentelėje:

Pakeitę juos į regresijos lygtį, gauname 64,72 milijono JAV dolerių skaičių. Tai reiškia, kad UAB MMM akcijų pirkti neapsimoka, nes jų 70 mln. JAV dolerių vertė yra gerokai išpūsta.

Kaip matote, Excel skaičiuoklės procesoriaus ir regresijos lygties naudojimas leido priimti pagrįstą sprendimą dėl labai konkrečios operacijos pagrįstumo.

Dabar jūs žinote, kas yra regresija. Aukščiau aptarti Excel pavyzdžiai padės išspręsti praktines ekonometrijos srities problemas.

Naudojant Excel analizės paketą (Regression) tiesinės regresijos konstravimas, jos parametrų ir jų reikšmės įvertinimas gali būti atliktas daug greičiau. Panagrinėkime gautų rezultatų interpretaciją bendruoju atveju ( k aiškinamieji kintamieji) pagal 3.6 pavyzdį.

Lentelėje regresijos statistika pateikiamos šios vertės:

Keli R – daugkartinės koreliacijos koeficientas;

R- kvadratas– determinacijos koeficientas R 2 ;

Normalizuotas R - kvadratas– pakoreguota R 2 pakoreguotas pagal laisvės laipsnių skaičių;

Standartinė klaida– regresijos standartinė paklaida S;

Pastebėjimai – stebėjimų skaičius n.

Lentelėje Dispersijos analizė suteikiama:

1. Stulpelis df - laisvės laipsnių skaičius lygus

stygai Regresija df = k;

stygai Likutisdf = nk – 1;

stygai Iš visodf = n– 1.

2. Stulpelis SS – kvadratinių nuokrypių suma lygi

stygai Regresija ;

stygai Likutis ;

stygai Iš viso .

3. Stulpelis MS dispersijos, nustatytos pagal formulę MS = SS/df:

stygai Regresija– faktorių dispersija;

stygai Likutis– liekamoji dispersija.

4. Stulpelis F – skaičiuojama vertė F- kriterijus, apskaičiuotas pagal formulę

F = MS(regresija)/ MS(likutis).

5. Stulpelis Reikšmė F – reikšmingumo lygio reikšmė, atitinkanti apskaičiuotąją F- statistika .

Reikšmė F= FDIST( F- statistika, df(regresija), df(likutis)).

Jei reikšmė F < стандартного уровня значимости, то R 2 yra statistiškai reikšmingas.

Šansai Standartinė klaida t-statistika P vertė Apatinis 95 proc. 95 % geriausi
Y 65,92 11,74 5,61 0,00080 38,16 93,68
X 0,107 0,014 7,32 0,00016 0,0728 0,142

Šioje lentelėje parodyta:

1. Šansai– koeficientų reikšmės a, b.

2. Standartinė klaida– regresijos koeficientų standartinės paklaidos S a, Sb.



3. t- statistika– apskaičiuotos vertės t - kriterijai, apskaičiuoti pagal formulę:

t-statistika = koeficientai / standartinė klaida.

4.R-vertė (reikšmė t) yra reikšmingumo lygio reikšmė, atitinkanti apskaičiuotą t- statistika.

R- vertė = STUDIDISTAS(t- statistika, df(likutis)).

Jeigu R-prasmė< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5. 95 % apačios ir 95 % viršaus– teorinės tiesinės regresijos lygties koeficientų 95 % pasikliautinųjų intervalų apatinės ir viršutinės ribos.

LIKUSIOJŲ ATSIĖMIMAS
Stebėjimas Numatyta y Likučiai e
72,70 -29,70
82,91 -20,91
94,53 -4,53
105,72 5,27
117,56 12,44
129,70 19,29
144,22 20,77
166,49 24,50
268,13 -27,13

Lentelėje LIKUSIOJŲ ATSIĖMIMAS nurodyta:

stulpelyje Stebėjimas– stebėjimo numeris;

stulpelyje Išpranašavo y – priklausomo kintamojo apskaičiuotos reikšmės;

stulpelyje Likučiai e – skirtumas tarp stebimų ir apskaičiuotų priklausomo kintamojo verčių.

3.6 pavyzdys. Yra duomenų (sutartiniais vienetais) apie maisto išlaidas y ir pajamos vienam gyventojui x devynioms šeimų grupėms:

x
y

Naudodamiesi Excel analizės paketo (Regression) rezultatais, analizuosime maisto kaštų priklausomybę nuo vienam gyventojui tenkančių pajamų.

Regresinės analizės rezultatai paprastai rašomi tokia forma:

kur skliausteliuose nurodytos regresijos koeficientų standartinės paklaidos.

Regresijos koeficientai A = 65,92 ir b= 0,107. Ryšio kryptis tarp y Ir x nustato regresijos koeficiento ženklą b= 0,107, t.y. ryšys yra tiesioginis ir teigiamas. Koeficientas b= 0,107 rodo, kad padidėjus pajamoms vienam gyventojui 1 sutartinė. vienetų išlaidos maistui padidėja 0,107 įprastinių vienetų. vienetų

Įvertinkime gauto modelio koeficientų reikšmingumą. Koeficientų reikšmė ( a, b) tikrina t- testas:

P vertė ( a) = 0,00080 < 0,01 < 0,05

P vertė ( b) = 0,00016 < 0,01 < 0,05,

todėl koeficientai ( a, b) yra reikšmingi 1 %, o juo labiau 5 % reikšmingumo lygiu. Taigi regresijos koeficientai yra reikšmingi ir modelis yra adekvatus pirminiams duomenims.

Regresijos įvertinimo rezultatai yra suderinami ne tik su gautomis regresijos koeficientų reikšmėmis, bet ir su tam tikra jų rinkiniu (pasitikėjimo intervalu). Su 95 % tikimybe koeficientų pasikliautinieji intervalai yra (38,16–93,68) a ir (0,0728 – 0,142) už b.

Modelio kokybė vertinama determinacijos koeficientu R 2 .

Didumas R 2 = 0,884 reiškia, kad pajamų vienam gyventojui veiksnys gali paaiškinti 88,4% maisto išlaidų svyravimų (išsklaidos).

Reikšmė R 2 tikrina F- testas: reikšmingumas F = 0,00016 < 0,01 < 0,05, следовательно, R 2 yra reikšmingas 1 %, o juo labiau 5 % reikšmingumo lygiu.

Porinės tiesinės regresijos atveju koreliacijos koeficientas gali būti apibrėžtas kaip . Gauta koreliacijos koeficiento reikšmė rodo, kad ryšys tarp išlaidų maistui ir pajamų vienam gyventojui yra labai glaudus.

Tiriant sudėtingus reiškinius, būtina atsižvelgti į daugiau nei du atsitiktinius veiksnius. Teisingą supratimą apie šių veiksnių santykio pobūdį galima gauti tik tuo atveju, jei visi nagrinėjami atsitiktiniai veiksniai bus išnagrinėti vienu metu. Bendras trijų ar daugiau atsitiktinių veiksnių tyrimas leis tyrėjui padaryti daugiau ar mažiau pagrįstas prielaidas apie priežastines priklausomybes tarp tiriamų reiškinių. Paprasta daugialypio ryšio forma yra tiesinis ryšys tarp trijų charakteristikų. Atsitiktiniai veiksniai žymimi kaip X 1 , X 2 ir X 3. Poriniai koreliacijos koeficientai tarp X 1 ir X 2 žymimas kaip r 12, atitinkamai tarp X 1 ir X 3 - r 12, tarp X 2 ir X 3 - r 23. Kaip tiesinio ryšio tarp trijų charakteristikų glaudumo matas, naudojami keli koreliacijos koeficientai, žymimi R 1–23 d., R 2–13 d., R 3 ּ 12 ir dalinės koreliacijos koeficientai, žymimi r 12.3 , r 13.2 , r 23.1 .

Trijų veiksnių daugkartinis koreliacijos koeficientas R 1,23 yra tiesinio ryšio tarp vieno iš veiksnių (indeksas prieš tašką) ir dviejų kitų veiksnių derinio (indeksai po taško) glaudumo rodiklis.

Koeficiento R reikšmės visada yra intervale nuo 0 iki 1. Kai R artėja prie vieno, linijinio ryšio tarp trijų charakteristikų laipsnis didėja.

Tarp daugkartinio koreliacijos koeficiento, pvz. R 2 ּ 13 , ir dviejų porų koreliacijos koeficientai r 12 ir r 23 yra ryšys: kiekvienas iš suporuotų koeficientų negali viršyti absoliučios vertės R 2–13 d.

Kelių koreliacijos koeficientų su žinomomis porų koreliacijos koeficientų r 12, r 13 ir r 23 reikšmėmis apskaičiavimo formulės yra tokios:

Kvadratinis kartotinis koreliacijos koeficientas R 2 vadinamas daugkartinio nustatymo koeficientas. Tai rodo priklausomo kintamojo kitimo proporciją, veikiant tiriamiems veiksniams.

Daugialypės koreliacijos reikšmingumas vertinamas pagal F- kriterijus:

n – imties dydis; k – veiksnių skaičius. Mūsų atveju k = 3.

nulinė hipotezė apie daugialypės koreliacijos koeficiento lygybę nuliui ( h o:r=0) priimamas, jei f f<f t, ir atmetamas, jei
ff T.

teorinė vertė f- nustatomi kriterijai v 1 = k- 1 ir v 2 = n - k laisvės laipsniai ir priimtas reikšmingumo lygis a (1 priedas).

Daugialypės koreliacijos koeficiento apskaičiavimo pavyzdys. Tiriant ryšį tarp veiksnių, gauti porų koreliacijos koeficientai ( n =15): r 12 ==0,6; g13 = 0,3; r 23 = - 0,2.

Būtina išsiaiškinti požymio priklausomybę X 2 nuo ženklo X 1 ir X 3, ty apskaičiuokite daugialypės koreliacijos koeficientą:

Lentelės vertė F-kriterijai, kurių n 1 = 2 ir n 2 = 15 – 3 = 12 laisvės laipsnių, kai a = 0,05 F 0,05 = 3,89 ir a = 0,01 F 0,01 = 6,93.

Taigi, ryšys tarp ženklų R 2,13 = 0,74 yra reikšmingas
1% reikšmingumo lygis F f > F 0,01 .

Sprendžiant iš daugkartinio nustatymo koeficiento R 2 = (0,74) 2 = 0,55, savybių kitimas X 2 yra 55 % susijęs su tiriamų veiksnių poveikiu, o 45 % variacijos (1-R 2) negalima paaiškinti šių kintamųjų įtaka.

Dalinė tiesinė koreliacija

Dalinės koreliacijos koeficientas yra rodiklis, matuojantis dviejų charakteristikų konjugacijos laipsnį.

Matematinė statistika leidžia nustatyti koreliaciją tarp dviejų charakteristikų, kurių trečioji yra pastovi, neatliekant specialaus eksperimento, bet naudojant suporuotus koreliacijos koeficientus. r 12 , r 13 , r 23 .

Dalinės koreliacijos koeficientai apskaičiuojami pagal formules:

Prieš tašką esantys skaičiai rodo, kurios savybės yra tiriamos, o skaičius po taško rodo, kurio požymio įtaka neįtraukiama (pašalinama). Dalinės koreliacijos paklaidos ir reikšmingumo kriterijus nustatomi naudojant tas pačias formules kaip ir porų koreliacijai:

.

Teorinė vertė t- yra nustatytas kriterijus v = n– 2 laisvės laipsniai ir priimtas reikšmingumo lygis a (1 priedas).

Nulinė hipotezė, kad dalinės koreliacijos koeficientas populiacijoje yra lygus nuliui ( h o: r= 0) priimamas, jei t f< t t, ir atmetamas, jei
tt T.

Daliniai koeficientai gali būti nuo -1 iki +1. Privatus determinacijos koeficientai rasta dalinės koreliacijos koeficientų kvadratu:

D 12.3 = r 2 12ּ3 ; d 13.2 = r 2 13ּ2 ; d 23ּ1 = r 2 23ּ1 .

Dažnai labai įdomu nustatyti atskirų veiksnių dalinės įtakos efektyviam požymiui laipsnį, atmetus (pašalinus) jo ryšį su kitais bruožais, iškreipiančiais šią koreliaciją. Kartais nutinka taip, kad esant pastoviai eliminuotos charakteristikos reikšmei, neįmanoma pastebėti jos statistinės įtakos kitų charakteristikų kintamumui. Norėdami suprasti dalinės koreliacijos koeficiento apskaičiavimo techniką, apsvarstykite pavyzdį. Yra trys variantai X, Y Ir Z. Dėl mėginio dydžio n= nustatoma 180 porinių koreliacijos koeficientų

r xy = 0,799; r xz = 0,57; r yz = 0,507.

Nustatykime dalinės koreliacijos koeficientus:

Dalinės koreliacijos koeficientas tarp parametro X Ir Y Z (r xy = 0,720) rodo, kad tik nedidelė šių charakteristikų ryšio dalis bendroje koreliacijoje ( r xy= 0,799) yra dėl trečiosios charakteristikos ( Z). Panašią išvadą reikia padaryti ir dėl dalinės parametro koreliacijos koeficiento X ir parametras Z su pastovia parametro verte Y (r X zּу = 0,318 ir r xz= 0,57). Priešingai, dalinės koreliacijos koeficientas tarp parametrų Y Ir Z su pastovia parametro verte X r yz ּ x= 0,105 reikšmingai skiriasi nuo bendrojo koreliacijos koeficiento r y z = 0,507. Iš to aišku, kad jei pasirinksite objektus su ta pačia parametro verte X, tada ryšys tarp ženklų Y Ir Z jie bus labai silpni, nes didelę šio ryšio dalį lemia parametro kitimas X.

Tam tikromis aplinkybėmis dalinės koreliacijos koeficientas gali būti priešingas poros ženklui.

Pavyzdžiui, tiriant charakteristikų santykį X, Y Ir Z- gauti poriniai koreliacijos koeficientai (su n = 100): r xy = 0,6; r X z= 0,9;
r y z = 0,4.

Dalinės koreliacijos koeficientai, neįskaitant trečiosios charakteristikos įtakos:

Pavyzdys rodo, kad poros koeficiento ir dalinės koreliacijos koeficiento reikšmės skiriasi ženklu.

Dalinės koreliacijos metodas leidžia apskaičiuoti antros eilės dalinės koreliacijos koeficientą. Šis koeficientas rodo ryšį tarp pirmosios ir antrosios charakteristikos su pastovia trečios ir ketvirtos vertės. Antros eilės dalinis koeficientas nustatomas remiantis pirmos eilės daliniais koeficientais, naudojant formulę:

Kur r 12 . 4 , r 13 m. 4, r 23 ּ4 - daliniai koeficientai, kurių reikšmė nustatoma pagal dalinio koeficiento formulę, naudojant porų koreliacijos koeficientus r 12 , r 13 , r 14 , r 23 , r 24 , r 34 .

Trijų kintamųjų daugialypės koreliacijos koeficientas yra tiesinio ryšio tarp vienos iš charakteristikų (rodyklės raidė prieš brūkšnį) ir dviejų kitų charakteristikų derinio (rodyklės raidė po brūkšnelio) glaudumo rodiklis:

; (12.7)

(12.8)

Šios formulės leidžia lengvai apskaičiuoti kelis koreliacijos koeficientus su žinomomis porų koreliacijos koeficientų reikšmėmis r xy, r xz ir r yz.

Koeficientas R nėra neigiamas ir visada svyruoja nuo 0 iki 1. Artėjant R Viena vertus, padidėja linijinio ryšio tarp trijų charakteristikų laipsnis. Tarp daugkartinio koreliacijos koeficiento, pvz. R y-xz, ir dviejų porų koreliacijos koeficientai r yx Ir r yz yra toks ryšys: kiekvienas iš suporuotų koeficientų negali viršyti absoliučia verte R y-xz.

Kvadratinis kartotinis koreliacijos koeficientas R 2 vadinamas daugkartinio determinacijos koeficientu. Tai rodo priklausomo kintamojo kitimo proporciją, veikiant tiriamiems veiksniams.

Daugialypės koreliacijos reikšmingumas vertinamas pagal
F– kriterijus:

, (12.9)

n- mėginio dydis,

k– funkcijų skaičius; mūsų atveju k = 3.

Teorinė vertė F– kriterijai paimti iš paraiškos lentelės ν 1 = k–1 ir ν 2 = n–k laisvės laipsniai ir priimtas reikšmingumo lygis. Nulinė hipotezė, kad daugybinės koreliacijos koeficientas populiacijoje yra lygus nuliui ( H0:R= 0) priimamas, jei F faktas.< F табл . ir atmetamas, jei F faktas. ≥ F lentelė.

Darbo pabaiga -

Ši tema priklauso skyriui:

Matematinė statistika

Švietimo įstaiga.. Gomelio valstybinis universitetas.. pavadintas Pranciškaus Skarynos Yu M Zhuchenko vardu..

Jei jums reikia papildomos medžiagos šia tema arba neradote to, ko ieškojote, rekomenduojame pasinaudoti paieška mūsų darbų duomenų bazėje:

Ką darysime su gauta medžiaga:

Jei ši medžiaga jums buvo naudinga, galite ją išsaugoti savo puslapyje socialiniuose tinkluose:

Visos temos šiame skyriuje:

Pamoka
universitetų studentams, studijuojantiems pagal specialybę 1-31 01 01 “Biologija” Gomelis 2010 m.

Matematinės statistikos dalykas ir metodas
Matematinės statistikos dalykas – masinių reiškinių savybių tyrimas biologijos, ekonomikos, technologijų ir kitose srityse. Šie reiškiniai paprastai pateikiami kaip sudėtingi dėl įvairovės (variacijų)

Atsitiktinio įvykio samprata
Statistinė indukcija arba statistinės išvados, kaip pagrindinis masės reiškinių tyrimo metodo komponentas, turi savo išskirtinių bruožų. Statistinės išvados daromos skaitiniais

Atsitiktinio įvykio tikimybė
Atsitiktinio įvykio skaitinė charakteristika, turinti savybę, kad bet kurios pakankamai didelės bandymų serijos atveju įvykio dažnis nuo šios charakteristikos skiriasi tik nežymiai.

Tikimybių skaičiavimas
Dažnai reikia vienu metu pridėti ir padauginti tikimybes. Pavyzdžiui, reikia nustatyti tikimybę gauti 5 taškus metant 2 kauliukus vienu metu. Tikėtina, kad reikalinga suma

Atsitiktinio dydžio samprata
Apibrėžę tikimybės sąvoką ir išsiaiškinę pagrindines jos savybes, pereikime prie vienos iš svarbiausių tikimybių teorijos sąvokų – atsitiktinio dydžio sąvokos.

Tarkime, kad tai yra rezultatas
Diskretieji atsitiktiniai dydžiai

Atsitiktinis dydis yra diskretus, jei jo galimų reikšmių aibė yra baigtinė arba bent jau skaičiuojama. Tarkime, kad atsitiktinis dydis X gali turėti reikšmes x1
Nuolatiniai atsitiktiniai dydžiai

Skirtingai nuo ankstesniame poskyryje aptartų diskrečiųjų atsitiktinių dydžių, nuolatinio atsitiktinio dydžio galimų dydžių rinkinys ne tik nėra baigtinis, bet ir nepriklauso nuo
Lūkesčiai ir dispersija

Dažnai atsiranda poreikis apibūdinti atsitiktinio dydžio pasiskirstymą naudojant vieną ar du skaitinius rodiklius, kurie išreiškia svarbiausias šio skirstinio savybes. Tokiems
Akimirkos

Didelę reikšmę matematinėje statistikoje turi vadinamieji atsitiktinio dydžio pasiskirstymo momentai. Matematiniuose lūkesčiuose nepakankamai atsižvelgiama į dideles atsitiktinio dydžio reikšmes.
Binominis skirstinys ir tikimybių matavimas

Šioje temoje apžvelgsime pagrindinius diskrečiųjų atsitiktinių dydžių pasiskirstymo tipus. Tarkime, kad kokio nors atsitiktinio įvykio A įvykimo tikimybė vieno bandymo metu yra lygi
Stačiakampis (vienodas) pasiskirstymas

Stačiakampis (vienodas) skirstinys yra paprasčiausias nepertraukiamo skirstinio tipas. Jei atsitiktinis dydis X intervale (a, b) gali įgyti bet kokią realią reikšmę, kur a ir b yra tikrosios
Normalus skirstinys vaidina pagrindinį vaidmenį matematinėje statistikoje. Tai nėra nė menkiausio laipsnio atsitiktinumas: objektyvioje realybėje labai dažnai susiduriama su įvairiais ženklais

Lognormalus pasiskirstymas
Atsitiktinis dydis Y turi lognormalųjį pasiskirstymą su parametrais μ ir σ, jei atsitiktinis dydis X = lnY turi normalųjį pasiskirstymą su tais pačiais parametrais μ ir &

Vidutinės vertės
Iš visų grupės savybių didžiausią teorinę ir praktinę reikšmę turi vidutinis lygis, matuojamas vidutine požymio verte.

Vidutinė funkcijos vertė yra labai gili sąvoka,
Bendrosios vidurkių savybės

Norint teisingai panaudoti vidutines reikšmes, būtina žinoti šių rodiklių savybes: medianinę vietą, abstraktumą ir bendro veiksmo vienybę.
Pagal jo skaitinę reikšmę

Aritmetinis vidurkis
Aritmetinis vidurkis, turintis bendrąsias vidutinių verčių savybes, turi savo ypatybes, kurias galima išreikšti šiomis formulėmis:

Vidutinis reitingas (ne parametrinis vidurkis)
Vidutinis reitingas nustatomas charakteristikoms, kurių kiekybiniai matavimo metodai dar nebuvo rasti. Pagal tokių ženklų pasireiškimo laipsnį objektai gali būti reitinguojami, t.y

Svertinis aritmetinis vidurkis
Paprastai, norint apskaičiuoti aritmetinį vidurkį, visos atributo reikšmės yra sudedamos ir gauta suma padalijama iš parinkčių skaičiaus. Tokiu atveju kiekviena į sumą įtraukta reikšmė ją padidina iki galo

Vidutinis kvadratas
Vidutinis kvadratas apskaičiuojamas pagal formulę: , (6.5) Jis yra lygus sumos kvadratinei šakniai

Mediana
Mediana yra būdinga reikšmė, padalijanti visą grupę į dvi lygias dalis: vienos dalies charakteristinė reikšmė mažesnė už medianą, o kitos – didesnė.

Pavyzdžiui, jei turite
Geometrinis vidurkis

Norėdami gauti geometrinį vidurkį grupei su n duomenų, turite padauginti visas parinktis ir iš gauto sandaugos išgauti n-ąją šaknį:
Harmoninis vidurkis

Harmoninis vidurkis apskaičiuojamas pagal formulę. (6.14) Penkioms parinktims: 1, 4, 5, 5 trečiadienį
Standartinis nuokrypis yra įvardyta vertė, išreikšta tais pačiais matavimo vienetais kaip ir aritmetinis vidurkis.

Todėl norint palyginti skirtingas charakteristikas, išreikštas skirtingais vienetais nuo
Ribos ir apimtis

Norint greitai ir apytiksliai įvertinti įvairovės laipsnį, dažnai naudojami paprasčiausi rodikliai: lim = (min ¸ max) – ribos, t.y. mažiausia ir didžiausia charakteristikos reikšmės, p =
Normalizuotas nuokrypis

Paprastai požymio išsivystymo laipsnis nustatomas jį išmatavus ir išreiškiamas tam tikru įvardintu skaičiumi: 3 kg svorio, 15 cm ilgio, 20 kabliukų ant bičių sparno, 4% riebumo piene, 15 kg karpymas
Visos grupės vidurkis ir sigma

Kartais reikia nustatyti suminio skirstinio, sudaryto iš kelių skirstinių, vidurkį ir sigmą. Šiuo atveju žinomi ne patys skirstiniai, o tik jų vidurkiai ir sigmos.
Pasiskirstymo kreivės iškrypimas (kreivumas) ir statumas (kurtozė).

Didelėms imtims (n > 100) apskaičiuojami dar du statistiniai duomenys.
Kreivės iškrypimas vadinamas asimetrija:

Variacijų serija
Didėjant tirtų grupių skaičiui, vis labiau išryškėja įvairovės modelis, kurį mažose grupėse slėpė atsitiktinė jos pasireiškimo forma.

Histograma ir variacijos kreivė
Histograma yra variacijų serija, pateikta diagramos pavidalu, kurioje skirtingos dažnio reikšmės yra pavaizduotos skirtingais juostų aukščiais. Duomenų pasiskirstymo histograma parodyta p

Skirtumų pasiskirstymo patikimumas
Statistinė hipotezė yra konkreti prielaida apie tikimybių pasiskirstymą, kuriuo grindžiamas stebimas duomenų pavyzdys.

Statistinių hipotezių tikrinimas yra priėmimo procesas
Pasvirimo ir kurtozės kriterijus

Kai kurios augalų, gyvūnų ir mikroorganizmų savybės, jungiant objektus į grupes, suteikia pasiskirstymą, kuris labai skiriasi nuo įprasto.
Tais atvejais, kai bet koks

Populiacija ir imtis
Bendrųjų parametrų įvertinimas naudojant imties rodiklius turi savo ypatybes.

Dalis niekada negali iki galo apibūdinti visumos, taigi ir bendrosios populiacijos charakteristikos
Pasitikėjimo ribos

Būtina nustatyti reprezentatyvumo paklaidų dydį, kad būtų galima naudoti imties rodiklius ir rasti galimas bendrųjų parametrų reikšmes. Šis procesas vadinamas o
Bendra vertinimo tvarka

Trys dydžiai, reikalingi bendrajam parametrui įvertinti – imties rodiklis (), patikimumo kriterijus
Aritmetinio vidurkio įvertinimas

Apskaičiuojant vidutinę vertę, siekiama nustatyti tiriamos kategorijos objektų bendrojo vidurkio vertę. Šiam tikslui reikalinga reprezentatyvumo paklaida nustatoma pagal formulę:
Vidutinio skirtumo įvertinimas

Kai kuriuose tyrimuose pirminiai duomenys laikomi dviejų matavimų skirtumais. Taip gali būti, kai kiekvienas imties individas tiriamas dviejose būsenose – arba skirtingo amžiaus, arba
Nepatikimas ir patikimas vidutinio skirtumo įvertinimas

Tokie imtinių tyrimų rezultatai, kuriems negalima gauti aiškaus bendrojo parametro įverčio (arba jis didesnis už nulį, arba mažesnis už arba lygus nuliui), vadinami nepatikimais.
Bendrųjų vidurkių skirtumo įvertinimas

Biologiniuose tyrimuose ypač svarbus skirtumas tarp dviejų dydžių. Skirtingai palyginamos skirtingos populiacijos, rasės, veislės, veislės, linijos, šeimos, eksperimentinės ir kontrolinės grupės (gr metodas
Skirtumo patikimumo kriterijus

Atsižvelgiant į tai, kad mokslininkams labai svarbu gauti patikimus skirtumus, reikia įvaldyti metodus, kurie leistų nustatyti, ar gautas rezultatas yra patikimas ir realus.
Reprezentatyvumas tiriant kokybines charakteristikas

Kokybinės savybės paprastai negali turėti pasireiškimo gradacijų: jų yra arba nėra kiekviename iš individų, pavyzdžiui, lytis, apdulkinimas, kai kurių požymių buvimas ar nebuvimas, deformacijos.
Akcijų skirtumo patikimumas

Mėginio proporcijų skirtumo patikimumas nustatomas taip pat, kaip ir vidutinių skirtumų atveju: (10.34)
Koreliacijos koeficientas

Daugelis tyrimų reikalauja išnagrinėti kelis jų tarpusavio santykių bruožus. Jei atliksite tokį tyrimą dėl dviejų savybių, pastebėsite, kad vienos charakteristikos kintamumas nėra
Koreliacijos koeficiento paklaida

Imties koreliacijos koeficiento patikimumas
Imties koreliacijos koeficiento kriterijus nustatomas pagal formulę: (11.9) čia:

Koreliacijos koeficiento pasitikėjimo ribos
Bendrosios koreliacijos koeficiento reikšmės pasikliovimo ribos randamos bendrai naudojant formulę:

Dviejų koreliacijos koeficientų skirtumo patikimumas
Koreliacijos koeficientų skirtumo patikimumas nustatomas taip pat kaip ir vidurkių skirtumo patikimumas, pagal įprastą formulę

Tiesios regresijos lygtis
Tiesioji koreliacija skiriasi tuo, kad naudojant šią ryšio formą kiekvienas identiškas pirmosios charakteristikos pokytis atitinka visiškai apibrėžtą ir taip pat identišką kitos charakteristikos pokytį.

Klaidos tiesinės regresijos lygties elementuose
Paprastoje tiesinės regresijos lygtyje: y = a + bx atsiranda trys reprezentatyvumo paklaidos.

1 Regresijos koeficiento paklaida:
Dalinės koreliacijos koeficientas

Dalinės koreliacijos koeficientas yra rodiklis, matuojantis dviejų charakteristikų konjugacijos laipsnį su pastovia trečiosios reikšme.
Matematinė statistika leidžia nustatyti koreliaciją

Tiesinės daugkartinės regresijos lygtis
Trijų kintamųjų tiesinio ryšio matematinė lygtis vadinama daugialypės tiesinės regresijos plokštumos lygtimi. Jis turi tokią bendrą formą:

Koreliacinis ryšys
Jei ryšys tarp tiriamų reiškinių labai skiriasi nuo tiesinio, o tai nesunku nustatyti iš grafiko, tai koreliacijos koeficientas netinka kaip ryšio matas. Jis gali nurodyti nebuvimą

Koreliacinio ryšio savybės
Koreliacijos koeficientas matuoja bet kokios formos koreliacijos laipsnį.

Be to, koreliacijos ryšys turi daugybę kitų savybių, kurios labai domina statistiką
Koreliacinio ryšio reprezentatyvumo klaida

Tiksli koreliacinio ryšio reprezentatyvumo paklaidos formulė dar nėra sukurta. Paprastai vadovėliuose pateikta formulė turi trūkumų, kurių ne visada galima ignoruoti. Ši formulė nemoko
Koreliacijos tiesiškumo kriterijus

Norint nustatyti kreivinės priklausomybės ir tiesinės priklausomybės aproksimacijos laipsnį, naudojamas F kriterijus, apskaičiuojamas pagal formulę:
Statistinė įtaka – tai tyrime organizuojamo veiksnio įvairovės (jo gradacijų) gaunamo požymio įvairovės atspindys.

Įvertinti neo faktoriaus įtaką
Faktorinė įtaka

Faktorinė įtaka – tai paprasta arba kombinuota statistinė tiriamų veiksnių įtaka.
Vieno veiksnio kompleksuose tam tikromis organizacinėmis sąlygomis tiriama paprasta vieno veiksnio įtaka.

Vieno veiksnio dispersinis kompleksas
Dispersinę analizę sukūrė ir į žemės ūkio ir biologijos tyrimų praktiką įdiegė anglų mokslininkas R. A. Fisheris, atradęs vidutinių kvadratų santykio pasiskirstymo dėsnį.

Daugiafaktorinis dispersinis kompleksas
Aiškus matematinis dispersinės analizės modelio supratimas palengvina būtinų skaičiavimo operacijų supratimą, ypač apdorojant duomenis iš daugiamačių eksperimentų, kuriuose daugiau

Transformacijos
Tinkamas dispersinės analizės naudojimas eksperimentinei medžiagai apdoroti suponuoja variantų (imčių) dispersijų homogeniškumą, normalų arba artimą normaliam pasiskirstymui.

Poveikių stiprumo rodikliai
Poveikių stiprumo nustatymas pagal jų rezultatus reikalingas biologijoje, žemės ūkyje, medicinoje, siekiant parinkti efektyviausias poveikio priemones, fizikinių ir cheminių veiksnių dozavimui – str.

Pagrindinio įtakos stiprumo rodiklio reprezentatyvumo klaida
Tiksli pagrindinio įtakos stiprumo rodiklio paklaidos formulė dar nerasta.

Vienfaktoriniuose kompleksuose, kai reprezentatyvumo paklaida nustatoma tik vienam faktoriniam rodikliui
Ribinės įtakos rodiklių reikšmės

Pagrindinis įtakos stiprumo rodiklis lygus vieno termino daliai nuo bendros terminų sumos. Be to, šis rodiklis yra lygus koreliacijos santykio kvadratui. Dėl šių dviejų priežasčių galios indikatorius
Poveikių patikimumas

Pagrindinis atrankinio tyrimo metu gautas įtakos stiprumo rodiklis visų pirma apibūdina įtakos, kuri iš tikrųjų pasireiškė tiriamų objektų grupėje, laipsnį.
Diskriminacinė analizė

Diskriminacinė analizė yra vienas iš daugiamatės statistinės analizės metodų. Diskriminacinės analizės tikslas yra, remiantis įvairių charakteristikų (požymių, porų) matavimu.
Diskriminacinė analizė „veikia“, jei tenkinamos kelios prielaidos.

Prielaida, kad stebimi dydžiai – išmatuojamos objekto charakteristikos – turi normalų pasiskirstymą. Tai
Diskriminacinės analizės algoritmas

Diskriminacinės problemos sprendimas (diskriminacinė analizė) susideda iš visos imties erdvės (visų nagrinėjamų daugiamačių atsitiktinių dydžių realizacijų rinkinio) padalijimo į tam tikrą skaičių.
Klasterinė analizė

Klasterinė analizė apjungia įvairias procedūras, naudojamas klasifikavimui atlikti. Taikant šias procedūras pradinis objektų rinkinys suskirstomas į grupes arba grupes
Klasterinės analizės metodai

Praktikoje dažniausiai diegiami aglomeraciniai klasterizacijos metodai.
Paprastai, prieš pradedant klasifikuoti, duomenys yra standartizuojami (vidurkis atimamas ir padalinamas iš kvadratinės šaknies).



Klasterinės analizės algoritmas Klasterinė analizė – tai daugiamačių stebėjimų ar objektų klasifikavimo metodų rinkinys, pagrįstas atstumo tarp objektų sąvokos apibrėžimu ir tada iš jų grupių identifikavimu, &