Parabolinė ir daugianarė regresija. Parabolinė regresija Parabolinės regresijos funkcijos lygtis atspindi vystymosi dinamiką

Kitas vieno veiksnio regresijos tipas yra aproksimacija pagal formos laipsnio polinomus:

Natūralu, kad norima gauti kuo paprastesnę priklausomybę, apsiribojant antrojo laipsnio laipsniniais daugianariais, t.y. parabolinė priklausomybė:
(5.5.2)

Apskaičiuokime dalines išvestines koeficientų atžvilgiu b 0 , b 1 Ir b 2 :



(5.5.3)

Išvestines prilyginus nuliui, gauname normalią lygčių sistemą:

(5.5.4)

Normaliųjų lygčių sistemos (5.5.2) sprendimas konkrečiam reikšmių atvejui x i * , y i * ;
gauname optimalios vertės b 0 , b 1 Ir b 2 . Aproksimavimui pagal priklausomybę (5.5.2) ir ypač (5.5.1) nebuvo gautos paprastos koeficientų skaičiavimo formulės ir paprastai jos apskaičiuojamos naudojant standartines procedūras matricos forma:

(5.5.5)

5.5.1 paveiksle parodytas tipiškas aproksimavimo pagal parabolinę priklausomybę pavyzdys:

9 (5;9)

(1;1)

1

1 2 3 4 5 x

5.5.1 pav. Eksperimentinių taškų koordinatės ir aproksimacijos

jų parabolinė priklausomybė

5.1 pavyzdys. Apytiksliai 5.1.1 lentelėje pateiktus eksperimento rezultatus su tiesinės regresijos lygtimi
.

5.1.1 lentelė

Eksperimentinius taškus sukonstruokime pagal 5.1.1 lentelėje nurodytas koordinates 5.1.1 pav. pateiktame grafike.

adresu

9

4

1 2 3 45x

Pagal 5.1.1 pav., ant kurios nubrėžsime tiesę preliminariam vertinimui, padarysime išvadą, kad yra aiškiai išreikštas netiesiškumas eksperimento taškų išsidėstymo vietoje, tačiau jis nėra labai reikšmingas ir todėl prasmingas. aproksimuoti juos tiesine priklausomybe. Atkreipkite dėmesį, kad norint gauti teisingą matematinę išvadą, reikia nutiesti tiesę, naudojant mažiausių kvadratų metodą.

Prieš atliekant regresinę analizę, patartina pasiskaičiuoti

tiesinės koreliacijos koeficientas tarp kintamųjų X Ir adresu:

Koreliacijos ryšio reikšmingumą lemia tiesinės koreliacijos koeficiento kritinė vertė, apskaičiuojama pagal formulę:

Kritinė Studento testo vertė t Kreta rasta pagal rekomenduojamo reikšmingumo lygio statistines lenteles α=0,05 ir už n-2 laisvės laipsnių. Jei apskaičiuota vertė r xy ne mažesnė už kritinę vertę r Kreta, tada koreliacija tarp kintamųjų x Ir y laikomas esminiu. Atlikime skaičiavimus:










Dėl to,
darome išvadą, kad koreliacija tarp kintamųjų X Ir adresu yra reikšmingas ir gali būti tiesinis.

Apskaičiuokime regresijos lygties koeficientus:

Taigi, mes gavome tiesinės regresijos lygtį:

Naudodami regresijos lygtį, brėžiame tiesę 5.1.2 pav.

y (5; 9,8)

9

4

(0;-0.2) 1 2 3 4 5 x

5.1.2 pav. Eksperimentinių taškų koordinatės ir aproksimacijos

jų tiesinė priklausomybė

Naudodami regresijos lygtį, apskaičiuojame funkcijos reikšmes pagal 5.1.1 lentelės eksperimentinius taškus ir skirtumą tarp eksperimentinės ir apskaičiuotos funkcijos reikšmių, kurias pateikiame 5.1.2 lentelėje.

5.1.2 lentelė


Apskaičiuokime vidutinę kvadratinę paklaidą ir jos santykį su vidutine verte:

Vertinant standartinės paklaidos ir vidutinės reikšmės santykį, gautas nepatenkinamas rezultatas, nes buvo viršyta rekomenduojama vertė 0,05.

Įvertinkime regresijos lygties koeficientų reikšmingumo lygį naudodami Stjudento t-testą:


Iš statistinės lentelės 3 laisvės laipsniai, užrašykime eilutes su reikšmingumo lygiu - ir Mokinio kriterijaus vertė t prie 5.1.3 lentelės.

5.1.3 lentelė

Regresijos lygties koeficientų reikšmingumo lygis:


Atkreipkite dėmesį, kad pagal koeficiento reikšmingumo lygį buvo gautas patenkinamas rezultatas, o už koeficientą nepatenkinama.

Įvertinkime gautos regresijos lygties kokybę naudodami rodiklius, apskaičiuotus remiantis dispersijos analize:

Egzaminas:

Patikrinimo rezultatas yra teigiamas, o tai rodo atliktų skaičiavimų teisingumą.

Apskaičiuokime Fišerio kriterijų:

su dviem laisvės laipsniais:

Naudodami statistines lenteles randame Fišerio kriterijaus kritines reikšmes dviem rekomenduojamoms reikšmingumo lygio gradacijomis:


Kadangi Fišerio testo apskaičiuota reikšmė viršija 0,01 reikšmingumo lygio kritinę reikšmę, manysime, kad reikšmingumo lygis pagal Fišerio testą yra mažesnis nei 0,01, o tai bus laikoma patenkinama.

Apskaičiuokime daugkartinio nustatymo koeficientą:

už du laisvės laipsnius

Naudodami rekomenduojamo 0,05 reikšmingumo lygio ir dviejų rastų laisvės laipsnių statistinę lentelę, randame daugkartinio nustatymo koeficiento kritinę reikšmę:

Kadangi apskaičiuota daugkartinio nustatymo koeficiento reikšmė viršija reikšmingumo lygio kritinę reikšmę
, tada reikšmingumo lygis pagal daugkartinio nustatymo koeficientą
ir gautas rezultatas pagal pateiktą rodiklį bus laikomas patenkinamu.

Taigi gauti apskaičiuoti parametrai standartinės paklaidos santykio su vidutine verte ir reikšmingumo lygiu pagal Stjudento testą yra nepatenkinami, todėl aproksimacijai patartina pasirinkti kitą aproksimuojančią priklausomybę.

5.2 pavyzdys. Atsitiktinių skaičių eksperimentinio pasiskirstymo aproksimacija matematine priklausomybe

5.1.1 lentelėje pateiktas eksperimentinis atsitiktinių skaičių pasiskirstymas, aproksimuojant tiesine priklausomybe, nedavė patenkinamo rezultato, įskaitant. dėl regresijos lygties su laisvuoju nariu koeficiento nereikšmingumo, todėl, siekdami pagerinti aproksimacijos kokybę, bandysime jį atlikti naudojant tiesinę priklausomybę be laisvojo nario:

Apskaičiuokime regresijos lygties koeficiento reikšmę:

Taigi, mes gavome regresijos lygtį:

Naudodamiesi gauta regresijos lygtimi, apskaičiuojame funkcijos reikšmes ir skirtumą tarp eksperimentinių ir apskaičiuotų funkcijos verčių, kurias pateikiame 5.2.1 lentelės forma.

5.2.1 lentelė

x i

Pagal regresijos lygtį
5.2.1 pav. brėžsime tiesią liniją.

y (5;9.73 )

(0;0) 1 2 3 4 5 x

5.2.1 pav. Eksperimentinių taškų koordinatės ir aproksimacijos

jų tiesinė priklausomybė

Aproksimacijos kokybei įvertinti atliksime kokybės rodiklių skaičiavimus, panašius į 5.1 pavyzdyje pateiktus skaičiavimus.

(lieka senas);

su 4 laisvės laipsniais;



Remdamiesi aproksimavimo rezultatais, pažymime, kad regresijos lygties koeficiento reikšmingumo lygio atžvilgiu gautas patenkinamas rezultatas; Standartinės paklaidos ir vidurkio santykis pagerėjo, bet vis tiek išlieka virš rekomenduojamos 0,05 vertės, todėl rekomenduojama kartoti aproksimaciją naudojant sudėtingesnį matematinį ryšį.

5.3 pavyzdys. Norėdami pagerinti 5.1 ir 5.2 pavyzdžių aproksimacijos kokybę, atliksime netiesinį aproksimavimą pagal priklausomybę
. Norėdami tai padaryti, pirmiausia atliksime tarpinius skaičiavimus ir jų rezultatus patalpinsime į 5.3.1 lentelę.

Vertybės

5.3.1 lentelė

X 2

(lnX) 2

lnX lnY

Papildomai paskaičiuokime:

Apytiksliai apskaičiuokime priklausomybę
. Naudodamiesi formulėmis (5.3.7), (5.3.8) apskaičiuojame koeficientus b 0 Ir b 1 :

Naudodamiesi formulėmis (5.3.11) apskaičiuojame koeficientus A 0 Ir A 1 :


Standartinei paklaidai apskaičiuoti buvo atlikti tarpiniai skaičiavimai, pateikti 5.3.2 lentelėje.

5.3.2 lentelė

Y i

y i

Suma: 7,5968

Standartinė aproksimacijos paklaida pasirodė daug didesnė nei dviejuose ankstesniuose pavyzdžiuose, todėl aproksimacijos rezultatus laikome netinkamais.

5.4 pavyzdys. Pabandykime aproksimuoti su kita netiesine priklausomybe
. Naudodami (5.3.9), (5.3.10) formules pagal 5.3.1 lentelę apskaičiuojame koeficientus b 0 Ir b 1 :

Gavome tarpinę priklausomybę:

Naudodamiesi formulėmis (5.3.13) apskaičiuojame koeficientus C 0 Ir C 1 :


Gavome galutinę priklausomybę:

Norėdami apskaičiuoti standartinę paklaidą, atliksime tarpinius skaičiavimus ir patalpinsime juos į 5.4.1 lentelę.

5.4.1 lentelė

Y i

y i

Suma: 21,83152

Apskaičiuokime standartinę paklaidą:

Standartinė aproksimacijos paklaida pasirodė daug didesnė nei ankstesniame pavyzdyje, todėl aproksimacijos rezultatus laikome netinkamais.

5.5 pavyzdys. Atsitiktinių skaičių eksperimentinio skirstinio aproksimacija matematine priklausomybe y = b · lnx

Pradiniai duomenys, kaip ir ankstesniuose pavyzdžiuose, pateikti 5.4.1 lentelėje ir 5.4.1 pav.

5.4.1 lentelė

Remiantis 5.4.1 pav. ir 5.4.1 lentelės analize, pastebime, kad esant mažesnėms argumento reikšmėms (lentelės pradžioje) funkcija pasikeičia labiau nei esant didesnėms reikšmėms (pabaigoje). lentelę), todėl patartina pakeisti argumento skalę ir iš jos į regresijos lygtį įvesti logaritminę funkciją bei apytiksliai su tokia matematine priklausomybe:

. Naudodami (5.4.3) formulę apskaičiuojame koeficientą b:

Aproksimacijos kokybei įvertinti atliksime 5.4.2 lentelėje pateiktus tarpinius skaičiavimus, iš kurių apskaičiuosime paklaidos dydį ir standartinės paklaidos santykį su vidutine verte.

5.4.2 lentelė


Kadangi standartinės paklaidos ir vidutinės vertės santykis viršija rekomenduojamą reikšmę 0,05, rezultatas bus laikomas nepatenkinamu. Visų pirma atkreipiame dėmesį, kad didžiausią nuokrypį suteikia vertė x=1, kadangi su šia verte lnx=0. Todėl apytiksliai apskaičiuosime priklausomybę y = b 0 +b 1 lnx

Pagalbinius skaičiavimus pateikiame 5.4.3 lentelės forma.

5.4.3 lentelė

Naudodami (5.4.6) ir (5.4.7) formules apskaičiuojame koeficientus b 0 ir b 1 :

9 (5;9.12)

4

1 (1;0.93)

1 2 3 4 5 x

Aproksimacijos kokybei įvertinti atliksime pagalbinius skaičiavimus ir nustatysime rastų koeficientų reikšmingumo lygį bei standartinės paklaidos santykį su vidutine verte.

Reikšmingumo lygis šiek tiek viršija rekomenduojamą reikšmę 0,05 (
).


Atsižvelgiant į tai, kad pagal pagrindinį rodiklį – standartinės paklaidos santykį su vidutine verte – gautas beveik dvigubas rekomenduojamo lygio 0,05 viršijimas, rezultatus laikysime priimtinais. Atkreipkite dėmesį, kad apskaičiuota Studento testo vertė t b 0 =2,922 skiriasi nuo kritinio
palyginti nedideliu kiekiu.

5.6 pavyzdys. 5.1 pavyzdžio eksperimentinius duomenis apytikskime hiperboline priklausomybe
. Norint apskaičiuoti koeficientus b 0 ir b 1 Atlikime preliminarius skaičiavimus, pateiktus 5.6.1 lentelėje.

5.6.1 lentelė

X i

x i =1/X i

x i 2

x i y i

Remdamiesi 5.6.1 lentelės rezultatais, naudodami (5.4.8) ir (5.4.9) formules, apskaičiuojame koeficientus b 0 ir b 1 :

Taigi gaunama hiperbolinės regresijos lygtis

.

Pagalbinių skaičiavimų rezultatai aproksimacijos kokybei įvertinti pateikti 5.6.2 lentelėje.

5.6.2 lentelė

X i

Remdamiesi 5.6.2 lentelės rezultatais, apskaičiuojame standartinę paklaidą ir standartinės paklaidos santykį su vidutine verte:


Atsižvelgiant į tai, kad standartinės paklaidos ir vidutinės vertės santykis viršija rekomenduojamą 0,05 reikšmę, darome išvadą, kad aproksimavimo rezultatai yra netinkami.

5.7 pavyzdys.

Norint apskaičiuoti konkrečias pajamų, gautų iš strėlinių kranų eksploatavimo, vertes, priklausomai nuo priežiūros darbų laiko, reikia gauti parabolinę priklausomybę.

Apskaičiuokime šios priklausomybės koeficientus b 0 , b 1 , b 11 matricos pavidalu pagal formulę:

Netiesinės regresijos lygtys, jungiančios efektyvųjį rodiklį su optimaliomis bokštinių kranų profilaktinės priežiūros vertėmis, gautos naudojant Statistica 6.0 taikomųjų programų paketo daugkartinės regresijos procedūrą. Toliau pateikiame efektyvaus veiklos rodiklio regresinės analizės rezultatus pagal 5.7.1 lentelę.

5.7.1 lentelė

5.7.2 lentelėje pateikti efektyvaus veiklos rodiklio netiesinės regresijos rezultatai, o 5.7.3 lentelėje – likučių analizės rezultatai.

5.7.2 lentelė

5.7.3 lentelė

Ryžiai. 3.7.36. Likučių analizė.

Taigi, mes gavome daugkartinę kintamojo regresijos lygtį
:

Standartinės paklaidos santykis reiškia:

14780/1017890=0,0145 < 0,05.

Kadangi standartinės paklaidos ir vidutinės vertės santykis neviršija rekomenduojamos reikšmės 0,05, aproksimavimo rezultatus galima laikyti priimtinais. Kaip trūkumą pagal 5.7.2 lentelę pažymėtina, kad visi apskaičiuoti koeficientai viršija rekomenduojamą 0,05 reikšmingumo lygį.

Laboratoriniai darbai

Ekonominių procesų prognozavimas
naudojant Excel skaičiuoklių procesorių.

Reikalavimai turiniui, dizainui ir vykdymo tvarkai

Laboratoriniams darbams atlikti reikia sukurti naują Excel darbaknygę pavadinimu „Jūsų vardas, Laboratorinis darbas Nr.1, Variantas Nr._“ (pvz.: „Ivanov I.P. Laboratorinis darbas Nr.1“ Variantas Nr.4).

Prieš atlikdami laboratorinius darbus, išstudijuokite teorinę dalį ir užduočių atlikimo būdus.

Užduotys turi būti baigtos ir įvykdytos pagal jūsų pasirinkimą . Darbaknygėje esantys darbalapiai turi būti pavadinti Užduotis1, Užduotis2. Įveskite užduočių rezultatus į ataskaitos failą.

Laboratorinių darbų pasirinkimai skirstomi pagal numerį Nr. grupių sąraše, žr. lentelę

Var. Var. Var. Var. Var. Var. Var.

Baigę laboratoriją atsakykite į viktorinos klausimus. Atsakymus į saugos klausimus pateikite ataskaitos faile. Savo darbo knygelę kartu su ataskaitos failu turite pateikti mokytojui diskelyje, pasirašydami „Mokinio I.P. Ivanovo laboratorinių darbų ataskaita Nr. 2, gr. 170404".

Teorinė dalis

Prognozavimas yra mokslinio tyrimo metodas, kuriuo siekiama pateikti galimus variantus tiems procesams ir reiškiniams, kurie pasirenkami analizės objektu.

Užduotys ekonominės prognozės yra: galimo išteklių paskirstymo įvairiose srityse numatymas; nustatant gautų rezultatų apatinę ir viršutinę ribas; didžiausio galimo išteklių kiekio, reikalingo ekonominėms, mokslinėms ir techninėms problemoms spręsti, įvertinimas ir kt.

Priklausomai nuo laikotarpio, kuriam sudaroma prognozė (pradavimo laikotarpis), prognozės gali būti:



· trumpalaikis;

· vidutinės trukmės;

· ilgalaikis;

· ilgalaikis.

Laiko prognozių gradacija yra santykinė ir priklauso nuo prognozės pobūdžio ir tikslo.

Atlikti trumpalaikė prognozė Dažniausiai naudojamas metodas yra ekstrapoliacija.

Ekstrapoliacijos metodas susideda iš reikšmių, kurios yra už tam tikros statistinės eilutės ribų, radimas: remiantis žinomomis statistinės eilutės reikšmėmis, randamos kitos vertės, esančios už šios serijos ribų.

Ekstrapoliuojant, išvados, padarytos tiriant reiškinio raidos tendencijas praeityje ir dabartyje, perkeliamos į ateitį, t.y. Ekstrapoliacija grindžiama prielaida apie tam tikrą faktorių charakteristikų, turinčių įtakos šio reiškinio vystymuisi, stabilumą.


1 pav. Pagrindiniai ekstrapoliacijos metodo pavadinimai.

Ekstrapoliuojant (žr. 1 pav.), vartojama tokia terminija:

t 1 – retrospektyvos gylis;

t 2 – numatymo momentas;

t 3 – prognozės horizontas;

t 2 – t 1 – stebėjimo intervalas (laikotarpis, kurio pagrindu tiriama prognozuojamo objekto raidos istorija);

t 3 – t 2 – pradinis intervalas (laikotarpis, kuriam sudaroma prognozė).

Kuo stabilesni prognozuojami procesai ir tendencijos, tuo toliau prognozavimo horizontas gali būti nustumtas atgal. Kaip rodo praktika, stebėjimo intervalas turėtų būti tris ar daugiau kartų ilgesnis už pradinį intervalą. Paprastai šis laikotarpis yra gana trumpas. Ekstrapoliacijos metodas neveikia nenutrūkstamiems procesams.

Ekstrapoliacijos metodas lengvai įgyvendinamas asmeniniame kompiuteryje. Šiuolaikinių skaičiuoklių procesorių, tokių kaip MS Excel, naudojimas leidžia greitai prognozuoti ekonominius procesus ekstrapoliacijos metodu.

Norint padidinti prognozės tikslumą, būtina atsižvelgti į numatomos vertės Y priklausomybę nuo išorinių veiksnių X. Tiriama verčių rinkinys, kaip taisyklė, priklauso nuo atsitiktinių veiksnių. Šiuo atžvilgiu prognozuojamos vertės Y priklausomybė nuo išorinių veiksnių X dažniausiai yra statistinė arba koreliacinė.

Statistiniai yra atsitiktinių dydžių priklausomybė, kurioje kiekviena vieno iš jų reikšmė atitinka kito pasiskirstymo dėsnį, tai yra, pasikeitus vienam iš kintamųjų, pasikeičia ir kito pasiskirstymas.

Koreliacija vadinama statistine atsitiktinių dydžių priklausomybe, kai pasikeitus vienam iš dydžių, pasikeičia ir kito vidutinė vertė.

Dviejų atsitiktinių dydžių X ir Y koreliacinės priklausomybės matas yra koreliacijos koeficientas r, kuris yra bematis dydis, todėl jis nepriklauso nuo tiriamų dydžių matavimo vienetų pasirinkimo.

Koreliacijos koeficiento savybės:

1) Jeigu du atsitiktiniai dydžiai X ir Y yra nepriklausomi, tai jų koreliacijos koeficientas lygus nuliui, t.y. r = 0.

2) Koreliacijos koeficiento modulis neviršija vieneto, t.y. |r|£1, kuri atitinka dvigubą nelygybę: -1£r£1.

3) Koeficiento lygybė -1 arba +1 rodo funkcinio (tiesioginio) ryšio buvimą. „+“ ženklas rodo tiesioginį ryšį (vieno požymio padidėjimą ar sumažėjimą lydi panašus kito požymio pasikeitimas), „-“ ženklas rodo atvirkštinį ryšį (vieno požymio padidėjimas arba sumažėjimas lydi pokyčio kitu atributu priešinga kryptimi).

Nustačius reikšmingiausias faktorių charakteristikas, turinčias įtakos prognozuojamai reikšmei, ne mažiau svarbu nustatyti jų matematinį aprašymą (lygtį), leidžiantį skaitiškai įvertinti efektyvų rodiklį per faktorių charakteristikas.

Lygtis, išreiškianti vidutinės veiklos rodiklio vertės kitimą priklausomai nuo faktorių charakteristikų reikšmių, vadinama regresijos lygtis.

Vadinamos regresijos lygtis atitinkančios koordinačių plokštumos tiesės regresijos linijos .

Koreliacinės priklausomybės gali būti išreikštos įvairių tipų regresijos lygtimis: tiesine, paraboline, hiperboline, eksponentine ir kt.

Tiesinė regresija

Tiesinės regresijos lygtis(atrankinis) Yįjungta X vadinama priklausomybe nuo stebimų kiekio verčių X, išreikštas tiesine funkcija:

kur yra vertė r paskambino tiesinės regresijos koeficientas Yįjungta X, b- pastovus.

Tiesinė aproksimacija gerai apibūdina dydžių kitimą, kuris vyksta pastoviu greičiu.

Jei dviejų dydžių koreliacijos koeficientas X Ir Y lygus r=±1, tada šie dydžiai yra susieti tiesiniu ryšiu. Koreliacijos koeficientas yra išmatuotų dydžių tiesinės priklausomybės stiprumo (artumo) matas. Praktiškai, jei dviejų dydžių koreliacijos koeficientas X Ir Y |r|>0,5, tada jie mano, kad yra pagrindo manyti, kad tarp šių dydžių yra tiesinis ryšys. Tačiau renkantis regresijos tiesės tipą (tiesinę ar netiesinę) geriau orientuotis pagal empirinės dydžių priklausomybės tipą. X Ir Y.

Parabolinė ir daugianarė regresija.

Parabolinis vertės priklausomybę Y nuo dydžio X vadinama priklausomybe, išreikšta kvadratine funkcija (2 eilės parabolė):

. (2)

Ši lygtis vadinama parabolinės regresijos lygtis Yįjungta X. Parinktys A, b, Su yra vadinami parabolinės regresijos koeficientai. Parabolinės regresijos koeficientų skaičiavimas visada yra sudėtingas, todėl skaičiavimams rekomenduojama naudoti kompiuterį.

Parabolinės regresijos (2) lygtis yra ypatingas bendresnės regresijos, vadinamos daugianamine regresija, atvejis. Polinomas vertės priklausomybę Y nuo dydžio X vadinama priklausomybe, išreikšta daugianario n- užsakymas:

kur skaičiai ir aš (i=0,1,…, n) yra vadinami daugianario regresijos koeficientai.

Polinominė aproksimacija naudojama apibūdinti dydžius, kurie pakaitomis didėja ir mažėja. Tai naudinga, pavyzdžiui, analizuojant didelį duomenų rinkinį apie nestabilų kiekį.

Galios regresija.

Galia vertės priklausomybę Y nuo dydžio X vadinama formos priklausomybe:

Ši lygtis vadinama galios regresijos lygtis Yįjungta X. Parinktys A Ir b yra vadinami galios regresijos koeficientai.

Galios dėsnio aproksimacija yra naudinga aprašant monotoniškai didėjantį arba monotoniškai mažėjantį dydį, pvz., greitėjančio automobilio nuvažiuotą atstumą. Galios dėsnio aproksimacijos negalima naudoti, jei duomenyse yra nulis arba neigiamos reikšmės.

Eksponentinė regresija.

Orientacinė(arba eksponentinis) vertės priklausomybė Y nuo dydžio X vadinama formos priklausomybe:

Ši lygtis vadinama eksponentinė lygtis(arba eksponentinis) regresija Yįjungta X. Parinktys A(arba k) Ir b yra vadinami eksponentinių koeficientų(arba eksponentinis) regresija.

Eksponentinis pritaikymas yra naudingas, kai duomenų pasikeitimo greitis nuolat didėja. Tačiau duomenims, kuriuose yra nulio arba neigiamos reikšmės, tokio tipo apytikslis nustatymas netaikomas.

Logaritminė regresija.

Logaritminis vertės priklausomybę Y nuo dydžio X vadinama formos priklausomybe:

(6)

Ši lygtis vadinama logaritminės regresijos lygtis Yįjungta X. Parinktys A Ir b yra vadinami logaritminės regresijos koeficientai.

Logaritminis aproksimavimas yra naudingas norint apibūdinti kiekį, kuris iš pradžių greitai didėja arba mažėja, o vėliau palaipsniui stabilizuojasi. Logaritminiam aproksimavimui naudojami ir neigiami, ir teigiami dydžiai.

Hiperbolinė regresija.

Hiperbolinis vertės priklausomybę Y nuo dydžio X vadinama formos priklausomybe:

Ši lygtis vadinama Hiperbolinės regresijos lygtis Yįjungta X. Parinktys A Ir b yra vadinami hiperbolinės regresijos koeficientai.

Regresijos lygčių sudarymo kokybė apibūdinama vidutine aproksimacijos paklaida arba santykine prognozės paklaida:

(8)

čia Y e – prognozuojamo rodiklio empirinė reikšmė; Y – apskaičiuota prognozuojamo rodiklio reikšmė.

Regresinės analizės atlikimą galima suskirstyti į tris etapus: ryšio formos (lygties tipo) parinkimas remiantis statistiniais duomenimis, pasirinktos lygties koeficientų apskaičiavimas, pasirinktos lygties patikimumo įvertinimas.

Naudojant skaičiuoklių procesorių, lengva atlikti visus regresinės analizės etapus.

Tiesinė regresija

Tiesinės regresijos lygtis – tai tiesės lygtis, kuri apytiksliai (apytiksliai apibūdina) atsitiktinių dydžių X ir Y ryšį.

Apsvarstykite dvimatį atsitiktinį dydį (X, Y), kur yra priklausomi atsitiktiniai dydžiai. Įsivaizduokime vieną iš dydžių kaip kito funkciją. Apsiribokime apytiksliu kiekio pavaizdavimu dydžio X tiesinės funkcijos pavidalu:

kur turi būti nustatyti parametrai. Tai galima padaryti įvairiais būdais: labiausiai paplitęs iš jų yra mažiausių kvadratų metodas. Funkcija g(x) vadinama Y vidutine kvadratine regresija X. Funkcija g(x) vadinama Y vidutine kvadratine regresija X.

kur F yra bendras kvadratinis nuokrypis.

Pasirinkime a ir b taip, kad kvadratinių nuokrypių suma būtų minimali. Norėdami rasti koeficientus a ir b, kuriems esant F pasiekia mažiausią reikšmę, dalines išvestines prilyginsime nuliui:

Raskite a ir b. Atlikę elementarias transformacijas, gauname dviejų tiesinių lygčių sistemą a ir b:

kur yra imties dydis.

Mūsų atveju A = 3888; B = 549; C = 8224; D = 1182; N = 100.

Iš šios tiesinės linijos raskime a ir b. Gauname stacionarų tašką, kur 1,9884; 0,8981.

Todėl lygtis bus tokia:

y = 1,9884x + 0,8981


Ryžiai. 10

Parabolinė regresija

Naudodamiesi stebėjimo duomenimis, raskime kvadratinės šaknies vidurkio (mūsų atveju parabolinės) regresijos kreivinės linijos imties lygtį. Naudokime mažiausių kvadratų metodą, norėdami nustatyti p, q, r.

Apsiribokime reikšmės Y pavaizdavimu reikšmės X parabolinės funkcijos pavidalu:

kur p, q ir r yra parametrai, kuriuos reikia nustatyti. Tai galima padaryti naudojant mažiausių kvadratų metodą.

Parametrus p, q ir r parinksime taip, kad kvadratinių nuokrypių suma būtų minimali. Kadangi kiekvienas nuokrypis priklauso nuo ieškomų parametrų, nuokrypių kvadratų suma yra šių parametrų funkcija F:

Norėdami rasti minimumą, atitinkamas dalines išvestis prilyginsime nuliui:

Raskite p, q ir r. Atlikę elementariąsias transformacijas, gauname trijų tiesinių lygčių sistemą p, q ir r:

Išspręsdami šią sistemą atvirkštinės matricos metodu, gauname: p = -0,0085; q = 2,0761;

Todėl parabolinės regresijos lygtis bus tokia:

y = –0,0085 x 2 + 2,0761 x 0,7462

Sukurkime parabolinės regresijos grafiką. Kad būtų lengviau stebėti, regresijos grafikas bus pavaizduotas sklaidos diagramos fone (žr. 13 pav.).


Ryžiai. 13

Dabar pavaizduokime tiesinės regresijos ir parabolinės regresijos linijas vienoje diagramoje, kad būtų galima vizualiai palyginti (žr. 14 pav.).


Ryžiai. 14

Tiesinė regresija rodoma raudonai, o parabolinė – mėlyna. Diagrama rodo, kad skirtumas šiuo atveju yra didesnis nei lyginant dvi tiesinės regresijos linijas. Reikia toliau tirti, kuri regresija geriau išreiškia ryšį tarp x ir y, t.y. kokio tipo ryšį tarp x ir y.

Kai kuriais atvejais empiriniai statistinės populiacijos duomenys, vizualiai pavaizduoti naudojant koordinačių diagramą, rodo, kad veiksnio padidėjimą lydi greitesnis rezultato augimas. Norėdami teoriškai apibūdinti tokio pobūdžio charakteristikų koreliaciją, galime paimti antros eilės parabolinės regresijos lygtį:

kur , yra parametras, rodantis gautos charakteristikos vidutinę reikšmę, esant visiškos veiksnio įtakos išskyrimui (x=0); – rezultato pokyčio proporcingumo koeficientas, absoliučiai padidėjus kiekvienam jo vienetui būdingam koeficientui; c – efektyviosios charakteristikos augimo pagreičio (lėtėjimo) koeficientas kiekvienam koeficiento vienetui.

Naudodami mažiausiųjų kvadratų metodą kaip pagrindą skaičiuodami parametrus , , c ir sąlyginai pradine reikšme paėmę reitinguotos serijos vidurinę reikšmę, gausime Σх = 0, Σх 3 =0. Šiuo atveju lygčių sistema supaprastinta forma bus tokia:

Iš šių lygčių galime rasti parametrus , , с, kuriuos bendra forma galima užrašyti taip:

(11.20)

(11.22)

Iš to aišku, kad norint nustatyti parametrus , , c reikia apskaičiuoti šias reikšmes: Σ y, Σ xy, Σ x 2, Σ x 2 y, Σ x 4. Šiuo tikslu galite naudoti lentelės išdėstymą. 11.9.

Tarkime, yra duomenų apie bulvių pasėlių dalį visų pasėlių plotų struktūroje ir pasėlių derlių (bendrąjį derlių) 30 žemės ūkio organizacijų. Būtina sukurti ir išspręsti šių rodiklių koreliacijos lygtį.

11.9 lentelė. Pagalbinių lygties rodiklių skaičiavimas

Parabolinė regresija

Prekės Nr. X adresu xy x 2 x 2 m x 4
x 1 1 val x 1 y 1
x 2 2 val x 2 y 2
n x n y n x n y n
Σ Σx Σу Σxy Σх 2 Σx 2 m Σх 4

Grafinis koreliacijos lauko vaizdas parodė, kad tirti rodikliai vienas su kitu empiriškai susiję tiese, artėjančia prie antros eilės parabolės. Todėl reikiamus parametrus , , s apskaičiuosime kaip norimos parabolinės regresijos lygties dalį, naudodamiesi lentelės išdėstymu. 11.10.

11.10 lentelė. Pagalbinių lygties duomenų apskaičiavimas

Parabolinė regresija

Prekės Nr. X, % y, tūkstančiai tonų xy x 2 x 2 m x 4
1,0 5,0 5,0 1,0 5,0 1,0
1,5 7,0 10,5 2,3 15,8 5,0
n 8,0 20,0 160,0 64,0
Σ

Pakeiskime konkrečias reikšmes Σ y = 495, Σ xy = 600, Σ x 2 = 750, Σ x 2 y = 12375, Σ x 4 = 18750, pateiktas lentelėje. 11.10, į formules (11.20), (11.21), (11.22). Mes gauname

Taigi parabolinės regresijos lygtis, išreiškianti bulvių pasėlių dalies pasėlių plotų struktūroje įtaką pasėlių derliui (bendrajam derliui) žemės ūkio organizacijose, turi tokią formą:

(11.23)

Iš 11.23 lygties matyti, kad tam tikros imties populiacijos sąlygomis vidutinį bulvių derlių (bendrąjį derlių) (10 tūkst. c) galima gauti nedarant tiriamo veiksnio - didinant pasėlių struktūroje pasėlių dalį. plotų, t.y. esant šiai sąlygai, kai pasėlių savitojo svorio svyravimai neturės įtakos bulvių pasėlio dydžiui (x = 0). Parametras (proporcingumo koeficientas) b = 0,8 rodo, kad kiekvienas pasėlių dalies padidėjimas procentais vidutiniškai padidina derlių 0,8 tūkst. tonų, o parametras c = 0,1 rodo, kad vienu procentu (kvadratu ) derlius padidėja paspartina vidutiniškai 0,1 tūkst.t bulvių.

Santykį tarp kintamųjų X ir Y galima apibūdinti įvairiai. Visų pirma, bet kokia ryšio forma gali būti išreikšta bendra lygtimi y = f(x), kur y laikomas priklausomu kintamuoju, arba kito – nepriklausomo kintamojo x, vadinamo, funkcija argumentas. Argumento ir funkcijos atitikimas gali būti nurodytas lentele, formule, grafiku ir pan. Funkcijos pokytis, priklausantis nuo vieno ar kelių argumentų pasikeitimų, vadinamas regresija.

Terminas "regresija"(iš lot. regressio – judėjimas atgal) pristatė F. Galtonas, tyręs kiekybinių požymių paveldėjimą. Jis atrado. kad aukštų ir žemo ūgio tėvų palikuonys grįžta (regresuoja) 1/3 link vidutinio šios savybės lygio tam tikroje populiacijoje. Toliau tobulėjant mokslui, šis terminas prarado pažodinę reikšmę ir buvo pradėtas vartoti koreliacijai tarp kintamųjų Y ir X apibūdinti.

Yra daug įvairių formų ir tipų koreliacijų. Tyrėjo užduotis yra kiekvienu konkrečiu atveju nustatyti ryšio formą ir išreikšti ją atitinkama koreliacijos lygtimi, kuri leidžia numatyti galimus vienos charakteristikos Y pokyčius remiantis žinomais kitos X, kuri koreliuoja su pirmąja, pokyčiais. .

Antrosios rūšies parabolės lygtis

Kartais ryšius tarp kintamųjų Y ir X galima išreikšti per parabolės formulę

Kur a,b,c yra nežinomi koeficientai, kuriuos reikia rasti, atsižvelgiant į žinomus Y ir X matavimus

Galite išspręsti naudodami matricos metodą, tačiau jau yra apskaičiuotos formulės, kurias naudosime

N - regresijos eilutės narių skaičius

Y - Y kintamojo reikšmės

X - kintamojo X reikšmės

Jei naudojate šį robotą per XMPP klientą, sintaksė yra tokia

regreso eilutė X;2

Kur 2 – rodo, kad regresija apskaičiuojama kaip netiesinė antros eilės parabolės pavidalu

Na, laikas patikrinti mūsų skaičiavimus.

Taigi yra stalas

X Y
1 18.2
2 20.1
3 23.4
4 24.6
5 25.6
6 25.9
7 23.6
8 22.7
9 19.2


Ar jums patiko straipsnis? Pasidalinkite su draugais!