Gabim i përafrimit të kriterit. Vlerësimi i besueshmërisë statistikore të rezultateve të modelimit të regresionit duke përdorur testin F Fisher

5. Duke përdorur testin F, u vërtetua se ekuacioni i regresionit të çiftëzuar në tërësi është statistikisht i parëndësishëm dhe nuk përshkruan në mënyrë adekuate fenomenin e studiuar të marrëdhënies midis vlerës së pensionit mujor y dhe kostos së jetesës x.

6. Është krijuar një model regresioni linear i shumëfishtë ekonometrik, duke lidhur shumën e të ardhurave neto të një firme të kushtëzuar y me qarkullimin e kapitalit x1 dhe kapitalin e përdorur x2

7. Nga llogaritja e koeficientëve të elasticitetit, tregohet se kur qarkullimi i kapitalit ndryshon me 1%, shuma e të ardhurave neto të shoqërisë ndryshon me 0,0008%, dhe kur kapitali i përdorur ndryshon me 1%, shuma e të ardhurave neto të shoqërisë. ndryshon me 0.56%.

8. Me anë të testit t u vlerësua rëndësia statistikore e koeficientëve të regresionit U konstatua se variabli shpjegues x 1 është statistikisht i parëndësishëm dhe mund të përjashtohet nga ekuacioni i regresionit, ndërsa në të njëjtën kohë ndryshorja shpjeguese x 2 është. statistikisht të rëndësishme.

9. Duke përdorur testin F, u vërtetua se ekuacioni i regresionit të çiftëzuar në tërësi është statistikisht i rëndësishëm dhe përshkruan në mënyrë adekuate fenomenin e studiuar të marrëdhënies midis vlerës së të ardhurave neto të një firme të kushtëzuar y dhe qarkullimit të kapitalit x 1 dhe kapitali i përdorur x 2.

10. Është llogaritur gabimi mesatar i përafrimit të të dhënave statistikore me një ekuacion linear të regresionit të shumëfishtë, i cili arriti në 29.8%. Tregohet për shkak të cilit vëzhgim në bazën e të dhënave statistikore madhësia e këtij gabimi tejkalon vlerën e lejuar.

14. Ndërtimi i një modeli regresioni të çiftuar pa përdorur EXCEL.

Duke përdorur materialin statistikor të dhënë në tabelën 3.5 është e nevojshme që:

2. Vlerësoni afërsinë e lidhjes duke përdorur tregues të korrelacionit dhe përcaktimit.

3. Duke përdorur koeficientin e elasticitetit, përcaktoni shkallën e lidhjes midis karakteristikës së faktorit dhe asaj rezultante.

4. Përcaktoni gabimin mesatar të përafrimit.

5. Vlerësoni besueshmërinë statistikore të modelimit duke përdorur F-testin e Fisher.

Tabela 3.5. Të dhënat fillestare.

Pjesa e të ardhurave në cash që synon rritjen e kursimeve në depozita, kredi, certifikata dhe për blerjen e valutës së huaj, në shumën totale të të ardhurave mesatare për frymë, %

Pagat mesatare mujore të përllogaritura, c.u.

Kaluzhskaya

Kostromskaya

Orlovskaya

Ryazan

Smolenskaya

Për të përcaktuar parametrat e panjohur b 0 , b 1 të ekuacionit të regresionit linear të çiftuar, përdorim sistemin standard të ekuacioneve normale, i cili ka formën

(3.7)

Për të zgjidhur këtë sistem, së pari është e nevojshme të përcaktohen vlerat e Sx 2 dhe Sxy. Këto vlera përcaktohen nga tabela e të dhënave burimore, duke e plotësuar atë me kolonat përkatëse (Tabela 3.6).

Tabela 3.6. Drejt llogaritjes së koeficientëve të regresionit.

Pastaj sistemi (3.7) merr formën

Duke shprehur b 0 nga ekuacioni i parë dhe duke zëvendësuar shprehjen që rezulton në ekuacionin e dytë, marrim:

Duke kryer shumëzimin term pas termi dhe duke hapur kllapat, marrim:

Së fundi, ekuacioni i regresionit linear të çiftuar që lidh vlerën e pjesës së të ardhurave në para të popullsisë që synon rritjen e kursimeve y me pagën mesatare të përllogaritur mujore x ka formën:

Pra, ndërsa ndërtohet ekuacioni i regresionit linear të çiftuar, ne përcaktojmë koeficientin e korrelacionit linear sipas varësisë:

ku janë vlerat e devijimeve standarde të parametrave përkatës.

Për të llogaritur koeficientin e korrelacionit linear nga varësia (3.9), ne kryejmë llogaritjet e ndërmjetme.

Duke zëvendësuar vlerat e parametrave të gjetur në shprehjen (3.9) marrim

.

Vlera e përftuar e koeficientit të korrelacionit linear tregon praninë e një lidhjeje të dobët statistikore të anasjelltë midis pjesës së të ardhurave në para të popullsisë që synon rritjen e kursimeve y dhe shumës së pagave mesatare të përllogaritura mujore x.

Koeficienti i përcaktimit është , që do të thotë se vetëm 9.6% shpjegohet duke regresuar variablin shpjegues x në y. Prandaj, vlera 1 e barabartë me 90.4% karakterizon peshën e variancës së variablit y të shkaktuar nga ndikimi i të gjithë variablave të tjerë shpjegues që nuk janë marrë parasysh në modelin ekonometrik.

Koeficienti i elasticitetit është

Rrjedhimisht, kur paga mesatare mujore e përllogaritur ndryshon me 1%, pjesa e të ardhurave në para të popullsisë që synon rritjen e kursimeve gjithashtu zvogëlohet me 1%, dhe me një rritje të pagave, ka një rënie në pjesën e të ardhurave në para të popullsisë. popullsia synon rritjen e kursimeve. Ky përfundim bie ndesh me sensin e shëndoshë dhe mund të shpjegohet vetëm nga pasaktësia e modelit të krijuar matematikor.

Le të llogarisim gabimin mesatar të përafrimit.

Tabela 3.7. Drejt llogaritjes së gabimit mesatar të përafrimit.

Vlera e përftuar tejkalon (12...15)%, që tregon rëndësinë e devijimit mesatar të të dhënave të llogaritura nga të dhënat aktuale mbi të cilat është ndërtuar modeli ekonometrik.

Besueshmëria e modelimit statistikor do të kryhet në bazë të testit F Fisher. Vlera teorike e kriterit Fisher F calc përcaktohet nga raporti i vlerave të faktorit dhe dispersioneve të mbetura të llogaritura për një shkallë lirie sipas formulës

ku n është numri i vëzhgimeve;

m është numri i variablave shpjegues (për shembullin në shqyrtim m m =1).

Vlera kritike F crit përcaktohet nga tabelat statistikore dhe për një nivel të rëndësisë a = 0.05 është e barabartë me 10.13. Meqenëse F është llogaritur

15. Ndërtimi i një modeli të regresionit të shumëfishtë pa përdorur EXCEL.

Duke përdorur materialin statistikor të dhënë në tabelën 3.8 ju duhet:

1. Ndërtoni një ekuacion linear të regresionit të shumëfishtë dhe shpjegoni kuptimin ekonomik të parametrave të tij.

2. Jepni një vlerësim krahasues të afërsisë së marrëdhënies midis faktorëve dhe atributit që rezulton duke përdorur koeficientët mesatarë (të përgjithshëm) të elasticitetit.

3. Vlerësoni rëndësinë statistikore të koeficientëve të regresionit duke përdorur testin t dhe hipotezën zero për mosrëndësinë e ekuacionit duke përdorur testin F.

4. Vlerësoni cilësinë e ekuacionit duke përcaktuar gabimin mesatar të përafrimit.

Tabela 3.8. Të dhënat fillestare.

Të ardhurat neto, milion dollarë amerikanë

Qarkullimi i kapitalit milion dollarë amerikanë

Kapitali i përdorur, milion dollarë amerikanë

Për të përcaktuar parametrat e panjohur b 0 , b 1 , b 2 të ekuacionit të regresionit të shumëfishtë linear, përdorim sistemin standard të ekuacioneve normale, i cili ka formën

(3.11)

Për të zgjidhur këtë sistem, fillimisht është e nevojshme të përcaktohen vlerat e sasive Sx 1 2, Sx 2 2, Sx 1 y, Sx 2 y, Sx 1 x 2. Këto vlera përcaktohen nga tabela e të dhënave burimore, duke e plotësuar atë me kolonat përkatëse (Tabela 3.9).

Tabela 3.9. Drejt llogaritjes së koeficientëve të regresionit.

Pastaj sistemi (3.11) merr formën

Për të zgjidhur këtë sistem, ne do të përdorim metodën e Gausit, e cila konsiston në eliminimin sekuencial të të panjohurave: pjesëtojeni ekuacionin e parë të sistemit me 10, pastaj shumëzoni ekuacionin që rezulton me 370.6 dhe zbrisni atë nga ekuacioni i dytë i sistemit, pastaj shumëzoni ekuacioni që rezulton me 158.20 dhe e zbres nga ekuacioni i tretë i sistemit. Duke përsëritur algoritmin e specifikuar për ekuacionet e dyta dhe të treta të transformuara të sistemit, marrim:

Þ Þ

Þ .

Pas transformimit kemi:

Pastaj varësia përfundimtare e të ardhurave neto nga qarkullimi i kapitalit dhe kapitali i përdorur në formën e një ekuacioni linear të regresionit të shumëfishtë ka formën:

Nga ekuacioni ekonometrik që rezulton është e qartë se me një rritje të kapitalit të përdorur, të ardhurat neto rriten dhe, anasjelltas, me një rritje të qarkullimit të kapitalit, të ardhurat neto zvogëlohen. Përveç kësaj, sa më i madh të jetë koeficienti i regresionit, aq më i madh është ndikimi i ndryshores shpjeguese në variablin e varur. Në shembullin në shqyrtim, vlera e koeficientit të regresionit është më e madhe se vlera e koeficientit, prandaj, kapitali i përdorur ka një ndikim dukshëm më të madh në të ardhurat neto sesa qarkullimi i kapitalit. Për të përcaktuar sasinë e këtij përfundimi, ne do të përcaktojmë koeficientët e elasticitetit të pjesshëm.

Analiza e rezultateve tregon gjithashtu se kapitali i përdorur ka një ndikim më të madh në të ardhurat neto. Pra, në veçanti, me një rritje të kapitalit të përdorur me 1%, të ardhurat neto rriten me 1.17%. Në të njëjtën kohë, me një rritje të qarkullimit të kapitalit me 1%, të ardhurat neto ulen me 0.5%.

Vlera teorike e kriterit Fisher F kalc.

Vlera e vlerës kritike F crit përcaktohet nga tabelat statistikore dhe për një nivel rëndësie prej a = 0.05 është e barabartë me 4.74. Meqenëse F calc > F crit, hipoteza zero hidhet poshtë dhe ekuacioni i regresionit që rezulton pranohet si i rëndësishëm statistikisht.

Vlerësimi i rëndësisë statistikore të koeficientëve të regresionit dhe kriterit t zbret në krahasimin e vlerës numerike të këtyre koeficientëve me madhësinë e gabimeve të tyre të rastësishme dhe sipas marrëdhënies:

Formula e punës për llogaritjen e vlerës teorike të statistikave t është:

, (3.13)

ku koeficientët e korrelacionit të çiftit dhe koeficienti i korrelacionit të shumëfishtë llogariten nga varësitë:

Atëherë vlerat teorike (të llogaritura) të statistikave t janë përkatësisht të barabarta me:

Meqenëse vlera kritike e statistikave t, e përcaktuar nga tabelat statistikore për nivelin e rëndësisë a = 0,05 e barabartë me t crit = 2,36, është më e madhe në vlerë absolute se = - 1,798, atëherë hipoteza zero nuk hidhet poshtë dhe ndryshorja shpjeguese x 1 është statistikisht i parëndësishëm dhe mund të përjashtohet nga ekuacioni i regresionit. Anasjelltas, për koeficientin e dytë të regresionit > t crit (3.3 > 2.36), dhe variabli shpjegues x 2 është statistikisht i rëndësishëm.

Le të llogarisim gabimin mesatar të përafrimit.

Tabela 3.10. Drejt llogaritjes së gabimit mesatar të përafrimit.

Atëherë gabimi mesatar i përafrimit është

Vlera e fituar nuk e kalon kufirin e lejuar të barabartë me (12…15).

16. Historia e zhvillimit të teorisë së matjes

TI u zhvillua fillimisht si një teori e matjeve psikofizike. Në botimet e pasluftës, psikologu amerikan S.S. Stevens u përqendrua në shkallët e matjes. Në gjysmën e dytë të shekullit të 20-të. Shtrirja e zbatimit të TI po zgjerohet me shpejtësi. Një nga vëllimet e "Enciklopedisë së Shkencave Psikologjike" të botuar në SHBA në vitet '50 quhej "Masjet Psikologjike". Autorët e këtij botimi zgjeruan fushën e TI nga psikofizika në psikologji në përgjithësi. Në artikullin e këtij koleksioni, "Bazat e teorisë së matjes", prezantimi ishte në një nivel matematikor abstrakt, pa iu referuar ndonjë fushe specifike zbatimi. Në të, theksi u vu në "homomorfizmat e sistemeve empirike me marrëdhënie në ato numerike" (nuk ka nevojë të hyjmë në këto terma matematikore këtu), dhe kompleksiteti matematikor i prezantimit u rrit në krahasim me veprat e S.S. Stevens.

Në një nga artikujt e parë vendas për TI (fundi i viteve '60), u vërtetua se pikët e caktuara nga ekspertët gjatë vlerësimit të objekteve të ekzaminimit maten, si rregull, në një shkallë rendore. Punimet që u shfaqën në fillim të viteve '70 çuan në një zgjerim të konsiderueshëm të fushës së përdorimit të TI. Është zbatuar në kualimetrinë pedagogjike (matjen e cilësisë së njohurive të studentëve), në kërkimin e sistemeve, në probleme të ndryshme të teorisë së vlerësimeve të ekspertëve, për grumbullimin e treguesve të cilësisë së produktit, në studimet sociologjike etj.

Si dy probleme kryesore të TI, së bashku me përcaktimin e llojit të shkallës për matjen e të dhënave specifike, u parashtrua një kërkim për algoritme të analizës së të dhënave, rezultati i të cilit nuk ndryshon me asnjë transformim të pranueshëm të shkallës (d.m.th., është i pandryshueshëm në lidhje me Shkallët e zakonshme në gjeografi janë erërat e shkallës Beaufort ("erë e qetë", "erë e lehtë", "erë e moderuar", etj.), shkalla e fuqisë së tërmetit. Natyrisht, nuk mund të thuhet se një tërmet me magnitudë 2 (një llambë që lëkundet nën tavan) është saktësisht 5 herë më i dobët se një tërmet me magnitudë 10 (shkatërrim i plotë i gjithçkaje në sipërfaqen e tokës).

Në mjekësi, shkallët rendore janë shkalla e fazave të hipertensionit (sipas Myasnikov), shkalla e shkallës së dështimit të zemrës (sipas Strazhesko-Vasilenko-Lang), shkalla e ashpërsisë së pamjaftueshmërisë koronare (sipas Fogelson), etj. . Të gjitha këto peshore janë ndërtuar sipas skemës së mëposhtme: nuk zbulohet asnjë sëmundje; faza e parë e sëmundjes; faza e dytë; Faza e tretë... Ndonjëherë dallohen fazat 1a, 16, etj. Çdo stad ka një karakteristikë mjekësore unike për të. Kur përshkruhen grupet e aftësisë së kufizuar, numrat përdoren në rend të kundërt: më i rëndë është grupi i parë i aftësisë së kufizuar, pastaj i dyti, më i lehtë është i treti.

Numrat e shtëpive maten gjithashtu në një shkallë rendore - ato tregojnë se në çfarë rendi ndodhen shtëpitë përgjatë rrugës. Numrat e vëllimit në veprat e mbledhura të një shkrimtari ose numrat e rasteve në një arkiv ndërmarrje zakonisht lidhen me rendin kronologjik të krijimit të tyre.

Gjatë vlerësimit të cilësisë së produkteve dhe shërbimeve, shkallët rendore janë të njohura në të ashtuquajturën kualimetri (përkthimi fjalë për fjalë - matja e cilësisë). Përkatësisht, një njësi prodhimi vlerësohet si e kalueshme ose e papërshtatshme. Për një analizë më të plotë, përdoret një shkallë me tre shkallëzime: ka defekte të rëndësishme - ka vetëm defekte të vogla - nuk ka defekte. Ndonjëherë përdoren katër shkallëzime: ka defekte kritike (duke e bërë të pamundur përdorimin) - ka defekte domethënëse - ka vetëm defekte të vogla - nuk ka defekte. Klasifikimi i produkteve ka një kuptim të ngjashëm - premium, klasë e parë, klasë e dytë,...

Gjatë vlerësimit të ndikimeve mjedisore, vlerësimi i parë, më i përgjithshëm është zakonisht rendor, për shembull: mjedisi natyror është i qëndrueshëm - mjedisi natyror është i shtypur (i degraduar). Shkalla mjedisore-mjekësore është e ngjashme: nuk ka ndikim të theksuar në shëndetin e njeriut - vërehet një ndikim negativ në shëndet.

Shkalla rendore përdoret edhe në fusha të tjera. Në ekonometri, këto janë kryesisht metoda të ndryshme të vlerësimeve të ekspertëve.

Të gjitha shkallët matëse ndahen në dy grupe - shkallët e karakteristikave cilësore dhe shkallët e karakteristikave sasiore. Shkalla rendore dhe shkalla e emërtimit janë shkallët kryesore të atributeve cilësore, kështu që në shumë fusha specifike rezultatet e analizës cilësore mund të konsiderohen si matje në këto shkallë. Shkallët e karakteristikave sasiore janë shkallët e intervaleve, raporteve, diferencave, absolute. Duke përdorur një shkallë intervali, matet madhësia e energjisë potenciale ose koordinata e një pike në një vijë të drejtë. Në këto raste, në shkallë nuk mund të shënohet as origjina natyrore dhe as njësia natyrore e matjes. Studiuesi duhet të vendosë pikën e fillimit dhe të zgjedhë vetë njësinë e matjes. Transformimet e pranueshme në shkallën e intervalit janë transformimet lineare në rritje, d.m.th. funksionet lineare. Shkallët e temperaturës Celsius dhe Fahrenheit janë të lidhura pikërisht nga një varësi e tillë: °C = 5/9 (°F - 32), ku °C është temperatura (në gradë) në shkallën Celsius dhe °F është temperatura në Shkalla Fahrenheit.

Nga shkallët sasiore, më të zakonshmet në shkencë dhe praktikë janë shkallët e raportit. Ata kanë një pikë referimi natyrore - zero, d.m.th. mungesa e sasisë, por asnjë njësi matëse natyrore. Shumica e njësive fizike maten në shkallën e raportit: masa trupore, gjatësia, ngarkesa, si dhe çmimet në ekonomi. Transformimet e pranueshme në shkallën e raportit janë të ngjashme (duke ndryshuar vetëm shkallën). Me fjalë të tjera, transformime lineare në rritje pa një term të lirë, për shembull, konvertimi i çmimeve nga një monedhë në tjetrën me një normë fikse. Supozoni se krahasojmë efikasitetin ekonomik të dy projekteve investuese duke përdorur çmimet në rubla. Projekti i parë le të dalë më i mirë se i dyti. Tani le të kalojmë në monedhën kineze - juan, duke përdorur një normë fikse konvertimi. Natyrisht, projekti i parë duhet të jetë përsëri më fitimprurës se i dyti. Megjithatë, algoritmet e llogaritjes nuk sigurojnë automatikisht që ky kusht të plotësohet dhe është e nevojshme të kontrollohet nëse plotësohet. Rezultatet e një testi të tillë për vlerat mesatare janë përshkruar më poshtë.

Një shkallë ndryshimi ka një njësi matëse natyrore, por nuk ka pikë referimi natyrore. Koha matet në shkallën e diferencave, nëse viti (ose dita - nga mesdita në mesditë) merret si njësi natyrore matëse, dhe në shkallën e intervaleve në rastin e përgjithshëm. Në nivelin aktual të njohurive, është e pamundur të tregohet një pikënisje natyrore. Autorë të ndryshëm llogaritin në mënyra të ndryshme datën e krijimit të botës, si dhe momentin e Lindjes së Krishtit.

Vetëm për shkallën absolute, rezultatet e matjes janë numra në kuptimin e zakonshëm të fjalës, për shembull, numri i njerëzve në një dhomë. Për një shkallë absolute, lejohet vetëm një transformim identiteti.

Në procesin e zhvillimit të fushës përkatëse të njohurive, lloji i shkallës mund të ndryshojë. Pra, në fillim temperatura u mat në një shkallë rendore (më ftohtë - më e ngrohtë). Pastaj - sipas intervalit (shkalla Celsius, Fahrenheit, Reaumur). Më në fund, pas zbulimit të zeros absolute, temperatura mund të konsiderohet e matur në një shkallë raporti (shkalla Kelvin). Duhet të theksohet se ndonjëherë ka mosmarrëveshje midis specialistëve rreth asaj se cilat peshore duhet të përdoren për të marrë në konsideratë disa vlera reale të matura. Me fjalë të tjera, procesi i matjes përfshin gjithashtu përcaktimin e llojit të shkallës (së bashku me arsyetimin për zgjedhjen e një lloji të veçantë të shkallës). Përveç gjashtë llojeve kryesore të peshoreve të listuara, ndonjëherë përdoren peshore të tjera.

17. Algoritme invariante dhe vlera mesatare.

Le të formulojmë kërkesën kryesore për algoritmet e analizës së të dhënave në TI: përfundimet e nxjerra në bazë të të dhënave të matura në një shkallë të një lloji të caktuar nuk duhet të ndryshojnë kur shkalla e matjes së këtyre të dhënave është e lejueshme. Me fjalë të tjera, konkluzionet duhet të jenë të pandryshueshme sipas transformimeve të vlefshme të shkallës.

Kështu, një nga qëllimet kryesore të teorisë së matjes është të luftojë subjektivitetin e studiuesit kur cakton vlera numerike për objektet reale. Kështu, distancat mund të maten në arshins, metra, mikronë, milje, parsekë dhe njësi të tjera matëse. Masa (pesha) - në poods, kilogramë, paund, etj. Çmimet për mallrat dhe shërbimet mund të tregohen në juanë, rubla, tenge, hryvnia, lat, krona, marka, dollarë amerikanë dhe monedha të tjera (në varësi të normave të specifikuara të konvertimit). Le të theksojmë një fakt shumë të rëndësishëm, edhe pse mjaft të dukshëm: zgjedhja e njësive matëse varet nga studiuesi, d.m.th. subjektive. Përfundimet statistikore mund të jenë adekuate me realitetin vetëm kur ato nuk varen nga njësia matëse që preferon studiuesi, kur ato janë të pandryshueshme në lidhje me transformimin e lejuar të shkallës. Nga shumë algoritme për analizën e të dhënave ekonometrike, vetëm disa e plotësojnë këtë kusht. Le ta tregojmë këtë duke krahasuar vlerat mesatare.

Le të jetë X 1, X 2,..., X n një mostër e vëllimit n. Shpesh përdoret mesatarja aritmetike. Përdorimi i mesatares aritmetike është aq i zakonshëm sa fjala e dytë në term shpesh hiqet dhe njerëzit flasin për pagën mesatare, të ardhurat mesatare dhe mesatare të tjera për të dhëna specifike ekonomike, që do të thotë "mesatare" mesataren aritmetike. Kjo traditë mund të çojë në përfundime të gabuara. Le ta tregojmë këtë duke përdorur shembullin e llogaritjes së pagës mesatare (të ardhurat mesatare) të punonjësve të një ndërmarrje hipotetike. Nga 100 punëtorë, vetëm 5 kanë pagë që e tejkalon atë dhe 95 të tjerëve paga është dukshëm më e vogël se mesatarja aritmetike. Arsyeja është e qartë - paga e një personi - drejtorit të përgjithshëm - tejkalon pagën e 95 punëtorëve - punëtorë, inxhinierë dhe punonjës zyrash me kualifikim të ulët dhe shumë të kualifikuar. Situata të kujton atë që përshkruhet në një histori të njohur për një spital në të cilin ndodhen 10 pacientë, 9 prej të cilëve kanë temperaturë 40°C dhe njëri ka vuajtur tashmë, i shtrirë në morg me temperaturë 0°. C. Ndërkohë, temperatura mesatare në spital është 36°C - nuk mund të ishte më mirë!

Kështu, mesatarja aritmetike mund të përdoret vetëm për popullata mjaft homogjene (pa dallime të mëdha në një drejtim ose në një tjetër). Cilat mesatare duhet të përdoren për të përshkruar pagat? Është krejt e natyrshme të përdoret mesatarja - mesatarja aritmetike e punonjësve të 50-të dhe të 51-të, nëse pagat e tyre janë të renditura në mënyrë jo-ulëse. Fillimisht vijnë pagat e 40 punëtorëve me kualifikim të ulët dhe më pas - nga i 41-ti në të 70-tin - pagat e punëtorëve me aftësi të larta. Rrjedhimisht, mesatarja bie në mënyrë specifike mbi to dhe është e barabartë me 200. Për 50 punëtorë, paga nuk i kalon 200, dhe për 50 - të paktën 200, kështu që mediana tregon "qendrën" rreth së cilës pjesa më e madhe e vlerave të studiuara janë të grupuara. Një tjetër vlerë mesatare është modaliteti, vlera më e zakonshme. Në rastin në shqyrtim, këto janë pagat e punëtorëve me kualifikim të ulët, d.m.th. 100. Kështu, për të përshkruar pagën kemi tre vlera mesatare - modalitetin (100 njësi), mesataren (200 njësi) dhe mesataren aritmetike (400 njësi).

Për shpërndarjet e të ardhurave dhe pagave të vëzhguara në jetën reale, i njëjti model është i vërtetë: modaliteti është më i vogël se mesatarja dhe mesatarja është më e vogël se mesatarja aritmetike.

Pse përdoren mesataret në ekonomi? Në mënyrë tipike për të zëvendësuar një koleksion numrash me një numër të vetëm në mënyrë që të krahasohen popullsitë duke përdorur mesataret. Le të jetë, për shembull, Y 1, Y 2,..., Y n një grup vlerësimesh ekspertësh "të dhëna" për një objekt ekspertize (për shembull, një nga opsionet për zhvillimin strategjik të një kompanie), Z 1 , Z 2,..., Z n -e dyta (një version tjetër i këtij zhvillimi). Si krahasohen këto popullsi? Natyrisht, mënyra më e lehtë është me vlera mesatare.

Si për të llogaritur mesataret? Ekzistojnë lloje të ndryshme të mesatareve: mesatarja aritmetike, mediana, modaliteti, mesatarja gjeometrike, mesatare harmonike, mesatare kuadratike. Le të kujtojmë se koncepti i përgjithshëm i vlerës mesatare u prezantua nga një matematikan francez i gjysmës së parë të shekullit të 19-të. Akademiku O. Cauchy. Është si më poshtë: vlera mesatare është çdo funksion Ф(Х 1, Х 2,..., Х n) i tillë që për të gjitha vlerat e mundshme të argumenteve vlera e këtij funksioni të mos jetë më e vogël se minimumi i numrat X 1, Х 2,... , X n , dhe jo më shumë se maksimumi i këtyre numrave. Të gjitha llojet e mesatareve të listuara më sipër janë mesatare Cauchy.

Me një transformim të pranueshëm të shkallës, vlera e mesatares ndryshon dukshëm. Por përfundimet se për cilën popullsi është mesatarja më e madhe dhe për cilën është më pak nuk duhet të ndryshojnë (në përputhje me kërkesën e pandryshueshmërisë së përfundimeve, e pranuar si kërkesë kryesore në TI). Le të formulojmë problemin përkatës matematikor të kërkimit të llojit të vlerave mesatare, rezultati i krahasimit të të cilit është i qëndrueshëm në lidhje me transformimet e shkallës së pranueshme.

Le të jetë Ф(Х 1 Х 2 ,..., Х n) mesatarja Cauchy. Le të jetë mesatarja për popullsinë e parë më pak se mesatarja për popullsinë e dytë: atëherë, sipas TI, për qëndrueshmërinë e rezultatit të krahasimit të mesatareve, është e nevojshme që për çdo transformim të pranueshëm g nga grupi i transformimeve të pranueshme në shkalla përkatëse është e vërtetë që mesatarja e vlerave të transformuara nga popullata e parë është gjithashtu më e vogël se mesatarja e vlerave të transformuara për grupin e dytë. Për më tepër, kushti i formuluar duhet të jetë i vërtetë për çdo dy grupe Y 1, Y 2,...,Y n dhe Z 1, Z 2,..., Z n dhe, kujtoni, çdo transformim të pranueshëm. Ne i quajmë të pranueshme vlerat mesatare që plotësojnë kushtin e formuluar (në shkallën e duhur). Sipas TI, vetëm mesataret e tilla mund të përdoren kur analizohen opinionet e ekspertëve dhe të dhëna të tjera të matura në shkallën në fjalë.

Duke përdorur teorinë matematikore të zhvilluar në vitet 1970, është e mundur të përshkruhet lloji i mesatareve të pranueshme në shkallët bazë. Është e qartë se për të dhënat e matura në një shkallë emrash, vetëm mënyra është e përshtatshme si mesatare.

18. Vlerat mesatare në një shkallë rendore

Le të shqyrtojmë përpunimin e mendimeve të ekspertëve të matur në një shkallë rendore. Deklarata e mëposhtme është e vërtetë.

Teorema1 . Nga të gjitha mesataret e Cauchy, vetëm anëtarët e serisë së variacioneve (statistika rendore) janë mesatare të pranueshme në një shkallë rendore.

Teorema 1 është e vlefshme me kusht që mesatarja Ф(Х 1 Х 2 ,..., Х n) të jetë funksion i vazhdueshëm (mbi bashkësinë e ndryshoreve) dhe simetrik. Kjo e fundit do të thotë se kur argumentet riorganizohen, vlera e funksionit Ф(Х 1 Х 2 ,..., Х n) nuk ndryshon. Kjo gjendje është mjaft e natyrshme, sepse ne gjejmë vlerën mesatare për tërësinë (bashkësinë), dhe jo për sekuencën. Kompleti nuk ndryshon në varësi të renditjes në të cilën i listojmë elementet e tij.

Sipas teoremës 1, në veçanti, mesatarja mund të përdoret si një mesatare për të dhënat e matura në një shkallë rendore (nëse madhësia e kampionit është tek). Nëse vëllimi është i barabartë, duhet të përdoret një nga dy anëtarët qendrorë të serisë së variacionit - siç quhen ndonjëherë, mediana e majtë ose mediana e djathtë. Moda mund të përdoret gjithashtu - është gjithmonë një anëtar i serisë së variacioneve. Por nuk mund të llogarisni kurrë mesataren aritmetike, mesataren gjeometrike, etj.

Teorema e mëposhtme është e vërtetë.

Teorema 2. Le të jenë Y 1, Y 2,...,Y m variabla të rastësishme të pavarura të shpërndara identike me funksionin e shpërndarjes F(x), dhe Z 1, Z 2,..., Zn të jenë variabla të rastësishme të pavarura të shpërndara identike me shpërndarjet e funksionit H(x), dhe mostrat Y 1, Y 2,...,Y m dhe Z 1, Z 2,..., Z n janë të pavarura nga njëri-tjetri dhe MY X > MZ X. Në mënyrë që probabiliteti i një ngjarje të priret në 1 në min(m, n) për çdo funksion të vazhdueshëm g në rritje strikte që plotëson kushtin |g i |>X, është e nevojshme dhe e mjaftueshme që pabarazia F(x) të plotësohet për të gjithë x< Н(х), причем существовало число х 0 , для которого F(x 0)

Shënim. Gjendja me kufirin e sipërm është thjesht intramatematikore në natyrë. Në fakt, funksioni g është një transformim arbitrar i pranueshëm në një shkallë rendore.

Sipas teoremës 2, mesatarja aritmetike mund të përdoret gjithashtu në një shkallë rendore nëse krahasohen mostrat nga dy shpërndarje që plotësojnë pabarazinë e dhënë në teoremë. E thënë thjesht, një nga funksionet e shpërndarjes duhet të jetë gjithmonë mbi tjetrin. Funksionet e shpërndarjes nuk mund të kryqëzohen, ato lejohen vetëm të prekin njëri-tjetrin. Ky kusht plotësohet, për shembull, nëse funksionet e shpërndarjes ndryshojnë vetëm në ndërrim:

F(x) = Н(x + ∆)

për disa ∆.

Kushti i fundit plotësohet nëse dy vlera të një sasie të caktuar maten duke përdorur të njëjtin instrument matës, në të cilin shpërndarja e gabimeve nuk ndryshon kur kalon nga matja e një vlere të sasisë në fjalë në matjen e një tjetre.

Mesatarja sipas Kolmogorov

Një përgjithësim i disa mesatareve të listuara më sipër është mesatarja e Kolmogorov. Për numrat X 1, X 2,..., X n, mesatarja e Kolmogorov llogaritet duke përdorur formulën

G((F(X l) + F(X 2)+...F(X n))/n),

ku F është një funksion rreptësisht monoton (d.m.th. rreptësisht në rritje ose rreptësisht në rënie),

G është funksioni i anasjelltë i F.

Mes mesatareve të Kolmogorovit ka shumë personazhe të njohur. Pra, nëse F(x) = x, atëherë mesatarja e Kolmogorovit është mesatarja aritmetike, nëse F(x) = lnx, atëherë mesatarja gjeometrike, nëse F(x) = 1/x, atëherë mesatarja harmonike, nëse F( x) = x 2, pastaj katrori mesatar, etj. Mesatarja Kolmogorov është një rast i veçantë i mesatares Cauchy. Nga ana tjetër, mesataret e tilla popullore si mesatarja dhe moda nuk mund të përfaqësohen si mesataret e Kolmogorov. Pohimet e mëposhtme janë vërtetuar në monografi.

Teorema3 . Nëse disa kushte intramatematikore të rregullsisë në shkallën e intervalit janë të vlefshme, nga të gjitha mjetet e Kolmogorovit, vetëm mesatarja aritmetike është e pranueshme. Kështu, mesatarja gjeometrike ose rrënja e mesme katrore e temperaturave (në Celsius) ose e distancave janë të pakuptimta. Mesatarja aritmetike duhet të përdoret si mesatare. Ju gjithashtu mund të përdorni mesataren ose modalitetin.

Teorema 4. Nëse disa kushte intramatematikore të rregullsisë në shkallën e raporteve janë të vlefshme, nga të gjitha mesataret e Kolmogorovit, vetëm mesataret e fuqisë me F(x) = x c dhe mesataren gjeometrike janë të pranueshme.

Koment. Mesatarja gjeometrike është kufiri i mesatares së fuqisë për c > 0.

A ka mesatare Kolmogorov që nuk mund të përdoren në shkallën e raportit? Sigurisht që kanë. Për shembull F(x) = e x.

Ngjashëm me vlerat mesatare, mund të studiohen karakteristika të tjera statistikore - tregues të shpërndarjes, lidhjes, distancës, etj. Nuk është e vështirë të tregohet, për shembull, se koeficienti i korrelacionit nuk ndryshon me ndonjë transformim të pranueshëm në një tas me intervale, ashtu si raporti i dispersioneve, dispersioni nuk ndryshon në shkallën e diferencave, koeficienti i variacionit në shkalla e raporteve etj.

Rezultatet e mësipërme për vlerat mesatare përdoren gjerësisht, jo vetëm në ekonomi, menaxhim, teorinë e vlerësimeve të ekspertëve ose sociologji, por edhe në inxhinieri, për shembull, për të analizuar metodat për grumbullimin e sensorëve në sistemet e automatizuara të kontrollit të procesit të furrave të shpërthimit. TI ka një rëndësi të madhe praktike në problemet e standardizimit dhe menaxhimit të cilësisë, veçanërisht në kualimetri, ku janë marrë rezultate teorike interesante. Kështu, për shembull, çdo ndryshim në koeficientët e peshës së treguesve individualë të cilësisë së produktit çon në një ndryshim në renditjen e produkteve sipas treguesit mesatar të ponderuar (kjo teoremë u vërtetua nga Prof. V.V. Podinovsky). Rrjedhimisht, informacioni i shkurtër i mësipërm për TI dhe metodat e tij kombinon, në një farë kuptimi, ekonominë, sociologjinë dhe shkencat inxhinierike dhe është një aparat adekuat për zgjidhjen e problemeve komplekse që më parë nuk ishin të përshtatshme për analiza efektive, për më tepër, hapet rruga për ndërtimin e modeleve realiste dhe zgjidhjen e problemit të parashikimit.

22. Regresioni linear i çiftëzuar

Le t'i drejtohemi tani një studimi më të detajuar të rastit më të thjeshtë të regresionit linear në çift. Regresioni linear përshkruhet nga marrëdhënia më e thjeshtë funksionale në formën e një ekuacioni drejtvizor dhe karakterizohet nga një interpretim transparent i parametrave të modelit (koeficientët e ekuacionit). Ana e djathtë e ekuacionit na lejon të marrim vlerat teorike (të llogaritura) të ndryshores rezultuese (të shpjeguar) bazuar në vlerat e dhëna të regresorit (ndryshores shpjeguese). Këto vlera ndonjëherë quhen edhe të parashikuara (në të njëjtin kuptim), d.m.th. të përftuara nga formula teorike. Megjithatë, kur parashtrohet një hipotezë për natyrën e varësisë, koeficientët e ekuacionit mbeten ende të panjohur. Në përgjithësi, marrja e vlerave të përafërta të këtyre koeficientëve është e mundur duke përdorur metoda të ndryshme.

Por më e rëndësishmja dhe më e përhapura prej tyre është metoda e katrorëve më të vegjël (OLS). Ai bazohet (siç është shpjeguar tashmë) në kërkesën për të minimizuar shumën e devijimeve në katror të vlerave aktuale të karakteristikës që rezulton nga ato të llogaritura (teorike). Në vend të vlerave teorike (për t'i marrë ato), zëvendësoni anët e djathta të ekuacionit të regresionit në shumën e devijimeve në katror, ​​dhe më pas gjeni derivatet e pjesshme të këtij funksioni (shuma e devijimeve në katror të vlerave aktuale të karakteristikës që rezulton nga ato teorike). Këto derivate të pjesshme nuk merren në lidhje me ndryshoret x dhe y, por në lidhje me parametrat a dhe b. Derivatet e pjesshëm vendosen të barabartë me zero dhe, pas transformimeve të thjeshta, por të rënda, fitohet një sistem ekuacionesh normale për përcaktimin e parametrave. Koeficienti për ndryshoren x, d.m.th. b quhet koeficienti i regresionit, ai tregon ndryshimin mesatar të rezultatit me një ndryshim të faktorit me një njësi. Parametri a mund të mos ketë një interpretim ekonomik, veçanërisht nëse shenja e këtij koeficienti është negative.

Regresioni linear në çift përdoret për të studiuar funksionin e konsumit. Koeficienti i regresionit në funksionin e konsumit përdoret për të llogaritur shumëzuesin. Pothuajse gjithmonë, ekuacioni i regresionit plotësohet me një tregues të afërsisë së lidhjes. Për rastin më të thjeshtë të regresionit linear, ky tregues i afërsisë së lidhjes është koeficienti linear i korrelacionit. Por meqenëse koeficienti i korrelacionit linear karakterizon afërsinë e lidhjes midis veçorive në një formë lineare, afërsia e vlerës absolute të koeficientit të korrelacionit linear me zero nuk shërben ende si një tregues i mungesës së një lidhjeje midis veçorive.

Është me një zgjedhje të ndryshme të specifikimeve të modelit dhe, për rrjedhojë, nga lloji i varësisë që marrëdhënia aktuale mund të rezultojë të jetë mjaft afër unitetit. Por cilësia e zgjedhjes së një funksioni linear përcaktohet duke përdorur katrorin e koeficientit të korrelacionit linear - koeficientin e përcaktimit. Ai karakterizon proporcionin e variancës së atributit efektiv y të shpjeguar me regresion në variancën totale të atributit efektiv. Vlera që plotëson koeficientin e përcaktimit me 1 karakterizon pjesën e variancës të shkaktuar nga ndikimi i faktorëve të tjerë që nuk merren parasysh në model (varianca e mbetur).

Regresioni i çiftëzuar përfaqësohet nga një ekuacion që lidh dy variabla y dhe x të formës së mëposhtme:

ku y është ndryshorja e varur (atributi rezultativ), dhe x është variabli i pavarur (ndryshorja shpjeguese, ose faktor-atribut). Ka regresion linear dhe regresion jolinear. Regresioni linear përshkruhet nga një ekuacion i formës:

y = a+ bx + .

Regresioni jolinear, nga ana tjetër, mund të jetë jolinear në lidhje me variablat shpjegues të përfshirë në analizë, por linear në lidhje me parametrat e vlerësuar. Ose ndoshta regresioni është jolinear për sa i përket parametrave që vlerësohen. Shembuj të regresionit që është jolinear në variablat shpjegues, por linear në parametrat e vlerësuar, përfshijnë varësi polinomiale të shkallëve të ndryshme (polinome) dhe një hiperbolë barabrinjës.

Regresioni jolinear për parametrat e vlerësuar është një varësi e fuqisë në lidhje me parametrin (parametri është në eksponent), një varësi eksponenciale, ku parametri është në bazën e eksponentit dhe një varësi eksponenciale, kur e gjithë varësia lineare është tërësisht në eksponent. Vini re se në të tre këto raste, komponenti i rastësishëm (mbetja e rastësishme)  përfshihet në anën e djathtë të ekuacionit si faktor, dhe jo si përmbledhje, d.m.th. në mënyrë shumëzuese! Devijimi mesatar i vlerave të llogaritura të karakteristikës që rezulton nga ato aktuale karakterizohet nga gabimi mesatar i përafrimit. Shprehet në përqindje dhe nuk duhet të kalojë 7-8%. Ky gabim mesatar i përafrimit është thjesht mesatarja e përqindjes së madhësive relative të diferencave midis vlerave aktuale dhe atyre të llogaritura.

Koeficienti mesatar i elasticitetit, i cili shërben si një karakteristikë e rëndësishme e shumë fenomeneve dhe proceseve ekonomike, është i rëndësishëm. Ai llogaritet si produkt i vlerës së derivatit të një marrëdhënieje të caktuar funksionale dhe raporti i vlerës mesatare të x me vlerën mesatare të y. Koeficienti i elasticitetit tregon se me çfarë përqindje mesatarisht do të ndryshojë rezultati y nga vlera mesatare e tij kur faktori x ndryshon me 1% nga vlera mesatare e tij (faktori x).

Problemet e analizës së variancës janë të lidhura ngushtë me regresionin në çift dhe regresionin e shumëfishtë (kur ka shumë faktorë) dhe variancën e mbetur. Analiza e variancës shqyrton variancën e ndryshores së varur. Në këtë rast, shuma totale e devijimeve në katror ndahet në dy pjesë. Termi i parë është shuma e devijimeve në katror për shkak të regresionit, ose të shpjeguara (faktoriale). Termi i dytë është shuma e mbetur e devijimeve në katror të pashpjegueshme nga regresioni i faktorëve.

Pjesa e variancës e shpjeguar me regresion në variancën totale të karakteristikës që rezulton y karakterizohet nga koeficienti (indeksi) i përcaktimit, i cili nuk është asgjë më shumë se raporti i shumës së devijimeve në katror për shkak të regresionit me shumën totale të devijimeve në katror. (termi i parë për të gjithë shumën).

Kur parametrat e modelit (koeficientët e të panjohurave) përcaktohen duke përdorur metodën e katrorëve më të vegjël, atëherë, në thelb, gjenden disa ndryshore të rastësishme (në procesin e marrjes së vlerësimeve). Me rëndësi të veçantë është vlerësimi i koeficientit të regresionit, i cili është një formë e veçantë e një ndryshoreje të rastësishme. Vetitë e kësaj ndryshoreje të rastësishme varen nga vetitë e termit të mbetur në ekuacion (në model). Për modelin e regresionit linear të çiftuar, konsideroni variablin shpjegues x si një ndryshore ekzogjene jo të rastësishme. Kjo thjesht do të thotë që vlerat e ndryshores x në të gjitha vëzhgimet mund të konsiderohen të paracaktuara dhe në asnjë mënyrë të lidhura me varësinë në studim. Kështu, vlera aktuale e ndryshores së shpjeguar përbëhet nga dy komponentë: një komponent jo i rastësishëm dhe një komponent i rastësishëm (termi i mbetur).

Nga ana tjetër, koeficienti i regresionit i përcaktuar duke përdorur metodën e katrorëve më të vegjël (OLS) është i barabartë me herësin e pjesëtimit të kovariancës së variablave x dhe y me variancën e ndryshores x. Prandaj ai përmban edhe një komponent të rastësishëm. Në fund të fundit, kovarianca varet nga vlerat e ndryshores y, ku vlerat e ndryshores y varen nga vlerat e termit të mbetur të rastësishëm . Më tej, është e lehtë të tregohet se kovarianca e variablave x dhe y është e barabartë me produktin e koeficientit të vlerësuar të regresionit beta () dhe variancës së ndryshores x, plus kovariancën e variablave x dhe . Kështu, vlerësimi i koeficientit të regresionit beta është i barabartë me vetë koeficientin e panjohur të regresionit, i shtuar në koeficientin e pjesëtimit të kovariancës së variablave x dhe  me variancën e ndryshores x. ato. vlerësimi i koeficientit të regresionit b i marrë nga çdo mostër paraqitet si shuma e dy termave: një vlerë konstante e barabartë me vlerën e vërtetë të koeficientit  (beta), dhe një komponent i rastësishëm në varësi të kovariancës së variablave x dhe  .

23. Kushtet matematikore Gauss-Markov dhe zbatimi i tyre.

Që analiza e regresionit të bazuar në OLS të zakonshme të prodhojë rezultatet më të mira, termi i rastësishëm duhet të plotësojë katër kushtet e Gauss-Markov.

Pritja matematikore e termit të rastësishëm është e barabartë me zero, d.m.th. është e paanshme. Nëse ekuacioni i regresionit përfshin një term konstant, atëherë është e natyrshme që kjo kërkesë të konsiderohet e përmbushur, pasi ky është një term konstant dhe duhet të marrë parasysh çdo prirje sistematike në vlerat e ndryshores y, e cila, përkundrazi, duhet të të mos përfshihen në variablat shpjegues të ekuacionit të regresionit.

Varianca e termit të rastësishëm është konstante për të gjitha vëzhgimet.

Kovarianca e vlerave të ndryshoreve të rastësishme që formojnë kampionin duhet të jetë e barabartë me zero, d.m.th. nuk ka asnjë lidhje sistematike midis vlerave të termit të rastësishëm në çdo dy vëzhgime të veçanta. Anëtarët e rastësishëm duhet të jenë të pavarur nga njëri-tjetri.

Ligji i shpërndarjes së termit të rastësishëm duhet të jetë i pavarur nga variablat shpjegues.

Për më tepër, në shumë aplikacione ndryshoret shpjeguese nuk janë stokastike, d.m.th. nuk kanë një komponent të rastësishëm. Vlera e çdo variabli të pavarur në çdo vëzhgim duhet të konsiderohet ekzogjene, e përcaktuar tërësisht nga shkaqe të jashtme që nuk merren parasysh në ekuacionin e regresionit.

Së bashku me kushtet e specifikuara të Gauss-Markov, supozohet gjithashtu se termi i rastësishëm ka një shpërndarje normale. Ai është i vlefshëm në kushte shumë të gjera dhe bazohet në të ashtuquajturën teoremë të kufirit qendror (CLT). Thelbi i kësaj teoreme është se nëse një ndryshore e rastësishme është rezultati i përgjithshëm i ndërveprimit të një numri të madh ndryshoresh të tjera të rastësishme, asnjëra prej të cilave nuk ka një ndikim mbizotërues në sjelljen e këtij rezultati të përgjithshëm, atëherë ndryshorja e rastësishme që rezulton do të përshkruhet. me një shpërndarje afërsisht normale. Kjo afërsi me shpërndarjen normale bën të mundur përdorimin e shpërndarjes normale dhe shpërndarjes Studenti, e cila në një farë kuptimi është një përgjithësim i saj, për të marrë vlerësime, të cilat dallojnë dukshëm nga ajo normale kryesisht në të ashtuquajturat “bishta, ” d.m.th. për madhësi të vogla të mostrave. Është gjithashtu e rëndësishme që nëse termi i rastësishëm shpërndahet normalisht, atëherë edhe koeficientët e regresionit do të shpërndahen normalisht.

Kurba e vendosur e regresionit (ekuacioni i regresionit) na lejon të zgjidhim problemin e të ashtuquajturit parashikimi i pikës. Në llogaritje të tilla, një vlerë e caktuar x jashtë intervalit të vëzhgimit të studiuar merret dhe zëvendësohet në anën e djathtë të ekuacionit të regresionit (procedura e ekstrapolimit). Sepse Vlerësimet për koeficientët e regresionit janë tashmë të njohura, atëherë është e mundur të llogaritet vlera e variablit të shpjeguar y që korrespondon me vlerën e marrë të x. Natyrisht, në përputhje me kuptimin e parashikimit (parashikimit), llogaritjet kryhen përpara (në zonën e vlerave të ardhshme).

Megjithatë, duke qenë se koeficientët janë përcaktuar me një gabim të caktuar, ajo që është me interes nuk është vlerësimi i pikës (parashikimi i pikës) për atributin efektiv, por njohja e kufijve brenda të cilëve, me një probabilitet të caktuar, vlerat e atributi efektiv që korrespondon me vlerën e marrë të faktorit x do të qëndrojë.

Për ta bërë këtë, llogaritet gabimi standard (devijimi standard). Mund të merret në frymën e asaj që sapo u tha si më poshtë. Shprehja e termit të lirë a nga vlerësimet përmes vlerave mesatare zëvendësohet në ekuacionin e regresionit linear. Më pas rezulton se gabimi standard varet nga gabimi i faktorit mesatar efektiv y dhe në mënyrë shtesë nga gabimi i koeficientit të regresionit b. Thjesht, katrori i këtij gabimi standard është i barabartë me shumën e gabimit në katror të vlerës mesatare y dhe produktin e gabimit në katror të koeficientit të regresionit me devijimin në katror të faktorit x dhe mesatares së tij. Më tej, termi i parë, sipas ligjeve të statistikave, është i barabartë me koeficientin e pjesëtimit të variancës së popullatës së përgjithshme me madhësinë (vëllimin) e kampionit.

Në vend të variancës së panjohur, varianca e mostrës përdoret si vlerësim. Prandaj, gabimi i koeficientit të regresionit përcaktohet si koeficienti i pjesëtimit të variancës së mostrës me variancën e faktorit x. Ju mund të merrni gabimin standard (devijimi standard) dhe konsiderata të tjera që janë më të pavarura nga modeli i regresionit linear. Për ta bërë këtë, përdoret koncepti i gabimit mesatar dhe gabimit margjinal dhe lidhja ndërmjet tyre.

Por edhe pas marrjes së gabimit standard, pyetja mbetet për kufijtë brenda të cilëve do të qëndrojë vlera e parashikuar. Me fjalë të tjera, për intervalin e gabimit të matjes, në supozimin natyror në shumë raste, mesi i këtij intervali jepet nga vlera e llogaritur (mesatare) e faktorit efektiv y. Këtu vjen në ndihmë teorema e kufirit qendror, e cila tregon saktësisht se me çfarë probabiliteti është madhësia e panjohur brenda këtij intervali besimi.

Në thelb, formula standarde e gabimit, pavarësisht se si dhe në çfarë forme është marrë, karakterizon gabimin në pozicionin e vijës së regresionit. Gabimi standard arrin një minimum kur vlera e faktorit x përkon me vlerën mesatare të faktorit.

24. Testimi statistikor i hipotezave dhe vlerësimi i rëndësisë së regresionit linear duke përdorur kriterin Fisher.

Pasi të jetë gjetur ekuacioni i regresionit linear, vlerësohet rëndësia e ekuacionit në tërësi dhe e parametrave të tij individualë. Vlerësimi i rëndësisë së një ekuacioni regresioni në tërësi mund të bëhet duke përdorur kritere të ndryshme. Mjaft e zakonshme dhe efektive është përdorimi i testit Fisher's F. Në këtë rast, parashtrohet hipoteza zero se koeficienti i regresionit është i barabartë me zero, d.m.th. b=0, prandaj faktori x nuk ka asnjë ndikim në rezultatin y. Llogaritjes së menjëhershme të F-testit i paraprin analiza e variancës. Vendin qendror në të e zë zbërthimi i shumës totale të devijimeve në katror të ndryshores y nga vlera mesatare y në dy pjesë - "e shpjeguar" dhe "e pashpjegueshme":

Shuma totale e devijimeve në katror të vlerave individuale të karakteristikës rezultuese y nga vlera mesatare y shkaktohet nga ndikimi i shumë faktorëve.

Le ta ndajmë me kusht të gjithë grupin e arsyeve në dy grupe: faktori i studiuar x dhe faktorë të tjerë. Nëse faktori nuk ndikon në rezultat, atëherë vija e regresionit në grafik është paralele me boshtin OX dhe y=y. Atëherë e gjithë varianca e karakteristikës që rezulton është për shkak të ndikimit të faktorëve të tjerë dhe shuma totale e devijimeve në katror do të përkojë me mbetjen. Nëse faktorët e tjerë nuk ndikojnë në rezultat, atëherë y lidhet funksionalisht me x dhe shuma e mbetur e katrorëve është zero. Në këtë rast, shuma e devijimeve në katror të shpjeguara nga regresioni është e njëjtë me shumën totale të katrorëve. Meqenëse jo të gjitha pikat e fushës së korrelacionit shtrihen në vijën e regresionit, shpërndarja e tyre ndodh gjithmonë siç shkaktohet nga ndikimi i faktorit x, d.m.th. regresioni i y mbi x, dhe i shkaktuar nga shkaqe të tjera (ndryshim i pashpjegueshëm). Përshtatshmëria e një linje regresioni për parashikim varet nga sa nga variacioni total në tiparin y llogaritet nga variacioni i shpjeguar.

Natyrisht, nëse shuma e devijimeve në katror për shkak të regresionit është më e madhe se shuma e mbetur e katrorëve, atëherë ekuacioni i regresionit është statistikisht i rëndësishëm dhe faktori x ka një ndikim të rëndësishëm në rezultat. Kjo është e barabartë me faktin se koeficienti i përcaktimit do t'i afrohet unitetit. Çdo shumë e devijimeve në katror lidhet me numrin e shkallëve të lirisë, d.m.th. numri i lirisë së ndryshimit të pavarur të një karakteristike. Numri i shkallëve të lirisë lidhet me numrin e njësive të popullsisë ose me numrin e konstantave të përcaktuara prej tij. Në lidhje me problemin në studim, numri i shkallëve të lirisë duhet të tregojë sa devijime të pavarura nga n e mundshme [(y 1 -y), (y 2 -y),...(y n -y)] kërkohen për të formuar një shumë të caktuar katrorësh. Kështu, për shumën totale të katrorëve ∑(y-y sr) 2, (n-1) kërkohen devijime të pavarura, sepse në një popullsi prej n njësive, pas llogaritjes së nivelit mesatar, vetëm (n-1) numri i devijimeve ndryshon lirshëm. Gjatë llogaritjes së shumës së shpjeguar ose faktorit të katrorëve ∑(y-y mesatar) 2, përdoren vlerat teorike (të llogaritura) të karakteristikës rezultante y*, të gjetura përgjatë vijës së regresionit: y(x)=a+bx.

Le të kthehemi tani te zgjerimi i shumës totale të devijimeve në katror të faktorit efektiv nga mesatarja e kësaj vlere. Kjo shumë përmban dy pjesë të përcaktuara më sipër: shumën e devijimeve në katror të shpjeguara me regresion dhe një shumë tjetër të quajtur shuma e mbetur e devijimeve në katror. Me këtë zbërthim është e lidhur analiza e variancës, e cila i përgjigjet drejtpërdrejt pyetjes themelore: si të vlerësohet rëndësia e ekuacionit të regresionit në tërësi dhe parametrave të tij individualë? Ajo gjithashtu përcakton në masë të madhe kuptimin e kësaj pyetjeje. Për të vlerësuar rëndësinë e ekuacionit të regresionit në tërësi, përdoret kriteri Fisher (F-test). Sipas qasjes së propozuar nga Fisher, parashtrohet një hipotezë zero: koeficienti i regresionit është i barabartë me zero, d.m.th. vlerab=0. Kjo do të thotë që faktori X nuk ka asnjë efekt në rezultatin Y.

Le të kujtojmë se pothuajse gjithmonë pikët e marra si rezultat i një studimi statistikor nuk qëndrojnë saktësisht në vijën e regresionit. Ato janë të shpërndara, duke qenë pak a shumë larg vijës së regresionit. Një shpërndarje e tillë është për shkak të ndikimit të faktorëve të tjerë, të ndryshëm nga faktori shpjegues X, që nuk merren parasysh në ekuacionin e regresionit. Gjatë llogaritjes së shumës së shpjeguar ose faktorit të devijimeve në katror, ​​përdoren vlerat teorike të karakteristikës rezultuese të gjetur nga vija e regresionit.

Për një grup të caktuar vlerash të variablave Y dhe X, vlera e llogaritur e vlerës mesatare Y është në regresion linear një funksion i vetëm një parametri - koeficienti i regresionit. Në përputhje me këtë, shuma faktoriale e devijimeve në katror ka një numër shkallësh lirie të barabartë me 1. Dhe numri i shkallëve të lirisë së shumës së mbetur të devijimeve në katror në regresionin linear është n-2.

Rrjedhimisht, duke pjesëtuar çdo shumë të devijimeve në katror në zgjerimin fillestar me numrin e shkallëve të lirisë, marrim devijimet mesatare në katror (varianca për një shkallë lirie). Më pas, duke e ndarë variancën e faktorit me një shkallë lirie me variancën e mbetur me një shkallë lirie, marrim një kriter për testimin e hipotezës zero, të ashtuquajturin raport F ose kriterin me të njëjtin emër. Domethënë, nëse hipoteza zero është e vërtetë, variancat e faktorit dhe ato të mbetura janë thjesht të barabarta me njëri-tjetrin.

Për të hedhur poshtë hipotezën zero, d.m.th. duke pranuar hipotezën e kundërt, e cila shpreh faktin e rëndësisë (prezencës) të marrëdhënies në studim, dhe jo thjesht një rastësie të rastësishme të faktorëve që simulojnë një marrëdhënie që në të vërtetë nuk ekziston, është e nevojshme të përdoren tabelat e vlerave kritike të marrëdhënien e specifikuar. Duke përdorur tabelat, përcaktohet vlera kritike (pragu) e kriterit Fisher. Ajo quhet edhe teorike. Pastaj ata kontrollojnë, duke e krahasuar atë me vlerën përkatëse empirike (aktuale) të kriterit të llogaritur nga të dhënat e vëzhgimit, nëse vlera aktuale e raportit e kalon vlerën kritike nga tabelat.

Kjo është bërë në mënyrë më të detajuar si kjo. Zgjidhni një nivel të caktuar të probabilitetit të pranisë së hipotezës zero dhe gjeni nga tabelat vlerën kritike të kriterit F, në të cilin mund të ndodhë ende një divergjencë e rastësishme e variancave me 1 shkallë lirie, d.m.th. vlera maksimale e tillë. Atëherë vlera e llogaritur e raportit F konsiderohet e besueshme (d.m.th., duke shprehur diferencën midis variancave aktuale dhe atyre të mbetura) nëse ky raport është më i madh se ai i paraqitur në tabelë. Pastaj hidhet poshtë hipoteza zero (nuk është e vërtetë që nuk ka shenja lidhjeje) dhe, përkundrazi, arrijmë në përfundimin se ka një lidhje dhe është domethënëse (është jo e rastësishme, domethënëse).

Nëse vlera e marrëdhënies rezulton të jetë më e vogël se ajo e tabelës, atëherë probabiliteti i hipotezës zero rezulton të jetë më i lartë se niveli i specifikuar (i cili u zgjodh fillimisht) dhe hipoteza zero nuk mund të refuzohet pa një rrezik të dukshëm të marrja e një përfundimi të gabuar për praninë e një marrëdhënieje. Prandaj, ekuacioni i regresionit konsiderohet i parëndësishëm.

Vlera e vetë kriterit F është e lidhur me koeficientin e përcaktimit. Përveç vlerësimit të rëndësisë së ekuacionit të regresionit në tërësi, vlerësohet edhe rëndësia e parametrave individualë të ekuacionit të regresionit. Në këtë rast, gabimi standard i koeficientit të regresionit përcaktohet duke përdorur devijimin standard empirik aktual dhe variancën empirike për shkallë lirie. Shpërndarja Studenti përdoret më pas për të testuar rëndësinë e koeficientit të regresionit për të llogaritur intervalet e tij të besueshmërisë.

Vlerësimi i rëndësisë së koeficientëve të regresionit dhe korrelacionit duke përdorur T-testin Student kryhet duke krahasuar vlerat e këtyre madhësive dhe gabimin standard. Madhësia e gabimit të parametrave të regresionit linear dhe koeficienti i korrelacionit përcaktohet nga formulat e mëposhtme:

ku S është rrënja mesatare katrore e devijimit të mbetur të mostrës,

r xy – koeficienti i korrelacionit.

Prandaj, vlera e gabimit standard të parashikuar nga linja e regresionit jepet me formulën:

Raportet përkatëse të vlerave të koeficientëve të regresionit dhe korrelacionit me gabimin e tyre standard formojnë të ashtuquajturat statistika t, dhe një krahasim i vlerës përkatëse të tabeluar (kritike) dhe vlerës së saj aktuale lejon që dikush të pranojë ose refuzojë nullin. hipoteza. Por më pas, për të llogaritur intervalin e besueshmërisë, gabimi maksimal për çdo tregues gjendet si produkt i vlerës tabelare të statistikës t me gabimin mesatar të rastësishëm të treguesit përkatës. Në fakt, ne në fakt e shkruam atë pak më ndryshe pikërisht më lart. Pastaj përftohen kufijtë e intervaleve të besimit: kufiri i poshtëm është duke zbritur gabimin margjinal përkatës nga koeficientët përkatës (në fakt mesatarja), dhe kufiri i sipërm është me mbledhje (shtim).

Në regresionin linear ∑(y x -y mesatar) 2 =b 2 ∑(x-x mesatare) 2. Kjo është e lehtë për tu verifikuar duke iu referuar formulës për koeficientin e korrelacionit linear: r 2 xy = b 2 *σ 2 x /σ 2 y

ku σ 2 y është varianca totale e tiparit y;

σ 2 x - dispersioni i karakteristikës y për shkak të faktorit x. Prandaj, shuma e devijimeve në katror për shkak të regresionit linear do të jetë:

∑(y x -y mesatare) 2 =b 2 ∑(x-x mesatare) 2 .

Meqenëse, për një vëllim të caktuar vëzhgimesh në x dhe y, shuma faktoriale e katrorëve në regresionin linear varet nga vetëm një konstante e koeficientit të regresionit b, atëherë kjo shumë katrorësh ka një shkallë lirie. Le të shqyrtojmë anën e përmbajtjes së vlerës së llogaritur të atributit y d.m.th. y x. Vlera y x përcaktohet nga ekuacioni i regresionit linear: y x ​​= a + bx.

Parametri a mund të përkufizohet si a=y-bx. Duke zëvendësuar shprehjen për parametrin a në modelin linear, marrim: y x ​​= y-bx+bx avg =y-b(x-x avg).

Për një grup të caktuar variablash y dhe x, vlera e llogaritur e y x është në regresionin linear një funksion i vetëm një parametri - koeficienti i regresionit. Prandaj, shuma faktoriale e devijimeve në katror ka një numër shkallësh lirie të barabartë me 1.

Ekziston barazi midis numrit të shkallëve të lirisë së shumave totale, faktorit dhe mbetjeve të katrorëve. Numri i shkallëve të lirisë së shumës së mbetur të katrorëve në regresionin linear është (n-2). Numri i shkallëve të lirisë për shumën totale të katrorëve përcaktohet nga numri i njësheve, dhe meqenëse përdorim mesataren e llogaritur nga të dhënat e mostrës, humbasim një shkallë lirie, d.m.th. (n-1). Pra, kemi dy barazi: për shumat dhe për numrin e shkallëve të lirisë. Dhe kjo, nga ana tjetër, na kthen te variancat e krahasueshme për shkallë lirie, raporti i të cilave jep kriterin Fisher.

25. Vlerësimi i rëndësisë së parametrave individualë të ekuacionit të regresionit dhe koeficientëve duke përdorur testin e Studentit.

27. Regresioni linear dhe jolinear dhe metodat e studimit të tyre.

Regresioni linear dhe metodat e kërkimit dhe vlerësimit të tij nuk do të ishin aq të rëndësishme nëse, përveç këtij rasti shumë të rëndësishëm, por gjithsesi më të thjeshtë, nuk do të merrnim me ndihmën e tyre një mjet për analizimin e varësive jolineare më komplekse. Regresionet jolineare mund të ndahen në dy klasa dukshëm të ndryshme. E para dhe më e thjeshta është klasa e varësive jolineare në të cilat ka jolinearitet në lidhje me variablat shpjegues, por që mbeten lineare në parametrat e përfshirë në to dhe i nënshtrohen vlerësimit. Kjo përfshin polinome të shkallëve të ndryshme dhe një hiperbolë barabrinjës.

Një regresion i tillë jolinear për variablat e përfshirë në shpjegim duke transformuar (zëvendësuar) thjesht variablat mund të reduktohet lehtësisht në regresion të zakonshëm linear për variablat e rinj. Prandaj, vlerësimi i parametrave në këtë rast kryhet thjesht nga katrorët më të vegjël, pasi varësitë janë lineare në parametra. Kështu, një rol të rëndësishëm në ekonomi luhet nga varësia jolineare e përshkruar nga një hiperbolë barabrinjës:

Parametrat e tij vlerësohen mirë duke përdorur metodën e katrorëve më të vegjël, dhe vetë kjo varësi karakterizon lidhjen midis kostove specifike të lëndëve të para, karburantit, materialeve me vëllimin e prodhimit, kohën e qarkullimit të mallrave dhe të gjithë këta faktorë me sasinë e tregtisë. qarkullim. Për shembull, kurba e Phillips karakterizon marrëdhënien jolineare midis shkallës së papunësisë dhe përqindjes së rritjes së pagave.

Situata është krejtësisht e ndryshme me regresionin që është jolinear në parametrat që vlerësohen, për shembull, i përfaqësuar nga një funksion fuqie, në të cilin vetë shkalla (eksponenti i saj) është një parametër, ose varet nga parametri. Mund të jetë gjithashtu një funksion eksponencial, ku baza e shkallës është një parametër, dhe një funksion eksponencial, në të cilin treguesi përsëri përmban një parametër ose një kombinim parametrash. Kjo klasë, nga ana tjetër, ndahet në dy nënklasa: njëra përfshin nga jashtë jolineare, por në thelb nga brenda lineare. Në këtë rast, ju mund ta sillni modelin në një formë lineare duke përdorur transformime. Megjithatë, nëse modeli është nga brenda jolinear, atëherë ai nuk mund të reduktohet në një funksion linear.

Kështu, vetëm modelet që janë në thelb jolineare në analizën e regresionit konsiderohen vërtet jolineare. Të gjitha të tjerat, të cilat mund të reduktohen në lineare nëpërmjet transformimeve, nuk konsiderohen si të tilla dhe janë ata që konsiderohen më shpesh në studimet ekonometrike. Në të njëjtën kohë, kjo nuk do të thotë se është e pamundur të studiohen varësitë në thelb jolineare në ekonometri. Nëse modeli është nga brenda jolinear në parametrat e tij, atëherë për vlerësimin e parametrave përdoren procedura përsëritëse, suksesi i të cilave varet nga lloji i ekuacionit për veçoritë e metodës iterative të përdorur.

Le të kthehemi te varësitë e reduktuara në lineare. Nëse ato janë jolineare si në parametra ashtu edhe në ndryshore, për shembull, të formës y = a shumëzuar me fuqinë e X, eksponenti i të cilit është parametri -  (beta):

Natyrisht, një marrëdhënie e tillë mund të shndërrohet lehtësisht në një ekuacion linear me logaritëm të thjeshtë.

Pas futjes së ndryshoreve të reja që tregojnë logaritme, fitohet një ekuacion linear. Procedura e vlerësimit të regresionit konsiston më pas në llogaritjen e variablave të reja për çdo vëzhgim duke marrë logaritme të vlerave origjinale. Më pas vlerësohet varësia e regresionit të variablave të rinj. Për të shkuar te variablat origjinale, duhet të merrni antilogaritmin, domethënë, në të vërtetë të ktheheni te vetë fuqitë në vend të eksponentëve të tyre (në fund të fundit, logaritmi është eksponenti). Rasti i funksioneve eksponenciale ose eksponenciale mund të konsiderohet në mënyrë të ngjashme.

Për një regresion dukshëm jolinear, nuk është e mundur të zbatohet procedura e zakonshme e vlerësimit të regresionit sepse marrëdhënia përkatëse nuk mund të konvertohet në lineare. Skema e përgjithshme e veprimeve është si më poshtë:

1. Pranohen disa vlera të besueshme të parametrave fillestarë;

2. Vlerat e parashikuara Y janë llogaritur nga vlerat aktuale X duke përdorur këto vlera parametrash;

3. Llogariten mbetjet për të gjitha vëzhgimet në kampion dhe më pas shuma e katrorëve të mbetjeve;

4. Bëhen ndryshime të vogla në një ose më shumë vlerësime të parametrave;

5. Llogariten vlerat e reja të parashikuara të Y, mbetjet dhe shuma e katrorëve të mbetjeve;

6. Nëse shuma e katrorëve të mbetjeve është më e vogël se më parë, atëherë vlerësimet e reja të parametrave janë më të mira se ato të mëparshme dhe duhet të përdoren si pikënisje e re;

7. Hapat 4, 5 dhe 6 përsëriten përsëri derisa të bëhet e pamundur të bëhen ndryshime të tilla në vlerësimet e parametrave që do të çonin në një ndryshim në shumën e mbetjeve të katrorëve;

8. Është konkluduar se shuma e mbetjeve në katror është minimizuar dhe vlerësimet përfundimtare të parametrave janë vlerësime të katrorëve më të vegjël.

Ndër funksionet jolineare që mund të reduktohen në formë lineare, funksioni i fuqisë përdoret gjerësisht në ekonometri. Parametri b në të ka një interpretim të qartë, duke qenë një koeficient elasticiteti. Në modelet që janë jolineare në parametrat e vlerësuar, por mund të reduktohen në formë lineare, metoda e katrorëve më të vegjël zbatohet në ekuacionet e transformuara. Përdorimi praktik i logaritmeve dhe, në përputhje me rrethanat, eksponentëve është i mundur kur shenja që rezulton nuk ka vlera negative. Kur studiohen marrëdhëniet midis funksioneve duke përdorur logaritmin e atributit rezultant, varësitë e ligjit të fuqisë mbizotërojnë në ekonometri (lakbat e kërkesës dhe ofertës, funksionet e prodhimit, kurbat e përthithjes për të karakterizuar marrëdhënien midis intensitetit të punës së produkteve, shkallës së prodhimit, varësisë i GNI në nivelin e punësimit, kurbat Engel).

28. Modeli invers dhe përdorimi i tij

Ndonjëherë përdoret i ashtuquajturi model invers, i cili nga brenda është jolinear, por në të, ndryshe nga një hiperbolë barabrinjës, nuk është ndryshorja shpjeguese që i nënshtrohet transformimit, por atributi që rezulton Y. Prandaj, modeli i anasjelltë rezulton të të jetë nga brenda jolineare dhe kërkesa OLS nuk plotësohet për vlerat aktuale të atributit rezultues Y dhe për vlerat e tyre të kundërta. Studimi i korrelacionit për regresionin jolinear meriton vëmendje të veçantë. Në rastin e përgjithshëm, një parabolë e shkallës së dytë, si polinomet e rendit më të lartë, kur linearizohet merr formën e një ekuacioni të regresionit të shumëfishtë. Nëse, kur është linearizuar, një ekuacion i regresionit që është jolinear në lidhje me variablin e shpjeguar merr formën e një ekuacioni të regresionit të çiftëzuar linear, atëherë një koeficient linear korrelacioni mund të përdoret për të vlerësuar afërsinë e marrëdhënies.

Nëse shndërrimet e ekuacionit të regresionit në formë lineare shoqërohen me variablin e varur (karakteristikë rezultuese), atëherë koeficienti i korrelacionit linear bazuar në vlerat e transformuara të karakteristikave jep vetëm një vlerësim të përafërt të marrëdhënies dhe nuk përkon numerikisht me indeksi i korrelacionit. Duhet të kihet parasysh se gjatë llogaritjes së indeksit të korrelacionit, përdoren shumat e devijimeve në katror të karakteristikës që rezulton Y, dhe jo logaritmet e tyre. Vlerësimi i rëndësisë së indeksit të korrelacionit kryhet në të njëjtën mënyrë si vlerësimi i besueshmërisë (rëndësisë) së koeficientit të korrelacionit. Vetë indeksi i korrelacionit, si indeksi i përcaktimit, përdoret për të testuar rëndësinë e përgjithshme të ekuacionit të regresionit jolinear duke përdorur testin Fisher F.

Vini re se mundësia e ndërtimit të modeleve jolineare, si duke i reduktuar ato në një formë lineare, ashtu edhe duke përdorur regresionin jolinear, nga njëra anë, rrit universalitetin e analizës së regresionit. Nga ana tjetër, komplikon ndjeshëm detyrat e studiuesit. Nëse e kufizojmë veten në analizën e regresionit të çiftuar, ne mund t'i vizatojmë vëzhgimet Y dhe X si një grafik shpërndarjeje. Shpesh disa funksione të ndryshme jolineare përafrojnë vëzhgimet nëse ato shtrihen në ndonjë kurbë. Por në rastin e analizës së regresionit të shumëfishtë, një grafik i tillë nuk mund të ndërtohet.

Kur shqyrtohen modele alternative me të njëjtin përkufizim të variablës së varur, procedura e përzgjedhjes është relativisht e thjeshtë. Mund të vlerësohet një regresion bazuar në të gjitha funksionet e besueshme që mund të imagjinohen dhe të zgjidhet funksioni që shpjegon më mirë ndryshimin në variablin e varur. Është e qartë se kur një funksion linear shpjegon afërsisht 64% të variancës në y, dhe një funksion hiperbolik shpjegon 99.9%, kjo e fundit duhet të zgjidhet padyshim. Por kur modele të ndryshme përdorin forma të ndryshme funksionale, problemi i përzgjedhjes së modelit bëhet dukshëm më i ndërlikuar.

29. Përdorimi i testit Box-Cox.

Në përgjithësi, kur shqyrtohen modele alternative me të njëjtin përkufizim të ndryshores së varur, zgjedhja është e thjeshtë. Është më e arsyeshme të vlerësohet regresioni bazuar në të gjitha funksionet e besueshme, duke u fokusuar në funksionin që shpjegon më shumë ndryshimin në variablin e varur. Nëse koeficienti i përcaktimit mat, në një rast, proporcioni i variancës të shpjeguar me regresion, dhe në tjetrin, proporcioni i variancës në logaritmin e kësaj ndryshoreje të varur shpjeguar me regresion, atëherë zgjedhja bëhet pa vështirësi. Është një çështje tjetër kur këto vlera për dy modele janë shumë afër dhe problemi i zgjedhjes bëhet dukshëm më i ndërlikuar.

Më pas duhet të zbatohet procedura standarde në formën e testit Box-Cox. Nëse thjesht duhet të krahasoni modelet duke përdorur faktorin efektiv dhe logaritmin e tij në formën e një varianti të ndryshores së varur, atëherë përdoret një version i testit Zarembka. Ai propozon një transformim të shkallës së vëzhgimit Y, e cila lejon krahasimin e drejtpërdrejtë të gabimit mesatar katror të rrënjës (MSE) në modelet lineare dhe logaritmike. Procedura përkatëse përfshin hapat e mëposhtëm:

    Është llogaritur mesatarja gjeometrike e vlerave Y në mostër, e cila përkon me eksponentin e mesatares aritmetike të logaritmit të Y;

    Vëzhgimet Y janë rillogaritur në atë mënyrë që ato të ndahen me vlerën e marrë në hapin e parë;

    Regresioni vlerësohet për një model linear duke përdorur vlerat e shkallëzuara Y në vend të vlerave origjinale Y, dhe për një model logaritmik duke përdorur logaritmin e vlerave të shkallëzuara Y. Vlerat RMSE për dy regresionet tani janë të krahasueshme modeli me shumën më të vogël të devijimeve në katror ofron një përshtatje më të mirë me marrëdhënien e vërtetë të vlerave të vëzhguara;

    Për të kontrolluar që njëri prej modeleve nuk ofron një përshtatje dukshëm më të mirë, mund të përdorni produktin e gjysmës së numrit të vëzhgimeve dhe logaritmin e raportit të vlerave të devijimit standard në regresionet e rillogaritura, dhe më pas të merrni vlerë absolute e kësaj vlere.

30. Konceptet e ndërlidhjes dhe shumëkolinearitetit të faktorëve.

34. Bazat e MNC-së dhe vlefshmëria e zbatimit të saj.

Le të kthehemi tani tek bazat e OLS, vlefshmëria e zbatimit të tij (duke përfshirë problemet e shumëfishta të regresionit) dhe vetitë më të rëndësishme të vlerësimeve të marra duke përdorur OLS. Le të fillojmë me faktin se, së bashku me varësinë analitike në anën e djathtë të ekuacionit të regresionit, një rol të rëndësishëm luan edhe termi i rastësishëm. Ky komponent i rastësishëm është një sasi e pavëzhgueshme. Vetë testet statistikore të parametrave të regresionit dhe treguesve të korrelacionit bazohen në supozime të patestueshme në lidhje me shpërndarjen e këtij komponenti të rastësishëm të regresionit të shumëfishtë. Këto supozime janë vetëm paraprake. Vetëm pas ndërtimit të ekuacionit të regresionit kontrollohet nëse vlerësimet e mbetjeve të rastësishme (analoge empirike të komponentit të rastit) kanë veti të supozuara a priori. Në thelb, kur vlerësohen parametrat e modelit, llogariten ndryshimet midis vlerave teorike dhe aktuale të atributit që rezulton në mënyrë që të vlerësohet vetë komponenti i rastësishëm. Është e rëndësishme të kihet parasysh se ky është vetëm një shembull i zbatimit të mbetjes së panjohur të një ekuacioni të caktuar.

Koeficientët e regresionit të marrë nga një sistem ekuacionesh normale janë vlerësime mostër të fuqisë së marrëdhënies. Është e qartë se ato kanë rëndësi praktike vetëm kur janë të paanshme. Kujtoni se në këtë rast mesatarja e mbetjeve është e barabartë me zero, ose, çfarë është e njëjtë, mesatarja e vlerësimit është e barabartë me vetë parametrin e vlerësuar. Atëherë mbetjet nuk do të grumbullohen mbi një numër të madh vlerësimesh të mostrës dhe vetë parametri i regresionit të gjetur mund të konsiderohet si mesatarja e një numri të madh vlerësimesh të paanshme.

Përveç kësaj, vlerësimet duhet të kenë variancën më të vogël, d.m.th. të jetë efektiv dhe më pas bëhet e mundur kalimi nga vlerësimet e pikës praktikisht të papërshtatshme në vlerësimin e intervalit. Së fundi, intervalet e besueshmërisë janë të dobishme kur probabiliteti për të marrë një vlerësim në një distancë të caktuar nga vlera e vërtetë (e panjohur) e parametrit është afër një. Vlerësime të tilla quhen konsistente dhe vetia e konsistencës karakterizohet nga një rritje në saktësinë e tyre me rritjen e madhësisë së mostrës.

Megjithatë, kushti i konsistencës nuk plotësohet automatikisht dhe varet ndjeshëm nga përmbushja e dy kërkesave të rëndësishme të mëposhtme. Së pari, vetë mbetjet duhet të jenë stokastike me rastësinë më të theksuar, d.m.th. të gjitha varësitë qartësisht funksionale duhet të përfshihen në mënyrë specifike në komponentin analitik të regresionit të shumëfishtë, dhe përveç kësaj, vlerat e mbetjeve duhet të shpërndahen në mënyrë të pavarur nga njëra-tjetra për mostra të ndryshme (pa autokorrelacion të mbetjeve). Kërkesa e dytë, jo më pak e rëndësishme është që varianca e çdo devijimi (mbetëse) të jetë identike për të gjitha vlerat e ndryshoreve X (homoscedasticiteti). ato. homoskedastizmi shprehet me qëndrueshmërinë e variancës për të gjitha vëzhgimet:

Përkundrazi, heteroskedasticiteti është shkelje e një qëndrueshmërie të tillë të variancës për vëzhgime të ndryshme. Në këtë rast, probabiliteti a priori (para vëzhgimeve) për të marrë vlera shumë të devijuara me shpërndarje të ndryshme teorike të termit të rastësishëm për vëzhgime të ndryshme në kampion do të jetë relativisht i lartë.

Autokorrelacioni i mbetjeve, ose prania e një korrelacioni midis mbetjeve të vëzhgimeve aktuale dhe të mëparshme (të mëvonshme), përcaktohet nga vlera e koeficientit të zakonshëm të korrelacionit linear. Nëse ndryshon ndjeshëm nga zero, atëherë mbetjet janë të autokorreluara dhe, për rrjedhojë, funksioni i densitetit të probabilitetit (shpërndarja e mbetjeve) varet nga pika e vëzhgimit dhe nga shpërndarja e vlerave të mbetura në pika të tjera vëzhgimi. Është i përshtatshëm për të përcaktuar autokorrelacionin e mbetjeve duke përdorur informacionin statistikor të disponueshëm nëse ka një renditje të vëzhgimeve sipas faktorit X. Mungesa e autokorrelacionit të mbetjeve siguron qëndrueshmërinë dhe efektivitetin e vlerësimeve të koeficientëve të regresionit.

35. Homoskedasticiteti dhe heteroskedasticiteti, autokorrelacioni i mbetjeve, katrorët më të vegjël të përgjithësuar (GLM).

Ngjashmëria e variancave të mbetjeve për të gjitha vlerat e ndryshoreve X, ose homoskedasticiteti, është gjithashtu absolutisht e nevojshme për të marrë vlerësime të qëndrueshme të parametrave të regresionit duke përdorur OLS. Mosplotësimi i kushtit të homoskedasticitetit çon në të ashtuquajturin heteroskedastizëm. Mund të çojë në vlerësime të njëanshme të koeficientëve të regresionit. Heteroskedasticiteti do të ndikojë kryesisht në uljen e efikasitetit të vlerësimeve të koeficientit të regresionit. Në këtë rast, bëhet veçanërisht e vështirë përdorimi i formulës për gabimin standard të koeficientit të regresionit, përdorimi i së cilës supozon një shpërndarje uniforme të mbetjeve për çdo vlerë të faktorit. Sa i përket paanshmërisë së vlerësimeve të koeficientëve të regresionit, kjo kryesisht varet nga pavarësia e mbetjeve dhe nga vlerat e vetë faktorëve.

Një mënyrë mjaft e qartë, ndonëse jo rigoroze dhe që kërkon aftësi për të testuar homoskedasticitetin është studimi grafik i natyrës së varësisë së mbetjeve nga atributi mesatar i llogaritur (teorik) rezultant, ose nga fushat përkatëse të korrelacionit. Metodat analitike për studimin dhe vlerësimin e heteroskedasticitetit janë më rigoroze. Nëse ka një prani të konsiderueshme të heteroskedasticitetit, këshillohet që në vend të OLS të përdoret OLS e përgjithësuar (GLM).

Përveç kërkesave për regresion të shumëfishtë që rrjedhin nga përdorimi i OLS, është gjithashtu e nevojshme të respektohen kushtet për variablat e përfshirë në model. Këto, para së gjithash, përfshijnë kërkesat në lidhje me numrin e faktorëve model për një vëllim të caktuar vëzhgimesh (1 deri në 7). Përndryshe, parametrat e regresionit do të jenë statistikisht të parëndësishëm. Nga pikëpamja e efektivitetit të aplikimit të metodave numerike përkatëse gjatë zbatimit të LSM, është e nevojshme që numri i vëzhgimeve të kalojë numrin e parametrave të vlerësuar (në një sistem ekuacionesh, numri i ekuacioneve është më i madh se numri i kërkuar variablat).

Arritja më domethënëse e ekonometrisë është zhvillimi i konsiderueshëm i metodave për vlerësimin e parametrave të panjohur dhe përmirësimi i kritereve për identifikimin e rëndësisë statike të efekteve në shqyrtim. Në këtë drejtim, pamundësia ose papërshtatshmëria e përdorimit të OLS tradicionale për shkak të heteroskedasticitetit të manifestuar në një shkallë ose në një tjetër çoi në zhvillimin e një OLS të përgjithësuar (GLM). Në fakt, kjo përfshin rregullimin e modelit, ndryshimin e specifikimeve të tij dhe transformimin e të dhënave origjinale për të siguruar vlerësime të paanshme, efikase dhe të qëndrueshme të koeficientëve të regresionit.

Supozohet se mesatarja e mbetjeve është zero, por shpërndarja e tyre nuk është më konstante, por është proporcionale me vlerat e K i, ku këto vlera janë koeficientë proporcionaliteti që janë të ndryshëm për vlera të ndryshme të faktori x. Kështu, janë këta koeficientë (vlerat K i) që karakterizojnë heterogjenitetin e dispersionit. Natyrisht, besohet se vetë sasia e dispersionit, e cila është një faktor i zakonshëm për këta koeficientë proporcionaliteti, është i panjohur.

Modeli origjinal, pas futjes së këtyre koeficientëve në ekuacionin e regresionit të shumëfishtë, vazhdon të mbetet heteroskedastik (më saktë, këto janë vlerat e mbetura të modelit). Le të mos jenë të autokorreluara këto mbetje (reziduale). Le të prezantojmë variabla të rinj të përftuar duke pjesëtuar variablat e modelit fillestar të regjistruar si rezultat i vëzhgimit të i-të me rrënjën katrore të koeficientëve të proporcionalitetit K i. Pastaj marrim një ekuacion të ri në variablat e transformuar, në të cilin mbetjet do të jenë homoskedastike. Vetë variablat e rinj janë variabla të vjetra (origjinale) të ponderuara.

Prandaj, vlerësimi i parametrave të ekuacionit të ri të marrë në këtë mënyrë me mbetjet homoskedastike do të reduktohet në metodën e katrorëve më të vegjël të ponderuar (në thelb, kjo është metoda OLS). Kur përdoren në vend të vetë variablave të regresionit, devijimet e tyre nga mesataret, shprehjet për koeficientët e regresionit marrin një formë të thjeshtë dhe të standardizuar (uniforme), e cila ndryshon pak për OLS dhe OLS nga faktori korrigjues 1/K në numërues dhe emëruesi i thyesës që jep koeficientin e regresionit.

Duhet të kihet parasysh se parametrat e modelit të transformuar (të rregulluar) varen ndjeshëm nga koncepti që përdoret si bazë për koeficientët e proporcionalitetit K i. Shpesh supozohet se mbetjet janë thjesht proporcionale me vlerat e faktorëve. Modeli merr formën e tij më të thjeshtë kur pranohet hipoteza se gabimet janë proporcionale me vlerat e faktorit të fundit në rend. Pastaj OLS bën të mundur rritjen e peshës së vëzhgimeve me vlera më të vogla të variablave të transformuar gjatë përcaktimit të parametrave të regresionit në krahasim me funksionimin e OLS standarde me variablat e burimit origjinal. Por këto variabla të rinj tashmë marrin një përmbajtje të ndryshme ekonomike.

Hipoteza për proporcionalitetin e mbetjeve me madhësinë e faktorit mund të ketë një bazë reale. Le të përpunohet një grup i caktuar i pamjaftueshëm homogjen i të dhënave, për shembull, duke përfshirë ndërmarrjet e mëdha dhe të vogla në të njëjtën kohë. Pastaj, vlerat e mëdha vëllimore të faktorit mund të korrespondojnë me një shpërndarje të madhe të karakteristikës që rezulton dhe një shpërndarje të madhe të vlerave të mbetura. Më tej, përdorimi i OLS dhe kalimi përkatës në vlerat relative jo vetëm që zvogëlon ndryshimin e faktorëve, por gjithashtu zvogëlon variancën e gabimit. Kështu, rasti më i thjeshtë i marrjes parasysh dhe korrigjimit të heteroskedasticitetit në modelet e regresionit realizohet nëpërmjet përdorimit të OLS.

Qasja e mësipërme për zbatimin e OLS në formën e OLS të ponderuar është mjaft praktike - ajo thjesht zbatohet dhe ka një interpretim ekonomik transparent. Sigurisht, kjo nuk është qasja më e përgjithshme dhe në kontekstin e statistikave matematikore, e cila shërben si bazë teorike e ekonometrisë, na ofrohet një metodë shumë më rigoroze që zbaton OLS në formën më të përgjithshme. Në të, ju duhet të dini matricën e kovariancës së vektorit të gabimit (kolona e mbetur). Dhe kjo është zakonisht e padrejtë në situata praktike, dhe mund të jetë e pamundur të gjendet kjo matricë si e tillë. Prandaj, në përgjithësi, është e nevojshme të vlerësohet disi matrica e kërkuar në mënyrë që të përdoret një vlerësim i tillë në formulat përkatëse në vend të vetë matricës. Kështu, mishërimi i përshkruar i OMNC përfaqëson një nga vlerësimet e tilla. Nganjëherë quhet katrorë më të vegjël të përgjithësuar të arritshëm.

Duhet të merret parasysh gjithashtu se koeficienti i përcaktimit nuk mund të shërbejë si një masë e kënaqshme e cilësisë së përshtatjes kur përdoret OLS. Duke iu rikthyer përdorimit të OLS, vërejmë gjithashtu se metoda e përdorimit të devijimeve standarde (gabimet standarde) në formën White (të ashtuquajturat gabime standarde të qëndrueshme në prani të heteroskedasticitetit) ka përgjithësim të mjaftueshëm. Kjo metodë është e zbatueshme me kusht që matrica e kovariancës së vektorit të gabimit të jetë diagonale. Nëse ka autokorrelacion të mbetjeve (gabimeve), kur ka elementë (koeficientë) jo zero në matricën e kovariancës dhe jashtë diagonales kryesore, atëherë duhet të përdoret një metodë më e përgjithshme e gabimit standard në formën Neve West. Ekziston një kufizim domethënës: elementët jo zero, përveç diagonales kryesore, gjenden vetëm në diagonalet ngjitur, të ndarë nga diagonalja kryesore jo më shumë se një sasi e caktuar.

Nga sa më sipër është e qartë se është e nevojshme të jeni në gjendje të kontrolloni të dhënat për heteroskedasticitet. Testet e mëposhtme i shërbejnë këtij qëllimi. Ata testojnë hipotezën kryesore për barazinë e variancave të mbetjeve kundrejt hipotezës alternative (për pabarazinë e këtyre hipotezave). Për më tepër, ka kufizime strukturore a priori në natyrën e heteroskedasticitetit. Testi Goldfeld-Quandt zakonisht përdor supozimin se varianca e gabimit (e mbetur) varet drejtpërdrejt nga vlera e disa ndryshoreve të pavarura. Skema e përdorimit të këtij testi është si më poshtë. Së pari, të dhënat renditen në rend zbritës të variablit të pavarur për të cilin dyshohet heteroskedastizmi. Ky grup i renditur i të dhënave më pas eliminon mesataren e disa vëzhgimeve, ku fjala "pak" nënkupton rreth një të katërtën (25%) të numrit të përgjithshëm të të gjitha vëzhgimeve. Më pas, dy regresione të pavarura kryhen në të parën nga vëzhgimet mesatare të mbetura (pas eliminimit) dhe dy të fundit nga këto vëzhgime mesatare të mbetura. Pas kësaj, ndërtohen dy mbetje përkatëse. Së fundi, përpilohet statistika Fisher F dhe nëse hipoteza në studim është e vërtetë, atëherë F është me të vërtetë shpërndarja e Fisher me shkallët e duhura të lirisë. Atëherë një vlerë e madhe e kësaj statistike do të thotë se hipoteza që testohet duhet të refuzohet. Pa hapin e eliminimit, fuqia e këtij testi zvogëlohet.

Testi Breusch-Pagan përdoret në rastet kur supozohet apriori se variancat varen nga disa variabla shtesë. Së pari, kryhet regresioni i zakonshëm (standard) dhe fitohet një vektor i mbetjeve. Pastaj ndërtohet një vlerësim i variancës. Më pas, kryhet një regresion i vektorit në katror të mbetjeve të pjestuar me variancën empirike (vlerësimi i variancës). Për të (regresioni), gjendet pjesa e shpjeguar e variacionit. Dhe për këtë shpjegohet një pjesë e variacionit, e ndarë në gjysmë, janë ndërtuar statistikat. Nëse hipoteza zero është e vërtetë (asnjë heteroskedasticitet nuk është i vërtetë), atëherë kjo vlerë ka një shpërndarje hee- katror. Nëse testi, përkundrazi, zbulon heteroskedasticitet, atëherë modeli origjinal transformohet duke i ndarë përbërësit e vektorit të mbetjeve me komponentët përkatës të vektorit të variablave të pavarur të vëzhguar.

36. Metoda e devijimit standard në formë White.

Mund të nxirren përfundimet e mëposhtme. Përdorimi i OLS në prani të heteroskedasticitetit zbret në minimizimin e shumës së devijimeve në katror të ponderuar. Përdorimi i OLS në dispozicion shoqërohet me nevojën për të pasur një numër të madh vëzhgimesh që tejkalojnë numrin e parametrave të vlerësuar. Rasti më i favorshëm për përdorimin e OLS është rasti kur gabimi (mbetjet) është proporcional me një nga variablat e pavarur dhe vlerësimet që rezultojnë janë të qëndrueshme. Nëse, megjithatë, në një model me heteroskedasticitet është e nevojshme të përdoret jo OLS, por OLS standarde, atëherë për të marrë vlerësime të qëndrueshme, mund të përdoren vlerësimet e gabimit në formën White ose Nevier-West.

Gjatë analizimit të serive kohore, shpesh është e nevojshme të merret parasysh varësia statistikore e vëzhgimeve në momente të ndryshme kohore. Në këtë rast, supozimi i gabimeve të pakorreluara nuk është i kënaqur. Le të shqyrtojmë një model të thjeshtë në të cilin gabimet formojnë një proces autoregresiv të rendit të parë. Në këtë rast, gabimet plotësojnë një lidhje të thjeshtë përsëritjeje, në anën e djathtë të së cilës një nga termat është një sekuencë e variablave të rastësishme të pavarura normalisht të shpërndara me mesatare zero dhe variancë konstante. Termi i dytë është prodhimi i parametrit (koeficienti i autogresionit) dhe vlerave të mbetjeve në pikën e mëparshme kohore. Sekuenca e vlerave të gabimit (mbetjet) në vetvete formon një proces të rastësishëm të palëvizshëm. Një proces i rastësishëm i palëvizshëm karakterizohet nga qëndrueshmëria e karakteristikave të tij me kalimin e kohës, në veçanti, mesatarja dhe varianca. Në këtë rast, matrica e kovariancës (kushtet e saj) me interes për ne mund të shkruhet lehtësisht duke përdorur fuqitë e parametrit.

Vlerësimi i një modeli autoregresiv për një parametër të njohur kryhet duke përdorur OLS. Në këtë rast, mjafton thjesht të reduktohet modeli origjinal me një transformim të thjeshtë në një model, gabimet e të cilit plotësojnë kushtet e një modeli standard regresioni. Është shumë e rrallë, por megjithatë ekziston një situatë në të cilën parametri i autoregresionit njihet. Prandaj, përgjithësisht është e nevojshme të kryhet vlerësimi me një parametër autoregresiv të panjohur. Ekzistojnë tre procedura më të përdorura për një vlerësim të tillë. Metoda Cochrane-Orcutt, procedura Hildreth-Lu dhe metoda Durbin.

Në përgjithësi, përfundimet e mëposhtme janë të vërteta. Analiza e serive kohore kërkon korrigjim të OLS konvencionale, pasi gabimet në këtë rast zakonisht janë të ndërlidhura. Shpesh këto gabime formojnë një proces autoregresiv stacionar të rendit të parë. Vlerësuesit OLS për autoregresionin e rendit të parë janë të paanshëm, të qëndrueshëm, por joefektivë. Me një koeficient të njohur autoregresioni, OLS reduktohet në transformime (korrigjime) të thjeshta të sistemit origjinal dhe më pas në aplikimin e OLS standarde. Nëse, siç ndodh më shpesh, koeficienti autoregresiv është i panjohur, atëherë ekzistojnë disa procedura të disponueshme për OLS, të cilat konsistojnë në vlerësimin e parametrit të panjohur (koeficientit), pas së cilës zbatohen të njëjtat transformime si në rastin e mëparshëm të të njohurit. parametri.

37. Koncepti i testit Breusch-Pagan, testi Goldfeldt-Quandt

Treguesit e korrelacionit dhe përcaktimit

Regresioni i çiftit linear

Bazuar në të dhënat ndihmëse, të cilat janë llogaritur në tabelë. 2, ne llogarisim treguesin e afërsisë së lidhjes.

Ky tregues është koeficienti i korrelacionit linear të mostrës, i llogaritur duke përdorur formulën.

Bazuar në rezultatet e llogaritjes së koeficientit të korrelacionit, mund të konkludojmë se marrëdhënia midis faktorit dhe karakteristikës rezultante është e drejtpërdrejtë dhe e fortë (sipas shkallës Chaddock).

Katrori i koeficientit të korrelacionit quhet koeficienti i përcaktimit, i cili tregon proporcionin e ndryshimit në karakteristikën rezultante të shpjeguar nga ndryshimi në karakteristikën e faktorit.

Zakonisht, kur interpretohet koeficienti i përcaktimit, ai shprehet në përqindje.

R2 = 0,8472 = 0,7181

ato. në 71.81% të rasteve, një ndryshim në një karakteristikë faktori çon në një ndryshim në karakteristikën që rezulton. Saktësia e zgjedhjes së ekuacionit të regresionit është mjaft e lartë. Pjesa e mbetur prej 28.19% e ndryshimit në Y shpjegohet me faktorë që nuk janë marrë parasysh në model.

Regresioni i çiftit të fuqisë

Ne përcaktojmë afërsinë e marrëdhënies midis karakteristikave rezultuese dhe faktorëve për regresionin e çiftit të fuqisë duke përdorur koeficientin e korrelacionit:

Duke zëvendësuar të dhënat e njohura, marrim:

Treguesi i përcaktimit.

ato. në 69% të rasteve, një ndryshim në një karakteristikë të faktorit çon në një ndryshim në karakteristikën që rezulton. Saktësia e përshtatjes së ekuacionit të regresionit është mesatare. Pjesa e mbetur prej 31% e ndryshimit në Y shpjegohet me faktorë që nuk janë marrë parasysh në model.

Gabim mesatar i përafrimit

Regresioni i çiftit linear

Le të vlerësojmë cilësinë e ekuacionit të regresionit duke përdorur gabimin e përafrimit absolut. Gabimi mesatar i përafrimit është devijimi mesatar i vlerave të llogaritura nga ato aktuale:

Regresioni i çiftit të fuqisë

Gabimi mesatar i përafrimit është devijimi mesatar i vlerave të llogaritura nga ato aktuale:

Një gabim i përafrimit brenda 5%-7% tregon një përshtatje të mirë të ekuacionit të regresionit me të dhënat origjinale.

Meqenëse gabimi është më shumë se 7%, nuk këshillohet përdorimi i këtij ekuacioni si regresion.

Vlerësimi i besueshmërisë statistikore të rezultateve të modelimit të regresionit duke përdorur testin F Fisher

Regresioni i çiftit linear

Koeficienti i përcaktimit R2 përdoret për të testuar rëndësinë e ekuacionit të regresionit linear në tërësi.

Testimi i rëndësisë së një modeli regresioni kryhet duke përdorur testin F Fisher, vlera e llogaritur e të cilit gjendet si raport i variancës së serisë origjinale të vëzhgimeve të treguesit që studiohet dhe vlerësimit të paanshëm të variancës së sekuencës së mbetur. për këtë model.

Nëse vlera e llogaritur me k 1 =(m) dhe k 2 =(n-m-1) shkallë lirie është më e madhe se vlera e tabelës në një nivel të caktuar rëndësie, atëherë modeli konsiderohet i rëndësishëm.

Rëndësia statistikore e regresionit linear të çiftuar vlerësohet duke përdorur algoritmin e mëposhtëm:

ku m=1 për regresionin çift.

Meqenëse vlera aktuale e F >

Regresioni i çiftit të fuqisë

Ngjashëm me regresionin linear të çifteve, ne do të vlerësojmë regresionin e çiftit të fuqisë

ku m është numri i faktorëve në model.

1. Parashtrohet një hipotezë zero se ekuacioni në tërësi është statistikisht i parëndësishëm: H 0: R 2 = 0 në nivelin e rëndësisë b.

2. Përcaktoni vlerën aktuale të kriterit F:

ku m=1 për regresionin çift.

3. Vlera e tabelës përcaktohet nga tabelat e shpërndarjes së Fisher për një nivel të caktuar rëndësie, duke marrë parasysh që numri i shkallëve të lirisë për shumën totale të katrorëve (variancë më e madhe) është 1 dhe numri i shkallëve të lirisë për pjesën e mbetur. shuma e katrorëve (variancë më e vogël) në regresionin linear është n-2 .

Tabela F është vlera maksimale e mundshme e kriterit nën ndikimin e faktorëve të rastësishëm në shkallë të caktuar lirie dhe niveli i rëndësisë b. Niveli i rëndësisë b - probabiliteti i refuzimit të hipotezës së saktë, me kusht që ajo të jetë e vërtetë. Zakonisht b merret e barabartë me 0.05 ose 0.01.

4. Nëse vlera aktuale e F-testit është më e vogël se vlera e tabelës, atëherë ata thonë se nuk ka arsye për të hedhur poshtë hipotezën zero.

Përndryshe, hipoteza zero hidhet poshtë dhe me probabilitetin (1-b) pranohet hipoteza alternative për rëndësinë statistikore të ekuacionit në tërësi.

Vlera e tabelës së kriterit me shkallë lirie:

k 1 =1 dhe k 2 =8, tabela F = 5,32

Meqenëse tabela e vlerës aktuale F > F, koeficienti i përcaktimit është statistikisht i rëndësishëm (vlerësimi i gjetur i ekuacionit të regresionit është statistikisht i besueshëm).

Bazuar në rezultatet e analizës, konkludojmë se koeficientët e përcaktimit si për regresionin linear të çiftit ashtu edhe për regresionin e çiftit të fuqisë janë statistikisht të rëndësishëm.

Meqenëse regresioni i çiftit linear ka një koeficient (indikativ) më të lartë të përcaktimit, ne besojmë se ai përshkruan në mënyrë adekuate marrëdhënien midis faktorit dhe karakteristikës që rezulton.

Gabimi i përafrimit është një nga çështjet që lind më shpesh gjatë aplikimit të metodave të caktuara të përafrimit të të dhënave burimore. Ekzistojnë lloje të ndryshme të gabimeve të përafrimit:

Gabimet që lidhen me gabimet e të dhënave burimore;

Gabimet që lidhen me mospërputhjen midis modelit të përafërt dhe strukturës së të dhënave të përafërta.

Excel ka një funksion linear të zhvilluar mirë për përpunimin e të dhënave dhe përafrimet që përdor matematikë të sofistikuar. Për të pasur një ide rreth tij, le t'i drejtohemi (përmes F1) pjesës përshkruese të këtij zhvillimi, të cilën e paraqesim me shkurtesa dhe disa ndryshime në shënim.

Llogarit statistikat për një seri duke përdorur katrorët më të vegjël për të llogaritur vijën e drejtë që i përshtatet më mirë të dhënave të disponueshme. Funksioni kthen një grup që përshkruan linjën që rezulton. Për shkak se një grup vlerash është kthyer, funksioni duhet të specifikohet si një formulë grupi.

Ekuacioni për një vijë të drejtë është:

y=a+b1*x1+b2*x2+...bn*xn

Sintaksë:

LINEST(y;x;konst;statistika)

Vargu y - vlerat e njohura y.

Vargu x - vlerat e njohura të x. Vargu x mund të përmbajë një ose më shumë grupe variablash.

Const është një vlerë boolean që specifikon nëse termi dummy a kërkohet të jetë 0.

Nëse argumenti konst është TRUE, 1, ose i anashkaluar, atëherë a vlerësohet si zakonisht. Nëse argumenti konst është FALSE ose 0, atëherë a vendoset në 0.

Statistika është një vlerë Boolean që tregon nëse statistikat shtesë të regresionit duhet të kthehen. Nëse argumenti statistikor është TRUE ose 1, atëherë LINEST kthen statistika shtesë të regresionit. Nëse statistikat janë FALSE, 0 ose janë lënë jashtë, atëherë LINEST kthen vetëm koeficientët dhe ndërprerjen.

Statistikat shtesë të regresionit:

se1,se2,...,sen - vlera standarde të gabimit për koeficientët b1,b2,...,bn.

deti - vlera standarde e gabimit për konstantën a (deti = #N/A nëse konstacioni është FALSE).

r2 është koeficienti i determinizmit. Krahasohen vlerat aktuale të y dhe vlerat e marra nga ekuacioni i vijës; Në bazë të rezultateve të krahasimit, llogaritet koeficienti i determinizmit, i normalizuar nga 0 në 1. Nëse është i barabartë me 1, atëherë ka një korrelacion të plotë me modelin, d.m.th. nuk ka asnjë ndryshim midis vlerave aktuale dhe të vlerësuara të y. Në rastin e kundërt, nëse koeficienti i përcaktimit është 0, atëherë ekuacioni i regresionit është i pasuksesshëm në parashikimin e vlerave të y. Për informacion se si llogaritet r2, shihni "Shënimet" në fund të këtij seksioni.

sey është gabimi standard për vlerësimin e y.

F-statistikë, ose F-vlera e vëzhguar. Statistika F përdoret për të përcaktuar nëse marrëdhënia e vëzhguar midis variablave të varur dhe të pavarur është për shkak të rastësisë apo jo.

df - shkallët e lirisë. Shkallët e lirisë janë të dobishme për gjetjen e vlerave F-kritike në një tabelë statistikore. Për të përcaktuar nivelin e besimit të modelit, krahasoni vlerat në tabelë me statistikën F të kthyer nga funksioni LINEST.

ssreg është shuma e regresionit të katrorëve.

ssresid është shuma e mbetur e katrorëve.

Figura më poshtë tregon rendin në të cilin kthehen statistikat shtesë të regresionit.

Shënime

Informacioni i zgjedhur nga funksioni mund të merret përmes funksionit INDEX, për shembull:

Ndërprerja Y (term i lirë):

INDEX(LINEST(y,x),2)

Saktësia e përafrimit duke përdorur vijën e drejtë të llogaritur nga funksioni LINEST varet nga shkalla e shpërndarjes së të dhënave. Sa më afër të jenë të dhënat me një vijë të drejtë, aq më i saktë është modeli i përdorur nga funksioni LINEST. Funksioni LINEST përdor katrorët më të vegjël për të përcaktuar përshtatjen më të mirë me të dhënat.

Kur kryen analizën e regresionit, Microsoft Excel llogarit, për çdo pikë, katrorin e diferencës midis vlerës së parashikuar y dhe vlerës aktuale y. Shuma e këtyre diferencave në katror quhet shuma e mbetur e katrorëve. Microsoft Excel më pas llogarit shumën e katrorëve të diferencave midis vlerave aktuale y dhe vlerës mesatare y, e cila quhet shuma totale e katrorëve (shuma e regresionit të katrorëve + shuma e mbetur e katrorëve). Sa më e vogël të jetë shuma e mbetur e katrorëve në krahasim me shumën totale të katrorëve, aq më i madh është koeficienti i përcaktimit r2, i cili mat se sa mirë ekuacioni i regresionit shpjegon marrëdhëniet midis variablave.

Vini re se vlerat y të parashikuara nga ekuacioni i regresionit mund të mos jenë të sakta nëse bien jashtë gamës së vlerave y që janë përdorur për të përcaktuar ekuacionin.

Shembulli 1 Pjerrësia dhe ndërprerja Y

LINEST((1;9;5;7);(0;4;2;3)) është e barabartë me (2;1), pjerrësia = 2 dhe ndërprerja y = 1.

Duke përdorur statistikat F dhe R2

Ju mund të përdorni statistikën F për të përcaktuar nëse një rezultat me një vlerë të lartë r2 është për shkak të rastësisë. Nëse F-vëzhguar është më e madhe se F-kritike, atëherë ekziston një marrëdhënie midis variablave. F-kritike mund të merret nga tabela e vlerave kritike F në çdo libër referimi mbi statistikat matematikore. Për të gjetur këtë vlerë duke përdorur një test me një bisht, vendosni vlerën e Alfa (vlera e Alfa përdoret për të treguar probabilitetin e përfundimit të gabuar se ekziston një lidhje e fortë) e barabartë me 0.05, dhe për numrin e shkallëve të lirisë ( zakonisht shënohet v1 dhe v2), le të vendosim v1 = k = 4 dhe v2 = n - (k + 1) = 11 - (4 + 1) = 6, ku k është numri i ndryshoreve dhe n është numri i pikave të të dhënave . Nga tabela e referencës, F-kritike është 4.53. Vlera F e vëzhguar është 459.753674 (kjo vlerë është marrë në shembullin që kemi lënë jashtë), e cila është dukshëm më e madhe se vlera kritike F prej 4.53. Prandaj, ekuacioni i regresionit që rezulton është i dobishëm për parashikimin e rezultatit të dëshiruar.

Ministria e Bujqësisë e Federatës Ruse

Buxheti federal i shtetit arsimor

institucioni i arsimit të lartë profesional

"Akademia Shtetërore Bujqësore e Permit

me emrin akademik D.N. Pryanishnikov"

Departamenti i Financave, Kredive dhe Analizave Ekonomike

Test në disiplinën "Ekonometria" Opsioni - 10


    Gabimet e përafrimit dhe përkufizimi i tyre…………………………………….3

    Metoda analitike për përafrimin e një serie kohore dhe funksionet e përdorura për këtë………………………………………………………………..4

    Pjesa praktike………………………………………………………………………………………….

    1. Detyra 1………………………………………………………11

      Detyra 2……………………………………………………………………….19

Lista e referencave………………………………………………………………………………………………………………………….

  1. Gabimet e përafrimit dhe përkufizimi i tyre.

Gabim mesatar i përafrimitështë devijimi mesatar i të dhënave të llogaritura nga të dhënat aktuale. Përcaktohet si një modul përqindjeje.

Vlerat aktuale të karakteristikës rezultante ndryshojnë nga ato teorike. Sa më i vogël të jetë ky ndryshim, aq më shumë vlerat teorike i afrohen të dhënave empirike, kjo është cilësia më e mirë e modelit. Madhësia e devijimeve të vlerave aktuale dhe të llogaritura të karakteristikës që rezulton për çdo vëzhgim paraqet gabimin e përafrimit. Numri i tyre korrespondon me vëllimin e popullsisë. Në disa raste, gabimi i përafrimit mund të jetë i barabartë me zero. Për krahasim, përdoren vlerat e devijimit të shprehura si përqindje e vlerave aktuale.

Meqenëse mund të jetë një vlerë pozitive ose negative, gabimet e përafrimit për çdo vëzhgim zakonisht përcaktohen si një modul përqindjeje. Devijimet mund të konsiderohen si një gabim absolut i përafrimit dhe si një gabim relativ i përafrimit. Për të pasur një gjykim të përgjithshëm për cilësinë e modelit nga devijimet relative për çdo vëzhgim, gabimi mesatar i përafrimit përcaktohet si mesatarja e thjeshtë aritmetike.

Gabimi mesatar i përafrimit llogaritet duke përdorur formulën:

Një përkufizim tjetër i gabimit mesatar të përafrimit është i mundur:

Nëse A £ 10-12%, atëherë mund të flasim për cilësinë e mirë të modelit.

  1. Një metodë analitike për përafrimin e një serie kohore dhe funksionet e përdorura për këtë.

Një teknikë më e avancuar për identifikimin e tendencës kryesore të zhvillimit në serinë e dinamikës është shtrirja analitike. Kur studiojmë një prirje të përgjithshme duke përdorur metodën e shtrirjes analitike, supozohet se ndryshimet në nivelet e një serie dinamike mund të shprehen me shkallë të ndryshme të saktësisë së përafrimit nga funksione të caktuara matematikore. Lloji i ekuacionit përcaktohet nga natyra e dinamikës së zhvillimit të një dukurie të veçantë. Në praktikë, duke përdorur seritë kohore ekzistuese, ata vendosin formën dhe gjejnë parametrat e funksionit y=f(t), dhe më pas analizojnë sjelljen e devijimeve nga trendi. Më shpesh, varësitë e mëposhtme përdoren për nivelim: lineare, parabolike dhe eksponenciale. Në shumë raste, modelimi i serive kohore duke përdorur polinome ose një funksion eksponencial nuk jep rezultate të kënaqshme, pasi seritë kohore përmbajnë luhatje të dukshme periodike rreth prirjes së përgjithshme. Në raste të tilla, duhet të përdoret analiza harmonike (harmonikët e serisë Fourier). Përdorimi i kësaj metode është i preferueshëm, pasi përcakton ligjin me të cilin mund të parashikohen me saktësi vlerat e niveleve të serisë.

Qëllimi i shtrirjes analitike të një serie kohore është të përcaktojë varësinë analitike ose grafike y=f(t). Funksioni y=f(t) është zgjedhur në mënyrë që të japë një shpjegim kuptimplotë të procesit që studiohet. Këto mund të jenë funksione të ndryshme.

Sistemet e ekuacioneve të formës y=f(t) për vlerësimin e parametrave të polinomeve duke përdorur metodat e katrorëve më të vegjël

(e klikuar)

Paraqitja grafike e polinomeve të rendit n

1. Nëse ndryshimi i niveleve të një serie karakterizohet nga një rritje (ulje) uniforme e niveleve, kur rritjet e zinxhirit absolut janë të përafërta në madhësi, tendenca e zhvillimit karakterizohet nga një ekuacion i drejtë.

2. Nëse, si rezultat i analizës së llojit të tendencës dinamike, krijohet një varësi kurvilineare, me nxitim afërsisht konstant, atëherë forma e prirjes shprehet me një ekuacion parabole të rendit të dytë.

3. Nëse nivelet e një sërë dinamikash rriten në progresionin gjeometrik, d.m.th. Koeficientët e rritjes së zinxhirit janë pak a shumë konstant, seritë e dinamikës janë rreshtuar duke përdorur një funksion eksponencial.

Pas zgjedhjes së llojit të ekuacionit, duhet të përcaktoni parametrat e ekuacionit. Mënyra më e zakonshme për të përcaktuar parametrat e një ekuacioni është metoda e katrorëve më të vegjël, në të cilën si zgjidhje merret pika minimale e shumës së devijimeve në katror midis niveleve teorike (të rreshtuara nga ekuacioni i zgjedhur) dhe niveleve empirike.

Shtrirja e drejtë (duke përcaktuar një vijë trendi) ka shprehjen: yt=a0+a1t

simboli t-kohë;

a 0 dhe a1 janë parametrat e vijës së dëshiruar.

Parametrat e linjës gjenden nga zgjidhja e sistemit të ekuacioneve:

Sistemi i ekuacioneve thjeshtohet nëse vlerat e t zgjidhen në mënyrë që shuma e tyre të jetë e barabartë me Σt = 0, d.m.th., fillimi i numërimit të kohës zhvendoset në mes të periudhës në shqyrtim. Nëse para transferimit të pikës së referencës t = 1, 2, 3, 4..., atëherë pas transferimit:

nëse numri i niveleve të serisë është tek t = -4 -3 -2 -1 0 +1 +2 +3 +4

nëse numri i niveleve të serisë është çift t = -7 -5 -3 -1 +1 +3 +5 +7

Kështu, ∑t për një fuqi tek do të jetë gjithmonë zero.

Në mënyrë të ngjashme, parametrat e një parabole të rendit të dytë gjenden nga zgjidhja e sistemit të ekuacioneve:

Përafrimi sipas rritjes mesatare absolute ose normës mesatare të rritjes:

Δ-rritja mesatare absolute;

K-shkalla mesatare e rritjes;

Y0 është niveli fillestar i rreshtit;

Уn është niveli përfundimtar i rreshtit;

t-numri rendor i nivelit, duke filluar nga zero.

Pasi është ndërtuar një ekuacion regresioni, vlerësohet besueshmëria e tij. Rëndësia e ekuacionit të zgjedhur të regresionit, parametrat e ekuacionit dhe koeficienti i korrelacionit duhet të vlerësohen duke përdorur metoda kritike të vlerësimit:

Fisher's F-test, Student's t-test, në këtë rast, vlerat e llogaritura të kritereve krahasohen me vlerat e tabeluara (kritike) në një nivel të caktuar rëndësie dhe numër të shkallëve të lirisë. Ffact > Ftheor - ekuacioni i regresionit është adekuat.

n është numri i vëzhgimeve (nivelet e serive), m është numri i parametrave të ekuacionit të regresionit (modelit).

Përshtatshmëria e ekuacionit të regresionit (cilësia e modelit në tërësi) kontrollohet duke përdorur gabimin mesatar të përafrimit, vlera e të cilit nuk duhet të kalojë 10-12% (rekomandohet).

Le të kontrollojmë hipotezën H 0 për barazinë e koeficientëve individual të regresionit në zero (nëse alternativa nuk është e barabartë me H 1) në nivelin e rëndësisë b = 0.05.

Nëse hipoteza kryesore rezulton e pasaktë, pranojmë atë alternative. Për të testuar këtë hipotezë, përdoret testi i Studentit t.

Vlera e kriterit t e gjetur nga të dhënat e vëzhgimit (të quajtura gjithashtu të vëzhguara ose aktuale) krahasohet me vlerën e tabeluar (kritike) të përcaktuar nga tabelat e shpërndarjes së studentëve (të cilat zakonisht jepen në fund të teksteve shkollore dhe seminareve mbi statistikat ose ekonometrinë).

Vlera e tabelës përcaktohet në varësi të nivelit të rëndësisë (b) dhe numrit të shkallëve të lirisë, i cili në rastin e regresionit të çiftit linear është i barabartë me (n-2), n është numri i vëzhgimeve.

Nëse vlera aktuale e testit t është më e madhe se vlera e tabelës (modulo), atëherë hipoteza kryesore hidhet poshtë dhe konsiderohet se me probabilitetin (1-b) parametri ose karakteristika statistikore në popullatë është dukshëm e ndryshme nga zero. .

Nëse vlera aktuale e testit t është më e vogël se vlera e tabelës (modulo), atëherë nuk ka arsye për të hedhur poshtë hipotezën kryesore, d.m.th. një parametër ose karakteristikë statistikore në popullatë nuk ndryshon ndjeshëm nga zero në nivelin e rëndësisë b.

t krit (n-m-1;b/2) = (30;0.025) = 2.042

Që nga 1.7< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом b можно пренебречь.

Që nga 0.56< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

Intervali i besimit për koeficientët e ekuacionit të regresionit.

Le të përcaktojmë intervalet e besimit të koeficientëve të regresionit, të cilët me një besueshmëri prej 95% do të jenë si më poshtë:

  • (b - t crit S b ; b + t crit S b)
  • (0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
  • (-0.13;1.41)

Meqenëse pika 0 (zero) ndodhet brenda intervalit të besimit, vlerësimi i intervalit të koeficientit b është statistikisht i parëndësishëm.

  • (a - t crit S a ; a + t crit S a)
  • (24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
  • (-65.79;114.91)

Me një probabilitet prej 95% mund të thuhet se vlera e këtij parametri do të qëndrojë në intervalin e gjetur.

Meqenëse pika 0 (zero) ndodhet brenda intervalit të besimit, vlerësimi i intervalit të koeficientit a është statistikisht i parëndësishëm.

2) F-statistikat. Kriteri Fisher.

Koeficienti i përcaktimit R2 përdoret për të testuar rëndësinë e ekuacionit të regresionit linear në tërësi.

Testimi i rëndësisë së një modeli regresioni kryhet duke përdorur testin F Fisher, vlera e llogaritur e të cilit gjendet si raport i variancës së serisë origjinale të vëzhgimeve të treguesit që studiohet dhe vlerësimit të paanshëm të variancës së sekuencës së mbetur. për këtë model.

Nëse vlera e llogaritur me k 1 =(m) dhe k 2 =(n-m-1) shkallë lirie është më e madhe se vlera e tabelës në një nivel të caktuar rëndësie, atëherë modeli konsiderohet i rëndësishëm.

ku m është numri i faktorëve në model.

Rëndësia statistikore e regresionit linear të çiftuar vlerësohet duke përdorur algoritmin e mëposhtëm:

  • 1. Parashtrohet një hipotezë zero se ekuacioni në tërësi është statistikisht i parëndësishëm: H 0: R 2 = 0 në nivelin e rëndësisë b.
  • 2. Më pas, përcaktoni vlerën aktuale të kriterit F:

ku m=1 për regresionin çift.

3. Vlera e tabelës përcaktohet nga tabelat e shpërndarjes së Fisher për një nivel të caktuar rëndësie, duke marrë parasysh që numri i shkallëve të lirisë për shumën totale të katrorëve (variancë më e madhe) është 1 dhe numri i shkallëve të lirisë për pjesën e mbetur. shuma e katrorëve (variancë më e vogël) në regresionin linear është n-2 .

Tabela F është vlera maksimale e mundshme e kriterit nën ndikimin e faktorëve të rastësishëm në shkallë të caktuar lirie dhe niveli i rëndësisë b. Niveli i rëndësisë b - probabiliteti i refuzimit të hipotezës së saktë, me kusht që ajo të jetë e vërtetë. Zakonisht b merret e barabartë me 0.05 ose 0.01.

4. Nëse vlera aktuale e F-testit është më e vogël se vlera e tabelës, atëherë ata thonë se nuk ka arsye për të hedhur poshtë hipotezën zero.

Përndryshe, hipoteza zero hidhet poshtë dhe me probabilitetin (1-b) pranohet hipoteza alternative për rëndësinë statistikore të ekuacionit në tërësi.

Vlera e tabelës së kriterit me shkallë lirie k 1 =1 dhe k 2 =30, tabela F = 4,17

Meqenëse vlera aktuale e F< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Marrëdhënia midis testit Fisher F dhe statistikës studentore t shprehet me barazinë:

Treguesit e cilësisë së ekuacionit të regresionit.

Testimi për autokorrelacionin e mbetjeve.

Një parakusht i rëndësishëm për ndërtimin e një modeli regresioni cilësor duke përdorur OLS është pavarësia e vlerave të devijimeve të rastësishme nga vlerat e devijimeve në të gjitha vëzhgimet e tjera. Kjo siguron që të mos ketë korrelacion midis ndonjë devijimi dhe, në veçanti, midis devijimeve ngjitur.

Autokorrelacioni (korrelacioni serial) përkufizohet si korrelacion ndërmjet treguesve të vëzhguar të renditur në kohë (seritë kohore) ose hapësirë ​​(seritë e kryqëzuara). Autokorrelacioni i mbetjeve (variancave) është i zakonshëm në analizën e regresionit kur përdoren të dhënat e serive kohore dhe shumë i rrallë kur përdoren të dhëna të kryqëzuara.

Në problemet ekonomike, autokorrelacioni pozitiv është shumë më i zakonshëm se autokorrelacioni negativ. Në shumicën e rasteve, autokorrelacioni pozitiv shkaktohet nga ndikimi konstant i drejtimit të disa faktorëve që nuk merren parasysh në model.

Autokorrelacioni negativ në thelb do të thotë që një devijim pozitiv pasohet nga një negativ dhe anasjelltas. Kjo situatë mund të ndodhë nëse e njëjta marrëdhënie midis kërkesës për pije joalkoolike dhe të ardhurave merret në konsideratë sipas të dhënave sezonale (dimër-verë).

Ndër arsyet kryesore që shkaktojnë autokorrelacion janë këto:

  • 1. Gabimet e specifikimeve. Dështimi për të marrë parasysh ndonjë variabël shpjegues të rëndësishëm në model ose një zgjedhje e gabuar e formës së varësisë zakonisht çon në devijime sistemike të pikave të vëzhgimit nga vija e regresionit, gjë që mund të çojë në autokorrelacion.
  • 2. Inercia. Shumë tregues ekonomikë (inflacioni, papunësia, GNP, etj.) kanë një natyrë të caktuar ciklike të shoqëruar me valëzimin e aktivitetit të biznesit. Prandaj, ndryshimi i treguesve nuk ndodh menjëherë, por ka një inerci të caktuar.
  • 3. Efekti i rrjetës së merimangës. Në shumë fusha të prodhimit dhe të tjera, treguesit ekonomikë i përgjigjen ndryshimeve të kushteve ekonomike me vonesë (vonesa kohore).
  • 4. Zbutja e të dhënave. Shpesh, të dhënat për një periudhë të caktuar kohore të gjatë merren nga mesatarja e të dhënave në intervalet e tyre përbërëse. Kjo mund të çojë në një zbutje të caktuar të luhatjeve që kanë ekzistuar brenda periudhës në shqyrtim, e cila nga ana tjetër mund të shkaktojë autokorrelacion.

Pasojat e autokorrelacionit janë të ngjashme me pasojat e heteroskedasticitetit: përfundimet nga statistikat t- dhe F që përcaktojnë rëndësinë e koeficientit të regresionit dhe koeficientit të përcaktimit ka të ngjarë të jenë të pasakta.



Ju pëlqeu artikulli? Ndani me miqtë tuaj!