Pse përdoret metoda e katrorëve më të vegjël? Rasti i një modeli polinom

Metoda me katrorin më të vogël

Në mësimin e fundit të temës, do të njihemi me aplikacionin më të famshëm FNP, i cili gjen aplikimin më të gjerë në fusha të ndryshme të shkencës dhe veprimtarisë praktike. Kjo mund të jetë fizika, kimia, biologjia, ekonomia, sociologjia, psikologjia, e kështu me radhë, e kështu me radhë. Me vullnetin e fatit, shpesh më duhet të merrem me ekonominë, dhe për këtë arsye sot do të organizoj për ju një udhëtim në një vend të mahnitshëm të quajtur Ekonometria=) ...Si nuk e deshiron?! Është shumë mirë atje - thjesht duhet të vendosni! ...Por ajo që me siguri dëshironi patjetër është të mësoni se si t'i zgjidhni problemet Metoda e katrorëve më të vegjël. Dhe veçanërisht lexuesit e zellshëm do të mësojnë t'i zgjidhin ato jo vetëm me saktësi, por edhe SHUME SHPEJTË ;-) Por së pari deklaratë e përgjithshme e problemit+ shembulli shoqërues:

Le të studiojmë tregues në një fushë të caktuar lëndore që kanë një shprehje sasiore. Në të njëjtën kohë, ka çdo arsye për të besuar se treguesi varet nga treguesi. Ky supozim mund të jetë ose një hipotezë shkencore ose i bazuar në sensin bazë të përbashkët. Megjithatë, le ta lëmë mënjanë shkencën dhe të eksplorojmë zona më të shijshme - domethënë, dyqanet ushqimore. Le të shënojmë me:

– zona me pakicë e një dyqani ushqimor, m2,
- qarkullimi vjetor i një dyqani ushqimor, milion rubla.

Është absolutisht e qartë se sa më e madhe të jetë sipërfaqja e dyqanit, aq më i madh do të jetë në shumicën e rasteve xhiroja e tij.

Supozoni se pas kryerjes së vëzhgimeve/eksperimenteve/llogaritjeve/valleve me një dajre kemi në dispozicion të dhëna numerike:

Me dyqanet ushqimore, mendoj se gjithçka është e qartë: - kjo është zona e dyqanit të parë, - qarkullimi vjetor i tij, - zona e dyqanit të dytë, - xhiroja vjetore e tij, etj. Nga rruga, nuk është aspak e nevojshme të kesh akses në materialet e klasifikuara - një vlerësim mjaft i saktë i qarkullimit tregtar mund të merret me anë të statistika matematikore. Sidoqoftë, le të mos shpërqendrohemi, kursi i spiunazhit tregtar tashmë është paguar =)

Të dhënat tabelare gjithashtu mund të shkruhen në formën e pikave dhe të përshkruhen në formën e njohur Sistemi kartezian .

Le t'i përgjigjemi një pyetjeje të rëndësishme: Sa pikë nevojiten për një studim cilësor?

Sa më i madh, aq më mirë. Seti minimal i pranueshëm përbëhet nga 5-6 pikë. Përveç kësaj, kur sasia e të dhënave është e vogël, rezultatet "anormale" nuk mund të përfshihen në mostër. Kështu, për shembull, një dyqan i vogël elitar mund të fitojë urdhra të përmasave më shumë se "kolegët e tij", duke shtrembëruar kështu modelin e përgjithshëm që duhet të gjeni!



Për ta thënë shumë thjesht, duhet të zgjedhim një funksion, orarin i cili kalon sa më afër pikave . Ky funksion quhet të përafërt (përafrim - përafrim) ose funksioni teorik . Në përgjithësi, këtu shfaqet menjëherë një "pretendues" i dukshëm - një polinom i shkallës së lartë, grafiku i të cilit kalon nëpër TË GJITHA pikat. Por ky opsion është i ndërlikuar dhe shpesh thjesht i pasaktë. (pasi grafiku do të "lak" gjatë gjithë kohës dhe do të pasqyrojë dobët tendencën kryesore).

Kështu, funksioni i kërkuar duhet të jetë mjaft i thjeshtë dhe në të njëjtën kohë të pasqyrojë në mënyrë adekuate varësinë. Siç mund ta merrni me mend, quhet një nga metodat për gjetjen e funksioneve të tilla Metoda e katrorëve më të vegjël. Së pari, le të shohim thelbin e tij në terma të përgjithshëm. Lërini disa funksione të përafrojnë të dhënat eksperimentale:


Si të vlerësohet saktësia e këtij përafrimi? Le të llogarisim edhe dallimet (devijimet) midis vlerave eksperimentale dhe funksionale (ne studiojmë vizatimin). Mendimi i parë që vjen në mendje është të vlerësojmë se sa e madhe është shuma, por problemi është se diferencat mund të jenë negative (Për shembull, ) dhe devijimet si rezultat i një përmbledhjeje të tillë do të anulojnë njëra-tjetrën. Prandaj, si një vlerësim i saktësisë së përafrimit, kërkon të merret shuma modulet devijimet:

ose i shembur: (në rast se dikush nuk e di: është ikona e shumës, dhe - një ndryshore ndihmëse "kundër", e cila merr vlera nga 1 në ) .

Duke përafruar pikat eksperimentale me funksione të ndryshme, do të marrim vlera të ndryshme, dhe padyshim, ku kjo shumë është më e vogël, ai funksion është më i saktë.

Një metodë e tillë ekziston dhe quhet metoda e modulit më të vogël. Megjithatë, në praktikë është bërë shumë më e përhapur metoda me katrorin më të vogël, në të cilën vlerat e mundshme negative eliminohen jo nga moduli, por duke kuadruar devijimet:



, pas së cilës përpjekjet synojnë të zgjedhin një funksion të tillë që shuma e devijimeve në katror ishte sa më i vogël. Në fakt, nga këtu vjen emri i metodës.

Dhe tani kthehemi në një pikë tjetër të rëndësishme: siç u përmend më lart, funksioni i zgjedhur duhet të jetë mjaft i thjeshtë - por ka edhe shumë funksione të tilla: lineare , hiperbolike , eksponenciale , logaritmike , kuadratike etj. Dhe, natyrisht, këtu do të doja menjëherë të "zvogëloja fushën e veprimtarisë". Cilën klasë funksionesh duhet të zgjedh për kërkime? Një teknikë primitive por efektive:

– Mënyra më e lehtë është të përshkruani pikat në vizatim dhe analizoni vendndodhjen e tyre. Nëse ata priren të vrapojnë në një vijë të drejtë, atëherë duhet të kërkoni ekuacioni i një linje me vlera optimale dhe . Me fjalë të tjera, detyra është të gjejmë koeficientë të tillë në mënyrë që shuma e devijimeve në katror të jetë më e vogla.

Nëse pikat janë të vendosura, për shembull, përgjatë hiperbolë, atëherë është e qartë se funksioni linear do të japë një përafrim të dobët. Në këtë rast, ne jemi duke kërkuar për koeficientët më "të favorshëm" për ekuacionin e hiperbolës – ato që japin shumën minimale të katrorëve .

Tani vini re se në të dyja rastet po flasim funksionet e dy variablave, argumentet e të cilit janë parametrat e varësisë së kërkuar:

Dhe në thelb ne duhet të zgjidhim një problem standard - të gjejmë funksioni minimal i dy variablave.

Le të kujtojmë shembullin tonë: supozoni se pikat e "magazinimit" priren të vendosen në një vijë të drejtë dhe ka çdo arsye për të besuar se varësia lineare qarkullim nga hapësira me pakicë. Le të gjejmë koeficientë të tillë "a" dhe "të jenë" të tillë që shuma e devijimeve në katror ishte më i vogli. Gjithçka është si zakonisht - së pari Derivatet e pjesshme të rendit të parë. Sipas rregulli i linearitetit Ju mund të dalloni pikërisht nën ikonën e shumës:

Nëse dëshironi ta përdorni këtë informacion për një ese ose punim terminor, do t'ju jem shumë mirënjohës për lidhjen në listën e burimeve, do të gjeni llogaritjet e tilla të detajuara në disa vende:

Le të krijojmë një sistem standard:

Ne zvogëlojmë çdo ekuacion me "dy" dhe, përveç kësaj, "ndajmë" shumat:

shënim : analizoni në mënyrë të pavarur pse "a" dhe "be" mund të hiqen përtej ikonës së shumës. Nga rruga, zyrtarisht kjo mund të bëhet me shumën

Le ta rishkruajmë sistemin në formën e "aplikuar":

pas së cilës fillon të shfaqet algoritmi për zgjidhjen e problemit tonë:

A i dimë koordinatat e pikave? E dimë. Shumat mund ta gjejmë? Lehtësisht. Le të bëjmë më të thjeshtën sistemi i dy ekuacioneve lineare në dy të panjohura("a" dhe "të jetë"). Ne e zgjidhim sistemin, për shembull, Metoda e Cramer-it, si rezultat i së cilës marrim një pikë të palëvizshme. Duke kontrolluar kusht i mjaftueshëm për një ekstrem, mund të verifikojmë se në këtë pikë funksioni arrin saktësisht minimale. Kontrolli përfshin llogaritje shtesë dhe për këtë arsye ne do ta lëmë atë në prapaskenë (nëse është e nevojshme, korniza që mungon mund të shihetKëtu ) . Ne nxjerrim përfundimin përfundimtar:

Funksioni menyra me e mire (të paktën krahasuar me çdo funksion tjetër linear) afron pikat eksperimentale . Përafërsisht, grafiku i tij kalon sa më afër këtyre pikave. Në traditë ekonometria quhet edhe funksioni i përafërt që rezulton ekuacioni i regresionit linear të çiftëzuar .

Problemi në shqyrtim ka një rëndësi të madhe praktike. Në situatën e shembullit tonë, barazimi. ju lejon të parashikoni se çfarë qarkullimi tregtar ("Ig") dyqani do të ketë në një ose një tjetër vlerë të zonës së shitjes (një ose një kuptim tjetër i "x"). Po, parashikimi që rezulton do të jetë vetëm një parashikim, por në shumë raste do të dalë mjaft i saktë.

Unë do të analizoj vetëm një problem me numrat "realë", pasi nuk ka vështirësi në të - të gjitha llogaritjet janë në nivelin e kurrikulës së shkollës së klasës 7-8. Në 95 për qind të rasteve, do t'ju kërkohet të gjeni vetëm një funksion linear, por në fund të artikullit do të tregoj se nuk është më e vështirë të gjesh ekuacionet e hiperbolës optimale, eksponenciale dhe disa funksione të tjera.

Në fakt, gjithçka që mbetet është të shpërndani të mirat e premtuara - në mënyrë që të mësoni të zgjidhni shembuj të tillë jo vetëm me saktësi, por edhe shpejt. Ne studiojmë me kujdes standardin:

Detyrë

Si rezultat i studimit të marrëdhënies midis dy treguesve, u morën çiftet e mëposhtme të numrave:

Duke përdorur metodën e katrorëve më të vegjël, gjeni funksionin linear që përafron më mirë atë empirik (me eksperience) të dhëna. Bëni një vizatim mbi të cilin do të ndërtohen pika eksperimentale dhe një grafik i funksionit të përafërt në një sistem koordinativ drejtkëndor kartezian . Gjeni shumën e devijimeve në katror ndërmjet vlerave empirike dhe teorike. Zbuloni nëse funksioni do të ishte më i mirë (nga pikëpamja e metodës së katrorëve më të vegjël) afroni pikat eksperimentale.

Ju lutemi vini re se kuptimet "x" janë të natyrshme dhe kjo ka një kuptim karakteristik kuptimor, për të cilin do të flas pak më vonë; por ato, natyrisht, mund të jenë edhe të pjesshme. Për më tepër, në varësi të përmbajtjes së një detyre të veçantë, vlerat "X" dhe "lojë" mund të jenë plotësisht ose pjesërisht negative. Epo, na është dhënë një detyrë "pa fytyrë" dhe ne e fillojmë atë zgjidhje:

Ne gjejmë koeficientët e funksionit optimal si zgjidhje për sistemin:

Për qëllime të regjistrimit më kompakt, ndryshorja "kundër" mund të hiqet, pasi tashmë është e qartë se përmbledhja kryhet nga 1 në .

Është më i përshtatshëm për të llogaritur shumat e kërkuara në formë tabelare:


Llogaritjet mund të kryhen në një mikrollogaritës, por është shumë më mirë të përdorni Excel - më shpejt dhe pa gabime; shikoni një video të shkurtër:

Kështu, marrim sa vijon sistemi:

Këtu mund të shumëzoni ekuacionin e dytë me 3 dhe Zbrisni të 2-tin nga ekuacioni i 1-rë termi për term. Por ky është fat - në praktikë, sistemet shpesh nuk janë dhuratë, dhe në raste të tilla kursen Metoda e Cramer-it:
, që do të thotë se sistemi ka një zgjidhje unike.

Le të kontrollojmë. Unë e kuptoj që ju nuk dëshironi, por pse të kaloni gabimet ku ato absolutisht nuk mund të mungojnë? Le ta zëvendësojmë zgjidhjen e gjetur në anën e majtë të secilit ekuacion të sistemit:

Janë marrë anët e djathta të ekuacioneve përkatëse, që do të thotë se sistemi është zgjidhur saktë.

Kështu, funksioni i dëshiruar përafrues: – nga të gjitha funksionet lineareËshtë ajo që përafron më së miri të dhënat eksperimentale.

Ndryshe nga drejt varësia e xhiros së dyqanit nga zona e tij, varësia e gjetur është e kundërta (parimi "sa më shumë, aq më pak"), dhe ky fakt zbulohet menjëherë nga negativi shpat. Funksioni na tregon se me një rritje të një treguesi të caktuar me 1 njësi, vlera e treguesit të varur zvogëlohet mesatare me 0.65 njësi. Siç thonë ata, sa më i lartë të jetë çmimi i hikërrorit, aq më pak shitet.

Për të paraqitur grafikun e funksionit të përafërt, gjejmë dy vlerat e tij:

dhe ekzekutoni vizatimin:

Drejtëza e ndërtuar quhet linjë trendi (domethënë, një linjë trendi lineare, d.m.th. në rastin e përgjithshëm, një trend nuk është domosdoshmërisht një vijë e drejtë). Të gjithë e njohin shprehjen “të jesh në trend” dhe mendoj se ky term nuk ka nevojë për komente shtesë.

Le të llogarisim shumën e devijimeve në katror midis vlerave empirike dhe teorike. Gjeometrikisht, kjo është shuma e katrorëve të gjatësisë së segmenteve të "mjedrës". (dy prej të cilave janë aq të vogla sa që as nuk duken).

Le të përmbledhim llogaritjet në një tabelë:


Ato mund të bëhen përsëri me dorë, për çdo rast, unë do të jap një shembull për pikën e parë:

por është shumë më efektive ta bësh atë në mënyrën e njohur tashmë:

E përsërisim edhe një herë: Cili është kuptimi i rezultatit të marrë? Nga të gjitha funksionet lineare y funksion treguesi është më i vogli, domethënë në familjen e tij është përafrimi më i mirë. Dhe këtu, meqë ra fjala, pyetja përfundimtare e problemit nuk është e rastësishme: po sikur funksioni eksponencial i propozuar a do të ishte më mirë të afroheshin pikat eksperimentale?

Le të gjejmë shumën përkatëse të devijimeve në katror - për t'i dalluar, unë do t'i tregoj ato me shkronjën "epsilon". Teknika është saktësisht e njëjtë:


Dhe përsëri, për çdo rast, llogaritjet për pikën 1:

Në Excel përdorim funksionin standard EXP (Sintaksa mund të gjendet në Excel Help).

konkluzioni: , që do të thotë se funksioni eksponencial i përafron pikat eksperimentale më keq se një drejtëz .

Por këtu duhet theksuar se "më keq" është nuk do të thotë akoma, çfarë nuk shkon. Tani kam ndërtuar një grafik të këtij funksioni eksponencial - dhe ai gjithashtu kalon afër pikave - aq sa pa hulumtime analitike është e vështirë të thuhet se cili funksion është më i saktë.

Kjo e mbyll zgjidhjen, dhe unë kthehem te çështja e vlerave natyrore të argumentit. Në studime të ndryshme, zakonisht ekonomike ose sociologjike, "X" natyrore përdoren për të numëruar muaj, vite ose intervale të tjera të barabarta kohore. Merrni, për shembull, problemin e mëposhtëm:

Të dhënat e mëposhtme janë të disponueshme për qarkullimin me pakicë të dyqanit për gjysmën e parë të vitit:

Duke përdorur shtrirjen analitike drejtvizore, përcaktoni vëllimin e qarkullimit për korrikun.

Po, nuk ka problem: ne numërojmë muajt 1, 2, 3, 4, 5, 6 dhe përdorim algoritmin e zakonshëm, si rezultat i të cilit marrim një ekuacion - e vetmja gjë është që kur bëhet fjalë për kohën, ata zakonisht përdorin shkronja "te" (edhe pse kjo nuk është kritike). Ekuacioni që rezulton tregon se në gjysmën e parë të vitit xhiroja tregtare është rritur mesatarisht me 27.74 njësi. në muaj. Le të marrim parashikimin për korrikun (muaji nr. 7): d.e.

Dhe ka shumë detyra si kjo. Ata që dëshirojnë mund të përdorin një shërbim shtesë, përkatësisht timin Llogaritësi Excel (versioni demo), e cila zgjidh problemin e analizuar pothuajse menjëherë! Versioni i punës i programit është i disponueshëm ne shkembim ose për tarifë simbolike.

Në fund të orës së mësimit, informacion i shkurtër për gjetjen e varësive të disa llojeve të tjera. Në fakt, nuk ka shumë për të thënë, pasi qasja themelore dhe algoritmi i zgjidhjes mbeten të njëjta.

Le të supozojmë se rregullimi i pikave eksperimentale i ngjan një hiperbole. Pastaj, për të gjetur koeficientët e hiperbolës më të mirë, duhet të gjeni minimumin e funksionit - çdokush mund të kryejë llogaritjet e hollësishme dhe të arrijë në një sistem të ngjashëm:

Nga pikëpamja teknike formale, ajo merret nga një sistem "linear". (le ta shënojmë me një yll) duke zëvendësuar "x" me . Po në lidhje me shumat? llogaritni, pas së cilës deri te koeficientët optimalë "a" dhe "be" afër në dorë.

Nëse ka çdo arsye për të besuar se pikat ndodhen përgjatë një lakore logaritmike, pastaj për të gjetur vlerat optimale gjejmë minimumin e funksionit . Formalisht, në sistemin (*) duhet të zëvendësohet me:

Kur kryeni llogaritjet në Excel, përdorni funksionin LN. E pranoj se nuk do të ishte veçanërisht e vështirë për mua të krijoja kalkulatorë për secilin prej rasteve në shqyrtim, por gjithsesi do të ishte më mirë që t'i "programonit" vetë llogaritjet. Video mësimore për të ndihmuar.

Me varësinë eksponenciale situata është pak më e ndërlikuar. Për ta reduktuar lëndën në rastin linear, marrim logaritmin e funksionit dhe përdorim vetitë e logaritmit:

Tani, duke krahasuar funksionin që rezulton me funksionin linear, arrijmë në përfundimin se në sistemin (*) duhet të zëvendësohet me , dhe – me . Për lehtësi, le të shënojmë:

Ju lutemi vini re se sistemi zgjidhet në lidhje me dhe, prandaj, pasi të keni gjetur rrënjët, nuk duhet të harroni të gjeni vetë koeficientin.

Për të afruar pikat eksperimentale parabola optimale , duhet gjetur funksion minimal prej tre variablave . Pas kryerjes së veprimeve standarde, marrim "punën" e mëposhtme sistemi:

Po, sigurisht, këtu ka më shumë shuma, por nuk ka aspak vështirësi kur përdorni aplikacionin tuaj të preferuar. Dhe së fundi, unë do t'ju tregoj se si të kryeni shpejt një kontroll duke përdorur Excel dhe të ndërtoni linjën e dëshiruar të prirjes: krijoni një komplot shpërndarjeje, zgjidhni ndonjë nga pikat me miun dhe kliko me të djathtën për të zgjedhur opsionin "Shto linjë trendi". Më pas, zgjidhni llojin e grafikut dhe në skedën "Opsione" aktivizoni opsionin "Trego ekuacionin në diagram". Ne rregull

Si gjithmonë, dua ta përfundoj artikullin me një frazë të bukur dhe pothuajse shkrova "Bëhu në trend!" Por ai ndryshoi mendje me kohë. Dhe jo sepse është stereotip. Nuk e di si është për askënd, por nuk dua shumë të ndjek trendin e promovuar amerikan dhe veçanërisht evropian =) Prandaj, uroj që secili prej jush të qëndrojë në linjën e tij!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Metoda e katrorëve më të vegjël është një nga më të zakonshmet dhe më të zhvilluarat për shkak të saj thjeshtësia dhe efikasiteti i metodave për vlerësimin e parametrave të modeleve lineare ekonometrike. Në të njëjtën kohë, gjatë përdorimit të tij, duhet pasur kujdes, pasi modelet e ndërtuara duke përdorur atë mund të mos plotësojnë një sërë kërkesash për cilësinë e parametrave të tyre dhe, si rezultat, të mos pasqyrojnë "mirë" modelet e zhvillimit të procesit. mjaft.

Le të shqyrtojmë më në detaje procedurën për vlerësimin e parametrave të një modeli ekonometrik linear duke përdorur metodën e katrorëve më të vegjël. Një model i tillë në përgjithësi mund të përfaqësohet nga ekuacioni (1.2):

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t.

Të dhënat fillestare kur vlerësohen parametrat a 0, a 1,..., a n është një vektor i vlerave të ndryshores së varur y= (y 1 , y 2 , ... , y T)" dhe matricën e vlerave të variablave të pavarur

në të cilën kolona e parë, e përbërë nga një, korrespondon me koeficientin e modelit.

Metoda e katrorëve më të vegjël mori emrin e saj bazuar në parimin bazë që vlerësimet e parametrave të marra në bazë të saj duhet të plotësojnë: shuma e katrorëve të gabimit të modelit duhet të jetë minimale.

Shembuj të zgjidhjes së problemave duke përdorur metodën e katrorëve më të vegjël

Shembulli 2.1. Ndërmarrja tregtare ka një rrjet prej 12 dyqanesh, informacioni mbi aktivitetet e të cilave është paraqitur në tabelë. 2.1.

Menaxhmenti i ndërmarrjes dëshiron të dijë se si madhësia e qarkullimit vjetor varet nga hapësira e shitjes me pakicë të dyqanit.

Tabela 2.1

Numri i dyqanit Qarkullimi vjetor, milion rubla. Sipërfaqja me pakicë, mijë m2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Zgjidhja me metodën e katrorëve më të vegjël. Le të tregojmë qarkullimin vjetor të dyqanit të th, milion rubla; - sipërfaqja me pakicë e dyqanit, mijë m2.

Fig.2.1. Scatterplot për shembullin 2.1

Për të përcaktuar formën e marrëdhënies funksionale ndërmjet variablave dhe do të ndërtojmë një diagramë shpërndarjeje (Fig. 2.1).

Bazuar në diagramin e shpërndarjes, mund të konkludojmë se qarkullimi vjetor varet pozitivisht nga hapësira e shitjes me pakicë (d.m.th., y do të rritet me rritjen ). Forma më e përshtatshme e lidhjes funksionale është lineare.

Informacioni për llogaritjet e mëtejshme është paraqitur në tabelë. 2.2. Duke përdorur metodën e katrorëve më të vegjël, ne vlerësojmë parametrat e një modeli ekonometrik linear me një faktor

Tabela 2.2

t y t x 1t y t 2 x 1t 2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Mesatare 68,29 0,89

Kështu,

Prandaj, me një rritje të hapësirës me pakicë me 1 mijë m2, duke qenë të barabarta gjërat e tjera, qarkullimi mesatar vjetor rritet me 67,8871 milion rubla.

Shembulli 2.2. Menaxhmenti i kompanisë vuri re se qarkullimi vjetor varet jo vetëm nga zona e shitjes së dyqanit (shih shembullin 2.1), por edhe nga numri mesatar i vizitorëve. Informacioni përkatës është paraqitur në tabelë. 2.3.

Tabela 2.3

Zgjidhje. Le të shënojmë - numrin mesatar të vizitorëve në dyqanin e th në ditë, mijëra njerëz.

Për të përcaktuar formën e marrëdhënies funksionale ndërmjet variablave dhe do të ndërtojmë një diagram shpërhapjeje (Fig. 2.2).

Bazuar në scatterplot, mund të konkludojmë se qarkullimi vjetor është pozitivisht i varur nga numri mesatar i vizitorëve në ditë (d.m.th., y do të rritet me rritjen ). Forma e varësisë funksionale është lineare.

Oriz. 2.2. Scatterplot për shembullin 2.2

Tabela 2.4

t x 2t x 2t 2 y t x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Mesatare 10,65

Në përgjithësi, është e nevojshme të përcaktohen parametrat e një modeli ekonometrik me dy faktorë

y t = a 0 + a 1 x 1t + a 2 x 2t + ε t

Informacioni i kërkuar për llogaritjet e mëtejshme është paraqitur në tabelë. 2.4.

Le të vlerësojmë parametrat e një modeli ekonometrik linear me dy faktorë duke përdorur metodën e katrorëve më të vegjël.

Kështu,

Vlerësimi i koeficientit =61.6583 tregon se, duke qenë të barabarta të gjërave të tjera, me një rritje të hapësirës me pakicë me 1 mijë m 2, qarkullimi vjetor do të rritet mesatarisht me 61.6583 milion rubla.

Vlerësimi i koeficientit = 2,2748 tregon se, duke qenë të barabarta, me një rritje të numrit mesatar të vizitorëve për 1 mijë persona. në ditë, qarkullimi vjetor do të rritet me një mesatare prej 2.2748 milion rubla.

Shembulli 2.3. Duke përdorur informacionin e paraqitur në tabelë. 2.2 dhe 2.4, vlerësoni parametrin e modelit ekonometrik me një faktor

ku është vlera e përqendruar e qarkullimit vjetor të dyqanit, milion rubla; - vlera e përqendruar e numrit mesatar ditor të vizitorëve në dyqanin t-të, mijë persona. (shih shembujt 2.1-2.2).

Zgjidhje. Informacioni shtesë i kërkuar për llogaritjet është paraqitur në tabelë. 2.5.

Tabela 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Shuma 48,4344 431,0566

Duke përdorur formulën (2.35), marrim

Kështu,

http://www.cleverstudents.ru/articles/mnk.html

Shembull.

Të dhëna eksperimentale për vlerat e variablave X Dhe janë dhënë në tabelë.

Si rezultat i shtrirjes së tyre, fitohet funksioni

Duke përdorur metoda me katrorin më të vogël, përafroni këto të dhëna me një varësi lineare y=sëpatë+b(gjeni parametrat A Dhe b). Gjeni se cila nga dy rreshtat (në kuptimin e metodës së katrorëve më të vegjël) i përafron më mirë të dhënat eksperimentale. Bëni një vizatim.

Zgjidhje.

Në shembullin tonë n=5. Plotësojmë tabelën për lehtësinë e llogaritjes së shumave që përfshihen në formulat e koeficientëve të kërkuar.

Vlerat në rreshtin e katërt të tabelës merren duke shumëzuar vlerat e rreshtit të dytë me vlerat e rreshtit të tretë për çdo numër i.

Vlerat në rreshtin e pestë të tabelës fitohen duke kuadruar vlerat në rreshtin e dytë për çdo numër i.

Vlerat në kolonën e fundit të tabelës janë shumat e vlerave nëpër rreshta.

Ne përdorim formulat e metodës së katrorëve më të vegjël për të gjetur koeficientët A Dhe b. Ne zëvendësojmë vlerat përkatëse nga kolona e fundit e tabelës në to:

Prandaj, y = 0,165x+2,184- vijën e drejtë të përafërt të dëshiruar.

Mbetet për të gjetur se cila nga rreshtat y = 0,165x+2,184 ose përafron më mirë të dhënat origjinale, domethënë bën një vlerësim duke përdorur metodën e katrorëve më të vegjël.

Dëshmi.

Kështu që kur të gjendet A Dhe b funksioni merr vlerën më të vogël, është e nevojshme që në këtë pikë matrica e formës kuadratike të diferencialit të rendit të dytë për funksionin. ishte pozitive definitive. Le ta tregojmë.

Diferenciali i rendit të dytë ka formën:

Kjo eshte

Prandaj, matrica e formës kuadratike ka formën

dhe vlerat e elementeve nuk varen nga A Dhe b.

Le të tregojmë se matrica është pozitive e përcaktuar. Për ta bërë këtë, të miturit këndorë duhet të jenë pozitivë.

Minor këndor i rendit të parë . Pabarazia është e rreptë, që nga pikat

Përafrimi i të dhënave eksperimentale është një metodë e bazuar në zëvendësimin e të dhënave të marra në mënyrë eksperimentale me një funksion analitik që kalon ose përputhet më afër në pikat nyjore me vlerat origjinale (të dhënat e marra gjatë një eksperimenti ose eksperimenti). Aktualisht, ekzistojnë dy mënyra për të përcaktuar një funksion analitik:

Duke ndërtuar një polinom interpolimi me n shkallë që kalon drejtpërdrejt nëpër të gjitha pikat grup të dhënash të dhëna. Në këtë rast, funksioni i përafërt paraqitet në formën e: një polinomi interpolimi në formën e Lagranzhit ose një polinomi interpolimi në formën e Njutonit.

Duke ndërtuar një polinom të përafërt me n shkallë që kalon në afërsinë më të afërt me pikat nga një grup i caktuar të dhënash. Kështu, funksioni i përafërt zbut të gjitha zhurmat (ose gabimet) e rastësishme që mund të lindin gjatë eksperimentit: vlerat e matura gjatë eksperimentit varen nga faktorë të rastësishëm që luhaten sipas ligjeve të tyre të rastësishme (gabimet e matjes ose instrumentit, pasaktësia ose eksperimenti gabime). Në këtë rast, funksioni i përafërt përcaktohet duke përdorur metodën e katrorëve më të vegjël.

Metoda me katrorin më të vogël(në literaturën në gjuhën angleze Ordinary Least Squares, OLS) është një metodë matematikore e bazuar në përcaktimin e funksionit të përafërt, i cili është ndërtuar në afërsinë më të afërt me pikat nga një grup i caktuar të dhënash eksperimentale. Afërsia e funksioneve origjinale dhe të përafërta F(x) përcaktohet nga një masë numerike, përkatësisht: shuma e devijimeve në katror të të dhënave eksperimentale nga kurba e përafërt F(x) duhet të jetë më e vogla.

Lakorja e përafërt e ndërtuar duke përdorur metodën e katrorëve më të vegjël

Përdoret metoda e katrorëve më të vegjël:

Të zgjidhë sisteme ekuacionesh të mbipërcaktuara kur numri i ekuacioneve tejkalon numrin e të panjohurave;

Për të gjetur një zgjidhje në rastin e sistemeve të zakonshme (jo të mbipërcaktuara) jolineare të ekuacioneve;

Për të përafruar vlerat e pikave me disa funksione të përafërta.

Funksioni i përafërt duke përdorur metodën e katrorëve më të vegjël përcaktohet nga kushti i shumës minimale të devijimeve në katror të funksionit të përafërt të llogaritur nga një grup i caktuar të dhënash eksperimentale. Ky kriter i metodës së katrorëve më të vegjël shkruhet si shprehja e mëposhtme:

Vlerat e funksionit të përafërt të llogaritur në pikat nyjore,

Një grup i caktuar i të dhënave eksperimentale në pikat nyjore.

Kriteri kuadratik ka një sërë veçorish "të mira", të tilla si diferencueshmëria, duke ofruar një zgjidhje unike për problemin e përafrimit me funksionet e përafrimit polinomial.

Në varësi të kushteve të problemit, funksioni i përafërt është një polinom i shkallës m

Shkalla e funksionit të përafërt nuk varet nga numri i pikave nodale, por dimensioni i tij duhet të jetë gjithmonë më i vogël se dimensioni (numri i pikave) i një grupi të dhënash eksperimentale të dhëna.

∙ Nëse shkalla e funksionit përafrues është m=1, atëherë funksionin tabelor e përafrojmë me drejtëz (regresion linear).

∙ Nëse shkalla e funksionit të përafërt është m=2, atëherë funksionin e tabelës e përafrojmë me një parabolë kuadratike (përafrim kuadratik).

∙ Nëse shkalla e funksionit të përafërt është m=3, atëherë funksionin e tabelës e përafrojmë me një parabolë kubike (përafrim kub).

Në rastin e përgjithshëm, kur është e nevojshme të ndërtohet një polinom i përafërt i shkallës m për vlerat e dhëna të tabelës, kushti për minimumin e shumës së devijimeve në katror mbi të gjitha pikat nyjore rishkruhet në formën e mëposhtme:

- koeficientët e panjohur të polinomit të përafërt të shkallës m;

Numri i vlerave të tabelës së specifikuar.

Një kusht i domosdoshëm për ekzistencën e një minimumi të një funksioni është barazia me zero e derivateve të tij të pjesshme në lidhje me variablat e panjohur. . Si rezultat, marrim sistemin e mëposhtëm të ekuacioneve:

Le të transformojmë sistemin linear të ekuacioneve që rezulton: hapni kllapat dhe zhvendosni termat e lirë në anën e djathtë të shprehjes. Si rezultat, sistemi rezultues i shprehjeve algjebrike lineare do të shkruhet në formën e mëposhtme:

Ky sistem i shprehjeve lineare algjebrike mund të rishkruhet në formë matrice:

Si rezultat, u përftua një sistem ekuacionesh lineare me dimension m+1, i cili përbëhet nga m+1 të panjohura. Ky sistem mund të zgjidhet duke përdorur çdo metodë për zgjidhjen e ekuacioneve algjebrike lineare (për shembull, metoda Gaussian). Si rezultat i zgjidhjes do të gjenden parametra të panjohur të funksionit përafrues që sigurojnë shumën minimale të devijimeve në katror të funksionit përafrues nga të dhënat origjinale, d.m.th. përafrimi kuadratik më i mirë i mundshëm. Duhet mbajtur mend se nëse edhe një vlerë e të dhënave burimore ndryshon, të gjithë koeficientët do të ndryshojnë vlerat e tyre, pasi ato përcaktohen plotësisht nga të dhënat burimore.

Përafrimi i të dhënave burimore sipas varësisë lineare

(regresionit linear)

Si shembull, le të shqyrtojmë teknikën për përcaktimin e funksionit të përafërt, i cili specifikohet në formën e një varësie lineare. Në përputhje me metodën e katrorëve më të vegjël, kushti për minimumin e shumës së devijimeve në katror shkruhet në formën e mëposhtme:

Koordinatat e nyjeve të tabelës;

Koeficientët e panjohur të funksionit të përafërt, i cili specifikohet si një varësi lineare.

Një kusht i domosdoshëm për ekzistencën e një minimumi të një funksioni është barazia me zero e derivateve të tij të pjesshme në lidhje me variablat e panjohur. Si rezultat, marrim sistemin e mëposhtëm të ekuacioneve:

Le të transformojmë sistemin linear të ekuacioneve që rezulton.

Ne zgjidhim sistemin rezultues të ekuacioneve lineare. Koeficientët e funksionit të përafërt në formë analitike përcaktohen si më poshtë (metoda e Cramer):

Këta koeficientë sigurojnë ndërtimin e një funksioni linear përafrues në përputhje me kriterin e minimizimit të shumës së katrorëve të funksionit të përafërt nga vlerat e dhëna tabelare (të dhëna eksperimentale).

Algoritmi për zbatimin e metodës së katrorëve më të vegjël

1. Të dhënat fillestare:

Përcaktohet një grup të dhënash eksperimentale me numrin e matjeve N

Përcaktohet shkalla e polinomit të përafërt (m).

2. Algoritmi i llogaritjes:

2.1. Koeficientët përcaktohen për ndërtimin e një sistemi ekuacionesh me dimensione

Koeficientët e sistemit të ekuacioneve (ana e majtë e ekuacionit)

- indeksi i numrit të kolonës së matricës katrore të sistemit të ekuacioneve

Termat e lirë të një sistemi ekuacionesh lineare (ana e djathtë e ekuacionit)

- indeksi i numrit të rreshtit të matricës katrore të sistemit të ekuacioneve

2.2. Formimi i një sistemi ekuacionesh lineare me dimension .

2.3. Zgjidhja e një sistemi ekuacionesh lineare për të përcaktuar koeficientët e panjohur të një polinomi të përafërt të shkallës m.

2.4 Përcaktimi i shumës së devijimeve në katror të polinomit të përafërt nga vlerat origjinale në të gjitha pikat nyjore.

Vlera e gjetur e shumës së devijimeve në katror është minimumi i mundshëm.

Përafrimi duke përdorur funksione të tjera

Duhet të theksohet se kur përafrohen të dhënat origjinale në përputhje me metodën e katrorëve më të vegjël, funksioni logaritmik, funksioni eksponencial dhe funksioni i fuqisë përdoren ndonjëherë si funksion përafrues.

Përafrimi logaritmik

Le të shqyrtojmë rastin kur funksioni i përafërt jepet nga një funksion logaritmik i formës:

Metoda me katrorin më të vogël përdoret për të vlerësuar parametrat e ekuacionit të regresionit.
Numri i rreshtave (të dhënat e burimit)

Një nga metodat për studimin e marrëdhënieve stokastike midis karakteristikave është analiza e regresionit.
Analiza e regresionit është nxjerrja e një ekuacioni të regresionit, me ndihmën e të cilit gjendet vlera mesatare e një ndryshoreje të rastësishme (atributi i rezultatit) nëse dihet vlera e një ndryshoreje tjetër (ose të tjera) (faktor-atribute). Ai përfshin hapat e mëposhtëm:

  1. përzgjedhja e formës së lidhjes (lloji i ekuacionit të regresionit analitik);
  2. vlerësimi i parametrave të ekuacionit;
  3. vlerësimi i cilësisë së ekuacionit të regresionit analitik.
Më shpesh, një formë lineare përdoret për të përshkruar marrëdhënien statistikore të veçorive. Fokusi në marrëdhëniet lineare shpjegohet nga interpretimi i qartë ekonomik i parametrave të tij, variacioni i kufizuar i variablave dhe fakti që në shumicën e rasteve format jolineare të marrëdhënieve konvertohen (me logaritëm ose zëvendësim të variablave) në një formë lineare për të kryer llogaritjet. .
Në rastin e një lidhjeje lineare dyshe, ekuacioni i regresionit do të marrë formën: y i =a+b·x i +u i . Parametrat a dhe b të këtij ekuacioni janë vlerësuar nga të dhënat e vrojtimit statistikor x dhe y. Rezultati i një vlerësimi të tillë është ekuacioni: , ku , janë vlerësimet e parametrave a dhe b , është vlera e atributit rezultues (variabli) i marrë nga ekuacioni i regresionit (vlera e llogaritur).

Më shpesh përdoret për të vlerësuar parametrat metoda e katrorëve më të vegjël (LSM).
Metoda e katrorëve më të vegjël siguron vlerësimet më të mira (të qëndrueshme, efikase dhe të paanshme) të parametrave të ekuacionit të regresionit. Por vetëm nëse plotësohen supozime të caktuara në lidhje me termin e rastësishëm (u) dhe variablin e pavarur (x) (shih supozimet OLS).

Problemi i vlerësimit të parametrave të një ekuacioni të çiftit linear duke përdorur metodën e katrorëve më të vegjëlështë si më poshtë: për të marrë vlerësime të tilla të parametrave, në të cilat shuma e devijimeve në katror të vlerave aktuale të karakteristikës rezultante - y i nga vlerat e llogaritura - është minimale.
Formalisht Testi OLS mund të shkruhet kështu: .

Klasifikimi i metodave të katrorëve më të vegjël

  1. Metoda me katrorin më të vogël.
  2. Metoda e gjasave maksimale (për një model normal klasik të regresionit linear, është postuluar normaliteti i mbetjeve të regresionit).
  3. Metoda e përgjithësuar e katrorëve më të vegjël OLS përdoret në rastin e autokorrelacionit të gabimeve dhe në rastin e heteroskedasticitetit.
  4. Metoda e katrorëve më të vegjël të ponderuar (një rast i veçantë i OLS me mbetje heteroskedastike).

Le të ilustrojmë çështjen metoda klasike e katrorëve më të vegjël në mënyrë grafike. Për ta bërë këtë, ne do të ndërtojmë një grafik shpërndarjeje bazuar në të dhënat e vëzhgimit (x i, y i, i=1;n) në një sistem koordinativ drejtkëndor (një grafik i tillë shpërndarjeje quhet fushë korrelacioni). Le të përpiqemi të zgjedhim një vijë të drejtë që është më afër pikave të fushës së korrelacionit. Sipas metodës së katrorëve më të vegjël, vija zgjidhet në mënyrë që shuma e katrorëve të distancave vertikale ndërmjet pikave të fushës së korrelacionit dhe kësaj linje të jetë minimale.

Shënimi matematikor për këtë problem: .
Vlerat e y i dhe x i =1...n janë të njohura për ne; Në funksionin S ato paraqesin konstante. Variablat në këtë funksion janë vlerësimet e kërkuara të parametrave - , . Për të gjetur minimumin e një funksioni të dy variablave, është e nevojshme të llogariten derivatet e pjesshme të këtij funksioni për secilin prej parametrave dhe t'i barazojmë me zero, d.m.th. .
Si rezultat, marrim një sistem prej 2 ekuacionesh normale lineare:
Duke zgjidhur këtë sistem, gjejmë vlerësimet e kërkuara të parametrave:

Korrektësia e llogaritjes së parametrave të ekuacionit të regresionit mund të kontrollohet duke krahasuar shumat (mund të ketë disa mospërputhje për shkak të rrumbullakimit të llogaritjeve).
Për të llogaritur vlerësimet e parametrave, mund të ndërtoni Tabelën 1.
Shenja e koeficientit të regresionit b tregon drejtimin e marrëdhënies (nëse b >0, marrëdhënia është e drejtpërdrejtë, nëse b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Formalisht, vlera e parametrit a është vlera mesatare e y me x e barabartë me zero. Nëse atributi-faktor nuk ka dhe nuk mund të ketë një vlerë zero, atëherë interpretimi i mësipërm i parametrit a nuk ka kuptim.

Vlerësimi i afërsisë së marrëdhënies ndërmjet karakteristikave kryhet duke përdorur koeficientin e korrelacionit të çiftit linear - r x,y. Mund të llogaritet duke përdorur formulën: . Për më tepër, koeficienti i korrelacionit të çiftit linear mund të përcaktohet përmes koeficientit të regresionit b: .
Gama e vlerave të pranueshme të koeficientit të korrelacionit të çiftit linear është nga -1 në +1. Shenja e koeficientit të korrelacionit tregon drejtimin e marrëdhënies. Nëse r x, y >0, atëherë lidhja është e drejtpërdrejtë; nëse r x, y<0, то связь обратная.
Nëse ky koeficient është afër unitetit në madhësi, atëherë marrëdhënia midis karakteristikave mund të interpretohet si një linjë mjaft e ngushtë. Nëse moduli i tij është i barabartë me një ê r x, y ê =1, atëherë lidhja ndërmjet karakteristikave është funksionale lineare. Nëse tiparet x dhe y janë linearisht të pavarura, atëherë r x,y është afër 0.
Për të llogaritur r x, y, mund të përdorni gjithashtu tabelën 1.

Tabela 1

N vëzhgimex iy ix i ∙y i
1 x 1y 1x 1 y 1
2 x 2y 2x 2 y 2
...
nx ny nx n y n
Shuma sipas kolonës∑x∑y∑xy
Vlera mesatare
Për të vlerësuar cilësinë e ekuacionit të regresionit që rezulton, llogaritni koeficientin teorik të përcaktimit - R 2 yx:

,
ku d 2 është varianca e y e shpjeguar nga ekuacioni i regresionit;
e 2 - varianca e mbetur (e pashpjegueshme nga ekuacioni i regresionit) të y;
s 2 y - varianca totale (totali) e y.
Koeficienti i përcaktimit karakterizon proporcionin e variacionit (dispersionit) të atributit rezultant y të shpjeguar me regresion (dhe, rrjedhimisht, faktorin x) në variacionin total (dispersion) y. Koeficienti i përcaktimit R 2 yx merr vlera nga 0 në 1. Prandaj, vlera 1-R 2 yx karakterizon proporcionin e variancës y të shkaktuar nga ndikimi i faktorëve të tjerë që nuk merren parasysh në model dhe gabimet e specifikimit.
Me regresion linear të çiftuar, R 2 yx =r 2 yx.

Shembull.

Të dhëna eksperimentale për vlerat e variablave X Dhe janë dhënë në tabelë.

Si rezultat i shtrirjes së tyre, fitohet funksioni

Duke përdorur metoda me katrorin më të vogël, përafroni këto të dhëna me një varësi lineare y=sëpatë+b(gjeni parametrat A Dhe b). Gjeni se cila nga dy rreshtat (në kuptimin e metodës së katrorëve më të vegjël) i përafron më mirë të dhënat eksperimentale. Bëni një vizatim.

Thelbi i metodës së katrorëve më të vegjël (LSM).

Detyra është të gjejmë koeficientët e varësisë lineare në të cilat funksionojnë dy ndryshore A Dhe b merr vlerën më të vogël. Kjo është, e dhënë A Dhe b shuma e devijimeve në katror të të dhënave eksperimentale nga drejtëza e gjetur do të jetë më e vogla. Kjo është e gjithë pika e metodës së katrorëve më të vegjël.

Kështu, zgjidhja e shembullit zbret në gjetjen e ekstremit të një funksioni të dy ndryshoreve.

Nxjerrja e formulave për gjetjen e koeficientëve.

Përpilohet dhe zgjidhet një sistem me dy ekuacione me dy të panjohura. Gjetja e derivateve të pjesshme të një funksioni sipas variablave A Dhe b, i barazojmë këto derivate me zero.

Ne zgjidhim sistemin rezultues të ekuacioneve duke përdorur çdo metodë (për shembull me metodën e zëvendësimit ose Metoda e Cramer-it) dhe merrni formulat për gjetjen e koeficientëve duke përdorur metodën e katrorëve më të vegjël (LSM).

E dhënë A Dhe b funksionin merr vlerën më të vogël. Dëshmia e këtij fakti është dhënë më poshtë në tekstin në fund të faqes.

Kjo është e gjithë metoda e katrorëve më të vegjël. Formula për gjetjen e parametrit a përmban shumat ,,, dhe parametrin n- sasia e të dhënave eksperimentale. Ne rekomandojmë llogaritjen e vlerave të këtyre shumave veç e veç. Koeficient b gjetur pas llogaritjes a.

Është koha për të kujtuar shembullin origjinal.

Zgjidhje.

Në shembullin tonë n=5. Plotësojmë tabelën për lehtësinë e llogaritjes së shumave që përfshihen në formulat e koeficientëve të kërkuar.

Vlerat në rreshtin e katërt të tabelës merren duke shumëzuar vlerat e rreshtit të dytë me vlerat e rreshtit të tretë për çdo numër i.

Vlerat në rreshtin e pestë të tabelës fitohen duke kuadruar vlerat në rreshtin e dytë për çdo numër i.

Vlerat në kolonën e fundit të tabelës janë shumat e vlerave nëpër rreshta.

Ne përdorim formulat e metodës së katrorëve më të vegjël për të gjetur koeficientët A Dhe b. Ne zëvendësojmë vlerat përkatëse nga kolona e fundit e tabelës në to:

Prandaj, y = 0,165x+2,184- vijën e drejtë të përafërt të dëshiruar.

Mbetet për të gjetur se cila nga rreshtat y = 0,165x+2,184 ose përafron më mirë të dhënat origjinale, domethënë bën një vlerësim duke përdorur metodën e katrorëve më të vegjël.

Vlerësimi i gabimit të metodës së katrorëve më të vegjël.

Për ta bërë këtë, ju duhet të llogaritni shumën e devijimeve në katror të të dhënave origjinale nga këto rreshta Dhe , një vlerë më e vogël i korrespondon një rreshti që përafron më mirë të dhënat origjinale në kuptimin e metodës së katrorëve më të vegjël.

Që atëherë, drejt y = 0,165x+2,184 përafron më mirë të dhënat origjinale.

Ilustrimi grafik i metodës së katrorëve më të vegjël (LS).

Gjithçka është qartë e dukshme në grafikët. Vija e kuqe është vija e drejtë e gjetur y = 0,165x+2,184, vija blu është , pikat rozë janë të dhënat origjinale.

Në praktikë, kur modeloni procese të ndryshme - në veçanti, ekonomike, fizike, teknike, sociale - përdoret gjerësisht një ose një metodë tjetër e llogaritjes së vlerave të përafërta të funksioneve nga vlerat e tyre të njohura në pika të caktuara fikse.

Ky lloj problemi i përafrimit të funksionit shpesh lind:

    kur ndërtoni formula të përafërta për llogaritjen e vlerave të sasive karakteristike të procesit në studim duke përdorur të dhëna tabelare të marra si rezultat i eksperimentit;

    në integrimin numerik, diferencimin, zgjidhjen e ekuacioneve diferenciale etj.;

    nëse është e nevojshme, llogaritni vlerat e funksioneve në pikat e ndërmjetme të intervalit të konsideruar;

    kur përcaktohen vlerat e sasive karakteristike të një procesi jashtë intervalit të konsideruar, veçanërisht gjatë parashikimit.

Nëse, për të modeluar një proces të caktuar të specifikuar nga një tabelë, ndërtojmë një funksion që përafërsisht përshkruan këtë proces bazuar në metodën e katrorëve më të vegjël, ai do të quhet funksion përafrues (regresion) dhe vetë problemi i ndërtimit të funksioneve të përafërta do të quhet një problem përafrimi.

Ky artikull diskuton aftësitë e paketës MS Excel për zgjidhjen e këtij lloj problemi, përveç kësaj, ai ofron metoda dhe teknika për ndërtimin (krijimin) e regresioneve për funksionet e tabeluara (që është baza e analizës së regresionit).

Excel ka dy opsione për ndërtimin e regresioneve.

    Shtimi i regresioneve (vijave të prirjes) të zgjedhur në një diagram të ndërtuar mbi bazën e një tabele të dhënash për karakteristikën e procesit në studim (e disponueshme vetëm nëse është ndërtuar një diagram);

    Përdorimi i funksioneve statistikore të integruara të fletës së punës Excel, duke ju lejuar të merrni regresione (linjat e trendit) direkt nga tabela e të dhënave burimore.

Shtimi i linjave të tendencës në një grafik

Për një tabelë të dhënash që përshkruan një proces dhe përfaqësohet nga një diagram, Excel ka një mjet efektiv të analizës së regresionit që ju lejon të:

    ndërtoni në bazë të metodës së katrorëve më të vegjël dhe shtoni pesë lloje regresionesh në diagram, të cilat modelojnë procesin në studim me shkallë të ndryshme saktësie;

    shtoni në diagram ekuacionin e ndërtuar të regresionit;

    përcaktoni shkallën e korrespondencës së regresionit të zgjedhur me të dhënat e shfaqura në grafik.

Bazuar në të dhënat e grafikut, Excel ju lejon të merrni lloje lineare, polinomiale, logaritmike, fuqie, eksponenciale të regresioneve, të cilat specifikohen nga ekuacioni:

y = y(x)

ku x është një variabël i pavarur që shpesh merr vlerat e një sekuence numrash natyrorë (1; 2; 3; ...) dhe prodhon, për shembull, një numërim mbrapsht të kohës së procesit në studim (karakteristikat).

1 . Regresioni linear është i mirë për modelimin e karakteristikave, vlerat e të cilave rriten ose ulen me një ritëm konstant. Ky është modeli më i thjeshtë për t'u ndërtuar për procesin në studim. Është ndërtuar në përputhje me ekuacionin:

y = mx + b

ku m është tangjentja e pjerrësisë së regresionit linear me abshisën; b - koordinata e pikës së prerjes së regresionit linear me boshtin e ordinatës.

2 . Një linjë prirje polinomiale është e dobishme për të përshkruar karakteristikat që kanë disa ekstreme të dallueshme (maksimum dhe minimum). Zgjedhja e shkallës polinomiale përcaktohet nga numri i ekstremeve të karakteristikës në studim. Kështu, një polinom i shkallës së dytë mund të përshkruajë mirë një proces që ka vetëm një maksimum ose minimum; polinomi i shkallës së tretë - jo më shumë se dy ekstreme; polinomi i shkallës së katërt - jo më shumë se tre ekstreme, etj.

Në këtë rast, linja e trendit ndërtohet në përputhje me ekuacionin:

y = c0 + c1x + c2x2 + c3x3 + c4x4 + c5x5 + c6x6

ku koeficientët c0, c1, c2,... c6 janë konstante vlerat e të cilave përcaktohen gjatë ndërtimit.

3 . Linja e prirjes logaritmike përdoret me sukses gjatë modelimit të karakteristikave, vlerat e të cilave fillimisht ndryshojnë me shpejtësi dhe më pas stabilizohen gradualisht.

y = c ln(x) + b

4 . Linja e prirjes së ligjit të fuqisë jep rezultate të mira nëse vlerat e marrëdhënies në studim karakterizohen nga një ndryshim i vazhdueshëm në normën e rritjes. Një shembull i një varësie të tillë është grafiku i lëvizjes së njëtrajtshme të përshpejtuar të një makine. Nëse ka vlera zero ose negative në të dhëna, nuk mund të përdorni një linjë të trendit të energjisë.

Ndërtuar në përputhje me ekuacionin:

y = c xb

ku koeficientët b, c janë konstante.

5 . Një linjë trendi eksponenciale duhet të përdoret kur shkalla e ndryshimit të të dhënave është vazhdimisht në rritje. Për të dhënat që përmbajnë vlera zero ose negative, ky lloj përafrimi gjithashtu nuk është i zbatueshëm.

Ndërtuar në përputhje me ekuacionin:

y = c ebx

ku koeficientët b, c janë konstante.

Kur zgjedh një linjë trendi, Excel llogarit automatikisht vlerën e R2, e cila karakterizon besueshmërinë e përafrimit: sa më afër unitetit të jetë vlera R2, aq më e besueshme është linja e tendencës përafërsisht procesin në studim. Nëse është e nevojshme, vlera R2 mund të shfaqet gjithmonë në grafik.

Përcaktohet nga formula:

Për të shtuar një linjë trendi në një seri të dhënash:

    aktivizoni një grafik bazuar në një seri të dhënash, p.sh. klikoni brenda zonës së grafikut. Artikulli Diagram do të shfaqet në menynë kryesore;

    pasi të klikoni mbi këtë artikull, në ekran do të shfaqet një meny në të cilën duhet të zgjidhni komandën Shto linjën e trendit.

Të njëjtat veprime mund të zbatohen lehtësisht duke lëvizur treguesin e miut mbi grafikun që korrespondon me një nga seritë e të dhënave dhe duke klikuar me të djathtën; Në menynë e kontekstit që shfaqet, zgjidhni komandën Shto linjën e trendit. Kutia e dialogut Trendline do të shfaqet në ekran me skedën Type të hapur (Fig. 1).

Pas kësaj ju duhet:

Zgjidhni llojin e kërkuar të linjës së prirjes në skedën Lloji (lloji Linear zgjidhet si parazgjedhje). Për llojin Polynomial, në fushën Degree, specifikoni shkallën e polinomit të zgjedhur.

1 . Fusha e ndërtuar në seri rendit të gjitha seritë e të dhënave në grafikun në fjalë. Për të shtuar një linjë trendi në një seri specifike të dhënash, zgjidhni emrin e saj në fushën Ndërtuar në seri.

Nëse është e nevojshme, duke shkuar te skeda Parametrat (Fig. 2), mund të vendosni parametrat e mëposhtëm për linjën e trendit:

    ndryshoni emrin e linjës së prirjes në Emrin e fushës së kurbës së përafërt (të zbutur).

    caktoni numrin e periudhave (përpara ose prapa) për parashikimin në fushën Parashikimi;

    shfaqni ekuacionin e vijës së prirjes në zonën e diagramit, për të cilën duhet të aktivizoni ekuacionin e shfaqjes në kutinë e kontrollit të diagramit;

    shfaqni vlerën e besueshmërisë së përafrimit R2 në zonën e diagramit, për të cilën duhet të aktivizoni kutinë e kontrollit Vendos vlerën e besueshmërisë së përafrimit në diagram (R^2);

    vendosni pikën e kryqëzimit të vijës së prirjes me boshtin Y, për të cilin duhet të aktivizoni kutinë e kontrollit për kryqëzimin e kurbës me boshtin Y në një pikë;

    Klikoni butonin OK për të mbyllur kutinë e dialogut.

Për të filluar redaktimin e një linje trendi tashmë të vizatuar, ekzistojnë tre mënyra:

    përdorni komandën Selected trend line nga menyja Format, pasi keni zgjedhur më parë linjën e trendit;

    zgjidhni komandën Format line trend nga menyja e kontekstit, e cila thirret duke klikuar me të djathtën në vijën e trendit;

    klikoni dy herë në vijën e trendit.

Kutia e dialogut Formati i linjës së tendencës do të shfaqet në ekran (Fig. 3), që përmban tre skeda: Pamja, Lloji, Parametrat dhe përmbajtja e dy të fundit përputhet plotësisht me skedat e ngjashme të kutisë së dialogut të linjës së trendit (Fig. 1 -2). Në skedën View, mund të vendosni llojin e linjës, ngjyrën dhe trashësinë e saj.

Për të fshirë një linjë tendence që është tërhequr tashmë, zgjidhni vijën e tendencës që do të fshihet dhe shtypni butonin Delete.

Përparësitë e mjetit të analizës së regresionit të konsideruar janë:

    lehtësia relative e ndërtimit të një linje trendi në grafikët pa krijuar një tabelë të dhënash për të;

    një listë mjaft e gjerë e llojeve të linjave të tendencave të propozuara, dhe kjo listë përfshin llojet më të përdorura të regresionit;

    aftësia për të parashikuar sjelljen e procesit në studim nga një numër arbitrar (brenda kufijve të sensit të përbashkët) hapash përpara dhe gjithashtu prapa;

    aftësia për të marrë ekuacionin e linjës së trendit në formë analitike;

    mundësia, nëse është e nevojshme, për të marrë një vlerësim të besueshmërisë së përafrimit.

Disavantazhet përfshijnë si më poshtë:

    ndërtimi i një linje trendi kryhet vetëm nëse ekziston një diagram i ndërtuar mbi një seri të dhënash;

    procesi i gjenerimit të serive të të dhënave për karakteristikën në studim bazuar në ekuacionet e linjës së trendit të marra për të është disi i rrëmujshëm: ekuacionet e kërkuara të regresionit përditësohen me çdo ndryshim në vlerat e serisë së të dhënave origjinale, por vetëm brenda zonës së grafikut. , ndërkohë që seria e të dhënave e formuar në bazë të tendencës së ekuacionit të linjës së vjetër mbetet e pandryshuar;

    Në raportet e PivotChart, ndryshimi i pamjes së një grafiku ose raporti të lidhur me PivotTable nuk ruan linjat ekzistuese të trendit, që do të thotë se përpara se të vizatoni vija trendi ose të formatoni ndryshe një raport PivotChart, duhet të siguroheni që paraqitja e raportit plotëson kërkesat e kërkuara.

Linjat e tendencës mund të përdoren për të plotësuar seritë e të dhënave të paraqitura në grafikët si grafikët, histogramët, grafikët e zonave të sheshta jo të standardizuara, grafikët me shirita, grafikët e shpërndarjes, grafikët me flluska dhe grafikët e aksioneve.

Ju nuk mund të shtoni linja prirje në seritë e të dhënave në grafikët 3D, të normalizuar, radar, byrek dhe donut.

Përdorimi i funksioneve të integruara të Excel

Excel ka gjithashtu një mjet për analizën e regresionit për vizatimin e linjave të tendencës jashtë zonës së grafikut. Ekzistojnë një numër funksionesh statistikore të fletës së punës që mund të përdoren për këtë qëllim, por të gjitha ato lejojnë vetëm regresione lineare ose eksponenciale.

Excel ka disa funksione për ndërtimin e regresionit linear, në veçanti:

    TRENDI;

  • SHPJERI dhe PRERJE.

Si dhe disa funksione për ndërtimin e një linje trendi eksponencial, në veçanti:

    LGRFPRIBL.

Duhet të theksohet se teknikat për ndërtimin e regresioneve duke përdorur funksionet TREND dhe GROWTH janë pothuajse të njëjta. E njëjta gjë mund të thuhet për çiftin e funksioneve LINEST dhe LGRFPRIBL. Për këto katër funksione, krijimi i një tabele vlerash përdor veçori të Excel-it si formulat e grupeve, të cilat disi rrëmujnë procesin e ndërtimit të regresioneve. Le të theksojmë gjithashtu se ndërtimi i regresionit linear, sipas mendimit tonë, realizohet më lehtë duke përdorur funksionet SLOPE dhe INTERCEPT, ku i pari prej tyre përcakton pjerrësinë e regresionit linear dhe i dyti përcakton segmentin e ndërprerë nga regresioni në boshti y.

Përparësitë e veglës së funksioneve të integruara për analizën e regresionit janë:

    një proces mjaft i thjeshtë dhe uniform i gjenerimit të serive të të dhënave të karakteristikës në studim për të gjitha funksionet statistikore të integruara që përcaktojnë linjat e trendit;

    metodologji standarde për ndërtimin e linjave të trendit bazuar në seritë e gjeneruara të të dhënave;

    aftësia për të parashikuar sjelljen e procesit në studim me numrin e kërkuar të hapave përpara ose prapa.

Disavantazhet përfshijnë faktin se Excel nuk ka funksione të integruara për krijimin e llojeve të tjera (përveç lineare dhe eksponenciale) të linjave të trendit. Kjo rrethanë shpesh nuk lejon zgjedhjen e një modeli mjaft të saktë të procesit në studim, si dhe marrjen e parashikimeve që janë afër realitetit. Përveç kësaj, kur përdorni funksionet TREND dhe RRITJE, ekuacionet e linjave të trendit nuk dihen.

Duhet të theksohet se autorët nuk u përpoqën të paraqisnin kursin e analizës së regresionit me ndonjë shkallë të plotësisë. Detyra e tij kryesore është të tregojë, duke përdorur shembuj specifikë, aftësitë e paketës Excel kur zgjidh problemet e përafrimit; demonstroni se çfarë mjetesh efektive ka Excel për ndërtimin e regresioneve dhe parashikimit; ilustrojnë se si probleme të tilla mund të zgjidhen relativisht lehtë edhe nga një përdorues që nuk ka njohuri të gjera për analizën e regresionit.

Shembuj të zgjidhjes së problemeve specifike

Le të shohim zgjidhjen e problemeve specifike duke përdorur mjetet e listuara të Excel.

Problemi 1

Me një tabelë të dhënash për fitimin e një ndërmarrje transporti automobilistik për vitet 1995-2002. ju duhet të bëni sa më poshtë:

    Ndërtoni një diagram.

    Shtoni linjat e trendit linear dhe polinom (kuadratik dhe kub) në grafik.

    Duke përdorur ekuacionet e linjës së prirjes, merrni të dhëna tabelare mbi fitimet e ndërmarrjes për secilën linjë prirje për 1995-2004.

    Bëni një parashikim për fitimin e ndërmarrjes për 2003 dhe 2004.

Zgjidhja e problemit

    Në rangun e qelizave A4:C11 të fletës së punës Excel, futni fletën e punës të paraqitur në Fig. 4.

    Pasi kemi zgjedhur gamën e qelizave B4:C11, ndërtojmë një diagram.

    Aktivizojmë diagramin e ndërtuar dhe, sipas metodës së përshkruar më sipër, pasi kemi zgjedhur llojin e linjës së trendit në kutinë e dialogut të linjës së tendencës (shih Fig. 1), shtojmë në mënyrë alternative në diagram linjat e trendit linear, kuadratik dhe kub. Në të njëjtën kuti dialogu, hapni skedën Parametrat (shih Fig. 2), në emrin e fushës së kurbës së përafërt (të zbutur), shkruani emrin e trendit që po shtohet dhe në fushën Parashikimi përpara për: periudhat, vendosni vlera 2, pasi është planifikuar të bëhet një parashikim fitimi për dy vitet e ardhshme. Për të shfaqur ekuacionin e regresionit dhe vlerën e besueshmërisë së përafrimit R2 në zonën e diagramit, aktivizoni ekuacionin e shfaqjes në kutitë e kontrollit të ekranit dhe vendosni vlerën e besueshmërisë së përafrimit (R^2) në diagram. Për perceptim më të mirë vizual, ne ndryshojmë llojin, ngjyrën dhe trashësinë e linjave të tendencave të ndërtuara, për të cilat përdorim skedën View në kutinë e dialogut Formati i linjës së trendit (shih Fig. 3). Diagrami që rezulton me linjat e tendencës së shtuar është paraqitur në Fig. 5.

    Për të marrë të dhëna tabelare mbi fitimet e ndërmarrjeve për çdo linjë trendi për 1995-2004. Le të përdorim ekuacionet e linjës së trendit të paraqitur në Fig. 5. Për ta bërë këtë, në qelizat e diapazonit D3:F3, futni informacionin e tekstit në lidhje me llojin e linjës së tendencës së zgjedhur: Trendi linear, Trendi kuadratik, trendi kub. Më pas, futni formulën e regresionit linear në qelizën D4 dhe, duke përdorur shënuesin e mbushjes, kopjoni këtë formulë me referenca relative në diapazonin e qelizave D5:D13. Duhet të theksohet se çdo qelizë me një formulë regresioni linear nga diapazoni i qelizave D4:D13 ka si argument një qelizë përkatëse nga diapazoni A4:A13. Në mënyrë të ngjashme, për regresionin kuadratik, plotësoni gamën e qelizave E4:E13, dhe për regresionin kub, plotësoni gamën e qelizave F4:F13. Kështu, është përpiluar një parashikim për fitimin e ndërmarrjes për vitet 2003 dhe 2004. duke përdorur tre tendenca. Tabela që rezulton e vlerave është paraqitur në Fig. 6.

Problemi 2

    Ndërtoni një diagram.

    Shtoni linjat e tendencës logaritmike, fuqisë dhe eksponenciale në grafik.

    Nxirrni ekuacionet e linjave të prirjeve të marra, si dhe vlerat e besueshmërisë së përafrimit R2 për secilën prej tyre.

    Duke përdorur ekuacionet e linjës së prirjes, merrni të dhëna tabelare mbi fitimin e ndërmarrjes për secilën linjë trendi për 1995-2002.

    Bëni një parashikim të fitimit të kompanisë për 2003 dhe 2004 duke përdorur këto linja prirje.

Zgjidhja e problemit

Duke ndjekur metodologjinë e dhënë në zgjidhjen e problemit 1, marrim një diagram me linja logaritmike, fuqie dhe tendencash eksponenciale të shtuara në të (Fig. 7). Më pas, duke përdorur ekuacionet e marra të linjës së trendit, ne plotësojmë një tabelë vlerash për fitimin e ndërmarrjes, duke përfshirë vlerat e parashikuara për 2003 dhe 2004. (Fig. 8).

Në Fig. 5 dhe fig. mund të shihet se modeli me prirje logaritmike i korrespondon vlerës më të ulët të besueshmërisë së përafrimit

R2 = 0,8659

Vlerat më të larta të R2 korrespondojnë me modelet me një prirje polinomiale: kuadratike (R2 = 0,9263) dhe kub (R2 = 0,933).

Problemi 3

Me tabelën e të dhënave për fitimin e një ndërmarrje transporti motorik për vitet 1995-2002, të dhënë në detyrën 1, duhet të kryeni hapat e mëposhtëm.

    Merrni seritë e të dhënave për linjat e prirjeve lineare dhe eksponenciale duke përdorur funksionet TREND dhe GROW.

    Duke përdorur funksionet TREND dhe RRITJE, bëni një parashikim të fitimit të ndërmarrjes për 2003 dhe 2004.

    Ndërtoni një diagram për të dhënat origjinale dhe seritë e të dhënave që rezultojnë.

Zgjidhja e problemit

Le të përdorim fletën e punës për problemin 1 (shih Fig. 4). Le të fillojmë me funksionin TREND:

    zgjidhni gamën e qelizave D4:D11, e cila duhet të plotësohet me vlerat e funksionit TREND që korrespondon me të dhënat e njohura për fitimin e ndërmarrjes;

    Thirrni komandën Funksion nga menyja Insert. Në kutinë e dialogut Function Wizard që shfaqet, zgjidhni funksionin TREND nga kategoria Statistikore dhe më pas klikoni butonin OK. I njëjti veprim mund të kryhet duke klikuar butonin (Insert Function) në shiritin standard të veglave.

    Në kutinë e dialogut "Argumentet e funksionit" që shfaqet, futni gamën e qelizave C4:C11 në fushën Vlerat e_njohura_y; në fushën Vlerat_njohura_x - diapazoni i qelizave B4:B11;

    Për ta bërë formulën e futur të bëhet një formulë grupi, përdorni kombinimin e tastit + + .

Formula që kemi futur në shiritin e formulave do të duket si: =(TREND(C4:C11,B4:B11)).

Si rezultat, diapazoni i qelizave D4:D11 është i mbushur me vlerat përkatëse të funksionit TREND (Fig. 9).

Për të bërë një parashikim të fitimit të ndërmarrjes për 2003 dhe 2004. nevojshme:

    zgjidhni gamën e qelizave D12:D13 ku do të futen vlerat e parashikuara nga funksioni TREND.

    thirrni funksionin TREND dhe në kutinë e dialogut Argumentet e funksionit që shfaqet, futni në fushën Vlerat_y_njohura - gamën e qelizave C4:C11; në fushën Vlerat_njohura_x - diapazoni i qelizave B4:B11; dhe në fushën New_values_x - diapazoni i qelizave B12:B13.

    kthejeni këtë formulë në një formulë grupi duke përdorur kombinimin e tastit Ctrl + Shift + Enter.

    Formula e futur do të duket si: =(TREND(C4:C11;B4:B11;B12:B13)), dhe diapazoni i qelizave D12:D13 do të plotësohet me vlerat e parashikuara të funksionit TREND (shih Fig. 9).

Seria e të dhënave plotësohet në mënyrë të ngjashme duke përdorur funksionin GROWTH, i cili përdoret në analizën e varësive jolineare dhe funksionon saktësisht në të njëjtën mënyrë si homologu i tij linear TREND.

Figura 10 tregon tabelën në modalitetin e shfaqjes së formulës.

Për të dhënat fillestare dhe seritë e të dhënave të marra, diagrami i paraqitur në Fig. njëmbëdhjetë.

Problemi 4

Me tabelën e të dhënave për marrjen e aplikacioneve për shërbime nga shërbimi dispeçer i një ndërmarrje transporti motorik për periudhën nga data 1 deri në 11 të muajit aktual, duhet të kryeni veprimet e mëposhtme.

    Merrni seritë e të dhënave për regresionin linear: duke përdorur funksionet SLOPE dhe INTERCEPT; duke përdorur funksionin LINEST.

    Merrni një seri të dhënash për regresionin eksponencial duke përdorur funksionin LGRFPRIBL.

    Duke përdorur funksionet e mësipërme, bëni një parashikim për marrjen e aplikacioneve në shërbimin e dërgimit për periudhën nga data 12 deri në 14 të muajit aktual.

    Krijoni një diagram për serinë e të dhënave origjinale dhe të marra.

Zgjidhja e problemit

Vini re se, ndryshe nga funksionet TREND dhe GROWTH, asnjë nga funksionet e listuara më sipër (SHPJETËSIA, INTERCEPT, LINEST, LGRFPRIB) nuk janë regresioni. Këto funksione luajnë vetëm një rol mbështetës, duke përcaktuar parametrat e nevojshëm të regresionit.

Për regresionet lineare dhe eksponenciale të ndërtuara duke përdorur funksionet SLOPE, INTERCEPT, LINEST, LGRFPRIB, pamja e ekuacioneve të tyre është gjithmonë e njohur, në ndryshim nga regresionet lineare dhe eksponenciale që korrespondojnë me funksionet TREND dhe GROWTH.

1 . Le të ndërtojmë një regresion linear me ekuacionin:

y = mx+b

duke përdorur funksionet SLOPE dhe INTERCEPT, me pjerrësinë e regresionit m të përcaktuar nga funksioni SLOPE, dhe termin e lirë b nga funksioni INTERCEPT.

Për ta bërë këtë, ne kryejmë veprimet e mëposhtme:

    futni tabelën origjinale në diapazonin e qelizave A4:B14;

    vlera e parametrit m do të përcaktohet në qelizën C19. Zgjidhni funksionin Slope nga kategoria Statistikore; futni gamën e qelizave B4:B14 në fushën e vlerave_y_njohur dhe gamën e qelizave A4:A14 në fushën e vlerave_x_njohur. Formula do të futet në qelizën C19: =SLOPE(B4:B14,A4:A14);

    Duke përdorur një teknikë të ngjashme, përcaktohet vlera e parametrit b në qelizën D19. Dhe përmbajtja e tij do të duket si: =SEGMENT(B4:B14,A4:A14). Kështu, vlerat e parametrave m dhe b të kërkuara për ndërtimin e një regresioni linear do të ruhen në qelizat C19, D19, përkatësisht;

    Më pas, futni formulën e regresionit linear në qelizën C4 në formën: =$C*A4+$D. Në këtë formulë, qelizat C19 dhe D19 shkruhen me referenca absolute (adresa e qelizës nuk duhet të ndryshojë gjatë kopjimit të mundshëm). Shenja e referencës absolute $ mund të shtypet ose nga tastiera ose duke përdorur tastin F4, pasi të vendosni kursorin në adresën e qelizës. Duke përdorur dorezën e mbushjes, kopjoni këtë formulë në gamën e qelizave C4:C17. Ne marrim seritë e kërkuara të të dhënave (Fig. 12). Për shkak të faktit se numri i kërkesave është një numër i plotë, duhet të vendosni formatin e numrave me numrin e numrave dhjetorë në 0 në skedën Number në dritaren e Formatit të qelizës.

2 . Tani le të ndërtojmë një regresion linear të dhënë nga ekuacioni:

y = mx+b

duke përdorur funksionin LINEST.

Për këtë:

    Futni funksionin LINEST si një formulë grupi në diapazonin e qelizave C20:D20: =(LINEST(B4:B14,A4:A14)). Si rezultat, marrim vlerën e parametrit m në qelizën C20 dhe vlerën e parametrit b në qelizën D20;

    shkruani formulën në qelizën D4: =$C*A4+$D;

    kopjoni këtë formulë duke përdorur shënuesin e mbushjes në diapazonin e qelizave D4:D17 dhe merrni serinë e dëshiruar të të dhënave.

3 . Ne ndërtojmë një regresion eksponencial me ekuacionin:

duke përdorur funksionin LGRFPRIBL kryhet në mënyrë të ngjashme:

    Në rangun e qelizave C21:D21 ne futim funksionin LGRFPRIBL si formulë grupi: =( LGRFPRIBL (B4:B14,A4:A14)). Në këtë rast, vlera e parametrit m do të përcaktohet në qelizën C21, dhe vlera e parametrit b do të përcaktohet në qelizën D21;

    formula futet në qelizën E4: =$D*$C^A4;

    duke përdorur shënuesin mbushës, kjo formulë kopjohet në diapazonin e qelizave E4:E17, ku do të vendoset seria e të dhënave për regresionin eksponencial (shih Fig. 12).

Në Fig. Figura 13 tregon një tabelë ku mund të shihni funksionet që përdorim me diapazonin e kërkuar të qelizave, si dhe formulat.

Madhësia R 2 thirrur koeficienti i përcaktimit.

Detyra e ndërtimit të një varësie regresioni është gjetja e vektorit të koeficientëve m të modelit (1) në të cilin koeficienti R merr vlerën maksimale.

Për të vlerësuar rëndësinë e R, përdoret testi F Fisher, i llogaritur duke përdorur formulën

Ku n- madhësia e mostrës (numri i eksperimenteve);

k është numri i koeficientëve të modelit.

Nëse F tejkalon një vlerë kritike për të dhënat n Dhe k dhe probabiliteti i pranuar i besimit, atëherë vlera e R konsiderohet e rëndësishme. Tabelat e vlerave kritike të F jepen në librat e referencës mbi statistikat matematikore.

Kështu, rëndësia e R përcaktohet jo vetëm nga vlera e tij, por edhe nga raporti midis numrit të eksperimenteve dhe numrit të koeficientëve (parametrave) të modelit. Në të vërtetë, raporti i korrelacionit për n=2 për një model të thjeshtë linear është i barabartë me 1 (një vijë e vetme e drejtë mund të vizatohet gjithmonë përmes 2 pikave në një plan). Megjithatë, nëse të dhënat eksperimentale janë variabla të rastësishme, një vlerë e tillë e R duhet t'i besohet me shumë kujdes. Zakonisht, për të marrë një regresion të rëndësishëm R dhe të besueshëm, ata përpiqen të sigurojnë që numri i eksperimenteve të tejkalojë ndjeshëm numrin e koeficientëve të modelit (n>k).

Për të ndërtuar një model regresioni linear ju nevojiten:

1) përgatit një listë me n rreshta dhe m kolona që përmbajnë të dhëna eksperimentale (kolona që përmban vlerën e daljes Y duhet të jetë i pari ose i fundit në listë); Për shembull, le të marrim të dhënat nga detyra e mëparshme, duke shtuar një kolonë të quajtur "Nr. Periudha", numëroni numrat e periudhës nga 1 në 12. (këto do të jenë vlerat X)

2) shkoni te menyja Data/Analiza e të dhënave/Regresioni

Nëse artikulli "Analiza e të dhënave" në menynë "Mjetet" mungon, atëherë duhet të shkoni te artikulli "Shtesa" në të njëjtën meny dhe të kontrolloni kutinë e kontrollit "Paketa e analizës".

3) në kutinë e dialogut "Regresion", vendosni:

· intervali i hyrjes Y;

· intervali i hyrjes X;

· intervali i daljes - qeliza e sipërme e majtë e intervalit në të cilin do të vendosen rezultatet e llogaritjes (rekomandohet vendosja e tyre në një fletë pune të re);

4) klikoni "Ok" dhe analizoni rezultatet.

100 RUR bonus për porosinë e parë

Zgjidh llojin e punës Puna e diplomës Puna e lëndës Punimi i lëndës Abstrakt Punimi i magjistraturës Raport praktike Artikull Raport Rishikim Punë testimi Monografi Zgjidhja e problemeve Plan biznesi Përgjigjet e pyetjeve Punë krijuese Ese Vizatim Ese Përkthimi Prezantime Shtypje Tjetër Rritja e veçantisë së tekstit Punimi i magjistraturës Punë laboratorike Ndihmë online

Zbuloni çmimin

Metoda e katrorëve më të vegjël është një teknikë matematikore (matematiko-statistikore) që përdoret për të përafruar seritë kohore, për të identifikuar formën e korrelacionit midis variablave të rastësishëm, etj. Konsiston në faktin se funksioni që përshkruan këtë fenomen përafrohet me një funksion më të thjeshtë. Për më tepër, kjo e fundit zgjidhet në atë mënyrë që devijimi standard (shih Shpërndarjen) i niveleve aktuale të funksionit në pikat e vëzhguara nga ato të rreshtuara të jetë më i vogli.

Për shembull, sipas të dhënave në dispozicion ( xi,yi) (i = 1, 2, ..., n) ndërtohet një kurbë e tillë y = a + bx, në të cilën arrihet shuma minimale e devijimeve në katror

d.m.th., një funksion në varësi të dy parametrave minimizohet: a- segment në boshtin e ordinatave dhe b- pjerrësia e vijës së drejtë.

Ekuacionet që japin kushtet e nevojshme për minimizimin e funksionit S(a,b), quhen ekuacionet normale. Si funksione përafruese, përdoren jo vetëm lineare (rreshtimi përgjatë një vije të drejtë), por edhe kuadratik, parabolik, eksponencial, etj. Për një shembull të rreshtimit të një serie kohore përgjatë një vije të drejtë, shih Fig. M.2, ku shuma e distancave në katror ( y 1 – ȳ 1)2 + (y 2 – ȳ 2)2 .... është më i vogli dhe vija e drejtë që rezulton pasqyron më së miri prirjen e një serie dinamike vëzhgimesh të një treguesi të caktuar me kalimin e kohës.

Për vlerësimet e paanshme OLS, është e nevojshme dhe e mjaftueshme të përmbushet kushti më i rëndësishëm i analizës së regresionit: pritshmëria matematikore e një gabimi të rastësishëm, e kushtëzuar nga faktorët, duhet të jetë e barabartë me zero. Ky kusht, në veçanti, plotësohet nëse: 1. pritshmëria matematikore e gabimeve të rastit është zero, dhe 2. faktorët dhe gabimet e rastit janë variabla të rastësishme të pavarura. Kushti i parë mund të konsiderohet gjithmonë i përmbushur për modelet me një konstante, pasi konstanta merr një pritje matematikore jo zero të gabimeve. Kushti i dytë - kushti i ekzogjenitetit të faktorëve - është thelbësor. Nëse kjo pronë nuk plotësohet, atëherë mund të supozojmë se pothuajse çdo vlerësim do të jetë jashtëzakonisht i pakënaqshëm: ato as nuk do të jenë të qëndrueshme (d.m.th., edhe një sasi shumë e madhe e të dhënave nuk na lejon të marrim vlerësime me cilësi të lartë në këtë rast ).

Metoda më e zakonshme e vlerësimit statistikor të parametrave të ekuacioneve të regresionit është metoda e katrorëve më të vegjël. Kjo metodë bazohet në një numër supozimesh në lidhje me natyrën e të dhënave dhe rezultatet e modelit. Ato kryesore janë një ndarje e qartë e variablave origjinalë në të varur dhe të pavarur, moskorrelacioni i faktorëve të përfshirë në ekuacione, lineariteti i marrëdhënies, mungesa e autokorrelacionit të mbetjeve, barazia e pritshmërive të tyre matematikore në zero dhe konstante. dispersion.

Një nga hipotezat kryesore të OLS është supozimi i barazisë së variancave të devijimeve ei, d.m.th. përhapja e tyre rreth vlerës mesatare (zero) të serisë duhet të jetë një vlerë e qëndrueshme. Kjo veti quhet homoskedasticitet. Në praktikë, variancat e devijimeve janë mjaft shpesh të pabarabarta, domethënë vërehet heteroskedasticiteti. Kjo mund të jetë për arsye të ndryshme. Për shembull, mund të ketë gabime në të dhënat burimore. Pasaktësitë e herëpashershme në informacionin burimor, të tilla si gabimet në renditjen e numrave, mund të kenë një ndikim të rëndësishëm në rezultate. Shpesh, një përhapje më e madhe e devijimeve єi vërehet me vlera të mëdha të ndryshores së varur (variablave). Nëse të dhënat përmbajnë një gabim domethënës, atëherë, natyrisht, devijimi i vlerës së modelit të llogaritur nga të dhënat e gabuara do të jetë gjithashtu i madh. Për të hequr qafe këtë gabim, duhet të zvogëlojmë kontributin e këtyre të dhënave në rezultatet e llogaritjes, duke u caktuar atyre më pak peshë se të gjithë të tjerëve. Kjo ide zbatohet në OLS të peshuara.



Ju pëlqeu artikulli? Ndani me miqtë tuaj!