Çfarë lloj metodash i përket analiza e regresionit? Korrelacioni për regresion të shumëfishtë

Analiza e regresionit dhe korrelacionit janë metoda kërkimore statistikore. Këto janë mënyrat më të zakonshme për të treguar varësinë e një parametri nga një ose më shumë variabla të pavarur.

Më poshtë, duke përdorur shembuj konkretë praktikë, do të shqyrtojmë këto dy analiza shumë të njohura midis ekonomistëve. Ne gjithashtu do të japim një shembull të marrjes së rezultateve kur i kombinojmë ato.

Analiza e regresionit në Excel

Tregon ndikimin e disa vlerave (të pavarura, të pavarura) në variablin e varur. Për shembull, si varet numri i popullsisë ekonomikisht aktive nga numri i ndërmarrjeve, pagat dhe parametrat e tjerë. Ose: si ndikojnë në nivelin e PBB-së investimet e huaja, çmimet e energjisë etj.

Rezultati i analizës ju lejon të nënvizoni përparësitë. Dhe bazuar në faktorët kryesorë, parashikoni, planifikoni zhvillimin e fushave prioritare dhe merrni vendime menaxheriale.

Regresioni ndodh:

  • lineare (y = a + bx);
  • parabolike (y = a + bx + cx 2);
  • eksponencial (y = a * exp(bx));
  • fuqia (y = a*x^b);
  • hiperbolike (y = b/x + a);
  • logaritmike (y = b * 1n(x) + a);
  • eksponencial (y = a * b^x).

Le të shohim një shembull të ndërtimit të një modeli regresioni në Excel dhe interpretimit të rezultateve. Le të marrim llojin linear të regresionit.

Detyrë. Në 6 ndërmarrje u analizua paga mesatare mujore dhe numri i punonjësve të larguar nga puna. Është e nevojshme të përcaktohet varësia e numrit të punonjësve që largohen nga paga mesatare.

Modeli i regresionit linear duket si ky:

Y = a 0 + a 1 x 1 +…+a k x k.

Ku a janë koeficientët e regresionit, x janë variabla ndikues, k është numri i faktorëve.

Në shembullin tonë, Y është treguesi i largimit nga punonjësit. Faktori ndikues është paga (x).

Excel ka funksione të integruara që mund t'ju ndihmojnë të llogaritni parametrat e një modeli të regresionit linear. Por shtesa "Paketa e analizës" do ta bëjë këtë më shpejt.

Ne aktivizojmë një mjet të fuqishëm analitik:

Pasi të aktivizohet, shtesa do të jetë e disponueshme në skedën e të dhënave.

Tani le të bëjmë vetë analizën e regresionit.



Para së gjithash, ne i kushtojmë vëmendje katrorit R dhe koeficientëve.

R-katror është koeficienti i përcaktimit. Në shembullin tonë - 0,755, ose 75,5%. Kjo do të thotë se parametrat e llogaritur të modelit shpjegojnë 75.5% të marrëdhënies ndërmjet parametrave të studiuar. Sa më i lartë të jetë koeficienti i përcaktimit, aq më i mirë është modeli. Mirë - mbi 0.8. E keqe - më pak se 0.5 (një analizë e tillë vështirë se mund të konsiderohet e arsyeshme). Në shembullin tonë - "jo keq".

Koeficienti 64.1428 tregon se çfarë do të jetë Y nëse të gjitha variablat në modelin në shqyrtim janë të barabartë me 0. Kjo do të thotë, vlera e parametrit të analizuar ndikohet edhe nga faktorë të tjerë që nuk janë përshkruar në model.

Koeficienti -0,16285 tregon peshën e variablit X në Y. Kjo do të thotë se paga mesatare mujore brenda këtij modeli ndikon në numrin e të larguarve me peshën -0,16285 (kjo është një shkallë e vogël ndikimi). Shenja "-" tregon një ndikim negativ: sa më e lartë të jetë paga, aq më pak njerëz e lënë. E cila është e drejtë.



Analiza e korrelacionit në Excel

Analiza e korrelacionit ndihmon në përcaktimin nëse ka një lidhje midis treguesve në një ose dy mostra. Për shembull, midis kohës së funksionimit të një makinerie dhe kostos së riparimeve, çmimit të pajisjeve dhe kohëzgjatjes së funksionimit, gjatësisë dhe peshës së fëmijëve, etj.

Nëse ka një lidhje, atëherë rritja e njërit parametër a çon në një rritje (korrelacion pozitiv) ose një ulje (negative) të tjetrit. Analiza e korrelacionit e ndihmon analistin të përcaktojë nëse vlera e një treguesi mund të përdoret për të parashikuar vlerën e mundshme të një tjetri.

Koeficienti i korrelacionit shënohet me r. Ndryshon nga +1 në -1. Klasifikimi i korrelacioneve për fusha të ndryshme do të jetë i ndryshëm. Kur koeficienti është 0, nuk ka lidhje lineare midis mostrave.

Le të shohim se si të gjejmë koeficientin e korrelacionit duke përdorur Excel.

Për të gjetur koeficientët e çiftuar, përdoret funksioni CORREL.

Objektivi: Përcaktoni nëse ka një lidhje midis kohës së funksionimit të një torno dhe kostos së mirëmbajtjes së saj.

Vendosni kursorin në çdo qelizë dhe shtypni butonin fx.

  1. Në kategorinë "Statistikore", zgjidhni funksionin CORREL.
  2. Argumenti "Array 1" - diapazoni i parë i vlerave - koha e funksionimit të makinës: A2:A14.
  3. Argumenti "Array 2" - diapazoni i dytë i vlerave - kostoja e riparimit: B2:B14. Klikoni OK.

Për të përcaktuar llojin e lidhjes, duhet të shikoni numrin absolut të koeficientit (çdo fushë e veprimtarisë ka shkallën e vet).

Për analizën e korrelacionit të disa parametrave (më shumë se 2), është më i përshtatshëm të përdoret "Analiza e të dhënave" (shtesa "Paketa e Analizës"). Ju duhet të zgjidhni korrelacionin nga lista dhe të caktoni grupin. Të gjitha.

Koeficientët rezultues do të shfaqen në matricën e korrelacionit. Si kjo:

Analiza e korrelacionit dhe e regresionit

Në praktikë, këto dy teknika shpesh përdoren së bashku.

Shembull:


Tani të dhënat e analizës së regresionit janë bërë të dukshme.

Gjatë studimeve, studentët shumë shpesh ndeshen me një sërë ekuacionesh. Njëri prej tyre - ekuacioni i regresionit - diskutohet në këtë artikull. Ky lloj ekuacioni përdoret posaçërisht për të përshkruar karakteristikat e marrëdhënies midis parametrave matematikorë. Ky lloj barazie përdoret në statistikë dhe ekonometri.

Përkufizimi i regresionit

Në matematikë, regresioni nënkupton një sasi të caktuar që përshkruan varësinë e vlerës mesatare të një grupi të dhënash nga vlerat e një sasie tjetër. Ekuacioni i regresionit tregon, në funksion të një karakteristike të veçantë, vlerën mesatare të një karakteristike tjetër. Funksioni i regresionit ka formën e një ekuacioni të thjeshtë y = x, në të cilin y vepron si një ndryshore e varur dhe x si një ndryshore e pavarur (faktor-tipar). Në fakt, regresioni shprehet si y = f (x).

Cilat janë llojet e marrëdhënieve midis variablave?

Në përgjithësi, ekzistojnë dy lloje të kundërta të marrëdhënieve: korrelacioni dhe regresioni.

E para karakterizohet nga barazia e variablave të kushtëzuar. Në këtë rast, nuk dihet me besueshmëri se cila variabël varet nga tjetra.

Nëse nuk ka barazi midis variablave dhe kushtet thonë se cila variabël është shpjeguese dhe cila është e varur, atëherë mund të flasim për praninë e një lidhjeje të llojit të dytë. Për të ndërtuar një ekuacion të regresionit linear, do të jetë e nevojshme të zbulohet se çfarë lloj marrëdhënieje vërehet.

Llojet e regresioneve

Sot, ekzistojnë 7 lloje të ndryshme të regresionit: hiperbolik, linear, shumëfish, jolinear, çift, invers, logaritmikisht linear.

Hiperbolike, lineare dhe logaritmike

Ekuacioni i regresionit linear përdoret në statistika për të shpjeguar qartë parametrat e ekuacionit. Duket sikur y = c+t*x+E. Një ekuacion hiperbolik ka formën e një hiperbole të rregullt y = c + m / x + E. Një ekuacion logaritmik linear shpreh marrëdhënien duke përdorur një funksion logaritmik: Në y = Në c + m * Në x + Në E.

Të shumëfishta dhe jolineare

Dy llojet më komplekse të regresionit janë të shumëfishtë dhe jolinearë. Ekuacioni i regresionit të shumëfishtë shprehet me funksionin y = f(x 1, x 2 ... x c) + E. Në këtë situatë, y vepron si një ndryshore e varur dhe x vepron si një ndryshore shpjeguese. Ndryshorja E është stokastike, ajo përfshin ndikimin e faktorëve të tjerë në ekuacion. Ekuacioni i regresionit jolinear është pak i diskutueshëm. Nga njëra anë, në raport me treguesit e marrë në konsideratë, nuk është linear, por nga ana tjetër, në rolin e vlerësimit të treguesve, është linear.

Llojet e kundërta dhe të çiftëzuara të regresioneve

Një invers është një lloj funksioni që duhet të konvertohet në një formë lineare. Në programet më tradicionale të aplikimit, ai ka formën e një funksioni y = 1/c + m*x+E. Një ekuacion i regresionit në çift tregon marrëdhënien midis të dhënave si funksion i y = f (x) + E. Ashtu si në ekuacionet e tjera, y varet nga x dhe E është një parametër stokastik.

Koncepti i korrelacionit

Ky është një tregues që tregon ekzistencën e një marrëdhënieje midis dy fenomeneve ose proceseve. Forca e marrëdhënies shprehet si një koeficient korrelacioni. Vlera e tij luhatet brenda intervalit [-1;+1]. Një tregues negativ tregon praninë e reagimeve, një tregues pozitiv tregon reagime të drejtpërdrejta. Nëse koeficienti merr një vlerë të barabartë me 0, atëherë nuk ka asnjë lidhje. Sa më afër të jetë vlera me 1, aq më e fortë është marrëdhënia midis parametrave, aq më afër 0, aq më e dobët është.

Metodat

Metodat parametrike të korrelacionit mund të vlerësojnë fuqinë e marrëdhënies. Ato përdoren në bazë të vlerësimit të shpërndarjes për të studiuar parametrat që i binden ligjit të shpërndarjes normale.

Parametrat e ekuacionit të regresionit linear janë të nevojshëm për të identifikuar llojin e varësisë, funksionin e ekuacionit të regresionit dhe për të vlerësuar treguesit e formulës së zgjedhur të marrëdhënies. Fusha e korrelacionit përdoret si metodë e identifikimit të lidhjes. Për ta bërë këtë, të gjitha të dhënat ekzistuese duhet të përshkruhen grafikisht. Të gjitha të dhënat e njohura duhet të vizatohen në një sistem koordinativ dy-dimensional drejtkëndor. Kështu formohet një fushë korrelacioni. Vlerat e faktorit përshkrues shënohen përgjatë boshtit të abshisës, ndërsa vlerat e faktorit të varur shënohen përgjatë boshtit të ordinatave. Nëse ekziston një marrëdhënie funksionale midis parametrave, ato rreshtohen në formën e një rreshti.

Nëse koeficienti i korrelacionit të të dhënave të tilla është më pak se 30%, mund të flasim për një mungesë pothuajse të plotë të lidhjes. Nëse është midis 30% dhe 70%, atëherë kjo tregon praninë e lidhjeve të mesme të ngushta. Një tregues 100% është dëshmi e një lidhjeje funksionale.

Një ekuacion jolinear i regresionit, ashtu si ai linear, duhet të plotësohet me një indeks korrelacioni (R).

Korrelacioni për regresion të shumëfishtë

Koeficienti i përcaktimit është një tregues i katrorit të korrelacionit të shumëfishtë. Ai flet për marrëdhënien e ngushtë të grupit të treguesve të paraqitur me karakteristikën që studiohet. Mund të flasë gjithashtu për natyrën e ndikimit të parametrave në rezultat. Ekuacioni i regresionit të shumëfishtë vlerësohet duke përdorur këtë tregues.

Për të llogaritur treguesin e korrelacionit të shumëfishtë, është e nevojshme të llogaritet indeksi i tij.

Metoda e katrorëve më të vegjël

Kjo metodë është një mënyrë për të vlerësuar faktorët e regresionit. Thelbi i tij është të minimizojë shumën e devijimeve në katror të marra si rezultat i varësisë së faktorit nga funksioni.

Një ekuacion i regresionit linear në çift mund të vlerësohet duke përdorur një metodë të tillë. Ky lloj ekuacioni përdoret kur zbulohet një marrëdhënie lineare e çiftuar midis treguesve.

Parametrat e ekuacionit

Çdo parametër i funksionit të regresionit linear ka një kuptim specifik. Ekuacioni i regresionit linear të çiftuar përmban dy parametra: c dhe m Parametri m demonstron ndryshimin mesatar në treguesin përfundimtar të funksionit y, me kusht që ndryshorja x të zvogëlohet (rritet) me një njësi konvencionale. Nëse ndryshorja x është zero, atëherë funksioni është i barabartë me parametrin c. Nëse ndryshorja x nuk është zero, atëherë faktori c nuk ka kuptim ekonomik. Ndikimi i vetëm në funksion është shenja përpara faktorit c. Nëse ka një minus, atëherë mund të themi se ndryshimi në rezultat është i ngadaltë në krahasim me faktorin. Nëse ka një plus, atëherë kjo tregon një ndryshim të përshpejtuar në rezultat.

Çdo parametër që ndryshon vlerën e ekuacionit të regresionit mund të shprehet përmes një ekuacioni. Për shembull, faktori c ka formën c = y - mx.

Të dhëna të grupuara

Ekzistojnë kushte të detyrës në të cilat të gjitha informacionet grupohen sipas atributit x, por për një grup të caktuar tregohen vlerat mesatare përkatëse të treguesit të varur. Në këtë rast, vlerat mesatare karakterizojnë se si ndryshon treguesi në varësi të x. Kështu, informacioni i grupuar ndihmon për të gjetur ekuacionin e regresionit. Përdoret si analizë e marrëdhënieve. Megjithatë, kjo metodë ka të metat e saj. Për fat të keq, treguesit mesatarë janë shpesh subjekt i luhatjeve të jashtme. Këto luhatje nuk pasqyrojnë modelin e marrëdhënies, ato thjesht maskojnë "zhurmën" e saj. Mesataret tregojnë modele marrëdhëniesh shumë më të këqija se një ekuacion i regresionit linear. Megjithatë, ato mund të përdoren si bazë për gjetjen e një ekuacioni. Duke shumëzuar numrin e një popullsie individuale me mesataren përkatëse, mund të merret shuma y brenda grupit. Tjetra, duhet të shtoni të gjitha shumat e marra dhe të gjeni treguesin përfundimtar y. Është pak më e vështirë të bësh llogaritjet me treguesin e shumës xy. Nëse intervalet janë të vogla, mund të marrim me kusht treguesin x për të gjitha njësitë (brenda grupit) të jetë i njëjtë. Ju duhet ta shumëzoni atë me shumën e y për të gjetur shumën e prodhimeve të x dhe y. Më pas, të gjitha shumat mblidhen së bashku dhe fitohet shuma totale xy.

Ekuacioni i regresionit të shumëfishtë në çift: vlerësimi i rëndësisë së një marrëdhënieje

Siç u diskutua më herët, regresioni i shumëfishtë ka një funksion të formës y = f (x 1,x 2,…,x m)+E. Më shpesh, një ekuacion i tillë përdoret për të zgjidhur problemin e ofertës dhe kërkesës për një produkt, të ardhurat nga interesi për aksionet e riblera dhe për të studiuar shkaqet dhe llojin e funksionit të kostos së prodhimit. Përdoret gjithashtu në mënyrë aktive në një shumëllojshmëri të gjerë studimesh dhe llogaritjesh makroekonomike, por në nivelin mikroekonomik ky ekuacion përdoret pak më rrallë.

Detyra kryesore e regresionit të shumëfishtë është të ndërtojë një model të dhënash që përmban një sasi të madhe informacioni në mënyrë që të përcaktohet më tej se çfarë ndikimi ka secili prej faktorëve individualisht dhe në tërësinë e tyre në treguesin që duhet të modelohet dhe koeficientët e tij. Ekuacioni i regresionit mund të marrë një shumëllojshmëri të gjerë vlerash. Në këtë rast, për të vlerësuar marrëdhënien, zakonisht përdoren dy lloje funksionesh: lineare dhe jolineare.

Funksioni linear përshkruhet në formën e marrëdhënies së mëposhtme: y = a 0 + a 1 x 1 + a 2 x 2,+ ... + a m x m. Në këtë rast, a2, a m konsiderohen koeficientë të regresionit "të pastër". Ato janë të nevojshme për të karakterizuar ndryshimin mesatar në parametrin y me një ndryshim (ulje ose rritje) në secilin parametër korrespondues x me një njësi, duke iu nënshtruar vlerave të qëndrueshme të treguesve të tjerë.

Ekuacionet jolineare kanë, për shembull, formën e një funksioni fuqie y=ax 1 b1 x 2 b2 ...x m bm. Në këtë rast, treguesit b 1, b 2 ..... b m quhen koeficientë elasticiteti, ata demonstrojnë se si rezultati do të ndryshojë (me sa%) me një rritje (ulje) në treguesin përkatës x me 1% dhe me një tregues të qëndrueshëm të faktorëve të tjerë.

Cilët faktorë duhet të merren parasysh gjatë ndërtimit të regresionit të shumëfishtë

Për të ndërtuar saktë regresionin e shumëfishtë, është e nevojshme të zbuloni se cilët faktorë duhet t'i kushtohet vëmendje e veçantë.

Është e nevojshme të kemi njëfarë kuptimi të natyrës së marrëdhënieve ndërmjet faktorëve ekonomikë dhe asaj që modelohet. Faktorët që duhet të përfshihen duhet të plotësojnë kriteret e mëposhtme:

  • Duhet t'i nënshtrohet matjes sasiore. Për të përdorur një faktor që përshkruan cilësinë e një objekti, në çdo rast duhet t'i jepet një formë sasiore.
  • Nuk duhet të ketë ndërlidhje faktorësh, apo marrëdhënie funksionale. Veprime të tilla më së shpeshti çojnë në pasoja të pakthyeshme - sistemi i ekuacioneve të zakonshme bëhet i pakushtëzuar, dhe kjo përfshin jobesueshmërinë dhe vlerësimet e tij të paqarta.
  • Në rastin e një treguesi të madh korrelacioni, nuk ka asnjë mënyrë për të zbuluar ndikimin e izoluar të faktorëve në rezultatin përfundimtar të treguesit, prandaj, koeficientët bëhen të pakuptueshëm.

Metodat e ndërtimit

Ka një numër të madh metodash dhe metodash që shpjegojnë se si mund të zgjidhni faktorët për një ekuacion. Sidoqoftë, të gjitha këto metoda bazohen në zgjedhjen e koeficientëve duke përdorur një tregues korrelacioni. Ndër to janë:

  • Metoda e eliminimit.
  • Metoda e ndërrimit.
  • Analiza e regresionit hap pas hapi.

Metoda e parë përfshin filtrimin e të gjithë koeficientëve nga grupi total. Metoda e dytë përfshin futjen e shumë faktorëve shtesë. Epo, e treta është eliminimi i faktorëve që janë përdorur më parë për ekuacionin. Secila prej këtyre metodave ka të drejtë të ekzistojë. Ata kanë të mirat dhe të këqijat e tyre, por të gjithë mund ta zgjidhin çështjen e eliminimit të treguesve të panevojshëm në mënyrën e tyre. Si rregull, rezultatet e marra nga secila metodë individuale janë mjaft të afërta.

Metodat e analizës me shumë variacione

Metoda të tilla të përcaktimit të faktorëve bazohen në marrjen në konsideratë të kombinimeve individuale të karakteristikave të ndërlidhura. Këto përfshijnë analizën diskriminuese, njohjen e formës, analizën e komponentit kryesor dhe analizën e grupimeve. Përveç kësaj, ekziston edhe analiza e faktorëve, por ajo u shfaq për shkak të zhvillimit të metodës së komponentëve. Të gjitha ato zbatohen në rrethana të caktuara, në varësi të kushteve dhe faktorëve të caktuar.

Pasi analiza e korrelacionit ka zbuluar praninë e marrëdhënieve statistikore midis variablave dhe ka vlerësuar shkallën e afërsisë së tyre, ne zakonisht kalojmë në një përshkrim matematikor të një lloji të caktuar varësie duke përdorur analizën e regresionit. Për këtë qëllim, zgjidhet një klasë funksionesh që lidh treguesin rezultant y dhe argumentet x 1, x 2, ..., x k, zgjidhen argumentet më informuese, vlerësimet e vlerave të panjohura të parametrave të llogariten ekuacioni i komunikimit dhe analizohen vetitë e ekuacionit që rezulton.

Funksioni f(x 1, x 2,..., x k) që përshkruan varësinë e vlerës mesatare të karakteristikës rezultante y nga vlerat e dhëna të argumenteve quhet funksion i regresionit (ekuacion). Termi "regresion" (latinisht - regres - tërheqje, kthim në diçka) u prezantua nga psikologu dhe antropologu anglez F. Galton dhe lidhet ekskluzivisht me specifikat e një prej shembujve të parë konkretë në të cilin u përdor ky koncept. Kështu, duke përpunuar të dhënat statistikore në lidhje me analizën e trashëgimisë së gjatësisë, F. Galton zbuloi se nëse baballarët devijojnë nga gjatësia mesatare e të gjithë baballarëve me x inç, atëherë djemtë e tyre devijojnë nga gjatësia mesatare e të gjithë djemve me më pak se x. inç. Trendi i identifikuar u quajt "regresion në mesatare". Që atëherë, termi "regresion" është përdorur gjerësisht në literaturën statistikore, megjithëse në shumë raste ai nuk e karakterizon saktë konceptin e varësisë statistikore.

Për të përshkruar me saktësi ekuacionin e regresionit, është e nevojshme të njihet ligji i shpërndarjes së treguesit efektiv y. Në praktikën statistikore, zakonisht duhet të kufizohet në kërkimin e përafrimeve të përshtatshme për funksionin e panjohur të regresionit të vërtetë, pasi studiuesi nuk ka njohuri të sakta për ligjin e shpërndarjes së probabilitetit të kushtëzuar të treguesit rezultant të analizuar y për vlerat e dhëna të argumenti x.

Le të shqyrtojmë marrëdhënien ndërmjet f(x) = M(y1x), modeli i regresionit? dhe vlerësimi i regresionit y. Lëreni treguesin efektiv y të lidhet me argumentin x nga relacioni:

ku është një ndryshore e rastësishme që ka një ligj të shpërndarjes normale, dhe Me = 0 dhe D e = y 2. Funksioni i regresionit të vërtetë në këtë rast ka formën: f (x) = M(y/x) = 2x 1.5.

Le të supozojmë se nuk e dimë formën e saktë të ekuacionit të vërtetë të regresionit, por kemi nëntë vëzhgime të një ndryshoreje të rastësishme dy-dimensionale të lidhura nga relacioni yi = 2x1.5 + e, dhe të paraqitur në Fig. 1

Figura 1 - Pozicioni relativ i së vërtetës f (x) dhe ajo teorike? modelet e regresionit

Vendndodhja e pikave në Fig. 1 na lejon të kufizohemi në klasën e varësive lineare të formës? = në 0 + në 1 x. Duke përdorur metodën e katrorëve më të vegjël, gjejmë vlerësimin e ekuacionit të regresionit y = b 0 + b 1 x. Për krahasim, në Fig. 1 tregon grafikët e funksionit të regresionit të vërtetë y = 2x 1.5, funksionin teorik të përafrimit të regresionit? = në 0 + në 1 x.

Meqenëse kemi bërë një gabim në zgjedhjen e klasës së funksionit të regresionit, dhe kjo është mjaft e zakonshme në praktikën e kërkimit statistikor, përfundimet dhe vlerësimet tona statistikore do të rezultojnë të gabuara. Dhe pa marrë parasysh se sa shumë e rrisim vëllimin e vëzhgimeve, vlerësimi ynë i mostrës y nuk do të jetë afër funksionit të regresionit të vërtetë f(x). Nëse do të kishim zgjedhur saktë klasën e funksioneve të regresionit, atëherë pasaktësia në përshkrimin e f(x) duke përdorur? mund të shpjegohet vetëm me kufizimet e mostrës.

Për të rivendosur sa më mirë, nga të dhënat statistikore origjinale, vlera e kushtëzuar e treguesit efektiv y(x) dhe funksionit të regresionit të panjohur f(x) = M(y/x), kriteret e mëposhtme të mjaftueshmërisë (funksionet e humbjes) janë më së shumti përdoret shpesh.

Metoda e katrorëve më të vegjël. Sipas tij, katrori i devijimit të vlerave të vëzhguara të treguesit efektiv y, (i = 1,2,..., n) nga vlerat e modelit,? = f(x i), ku x i është vlera e vektorit të argumentit në vëzhgimin e i-të: ?(y i - f(x i) 2 > min Regresioni që rezulton quhet katror mesatar.

Metoda e moduleve më të vogla. Sipas tij, shuma e devijimeve absolute të vlerave të vëzhguara të treguesit efektiv nga vlerat modulare minimizohet. Dhe ne marrim,? = f(x i), do të thotë regresion mesatar absolut? |y i - f(x i)| > min.

Analiza e regresionit është një metodë e analizës statistikore të varësisë së një ndryshoreje të rastësishme y nga variablat x j = (j=1,2,..., k), e konsideruar në analizën e regresionit si ndryshore jo të rastësishme, pavarësisht nga ligji i vërtetë i shpërndarjes. prej x j.

Zakonisht supozohet se një ndryshore e rastësishme y ka një ligj të shpërndarjes normale me një pritshmëri matematikore të kushtëzuar y, e cila është një funksion i argumenteve x/ (/ = 1, 2,..., k) dhe një variancë konstante y 2 të pavarur të argumenteve.

Në përgjithësi, modeli i analizës së regresionit linear ka formën:

Y = Y k j=0 V j ts j(x 1 , x 2 . . .. , x k)+E

ku q j është një funksion i variablave të tij - x 1, x 2. . .. ,x k, E është një ndryshore e rastësishme me zero pritje matematikore dhe variancë y 2.

Në analizën e regresionit, lloji i ekuacionit të regresionit zgjidhet bazuar në natyrën fizike të fenomenit që studiohet dhe rezultatet e vëzhgimit.

Vlerësimet e parametrave të panjohur të ekuacionit të regresionit zakonisht gjenden duke përdorur metodën e katrorëve më të vegjël. Më poshtë do të ndalemi në këtë problem në mënyrë më të detajuar.

Ekuacioni i regresionit linear bivarianë. Le të supozojmë, bazuar në analizën e fenomenit në studim, se në "mesatare" y është një funksion linear i x, d.m.th. ekziston një ekuacion regresioni.

y=M(y/x)=në 0 + në 1 x)

ku M(y1x) është pritshmëria matematikore e kushtëzuar e ndryshores së rastësishme y për një x të dhënë; në 0 dhe në 1 - parametra të panjohur të popullatës së përgjithshme, të cilat duhet të vlerësohen bazuar në rezultatet e vëzhgimeve të mostrës.

Supozoni se për të vlerësuar parametrat në 0 dhe në 1, një mostër me madhësi n është marrë nga një popullatë dy-dimensionale (x, y), ku (x, y,) është rezultati i vëzhgimit të i-të (i = 1 , 2,..., n) . Në këtë rast, modeli i analizës së regresionit ka formën:

y j = në 0 + në 1 x+e j .

ku e j janë variabla të rastësishme të pavarura të shpërndara normalisht me zero pritshmëri matematikore dhe variancë y 2, pra M e j. = 0;

D e j .= y 2 për të gjitha i = 1, 2,..., n.

Sipas metodës së katrorëve më të vegjël, si vlerësime të parametrave të panjohur në 0 dhe 1, duhet të merren vlera të tilla të karakteristikave të mostrës b 0 dhe b 1 që minimizojnë shumën e devijimeve në katror të vlerave të rezultatit. karakteristikë për i nga pritshmëria matematikore e kushtëzuar? i

Ne do të shqyrtojmë metodologjinë për përcaktimin e ndikimit të karakteristikave të marketingut në fitimin e një ndërmarrjeje duke përdorur shembullin e shtatëmbëdhjetë ndërmarrjeve tipike me madhësi mesatare dhe tregues të aktivitetit ekonomik.

Gjatë zgjidhjes së problemit, janë marrë parasysh karakteristikat e mëposhtme, të identifikuara si më domethënëse (të rëndësishme) si rezultat i anketës së pyetësorit:

* aktiviteti inovativ i ndërmarrjes;

* planifikimi i gamës së produkteve;

* formimi i politikës së çmimeve;

* marrëdhëniet me publikun;

* Sistemi i shitjeve;

* Sistemi i nxitjes së punonjësve.

Bazuar në një sistem krahasimesh sipas faktorëve, u ndërtuan matricat katrore të afërsisë, në të cilat u llogaritën vlerat e përparësive relative për secilin faktor: aktiviteti inovativ i ndërmarrjes, planifikimi i gamës së produkteve, formimi i politikës së çmimeve, reklamimi. , marrëdhëniet me publikun, sistemi i shitjeve, sistemi i nxitjes së punonjësve.

Vlerësimet e prioriteteve për faktorin “marrëdhënie me publikun” janë marrë si rezultat i një sondazhi të specialistëve të ndërmarrjeve. Shënimet e mëposhtme pranohen: > (më mirë), > (më mirë ose e njëjta), = (njëjtë),< (хуже или одинаково), <

Më pas, u zgjidh problemi i një vlerësimi gjithëpërfshirës të nivelit të marketingut të ndërmarrjes. Gjatë llogaritjes së treguesit, u përcaktua rëndësia (pesha) e karakteristikave të pjesshme të konsideruara dhe u zgjidh problemi i konvolucionit linear të treguesve të pjesshëm. Përpunimi i të dhënave është kryer duke përdorur programe të zhvilluara posaçërisht.

Më pas, llogaritet një vlerësim gjithëpërfshirës i nivelit të marketingut të ndërmarrjes - koeficienti i marketingut, i cili është futur në tabelën 1. Përveç kësaj, tabela përfshin tregues që karakterizojnë ndërmarrjen në tërësi. Të dhënat në tabelë do të përdoren për të kryer analizën e regresionit. Atributi që rezulton është fitimi. Së bashku me koeficientin e marketingut, si tregues faktorësh janë përdorur edhe këta tregues: vëllimi i prodhimit bruto, kostoja e aktiveve fikse, numri i punonjësve dhe koeficienti i specializimit.

Tabela 1 - Të dhënat fillestare për analizën e regresionit


Sipas të dhënave të tabelës dhe në bazë të faktorëve me vlerat më domethënëse të koeficientëve të korrelacionit, u ndërtuan funksionet e regresionit të varësisë së fitimit nga faktorët.

Ekuacioni i regresionit në rastin tonë do të marrë formën:

Ndikimi sasior i faktorëve të diskutuar më sipër në masën e fitimit tregohet nga koeficientët e ekuacionit të regresionit. Ato tregojnë se sa mijëra rubla ndryshon vlera e saj kur karakteristika e faktorit ndryshon me një njësi. Siç vijon nga ekuacioni, një rritje në koeficientin e përzierjes së marketingut me një njësi jep një rritje të fitimit me 1547.7 mijë rubla. Kjo sugjeron se përmirësimi i aktiviteteve të marketingut ka potencial të madh për përmirësimin e performancës ekonomike të ndërmarrjeve.

Kur studiohet efektiviteti i marketingut, faktori më interesant dhe më i rëndësishëm është faktori X5 - koeficienti i marketingut. Në përputhje me teorinë e statistikave, avantazhi i ekuacionit ekzistues të regresionit të shumëfishtë është aftësia për të vlerësuar ndikimin e izoluar të secilit faktor, përfshirë faktorin e marketingut.

Rezultatet e analizës së regresionit kanë një aplikim më të gjerë se sa për llogaritjen e parametrave të ekuacionit. Kriteri për klasifikimin e ndërmarrjeve (Kef) si relativisht më të mira ose relativisht më të këqija bazohet në treguesin relativ të rezultatit:

ku Y fakti është vlera aktuale e ndërmarrjes së i-të, mijë rubla;

Y e llogaritur - shuma e fitimit të ndërmarrjes së i-të, e marrë nga llogaritja duke përdorur ekuacionin e regresionit

Për sa i përket problemit që zgjidhet, vlera quhet "koeficienti i efikasitetit". Veprimtaria e një ndërmarrje mund të konsiderohet efektive në rastet kur vlera e koeficientit është më e madhe se një. Kjo do të thotë që fitimi aktual është më i madh se fitimi mesatar mbi kampionin.

Vlerat aktuale dhe të vlerësuara të fitimit janë paraqitur në tabelë. 2.

Tabela 2 - Analiza e karakteristikës që rezulton në modelin e regresionit

Nga analiza e tabelës rezulton se në rastin tonë, aktivitetet e ndërmarrjeve 3, 5, 7, 9, 12, 14, 15, 17 për periudhën në shqyrtim mund të konsiderohen të suksesshme.

Analiza e regresionit është një nga metodat më të njohura të kërkimit statistikor. Mund të përdoret për të përcaktuar shkallën e ndikimit të variablave të pavarur në variablin e varur. Microsoft Excel ka mjete të dizajnuara për të kryer këtë lloj analize. Le të shohim se çfarë janë dhe si t'i përdorim ato.

Por, për të përdorur funksionin që ju lejon të kryeni analizën e regresionit, fillimisht duhet të aktivizoni Paketën e Analizës. Vetëm atëherë mjetet e nevojshme për këtë procedurë do të shfaqen në shiritin e Excel.


Tani kur shkojmë te skeda "Të dhënat", në shiritin në kutinë e veglave "Analiza" do të shohim një buton të ri - "Analiza e të dhënave".

Llojet e analizës së regresionit

Ekzistojnë disa lloje të regresioneve:

  • parabolike;
  • qetësues;
  • logaritmike;
  • eksponenciale;
  • demonstrative;
  • hiperbolike;
  • regresioni linear.

Më vonë do të flasim për kryerjen e llojit të fundit të analizës së regresionit në Excel.

Regresioni linear në Excel

Më poshtë, si shembull, është një tabelë që tregon temperaturën mesatare ditore të ajrit jashtë dhe numrin e klientëve të dyqaneve për ditën përkatëse të punës. Le të zbulojmë duke përdorur analizën e regresionit saktësisht se si kushtet e motit në formën e temperaturës së ajrit mund të ndikojnë në frekuentimin e një ndërmarrje me pakicë.

Ekuacioni i përgjithshëm i regresionit linear është si vijon: Y = a0 + a1x1 +...+akhk. Në këtë formulë Y nënkupton një variabël, ndikimin e faktorëve mbi të cilët ne po përpiqemi të studiojmë. Në rastin tonë, ky është numri i blerësve. Kuptimi x janë faktorë të ndryshëm që ndikojnë në një variabël. Opsionet a janë koeficientët e regresionit. Domethënë, janë ata që përcaktojnë rëndësinë e një faktori të caktuar. Indeksi k tregon numrin e përgjithshëm të këtyre faktorëve të njëjtë.


Analiza e rezultateve të analizës

Rezultatet e analizës së regresionit shfaqen në formën e një tabele në vendin e specifikuar në cilësimet.

Një nga treguesit kryesorë është R-katror. Ai tregon cilësinë e modelit. Në rastin tonë, ky koeficient është 0,705 ose rreth 70,5%. Ky është një nivel i pranueshëm i cilësisë. Varësia më pak se 0.5 është e keqe.

Një tregues tjetër i rëndësishëm ndodhet në qelizën në kryqëzimin e linjës "Kryqëzimi Y" dhe kolona "Shanset". Kjo tregon se çfarë vlere do të ketë Y, dhe në rastin tonë, ky është numri i blerësve, me të gjithë faktorët e tjerë të barabartë me zero. Në këtë tabelë, kjo vlerë është 58.04.

Vlera në kryqëzimin e grafikut "Ndryshorja X1" Dhe "Shanset" tregon nivelin e varësisë së Y nga X. Në rastin tonë, ky është niveli i varësisë së numrit të klientëve të dyqanit nga temperatura. Një koeficient prej 1.31 konsiderohet një tregues mjaft i lartë i ndikimit.

Siç mund ta shihni, duke përdorur Microsoft Excel është mjaft e lehtë të krijoni një tabelë të analizës së regresionit. Por vetëm një person i trajnuar mund të punojë me të dhënat dalëse dhe të kuptojë thelbin e tyre.

Në veprat e tij që datojnë që nga viti 1908. Ai e përshkroi atë duke përdorur shembullin e punës së një agjenti që shet pasuri të paluajtshme. Në të dhënat e tij, specialisti i shitjeve të shtëpive mbante gjurmët e një game të gjerë të dhënash hyrëse për çdo ndërtesë specifike. Në bazë të rezultateve të ankandit, u përcaktua se cili faktor kishte ndikimin më të madh në çmimin e transaksionit.

Analiza e një numri të madh transaksionesh dha rezultate interesante. Çmimi përfundimtar u ndikua nga shumë faktorë, duke çuar ndonjëherë në konkluzione paradoksale dhe madje edhe në "përputhje" të dukshme kur një shtëpi me potencial të lartë fillestar shitej me një çmim të reduktuar.

Shembulli i dytë i aplikimit të një analize të tillë është puna e së cilës iu besua përcaktimi i shpërblimit të punonjësve. Kompleksiteti i detyrës qëndronte në faktin se ajo kërkonte jo shpërndarjen e një shume fikse për të gjithë, por korrespondencën e saj të rreptë me punën specifike të kryer. Shfaqja e shumë problemeve me zgjidhje praktikisht të ngjashme kërkonte një studim më të detajuar të tyre në nivelin matematik.

Një vend i rëndësishëm iu nda seksionit "analiza e regresionit", i cili kombinoi metoda praktike të përdorura për të studiuar varësitë që bien nën konceptin e regresionit. Këto marrëdhënie vërehen ndërmjet të dhënave të marra nga studimet statistikore.

Mes shumë detyrave që duhen zgjidhur, synimet kryesore janë tre: përcaktimi i një ekuacioni të regresionit të përgjithshëm; ndërtimin e vlerësimeve të parametrave që janë të panjohura që janë pjesë e ekuacionit të regresionit; testimi i hipotezave të regresionit statistikor. Gjatë studimit të marrëdhënies që lind midis një çifti sasish të përftuara si rezultat i vëzhgimeve eksperimentale dhe që përbëjnë një seri (bashkësi) të tipit (x1, y1), ..., (xn, yn), ato mbështeten në dispozitat e teorisë së regresionit dhe supozojmë se për njërën sasi Y ka një shpërndarje probabiliteti të caktuar, ndërsa X tjetër mbetet fikse.

Rezultati Y varet nga vlera e ndryshores X, kjo varësi mund të përcaktohet nga modele të ndryshme, ndërsa saktësia e rezultateve të marra ndikohet nga natyra e vëzhgimeve dhe qëllimi i analizës. Modeli eksperimental bazohet në supozime të caktuara që janë të thjeshtuara, por të besueshme. Kushti kryesor është që parametri X të jetë një sasi e kontrolluar. Vlerat e tij vendosen para fillimit të eksperimentit.

Nëse gjatë një eksperimenti përdoret një palë ndryshoresh të pakontrolluara XY, atëherë në të njëjtën mënyrë kryhet analiza e regresionit, por përdoren metoda për interpretimin e rezultateve, gjatë të cilave studiohet marrëdhënia e variablave të rastësishëm në studim nuk janë një temë abstrakte. Ato gjejnë zbatim në jetë në sfera të ndryshme të veprimtarisë njerëzore.

Në literaturën shkencore, termi analizë e regresionit linear përdoret gjerësisht për të përcaktuar metodën e mësipërme. Për variablin X, përdoret termi regresor ose parashikues, dhe variablat e varur Y quhen gjithashtu variabla kriteri. Kjo terminologji pasqyron vetëm varësinë matematikore të variablave, por jo marrëdhënien shkak-pasojë.

Analiza e regresionit është metoda më e zakonshme e përdorur në përpunimin e rezultateve të një shumëllojshmërie të gjerë vëzhgimesh. Varësitë fizike dhe biologjike studiohen duke përdorur këtë metodë, ajo zbatohet si në ekonomi ashtu edhe në teknologji. Shumë fusha të tjera përdorin modele të analizës së regresionit. Analiza e variancës dhe analiza statistikore multivariate punojnë ngushtë me këtë metodë studimi.



Ju pëlqeu artikulli? Ndani me miqtë tuaj!