Regresyon analizi ne tür yöntemlere aittir? Çoklu Regresyon Korelasyonu

Regresyon ve korelasyon analizi istatistiksel araştırma yöntemleridir. Bunlar bir parametrenin bir veya daha fazla bağımsız değişkene bağımlılığını göstermenin en yaygın yoludur.

Aşağıda, spesifik pratik örnekler kullanarak, ekonomistler arasında çok popüler olan bu iki analizi ele alacağız. Bunları birleştirirken sonuçların elde edilmesine de bir örnek vereceğiz.

Excel'de Regresyon Analizi

Bazı değerlerin (bağımsız, bağımsız) bağımlı değişken üzerindeki etkisini gösterir. Örneğin ekonomik olarak aktif nüfus sayısı işletme sayısına, ücretlere ve diğer parametrelere nasıl bağlıdır? Veya: yabancı yatırımlar, enerji fiyatları vb. GSYİH düzeyini nasıl etkiler?

Analizin sonucu öncelikleri vurgulamanıza olanak tanır. Ve ana faktörlere dayanarak, öncelikli alanların gelişimini tahmin edin, planlayın ve yönetim kararları alın.

Regresyon gerçekleşir:

  • doğrusal (y = a + bx);
  • parabolik (y = a + bx + cx 2);
  • üstel (y = a * exp(bx));
  • güç (y = a*x^b);
  • hiperbolik (y = b/x + a);
  • logaritmik (y = b * 1n(x) + a);
  • üstel (y = a * b^x).

Excel'de regresyon modeli oluşturma ve sonuçları yorumlama örneğine bakalım. Regresyonun doğrusal türünü ele alalım.

Görev. 6 işletmede ortalama aylık maaş ve işten ayrılan çalışan sayısı analiz edildi. İşten ayrılan çalışan sayısının ortalama maaşa bağımlılığının belirlenmesi gerekmektedir.

Doğrusal regresyon modeli şuna benzer:

Y = a 0 + a 1 x 1 +…+a k x k.

a regresyon katsayılarını, x etkileyen değişkenleri, k ise faktör sayısını göstermektedir.

Örneğimizde Y, çalışanların işten ayrılma göstergesidir. Etkileyen faktör ücretlerdir (x).

Excel, doğrusal regresyon modelinin parametrelerini hesaplamanıza yardımcı olabilecek yerleşik işlevlere sahiptir. Ancak “Analiz Paketi” eklentisi bunu daha hızlı yapacaktır.

Güçlü bir analitik aracı etkinleştiriyoruz:

Etkinleştirildiğinde eklenti Veri sekmesinde mevcut olacaktır.

Şimdi regresyon analizini kendimiz yapalım.



Öncelikle R-kare ve katsayılara dikkat ediyoruz.

R-kare belirleme katsayısıdır. Örneğimizde – 0,755 veya %75,5. Bu da modelin hesaplanan parametrelerinin çalışılan parametreler arasındaki ilişkinin %75,5'ini açıkladığı anlamına gelmektedir. Belirleme katsayısı ne kadar yüksek olursa model o kadar iyi olur. İyi - 0,8'in üzerinde. Kötü - 0,5'ten az (böyle bir analizin pek makul olduğu düşünülemez). Örneğimizde – “fena değil”.

64.1428 katsayısı, söz konusu modeldeki tüm değişkenlerin 0'a eşit olması durumunda Y'nin ne olacağını gösterir. Yani, analiz edilen parametrenin değeri, modelde açıklanmayan diğer faktörlerden de etkilenir.

-0,16285 katsayısı, X değişkeninin Y üzerindeki ağırlığını gösterir. Yani, bu modeldeki ortalama aylık maaş, -0,16285 ağırlığıyla işten ayrılanların sayısını etkiler (bu küçük bir etki derecesidir). “-” işareti olumsuz bir etkiyi gösterir: maaş ne kadar yüksek olursa, o kadar az kişi ayrılır. Bu adil.



Excel'de Korelasyon Analizi

Korelasyon analizi, bir veya iki örnekteki göstergeler arasında bir ilişki olup olmadığının belirlenmesine yardımcı olur. Örneğin, bir makinenin çalışma süresi ile onarım maliyeti, ekipmanın fiyatı ile çalışma süresi, çocukların boyu ve kilosu vb. arasında.

Bir bağlantı varsa, bir parametredeki artış diğerinin artmasına (pozitif korelasyon) veya azalmasına (negatif) yol açar mı? Korelasyon analizi, analistin bir göstergenin değerinin diğerinin olası değerini tahmin etmek için kullanılıp kullanılamayacağını belirlemesine yardımcı olur.

Korelasyon katsayısı r ile gösterilir. +1 ila -1 arasında değişir. Farklı alanlar için korelasyonların sınıflandırılması farklı olacaktır. Katsayı 0 olduğunda örnekler arasında doğrusal bir ilişki yoktur.

Excel kullanarak korelasyon katsayısının nasıl bulunacağına bakalım.

Eşleştirilmiş katsayıları bulmak için CORREL işlevi kullanılır.

Amaç: Torna tezgahının çalışma süresi ile bakım maliyeti arasında bir ilişki olup olmadığını belirlemek.

İmleci herhangi bir hücreye yerleştirin ve fx düğmesine basın.

  1. “İstatistik” kategorisinde CORREL fonksiyonunu seçin.
  2. Argüman "Dizi 1" - ilk değer aralığı - makinenin çalışma süresi: A2:A14.
  3. Bağımsız değişken "Dizi 2" - ikinci değer aralığı - onarım maliyeti: B2:B14. Tamam'ı tıklayın.

Bağlantı türünü belirlemek için katsayının mutlak sayısına bakmanız gerekir (her faaliyet alanının kendi ölçeği vardır).

Birkaç parametrenin (2'den fazla) korelasyon analizi için “Veri Analizi” (“Analiz Paketi” eklentisi) kullanılması daha uygundur. Listeden korelasyonu seçmeniz ve diziyi belirlemeniz gerekir. Tüm.

Ortaya çıkan katsayılar korelasyon matrisinde görüntülenecektir. Bunun gibi:

Korelasyon ve regresyon analizi

Pratikte bu iki teknik sıklıkla birlikte kullanılmaktadır.

Örnek:


Artık regresyon analizi verileri görünür hale geldi.

Öğrenciler çalışmaları sırasında sıklıkla çeşitli denklemlerle karşılaşırlar. Bu makalede bunlardan biri olan regresyon denklemi tartışılmaktadır. Bu tür denklem özellikle matematiksel parametreler arasındaki ilişkinin özelliklerini tanımlamak için kullanılır. Bu tür eşitlik istatistik ve ekonometride kullanılır.

regresyonun tanımı

Matematikte regresyon, bir veri kümesinin ortalama değerinin başka bir miktarın değerlerine bağımlılığını tanımlayan belirli bir miktar anlamına gelir. Regresyon denklemi, belirli bir özelliğin fonksiyonu olarak başka bir özelliğin ortalama değerini gösterir. Regresyon fonksiyonu, y'nin bağımlı değişken ve x'in bağımsız değişken (özellik faktörü) olarak hareket ettiği basit bir y = x denklemi biçimine sahiptir. Aslında regresyon y = f(x) şeklinde ifade edilir.

Değişkenler arasındaki ilişki türleri nelerdir?

Genel olarak iki zıt ilişki türü vardır: korelasyon ve regresyon.

Birincisi koşullu değişkenlerin eşitliği ile karakterize edilir. Bu durumda hangi değişkenin diğerine bağlı olduğu kesin olarak bilinmemektedir.

Değişkenler arasında eşitlik yoksa ve koşullar hangi değişkenin açıklayıcı, hangisinin bağımlı olduğunu söylüyorsa o zaman ikinci tip bir bağlantının varlığından bahsedebiliriz. Doğrusal bir regresyon denklemi oluşturmak için ne tür bir ilişkinin gözlemlendiğini bulmak gerekecektir.

Regresyon türleri

Günümüzde 7 farklı regresyon türü bulunmaktadır: hiperbolik, doğrusal, çoklu, doğrusal olmayan, ikili, ters, logaritmik olarak doğrusal.

Hiperbolik, doğrusal ve logaritmik

Doğrusal regresyon denklemi istatistikte denklemin parametrelerini net bir şekilde açıklamak için kullanılır. y = c+t*x+E gibi görünüyor. Bir hiperbolik denklem, düzenli hiperbol y = c + m / x + E biçimindedir. Logaritmik olarak doğrusal bir denklem, ilişkiyi logaritmik bir fonksiyon kullanarak ifade eder: In y = In c + m * In x + In E.

Çoklu ve doğrusal olmayan

Daha karmaşık olan iki regresyon türü çokludur ve doğrusal değildir. Çoklu regresyon denklemi y = f(x 1, x 2 ... x c) + E fonksiyonu ile ifade edilir. Bu durumda y bağımlı değişken, x ise açıklayıcı değişken görevi görmektedir. E değişkeni stokastiktir; denklemdeki diğer faktörlerin etkisini içerir. Doğrusal olmayan regresyon denklemi biraz tartışmalıdır. Bir yandan dikkate alınan göstergelere göre doğrusal değil, diğer yandan göstergeleri değerlendirme rolünde doğrusaldır.

Ters ve eşleştirilmiş regresyon türleri

Ters, doğrusal forma dönüştürülmesi gereken bir fonksiyon türüdür. Çoğu geleneksel uygulama programında y = 1/c + m*x+E fonksiyonu şeklindedir. İkili regresyon denklemi, veriler arasındaki ilişkiyi y = f (x) + E'nin bir fonksiyonu olarak gösterir. Diğer denklemlerde olduğu gibi, y x'e bağlıdır ve E stokastik bir parametredir.

Korelasyon kavramı

Bu, iki olgu veya süreç arasında bir ilişkinin varlığını gösteren bir göstergedir. İlişkinin gücü korelasyon katsayısı olarak ifade edilir. Değeri [-1;+1] aralığında dalgalanır. Negatif gösterge geri bildirimin varlığını, pozitif gösterge ise doğrudan geri bildirimi belirtir. Katsayı 0'a eşit bir değer alıyorsa ilişki yoktur. Değer 1'e ne kadar yakınsa parametreler arasındaki ilişki o kadar güçlü, 0'a ne kadar yakınsa o kadar zayıftır.

Yöntemler

Korelasyon parametrik yöntemleri ilişkinin gücünü değerlendirebilir. Normal dağılım yasasına uyan parametreleri incelemek için dağılım tahmini temelinde kullanılırlar.

Doğrusal regresyon denkleminin parametreleri, bağımlılığın türünü, regresyon denkleminin işlevini tanımlamak ve seçilen ilişki formülünün göstergelerini değerlendirmek için gereklidir. Korelasyon alanı bağlantı tanımlama yöntemi olarak kullanılır. Bunu yapmak için mevcut tüm verilerin grafiksel olarak gösterilmesi gerekir. Bilinen tüm veriler dikdörtgen iki boyutlu koordinat sisteminde gösterilmelidir. Bu bir korelasyon alanı yaratır. Tanımlayan faktörün değerleri apsis ekseni boyunca işaretlenirken, bağımlı faktörün değerleri ordinat ekseni boyunca işaretlenir. Parametreler arasında işlevsel bir ilişki varsa bunlar bir çizgi şeklinde sıralanır.

Bu tür verilerin korelasyon katsayısı %30'un altında ise neredeyse tamamen bağlantısızlıktan söz edebiliriz. %30 ile %70 arasında olması orta yakın bağlantıların varlığını gösterir. %100 göstergesi işlevsel bir bağlantının kanıtıdır.

Doğrusal olmayan bir regresyon denklemi, tıpkı doğrusal bir regresyon denklemi gibi, bir korelasyon indeksi (R) ile desteklenmelidir.

Çoklu Regresyon Korelasyonu

Belirleme katsayısı çoklu korelasyonun karesinin bir göstergesidir. Sunulan göstergeler dizisinin incelenen özellik ile yakın ilişkisinden bahsediyor. Ayrıca parametrelerin sonuç üzerindeki etkisinin doğası hakkında da konuşabilir. Çoklu regresyon denklemi bu gösterge kullanılarak tahmin edilir.

Çoklu korelasyon göstergesini hesaplamak için endeksinin hesaplanması gerekir.

En küçük kareler yöntemi

Bu yöntem regresyon faktörlerini tahmin etmenin bir yoludur. Bunun özü, faktörün fonksiyona bağımlılığının bir sonucu olarak elde edilen karesel sapmaların toplamını en aza indirmektir.

Böyle bir yöntem kullanılarak ikili doğrusal regresyon denklemi tahmin edilebilir. Bu tür denklem, göstergeler arasında ikili doğrusal bir ilişki tespit edildiğinde kullanılır.

Denklem Parametreleri

Doğrusal regresyon fonksiyonunun her parametresinin belirli bir anlamı vardır. Eşleştirilmiş doğrusal regresyon denklemi iki parametre içerir: c ve m. m parametresi, x değişkeninin bir geleneksel birim kadar azalması (artması) koşuluyla, y fonksiyonunun son göstergesindeki ortalama değişikliği gösterir. Eğer x değişkeni sıfır ise fonksiyon c parametresine eşittir. Eğer x değişkeni sıfır değilse c faktörü ekonomik bir anlam taşımamaktadır. Fonksiyon üzerindeki tek etki c faktörünün önündeki işarettir. Eğer bir eksi varsa o zaman sonuçtaki değişimin faktöre göre yavaş olduğunu söyleyebiliriz. Bir artı varsa, bu sonuçta daha hızlı bir değişiklik olduğunu gösterir.

Regresyon denkleminin değerini değiştiren her parametre bir denklem aracılığıyla ifade edilebilir. Örneğin, c faktörü c = y - mx biçimindedir.

Gruplandırılmış veriler

Tüm bilgilerin x niteliğine göre gruplandırıldığı görev koşulları vardır, ancak belirli bir grup için bağımlı göstergenin karşılık gelen ortalama değerleri belirtilir. Bu durumda ortalama değerler, x'e bağlı göstergenin nasıl değiştiğini karakterize eder. Böylece gruplandırılmış bilgiler regresyon denkleminin bulunmasına yardımcı olur. İlişkilerin analizi olarak kullanılır. Ancak bu yöntemin dezavantajları vardır. Ne yazık ki ortalama göstergeler sıklıkla dış dalgalanmalara maruz kalıyor. Bu dalgalanmalar ilişkinin şeklini yansıtmaz; sadece “gürültüyü” maskeler. Ortalamalar, doğrusal bir regresyon denkleminden çok daha kötü ilişki modellerini gösterir. Ancak bunlar bir denklem bulmak için temel olarak kullanılabilir. Bireysel popülasyonun sayısı karşılık gelen ortalamayla çarpılarak grup içindeki y toplamı elde edilebilir. Daha sonra, alınan tüm tutarları toplamanız ve son gösterge y'yi bulmanız gerekir. Toplam göstergesi xy ile hesaplama yapmak biraz daha zordur. Aralıklar küçükse, koşullu olarak tüm birimler için (grup içindeki) x göstergesinin aynı olmasını alabiliriz. X ve y'nin çarpımlarının toplamını bulmak için bunu y toplamı ile çarpmanız gerekir. Daha sonra tüm miktarlar toplanır ve toplam xy miktarı elde edilir.

Çoklu ikili regresyon denklemi: bir ilişkinin öneminin değerlendirilmesi

Daha önce tartışıldığı gibi, çoklu regresyonun fonksiyonu y = f (x 1,x 2,…,x m)+E formundadır. Çoğu zaman, böyle bir denklem, bir ürün için arz ve talep problemini, geri satın alınan hisselerden elde edilen faiz gelirini çözmek ve üretim maliyeti fonksiyonunun nedenlerini ve türünü incelemek için kullanılır. Aynı zamanda çok çeşitli makroekonomik çalışmalarda ve hesaplamalarda da aktif olarak kullanılmaktadır, ancak mikroekonomi düzeyinde bu denklem biraz daha az kullanılmaktadır.

Çoklu regresyonun asıl görevi, her bir faktörün bireysel olarak ve bütünlük içinde modellenmesi gereken gösterge ve katsayıları üzerinde ne gibi bir etkiye sahip olduğunu daha fazla belirlemek için büyük miktarda bilgi içeren bir veri modeli oluşturmaktır. Regresyon denklemi çok çeşitli değerler alabilir. Bu durumda ilişkiyi değerlendirmek için genellikle iki tür fonksiyon kullanılır: doğrusal ve doğrusal olmayan.

Doğrusal fonksiyon aşağıdaki ilişki formunda gösterilir: y = a 0 + a 1 x 1 + a 2 x 2,+ ... + a m x m. Bu durumda a2, a m “saf” regresyon katsayıları olarak kabul edilir. Diğer göstergelerin sabit değerlerine bağlı olarak, y parametresindeki ortalama değişikliği, karşılık gelen her x parametresinde bir birim değişiklik (azalma veya artış) ile karakterize etmek gerekir.

Doğrusal olmayan denklemler örneğin y=ax 1 b1 x 2 b2 ...x m bm güç fonksiyonu biçimine sahiptir. Bu durumda, b 1, b 2 ..... b m göstergelerine esneklik katsayıları denir, ilgili x göstergesinde% 1 artış (azalış) ile sonucun nasıl değişeceğini (% ne kadar) gösterirler ve diğer faktörlerin istikrarlı bir göstergesi ile.

Çoklu regresyon oluştururken hangi faktörlerin dikkate alınması gerekir?

Çoklu regresyonu doğru bir şekilde oluşturmak için hangi faktörlere özellikle dikkat edilmesi gerektiğini bulmak gerekir.

Ekonomik faktörler ile modellenenler arasındaki ilişkilerin doğası hakkında bir miktar anlayışa sahip olmak gerekir. Dahil edilmesi gereken faktörler aşağıdaki kriterleri karşılamalıdır:

  • Kantitatif ölçüme tabi tutulmalıdır. Bir nesnenin kalitesini tanımlayan bir faktörün kullanılabilmesi için her durumda ona niceliksel bir form verilmesi gerekir.
  • Faktörler arasında herhangi bir korelasyon veya işlevsel ilişki olmamalıdır. Bu tür eylemler çoğu zaman geri dönüşü olmayan sonuçlara yol açar - sıradan denklemler sistemi koşulsuz hale gelir ve bu, onun güvenilmezliğini ve belirsiz tahminlerini gerektirir.
  • Büyük bir korelasyon göstergesi durumunda, faktörlerin göstergenin nihai sonucu üzerindeki izole etkisini bulmanın bir yolu yoktur, bu nedenle katsayılar yorumlanamaz hale gelir.

İnşaat yöntemleri

Bir denklem için faktörleri nasıl seçebileceğinizi açıklayan çok sayıda yöntem ve yöntem vardır. Ancak tüm bu yöntemler bir korelasyon göstergesi kullanılarak katsayıların seçimine dayanmaktadır. Aralarında:

  • Eliminasyon yöntemi.
  • Anahtarlama yöntemi.
  • Adım adım regresyon analizi.

İlk yöntem, toplam kümedeki tüm katsayıların filtrelenmesini içerir. İkinci yöntem birçok ek faktörün dahil edilmesini içerir. Üçüncüsü ise daha önce denklem için kullanılan faktörlerin ortadan kaldırılmasıdır. Bu yöntemlerin her birinin var olma hakkı vardır. Artıları ve eksileri var, ancak hepsi gereksiz göstergeleri ortadan kaldırma sorununu kendi yöntemleriyle çözebilir. Kural olarak, her bir yöntemle elde edilen sonuçlar oldukça yakındır.

Çok değişkenli analiz yöntemleri

Faktörleri belirlemeye yönelik bu tür yöntemler, birbiriyle ilişkili özelliklerin bireysel kombinasyonlarının dikkate alınmasına dayanmaktadır. Bunlar, diskriminant analizi, şekil tanıma, temel bileşen analizi ve küme analizini içerir. Ayrıca faktör analizi de vardır ancak bileşen yönteminin gelişmesi nedeniyle ortaya çıkmıştır. Hepsi belirli koşullar ve faktörlere tabi olarak belirli durumlarda geçerlidir.

Korelasyon analizi, değişkenler arasındaki istatistiksel ilişkilerin varlığını ortaya çıkardıktan ve bunların yakınlık derecesini değerlendirdikten sonra, genellikle regresyon analizini kullanarak belirli bir bağımlılık türünün matematiksel açıklamasına geçeriz. Bu amaçla, sonuç göstergesi y ile x 1, x 2, ..., x k argümanlarını birbirine bağlayan bir fonksiyon sınıfı seçilir, en bilgilendirici argümanlar seçilir, parametrelerin bilinmeyen değerlerinin tahminleri yapılır. iletişim denklemi hesaplanır ve elde edilen denklemin özellikleri analiz edilir.

Ortaya çıkan karakteristik y'nin ortalama değerinin argümanların verilen değerlerine bağımlılığını tanımlayan f(x 1, x 2,..., x k) fonksiyonuna regresyon fonksiyonu (denklem) denir. "Regresyon" terimi (Latince -regresyon - geri çekilme, bir şeye dönüş) İngiliz psikolog ve antropolog F. Galton tarafından tanıtıldı ve yalnızca bu kavramın kullanıldığı ilk somut örneklerden birinin özellikleriyle ilişkilendirildi. Böylece, boy kalıtımının analizi ile bağlantılı olarak istatistiksel verileri işleyen F. Galton, eğer babalar tüm babaların ortalama boylarından x inç saparsa, oğullarının tüm oğulların ortalama boylarından x'ten daha az saptığını buldu. inç. Belirlenen eğilime "ortalama gerileme" adı verildi. O zamandan beri, "regresyon" terimi istatistiksel literatürde yaygın olarak kullanılmaktadır, ancak çoğu durumda istatistiksel bağımlılık kavramını doğru bir şekilde karakterize etmemektedir.

Regresyon denklemini doğru bir şekilde tanımlamak için etkin gösterge y'nin dağılım yasasını bilmek gerekir. İstatistiksel uygulamada, araştırmacının, verilen değerler için analiz edilen sonuç göstergesi y'nin koşullu olasılık dağılım yasası hakkında tam bilgi sahibi olmaması nedeniyle, genellikle bilinmeyen gerçek regresyon fonksiyonu için uygun yaklaşımların araştırılmasıyla sınırlandırılması gerekir. argüman x.

Gerçek f(x) = M(y1x) arasındaki ilişkiyi ele alalım, model regresyonu? ve regresyon tahmini y. Etkin gösterge y'nin x argümanıyla aşağıdaki ilişkiyle ilişkilendirilmesine izin verin:

normal dağılım yasasına sahip bir rastgele değişken ve Me = 0 ve D e = y 2. Bu durumda gerçek regresyon fonksiyonu şu şekildedir: f (x) = M(y/x) = 2x 1,5.

Gerçek regresyon denkleminin tam biçimini bilmediğimizi varsayalım, ancak yi = 2x1.5 + e ilişkisiyle ilişkilendirilen ve Şekil 2'de sunulan iki boyutlu bir rastgele değişkene ilişkin dokuz gözlemimiz var. 1

Şekil 1 - Doğru f(x)'in ve teorik olanın göreceli konumu? regresyon modelleri

Şekil 2'deki noktaların konumu. 1, kendimizi formun doğrusal bağımlılıkları sınıfıyla sınırlamamıza izin veriyor mu? = 0 + 1 x'te. En küçük kareler yöntemini kullanarak y = b 0 + b 1 x regresyon denkleminin tahminini buluyoruz. Karşılaştırma için, Şekil 2'de. Şekil 1, gerçek regresyon fonksiyonunun grafiklerini göstermektedir: y = 2x 1,5, teorik olarak yaklaşan regresyon fonksiyonu? = 0 + 1 x'te.

Regresyon fonksiyonunun sınıfını seçerken bir hata yaptığımızdan ve bu istatistiksel araştırma pratiğinde oldukça yaygın olduğundan, istatistiksel sonuçlarımız ve tahminlerimiz hatalı olacaktır. Gözlem hacmini ne kadar artırırsak artıralım, örnek tahminimiz y, gerçek regresyon fonksiyonu f(x)'e yakın olmayacaktır. Eğer regresyon fonksiyonlarının sınıfını doğru seçmiş olsaydık, o zaman f(x)'i kullanarak tanımlamadaki yanlışlık ne olurdu? yalnızca örneklem sınırlılıkları ile açıklanabilmektedir.

Orijinal istatistiksel verilerden etkin gösterge y(x)'in koşullu değerini ve bilinmeyen regresyon fonksiyonunu f(x) = M(y/x) en iyi şekilde geri yüklemek için aşağıdaki yeterlilik kriterleri (kayıp fonksiyonları) en çok kullanılanlardır. sık kullanılan.

En küçük kareler yöntemi. Buna göre, etkin gösterge y'nin (i = 1,2,..., n) gözlenen değerlerinin model değerlerinden sapmasının karesi,? = f(x i), burada x i, i'inci gözlemdeki argüman vektörünün değeridir: ?(y i - f(x i) 2 > min. Ortaya çıkan regresyona ortalama kare adı verilir.

En küçük modüllerin yöntemi. Buna göre etkin göstergenin gözlemlenen değerlerinin modüler değerlerden mutlak sapmalarının toplamı en aza indirilir. Ve anladık? = f(x i), mutlak medyan regresyon anlamına mı geliyor? |y i - f(x i)| > dk.

Regresyon analizi, gerçek dağılım yasasından bağımsız olarak regresyon analizinde rastgele olmayan değişkenler olarak kabul edilen x j = (j=1,2,..., k) değişkenlerine rastgele bir değişken y'nin bağımlılığının istatistiksel analiz yöntemidir. x j'nin.

Genellikle bir rastgele değişkenin y'nin, x/ (/ = 1, 2,..., k) bağımsız değişkenlerinin ve y 2 bağımsız sabit varyansının bir fonksiyonu olan koşullu matematiksel beklenti y ile normal dağılım yasasına sahip olduğu varsayılır. argümanlardan.

Genel olarak doğrusal regresyon analiz modeli şu şekildedir:

e = Y k j=0 V J ts J(X 1 , X 2 . . .. ,X k)+E

burada q j değişkenlerinin bir fonksiyonudur - x 1, x 2. . .. ,x k, E sıfır matematiksel beklentisi ve varyansı y 2 olan bir rastgele değişkendir.

Regresyon analizinde, regresyon denkleminin türü, incelenen olgunun fiziksel doğasına ve gözlem sonuçlarına göre seçilir.

Regresyon denkleminin bilinmeyen parametrelerinin tahminleri genellikle en küçük kareler yöntemi kullanılarak bulunur. Aşağıda bu sorun üzerinde daha ayrıntılı olarak duracağız.

İki değişkenli doğrusal regresyon denklemi. İncelenen olgunun analizine dayanarak, "ortalama" y'nin x'in doğrusal bir fonksiyonu olduğunu, yani bir regresyon denklemi olduğunu varsayalım.

y=M(y/x)=in 0 + in 1 x)

burada M(y1x), belirli bir x için rastgele değişken y'nin koşullu matematiksel beklentisidir; 0 ve 1'de - örnek gözlemlerin sonuçlarına göre tahmin edilmesi gereken genel popülasyonun bilinmeyen parametreleri.

0 ve 1'deki parametreleri tahmin etmek için, iki boyutlu bir popülasyondan (x, y) n boyutunda bir numunenin alındığını varsayalım; burada (x, y,), i'inci gözlemin sonucudur (i = 1). , 2,..., n) . Bu durumda regresyon analizi modeli şu şekildedir:

y j = 0'da + 1'de x+e j .

burada e j bağımsız, sıfır matematiksel beklenti ve varyans y 2 olan normal dağılımlı rastgele değişkenlerdir, yani M e j. = 0;

Tüm i = 1, 2,..., n için D e j .= y 2.

En küçük kareler yöntemine göre, 0 ve 1'de bilinmeyen parametrelerin tahminleri olarak, sonuç değerlerinin karesel sapmalarının toplamını en aza indiren b 0 ve b 1 örnek özelliklerinin değerleri alınmalıdır. koşullu matematiksel beklentiden i'nin karakteristiği? Ben

Ortalama büyüklük ve ekonomik faaliyet göstergelerine sahip on yedi tipik işletme örneğini kullanarak, pazarlama özelliklerinin bir işletmenin kârı üzerindeki etkisini belirleme yöntemini ele alacağız.

Sorunu çözerken, anket araştırması sonucunda en önemli (önemli) olarak belirlenen aşağıdaki özellikler dikkate alınmıştır:

* işletmenin yenilikçi faaliyeti;

* Üretilen ürün yelpazesinin planlanması;

* Fiyatlandırma politikasının oluşturulması;

* Halkla ilişkiler;

* satış sistemi;

* Çalışan teşvik sistemi.

Faktörlere göre bir karşılaştırma sistemine dayanarak, her faktör için göreceli önceliklerin değerlerinin hesaplandığı kare kare matrisler oluşturuldu: işletmenin yenilikçi faaliyeti, ürün yelpazesinin planlanması, fiyatlandırma politikasının oluşturulması, reklam , halkla ilişkiler, satış sistemi, çalışan teşvik sistemi.

İşletme uzmanlarının katıldığı bir anket sonucunda “halkla ilişkiler” faktörüne ilişkin öncelik tahminleri elde edildi. Aşağıdaki gösterimler kabul edilir: > (daha iyi), > (daha iyi veya aynı), = (aynı),< (хуже или одинаково), <

Daha sonra işletmenin pazarlama düzeyinin kapsamlı bir değerlendirmesi sorunu çözüldü. Gösterge hesaplanırken, dikkate alınan kısmi özelliklerin önemi (ağırlığı) belirlendi ve kısmi göstergelerin doğrusal evrişimi sorunu çözüldü. Veri işleme özel geliştirilmiş programlar kullanılarak gerçekleştirildi.

Daha sonra, işletmenin pazarlama seviyesinin kapsamlı bir değerlendirmesi hesaplanır - Tablo 1'e girilen pazarlama katsayısı. Ayrıca tablo, işletmeyi bir bütün olarak karakterize eden göstergeleri içerir. Tablodaki veriler regresyon analizini gerçekleştirmek için kullanılacaktır. Ortaya çıkan özellik kârdır. Pazarlama katsayısının yanı sıra faktör göstergeleri olarak aşağıdaki göstergeler kullanıldı: brüt çıktı hacmi, sabit varlıkların maliyeti, çalışan sayısı ve uzmanlaşma katsayısı.

Tablo 1 - Regresyon analizi için başlangıç ​​verileri


Tablo verilerine göre ve korelasyon katsayılarının en anlamlı değerlerine sahip faktörler temelinde, kârın faktörlere bağımlılığının regresyon fonksiyonları oluşturulmuştur.

Bizim durumumuzda regresyon denklemi şu şekilde olacaktır:

Yukarıda tartışılan faktörlerin kâr miktarı üzerindeki niceliksel etkisi, regresyon denkleminin katsayıları ile gösterilir. Faktör özelliği bir birim değiştiğinde değerinin kaç bin ruble değiştiğini gösterirler. Denklemden de anlaşılacağı gibi, pazarlama karması katsayısının bir birim artması, kârda 1547,7 bin ruble artış sağlıyor. Bu, pazarlama faaliyetlerinin iyileştirilmesinin, işletmelerin ekonomik performansının iyileştirilmesi için muazzam bir potansiyele sahip olduğunu göstermektedir.

Pazarlama etkinliğini incelerken en ilginç ve en önemli faktör X5 faktörüdür - pazarlama katsayısı. İstatistik teorisine uygun olarak, mevcut çoklu regresyon denkleminin avantajı, pazarlama faktörü de dahil olmak üzere her faktörün izole edilmiş etkisini değerlendirme yeteneğidir.

Regresyon analizinin sonuçları, denklemin parametrelerinin hesaplanmasından daha geniş bir uygulamaya sahiptir. (Kef) işletmelerini nispeten daha iyi veya nispeten daha kötü olarak sınıflandırma kriteri, sonucun göreceli göstergesine dayanmaktadır:

burada Y facti, i-inci işletmenin gerçek değeridir, bin ruble;

Hesaplanan Y - regresyon denklemi kullanılarak hesaplanarak elde edilen i-inci işletmenin kâr miktarı

Çözülen problem açısından bu değere “verimlilik katsayısı” adı verilmektedir. Katsayı değerinin birden büyük olduğu durumlarda işletmenin faaliyeti etkili kabul edilebilir. Bu, gerçek kârın numunedeki ortalama kârdan daha büyük olduğu anlamına gelir.

Gerçek ve tahmini kar değerleri tabloda sunulmaktadır. 2.

Tablo 2 - Regresyon modelinde ortaya çıkan özelliğin analizi

Tablonun analizi, bizim durumumuzda, 3, 5, 7, 9, 12, 14, 15, 17 numaralı işletmelerin incelenen dönemdeki faaliyetlerinin başarılı sayılabileceğini göstermektedir.

Regresyon analizi istatistiksel araştırmaların en popüler yöntemlerinden biridir. Bağımsız değişkenlerin bağımlı değişken üzerindeki etki derecesini belirlemek için kullanılabilir. Microsoft Excel'in bu tür analizleri gerçekleştirmek için tasarlanmış araçları vardır. Gelin bunların ne olduğuna ve nasıl kullanılacağına bakalım.

Ancak regresyon analizi yapmanızı sağlayan fonksiyonu kullanabilmeniz için öncelikle Analiz Paketini aktif etmeniz gerekmektedir. Ancak o zaman bu prosedür için gerekli araçlar Excel şeridinde görünecektir.


Şimdi sekmeye gittiğimizde "Veri", araç kutusundaki şeritte "Analiz" yeni bir düğme göreceğiz - "Veri analizi".

Regresyon Analizi Türleri

Birkaç tür regresyon vardır:

  • parabolik;
  • sakinleştirici;
  • logaritmik;
  • üstel;
  • gösterici;
  • hiperbolik;
  • doğrusal regresyon.

Regresyon analizinin son türünün Excel'de yapılması konusunu daha sonra detaylı olarak konuşacağız.

Excel'de Doğrusal Regresyon

Aşağıda örnek olarak, dışarıdaki ortalama günlük hava sıcaklığını ve ilgili iş günü için mağaza müşteri sayısını gösteren bir tablo bulunmaktadır. Regresyon analizini kullanarak, hava sıcaklığı şeklindeki hava koşullarının bir perakende kuruluşunun katılımını tam olarak nasıl etkileyebileceğini öğrenelim.

Genel doğrusal regresyon denklemi şu şekildedir: Y = a0 + a1x1 +...+akhk. Bu formülde eüzerinde çalışmaya çalıştığımız faktörlerin etkisi olan bir değişken anlamına gelir. Bizim durumumuzda bu alıcı sayısıdır. Anlam X Bir değişkeni etkileyen çeşitli faktörlerdir. Seçenekler A regresyon katsayılarıdır. Yani belirli bir faktörün önemini belirleyenler onlardır. Dizin k aynı faktörlerin toplam sayısını belirtir.


Analiz sonuçları analizi

Regresyon analizinin sonuçları ayarlarda belirtilen yerde tablo şeklinde görüntülenir.

Ana göstergelerden biri R Meydanı. Modelin kalitesini gösterir. Bizim durumumuzda bu katsayı 0,705 yani %70,5 civarındadır. Bu kabul edilebilir bir kalite seviyesidir. Bağımlılığın 0,5'ten az olması kötüdür.

Bir diğer önemli gösterge ise çizginin kesişimindeki hücrede bulunur. "Y-kavşağı" ve sütun "Oranlar". Bu, Y'nin hangi değere sahip olacağını gösterir ve bizim durumumuzda bu, diğer tüm faktörlerin sıfıra eşit olduğu alıcıların sayısıdır. Bu tabloda bu değer 58,04'tür.

Grafiğin kesişim noktasındaki değer "Değişken X1" Ve "Oranlar" Y'nin X'e bağımlılık düzeyini gösterir. Bizim durumumuzda bu, mağaza müşteri sayısının sıcaklığa bağımlılık düzeyidir. 1,31 katsayısı oldukça yüksek bir etki göstergesi olarak kabul edilir.

Gördüğünüz gibi Microsoft Excel kullanarak regresyon analiz tablosu oluşturmak oldukça kolaydır. Ancak yalnızca eğitimli bir kişi çıktı verileriyle çalışabilir ve özünü anlayabilir.

1908 yılına dayanan eserlerinde. Bunu, emlak satan bir acentenin işi örneğini kullanarak anlattı. Ev satış uzmanı, kayıtlarında her bir bina için geniş bir yelpazedeki girdi verilerini takip ediyordu. Açık artırma sonuçlarına göre hangi faktörün işlem fiyatı üzerinde en büyük etkiye sahip olduğu belirlendi.

Çok sayıda işlemin analizi ilginç sonuçlar verdi. Nihai fiyat birçok faktörden etkileniyordu; bazen paradoksal sonuçlara ve hatta yüksek başlangıç ​​potansiyeline sahip bir ev indirimli bir fiyata satıldığında bariz "aykırı değerlere" yol açıyordu.

Böyle bir analizin uygulanmasının ikinci örneği, çalışanların ücretlerinin belirlenmesiyle görevlendirilen çalışmadır. Görevin karmaşıklığı, sabit bir miktarın herkese dağıtılmasını değil, gerçekleştirilen spesifik işe tam olarak uymasını gerektirmesi gerçeğinde yatıyordu. Pratik olarak benzer çözümlere sahip birçok problemin ortaya çıkması, bunların matematiksel düzeyde daha ayrıntılı bir şekilde incelenmesini gerektirdi.

Regresyon kavramı kapsamına giren bağımlılıkları incelemek için kullanılan pratik yöntemleri birleştiren “regresyon analizi” bölümüne önemli bir yer ayrıldı. Bu ilişkiler istatistiksel çalışmalardan elde edilen veriler arasında gözlenmektedir.

Çözülmesi gereken pek çok görev arasında ana hedefler üçtür: genel bir regresyon denkleminin belirlenmesi; regresyon denkleminin parçası olan bilinmeyen parametrelerin tahminlerinin oluşturulması; İstatistiksel regresyon hipotezlerinin test edilmesi. Deneysel gözlemler sonucunda elde edilen ve (x1, y1), ..., (xn, yn) türünde bir dizi (küme) oluşturan bir çift miktar arasında ortaya çıkan ilişkiyi incelerken, şunlara güvenirler: regresyon teorisinin hükümlerine göre hareket eder ve bir Y niceliği için belirli bir olasılık dağılımının olduğunu, diğer X'in ise sabit kaldığını varsayar.

Y sonucu, X değişkeninin değerine bağlıdır; bu bağımlılık çeşitli kalıplarla belirlenebilirken, elde edilen sonuçların doğruluğu gözlemlerin doğasından ve analizin amacından etkilenir. Deneysel model basitleştirilmiş ancak makul olan belirli varsayımlara dayanmaktadır. Ana koşul, X parametresinin kontrollü bir miktar olmasıdır. Değerleri deneyin başlamasından önce ayarlanır.

Bir deney sırasında bir çift kontrolsüz değişken XY kullanılırsa, regresyon analizi aynı şekilde gerçekleştirilir, ancak sonuçların yorumlanması için, incelenen rastgele değişkenlerin ilişkisinin incelendiği yöntemler kullanılır. Matematiksel istatistik yöntemleri. soyut bir konu değildir. İnsan faaliyetinin çeşitli alanlarında yaşamda uygulama bulurlar.

Bilimsel literatürde doğrusal regresyon analizi terimi yukarıdaki yöntemi tanımlamak için yaygın olarak kullanılmaktadır. X değişkeni için regresör veya yordayıcı terimi kullanılır ve bağımlı Y değişkenlerine aynı zamanda kriter değişkenler de denir. Bu terminoloji, değişkenlerin yalnızca matematiksel bağımlılığını yansıtır, neden-sonuç ilişkisini yansıtmaz.

Regresyon analizi, çok çeşitli gözlemlerin sonuçlarının işlenmesinde kullanılan en yaygın yöntemdir. Fiziksel ve biyolojik bağımlılıklar bu yöntemle incelenir; hem ekonomide hem de teknolojide uygulanır. Diğer birçok alan regresyon analizi modellerini kullanır. Varyans analizi ve çok değişkenli istatistiksel analiz, bu çalışma yöntemiyle yakından çalışır.



Makaleyi beğendin mi? Arkadaşlarınla ​​paylaş!