Regresyon analizi teorisi. A) Basit doğrusal regresyonun grafiksel analizi

A) Basit doğrusal regresyonun grafiksel analizi.

Basit doğrusal regresyon denklemi y=a+bx. Y ve X rastgele değişkenleri arasında bir korelasyon varsa, o zaman y = ı +  değeri,

burada ı, y = f(x) denkleminden elde edilen y'nin teorik değeridir,

 – teorik denklemin gerçek (deneysel) verilerden sapma hatası.

Ortalama değer ý'nin x'e bağımlılığına ilişkin denklem, yani ý = f(x), regresyon denklemi olarak adlandırılır. Regresyon analizi dört aşamadan oluşur:

1) sorunun belirlenmesi ve bağlantının nedenlerinin belirlenmesi.

2) araştırma nesnesinin sınırlandırılması, istatistiksel bilgilerin toplanması.

3) toplanan verilerin analizine ve niteliğine dayalı olarak birleştirme denkleminin seçimi.

4) sayısal değerlerin hesaplanması, korelasyon bağlantılarının özellikleri.

İki değişken, bir değişkendeki değişim diğer değişkendeki sistematik değişime karşılık gelecek şekilde ilişkiliyse, bu değişkenler biliniyorsa aralarındaki ilişkinin denklemini tahmin etmek ve seçmek için regresyon analizi kullanılır. Korelasyon analizi, regresyon analizinden farklı olarak X ve Y arasındaki ilişkinin yakınlığını analiz etmek için kullanılır.

Regresyon analizinde düz bir çizgi bulmayı düşünelim:

Teorik regresyon denklemi.

"Basit regresyon" terimi, bir değişkenin değerinin başka bir değişken hakkındaki bilgiye dayanarak tahmin edildiğini belirtir. Basit çok değişkenli regresyonun aksine, iki, üç veya daha fazla değişkenin bilgisine dayalı olarak bir değişkeni tahmin etmek için kullanılır. Basit doğrusal regresyonun grafiksel analizine bakalım.

İstihdam öncesi ve işgücü verimliliğine ilişkin tarama testlerinin sonuçlarının olduğunu varsayalım.

Seçim sonuçları (100 puan), x

Verimlilik (20 puan), y

Noktaları bir grafik üzerine çizerek bir dağılım diyagramı (alan) elde ederiz. Seçim testlerinin sonuçlarını ve işgücü verimliliğini analiz etmek için kullanıyoruz.

Dağılım grafiğini kullanarak regresyon çizgisini analiz edelim. Regresyon analizinde her zaman en az iki değişken belirtilir. Bir değişkendeki sistematik değişiklik, diğerindeki değişiklikle ilişkilidir. birincil hedef regresyon analizi Bir değişkenin değeri biliniyorsa, bir değişkenin değerinin tahmin edilmesinden oluşur. Eksiksiz bir görev için emek verimliliğinin değerlendirilmesi önemlidir.

Bağımsız değişken Regresyon analizinde, başka bir değişkeni analiz etmek için temel olarak kullanılan bir miktar. Bu durumda bunlar seçim testlerinin sonuçlarıdır (X ekseni boyunca).

Bağımlı değişken tahmini değer denir (Y ekseni boyunca). Regresyon analizinde yalnızca bir bağımlı değişken ve birden fazla bağımsız değişken bulunabilir.

Basit regresyon analizi için bağımlılık, X ekseninin bağımsız değişken ve Y ekseninin bağımlı değişken olduğu iki koordinatlı bir sistemde (x ve y) temsil edilebilir. Grafikte bir çift değer temsil edilecek şekilde kesişim noktalarını çiziyoruz. Zamanlama denir dağılım grafiği. Yapısı regresyon analizinin ikinci aşamasıdır, çünkü ilki analiz edilen değerlerin seçilmesi ve örnek verilerin toplanmasıdır. Bu nedenle istatistiksel analiz için regresyon analizi kullanılır. Bir grafikteki örnek veriler arasındaki ilişki doğrusaldır.

Bir x değişkenine dayalı olarak bir y değişkeninin büyüklüğünü tahmin etmek için, dağılım grafiğindeki noktaların konumuna bağlı olarak x ve y arasındaki ilişkiyi en iyi temsil eden çizginin konumunu belirlemek gerekir. Örneğimizde bu performans analizidir. Saçılma noktalarından çizilen çizgi – regresyon hattı. Görsel deneyime dayalı bir regresyon çizgisi oluşturmanın bir yolu serbest yöntemdir. Regresyon çizgimiz emek verimliliğini belirlemek için kullanılabilir. Regresyon çizgisinin denklemini bulurken

En küçük kareler testi sıklıkla kullanılır. En uygun doğru, sapmaların kareleri toplamının minimum olduğu çizgidir.

Bir büyüme çizgisinin matematiksel denklemi, aritmetik ilerlemedeki büyüme yasasını temsil eder:

en = ABX.

e = A + BX– tek parametreli verilen denklem, en basit birleştirme denklemi türüdür. Ortalama değerler için kabul edilebilir. arasındaki ilişkiyi daha doğru ifade edebilmek için X Ve en ek bir orantı katsayısı eklenir B regresyon çizgisinin eğimini gösterir.

B) Teorik bir regresyon çizgisinin oluşturulması.

Bunu bulma süreci, eğri tipinin seçilmesi ve gerekçelendirilmesi ve parametrelerin hesaplanmasından oluşur. A, B, İle vesaire. İnşaat sürecine tesviye denir ve matın sunduğu eğrilerin sağlanması. analiz, çeşitli. Çoğu zaman, ekonomik problemlerde, pozitif tamsayı kuvvetlerinin polinomları ile ifade edilen denklemlerden oluşan bir eğri ailesi kullanılır.

1)
– düz bir çizginin denklemi,

2)
– hiperbol denklemi,

3)
– bir parabolün denklemi,

burada ı teorik regresyon çizgisinin koordinatlarıdır.

Denklem türünü seçtikten sonra bu denklemin bağlı olduğu parametreleri bulmanız gerekir. Örneğin, saçılma alanındaki noktaların konumunun doğası, teorik regresyon çizgisinin düz olduğunu gösterdi.

Dağılım grafiği, regresyon analizini kullanarak işgücü verimliliğini temsil etmenize olanak tanır. Ekonomide, nihai ürünü etkileyen birçok özelliği (fiyatlandırmayı dikkate alarak) tahmin etmek için regresyon analizi kullanılır.

B) Düz bir çizgi bulmak için en küçük çerçevelerin kriteri.

Bir dağılım grafiğinde uygun bir regresyon çizgisi için uygulayabileceğimiz bir kriter, karesel hataların toplamının minimum olduğu doğrunun seçilmesine dayanmaktadır.

Saçılma noktalarının düz çizgiye yakınlığı, bölümlerin koordinatları ile ölçülür. Bu noktaların sapmaları pozitif ve negatif olabilir ancak teorik çizginin deneysel çizgiden sapmalarının karelerinin toplamı her zaman pozitiftir ve minimum olmalıdır. Tüm saçılma noktalarının regresyon çizgisinin konumuyla çakışmaması, deneysel ve teorik veriler arasında bir farklılığın varlığına işaret etmektedir. Dolayısıyla, bulunan regresyon çizgisi dışında hiçbir regresyon çizgisinin deneysel ve deneysel veriler arasında daha az miktarda sapma veremeyeceğini söyleyebiliriz. Bu nedenle teorik denklemi bulduktan sonra ý ve regresyon doğrusunda en küçük kareler gereksinimini karşılıyoruz.

Bu, birleştirme denklemi kullanılarak yapılır
parametreleri bulmak için formülleri kullanma A Ve B. Teorik değerin alınması
ve denklemin sol tarafını ifade ederek F, fonksiyonu alıyoruz
bilinmeyen parametrelerden A Ve B. Değerler A Ve B minimum işlevi karşılayacak F ve kısmi diferansiyel denklemlerden bulunur
Ve
. Bu gerekli kondisyon ancak pozitif ikinci dereceden bir fonksiyon için bu aynı zamanda bulmak için yeterli bir koşuldur. A Ve B.

Kısmi türev denklemlerinden parametre formüllerini türetelim A Ve B:



bir denklem sistemi elde ederiz:

Nerede
– aritmetik ortalama hataları.

Sayısal değerleri değiştirerek parametreleri buluyoruz A Ve B.

Bir konsept var
. Bu yaklaşıklık faktörüdür.

Eğer e < 33%, то модель приемлема для дальнейшего анализа;

Eğer e>%33, sonra bir hiperbol, parabol vb. alırız. Bu, çeşitli durumlarda analiz hakkı verir.

Sonuç: Yaklaşım katsayısı kriterine göre en uygun çizgi,

ve problemimiz için başka hiçbir regresyon çizgisi minimum sapmayı vermez.

D) Tahminin kare hatası, tipikliklerinin kontrol edilmesi.

Araştırma parametresi sayısının 30'dan az olduğu bir evrenle ilgili olarak ( N < 30), для проверки типичности параметров уравнения регрессии используется T-Öğrencinin t testi. Bu gerçek değeri hesaplar T-kriterler:

Buradan

Nerede – artık kök-ortalama-kare hatası. Kabul edilmiş T A Ve T B kritik ile karşılaştırıldığında T k Kabul edilen anlamlılık düzeyini dikkate alarak Öğrenci tablosundan ( = 0,01 = %99 veya  = 0,05 = %95) P = F = k 1 = M– incelenen denklemin parametre sayısı (serbestlik derecesi). Örneğin, eğer sen = A + bx; M = 2, k 2 = F 2 = P 2 = N – (M+ 1), burada N– incelenen özelliklerin sayısı.

T A < T k < T B .

Çözüm: tipiklik açısından test edilen regresyon denkleminin parametreleri kullanılarak matematiksel bir iletişim modeli oluşturulur
. Bu durumda, analizde kullanılan matematiksel fonksiyonun parametreleri (doğrusal, hiperbol, parabol) karşılık gelen niceliksel değerleri alır. Bu şekilde elde edilen modellerin anlamsal içeriği, ortaya çıkan özelliğin ortalama değerini karakterize etmeleridir.
faktör karakteristiğinden X.

D) Eğrisel regresyon.

Çoğu zaman değişkenler arasında değişen bir ilişki kurulduğunda eğrisel bir ilişki ortaya çıkar. Artışın (azalışın) yoğunluğu X seviyesine bağlıdır. Eğrisel bağımlılığın farklı türleri vardır. Örneğin, mahsul verimi ile yağış arasındaki ilişkiyi düşünün. Eşit doğa şartlarında yağışların artmasıyla birlikte verimde de yoğun bir artış oluyor ama belli bir limite kadar. Kritik noktadan sonra yağışlar aşırı olmaya başlıyor ve verim felaket derecede düşüyor. Örnek, ilişkinin ilk başta olumlu, sonra olumsuz olduğunu gösteriyor. Kritik nokta, Y özelliğinin maksimum veya minimum değerine karşılık gelen X özelliğinin optimal seviyesidir.

Ekonomide fiyat ile tüketim, üretkenlik ile deneyim arasında böyle bir ilişki görülmektedir.

Parabolik bağımlılık.

Veriler, bir faktör özelliğindeki artışın sonuç özelliğinde bir artışa yol açtığını gösteriyorsa, regresyon denklemi olarak ikinci dereceden bir denklem (parabol) alınır.

. a,b,c katsayıları kısmi diferansiyel denklemlerden bulunur:

Bir denklem sistemi elde ederiz:

Eğrisel denklem türleri:

,

,

İşgücü verimliliği ile seçim testi puanları arasında eğrisel bir ilişki olduğunu varsayma hakkımız var. Bu, puanlama sistemi arttıkça performansın bir düzeyde düşmeye başlayacağı ve dolayısıyla düz modelin eğrisel olabileceği anlamına gelir.

Üçüncü model bir hiperbol olacak ve tüm denklemlerde x değişkeninin yerini ifade alacak.

SONUÇLARIN SONUÇLANMASI

Tablo 8.3a. Regresyon istatistikleri
Regresyon istatistikleri
Çoğul R 0,998364
R Meydanı 0,99673
Normalleştirilmiş R-kare 0,996321
Standart hata 0,42405
Gözlemler 10

Öncelikle tablo 8.3a'da sunulan hesaplamaların en üst kısmına, yani regresyon istatistiklerine bakalım.

Kesinlik ölçüsü olarak da adlandırılan R-kare değeri, ortaya çıkan regresyon çizgisinin kalitesini karakterize eder. Bu kalite, kaynak veriler ile regresyon modeli (hesaplanan veriler) arasındaki yazışma derecesi ile ifade edilir. Kesinliğin ölçüsü her zaman aralık dahilindedir.

Çoğu durumda, R-kare değeri uç değerler olarak adlandırılan bu değerlerin arasındadır; sıfır ile bir arasında.

R-kare değerinin bire yakın olması, oluşturulan modelin ilgili değişkenlerdeki değişkenliğin neredeyse tamamını açıkladığı anlamına gelir. Tersine, sıfıra yakın bir R-kare değeri, oluşturulan modelin kalitesinin zayıf olduğu anlamına gelir.

Örneğimizde kesinlik ölçüsü 0,99673'tür, bu da regresyon çizgisinin orijinal verilere çok iyi uyduğunu gösterir.

Çoğul R- çoklu korelasyon katsayısı R - bağımsız değişkenlerin (X) ve bağımlı değişkenin (Y) bağımlılık derecesini ifade eder.

Çoklu R, belirleme katsayısının kareköküne eşittir; bu miktar sıfırdan bire kadar değerler alır.

Basit doğrusal regresyon analizinde çoklu R, Pearson korelasyon katsayısına eşittir. Aslında bizim durumumuzda çoklu R, önceki örnekteki Pearson korelasyon katsayısına eşittir (0,998364).

Tablo 8.3b. Regresyon katsayıları
Oranlar Standart hata t-istatistiği
Y-kavşağı 2,694545455 0,33176878 8,121757129
Değişken X 1 2,305454545 0,04668634 49,38177965
* Hesaplamaların kısaltılmış bir versiyonu sağlanmıştır

Şimdi hesaplamaların tablo 8.3b'de sunulan orta kısmını düşünün. Burada regresyon katsayısı b (2,305454545) ve ordinat ekseni boyunca yer değiştirme verilmiştir; sabit a (2,694545455).

Hesaplamalara dayanarak regresyon denklemini aşağıdaki gibi yazabiliriz:

Y= x*2,305454545+2,694545455

Değişkenler arasındaki ilişkinin yönü işaretlere (negatif veya pozitif) göre belirlenir. regresyon katsayıları(katsayı b).

Eğer işaret regresyon katsayısı- pozitif ise bağımlı değişken ile bağımsız değişken arasındaki ilişki pozitif olacaktır. Bizim durumumuzda regresyon katsayısının işareti pozitif olduğundan ilişki de pozitiftir.

Eğer işaret regresyon katsayısı- Negatif, bağımlı değişken ile bağımsız değişken arasındaki ilişki negatiftir (ters).

Tablo 8.3c'de. Artıkların türetilmesinin sonuçları sunulmaktadır. Bu sonuçların raporda görünmesi için “Regresyon” aracını çalıştırırken “Artıklar” onay kutusunu etkinleştirmeniz gerekir.

GERİ KAZANIMIN ÇEKİLMESİ

Tablo 8.3c. Kalanlar
Gözlem Tahmin edilen Y Kalanlar Standart bakiyeler
1 9,610909091 -0,610909091 -1,528044662
2 7,305454545 -0,305454545 -0,764022331
3 11,91636364 0,083636364 0,209196591
4 14,22181818 0,778181818 1,946437843
5 16,52727273 0,472727273 1,182415512
6 18,83272727 0,167272727 0,418393181
7 21,13818182 -0,138181818 -0,34562915
8 23,44363636 -0,043636364 -0,109146047
9 25,74909091 -0,149090909 -0,372915662
10 28,05454545 -0,254545455 -0,636685276

Raporun bu bölümünü kullanarak her noktanın oluşturulan regresyon çizgisinden sapmalarını görebiliriz. En büyük mutlak değer

İstatistiksel modellemede regresyon analizi, değişkenler arasındaki ilişkiyi değerlendirmek için kullanılan bir çalışmadır. Bu matematiksel yöntem, bir bağımlı değişken ile bir veya daha fazla bağımsız değişken arasındaki ilişkiye odaklanılan birden fazla değişkenin modellenmesi ve analiz edilmesi için birçok başka yöntemi içerir. Daha spesifik olarak regresyon analizi, bağımsız değişkenlerden biri değişirken diğer bağımsız değişkenler sabit kalırsa bağımlı değişkenin tipik değerinin nasıl değiştiğini anlamamıza yardımcı olur.

Her durumda, hedef tahmini bağımsız değişkenlerin bir fonksiyonudur ve regresyon fonksiyonu olarak adlandırılır. Regresyon analizinde, bağımlı değişkendeki değişimin, bir olasılık dağılımı kullanılarak tanımlanabilen regresyonun bir fonksiyonu olarak karakterize edilmesi de ilgi çekicidir.

Regresyon Analizi Sorunları

Bu istatistiksel araştırma yöntemi, kullanımının önemli avantajlara sahip olduğu tahminlerde yaygın olarak kullanılmaktadır, ancak bazen yanılsamaya veya yanlış ilişkilere yol açabilmektedir, bu nedenle, örneğin korelasyon anlamına gelmediğinden, söz konusu konuda dikkatli kullanılması tavsiye edilir. nedensellik.

Regresyon analizi için parametrik olan doğrusal ve sıradan en küçük kareler regresyonu gibi çok sayıda yöntem geliştirilmiştir. Bunların özü, regresyon fonksiyonunun verilerden tahmin edilen sonlu sayıda bilinmeyen parametre açısından tanımlanmasıdır. Parametrik olmayan regresyon, fonksiyonunun sonsuz boyutlu olabilen belirli bir fonksiyon seti içerisinde yer almasına izin verir.

İstatistiksel bir araştırma yöntemi olarak pratikte regresyon analizi, veri oluşturma sürecinin biçimine ve regresyon yaklaşımıyla nasıl ilişkilendirildiğine bağlıdır. Veri süreci oluşturmanın gerçek biçimi genellikle bilinmeyen bir sayı olduğundan, verilerin regresyon analizi çoğunlukla bir dereceye kadar süreçle ilgili varsayımlara bağlıdır. Yeterli veri mevcutsa bu varsayımlar bazen test edilebilir. Regresyon modelleri, varsayımlar orta derecede ihlal edildiğinde bile genellikle faydalıdır, ancak en yüksek verimlilikte performans göstermeyebilirler.

Daha dar anlamda regresyon, sınıflandırmada kullanılan ayrık yanıt değişkenlerinin aksine, özellikle sürekli yanıt değişkenlerinin tahminine atıfta bulunabilir. Sürekli çıktı değişkeni durumu, onu ilgili sorunlardan ayırmak için metrik regresyon olarak da adlandırılır.

Hikaye

Regresyonun en eski biçimi, iyi bilinen en küçük kareler yöntemidir. 1805'te Legendre ve 1809'da Gauss tarafından yayımlandı. Legendre ve Gauss, bu yöntemi astronomik gözlemlerden Güneş çevresindeki cisimlerin (çoğunlukla kuyruklu yıldızlar, ancak daha sonra yeni keşfedilen küçük gezegenler) yörüngelerini belirleme problemine uyguladılar. Gauss, 1821'de Gauss-Markov teoreminin bir versiyonunu da içeren en küçük kareler teorisinin daha da geliştirilmesini yayınladı.

"Regresyon" terimi, 19. yüzyılda Francis Galton tarafından biyolojik bir olguyu tanımlamak için icat edildi. Buradaki fikir, torunların atalarının boyundan itibaren normal ortalamaya doğru gerileme eğiliminde olmasıydı. Galton'a göre regresyon yalnızca bu biyolojik anlama sahipti, ancak daha sonra çalışmaları Udney Yoley ve Karl Pearson tarafından sürdürüldü ve daha genel bir istatistiksel bağlama getirildi. Yule ve Pearson'un çalışmasında yanıt ve açıklayıcı değişkenlerin ortak dağılımının Gauss olduğu varsayılmaktadır. Bu varsayım Fischer tarafından 1922 ve 1925 tarihli makalelerde reddedildi. Fisher, yanıt değişkeninin koşullu dağılımının Gaussian olduğunu, ancak ortak dağılımın böyle olması gerekmediğini öne sürdü. Bu bakımdan Fischer'in önerisi Gauss'un 1821 formülasyonuna daha yakındır. 1970'den önce regresyon analizi sonucunun alınması bazen 24 saat kadar sürüyordu.

Regresyon analizi yöntemleri aktif araştırma alanı olmaya devam ediyor. Son yıllarda sağlam regresyon için yeni yöntemler geliştirildi; ilişkili yanıtları içeren regresyonlar; farklı türdeki eksik verileri barındıran regresyon yöntemleri; parametrik olmayan regresyon; Bayes regresyon yöntemleri; yordayıcı değişkenlerin hatayla ölçüldüğü regresyonlar; gözlemlerden daha fazla öngörücü içeren regresyon ve regresyonla neden-sonuç çıkarımı.

Regresyon modelleri

Regresyon analizi modelleri aşağıdaki değişkenleri içerir:

  • Skaler veya vektör olabilen, beta olarak belirlenmiş bilinmeyen parametreler.
  • Bağımsız Değişkenler, X.
  • Bağımlı Değişkenler, Y.

Regresyon analizinin kullanıldığı farklı bilim alanları, bağımlı ve bağımsız değişkenler yerine farklı terimler kullanır, ancak her durumda regresyon modeli Y'yi X ve β'nın bir fonksiyonuyla ilişkilendirir.

Yaklaşım genellikle E(Y | X) = F(X, β) şeklinde yazılır. Regresyon analizinin yapılabilmesi için f fonksiyonunun tipinin belirlenmesi gerekmektedir. Daha az sıklıkla, verilere dayanmayan Y ve X arasındaki ilişkiye ilişkin bilgiye dayanır. Eğer böyle bir bilgi mevcut değilse esnek veya kullanışlı F formu seçilir.

Bağımlı değişken Y

Şimdi bilinmeyen parametreler β'nın vektörünün k uzunluğuna sahip olduğunu varsayalım. Regresyon analizini gerçekleştirmek için kullanıcının bağımlı değişken Y hakkında bilgi sağlaması gerekir:

  • (Y, X) formundaki N veri noktası gözlemlenirse, burada N< k, большинство классических подходов к регрессионному анализу не могут быть выполнены, так как система уравнений, определяющих модель регрессии в качестве недоопределенной, не имеет достаточного количества данных, чтобы восстановить β.
  • Tam olarak N = K gözlemleniyorsa ve F fonksiyonu doğrusal ise, o zaman Y = F(X, β) denklemi yaklaşık olarak çözülmek yerine tam olarak çözülebilir. Bu, X doğrusal olarak bağımsız olduğu sürece benzersiz bir çözüme sahip olan N-bilinmeyenlerle (β elemanları) bir dizi N-denkleminin çözülmesi anlamına gelir. Eğer F doğrusal değilse çözüm olmayabilir veya birçok çözüm mevcut olabilir.
  • En yaygın durum N > veri noktalarının gözlemlendiği durumdur. Bu durumda, veriye en iyi uyan β için benzersiz bir değer tahmin etmek için verilerde yeterli bilgi vardır ve verilere uygulamanın β'da aşırı belirlenmiş bir sistem olarak görülebileceği bir regresyon modeli vardır.

İkinci durumda, regresyon analizi aşağıdakiler için araçlar sağlar:

  • Bilinmeyen β parametreleri için, örneğin Y'nin ölçülen ve tahmin edilen değeri arasındaki mesafeyi en aza indirecek bir çözüm bulmak.
  • Belirli istatistiksel varsayımlar altında regresyon analizi, bilinmeyen parametreler β ve bağımlı değişken Y'nin tahmin edilen değerleri hakkında istatistiksel bilgi sağlamak için fazla bilgi kullanır.

Gerekli sayıda bağımsız ölçüm

Üç bilinmeyen parametreye sahip bir regresyon modelini düşünün: β 0, β 1 ve β 2. Deneycinin bağımsız değişken X vektörünün aynı değeri üzerinde 10 ölçüm yaptığını varsayalım. Bu durumda regresyon analizi benzersiz bir değer kümesi üretmez. Yapabileceğiniz en iyi şey, bağımlı değişken Y'nin ortalamasını ve standart sapmasını tahmin etmektir. Benzer şekilde, X'in iki farklı değerini ölçerek, iki bilinmeyenle regresyon için yeterli veri elde edebilirsiniz, ancak üç veya daha fazla bilinmeyenle elde edemezsiniz.

Deneycinin ölçümleri bağımsız değişken vektör X'in üç farklı değerinde yapılmışsa, regresyon analizi β'daki üç bilinmeyen parametre için benzersiz bir tahmin seti sağlayacaktır.

Genel doğrusal regresyon durumunda yukarıdaki ifade, X T X matrisinin tersinir olması şartına eşdeğerdir.

İstatistiksel Varsayımlar

Ölçümlerin sayısı (N), bilinmeyen parametrelerin sayısından (k) ve ölçüm hatalarından (εi) büyük olduğunda, kural olarak, ölçümlerde yer alan fazla bilgi daha sonra dağıtılır ve bilinmeyen parametrelere ilişkin istatistiksel tahminler için kullanılır. Bu fazla bilgiye serbestliğin regresyon derecesi denir.

Temel Varsayımlar

Regresyon analizine yönelik klasik varsayımlar şunları içerir:

  • Örnekleme, çıkarım tahminini temsil eder.
  • Hata terimi, açıklayıcı değişkenlere bağlı olan, ortalaması sıfır olan rastgele bir değişkendir.
  • Bağımsız değişkenler hatasız ölçülür.
  • Bağımsız değişkenler (yordayıcılar) olarak doğrusal olarak bağımsızdırlar, yani herhangi bir yordayıcıyı diğerlerinin doğrusal birleşimi olarak ifade etmek mümkün değildir.
  • Hatalar korelasyonsuzdur, yani köşegenlerin hata kovaryans matrisi ve sıfır olmayan her öğe hata varyansıdır.
  • Hata varyansı gözlemler arasında sabittir (homoskedastisite). Değilse, ağırlıklı en küçük kareler veya diğer yöntemler kullanılabilir.

En küçük kareler tahmini için bu yeterli koşullar gerekli özelliklere sahiptir; özellikle bu varsayımlar, özellikle doğrusal tahminciler sınıfında dikkate alındığında parametre tahminlerinin objektif, tutarlı ve etkili olacağı anlamına gelir. Kanıtların koşulları nadiren karşıladığını belirtmek önemlidir. Yani varsayımlar doğru olmasa bile yöntem kullanılır. Varsayımlardaki farklılıklar bazen modelin ne kadar yararlı olduğunun bir ölçüsü olarak kullanılabilir. Bu varsayımların çoğu daha gelişmiş yöntemlerle gevşetilebilir. İstatistiksel analiz raporları tipik olarak örnek veriler üzerindeki testlerin analizini ve modelin kullanışlılığına yönelik metodolojiyi içerir.

Ek olarak bazı durumlarda değişkenler nokta konumlarında ölçülen değerlere atıfta bulunur. Değişkenlerde istatistiksel varsayımları ihlal eden mekansal eğilimler ve mekansal otokorelasyonlar olabilir. Coğrafi ağırlıklı regresyon bu tür verilerle ilgilenen tek yöntemdir.

Doğrusal regresyonun bir özelliği, Yi olan bağımlı değişkenin, parametrelerin doğrusal bir birleşimi olmasıdır. Örneğin, basit doğrusal regresyon, n-noktalarını modellemek için bir bağımsız değişkeni (xi) ve iki parametreyi (β0 ve β1) kullanır.

Çoklu doğrusal regresyonda birden fazla bağımsız değişken veya bunların işlevleri vardır.

Bir popülasyondan rastgele bir örnek alındığında, parametreleri bir örnek doğrusal regresyon modeli elde edilmesini sağlar.

Bu açıdan en popüler olanı en küçük kareler yöntemidir. Artıkların karelerinin toplamını en aza indiren parametre tahminleri elde etmek için kullanılır. Bu fonksiyonun bu tür minimizasyonu (doğrusal regresyonun tipik bir örneğidir), parametre tahminleri elde etmek için çözülen bir dizi normal denkleme ve parametreli bir dizi doğrusal denkleme yol açar.

Popülasyon hatasının genel olarak yayıldığı varsayımı altında, bir araştırmacı bu standart hata tahminlerini güven aralıkları oluşturmak ve parametreleri hakkında hipotez testleri yürütmek için kullanabilir.

Doğrusal olmayan regresyon analizi

Fonksiyonun parametrelere göre doğrusal olmadığı bir örnek, kareler toplamının yinelemeli bir prosedür kullanılarak en aza indirilmesi gerektiğini gösterir. Bu, doğrusal ve doğrusal olmayan en küçük kareler yöntemleri arasındaki farkları tanımlayan birçok komplikasyonu beraberinde getirir. Sonuç olarak, doğrusal olmayan bir yöntem kullanıldığında regresyon analizinin sonuçları bazen tahmin edilemez.

Güç ve örneklem büyüklüğünün hesaplanması

Modeldeki bağımsız değişkenlerin sayısı ile gözlem sayısı arasında genellikle tutarlı bir yöntem yoktur. İlk kural Dobra ve Hardin tarafından önerildi ve N = t^n'ye benziyor; burada N örneklem büyüklüğü, n bağımsız değişkenlerin sayısı ve t, eğer modelde istenen doğruluğu elde etmek için gereken gözlem sayısıdır. yalnızca bir bağımsız değişken. Örneğin, bir araştırmacı 1000 hastayı (N) içeren bir veri setini kullanarak doğrusal bir regresyon modeli oluşturur. Araştırmacı, (m) doğrusunu doğru bir şekilde tanımlamak için beş gözlemin gerekli olduğuna karar verirse, modelin destekleyebileceği maksimum bağımsız değişken sayısı 4'tür.

Diğer yöntemler

Regresyon modeli parametreleri genellikle en küçük kareler yöntemi kullanılarak tahmin edilse de, çok daha az kullanılan başka yöntemler de vardır. Örneğin, bunlar aşağıdaki yöntemlerdir:

  • Bayes yöntemleri (örneğin, Bayes doğrusal regresyonu).
  • Yüzde hatalarını azaltmanın daha uygun olduğu durumlarda kullanılan yüzde regresyonu.
  • Kantil regresyona yol açan aykırı değerlerin varlığında daha sağlam olan en küçük mutlak sapmalar.
  • Çok sayıda gözlem ve hesaplama gerektiren parametrik olmayan regresyon.
  • Belirli bir giriş alanında anlamlı bir mesafe ölçüsü bulmak için öğrenilen bir uzaktan eğitim metriği.

Yazılım

Tüm önemli istatistiksel yazılım paketleri en küçük kareler regresyon analizini gerçekleştirir. Basit doğrusal regresyon ve çoklu regresyon analizi, bazı hesap makinelerinin yanı sıra bazı elektronik tablo uygulamalarında da kullanılabilir. Birçok istatistiksel yazılım paketi çeşitli parametrik olmayan ve sağlam regresyon türlerini gerçekleştirebilse de, bu yöntemler daha az standartlaştırılmıştır; farklı yazılım paketleri farklı yöntemler uygular. Muayene analizi ve nörogörüntüleme gibi alanlarda kullanılmak üzere özel regresyon yazılımı geliştirilmiştir.

Korelasyon ve regresyon kavramları doğrudan ilişkilidir. Korelasyon ve regresyon analizinde birçok yaygın hesaplama tekniği vardır. Olaylar ve süreçler arasındaki neden-sonuç ilişkilerini tanımlamak için kullanılırlar. Ancak eğer korelasyon analizi stokastik bağlantının gücünü ve yönünü tahmin etmemizi sağlar, ardından regresyon analizi- aynı zamanda bir tür bağımlılık.

Regresyon şöyle olabilir:

a) olayların (değişkenlerin) sayısına bağlı olarak:

Basit (iki değişken arasındaki regresyon);

Çoklu (bağımlı değişken (y) ile birkaç açıklayıcı değişken (x1, x2...xn) arasındaki regresyon;

b) forma bağlı olarak:

Doğrusal (doğrusal bir fonksiyonla görüntülenir ve incelenen değişkenler arasında doğrusal ilişkiler vardır);

Doğrusal olmayan (doğrusal olmayan bir fonksiyonla görüntülenir; incelenen değişkenler arasındaki ilişki doğrusal değildir);

c) değerlendirmeye dahil edilen değişkenler arasındaki ilişkinin niteliği gereği:

Pozitif (açıklayıcı değişkenin değerindeki bir artış, bağımlı değişkenin değerinde bir artışa yol açar ve bunun tersi de geçerlidir);

Negatif (açıklayıcı değişkenin değeri arttıkça açıklanan değişkenin değeri azalır);

d) türe göre:

Doğrudan (bu durumda nedenin etki üzerinde doğrudan etkisi vardır, yani bağımlı ve açıklayıcı değişkenler birbirleriyle doğrudan ilişkilidir);

Dolaylı (açıklayıcı değişkenin, bağımlı değişken üzerinde üçüncü veya bir dizi başka değişken aracılığıyla dolaylı bir etkisi vardır);

Yanlış (saçma gerileme) - incelenen süreçlere ve olaylara yüzeysel ve resmi bir yaklaşımla ortaya çıkabilir. Bunun saçma bir örneği, ülkemizde tüketilen alkol miktarındaki azalma ile çamaşır tozu satışındaki azalma arasında bağlantı kuran regresyondur.

Regresyon analizi yapılırken aşağıdaki ana görevler çözülür:

1. Bağımlılık şeklinin belirlenmesi.

2. Regresyon fonksiyonunun tanımı. Bunu yapmak için, ilk olarak bağımlı değişkendeki genel değişim eğilimini belirlemeye ve ikinci olarak açıklayıcı değişkenin (veya birkaç değişkenin) bağımlı değişken.

3. Bağımlı değişkenin bilinmeyen değerlerinin tahmini. Ortaya çıkan matematiksel ilişki (regresyon denklemi), bağımlı değişkenin değerini hem açıklayıcı değişkenlerin belirtilen değerleri aralığında hem de ötesinde belirlemenizi sağlar. İkinci durumda, regresyon analizi, sosyo-ekonomik süreçler ve olaylardaki değişiklikleri tahmin etmede yararlı bir araç görevi görür (mevcut eğilimler ve ilişkilerin korunması koşuluyla). Tipik olarak, tahminin gerçekleştirildiği zaman periyodunun uzunluğu, ilk göstergelerin gözlemlerinin gerçekleştirildiği zaman aralığının yarısından fazla olmayacak şekilde seçilir. Hem pasif bir tahmin yürütmek, ekstrapolasyon problemini çözmek hem de aktif olanı, iyi bilinen "eğer ..., o zaman" şemasına göre akıl yürütmek ve çeşitli değerleri bir veya daha fazla açıklayıcı regresyon değişkenine koymak mümkündür. .



İçin regresyon yapısı adı verilen özel bir yöntem en küçük kareler yöntemi. Bu yöntemin diğer yumuşatma yöntemlerine göre avantajları vardır: gerekli parametrelerin nispeten basit bir matematiksel tespiti ve olasılıksal açıdan iyi bir teorik gerekçelendirme.

Bir regresyon modeli seçerken temel gereksinimlerden biri, mümkün olan en büyük basitliği sağlamak ve yeterli doğrulukta bir çözüm elde etmenize olanak sağlamaktır. Bu nedenle, istatistiksel ilişkiler kurmak için, öncelikle kural olarak doğrusal fonksiyonlar sınıfından bir model düşünürüz (mümkün olan tüm fonksiyon sınıflarının en basiti olarak):

burada bi, b2...bj bağımsız değişkenler xij'nin yi değeri üzerindeki etkisini belirleyen katsayılardır; ai - ücretsiz üye; ei - hesaba katılmayan faktörlerin bağımlı değişken üzerindeki etkisini yansıtan rastgele sapma; n - bağımsız değişkenlerin sayısı; N, gözlemlerin sayısıdır ve (N . n+1) koşulunun karşılanması gerekir.

Doğrusal modelçok geniş bir sınıftaki farklı sorunları tanımlayabilir. Ancak uygulamada, özellikle sosyo-ekonomik sistemlerde, büyük yaklaşım hatalarından dolayı doğrusal modellerin kullanılması bazen zorlaşabilmektedir. Bu nedenle doğrusallaştırılabilen doğrusal olmayan çoklu regresyon fonksiyonları sıklıkla kullanılır. Bunlar arasında örneğin çeşitli sosyo-ekonomik çalışmalarda uygulama alanı bulan üretim fonksiyonu (Cobb-Douglas güç fonksiyonu) yer alır. Şuna benziyor:

burada b 0 normalleştirme faktörüdür, b 1 ...b j bilinmeyen katsayılardır, e i rastgele bir sapmadır.

Doğal logaritma kullanarak bu denklemi doğrusal forma dönüştürebilirsiniz:

Ortaya çıkan model yukarıda açıklanan standart doğrusal regresyon prosedürlerinin kullanılmasına izin verir. İki tip (toplamlı ve çarpımlı) modeller oluşturarak en iyisini seçebilir ve daha küçük yaklaşık hatalarla daha fazla araştırma yapabilirsiniz.

Yaklaşık fonksiyonları seçmek için iyi geliştirilmiş bir sistem vardır - argümanların grup muhasebesi yöntemi(MGUA).

Seçilen modelin doğruluğu, gözlemlenen değerler y i ile regresyon denklemi kullanılarak tahmin edilen karşılık gelen değerler y arasındaki farklar olan artıkların incelenmesinin sonuçlarına göre değerlendirilebilir. Bu durumda Modelin yeterliliğini kontrol etmek için hesaplanmış ortalama yaklaşım hatası:

E'nin %15'ten fazla olmaması durumunda modelin yeterli olduğu kabul edilir.

Sosyo-ekonomik sistemlerle ilgili olarak klasik regresyon modelinin yeterliliği için temel koşulların her zaman karşılanmadığını özellikle vurguluyoruz.

Ortaya çıkan yetersizliğin tüm nedenleri üzerinde durmadan sadece isimlerini vereceğiz. çoklu bağlantı- istatistiksel bağımlılıkların incelenmesinde regresyon analizi prosedürlerini etkili bir şekilde uygulamanın en zor sorunu. Altında çoklu bağlantı açıklayıcı değişkenler arasında doğrusal bir ilişkinin olduğu anlaşılmaktadır.

Bu olgu:

a) regresyon katsayılarını anlamlı bir şekilde yorumlarken anlamını bozar;

b) değerlendirmenin doğruluğunu azaltır (değerlendirmelerin dağılımı artar);

c) katsayı tahminlerinin örnek verilere duyarlılığını arttırır (örneklem boyutunun arttırılması tahminleri büyük ölçüde etkileyebilir).

Çoklu doğrusallığı azaltmak için çeşitli teknikler vardır. En erişilebilir yol, eğer aralarındaki korelasyon katsayısı mutlak değer olarak 0,8'e eşit bir değeri aşarsa, iki değişkenden birini ortadan kaldırmaktır. Değişkenlerden hangisinin tutulacağına, temel hususlara dayanarak karar verilir. Daha sonra regresyon katsayıları tekrar hesaplanır.

Adım adım regresyon algoritması kullanmak, modele bir bağımsız değişkeni sırayla dahil etmenize ve regresyon katsayılarının önemini ve değişkenlerin çoklu doğrusallığını analiz etmenize olanak tanır. Son olarak, incelenen ilişkide yalnızca regresyon katsayılarının gerekli önemini ve çoklu bağlantının minimum etkisini sağlayan değişkenler kalır.

Regresyon analizi, ölçülen verileri modelleme ve özelliklerini inceleme yöntemidir. Veriler, bağımlı değişkenin (yanıt değişkeni) ve bağımsız değişkenin (açıklayıcı değişken) değer çiftlerinden oluşur. Bir regresyon modeli, bağımsız değişkenin ve eklenen rastgele değişkenli parametrelerin bir fonksiyonudur.

Korelasyon analizi ve regresyon analizi, matematiksel istatistiğin ilgili bölümleridir ve örnek verileri kullanarak bir dizi büyüklüğün istatistiksel bağımlılığını incelemeyi amaçlamaktadır; bazıları rastgeledir. İstatistiksel bağımlılıkta, nicelikler işlevsel olarak ilişkili değildir ancak ortak olasılık dağılımıyla rastgele değişkenler olarak tanımlanır.

Rastgele değişkenlerin bağımlılığının incelenmesi, regresyon modellerine ve örnek verilere dayalı regresyon analizine yol açar. Olasılık teorisi ve matematiksel istatistikler yalnızca istatistiksel bağımlılığı incelemek için bir aracı temsil eder, ancak nedensel bir ilişki kurmayı amaçlamaz. Nedensel bir ilişki hakkındaki fikir ve hipotezler, incelenen olgunun anlamlı bir açıklamasına izin veren başka bir teoriden getirilmelidir.

Sayısal veriler genellikle birbirleriyle açık (bilinen) veya örtülü (gizli) ilişkilere sahiptir.

Doğrudan hesaplama yöntemleriyle elde edilen, yani önceden bilinen formüller kullanılarak hesaplanan göstergeler açıkça ilişkilidir. Örneğin, planın tamamlanma yüzdeleri, seviyeler, spesifik ağırlıklar, miktardaki sapmalar, yüzdelerdeki sapmalar, büyüme oranları, büyüme oranları, endeksler vb.

İkinci tip (örtük) bağlantılar önceden bilinmemektedir. Ancak karmaşık olayları yönetebilmek için açıklayabilmek ve tahmin edebilmek (tahmin edebilmek) gerekir. Bu nedenle uzmanlar, gözlemlerin yardımıyla gizli bağımlılıkları belirlemeye ve bunları formüller biçiminde ifade etmeye, yani olayları veya süreçleri matematiksel olarak modellemeye çalışırlar. Böyle bir fırsat korelasyon-regresyon analiziyle sağlanır.

Matematiksel modeller üç genel amaç için oluşturulur ve kullanılır:

  • *açıklama için;
  • * tahmin için;
  • * Sürüş için.

Korelasyon ve regresyon analizi yöntemlerini kullanan analistler, korelasyon katsayısını kullanarak göstergeler arasındaki bağlantıların yakınlığını ölçer. Bu durumda, gücü farklı (güçlü, zayıf, orta vb.) ve yönü farklı (doğrudan, ters) bağlantılar keşfedilir. Bağlantıların anlamlı olduğu ortaya çıkarsa, matematiksel ifadelerinin bir regresyon modeli şeklinde bulunması ve modelin istatistiksel anlamlılığının değerlendirilmesi tavsiye edilebilir.

Regresyon analizi, gözlemsel veriler arasındaki örtülü ve örtülü bağlantıları tanımlamak için modern matematiksel istatistiğin ana yöntemi olarak adlandırılır.

Regresyon analizinin problem cümlesi aşağıdaki şekilde formüle edilmiştir.

Bir dizi gözlemsel sonuç var. Bu sette bir sütun, geri kalan sütunların temsil ettiği nesnenin ve ortamın parametreleriyle işlevsel bir ilişki kurmanın gerekli olduğu bir göstergeye karşılık gelir. Gerekli: gösterge ve faktörler arasında niceliksel bir ilişki kurun. Bu durumda, regresyon analizi problemi, mevcut deneysel verileri en iyi şekilde tanımlayan böyle bir fonksiyonel bağımlılığın y = f (x2, x3, ..., xт) tanımlanması görevi olarak anlaşılmaktadır.

Varsayımlar:

gözlemlerin sayısı, faktörlere ve bunların ilişkilerine ilişkin istatistiksel kalıpları göstermek için yeterlidir;

işlenen verilerin ölçüm hatalarından ve hesaba katılmayan rastgele faktörlerin etkisinden kaynaklanan bazı hatalar (gürültü) içermesi;

Gözlem sonuçları matrisi, incelenen nesne hakkında çalışmanın başlamasından önce mevcut olan tek bilgidir.

Göstergenin parametrelere bağımlılığını açıklayan f (x2, x3, ..., xт) fonksiyonuna regresyon denklemi (fonksiyon) denir. "Regresyon" terimi (regresyon (Latince) - geri çekilme, bir şeye dönüş), yöntemin oluşturulması aşamasında çözülen belirli sorunlardan birinin özellikleriyle ilişkilidir.

Regresyon analizi sorununun çözümünün birkaç aşamaya bölünmesi tavsiye edilir:

veri ön işleme;

regresyon denklemlerinin türünün seçilmesi;

regresyon denklemi katsayılarının hesaplanması;

Oluşturulan fonksiyonun gözlem sonuçlarına uygunluğunun kontrol edilmesi.

Ön işleme, veri matrisinin standartlaştırılmasını, korelasyon katsayılarının hesaplanmasını, bunların anlamlılığının kontrol edilmesini ve önemsiz parametrelerin değerlendirme dışı bırakılmasını içerir.

Regresyon denklemi türünün seçilmesi Veriyi en iyi tanımlayan fonksiyonel ilişkiyi belirleme görevi, bir dizi temel zorluğun üstesinden gelmeyi içerir. Genel durumda, standartlaştırılmış veriler için göstergenin parametrelere olan işlevsel bağımlılığı şu şekilde temsil edilebilir:

y = f (x1, x2, …, xm) + e

burada f, önceden bilinmeyen, belirlenecek bir fonksiyondur;

e - veri yaklaşım hatası.

Bu denklem genellikle örnek regresyon denklemi olarak adlandırılır. Bu denklem, göstergenin değişimi ile faktörlerin değişimi arasındaki ilişkiyi karakterize eder. Korelasyon ölçüsü ise faktörlerdeki değişimle ilişkili bir göstergedeki değişimin oranını ölçer. Başka bir deyişle, bir gösterge ile faktörler arasındaki korelasyon, düzeyleri arasında bir bağlantı olarak yorumlanamaz ve regresyon analizi, faktörlerin göstergeyi oluşturmadaki rolünü açıklamaz.

Diğer bir özellik, her faktörün gösterge üzerindeki etki derecesinin değerlendirilmesi ile ilgilidir. Regresyon denklemi, her faktörün gösterge üzerindeki ayrı etkisinin bir değerlendirmesini sağlamaz; böyle bir değerlendirme, yalnızca diğer tüm faktörlerin incelenen faktörle ilgili olmadığı durumlarda mümkündür. İncelenen faktör, göstergeyi etkileyen diğer faktörlerle ilişkiliyse, faktörün etkisinin karma bir özelliği elde edilecektir. Bu özellik, hem faktörün doğrudan etkisini hem de diğer faktörlerle bağlantı yoluyla ortaya çıkan dolaylı etkiyi ve bunların gösterge üzerindeki etkisini içerir.

Göstergeyle zayıf ilişkili ancak diğer faktörlerle yakından ilişkili faktörlerin regresyon denklemine dahil edilmesi önerilmez. İşlevsel olarak birbiriyle ilişkili faktörler de denklemde yer almaz (bunlar için korelasyon katsayısı 1'dir). Bu tür faktörlerin dahil edilmesi, regresyon katsayılarının tahmin edilmesine yönelik denklem sisteminin bozulmasına ve çözümün belirsizliğine yol açar.

f fonksiyonu, e hatasının bir anlamda minimum olmasını sağlayacak şekilde seçilmelidir. Fonksiyonel bir bağlantının seçilebilmesi için öncelikle f fonksiyonunun hangi sınıfa ait olabileceğine dair bir hipotez ileri sürülür ve ardından bu sınıftaki “en iyi” fonksiyon seçilir. Seçilen fonksiyon sınıfının bir miktar “pürüzsüzlüğe” sahip olması gerekir; Argüman değerlerindeki "küçük" değişiklikler, fonksiyon değerlerinde "küçük" değişikliklere neden olmalıdır.

Uygulamada yaygın olarak kullanılan özel bir durum, birinci dereceden polinom veya doğrusal regresyon denklemidir.

Fonksiyonel bağımlılığın tipini seçmek için aşağıdaki yaklaşım önerilebilir:

gösterge değerlerine sahip noktalar parametre alanında grafiksel olarak görüntülenir. Çok sayıda parametreyle, her biri için noktalar oluşturmak ve değerlerin iki boyutlu dağılımlarını elde etmek mümkündür;

noktaların konumuna bağlı olarak ve gösterge ile nesnenin parametreleri arasındaki ilişkinin özünün analizine dayanarak, yaklaşık regresyon türü veya olası seçenekleri hakkında bir sonuca varılır;

Parametreler hesaplandıktan sonra yaklaşımın kalitesi değerlendirilir; hesaplanan ve gerçek değerler arasındaki benzerlik derecesini değerlendirmek;

hesaplanan ve gerçek değerlerin tüm görev alanı boyunca yakın olması durumunda, regresyon analizi probleminin çözülmüş olduğu düşünülebilir. Aksi takdirde, farklı türde bir polinom veya periyodik gibi başka bir analitik fonksiyon seçmeyi deneyebilirsiniz.

Regresyon Denklem Katsayılarının Hesaplanması

Bilinmeyenlerin sayısı her zaman denklem sayısından daha fazla olduğundan, bir denklem sistemini mevcut verilere dayanarak açık bir şekilde çözmek imkansızdır. Bu sorunun üstesinden gelmek için ek varsayımlara ihtiyaç vardır. Sağduyu şunu belirtir: Polinomun katsayılarının, veri yaklaşımında minimum hatayı sağlayacak şekilde seçilmesi tavsiye edilir. Yaklaşım hatalarını değerlendirmek için çeşitli önlemler kullanılabilir. Kök ortalama kare hatası böyle bir ölçü olarak yaygın olarak kullanılır. Buna dayanarak, regresyon denklemlerinin katsayılarını tahmin etmek için özel bir yöntem geliştirilmiştir - en küçük kareler yöntemi (LSM). Bu yöntem, normal dağılım seçeneği altında regresyon denkleminin bilinmeyen katsayılarının maksimum olasılık tahminlerini elde etmenize olanak tanır, ancak faktörlerin diğer herhangi bir dağılımı için de kullanılabilir.

MNC aşağıdaki hükümlere dayanmaktadır:

hataların ve faktörlerin değerleri bağımsızdır ve dolayısıyla ilişkisizdir, yani. girişim oluşturmaya yönelik mekanizmaların, faktör değerleri oluşturmaya yönelik mekanizmayla ilişkili olmadığı varsayılmaktadır;

e hatasının matematiksel beklentisi sıfıra eşit olmalıdır (sabit bileşen a0 katsayısına dahildir), diğer bir deyişle hata merkezi bir büyüklüktür;

hata varyansının örnek tahmini minimum düzeyde olmalıdır.

Doğrusal model hatalıysa veya parametreler yanlış ölçülüyorsa, bu durumda en küçük kareler yöntemi, doğrusal modelin gerçek nesneyi seçilen standart sapma anlamında en iyi tanımladığı katsayıların bu tür değerlerini bulmamızı sağlar. kriter.

Ortaya çıkan regresyon denkleminin kalitesi, göstergenin gözlem sonuçları ile parametre uzayındaki belirli noktalarda regresyon denkleminin öngördüğü değerler arasındaki yakınlık derecesine göre değerlendirilir. Sonuçlar birbirine yakınsa regresyon analizi sorunu çözülmüş sayılabilir. Aksi takdirde regresyon denklemini değiştirmeli ve parametreleri tahmin etmek için hesaplamaları tekrarlamalısınız.

Birkaç gösterge varsa, regresyon analizi sorunu her biri için bağımsız olarak çözülür.

Regresyon denkleminin özünü analiz ederken aşağıdaki noktalara dikkat edilmelidir. Dikkate alınan yaklaşım, katsayıların ayrı (bağımsız) değerlendirilmesini sağlamaz - bir katsayı değerindeki değişiklik, diğerlerinin değerlerinde de değişiklik gerektirir. Elde edilen katsayılar, ilgili parametrenin gösterge değerine katkısı olarak değerlendirilmemelidir. Bir regresyon denklemi, parametreler ile bir gösterge arasındaki ilişkiyi açıklayan bir yasa değil, yalnızca mevcut verilerin iyi bir analitik açıklamasıdır. Bu denklem, belirli bir parametre değişikliği aralığında göstergenin değerlerini hesaplamak için kullanılır. Bu aralığın dışındaki hesaplamalar için sınırlı uygunluktadır; enterpolasyon problemlerini çözmek için ve sınırlı bir ölçüde ekstrapolasyon için kullanılabilir.

Tahminin yanlış olmasının ana nedeni, regresyon çizgisinin ekstrapolasyonunun belirsizliği değil, modelde dikkate alınmayan faktörlerden dolayı göstergenin önemli ölçüde değişmesidir. Tahmin yeteneğinin sınırlılığı, modelde dikkate alınmayan parametrelerin kararlılık durumu ve dikkate alınan model faktörlerinin etkisinin niteliğidir. Dış ortam keskin bir şekilde değişirse derlenen regresyon denklemi anlamını kaybedecektir.

Parametrenin beklenen değerinin regresyon denkleminde yerine konulmasıyla elde edilen tahmin bir noktadır. Böyle bir tahminin gerçekleşme ihtimali yok denecek kadar azdır. Tahminin güven aralığının belirlenmesi tavsiye edilir. Göstergenin bireysel değerleri için aralık, regresyon çizgisinin konumundaki hataları ve bireysel değerlerin bu çizgiden sapmalarını dikkate almalıdır.



Makaleyi beğendin mi? Arkadaşlarınla ​​paylaş!