Çoğul r. Ekonometrik analiz için etkili bir araç olarak Microsoft yazılım paketi


  1. Oluşturulan modelin kalitesini değerlendirin. Tek faktörlü modele kıyasla modelin kalitesi arttı mı? Esneklik katsayılarını, - ve -katsayılarını kullanarak önemli faktörlerin sonuç üzerindeki etkisini değerlendirin.
Seçilen çoklu modelin (6) kalitesini değerlendirmek için, bu problemin 1.4 paragrafına benzer şekilde, belirleme katsayısını kullanırız. R- kare, ortalama bağıl yaklaşım hatası ve F-Fisher kriteri.

Belirleme katsayısı R-kare, “Regresyon” sonuçlarından alınacaktır (model (6) için “Regresyon istatistikleri” tablosu).

Sonuç olarak, bir dairenin fiyatındaki değişiklik (değişim) e Bu denkleme göre %76,77'si bölgenin şehir değişimi ile açıklanmaktadır. X 1 , apartmandaki oda sayısı X 2 ve yaşam alanı X 4 .

Orijinal verileri kullanıyoruz e Ben ve Regresyon aracı tarafından bulunan kalıntılar (model (6) için “Kalan çıktısı” tablosu). Göreceli hataları hesaplayalım ve ortalama değeri bulalım
.

GERİ KAZANIMIN ÇEKİLMESİ


Gözlem

Tahmin edilen Y

Kalanlar

Rel. hata

1

45,95089273

-7,95089273

20,92340192

2

86,10296493

-23,90296493

38,42920407

3

94,84442678

30,15557322

24,12445858

4

84,17648426

-23,07648426

37,76838667

5

40,2537216

26,7462784

39,91981851

6

68,70572376

24,29427624

26,12287768

7

143,7464899

-25,7464899

21,81905923

8

106,0907598

25,90924022

19,62821228

9

135,357993

-42,85799303

46,33296544

10

114,4792566

-9,47925665

9,027863476

11

41,48765602

0,512343975

1,219866607

12

103,2329236

21,76707636

17,41366109

13

130,3567798

39,64322022

23,3195413

14

35,41901876

2,580981242

6,7920559

15

155,4129693

-24,91296925

19,0903979

16

84,32108188

0,678918123

0,798727204

17

98,0552279

-0,055227902

0,056355002

18

144,2104618

-16,21046182

12,66442329

19

122,8677535

-37,86775351

44,55029825

20

100,0221225

59,97787748

37,48617343

21

53,27196558

6,728034423

11,21339071

22

35,06605378

5,933946225

14,47303957

23

114,4792566

-24,47925665

27,19917406

24

113,1343153

-30,13431529

36,30640396

25

40,43190991

4,568090093

10,15131132

26

39,34427892

-0,344278918

0,882766457

27

144,4794501

-57,57945009

66,25943623

28

56,4827667

-16,4827667

41,20691675

29

95,38240332

-15,38240332

19,22800415

30

228,6988826

-1,698882564

0,748406416

31

222,8067278

12,19327221

5,188626473

32

38,81483144

1,185168555

2,962921389

33

48,36325811

18,63674189

27,81603267

34

126,6080021

-3,608002113

2,933335051

35

84,85052935

15,14947065

15,14947065

36

116,7991162

-11,79911625

11,23725357

37

84,17648426

-13,87648426

19,73895342

38

113,9412801

-31,94128011

38,95278062

39

215,494184

64,50581599

23,03779142

40

141,7795953

58,22040472

29,11020236

Ortalama

101,2375

22,51770962

Göreceli hatalar sütununu kullanarak ortalama değeri buluyoruz =22.51% (ORTALAMA işlevini kullanarak).

Karşılaştırma %22,51>%7 olduğunu gösteriyor. Sonuç olarak modelin doğruluğu yetersizdir.

Kullanarak F – Fisher kriteri Modelin önemini bir bütün olarak kontrol edelim. Bunu yapmak için, “Regresyon” aracını kullanmanın sonuçlarını yazacağız (model (6) için “varyans analizi” tablosu) F= 39,6702.

FRIST fonksiyonunu kullanarak değeri buluyoruz F cr =3.252 anlamlılık düzeyi için a = %5 ve serbestlik derecesi sayıları k 1 = 2 , k 2 = 37 .

F> F cr bu nedenle model (6)'nın denklemi anlamlıdır, kullanılması tavsiye edilir, bağımlı değişken e modelde yer alan faktör değişkenleri tarafından oldukça iyi açıklanmaktadır (6) X 1 , X 2. Ve X 4 .

Ek olarak kullanarak T –Öğrenci t testi Modelin bireysel katsayılarının önemini kontrol edelim.

T–Regresyon denkleminin katsayılarına ilişkin istatistikler “Regresyon” aracının sonuçlarında verilmiştir. Seçilen model için aşağıdaki değerler elde edildi (6):


Oranlar

Standart hata

t-istatistiği

P-Değeri

Alt %95

İlk %95

Alt %95,0

İlk %95,0

Y-kavşağı

-5,643572321

12,07285417

-0,46745966

0,642988

-30,1285

18,84131

-30,1285

18,84131

X4

2,591405557

0,461440597

5,61590284

2.27E-06

1,655561

3,52725

1,655561

3,52725

X1

6,85963077

9,185748512

0,74676884

0,460053

-11,7699

25,48919

-11,7699

25,48919

X2

-1,985156991

7,795346067

-0,25465925

0,800435

-17,7949

13,82454

-17,7949

13,82454

Kritik değer T cr anlamlılık düzeyi için bulunan α=%5 ve serbestlik derecesi sayısı k=40–2–1=37 . T cr =2.026 (STUDAR işlevi).

Ücretsiz oranlar için α =–5.643 tanımlanmış istatistikler
, T cr Bu nedenle serbest katsayı anlamlı değildir ve modelden çıkarılabilir.

Regresyon katsayısı için β 1 =6.859 tanımlanmış istatistikler
, β 1 anlamlı değilse bölgesel şehir faktörü modelden çıkarılabilir.

Regresyon katsayısı için β 2 =-1,985 tanımlanmış istatistikler
, T cr dolayısıyla regresyon katsayısı β 2 anlamlı değilse apartmandaki oda sayısı faktörü modelin dışında tutulabilir.

Regresyon katsayısı için β 4 =2.591 tanımlanmış istatistikler
, >t cr, dolayısıyla regresyon katsayısı β 4 Önemlidir, dairenin yaşam alanı faktörü modelde tutulabilir.

Model katsayılarının anlamlılığına ilişkin sonuçlar anlamlılık düzeyinde yapılır. α=%5. P-değeri sütununa baktığımızda, serbest katsayının olduğunu görüyoruz. α 0,64=%64 düzeyinde anlamlı sayılabilir; regresyon katsayısı β 1 – 0,46 = %46 düzeyinde; regresyon katsayısı β 2 – 0,8 = %80 seviyesinde; ve regresyon katsayısı β 4 – 2,27E-06= 2,26691790951854E-06 = %0,0000002 düzeyinde.

Denkleme yeni faktör değişkenleri eklendiğinde belirleme katsayısı otomatik olarak artar. R 2 ve ortalama yaklaşım hatası azalır, ancak modelin kalitesi her zaman iyileşmez. Bu nedenle, modelin (3) ve seçilen çoklu modelin (6) kalitesini karşılaştırmak için normalleştirilmiş belirleme katsayılarını kullanırız.

Dolayısıyla regresyon denklemine “bölgenin şehri” faktörü eklendiğinde X 1 ve “apartmandaki oda sayısı” faktörü X 2 modelin kalitesi bozuldu, bu da faktörlerin ortadan kaldırılması lehine konuşuyor X 1 ve X Modelden 2.

Daha fazla hesaplama yapalım.

Ortalama esneklik katsayıları doğrusal bir model durumunda formüllerle belirlenir
.

ORTALAMA işlevini kullanarak şunları buluruz: S e sadece faktörün artmasıyla X 4 bir standart sapma kadar – 0,914 artar S e

Delta katsayıları formüllerle belirlenir
.

Excel'deki "Veri Analizi" paketinin "Korelasyon" aracını kullanarak çift korelasyon katsayılarını bulalım.


e

X1

X2

X4

e

1

X1

-0,01126

1

X2

0,751061

-0,0341

1

X4

0,874012

-0,0798

0,868524

1

Belirleme katsayısı daha önce belirlenmiş ve 0,7677'ye eşittir.

Delta katsayılarını hesaplayalım:

;

Δ 1'den beri 1 Ve X 2 kötü seçilmiştir ve modelden çıkarılmaları gerekir. Bu, ortaya çıkan doğrusal üç faktörlü modelin denklemine göre, ortaya çıkan faktördeki değişimin olduğu anlamına gelir. e(daire fiyatları) %104 faktörün etkisiyle açıklanmaktadır. X 4 (apartmanın yaşam alanı), %4 oranında faktörden etkilenmektedir X 2 (oda sayısı), %0,0859 oranında faktörden etkilendi X 1 (bölgenin şehri).

Rusya Federasyonu Eğitim ve Bilim Bakanlığı

Federal Devlet Özerk Yüksek Mesleki Eğitim Kurumu

Uzak Doğu Federal Üniversitesi

Ekonomi ve Yönetim Okulu

İşletme Bilişimi ve Ekonomik ve Matematiksel Yöntemler Bölümü

LABORATUVAR İŞİ

"Simülasyon Modelleme" disiplininde

Uzmanlık 080801.65 “Uygulamalı bilişim (ekonomide)”

REGRESYON ANALİZİ

Rudakova

Ulyana Anatolyevna

Vladivostok

RAPOR

Ödev: 23 gayrimenkule ilişkin verilere (satış fiyatı ve yaşam alanı) dayalı bir regresyon analizi prosedürünü düşünün.

"Regresyon" çalışma modu, doğrusal regresyon denkleminin parametrelerini hesaplamak ve incelenen süreç için yeterliliğini kontrol etmek için kullanılır.

MS Excel'de regresyon analizi problemini çözmek için menüden seçim yapın Hizmettakım Veri analizive analiz aracı" Regresyon".

Görüntülenen iletişim kutusunda aşağıdaki parametreleri ayarlayın:

1. Giriş aralığı Y- bu, ortaya çıkan özniteliğin veri aralığıdır. Bir sütundan oluşmalıdır.

2. Giriş aralığı Xfaktörlerin değerlerini (bağımsız değişkenler) içeren bir hücre aralığıdır. Giriş aralıklarının (sütunların) sayısı 16'dan fazla olmamalıdır.

.Onay kutusu Etiketler, aralığın ilk satırı bir başlık içeriyorsa ayarlanır.

5. Sabit sıfır.Regresyon çizgisinin orijinden geçmesi gerekiyorsa bu onay kutusu ayarlanmalıdır (ve 0=0).

6. Çıktı aralığı/ Yeni çalışma sayfası/ Yeni çalışma kitabı -çıkış aralığının sol üst hücresinin adresini belirtin.

.Onay kutuları grup içinde Kalanlarkarşılık gelen sütunların veya grafiklerin çıktı aralığına dahil edilmesi gerekiyorsa ayarlanır.

.Gözlemlenen Y değerlerinin otomatik olarak oluşturulan yüzdelik aralıklara bağımlılığının dağılım grafiğini görüntülemek istiyorsanız Normal Olasılık Grafiği onay kutusunun aktif hale getirilmesi gerekir.

Çıkış aralığında OK butonuna tıkladıktan sonra bir rapor alıyoruz.

Bir dizi veri analizi aracı kullanarak kaynak verilerin regresyon analizini gerçekleştireceğiz.

Regresyon analizi aracı, en küçük kareler yöntemini kullanarak bir regresyon denkleminin parametrelerini sığdırmak için kullanılır. Regresyon, bir veya daha fazla bağımsız değişkenin değerlerinin tek bir bağımlı değişken üzerindeki etkisini analiz etmek için kullanılır.

TABLO REGRESYON İSTATİSTİKLERİ

Büyüklük çoğul Rbelirleme katsayısının köküdür (R-kare). Korelasyon indeksi veya çoklu korelasyon katsayısı olarak da adlandırılır. Bağımsız değişkenlerin (X1, X2) ve bağımlı değişkenin (Y) bağımlılık derecesini ifade eder ve belirleme katsayısının kareköküne eşittir; bu değer sıfırdan bire kadar olan aralıkta değerler alır. Bizim durumumuzda 0,7'ye eşit olması değişkenler arasında anlamlı bir ilişki olduğunu göstermektedir.

Büyüklük R-kare (belirleme katsayısı)Kesinlik ölçüsü olarak da adlandırılan , ortaya çıkan regresyon çizgisinin kalitesini karakterize eder. Bu kalite, kaynak veriler ile regresyon modeli (hesaplanan veriler) arasındaki yazışma derecesi ile ifade edilir. Kesinliğin ölçüsü her zaman aralık dahilindedir.

Bizim durumumuzda R-kare değeri 0,48'dir, yani. neredeyse %50, bu da regresyon çizgisinin orijinal verilere zayıf bir uyumunu gösterir. bulunan değer R-kare = %48<75%, то, следовательно, также можно сделать вывод о невозможности прогнозирования с помощью найденной регрессионной зависимости. Таким образом, модель объясняет всего 48% вариации цены, что говорит о недостаточности выбранных факторов, либо о недостаточном объеме выборки.

Normalleştirilmiş R-kareaynı belirleme katsayısıdır ancak örneklem büyüklüğüne göre ayarlanmıştır.

Normal R-kare=1-(1-R-kare)*((n-1)/(n-k))

regresyon analizi doğrusal denklem

burada n gözlem sayısıdır; k - parametre sayısı. Yeni regresörler (faktörler) eklenirken normalleştirilmiş R-kare kullanılması tercih edilir, çünkü arttıkça R-kare değeri de artacaktır ancak bu modelde bir iyileşme olduğunu göstermez. Bizim durumumuzda ortaya çıkan değer 0,43 olduğundan (R-kareden sadece 0,05 farklı) R-kare katsayısına olan güvenin yüksek olduğundan bahsedebiliriz.

Standart hatagözlem sonuçlarına yaklaşmanın (yaklaştırmanın) kalitesini gösterir. Bizim durumumuzda hata 5.1'dir. Yüzde olarak hesaplayalım: 5.1/(57.4-40.1)=0.294 ≈ %29 (Standart hata şu şekilde olduğunda model daha iyi kabul edilir:<30%)

Gözlemler- gözlemlenen değerlerin sayısı belirtilir (23).

VARYANS TABLO ANALİZİ

Regresyon denklemini elde etmek için bir istatistik belirlenir - regresyon denkleminin doğruluğunun bir özelliği; bu, bağımlı değişkenin varyansının regresyon denklemi tarafından açıklanan kısmının açıklanmayan (artık) kısmına oranıdır. varyans.

df sütununda- k serbestlik derecesi sayısı verilmiştir.

Geriye kalan için bu, n-(m+1)'e eşit bir değerdir, yani. başlangıç ​​noktalarının sayısı (23) eksi katsayıların sayısı (2) ve eksi serbest terim (1).

SS sütununda- ortaya çıkan özelliğin ortalama değerinden sapmaların karelerinin toplamı. Şunları sunar:

Regresyon denklemi kullanılarak hesaplanan teorik değerlerin ortaya çıkan karakteristiğinin ortalama değerinden kare sapmaların regresyon toplamı.

Orijinal değerlerin teorik değerlerden sapmalarının kalan toplamı.

Başlangıç ​​değerlerinin ortaya çıkan karakteristikten karesel sapmalarının toplam toplamı.

Karesel sapmaların regresyon toplamı ne kadar büyükse (veya kalan toplam ne kadar küçükse), regresyon denklemi orijinal noktalar bulutuna o kadar iyi yaklaşır. Bizim durumumuzda kalan miktar yaklaşık %50'dir. Sonuç olarak, regresyon denklemi başlangıç ​​noktaları bulutuna çok zayıf bir şekilde yaklaşmaktadır.

MS sütununda- tarafsız örnek varyansları, regresyon ve artık.

F sütununda Regresyon denkleminin anlamlılığını test etmek için kriter istatistiklerinin değeri hesaplandı.

Regresyon denkleminin anlamlılığını istatistiksel olarak test etmek için, değişkenler arasında bir ilişkinin bulunmadığına dair bir sıfır hipotezi formüle edilir (değişkenler için tüm katsayılar sıfıra eşittir) ve anlamlılık düzeyi seçilir.

Anlamlılık düzeyi, test sonucunda doğru sıfır hipotezinin reddedilmesi anlamına gelen I. tip hata yapmanın kabul edilebilir olasılığıdır. Bu durumda, tip I hata yapmak, bir örneklemde, popülasyondaki değişkenler arasında gerçekte böyle bir ilişki olmadığı halde bir ilişki olduğunu fark etmek anlamına gelir. Tipik olarak anlamlılık düzeyi %5 olarak alınır. Elde edilen değer = 9,4 ile tablo değeri = 3,5 (serbestlik derecesi sayısı sırasıyla 2 ve 20) ile karşılaştırıldığında regresyon denkleminin anlamlı (F>Fcr) olduğunu söyleyebiliriz.

Önem sütununda F kriter istatistiklerinin elde edilen değerinin olasılığı hesaplanır. Bizim durumumuzda bu değer = 0,00123 yani 0,05'ten küçük olduğundan regresyon denkleminin (bağımlılığın) %95 olasılıkla anlamlı olduğunu söyleyebiliriz.

Yukarıda açıklanan iki sütun, modelin bir bütün olarak güvenilirliğini göstermektedir.

Aşağıdaki tabloda regresörlerin katsayıları ve tahminleri yer almaktadır.

Y kesme çizgisi herhangi bir regresörle ilişkili değildir; serbest bir katsayıdır.

Sütunda ihtimaller regresyon denklemi katsayılarının değerleri kaydedilir. Böylece denklem elde edildi:

Y=25,6+0,009X1+0,346X2

Regresyon denklemi başlangıç ​​noktaları bulutunun merkezinden geçmelidir: 13,02≤M(b)≤38,26

Daha sonra sütun değerlerini çiftler halinde karşılaştırın Katsayılar ve Standart Hata. Bizim durumumuzda katsayıların tüm mutlak değerlerinin standart hataları aştığı görülmektedir. Bu regresörlerin önemini gösterebilir ancak bu kaba bir analizdir. T-istatistik sütunu katsayıların önemine ilişkin daha doğru bir tahmin içerir.

T-istatistik sütununda formül kullanılarak hesaplanan t-testi değerlerini içerir:

t=(Katsayı)/(Standart hata)


n-(k+1)=23-(2+1)=20

Öğrenci tablosunu kullanarak ttable = 2,086 değerini buluruz. Karşılaştırma

t tablosunda regresör katsayısı X2'nin önemsiz olduğunu görüyoruz.

Kolon p değeri kullanılan test istatistiğinin (Student t istatistiği) kritik değerinin örneklemden hesaplanan değeri aşma olasılığını temsil eder. Bu durumda karşılaştırırız p değerleri seçilen önem düzeyiyle (0,05). Yalnızca regresör katsayısı X2=0.08>0.05'in önemsiz kabul edilebileceği görülmektedir.

Alt %95 ve üst %95 sütunları, %95 güvenle güven aralığı sınırlarını sağlar. Her katsayının kendi sınırları vardır: Katsayıttable*Standart hata

Güven aralıkları yalnızca istatistiksel olarak anlamlı değerler için oluşturulur.

KALAN PAYI ÇEKİLME TABLOSU

Kalan bireysel bir noktanın (gözlem) regresyon çizgisinden (tahmin edilen değer) sapmasıdır.

Normallik Varsayımı kalanlar tahmin edilen ve gözlemlenen değerler arasındaki farkın dağılımının normal olduğunu varsayar. Dağıtımın doğasını görsel olarak belirlemek için işlevi etkinleştirin denge tablosu.

Artık grafikler, orijinal Y değerleri ile X1 ve X2 değişken bileşeninin her bir değeri için regresyon fonksiyonundan hesaplananlar arasındaki farkları gösterir. Kullanılan hattın kabul edilebilir olup olmadığını belirlemek için kullanılır.

Uyum grafiği, regresyon çizgisinin görsel bir temsilini sağlamak için kullanılabilir.

Standart artıklar, standart sapmalarını tahmin etmek için normalleştirilmiş artıklardır.

Nedensel tahmin yöntemlerinin özü, sonuç ve faktör değişkenleri arasında matematiksel bir bağlantı kurmaktır.

Nedensel tahmin yöntemlerinin kullanılmasının gerekli koşulu, büyük miktarda verinin bulunmasıdır. Değişkenler arasındaki ilişkiler matematiksel olarak doğru bir şekilde tanımlanabildiği takdirde nedensel tahminin doğruluğu oldukça yüksek olacaktır.
Nedensel tahmin yöntemleri şunları içerir:


  • çok değişkenli regresyon modelleri,

  • simülasyon modellemesi.
En yaygın nedensel tahmin yöntemleri çok değişkenli regresyon modelleridir .

1.4.1 Çok değişkenli regresyon modelleri

Çok değişkenli regresyon modeli, birden fazla bağımsız değişken içeren bir denklemdir.

Çok değişkenli bir regresyon modeli oluşturmak için çeşitli işlevler kullanılabilir; en yaygın olanları doğrusal ve güç bağımlılıklarıdır:

Doğrusal modelde parametreler(b 1, b 2, ... b n), diğer tüm bağımsız değişkenlerin sıfıra eşit olması durumunda, bağımsız değişkenlerden her birinin tahmin edilen değer üzerindeki etkisi olarak yorumlanır.

İÇİNDE güç modeli parametreler esneklik katsayılarıdır. İlgili faktörde %1'lik bir değişiklik olduğunda sonucun (y) ortalama yüzde kaç oranında değişeceğini, diğer faktörlerin etkisinin ise değişmediğini gösterirler. Çoklu regresyon denklemlerinin parametrelerini hesaplamak için aynı zamanda kullanılır en küçük kareler yöntemi.

Regresyon modelleri oluştururken veri kalitesi belirleyici bir rol oynar. Veri toplama tahminlerin temelini oluşturur, dolayısıyla veri toplarken uyulması gereken bir takım gereksinimler ve kurallar vardır.


  1. İlk önce, veri olmalıdır gözlemlenebilir yani hesaplama sonucu değil ölçüm sonucu elde edilir.

  1. İkinci olarak, veri dizisinden gerekli yinelenen ve oldukça farklı verileri hariç tutun. Tekrarlanmayan veriler ne kadar fazlaysa ve popülasyon ne kadar homojense denklem o kadar iyi olur. Oldukça farklı değerlerle, genel seriye uymayan gözlemleri kastediyoruz. Örneğin işçilerin maaş verileri dört ve beş haneli rakamlarla (7.000, 10.000, 15.000), ancak altı haneli bir sayı (250.000) bulundu. Açıkçası bu bir hatadır.

  1. Üçüncü kural (gereklilik): oldukça büyük miktarda veri. İstatistikçiler, iyi bir denklem oluşturmak için ne kadar veriye ihtiyaç duyulduğu konusunda farklı görüşlere sahiptir. Bazılarına göre veri gereklidir 4-6 kat daha fazla faktör sayısı. Diğerleri bunu iddia ediyor en az 10 kat daha fazla Faktörlerin sayısı, daha sonra tam güçle işleyen büyük sayılar yasası, ilişkinin doğal doğasından rastgele sapmaların etkili bir şekilde bastırılmasını sağlar.

Çok değişkenli regresyon modelinin oluşturulmasıHANIMexcel
Excel elektronik tablolarında yalnızca oluşturmak mümkündür doğrusalçok değişkenli regresyon modeli.
, (1.19)
Bunu yapmak için öğeyi seçmeniz gerekir "Veri analizi", ve sonra beliren pencerede - araç "gerileme"


Şekil 1.45 – “Regresyon” aracının iletişim kutusu
Görüntülenen pencerede aşağıdakiler de dahil olmak üzere bir dizi alanı doldurmanız gerekir:


  • Giriş aralığı e – elde edilen Y değişkeninin değerlerini içeren, bir sütundaki bir veri aralığı.

  • Giriş aralığı X faktör değişkenlerinin değerlerini içeren bir veri aralığıdır.

Giriş aralığının ilk satırı veya ilk sütunu başlıklar içeriyorsa kutuyu işaretlemeniz gerekir. "etiketler" .

Varsayılan uygulandı güvenilirlik seviyesi %95. Farklı bir seviye ayarlamak istiyorsanız kutuyu işaretleyin ve istediğiniz güvenilirlik seviyesini yanındaki alana girin.

Onay kutusu "Sabit sıfır" yalnızca kesme terimi olmadan bir regresyon denklemi elde etmek istiyorsanız işaretlenmesi gerekir A, böylece regresyon çizgisi orijinden geçer.
Hesaplama sonuçlarının çıktısı 3 şekilde düzenlenebilir:


  • V bu çalışma sayfasındaki hücre aralığı (Bunun için sahada "Çıktı aralığı" hesaplama sonuçlarının görüntüleneceği aralığın sol üst hücresini tanımlayın);

  • Açık yeni çalışma sayfası (yanındaki alana bu sayfanın istediğiniz adını girebilirsiniz);

  • V yeni çalışma kitabı .

Onay kutularını ayarlama "Kalıntılar" Ve "Standartlaştırılmış dengeler"çıkış aralığına dahil edilmelerini emreder.
Her bağımsız değişkenin artıklarını çizmek için onay kutusunu seçin "Denge tablosu."Kalanlar aksi takdirde tahmin hataları denir. Gerçek ve tahmin edilen Y değerleri arasındaki fark olarak tanımlanırlar.
Artık grafiklerin yorumlanması
Artık grafiklerde herhangi bir desen olmamalıdır. Bir model izlenebiliyorsa, bu, modelin bizim için bilinmeyen bazı şeyleri içermediği, ancak hakkında veri bulunmayan doğal olarak etkili olan bir faktörü içerdiği anlamına gelir.

Kutuyu işaretlerken "Seçim takvimi" Teorik regresyon çizgisinin gözlemlenenlere ne kadar iyi uyduğunu gösteren bir dizi grafik görüntülenecektir; gerçek veriler.

Seçim grafiklerinin yorumlanması
Excel'de uyum grafiklerindeki kırmızı noktalar teorik değerleri gösterir e, mavi noktalar - orijinal veriler. Kırmızı noktalar mavi noktalarla iyi örtüşüyorsa, bu görsel olarak başarılı bir regresyon denklemini gösterir.
Çok değişkenli regresyon modellerine dayanan tahminin gerekli bir aşaması, regresyon denkleminin istatistiksel öneminin değerlendirilmesidir; Oluşturulan regresyon denkleminin tahmin amacıyla kullanıma uygunluğu. Bu sorunu çözmek için MS Excel'de bir takım katsayılar hesaplanır. Yani:


  1. Çoklu korelasyon katsayısı

Ortaya çıkan ve arasındaki bağlantının yakınlığını ve yönünü karakterize eder. birçok faktör değişkenleri. İki faktörlü bağımlılıkta çoklu korelasyon katsayısı aşağıdaki formül kullanılarak hesaplanır:
, (1.20)


  1. Çoklu belirleme katsayısı ( R 2 ).

R2, modelde yer alan faktörlerle açıklanan, teorik değerdeki y'nin gerçek değerlerine göre değişimin oranıdır. Teorik değerlerin geri kalanı modelde yer almayan diğer faktörlere bağlıdır. R 2, 0'dan 1'e kadar değerler alabilir. Eğer ise modelin kalitesi yüksektir. Bu gösterge özellikle birkaç modeli karşılaştırmak ve en iyisini seçmek için kullanışlıdır.


  1. Normalleştirilmiş belirleme katsayısı R 2

R2 göstergesinin dezavantajı, az sayıda gözlem nedeniyle büyük belirleme katsayısı değerlerinin elde edilebilmesidir. Normalleştirilmiş bu durumda olduğundan çok daha büyük başka bir veri setinde hangi değeri elde edebileceğiniz hakkında bilgi sağlar.

Normalleştirilmiş formül kullanılarak hesaplanır:

, (1.21)

normalleştirilmiş çoklu belirleme katsayısı nerede,

Çoklu belirleme katsayısı,

Agreganın hacmi,

Faktör değişkenlerinin sayısı.


  1. Regresyonun standart hatası tahmin hatasının yaklaşık büyüklüğünü gösterir. Değerlendirilen modelin kalitesini ölçmek için temel bir nicelik olarak kullanılır. Formül kullanılarak hesaplanır:
, (1.22)

kalanların kareleri toplamı nerede,

Kalıntıların serbestlik derecesi sayısı.
Yani regresyonun standart hatası serbestlik derecesi başına hatanın karesini gösterir.


SONUÇLARIN SONUÇLANMASI

Regresyon istatistikleri

Çoğul R

0.973101

R Meydanı

0.946926

Normalleştirilmiş R-kare

0.940682

Standart hata

0.59867

Gözlemler

20

Varyans analizi

df

SS

HANIM

F

Önem F

Regresyon

2

108.7071

54.35355

151.6535

1.45E-11

Kalan

17

6.092905

0.358406

Toplam

19

114.8

Oranlar

Standart hata

t-istatistiği

P-Değeri

Alt %95

İlk %95

Alt %95,0

İlk %95,0

Y-kavşağı

1.835307

0.471065

3.89608

0.001162

0.841445

2.829169

0.841445

2.829169

x1

0.945948

0.212576

4.449917

0.000351

0.49745

1.394446

0.49745

1.394446

x2

0.085618

0.060483

1.415561

0.174964

-0.04199

0.213227

-0.04199

0.213227

Varyans analizi yöntemi, bir değişkenin toplam sapmalarının karelerinin toplamının ayrıştırılmasından oluşur. en ortalama değerden iki parçaya:


  1. regresyon (veya faktör) ile açıklanır,

  2. kalıntı.
, (1.2 3)
Bir regresyon modelinin tahmin için uygunluğu, özellikteki toplam varyasyonun ne kadar olduğuna bağlıdır. sen Regresyonla açıklanan varyasyonu açıklar. Açıkçası, eğer regresyonla açıklanan sapmaların kareleri toplamı artıktan büyükse, o zaman regresyon denkleminin istatistiksel anlamlılığı hakkında bir sonuca varılır. Bu, belirleme katsayısının birliğe yaklaşmasıyla eşdeğerdir.
“Varyans Analizi” tablosundaki gösterimler:
Tablonun ikinci sütunu serbestlik derecesinin sayısını ifade eder. Toplam varyans için serbestlik derecesi sayısı şuna eşittir: faktör varyansı için (veya regresyonla açıklanan varyans), artık varyans için.

burada n gözlem sayısıdır,

m – modelin faktör değişkenlerinin sayısı.
Tablonun üçüncü sütununa denir. Karesel sapmaların toplamını temsil eder. Sapmaların karelerinin toplam toplamı aşağıdaki formülle belirlenir:

, (1.24)
Karelerin çarpan toplamı:

, (1.26)
Dördüncü sütuna karesel sapmaların ortalama değeri denir. Formülle belirlenir:

Fisher'in F testi kullanılarak regresyon denkleminin belirlenme katsayısının istatistiksel önemi belirlenir. Bunu yapmak için, sonuç ve faktör değişkenleri arasında olduğunu belirten bir sıfır hipotezi ileri sürülür. bağlantı yok. Bu ancak çoklu doğrusal regresyon denkleminin tüm parametrelerinin ve korelasyon katsayısının sıfıra eşit olması durumunda mümkündür.

Bu hipotezi test etmek için Fisher's F testinin gerçek değerini hesaplamak ve bunu tablodaki değerle karşılaştırmak gerekir. F kriterinin gerçek değeri aşağıdaki formül kullanılarak hesaplanır:

, (1.28)

Özel istatistik tablolarından aşağıdakiler tarafından seçilmiştir:


  • Belirli bir önem düzeyi () ve

  • serbestlik derecesi sayısı.

MS Excel'de, F kriterinin tablo değeri şu fonksiyon kullanılarak belirlenebilir: =DFIST(olasılık, serbestlik derecesi1, serbestlik derecesi2)

Örneğin: =FDISC(0,05;df1;df2)
Önem düzeyi 1, regresyon modelinin parametrelerinin hesaplandığı ile aynı olacak şekilde seçilir. Varsayılan %95'tir.

Eğer ise ileri sürülen hipotez reddedilir ve regresyon denkleminin istatistiksel anlamlılığı kabul edilir. Özellikle önemli tahminlerin olması durumunda, F kriterinin tablo değerinin 4 kat arttırılması önerilir, yani durum kontrol edilir:
=151.65; = 3.59
Hesaplanan değer tablo değerini önemli ölçüde aşıyor. Bu, belirleme katsayısının sıfırdan önemli ölçüde farklı olduğu anlamına gelir, dolayısıyla regresyon bağımlılığının olmadığı hipotezinin reddedilmesi gerekir.
Şimdi regresyon katsayılarının önemini aşağıdakilere dayanarak tahmin edelim: T-Öğrencinin t testi. Hangi faktör değişkenlerinin (x), ortaya çıkan değişken (y) üzerinde en büyük etkiye sahip olduğunu belirlemenizi sağlar.

Standart hatalar genellikle ile gösterilir. Alt simge, bu hatanın hesaplandığı regresyon denkleminin parametresini belirtir

Formül kullanılarak hesaplanır:

, (1.29)

ortaya çıkan değişkenin standart sapması nerede,

Karakteristik için RMS,

Çoklu denklem için belirleme katsayısı

regresyonlar,

Faktörün bağımlılığı için belirleme katsayısı

denklemdeki diğer tüm faktörler.

Kalan kareler toplamı için serbestlik derecesi sayısı

sapmalar.
MS Excel'de standart hatalar otomatik olarak hesaplanır (3. tablonun 3. sütununda bulunur).
Gerçek değerT-Öğrenci t testi MS Excel'de 3. tablonun 4. sütununda bulunur ve denir t-istatistikleri.
(4. sütun) = (2. sütun) / (3. sütun)

t-istatistik = Katsayılar/Standart hata
Tablo değeriT-Öğrenci t testi kabul edilen anlamlılık düzeyine (genellikle 0,05; 0,01) ve serbestlik derecesi sayısına bağlıdır.

burada n popülasyondaki birim sayısıdır,

m denklemdeki faktörlerin sayısıdır.
MS Excel'de Öğrenci t testinin tablo değeri aşağıdaki fonksiyon kullanılarak belirlenebilir:

STUDRIST(olasılık; serbestlik derecesi sayısı)
Örneğin: =STUDISCOVER(0,05,7)
Eğer ise regresyon denklemi katsayısının istatistiksel olarak anlamlı (güvenilir) olduğu ve modele dahil edilerek tahmin amacıyla kullanılabileceği sonucuna varılır.

1.4.2 Monte Carlo simülasyon yöntemi

Simülasyon yöntemi adını, Akdeniz kıyısında, Fransa ve İtalya sınırına yakın, dünyanın en küçük ülkelerinden biri olan Monako Prensliği'nde yer alan Monte Carlo şehrinden almıştır.

Monte Carlo simülasyon yöntemi, belirlenen kısıtlamalara uygun olarak rastgele değerler üretilmesini içerir. Simülasyon modellemeyi yapmaya başlarken, öncelikle, tahmin edilen göstergenin, faktör değişkenleri arasındaki ilişkiyi ve bunların sonuç üzerindeki etkisinin derecesini ve doğasını yansıtan bir ekonomik-matematiksel modelinin (EMM) geliştirilmesi gerekir. . Modern piyasa koşullarında ekonomik ilişkiler konusu, farklı nitelikte ve yönde birçok faktörden aynı anda etkilendiğinden ve bunların etkisinin derecesi deterministik olmadığından, EMM değişkenlerini iki gruba ayırmak gerekli görünmektedir: stokastik ve deterministik;

Daha sonra, her stokastik değişken için olasılık dağılım türlerini ve karşılık gelen giriş parametrelerini belirlemeli ve rastgele sayı üreteci MS Excel veya başka bir yazılım kullanarak stokastik değişkenlerin değerlerini simüle etmelisiniz.

MS Excel 2007 kullanıcıları, eklentiyi etkinleştirdikten sonra "rastgele sayı oluşturma" aracını kullanabilirler. Analiz paketi. Eklentiyi etkinleştirme prosedürü yukarıda açıklanmıştır (bkz. sayfa 10, Şekil 1.5-1.8). Menüde simülasyon gerçekleştirmek için VERİ bir öğe seçmeniz gerekiyor "Veri analizi", görüntülenen iletişim kutusunda listeden bir araç seçin "Rastgele Sayı Üretimi" ve Tamam'ı tıklayın.

Şekil 1.46 - Veri analizi menü arayüzü
Görüntülenen iletişim kutusunda, her stokastik değişken için olasılık dağılımının türünü seçmeli ve uygun giriş parametrelerini ayarlamalısınız.

Şekil 1.47 - Rastgele sayı üreteci iletişim kutusu
Bu aşama en zor olanlardan biridir, bu nedenle bunu yaparken uzmanların bilgi ve deneyimlerini kullanmak gerekir. Olasılık dağılımı türünün seçilmesi mevcut istatistiksel bilgilere dayanarak da gerçekleştirilebilir. Uygulamada en sık kullanılan olasılık dağılım türleri normal, üçgen ve tekdüzedir.

Normal dağılım (veya Moivre-Gauss-Laplace yasası) tahmin edilen parametrenin değişkenlerinin ortalama değere yöneldiğini varsayar. Ortalamadan önemli ölçüde farklı olan, yani dağılımın “kuyruklarında” yer alan bir değişkenin değerlerinin olasılığı düşüktür.

Üçgen dağılım normal dağılımın bir türevidir ve ortalama değere yaklaştıkça doğrusal olarak artan bir dağılım varsayar.

Üniforma dağıtımı Değişken göstergenin tüm değerlerinin aynı uygulama olasılığına sahip olması durumunda kullanılır.

Değişken önemli olduğunda ve dağıtım yasasını seçmenin imkansızlığı bakış açısından görülebilir ayrık dağıtım. Yukarıda listelenen olasılık dağılım türleri, Tablo 1.11'de sunulan girdi parametrelerinin belirlenmesini gerektirir.
Tablo 1.11 - Ana olasılık dağılım türlerinin giriş parametreleri


Olasılık türü

dağıtım


Giriş parametreleri

1 Normal dağılım

  • ortalama değer;

  • standart sapma;

2 Üçgen dağılım

  • ortalama değer;


3 Düzgün dağılım

  • olası değer aralığının sınırları;

4 Ayrık dağıtım

  • spesifik değişken değerleri;

  • bu olasılık değerlerine karşılık gelir.

Bir dizi deney sonucunda, tahmin edilen göstergenin değerinin hesaplanması gereken stokastik değişkenlerin değerlerinin bir dağılımı elde edilecektir.

Bir sonraki gerekli adım, aşağıdaki istatistiksel özelliklerin hesaplanmasının önerildiği simülasyon modelleme sonuçlarının ekonomik ve istatistiksel bir analizini yapmaktır:


  • ortalama değer;

  • standart sapma;

  • dağılım;

  • minimum ve maksimum değer;

  • salınım aralığı;

  • asimetri katsayısı;

  • aşırı.
Yukarıdaki göstergeler normal dağılım hipotezini test etmek için kullanılabilir. Hipotez doğrulanırsa, aralık tahmini yapmak için “üç sigma” kuralı kullanılabilir. Üç sigma kuralı şunu belirtir: Eğer bir rastgele değişken X ve parametreleriyle normal dağılım yasasına tabidir, bu durumda değerlerinin aralıkta yer aldığı neredeyse kesindir, yani . Netliği artırmak ve yorumlamayı basitleştirmek için bir histogram oluşturulması tavsiye edilir.


Şekil 1.48 - Tahmin edilen gösterge değerlerinin histogramı

Bu aşamaların uygulanması, öngörülen göstergenin (aralık tahmini) değerlerinin olasılıksal bir değerlendirmesinin elde edilmesini mümkün kılacaktır.

Karmaşık olayları incelerken ikiden fazla rastgele faktörü hesaba katmak gerekir. Bu faktörler arasındaki ilişkinin doğasının doğru anlaşılması ancak söz konusu rastgele faktörlerin hepsinin bir kerede incelenmesiyle elde edilebilir. Üç veya daha fazla rastgele faktörün ortak çalışması, araştırmacının incelenen olgular arasındaki nedensel bağımlılıklar hakkında az çok makul varsayımlar oluşturmasına olanak sağlayacaktır. Çoklu ilişkinin basit bir biçimi, üç özellik arasındaki doğrusal bir ilişkidir. Rastgele faktörler şu şekilde gösterilir: X 1 , X 2 ve X 3. Arasındaki eşleştirilmiş korelasyon katsayıları X 1 ve X 2 olarak gösterilir R 12, sırasıyla X 1 ve X 3 - R 12, arası X 2 ve X 3 - R 23. Üç karakteristik arasındaki doğrusal ilişkinin yakınlığının bir ölçüsü olarak, çoklu korelasyon katsayıları kullanılır. R 1 ּ 23 , R 2 ּ 13 , R 3 ּ 12 ve kısmi korelasyon katsayıları, belirtilen R 12.3 , R 13.2 , R 23.1 .

Üç faktörün çoklu korelasyon katsayısı R 1.23, faktörlerden biri (noktadan önceki endeks) ile diğer iki faktörün birleşimi (noktadan sonraki endeksler) arasındaki doğrusal ilişkinin yakınlığının bir göstergesidir.

R katsayısının değerleri her zaman 0 ila 1 aralığındadır. R bire yaklaştıkça üç karakteristik arasındaki doğrusal ilişkinin derecesi artar.

Çoklu korelasyon katsayısı arasında, ör. R 2 ּ 13 ve iki çift korelasyon katsayısı R 12 ve R 23 bir ilişki var: eşleştirilmiş katsayıların her biri mutlak değeri aşamaz R 2 ּ 13 .

Çift korelasyon katsayıları r 12, r 13 ve r 23'ün bilinen değerleri ile çoklu korelasyon katsayılarını hesaplamak için formüller şu şekildedir:

Çoklu korelasyon katsayısının karesi R 2 denir çoklu belirleme katsayısı.İncelenen faktörlerin etkisi altında bağımlı değişkendeki değişimin oranını gösterir.

Çoklu korelasyonun önemi şu şekilde değerlendirilir: F-kriter:

N -örnek boyut; k – faktör sayısı. Bizim durumumuzda k = 3.

Popülasyondaki çoklu korelasyon katsayısının sıfıra eşit olduğuna ilişkin boş hipotez ( merhaba:R=0) şu durumda kabul edilir: F F<f t ve eğer reddedilirse
FF T.

Teorik değer F-kriterler belirlendi v 1 = k- 1 ve v 2 = N - k serbestlik dereceleri ve kabul edilen anlamlılık düzeyi a (Ek 1).

Çoklu korelasyon katsayısının hesaplanmasına örnek. Faktörler arasındaki ilişkiyi incelerken çift korelasyon katsayıları elde edildi ( N =15): R 12 ==0,6; g13 = 0,3; R 23 = - 0,2.

Özelliğin bağımlılığını bulmak gerekir X 2 burcundan X 1 ve X 3, yani çoklu korelasyon katsayısını hesaplayın:

Tablo değeri F-kriter n 1 = 2 ve n 2 = 15 – 3 = 12 serbestlik derecesi ve a = 0,05 F 0,05 = 3,89 ve a = 0,01'de F 0,01 = 6,93.

Böylece işaretler arasındaki ilişki R 2,13 = 0,74 anlamlıdır
%1 anlamlılık düzeyi F f > F 0,01 .

Çoklu belirleme katsayısına bakılırsa R 2 = (0,74) 2 = 0,55, özellik değişimi X 2'nin %55'i çalışılan faktörlerin etkisi ile ilişkilidir ve varyasyonun (1-R2) %45'i bu değişkenlerin etkisiyle açıklanamaz.

Kısmi doğrusal korelasyon

Kısmi korelasyon katsayısı iki özelliğin birleşme derecesini ölçen bir göstergedir.

Matematiksel istatistikler, özel bir deney yapmadan, ancak eşleştirilmiş korelasyon katsayılarını kullanarak, iki özellik arasında üçüncünün sabit değeri ile bir korelasyon kurmanıza olanak tanır. R 12 , R 13 , R 23 .

Kısmi korelasyon katsayıları aşağıdaki formüller kullanılarak hesaplanır:

Noktadan önceki sayılar ilişkinin hangi özelliklerinin incelendiğini, noktadan sonraki sayılar ise hangi özelliğin hariç tutulduğunu (ortadan kaldırıldığını) gösterir. Kısmi korelasyon için hata ve anlamlılık kriteri, ikili korelasyonla aynı formüller kullanılarak belirlenir:

.

Teorik değer T- için kriter belirlendi v = N– 2 serbestlik derecesi ve kabul edilen önem düzeyi a (Ek 1).

Popülasyondaki kısmi korelasyon katsayısının sıfıra eşit olduğuna dair boş hipotez ( H o: R= 0) şu durumda kabul edilir: T F< T t ve eğer reddedilirse
TT T.

Kısmi katsayılar -1 ile +1 arasında değerler alabilir. Özel belirleme katsayıları kısmi korelasyon katsayılarının karesi alınarak bulunur:

D 12.3 = R 2 12ּ3; D 13.2 = R 2 13ּ2; D 23ּ1 = R 2 23ּ1 .

Bireysel faktörlerin etkili bir özellik üzerindeki kısmi etkisinin derecesini belirlemek ve bu korelasyonu bozan diğer özelliklerle olan bağlantısını hariç tutmak (ortadan kaldırmak) genellikle büyük ilgi görmektedir. Bazen, elenen özelliğin sabit bir değeriyle, diğer özelliklerin değişkenliği üzerindeki istatistiksel etkisini fark etmenin imkansız olduğu görülür. Kısmi korelasyon katsayısını hesaplama tekniğini anlamak için bir örnek düşünün. Üç seçenek var X, e Ve Z. Örnek boyutu için N= 180 eşleştirilmiş korelasyon katsayısı belirlenir

r xy = 0,799; rxz = 0,57; r yz = 0,507.

Kısmi korelasyon katsayılarını belirleyelim:

Parametreler arasındaki kısmi korelasyon katsayısı X Ve e Z (R xy = 0,720) genel korelasyonda bu özellikler arasındaki ilişkinin sadece küçük bir kısmının olduğunu göstermektedir ( r xy= 0,799) üçüncü özelliğin etkisinden kaynaklanmaktadır ( Z). Parametreler arasındaki kısmi korelasyon katsayısı için de benzer bir sonuca varılmalıdır. X ve parametre Z sabit bir parametre değeriyle e (R X zּу = 0,318 ve rxz= 0,57). Aksine parametreler arasındaki kısmi korelasyon katsayısı e Ve Z sabit bir parametre değeriyle X r yz ּ X= 0,105 genel korelasyon katsayısı r y'den önemli ölçüde farklıdır z = 0.507. Buradan, aynı parametre değerine sahip nesneleri seçerseniz, X, ardından işaretler arasındaki ilişki e Ve Z Bu ilişkinin önemli bir kısmı parametredeki değişiklikten kaynaklandığından çok zayıf bir ilişkiye sahip olacaklar. X.

Bazı durumlarda kısmi korelasyon katsayısı çiftin işaretinin tersi olabilir.

Örneğin, özellikler arasındaki ilişkiyi incelerken X, Y Ve Z- eşleştirilmiş korelasyon katsayıları elde edildi (ile N = 100): R xy = 0,6; R X z= 0,9;
ey z = 0,4.

Üçüncü özelliğin etkisi hariç kısmi korelasyon katsayıları:

Örnek, çift katsayısı ve kısmi korelasyon katsayısı değerlerinin işaret bakımından farklı olduğunu göstermektedir.

Kısmi korelasyon yöntemi, ikinci dereceden kısmi korelasyon katsayısının hesaplanmasını mümkün kılar. Bu katsayı, üçüncü ve dördüncünün sabit değeri ile birinci ve ikinci özellikler arasındaki ilişkiyi gösterir. İkinci dereceden kısmi katsayının belirlenmesi, aşağıdaki formül kullanılarak birinci dereceden kısmi katsayılara dayanmaktadır:

Nerede R 12 . 4 , R 13 ּ4, R 23 ּ4 - değeri çift korelasyon katsayıları kullanılarak kısmi katsayı formülü ile belirlenen kısmi katsayılar R 12 , R 13 , R 14 , R 23 , R 24 , R 34 .

Öncelikle nedensel modelimizin yalnızca içerdiği bir durumda belirlediğimiz soruların her birine bir cevap bulmaya çalışalım. iki bağımsız değişken.

Çoklu korelasyon R ve belirleme katsayısı R2

Tüm bağımsız değişkenlerin bağımlı değişkenle toplam ilişkisini tahmin etmek için şunu kullanın: çoklu korelasyon katsayısı R. Çoklu korelasyon katsayısı arasındaki fark R iki değişkenli korelasyon katsayısından G sadece olumlu olabileceğidir. İki bağımsız değişken için aşağıdaki şekilde tahmin edilebilir:

Çoklu korelasyon katsayısı, denklem (9.1)'i oluşturan kısmi regresyon katsayıları tahmin edilerek de belirlenebilir. İki değişken için bu denklem açıkça aşağıdaki formu alacaktır:

(9.2)

Bağımsız değişkenlerimiz standart normal dağılım veya Z dağılımının birimlerine dönüştürülürse, denklem (9.2) açıkça şöyle olur:

(9.3)

Denklem (9.3)'te β katsayısı, regresyon katsayısının standartlaştırılmış değerini belirtir İÇİNDE.

Standartlaştırılmış regresyon katsayıları aşağıdaki formüller kullanılarak hesaplanabilir:

Şimdi çoklu korelasyon katsayısını hesaplama formülü şöyle görünecek:

Korelasyon katsayısını tahmin etmenin başka bir yolu R iki değişkenli korelasyon katsayısının hesaplanmasıdır R bağımlı değişken Y'nin değerleri ile doğrusal regresyon denklemine (9.2) göre hesaplanan karşılık gelen değerler arasında. Başka bir deyişle değer R şu şekilde değerlendirilebilir:

Bu katsayı ile birlikte basit regresyon durumunda olduğu gibi değeri tahmin edebiliriz. R 2, aynı zamanda genellikle şu şekilde de gösterilir: determinasyon katsayısı. İki değişken arasındaki ilişkinin değerlendirilmesi durumunda olduğu gibi, belirleme katsayısı da R 2 bağımlı değişkenin varyansının yüzde kaçını gösterir e yani , tüm bağımsız değişkenlerin dağılımıyla ilişkili olduğu ortaya çıktı - . Başka bir deyişle belirleme katsayısı şu şekilde değerlendirilebilir:

Ayrıca bağımsız değişkenlerin hiçbiriyle ilişkili olmayan bağımlı değişkendeki artık varyansın yüzdesini de tahmin edebiliriz 1 – R 2. Bu değerin karekökü, yani. miktar, tıpkı iki değişkenli korelasyon durumunda olduğu gibi, denir yabancılaşma katsayısı.

Korelasyon kısmı

Determinasyon katsayısı R Şekil 2, bağımlı değişkendeki varyansın yüzde kaçının nedensel modelde yer alan tüm bağımsız değişkenlerdeki varyansa atfedilebileceğini göstermektedir. Bu katsayı ne kadar büyük olursa ortaya koyduğumuz nedensel model de o kadar anlamlı olur. Eğer bu katsayı çok büyük değilse, incelediğimiz değişkenlerin bağımlı değişkenin toplam varyansına katkısı da anlamsız çıkıyor. Ancak uygulamada, yalnızca tüm değişkenlerin toplam katkısını değil, aynı zamanda ele aldığımız bağımsız değişkenlerin her birinin bireysel katkısını da tahmin etmek çoğu zaman gereklidir. Böyle bir katkı şu şekilde tanımlanabilir: korelasyon kısmı.

Bildiğimiz gibi, iki değişkenli korelasyon durumunda, bağımsız değişkendeki varyansla ilişkili bağımlı değişkendeki varyansın yüzdesi şu şekilde gösterilebilir: R 2. Bununla birlikte, birkaç bağımsız değişkenin etkilerinin çalışılması durumunda bu varyansın bir kısmı, kontrol olarak kullandığımız bağımsız değişkenin varyansından aynı anda kaynaklanmaktadır. Bu ilişkiler Şekil 2'de açıkça gösterilmektedir. 9.1.

Pirinç. 9.1. Bağımlı değişkenin varyanslarının oranı (e ) ve iki bağımsız (X 1VeX 2) iki bağımsız değişkenle korelasyon analizindeki değişkenler

Şekil 2'de gösterildiği gibi. 9.1, tüm varyans e iki bağımsız değişkenimizle ilişkili, etiketli üç bölümden oluşur a, b Ve İle. Parçalar A Ve B farklılıklar e iki bağımsız değişkenin varyanslarına ayrı ayrı aittir – X 1 ve X 2. Aynı zamanda c kısmının dağılımı aynı anda hem bağımlı değişken Y'nin dağılımını hem de iki değişkenimizin dağılımını birbirine bağlar X. Bu nedenle değişkenin ilişkisini değerlendirmek için X 1 değişkenli E, değişkenin etkisinden kaynaklanmıyor X Değişken başına 2 e miktardan gerekli R" 2 kare korelasyonun değerini çıkarın e İle X 2:

(9.6)

Benzer şekilde, Y ile korelasyonun kısmını tahmin edebiliriz. X 2 ile korelasyonundan kaynaklanmıyor X 1.

(9.7)

Büyüklük efendim (9.6) ve (9.7) denklemlerinde aradığımız şey korelasyon kısmı.

Bir parçanın korelasyonu aynı zamanda olağan iki değişkenli korelasyona göre de tanımlanabilir:

Başka bir deyişle parça korelasyonuna yarı kısmi korelasyon denir. Bu isim, bir korelasyon hesaplanırken ikinci bağımsız değişkenin etkisinin birinci bağımsız değişkenin değerlerine göre ortadan kaldırıldığı, ancak bağımlı değişkene göre ortadan kaldırılmadığı anlamına gelir. Etki X 1, değerler kullanılarak bir nevi ayarlanır X 2, dolayısıyla korelasyon katsayısı hesaplanmaz e Ve X 1 ve arası e ve ve değerler değerlere göre hesaplanır X 2, basit doğrusal regresyon bölümünde tartışıldığı gibi (bkz. alt bölüm 7.4.2). Böylece aşağıdaki ilişkinin geçerli olduğu ortaya çıkar:

Regresyon analizinde, diğer bağımsız değişkenlerin hem bağımsız değişkenin kendisi hem de bağımlı değişken üzerinde etkisi olmadığında, bir bağımsız değişkenin bağımlı bir değişkenle korelasyonunu değerlendirmek için kısmi korelasyon kavramı kullanılır.

Kısmi korelasyonlar

Özel, veya kısmi, korelasyon Matematiksel istatistiklerde, belirli bir bağımsız değişkenin varyansıyla ilişkili bağımlı değişkenin varyansının, bu bağımlı değişkenin tüm varyansına göre oranı yoluyla belirlenir; diğerinin varyansıyla ilişkili kısmı sayılmaz. bağımsız değişkenler. Resmi olarak, iki bağımsız değişken durumunda bu şu şekilde ifade edilebilir:

Kısmi korelasyon değerlerinin kendisi halkla ilişkiler iki değişkenli korelasyon değerlerine dayanarak bulunabilir:

Dolayısıyla kısmi korelasyon, hem bağımlı hem de bağımsız değişkenin düzeltilmiş değerleri arasındaki sıradan iki değişkenli korelasyon olarak tanımlanabilir. Düzeltmenin kendisi, kontrol görevi gören bağımsız değişkenin değerlerine uygun olarak gerçekleştirilir. Başka bir deyişle bağımlı değişken arasındaki kısmi korelasyon e ve bağımsız değişken X değerleri ve değerleri arasındaki olağan korelasyon olarak tanımlanabilir ve ikinci bağımsız değişkenin değerlerine dayalı olarak tahmin edilebilir X 2.



Makaleyi beğendin mi? Arkadaşlarınla ​​paylaş!