Regresyon denklemi katsayılarının anlamlılığının belirlenmesi. Regresyon denkleminin ve parametrelerinin istatistiksel öneminin değerlendirilmesi

Korelasyon katsayısının önemini ve anlamlılığını değerlendirmek için Öğrenci t testi kullanılır.

Korelasyon katsayısının ortalama hatası aşağıdaki formül kullanılarak bulunur:

N
ve hataya bağlı olarak t kriteri hesaplanır:

Hesaplanan t-testi değeri, Öğrenci dağılım tablosunda 0,05 veya 0,01 anlamlılık düzeyinde bulunan tablo değeri ve serbestlik derecesi sayısı n-1 ile karşılaştırılır. T testinin hesaplanan değeri tablo değerinden büyükse korelasyon katsayısı anlamlı kabul edilir.

Eğrisel bir ilişki durumunda, korelasyon ilişkisinin ve regresyon denkleminin önemini değerlendirmek için F testi kullanılır. Aşağıdaki formülle hesaplanır:

veya

burada η korelasyon oranıdır; n – gözlem sayısı; m – regresyon denklemindeki parametre sayısı.

Hesaplanan F değeri, kabul edilen anlamlılık düzeyi α (0,05 veya 0,01) ve serbestlik derecesi sayıları k 1 =m-1 ve k 2 =n-m için tablodaki değerle karşılaştırılır. Hesaplanan F değeri tablodaki değeri aşarsa ilişki anlamlı kabul edilir.

Regresyon katsayısının önemi, aşağıdaki formül kullanılarak hesaplanan Öğrenci t-testi kullanılarak belirlenir:

burada σ 2 ve i regresyon katsayısının varyansıdır.

Aşağıdaki formülle hesaplanır:

burada k, regresyon denklemindeki faktör özelliklerinin sayısıdır.

Regresyon katsayısı t a 1 ≥t cr ise anlamlı kabul edilir. t cr, kabul edilen anlamlılık seviyesindeki Öğrenci dağılımının kritik noktaları ve k=n-1 serbestlik derecesi sayısı tablosunda bulunur.

4.3 Excel'de korelasyon ve regresyon analizi.

1 kental tahıl başına verim ve işçilik maliyetleri arasındaki ilişkinin korelasyon-regresyon analizini yapalım. Bunu yapmak için bir Excel sayfası açın ve faktör karakteristiğinin değerlerini A1:A30 hücrelerine girin. B1:B30 hücrelerinde tahıl mahsullerinin verimi, ortaya çıkan özelliğin değeri, 1 kental tahıl başına işçilik maliyetidir. Araçlar menüsünde Veri Analizi seçeneğini seçin. Bu öğeye sol tıklayarak Regresyon aracını açacağız. Tamam düğmesine tıkladığınızda ekranda Regresyon iletişim kutusu görünür. Giriş aralığı Y alanına, sonuç karakteristiğinin değerlerini girin (B1:B30 hücrelerini vurgulayarak), Giriş aralığı X alanına faktör karakteristiğinin değerlerini girin (A1:A30 hücrelerini vurgulayarak). %95 olasılık düzeyini işaretleyin ve Yeni Çalışma Sayfası'nı seçin. Tamam düğmesine tıklayın. Çalışma sayfasında, regresyon denkleminin parametrelerinin, korelasyon katsayısının ve korelasyon katsayısının ve regresyon denkleminin parametrelerinin önemini belirlemenize olanak tanıyan diğer göstergelerin hesaplanmasının sonuçlarını gösteren "SONUÇLARIN SONUÇLARI" tablosu görünür.

SONUÇLARIN SONUÇLANMASI

Regresyon istatistikleri

Çoğul R

R Meydanı

Normalleştirilmiş R-kare

Standart hata

Gözlemler

Varyans analizi

Önem F

Regresyon

Oranlar

Standart hata

t-istatistiği

P-Değeri

Alt %95

İlk %95

Alt %95,0

İlk %95,0

Y-kavşağı

Değişken X 1

Bu tabloda “Çoklu R” korelasyon katsayısını, “R-kare” ise belirleme katsayısını göstermektedir. “Katsayılar: Y-kesişimi” - regresyon denkleminin serbest terimi 2,836242; “Değişken X1” – regresyon katsayısı -0,06654. Korelasyon katsayısının, regresyon denkleminin parametrelerinin ve denklemin tamamının önemini değerlendirmek için gerekli olan Fisher F testi 74.9876, Öğrenci t testi 14.18042, “Standart hata 0.112121” değerleri de vardır.

Tablodaki verilere dayanarak bir regresyon denklemi oluşturacağız: y x ​​= 2,836-0,067x. Regresyon katsayısı a 1 = -0,067, tahıl verimindeki 1 c/ha artışla, 1 c tahıl başına işçilik maliyetinin 0,067 adam-saat azaldığı anlamına gelir.

Korelasyon katsayısı r=0,85>0,7'dir, dolayısıyla bu popülasyonda incelenen özellikler arasındaki ilişki yakındır. Belirleme katsayısı r2 =0,73, etkili özellikteki varyasyonun (1 kental tahıl başına işçilik maliyeti) %73'ünün faktör özelliğinin (tane verimi) etkisinden kaynaklandığını göstermektedir.

Fisher-Snedecor dağılımının kritik noktaları tablosunda, F testinin kritik değerini 0,05 anlamlılık seviyesinde ve k 1 =m-1=2-1=1 ve k serbestlik derecesi sayısını buluyoruz. 2 =n-m=30-2=28, 4,21'e eşittir. Kriterin hesaplanan değeri tablodaki değerden büyük olduğundan (F=74.9896>4.21) regresyon denklemi anlamlı kabul edilir.

Korelasyon katsayısının önemini değerlendirmek için Öğrenci t-testini hesaplayalım:

İÇİNDE
Öğrenci dağılımının kritik noktaları tablosunda t-testinin kritik değerini 0,05 anlamlılık düzeyinde ve serbestlik derecesi sayısını n-1=30-1=29 olarak 2,0452 olarak buluyoruz. Hesaplanan değer tablo değerinden büyük olduğundan korelasyon katsayısı anlamlıdır.

Regresyon denklemi parametrelerinin öneminin tahmini

Doğrusal regresyon denkleminin parametrelerinin önemi Öğrenci testi kullanılarak değerlendirilir:

Eğer T hesapla > T cr, o zaman ana hipotez kabul edilir ( H o), regresyon parametrelerinin istatistiksel önemini gösteren;

Eğer T hesapla< T cr, o zaman alternatif hipotez kabul edilir ( H 1), regresyon parametrelerinin istatistiksel anlamsızlığını gösterir.

Nerede anne , m b– parametrelerin standart hataları A Ve B:

(2.19)

(2.20)

Kriterin kritik (tablo) değeri, Öğrenci dağılımının istatistiksel tabloları (Ek B) veya tablolar kullanılarak bulunur. excel(“İstatistik” fonksiyon sihirbazının bölümü):

T cr = STUDARİST( a=1-P; k=n-2), (2.21)

Nerede k=n-2 aynı zamanda serbestlik derecesi sayısını da temsil eder .

İstatistiksel anlamlılık değerlendirmesi aynı zamanda doğrusal korelasyon katsayısına da uygulanabilir.

Nerede Bay– korelasyon katsayısının değerlerinin belirlenmesinde standart hata r yx

(2.23)

Aşağıda ikinci bölümün konularıyla ilgili pratik ve laboratuvar çalışmalarına yönelik ödev seçenekleri bulunmaktadır.

2. bölüm için kendi kendine test soruları

1. Ekonometrik modelin ana bileşenlerini ve bunların özünü belirtiniz.

2. Ekonometrik araştırma aşamalarının ana içeriği.

3. Doğrusal regresyon parametrelerinin belirlenmesine yönelik yaklaşımların özü.

4. Regresyon denkleminin parametrelerinin belirlenmesinde en küçük kareler yöntemini kullanmanın özü ve özelliği.

5. İncelenen faktörler arasındaki ilişkinin yakınlığını değerlendirmek için hangi göstergeler kullanılıyor?

6. Doğrusal korelasyon katsayısının özü.

7. Belirleme katsayısının özü.

8. Regresyon modellerinin yeterliliğini (istatistiksel anlamlılık) değerlendirme prosedürlerinin özü ve temel özellikleri.

9. Doğrusal regresyon modellerinin yeterliliğinin yaklaşım katsayısı ile değerlendirilmesi.

10. Fisher kriterini kullanarak regresyon modellerinin yeterliliğini değerlendirme yaklaşımının özü. Ampirik ve kritik kriter değerlerinin belirlenmesi.

11. Ekonometrik araştırmalarla ilgili olarak “varyans analizi” kavramının özü.

12. Doğrusal bir regresyon denkleminin parametrelerinin önemini değerlendirme prosedürünün özü ve ana özellikleri.

13. Doğrusal bir regresyon denkleminin parametrelerinin önemini değerlendirirken Öğrenci dağılımını kullanmanın özellikleri.

14. İncelenen sosyo-ekonomik olgunun tek değerlerini tahmin etme görevi nedir?

1. Bir korelasyon alanı oluşturun ve incelenen faktörlerin ilişkisine ilişkin denklemin biçimine ilişkin bir varsayım formüle edin;

2. En küçük kareler yönteminin temel denklemlerini yazın, gerekli dönüşümleri yapın, ara hesaplamalar için bir tablo çizin ve doğrusal regresyon denkleminin parametrelerini belirleyin;

3. Excel elektronik tablolarının standart prosedürlerini ve işlevlerini kullanarak hesaplamaların doğruluğunu kontrol edin.

4. Sonuçları analiz edin, sonuçları ve önerileri formüle edin.

1. Doğrusal korelasyon katsayısının değerinin hesaplanması;

2. Varyans analizi tablosunun oluşturulması;

3. Belirleme katsayısının tahmini;

4. Standart prosedürleri ve Excel elektronik tablolarının işlevlerini kullanarak hesaplamaların doğruluğunu kontrol edin.

5. Sonuçları analiz edin, sonuçları ve önerileri formüle edin.

4. Seçilen regresyon denkleminin yeterliliğine ilişkin genel bir değerlendirme yapın;

1. Yaklaşım katsayısı değerlerine göre denklemin yeterliliğinin değerlendirilmesi;

2. Belirleme katsayısı değerlerine göre denklemin yeterliliğinin değerlendirilmesi;

3. Denklemin yeterliliğinin Fisher kriteri kullanılarak değerlendirilmesi;

4. Regresyon denkleminin parametrelerinin yeterliliğine ilişkin genel bir değerlendirme yapın;

5. Excel elektronik tablolarının standart prosedürlerini ve işlevlerini kullanarak hesaplamaların doğruluğunu kontrol edin.

6. Sonuçları analiz edin, sonuçları ve önerileri formüle edin.

1. Excel Elektronik Tablo İşlevleri Sihirbazı'nın standart prosedürlerini kullanarak (“Matematiksel” ve “İstatistiksel” bölümlerden);

2. Veri hazırlama ve DOT fonksiyonunun kullanım özellikleri;

3. Veri hazırlama ve “TAHMİN” fonksiyonunu kullanma özellikleri.

1. Excel elektronik tablo veri analizi paketinin standart prosedürlerini kullanmak;

2. Verilerin hazırlanması ve “REGRESYON” prosedürünün uygulanmasının özellikleri;

3. Regresyon analizi tablo verilerinin yorumlanması ve sentezi;

4. Varyans tablosu analizinden elde edilen verilerin yorumlanması ve sentezi;

5. Regresyon denkleminin parametrelerinin önemini değerlendirmek için tablodaki verilerin yorumlanması ve genelleştirilmesi;

Seçeneklerden birine dayalı laboratuvar çalışması yaparken aşağıdaki belirli görevleri tamamlamanız gerekir:

1. İncelenen faktörlerin ilişkisi için denklemin biçimini seçin;

2. Regresyon denkleminin parametrelerini belirleyin;

3. İncelenen faktörlerin yakın ilişkisini değerlendirin;

4. Seçilen regresyon denkleminin yeterliliğini değerlendirin;

5. Regresyon denkleminin parametrelerinin istatistiksel anlamlılığını değerlendirin.

6. Excel elektronik tablolarının standart prosedürlerini ve işlevlerini kullanarak hesaplamaların doğruluğunu kontrol edin.

7. Sonuçları analiz edin, sonuçları ve önerileri formüle edin.

“Ekonometrik araştırmalarda eşleştirilmiş doğrusal regresyon ve korelasyon” konulu pratik ve laboratuvar çalışmaları için ödevler.

seçenek 1 seçenek 2 Seçenek 3 Seçenek 4 Seçenek 5
X sen X sen X sen X sen X sen
Seçenek 6 Seçenek 7 Seçenek 8 Seçenek 9 Seçenek 10
X sen X sen X sen X sen X sen

Her bir regresyon katsayısının bireysel istatistiksel önemi değerlendirildikten sonra, katsayıların toplam önemi genellikle analiz edilir; bir bütün olarak denklemin tamamı. Bu analiz, açıklayıcı değişkenler için tüm regresyon katsayılarının eş zamanlı sıfıra eşitliği hakkındaki hipotezin genel önemi hakkındaki hipotezin test edilmesi temelinde gerçekleştirilir:

H 0: b 1 = b 2 = ... = b m = 0.

Bu hipotez reddedilmezse, modelin tüm m açıklayıcı değişkenleri X 1, X 2, ..., X m'nin bağımlı değişken Y üzerindeki toplam etkisinin istatistiksel olarak anlamsız kabul edilebileceği ve genel kalitenin olduğu sonucuna varılır. Regresyon denkleminin düşük olduğu düşünülebilir.

Bu hipotez, açıklanan ve kalan varyansı karşılaştıran varyans analizi temelinde test edilir.

H 0: (açıklanan varyans) = (kalan varyans),

H 1: (açıklanan varyans) > (kalan varyans).

F istatistikleri oluşturulmuştur:

Nerede – regresyonla açıklanan varyans;

– artık dağılım (sapmaların karelerinin toplamının serbestlik derecesi sayısına bölümü n-m-1). OLS varsayımları karşılandığında, oluşturulan F istatistiği, n1 = m, n2 = n–m–1 serbestlik derecesine sahip bir Fisher dağılımına sahiptir. Bu nedenle, eğer gerekli anlamlılık seviyesinde bir F gözlemleniyorsa > Fa; M; n - m -1 = Fa (burada Fa ; m ; n - m -1, Fisher dağılımının kritik noktasıdır), bu durumda H 0, H 1 lehine reddedilir. Bu, regresyonla açıklanan varyansın artık varyanstan önemli ölçüde daha büyük olduğu anlamına gelir ve bu nedenle regresyon denklemi, bağımlı değişken Y'deki değişim dinamiklerini oldukça niteliksel olarak yansıtır. Eğer F gözlemlenirse< F a ; m ; n - m -1 = F кр. , то нет основания для отклонения Н 0 . Значит, объясненная дисперсия соизмерима с дисперсией, вызванной случайными факторами. Это дает основание считать, что совокупное влияние объясняющих переменных модели несущественно, а следовательно, общее качество модели невысоко.

Bununla birlikte, pratikte, bu hipotez yerine, R2 belirleme katsayısının istatistiksel önemi hakkında yakından ilişkili bir hipotez daha sık test edilir:



H 0: R 2 > 0.

Bu hipotezi test etmek için aşağıdaki F istatistiği kullanılır:

. (8.20)

OLS varsayımları karşılanırsa ve H 0 doğruysa F değeri, F istatistiğinin (8.19) dağılımına benzer bir Fisher dağılımına sahiptir. Aslında, (8.19)'daki kesrin pay ve paydasının toplam sapmaların kareleri toplamına bölünmesi ve regresyonla açıklanan sapmaların karelerinin toplamına ve sapmaların karelerinin kalan toplamına bölündüğünü bilmek (bu, daha sonra gösterileceği gibi, normal denklemler sisteminin bir sonucudur)

,

(8.20) formülünü elde ederiz:

(8.20)'den F ve R2 üslerinin aynı anda sıfıra eşit veya eşit olmadığı açıktır. Eğer F = 0 ise R 2 = 0 olur ve regresyon doğrusu Y = en küçük karelere göre en iyisidir ve dolayısıyla Y'nin değeri X 1, X 2, ..., X m'ye doğrusal olarak bağlı değildir. . H 0 sıfır hipotezini test etmek için: Belirli bir anlamlılık seviyesi a'da F = 0, Fisher dağılımının kritik noktaları tablolarından F cr = Fa kritik değeri bulunur; M; n - m -1 . F > F cr ise sıfır hipotezi reddedilir. Bu, R 2 > 0 olduğu gerçeğine eşdeğerdir, yani. R2 istatistiksel olarak anlamlıdır.

F istatistiklerinin analizi, tüm doğrusal regresyon katsayılarının aynı anda sıfıra eşit olduğu hipotezini kabul etmek için R2 belirleme katsayısının sıfırdan önemli ölçüde farklı olmaması gerektiği sonucuna varmamızı sağlar. Gözlem sayısı arttıkça kritik değeri azalır ve keyfi olarak küçülebilir.

Örneğin, 30 gözlem için iki açıklayıcı değişken X 1 i, X 2 i ile bir regresyonu tahmin ederken, R 2 = 0,65 olsun. Daha sonra

F obs = 25,07.

Fisher dağılımının kritik noktalarına ilişkin tabloları kullanarak F 0,05'i buluruz; 2; 27 = 3,36; F0.01; 2; 27 = 5,49. Hem %5 hem de %1 anlamlılık seviyesinde gözlenen F = 25.07 > F cr olduğundan, sıfır hipotezi her iki durumda da reddedilir.

Aynı durumda R 2 = 0,4 ise, o zaman

F obs = = 9.

İlişkinin önemsiz olduğu varsayımı burada da reddedilmektedir.

İkili regresyon durumunda, F istatistiği için sıfır hipotezinin test edilmesinin, t istatistiği için sıfır hipotezinin test edilmesine eşdeğer olduğuna dikkat edin.

korelasyon katsayısı. Bu durumda F istatistiği t istatistiğinin karesine eşittir. Çoklu doğrusal regresyon durumunda R2 katsayısı bağımsız bir önem kazanır.

8.6. Toplam karesel sapmaların toplamını ayrıştırmak için varyans analizi. Karşılık gelen kare sapmaların toplamları için serbestlik dereceleri

Yukarıda özetlenen teoriyi ikili doğrusal regresyon için uygulayalım.

Doğrusal regresyon denklemi bulunduktan sonra hem denklemin bir bütün olarak hem de bireysel parametrelerinin önemi değerlendirilir.

Regresyon denkleminin bir bütün olarak önemi Fisher F testi kullanılarak değerlendirilir. Bu durumda regresyon katsayısının sıfıra eşit olduğu yönünde sıfır hipotezi ileri sürülmektedir; b = 0 ve bu nedenle x faktörünün y sonucu üzerinde hiçbir etkisi yoktur.

F testinin doğrudan hesaplanmasından önce varyans analizi yapılır. Buradaki merkezi yer, y değişkeninin ortalama değerden karesel sapmalarının toplam toplamının iki kısma - “açıklanmış” ve “açıklanmamış” ayrıştırılmasıyla işgal edilmiştir:

Denklem (8.21), önceki konulardan birinde türetilmiş normal denklemler sisteminin bir sonucudur.

İfade kanıtı (8.21).

Geriye son terimin sıfıra eşit olduğunu kanıtlamak kalıyor.

1'den n'ye kadar tüm denklemleri toplarsanız

y ben = a+b×x i +e ben , (8.22)

o zaman åy i = a×å1+b×åx i +åe i elde ederiz. åe i =0 ve å1 =n olduğundan, şunu elde ederiz:

Daha sonra .

Denklemi (8.23) ifadeden (8.22) çıkarırsak, şunu elde ederiz:

Sonuç olarak elde ederiz

İki normal denklem sistemi nedeniyle son toplamlar sıfıra eşittir.

Etkin karakteristik y'nin bireysel değerlerinin ortalama değerden kare sapmalarının toplam toplamı birçok nedenin etkisinden kaynaklanmaktadır. Tüm nedenler kümesini koşullu olarak iki gruba ayıralım: çalışılan faktör x ve diğer faktörler. Faktörün sonuç üzerinde herhangi bir etkisi yoksa regresyon çizgisi OX'a ve eksene paraleldir. Bu durumda, ortaya çıkan özelliğin tüm varyansı diğer faktörlerin etkisinden kaynaklanmaktadır ve sapmaların toplam karesi toplamı artık ile çakışacaktır. Eğer diğer faktörler sonucu etkilemiyorsa, o zaman y fonksiyonel olarak x ile ilişkilidir ve kalan kareler toplamı sıfırdır. Bu durumda regresyonun açıkladığı sapmaların kareleri toplamı, toplam kareler toplamı ile örtüşmektedir.

Korelasyon alanının tüm noktaları regresyon çizgisi üzerinde bulunmadığından, bunların saçılımı her zaman x faktörünün etkisiyle meydana gelir; y'nin x üzerinde gerilemesi ve diğer nedenlerden kaynaklanması (açıklanamayan varyasyon). Bir regresyon çizgisinin tahmin için uygunluğu, y özelliğindeki toplam varyasyonun ne kadarının açıklanan varyasyon tarafından açıklandığına bağlıdır. Açıkçası, eğer regresyondan kaynaklanan sapmaların kareleri toplamı kalan kareler toplamından büyükse, bu durumda regresyon denklemi istatistiksel olarak anlamlıdır ve x faktörünün y karakteristiği üzerinde önemli bir etkisi vardır. Bu, belirleme katsayısının birliğe yaklaşması gerçeğine eşdeğerdir.

Herhangi bir kareler toplamı, serbestlik derecesi sayısı (df – serbestlik derecesi) ve bir özelliğin bağımsız varyasyonunun serbestlik sayısı ile ilişkilidir. Serbestlik derecesinin sayısı, n popülasyonunun birim sayısı ve bundan belirlenen sabitlerin sayısı ile ilgilidir. İncelenmekte olan problemle ilgili olarak, serbestlik derecesi sayısı, belirli bir kareler toplamını oluşturmak için n olası sapmadan kaç tane bağımsız sapmanın gerekli olduğunu göstermelidir. Bu nedenle, toplam kareler toplamı için (n-1) bağımsız sapma gereklidir, çünkü n birimlik bir kümede ortalama hesaplandıktan sonra yalnızca (n-1) sapma sayısı serbestçe değişir. Örneğin, bir dizi y değerimiz var: 1,2,3,4,5. Bunların ortalaması 3'tür ve ortalamadan n sapma şu şekilde olacaktır: -2, -1, 0, 1, 2. O zamandan beri, yalnızca dört sapma serbestçe değişir ve beşinci sapma, önceki dört sapma belirlenebilirse belirlenebilir. bilinen.

Açıklanan veya faktör karelerinin toplamını hesaplarken ortaya çıkan özelliğin teorik (hesaplanan) değerleri kullanılır

Bu durumda doğrusal regresyondan kaynaklanan sapmaların karelerinin toplamı şuna eşittir:

x ve y'deki belirli bir gözlem hacmi için, doğrusal regresyondaki karelerin faktör toplamı yalnızca regresyon sabiti b'ye bağlı olduğundan, bu kareler toplamı yalnızca bir serbestlik derecesine sahiptir.

Toplamın serbestlik derecesi sayısı, faktör ve sapmaların kareleri toplamı arasında eşitlik vardır. Doğrusal regresyonda artık kareler toplamının serbestlik derecesi sayısı n-2'dir. Toplam kareler toplamının serbestlik derecesi sayısı, değişken karakteristiklerin birim sayısına göre belirlenir ve örnek verilerden hesaplanan ortalamayı kullandığımız için bir serbestlik derecesini kaybederiz, yani. toplam df = n–1.

Yani iki eşitliğimiz var:

Her kareler toplamını karşılık gelen serbestlik derecesine bölerek sapmaların ortalama karesini veya aynı şey olan bir D serbestlik derecesi başına dağılımını elde ederiz.

;

;

.

Varyansın bir serbestlik derecesi ile tanımlanması, varyansları karşılaştırılabilir bir forma getirir. Serbestlik derecesi başına faktör ve artık varyansları karşılaştırarak Fisher F testinin değerini elde ederiz.

burada sıfır hipotezini test etmek için F kriteri H 0: D olgusu = D dinlenme.

Sıfır hipotezi doğruysa faktör ve artık varyanslar birbirinden farklı değildir. H 0 için, faktör dağılımının artık dağılımını birkaç kez aşması için bir çürütme gereklidir. İngiliz istatistikçi Snedecor, sıfır hipotezinin çeşitli önem seviyelerinde ve çeşitli serbestlik derecelerinde F oranlarının kritik değerlerinin tablolarını geliştirdi. F testinin tablolaştırılmış değeri, sıfır hipotezinin belirli bir olasılık düzeyi için rastgele sapması durumunda meydana gelebilecek varyans oranının maksimum değeridir. Hesaplanan F oranı değeri, tablodaki değerden büyükse güvenilir kabul edilir. F olgusu > F tablosu ise, o zaman özellikler arasında bir bağlantının olmadığı yönündeki H 0: D olgusu = D sıfır hipotezi reddedilir ve bu bağlantının önemi hakkında bir sonuca varılır.

Eğer F bir gerçekse< F табл, то вероятность нулевой гипотезы H 0: D факт = D ост выше заданного уровня (например, 0,05) и она не может быть отклонена без серьёзного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым. Гипотеза H 0 не отклоняется.

Bölüm 3'teki bu örnekte:

= 131200 -7*144002 = 30400 – toplam kareler toplamı;

1057,878*(135,43-7*(3,92571) 2) = 28979,8 – karelerin çarpan toplamı;

=30400-28979,8 = 1420,197 – kalan kareler toplamı;

D gerçeği = 28979,8;

D geri kalan = 1420,197/(n-2) = 284,0394;

F gerçeği =28979,8/284,0394 = 102,0274;

Fa =0,05; 2; 5 =6,61; Fa =0,01; 2; 5 = 16,26.

F olgusu > F tablosu hem %1 hem de %5 anlamlılık düzeyinde olduğundan, regresyon denkleminin anlamlı olduğu sonucuna varabiliriz (ilişki kanıtlanmıştır).

F testinin değeri belirleme katsayısı ile ilgilidir. Karesel sapmaların faktör toplamı şu şekilde temsil edilebilir:

,

ve kalan kareler toplamı şu şekilde

.

Daha sonra F testinin değeri şu şekilde ifade edilebilir:

.

Regresyon anlamlılık değerlendirmesi genellikle varyans analizi tablosu şeklinde verilir.

, değeri belirli bir α anlamlılık seviyesindeki tablo değeri ve serbestlik derecesi sayısı (n-2) ile karşılaştırılır.
Varyasyon Kaynakları Serbestlik derecesi sayısı Karesel sapmaların toplamı Serbestlik derecesi başına dağılım F oranı
gerçek a=0,05'te tablo halinde
Genel
Açıklandı 28979,8 28979,8 102,0274 6,61
Artık 1420,197 284,0394

Regresyon denklemi oluşturulduktan ve doğruluğu belirleme katsayısı kullanılarak değerlendirildikten sonra, bu doğruluğun nasıl elde edildiği ve dolayısıyla bu denkleme güvenilip güvenilemeyeceği sorusu açık kalır. Gerçek şu ki, regresyon denklemi bilinmeyen genel nüfusa göre değil, ondan alınan bir örnek üzerine inşa edilmiştir. Genel popülasyondan alınan noktalar numuneye rastgele düşer, bu nedenle olasılık teorisine uygun olarak, diğer durumların yanı sıra, "geniş" bir genel popülasyondan alınan numunenin "dar" olması mümkündür (Şekil 15). .

Pirinç. 15. Genel popülasyondan örnekleme dahil edilecek puanlara ilişkin olası seçenek.

Bu durumda:

a) örneklem kullanılarak oluşturulan regresyon denklemi, genel nüfusa yönelik regresyon denkleminden önemli ölçüde farklı olabilir ve bu da tahmin hatalarına yol açabilir;

b) Belirleme katsayısı ve diğer doğruluk özellikleri makul olmayan derecede yüksek olacak ve denklemin tahmin nitelikleri konusunda yanıltıcı olacaktır.

Sınırlayıcı durumda, ana ekseni yatay eksene paralel olan bir bulut olan genel popülasyondan (değişkenler arasında herhangi bir ilişki yoktur), rastgele seçim nedeniyle bir örnek elde edileceğinde seçenek hariç tutulamaz, ana ekseni eksene eğimli olacaktır. Bu nedenle, genel popülasyonun bir sonraki değerlerini, ondan alınan bir örnekten elde edilen verilere dayanarak tahmin etme girişimleri, yalnızca bağımlı ve bağımsız değişkenler arasındaki ilişkinin gücünü ve yönünü değerlendirmedeki hatalarla değil, aynı zamanda tehlikeyle de doludur. değişkenler arasında gerçekte olmayan bir bağlantı bulmak.

Popülasyondaki tüm noktalar hakkında bilgi bulunmadığında, ilk durumda hataları azaltmanın tek yolu, regresyon denkleminin katsayılarını tahmin etmede bunların tarafsız ve etkin olmasını sağlayan bir yöntem kullanmaktır. Ve ikinci vakanın ortaya çıkma olasılığı, genel popülasyonun birbirinden bağımsız iki değişkenli bir özelliğinin önceden bilinmesi nedeniyle önemli ölçüde azaltılabilir - içinde eksik olan tam da bu bağlantıdır. Bu azalma, elde edilen regresyon denkleminin istatistiksel anlamlılığının kontrol edilmesiyle elde edilir.

En sık kullanılan doğrulama seçeneklerinden biri aşağıdaki gibidir. Ortaya çıkan regresyon denklemi için, bir -istatistik belirlenir - regresyon denkleminin doğruluğunun bir özelliği; bu, bağımlı değişkenin varyansının regresyon denklemi tarafından açıklanan kısmının açıklanmayan (artık) kısma oranıdır. varyansın. Çok değişkenli regresyon durumunda -istatistikleri belirleme denklemi şu şekildedir:

burada: - açıklanan varyans - bağımlı değişken Y'nin regresyon denklemiyle açıklanan varyansının bir kısmı;

Artık varyans, bağımlı değişken Y'nin varyansının regresyon denklemiyle açıklanmayan kısmıdır; varlığı, rastgele bileşenin eyleminin bir sonucudur;

Örnekteki nokta sayısı;

Regresyon denklemindeki değişken sayısı.

Yukarıdaki formülden de görülebileceği gibi varyanslar, karşılık gelen kareler toplamının serbestlik derecesi sayısına bölünmesiyle elde edilir. Serbestlik derecesi sayısı, bağımlı değişkenin, numunenin istenen özelliğini elde etmek için yeterli olan ve serbestçe değişebilen, bu numune için diğer tüm değerlerin dikkate alındığı minimum gerekli değer sayısıdır. İstenilen özelliği hesaplamak için kullanılanlar bilinmektedir.

Artık varyansı elde etmek için regresyon denkleminin katsayılarına ihtiyaç vardır. Eşleştirilmiş doğrusal regresyon durumunda iki katsayı vardır, bu nedenle formüle göre ( alınarak) serbestlik derecesi sayısı eşittir. Bu, artık varyansı belirlemek için regresyon denkleminin katsayılarını ve yalnızca örnekteki bağımlı değişkenin değerlerini bilmenin yeterli olduğu anlamına gelir. Kalan iki değer bu verilere dayanarak hesaplanabilir ve bu nedenle serbestçe değişken değildir.

Bağımlı değişkenin değerlerinin açıklanan varyansını hesaplamak için kesinlikle gerekli değildir, çünkü bağımsız değişkenlere ait regresyon katsayıları ve bağımsız değişkenin varyansı bilinerek hesaplanabilir. Bunu doğrulamak için daha önce verilen ifadeyi hatırlamak yeterlidir. . Bu nedenle, artık varyansın serbestlik derecesi sayısı, regresyon denklemindeki (eşleştirilmiş doğrusal regresyon için) bağımsız değişkenlerin sayısına eşittir.

Sonuç olarak, eşleştirilmiş doğrusal regresyon denkleminin -kriteri aşağıdaki formülle belirlenir:

.

Olasılık teorisinde, bağımlı ve bağımsız değişkenler arasında herhangi bir ilişkinin bulunmadığı genel popülasyondan alınan bir örneklem için elde edilen bir regresyon denkleminin -ölçütünün oldukça iyi çalışılmış olan Fisher dağılımına sahip olduğu kanıtlanmıştır. Bu sayede -kriterinin herhangi bir değeri için, oluşma olasılığını hesaplamak ve bunun tersine -kriterinin belirli bir olasılıkla aşamayacağı değeri belirlemek mümkündür.

Regresyon denkleminin anlamlılığını istatistiksel olarak test etmek için, değişkenler arasında bir ilişkinin bulunmadığına dair bir sıfır hipotezi formüle edilir (değişkenler için tüm katsayılar sıfıra eşittir) ve anlamlılık düzeyi seçilir.

Anlamlılık düzeyi, test sonucunda doğru sıfır hipotezinin reddedilmesi anlamına gelen I. tip hata yapmanın kabul edilebilir olasılığıdır. Bu durumda, tip I hata yapmak, bir örneklemde, popülasyondaki değişkenler arasında gerçekte böyle bir ilişki olmadığı halde bir ilişki olduğunu fark etmek anlamına gelir.

Tipik olarak anlamlılık düzeyi %5 veya %1 olarak alınır. Anlamlılık düzeyi ne kadar yüksek olursa (ne kadar az olursa), testin güvenirlik düzeyi de o kadar yüksek olur; Örnekte genel popülasyonda aslında ilgisiz değişkenlerin bir bağlantısının varlığını fark etme hatasından kaçınma şansı o kadar artar. Ancak anlamlılık düzeyi arttıkça ikinci tür bir hata yapma tehlikesi de artar; doğru sıfır hipotezini reddetmek, yani. Örneklemde genel popülasyondaki değişkenler arasındaki gerçek bağlantıyı fark etmemek. Bu nedenle, hangi hatanın büyük olumsuz sonuçlara sahip olduğuna bağlı olarak, şu veya bu önem düzeyi seçilir.

Seçilen anlamlılık düzeyi için Fisher dağılımı, değişkenler arasında ilişki olmayan genel popülasyondan elde edilen güç örnekleminde anlamlılık düzeyini aşmayan aşma olasılığının tablo değerini belirler. regresyon denkleminin gerçek kriter değeri ile karşılaştırılır.

Koşul karşılanırsa, ilgisiz değişkenlere sahip genel bir popülasyondan alınan bir örneklemde -kriter değerine eşit veya daha büyük bir bağlantının hatalı tespiti, anlamlılık seviyesinden daha düşük bir olasılıkla meydana gelecektir. “Çok nadir olaylar yoktur” kuralı uyarınca örneklemde kurulan değişkenler arasındaki ilişkinin, elde edildiği genel popülasyonda da mevcut olduğu sonucuna varıyoruz.

Eğer olduğu ortaya çıkarsa, regresyon denklemi istatistiksel olarak anlamlı değildir. Başka bir deyişle, örneklemin değişkenler arasında gerçekte var olmayan bir ilişki kurması ihtimali gerçektir. İstatistiksel anlamlılık testini geçemeyen bir denklem, son kullanma tarihi geçmiş bir ilaçla aynı şekilde ele alınır.

Ti - bu tür ilaçlar mutlaka bozulmaz, ancak kalitelerine güven olmadığından kullanılmamayı tercih ederler. Bu kural tüm hatalara karşı koruma sağlamaz ancak en ciddi hatalardan kaçınmanıza olanak tanır ki bu da oldukça önemlidir.

Elektronik tabloları kullanırken daha uygun olan ikinci doğrulama seçeneği, ortaya çıkan kriter değerinin oluşma olasılığını anlamlılık düzeyiyle karşılaştırmaktır. Bu olasılık anlamlılık seviyesinin altındaysa denklem istatistiksel olarak anlamlıdır, aksi durumda değildir.

Regresyon denkleminin istatistiksel anlamlılığı bir bütün olarak kontrol edildikten sonra, özellikle çok değişkenli bağımlılıklar için, elde edilen regresyon katsayılarının istatistiksel anlamlılığının kontrol edilmesi genellikle faydalıdır. Doğrulama ideolojisi, denklemin bir bütün olarak kontrol edilmesiyle aynıdır, ancak aşağıdaki formüllerle belirlenen bir kriter olarak Öğrenci t testi kullanılır:

Ve

burada: , - Öğrencinin katsayılar için kriterinin değerleri ve sırasıyla;

- regresyon denkleminin artık varyansı;

Örnekteki nokta sayısı;

İkili doğrusal regresyon için örnekteki değişken sayısı.

Öğrenci testinin elde edilen gerçek değerleri tablo değerleriyle karşılaştırılır. , Öğrenci dağılımından elde edilmiştir. Eğer öyle çıkarsa, karşılık gelen katsayı istatistiksel olarak anlamlıdır, aksi takdirde anlamlı değildir. Katsayıların istatistiksel anlamlılığını kontrol etmenin ikinci seçeneği, Öğrenci testinin ortaya çıkma olasılığını belirlemek ve bunu anlamlılık düzeyiyle karşılaştırmaktır.

Katsayıları istatistiksel olarak anlamsız çıkan değişkenler için, bunların popülasyondaki bağımlı değişken üzerindeki etkisinin tamamen yok olma ihtimali yüksektir. Bu nedenle ya örneklemdeki puan sayısını arttırmak gerekir, o zaman belki katsayı istatistiksel olarak anlamlı hale gelir ve aynı zamanda değeri de netleşir, ya da bağımlı değişkenle daha yakından ilişkili bağımsız değişkenler olarak başkalarını bulmak gerekir. değişken. Bu durumda her iki durumda da tahmin doğruluğu artacaktır.

Regresyon denklemi katsayılarının önemini değerlendirmek için açık bir yöntem olarak aşağıdaki kural kullanılabilir: Öğrenci t testi 3'ten büyükse, o zaman böyle bir katsayının kural olarak istatistiksel olarak anlamlı olduğu ortaya çıkar. Genel olarak istatistiksel olarak anlamlı regresyon denklemlerinin elde edilebilmesi için koşulun sağlanması gerektiğine inanılmaktadır.

Bilinmeyen bir değer ile bilinen bir değerin elde edilen regresyon denkleminden elde edilen standart tahmin hatası, aşağıdaki formül kullanılarak tahmin edilir:

Böylece %68 güven olasılığına sahip bir tahmin şu şekilde sunulabilir:

Farklı bir güven düzeyi gerekiyorsa, o zaman anlamlılık düzeyi için Öğrenci kriterini bulmak gerekir ve güvenilirlik düzeyine sahip tahmin için güven aralığı şuna eşit olacaktır: .

Çok boyutlu ve doğrusal olmayan bağımlılıkların tahmini

Tahmin edilen değer birkaç bağımsız değişkene bağlıysa, bu durumda formun çok değişkenli bir regresyonu vardır:

burada: - değişkenlerin tahmin edilen değer üzerindeki etkisini açıklayan regresyon katsayıları.

Regresyon katsayılarını belirleme metodolojisi, özellikle elektronik tablo kullanıldığında ikili doğrusal regresyondan farklı değildir çünkü hem ikili hem de çok değişkenli doğrusal regresyon için aynı işlevi kullanır. Bu durumda bağımsız değişkenler arasında herhangi bir ilişkinin olmaması arzu edilir. bir değişkenin değiştirilmesi diğer değişkenlerin değerlerini etkilemedi. Ancak bu gereklilik zorunlu değildir; değişkenler arasında işlevsel doğrusal bağımlılıkların olmaması önemlidir. Ortaya çıkan regresyon denkleminin ve bireysel katsayılarının istatistiksel öneminin kontrol edilmesi için yukarıda açıklanan prosedürler, tahmin doğruluğunun değerlendirilmesi, ikili doğrusal regresyon durumundakiyle aynı kalır. Aynı zamanda, ikili regresyonlar yerine çok değişkenli regresyonların kullanılması, genellikle değişkenlerin doğru seçilmesiyle, bağımlı değişkenin davranışını tanımlamanın doğruluğunu ve dolayısıyla tahminin doğruluğunu önemli ölçüde artırmaya olanak tanır.

Ayrıca çok değişkenli doğrusal regresyon denklemleri, tahmin edilen değerin bağımsız değişkenlere doğrusal olmayan bağımlılığını tanımlamayı mümkün kılar. Doğrusal olmayan bir denklemi doğrusal bir forma indirme işlemine doğrusallaştırma denir. Özellikle, eğer bu bağımlılık 1'den farklı dereceli bir polinomla tanımlanırsa, birden farklı dereceli değişkenleri birinci dereceden yeni değişkenlerle değiştirerek, doğrusal olmayan bir regresyon problemi yerine çok değişkenli bir doğrusal regresyon problemi elde ederiz. Yani, örneğin, bağımsız bir değişkenin etkisi şu formdaki bir parabol ile tanımlanırsa

daha sonra değiştirme, doğrusal olmayan problemi şu şekilde çok boyutlu doğrusal bir soruna dönüştürmemize olanak tanır:

Tahmin edilen değerin bağımsız değişkenlerin çarpımına bağlı olması nedeniyle doğrusal olmamanın ortaya çıktığı doğrusal olmayan problemler de kolaylıkla dönüştürülebilir. Böyle bir etkiyi hesaba katmak için bu çarpıma eşit yeni bir değişkenin tanıtılması gerekir.

Doğrusal olmamanın daha karmaşık bağımlılıklarla tanımlandığı durumlarda koordinat dönüşümü nedeniyle doğrusallaştırma mümkündür. Bu amaçla değerler hesaplanır ve dönüştürülmüş değişkenlerin çeşitli kombinasyonlarındaki başlangıç ​​noktalarının bağımlılığının grafikleri oluşturulur. Bağımlılığın düz bir çizgiye en yakın olduğu dönüştürülmüş koordinatların veya dönüştürülmüş ve dönüştürülmemiş koordinatların bu kombinasyonu, doğrusal olmayan bir bağımlılığın doğrusal bir forma dönüştürülmesine yol açacak değişkenlerin değişmesine yol açar. Örneğin formun doğrusal olmayan bağımlılığı

doğrusal bir forma dönüşür

Dönüştürülen denklem için elde edilen regresyon katsayıları tarafsız ve etkili kalır ancak denklem ve katsayıların istatistiksel anlamlılığının test edilmesi mümkün değildir

En küçük kareler yöntemini kullanmanın geçerliliğinin kontrol edilmesi

En küçük kareler yönteminin kullanılması, aşağıdaki koşullara (Gauss-Markov koşulları) bağlı olarak regresyon denkleminin katsayılarının verimliliğini ve tarafsız tahminlerini sağlar:

3. değerler birbirine bağlı değildir

4. değerler bağımsız değişkenlere bağlı değildir

Bu koşulların karşılanıp karşılanmadığını kontrol etmenin en kolay yolu, artıkları önce bir fonksiyon olarak, sonra da bağımsız değişken(ler)in bir fonksiyonu olarak çizmektir. Bu grafiklerdeki noktalar x eksenine simetrik olarak yerleştirilmiş bir koridorda yer alıyorsa ve noktaların konumunda herhangi bir desen görünmüyorsa Gauss-Markov koşulları karşılanıyor demektir ve regresyonun doğruluğunu iyileştirme fırsatı yoktur. denklem. Durum böyle değilse, denklemin doğruluğunu önemli ölçüde artırmak mümkündür ve bunun için özel literatüre başvurmak gerekir.

Doğrusal regresyon denklemi bulunduktan sonra hem denklemin bir bütün olarak hem de bireysel parametrelerinin önemi değerlendirilir.

Regresyon denkleminin bir bütün olarak önemi Fisher's F testi kullanılarak değerlendirilir. Bu durumda sıfır hipotezi ileri sürülür, regresyon katsayısı sıfıra eşit olur yani b=0 olur ve dolayısıyla x faktörü y sonucunu etkilemez. F testinin hemen hesaplanmasından önce varyans analizi yapılır. Buradaki merkezi yer, y değişkeninin ortalama y değerinden sapmalarının kare toplamının iki parçaya - “açıklanmış” ve “açıklanmamış” (Ek 2) ayrıştırılmasıyla işgal edilmiştir.

Ortaya çıkan karakteristik y'nin bireysel değerlerinin ortalama y değerinden karesel sapmalarının toplam toplamı birçok nedenin etkisinden kaynaklanmaktadır. Geleneksel olarak, nedenlerin tamamı iki gruba ayrılabilir:

  • · çalışılan faktör x
  • · diğer faktörler

Faktör sonucu etkilemiyorsa grafikteki regresyon çizgisi xy ekseni y = y'ye paraleldir. Bu durumda, ortaya çıkan özelliğin tüm varyansı, diğer faktörlerin etkisinden kaynaklanmaktadır ve sapmaların karelerinin toplamı, artık ile örtüşmektedir. Eğer diğer faktörler sonucu etkilemiyorsa, o zaman y fonksiyonel olarak x ile ilişkilidir ve kalan kareler toplamı sıfırdır. Bu durumda regresyonun açıkladığı sapmaların kareleri toplamı, toplam kareler toplamına eşittir.

Korelasyon alanının tüm noktaları regresyon çizgisi üzerinde bulunmadığından, hem x faktörünün etkisinden, yani y'nin x üzerindeki regresyonundan hem de diğer niceliklerin etkisinden (açıklanamayan değişim) dolayı bunların saçılımı her zaman meydana gelir. Bir regresyon çizgisinin tahmin için uygunluğu, y özelliğindeki toplam varyasyonun ne kadarının açıklanan varyasyon tarafından açıklandığına bağlıdır. Açıkçası, regresyondan kaynaklanan sapmaların kareleri toplamı kalan kareler toplamından büyükse, bu durumda regresyon denklemi istatistiksel olarak anlamlıdır ve x faktörünün y sonucu üzerinde önemli bir etkisi vardır. Bu, r 2 xy belirleme katsayısının birliğe yaklaşacağı gerçeğine eşdeğerdir.

Herhangi bir kare sapma toplamı, serbestlik derecesi sayısıyla (df - serbestlik derecesi), yani bir özelliğin bağımsız varyasyonunun serbestlik sayısıyla ilişkilidir. Serbestlik derecesinin sayısı, n popülasyonunun birim sayısı ve bundan belirlenen sabitlerin sayısı ile ilgilidir. İncelenmekte olan problemle ilgili olarak, serbestlik derecesi sayısı, n olası [(y 1 -y), (y 2 -y),...,(y n -y)] üzerinden kaç bağımsız sapmanın olduğunu göstermelidir. Belirli bir kareler toplamını oluşturmak için gereklidir. Bu nedenle toplam kareler toplamı için?(y-y) 2, (n-1) bağımsız sapmalar gereklidir.

Karelerin açıklanan veya faktör toplamını hesaplarken?(y x -y) 2, regresyon çizgisi boyunca bulunan y x karakteristiğinin teorik (hesaplanan) değerleri kullanılır: y x ​​=a+b*x.

Doğrusal regresyonda, doğrusal regresyondan kaynaklanan sapmaların karelerinin toplamı şöyle olacaktır: ?(y x -y) 2 =b 2 *?(x -x) 2.

x ve y'deki belirli bir gözlem hacmi için, doğrusal regresyondaki karelerin faktör toplamı, regresyon katsayısı b'nin yalnızca bir sabitine bağlı olduğundan, bu kareler toplamı bir serbestlik derecesine sahiptir. Y özelliğinin yani y x'in hesaplanan değerinin içerik tarafını düşünürsek aynı sonuca varırız. y x değeri doğrusal regresyon denklemiyle belirlenir: y x ​​=a+b*x. a parametresi şu şekilde tanımlanabilir: a=y-b*x. A parametresinin ifadesini doğrusal modelde değiştirerek şunu elde ederiz:

y x = y-b*x+b*x= y-b*(x-x).

Bu, belirli bir y ve x değişkenleri kümesi için doğrusal regresyonda hesaplanan yx değerinin yalnızca bir parametrenin, yani regresyon katsayısının bir fonksiyonu olduğunu gösterir. Buna göre sapmaların karelerinin faktör toplamı 1'e eşit bir serbestlik derecesine sahiptir.

Toplam, faktör ve kalan kareler toplamlarının serbestlik derecesi sayısı arasında eşitlik vardır. Doğrusal regresyonda artık kareler toplamının serbestlik derecesi sayısı n-2'dir. Toplam kareler toplamı için serbestlik derecesi sayısı birim sayısına göre belirlenir ve örnek verilerden hesaplanan ortalama kullanıldığından bir serbestlik derecesini kaybederiz yani df toplam = n-1.

Yani iki eşitlik vardır:

?(y-y) 2 =?(y x -y) 2 +?(y-y x) 2,

Her kareler toplamını karşılık gelen serbestlik derecesine bölerek sapmaların ortalama karesini veya aynı şey olan bir D serbestlik derecesi başına dağılımını elde ederiz.

D toplam =?(y-y) 2 /(n-1);

D olgusu =?(y x -y) 2 /1;

D kalan =?(y- y x) 2 /(n-1).

Varyansın bir serbestlik derecesi ile tanımlanması, varyansları karşılaştırılabilir bir forma getirir. Serbestlik derecesi başına faktör ve artık varyansları karşılaştırarak F oranının değerini (F kriteri) elde ederiz:

F= D gerçeği / D dinlenme, burada

F - sıfır hipotezini test etme kriteri H 0: D olgusu = D dinlenme.

Sıfır hipotezi doğruysa faktör ve artık varyanslar birbirinden farklı değildir. H 0 için, faktör dağılımının artık dağılımını birkaç kez aşması için bir çürütme gereklidir.

İngiliz istatistikçi Snedecor, sıfır hipotezinin farklı önem seviyelerinde ve farklı sayıda serbestlik derecesinde F oranlarının kritik değerlerinin tablolarını geliştirdi.

F testinin tablolaştırılmış değeri, sıfır hipotezinin belirli bir olasılık düzeyi için şans eseri birbirinden sapması durumunda oluşabilecek varyans oranının maksimum değeridir.

Hesaplanan F oranı değeri, tablodaki değerden büyükse güvenilir kabul edilir (birden farklı).

Bu durumda özellikler arasında bir bağlantının olmadığına ilişkin sıfır hipotezi reddedilir ve bu bağlantının önemine ilişkin bir sonuca varılır: F olgusu > F tablosu. H 0 reddedilir.

Değerin F tablosundan küçük çıkması durumunda

Belirleme katsayısı modelin kalitesinin bir değerlendirmesini verir. Belirleme katsayısı ( R 2) çoklu korelasyon katsayısının karesidir.

Ortaya çıkan özelliğin varyansının ne kadarının bağımsız değişkenlerin etkisiyle açıklandığını gösterir.

Belirleme katsayısını hesaplamak için formül:

sen Ben-- örnek veriler ve F Ben-- karşılık gelen model değerleri.

Aynı zamanda iki değişken arasındaki kare Pearson korelasyonudur. İki değişken arasında paylaşılan varyans miktarını ifade eder.

Katsayı aralıktan değer alır. Değer 1'e ne kadar yakınsa model ampirik gözlemlere o kadar yakın demektir.

Eşleştirilmiş doğrusal regresyon modeli durumunda, belirleme katsayısı korelasyon katsayısının karesine eşittir; yani R 2 = R 2 .

Bazen iletişimin yakınlığının göstergelerine niteliksel bir değerlendirme yapılabilir (Chaddock ölçeği) (Ek 3).

Değer 1 olduğunda ve bağlantı yokluğu 0 olduğunda işlevsel bir bağlantı meydana gelir. Bağlantının yakınlığı 0,7'den düşük değerler için belirleme katsayısının değeri her zaman% 50'nin altında olacaktır. Bu, faktör özelliklerindeki değişimin, performans göstergesindeki değişimi etkileyen, modelde dikkate alınmayan diğer faktörlerle karşılaştırıldığında daha küçük bir kısmı oluşturduğu anlamına gelir. Bu koşullar altında oluşturulan regresyon modellerinin pratik önemi düşüktür.



Makaleyi beğendin mi? Arkadaşlarınla ​​paylaş!