Korelasyon tablosu kullanılarak düz bir çizginin örnek denklemi. Doğrusal Regresyonun Temelleri

4 Nolu LABORATUAR ÇALIŞMASI

Örnek korelasyon katsayısının hesaplanması ve ampirik ve teorik regresyon çizgisinin oluşturulması

İşin amacı : doğrusal korelasyona aşinalık; Korelasyon katsayısını hesaplama ve örnekleme ve teorik regresyon çizgilerinin denklemlerini derleme yeteneğini geliştirmek.

Çalışmanın içeriği : deneysel verilere dayanarak, örnek korelasyon katsayısını hesaplayın, bunun için güvenilir bir güven aralığı oluşturun, elde edilen sonucun anlamsal bir tanımını yapın, ampirik ve teorik regresyon çizgileri oluşturun Açık
yukarıdaki edat yöntemine göre.

Korelasyon yöntemi

Matematiksel istatistiklerde korelasyon yöntemi kullanılarak olaylar arasındaki ilişki belirlenir. Bu ilişkiyi incelemenin özelliği, dış faktörlerin etkisini izole etmenin imkansız olmasıdır. Bu nedenle, faktörlerin dış etkilerinin karmaşık bir etkileşimi durumunda, dış faktörler değişmeseydi, yani deney koşulları yeterli olsaydı, özellikler arasındaki ilişkinin ne olacağını belirlemek için korelasyon yöntemi kullanılır. .

Korelasyon teorisi iki sorunu ele alır:

1) incelenen özellikler arasındaki korelasyon parametresinin belirlenmesi;

2) bu bağlantının yakınlığının belirlenmesi. Özellikler arasındaki ilişkinin doğası hakkında
Ve koordinat sistemindeki (korelasyon alanı) noktaların konumuna göre değerlendirilebilir. Bu noktalar düz bir çizginin yakınında bulunuyorsa, koşullu ortalama arasında olduğu varsayılır. Ve
doğrusal bir ilişki vardır. Denklem
Açık
.

Denklem
regresyon çizgisi denklemi denir
Açık . Her iki regresyon çizgisi de düzse, doğrusal bir korelasyon vardır.

Regresyon Doğrusu Denklemleri

Ve
korelasyon tablosunda verilen örnek verilere dayanarak derlenir.

- karşılık gelen özelliklerin ortalama değerleri;

- regresyon katsayıları Açık
Ve
Açık - formüller kullanılarak hesaplanır

Nerede
- ürünün ortalama değeri
Açık ;

Ve
- özellik farklılıkları
Ve .

Doğrusal korelasyonda, özellikler arasındaki ilişkinin yakınlığı örnek korelasyon katsayısı ile karakterize edilir. “-1” ile “+1” arasında değişen değerleri alan.

Korelasyon katsayısının değeri negatifse bu, incelenen özellikler arasında ters doğrusal bir ilişki olduğunu gösterir; eğer olumluysa – doğrusal bir bağlantı hakkında. Korelasyon katsayısı 0 ise özellikler arasında doğrusal bir ilişki yoktur.

Örnek korelasyon katsayısı aşağıdaki formül kullanılarak hesaplanır:

içerdeyim
(1)

Nerede - ürünlerin ortalama değeri
Açık

Ve - karşılık gelen özelliklerin ortalama değerleri;

Ve - karakteristik için bulunan standart sapmalar
ve işaret için .

İŞİN YAPILMASI YÖNTEMİ

Arabanın arka aksındaki yağlama yağının sıcaklığına ilişkin istatistiksel veriler verilmektedir. ortam sıcaklığına bağlı olarak
.

1. ÖRNEK KORELASYON KATSAYISININ HESAPLANMASI

Bu koşulları bir korelasyon tablosunda özetleyeceğiz

Tablo 1.

N sen(y karakteristiğinin frekansı)

n x (x karakteristiğinin frekansı)

Örneklemin sayısal özelliklerini bulalım

1.1. X ve Y özelliklerinin ortalama değerlerini bulalım

,

1.2. Örnek varyansları bulalım

1513-1281,64=231,36

1.3. Örnek standart sapma

,

,

1.4. Örnek korelasyon anı

1/50(40 + 120+720+480+200+800+900+4200+1120+2160+4500+5280+4400+1320+1560) – 497,62=

1/50(27800) – 497,62 = 556 – 497,62 = 58,38

1.5. Örnek korelasyon katsayısı


0,77

2. Korelasyon katsayısının anlamlılığını kontrol edelim; bunun için istatistikleri kontrol edelim:

=
≈ 8,3

bulacağız
Teknolojide en çok kullanılan önem düzeyine göre Öğrenci dağılım tablosundan (Ek)
Ve
e– serbestlik derecesi sayısı K= n – 2 = 50 – 2 = 48,
2,02

Çünkü
= 8,3 > 2,02 ise bulunan korelasyon katsayısı sıfırdan önemli ölçüde farklıdır. Bu, X ve Y değişkenlerinin formun doğrusal bir regresyon ilişkisi ile ilişkili olduğu anlamına gelir

Böylece korelasyon katsayısı, arka aks yağlama yağı sıcaklığı ile ortam hava sıcaklığı arasında var olan yakın doğrusal ilişkiyi gösterir.

3. Ampirik doğrusal regresyon denklemlerinin hazırlanmasıeAçıkXVeXAçıke.

3.1. Y'nin X üzerindeki ampirik doğrusal regresyon denklemi.

,

3.2. X'in ampirik doğrusal regresyon denklemie.

,

=35,8+2,34(y-13,9)

4. AMPİRİK REGRESYON ÇİZGİSİNİN İNŞASIeAÇIKX.

Ampirik bir regresyon çizgisi oluşturmak için Tablo 2'yi hazırlayalım.

Tablo 2

- karakteristik değerlerin koşullu ortalaması şartıyla belirli bir değer alır, yani

;

;

;

Sayı çiftlerini alma
Noktaların koordinatları için bunları bir koordinat sisteminde oluşturun ve bunları düz çizgi parçalarıyla birleştirin. Ortaya çıkan kesikli çizgi ampirik regresyon çizgisi olacaktır.

Y'nin X üzerindeki teorik düz çizgi regresyonunun denklemi şöyledir:

;
, Nerede - özniteliğin örnek ortalaması ;

- özniteliğin örnek ortalaması .

;
;
;
;
.

Y'nin X üzerindeki doğrudan regresyon denklemi şu şekilde yazılacaktır:

veya nihayet

Her iki regresyon çizgisini de oluşturalım (Şekil 1)

Pirinç. 1. Ampirik ve teorik regresyon çizgileri

en
;

5. Analiz sonuçlarının anlamlı yorumunu yapacağız.

Bir aracın arka aksındaki yağlama yağının sıcaklığı ile ortam hava sıcaklığı arasında yakın, doğrudan bir doğrusal ilişki vardır ( R V=0,77). Bu 0,95 olasılıkla ifade edilebilir.

Denklem
Bir arabanın arka aksının yağlama yağı sıcaklığının ortalama olarak ortam sıcaklığına nasıl bağlı olduğunu karakterize eder.

Doğrusal regresyon katsayısı (
), ortam sıcaklığının ortalama 1 derece artması durumunda otomobilin arka aksındaki yağlama yağının sıcaklığının ortalama 0,25 derece artacağını öne sürüyor.

Denklem
Bir aracın arka aksının yağlama yağı sıcaklığının ortam sıcaklığına nasıl bağlı olduğunu karakterize eder. Bir otomobilin arka aksındaki yağlama yağının sıcaklığının ortalama 1 derece arttırılması gerekiyorsa, ortam hava sıcaklığının da ortalama 2,34 derece arttırılması gerekmektedir.
)

BİREYSEL GÖREVLER İÇİN SEÇENEKLER

1. X'in dağılımı - sabit üretim varlıklarının maliyeti (milyon ruble) ve Y - işçi başına ortalama aylık üretim

2. 200 adet silindirik lamba direğinin boy X (cm) ve ağırlık Y (kg) dağılımı aşağıdaki tabloda verilmiştir:

3. 100 firmanın üretim X (para birimi cinsinden) ve günlük üretim Y (ton cinsinden) bazında dağılımı aşağıdaki tabloda verilmektedir:

Çok sayıda denemede, aynı X değeri nx kez, aynı Y değeri ny kez ve aynı sayı çifti (x; y) nxy kez ortaya çıkabilir,

ve genellikle örneklem büyüklüğü.

Bu nedenle gözlem verileri Gruplandırılır, yani nx, ny, nxy hesaplanır. Gruplandırılmış tüm veriler, korelasyon tablosu adı verilen bir tablo biçiminde kaydedilir.

X üzerinde Y ve Y üzerinde X'in regresyon çizgilerinin her ikisi de düzse, korelasyon doğrusaldır.

X üzerindeki Y düz regresyon çizgisinin örnek denklemi şu şekildedir:

En küçük kareler yöntemiyle belirlenen pyx ve B parametreleri şu şekildedir:

burada yx koşullu ortalamadır; XВ ve Ув, X ve Y özelliklerinin örnek ortalamalarıdır; -x ve -y örnek standart sapmalardır; gV örnek korelasyon katsayısıdır.

X'in Y üzerindeki düz çizgi regresyonunun örnek denklemi şu şekildedir:

X ve Y özelliklerine ilişkin gözlemsel verilerin, eşit aralıklı seçeneklerle bir korelasyon tablosu biçiminde verildiğini varsayıyoruz.

Daha sonra koşullu seçeneklere geçiyoruz:

burada C1, X özelliğinin en yüksek frekansa sahip varyantıdır; C 2 - en yüksek frekansa sahip olan Y özelliğinin çeşidi; h1 — adım (iki bitişik X seçeneği arasındaki fark); h2 - adım (iki bitişik Y seçeneği arasındaki fark).

Daha sonra örnek korelasyon katsayısı

u, v, su, sv miktarları çarpım yöntemiyle veya doğrudan formüller kullanılarak bulunabilir.

Bu miktarları bildiğimizde, regresyon denklemlerinde yer alan parametreleri formülleri kullanarak bulacağız.

BÖLÜM 6 KAPSAMINDA TİPİK KONTROL ÇALIŞMASI. 12.1. Rastgele Etkinlikler

12.1. Rastgele Etkinlikler

12.1.1. Kutuda 6 adet aynı çift siyah eldiven ve 4 adet aynı çift bej eldiven bulunmaktadır. Rasgele çekilen iki eldivenin bir çift oluşturma olasılığını bulun.

A olayını ele alalım: rastgele çekilen iki eldiven bir çift oluşturuyor; ve hipotezler: B1 - bir çift siyah eldiven çıkarıldı, B2 - bir çift bej eldiven çıkarıldı, B3 - çıkarılan eldivenler bir çift oluşturmuyor.

B1 hipotezinin çarpım teoremine göre olasılığı, birinci eldivenin siyah ve ikinci eldivenin siyah olma olasılıklarının çarpımına eşittir, yani.

Benzer şekilde Bi hipotezinin olasılığı:

B1, B2 ve B3 hipotezleri tam bir olaylar grubu oluşturduğundan B3 hipotezinin olasılığı şuna eşittir:

Toplam olasılık formülüne göre elimizde:

burada Pb(A), bir çiftin iki siyah eldivenden oluşma olasılığıdır ve Pb1(A) = 1; pB1 (A) iki bej eldivenin bir çift oluşturma olasılığıdır ve Pb2 (A) = 1; ve son olarak РВз(A) - bir çiftin farklı renkteki eldivenlerden oluşma olasılığı ve

Dolayısıyla rastgele çekilen iki eldivenin bir çift oluşturma olasılığı şuna eşittir:

12.1.2. Torbanın içinde 3 beyaz ve 5 siyah top bulunmaktadır. Rastgele 3 top birer birer çekiliyor ve her çekimden sonra torbaya geri gönderiliyor. Çekilen toplar arasında aşağıdakilerin olma olasılığını bulun:

a) tam olarak iki beyaz top, b) en az iki beyaz top.

Çözüm. Geri dönüşlü bir şemamız var, yani. topların bileşimi her değişmediğinde:

a) Üç top çekildiğinde ikisi beyaz, biri siyah olmalıdır. Bu durumda siyah birinci, ikinci veya üçüncü olabilir. Olasılıkların toplama ve çarpma teoremlerini birlikte uygulayarak şunu elde ederiz:

b) en az iki beyaz topun çıkarılması, iki veya üç beyaz topun olması gerektiği anlamına gelir:

12.1.3. Torbanın içinde 6 beyaz ve 5 siyah top bulunmaktadır. Torbaya geri gönderilmeden art arda rastgele üç top çekiliyor. Üst üste üçüncü topun beyaz olma olasılığını bulun.

Çözüm. Üçüncü topun beyaz olması gerekiyorsa, ilk iki top beyaz, beyaz ve siyah, siyah ve beyaz veya siyah olabilir, yani dört grup olmayan top vardır.

ortak etkinlikler. Olasılık çarpım teoremini bunlara uyguladığımızda şunu elde ederiz:

P = P1(5 . P2(5 . P3(5 + (P1(5 . P2ch. P3(5 + P14 . P2(5 . P3(5)) + P1ch. P2ch. P3(5 =)

A A 4 A A 5 A A 5 A A 6=540 = A

S.10. 9 + I.10. 9 + I.10. 9 + I.10. 9 = 990 = IT

Regresyon nedir?

İki sürekli değişkeni düşünün x=(x 1 , x 2 , .., x n), y=(y 1 , y 2 , ..., y n).

Noktaları iki boyutlu bir dağılım grafiğine yerleştirelim ve diyelim ki elimizde doğrusal ilişki Verilere düz bir çizgiyle yaklaşılıyorsa.

Eğer buna inanırsak sen bağlıdır X ve değişiklikler sen tam olarak değişikliklerden kaynaklanmaktadır X regresyon çizgisini belirleyebiliriz (regresyon sen Açık X), bu iki değişken arasındaki doğrusal ilişkiyi en iyi tanımlayandır.

Regresyon kelimesinin istatistiksel kullanımı, Sir Francis Galton'a (1889) atfedilen, ortalamaya regresyon olarak bilinen olgudan gelmektedir.

Uzun babaların uzun boylu oğullara sahip olma eğiliminde olmalarına rağmen, oğulların ortalama boylarının uzun babalarınkinden daha kısa olduğunu gösterdi. Oğulların ortalama boyu, popülasyondaki tüm babaların ortalama boyuna doğru "gerildi" ve "geriye doğru ilerledi". Bu nedenle, ortalama olarak, uzun babaların daha kısa (ama yine de oldukça uzun) oğulları var ve kısa boylu babaların daha uzun (ama yine de oldukça kısa) oğulları var.

Regresyon çizgisi

Basit (çift yönlü) bir doğrusal regresyon çizgisini tahmin eden matematiksel bir denklem:

X bağımsız değişken veya yordayıcı olarak adlandırılır.

e- bağımlı değişken veya yanıt değişkeni. Bu beklediğimiz değer sen(ortalama olarak) değerini biliyorsak X yani "tahmin edilen değer" sen»

  • A- değerlendirme hattının serbest üyesi (kesişmesi); anlamı bu e, Ne zaman x=0(Şekil 1).
  • B- tahmini çizginin eğimi veya eğimi; hangi miktarda olduğunu temsil eder e eğer arttırırsak ortalama olarak artar X bir birim için.
  • A Ve B tahmin edilen doğrunun regresyon katsayıları olarak adlandırılır, ancak bu terim genellikle yalnızca B.

İkili doğrusal regresyon, birden fazla bağımsız değişkeni içerecek şekilde genişletilebilir; bu durumda şu şekilde bilinir: çoklu regresyon.

Şekil 1. a kesim noktasını ve b eğimini gösteren doğrusal regresyon çizgisi (x bir birim arttıkça Y miktarı da artar)

En küçük kareler yöntemi

Bir gözlem örneğini kullanarak regresyon analizi yapıyoruz. A Ve B- popülasyondaki (genel popülasyon) doğrusal regresyon çizgisini belirleyen gerçek (genel) parametreler olan α ve β'nın örnek tahminleri.

Katsayıları belirlemenin en basit yöntemi A Ve Böyle en küçük kareler yöntemi(ÇUŞ).

Uyum, artıklara (her noktanın çizgiden dikey mesafesi, örneğin artık = gözlemlenen) bakılarak değerlendirilir. sen- tahmin sen, Pirinç. 2).

En iyi uyum çizgisi, artıkların karelerinin toplamı minimum olacak şekilde seçilir.

Pirinç. 2. Her nokta için artıkların (dikey noktalı çizgiler) gösterildiği doğrusal regresyon çizgisi.

Doğrusal Regresyon Varsayımları

Yani, gözlemlenen her değer için kalan, farka eşittir ve karşılık gelen tahmin edilen değer, pozitif veya negatif olabilir.

Doğrusal regresyonun ardındaki aşağıdaki varsayımları test etmek için artıkları kullanabilirsiniz:

  • Artıklar normal olarak sıfır ortalaması ile dağıtılır;

Doğrusallık, normallik ve/veya sabit varyans varsayımları sorgulanabilirse, bu varsayımların karşılandığı yeni bir regresyon çizgisini dönüştürebilir veya hesaplayabiliriz (örneğin, logaritmik dönüşüm vb. kullanın).

Anormal değerler (aykırı değerler) ve etki noktaları

"Etkili" bir gözlem atlanırsa, bir veya daha fazla model parametre tahminini değiştirir (yani eğim veya kesişme).

Bir aykırı değer (bir veri kümesindeki değerlerin çoğunluğuyla tutarsız olan bir gözlem) "etkili" bir gözlem olabilir ve iki değişkenli bir dağılım grafiği veya artık grafiği incelenerek görsel olarak kolayca tespit edilebilir.

Hem aykırı değerler hem de “etkili” gözlemler (noktalar) için, hem dahil edilerek hem de edilmeden modeller kullanılır ve tahminlerdeki değişikliklere (regresyon katsayıları) dikkat edilir.

Bir analiz gerçekleştirirken, aykırı değerleri veya etki noktalarını otomatik olarak göz ardı etmemelisiniz çünkü bunları göz ardı etmek, elde edilen sonuçları etkileyebilir. Her zaman bu aykırı değerlerin nedenlerini inceleyin ve analiz edin.

Doğrusal regresyon hipotezi

Doğrusal regresyon oluşturulurken, regresyon çizgisi β'nın genel eğiminin sıfıra eşit olduğu boş hipotezi test edilir.

Doğrunun eğimi sıfırsa ve arasında doğrusal bir ilişki yoktur: değişiklik etkilemez

Gerçek eğimin sıfır olduğuna ilişkin sıfır hipotezini test etmek için aşağıdaki algoritmayı kullanabilirsiniz:

Katsayının standart hatasının serbestlik dereceli bir dağılıma tabi olduğu orana eşit test istatistiğini hesaplayın


,

- artıkların dağılımının tahmini.

Genellikle anlamlılık düzeyine ulaşıldığında sıfır hipotezi reddedilir.


iki taraflı bir test olasılığını veren serbestlik dereceli dağılımın yüzde puanı nerede

Bu %95 olasılıkla genel eğimi içeren aralıktır.

Büyük örnekler için örneğin 1,96 değerine yaklaşabiliriz (yani test istatistiği normal dağılma eğiliminde olacaktır).

Doğrusal regresyonun kalitesinin değerlendirilmesi: R 2 belirleme katsayısı

Doğrusal ilişki nedeniyle ve bunun şu şekilde değişmesini bekliyoruz: ve buna regresyondan kaynaklanan veya regresyonla açıklanan varyasyon adını verin. Artık değişim mümkün olduğu kadar küçük olmalıdır.

Eğer bu doğruysa, varyasyonun çoğu regresyonla açıklanacak ve noktalar regresyon çizgisine yakın olacaktır; çizgi verilere iyi uyuyor.

Regresyonla açıklanan toplam varyansın oranına denir. belirleme katsayısı genellikle yüzde olarak ifade edilir ve gösterilir R2(eşleştirilmiş doğrusal regresyonda bu miktardır r2, korelasyon katsayısının karesi), regresyon denkleminin kalitesini öznel olarak değerlendirmenize olanak tanır.

Fark, regresyonla açıklanamayan varyans yüzdesini temsil eder.

Değerlendirilecek resmi bir test yoktur; regresyon çizgisinin uyumunun iyiliğini belirlemek için öznel yargıya güvenmek zorundayız.

Tahmine Regresyon Doğrusu Uygulamak

Gözlemlenen aralığın en uç noktasındaki bir değerden bir değer tahmin etmek için bir regresyon çizgisi kullanabilirsiniz (asla bu sınırların ötesine geçmeyin).

Belirli bir değere sahip gözlemlenebilirlerin ortalamasını, bu değeri regresyon çizgisinin denklemine yerleştirerek tahmin ederiz.

Yani, eğer tahmin edersek, gerçek popülasyon ortalaması için bir güven aralığı tahmin etmek amacıyla bu tahmin edilen değeri ve standart hatasını kullanın.

Bu prosedürü farklı değerler için tekrarlamak, bu çizgi için güven limitleri oluşturmanıza olanak sağlar. Bu, örneğin %95 güven seviyesinde gerçek çizgiyi içeren bant veya alandır.

Basit regresyon planları

Basit regresyon tasarımları bir sürekli öngörücü içerir. 7, 4 ve 9 gibi P tahmin değerlerine sahip 3 gözlem varsa ve tasarım birinci dereceden bir P etkisi içeriyorsa, o zaman tasarım matrisi X şöyle olacaktır:

ve X1 için P'yi kullanan regresyon denklemi şu şekildedir:

Y = b0 + b1 P

Basit bir regresyon tasarımı P üzerinde ikinci dereceden bir etki gibi daha yüksek dereceli bir etki içeriyorsa, tasarım matrisindeki X1 sütunundaki değerler ikinci kuvvete yükseltilecektir:

ve denklem şu şekli alacaktır

Y = b0 + b1 P2

Sigma kısıtlı ve aşırı parametreli kodlama yöntemleri, basit regresyon tasarımlarına ve yalnızca sürekli tahmin ediciler içeren diğer tasarımlara uygulanmaz (çünkü kategorik tahmin ediciler yoktur). Seçilen kodlama yöntemine bakılmaksızın sürekli değişkenlerin değerleri buna göre artırılır ve X değişkenleri için değer olarak kullanılır. Bu durumda herhangi bir yeniden kodlama yapılmaz. Ek olarak, regresyon planlarını açıklarken X tasarım matrisini dikkate almayıp yalnızca regresyon denklemiyle çalışabilirsiniz.

Örnek: Basit Regresyon Analizi

Bu örnek, tabloda sunulan verileri kullanır:

Pirinç. 3. Başlangıç ​​verileri tablosu.

Rastgele seçilen 30 ilçede 1960 ve 1970 nüfus sayımlarının karşılaştırılmasından derlenen veriler. İlçe adları gözlem adları olarak sunulmuştur. Her bir değişkene ilişkin bilgiler aşağıda sunulmuştur:

Pirinç. 4. Değişken özellikler tablosu.

Araştırma problemi

Bu örnekte yoksulluk oranı ile yoksulluk sınırının altındaki ailelerin yüzdesini öngören derece arasındaki korelasyon analiz edilecektir. Bu nedenle değişken 3'ü (Pt_Poor) bağımlı değişken olarak ele alacağız.

Bir hipotez öne sürebiliriz: Nüfus büyüklüğündeki değişiklikler ile yoksulluk sınırının altındaki ailelerin yüzdesi birbiriyle ilişkilidir. Yoksulluğun dışarıya göçe yol açmasını beklemek makul görünmektedir, dolayısıyla yoksulluk sınırının altındaki insanların yüzdesi ile nüfus değişimi arasında negatif bir korelasyon olacaktır. Bu nedenle değişken 1'i (Pop_Chng) tahmin değişkeni olarak ele alacağız.

Sonuçları görüntüle

Regresyon katsayıları

Pirinç. 5. Pt_Poor'un Pop_Chng üzerindeki regresyon katsayıları.

Pop_Chng satırı ile Param sütununun kesiştiği noktada.<.05 . Обратите внимание на не стандартизованный коэффициент, который также является коэффициентом корреляции Пирсона для простых регрессионных планов, равен -.65, который означает, что для каждого уменьшения стандартного отклонения численности населения происходит увеличение стандартного отклонения уровня бедности на.65.

Pt_Poor'un Pop_Chng üzerindeki regresyonuna ilişkin standartlaştırılmamış katsayı -0,40374'tür. Bu, nüfustaki her bir birim azalmaya karşılık yoksulluk oranında 0,40374 artış olduğu anlamına geliyor. Bu standartlaştırılmamış katsayı için üst ve alt (varsayılan) %95 güven sınırları sıfır içermez, dolayısıyla regresyon katsayısı p düzeyinde anlamlıdır

Verilerde büyük aykırı değerler mevcutsa korelasyon katsayıları önemli ölçüde fazla tahmin edilebilir veya eksik tahmin edilebilir. Bağımlı değişken Pt_Poor'un ilçelere göre dağılımını inceleyelim. Bunu yapmak için Pt_Poor değişkeninin histogramını oluşturalım.

Pirinç. 6. Pt_Poor değişkeninin histogramı.

Gördüğünüz gibi bu değişkenin dağılımı normal dağılımdan oldukça farklı. Bununla birlikte, iki ilçede (iki sağ sütun) normal dağılıma göre yoksulluk sınırının altında olan ailelerin yüzdesi beklenenden daha yüksek olmasına rağmen, bunlar "aralık içinde" görünmektedir.

Pirinç. 7. Pt_Poor değişkeninin histogramı.

Bu yargı biraz subjektif. Temel kural, gözlemin (veya gözlemlerin) aralık (standart sapmanın ortalama ± 3 katı) dahilinde olmaması durumunda aykırı değerlerin dikkate alınması gerektiğidir. Bu durumda, bunların popülasyon üyeleri arasındaki korelasyon üzerinde önemli bir etkiye sahip olmadıklarından emin olmak için analizi aykırı değerlerle ve aykırı değerler olmadan tekrarlamak faydalı olacaktır.

Dağılım grafiği

Hipotezlerden biri, verilen değişkenler arasındaki ilişkiyle ilgili önsel ise, o zaman bunu karşılık gelen dağılım grafiğinin grafiği üzerinde test etmek faydalı olacaktır.

Pirinç. 8. Dağılım diyagramı.

Dağılım grafiği, iki değişken arasında net bir negatif korelasyon (-.65) göstermektedir. Aynı zamanda regresyon çizgisi için %95 güven aralığını da gösterir; yani regresyon çizgisinin iki noktalı eğri arasında yer alma olasılığı %95'tir.

Önem kriterleri

Pirinç. 9. Önemlilik kriterlerini içeren tablo.

Pop_Chng regresyon katsayısı testi, Pop_Chng'nin Pt_Poor ile güçlü bir şekilde ilişkili olduğunu doğrular, p<.001 .

Sonuç olarak

Bu örnek, basit bir regresyon tasarımının nasıl analiz edileceğini gösterdi. Standartlaştırılmamış ve standartlaştırılmış regresyon katsayılarının yorumları da sunuldu. Bağımlı bir değişkenin tepki dağılımını çalışmanın önemi tartışılır ve bir yordayıcı ile bağımlı değişken arasındaki ilişkinin yönünü ve gücünü belirlemeye yönelik bir teknik gösterilir.

Metodolojik Formun kapak sayfası

Kazakistan Cumhuriyeti Eğitim ve Bilim Bakanlığı

«

UMC Başkanı _______________ « ___"____________20__

ONAYLI:

OPiMOUP Başkanı _________________ « ___"____________20__

Üniversitenin eğitim ve metodoloji konseyi tarafından onaylandı

« ___"____________20 __ Protokol No.____

Konuyu incelerken " Olasılık teorisi ve matematiksel istatistiklerden elde edilen bilgiler” kapsamında, istatistiksel verilerin sunulma ve işlenme yöntemlerine özel dikkat gösterilmelidir. Teorik ve seçici özellikler. Hipotezleri test etmek için genel şema. 1. ve 2. tür hatalar. Nokta ve aralık tahminleri. Tahminlerin istatistiksel özellikleri. İki rastgele değişkenin bağımlılıklarının analizi.

Ders. En küçük kareler yöntemi.

h1, h2 – adımlar, yani iki komşu seçenek arasındaki fark.

Bu durumda örnek korelasyon katsayısı

,

Ayrıca, terim hesaplama tablosu 1'i kullanarak hesaplamak için uygundur.

Değerler formüller kullanılarak bulunabilir

Ters geçiş için ifadeler kullanılır

Örnek Korelasyon tablosuna dayanarak Y'nin X üzerindeki örnek doğrusal regresyon denklemini bulun.

Çözüm. Hesaplamaları basitleştirmek için formüller kullanılarak hesaplanan koşullu seçeneklere geçelim.

,

ve koşullu seçeneklerle dönüştürülmüş bir korelasyon tablosu oluşturun

Daha sonra, dolu hücrenin sağ üst köşesine ve sol alt köşeye hesaplanan değerleri gireceğimiz yeni bir tablo oluşturacağız, ardından değerleri elde etmek için satırlardaki üst değerleri toplayacağız. ​Vj ve Ui için sütunlardaki alt değerler ve değerleri hesaplayın.

vjVj

İki rastgele değişken fonksiyonel bağımlılıkla, istatistiksel bağımlılıkla ilişkilendirilebilir veya bağımsız olabilir. İki niceliğin her ikisi veya bir tanesi aynı zamanda rastgele faktörlerin etkisine de tabi olduğundan, katı bir fonksiyonel bağımlılık nadiren gerçekleşir. Üstelik, bu faktörler arasında her iki nicelik için de bazı ortak noktalar olabilir; her iki rastgele değişkeni de etkilemektedir. Bu durumlarda istatistiksel bir bağımlılık ortaya çıkar.

İstatistiksel Büyüklüklerden birindeki değişikliğin diğerinin dağılımında da değişikliğe yol açtığı bir bağımlılıktır. Özellikle büyüklüklerden birinde meydana gelen değişiklik diğerinin ortalama değerinde de değişikliğe neden olur. Bu durumda istatistiksel bağımlılığa denir. korelasyon.Örneğin gübre miktarı ile hasat arasındaki ilişki, yatırılan fonlar ile kâr arasındaki ilişki.

X=x değerine karşılık gelen Y rastgele değişkeninin gözlenen değerlerinin aritmetik ortalamasına denir koşullu ortalama x ve matematiksel beklentinin bir nokta tahminidir . Koşullu ortalama y de benzer şekilde belirlenir.

Koşullu matematiksel beklenti M(Y|x) bir fonksiyonudur X, bu nedenle değerlendirmesi, yani. koşullu ortalama X, ayrıca x'in bir fonksiyonu:

x = f*(x).

Bu denklem denir X üzerinde Y'nin örnek regresyon denklemi. İşlev f*(x) isminde örnek regresyon ve grafiği Y'nin X üzerindeki örnek regresyon çizgisi. Benzer şekilde Denk.

e = φ * (y),

işlev φ * (y) ve onun programının adı örnek regresyon denklemi, örnek regresyon ve X'in Y üzerindeki örnek regresyon çizgisi.

Fonksiyon Parametrelerini Bulma f*(x) Ve φ * (y) Türleri biliniyorsa X ve Y büyüklükleri arasındaki ilişkinin yakınlığının değerlendirilmesi sorun teşkil eder. korelasyon analizi. Regresyon analizinin görevi, regresyon fonksiyonu βi ve artık varyans σ ost 2'nin parametrelerini tahmin etmektir.

Artık varyans, Y dağılımının X'in eylemiyle açıklanamayan kısmıdır. σ artık 2, regresyon fonksiyonunun seçiminin doğruluğunu ve analize dahil edilen özellikler kümesinin tamlığını değerlendirmeye hizmet edebilir. Bağımlılık türü g(x), korelasyon alanının doğasına ve sürecin doğasına göre seçilir.



Doğrusal regresyon katsayısının tahmini β Y'nin X r yx üzerindeki örnek regresyon katsayısı. Parametre değerleri r yx ve parametre B düz çizgi regresyon denklemleri

Y = r yx x + b

xOy düzlemindeki gözlemsel verilerden oluşturulan (x 1 ,y 1), (x 2 ,y 2),…,(x n ,y n) noktaları düzlüğe mümkün olduğu kadar yakın olacak şekilde seçilir. regresyon çizgisi. Bu, Y(x i) fonksiyonunun y i'den sapmalarının karelerinin toplamının minimum olması gerekliliğine eşdeğerdir. Çok uluslu şirketlerin özü budur.

Y'nin X üzerindeki düz bir regresyon çizgisinin örnek denklemi şu şekilde yazılabilir:

X -= r in s y /s x (x – ) ,

burada s x ve s y X ve Y'nin örnek standart sapmalarıdır ve

r =

gruplandırılmış verilerden hesaplanan örnek korelasyon katsayısı. Burada n xy (x,y) değişken çiftinin frekansıdır. Benzer şekilde, X üzerindeki Y düz regresyon çizgisinin örnek denklemini bulun:

Y – = r in s x /s y (y –)

Örneklemde bulunan Y ve X arasındaki ilişkinin matematiksel modelinin istatistiksel verilere uyup uymadığını belirlemek için regresyon katsayılarının anlamlılığı ve regresyon denkleminin anlamlılığı değerlendirilmelidir.

Regresyon katsayılarının anlamlılığının test edilmesi, tahminin büyüklüğünün, regresyon katsayısının sıfırdan farklı olduğuna dair makul bir sonucu desteklemek için yeterli olup olmadığının belirlenmesi anlamına gelir. H 0 hipotezi öne sürülüyor: regresyon katsayısı sıfıra eşit β =0. H0 hipotezi, Öğrenci kanununa göre dağıtılan istatistikler kullanılarak test edilir.

t = │b / sb │

Nerede B regresyon katsayısı tahminidir ve s b– standart sapmanın tahmini, diğer bir deyişle tahminin standart hatası. │t │≥ t cr (α, k) ise regresyon katsayısının sıfıra eşit olduğu yönündeki sıfır hipotezi reddedilir ve katsayı anlamlı kabul edilir. │t │'de< t кр нет оснований отвергать нулевую гипотезу.



Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!