Korelasyon analizi sonucunda hesaplanır. Korelasyon bağımlılığının sayısal ifadesi

DERS ÇALIŞMASI

Konu: Korelasyon analizi

giriiş

1. Korelasyon analizi

1.1 Korelasyon kavramı

1.2 Korelasyonların genel sınıflandırması

1.3 Korelasyon alanları ve yapım amacı

1.4 Korelasyon analizinin aşamaları

1.5 Korelasyon katsayıları

1.6 Normalleştirilmiş Bravais-Pearson korelasyon katsayısı

1.7 Spearman'ın sıra korelasyon katsayısı

1.8 Korelasyon katsayılarının temel özellikleri

1.9 Korelasyon katsayılarının öneminin kontrol edilmesi

1.10 Çift korelasyon katsayısının kritik değerleri

2. Çok faktörlü bir deney planlamak

2.1 Sorunun durumu

2.2 Planın merkezinin (temel düzey) ve faktör değişimi düzeyinin belirlenmesi

2.3 Planlama matrisinin oluşturulması

2.4 Farklı serilerde dağılım homojenliğinin ve ölçüm denkliğinin kontrol edilmesi

2.5 Regresyon denklemi katsayıları

2.6 Tekrarlanabilirlik farkı

2.7 Regresyon denklemi katsayılarının öneminin kontrol edilmesi

2.8 Regresyon denkleminin yeterliliğinin kontrol edilmesi

Çözüm

Referanslar

GİRİİŞ

Deneysel planlama, deneysel araştırmanın rasyonel organizasyonu için yöntemleri - incelenen faktörlerin optimal seçiminden ve amacına uygun olarak gerçek deney planının belirlenmesinden sonuçları analiz etme yöntemlerine kadar - inceleyen matematiksel ve istatistiksel bir disiplindir. Deneysel planlama, rasyonel deneysel planlamanın, tahminlerin doğruluğunda, ölçüm sonuçlarının en iyi şekilde işlenmesinden daha az önemli kazanımlar sağlamadığını vurgulayan İngiliz istatistikçi R. Fisher'ın (1935) çalışmalarıyla başladı. 20. yüzyılın 60'lı yıllarında modern deneysel planlama teorisi ortaya çıktı. Yöntemleri fonksiyon yaklaşım teorisi ve matematiksel programlamayla yakından ilgilidir. Optimal planlar oluşturulmuş ve özellikleri geniş bir model sınıfı için incelenmiştir.

Deneysel planlama, belirli gereksinimleri karşılayan bir deney planının seçimi, bir deney stratejisi geliştirmeyi amaçlayan bir dizi eylemdir (önsel bilgi elde etmekten uygulanabilir bir matematiksel model elde etmeye veya optimal koşulları belirlemeye kadar). Bu, incelenen olgunun mekanizması hakkında eksik bilgi koşulları altında uygulanan bir deneyin amaçlı kontrolüdür.

Ölçümler sürecinde, sonraki veri işlemenin yanı sıra sonuçların matematiksel bir model biçiminde resmileştirilmesi sırasında hatalar ortaya çıkar ve orijinal verilerde yer alan bilgilerin bir kısmı kaybolur. Deneysel planlama yöntemlerinin kullanılması, matematiksel modelin hatasını belirlemeyi ve yeterliliğini değerlendirmeyi mümkün kılar. Modelin doğruluğu yetersiz çıkarsa deneysel planlama yöntemlerinin kullanılması, matematiksel modelin ek deneylerle önceki bilgileri kaybetmeden ve minimum maliyetle modernleştirilmesini mümkün kılar.

Bir deney planlamanın amacı, bir nesne hakkında en az emekle güvenilir ve güvenilir bilgi elde etmenin mümkün olduğu deneyleri yürütmek için bu koşulları ve kuralları bulmak ve bu bilgiyi kompakt ve kullanışlı bir biçimde sunmaktır. doğruluğun niceliksel bir değerlendirmesiyle.

Çalışmanın farklı aşamalarında kullanılan ana planlama yöntemleri arasında şunlar yer almaktadır:

Asıl önemi, daha ayrıntılı çalışmaya konu olan bir grup önemli faktörün tüm faktör kümesinden seçilmesi olan bir tarama deneyinin planlanması;

ANOVA için deneysel tasarım, yani. niteliksel faktörlere sahip nesneler için planların hazırlanması;

Regresyon modellerini (polinom ve diğerleri) elde etmenizi sağlayacak bir regresyon deneyi planlamak;

Ana görevin araştırma nesnesinin deneysel optimizasyonu olduğu aşırı bir deney planlamak;

Dinamik süreçleri vb. incelerken planlama yapmak.

Disiplini incelemenin amacı, öğrencileri planlama teorisi yöntemlerini ve modern bilgi teknolojilerini kullanarak uzmanlık alanlarındaki üretim ve teknik faaliyetlere hazırlamaktır.

Disiplinin amaçları: Bilimsel ve endüstriyel deneyleri planlamak, organize etmek ve optimize etmek, deneyler yapmak ve elde edilen sonuçları işlemek için modern yöntemlerin incelenmesi.

1. KORELASYON ANALİZİ

1.1 Korelasyon kavramı

Bir araştırmacı genellikle incelenen bir veya daha fazla örnekte iki veya daha fazla değişkenin birbiriyle nasıl ilişkili olduğuyla ilgilenir. Örneğin boy kişinin kilosunu etkileyebilir mi veya kan basıncı ürün kalitesini etkileyebilir mi?

Değişkenler arasındaki bu tür bağımlılığa korelasyon veya korelasyon denir. Korelasyon, bir özelliğin değişkenliğinin diğerinin değişkenliğine uygun olduğu gerçeğini yansıtan, iki özellikteki tutarlı bir değişikliktir.

Örneğin insanların boyu ile kiloları arasında ortalama olarak pozitif bir ilişki olduğu ve boy arttıkça kişinin kilosunun da arttığı bilinmektedir. Bununla birlikte, nispeten kısa kişilerin aşırı kilolu olduğu ve tam tersine, yüksek boylu astenik kişilerin düşük kilolu olduğu bu kuralın istisnaları vardır. Bu tür istisnaların nedeni, her biyolojik, fizyolojik veya psikolojik işaretin birçok faktörün etkisiyle belirlenmesidir: çevresel, genetik, sosyal, çevresel vb.

Korelasyon bağlantıları, yalnızca matematiksel istatistik yöntemleri kullanılarak temsili örnekler üzerinde çalışılabilen olasılıksal değişikliklerdir. Her iki terim de (korelasyon bağlantısı ve korelasyon bağımlılığı) sıklıkla birbirinin yerine kullanılır. Bağımlılık etkiyi, bağlantıyı, yani yüzlerce nedenden dolayı açıklanabilecek her türlü koordineli değişikliği ima eder. Korelasyon bağlantıları neden-sonuç ilişkisinin kanıtı olarak kabul edilemez; yalnızca bir özellikteki değişikliklere genellikle diğerindeki belirli değişikliklerin eşlik ettiğini gösterir.

Korelasyon bağımlılığı - Bunlar, bir özelliğin değerlerini başka bir özelliğin farklı değerlerinin ortaya çıkma olasılığına sokan değişikliklerdir.

Korelasyon analizinin görevi, değişen özellikler arasındaki ilişkinin yönünü (pozitif veya negatif) ve formunu (doğrusal, doğrusal olmayan) belirlemek, yakınlığını ölçmek ve son olarak elde edilen korelasyon katsayılarının anlamlılık düzeyini kontrol etmekten ibarettir.

Korelasyon bağlantıları biçim, yön ve derece (kuvvet) bakımından farklılık gösterir .

Korelasyon ilişkisinin şekli doğrusal veya eğrisel olabilir. Örneğin, simülatördeki eğitim oturumlarının sayısı ile kontrol oturumundaki doğru çözülmüş problemlerin sayısı arasındaki ilişki basit olabilir. Örneğin motivasyon düzeyi ile bir görevin etkinliği arasındaki ilişki eğrisel olabilir (Şekil 1). Motivasyon arttıkça, önce bir görevi tamamlamanın etkinliği artar, daha sonra görevi tamamlamanın maksimum etkinliğine karşılık gelen optimum motivasyon düzeyine ulaşılır; Motivasyondaki daha fazla artışa verimlilikte bir azalma eşlik eder.

Şekil 1 - Problem çözmenin etkinliği ile motivasyon eğilimlerinin gücü arasındaki ilişki

Korelasyon ilişkisi yönde pozitif (“doğrudan”) ve negatif (“ters”) olabilir. Pozitif doğrusal korelasyonda, bir özelliğin yüksek değerleri diğerinin yüksek değerlerine karşılık gelir ve bir özelliğin düşük değerleri diğerinin düşük değerlerine karşılık gelir (Şekil 2). Negatif korelasyon durumunda ilişkiler terstir (Şekil 3). Pozitif korelasyonda korelasyon katsayısı pozitif işarete sahiptir, negatif korelasyonda ise negatif işarete sahiptir.

Şekil 2 - Doğrudan korelasyon

Şekil 3 - Ters korelasyon


Şekil 4 – Korelasyon yok

Korelasyonun derecesi, gücü veya yakınlığı korelasyon katsayısının değeri ile belirlenir. Bağlantının gücü yönüne bağlı değildir ve korelasyon katsayısının mutlak değeri ile belirlenir.

1.2 Korelasyonların genel sınıflandırması

Korelasyon katsayısına bağlı olarak aşağıdaki korelasyonlar ayırt edilir:

Güçlü veya r>0,70 korelasyon katsayısına yakın;

Ortalama (0,50'de

Orta (0,30'da

Zayıf (0,20'de

Çok zayıf (r'de<0,19).

1.3 Korelasyon alanları ve yapım amacı

Korelasyon, iki özelliğin ölçülen değerleri (xi, y i) olan deneysel verilere dayanarak incelenir. Çok az deneysel veri varsa, iki boyutlu ampirik dağılım, x i ve y i değerlerinin çift serisi olarak temsil edilir. Aynı zamanda özellikler arasındaki korelasyon bağımlılığı farklı şekillerde açıklanabilir. Bir argüman ile bir fonksiyon arasındaki yazışma bir tablo, formül, grafik vb. ile verilebilir.

Korelasyon analizi, diğer istatistiksel yöntemler gibi, xi ve y i deneysel değerlerinin elde edildiği belirli bir genel popülasyonda incelenen özelliklerin davranışını tanımlayan olasılıksal modellerin kullanımına dayanmaktadır. Değerleri metrik ölçek birimlerinde (metre, saniye, kilogram vb.) Doğru bir şekilde ölçülebilen niceliksel özellikler arasındaki korelasyonu incelerken, genellikle iki boyutlu normal dağılmış bir nüfus modeli benimsenir. Böyle bir model, x i ve y i değişkenleri arasındaki ilişkiyi, dikdörtgen koordinat sistemindeki noktaların geometrik konumu biçiminde grafiksel olarak gösterir. Bu grafiksel ilişkiye aynı zamanda dağılım grafiği veya korelasyon alanı da denir.
Bu iki boyutlu normal dağılım modeli (korelasyon alanı), korelasyon katsayısının net bir grafiksel yorumunu vermemize olanak tanır, çünkü toplam dağılım beş parametreye bağlıdır: μ x, μ y – ortalama değerler (matematiksel beklentiler); σ x ,σ y – X ve Y rastgele değişkenlerinin standart sapmaları ve p – X ve Y rastgele değişkenleri arasındaki ilişkinin bir ölçüsü olan korelasyon katsayısı.
p = 0 ise iki boyutlu normal bir popülasyondan elde edilen x i , y i değerleri grafik üzerinde dairenin sınırladığı alan içerisinde x, y koordinatlarında yer alır (Şekil 5, a). Bu durumda X ve Y rastgele değişkenleri arasında korelasyon yoktur ve bunlara korelasyonsuz denir. İki boyutlu bir normal dağılım için korelasyonsuzluk aynı zamanda X ve Y rastgele değişkenlerinin bağımsızlığı anlamına gelir.

Halk sağlığı ve sağlık hizmetlerini bilimsel ve pratik amaçlarla incelerken, araştırmacının sıklıkla istatistiksel bir popülasyonun faktör ve performans özellikleri arasındaki ilişkilerin istatistiksel bir analizini yapması (nedensel ilişki) veya bu popülasyonun çeşitli özelliklerindeki paralel değişikliklerin bağımlılığını belirlemesi gerekir. üçüncü bir değere (ortak nedenlerine) dayanarak. Bu bağlantının özelliklerini inceleyebilmek, boyutunu ve yönünü belirleyebilmek ve ayrıca güvenilirliğini değerlendirebilmek gerekir. Bu amaçla korelasyon yöntemleri kullanılmaktadır.

  1. Özellikler arasındaki niceliksel ilişkilerin tezahür türleri
    • işlevsel bağlantı
    • korelasyon bağlantısı
  2. Fonksiyonel ve korelasyonel bağlantının tanımları

    Fonksiyonel bağlantı- Birinin her değeri diğerinin kesin olarak tanımlanmış bir değerine karşılık geldiğinde iki özellik arasındaki bu tür bir ilişki (bir dairenin alanı dairenin yarıçapına vb. bağlıdır). İşlevsel bağlantı, fiziksel ve matematiksel süreçlerin karakteristiğidir.

    Korelasyon- bir özelliğin her bir spesifik değerinin, kendisiyle ilişkili başka bir özelliğin çeşitli değerlerine karşılık geldiği böyle bir ilişki (bir kişinin boyu ile kilosu arasındaki ilişki; vücut ısısı ile nabız hızı arasındaki ilişki, vb.). Korelasyon tıbbi ve biyolojik süreçler için tipiktir.

  3. Korelasyon bağlantısı kurmanın pratik önemi. Faktör ve sonuç özellikleri arasındaki neden-sonuç ilişkilerinin belirlenmesi (fiziksel gelişimi değerlendirirken, çalışma koşulları, yaşam koşulları ve sağlık durumu arasındaki ilişkiyi belirlemek, hastalık sıklığının yaşa, hizmet süresine, mesleki tehlikelerin varlığı vb.)

    Çeşitli özelliklerdeki paralel değişikliklerin üçüncü bir değere bağımlılığı. Örneğin atölyede yüksek sıcaklığın etkisi altında kan basıncında, kan viskozitesinde, nabız hızında vb. değişiklikler meydana gelir.

  4. Özellikler arasındaki ilişkinin yönünü ve gücünü karakterize eden bir değer. Bir sayıda işaretler (olgular) arasındaki bağlantının yönü ve gücü hakkında fikir veren korelasyon katsayısı, 0'dan ± 1'e kadar dalgalanmalarının sınırları
  5. Korelasyonları sunma yöntemleri
    • grafik (dağılım grafiği)
    • korelasyon katsayısı
  6. Korelasyonun yönü
    • dümdüz
    • tersi
  7. Korelasyonun gücü
    • güçlü: ±0,7 ila ±1
    • ortalama: ±0,3 ila ±0,699
    • zayıf: 0 ila ±0,299
  8. Korelasyon katsayısını ve formüllerini belirleme yöntemleri
    • kareler yöntemi (Pearson yöntemi)
    • sıralama yöntemi (Spearman yöntemi)
  9. Korelasyon katsayısının kullanımına ilişkin metodolojik gereksinimler
    • ilişkinin ölçülmesi yalnızca niteliksel olarak homojen popülasyonlarda mümkündür (örneğin, cinsiyet ve yaşa göre homojen olan popülasyonlarda boy ve kilo arasındaki ilişkinin ölçülmesi)
    • hesaplama mutlak veya türetilmiş değerler kullanılarak yapılabilir
    • Korelasyon katsayısını hesaplamak için gruplanmamış varyasyon serileri kullanılır (bu gereklilik yalnızca korelasyon katsayısı kareler yöntemi kullanılarak hesaplanırken geçerlidir)
    • gözlem sayısı en az 30
  10. Sıra korelasyonu yönteminin kullanımına ilişkin öneriler (Spearman yöntemi)
    • Bağlantının gücünü doğru bir şekilde belirlemeye gerek olmadığında ancak yaklaşık veriler yeterli olduğunda
    • özellikler yalnızca niceliksel olarak değil aynı zamanda niteliksel değerlerle de temsil edildiğinde
    • özellik dağılım serisinin açık seçeneklere sahip olması durumunda (örneğin, 1 yıla kadar iş deneyimi vb.)
  11. Kareler yönteminin kullanımına ilişkin öneriler (Pearson yöntemi)
    • Özellikler arasındaki bağlantının gücünün doğru bir şekilde belirlenmesi gerektiğinde
    • işaretlerin yalnızca niceliksel ifadeleri olduğunda
  12. Korelasyon katsayısının hesaplanmasına yönelik metodoloji ve prosedür

    1) Kareler yöntemi

    2) Sıralama yöntemi

  13. Korelasyon katsayısını kullanarak korelasyon ilişkisini değerlendirme şeması
  14. Korelasyon katsayısı hatasının hesaplanması
  15. Sıra korelasyon yöntemi ve kareler yöntemiyle elde edilen korelasyon katsayısının güvenilirliğinin tahmini

    Yöntem 1
    Güvenilirlik aşağıdaki formülle belirlenir:

    t kriteri, serbestlik derecesi sayısı (n - 2) dikkate alınarak bir t değerleri tablosu kullanılarak değerlendirilir; burada n, eşleştirilmiş seçeneklerin sayısıdır. T kriteri, p ≥%99 olasılığa karşılık gelecek şekilde tablo kriterine eşit veya daha büyük olmalıdır.

    Yöntem 2
    Güvenilirlik, özel bir standart korelasyon katsayıları tablosu kullanılarak değerlendirilir. Bu durumda, belirli sayıda serbestlik derecesi (n - 2) ile, hatasız tahmin p ≥%95 derecesine karşılık gelen tablodaki değere eşit veya ondan daha fazla olduğunda bir korelasyon katsayısı güvenilir kabul edilir. .

kareler yöntemini kullanmak

Egzersiz yapmak: Aşağıdaki veriler biliniyorsa korelasyon katsayısını hesaplayın, sudaki kalsiyum miktarı ile su sertliği arasındaki ilişkinin yönünü ve gücünü belirleyin (Tablo 1). İlişkinin güvenilirliğini değerlendirin. Bir sonuç çıkarın.

Tablo 1

Yöntem seçiminin gerekçesi. Sorunu çözmek için kareler yöntemi (Pearson) seçildi çünkü işaretlerin her birinin (su sertliği ve kalsiyum miktarı) sayısal bir ifadesi vardır; açık seçenek yok.

Çözüm.
Hesaplamaların sırası metinde açıklanmış, sonuçlar tabloda sunulmuştur. Bir dizi eşleştirilmiş karşılaştırılabilir özellik oluşturduktan sonra, bunları x (derece cinsinden su sertliği) ve y (mg/l cinsinden sudaki kalsiyum miktarı) ile belirtin.

Su sertliği
(derece olarak)
Sudaki kalsiyum miktarı
(mg/l cinsinden)
d x gün d x x d y dx2 gün 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
Mx =Σx / n M y =Σ y / n Σ d x x d y =7078 Σdx2 =982 Σ d y 2 =51056
M x =120/6=20 My =852/6=142
  1. Aşağıdaki formülleri kullanarak "x" satır seçeneğindeki M x ve "y" satır seçeneğindeki M y'nin ortalama değerlerini belirleyin:
    Mx = Σх/n (sütun 1) ve
    M y = Σу/n (sütun 2)
  2. Her seçeneğin "x" serisinde ve "y" serisinde hesaplanan ortalamanın değerinden sapmasını (d x ve d y) bulun
    d x = x - M x (sütun 3) ve d y = y - M y (sütun 4).
  3. d x x d y sapmalarının çarpımını bulun ve bunları toplayın: Σ d x x d y (sütun 5)
  4. Her d x ve d y sapmasının karesini alın ve değerlerini “x” serisi ve “y” serisi boyunca toplayın: Σ d x 2 = 982 (sütun 6) ve Σ d y 2 = 51056 (sütun 7).
  5. Σ d x 2 x Σ d y 2 çarpımını belirleyin ve bu çarpımdan karekök çıkarın
  6. Ortaya çıkan değerler Σ (d x x d y) ve √ (Σd x 2 x Σd y 2) Korelasyon katsayısını hesaplamak için formülü değiştirin:
  7. Korelasyon katsayısının güvenilirliğini belirleyin:
    1. yöntem. Aşağıdaki formülleri kullanarak korelasyon katsayısının (mr xy) ve t kriterinin hatasını bulun:

    Kriter t = 14,1, hatasız tahmin olasılığına karşılık gelir p > %99,9.

    2. yöntem. Korelasyon katsayısının güvenilirliği “Standart korelasyon katsayıları” tablosu kullanılarak değerlendirilir (bkz. Ek 1). Serbestlik derecesi sayısı (n - 2)=6 - 2=4 ile hesaplanan korelasyon katsayımız r xу = + 0,99, tablodakinden daha büyüktür (p = %99'da r tablosu = + 0,917).

    Çözüm. Suda ne kadar çok kalsiyum varsa, o kadar sert olur (bağlantı doğrudan, güçlü ve özgün: r xy = + 0,99, p > %99,9.

    sıralama yöntemini kullanmak

    Egzersiz yapmak: Sıralama yöntemini kullanarak, aşağıdaki veriler elde edilirse, yılların iş deneyimi ile yaralanma sıklığı arasındaki ilişkinin yönünü ve gücünü belirleyin:

    Yöntemin seçilmesinin gerekçesi: Sorunu çözmek için yalnızca sıra korelasyonu yöntemi seçilebilir çünkü “Yıl cinsinden iş deneyimi” özelliğinin ilk satırı, bağlantı kurmak için daha doğru bir yöntemin (kareler yöntemi) kullanılmasına izin vermeyen açık seçeneklere (1 yıla kadar ve 7 veya daha fazla yıla kadar iş deneyimi) sahiptir. Karşılaştırılan özellikler arasında

    Çözüm. Hesaplamaların sırası metinde sunulur, sonuçlar tabloda sunulur. 2.

    Tablo 2

    Yıllar süren iş deneyimi Yaralanma sayısı Sıra sayıları (sıralar) Sıra farkı Sıralamaların kare farkı
    X e d(x-y) gün 2
    1 yıla kadar 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 veya daha fazla 6 5 1 +4 16
    Σ d 2 = 38,5

    Güvenilir kabul edilen standart korelasyon katsayıları (L.S. Kaminsky'ye göre)

    Serbestlik derecesi sayısı - 2 Olasılık düzeyi p (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Vlasov V.V. Epidemiyoloji. - M.: GEOTAR-MED, 2004. - 464 s.
    2. Lisitsyn Yu.P. Halk sağlığı ve sağlık hizmetleri. Üniversiteler için ders kitabı. - M.: GEOTAR-MED, 2007. - 512 s.
    3. Medic V.A., Yuryev V.K. Halk sağlığı ve sağlık hizmetlerine ilişkin derslerin kursu: Bölüm 1. Halk sağlığı. - M.: Tıp, 2003. - 368 s.
    4. Minyaev V.A., Vishnyakov N.I. ve diğerleri Sosyal tıp ve sağlık kuruluşu (2 ciltlik kılavuz). - St. Petersburg, 1998. -528 s.
    5. Kucherenko V.Z., Agarkov N.M. ve diğerleri Sosyal hijyen ve sağlık kuruluşu (Eğitim) - Moskova, 2000. - 432 s.
    6. S. Glanz. Tıbbi ve biyolojik istatistikler. İngilizceden çeviri - M., Praktika, 1998. - 459 s.

Regresyon ve korelasyon analizi istatistiksel araştırma yöntemleridir. Bunlar bir parametrenin bir veya daha fazla bağımsız değişkene bağımlılığını göstermenin en yaygın yoludur.

Aşağıda, spesifik pratik örnekler kullanarak, ekonomistler arasında çok popüler olan bu iki analizi ele alacağız. Bunları birleştirirken sonuçların elde edilmesine de bir örnek vereceğiz.

Excel'de Regresyon Analizi

Bazı değerlerin (bağımsız, bağımsız) bağımlı değişken üzerindeki etkisini gösterir. Örneğin ekonomik olarak aktif nüfus sayısı işletme sayısına, ücretlere ve diğer parametrelere nasıl bağlıdır? Veya: yabancı yatırımlar, enerji fiyatları vb. GSYİH düzeyini nasıl etkiler?

Analizin sonucu öncelikleri vurgulamanıza olanak tanır. Ve ana faktörlere dayanarak, öncelikli alanların gelişimini tahmin edin, planlayın ve yönetim kararları alın.

Regresyon gerçekleşir:

  • doğrusal (y = a + bx);
  • parabolik (y = a + bx + cx 2);
  • üstel (y = a * exp(bx));
  • güç (y = a*x^b);
  • hiperbolik (y = b/x + a);
  • logaritmik (y = b * 1n(x) + a);
  • üstel (y = a * b^x).

Excel'de regresyon modeli oluşturma ve sonuçları yorumlama örneğine bakalım. Regresyonun doğrusal türünü ele alalım.

Görev. 6 işletmede ortalama aylık maaş ve işten ayrılan çalışan sayısı analiz edildi. İşten ayrılan çalışan sayısının ortalama maaşa bağımlılığının belirlenmesi gerekmektedir.

Doğrusal regresyon modeli şuna benzer:

Y = a 0 + a 1 x 1 +…+a k x k.

a regresyon katsayılarını, x etkileyen değişkenleri, k ise faktör sayısını göstermektedir.

Örneğimizde Y, çalışanların işten ayrılma göstergesidir. Etkileyen faktör ücretlerdir (x).

Excel, doğrusal regresyon modelinin parametrelerini hesaplamanıza yardımcı olabilecek yerleşik işlevlere sahiptir. Ancak “Analiz Paketi” eklentisi bunu daha hızlı yapacaktır.

Güçlü bir analitik aracı etkinleştirelim:

Etkinleştirildiğinde eklenti Veri sekmesinde mevcut olacaktır.

Şimdi regresyon analizini kendimiz yapalım.



Öncelikle R-kare ve katsayılara dikkat ediyoruz.

R-kare belirleme katsayısıdır. Örneğimizde – 0,755 veya %75,5. Bu, modelin hesaplanan parametrelerinin, çalışılan parametreler arasındaki ilişkinin %75,5'ini açıkladığı anlamına gelmektedir. Belirleme katsayısı ne kadar yüksek olursa model o kadar iyi olur. İyi - 0,8'in üzerinde. Kötü - 0,5'ten az (böyle bir analizin pek makul olduğu düşünülemez). Örneğimizde “fena değil”.

64.1428 katsayısı, söz konusu modeldeki tüm değişkenlerin 0'a eşit olması durumunda Y'nin ne olacağını gösterir. Yani, analiz edilen parametrenin değeri, modelde açıklanmayan diğer faktörlerden de etkilenir.

-0,16285 katsayısı, X değişkeninin Y üzerindeki ağırlığını gösterir. Yani, bu modeldeki ortalama aylık maaş, -0,16285 ağırlığıyla işten ayrılanların sayısını etkiler (bu küçük bir etki derecesidir). “-” işareti olumsuz bir etkiyi gösterir: maaş ne kadar yüksek olursa, o kadar az kişi ayrılır. Bu adil.



Excel'de Korelasyon Analizi

Korelasyon analizi, bir veya iki örnekteki göstergeler arasında bir ilişki olup olmadığının belirlenmesine yardımcı olur. Örneğin, bir makinenin çalışma süresi ile onarım maliyeti, ekipmanın fiyatı ile çalışma süresi, çocukların boyu ve kilosu vb. arasında.

Bir bağlantı varsa, bir parametredeki artış diğerinin artmasına (pozitif korelasyon) veya azalmasına (negatif) yol açar mı? Korelasyon analizi, analistin bir göstergenin değerinin diğerinin olası değerini tahmin etmek için kullanılıp kullanılamayacağını belirlemesine yardımcı olur.

Korelasyon katsayısı r ile gösterilir. +1 ila -1 arasında değişir. Farklı alanlar için korelasyonların sınıflandırılması farklı olacaktır. Katsayı 0 olduğunda örnekler arasında doğrusal bir ilişki yoktur.

Excel kullanarak korelasyon katsayısının nasıl bulunacağına bakalım.

Eşleştirilmiş katsayıları bulmak için CORREL işlevi kullanılır.

Amaç: Torna tezgahının çalışma süresi ile bakım maliyeti arasında bir ilişki olup olmadığını belirlemek.

İmleci herhangi bir hücreye yerleştirin ve fx düğmesine basın.

  1. “İstatistik” kategorisinde CORREL fonksiyonunu seçin.
  2. Argüman "Dizi 1" - ilk değer aralığı - makinenin çalışma süresi: A2:A14.
  3. Bağımsız değişken "Dizi 2" - ikinci değer aralığı - onarım maliyeti: B2:B14. Tamam'ı tıklayın.

Bağlantı türünü belirlemek için katsayının mutlak sayısına bakmanız gerekir (her faaliyet alanının kendi ölçeği vardır).

Birkaç parametrenin (2'den fazla) korelasyon analizi için “Veri Analizi” (“Analiz Paketi” eklentisi) kullanılması daha uygundur. Listeden korelasyonu seçmeniz ve diziyi belirlemeniz gerekir. Tüm.

Ortaya çıkan katsayılar korelasyon matrisinde görüntülenecektir. Bunun gibi:

Korelasyon ve regresyon analizi

Pratikte bu iki teknik sıklıkla birlikte kullanılmaktadır.

Örnek:


Artık regresyon analizi verileri görünür hale geldi.

Herhangi bir doğa kanunu veya sosyal gelişme, bir dizi ilişkinin tanımıyla temsil edilebilir. Bu bağımlılıklar stokastik ise ve analiz genel popülasyondan bir örnek üzerinde gerçekleştiriliyorsa, o zaman bu araştırma alanı, korelasyon, regresyon, varyans, kovaryans analizi ve analizini içeren bağımlılıkların istatistiksel çalışmasının görevleriyle ilgilidir. beklenmedik durum tabloları.

    İncelenen değişkenler arasında bir ilişki var mı?

    Bağlantıların yakınlığı nasıl ölçülür?

İstatistiksel bir çalışmada parametreler arasındaki ilişkinin genel diyagramı Şekil 1'de gösterilmektedir. 1.

Şekil S'de, incelenmekte olan gerçek nesnenin bir modeli yer almaktadır. Açıklayıcı (bağımsız, faktör) değişkenler, nesnenin çalışma koşullarını tanımlar. Rastgele faktörler, etkisinin dikkate alınması zor olan veya etkisi şu anda ihmal edilen faktörlerdir. Ortaya çıkan (bağımlı, açıklanan) değişkenler, nesnenin işleyişinin sonucunu karakterize eder.

İlişkiyi analiz etme yönteminin seçimi, analiz edilen değişkenlerin doğası dikkate alınarak gerçekleştirilir.

Korelasyon analizi, değişkenler arasındaki ilişkiyi incelemeyi içeren istatistiksel verileri işleme yöntemidir.

Korelasyon analizinin amacı, bir değişken hakkında başka bir değişken kullanarak bazı bilgiler sağlamaktır. Bir hedefe ulaşmanın mümkün olduğu durumlarda değişkenlerin korelasyonlu olduğu söylenir. Korelasyon değerlerin yalnızca doğrusal bağımlılığını yansıtır ancak işlevsel bağlantılarını yansıtmaz. Örneğin, A = sin(x) ve B = cos(x) büyüklükleri arasındaki korelasyon katsayısını hesaplarsanız bu durumda sıfıra yakın olacaktır, yani. miktarları arasında herhangi bir ilişki yoktur.

Korelasyon incelenirken grafiksel ve analitik yaklaşımlar kullanılır.

Grafiksel analiz bir korelasyon alanının oluşturulmasıyla başlar. Bir korelasyon alanı (veya dağılım grafiği), iki özelliğin ölçüm sonuçları arasındaki grafiksel bir ilişkidir. Bunu oluşturmak için, ilk veriler, her bir değer çiftini (xi, yi) dikdörtgen bir koordinat sisteminde xi ve yi koordinatlarına sahip bir nokta olarak görüntüleyen bir grafik üzerine çizilir.

Korelasyon alanının görsel analizi, incelenen iki gösterge arasındaki ilişkinin biçimi ve yönü hakkında varsayımlarda bulunmamıza olanak tanır. İlişkinin biçimine göre, korelasyon bağımlılıkları genellikle doğrusal (bkz. Şekil 1) ve doğrusal olmayan (bkz. Şekil 2) olarak ikiye ayrılır. Doğrusal bağımlılıkta korelasyon alanının zarfı bir elipse yakındır. İki rastgele değişkenin doğrusal ilişkisi, bir rastgele değişken artarken diğer rastgele değişkenin doğrusal bir yasaya göre artma (veya azalma) eğiliminde olmasıdır.

Bir özelliğin değerindeki bir artış ikincinin değerinde bir artışa yol açıyorsa ilişkinin yönü pozitiftir (bkz. Şekil 3), bir özelliğin değerindeki bir artış değerde bir azalmaya yol açıyorsa ise negatiftir. ikincinin (bkz. Şekil 4).

Yalnızca olumlu veya yalnızca olumsuz yönleri olan bağımlılıklara monotonik denir.

Psikolojik araştırma materyallerinin işlenmesinde istatistiksel yöntemlerin kullanılması, deneysel verilerden yararlı bilgilerin çıkarılması için harika bir fırsat sağlar. En yaygın istatistiksel yöntemlerden biri korelasyon analizidir.

"Korelasyon" terimi ilk olarak "hayvanların parçaları ve organları arasındaki korelasyon yasasını" türeten Fransız paleontolog J. Cuvier tarafından kullanıldı (bu yasa, vücudun bulunan parçalarından hayvanın tamamının görünümünü yeniden yapılandırmaya izin verir) . Bu terim istatistiklere İngiliz biyolog ve istatistikçi F. Galton tarafından dahil edildi (sadece "bağlantı" değil - ilişki, ve "sanki bir bağlantı varmış gibi" - korelasyon).

Korelasyon analizi, korelasyon katsayıları, iki değişkenli tanımlayıcı istatistikler, iki değişken arasındaki ilişkinin (ortak değişkenlik) niceliksel bir ölçüsü kullanılarak değişkenler arasındaki ilişkilere ilişkin hipotezlerin test edilmesidir. Dolayısıyla bu, rastgele değişkenler veya özellikler arasındaki korelasyonları tespit etmeye yönelik bir dizi yöntemdir.

İki rastgele değişken için korelasyon analizi şunları içerir:

  • bir korelasyon alanı oluşturmak ve bir korelasyon tablosu hazırlamak;
  • örnek korelasyon katsayılarının ve korelasyon ilişkilerinin hesaplanması;
  • ilişkinin önemine ilişkin istatistiksel hipotezin test edilmesi.

Korelasyon analizinin temel amacı, incelenen iki veya daha fazla değişken arasındaki, incelenen iki özellikteki ortak koordineli bir değişiklik olarak kabul edilen ilişkiyi tanımlamaktır. Bu değişkenliğin üç ana özelliği vardır: şekil, yön ve güç.

Korelasyon ilişkisinin biçimi doğrusal veya doğrusal olmayabilir. Korelasyon ilişkisini tanımlamak ve yorumlamak için doğrusal form daha uygundur. Doğrusal bir korelasyon ilişkisi için iki ana yön ayırt edilebilir: pozitif (“doğrudan bağlantı”) ve negatif (“geri bildirim”).

İlişkinin gücü doğrudan çalışılan değişkenlerin ortak değişkenliğinin ne kadar belirgin olduğunu gösterir. Psikolojide fenomenlerin işlevsel ilişkisi ampirik olarak yalnızca karşılık gelen özelliklerin olasılıksal bağlantısı olarak tanımlanabilir. Olasılıksal ilişkinin doğası hakkında net bir fikir, eksenleri iki değişkenin değerlerine karşılık gelen ve her konu bir noktayı temsil eden bir grafik olan bir dağılım diyagramı ile verilir.

Olasılıksal bir ilişkinin sayısal bir özelliği olarak, değerleri -1 ile +1 arasında değişen korelasyon katsayıları kullanılır. Hesaplamaları yaptıktan sonra araştırmacı, kural olarak yalnızca daha fazla yorumlanan en güçlü korelasyonları seçer (Tablo 1).

"Yeterince güçlü" korelasyonları seçme kriteri, korelasyon katsayısının kendisinin mutlak değeri (0,7'den 1'e kadar) veya bu katsayının istatistiksel anlamlılık düzeyine göre belirlenen göreceli değeri (0,01'den 0,1'e kadar) olabilir. örneklem büyüklüğüne göre. Küçük örneklerde, istatistiksel anlamlılık düzeyine dayalı olarak daha ileri yorumlama için güçlü korelasyonların seçilmesi daha doğrudur. Büyük örneklemler üzerinde yapılan çalışmalarda korelasyon katsayılarının mutlak değerlerinin kullanılması daha doğru olacaktır.

Bu nedenle, korelasyon analizinin görevi, değişen özellikler arasındaki ilişkinin yönünü (pozitif veya negatif) ve biçimini (doğrusal, doğrusal olmayan) belirlemek, sıkılığını ölçmek ve son olarak elde edilen korelasyon katsayılarının anlamlılık düzeyini kontrol etmekten ibarettir. .

Günümüzde pek çok farklı korelasyon katsayısı geliştirilmiştir. En çok kullanılanlar R-Pearson, R-Mızrakçı ve τ -Kendall. Modern bilgisayar istatistik programları “Korelasyonlar” menüsünde tam olarak bu üç katsayıyı sunar ve diğer araştırma problemlerini çözmek için grupları karşılaştırmaya yönelik yöntemler sunulur.

Korelasyon katsayısının hesaplanmasında kullanılacak yöntemin seçimi değişkenlerin ait olduğu ölçek türüne bağlıdır (Tablo 2).

Aralık ve nominal ölçek değişkenleri için Pearson korelasyon katsayısı (çarpım moment korelasyonu) kullanılır. İki değişkenden en az birinin sıralı ölçekte olması veya normal dağılmaması durumunda Spearman'ın sıra korelasyonu kullanılır veya

t-Kendall. İki değişkenden biri ikili ise nokta çift serili korelasyonu kullanabilirsiniz (bu özellik SPSS istatistiksel bilgisayar programında mevcut değildir; bunun yerine sıra korelasyon hesaplamaları kullanılabilir). Her iki değişken de ikili ise, dört alanlı bir korelasyon kullanılır (bu tür bir korelasyon SPSS tarafından mesafe ölçümlerinin ve benzerlik ölçümlerinin tanımına dayalı olarak hesaplanır). Dikotom olmayan iki değişken arasındaki korelasyon katsayısının hesaplanması ancak aralarındaki ilişkinin doğrusal (tek yönlü) olması durumunda mümkündür. Bağlantı örneğin sen-şekilli (belirsiz), korelasyon katsayısı bağlantı kuvvetinin ölçüsü olarak kullanılmaya uygun değildir: değeri sıfıra eğilimlidir.

Dolayısıyla korelasyon katsayılarını uygulama koşulları aşağıdaki gibi olacaktır:

  • aynı nesne örneğinde niceliksel (sıralama, metrik) ölçekte ölçülen değişkenler;
  • Değişkenler arasındaki ilişki monotondur.

Korelasyon analizi ile test edilen temel istatistiksel hipotez yönsüzdür ve popülasyonda korelasyonun sıfıra eşit olduğu yönünde bir ifade içerir. H 0: r xy= 0. Reddedilirse alternatif hipotez kabul edilir H 1: rxy≠ 0, hesaplanan korelasyon katsayısının işaretine bağlı olarak pozitif veya negatif bir korelasyonun varlığını gösterir.

Hipotezlerin kabulü veya reddine dayanarak anlamlı sonuçlar çıkarılır. İstatistiksel test sonuçlarına göre ise H 0: r xy= 0 a düzeyinde sapma göstermiyorsa anlamlı sonuç şu şekilde olacaktır: X Ve e bulunamadı. Eğer H 0 r xy= 0 a düzeyinde sapma gösterir; bu, arasında pozitif (negatif) bir ilişkinin tespit edildiği anlamına gelir. X Ve e. Ancak belirlenen korelasyonların yorumlanmasına dikkatle yaklaşılmalıdır. Bilimsel açıdan bakıldığında, iki değişken arasında basit bir ilişki kurmak, bir neden-sonuç ilişkisinin var olduğu anlamına gelmez. Üstelik bir korelasyonun varlığı, neden-sonuç arasında bir sıra ilişkisi kurmaz. Basitçe, iki değişkenin birbirleriyle şans eseri beklenebilecekten daha büyük ölçüde ilişkili olduğunu gösterir. Ancak dikkatli olunması halinde neden-sonuç ilişkilerinin araştırılmasında korelasyonel yöntemlerin kullanılması haklıdır. Göstergedeki artışın nedeni X değişkenidir gibi kategorik ifadelerden kaçınmalısınız. e" Bu tür ifadeler, teorik olarak kesinlikle gerekçelendirilmesi gereken varsayımlar olarak formüle edilmelidir.

Her bir korelasyon katsayısı için matematiksel prosedürün ayrıntılı bir açıklaması matematiksel istatistik ders kitaplarında verilmiştir; ; ; vb. Ölçüm ölçeğinin türüne bağlı olarak bu katsayıların kullanılma olasılığını açıklamakla kendimizi sınırlayacağız.

Metrik Değişkenlerin Korelasyonu

Aynı örnek üzerinde ölçülen iki metrik değişken arasındaki ilişkiyi incelemek için kullanılır. korelasyon katsayısı R-Pearson. Katsayının kendisi, genellikle sembollerle gösterilen, özellikler arasında yalnızca doğrusal bir ilişkinin varlığını karakterize eder. X Ve e. Doğrusal korelasyon katsayısı parametrik bir yöntemdir ve doğru kullanımı ancak ölçüm sonuçlarının aralık ölçeğinde sunulması ve analiz edilen değişkenlerdeki değerlerin dağılımının normalden çok az farklı olması durumunda mümkündür. Kullanımının uygun olduğu birçok durum vardır. Örneğin: bir öğrencinin zekası ile akademik performansı arasında bağlantı kurmak; ruh hali ile sorunlu bir durumdan çıkma başarısı arasında; gelir düzeyi ile mizaç vb. arasında

Pearson katsayısı psikoloji ve pedagojide yaygın olarak kullanılmaktadır. Örneğin, I. Ya. Kaplunovich ve P. D. Rabinovich, M. P. Nuzhdina'nın çalışmalarında hipotezleri doğrulamak için Pearson doğrusal korelasyon katsayısının hesaplanması kullanıldı.

Verileri manuel olarak işlerken korelasyon katsayısının hesaplanması ve ardından belirlenmesi gerekir. P-önem düzeyi (veri doğrulamayı basitleştirmek için kritik değer tablolarını kullanın) r xy, bu kriter kullanılarak derlenenler). Pearson doğrusal korelasyon katsayısının değeri +1'i aşamaz ve –1'den küçük olamaz. Bu iki sayı +1 ve –1 korelasyon katsayısının sınırlarıdır. Bir hesaplamanın +1'den büyük veya –1'den küçük bir değerle sonuçlanması, hesaplamalarda bir hata oluştuğunu gösterir.

Bilgisayarda hesaplama yapılırken, hesaplanan korelasyon katsayısına daha doğru bir değerle bir istatistik programı (SPSS, Statistica) eşlik eder. P-seviye.

Kabul veya reddetmeye ilişkin istatistiksel bir karar için H 0 genellikle kurulu α = 0,05 ve çok sayıda gözlem için (100 veya daha fazla) α = 0,01. Eğer p ≤ α, H 0 reddedilir ve incelenen değişkenler arasında (korelasyonun işaretine bağlı olarak pozitif veya negatif) istatistiksel olarak güvenilir (anlamlı) bir ilişki bulunduğuna dair anlamlı bir sonuca varılır. Ne zaman p > α, H 0 reddedilmezse, anlamlı sonuç (istatistiksel olarak anlamlı) bir bağlantının bulunmadığı ifadesi ile sınırlıdır.

Bir bağlantı bulunamazsa ancak gerçekten bir bağlantı olduğuna inanmak için bir neden varsa, bağlantının güvenilmezliğinin olası nedenlerini kontrol etmelisiniz.

İletişimin doğrusal olmaması– Bunu yapmak için iki boyutlu dağılım grafiğini analiz edin. Eğer ilişki doğrusal değil fakat monoton ise sıralama korelasyonlarına geçin. İlişki monotonik değilse, örneği ilişkinin monoton olduğu parçalara bölün ve örneğin her bölümü için korelasyonları ayrı ayrı hesaplayın veya örneği zıt gruplara bölün ve ardından bunları ifadenin ifade düzeyine göre karşılaştırın. karakter.

Bir veya her iki özelliğin dağılımında aykırı değerlerin varlığı ve belirgin asimetri. Bunu yapmak için her iki özelliğin frekans dağılımının histogramlarına bakmanız gerekir. Aykırı değerler veya asimetriler varsa, aykırı değerleri hariç tutun veya korelasyonları sıralamaya devam edin.

Örnek heterojenliği(2B dağılım grafiğini analiz edin). Örneği, ilişkinin farklı yönlere sahip olabileceği parçalara bölmeye çalışın.

Bağlantı istatistiksel olarak anlamlıysa, anlamlı bir sonuca varmadan önce yanlış korelasyon olasılığını dışlamak gerekir:

  • bağlantı emisyonlardan kaynaklanıyor. Aykırı değerler varsa sıralama korelasyonlarına gidin veya aykırı değerleri hariç tutun;
  • ilişki üçüncü değişkenin etkisinden kaynaklanmaktadır. Böyle bir olgu varsa korelasyonun sadece örneklemin tamamı için değil, her grup için ayrı ayrı hesaplanması gerekir. “Üçüncü” değişken metrik ise kısmi korelasyonu hesaplayın.

Kısmi korelasyon katsayısı r xy -zİki değişken arasındaki ilişkinin doğru olduğu varsayımının kontrol edilmesi gerektiğinde hesaplanır X Ve eüçüncü değişkenin etkisine bağlı değildir Z. Çoğu zaman, iki değişken birbiriyle ilişkilidir çünkü her ikisi de üçüncü bir değişkenin etkisi altında uyum içinde değişir. Yani aslında karşılık gelen özellikler arasında bir bağlantı yoktur ancak ortak bir nedenin etkisi altında istatistiksel bir ilişki içinde ortaya çıkar. Örneğin, farklı yaşlardaki bir grupta çeşitli psikolojik özelliklerin ilişkisi incelenirken yaş, iki değişkendeki değişkenliğin ortak bir nedeni olabilir. Kısmi korelasyonu nedensellik perspektifinden yorumlarken dikkatli olunmalıdır. Z aynı zamanda şu şekilde ilişkilidir: X ve ile e ve kısmi korelasyon r xy -z sıfıra yakın olduğundan, bundan tam olarak ne çıktığı sonucu çıkmaz. Z bunun yaygın bir nedenidir X Ve e.

Sıra değişkenlerinin korelasyonu

Korelasyon katsayısı niceliksel veriler için kabul edilemezse R-Pearson, daha sonra ön sıralamanın ardından iki değişken arasındaki ilişkiye ilişkin hipotezi test etmek için korelasyonlar uygulanabilir. R-Mızrakçı veya τ -Kendall. Örneğin, müzik konusunda yetenekli ergenlerin psikofiziksel özelliklerinin I. A. Lavochkin tarafından incelenmesinde Spearman kriteri kullanıldı.

Her iki katsayıyı (Spearman ve Kendall) doğru bir şekilde hesaplamak için, ölçüm sonuçlarının bir sıra veya aralık ölçeğinde sunulması gerekir. Bu kriterler arasında temel bir fark yoktur, ancak genel olarak Kendall katsayısının daha "anlamlı" olduğu kabul edilir, çünkü değişkenler arasındaki ilişkileri daha kapsamlı ve ayrıntılı olarak analiz eder ve değer çiftleri arasındaki tüm olası yazışmaları inceler. Spearman katsayısı, değişkenler arasındaki ilişkinin niceliksel derecesini daha doğru bir şekilde hesaba katar.

Spearman'ın sıra korelasyon katsayısı klasik Pearson korelasyon katsayısının parametrik olmayan bir analoğudur, ancak hesaplanmasında karşılaştırılan değişkenlerin (aritmetik ortalama ve varyans) dağılımla ilgili göstergeleri değil, sıralamalar dikkate alınır. Örneğin, kişinin "gerçek benliği" ile "ideal benliği" fikrinin içerdiği kişilik niteliklerine ilişkin sıralama değerlendirmeleri arasındaki bağlantıyı belirlemek gerekir.

Spearman katsayısı psikolojik araştırmalarda yaygın olarak kullanılmaktadır. Örneğin, Yu. V. Bushov ve N. N. Nesmelova'nın çalışmasında: ses sinyallerinin süresinin tahmin edilmesinin ve çoğaltılmasının bir kişinin bireysel özelliklerine bağımlılığını incelemek için kullanıldı.

Bu katsayı benzer olduğundan R-Pearson, hipotezleri test etmek için kullanımı katsayı kullanımına benzer R-Pearson. Yani, test edilen istatistiksel hipotez, istatistiksel karar verme prosedürü ve anlamlı bir sonucun formüle edilmesi aynıdır. Bilgisayar programlarında (SPSS, Statistica) aynı katsayılar için anlamlılık düzeyleri R-Pearson ve R-Spearman'lar her zaman çakışır.

Katsayı avantajı R-Spearman ve oran R-Pearson – iletişime karşı daha fazla hassasiyet. Aşağıdaki durumlarda kullanırız:

  • en az bir değişkenin dağılımında normal formdan önemli bir sapmanın varlığı (asimetri, aykırı değerler);
  • eğrisel (monotonik) bir bağlantının görünümü.

Katsayının uygulanmasına ilişkin kısıtlama R-Mızraklılar:

  • her değişken için en az 5 gözlem;
  • bir veya her iki değişken için çok sayıda aynı sıranın katsayısı kaba bir değer verir.

Sıra korelasyon katsayısı τ -Kendall aynı veya farklı eğilimlere sahip (artan veya azalan değerler) iki örneğin değer çiftlerinin oranının hesaplanmasına dayanan bağımsız orijinal bir yöntemdir. Bu katsayıya aynı zamanda denir. uyum katsayısı. Dolayısıyla, bu yöntemin ana fikri, bağlantının yönünün, konuları çiftler halinde karşılaştırarak değerlendirilebilmesidir: eğer bir çift konu X değişimle aynı doğrultudadır. e Bu olumlu bir bağlantıya işaret eder; eğer örtüşmezse, örneğin aile refahı için belirleyici öneme sahip kişisel nitelikleri incelerken olumsuz bir bağlantıya işaret eder. Bu yöntemde bir değişken, artan büyüklük sırasına göre monoton bir dizi (örneğin kocanın verileri) olarak temsil edilir; başka bir değişkene (örneğin eşin verileri) karşılık gelen sıralama yerleri atanır. Korelasyon katsayıları formülünde ters çevirme sayısı (ilk satıra kıyasla monotonluk ihlalleri) kullanılır.

Sayarken τ- Kendall "manuel olarak" veriler ilk önce değişkene göre sıralanır X. Daha sonra her konu için sıralamasının kaç katı olduğu hesaplanır. e aşağıdaki konuların sıralamasından daha düşük olduğu ortaya çıktı. Sonuç "Eşleşmeler" sütununa kaydedilir. “Eşleşme” sütunundaki tüm değerlerin toplamı P– toplam eşleşme sayısı, hesaplama açısından daha basit olan ancak örneklem arttıkça Kendall katsayısını hesaplamak için formülde değiştirilir. R-Spearman, hesaplamaların hacmi orantılı değil katlanarak artıyor. Yani örneğin ne zaman N= 12 66 çift konuyu sıralamak gerekir ve ne zaman N= 489 – zaten 1128 çift, yani hesaplamaların hacmi 17 kattan fazla artıyor. Bir istatistiksel programda (SPSS, Statistica) bir bilgisayarda hesaplama yapılırken, Kendall katsayısı katsayılara benzer şekilde hesaplanır. R-Mızrakçı ve R-Pearson. Hesaplanan korelasyon katsayısı τ -Kendall daha doğru bir değerle karakterize edilir P-seviye.

Kaynak verilerde aykırı değerler varsa Kendall katsayısının kullanılması tercih edilir.

Sıra korelasyon katsayılarının bir özelliği, maksimum mutlak sıra korelasyonlarının (+1, –1), orijinal değişkenler arasındaki katı doğrudan veya ters orantılı ilişkilere mutlaka karşılık gelmemesidir. X Ve e: Aralarında yalnızca monoton bir işlevsel bağlantı yeterlidir. Sıra korelasyonları, bir değişkenin daha büyük bir değeri her zaman başka bir değişkenin daha büyük bir değerine (+1) karşılık geliyorsa veya bir değişkenin daha büyük bir değeri her zaman başka bir değişkenin daha küçük bir değerine karşılık geliyorsa ve bunun tersi de geçerliyse (-1) maksimum mutlak değerine ulaşır. ).

Test edilen istatistiksel hipotez, istatistiksel karar alma prosedürü ve anlamlı bir sonucun formüle edilmesi vakayla aynıdır. R-Mızrakçı veya R-Pearson.

İstatistiksel olarak anlamlı bir ilişki bulunamıyorsa ancak gerçekten bir ilişkinin olduğuna inanmak için neden varsa, öncelikle katsayıdan hareket etmelisiniz.

R-Spearman'dan katsayıya τ -Kendall (veya tam tersi) ve ardından güvenilmez bağlantının olası nedenlerini kontrol edin:

  • iletişimin doğrusal olmaması: Bunu yapmak için 2B dağılım grafiğine bakın. İlişki monoton değilse, örneği ilişkinin monoton olduğu parçalara bölün veya örneği zıt gruplara bölün ve ardından bunları özelliğin ifade düzeyine göre karşılaştırın;
  • örnek heterojenliği: İki boyutlu bir dağılım grafiğine bakın, örneği, ilişkinin farklı yönlere sahip olabileceği parçalara bölmeye çalışın.

Bağlantı istatistiksel olarak anlamlıysa, anlamlı bir sonuca varmadan önce, yanlış korelasyon olasılığını dışlamak gerekir (metrik korelasyon katsayılarına benzetilerek).

İkili değişkenlerin korelasyonu

İkili bir ölçekte ölçülen iki değişkeni karşılaştırırken korelasyonun ölçüsü, ikili veriler için korelasyon katsayısı olan j katsayısıdır.

Büyüklük katsayısı φ+1 ile –1 arasında yer alır. İkili olarak ölçülen iki özellik arasındaki ilişkinin yönünü karakterize eden pozitif veya negatif olabilir. Ancak φ'nin yorumlanması belirli sorunlar ortaya çıkarabilir. φ katsayısının hesaplanmasında yer alan ikili veriler, iki boyutlu normal bir yüzeye benzemediğinden, yorumlanan değerlerin normal olduğunu varsaymak yanlıştır. r xy=0,60 ve φ = 0,60 aynıdır. Katsayı φ, kodlama yönteminin yanı sıra dört alanlı tablo veya beklenmedik durum tablosu kullanılarak da hesaplanabilir.

Korelasyon katsayısı φ'yi uygulamak için aşağıdaki koşulların karşılanması gerekir:

  • karşılaştırılan özellikler ikili bir ölçekte ölçülmelidir;
  • X Ve e aynı olmalıdır.

Bu tür bir korelasyon SPSS bilgisayar programında uzaklık ölçüleri ve benzerlik ölçülerinin tanımına dayalı olarak hesaplanır. Faktör analizi, küme analizi, çok boyutlu ölçeklendirme gibi bazı istatistiksel prosedürler bu önlemlerin kullanımı üzerine kuruludur ve bazen kendileri benzerlik önlemlerinin hesaplanması için ek yetenekler sağlarlar.

Bir değişkenin ikili bir ölçekte ölçüldüğü durumlarda (değişken X) ve diğeri aralık veya oran ölçeğinde (değişken e), kullanılmış çift ​​serili korelasyon katsayısıörneğin, bir çocuğun cinsiyetinin boy ve kilo üzerindeki etkisine ilişkin hipotezleri test ederken. Bu katsayı -1 ila +1 aralığında değişir ancak sonuçların yorumlanmasında işaretinin önemi yoktur. Bunu kullanmak için aşağıdaki koşulların karşılanması gerekir:

  • Karşılaştırılan özellikler farklı ölçeklerde ölçülmelidir: X– ikili ölçekte; diğer e– aralıklar veya oranlar ölçeğinde;
  • değişken e normal bir dağılım yasası vardır;
  • Karşılaştırılan değişkenlerdeki değişen özelliklerin sayısı X Ve e aynı olmalıdır.

Değişken ise X ikili bir ölçekte ölçülür ve değişken e sıra ölçeğinde (değişken e), kullanılabilir sıra-çift serili korelasyon katsayısı Kendall'ın τ'sı ile yakından ilişkilidir ve tanımında tesadüf ve tersinirlik kavramlarını kullanır. Sonuçların yorumlanması aynıdır.

Korelasyon analizinin SPSS ve Statistica bilgisayar programlarını kullanarak yapılması basit ve kullanışlı bir işlemdir. Bunun için İki Değişkenli Korelasyonlar iletişim kutusunu çağırdıktan sonra (Analiz>Korelasyon>İki Değişkenli...), incelenen değişkenleri Değişkenler alanına taşımanız ve değişkenler arasındaki korelasyonun belirleneceği yöntemi seçmeniz gerekir. Hesaplanan her kriter için çıktı dosyası bir kare tablo (Korelasyonlar) içerir. Tablonun her hücresi şunu gösterir: korelasyon katsayısının değeri (Korelasyon Katsayısı), hesaplanan Sig katsayısının istatistiksel önemi, denek sayısı.

Ortaya çıkan korelasyon tablosunun başlık ve yan sütunları değişkenlerin adlarını içerir. Herhangi bir değişkenin kendisiyle korelasyonu maksimum olduğundan tablonun köşegeni (sol üst - sağ alt köşe) birimlerden oluşur. Tablo bu köşegene göre simetriktir. Programda “Önemli korelasyonları işaretle” onay kutusu işaretlenirse, son korelasyon tablosunda istatistiksel olarak anlamlı katsayılar işaretlenecektir: 0,05 düzeyinde ve daha az - bir yıldız işaretiyle (*) ve 0,01 düzeyinde - ile iki yıldız (**).

Özetlemek gerekirse: Korelasyon analizinin temel amacı değişkenler arasındaki ilişkiyi belirlemektir. Bağlantının ölçüsü, seçimi doğrudan değişkenlerin ölçüldüğü ölçek türüne, karşılaştırılan değişkenlerdeki değişen özelliklerin sayısına ve değişkenlerin dağılımına bağlı olan korelasyon katsayılarıdır. İki değişken arasında korelasyonun olması, aralarında nedensel bir ilişkinin olduğu anlamına gelmez. Korelasyon doğrudan nedenselliği göstermese de, nedene dair bir ipucu olabilir. Buna dayanarak hipotezler oluşturulabilir. Bazı durumlarda korelasyon eksikliğinin nedensellik hipotezi üzerinde daha derin bir etkisi vardır. İki değişken arasındaki korelasyonun sıfır olması, bir değişkenin diğeri üzerinde etkisinin olmadığını gösterebilir.



Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!