Basit korelasyon analizi. Excel'de Regresyon Analizi

Halk sağlığı ve sağlık hizmetlerini bilimsel ve pratik amaçlarla incelerken, araştırmacının sıklıkla istatistiksel bir popülasyonun faktör ve performans özellikleri arasındaki ilişkilerin istatistiksel bir analizini yapması (nedensel ilişki) veya bu popülasyonun çeşitli özelliklerindeki paralel değişikliklerin bağımlılığını belirlemesi gerekir. üçüncü bir değere (ortak nedenlerine) dayanarak. Bu bağlantının özelliklerini inceleyebilmek, boyutunu ve yönünü belirleyebilmek ve ayrıca güvenilirliğini değerlendirebilmek gerekir. Bu amaçla korelasyon yöntemleri kullanılmaktadır.

  1. Özellikler arasındaki niceliksel ilişkilerin tezahür türleri
    • işlevsel bağlantı
    • korelasyon bağlantısı
  2. Fonksiyonel ve korelasyonel bağlantının tanımları

    Fonksiyonel bağlantı- Birinin her değeri diğerinin kesin olarak tanımlanmış bir değerine karşılık geldiğinde iki özellik arasındaki bu tür bir ilişki (bir dairenin alanı dairenin yarıçapına vb. bağlıdır). İşlevsel bağlantı, fiziksel ve matematiksel süreçlerin karakteristiğidir.

    Korelasyon- bir özelliğin her bir spesifik değerinin, kendisiyle ilişkili başka bir özelliğin çeşitli değerlerine karşılık geldiği böyle bir ilişki (bir kişinin boyu ile kilosu arasındaki ilişki; vücut ısısı ile nabız hızı arasındaki ilişki, vb.). Korelasyon tıbbi ve biyolojik süreçler için tipiktir.

  3. Korelasyon bağlantısı kurmanın pratik önemi. Faktör ve sonuç özellikleri arasındaki neden-sonuç ilişkilerinin belirlenmesi (fiziksel gelişimi değerlendirirken, çalışma koşulları, yaşam koşulları ve sağlık durumu arasındaki ilişkiyi belirlemek, hastalık sıklığının yaşa, hizmet süresine, mesleki tehlikelerin varlığı vb.)

    Çeşitli özelliklerdeki paralel değişikliklerin üçüncü bir değere bağımlılığı. Örneğin atölyede yüksek sıcaklığın etkisi altında kan basıncında, kanın viskozitesinde, nabız hızında vb. değişiklikler meydana gelir.

  4. Özellikler arasındaki ilişkinin yönünü ve gücünü karakterize eden bir değer. Bir sayıda işaretler (olgular) arasındaki bağlantının yönü ve gücü hakkında fikir veren korelasyon katsayısı, 0'dan ± 1'e kadar dalgalanmalarının sınırları
  5. Korelasyonları sunma yöntemleri
    • grafik (dağılım grafiği)
    • korelasyon katsayısı
  6. Korelasyonun yönü
    • dümdüz
    • tersi
  7. Korelasyonun gücü
    • güçlü: ±0,7 ila ±1
    • ortalama: ±0,3 ila ±0,699
    • zayıf: 0 ila ±0,299
  8. Korelasyon katsayısını ve formüllerini belirleme yöntemleri
    • kareler yöntemi (Pearson yöntemi)
    • sıralama yöntemi (Spearman yöntemi)
  9. Korelasyon katsayısının kullanımına ilişkin metodolojik gereksinimler
    • ilişkinin ölçülmesi yalnızca niteliksel olarak homojen popülasyonlarda mümkündür (örneğin, cinsiyet ve yaşa göre homojen olan popülasyonlarda boy ve kilo arasındaki ilişkinin ölçülmesi)
    • hesaplama mutlak veya türetilmiş değerler kullanılarak yapılabilir
    • Korelasyon katsayısını hesaplamak için gruplanmamış varyasyon serileri kullanılır (bu gereklilik yalnızca korelasyon katsayısı kareler yöntemi kullanılarak hesaplanırken geçerlidir)
    • gözlem sayısı en az 30
  10. Sıra korelasyonu yönteminin kullanımına ilişkin öneriler (Spearman yöntemi)
    • Bağlantının gücünü doğru bir şekilde belirlemeye gerek olmadığında ancak yaklaşık veriler yeterli olduğunda
    • özellikler yalnızca niceliksel olarak değil aynı zamanda niteliksel değerlerle de temsil edildiğinde
    • özellik dağılım serisinin açık seçeneklere sahip olması durumunda (örneğin, 1 yıla kadar iş deneyimi vb.)
  11. Kareler yönteminin kullanımına ilişkin öneriler (Pearson yöntemi)
    • Özellikler arasındaki bağlantının gücünün doğru bir şekilde belirlenmesi gerektiğinde
    • işaretlerin yalnızca niceliksel ifadeleri olduğunda
  12. Korelasyon katsayısının hesaplanmasına yönelik metodoloji ve prosedür

    1) Kareler yöntemi

    2) Sıralama yöntemi

  13. Korelasyon katsayısını kullanarak korelasyon ilişkisini değerlendirme şeması
  14. Korelasyon katsayısı hatasının hesaplanması
  15. Sıra korelasyon yöntemi ve kareler yöntemiyle elde edilen korelasyon katsayısının güvenilirliğinin tahmini

    Yöntem 1
    Güvenilirlik aşağıdaki formülle belirlenir:

    t kriteri, serbestlik derecesi sayısı (n - 2) dikkate alınarak bir t değerleri tablosu kullanılarak değerlendirilir; burada n, eşleştirilmiş seçeneklerin sayısıdır. t kriteri, p ≥%99 olasılığa karşılık gelecek şekilde tablo kriterine eşit veya daha büyük olmalıdır.

    Yöntem 2
    Güvenilirlik, özel bir standart korelasyon katsayıları tablosu kullanılarak değerlendirilir. Bu durumda, belirli sayıda serbestlik derecesi (n - 2) ile, hatasız tahmin p ≥%95 derecesine karşılık gelen tablodaki değere eşit veya ondan daha fazla olduğunda bir korelasyon katsayısı güvenilir kabul edilir. .

kareler yöntemini kullanmak

Egzersiz yapmak: Aşağıdaki veriler biliniyorsa korelasyon katsayısını hesaplayın, sudaki kalsiyum miktarı ile su sertliği arasındaki ilişkinin yönünü ve gücünü belirleyin (Tablo 1). İlişkinin güvenilirliğini değerlendirin. Bir sonuç çıkarın.

tablo 1

Yöntem seçiminin gerekçesi. Sorunu çözmek için kareler yöntemi (Pearson) seçildi çünkü işaretlerin her birinin (su sertliği ve kalsiyum miktarı) sayısal bir ifadesi vardır; açık seçenek yok.

Çözüm.
Hesaplamaların sırası metinde açıklanmış, sonuçlar tabloda sunulmuştur. Karşılaştırılabilir bir dizi eşleştirilmiş özellik oluşturduktan sonra bunları x (derece cinsinden su sertliği) ve y (mg/l cinsinden sudaki kalsiyum miktarı) ile belirtin.

Suyun sertliği
(derece olarak)
Sudaki kalsiyum miktarı
(mg/l cinsinden)
dx gün d x x d y d x 2 gün 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
Mx =Σx / n M y =Σ y / n Σ d x x d y =7078 Σdx2 =982 Σ d y 2 =51056
M x =120/6=20 M y =852/6=142
  1. Aşağıdaki formülleri kullanarak "x" satır seçeneğindeki M x ve "y" satır seçeneğindeki M y'nin ortalama değerlerini belirleyin:
    M x = Σх/n (sütun 1) ve
    M y = Σу/n (sütun 2)
  2. Her seçeneğin "x" serisinde ve "y" serisinde hesaplanan ortalamanın değerinden sapmasını (d x ve d y) bulun
    d x = x - M x (sütun 3) ve d y = y - M y (sütun 4).
  3. d x x d y sapmalarının çarpımını bulun ve bunları toplayın: Σ d x x d y (sütun 5)
  4. Her d x ve d y sapmasının karesini alın ve değerlerini “x” serisi ve “y” serisi boyunca toplayın: Σ d x 2 = 982 (sütun 6) ve Σ d y 2 = 51056 (sütun 7).
  5. Σ d x 2 x Σ d y 2 çarpımını belirleyin ve bu çarpımdan karekök çıkarın
  6. Ortaya çıkan değerler Σ (d x x d y) ve √ (Σd x 2 x Σd y 2) Korelasyon katsayısını hesaplamak için formülü değiştirin:
  7. Korelasyon katsayısının güvenilirliğini belirleyin:
    1. yöntem. Aşağıdaki formülleri kullanarak korelasyon katsayısının (mr xy) ve t kriterinin hatasını bulun:

    Kriter t = 14,1, hatasız tahmin olasılığına karşılık gelir p > %99,9.

    2. yöntem. Korelasyon katsayısının güvenilirliği “Standart korelasyon katsayıları” tablosu kullanılarak değerlendirilir (bkz. Ek 1). Serbestlik derecesi sayısı (n - 2)=6 - 2=4 ile hesaplanan korelasyon katsayımız r xу = + 0,99, tablodakinden daha büyüktür (p = %99'da r tablosu = + 0,917).

    Çözüm. Suda ne kadar çok kalsiyum varsa, o kadar sert olur (bağlantı doğrudan, güçlü ve özgün: r xy = + 0,99, p > %99,9.

    sıralama yöntemini kullanmak

    Egzersiz yapmak: Sıralama yöntemini kullanarak, aşağıdaki veriler elde edilirse, yılların iş deneyimi ile yaralanma sıklığı arasındaki ilişkinin yönünü ve gücünü belirleyin:

    Yöntemin seçilmesinin gerekçesi: Sorunu çözmek için yalnızca sıra korelasyonu yöntemi seçilebilir çünkü "Yıl cinsinden iş deneyimi" özelliğinin ilk satırı, bağlantı kurmak için daha doğru bir yöntemin (kareler yöntemi) kullanılmasına izin vermeyen açık seçeneklere (1 yıla kadar ve 7 veya daha fazla yıla kadar iş deneyimi) sahiptir. Karşılaştırılan özellikler arasında

    Çözüm. Hesaplamaların sırası metinde sunulur, sonuçlar tabloda sunulur. 2.

    Tablo 2

    Yıllar süren iş deneyimi Yaralanma sayısı Sıra sayıları (sıralar) Sıra farkı Sıralamaların kare farkı
    X e d(x-y) gün 2
    1 yıla kadar 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 veya daha fazla 6 5 1 +4 16
    Σ d 2 = 38,5

    Güvenilir kabul edilen standart korelasyon katsayıları (L.S. Kaminsky'ye göre)

    Serbestlik derecesi sayısı - 2 Olasılık düzeyi p (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Vlasov V.V. Epidemiyoloji. - M.: GEOTAR-MED, 2004. - 464 s.
    2. Lisitsyn Yu.P. Halk sağlığı ve sağlık hizmetleri. Üniversiteler için ders kitabı. - M.: GEOTAR-MED, 2007. - 512 s.
    3. Medic V.A., Yuryev V.K. Halk sağlığı ve sağlık hizmetlerine ilişkin derslerin kursu: Bölüm 1. Halk sağlığı. - M.: Tıp, 2003. - 368 s.
    4. Minyaev V.A., Vishnyakov N.I. ve diğerleri Sosyal tıp ve sağlık kuruluşu (2 ciltlik kılavuz). - St. Petersburg, 1998. -528 s.
    5. Kucherenko V.Z., Agarkov N.M. ve diğerleri Sosyal hijyen ve sağlık kuruluşu (Eğitim) - Moskova, 2000. - 432 s.
    6. S. Glanz. Tıbbi ve biyolojik istatistikler. İngilizceden çeviri - M., Praktika, 1998. - 459 s.

DERS ÇALIŞMASI

Konu: Korelasyon analizi

giriiş

1. Korelasyon analizi

1.1 Korelasyon kavramı

1.2 Korelasyonların genel sınıflandırması

1.3 Korelasyon alanları ve yapım amacı

1.4 Korelasyon analizinin aşamaları

1.5 Korelasyon katsayıları

1.6 Normalleştirilmiş Bravais-Pearson korelasyon katsayısı

1.7 Spearman'ın sıra korelasyon katsayısı

1.8 Korelasyon katsayılarının temel özellikleri

1.9 Korelasyon katsayılarının öneminin kontrol edilmesi

1.10 Çift korelasyon katsayısının kritik değerleri

2. Çok faktörlü bir deney planlamak

2.1 Sorunun durumu

2.2 Planın merkezinin (temel düzey) ve faktör değişimi düzeyinin belirlenmesi

2.3 Planlama matrisinin oluşturulması

2.4 Farklı serilerde dağılım homojenliğinin ve ölçüm denkliğinin kontrol edilmesi

2.5 Regresyon denklemi katsayıları

2.6 Tekrarlanabilirlik farkı

2.7 Regresyon denklemi katsayılarının öneminin kontrol edilmesi

2.8 Regresyon denkleminin yeterliliğinin kontrol edilmesi

Çözüm

Kaynakça

GİRİİŞ

Deneysel planlama, deneysel araştırmanın rasyonel organizasyonu için yöntemleri - incelenen faktörlerin optimal seçiminden ve amacına uygun olarak gerçek deney planının belirlenmesinden sonuçları analiz etme yöntemlerine kadar - inceleyen matematiksel ve istatistiksel bir disiplindir. Deneysel planlama, rasyonel deneysel planlamanın, tahminlerin doğruluğunda, ölçüm sonuçlarının en iyi şekilde işlenmesinden daha az önemli kazanımlar sağlamadığını vurgulayan İngiliz istatistikçi R. Fisher'ın (1935) çalışmalarıyla başladı. 20. yüzyılın 60'lı yıllarında modern deneysel planlama teorisi ortaya çıktı. Yöntemleri fonksiyon yaklaşım teorisi ve matematiksel programlamayla yakından ilgilidir. Geniş bir model sınıfı için en uygun planlar oluşturulmuş ve özellikleri incelenmiştir.

Deneysel planlama, belirli gereksinimleri karşılayan bir deney planının seçimi, bir deney stratejisi geliştirmeyi amaçlayan bir dizi eylemdir (önsel bilgi elde etmekten uygulanabilir bir matematiksel model elde etmeye veya optimal koşulları belirlemeye kadar). Bu, incelenen olgunun mekanizması hakkında eksik bilgi koşulları altında uygulanan bir deneyin amaçlı kontrolüdür.

Ölçümler sürecinde, sonraki veri işlemenin yanı sıra sonuçların matematiksel bir model biçiminde resmileştirilmesi sırasında hatalar ortaya çıkar ve orijinal verilerde yer alan bilgilerin bir kısmı kaybolur. Deneysel planlama yöntemlerinin kullanılması, matematiksel modelin hatasını belirlemeyi ve yeterliliğini değerlendirmeyi mümkün kılar. Modelin doğruluğu yetersiz çıkarsa, deneysel planlama yöntemlerinin kullanılması, matematiksel modelin ek deneylerle, önceki bilgileri kaybetmeden ve minimum maliyetle modernleştirilmesini mümkün kılar.

Bir deney planlamanın amacı, bir nesne hakkında en az emekle güvenilir ve güvenilir bilgi elde etmenin mümkün olduğu deneyleri yürütmek için bu koşulları ve kuralları bulmak ve bu bilgiyi kompakt ve kullanışlı bir biçimde sunmaktır. doğruluğun niceliksel bir değerlendirmesiyle.

Çalışmanın farklı aşamalarında kullanılan ana planlama yöntemleri arasında şunlar yer almaktadır:

Asıl anlamı, daha ayrıntılı çalışmaya konu olan bir grup önemli faktörün tüm faktör kümesinden seçimi olan bir tarama deneyinin planlanması;

ANOVA için deneysel tasarım, yani. niteliksel faktörlere sahip nesneler için planların hazırlanması;

Regresyon modellerini (polinom ve diğerleri) elde etmenizi sağlayacak bir regresyon deneyi planlamak;

Ana görevin araştırma nesnesinin deneysel optimizasyonu olduğu aşırı bir deney planlamak;

Dinamik süreçleri vb. incelerken planlama yapmak.

Disiplini incelemenin amacı, öğrencileri planlama teorisi yöntemlerini ve modern bilgi teknolojilerini kullanarak uzmanlık alanlarındaki üretim ve teknik faaliyetlere hazırlamaktır.

Disiplinin amaçları: Bilimsel ve endüstriyel deneyleri planlamak, organize etmek ve optimize etmek, deneyler yapmak ve elde edilen sonuçları işlemek için modern yöntemlerin incelenmesi.

1. KORELASYON ANALİZİ

1.1 Korelasyon kavramı

Bir araştırmacı genellikle incelenen bir veya daha fazla örnekte iki veya daha fazla değişkenin birbiriyle nasıl ilişkili olduğuyla ilgilenir. Örneğin boy kişinin kilosunu etkileyebilir mi veya kan basıncı ürün kalitesini etkileyebilir mi?

Değişkenler arasındaki bu tür bağımlılığa korelasyon veya korelasyon denir. Korelasyon, bir özelliğin değişkenliğinin diğerinin değişkenliğine uygun olduğu gerçeğini yansıtan, iki özellikteki tutarlı bir değişikliktir.

Örneğin insanların boyu ile kiloları arasında ortalama olarak pozitif bir ilişki olduğu ve boy arttıkça kişinin kilosunun da arttığı bilinmektedir. Bununla birlikte, nispeten kısa kişilerin aşırı kilolu olduğu ve tam tersine, yüksek boylu astenik kişilerin düşük kilolu olduğu bu kuralın istisnaları vardır. Bu tür istisnaların nedeni, her biyolojik, fizyolojik veya psikolojik işaretin birçok faktörün etkisiyle belirlenmesidir: çevresel, genetik, sosyal, çevresel vb.

Korelasyon bağlantıları, yalnızca matematiksel istatistik yöntemleri kullanılarak temsili örnekler üzerinde çalışılabilen olasılıksal değişikliklerdir. Her iki terim de (korelasyon ilişkisi ve korelasyon bağımlılığı) sıklıkla birbirinin yerine kullanılır. Bağımlılık etkiyi, bağlantıyı, yani yüzlerce nedenden dolayı açıklanabilecek her türlü koordineli değişikliği ima eder. Korelasyonlar neden-sonuç ilişkisinin kanıtı olarak kabul edilemez; bunlar yalnızca bir özellikteki değişikliklere genellikle başka bir özellikteki belirli değişikliklerin eşlik ettiğini gösterir.

Korelasyon bağımlılığı - Bunlar, bir özelliğin değerlerini başka bir özelliğin farklı değerlerinin ortaya çıkma olasılığına sokan değişikliklerdir.

Korelasyon analizinin görevi, değişen özellikler arasındaki ilişkinin yönünü (pozitif veya negatif) ve formunu (doğrusal, doğrusal olmayan) belirlemek, yakınlığını ölçmek ve son olarak elde edilen korelasyon katsayılarının anlamlılık düzeyini kontrol etmekten ibarettir.

Korelasyon bağlantıları biçim, yön ve derece (kuvvet) bakımından farklılık gösterir .

Korelasyon ilişkisinin şekli doğrusal veya eğrisel olabilir. Örneğin, simülatördeki eğitim oturumlarının sayısı ile kontrol oturumundaki doğru çözülmüş problemlerin sayısı arasındaki ilişki basit olabilir. Örneğin motivasyon düzeyi ile bir görevin etkinliği arasındaki ilişki eğrisel olabilir (Şekil 1). Motivasyon arttıkça, önce bir görevi tamamlamanın etkinliği artar, daha sonra görevi tamamlamanın maksimum etkinliğine karşılık gelen optimum motivasyon düzeyine ulaşılır; Motivasyondaki daha fazla artışa verimlilikte bir azalma eşlik eder.

Şekil 1 - Problem çözmenin etkinliği ile motivasyon eğilimlerinin gücü arasındaki ilişki

Korelasyon ilişkisi yönde pozitif (“doğrudan”) ve negatif (“ters”) olabilir. Pozitif doğrusal korelasyonda, bir özelliğin yüksek değerleri diğerinin yüksek değerlerine karşılık gelir ve bir özelliğin düşük değerleri diğerinin düşük değerlerine karşılık gelir (Şekil 2). Negatif korelasyon durumunda ilişkiler terstir (Şekil 3). Pozitif korelasyonda korelasyon katsayısı pozitif işarete sahiptir, negatif korelasyonda ise negatif işarete sahiptir.

Şekil 2 - Doğrudan korelasyon

Şekil 3 - Ters korelasyon


Şekil 4 – Korelasyon yok

Korelasyonun derecesi, gücü veya yakınlığı korelasyon katsayısının değeri ile belirlenir. Bağlantının gücü yönüne bağlı değildir ve korelasyon katsayısının mutlak değeri ile belirlenir.

1.2 Korelasyonların genel sınıflandırması

Korelasyon katsayısına bağlı olarak aşağıdaki korelasyonlar ayırt edilir:

Güçlü veya r>0,70 korelasyon katsayısına yakın;

Ortalama (0,50'de

Orta (0,30'da

Zayıf (0,20'de

Çok zayıf (r'de<0,19).

1.3 Korelasyon alanları ve yapım amacı

Korelasyon, iki özelliğin ölçülen değerleri (xi, y i) olan deneysel verilere dayanarak incelenir. Çok az deneysel veri varsa, iki boyutlu ampirik dağılım, x i ve y i değerlerinin çift serisi olarak temsil edilir. Aynı zamanda özellikler arasındaki korelasyon bağımlılığı farklı şekillerde açıklanabilir. Bir argüman ile bir fonksiyon arasındaki yazışma bir tablo, formül, grafik vb. ile verilebilir.

Korelasyon analizi, diğer istatistiksel yöntemler gibi, xi ve y i deneysel değerlerinin elde edildiği belirli bir genel popülasyonda incelenen özelliklerin davranışını tanımlayan olasılıksal modellerin kullanımına dayanmaktadır. Değerleri metrik ölçek birimlerinde (metre, saniye, kilogram vb.) Doğru bir şekilde ölçülebilen niceliksel özellikler arasındaki korelasyonu incelerken, genellikle iki boyutlu normal dağılmış bir nüfus modeli benimsenir. Böyle bir model, x i ve y i değişkenleri arasındaki ilişkiyi, dikdörtgen koordinat sistemindeki noktaların geometrik konumu biçiminde grafiksel olarak gösterir. Bu grafiksel ilişkiye aynı zamanda dağılım grafiği veya korelasyon alanı da denir.
Bu iki boyutlu normal dağılım modeli (korelasyon alanı), korelasyon katsayısının net bir grafiksel yorumunu vermemize olanak tanır, çünkü toplam dağılım beş parametreye bağlıdır: μ x, μ y – ortalama değerler (matematiksel beklentiler); σ x,σ y – X ve Y rastgele değişkenlerinin standart sapmaları ve p – X ve Y rastgele değişkenleri arasındaki ilişkinin bir ölçüsü olan korelasyon katsayısı.
p = 0 ise iki boyutlu normal bir popülasyondan elde edilen x i , y i değerleri grafikte dairenin sınırladığı alan içerisinde x, y koordinatlarında yer alır (Şekil 5, a). Bu durumda X ve Y rastgele değişkenleri arasında korelasyon yoktur ve bunlara korelasyonsuz denir. İki boyutlu bir normal dağılım için korelasyonsuzluk aynı zamanda X ve Y rastgele değişkenlerinin bağımsızlığı anlamına gelir.

Sıralamaya tabi iki değer dizisi varsa Spearman sıra korelasyonunu hesaplamak mantıklıdır.

Bu tür seriler temsil edilebilir:

  • incelenen aynı nesne grubunda belirlenen bir çift özellik;
  • aynı özelliklere göre incelenen 2 nesnede belirlenen bir çift bireysel alt özellik;
  • bir çift grup alt özelliği;
  • özelliklerin bireysel ve grup olarak tabi kılınması.

Yöntem, göstergelerin her bir özellik için ayrı ayrı sıralanmasını içerir.

En küçük değer en küçük rütbeye sahiptir.

Bu yöntem, incelenen olaylar arasında bir ilişkinin varlığını belirlemek için tasarlanmış parametrik olmayan bir istatistiksel yöntemi ifade eder:

  • iki niceliksel veri dizisi arasındaki gerçek paralellik derecesinin belirlenmesi;
  • niceliksel olarak ifade edilen, belirlenen bağlantının yakınlığının değerlendirilmesi.

Korelasyon analizi

2 veya daha fazla rastgele değer (değişken) arasındaki ilişkinin varlığını ve bunun gücünü belirlemek için tasarlanmış istatistiksel yönteme korelasyon analizi denir.

Adını korelasyon (enlem.) - orandan almıştır.

Kullanırken aşağıdaki senaryolar mümkündür:

  • korelasyonun varlığı (pozitif veya negatif);
  • korelasyon yok (sıfır).

Değişkenler arasında bir ilişki kuruluyorsa onların korelasyonundan bahsediyoruz. Yani X'in değeri değiştiğinde Y'nin değerinde de orantılı bir değişimin mutlaka gözlemleneceğini söyleyebiliriz.

Araç olarak çeşitli iletişim önlemleri (katsayılar) kullanılır.

Seçimleri şunlardan etkilenir:

  • rastgele sayıları ölçmek için bir yöntem;
  • rastgele sayılar arasındaki bağlantının doğası.

Bir korelasyon ilişkisinin varlığı grafiksel olarak (grafikler) ve bir katsayı (sayısal gösterim) kullanılarak görüntülenebilir.

Korelasyon ilişkisi aşağıdaki özelliklerle karakterize edilir:

  • bağlantının gücü (±0,7 ila ±1 arasında bir korelasyon katsayısı ile - güçlü; ±0,3 ila ±0,699 arasında - ortalama; 0 ila ±0,299 arasında - zayıf);
  • iletişimin yönü (doğrudan veya ters).

Korelasyon Analizinin Hedefleri

Korelasyon analizi, incelenen değişkenler arasında nedensel bir ilişki kurmamıza izin vermez.

Aşağıdaki amaçlarla gerçekleştirilir:

  • değişkenler arasında ilişkilerin kurulması;
  • başka bir değişkene dayalı olarak bir değişken hakkında belirli bilgilerin elde edilmesi;
  • bu bağımlılığın yakınlığının (bağlantısının) belirlenmesi;
  • kurulan bağlantının yönünü belirlemek.

Korelasyon analizi yöntemleri


Bu analiz aşağıdakiler kullanılarak gerçekleştirilebilir:

  • kareler yöntemi veya Pearson;
  • rütbe yöntemi veya Spearman.

Pearson yöntemi, değişkenler arasında var olan kuvvetin doğru bir şekilde belirlenmesini gerektiren hesaplamalara uygulanabilir. Yardımıyla incelenen özellikler yalnızca niceliksel olarak ifade edilmelidir.

Spearman yöntemini veya sıra korelasyonunu uygulamak için özelliklerin ifade edilmesine yönelik katı bir gereklilik yoktur - hem niceliksel hem de niteliksel olabilir. Bu yöntem sayesinde bağlantının gücünün kesin olarak belirlenmesi hakkında değil, yaklaşık nitelikte bilgi elde edilir.

Değişken satırları açık değişkenler içerebilir. Örneğin iş tecrübesi 1 yıla kadar, 5 yıldan fazla vb. değerlerle ifade edildiğinde.

Korelasyon katsayısı

İki değişkendeki değişikliklerin doğasını karakterize eden istatistiksel bir miktara korelasyon katsayısı veya çift korelasyon katsayısı denir. Niceliksel olarak -1 ile +1 arasında değişir.

En yaygın olasılıklar şunlardır:

  • Pearson– aralık ölçeğine ait değişkenler için uygulanabilir;
  • Mızrakçı– sıralı ölçek değişkenleri için.

Korelasyon katsayısını kullanmanın sınırlamaları

Korelasyon katsayısı hesaplanırken güvenilmez veriler elde etmek aşağıdaki durumlarda mümkündür:

  • yeterli sayıda değişken değer mevcuttur (25-100 çift gözlem);
  • örneğin incelenen değişkenler arasında doğrusal bir ilişki yerine ikinci dereceden bir ilişki kurulur;
  • her durumda veriler birden fazla gözlem içeriyor;
  • değişkenlerin anormal değerlerinin (aykırı değerlerin) varlığı;
  • incelenmekte olan veriler açıkça ayırt edilebilen gözlem alt gruplarından oluşur;
  • Bir korelasyonun varlığı, değişkenlerden hangisinin neden, hangisinin sonuç olarak değerlendirilebileceğini belirlememize izin vermez.

Korelasyonun anlamlılığının kontrol edilmesi

İstatistiksel büyüklükleri değerlendirmek için, bir miktarın veya onun uç değerlerinin rastgele ortaya çıkma olasılığını karakterize eden önem veya güvenilirlik kavramı kullanılır.

Bir korelasyonun önemini belirlemenin en yaygın yöntemi, Öğrenci t testidir.

Değeri tablo değeri ile karşılaştırıldığında serbestlik derecesi sayısı 2 olarak alınır. Kriterin hesaplanan değerinin tablo değerinden büyük olması korelasyon katsayısının anlamlılığını gösterir.

Ekonomik hesaplamalar yapılırken 0,05 (%95) veya 0,01 (%99) güven düzeyi yeterli kabul edilir.

Mızrakçı rütbeleri

Spearman'ın sıra korelasyon katsayısı, olaylar arasında bir ilişkinin varlığını istatistiksel olarak belirlemenize olanak tanır. Hesaplanması, her özellik için bir seri numarasının (sıralamanın) oluşturulmasını içerir. Sıralama artan veya azalan olabilir.

Sıralamaya tabi olan özelliklerin sayısı herhangi bir olabilir. Bu, sayılarını sınırlayan oldukça emek yoğun bir süreçtir. 20 işarete ulaştığınızda zorluklar başlıyor.

Spearman katsayısını hesaplamak için aşağıdaki formülü kullanın:

burada:

n – sıralanan özelliklerin sayısını görüntüler;

d, iki değişkendeki sıralar arasındaki farktan başka bir şey değildir;

ve ∑(d2) sıra farklarının karelerinin toplamıdır.

Korelasyon analizinin psikolojide uygulanması

Psikolojik araştırmanın istatistiksel olarak desteklenmesi, onu daha nesnel ve temsil gücü yüksek hale getirmeyi mümkün kılar. Psikolojik deneyler sırasında elde edilen verilerin istatistiksel olarak işlenmesi, maksimum yararlı bilginin çıkarılmasına yardımcı olur.

Sonuçlarını işlemek için en yaygın kullanılan yöntem korelasyon analizidir.

Araştırma sırasında elde edilen sonuçların korelasyon analizinin yapılması uygundur:

  • kaygı (R. Temml, M. Dorca, V. Amen'in testlerine göre);
  • aile ilişkileri (“Aile ilişkilerinin analizi” (ARA) anketi, E.G. Eidemiller, V.V. Yustitskis);
  • içsellik-dışsallık düzeyi (E.F. Bazhin, E.A. Golynkina ve A.M. Etkind'in anketi);
  • öğretmenler arasında duygusal tükenmişlik düzeyi (V.V. Boyko'nun anketi);
  • multidisipliner eğitim sırasında öğrencilerin sözel zeka unsurları arasındaki bağlantılar (K.M. Gurevich ve diğerlerinin metodolojisi);
  • empati düzeyi (V.V. Boyko'nun yöntemi) ile evlilik tatmini (V.V. Stolin, T.L. Romanova, G.P. Butenko'nun anketi) arasındaki bağlantılar;
  • ergenlerin sosyometrik durumu (Jacob L. Moreno testi) ile aile eğitim tarzının özellikleri (E.G. Eidemiller, V.V. Yustitskis'in anketi) arasındaki bağlantılar;
  • iki ebeveynli ve tek ebeveynli ailelerde büyüyen ergenlerin yaşam hedeflerinin yapıları (anket Edward L. Deci, Richard M. Ryan Ryan).

Spearman kriterini kullanarak korelasyon analizi yapmak için kısa talimatlar

Spearman'ın yöntemi kullanılarak korelasyon analizi gerçekleştirildi aşağıdaki algoritmaya göre:

  • eşleştirilmiş karşılaştırılabilir özellikler, biri X ve diğeri Y ile gösterilen 2 sıra halinde düzenlenmiştir;
  • X serisinin değerleri artan veya azalan sırada düzenlenmiştir;
  • Y serisinin değerlerinin düzenlenme sırası, X serisinin değerleriyle uygunluklarına göre belirlenir;
  • X serisindeki her değer için sıralamayı belirleyin - minimum değerden maksimum değere kadar bir seri numarası atayın;
  • Y serisindeki değerlerin her biri için sıralamayı da belirleyin (minimumdan maksimuma);
  • D=X-Y formülünü kullanarak X ve Y'nin sıraları arasındaki farkı (D) hesaplayın;
  • ortaya çıkan fark değerlerinin karesi alınır;
  • sıra farklarının karelerinin toplamını gerçekleştirin;
  • aşağıdaki formülü kullanarak hesaplamaları yapın:

Spearman korelasyon örneği

Aşağıdaki verilerin mevcut olması halinde, iş deneyimi ile yaralanma oranları arasında bir ilişkinin varlığının belirlenmesi gerekmektedir:

En uygun analiz yöntemi sıralama yöntemidir çünkü özelliklerden biri açık seçenekler şeklinde sunulur: 1 yıla kadar iş deneyimi ve 7 yıl veya daha fazla iş deneyimi.

Sorunun çözümü, bir çalışma tablosunda derlenen ve manuel olarak yapılabilen verilerin sıralanmasıyla başlar, çünkü hacimleri büyük değil:

İş deneyimi Yaralanma sayısı Seri numaraları (sıralama) Sıra farkı Sıralamaların kare farkı
d(x-y)
1 yıla kadar 24 1 5 -4 16
1-2 16 2 4 -2 4
3-4 12 3 2,5 +0,5 0,25
5-6 12 4 2,5 +1,5 2,5
7 veya daha fazla 6 5 1 +4 16
Σ d2 = 38,5

Sütundaki kesirli sıraların ortaya çıkması, eşit büyüklükte değişkenlerin ortaya çıkması durumunda sıranın aritmetik ortalamasının bulunmasından kaynaklanmaktadır. Bu örnekte, yaralanma göstergesi 12 iki kez geçiyor ve 2. ve 3. sıralara atanıyor, bu sıraların aritmetik ortalamasını (2+3)/2= 2.5 bulun ve bu değeri 2 gösterge için çalışma sayfasına yerleştirin.
Elde edilen değerleri çalışma formülünde yerine koyarak ve basit hesaplamalar yaparak -0,92'ye eşit Spearman katsayısını elde ederiz.

Negatif bir katsayı değeri, özellikler arasında ters bir ilişkinin varlığını gösterir ve kısa iş tecrübesine çok sayıda yaralanmanın eşlik ettiğini iddia etmemizi sağlar. Üstelik bu göstergeler arasındaki bağlantının gücü oldukça büyük.
Hesaplamaların bir sonraki aşaması, elde edilen katsayının güvenilirliğini belirlemektir:
hatası ve Öğrenci testi hesaplanır

Matematiksel analiz ve tahmin yöntemleri

Korelasyon analizi

giriiş

2. Regresyon analizi

3. Faktör analizi

4. Küme analizi

5. Sosyal ve hukuki süreçlerin dinamiklerinin analizi ve tahmini

Çözüm

Sosyo-ekonomik olgular ve süreçler arasında iki tür bağımlılık mümkündür: işlevsel ve stokastik. Çeşitli olayları karakterize eden veya diğer parametreler. Bu tür bağımlılığın örneklerine sosyal çevrede neredeyse hiç rastlanmaz.

Stokastik (olasılıksal) bir bağımlılıkla, bağımlı değişkenin belirli bir değeri, açıklayıcı değişkenin bir dizi değerine karşılık gelir. Bunun nedeni her şeyden önce bağımlı değişkenin hesaba katılmayan bir takım faktörlerden etkilenmesidir. Ayrıca değişkenlerin ölçümündeki hataların da etkisi vardır: değerlerin rastgele dağılması nedeniyle değerleri ancak belirli bir olasılıkla gösterilebilir.

Sosyo-ekonomik alanda olasılıksal bir yapıya sahip birçok olguyla uğraşmak zorundayız. Dolayısıyla belirli bir zaman diliminde işlenen ve çözülen suçların sayısı, herhangi bir bölgede belirli bir zaman diliminde meydana gelen trafik kazalarının sayısı rastgele değişkenlerdir.

Stokastik ilişkileri incelemek için özel yöntemler, özellikle korelasyon analizi vardır ("korelasyon" bir ilişkidir, mevcut fenomenler ve süreçler arasındaki bağlantıdır).

Korelasyon analizi- Bu, çeşitli özellikler arasındaki ilişkilerin incelenmesini mümkün kılan bir dizi istatistiksel bilgi işleme yönteminin belirli bir sırayla kullanılmasıdır.

Korelasyon analizinin görevi matematiksel istatistik yöntemi olarak bağlantının biçimini ve yönünü belirlemek ve bu bağlantının incelenen rastgele özellikler arasındaki yakınlığını ölçmektir.

İstatistikte, iki karakteristik arasındaki doğrusal ilişkinin büyüklüğü basit bir (örnek) kullanılarak ölçülür. korelasyon katsayısı. Bir değişkenin diğerlerine olan doğrusal bağımlılığının büyüklüğü, bu değişkenlerin diğer değişkenlerle olan ilişkisinden kaynaklanan doğrusal bağımlılığın bir kısmı ortadan kaldırıldıktan sonra çoklu katsayı ile ölçülür.

Biçim olarak korelasyonlar doğrusal (doğrusal) ve doğrusal olmayan (eğrisel) olabilir ve yönde olabilir.

Doğrudan bağlantı bir özelliğin değerlerinde bir artış (azalış) ile diğer bir özelliğin değerlerinin arttığını (azaldığını) belirtir. Şu tarihte: geri bildirim Bir özelliğin değerindeki artış (azalış), diğer bir özelliğin değerlerinde azalmaya (artmaya) yol açar.



Korelasyon analizinin ana görevi- Bağlantının sıkılığının ölçülmesi - çeşitli korelasyon katsayılarının hesaplanması ve bunların önemlerinin kontrol edilmesiyle çözülür.

Korelasyon katsayısı, doğrudan bir ilişki için 0'dan +1'e kadar, ters bir ilişki için -1'den 0'a kadar değerler alabilir. Katsayıların 0'a yakın olması, özellikler arasında istatistiksel olarak doğrusal bir ilişkinin olmadığı kabul edilir; Katsayıların mutlak değerleri 0,3'ün altında olduğunda ilişki zayıftır; 0,3...0,5 değerlerinde bağlantı orta düzeydedir; 0,5...0,7'de - ilişki anlamlıdır; 0,7...0,9'da - bağlantı güçlü; katsayı değerleri 0,9'dan büyükse ilişkinin çok güçlü olduğu kabul edilir; katsayılar +1 veya -1'e eşitse, o zaman işlevsel bir bağlantıdan bahsediyoruz (bu, istatistiksel çalışmalarda pratikte oluşmaz).

Bununla birlikte, ilişkinin gücüne ilişkin bu kadar basitleştirilmiş bir değerlendirme her zaman doğru değildir, çünkü istatistiksel bir ilişkinin varlığına duyulan güvenin derecesi, incelenen popülasyonun büyüklüğüne bağlıdır. Karakteristikler arasında bir ilişkinin varlığına ilişkin hipotezin kabul edilebilmesi için popülasyonun hacmi ne kadar küçükse korelasyon katsayısının değeri de o kadar büyük olmalıdır. Özellikler arasında doğrusal bir istatistiksel ilişkinin varlığına olan güvenin derecesini niceliksel olarak ölçmek için, kavramlar önem düzeyi Ve eşik (kritik) değerler korelasyon katsayısı.

Önem kontrolü Ortaya çıkan korelasyon katsayısı, hesaplanan değerin kritik değerle karşılaştırılmasından oluşur. Belirli sayıda ölçüm ve belirli bir anlamlılık düzeyi için kritik bir değer bulunur ve hesaplanan değerle karşılaştırılır. Hesaplanan değer kritik değerden büyükse ilişki anlamlıdır; daha azsa ilişki ya yoktur (ve korelasyon katsayısının bu değeri rastgele sapmalarla açıklanır) ya da örneklem tanımlanamayacak kadar küçüktür. BT.

İçin doğrusal bir ilişkinin varlığını ve büyüklüğünü belirlemek iki değişken X ve Y arasında iki prosedürün gerçekleştirilmesi gerekir. Birincisi, [(Xi,Yi),i=1,n] noktalarını düzlem üzerinde grafiksel olarak görüntülemektir. Ortaya çıkan grafiğe değişkenler arasında doğrusal bir ilişki olduğu varsayımının geçerliliği denir. Böyle bir varsayım kabul edilebilirse, o zaman doğrusal ilişkinin büyüklüğünü niceliksel biçimde ifade etmek gerekir. Bunu yapmak için örnek korelasyon katsayısı kullanılır:

burada n ölçüm sayısı, Xi,Yi i'inci değerler, X,Y ortalama değerler, sx, sy sırasıyla X ve Y değişkenlerinin standart sapmalarıdır.

İstatistiksel analiz teorisinde korelasyon ilişkisi, analiz edilen değişkenlerin normal dağılım koşulları altında doğrusal bir bağımlılık olarak tanımlanır. Bu nedenle korelasyon yöntemlerinin doğru uygulanabilmesi için değişkenlerin dağılımının normale, ilişki biçiminin ise doğrusala yakınlığının gerekçelendirilmesi gerekmektedir. Aksi halde daha karmaşık analiz tekniklerinin veya diğer birleştirme katsayılarının kullanılması gerekir.

Ampirik bir dağılımın normalliğini kontrol etmenin oldukça basit, hesaplama açısından basit bir yolu, aşağıdaki oranı tahmin etmektir:

,

burada C ortalama mutlak sapmadır, s ise standart sapmadır.

Belirtilen eşitsizlik karşılanırsa ampirik dağılımların normalliğinden ve korelasyon katsayısının değişkenler arasındaki doğrusal istatistiksel ilişkinin bir ölçüsü olarak kullanılmasının doğruluğundan bahsedebiliriz.

Genel olarak suç oranı birçok faktörden etkilenir. Bunlar sosyo-ekonomik, coğrafi ve iklimsel, demografik vb.nin yanı sıra güçleri ve araçları karakterize eden işaretleri, içişleri organının örgütlenme derecesini içerir.

Ancak iki değişken arasında istatistiksel olarak güçlü, anlamlı bir ilişki olsa bile, bunların nedenselliğinden tam olarak emin olunamaz, çünkü ortak istatistiksel ilişkiyi belirleyen başka nedenler (faktörler) olabilir. İstatistiksel sonuçlar her zaman sağlam bir teorik çerçeveyle desteklenmelidir.

Aynı zamanda, istatistiksel olarak anlamlı bir bağlantının olmaması, bir neden-sonuç ilişkisinin olmadığını göstermez, ancak temel kavram ve pratik deneyim bunun mümkün olduğunu gösteriyorsa, kişiyi onu tanımlamanın başka yollarını ve araçlarını aramaya zorlar. varoluş.

KORELASYON ANALİZİ- Matematiksel korelasyon teorisine dayanan, rastgele olaylar ve olaylar arasındaki ilişkiyi değerlendirmek için bir dizi yöntem. Bu durumda, minimum hesaplama gerektiren en basit özellikler kullanılır. "Korelasyon" terimi genellikle "bağlantı" ve "karşılıklı bağımlılık" kavramlarıyla tanımlanır. Ancak bunlar yeterli değildir. Korelasyon, özellikler arasındaki bağlantının yalnızca bir türüdür; ortalama olarak görünür ve doğası gereği doğrusaldır. İki miktar arasında kesin bir ilişki varsa, böyle bir ilişkiye fonksiyonel denir ve miktarlardan (neden) birinden diğer miktarın (etki) değerini açıkça belirlemek mümkündür. Fonksiyonel bağımlılık, ilişkinin iki miktarın her değeri için değil, yalnızca ortalama olarak ortaya çıktığı rastgele (olasılıklı, stokastik) bağımlılığın özel bir ifadesidir.

K. a. İki veya daha fazla rastgele değişken incelenirken en önemli iki niceliksel özelliği tanımlamak için kullanılır: bu nicelikler arasındaki ilişki için matematiksel bir denklem ve aralarındaki ilişkinin yakınlığının değerlendirilmesi. Bu özelliklerin belirlenmesine yönelik ilk veriler, gözlemin (ölçüm, deney) eşzamanlı sonuçlarıdır, yani aralarındaki ilişki incelenmekte olan özelliklere ilişkin deneyim istatistiksel verilerinden eşzamanlı olarak elde edilir. Başlangıç ​​verileri, gözlem sonuçlarının kayıtlarını veya bunların manyetik bant, delikli bant veya delikli kartlar üzerindeki eşdeğer temsillerini içeren tablolar şeklinde belirtilebilir.

K. a. çeşitli işaretler arasındaki yakınlık ve ilişki denklemlerini belirlemek için tıp ve biyolojide geniş uygulama alanı bulmuştur; örneğin, sağlıklı veya hasta insanlar üzerinde yapılan kama analizlerinin, işaretlerin veya özel muayenelerin sonuçları (bkz. Vücut fonksiyonlarının korelasyonu). Sonuçlar K. a. hastalıklara ilişkin nesnel tahminler yapmak, hastanın durumunu ve hastalığın seyrini değerlendirmek için kullanılır (bkz. Tahmin). A priori, yalnızca teorik biyol ve bal sonuçlarına dayanmaktadır. Araştırmada, incelenen özelliklerin birbirleriyle nasıl ilişkili olduğunu tahmin etmek zor, hatta imkansızdır. Bu soruyu cevaplamak için bir gözlem veya özel bir deney yapılır.

İki boyutlu korelasyon analizi, herhangi iki özelliğin tezahürüne ilişkin deneysel verileri işlerken kullanılır.

KORELASYON TABLOSU. Not. Tablo, X ve Y işaretlerinin aralıklarını ve bunların ortaya çıkma sıklıklarını (tablonun ortasında) gösterir; burada Y, çapıdır, ampulokonjonktival bölgenin mikro damar yapısının morfometrik analizinin sonuçlarından hesaplanır. venül ve X, arteriyolün çapıdır (mmk cinsinden).

Her deneysel sonuç rastgele bir değişkendir ve objektif modeller yalnızca ölçüm sonuçlarının tamamında görünür. Bu nedenle, rastgele olan bireysel değerlere değil, tüm deneysel veri setinin işlenmesinin sonuçlarına dayanarak sonuçlar çıkarılır. Rastgele bir olayın etkisini azaltmak için, ilk veriler gruplar halinde birleştirilir ve bu, bir korelasyon tablosu derlenerek elde edilir (tabloya bakın). Böyle bir tablo, iki özelliğin (Y ve X) değerlerinin aralıklarını (veya orta noktalarını) ve ayrıca bu değerlerin karşılık gelen aralığında X ve Y değerlerinin ortaya çıkma sıklığını içerir. Deneyin sonuçlarından hesaplanan bu frekanslar, belirli bir aralığın X ve Y değerlerinin birlikte ortaya çıkma olasılığının pratik bir tahminini temsil eder. Bir korelasyon tablosunun oluşturulması, ilk bilgilerin işlenmesinin ilk aşamasıdır. Korelasyon tablolarının oluşturulması ve bunların daha sonraki tam işlemleri, evrensel veya özel bilgisayarlarda hızlı bir şekilde gerçekleştirilir (bkz. Elektronik bilgisayar). Korelasyon tablosunun gruplandırılmış verileri kullanılarak denklemin ampirik özellikleri ve bağlantının gücü hesaplanır. Y ve X arasındaki ilişki denklemini belirlemek için, X karakteristiğinin her aralığında Y karakteristiğinin ortalama değerleri hesaplanır. Böylece. her i-inci aralık için Yxi değerini elde edin; bu değerin bağlantısı, tüm i-aralıkları için ortalama olarak Y özelliği ile X özelliği arasındaki bağlantının biçimini karakterize eden ampirik bir regresyon çizgisi verir - Yx= f(x) fonksiyonunun bir grafiği . Y ve X özellikleri arasında kesin bir bağlantı olsaydı, bağlantı denklemi pratik ve teorik sorunları çözmek için yeterli olurdu, çünkü X'in değeri verilirse onun yardımıyla Y özelliğinin değerini belirlemek her zaman mümkündür. Uygulamada Y ile X arasındaki ilişki kesin değildir, bu ilişki rastgeledir ve X'in bir değeri Y'nin bir dizi değerine karşılık gelir. Bu nedenle Y arasındaki ilişkinin gücünü ve yakınlığını ölçen başka bir özelliğe ihtiyaç vardır. ve X. Bu tür özellikler, dağılım (korelasyon) ilişkisi ηух ve korelasyon katsayısı ryx'tir. Bu niceliklerden ilki, keyfi bir f fonksiyonunda Y ve X arasındaki bağlantının yakınlığını karakterize eder ve ryx yalnızca f'nin doğrusal bir fonksiyon olduğu durumda kullanılır.

ηyx ve ryx değerleri de basit bir şekilde korelasyon tablosundan belirlenir. Hesaplama genellikle aşağıdaki sırayla gerçekleştirilir: hem X hem de Y özelliklerinin ortalama değerleri belirlenir, standart sapmaları σx ve σy ve ardından formüle göre ηxy:

ve aşağıdaki formüle göre ryx:

burada n toplam deney sayısıdır, Xcpi i-inci aralığın X'inin ortalama değeridir, Ycpj j-inci aralığın Y'sinin ortalama değeridir, k, l X ve Y özellik aralıklarının sayısıdır, sırasıyla mi(x), Xcpi değerlerinin frekansıdır (sayısıdır). ηyx ve ryx'i belirleme doğruluğunun niceliksel özellikleri, bunların standart sapmalarıdır;

η katsayısının değerleri sıfır ile bir arasındadır (0=<ηyx=<1). Если ηyx= 0 (рис., а), то это свидетельствует о том, что признаки Y и X недисперсированы, т. е. регрессия Yx = f(x) не дает связи между признаками Y и X, а при ηyx = 1 существует однозначная связь между Y и X (рис., б, ж). Для ηyx<1 признак Y только частично определяется признаком X, и необходимо изучение дополнительных признаков для повышения достоверности определения Y (рис., г, д, е, и).

r katsayısının değeri -1 ile +1 arasındadır (-1=

Çok değişkenli korelasyon analizi - incelenen özelliklerin sayısının ikiden fazla olduğu durumlarda denklemin ve ilişkinin gücünün belirlenmesi. Dolayısıyla, eğer Y karmaşık bir özellikse ve sonucu bir dizi X1, X2, ..., Xn özelliğinin görünümüne bağlıysa, o zaman deneysel verilere göre aşağıdakiler belirlenmelidir: a) bağlantı denklemi Y özelliğinin X1, X2,... ., Xn özellikleri kümesiyle birlikte kullanılması, yani Yx1x2...xn = F(x1, x2...,xn) ; b) Y ile X1, X2,..., Xn kümesi arasındaki bağlantının yakınlığı.

Gözlemin ön işlenmesi çok boyutlu CA ile sonuçlanır. her bir özellik çifti için ηyxi (i = 1,2,..., n) ve ηxixj (i!=j) korelasyon katsayıları ryxi ve rxixj dağılım ilişkilerinin değerlerinin yanı sıra eşleştirilmiş Yxi regresyonlarının belirlenmesidir. = fi(xi) Bu verilerden, çoklu regresyon denklemleri Yx1x2...xn = F (x1,x2,...,xn), çoklu dağılım ilişkisi ηyx1x2...xn ve çoklu korelasyon katsayısı Ryx1x2...xn belirlenir. Çoklu regresyon denklemi, X1, X2, ..., Xn değerlerine dayanarak Y karakteristiğinin değerini belirlemeyi mümkün kılar, yani bu denklemle Y'nin değerlerini tahmin etmek mümkündür. ortaya çıkan setin belirli değerlerinin sonuçlarına dayanmaktadır (örneğin, X1, X2...Xn özelliklerine ilişkin analiz sonuçları). ηyx1x2...xn değeri, isteğe bağlı bir F fonksiyonu için Y ile X1, X2, ...Xn karakteristikleri kümesi arasındaki bağlantının yakınlığının bir karakteristiği olarak kullanılır ve Ryx1x2...xn - aşağıdaki durum için kullanılır: F fonksiyonu doğrusaldır. ηyx1x2....xn ve Ryx1x2...xn katsayıları sıfır ile bir arasında değerler alır. Çok boyutlu CA'nın dikkate alınması. ek özellikler, ηyx1x2...xn, Ryx1x2...xn değerlerinin birliğe daha yakın elde edilmesini mümkün kılar ve böylece çoklu regresyon denklemi kullanılarak Y özelliğinin tahmininin doğruluğunu arttırır.

Örnek olarak, eşleştirilmiş CA'nın sonuçlarını, ayrıca çoklu regresyon denklemini ve işaretler arasındaki çoklu korelasyon katsayısını ele alalım: Y - stabil psödoparezi, X1 - sağdaki uzuvlardaki motor kusurun lateralizasyonu, X2 - soldaki uzuvlarda da aynı, X3 - bitkisel krizler. Bunlara ait dağılım ilişkileri ve ikili korelasyon katsayılarının değerleri sırasıyla ηyx1 = 0,429, ηyx2 = 0,616, ηyx3 = -0,334 ve ryx1 = 0,320, ryx2 = 0,586, ryx3 = -0,325 olacaktır. Çoklu doğrusal regresyon denklemine göre Yx1x2x3 = 0,638 x1 + 0,839 x2 - 0,195 x3. Çoklu korelasyon katsayısı Ryx1x2x3 =0,721 olarak ifade edilecektir. Örnek, X1, X2 ve X3 verilerine göre stabil psödoparezinin uygulama için yeterli doğrulukla tahmin edilebileceğini göstermektedir.

K. a.'nın yöntemleri. Ayrıca dinamik özelliklerin elde edilmesini de mümkün kılarlar. Bu durumda çalışılan özellikler (örneğin EKG, EEG, vb.) Y(t) ve X(t)'nin rastgele fonksiyonları olarak kabul edilir. Bu fonksiyonların gözlem sonuçlarına dayanarak, en önemli iki özellik de belirlenir: a) telekom operatörünün Y (t) ve X (t) arasındaki değerlendirilmesi (matematiksel denklem); b) aralarındaki bağlantının yakınlığının değerlendirilmesi. Y(t) ve X(t) rastgele fonksiyonlarının dağılım ve korelasyon fonksiyonları, bağlantının sıkılığının özellikleri olarak alınır. Bu fonksiyonlar varyans ilişkilerinin ve korelasyon katsayılarının bir genellemesidir. Böylece, her sabit değer t'nin normalleştirilmiş karşılıklı dağılım fonksiyonu ηyx(t), Y(t) ve X(t) özelliklerinin değerleri arasındaki dağılım ilişkisidir. Benzer şekilde, normalleştirilmiş çapraz korelasyon fonksiyonu Ryx(t), her sabit değer t için, Y(t) ve X(t) özellikleri arasındaki korelasyon katsayısını temsil eder. Zamanın farklı noktalarında incelenen aynı değer için doğrusal bir ilişkinin (bağımlılık) karakteristiğine otokorelasyon denir.

K. a. matematiksel modellerin elde edilmesinde ve tıbbi-biyoloji, araştırma ve tedaviyi otomatikleştirmede yaygın kullanım alanı bulan tanımlama problemini çözme yöntemlerinden biridir.

Kaynakça: Bilgisayar sistemleri ve kalp hastalıklarının otomatik tanısı, ed. C. Caceres ve L. Dreyfus, çev. İngilizce'den, M., 1974; Gutman S.R. Kitapta normal rastgele bir sürece yaklaşan iki elektroensefalogram modeli hakkında: Yönetim ve bilgi. Yaşayan Doğadaki Süreçler, ed. V. V. Larina, s. 205, M., 1971; Zaslavskaya R.M., Perepel-kin E.G. ve Akhmetov K.Z. Gün içinde anjina pektorisli hastalarda hemokoagülasyon göstergeleri ile lipit metabolizması arasındaki korelasyon bağlantıları, Kardiyoloji, cilt 17, no. 111, 1977; Kramer G. İstatistiğin matematiksel yöntemleri, çev. İngilizce'den, M., 1975; Pasternak E. B. ve ark. Atriyal fibrilasyon sırasında kulakçıkların elektriksel aktivitesinin enstrümantal korelasyon analizi kullanılarak incelenmesi, Cardiology, cilt 17, Hya 7, s. 50, 1977; Sinitsyn B.S. Otomatik bağdaştırıcılar ve uygulamaları, Novosibirsk, 1964, bibliogr.; U r b a x V. Yu. Biyolojik ve tıbbi araştırmalarda istatistiksel analiz, M., 1975, bibliogr.

V. N. Raibman, N. S. Raibman.



Makaleyi beğendin mi? Arkadaşlarınla ​​paylaş!