Korelasyon analizine neden ihtiyaç duyulur? Yöntemi kullanma koşulları

Doğayı, toplumu ve ekonomiyi incelerken gözlemlenen süreçler ve olaylar arasındaki karşılıklı ilişkiyi hesaba katmak gerekir. Üstelik açıklamanın bütünlüğü, şu ya da bu şekilde, aralarındaki neden-sonuç ilişkilerinin niceliksel özellikleriyle belirlenir. Bunlardan en önemlilerini ve bazı faktörlerin diğerleri üzerindeki etkisini değerlendirmek, istatistiğin temel görevlerinden biridir.

İlişkilerin tezahür biçimleri çok çeşitlidir. Bunların en yaygın iki türü olarak işlevsel vurgu(dolu) ve korelasyon(eksik) bağlantı. İlk durumda, faktör karakteristiğinin değeri bir veya daha fazla fonksiyon değerine tam olarak karşılık gelir. Çoğu zaman fizik ve kimyada fonksiyonel bağlantılar ortaya çıkar. Ekonomide buna bir örnek, emek verimliliği ile artan üretim arasındaki doğrudan orantılı ilişkidir.

Bağımlı değişkenin verilen değerleri bağımsız değişkenin belirli sayıda olası değerine karşılık geldiğinde, kütle gözlemleri için ortalama olarak bir korelasyon ilişkisi (eksik veya istatistiksel olarak da adlandırılır) ortaya çıkar. Bunun açıklaması, etkileşimi hesaba katılmayan rastgele değişkenlerden etkilenen, analiz edilen faktörler arasındaki ilişkilerin karmaşıklığıdır. Bu nedenle, işaretler arasındaki bağlantı yalnızca vakaların çoğunda ortalama olarak ortaya çıkar. Korelasyon bağlantısında her argüman değeri, belirli bir aralıkta rastgele dağıtılan fonksiyon değerlerine karşılık gelir.

Örneğin, argümandaki hafif bir artış, fonksiyonun yalnızca ortalama bir artışını veya azalmasını (yönüne bağlı olarak) gerektirecek, bireysel gözlem birimleri için belirli değerler ise ortalamadan farklı olacaktır. Bu tür bağımlılıklar her yerde bulunur. Örneğin tarımda bu, verim ile uygulanan gübre miktarı arasındaki ilişki olabilir. Açıkçası, ikincisi mahsulün oluşumunda rol oynuyor. Ancak her spesifik tarla veya arsa için aynı miktarda uygulanan gübre, nihai sonucu oluşturan bir dizi başka faktörün (hava durumu, toprak durumu vb.) etkileşimi nedeniyle verimde farklı bir artışa neden olacaktır. Bununla birlikte, ortalama olarak böyle bir ilişki gözlenmektedir - uygulanan gübrelerin kütlesindeki artış, verimde artışa yol açmaktadır.

İletişimin yönüne göre dümdüz, Bağımlı değişken faktör özelliğinin artmasıyla arttığında ve tersi, ikincisinin büyümesine fonksiyonda bir azalma eşlik eder. Bu tür bağlantılar sırasıyla pozitif ve negatif olarak da adlandırılabilir.

Analitik formlarıyla ilgili olarak bağlantılar doğrusal Ve doğrusal olmayan.İlk durumda, özellikler arasında ortalama olarak doğrusal ilişkiler ortaya çıkar. Doğrusal olmayan bir ilişki, doğrusal olmayan bir fonksiyonla ifade edilir ve değişkenler ortalama olarak birbirleriyle doğrusal olmayan bir şekilde ilişkilidir.

Etkileşen faktörler açısından bağlantıların oldukça önemli bir özelliği daha vardır. İki özellik arasındaki bağlantı karakterize edilirse, genellikle buna denir. buhar odası. İkiden fazla değişken inceleniyorsa – çoklu.

Yukarıdaki sınıflandırma kriterleri çoğunlukla istatistiksel analizde bulunur. Ancak listelenenlere ek olarak, ayrıca doğrudan, dolaylı Ve YANLIŞ iletişim. Aslında her birinin özü isminden bellidir. İlk durumda faktörler birbirleriyle doğrudan etkileşime girer. Dolaylı bir bağlantı, incelenen özellikler arasındaki ilişkiye aracılık eden bazı üçüncü değişkenlerin katılımıyla karakterize edilir. Yanlış bağlantı, resmi olarak kurulan ve kural olarak yalnızca niceliksel tahminlerle onaylanan bir bağlantıdır. Niteliksel bir temeli yoktur veya anlamsızdır.

Güç bakımından farklılık gösterir zayıf Ve güçlü iletişim. Bu resmi özellik, belirli niceliklerle ifade edilir ve belirli göstergeler için bağlantının gücüne ilişkin genel kabul görmüş kriterlere uygun olarak yorumlanır.

En genel biçimde, ilişkileri inceleme alanındaki istatistiğin görevi, onların varlığını ve yönünü ölçmek ve ayrıca bazı faktörlerin diğerleri üzerindeki etkisinin gücünü ve biçimini karakterize etmektir. Bunu çözmek için, biri korelasyon analizi yöntemlerini, diğeri regresyon analizini içeren iki grup yöntem kullanılır. Aynı zamanda, bazı araştırmacılar bu yöntemleri bir temele sahip olan korelasyon-regresyon analizinde birleştirir: bir takım genel hesaplama prosedürlerinin varlığı, sonuçların yorumlanmasında tamamlayıcılık, vb.

Dolayısıyla bu bağlamda ilişkinin kapsamlı bir şekilde karakterize edilmesi durumunda geniş anlamda korelasyon analizinden bahsedebiliriz. Aynı zamanda bağlantının kuvvetinin incelendiği dar anlamda korelasyon analizi ve bağlantının şeklinin ve bazı faktörlerin diğerleri üzerindeki etkisinin değerlendirildiği regresyon analizi de bulunmaktadır.

Görevlerin kendisi korelasyon analizi değişen özellikler arasındaki ilişkinin yakınlığını ölçmek, bilinmeyen nedensel ilişkileri belirlemek ve ortaya çıkan özellik üzerinde en büyük etkiye sahip olan faktörleri değerlendirmek.

Görevler regresyon analizi bağımlılığın formunun belirlenmesi, regresyon fonksiyonunun belirlenmesi ve bağımlı değişkenin bilinmeyen değerlerinin tahmin edilmesi için bir denklem kullanılması alanında yatmaktadır.

Bu sorunların çözümü, kullanımı ilişkilerin istatistiksel incelenmesi hakkında konuşmaya zemin sağlayan uygun tekniklere, algoritmalara, göstergelere dayanmaktadır.

Geleneksel korelasyon ve regresyon yöntemlerinin, bilgisayarlar için çeşitli istatistiksel yazılım paketlerinde yaygın olarak temsil edildiğine dikkat edilmelidir. Araştırmacı ancak bilgiyi doğru bir şekilde hazırlayabilir, analiz gereksinimlerini karşılayan bir yazılım paketi seçebilir ve elde edilen sonuçları yorumlamaya hazır olabilir. İletişim parametrelerini hesaplamak için birçok algoritma vardır ve şu anda bu kadar karmaşık bir analiz türünün manuel olarak yapılması pek tavsiye edilmez. Hesaplamalı prosedürler bağımsız olarak ilgi çekicidir, ancak sonuçların yorumlanmasına yönelik belirli yöntemlerin ilişkilerini, yeteneklerini ve sınırlamalarını inceleme ilkelerine ilişkin bilgi, araştırma için bir ön koşuldur.

Bir bağlantının gücünü değerlendirme yöntemleri korelasyon (parametrik) ve parametrik olmayan olarak ikiye ayrılır. Parametrik yöntemler, kural olarak normal dağılım tahminlerinin kullanılmasına dayanır ve incelenen popülasyonun normal dağılım yasasına uyan değerlerden oluştuğu durumlarda kullanılır. Uygulamada bu pozisyon çoğu zaman önsel olarak kabul edilir. Aslında bu yöntemler parametriktir ve genellikle korelasyon yöntemleri olarak adlandırılır.

Parametrik olmayan yöntemler, çalışılan büyüklüklerin dağılım kanununa kısıtlama getirmez. Avantajları hesaplamaların basitliğidir.

Matematiksel analiz ve tahmin yöntemleri

Korelasyon analizi

giriiş

2. Regresyon analizi

3. Faktör analizi

4. Küme analizi

5. Sosyal ve hukuki süreçlerin dinamiklerinin analizi ve tahmini

Çözüm

Sosyo-ekonomik olgular ve süreçler arasında iki tür bağımlılık mümkündür: işlevsel ve stokastik. Çeşitli olayları karakterize eden veya diğer parametreler. Bu tür bağımlılığın örneklerine sosyal çevrede neredeyse hiç rastlanmaz.

Stokastik (olasılıklı) bir bağımlılıkla, bağımlı değişkenin belirli bir değeri, açıklayıcı değişkenin bir dizi değerine karşılık gelir. Bunun nedeni her şeyden önce bağımlı değişkenin hesaba katılmayan bir takım faktörlerden etkilenmesidir. Ayrıca değişkenlerin ölçümündeki hataların da etkisi vardır: değerlerin rastgele dağılması nedeniyle değerleri ancak belirli bir olasılıkla gösterilebilir.

Sosyo-ekonomik alanda olasılıksal bir yapıya sahip birçok olguyla uğraşmak zorundayız. Dolayısıyla belirli bir zaman diliminde işlenen ve çözülen suçların sayısı, herhangi bir bölgede belirli bir zaman diliminde meydana gelen trafik kazalarının sayısı rastgele değişkenlerdir.

Stokastik ilişkileri incelemek için özel yöntemler, özellikle korelasyon analizi vardır ("korelasyon" bir ilişkidir, mevcut fenomenler ve süreçler arasındaki bağlantıdır).

Korelasyon analizi- Bu, çeşitli özellikler arasındaki ilişkilerin incelenmesini mümkün kılan bir dizi istatistiksel bilgi işleme yönteminin belirli bir sırayla kullanılmasıdır.

Korelasyon analizinin görevi matematiksel istatistik yöntemi olarak bağlantının biçimini ve yönünü belirlemek ve bu bağlantının incelenen rastgele özellikler arasındaki yakınlığını ölçmektir.

İstatistikte, iki karakteristik arasındaki doğrusal ilişkinin büyüklüğü basit bir (örnek) kullanılarak ölçülür. korelasyon katsayısı. Bir değişkenin diğerlerine olan doğrusal bağımlılığının büyüklüğü, bu değişkenlerin diğer değişkenlerle olan ilişkisinden kaynaklanan doğrusal bağımlılığın bir kısmı ortadan kaldırıldıktan sonra çoklu katsayı ile ölçülür.

Korelasyon bağlantıları form olarak doğrusal (doğrusal) ve doğrusal olmayan (eğrisel) olabilir ve yönde olabilir.

Doğrudan bağlantı bir özelliğin değerlerinde bir artış (azalış) ile diğer bir özelliğin değerlerinin arttığını (azaldığını) belirtir. Şu tarihte: geri bildirim Bir özelliğin değerindeki artış (azalış), diğer bir özelliğin değerlerinde azalmaya (artmaya) yol açar.



Korelasyon analizinin ana görevi- bağlantının sıkılığının ölçülmesi - çeşitli korelasyon katsayılarının hesaplanması ve bunların önemlerinin kontrol edilmesiyle çözülür.

Korelasyon katsayısı, doğrudan bir ilişki için 0'dan +1'e kadar, ters bir ilişki için -1'den 0'a kadar değerler alabilir. Katsayıların 0'a yakın olması, özellikler arasında istatistiksel olarak doğrusal bir ilişkinin olmadığı kabul edilir; Katsayıların mutlak değerleri 0,3'ün altında olduğunda ilişki zayıftır; 0,3...0,5 değerlerinde bağlantı orta düzeydedir; 0,5...0,7'de - ilişki anlamlıdır; 0,7...0,9'da - bağlantı güçlü; katsayı değerleri 0,9'dan büyükse ilişkinin çok güçlü olduğu kabul edilir; katsayılar +1 veya -1'e eşitse, o zaman işlevsel bir bağlantıdan bahsediyoruz (bu, istatistiksel çalışmalarda pratikte oluşmaz).

Bununla birlikte, ilişkinin gücüne ilişkin bu kadar basitleştirilmiş bir değerlendirme her zaman doğru değildir, çünkü istatistiksel bir ilişkinin varlığına duyulan güvenin derecesi, incelenen popülasyonun büyüklüğüne bağlıdır. Karakteristikler arasında bir ilişkinin varlığına ilişkin hipotezin kabul edilebilmesi için popülasyonun hacmi ne kadar küçükse korelasyon katsayısının değeri de o kadar büyük olmalıdır. Özellikler arasında doğrusal bir istatistiksel ilişkinin varlığına olan güvenin derecesini niceliksel olarak ölçmek için, kavramlar önem düzeyi Ve eşik (kritik) değerler korelasyon katsayısı.

Önem kontrolü Ortaya çıkan korelasyon katsayısı, hesaplanan değerin kritik değerle karşılaştırılmasından oluşur. Belirli sayıda ölçüm ve belirli bir anlamlılık düzeyi için kritik bir değer bulunur ve hesaplanan değerle karşılaştırılır. Hesaplanan değer kritik değerden büyükse ilişki anlamlıdır; daha azsa ilişki ya yoktur (ve korelasyon katsayısının bu değeri rastgele sapmalarla açıklanır) ya da örneklem tanımlanamayacak kadar küçüktür. BT.

İçin doğrusal bir ilişkinin varlığını ve büyüklüğünü belirlemek iki değişken X ve Y arasında iki prosedürün gerçekleştirilmesi gerekir. Birincisi, [(Xi,Yi),i=1,n] noktalarını düzlem üzerinde grafiksel olarak görüntülemektir. Ortaya çıkan grafiğe değişkenler arasında doğrusal bir ilişki olduğu varsayımının geçerliliği denir. Böyle bir varsayım kabul edilebilirse, doğrusal ilişkinin büyüklüğünü niceliksel biçimde ifade etmek gerekir. Bunu yapmak için örnek korelasyon katsayısı kullanılır:

burada n ölçüm sayısı, Xi,Yi i'inci değerler, X,Y ortalama değerler, sx, sy sırasıyla X ve Y değişkenlerinin standart sapmalarıdır.

İstatistiksel analiz teorisinde korelasyon ilişkisi, analiz edilen değişkenlerin normal dağılım koşulları altında doğrusal bir bağımlılık olarak tanımlanır. Bu nedenle korelasyon yöntemlerinin doğru uygulanabilmesi için değişkenlerin dağılımının normale, ilişki biçiminin ise doğrusala yakınlığının gerekçelendirilmesi gerekmektedir. Aksi halde daha karmaşık analiz tekniklerinin veya diğer birleştirme katsayılarının kullanılması gerekir.

Ampirik bir dağılımın normalliğini kontrol etmenin oldukça basit, hesaplama açısından basit bir yolu, aşağıdaki oranı tahmin etmektir:

,

burada C ortalama mutlak sapmadır, s ise standart sapmadır.

Belirtilen eşitsizlik karşılanırsa, ampirik dağılımların normalliğinden ve korelasyon katsayısının değişkenler arasındaki doğrusal istatistiksel ilişkinin bir ölçüsü olarak kullanılmasının doğruluğundan bahsedebiliriz.

Genel olarak suç oranı birçok faktörden etkilenir. Bunlar sosyo-ekonomik, coğrafi ve iklimsel, demografik vb.nin yanı sıra güçleri ve araçları karakterize eden işaretleri, içişleri organının örgütlenme derecesini içerir.

Ancak iki değişken arasında istatistiksel olarak güçlü, anlamlı bir ilişki olsa bile, bunların nedenselliğinden tam olarak emin olunamaz, çünkü ortak istatistiksel ilişkiyi belirleyen başka nedenler (faktörler) olabilir. İstatistiksel sonuçlar her zaman sağlam bir teorik çerçeve ile desteklenmelidir.

Aynı zamanda, istatistiksel olarak anlamlı bir bağlantının olmaması, bir neden-sonuç ilişkisinin olmadığını göstermez, ancak temel kavram ve pratik deneyim bunun mümkün olduğunu gösteriyorsa, kişiyi onu tanımlamanın başka yollarını ve araçlarını aramaya zorlar. varoluş.

Ara bağlantı kavramı psikolojik araştırmalarda oldukça yaygındır. Bir psikologun, herhangi bir sonuca varmak için iki veya daha fazla işaret veya fenomen göstergesinin ölçümlerini karşılaştırması gerektiğinde onunla çalışması gerekir.

İncelenen olgular arasındaki ilişkinin doğası açık olabilir; örneğin bir özelliğin belirli bir değeri diğerinin açık ve kesin bir değerine karşılık geldiğinde. Örneğin, zihinsel işlevlere yönelik testlerdeki kalıpları aramaya yönelik alt testte, atılan "ham" puanların sayısı aşağıdaki formülle belirlenir:
Xi = Stz - Söz / Stz + Spz * Sbc,
burada Xi seçeneğin değeridir, Stz alt testte önceden belirlenen kalıpların (yazışmaların) sayısıdır, Soz test katılımcılarına hatalı olarak gösterilen yazışmaların sayısıdır, Sz alt testteki belirtilmemiş (kaçırılan) eşleşmelerin sayısıdır. Test katılımcıları, Sbc, test katılımcıları tarafından testte görüntülenen tüm kelimelerin sayısıdır.

Bu ilişkiye işlevsel denir: burada bir gösterge diğerinin işlevidir, bu da birinciyle ilgili bir argümandır.

Ancak her zaman kesin ve net bir ilişki bulunmaz. Daha sık olarak, bir özelliğin bir değerinin diğerinin birkaç değerine karşılık gelebileceği bir durumla karşılaşırız. Bu değerler az çok tanımlanmış sınırlar içerisinde değişiklik gösterir. Bu tür ilişkilere korelasyonel veya korelasyonel denir.

Korelasyon ilişkilerinin çeşitli ifade türleri kullanılır. Bu nedenle, değerleri değişen niceliksel bir yapıya sahip olan özellikler arasındaki ilişkiyi ifade etmek için merkezi eğilim ölçüleri kullanılır: çift korelasyon katsayısının daha sonra hesaplanmasıyla tablolama, çoklu ve kısmi korelasyon katsayısı, çoklu belirleme katsayısı, korelasyon oranı.

Varyasyonu niteliksel nitelikte olan özellikler arasındaki ilişkiyi incelemek gerekiyorsa (projektif kişilik araştırması yöntemlerinin sonuçları, Semantik Diferansiyel yöntemini kullanan çalışmalar, Açık Ölçekleri kullanan çalışmalar vb.), o zaman nitel olanı kullanın. alternatif korelasyon katsayısı (tetrakorik gösterge), Pearson kriteri x2, Pearson ve Chuprov beklenmedik durum göstergeleri.

Kalitatif-kantitatif korelasyonu belirlemek, yani. Böyle bir korelasyon, bir özelliğin niteliksel bir varyasyonu olduğunda ve diğerinin niceliksel bir varyasyonu olduğunda, özel yöntemler kullanılır.

Korelasyon katsayısı (terim ilk olarak 1888'de F. Galton tarafından tanıtıldı), karşılaştırılan iki örnek seçeneği (örnekler) arasındaki bağlantının gücünün bir göstergesidir. Korelasyon katsayısını hesaplamak için kullanılan formülden bağımsız olarak değeri -1 ile +1 arasında değişir. Tamamen pozitif bir korelasyon durumunda bu katsayı artı 1'dir ve tamamen negatif bir korelasyon durumunda eksi 1'dir. Tipik olarak bu, her birinin değerlerinin kesişme noktalarından geçen düz bir çizgidir. veri çifti.

Varyant değerleri düz bir çizgide sıralanmıyorsa ve bir "bulut" oluşturuyorsa, mutlak değerdeki korelasyon katsayısı birden küçük olur ve "bulut" yuvarlandıkça sıfıra yaklaşır. Korelasyon katsayısı 0 ise her iki seçenek de birbirinden tamamen bağımsızdır.

Korelasyon katsayısının hesaplanan (ampirik) herhangi bir değeri, korelasyon katsayısının ilgili kritik değerleri tabloları kullanılarak güvenilirlik (istatistiksel anlamlılık) açısından kontrol edilmelidir. Ampirik değer yüzde 5 düzeyinde tabloya eşit veya küçükse (P = 0,05), korelasyon anlamlı değildir. Korelasyon katsayısının hesaplanan değeri P=0,01 için tablo değerinden büyükse korelasyon istatistiksel olarak anlamlıdır (güvenilirdir).

Katsayı değerinin 0,05 > P > 0,01 arasında olması durumunda, pratikte korelasyonun P = 0,05 için anlamlı olduğundan söz edilir.

Bravais-Pearson korelasyon katsayısı (r), aritmetik ortalamaların ve ortalama kare değerlerinin karşılaştırıldığı hesaplama için 1896'da önerilen parametrik bir göstergedir. Bu katsayıyı hesaplamak için aşağıdaki formülü kullanın (farklı yazarlar için farklı görünebilir):
r= (E Xi Xi1) - NXap X1ap / N-1 Qx Qx1,

burada E Xi Xi1, ikili olarak karşılaştırılabilir seçeneklerin değerlerinin çarpımlarının toplamıdır, n, karşılaştırılan çiftlerin sayısıdır, NXap, X1ap, Xi, Xi seçeneğinin aritmetik ortalamalarıdır; sırasıyla Qx, Qx, x ve x dağılımlarının standart sapmalarıdır.

Spearman'ın sıra korelasyon katsayısı Rs (sıra korelasyon katsayısı, Spearman katsayısı), korelasyon katsayısının en basit şeklidir ve belirli bir seçeneğin sıraları (yerleri) arasındaki ilişkiyi, kendi değerini dikkate almadan çeşitli özelliklere göre ölçer. Burada araştırılan şey niceliksel bir ilişkiden ziyade niteliksel bir ilişkidir.

Tipik olarak, bu parametrik olmayan kriter, veriler arasındaki aralıklar hakkında değil, sıralamaları hakkında sonuçlar çıkarmanın gerekli olduğu durumlarda ve ayrıca dağıtım eğrileri son derece asimetrik olduğunda ve aşağıdaki gibi parametrik kriterlerin kullanımına izin vermediğinde kullanılır: Bravais-Pearson korelasyon katsayısı (bu durumlarda bazı durumlarda niceliksel verileri sıralı verilere dönüştürmek gerekli olabilir). Rs katsayısı +1'e yakınsa, bu, belirli özelliklere göre sıralanan numunenin iki sırasının pratik olarak çakıştığı anlamına gelir ve bu katsayı - 1'e yakınsa, tam bir ters ilişkiden bahsedebiliriz.

Bravais-Pearson korelasyon katsayısının hesaplanması gibi, Rs katsayısının hesaplamaları da tablo halinde daha uygun bir şekilde sunulur.

Regresyon, fonksiyonel ilişki kavramını, bir değişkenin değerleri arasındaki bağımlılığın stokastik (olasılıksal) doğası durumuna genelleştirir. Regresyon problemlerinin kategorisini çözmenin amacı, girdi seçeneklerinin değerlerine dayalı olarak sürekli çıktı değişkenliğinin değerini tahmin etmektir.

Korelasyon analizi

Korelasyon- iki veya daha fazla rastgele değişken (veya kabul edilebilir bir doğruluk derecesi ile bu şekilde kabul edilebilecek değişkenler) arasındaki istatistiksel ilişki. Bu durumda bu niceliklerin bir ya da birkaçındaki değişiklik, diğer ya da başka niceliklerde sistematik bir değişikliğe yol açmaktadır. İki rastgele değişken arasındaki korelasyonun matematiksel ölçüsü korelasyon katsayısıdır.

Korelasyon pozitif ve negatif olabilir (örneğin bağımsız rastgele değişkenler için istatistiksel bir ilişkinin olmaması da mümkündür). Negatif korelasyon - bir değişkendeki artışın başka bir değişkendeki azalmayla ilişkili olduğu ve korelasyon katsayısının negatif olduğu korelasyon. Pozitif korelasyon - bir değişkendeki artışın başka bir değişkendeki artışla ilişkili olduğu ve korelasyon katsayısının pozitif olduğu korelasyon.

Otokorelasyon - aynı serideki rastgele değişkenler arasındaki istatistiksel ilişki, ancak örneğin rastgele bir süreç için bir zaman kaymasıyla alınan bir kayma ile alınır.

İzin vermek X,e- bir olasılık uzayında tanımlanan iki rastgele değişken. Daha sonra korelasyon katsayıları aşağıdaki formülle verilir:

,

burada cov kovaryansı belirtir ve D varyanstır veya eşdeğerdir,

,

burada sembol matematiksel beklentiyi belirtir.

Böyle bir ilişkiyi grafiksel olarak temsil etmek için her iki değişkene karşılık gelen eksenlere sahip dikdörtgen bir koordinat sistemi kullanabilirsiniz. Her değer çifti belirli bir sembolle işaretlenmiştir. Bu grafiğe "dağılım grafiği" denir.

Korelasyon katsayısının hesaplanma yöntemi değişkenlerin ait olduğu ölçek türüne bağlıdır. Bu nedenle değişkenleri aralıklı ve niceliksel ölçeklerle ölçmek için Pearson korelasyon katsayısının (çarpım moment korelasyonu) kullanılması gerekir. İki değişkenden en az biri sıralı ölçekteyse veya normal dağılım göstermiyorsa, Spearman'ın sıra korelasyonu veya Kendal'ın τ (tau)'su kullanılmalıdır. İki değişkenden birinin ikili olması durumunda, nokta-çift serili korelasyon kullanılır ve her iki değişkenin de ikili olması durumunda dört alanlı korelasyon kullanılır. İkili olmayan iki değişken arasındaki korelasyon katsayısının hesaplanması, yalnızca aralarındaki ilişkinin doğrusal (tek yönlü) olması durumunda anlamlıdır.

Kendell korelasyon katsayısı

Karşılıklı bozukluğu ölçmek için kullanılır.

Spearman korelasyon katsayısı

Korelasyon katsayısının özellikleri

Kovaryansı iki rastgele değişkenin skaler çarpımı olarak alırsak, o zaman rastgele değişkenin normu şuna eşit olacaktır: ve Cauchy-Bunyakovsky eşitsizliğinin sonucu şöyle olacaktır: . , Nerede . Ayrıca bu durumda işaretler ve k kibrit: .

Korelasyon analizi

Korelasyon analizi- katsayıların incelenmesinden oluşan istatistiksel verilerin işlenmesi yöntemi ( korelasyonlar) değişkenler arasında. Bu durumda, bir veya daha fazla özellik çifti arasındaki korelasyon katsayıları karşılaştırılarak aralarında istatistiksel ilişkiler kurulur.

Hedef korelasyon analizi- Başka bir değişkeni kullanarak bir değişken hakkında bazı bilgiler sağlayın. Bir hedefe ulaşmanın mümkün olduğu durumlarda değişkenlerin olduğu söylenir. ilişkilendirmek. En genel haliyle, bir korelasyon hipotezini kabul etmek, A değişkeninin değerindeki bir değişikliğin, B'nin değerindeki orantılı bir değişiklikle eş zamanlı olarak meydana geleceği anlamına gelir: eğer her iki değişken de artarsa, o zaman korelasyon pozitif Değişkenlerden biri artarken diğeri azalıyorsa, korelasyon negatif.

Korelasyon değerlerin yalnızca doğrusal bağımlılığını yansıtır ancak işlevsel bağlantılarını yansıtmaz. Örneğin büyüklükler arasındaki korelasyon katsayısını hesaplarsanız A = SBenN(X) Ve B = COS(X) o zaman sıfıra yakın olacaktır, yani miktarlar arasında bağımlılık yoktur. Bu arada, A ve B nicelikleri yasaya göre açıkça işlevsel olarak ilişkilidir. SBenN 2 (X) + COS 2 (X) = 1 .

Korelasyon Analizinin Sınırlamaları

Her biri için karşılık gelen x ve y korelasyon katsayılarıyla birlikte (x,y) çiftlerinin dağılım grafikleri. Korelasyon katsayısının doğrusal bir ilişkiyi yansıttığını (üst satır), ancak bir ilişki eğrisini (orta çizgi) tanımlamadığını ve karmaşık, doğrusal olmayan ilişkileri (alt satır) tanımlamak için hiç uygun olmadığını unutmayın.

  1. Çalışma için yeterli sayıda vaka varsa uygulama mümkündür: belirli bir tür için korelasyon katsayısı 25 ila 100 gözlem çifti arasında değişir.
  2. İkinci sınırlama, korelasyon analizi hipotezinden kaynaklanmaktadır; değişkenlerin doğrusal bağımlılığı. Bir ilişkinin varlığının güvenilir bir şekilde bilindiği birçok durumda, ilişkinin doğrusal olmaması (örneğin parabol olarak ifade edilmesi) nedeniyle korelasyon analizi sonuç vermeyebilir.
  3. Salt korelasyon gerçeği, değişkenlerden hangisinin değişimden önce geldiğini veya değişime neden olduğunu veya değişkenlerin genellikle örneğin üçüncü bir faktörün etkisi nedeniyle birbirleriyle nedensel olarak ilişkili olduğunu iddia etmek için temel sağlamaz.

Uygulama kapsamı

Bu istatistiksel veri işleme yöntemi ekonomi ve sosyal bilimlerde (özellikle psikoloji ve sosyolojide) oldukça popülerdir, ancak korelasyon katsayılarının uygulama kapsamı geniştir: endüstriyel ürünlerin kalite kontrolü, metalurji, tarım kimyası, hidrobiyoloji, biyometri ve diğerleri.

Yöntemin popülaritesi iki faktörden kaynaklanmaktadır: korelasyon katsayılarının hesaplanması nispeten kolaydır ve bunların kullanımı özel matematik eğitimi gerektirmez. Yorumlama kolaylığı ile birleşen katsayıların uygulama kolaylığı, istatistiksel veri analizi alanında yaygın olarak kullanılmasına yol açmıştır.

Yanlış korelasyon

Çoğu zaman, korelasyon araştırmasının baştan çıkarıcı basitliği, araştırmacıyı, özellik çiftleri arasında bir neden-sonuç ilişkisinin varlığı hakkında yanlış sezgisel çıkarımlara varmaya teşvik ederken, korelasyon katsayıları yalnızca istatistiksel ilişkiler kurar.

Sosyal bilimlerin modern niceliksel metodolojisinde, aslında ampirik yöntemler kullanılarak gözlemlenen değişkenler arasında neden-sonuç ilişkileri kurmaya yönelik girişimlerden vazgeçilmiştir. Bu nedenle sosyal bilimlerdeki araştırmacılar, incelenen değişkenler arasında ilişki kurmaktan bahsederken ya genel bir teorik varsayımı ya da istatistiksel bir bağımlılığı ima etmektedir.

Ayrıca bakınız

Wikimedia Vakfı.

2010.

    Bkz. KORELASYON ANALİZİ. Antinazi. Sosyoloji Ansiklopedisi, 2009 ... Sosyoloji Ansiklopedisi

    İki (veya daha fazla) rastgele özellik veya faktör arasındaki korelasyonu incelemek için pratik yöntemleri birleştiren bir matematiksel istatistik dalı. Bkz. Korelasyon (matematiksel istatistiklerde)... Büyük Ansiklopedik Sözlük

    KORELASYON ANALİZİ, iki (veya daha fazla) rastgele özellik veya faktör arasındaki korelasyonu incelemek için pratik yöntemleri birleştiren matematiksel istatistik bölümü. Bkz. Korelasyon (bkz. KORELASYON (karşılıklı ilişki ...) Ansiklopedik Sözlük

    Korelasyon analizi- (ekonomide) değişen miktarlar arasındaki ilişkileri inceleyen bir matematiksel istatistik dalı (korelasyon, Latince korelasyon kelimesinden gelen bir orandır). İlişki tam (yani işlevsel) ve eksik olabilir... ... Ekonomik-matematiksel sözlük

    korelasyon analizi- (psikolojide) (Latince korelasyon oranından), incelenen özellikler veya faktörler arasındaki bağlantının biçimini, işaretini ve yakınlığını değerlendirmek için istatistiksel bir yöntem. Bir bağlantının biçimini belirlerken doğrusallığı veya doğrusal olmayışı dikkate alınır (yani ortalama olarak... ... Büyük psikolojik ansiklopedi

    korelasyon analizi- - [L.G. Bilgi teknolojisi üzerine İngilizce-Rusça sözlük. M.: Devlet İşletmesi TsNIIS, 2003.] Genel olarak bilgi teknolojisi konuları EN korelasyon analizi ... Teknik Çevirmen Kılavuzu

    korelasyon analizi- Koreli analiz durumu T sritis Kuno kultura ve sportas apibrėžtis İstatistiksel yöntemler, kuriuo įvertinami tiramųjų asmenų, reiškinių požymiai arba veiksnių. atitikmenys: İngilizce. korelasyon çalışmaları vok. Analiz der Korelasyon, f;… … Spor terminų žodynas

    İki rastgele özellik veya faktör arasındaki korelasyonu tespit etmek için matematiksel korelasyon teorisine (Bkz. Korelasyon) dayanan bir dizi yöntem. K. a. deneysel veriler aşağıdakileri içerir... ... Büyük Sovyet Ansiklopedisi

    Matematik bölümü pratikleri birleştiren istatistikler İlişkili araştırma yöntemleri. iki (veya daha fazla) rastgele özellik veya faktör arasındaki bağımlılıklar. Bkz. Korelasyon... Büyük Ansiklopedik Politeknik Sözlüğü



Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!