Psikolojide Spearman korelasyon analizi. Nokta çift serili korelasyon katsayısı

37. Spearman'ın sıra korelasyon katsayısı.

S.56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Spearman'ın sıra korelasyon katsayısı şu durumlarda kullanılır:
- değişkenler var sıralama ölçeğiölçümler;
- veri dağılımı şundan çok farklı: normal ya da hiç bilinmiyor;
- numunelerin hacmi küçük (N)< 30).

Spearman sıra korelasyon katsayısının yorumu Pearson katsayısından farklı değildir ancak anlamı biraz farklıdır. Bu yöntemler arasındaki farkı anlamak ve uygulama alanlarını mantıksal olarak doğrulamak için formüllerini karşılaştıralım.

Pearson korelasyon katsayısı:

Spearman korelasyon katsayısı:

Gördüğünüz gibi formüller önemli ölçüde farklılık gösteriyor. Formülleri karşılaştıralım

Pearson korelasyon formülü, ilişkili serilerin aritmetik ortalamasını ve standart sapmasını kullanır, ancak Spearman formülü bunu kullanmaz. Bu nedenle Pearson formülünü kullanarak yeterli bir sonuç elde etmek için ilişkili serilerin normal dağılıma yakın olması gerekir (ortalama ve standart sapma normal dağılım parametreleri). Bu Spearman formülüyle ilgili değildir.

Pearson formülünün bir unsuru da her serinin standardizasyonudur. z-puanı.

Gördüğünüz gibi Pearson korelasyon katsayısı formülünde değişkenlerin Z ölçeğine dönüştürülmesi mevcut. Buna göre Pearson katsayısı için verinin ölçeğinin hiçbir önemi yok: örneğin iki değişkeni ilişkilendirebiliriz, bunlardan biri min. = 0 ve maks. = 1 ve ikinci dk. = 100 ve maks. = 1000. Değer aralığı ne kadar farklı olursa olsun hepsi aynı ölçekteki standart z değerlerine dönüştürülecektir.

Spearman katsayısında böyle bir normalizasyon oluşmaz, dolayısıyla

SPEARMAN KATSAYISININ KULLANILMASI İÇİN ZORUNLU BİR KOŞUL İKİ DEĞİŞKENİN ARALIĞININ EŞİTLİĞİDİR.

Farklı aralıklara sahip veri serileri için Spearman katsayısını kullanmadan önce, rütbe. Sıralama, bu serilerin değerlerinin aynı minimum = 1 (minimum sıra) ve değer sayısına eşit bir maksimum (maksimum, son sıra = N, yani örnekteki maksimum vaka sayısı) elde etmesiyle sonuçlanır. .

Hangi durumlarda sıralama yapmadan yapabilirsiniz?

Bunlar, verilerin başlangıçta sıralama ölçeği. Örneğin Rokeach'in değer yönelimleri testi.

Ayrıca bunlar, değer seçeneklerinin sayısının az olduğu ve numunenin sabit bir minimum ve maksimum içerdiği durumlardır. Örneğin anlamsal bir diferansiyelde minimum = 1, maksimum = 7.

Spearman'ın sıra korelasyon katsayısını hesaplama örneği

Rokeach'in değer yönelimleri testi iki X ve Y örneği üzerinde gerçekleştirildi. Amaç: Bu örneklerin değer hiyerarşilerinin ne kadar yakın olduğunu (kelimenin tam anlamıyla ne kadar benzer olduklarını) bulmak.

Ortaya çıkan değer r=0,747 şu şekilde kontrol edilir: kritik değerler tablosu. Tabloya göre N=18 ile elde edilen değer p düzeyinde anlamlıdır.<=0,005

Spearman ve Kendal sıra korelasyon katsayıları

Sıralı ölçeğe ait değişkenler veya normal dağılıma tabi olmayan değişkenler ile aralık ölçeğine ait değişkenler için Pearson katsayısı yerine Spearman sıra korelasyonu hesaplanır. Bunu yapmak için, bireysel değişken değerlerine, daha sonra uygun formüller kullanılarak işlenen sıralar atanır. Sıra korelasyonunu algılamak için, İki Değişkenli Korelasyonlar... iletişim kutusundaki varsayılan Pearson korelasyonu onay kutusunun işaretini kaldırın. Bunun yerine Spearman korelasyon hesaplamasını etkinleştirin. Bu hesaplama aşağıdaki sonuçları verecektir. Sıra korelasyon katsayıları, Pearson katsayılarının karşılık gelen değerlerine çok yakındır (orijinal değişkenler normal dağılıma sahiptir).

titkova-matmetody.pdf s. 45

Spearman'ın sıra korelasyon yöntemi sıkılığı (kuvvet) ve yönü belirlemenize olanak tanır

Arasındaki korelasyon iki işaret veya iki profil (hiyerarşiler) işaretler.

Sıra korelasyonunu hesaplamak için iki satır değere sahip olmak gerekir,

hangileri sıralanabilir? Bu tür değer dizileri şunlar olabilir:

1) iki işaret aynı şekilde ölçüldü grup konular;

2) iki ayrı özellik hiyerarşisi, aynı yöntemi kullanarak iki denekte tanımlandı

özellikler kümesi;

3) iki özelliklerin grup hiyerarşileri,

4) bireysel ve grupözelliklerin hiyerarşisi.

İlk olarak göstergeler her bir özellik için ayrı ayrı sıralanır.

Kural olarak, daha düşük bir nitelik değerine daha düşük bir sıralama atanır.

İlk durumda (iki özellik), bireysel değerler birinciye göre sıralanır.

farklı denekler tarafından elde edilen özellikler ve ardından ikincisi için bireysel değerler

imza.

Eğer iki özellik pozitif olarak ilişkiliyse, o zaman sıralaması düşük olan konular

bunlardan biri diğerinde düşük derecelere sahip olacak ve yüksek derecelere sahip konular

özelliklerden biri diğer özellik için de yüksek sıralamalara sahip olacaktır. Rs'yi hesaplamak için

farklılıklar belirlenmeli (D) her ikisinde de belirli bir konunun elde ettiği sıralamalar arasında

işaretler. Daha sonra bu göstergeler d belirli bir şekilde dönüştürülerek 1'den çıkarılır.

Sıralar arasındaki fark ne kadar küçük olursa, rs o kadar büyük olur ve +1'e o kadar yakın olur.

Korelasyon yoksa tüm sıralar karışacak ve hiçbir sonuç kalmayacaktır.

yazışma yok. Formül, bu durumda rs'nin 0'a yakın olacağı şekilde tasarlanmıştır.

Negatif korelasyon durumunda bir temelde konuların düşük sıraları

başka bir temelde yüksek rütbeler karşılık gelecektir ve bunun tersi de geçerlidir. Farklılık ne kadar büyük olursa

iki değişken üzerindeki deneklerin sıraları arasında, rs -1'e ne kadar yakınsa.

İkinci durumda (iki ayrı profil), bireysel olanlar sıralanır

2 deneğin her birinin belirli bir göre elde ettiği değerler (onlar için aynı)

her ikisi de) özellikler kümesi. İlk sıra en düşük değere sahip özelliğe verilecek; ikinci sıra –

daha yüksek değere sahip bir işaret vb. Açıkçası, tüm özellikler ölçülmeli

aynı birimler, aksi takdirde sıralama mümkün değildir. Mesela imkansız

Cattell Kişilik Envanterindeki (16PF) göstergeleri şu şekilde ifade ediliyorsa sıralayın:

Farklı faktörler için değer aralıkları farklı olduğundan "ham" puanlar: 0'dan 13'e, 0'dan 13'e

20 ve 0'dan 26'ya kadar. Hangi faktörün ilk sırada yer alacağını söyleyemeyiz.

tüm değerleri tek bir ölçeğe getirene kadar ifade (çoğunlukla bu duvar ölçeğidir).

İki konunun bireysel hiyerarşileri pozitif olarak ilişkiliyse, o zaman işaretler

birinde düşük sıralamaya sahip olmak diğerinde de düşük sıralamaya sahip olacaktır ve bunun tersi de geçerlidir.

Örneğin, eğer bir deneğin E faktörü (baskınlık) en düşük sıraya sahipse, o zaman

Başka bir test deneği, eğer bir test deneği C faktörüne sahipse düşük bir sıralamaya sahip olmalıdır.

(duygusal istikrar) en yüksek sırada yer alıyorsa, diğer konunun da

bu faktörün yüksek bir sıralaması var vb.

Üçüncü durumda (iki grup profili), grup ortalama değerleri sıralanır,

her iki grup için de aynı olan, belirli bir sete göre 2 grup denekten elde edildi

işaretler. Bundan sonra, akıl yürütme çizgisi önceki iki durumdakiyle aynıdır.

4. durumda (bireysel ve grup profilleri), ayrı ayrı sıralanırlar

aynı set için konunun bireysel değerleri ve grup ortalama değerleri

kural olarak bu bireysel konuyu hariç tutarak elde edilen işaretler - o

Bireysel profilinin karşılaştırılacağı ortalama grup profiline katılmıyor

profil. Sıra korelasyonu, bireyin ve kişinin ne kadar tutarlı olduğunu kontrol etmenizi sağlayacaktır.

grup profilleri.

Her dört durumda da ortaya çıkan korelasyon katsayısının önemi belirlenir.

sıralanmış değerlerin sayısına göre N.İlk durumda, bu miktar şuna denk gelecektir:

örneklem büyüklüğü İkinci durumda gözlem sayısı özellik sayısı olacaktır,

hiyerarşiyi oluşturuyor. Üçüncü ve dördüncü durumlarda N aynı zamanda karşılaştırılanların sayısıdır.

gruplardaki deneklerin sayısı değil, özelliklerdir. Örneklerde ayrıntılı açıklamalar verilmiştir. Eğer

rs'nin mutlak değeri kritik bir değere ulaşır veya onu aşar, korelasyon

güvenilir.

Hipotezler.

İki olası hipotez vardır. Birincisi durum 1 için geçerlidir, ikincisi ise diğer üçü için geçerlidir

Hipotezlerin ilk versiyonu

H0: A ve B değişkenleri arasındaki korelasyon sıfırdan farklı değildir.

H2: A ve B değişkenleri arasındaki korelasyon sıfırdan anlamlı derecede farklıdır.

Hipotezlerin ikinci versiyonu

H0: A ve B hiyerarşileri arasındaki korelasyon sıfırdan farklı değildir.

H2: A ve B hiyerarşileri arasındaki korelasyon sıfırdan önemli ölçüde farklıdır.

Sıra korelasyon katsayısının sınırlamaları

1. Her değişken için en az 5 gözlem sunulmalıdır. Üst

örnekleme sınırı mevcut kritik değer tabloları tarafından belirlenir .

2. Çok sayıda özdeş durum için Spearman'ın sıra korelasyon katsayısı rs

Karşılaştırılan değişkenlerden biri veya her ikisi için sıralamalar kaba değerler verir. İdeal olarak

her iki ilişkili seri de birbirinden farklı iki diziyi temsil etmelidir

değerler. Bu şartın sağlanamaması durumunda değişiklik yapılması gerekmektedir.

aynı rütbeler.

Spearman'ın sıra korelasyon katsayısı aşağıdaki formül kullanılarak hesaplanır:

Karşılaştırılan her iki sıra serisi de aynı sıradaki grupları içeriyorsa,

Sıra korelasyon katsayısını hesaplamadan önce aynı düzeltmelerin yapılması gerekir.

Ta ve TV sıralamaları:

Ta = Σ (a3 – a)/12,

Тв = Σ (в3 – в)/12,

Nerede A - A sıra satırındaki aynı sıralara sahip her grubun hacmi, – her birinin hacmi

B sıra serisinde aynı sıradaki gruplar.

Rs'nin ampirik değerini hesaplamak için aşağıdaki formülü kullanın:

38. Nokta-çift serili korelasyon katsayısı.

Genel olarak korelasyon hakkında 36 numaralı soruya bakınız.İle. 56 (64) 063.JPG

harchenko-korranaliz.pdf

X değişkeninin güçlü bir ölçekte ve Y değişkeninin ikili bir ölçekte ölçülmesine izin verin. Nokta çift serili korelasyon katsayısı rpb aşağıdaki formül kullanılarak hesaplanır:

Burada x 1, Y üzerinden "bir" değerine sahip X nesneleri üzerindeki ortalama değerdir;

x 0 – Y üzerinde “sıfır” değeri olan X nesneleri üzerindeki ortalama değer;

s x – X boyunca tüm değerlerin standart sapması;

n 1 – Y'deki nesnelerin sayısı “bir”, n 0 – Y'deki “sıfır” nesnelerin sayısı;

n = n 1 + n 0 – örneklem büyüklüğü.

Nokta çift serili korelasyon katsayısı aynı zamanda diğer eşdeğer ifadeler kullanılarak da hesaplanabilir:

burada x– değişkenin genel ortalama değeri X.

Nokta çift serili korelasyon katsayısı rpb–1 ila +1 arasında değişir. Değişkenler bir ise değeri sıfırdır e ortalamaya sahip olmak e, sıfırın üzerinde değişkenlerin ortalamasına eşit e.

Sınav önem hipotezleri nokta çift serili korelasyon katsayısı kontrol etmektir sıfır hipoteziH 0 genel korelasyon katsayısının sıfıra eşitliği hakkında: ρ = 0, Öğrenci t testi kullanılarak gerçekleştirilir. Ampirik önem

kritik değerlerle karşılaştırıldığında T A (df) serbestlik derecesi sayısı için df = N– 2

Koşul | T| ≤ ta(df), ρ = 0 sıfır hipotezi reddedilmez. Ampirik değer | T| kritik bölgeye düşer, yani koşul | T| > ta(N– 2). Nokta çift serili korelasyon katsayısı kullanılarak hesaplanan ilişkinin güvenilirliği rpb kriteri kullanılarak da belirlenebilir. χ Serbestlik derecesi sayısı için 2 df= 2.

Nokta çift serili korelasyon

Momentlerin çarpımının korelasyon katsayısının müteakip modifikasyonu, çift serili noktaya yansıtıldı. R. Bu istatistik. Biri sürekli ve normal dağılımlı olduğu varsayılan, diğeri ise kelimenin tam anlamıyla ayrık olan iki değişken arasındaki ilişkiyi gösterir. Nokta çift serili korelasyon katsayısı şu şekilde gösterilir: R pbis Beri R pbis ikilik, ayrık değişkenin gerçek doğasını yansıtır ve şu durumda olduğu gibi yapay değildir: R bis işareti keyfi olarak belirlenir. Bu nedenle, tüm pratik amaçlar için. hedefler R pbis 0,00 ila +1,00 aralığında kabul edilir.

Ayrıca iki değişkenin sürekli ve normal dağılımlı olduğu varsayılır, ancak her ikisi de çift serili korelasyon durumunda olduğu gibi yapay olarak dikotomize edilir. Bu tür değişkenler arasındaki ilişkiyi değerlendirmek için tetrakorik korelasyon katsayısı kullanılır. R tet, aynı zamanda Pearson tarafından da yetiştirildi. Temel Hesaplama için (kesin) formüller ve prosedürler R tet oldukça karmaşık. Bu nedenle pratik olarak Bu yöntem yaklaşıkları kullanır R tet kısaltılmış prosedürler ve tablolar esas alınarak elde edilmiştir.

/on-line/dictionary/dictionary.php?term=511

NOKTA İKİ SERİ KATSAYISI biri ikili ölçekte, diğeri aralık ölçeğinde ölçülen iki değişken arasındaki korelasyon katsayısıdır. Klasik ve modern testlerde, bir test görevinin kalitesinin (güvenilirlik ve genel test puanıyla tutarlılık) bir göstergesi olarak kullanılır.

Ölçülen değişkenleri ilişkilendirmek için ikili ve aralık ölçeği kullanmak nokta-çift serili korelasyon katsayısı.
Nokta-çift serili korelasyon katsayısı, biri isim ölçeğinde ölçülen ve yalnızca 2 değer alan (örneğin, erkek/kadın, doğru cevap/yanlış cevap, özellik) değişkenlerin ilişkisinin korelasyon analizi yöntemidir. mevcut/mevcut değil) ve ikincisi ölçek oranlarında veya aralık ölçeğinde. Nokta-çift serili korelasyon katsayısını hesaplamak için formül:

Nerede:
m1 ve m0, Y'de 1 veya 0 değeri olan X'in ortalama değerleridir.
σx – tüm değerlerin X'e göre standart sapması
n1,n0 – 1 veya 0'dan Y'ye kadar olan X değerlerinin sayısı.
n – toplam değer çifti sayısı

Çoğu zaman, bu tür bir korelasyon katsayısı, test öğeleri ile toplam ölçek arasındaki ilişkiyi hesaplamak için kullanılır. Bu bir tür geçerlilik kontrolüdür.

39. Sıra-çift serili korelasyon katsayısı.

Genel olarak korelasyon hakkında 36 numaralı soruya bakınız.İle. 56 (64) 063.JPG

harchenko-korranaliz.pdf s. 28

Değişkenlerden birinin ( X) sıralı bir ölçekte sunulur ve diğeri ( e) – ikili, formülle hesaplanır

İşte bir tanesine sahip nesnelerin ortalama sıralaması e; – sıfır ila nesnelerin ortalama sıralaması e, N- örnek boyut.

Sınav önem hipotezleri Sıra-çift serili korelasyon katsayısı, formüllerde değiştirme ile Öğrenci testi kullanılarak nokta iki serili korelasyon katsayısına benzer şekilde gerçekleştirilir. Rpb Açık Rrb.

Bir değişkenin ikili bir ölçekte ölçüldüğü durumlarda (değişken X), diğeri ise sıra ölçeğinde (değişken Y), sıra-çift serili korelasyon katsayısı kullanılır. değişken olduğunu hatırlıyoruz. X,İkili bir ölçekte ölçülen, yalnızca 0 ve 1 olmak üzere iki değer (kod) alır. Özellikle vurguluyoruz: bu katsayı -1 ila +1 aralığında değişmesine rağmen, işaretinin yorumlanması için önemli değil sonuçlar. Bu genel kuralın bir başka istisnasıdır.

Bu katsayı aşağıdaki formül kullanılarak hesaplanır:

nerede X 1– değişkenin bu unsurları için ortalama sıralama e değişkendeki kod (işaret) 1'e karşılık gelir X;

'X 0 – değişkenin bu unsurları için ortalama sıralama E, değişkendeki 0 koduna (işaretine) karşılık gelir X\

N - değişkendeki toplam öğe sayısı X.

Sıra-çift serili korelasyon katsayısını uygulamak için aşağıdaki koşulların karşılanması gerekir:

1. Karşılaştırılan değişkenler farklı ölçeklerde ölçülmelidir: X - ikili ölçekte; diğer Y– bir sıralama ölçeğinde.

2. Karşılaştırılan değişkenlerdeki değişen özelliklerin sayısı X Ve e aynı olmalıdır.

3. Sıra-çift serili korelasyon katsayısının güvenilirlik düzeyini değerlendirmek için formül (11.9) ve Öğrenci kriteri için kritik değerler tablosunu kullanmalısınız. k = n – 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Değişkenlerden birinin temsil edildiği durumlar ikili ölçek, diğeri ise sıralama (sıra), başvuru gerektirir sıra-çift serili korelasyon katsayısı:

dev/dk=2 / n * (m1 - m0)

Nerede:
n – ölçüm nesnelerinin sayısı
m1 ve m0 - ikinci değişkende 1 veya 0 bulunan nesnelerin ortalama sıralaması.
Bu katsayı aynı zamanda testlerin geçerliliği kontrol edilirken de kullanılır.

40. Doğrusal korelasyon katsayısı.

Genel olarak korelasyon (ve özellikle doğrusal korelasyon) için 36 numaralı soruya bakın.İle. 56 (64) 063.JPG

Bay PEARSON'UN KATSAYISI

R-Pearson (Pearson R) iki metrik arasındaki ilişkiyi incelemek için kullanılırAynı örnek üzerinde ölçülen farklı değişkenler. Kullanımının uygun olduğu birçok durum vardır. Zeka üniversite son yıllarında akademik performansı etkiler mi? Bir çalışanın maaşının büyüklüğü onun meslektaşlarına olan dostluğuyla mı alakalı? Bir öğrencinin ruh hali karmaşık bir aritmetik problemini çözme başarısını etkiler mi? Bu tür soruları yanıtlamak için araştırmacının örneklemin her üyesi için iki ilgi göstergesini ölçmesi gerekir. İlişkiyi incelemek için gereken veriler daha sonra aşağıdaki örnekte olduğu gibi tablo haline getirilir.

ÖRNEK 6.1

Tablo, 20 8. sınıf öğrencisi için iki zeka göstergesini (sözlü ve sözsüz) ölçmek için başlangıç verilerinin bir örneğini göstermektedir.

Bu değişkenler arasındaki ilişki bir dağılım grafiği kullanılarak gösterilebilir (bkz. Şekil 6.3). Diyagram, ölçülen göstergeler arasında bir ilişki olduğunu göstermektedir: sözel zekanın değeri ne kadar büyükse, (çoğunlukla) sözel olmayan zekanın değeri de o kadar yüksektir.

Korelasyon katsayısının formülünü vermeden önce, örnek 6.1'deki verileri kullanarak bunun oluşma mantığını izlemeye çalışalım. Her /-noktasının (sayı / konusu) diğer noktalara göre dağılım diyagramı üzerindeki konumu (Şekil 6.3), karşılık gelen değişken değerlerinin ortalama değerlerinden değerleri ve sapma işaretleri ile belirlenebilir. : (xj - MJ Ve (akıl en ). Bu sapmaların işaretleri çakışıyorsa, bu pozitif bir ilişki olduğunu gösterir (daha büyük değerler X büyük değerler karşılık gelir en veya daha düşük değerler X daha küçük değerler karşılık gelir y).

1 numaralı konu için ortalamadan sapma X ve tarafından en pozitif ve 3 numaralı denek için her iki sapma da negatiftir. Sonuç olarak, her ikisinden elde edilen veriler, incelenen özellikler arasında pozitif bir ilişkiye işaret etmektedir. Aksine, ortalamadan sapma belirtileri varsa X ve tarafından en farklılık gösteriyorsa bu, özellikler arasında negatif bir ilişki olduğunu gösterir. Dolayısıyla 4 numaralı konu için ortalamadan sapma X olumsuzdur, tarafından y - pozitif ve 9 numaralı konu için - tam tersi.

Böylece, eğer sapmaların çarpımı (x,- M X ) X (akıl en ) pozitifse, /-konunun verileri doğrudan (pozitif) bir ilişkiyi gösterir ve negatifse ters (negatif) bir ilişkiyi gösterir. Buna göre eğer Xwey y Genellikle doğru orantılıysa, sapmaların çoğu pozitif olacaktır ve eğer ters bir ilişkiyle ilişkiliyse, çoğu ürün negatif olacaktır. Bu nedenle, ilişkinin gücü ve yönüne ilişkin genel bir gösterge, belirli bir örnek için tüm sapmaların çarpımlarının toplamı olabilir:

Değişkenler arasında doğrudan orantılı bir ilişki olduğunda, bu değer büyük ve pozitiftir - çoğu konu için sapmalar işaretle çakışır (bir değişkenin büyük değerleri başka bir değişkenin büyük değerlerine karşılık gelir ve bunun tersi de geçerlidir). Eğer X Ve en geri bildirime sahipseniz, çoğu konu için bir değişkenin daha büyük değerleri başka bir değişkenin daha küçük değerlerine karşılık gelecektir, yani çarpımların işaretleri negatif olacak ve bir bütün olarak çarpımların toplamı da büyük olacaktır. mutlak değerde, ancak işarette negatif. Değişkenler arasında sistematik bir bağlantı yoksa, pozitif terimler (sapmaların ürünleri) negatif terimlerle dengelenecek ve tüm sapmaların ürünlerinin toplamı sıfıra yakın olacaktır.

Ürünlerin toplamının numune büyüklüğüne bağlı olmadığından emin olmak için ortalamanın alınması yeterlidir. Ancak biz, ara bağlantının ölçüsüyle genel bir parametre olarak değil, bunun hesaplanmış bir tahmini olarak, istatistik olarak ilgileniyoruz. Bu nedenle dağılım formülüne gelince, bu durumda aynısını yapacağız, sapmaların çarpımlarının toplamını N, ve TV'de - 1. Bu, fizik ve teknik bilimlerde yaygın olarak kullanılan ve adı verilen bir bağlantı ölçüsüyle sonuçlanır. kovaryans (Kovahance):

İÇİNDE

Psikolojide, fizikten farklı olarak, psikologlar bir işaretin mutlak değeriyle değil, bir gruptaki deneklerin göreceli konumuyla ilgilendikleri için çoğu değişken keyfi ölçeklerde ölçülür. Ayrıca kovaryans, özelliklerin ölçüldüğü ölçeğin (varyans) ölçeğine çok duyarlıdır. Bağlantı ölçüsünü her iki özelliğin ölçüm birimlerinden bağımsız hale getirmek için kovaryansı karşılık gelen standart sapmalara bölmek yeterlidir. Böylece elde edildi için-K. Pearson korelasyon katsayısının katırı:

veya ox ve ifadelerini değiştirdikten sonra

Her iki değişkenin değerleri aşağıdaki formül kullanılarak r değerlerine dönüştürülürse

o zaman r-Pearson korelasyon katsayısı formülü daha basit görünür (071.JPG):

/dict/socology/article/soc/soc-0525.htm

KORELASYON DOĞRUSAL- iki niceliksel değişken arasında nedensel olmayan nitelikteki istatistiksel doğrusal ilişki X Ve en. "K.L katsayısı" kullanılarak ölçülmüştür. Kovaryansın her iki değişkenin standart sapmalarına bölünmesinin sonucu olan Pearson:

Nerede S xy- değişkenler arasındaki kovaryans X Ve en;

S X , S sen- değişkenler için standart sapmalar X Ve en;

X Ben , sen Ben- değişken değerler X Ve en numaralı nesne için Ben;

X, sen- değişkenler için aritmetik ortalamalar X Ve en.

Pearson katsayısı R[-1; +1]. Anlam r = 0 değişkenler arasında doğrusal bir ilişki olmadığı anlamına gelir X Ve en(ancak doğrusal olmayan istatistiksel ilişkiyi hariç tutmaz). Pozitif katsayı değerleri ( R> 0) doğrudan doğrusal bağlantıyı belirtir; değeri +1'e ne kadar yakınsa, ilişki istatistiksel doğru o kadar güçlüdür. Negatif katsayı değerleri ( R < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее обратная связь. Значения R= ±1, doğrudan veya ters tam bir doğrusal bağlantının varlığı anlamına gelir. Tam bağlantı durumunda koordinatları olan tüm noktalar ( X Ben , sen Ben) düz bir çizgi üzerinde uzanmak sen = A + bx.

"Katsayı K.L." Pearson ayrıca doğrusal ikili regresyon modelinde bağlantının gücünü ölçmek için de kullanılır.

41. Korelasyon matrisi ve korelasyon grafiği.

Genel olarak korelasyon hakkında 36 numaralı soruya bakınız.İle. 56 (64) 063.JPG

Korelasyon matrisi.Çoğunlukla korelasyon analizi, tek bir örnekte niceliksel bir ölçekte ölçülen iki değil birçok değişken arasındaki ilişkilerin incelenmesini içerir. Bu durumda, bu değişken kümesinin her bir çifti için korelasyonlar hesaplanır. Hesaplamalar genellikle bilgisayarda yapılır ve sonuç bir korelasyon matrisidir.

Korelasyon matrisi(Korelasyon Matris) kümedeki her çift için bir tür korelasyonun hesaplanmasının sonucudur R değişkenler bir numunede niceliksel bir ölçekte ölçülür.

ÖRNEK

5 değişken arasındaki ilişkileri incelediğimizi varsayalım (vl, v2,..., v5; P= 5), bir numune üzerinde ölçüldü N=30İnsan. Aşağıda kaynak verilerinin bir tablosu ve bir korelasyon matrisi bulunmaktadır.

VE
benzer veriler:

Korelasyon matrisi:

Korelasyon matrisinin kare, ana köşegen (takkak,y = /) y'ye göre simetrik, ana köşegen üzerindeki birimlerle (çünkü) olduğunu fark etmek kolaydır. G Ve = Gu = 1).

Korelasyon matrisi kare: satır ve sütun sayısı değişken sayısına eşittir. O simetrik korelasyon olduğundan ana köşegene göre Xİle en korelasyona eşit enİle X.Özelliğin kendisiyle korelasyonu bire eşit olduğundan birimler ana köşegeninde bulunur. Sonuç olarak, korelasyon matrisinin tüm elemanları analize tabi değildir, ancak ana köşegenin üstünde veya altında bulunanlar analize tabidir.

Korelasyon katsayılarının sayısı,İlişkileri incelerken analiz edilecek özellikler aşağıdaki formülle belirlenir: P(P- 1)/2. Yukarıdaki örnekte bu tür korelasyon katsayılarının sayısı 5(5 - 1)/2 = 10'dur.

Korelasyon matrisini analiz etmenin ana görevi Birçok özellik arasındaki ilişkilerin yapısını belirlemek. Bu durumda görsel analiz mümkündür korelasyon galaksileri- grafik resim istatistiksel olarak yapılaranlamlı bağlantılar, bu tür çok fazla bağlantı yoksa (10-15'e kadar). Diğer bir yol ise çok değişkenli yöntemlerin kullanılmasıdır: çoklu regresyon, faktör veya küme analizi ("Çok değişkenli yöntemler..." bölümüne bakın). Faktör veya küme analizi kullanarak, birbirleriyle diğer değişkenlerden daha yakından ilişkili olan değişken gruplarını belirlemek mümkündür. Bu yöntemlerin bir kombinasyonu da çok etkilidir, örneğin çok sayıda işaret varsa ve bunlar homojen değilse.

Korelasyonların karşılaştırılması - iki seçeneğe sahip olan korelasyon matrisini analiz etmeye yönelik ek bir görev. Korelasyon matrisinin satırlarından birindeki (değişkenlerden biri için) korelasyonların karşılaştırılması gerekiyorsa, bağımlı örnekler için karşılaştırma yöntemi kullanılır (s. 148-149). Farklı örneklemler için hesaplanan aynı isimli korelasyonları karşılaştırırken bağımsız örneklemler için karşılaştırma yöntemi kullanılır (s. 147-148).

Karşılaştırma yöntemleri korelasyonlar çapraz olarak korelasyon matrisi (rastgele bir sürecin durağanlığını değerlendirmek için) ve karşılaştırma birçok Farklı numuneler için (homojenlikleri nedeniyle) elde edilen korelasyon matrisleri yoğun emek gerektirir ve bu kitabın kapsamı dışındadır. Bu yöntemleri Sukhodolsky 1'in kitabından tanıyabilirsiniz.

Korelasyonların istatistiksel anlamlılığı sorunu. Sorun, istatistiksel hipotez testi prosedürünün şunu varsaymasıdır: bir-çoklu bir numune üzerinde gerçekleştirilen test. Aynı yöntem uygulanırsa defalarca, farklı değişkenlere bağlı olsa bile tamamen tesadüfen bir sonuç elde etme olasılığı artar. Genel olarak aynı hipotez test yöntemini tekrarlarsak bir kere farklı değişkenler veya örneklerle ilgili olarak, belirlenen a değeriyle hipotezin onayını almamız garanti edilir. ah vaka sayısı.

Diyelim ki 15 değişken için bir korelasyon matrisi analiz ediliyor, yani 15(15-1)/2 = 105 korelasyon katsayısı hesaplanıyor. Hipotezleri test etmek için a = 0,05 düzeyi ayarlanır. Hipotezi 105 kez kontrol ettiğimizde, bağlantının gerçekten var olup olmadığına bakılmaksızın, hipotezin onayını beş kez (!) alırız. Bunu bilerek ve diyelim ki 15 “istatistiksel olarak anlamlı” korelasyon katsayısına sahip olarak hangilerinin tesadüfen elde edildiğini, hangilerinin gerçek bir ilişkiyi yansıttığını söyleyebilir miyiz?

Kesin olarak konuşursak, istatistiksel bir karar vermek için a düzeyini test edilen hipotez sayısı kadar azaltmak gerekir. Ancak bu pek tavsiye edilmez, çünkü gerçekte var olan bir bağlantıyı göz ardı etme (II. Tip hata yapma) olasılığı öngörülemeyen bir şekilde artar.

Korelasyon matrisi tek başına yeterli bir temel değildiriçerdiği bireysel katsayılara ilişkin istatistiksel sonuçlar içinkorelasyonlar!

Bu sorunu çözmenin gerçekten ikna edici tek bir yolu vardır: numuneyi rastgele iki parçaya bölmek ve yalnızca numunenin her iki kısmında da istatistiksel olarak anlamlı olan korelasyonları hesaba katmak. Bir alternatif, istatistiksel olarak anlamlı derecede ilişkili değişken gruplarını tanımlamak ve ardından yorumlamak için çok değişkenli yöntemlerin (faktör, küme veya çoklu regresyon analizi) kullanılması olabilir.

Eksik değerler sorunu. Verilerde eksik değerler varsa, korelasyon matrisini hesaplamak için iki seçenek mümkündür: a) değerlerin satır satır kaldırılması (Hariç tutmakvakalarliste halinde); b) değerlerin ikili olarak silinmesi (Hariç tutmakvakalarikili olarak). Şu tarihte: satır satır silme Eksik değerleri olan gözlemlerde, değişkenlerden biri için en az bir eksik değeri olan bir nesneye (konuya) ilişkin satırın tamamı silinir. Bu yöntem, tüm katsayıların aynı nesne kümesinden hesaplanması anlamında "doğru" bir korelasyon matrisine yol açar. Ancak eksik değerler değişkenlerde rastgele dağıtılıyorsa bu yöntem, söz konusu veri setinde tek bir nesnenin kalmamasına neden olabilir (her satırda en az bir eksik değer olacaktır) . Bu durumdan kaçınmak için adı verilen başka bir yöntemi kullanın. ikili kaldırma. Bu yöntem yalnızca seçilen her sütun-değişken çiftindeki boşlukları dikkate alır ve diğer değişkenlerdeki boşlukları göz ardı eder. Bir değişken çiftinin korelasyonu, boşlukların olmadığı nesneler için hesaplanır. Pek çok durumda, özellikle boşluk sayısının nispeten küçük olduğu, örneğin %10 olduğu ve boşlukların oldukça rastgele dağıtıldığı durumlarda, bu yöntem ciddi hatalara yol açmaz. Ancak bazen durum böyle değildir. Örneğin, değerlendirmedeki sistematik bir önyargı (kayma), ihmallerin sistematik bir düzenlemesini "gizleyebilir"; bu, farklı alt kümeler için (örneğin, farklı nesne alt grupları için) oluşturulan korelasyon katsayıları arasındaki farkın nedenidir. Hesaplanan korelasyon matrisiyle ilgili bir diğer problem ikili olarak boşlukların giderilmesi, bu matrisin diğer analiz türlerinde (örneğin, çoklu regresyon veya faktör analizinde) kullanılması durumunda ortaya çıkar. Belirli bir tutarlılık düzeyi ve çeşitli katsayıların “uyumluluğu” ile “doğru” korelasyon matrisinin kullanıldığını varsayıyorlar. “Kötü” (önyargılı) tahminlere sahip bir matris kullanmak, programın ya böyle bir matrisi analiz edememesine ya da sonuçların hatalı olmasına neden olur. Bu nedenle, eksik verileri hariç tutmak için ikili yöntem kullanılıyorsa, eksik verilerin dağılımında sistematik kalıpların olup olmadığının kontrol edilmesi gerekir.

Eksik verilerin ikili olarak silinmesi, ortalamalarda ve varyanslarda (standart sapmalar) herhangi bir sistematik kaymaya yol açmıyorsa, bu istatistikler, eksik verileri silmeye yönelik satır satır yöntemi kullanılarak hesaplanan istatistiklere benzer olacaktır. Önemli bir fark gözlenirse, tahminlerde bir değişiklik olduğunu varsaymak için neden vardır. Örneğin, bir değişkenin değerlerinin ortalaması (veya standart sapması) ise A, değişkenle korelasyonunun hesaplanmasında kullanılan İÇİNDE, değişkenin aynı değerlerinin ortalamasından (veya standart sapmasından) çok daha az A, C değişkeniyle korelasyonunun hesaplanmasında kullanılmışsa, bu iki korelasyonun da geçerli olmasını beklemek için her türlü neden vardır. (A-Bbiz) farklı veri alt kümelerine dayanmaktadır. Değişken değerlerindeki boşlukların rastgele olmayan yerleştirilmesinden kaynaklanan korelasyonlarda bir sapma olacaktır.

Korelasyon galaksilerinin analizi. Korelasyon matrisinin elemanlarının istatistiksel önemi sorununu çözdükten sonra, istatistiksel olarak anlamlı korelasyonlar, bir korelasyon galaksisi veya galaksisi biçiminde grafiksel olarak gösterilebilir. Korelasyon galaksisi - Bu, köşelerden ve onları birbirine bağlayan çizgilerden oluşan bir şekildir. Köşeler özelliklere karşılık gelir ve genellikle sayılarla - değişken sayılarla - gösterilir. Çizgiler istatistiksel olarak anlamlı bağlantılara karşılık gelir ve bağlantının işaretini ve bazen de j-anlamlılık düzeyini grafiksel olarak ifade eder.

Korelasyon galaksisi yansıtabilir Tüm korelasyon matrisinin istatistiksel olarak anlamlı bağlantıları (bazen denir) korelasyon grafiği ) veya sadece anlamlı olarak seçilmiş kısmı (örneğin, faktör analizi sonuçlarına göre bir faktöre karşılık gelen kısmı).

BİR KORELASYON PLEİADE İNŞA ETME ÖRNEĞİ

Mezunların devlet (nihai) sertifikasyonu için hazırlık: Birleşik Devlet Sınavı veri tabanının oluşturulması (tüm kategorilerdeki Birleşik Devlet Sınavı katılımcılarının genel listesi, konuları belirten genel liste) - aynı konular için yedek günleri dikkate alarak;

Çalışma planı (27)

Çözüm

2. Eğitim kurumunun fen ve matematik eğitimi konularında içeriği iyileştirme ve kaliteyi değerlendirme faaliyetleri Belediye eğitim kurumu orta öğretim okulu No. 4, Litvinovskaya, Chapaevskaya,

Spearman sıralama korelasyonu(sıra korelasyonu). Spearman'ın sıra korelasyonu, faktörler arasındaki ilişkinin derecesini belirlemenin en basit yoludur. Yöntemin adı, ilişkinin sıralar arasında, yani elde edilen niceliksel değerlerin azalan veya artan sırada sıralandığı seriler arasında belirlendiğini belirtir. Öncelikle, çiftler arasındaki bağlantının dörtten az ve yirmiden fazla olması durumunda sıra korelasyonunun önerilmediğini unutmamak gerekir; ikincisi, sıra korelasyonu, değerlerin doğası gereği yarı niceliksel olması, yani sayısal bir ifadeye sahip olmaması ve bu değerlerin açık bir oluşum sırasını yansıtması durumunda, başka bir durumda ilişkinin belirlenmesini mümkün kılar; üçüncü olarak, yaklaşık veri elde etmenin yeterli olduğu durumlarda sıra korelasyonunun kullanılması tavsiye edilir. Soruyu belirlemek için sıra korelasyon katsayısının hesaplanmasına bir örnek: anket, deneklerin X ve Y benzer kişisel niteliklerini ölçer. "Evet" veya "hayır" alternatif yanıtlarını gerektiren iki anket (X ve Y) kullanılarak, 15 deneğin yanıtları (N = 10) olmak üzere birincil sonuçlar elde edildi. Sonuçlar, anket X ve anket B için ayrı ayrı olumlu yanıtların toplamı olarak sunuldu. Bu sonuçlar tabloda özetlenmiştir. 5.19.

Tablo 5.19. Spearman sıra korelasyon katsayısını (p) hesaplamak için birincil sonuçların tablolanması *

Özet korelasyon matrisinin analizi. Korelasyon galaksileri yöntemi.

Örnek. Masada Şekil 6.18 Wechsler yöntemi kullanılarak test edilen on bir değişkenin yorumlarını göstermektedir. Veriler, 18 ila 25 yaşları arasındaki homojen bir örneklemden (n = 800) elde edilmiştir.

Tabakalandırmadan önce korelasyon matrisinin sıralanması tavsiye edilir. Bunu yapmak için, her değişkenin diğerleriyle olan korelasyon katsayılarının ortalama değerleri orijinal matriste hesaplanır.

Sonra tabloya göre. 5.20, belirli bir 0,95 güven olasılığı ve n - miktarları ile korelasyon matrisinin kabul edilebilir katmanlaşma seviyelerini belirler

Tablo 6.20. Artan korelasyon matrisi

Değişkenler	1	2	3	4	istemek	0	7	8	0	10	11	M (rij)	Rütbe
1	1	0,637	0,488	0,623	0,282	0,647	0,371	0,485	0,371	0,365	0,336	0,454	1
2		1	0,810	0,557	0,291	0,508	0,173	0,486	0,371	0,273	0,273	0,363	4
3			1	0,346	0,291	0,406	0,360	0,818	0,346	0,291	0,282	0,336	7
4				1	0,273	0,572	0,318	0,442	0,310	0,318	0,291	0,414	3
5					1	0,354	0,254	0,216	0,236	0,207	0,149	0,264	11
6						1	0,365	0,405	0,336	0,345	0,282	0,430	2
7							1	0,310	0,388	0,264	0,266	0,310	9
8								1	0,897	0,363	0,388	0,363	5
9									1	0,388	0,430	0,846	6
10										1	0,336	0,310	8
11											1	0,300	10

Tanımlar: 1 - genel farkındalık; 2 - kavramsallık; 3 - dikkat; 4 - genellemenin vverileri K; b - doğrudan ezberleme (sayılarla) 6 - ana dile hakim olma düzeyi; 7 - duyu-motor becerilerde ustalaşma hızı (sembol kodlama) 8 - gözlem; 9 - kombinatoryal yetenekler (analiz ve sentez için) 10 - parçaları anlamlı bir bütün halinde organize etme yeteneği; 11 - buluşsal sentez yeteneği; M (rij) - değişkenin diğer gözlem değişkenleriyle korelasyon katsayılarının ortalama değeri (bizim durumumuzda n = 800): r (0) - sıfır "Diseksiyon" düzleminin değeri - minimum anlamlı mutlak değer korelasyon katsayısı (n - 120, r (0) = 0,236; n = 40, r (0) = 0,407) | veya | - izin verilen tabakalaşma adımı (n = 40, | Δr | = 0,558) in - izin verilen tabakalaşma seviyesi sayısı (n = 40, s = 1; n = 120, s = 2); r (1), r (2), ..., r (9) - kesme düzleminin mutlak değeri (n = 40, r (1) = 0,965).

n = 800 için, gtipi değerini ve gi sınırlarını buluruz, ardından korelasyon matrisini katmanlandırırız, katmanlar içindeki korelasyon galaksilerini veya korelasyon matrisinin ayrı kısımlarını vurgulayarak üstteki katmanlar için korelasyon galaksilerinin ilişkilerini çizeriz (Şekil 1). .5.5).

Ortaya çıkan galaksilerin anlamlı bir analizi matematiksel istatistiklerin ötesine geçer. Ülker'in anlamlı yorumlanmasına yardımcı olan iki resmi göstergenin bulunduğuna dikkat edilmelidir. Önemli bir gösterge, bir tepe noktasının derecesi, yani bir tepe noktasına bitişik kenarların sayısıdır. Kenar sayısı en fazla olan değişken galaksinin “çekirdeği”dir ve bu galaksinin geri kalan değişkenlerinin bir göstergesi olarak değerlendirilebilir. Bir diğer önemli gösterge ise iletişim yoğunluğudur. Bir değişkenin bir galakside daha az fakat daha yakın bağlantısı olabilir ve başka bir galakside daha fazla fakat daha az yakın bağlantısı olabilir.

Tahminler ve tahminler. y = b1x + b0 denklemine doğrunun genel denklemi denir. (x, y) nokta çiftlerini gösterir.

Pirinç. 5.5. Matris katmanlaması ile elde edilen korelasyon galaksileri

belirli bir doğru üzerinde yer alır ve herhangi bir x değeri için onunla eşleştirilmiş b değeri, x'in belirli bir b1 sayısı ile çarpılması ve ikinci olarak b0 sayısının bu çarpıma eklenmesiyle bulunabilir.

Regresyon katsayısı, nedensel faktör bir birim değiştiğinde araştırma faktöründeki değişimin derecesini belirlemenizi sağlar. Mutlak değerler, değişken faktörler arasındaki ilişkiyi mutlak değerleri ile karakterize eder. Regresyon katsayısı aşağıdaki formül kullanılarak hesaplanır:

Deneylerin tasarımı ve analizi. Deney tasarımı ve analizi, değişkenler arasındaki nedensel ilişkileri bulmak ve test etmek için geliştirilen istatistiksel yöntemlerin üçüncü önemli dalıdır.

Çok faktörlü bağımlılıkları incelemek için matematiksel deneysel tasarım yöntemleri son zamanlarda giderek daha fazla kullanılmaktadır.

Tüm faktörleri aynı anda değiştirme yeteneği şunları yapmanızı sağlar: a) deney sayısını azaltmak;

b) deneysel hatayı minimuma indirmek;

c) alınan verilerin işlenmesini basitleştirmek;

d) sonuçların netliğini ve karşılaştırma kolaylığını sağlamak.

Her faktör, seviye adı verilen ve -1, 0 ve 1 ile gösterilen belirli sayıda farklı değer elde edebilir. Sabit bir faktör seviyesi seti, olası deneylerden birinin koşullarını belirler.

Tüm olası kombinasyonların toplamı aşağıdaki formül kullanılarak hesaplanır:

Tam bir faktöriyel deney, faktör seviyelerinin tüm olası kombinasyonlarının uygulandığı bir deneydir. Tam faktöriyel deneyler diklik özelliğine sahip olabilir. Ortogonal planlamada deneydeki faktörler korelasyonsuzdur; sonuçta hesaplanan regresyon katsayıları birbirinden bağımsız olarak belirlenir.

Matematiksel deneysel planlama yönteminin önemli bir avantajı, çok yönlülüğü ve birçok araştırma alanına uygunluğudur.

Renkli TV denetleyicilerinde bazı faktörlerin zihinsel stres düzeyinin oluşumu üzerindeki etkisini karşılaştırmanın bir örneğini ele alalım.

Deney ortogonal Tasarım 2 üçe dayanmaktadır (iki düzeyde üç faktör değişir).

Deney 2 + 3 tam bölüm ve üç tekrarla gerçekleştirildi.

Ortogonal planlama bir regresyon denkleminin oluşturulmasına dayanır. Üç faktör için şöyle görünür:

Bu örnekteki sonuçların işlenmesi şunları içerir:

a) hesaplama için ortogonal plan 2+3 tablosunun oluşturulması;

b) regresyon katsayılarının hesaplanması;

c) önemlerinin kontrol edilmesi;

d) elde edilen verilerin yorumlanması.

Söz konusu denklemin regresyon katsayıları için K tekrar sayısının 3 olduğu katsayıların anlamlılığını değerlendirebilmek için N = 2 3 = 8 seçeneğini koymak gerekiyordu.

Deney planlama matrisi derlendi ve şöyle görünüyordu:

Aşağıdaki hesaplayıcı, iki rastgele değişken arasındaki Spearman'ın sıra korelasyon katsayısını hesaplar. Teorik kısım, hesap makinesinin altındadır.

eklemek ithalat ihracat mode_edit silmek

Rastgele değişkenlerdeki değişiklikler

	ok_yukarı doğruok_aşağı doğru	ok_yukarı doğruok_aşağı doğru
			mode_edit

Sayfa başına öğe sayısı: 5 10 20 50 100 şerit_left chevron_right

Rastgele değişkenlerdeki değişiklikler

Verileri içe aktar İçe aktarma hatası

"Veri alanlarını ayırmak için aşağıdaki karakterlerden biri kullanılır: sekme, noktalı virgül (;) veya virgül(,)" Örnek: -50.5;-50.5

İçe Aktar Geri İptal

Virgülden sonraki rakamlar: 4

Hesaplamak

Spearman'ın korelasyon katsayısı

Kaydetmek paylaşmak eklenti

Spearman'ın sıra korelasyon katsayısı hesaplama yöntemi aslında oldukça basittir. Pearson korelasyon katsayısını tasarlamak gibidir, ancak yalnızca rastgele değişkenlerin ölçümü için değil, onlar için de tasarlanmıştır. sıralama değerleri.

Sadece rütbe değerinin ne olduğunu ve tüm bunların neden gerekli olduğunu anlamamız gerekiyor.

Bir varyasyon serisinin elemanları artan veya azalan sırada düzenlenmişse, bu rütbe elemanın sıralı serideki numarası olacaktır.

Örneğin değişken bir serimiz var (17,26,5,14,21). Elemanlarını azalan düzende sıralayalım (26,21,17,14,5). 26'nın sıralaması 1, 21 - sıralaması 2 vb., Sıralama değerlerinin varyasyonel serisi şu şekilde görünecektir (3,1,5,4,2).

Yani Spearman katsayısı hesaplanırken ilk varyasyon serileri, varyasyonel sıralama değerleri serisine dönüştürülür ve ardından Pearson formülü bunlara uygulanır.
.
Bir incelik var - tekrarlanan değerlerin sıralaması, sıralamaların ortalaması olarak alınır. Yani, bir (17, 15, 14, 15) serisi için sıralama serisi (1, 2,5, 4, 2,5) gibi görünecektir, çünkü ilk eleman 15'in derecesi 2 ve ikinci elemanın sırası 3'tür, Ve.

Tekrarlayan değerlere, yani sıralama serisinin tüm değerlerine (1 ile n arasındaki sayılar) sahip değilseniz, Pearson formülü şu şekilde basitleştirilebilir:

Bu arada, bu formül genellikle Spearman katsayısının hesaplanmasında kullanılan formül olarak verilir.

Değerlerin kendisinden sıra değerlerine geçişin özü nedir?
Sıralama değerlerinin korelasyonunu araştırırken, iki değişkenin bağımlılığının monotonik bir fonksiyonla ne kadar iyi tanımlandığını bulabilirsiniz.

Katsayının işareti değişkenler arasındaki ilişkinin yönünü gösterir. İşaret pozitif ise Y'nin değerleri X'in artmasıyla artma eğilimindedir. İşaret negatifse Y'nin değerleri X'in artmasıyla azalma eğilimindedir. Katsayı 0 ise orada o zaman bir eğilim yok. Katsayı 1 veya -1'e eşitse, X ve Y arasındaki ilişki monotonik fonksiyon görünümüne sahiptir, yani. X'in artmasıyla Y de artar ve bunun tersi de geçerlidir.

Yani, bir değişkenin diğeriyle yalnızca doğrusal ilişkisini tespit edebilen Pearson korelasyon katsayısından farklı olarak Spearman korelasyon katsayısı, doğrudan doğrusal ilişkinin ortaya çıkarılamadığı monotonik bağımlılığı tespit edebilir.

İşte bir örnek.
Bir örnekle açıklayayım. Diyelim ki y=10/x fonksiyonunu inceliyoruz.
Aşağıdaki X ve Y ölçümlerine sahibiz
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Bu veri için Pearson korelasyon katsayısı -0,4686'ya eşittir, yani. ilişki zayıftır veya yoktur. Ve Spearman'ın korelasyon katsayısı kesinlikle -1'e eşittir, sanki bu araştırmacıya Y'nin X'e güçlü negatif monotonik bağımlılığı olduğuna dair bir ipucu veriyormuş gibi.

Kısa teori

Sıra korelasyonu, değişkenlerin artan değere göre sıralanan ilişkilerini yansıtan bir korelasyon analizi yöntemidir.

Sıralar, sıralanmış bir serideki toplu birimlerin seri numaralarıdır. Bir popülasyonu, aralarındaki ilişki incelenen iki özelliğe göre sıralarsak, sıraların tam çakışması, mümkün olan en yakın doğrudan bağlantı anlamına gelir ve sıraların tam tersi, mümkün olan en yakın geri bildirim anlamına gelir. Her iki özelliği de aynı sıraya göre sıralamak gerekir: ya özelliğin daha küçük değerlerinden daha büyük değerlerine ya da tam tersi.

Pratik amaçlar için sıra korelasyonunun kullanılması çok faydalıdır. Örneğin, ürünün iki niteliksel özelliği arasında yüksek dereceli bir korelasyon kurulursa, ürünleri özelliklerden yalnızca birine göre kontrol etmek yeterlidir, bu da maliyeti azaltır ve kontrolü hızlandırır.

K. Spearman tarafından önerilen sıra korelasyon katsayısı, bir sıra ölçeğinde ölçülen değişkenler arasındaki ilişkinin parametrik olmayan bir ölçümünü ifade eder. Bu katsayı hesaplanırken popülasyondaki özelliklerin dağılımlarının doğası hakkında herhangi bir varsayım yapılmasına gerek yoktur. Bu katsayı, bu durumda karşılaştırılan büyüklüklerin sıralarını temsil eden sıralı özellikler arasındaki bağlantının yakınlık derecesini belirler.

Spearman korelasyon katsayısının değeri +1 ile -1 aralığındadır. Bir sıra ölçeğinde ölçülen iki özellik arasındaki ilişkinin yönünü karakterize eden pozitif veya negatif olabilir.

Spearman'ın sıra korelasyon katsayısı aşağıdaki formül kullanılarak hesaplanır:

İki değişkene göre sıralar arasındaki fark

– eşleşen çiftlerin sayısı

Sıra korelasyon katsayısının hesaplanmasında ilk adım değişken serisini sıralamaktır. Sıralama prosedürü, değişkenlerin değerlerine göre artan sırada düzenlenmesiyle başlar. Doğal sayılarla gösterilen farklı değerlere rütbeler atanır. Eşit değerde birden fazla değişken varsa bunlara ortalama bir sıralama atanır.

Spearman sıralama korelasyon katsayısının avantajı, sayısal olarak ifade edilemeyen özelliklere göre sıralamanın mümkün olmasıdır: belirli bir pozisyon için adayları mesleki seviyeye, bir takıma liderlik etme becerisine, kişisel çekiciliğe, kişisel cazibeye göre sıralamak mümkündür. vb. Uzman değerlendirmeleriyle, farklı uzmanların değerlendirmelerini sıralamak ve bunların birbirleriyle olan korelasyonlarını bulmak mümkündür; böylece, diğer uzmanların değerlendirmeleriyle zayıf korelasyona sahip olan uzmanın değerlendirmeleri değerlendirme dışı bırakılır. Trendin istikrarını değerlendirmek için Spearman'ın sıra korelasyon katsayısı kullanılır. Sıra korelasyon katsayısının dezavantajı, sıralardaki aynı farklılıkların, özelliklerin değerlerindeki (kantitatif özellikler durumunda) tamamen farklı farklılıklara karşılık gelebilmesidir. Bu nedenle, ikincisi için, sıraların korelasyonu, bağlantının yakınlığının yaklaşık bir ölçüsü olarak düşünülmelidir; bu, özelliklerin sayısal değerlerinin korelasyon katsayısından daha az bilgilendiricidir.

Sorun çözümü örneği

Görev

Bir üniversite yurdunda yaşayan rastgele seçilmiş 10 öğrenciyle yapılan bir anket, önceki oturumdan alınan ortalama puan ile öğrencinin bağımsız çalışmaya haftada harcadığı saat sayısı arasındaki ilişkiyi ortaya koyuyor.

Spearman sıra korelasyon katsayısını kullanarak ilişkinin gücünü belirleyin.

Sorunları çözmekte zorluk çekiyorsanız site, istatistik konusunda öğrencilere evde yapılan testler veya sınavlarla çevrimiçi yardım sağlar.

Sorunun çözümü

Sıra korelasyon katsayısını hesaplayalım.

№

değişen

Sıra karşılaştırması

Sıra farkı

4.7

3.1

-2

4.4

3.6

-2

3.8

3.7

-3

3.7

3.8

4.2

3.9

-3

4.3

3.6

4.2

4.3

3.1

4.4

3.9

4.7

Toplam

Spearman'ın sıra korelasyon katsayısı:

Sayısal değerleri değiştirerek şunu elde ederiz:

Sorunun sonucu

Önceki oturumun genel not ortalaması ile öğrencinin bağımsız çalışmaya haftada harcadığı saat sayısı arasındaki ilişki orta derecede güçlüdür.

Bir testi tamamlamak için zamanınız azalıyorsa, web sitesinden istatistik sorunlarına her zaman acil bir çözüm sipariş edebilirsiniz.

Ortalama Bir testi çözmenin maliyeti 700 - 1200 ruble'dir (ancak tüm sipariş için en az 300 ruble değildir). Fiyat, kararın aciliyetinden büyük ölçüde etkilenir (bir günden birkaç saate kadar). Bir sınav/test için çevrimiçi yardımın maliyeti 1000 ruble'dir. Bileti çözmek için.

Daha önce görev koşullarını göndermiş ve ihtiyacınız olan çözümün zaman dilimini size bildirmiş olarak, maliyetle ilgili tüm soruları doğrudan sohbette sorabilirsiniz. Tepki süresi birkaç dakikadır.

İlgili sorunlara örnekler

Fechner oranı
Kısa bir teori verilmiş ve Fechner işaret korelasyon katsayısının hesaplanması probleminin çözümüne ilişkin bir örnek ele alınmıştır.

Chuprov ve Pearson'un karşılıklı olasılık katsayıları
Sayfa, Chuprov ve Pearson karşılıklı olasılık katsayılarını kullanarak niteliksel özellikler arasındaki ilişkileri incelemeye yönelik yöntemler hakkında bilgi içerir.

Spearman'ın sıra korelasyon katsayısı, olaylar arasındaki ilişkiyi istatistiksel olarak incelemek için kullanılan parametrik olmayan bir yöntemdir. Bu durumda, incelenen özelliklerin iki niceliksel serisi arasındaki gerçek paralellik derecesi belirlenir ve niceliksel olarak ifade edilen bir katsayı kullanılarak kurulan bağlantının yakınlığının bir değerlendirmesi yapılır.

1. Sıra korelasyon katsayısının gelişiminin tarihi

Bu kriter 1904 yılında korelasyon analizi için geliştirilmiş ve önerilmiştir. Charles Edward Spearman, İngiliz psikolog, Londra ve Chesterfield Üniversitelerinde profesör.

2. Spearman katsayısı ne için kullanılır?

Spearman sıra korelasyon katsayısı, karşılaştırılan iki seri arasındaki ilişkinin yakınlığını belirlemek ve değerlendirmek için kullanılır. niceliksel göstergeler. Artış veya azalış derecesine göre sıralanan göstergelerin sıralarının çoğu durumda çakışması durumunda (bir göstergenin daha büyük değeri, başka bir göstergenin daha büyük değerine karşılık gelir - örneğin, hastanın boyunu ve vücut ağırlığını karşılaştırırken), var olduğu sonucuna varılmıştır. dümdüz korelasyon bağlantısı. Göstergelerin sıralaması ters yöndeyse (bir göstergenin daha yüksek değeri diğerinin daha düşük değerine karşılık gelir; örneğin, yaş ve kalp atış hızını karşılaştırırken), sonra konuşurlar tersi göstergeler arasındaki bağlantılar.

Spearman korelasyon katsayısı aşağıdaki özelliklere sahiptir:

Korelasyon katsayısı eksi birden bire kadar değerler alabilir ve rs=1 ile tam olarak doğrudan bir ilişki, rs= -1 ile ise tam olarak geri beslemeli bir ilişki vardır.
Korelasyon katsayısı negatifse geri beslemeli bir ilişki var; pozitifse doğrudan bir ilişki var.
Korelasyon katsayısı sıfırsa, miktarlar arasında pratik olarak hiçbir bağlantı yoktur.
Korelasyon katsayısının modülü birliğe ne kadar yakınsa, ölçülen büyüklükler arasındaki ilişki o kadar güçlü olur.

3. Spearman katsayısı hangi durumlarda kullanılabilir?

Katsayının bir yöntem olması nedeniyle parametrik olmayan analiz normal dağılım için herhangi bir test yapılmasına gerek yoktur.

Karşılaştırılabilir göstergeler her ikisinde de ölçülebilir sürekli ölçek(örneğin, 1 μl kandaki kırmızı kan hücrelerinin sayısı) ve sıralı(örneğin, 1'den 5'e kadar uzman değerlendirme puanları).

Ölçülen miktarlardan herhangi birinin farklı değerleri arasındaki fark yeterince büyükse Spearman değerlendirmesinin etkinliği ve kalitesi azalır. Ölçülen miktarın değerlerinin eşit olmayan bir dağılımı varsa Spearman katsayısının kullanılması önerilmez.

4. Spearman katsayısı nasıl hesaplanır?

Spearman sıra korelasyon katsayısının hesaplanması aşağıdaki adımları içerir:

5. Spearman katsayısı değeri nasıl yorumlanır?

Sıra korelasyon katsayısını kullanırken, özellikler arasındaki bağlantının yakınlığı, zayıf bağlantının göstergeleri olarak 0,3 veya daha düşük katsayı değerleri dikkate alınarak şartlı olarak değerlendirilir; 0,4'ten büyük ancak 0,7'den küçük değerler, orta düzeyde bağlantı yakınlığının göstergeleridir ve 0,7 veya daha yüksek değerler, yüksek bağlantı yakınlığının göstergeleridir.

Elde edilen katsayının istatistiksel anlamlılığı, Öğrenci t-testi kullanılarak değerlendirilir. Hesaplanan t-testi değeri, belirli sayıda serbestlik derecesi için tablodaki değerden küçükse, gözlemlenen ilişki istatistiksel olarak anlamlı değildir. Daha büyükse, korelasyon istatistiksel olarak anlamlı kabul edilir.