Korelasyon alanı nasıl oluşturulur? Korelasyon alanı

Rastgele değişkenler arasındaki bağımlılıkların deneysel çalışması için x ve y bir dizi bağımsız deney gerçekleştirin. Sonuç Ben- deney bir çift değer verir (x r, y g), ben = 1, 2,..., P.

Nesnelerin çeşitli özelliklerini karakterize eden nicelikler bağımsız veya birbiriyle ilişkili olabilir. İlişkilerin tezahür biçimleri çok çeşitlidir. En yaygın iki tür işlevsel (tam) ve korelasyon (eksik) bağlantılardır.

İki nicelik fonksiyonel olarak birinin değerine bağlı olduğunda -x h mutlaka başka bir miktarın bir veya daha fazla kesin olarak tanımlanmış değerine karşılık gelir -y ( .Çoğu zaman fizik ve kimyada fonksiyonel bağlantılar ortaya çıkar. Gerçek durumlarda, nesnenin kendisinin ve dış ortamın birbirini etkileyen sonsuz sayıda özelliği vardır, dolayısıyla bu tür bir bağlantı yoktur, başka bir deyişle işlevsel bağlantılar matematiksel soyutlamalardır.

Genel faktörlerin etkisi ve nesnelerin davranışındaki nesnel kalıpların varlığı, yalnızca istatistiksel bağımlılığın ortaya çıkmasına yol açar. İstatistik, miktarlardan birindeki bir değişikliğin diğerlerinin (diğerinin) dağılımında bir değişiklik gerektirdiği ve bu diğer miktarların belirli olasılıklarla belirli değerleri aldığı bir bağımlılıktır. Bu durumda, fonksiyonel bağımlılık, istatistiksel bağımlılığın özel bir durumu olarak düşünülmelidir: bir faktörün değeri, bire eşit olasılıkla diğer faktörlerin değerlerine karşılık gelir. İstatistiksel bağımlılığın daha önemli bir özel durumu, bazı rastgele değişkenlerin değerleri ile diğerlerinin ortalama değeri arasındaki ilişkiyi karakterize eden korelasyon bağımlılığıdır, ancak her bir durumda birbiriyle ilişkili herhangi bir değer farklı değerler alabilir.

Bağımlı değişkenin verilen değerleri bağımsız değişkenin belirli sayıda olası değerine karşılık geldiğinde, kütle gözlemleri için ortalama olarak bir korelasyon ilişkisi (eksik veya istatistiksel olarak da adlandırılır) ortaya çıkar. Açıklama - Etkileşimi hesaba katılmayan rastgele değişkenlerden etkilenen, analiz edilen faktörler arasındaki ilişkilerin karmaşıklığı. Bu nedenle, işaretler arasındaki bağlantı yalnızca vakaların çoğunda ortalama olarak ortaya çıkar. Korelasyon bağlantısında her argüman değeri, belirli bir aralıkta rastgele dağıtılan fonksiyon değerlerine karşılık gelir.

"Korelasyon" terimi ilk olarak "hayvan parçaları ve organlarının korelasyon yasasını" türeten Fransız paleontolog J. Cuvier tarafından kullanıldı (bu yasa, bulunan vücut parçalarından hayvanın tamamının görünümünü yeniden yapılandırmaya izin verir). Bu terim istatistiklere İngiliz biyolog ve istatistikçi F. Galton tarafından tanıtıldı (sadece bir ilişki değil, aynı zamanda "sanki bir bağlantı gibi" - korelasyon).

Korelasyon bağımlılıkları her yerde bulunur. Örneğin tarımda bu, verim ile uygulanan gübre miktarı arasındaki ilişki olabilir. Açıkçası, ikincisi mahsulün oluşumunda rol oynuyor. Ancak her spesifik tarla veya arsa için aynı miktarda uygulanan gübre, nihai sonucu oluşturan bir dizi başka faktörün (hava durumu, toprak durumu vb.) etkileşimi nedeniyle verimde farklı bir artışa neden olacaktır. Bununla birlikte, ortalama olarak böyle bir ilişki gözlenmektedir - uygulanan gübrelerin kütlesindeki artış, verimde artışa yol açmaktadır.

İncelenen özellikler arasındaki bağlantıları belirlemenin en basit yöntemi bir korelasyon tablosu oluşturmaktır; görsel temsili korelasyon alanıdır. jq değerlerinin apsis ekseninde ve ordinat ekseninde çizildiği bir grafiktir yx. Noktaların konumu ve belirli bir yöndeki konsantrasyonları ile bir bağlantının varlığı niteliksel olarak değerlendirilebilir.

Pirinç. 7.3.

Rastgele değişkenler arasında parabolik fonksiyonel olana yakın pozitif bir korelasyon Şekil 2'de gösterilmektedir. 6.1 , A.Şek. Şekil 6.1, b'de zayıf negatif korelasyonun bir örneği gösterilmektedir ve Şekil 6.1'de b'de zayıf bir negatif korelasyon örneği gösterilmektedir. 6.1, V- pratik olarak ilişkisiz rastgele değişkenlere bir örnek. Bağımlılık grafikte düz bir çizgiyle (pozitif veya negatif eğimle) "gösterilebiliyorsa" korelasyon yüksektir.

Sistematik problem çözme Lapygin Yuri Nikolaevich

7.3. Korelasyon alanı

7.3. Korelasyon alanı

Mantık, fantezinin deli gömleğidir.

Helmar Nahr

Grafikler genellikle iki değişken arasındaki ilişkileri kurmak için kullanılır.

Her iki değişkenin de eş zamanlı değişmesi, aralarında bağlantı olduğu ve birbirlerini etkiledikleri anlamına gelebilir. Bir örnek, ürün maliyetlerinin yapısındaki ücretlerin payındaki büyümenin dinamikleri ve emek üretkenliğinin dinamikleridir. Gözlemler birinci değişken arttıkça ikincisinin de arttığını göstermektedir.

Ancak şunu da unutmamak gerekir ki, değişkenlerdeki değişikliklerde belirli bir düzeyde eşzamanlılık olsa bile bu, aralarında koşulsuz bir neden-sonuç ilişkisinin var olduğu anlamına gelmez (belki de bu duruma neden olan üçüncü bir değişken vardır). bir etki).

Korelasyon alanlarının örnekleri Şekil 2'de gösterilmektedir. 7.2.

Aşağıda çizimin bir açıklaması sunulmaktadır.

1. Analiz için iki değişken seçilir: biri bağımsız, diğeri bağımlı.

2. Bağımsız değişkenin her değeri için bağımlı değişkenin karşılık gelen değerini ölçün. Bu iki değer, grafikte nokta olarak gösterilen bir veri çifti oluşturur. Tipik olarak en az 30 puan almanız gerekir ancak anlamlı bir grafik oluşturmak için puan sayısının en az 100 olması gerekir.

3. Beklenen nedeni karakterize eden bağımsız değişkenin değeri eksen boyunca çizilir X ve sorunu karakterize eden bağımlı değişkenin değeri eksen boyuncadır en.

4. Ortaya çıkan veri çiftleri grafikte noktalar halinde işaretlenir ve sonuç analiz edilir. Korelasyon diyagramda görünmüyorsa, logaritmik ölçekte bir grafik oluşturmayı deneyebilirsiniz.

Pazarlama Savaşları kitabından kaydeden Rice Al

Reklam metni kitabından. Derleme ve tasarım metodolojisi yazar Berdyshev Sergey Nikolaevich

5.2. Onomastik alan A.V. Superanskaya, N.V. Podolskaya ve diğer dilbilimciler, genel olarak adlandırma ve ticaret açısından önemli olan aşağıdaki adlandırılmış nesne sınıflarını ve bunlara karşılık gelen onomastik kategorileri tanımlama eğilimindedir: belge ve yasaların adları - belge adları,

Bunu Kullanmalısınız kitabından yazar Slovtsova Irina

Sayılarda güvenlik var mı? Birkaç yıl boyunca bölgesel basında çalıştım ve yerel yönetim sorunları hakkında yazdım. Bürokratik aygıtın öyle yapılandırılmış, hiyerarşik bir şemaya göre inşa edilmiş, hayatımızın tüm alanlarına nüfuz ettiğini, tek bir kişinin (hatta

Reklamcılıktaki Hayatım kitabından kaydeden Claude Hopkins

iPresentation kitabından. Apple Lideri Steve Jobs'tan İkna Dersleri kaydeden Gallo Carmine

"Gerçeklik Çarpıtma Alanı" Sculley, Apple Başkan Yardımcısı Bud Tribble'ın bir zamanlar "gerçeklik çarpıtma alanı" olarak tanımladığı şeye, herkesi neredeyse her şeye ikna etme yeteneğine tanık oldu. Pek çok insan bu manyetik çekime karşı koyamaz ve

Sergi Yönetimi: Yönetim Stratejileri ve Pazarlama İletişimi kitabından yazar Filonenko İgor

9. Sergi Alanında Halkla İlişkiler 9.1. Sergi alanındaki halkla ilişkilerin amaçları, hedefleri, araçları Geniş anlamda halkla ilişkiler (bundan böyle - PR) “iyi niyet oluşturmayı ve sürdürmeyi amaçlayan planlanmış ve uygulanan çabalar” olarak tanımlanmaktadır.

İlham Veren Yönetici kitabından yazar Leary-Joyce Judith

“Mucizeler Alanı” Ben şahsen bunun mükemmel bir olasılık olduğunu düşünüyorum: Daha iyi bir şeyi hayal bile edemezdim. Aslında bu kitabı bu yüzden yazdım. “Düşler Tarlası” filmini izlediniz mi? Orada, Kevin Costner'ın karakteri mısır tarlasını inşa etmeye karar veriyor

Reklam Ajansı kitabından: nereden başlamalı, nasıl başarılı olunur yazar Golovanov Vasily Anatolyevich

"Sahada!" Bu bölümde, satacağınız hizmetler için sözleşmelerin müzakere edilmesi ve sonuçlandırılmasına ilişkin çalışmanın ana aşamasıyla ilgili tüm ana konuları ele alacağız. Vakaların% 80'inde tüm girişimciler müzakerelere kolayca hazırdır - bunu biliyorum.

Apple kitabından. İnanç olgusu yazar Vasiliev Yuri Nikolayeviç

Altered Reality Field İlk Mac'in ana geliştiricilerinden Andy Herzwild, Steve Jobs hakkında şunları söyledi: "Altered Reality Field, karizmatik hitabet tarzının, inatçılığın ve herhangi bir gerçeği çarpıtıp başka bir şeye dönüştürme arzusunun muhteşem bir karışımıydı.

Görgü Kuralları kitabından. Sosyal ve ticari iletişim için eksiksiz bir kurallar dizisi. Tanıdık ve alışılmadık durumlarda nasıl davranılacağı yazar Belousova Tatyana

LEGO şirketini öldürmeyen ama daha da güçlendiren şey kitabından. Tuğla tuğla kaydeden Bryn Bill

Üç Liderlik Çemberi kitabından yazar Sudarkin İskender

Sayılarda güvenlik vardır. Çalışmaya bir İK uzmanının dahil edilmesi Bir süre önce, 2000'li yılların ortalarında, "yöneticinin stratejik ortağı olarak İK" konusu İK yöneticisi forumlarında aktif olarak tartışılıyordu. Anlaşmazlıklar yerini geçici fikir birliğine bıraktı, konuşmaya davet edilenler

Lansman kitabından! İşletmeniz için hızlı başlangıç kaydeden Walker Jeff

Mağaza Direktörünün Büyük Kitabı 2.0 kitabından. Yeni teknolojiler kaydeden Krok Gulfira

Müşterilerinize Sarılın kitabından. Üstün Hizmet Uygulaması kaydeden Mitchell Jack

Piskoposluk basın servisinin çalışmalarını organize etmek için Kılavuzlar kitabından yazar E Zhukovskaya E

Ana ve ilgili bileşenler için bir korelasyon alanı oluşturuyoruz. Apsis ekseninde ana bileşenin içeriğini (bu durumda Hg) çizeriz ve ordinat ekseninde ilgili bileşenin içeriğini çizeriz, yani. sn.

Korelasyon alanındaki bağlantının gücünün bir ön değerlendirmesini yapmak için, ana ve ilişkili bileşenlerin ortanca değerlerine karşılık gelen, alanı dört kareye bölen çizgiler çizmek gerekir.

Bir bağlantının gücünün niceliksel bir ölçüsü korelasyon katsayısıdır. Yaklaşık tahmini aşağıdaki formül kullanılarak hesaplanır:

Burada n1, I ve III'teki toplam puan sayısıdır, n2 = II ve IV'teki toplam puan sayısıdır.

ben = 4 II = 8 III = 7 IV = 5

Daha sonra, bilgisayarda hesaplanan başlangıç ​​verilerini (Хср, Yср, varyanslar Dx, Dy ve bunların kovaryansları cov(x,y)) kullanarak, korelasyon katsayısı r'nin değerini ve ilişkili doğrusal regresyon denklemlerinin parametrelerini hesaplarız. bileşen ana öğeye göre ve ana bileşen ilgili bileşene göre.

Aşağıdaki formülleri kullanarak hesaplıyoruz:

İlk veriler:

cov(x, y) = 163,86

r = cov(x, y)/√Dx * Dy = 163,86/√157,27* 645,61= 0,51

b = cov(x, y)/Dx = 163,86/157,27= 1,04

a = Yavg – b * Xorta = 153,13– (-0,08) * 36,75 = 150,19

d = cov(x, y)/ Dy = 163,86/645,61= 0,25

c = Хср – d * Yср = 36,75– (0,25) * 153,13= -1,5

y =150,19+1,04x x = -1,5+0,25y

Korelasyon alanında regresyon çizgileri oluşturuyoruz.

Aşama 7. Korelasyon ilişkisinin varlığına ilişkin hipotezin test edilmesi

Korelasyonun varlığına ilişkin hipotezin test edilmesi, iki boyutlu normal dağılım gösteren bir rastgele değişken olan X, Y için, x ve y arasında korelasyon olmadığında korelasyon katsayısının “0” olması gerçeğine dayanmaktadır. Korelasyonun yokluğuna ilişkin hipotezi test etmek için kriterin değerini hesaplamak gerekir:

t = r * √(N – 2)/√(1 – r2) = 0,51* √(24-2)/√(1 – (0,51) 2) = 2,65

Değerlerimiz için t = 2,65

Tablo değeri ttab = 2,02

Hesaplanan t değeri tablo değerini aştığı için korelasyonun olmadığı hipotezi reddedilir. Bir bağlantı var.

Aşama 8. Ampirik regresyon çizgilerinin oluşturulması. Korelasyon oranının hesaplanması

Seçilen veriler ana bileşenin içerik değerlerine (bu durumda Hg) göre sınıflara ayrılır. Bunu yapmak için, ana yararlı bileşenin minimum içeriğinden maksimum içeriğe kadar tüm değer aralığı 6 aralığa bölünür. Her aralık için:

    Bu n(i) aralığına düşen değerlerin sayısı belirlenir

    Ana bileşen değerlerine (y(I, av)) karşılık gelen ilişkili bileşen içerik değerlerinin sayısı hesaplanır ve bu sayı n(i)'ye bölünür

Tablo 3

Aralık sınırı

Korelasyon alanında ampirik bir regresyon çizgisi oluşturuyoruz.

dtoplam = √Dy = 25,4

dkoşul = /N = 66.14

İlişkili bileşenin ana r'ye korelasyon oranının değeri aşağıdaki formül kullanılarak hesaplanır:

r = dkoşul/ dtoplam = 66,14/25,4 = 2,6

İki istatistiksel özellik X ve Y arasındaki korelasyon sorusunu gündeme getirirken, değerlerinin paralel kaydedilmesiyle bir deney gerçekleştirilir.

Örnek 8.1.

Koşarak uzun atlama sonucunun (X işareti) son koşma hızının (Y işareti) değerine bağlı olup olmadığını belirleyin. Bu soruyu cevaplamak için bir sporcunun veya sporcu grubunun her atlayışındaki X sonucunun kaydedilmesine paralel olarak, son kalkış hızı Y'nin değeri de kaydedilir. Şöyle olsunlar:

Tablo 5

BEN
xi (cm)
yi (m/sn) 10,7 10,5 10,1 9,8 10,1 10,5 9,1 9,6

Yatay eksende sıçrama uzunluğunu (X) ve bu sıçramadaki son kalkış hızı değerini (Y) çizeceğimiz Tablo 5'i dikdörtgen koordinat sisteminde bir grafik şeklinde sunalım. dikey eksende.
function PlayMyFlash(cmd)( Corel_.TPay(cmd); )

№1 !!! №2 !!! №3 !!! №4 !!! №5!!! №6 !!! №7 !!! №8!!!

Pirinç. 8. Korelasyon alanı grafiği.

Korelasyon alanına grafikte bu şekilde elde edilen noktaların saçılım bölgesi adını vereceğiz. Şekil 8'deki korelasyon alanını görsel olarak analiz ettiğinizde, bunun düz bir çizgi boyunca uzatılmış gibi göründüğünü görebilirsiniz. Bu resim, özellikler arasındaki sözde doğrusal korelasyon ilişkisinin tipik bir örneğidir. Bu durumda, genel olarak son kalkış hızının artmasıyla atlama uzunluğunun da arttığı ve bunun tersinin de geçerli olduğu varsayılabilir. Onlar. Söz konusu özellikler arasında doğrudan (pozitif) bir ilişki vardır.

Bu örnekle birlikte, diğer birçok olası korelasyon alanından aşağıdakiler ayırt edilebilir (Şekil 9-11):

Şekil 9 da doğrusal bir ilişki göstermektedir, ancak bir özelliğin değerleri arttıkça diğerinin değerleri azalır ve bunun tersi de geçerlidir. geri bildirim veya olumsuz. Şekil 11'de korelasyon alanının noktalarının bir çeşit eğri çizgi etrafında dağıldığı varsayılabilir. Bu durumda özellikler arasında eğrisel bir korelasyon olduğunu söylüyorlar.

Şekil 10'da gösterilen korelasyon alanıyla ilgili olarak noktaların düz veya eğri bir çizgi boyunca yer aldığı söylenemez; küresel bir şekle sahiptir. Bu durumda X ve Y özelliklerinin birbirine bağlı olmadığını söylüyorlar.

Ek olarak korelasyon alanı, eğer bu bağlantı mevcutsa, korelasyon bağlantısının yakınlığını yaklaşık olarak değerlendirmek için kullanılabilir. Burada şunu söylüyorlar: Hayali ortalama çizginin etrafına ne kadar az nokta dağılırsa, söz konusu özellikler arasındaki korelasyon o kadar yakın olur.

Korelasyon alanlarının görsel analizi, korelasyon ilişkisinin özünü anlamamıza yardımcı olur ve bağlantının varlığı, yönü ve yakınlığı hakkında varsayımlarda bulunmamıza olanak tanır. Ancak bu yöntemle işaretler arasında bir bağlantı olup olmadığını, doğrusal bir bağlantı mı yoksa eğrisel bir bağlantı mı, yakın bir bağlantı mı (güvenilir) yoksa zayıf bir bağlantı mı (güvenilmez) kesin olarak söylemek imkansızdır. Özellikler arasındaki doğrusal ilişkiyi belirlemenin ve değerlendirmenin en doğru yöntemi, istatistiksel verilerden çeşitli korelasyon göstergelerinin belirlenmesi yöntemidir.

3. Korelasyon katsayıları ve özellikleri

Genellikle iki özellik arasındaki ilişkinin güvenilirliğini belirlemek için (X, Y) kullanmak parametrik olmayan (sıralama) Spearman korelasyon katsayısı ve parametrik Pearson korelasyon katsayısı . Bu korelasyon göstergelerinin değeri aşağıdaki formüllerle belirlenir:

(1)

Burada: dx - x karakteristiğinin istatistiksel verilerinin sıraları;

dy - y karakteristiğinin istatistiksel verilerinin sıraları.

(2)

Burada: - x karakteristiğinin istatistiksel verileri,

Y karakteristiğinin istatistiksel verileri.

Bu katsayılar aşağıdaki güçlü özelliklere sahiptir:

1. Korelasyon katsayılarına dayanarak, özellikler arasında yalnızca doğrusal bir korelasyon yargılanabilir. Onların yardımıyla eğrisel bir bağlantı hakkında hiçbir şey söylenemez.
2. Korelasyon katsayılarının değerleri -1'den az veya +1'den fazla olamayacak boyutsuz bir miktardır;
3.
4. Korelasyon katsayılarının değerleri sıfır ise; = 0 veya = 0 ise x, y özellikleri arasındaki bağlantı mevcut olmayan.
5. Korelasyon katsayılarının değerleri negatif ise;< 0 или < 0, то связь между признаками Х и Y tersi.
6. Korelasyon katsayılarının değerleri pozitif ise; > 0 veya y> 0 ise X ve Y özellikleri arasındaki ilişki dümdüz(olumlu).
7. Korelasyon katsayıları +1 veya -1 değerlerini alıyorsa; = ± 1 veya = ± 1 ise X ve Y özellikleri arasındaki ilişki doğrusal (fonksiyonel).
8. Özellikler arasındaki korelasyonun güvenilirliği yalnızca korelasyon katsayılarının büyüklüğü ile değerlendirilemez. Bu güvenilirlik aynı zamanda şunlara da bağlıdır: serbestlik derecesi sayısı.

Burada: n, X ve Y özelliklerine ait ilişkili istatistiksel veri çiftlerinin sayısıdır.

N ne kadar büyük olursa, aynı korelasyon katsayısına sahip ilişkinin güvenilirliği de o kadar yüksek olur.

Listelenen ortak özelliklere ek olarak, söz konusu korelasyon katsayıları da farklılıklara sahiptir. Temel farkları Pearson katsayısı ( yalnızca X ve Y özelliklerinin dağılımı normal ise kullanılabilir, Spearman katsayısı () herhangi bir dağılıma sahip özellikler için kullanılabilir. Söz konusu özellikler normal dağılıma sahipse, o zaman Pearson katsayısını () kullanarak bir korelasyon bağlantısının varlığını belirlemek daha uygundur, çünkü bu durumda Spearman katsayısından () daha küçük bir hataya sahip olacaktır.

Örnek 8.2.

Spearman sıra korelasyon katsayısını kullanarak, bir grup sporcunun koşu uzun atlama sonuçları (X) ile son koşu hızı (Y) arasında bir ilişki olup olmadığını belirleyin (Örnek 8.1'deki veriler, Tablo 5).

Formül (1)'de dx ve dy istatistiksel verilerin sıralarıdır; seçeneği sıralanmış kümelerine yerleştirir. Toplamda birkaç özdeş veri varsa, sıralamaları eşittir ve bu seçeneklerin kapladığı yerlerin ortalama değeri olarak belirlenir. Örneğin,

Veri xi
dx rütbeleri 4,5 4,5 4,5 4,5 7,5 7,5
3 + 4 + 5 + 6 7 + 8

Bu kuralı kullanarak Tablo 5'teki verilerin sıralarını belirleyeceğiz. Kolaylık sağlamak için her şeyi Tablo 6 şeklinde yazacağız.

Tablo 6

dx ölmek dx-dy
9,1 1 - 1 = 0 02 = 0
9,6 2 - 2 = 0 02 = 0
9,8 3 - 3 = 0 02 = 0
10,1 4 - 4 = 0 02 = 0
10,5 6,5 5 - 6,5 = - 1,5 (- 1,5)2 = 2,25
10,5 6,5 6 - 6,5 = - 0,5 (- 0,5)2 = 0,25
10,3 7 - 5 = 2 22 = 4
10,7 8 - 8 = 0 02 = 0
(dx-dy) = 0

Bu durumda 8 çift değerimiz var, yani. 8 ilişkili çift. Bu, n = 8 anlamına gelir. Formül (1)'deki sonucu yerine koyarsak, şunu elde ederiz:

Çözüm:

(0,92 > 0) , sonra işaretlerin arasında X ve Y sen X) ve bunun tersi de geçerlidir - kalkış hızının azalmasıyla atlamanın uzunluğu azalır. Spearman korelasyon katsayısının güvenilirliği, sıra korelasyon katsayısının kritik değerleri tablosundan belirlenir.

b) çünkü Korelasyon katsayısının sonuç değeri = 0,9, tablo değerinden = 0,88 daha büyükse, bu düzey b = %99'a karşılık gelir, bu durumda (a) sonucunun doğruluğuna olan güven %99'dan büyüktür. Bu tür bir güvenilirlik, (a) sonucunu tüm popülasyona genişletmemize olanak tanır; tüm uzun atlamacılar için.

Dağılımın normalliği açısından değerlendirilen popülasyonların ön kontrolü yapılmazsa, Pearson korelasyon katsayısı güvenilir değilse, bir bağlantının varlığı da Spearman katsayısı kullanılarak kontrol edilmelidir.

Örnek 8.3.

Sıra korelasyon katsayısı, herhangi bir istatistiksel dağılıma sahip değişkenler arasındaki ilişkileri tanımlamak için kullanılabilir. Ancak bu değişkenler normal (Gaussian) dağılıma sahipse, normalleştirilmiş (Bravais-Pearson) korelasyon katsayısı kullanılarak ilişki daha doğru bir şekilde kurulabilir.

Örneğimizde ve - normal dağılım yasasına karşılık geldiğini varsayalım ve test sonuçları arasında bir bağlantının varlığını kontrol edelim. X ve Y normalleştirilmiş korelasyon katsayısının hesaplanması kullanılarak.

Formül (1)'den, hesaplama için özelliklerin ortalama değerlerini bulmanın gerekli olduğu açıktır. X,Y ve her istatistiksel verinin ortalamasından sapması. Bu değerleri bilerek hesaplamanın zor olmadığı tutarları bulabilirsiniz.

Tablo 5'teki verilere dayanarak Tablo 7'yi doldurun:

Tablo 7

962 = 9216 10,7 0,6 0,62 = 0,36 96 · 0,6 = 57,6
262 = 676 10,5 0,4 0,42 = 0,16 26 · 0,4 = 10,4
10,3 0,2 0,04 5,4
- 4 9,8 - 0,3 0,09 1,2
10,1 0,00 1,0
10,5 0,4 0,16 3,2
- 92 9,1 - 1,0 1,00 9,2
- 64 9,6 - 0,5 0,25 32,0
= 23262 = 2,06 = 201

7. sütunun toplamını formül (1)'in payına ve 3. ve 6. sütunların toplamlarını paydaya koyarsak, şunu elde ederiz:

Çözüm:

a) çünkü korelasyon katsayısı değeri pozitif (0.92>0) , sonra arasında X ve Y doğrudan bir bağlantı var, yani. artan kalkış hızıyla (işaret e) atlamanın uzunluğu artar (işaret X) ve bunun tersi de geçerlidir - kalkış hızının azalmasıyla atlamanın uzunluğu azalır. Elde edilen sonucun doğruluğuna olan güveni bilmek çok önemlidir.

Korelasyon, iki özelliğin ölçülen değerleri (xi, yi) olan deneysel verilere dayanarak incelenir. Çok az deneysel veri varsa, iki boyutlu ampirik dağılım, xi ve yi değerlerinin çift serisi olarak temsil edilir. Aynı zamanda özellikler arasındaki korelasyon bağımlılığı farklı şekillerde açıklanabilir. Bir argüman ile bir fonksiyon arasındaki yazışma bir tablo, formül, grafik vb. ile verilebilir.

Korelasyon analizi, diğer istatistiksel yöntemler gibi, deneysel değerlerin xi ve yi'nin elde edildiği belirli bir genel popülasyonda incelenen özelliklerin davranışını tanımlayan olasılıksal modellerin kullanımına dayanmaktadır. Değerleri metrik ölçek birimlerinde (metre, saniye, kilogram vb.) Doğru bir şekilde ölçülebilen niceliksel özellikler arasındaki korelasyonu incelerken, genellikle iki boyutlu normal dağılmış bir nüfus modeli benimsenir. Böyle bir model, xi ve yi değişkenleri arasındaki ilişkiyi, dikdörtgen bir koordinat sistemindeki noktaların geometrik konumu biçiminde grafiksel olarak gösterir. Bu grafiksel ilişkiye aynı zamanda dağılım grafiği veya korelasyon alanı da denir.

Bu iki boyutlu normal dağılım modeli (korelasyon alanı), korelasyon katsayısının net bir grafiksel yorumunu vermemize olanak tanır, çünkü toplam dağılım beş parametreye bağlıdır: μx, μy – ortalama değerler (matematiksel beklentiler); σx,σy – X ve Y rastgele değişkenlerinin standart sapmaları ve p – X ve Y rastgele değişkenleri arasındaki ilişkinin bir ölçüsü olan korelasyon katsayısı.

p = 0 ise iki boyutlu normal popülasyondan elde edilen xi, yi değerleri, grafikte dairenin sınırladığı alan içerisinde x, y koordinatlarında yer alır (Şekil 5, a). Bu durumda X ve Y rastgele değişkenleri arasında korelasyon yoktur ve bunlara korelasyonsuz denir. İki boyutlu bir normal dağılım için korelasyonsuzluk aynı zamanda X ve Y rastgele değişkenlerinin bağımsızlığı anlamına gelir.

Eğer p = 1 veya p = -1 ise, X ve Y rastgele değişkenleri (Y = c + dX) arasında doğrusal bir fonksiyonel ilişki vardır. Bu durumda tam korelasyondan bahsediyorlar. P = 1 olduğunda, xi, yi değerleri, pozitif eğime sahip bir düz çizgi üzerinde uzanan noktaları belirler (xi'deki artışla, yi değerleri de p = -1 olduğunda artar); doğrunun eğimi negatiftir (Şekil 5, b). Ara durumlarda (-1< p < 1) точки, соответствующие значениям xi, yi, попадают в область, ограниченную некоторым эллипсом (рисунок 5, в, г), причем при p >0 ile pozitif bir korelasyon vardır (xi'deki artışla yi'nin değerleri artma eğilimindedir), p ile< 0 корреляция отрицательная. Чем ближе р к, тем уже эллипс и тем теснее экспериментальные значения группируются около прямой линии. Здесь же следует обратить внимание на то, что линия, вдоль которой группируются точки, может быть не только прямой, а иметь любую другую форму: парабола, гипербола и т. д. В этих случаях мы рассматривали бы так называемую, нелинейную (или криволинейную) корреляцию.



Dolayısıyla, korelasyon alanının görsel analizi, yalnızca incelenen özellikler arasındaki istatistiksel ilişkinin (doğrusal veya doğrusal olmayan) varlığını değil, aynı zamanda yakınlığını ve şeklini de belirlemeye yardımcı olur. Bu, analizin bir sonraki adımı olan uygun korelasyon katsayısının seçilmesi ve hesaplanması için gereklidir.

Karakteristikler arasındaki korelasyon farklı şekillerde açıklanabilir. Özellikle, herhangi bir bağlantı biçimi, Y özniteliğinin bağımlı bir değişken olduğu veya bağımsız değişken X'in bağımsız değişken adı verilen bir fonksiyonu olduğu Y = f(X) genel denklemiyle ifade edilebilir. Bir argüman ile bir fonksiyon arasındaki yazışma bir tablo, formül, grafik vb. ile verilebilir.



Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!