İstatistiksel anlamlılık formülü. Tam olarak ne anlama geldiğini

İSTATİSTİKSEL GÜVENİLİRLİK

- İngilizce güvenilirlik/geçerlilik, istatistiksel; Almanca Doğrulama, istatistik. İstatistiksel bir testte veya Q.l.'de tutarlılık, nesnellik ve belirsizlik eksikliği. ölçüm seti. D. s. aynı sonuçların elde edilip edilmediğini görmek için aynı testin (veya anketin) aynı denek üzerinde tekrarlanmasıyla test edilebilir; veya aynı nesneyi ölçmesi gereken bir testin farklı bölümlerini karşılaştırarak.

Antinazi. Sosyoloji Ansiklopedisi, 2009

Diğer sözlüklerde “İSTATİSTİKSEL GÜVENİLİRLİK” in ne olduğuna bakın:

    İSTATİSTİKSEL GÜVENİLİRLİK- İngilizce güvenilirlik/geçerlilik, istatistiksel; Almanca Doğrulama, istatistik. İstatistiksel bir testte veya Q.l.'de tutarlılık, nesnellik ve belirsizlik eksikliği. ölçüm seti. D. s. aynı testi tekrarlayarak doğrulanabilir (veya... Açıklayıcı Sosyoloji Sözlüğü

    İstatistikte bir değerin tesadüfen ortaya çıkma olasılığı veya daha uç değerlerin düşük olması durumunda istatistiksel olarak anlamlı denir. Burada aşırı noktayla, test istatistiklerinin sıfır hipotezinden sapma derecesini kastediyoruz. Farkın adı... ...Wikipedia

    İstatistiksel kararlılığın fiziksel olgusu, örneklem büyüklüğü arttıkça rastgele bir olayın sıklığının veya fiziksel bir miktarın ortalama değerinin sabit bir sayıya yönelmesidir. İstatistik olgusu... ... Vikipedi

    FARKLILIKLARIN GÜVENİLİRLİĞİ (Benzerlikler)- incelenen göstergelere (değişkenlere) göre örnekler arasındaki farklılıkların veya benzerliklerin önem düzeyini belirlemek için analitik istatistiksel prosedür ... Modern eğitim süreci: temel kavramlar ve terimler

    RAPORLAMA, İSTATİSTİK Büyük Muhasebe Sözlüğü

    RAPORLAMA, İSTATİSTİK- ilgili organların işletmelerden (kuruluşlar ve kurumlar) ihtiyaç duydukları bilgileri yasal olarak oluşturulmuş raporlama belgeleri (istatistiksel raporlar) biçiminde aldıkları bir tür devlet istatistiksel gözlemi... Büyük ekonomi sözlüğü

    İnsanın sosyal yaşamındaki kitlesel olayların sistematik olarak gözlemlenmesi, bunların sayısal tanımlarının derlenmesi ve bu tanımların bilimsel olarak işlenmesi yöntemlerini inceleyen bir bilim. Dolayısıyla teorik istatistik bir bilimdir... ... Ansiklopedik Sözlük F.A. Brockhaus ve I.A. Efron

    Korelasyon katsayısı- (Korelasyon katsayısı) Korelasyon katsayısı, iki rastgele değişkenin bağımlılığının istatistiksel bir göstergesidir. Korelasyon katsayısının tanımı, korelasyon katsayılarının türleri, korelasyon katsayısının özellikleri, hesaplanması ve uygulanması... ... Yatırımcı Ansiklopedisi

    İstatistikler- (İstatistik) İstatistik, olgu ve süreçlerdeki niceliksel değişiklikleri inceleyen genel bir teorik bilimdir. Devlet istatistikleri, istatistiksel hizmetler, Rosstat (Goskomstat), istatistiksel veriler, sorgu istatistikleri, satış istatistikleri,... ... Yatırımcı Ansiklopedisi

    Korelasyon- (Korelasyon) Korelasyon, iki veya daha fazla rastgele değişken arasındaki istatistiksel ilişkidir. Korelasyon kavramı, korelasyon türleri, korelasyon katsayısı, korelasyon analizi, fiyat korelasyonu, Forex İçeriklerindeki döviz çiftlerinin korelasyonu... ... Yatırımcı Ansiklopedisi

Kitaplar

  • Araştırmada matematik ve matematik araştırması: Öğrenci araştırma faaliyetlerine ilişkin metodolojik koleksiyon, Borzenko V.I.. Koleksiyon, öğrenci araştırma faaliyetlerinin düzenlenmesinde uygulanabilir metodolojik gelişmeleri sunmaktadır. Koleksiyonun ilk bölümü araştırma yaklaşımının uygulanmasına ayrılmıştır...

Önem düzeyi - bu, farklılıkların önemli olduğunu düşünme olasılığımızdır, ancak aslında bunlar rastgeledir.

Farklılıkların %5 anlamlılık düzeyinde anlamlı olduğunu belirttiğimizde veya R< 0,05 , o zaman güvenilmez olma olasılıklarının 0,05 olduğunu kastediyoruz.

Farklılıkların %1 anlamlılık düzeyinde anlamlı olduğunu belirttiğimizde veya R< 0,01 , o zaman güvenilmez olma olasılıklarının 0,01 olduğunu kastediyoruz.

Tüm bunları daha resmi bir dile çevirirsek, anlamlılık düzeyi, sıfır hipotezinin doğru olmasına rağmen reddedilme olasılığıdır.

Hata,oluşanobiz neyizReddedilmişboş hipotezdoğru olmasına rağmen tip 1 hata olarak adlandırılır.(Bakınız Tablo 1)

Masa 1. Boş ve alternatif hipotezler ve olası test koşulları.

Böyle bir hatanın olasılığı genellikle şu şekilde gösterilir: α. Aslında p'yi değil parantez içinde belirtmemiz gerekirdi. < 0,05 veya p < 0,01 ve α < 0,05 veya α < 0,01.

Hata olasılığı ise α , o zaman doğru kararın olasılığı: 1-α. α ne kadar küçük olursa, doğru kararın olasılığı da o kadar büyük olur.

Tarihsel olarak psikolojide istatistiksel anlamlılığın en düşük düzeyinin %5 düzeyi (p≤0,05), yeterli düzeyde %1 düzeyinin (p≤0,01), en yüksek istatistiksel anlamlılık düzeyinin ise %0,1 düzeyinin (p≤0,001) olduğu genel kabul görmektedir. bu nedenle, kritik değer tabloları genellikle p≤0.05 ve p≤0.01, bazen - p≤0.001 istatistiksel anlamlılık düzeylerine karşılık gelen kriterlerin değerlerini içerir. Bazı kriterler için tablolar, farklı ampirik değerlerin kesin anlamlılık düzeyini göstermektedir. Örneğin φ*=1,56 p=0,06 için.

Ancak istatistiksel anlamlılık düzeyi p=0,05'e ulaşana kadar sıfır hipotezini reddetme hakkımız yoktur.

Fark yok hipotezini (Ho) reddetmek ve farkların istatistiksel anlamlılığı hipotezini (H 1) kabul etmek için aşağıdaki kurala bağlı kalacağız.

Ho'yu reddetme ve h1'i kabul etme kuralı

Testin ampirik değeri p≤0,05'e karşılık gelen kritik değere eşit veya bu değerden büyükse H 0 reddedilir, ancak H 1'i henüz kesin olarak kabul edemeyiz.

Kriterin ampirik değeri p≤0,01'e karşılık gelen kritik değere eşitse veya onu aşarsa H 0 reddedilir ve H 1 kabul edilir. : İstisnalar

G işareti testi, Wilcoxon T testi ve Mann-Whitney U testi. Onlar için ters ilişkiler kurulur.

Pirinç. 4. Rosenbaum'un Q kriteri için “önem ekseni” örneği.

Kriterin kritik değerleri Q o, o5 ve Q 0,01, kriterin ampirik değeri ise Q em olarak belirlenir. Bir elips içine alınmıştır.

Q 0.01 kritik değerinin sağında “önem bölgesi” uzanır - bu, Q 0.01'i aşan ampirik değerleri içerir ve bu nedenle kesinlikle önemlidir.

Kritik değer Q 0,05'in solunda "önemsizlik bölgesi" uzanır - bu, Q 0,05'in altındaki ampirik Q değerlerini içerir ve bu nedenle kesinlikle önemsizdir. Bunu görüyoruz 0,05 =6; Bunu görüyoruz 0,01 =9; Bunu görüyoruz Q =8;

em.

Kriterin ampirik değeri Q 0.05 ile Q 0.01 arasındaki bölgeye düşer. Bu bir “belirsizlik” bölgesidir: Farklılıkların güvenilmezliğine (H 0) ilişkin hipotezi zaten reddedebiliriz, ancak bunların güvenilirliğine (H 1) ilişkin hipotezi henüz kabul edemeyiz. < Ancak uygulamada araştırmacı, önemsizlik bölgesine girmeyen farklılıkları güvenilir olarak kabul edebilir ve bunların p düzeyinde güvenilir olduğunu beyan edebilir. 0,05 veya elde edilen ampirik kriter değerinin tam anlamlılık düzeyini belirterek, örneğin: p=0,02. Matematiksel yöntemlere ilişkin tüm ders kitaplarında bulunan standart tablolar kullanılarak bu, Kruskal-Wallis H kriterlerine göre yapılabilir, χ 2 R .

Yönlü ve yönsüz istatistiksel hipotezleri test ederken istatistiksel anlamlılık düzeyi veya kritik test değerleri farklı şekilde belirlenir.

Yönlü bir istatistiksel hipotezde tek kuyruklu bir test kullanılır, yönsüz bir hipotezde iki kuyruklu bir test kullanılır. İki kuyruklu test daha katıdır çünkü her iki yöndeki farklılıkları test eder ve dolayısıyla testin önceden p anlamlılık düzeyine karşılık gelen ampirik değeri < 0,05, artık yalnızca p seviyesine karşılık geliyor < 0,10.

Tek taraflı mı yoksa iki taraflı mı kriter kullandığına her zaman kendi başımıza karar vermek zorunda kalmayacağız. Kriterlerin kritik değer tabloları, yönlü hipotezler tek taraflı bir kritere, yönsüz hipotezler ise iki taraflı bir kritere karşılık gelecek ve verilen değerler aşağıdaki gereksinimleri karşılayacak şekilde seçilir: her biri için geçerlidir. Araştırmacının yalnızca hipotezlerinin anlam ve biçim açısından her bir kriterin tanımında önerilen hipotezlerle örtüşmesini sağlaması gerekir.

FCC'nin hesaplama uygulamalarında istatistiksel güvenilirlik esastır. Daha önce aynı popülasyondan birden fazla numunenin seçilebileceği belirtilmişti:

Doğru seçilirlerse, ortalama göstergeleri ve genel nüfusun göstergeleri, kabul edilen güvenilirlik dikkate alınarak temsil edilebilirlik hatasının büyüklüğü açısından birbirinden biraz farklıdır;

Farklı popülasyonlardan seçilirlerse aralarındaki fark anlamlı olur. İstatistik tamamen örnekleri karşılaştırmakla ilgilidir;

Eğer bunlar önemsiz, prensip dışı, önemsiz derecede farklılık gösteriyorsa, yani aslında aynı genel popülasyona aitlerse, aralarındaki farka istatistiksel olarak güvenilmez denir.

İstatistiksel olarak güvenilir Örnek farkı, önemli ölçüde ve temel olarak farklılık gösteren, yani farklı genel popülasyonlara ait olan bir örnektir.

FCC'de numune farklılıklarının istatistiksel öneminin değerlendirilmesi birçok pratik problemin çözülmesi anlamına gelir. Örneğin, yeni öğretim yöntemlerinin, programların, alıştırma setlerinin, testlerin, kontrol alıştırmalarının tanıtılması, deneysel testleriyle ilişkilidir; bu, test grubunun temelde kontrol grubundan farklı olduğunu göstermelidir. Bu nedenle, numuneler arasında istatistiksel olarak anlamlı bir farkın varlığının veya yokluğunun tespit edilmesi için istatistiksel anlamlılık kriterleri adı verilen özel istatistiksel yöntemler kullanılır.

Tüm kriterler iki gruba ayrılır: parametrik ve parametrik olmayan. Parametrik kriterler normal bir dağılım yasasının varlığını gerektirir; Bu, normal yasanın ana göstergelerinin - aritmetik ortalama ve standart sapma - zorunlu olarak belirlenmesi anlamına gelir. Parametrik kriterler en doğru ve doğrudur. Parametrik olmayan testler, örnek öğeler arasındaki sıra (sıra) farklılıklarına dayanır.

FCC uygulamasında kullanılan istatistiksel anlamlılık için ana kriterleri sunalım: Öğrenci testi ve Fisher testi.

Öğrenci t testi Adını bu yöntemi keşfeden İngiliz bilim adamı K. Gosset'ten (Öğrenci - takma ad) almıştır. Öğrenci t testi parametriktir ve örneklerin mutlak değerlerini karşılaştırmak için kullanılır. Numunelerin boyutları farklılık gösterebilir.

Öğrenci t testi bu şekilde tanımlanır.

1. Aşağıdaki formülü kullanarak Öğrenci t testini bulun:


karşılaştırılan örneklerin aritmetik ortalamaları nerede; t 1, t 2 - karşılaştırılan örneklerin göstergelerine dayanarak belirlenen temsiliyet hataları.

2. FCC'deki uygulama, spor çalışmaları için P = 0,95 hesabının güvenilirliğini kabul etmenin yeterli olduğunu göstermiştir.

Sayma güvenilirliği için: P = 0,95 (a = 0,05), serbestlik derecesi sayısıyla birlikte

k = n 1 + n 2 - 2 Ek 4'teki tablodan kriterin sınır değerinin değerini buluyoruz ( t gr).

3. Normal dağılım yasasının özelliklerine dayanarak Öğrenci kriteri t ve t gr'yi karşılaştırır.

Sonuç çıkarıyoruz:

t t gr ise, karşılaştırılan örnekler arasındaki fark istatistiksel olarak anlamlıdır;

t t gr ise fark istatistiksel olarak anlamsızdır.

FCS alanındaki araştırmacılar için, istatistiksel anlamlılığın değerlendirilmesi belirli bir problemin çözümünde ilk adımdır: karşılaştırılan numunelerin temelde birbirlerinden farklı olup olmadığı. Bir sonraki adım, bu farklılığın, görevin koşulları tarafından belirlenen pedagojik açıdan değerlendirilmesidir.

Belirli bir örnek kullanarak Öğrenci testinin uygulanmasını ele alalım.

Örnek 2.14. 18 kişiden oluşan bir grup, xi'den önce ve sonra kalp atış hızı (bpm) açısından değerlendirildi sen benısınma.

Isınmanın etkinliğini kalp atış hızına göre değerlendirin. İlk veriler ve hesaplamalar tabloda sunulmaktadır. 2.30 ve 2.31.

Tablo 2.30

Isınmadan önce kalp atış hızı göstergelerinin işlenmesi


Örnek boyutları eşit olduğundan (aynı grup farklı koşullar altında çalışıldı) ve standart sapmalar s x = s y = 3 atım/dakika olduğundan, her iki grup için hatalar çakıştı. Öğrenci testini tanımlamaya geçelim:

Hesabın güvenilirliğini belirledik: P = 0,95.

Serbestlik derecesi sayısı k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. Ek 4'teki tablodan şunu buluyoruz: t gr= 2,02.

İstatistiksel çıkarım. t = 11,62 ve sınır t gr = 2,02 olduğuna göre 11,62 > 2,02, yani. t > t gr olduğundan örnekler arasındaki fark istatistiksel olarak anlamlıdır.

Pedagojik sonuç. Kalp atım hızı açısından grubun ısınma öncesi ve sonrası durumu arasındaki farkın istatistiksel olarak anlamlı olduğu bulundu. önemli, temel. Dolayısıyla kalp atış hızı göstergesine dayanarak ısınmanın etkili olduğu sonucuna varabiliriz.

Fisher kriteri parametriktir. Numune dağılım oranlarını karşılaştırırken kullanılır. Bu, kural olarak, spor çalışmalarının istikrarı veya fiziksel kültür ve spor uygulamalarında fonksiyonel ve teknik göstergelerin istikrarı açısından bir karşılaştırma anlamına gelir. Numuneler farklı boyutlarda olabilir.

Fisher kriteri aşağıdaki sırayla tanımlanır.

1. Formülü kullanarak Fisher kriteri F'yi bulun


burada , karşılaştırılan örneklerin varyanslarıdır.

Fisher kriterinin koşulları, formülün payında şunu şart koşar: F büyük bir dağılım var, yani F sayısı her zaman birden büyüktür.

Sayımın güvenilirliğini belirledik: P = 0,95 - ve her iki örnek için serbestlik derecesi sayısını belirledik: k 1 = n 1 - 1, k 2 = n 2 - 1.

Ek 4'teki tabloyu kullanarak F kriterinin sınır değerini buluyoruz gr.

F ve F kriterlerinin karşılaştırılması gr sonuçları formüle etmemizi sağlar:

F > F gr ise numuneler arasındaki fark istatistiksel olarak anlamlıdır;

eğer F< F гр, то различие между выборками статически недо­стоверно.

Spesifik bir örnek verelim.

Örnek 2.15. İki grup hentbol oyuncusunu analiz edelim: x ben (n 1= 16 kişi) ve y i (n 2 = 18 kişi). Bu sporcu gruplarına, topu kaleye atarken kalkış süreleri incelendi.

İtme göstergeleri aynı türden mi?

İlk veriler ve temel hesaplamalar tabloda sunulmaktadır. 2.32 ve 2.33.

Tablo 2.32

Birinci grup hentbol oyuncularının itme göstergelerinin işlenmesi


Fisher kriterini tanımlayalım:





Ek 6'daki tabloda sunulan verilere göre Fgr: Fgr = 2,4'ü buluyoruz.

Ek 6'daki tabloda, hem büyük hem de küçük dağılımların serbestlik derecesi sayılarının sıralamasının, büyük sayılara yaklaştıkça kabalaştığına dikkat edelim. Böylece, daha büyük dağılımın serbestlik derecesi sayısı şu sırayla gelir: 8, 9, 10, 11, 12, 14, 16, 20, 24, vb. ve daha küçük olan - 28, 29, 30, 40 , 50 vb. d.

Bu durum örneklem büyüklüğü arttıkça F-testindeki farklılıkların azalması ve orijinal verilere yakın tablo değerlerinin kullanılmasının mümkün olmasıyla açıklanmaktadır. Yani örnek 2.15 =17 yoktur ve buna en yakın değer k = 16 olarak alınabilir ve buradan Fgr = 2.4 elde edilir.

İstatistiksel çıkarım. Fisher testi F= 2,5 > F= 2,4 olduğundan, numuneler istatistiksel olarak anlamlı bir şekilde ayırt edilebilir.

Pedagojik sonuç. Her iki gruptaki hentbolcular için topu kaleye atarken kalkış süresi (süreleri) değerleri önemli ölçüde farklılık göstermektedir. Bu gruplar farklı değerlendirilmelidir.

Daha ileri araştırmalar bu farklılığın nedenini ortaya koymalıdır.

Örnek 2.20.(numunenin istatistiksel güvenilirliği hakkında ). Antrenmanın başında sinyalin verilmesinden topa vurmaya kadar geçen süre (ler) x i ve sonunda y i ise futbolcunun nitelikleri gelişmiş midir?

İlk veriler ve temel hesaplamalar tabloda verilmiştir. 2.40 ve 2.41.

Tablo 2.40

Antrenman başında sinyal vermekten topa vurmaya kadar geçen süre göstergelerinin işlenmesi


Öğrenci kriterini kullanarak gösterge grupları arasındaki farkı belirleyelim:

Güvenilirlik P = 0,95 ve serbestlik derecesi k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42 ile Ek 4'teki tabloyu kullanarak şunu buluruz: t gr= 2,02. t = 8,3 olduğundan > t gr= 2,02 - fark istatistiksel olarak anlamlıdır.

Fisher kriterini kullanarak gösterge grupları arasındaki farkı belirleyelim:


Ek 2'deki tabloya göre güvenilirlik P = 0,95 ve serbestlik derecesi k = 22-1 = 21 ile F gr = 21 olur. F = 1,53 olduğundan< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

İstatistiksel çıkarım. Aritmetik ortalamaya göre gösterge grupları arasındaki fark istatistiksel olarak anlamlıdır. Dağılım (dağılım) açısından gösterge grupları arasındaki fark istatistiksel olarak güvenilmezdir.

Pedagojik sonuç. Futbolcunun nitelikleri önemli ölçüde gelişti ancak ifadesinin istikrarına dikkat edilmesi gerekiyor.

İşe hazırlanma

“Spor Metrolojisi” disiplininde bu laboratuvar çalışmasını yürütmeden önce Çalışma grubundaki tüm öğrenciler 3-4 kişilik çalışma takımları oluşturmalıdır., tüm laboratuvar çalışmalarının iş atamasını ortaklaşa tamamlamak.

İşe hazırlanırken Önerilen literatürün ilgili bölümlerine (bu yönergelerin 6. bölümüne bakın) ve ders notlarına aşina olun. Bu laboratuvar çalışması için bölüm 1 ve 2'yi ve bunun için iş atamasını (bölüm 4) inceleyin.

Rapor formu hazırlayın A4 boyutunda yazı kağıdının standart sayfalarına yazıp iş için gerekli malzemelerle doldurun.

Raporun içermesi gerekenler :

Bölümün (UC ve TR), çalışma grubunun, öğrencinin soyadının, adının, soyadının, laboratuvar çalışmasının numarası ve unvanının, tamamlanma tarihinin yanı sıra soyadı, akademik derece, akademik unvan ve bilgilerin yer aldığı başlık sayfası işi kabul eden öğretmenin konumu;

Çalışmanın amacı;

Hesaplamaların ara ve nihai sonuçlarını açıklayan sayısal değerlere sahip formüller;

Ölçülen ve hesaplanan değerlerin tabloları;

Ödevin gerektirdiği grafik materyali;

İş atamasının her aşamasının sonuçları ve genel olarak yapılan çalışma hakkında kısa sonuçlar.

Tüm grafikler ve tablolar çizim araçları kullanılarak dikkatlice çizilir. Geleneksel grafik ve harf sembolleri GOST'lara uygun olmalıdır. Bilgisayar teknolojisi kullanılarak rapor hazırlanmasına izin verilmektedir.

İş ataması

Tüm ölçümleri yapmadan önce takımın her üyesi, Ek 7'de verilen Dart spor oyununun aşağıdaki araştırma aşamalarını gerçekleştirmek için gerekli olan kullanım kurallarını incelemelidir.

Araştırmanın I. Aşaması“Dart sporu oyununda takımın her bir üyesinin hedefi vurma sonuçlarının normal dağılım kanununa uygunluk açısından kriterlerine göre incelenmesi χ2 Pearson ve üç sigma kriteri"

1. (Kişisel) hızınızı ve eylemlerin koordinasyonunu ölçün (test edin), Dart spor oyununda dairesel bir hedefe 30-40 kez dart atılarak yapılır.

2. Ölçüm sonuçları (testler) x ben(gözlüklerde) bir varyasyon serisi şeklinde formatlanmış ve tablo 4.1'e girilmiştir (sütunlar , gerekli tüm hesaplamaları yapın, gerekli tabloları doldurun ve elde edilen ampirik dağılımın normal dağılım yasasına uygunluğu hakkında uygun sonuçları çıkarın) Bu kılavuzun 7 - 10. sayfalarındaki 2. bölümünde verilen örnek 2.12'deki benzer hesaplamalar, tablolar ve sonuçlarla analoji.

Tablo 4.1

Konuların eylemlerinin hızı ve koordinasyonunun normal dağılım yasasına uygunluğu

HAYIR. yuvarlak
Toplam

II – araştırma aşaması

“Bir takımın üyelerinin ölçüm sonuçlarına dayanarak, çalışma grubunun tüm öğrencilerinin Dart sporu oyununun hedefindeki genel isabet popülasyonunun ortalama göstergelerinin tahmini”

İlk aşamada elde edilen tüm ekip üyelerinin Dart hedefine ulaşma sonuçlarına dayanarak, çalışma grubundaki tüm öğrencilerin ortalama hız ve eylem koordinasyon göstergelerini (sınıf dergisindeki çalışma grubu listesine göre) değerlendirin. Bu laboratuvar çalışmasının araştırması.

1. Hız ölçümlerinin sonuçlarını ve eylemlerin koordinasyonunu belgeleyin Spor oyununda dairesel bir hedefe dart atarken Genel popülasyondan alınan ölçüm sonuçlarının bir örneğini temsil eden takımınızın tüm üyelerinin (2 - 4 kişi) dartları (bir çalışma grubundaki tüm öğrencilerin ölçüm sonuçları - örneğin, 15 kişi), bunları ikinci ve üçüncü sütunlara girerek Tablo 4.2.

Tablo 4.2

Hız göstergelerinin işlenmesi ve eylemlerin koordinasyonu

tugay üyeleri

HAYIR.
Toplam

Aşağıdaki tablo 4.2'de anlaşılmalıdır , eşleşen ortalama puan (Tablo 4.1'deki hesaplama sonuçlarına bakın) ekibinizin üyeleri ( , araştırmanın ilk aşamasında elde edilmiştir. Şunu belirtmek gerekir ki, kural olarak, Tablo 4.2, araştırmanın ilk aşamasında ekibin bir üyesi tarafından elde edilen ölçüm sonuçlarının hesaplanan ortalama değerini içermektedir. Çünkü farklı ekip üyelerinin ölçüm sonuçlarının çakışma olasılığı çok düşüktür. Daha sonra, Kural olarak, değerler sütunda Tablo 4.2 her satır için - 1'e eşit, A “Toplam "sütunlar" " yazılır ekibinizin üye sayısı.

2. Tablo 4.2'yi doldurmak için gerekli tüm hesaplamaları ve ayrıca sayfa 13-14'teki bu metodolojik gelişimin 2. bölümünde verilen örnek 2.13'teki hesaplamalara ve sonuçlara benzer diğer hesaplamaları ve sonuçları gerçekleştirin. Temsil edilebilirlik hatası hesaplanırken dikkate alınmalıdır. "M" örneklem küçük olduğundan (n ve genel popülasyonun element sayısı N biliniyor ve çalışma grubundaki öğrenci sayısına eşit olduğundan) bu metodolojik geliştirmenin 13. sayfasında verilen formül 2.4'ün kullanılması gerekir, çalışma grubunun dergi listesine göre.

III – araştırma aşaması

Isınmanın etkinliğinin, her takım üyesi tarafından Öğrenci t-testi kullanılarak “Eylemlerin hızı ve koordinasyonu” göstergesine göre değerlendirilmesi

Bu laboratuvar çalışmasının araştırmasının ilk aşamasında gerçekleştirilen "Dart" spor oyununun hedefine dart atmak için ısınmanın etkinliğini ekibin her üyesi tarafından "Hız ve Hız" göstergesine göre değerlendirmek. Eylemlerin koordinasyonu", Öğrenci kriterini kullanarak - ampirik dağılım yasasının normal dağılım yasasına istatistiksel güvenilirliği için parametrik bir kriter.

… Toplam

2. farklılıklar ve RMS , ısınma sonuçlarına göre “Hız ve eylemlerin koordinasyonu” göstergesinin ölçüm sonuçları, Tablo 4.3'te verilmiştir, (bu metodolojik geliştirmenin 16. sayfasındaki örnek 2.14'ün tablo 2.30'undan hemen sonra verilen benzer hesaplamalara bakın).

3. Çalışma ekibinin her üyesi Isındıktan sonra (kişisel) hızınızı ve eylemlerin koordinasyonunu ölçün (test edin),

… Toplam

5. Ortalama hesaplamaları gerçekleştirin farklılıklar ve RMS ,Isınma sonrası “Hız ve eylemlerin koordinasyonu” göstergesinin ölçüm sonuçları, Tablo 4.4'te verilmiştir, Isınma sonuçlarına göre genel ölçüm sonuçlarını yazın (bu metodolojik geliştirmenin 17. sayfasındaki örnek 2.14'ün tablo 2.31'inden hemen sonra verilen benzer hesaplamalara bakın).

6. Bu metodolojik gelişimin 2. bölümünde 16-17. sayfalarda verilen örnek 2.14'teki hesaplamalara ve sonuçlara benzer tüm gerekli hesaplamaları ve sonuçları gerçekleştirin. Temsil edilebilirlik hatası hesaplanırken dikkate alınmalıdır. "M" Örnek n olduğundan ve popülasyondaki N ( elementlerin sayısı bilinmediğinden, bu metodolojik geliştirmenin 12. sayfasında verilen formül 2.1'in kullanılması gereklidir.

IV – araştırma aşaması

İki ekip üyesinin “Eylemlerin hızı ve koordinasyonu” göstergelerinin tekdüzeliğinin (kararlılığının) Fisher kriteri kullanılarak değerlendirilmesi

Bu laboratuvar çalışmasında araştırmanın üçüncü aşamasında elde edilen ölçüm sonuçlarına dayanarak, iki ekip üyesinin "Eylemlerin hızı ve koordinasyonu" göstergelerinin tekdüzeliğini (kararlılığını) Fisher kriterini kullanarak değerlendirin.

Bunu yapmak için aşağıdakileri yapmanız gerekir.

Tablo 4.3 ve 4.4'teki veriler kullanılarak, araştırmanın üçüncü aşamasında elde edilen bu tablolardan varyansların hesaplanmasının sonuçları ve ayrıca spor göstergelerinin tek biçimliliğini (istikrarlılığını) değerlendirmek için Fisher kriterini hesaplama ve uygulama metodolojisi, Bu metodolojik gelişimin 18-19. sayfalarındaki örnek 2.15'ten uygun istatistiksel ve pedagojik sonuçları çıkarın.

V – araştırma aşaması

Bir takım üyesinin ısınmadan önce ve sonra “Hız ve eylemlerin koordinasyonu” gösterge gruplarının değerlendirilmesi

Bir deneyin (anketin) herhangi bir bilimsel ve pratik durumunda, araştırmacılar tüm insanları (genel nüfus, nüfus) değil, yalnızca belirli bir örneği inceleyebilir. Örneğin, belirli bir hastalıktan muzdarip olanlar gibi nispeten küçük bir insan grubu üzerinde çalışıyor olsak bile, uygun kaynaklara sahip olmamız veya her hastayı test etme ihtiyacı duymamız pek olası değildir. Bunun yerine, daha uygun ve daha az zaman alıcı olduğundan popülasyondan bir numuneyi test etmek yaygındır. Eğer öyleyse, örneklemden elde edilen sonuçların tüm grubu temsil ettiğini nasıl bileceğiz? Ya da profesyonel terminolojiyi kullanırsak, araştırmamızın konunun tamamını doğru şekilde tanımladığından emin olabilir miyiz? nüfus, kullandığımız örnek?

Bu soruyu cevaplamak için test sonuçlarının istatistiksel anlamlılığının belirlenmesi gerekir. İstatistiksel önem (Önemli seviye kısaltılmış Sig.), veya /7 anlamlılık düzeyi (p düzeyi) - belirli bir sonucun, çalışmanın örneklendiği popülasyonu doğru şekilde temsil etme olasılığıdır. Bunun yalnızca olduğunu unutmayın olasılık- belirli bir çalışmanın tüm popülasyonu doğru şekilde tanımladığını kesin olarak söylemek imkansızdır. En iyi ihtimalle anlamlılık düzeyi bunun çok muhtemel olduğu sonucuna varabilir. Dolayısıyla kaçınılmaz olarak bir sonraki soru ortaya çıkıyor: Belirli bir sonucun popülasyonun doğru bir karakterizasyonu olarak kabul edilebilmesi için hangi önem düzeyine sahip olması gerekir?

Örneğin, hangi olasılık değerinde bu tür şansların risk almak için yeterli olduğunu söylemeye isteklisiniz? Ya oranlar 100 üzerinden 10 ya da 100 üzerinden 50 ise? Peki ya bu olasılık daha yüksekse? 100 üzerinden 90, 100 üzerinden 95 veya 100 üzerinden 98 gibi oranlara ne dersiniz? Risk içeren bir durum için bu seçim oldukça sorunludur çünkü kişinin kişisel özelliklerine bağlıdır.

Psikolojide, geleneksel olarak 100 üzerinden 95 veya daha fazla şansın, sonuçların doğru olma olasılığının, tüm popülasyona genellenebilecek kadar yüksek olduğu anlamına geldiğine inanılır. Bu rakam bilimsel ve pratik faaliyet sürecinde oluşturulmuştur - kılavuz olarak seçilmesi gereken bir yasa yoktur (ve aslında diğer bilimlerde bazen önem seviyesinin diğer değerleri seçilir).

Psikolojide bu olasılık oldukça alışılmadık bir şekilde işlenir. Örneğin popülasyonu temsil etme olasılığı yerine, örneğin popülasyonu temsil etme olasılığı temsil etmiyor nüfus. Başka bir deyişle, gözlemlenen ilişkinin veya farklılıkların rastgele olması ve popülasyonun bir özelliği olmaması olasılığıdır. Dolayısıyla psikologlar, bir çalışmanın sonuçlarının doğru olma ihtimalinin 100'de 95 olduğunu söylemek yerine, sonuçların yanlış olma ihtimalinin 100'de 5 olduğunu söylüyorlar (tıpkı sonuçların doğru olma ihtimalinin 100'de 40 olduğu anlamına geldiği gibi) Yanlışlıkları lehine 100'de 60 şans). Olasılık değeri bazen yüzde olarak ifade edilir, ancak daha sıklıkla ondalık kesir olarak yazılır. Örneğin, 100 üzerinden 10 şans, 0,1'lik ondalık kesir olarak ifade edilir; 100 üzerinden 5 0,05 olarak yazılır; 100 üzerinden 1 - 0,01. Bu kayıt biçiminde sınır değeri 0,05'tir. Bir sonucun doğru sayılabilmesi için anlamlılık düzeyinin yüksek olması gerekir. altında bu sayı (unutmayın, bu sonucun olasılığıdır) yanlış nüfusu tanımlar). Terminolojiyi aradan çıkarmak için, “sonucun yanlış olma ihtimalini” (buna daha doğrusu) ekleyelim. önem düzeyi) genellikle Latin harfiyle gösterilir R. Deneysel sonuçların açıklamaları genellikle "sonuçlar güven düzeyinde anlamlıydı" gibi bir özet beyanı içerir. (P(p) 0,05'ten az (yani %5'ten az).

Böylece anlamlılık düzeyi ( R) sonuçların olasılığını gösterir Olumsuz nüfusu temsil eder. Geleneksel olarak psikolojide, sonuçların genel tabloyu güvenilir bir şekilde yansıttığı kabul edilir. R 0,05'ten az (yani %5). Ancak bu yalnızca olasılıksal bir ifadedir ve kesinlikle koşulsuz bir garanti değildir. Bazı durumlarda bu sonuç doğru olmayabilir. Aslında anlamlılık düzeyinin büyüklüğüne bakarsak bunun ne sıklıkta olabileceğini hesaplayabiliriz. 0,05 anlamlılık düzeyinde, sonuçların 100 katından 5'inin hatalı olması muhtemeldir. 11a ilk bakışta bu çok yaygın değil gibi görünüyor, ancak düşündüğünüzde 100 üzerinden 5 şans 20 üzerinden 1 ile aynı. Yani her 20 vakadan birinde sonuç şu olacak: yanlış. Bu tür olasılıklar özellikle olumlu görünmüyor ve araştırmacılar bu tür risklere girmekten kaçınmalıdır. birinci türden hatalar. Araştırmacıların gerçek sonuçlara ulaştıklarını düşündükleri halde aslında bulamadıkları zaman ortaya çıkan hatanın adıdır. Araştırmacıların bir sonuç bulamadıklarına inanmaları ama aslında bir sonuç olduğuna inanmalarından oluşan tam tersi hataya ne ad verilir? ikinci tip hatalar.

Bu hatalar, yapılan istatistiksel analizin göz ardı edilememesi nedeniyle ortaya çıkar. Hata olasılığı, sonuçların istatistiksel anlamlılık düzeyine bağlıdır. Bir sonucun doğru sayılması için anlamlılık düzeyinin 0,05'in altında olması gerektiğini daha önce belirtmiştik. Elbette bazı sonuçlar daha düşük düzeydedir ve 0,001 kadar düşük sonuçlar bulmak alışılmadık bir durum değildir (0,001 değeri, sonuçların yanlış olma ihtimalinin 1000'de 1 olduğunu gösterir). P değeri ne kadar küçük olursa sonuçların doğruluğuna olan güvenimiz o kadar güçlü olur.

Tabloda Şekil 7.2, istatistiksel çıkarım olasılığına ilişkin anlamlılık düzeylerinin geleneksel yorumunu ve bir ilişkinin (farklılıkların) varlığına ilişkin kararın gerekçesini göstermektedir.

Tablo 7.2

Psikolojide kullanılan anlamlılık düzeylerinin geleneksel yorumu

Pratik araştırma deneyimine dayanarak, şu şekilde tavsiye edilir: Birinci ve ikinci türdeki hatalardan mümkün olduğunca kaçınmak için, önemli sonuçlar çıkarırken, seviyelere odaklanarak farklılıkların (bağlantıların) varlığı hakkında kararlar alınmalıdır. R n işareti.

İstatistiksel test(İstatistiksel Test - istatistiksel anlamlılık düzeyini belirlemek için bir araçtır. Bu, yüksek olasılıkla doğru bir hipotezin kabul edilmesini, yanlış bir hipotezin ise reddedilmesini sağlayan belirleyici bir kuraldır.

İstatistiksel kriterler aynı zamanda belirli bir sayıyı ve sayının kendisini hesaplama yöntemini de belirtir. Tüm kriterler tek bir amaç için kullanılır: belirlemek önem düzeyi analiz ettikleri veriler (yani verilerin, numunenin alındığı popülasyonu doğru şekilde temsil eden gerçek bir etkiyi yansıtma olasılığı).

Bazı testler yalnızca normal olarak dağıtılan veriler için kullanılabilir (ve özellik aralık ölçeğinde ölçülüyorsa) - bu testlere genellikle denir. parametrik. Diğer kriterleri kullanarak verileri hemen hemen her dağıtım yasasıyla analiz edebilirsiniz - bunlara denir parametrik olmayan.

Parametrik kriterler, hesaplama formülünde dağılım parametrelerini içeren kriterlerdir; ortalamalar ve varyanslar (Student's t-testi, Fisher's F-testi, vb.).

Parametrik olmayan kriterler, dağılım parametrelerinin hesaplanmasına ilişkin formülde dağılım parametrelerini içermeyen ve frekanslar veya sıralar (kriter) ile çalışmaya dayalı kriterlerdir. Bunu görüyoruz Rosenbaum kriteri sen Manna-Whitney

Örneğin, farklılıkların anlamlılığının Öğrenci t-testi ile belirlendiğini söylediğimizde, ampirik değeri hesaplamak için Öğrenci t-testi yönteminin kullanıldığını ve bu değerin daha sonra tablodaki (kritik) değerle karşılaştırıldığını kastediyoruz.

Kriterin ampirik (bizim tarafımızdan hesaplanan) ve kritik değerlerinin (tablo) oranına göre hipotezimizin doğrulanıp doğrulanmadığına karar verebiliriz. Çoğu durumda, farklılıkları anlamlı olarak tanıyabilmemiz için, kriterin ampirik değerinin kritik değeri aşması gerekir, ancak bazı kriterler (örneğin, Mann-Whitney testi veya işaret testi) vardır. tam tersi kurala uymalıyız.

Bazı durumlarda, kritere ilişkin hesaplama formülü, incelenen örnekteki gözlem sayısını içerir; bu sayı şu şekilde gösterilir: P. Özel bir tablo kullanarak, belirli bir ampirik değerin farklılıkların hangi istatistiksel anlamlılık düzeyine karşılık geldiğini belirleriz. Çoğu durumda, kriterin aynı ampirik değeri, incelenen örnekteki gözlem sayısına bağlı olarak önemli veya önemsiz olabilir ( N ) veya sözde serbestlik derecesi sayısı , olarak gösterilir v (g>) veya nasıl df (Bazen D).

bilmek N veya serbestlik derecesi sayısı, özel tablolar (ana tablolar Ek 5'te verilmiştir) kullanarak kriterin kritik değerlerini belirleyebilir ve elde edilen ampirik değeri onlarla karşılaştırabiliriz. Bu genellikle şu şekilde yazılır: “ne zaman n = Kriterin 22 kritik değeri tst = 2,07" veya "de v (D) = Öğrenci testinin 2 kritik değeri = 4,30” vb.

Tipik olarak, tercih hala parametrik kriterlere verilmektedir ve biz de bu pozisyona bağlı kalıyoruz. Daha güvenilir oldukları kabul edilir ve daha fazla bilgi ve daha derin analiz sağlayabilirler. Matematiksel hesaplamaların karmaşıklığına gelince, bilgisayar programları kullanıldığında bu karmaşıklık ortadan kalkar (ancak bazılarının üstesinden gelinebilir gibi görünür).

  • Bu ders kitabında istatistik sorununu ayrıntılı olarak ele almıyoruz.
  • hipotezler (boş - R0 ve alternatif - Hj) ve yapılan istatistiksel kararlar, çünkü psikoloji öğrencileri bunu "Psikolojide matematiksel yöntemler" disiplininde ayrı olarak inceliyorlar. Ayrıca bir araştırma raporu hazırlarken (ders veya diploma çalışması, yayın), istatistiksel hipotezlerin ve istatistiksel çözümlerin kural olarak verilmediğine dikkat edilmelidir. Genellikle, sonuçları açıklarken kriter belirtilir, gerekli tanımlayıcı istatistikler (ortalamalar, sigma, korelasyon katsayıları vb.), Kriterlerin ampirik değerleri, serbestlik dereceleri ve mutlaka p anlamlılık düzeyi verilir. . Daha sonra, test edilen hipotezle ilgili olarak, ulaşılan veya ulaşılamayan önem düzeyini gösteren (genellikle eşitsizlik biçiminde) anlamlı bir sonuç formüle edilir.

İstatistikler uzun zamandır yaşamın ayrılmaz bir parçası haline geldi. İnsanlar her yerde bununla karşılaşıyor. İstatistiklere dayanarak, nerede ve hangi hastalıkların yaygın olduğu, belirli bir bölgede veya nüfusun belirli bir kesimi arasında neyin daha fazla talep edildiği hakkında sonuçlar çıkarılır. Hatta hükümet adaylarının siyasi programları bile buna dayanıyor. Bunlar ayrıca perakende zincirleri tarafından mal satın alırken de kullanılıyor ve üreticiler tekliflerinde bu verilere göre yönlendiriliyor.

İstatistikler toplum yaşamında önemli bir rol oynar ve her bireyi küçük şeylerde bile etkiler. Örneğin, belirli bir şehir veya bölgede çoğu insan giyimde koyu renkleri tercih ediyorsa, o zaman yerel perakende satış noktalarında çiçek desenli parlak sarı bir yağmurluk bulmak son derece zor olacaktır. Peki bu kadar etkisi olan bu veriler hangi niceliklerden oluşuyor? Örneğin “istatistiksel anlamlılık” ne demektir? Bu tanımla tam olarak ne kastedilmektedir?

Bu nedir?

Bir bilim olarak istatistik, farklı nicelik ve kavramların birleşiminden oluşur. Bunlardan biri “istatistiksel anlamlılık” kavramıdır. Diğer göstergelerin ortaya çıkma olasılığının ihmal edilebilir olduğu değişkenlerin değerinin adıdır.

Örneğin, yağmurlu bir gecenin ardından sonbahar ormanında mantar toplamak için yapılan sabah yürüyüşünde 10 kişiden 9'u ayağına lastik ayakkabı giyiyor. Bir noktada 8 tanesinin kanvas mokasen giyiyor olma ihtimali ihmal edilebilir. Dolayısıyla bu özel örnekte 9 sayısı “istatistiksel anlamlılık” olarak adlandırılan değerdir.

Buna göre aşağıdaki pratik örneği geliştirirsek, ayakkabı mağazaları yaz sezonunun sonuna doğru yılın diğer zamanlarına göre daha fazla miktarda lastik çizme satın alıyor. Dolayısıyla istatistiksel bir değerin büyüklüğü günlük yaşamı etkilemektedir.

Elbette karmaşık hesaplamalarda, örneğin virüslerin yayılmasını tahmin ederken çok sayıda değişken dikkate alınır. Ancak istatistiksel verilerin önemli bir göstergesini belirlemenin özü, hesaplamaların karmaşıklığına ve sabit olmayan değerlerin sayısına bakılmaksızın benzerdir.

Nasıl hesaplanır?

Denklemin “istatistiksel anlamlılık” göstergesinin değeri hesaplanırken kullanılırlar. Yani bu durumda her şeye matematiğin karar verdiği söylenebilir. En basit hesaplama seçeneği, aşağıdaki parametreleri içeren bir matematiksel işlemler zinciridir:

  • anketlerden veya nesnel verilerin incelenmesinden elde edilen iki tür sonuç, örneğin a ve b ile gösterilen satın alma miktarları;
  • her iki grup için gösterge - n;
  • birleştirilmiş numunenin payının değeri - p;
  • “standart hata” kavramı - SE.

Bir sonraki adım, genel test göstergesini - t belirlemektir, değeri 1,96 sayısıyla karşılaştırılır. 1,96, Öğrencinin t-dağılımı fonksiyonuna göre %95 aralığını temsil eden ortalama değerdir.

Genellikle n ve p değerleri arasındaki farkın ne olduğu sorusu ortaya çıkar. Bu nüans bir örnek yardımıyla kolayca açıklığa kavuşturulabilir. Diyelim ki kadın ve erkekler için bir ürüne veya markaya olan bağlılığın istatistiksel önemini hesaplıyoruz.

Bu durumda, harf tanımlarının ardından aşağıdakiler gelecektir:

  • n - yanıt verenlerin sayısı;
  • p - üründen memnun kalan kişi sayısı.

Bu durumda görüşülen kadın sayısı n1 olarak belirlenecektir. Buna göre n2 erkek var. P sembolü için “1” ve “2” sayıları aynı anlama gelecektir.

Test göstergesinin Öğrenci hesaplama tablolarındaki ortalama değerlerle karşılaştırılması “istatistiksel anlamlılık” olarak adlandırılan duruma gelir.

Doğrulama ile kastedilen nedir?

Herhangi bir matematiksel hesaplamanın sonuçları her zaman kontrol edilebilir; çocuklara bu ilkokulda öğretilir. İstatistiksel göstergelerin bir hesaplama zinciri kullanılarak belirlendiğinden kontrol edildiğini varsaymak mantıklıdır.

Ancak istatistiksel anlamlılığın test edilmesi sadece matematikle ilgili değildir. İstatistik, her zaman hesaplanamayan çok sayıda değişken ve çeşitli olasılıklarla ilgilenir. Yani, makalenin başında verilen lastik ayakkabılarla ilgili örneğe dönersek, o zaman mağazalar için mal alıcılarının güveneceği istatistiksel verilerin mantıksal yapısı, kuru ve sıcak hava nedeniyle bozulabilir; bu, için tipik değildir. sonbahar. Bu durumun sonucunda lastik çizme satın alan kişi sayısı azalacak ve perakende satış mağazaları zarara uğrayacak. Elbette matematiksel bir formül, hava anormalliklerini tahmin edemez. Bu ana “hata” denir.

Hesaplanan önem düzeyini kontrol ederken tam olarak bu tür hataların olasılığı dikkate alınır. Hem hesaplanan göstergeleri hem de kabul edilen önem seviyelerini ve ayrıca geleneksel olarak hipotez olarak adlandırılan değerleri dikkate alır.

Önem düzeyi nedir?

“Seviye” kavramı istatistiksel anlamlılık için ana kriterler arasında yer almaktadır. Uygulamalı ve pratik istatistiklerde kullanılır. Bu, olası sapma veya hata olasılığını dikkate alan bir değer türüdür.

Seviye, hazır örneklerdeki farklılıkların belirlenmesine dayanır ve bunların önemini veya tersine rastgeleliğini belirlememize olanak tanır. Bu kavramın sadece dijital anlamları değil, aynı zamanda kendine özgü kod çözümlemeleri de var. Değerin nasıl anlaşılması gerektiğini açıklarlar ve sonucu ortalama endeksle karşılaştırarak seviyenin kendisi belirlenir, bu da farklılıkların güvenilirlik derecesini ortaya çıkarır.

Böylece seviye kavramını basitçe hayal edebiliriz - elde edilen istatistiksel verilerden çıkarılan sonuçlarda kabul edilebilir, olası bir hatanın veya hatanın bir göstergesidir.

Hangi önem seviyeleri kullanılıyor?

Uygulamada bir hatanın olasılık katsayılarının istatistiksel anlamlılığı üç temel düzeye dayanmaktadır.

İlk seviye, değerin %5 olduğu eşik olarak kabul edilir. Yani hata olasılığı %5 anlamlılık düzeyini aşmamaktadır. Bu, istatistiksel araştırma verilerine dayanarak yapılan kusursuz ve hatasız sonuçlara olan güvenin %95 olduğu anlamına gelir.

İkinci seviye %1 eşiğidir. Buna göre bu rakam, istatistiksel hesaplamalar sırasında elde edilen verilere %99 güvenle yön verilebilecek anlamına gelmektedir.

Üçüncü seviye %0,1’dir. Bu değerle hata olasılığı yüzde bire eşittir, yani hatalar pratik olarak ortadan kaldırılır.

İstatistikte hipotez nedir?

Kavram olarak hatalar, sıfır hipotezinin kabulü veya reddedilmesiyle ilgili olarak iki yöne ayrılır. Hipotez, tanımına göre arkasında bir dizi başka veri veya ifadenin yer aldığı bir kavramdır. Yani istatistiksel muhasebe konusuyla ilgili bir şeyin olasılıksal dağılımının açıklaması.

Basit hesaplamalarda iki hipotez vardır; sıfır ve alternatif. Aralarındaki fark, sıfır hipotezinin istatistiksel anlamlılığın belirlenmesinde yer alan örnekler arasında temel bir fark olmadığı fikrine dayanması ve alternatif hipotezin ise tamamen zıt olmasıdır. Yani alternatif hipotez, örneklem verileri arasında anlamlı bir farklılığın varlığına dayanmaktadır.

Hatalar nelerdir?

İstatistikte bir kavram olarak hatalar, doğrudan şu veya bu hipotezin doğru olarak kabul edilmesine bağlıdır. İki yöne veya türe ayrılabilirler:

  • birinci tip, yanlış olduğu ortaya çıkan sıfır hipotezinin kabul edilmesinden kaynaklanmaktadır;
  • ikincisi alternatifi takip etmekten kaynaklanmaktadır.

İlk hata türüne yanlış pozitif denir ve istatistiksel verilerin kullanıldığı tüm alanlarda oldukça sık görülür. Buna göre ikinci tip hataya yanlış negatif denir.

İstatistikte regresyon ne için kullanılır?

Regresyonun istatistiksel önemi, verilere dayanarak hesaplanan çeşitli bağımlılıklar modelinin gerçeğe ne kadar iyi karşılık geldiğini belirlemek için kullanılabilmesidir; dikkate alınması gereken faktörlerin yeterliliğini veya eksikliğini belirlemenize ve sonuç çıkarmanıza olanak tanır.

Regresyon değeri, sonuçların Fisher tablolarında listelenen verilerle karşılaştırılması yoluyla belirlenir. Veya varyans analizini kullanarak. Regresyon göstergeleri, çok sayıda değişkeni, rastgele verileri ve olası değişiklikleri içeren karmaşık istatistiksel çalışmalar ve hesaplamalar için önemlidir.



Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!