Parametrik student's t testi değerlendirir. MS Excel'de ortalama hakkındaki hipotezi test etmek ve güven aralığını hesaplamak için Öğrenci t-testi dağılımı

İstatistiksel hipotez testi, örnek verilere dayanarak bir popülasyonun özellikleri hakkında güçlü çıkarımlar yapmamızı sağlar. Farklı hipotezler var. Bunlardan biri ortalamaya ilişkin hipotezdir (matematiksel beklenti). Bunun özü, genel ortalamanın nerede bulunabileceği veya bulunamayacağı konusunda yalnızca mevcut örneğe dayanarak doğru bir sonuca varmaktır (gerçeği hiçbir zaman tam olarak bilemeyeceğiz, ancak aramayı daraltabiliriz).

Hipotezleri test etmeye yönelik genel yaklaşım anlatılmıştır, o yüzden doğrudan konuya geçelim. Öncelikle numunenin rastgele değişkenlerden oluşan normal bir popülasyondan alındığını varsayalım. X genel ortalamayla μ ve varyans σ2(Biliyorum, bunun olmayacağını biliyorum ama sözümü kesmeyin!). Bu örneğin aritmetik ortalamasının kendisi açıkça bir rastgele değişkendir. Bu tür birçok örnek çıkarırsanız ve ortalamalarını hesaplarsanız, onların da matematiksel bir beklentisi olacaktır. μ Ve

Daha sonra rastgele değişken

Şu soru ortaya çıkıyor: %95 olasılıkla genel ortalama ±1,96 aralığında mı olacak? s x̅. Başka bir deyişle rastgele değişkenlerin dağılımları

eş değer.

Bu soru ilk olarak Dublin'deki (İrlanda) Guinness bira fabrikasında çalışan bir kimyager tarafından soruldu (ve çözüldü). Kimyagerin adı William Seely Gossett'ti ve kimyasal analiz için bira örnekleri alıyordu. Görünüşe göre bir noktada William, ortalamaların dağılımı hakkındaki belirsiz şüphelerden dolayı eziyet çekmeye başladı. Normal bir dağılımın olması gerekenden biraz daha bulaşmış olduğu ortaya çıktı.

Dublin'li kimyager William Gosset, keşfettiği dağıtım fonksiyonunun matematiksel temelini toplayıp değerlerini hesapladıktan sonra, Biometrics dergisinin (baş editör - Karl Pearson) Mart 1908 sayısında yayınlanan bir not yazdı. Çünkü Guinness, bira üretim sırlarının ifşa edilmesini kesinlikle yasakladı; Gossett, Öğrenci takma adıyla imza attı.

K. Pearson'un dağıtımı zaten icat etmiş olmasına rağmen, genel normallik fikri hala hakimdi. Kimse örneklem puanlarının dağılımının normal olmayabileceğini düşünmeyecekti. Bu nedenle W. Gosset'in makalesi pratikte fark edilmedi ve unutuldu. Ve Gosset'in keşfini yalnızca Ronald Fisher takdir etti. Fischer, çalışmasında yeni dağılımı kullanmış ve ona adını vermiştir. Öğrencinin t-dağılımı. Buna göre hipotezleri test etme kriteri şu hale geldi: Öğrenci t testi. Örnek verilerin analizi çağına adım atan istatistikte bir “devrim” böyle yaşandı. Bu, tarihe kısa bir geziydi.

Bakalım W. Gosset ne görebilmiş. 6 gözlemden ortalama 20 bin normal örnek üretelim ( X) 50 ve standart sapma ( σ ) 10. Daha sonra örnek ortalamaları kullanarak normalleştiririz. genel varyans:

Ortaya çıkan 20 bin ortalamayı 0,1 uzunlukta aralıklarla gruplayıp frekansları hesaplayacağız. Örnek ortalamaların gerçek (Norm) ve teorik (ENorm) frekans dağılımını diyagram üzerinde gösterelim.

Noktalar (gözlenen frekanslar) pratik olarak çizgiyle (teorik frekanslar) çakışır. Bu anlaşılabilir bir durumdur çünkü veriler aynı genel popülasyondan alınmıştır ve farklılıklar yalnızca örnekleme hatalarından kaynaklanmaktadır.

Yeni bir deney yapalım. Ortalamaları kullanarak normalleştiririz örnek varyans.

Frekansları tekrar sayalım ve bunları diyagram üzerinde noktalar halinde çizelim ve karşılaştırma için standart bir normal dağılım çizgisi bırakalım. Ortalamaların ampirik frekansını örneğin harfle gösterelim. T.

Bu sefer dağılımların pek örtüşmediği görülüyor. Yakın evet ama aynı şey değil. Kuyruklar daha “ağır” hale geldi.

Gosset-Student, MS Excel'in en son sürümüne sahip değildi ancak fark ettiği etki tam olarak buydu. Bu neden oluyor? Bunun açıklaması rastgele değişkenin

yalnızca örnekleme hatasına (pay) değil, aynı zamanda yine rastgele bir değişken olan ortalamanın (payda) standart hatasına da bağlıdır.

Böyle bir rastgele değişkenin nasıl bir dağılıma sahip olması gerektiğine biraz bakalım. Öncelikle matematiksel istatistiklerden bir şeyler hatırlamanız (veya öğrenmeniz) gerekecek. Normal dağılımdan alınan bir örnekte şunu belirten Fisher teoremi vardır:

1. orta X ve örnek varyansı s 2 bağımsız miktarlardır;

2. serbestlik derecesi sayısıyla çarpılan örneklem ve popülasyon varyansının oranı bir dağılıma sahiptir χ2(ki-kare) aynı sayıda serbestlik derecesine sahip, yani

Nerede k– serbestlik derecesi sayısı (İngilizce serbestlik derecesi (d.f.))

Normal modellerin istatistiklerindeki diğer birçok sonuç bu yasaya dayanmaktadır.

Ortalamanın dağılımına dönelim. İfadenin payını ve paydasını bölme

Açık σ X̅. Aldık

Pay standart bir normal rastgele değişkendir (biz şunu belirtiriz: ξ (xi)). Paydayı Fisher teoreminden ifade edelim.

Daha sonra orijinal ifade şu şekli alacaktır:

Genel haliyle bu böyledir (Öğrenci ilişkisi). Dağıtım fonksiyonunu doğrudan türetebilirsiniz çünkü bu ifadedeki her iki rastgele değişkenin dağılımları bilinmektedir. Bu zevki matematikçilere bırakalım.

Öğrenci t-dağılımı fonksiyonunun anlaşılması oldukça zor bir formülü var, dolayısıyla analiz etmenin bir anlamı yok. Zaten kimse kullanmıyor çünkü... olasılıklar Öğrenci dağılımlarının özel tablolarında (bazen Öğrenci katsayıları tabloları olarak da adlandırılır) verilir veya PC formüllerine dahil edilir.

Böylece, bu yeni bilgilerle donanmış olarak Öğrenci dağılımının resmi tanımını anlayabilirsiniz.
Öğrenci dağılımına tabi rastgele bir değişken k serbestlik derecesi bağımsız rastgele değişkenlerin oranıdır

Nerede ξ standart normal yasaya göre dağıtılır ve χ2k dağıtıma uyar χ2 C k serbestlik dereceleri.

Böylece, aritmetik ortalama için Öğrenci t testi formülü

Öğrenci ilişkisinde özel bir durum var

Formül ve tanımdan, Öğrenci t-testinin dağılımının yalnızca serbestlik derecesi sayısına bağlı olduğu anlaşılmaktadır.

Şu tarihte: k> 30 t-testi pratik olarak standart normal dağılımdan farklı değildir.

Ki-kareden farklı olarak t testi tek kuyruklu veya iki kuyruklu olabilir. Genellikle sapmanın ortalamadan her iki yönde de meydana gelebileceğini varsayarak iki taraflı kullanırlar. Ancak problemin durumu yalnızca bir yönde sapmaya izin veriyorsa, o zaman tek taraflı bir kriterin kullanılması mantıklı olacaktır. Bu gücü biraz artırır, çünkü... sabit bir anlamlılık seviyesinde kritik değer sıfıra biraz yaklaşır.

Öğrenci t-testini kullanma koşulları

Öğrencinin keşfinin bir zamanlar istatistikte devrim yaratmış olmasına rağmen, t-testinin uygulama olanakları hâlâ oldukça sınırlıdır, çünkü kendisi orijinal verilerin normal bir dağılıma sahip olduğu varsayımından gelir. Veriler normal değilse (ki bu genellikle böyledir), t testi artık Öğrenci dağılımına sahip olmayacaktır. Bununla birlikte, merkezi limit teoreminin etkisi nedeniyle, anormal veriler için bile ortalama, hızlı bir şekilde çan şeklinde bir dağılım elde eder.

Örneğin, 5 serbestlik derecesine sahip ki-kare dağılımı gibi sağa kuvvetli bir şekilde çarpık olan verileri düşünün.

Şimdi 20 bin örnek oluşturalım ve hacimlerine göre ortalamaların dağılımının nasıl değiştiğini gözlemleyelim.

Fark, 15-20 gözleme kadar olan küçük numunelerde oldukça belirgindir. Ama sonra hızla ortadan kayboluyor. Dolayısıyla dağılımın normal olmaması elbette iyi değil ama kritik de değil.

En önemlisi, t-testi aykırı değerlerden “korkuyor”; anormal sapmalar. Her biri 15 gözlemden oluşan 20 bin normal örnek alalım ve bazılarına rastgele bir aykırı değer ekleyelim.

Resim kasvetli çıkıyor. Ortalamaların gerçek frekansları teorik olanlardan çok farklıdır. Böyle bir durumda t dağılımını kullanmak çok riskli bir girişim haline gelir.

Dolayısıyla, çok küçük olmayan örneklerde (15 gözlemden), t-testi orijinal verilerin normal olmayan dağılımına nispeten dirençlidir. Ancak verilerdeki aykırı değerler t-testinin dağılımını büyük ölçüde bozar ve bu da istatistiksel çıkarımlarda hatalara yol açabilir; dolayısıyla anormal gözlemlerin ortadan kaldırılması gerekir. Genellikle ortalamadan ±2 standart sapma dahilinde kalan tüm değerler numuneden çıkarılır.

MS Excel'de Öğrenci t-testini kullanarak matematiksel beklentiyle ilgili bir hipotezi test etmeye bir örnek

Excel'in t dağıtımıyla ilgili çeşitli işlevleri vardır. Şimdi onlara bakalım.

STUDENT.DIST – “klasik” sol taraflı Öğrenci t-dağılımı. Giriş, t kriteri değeri, serbestlik derecesi sayısı ve neyin hesaplanması gerektiğini belirleyen bir seçenektir (0 veya 1): yoğunluk veya fonksiyon değeri. Çıktıda sırasıyla rastgele değişkenin argümanda belirtilen t kriterinden daha az olma yoğunluğunu veya olasılığını elde ederiz.

ÖĞRENCİ.DAĞ.2X – iki yönlü dağıtım. Argüman, t-testinin mutlak değeri (modülo) ve serbestlik derecesinin sayısıdır. Sonuç olarak, aynı veya hatta daha büyük t kriteri değerini elde etme olasılığını elde ederiz; gerçek anlamlılık düzeyi (p düzeyi).

STUDENT.DIST.PH – sağ taraftaki t dağılımı. Yani, 1-ÖĞRENCİ.DAĞ(2;5;1) = ÖĞRENCİ.DAĞ.PH(2;5) = 0,05097. T testi pozitifse, ortaya çıkan olasılık p düzeyidir.

STUDENT.INR – t dağılımının sol taraftaki tersini hesaplamak için kullanılır. Tartışma olasılık ve serbestlik derecesinin sayısıdır. Çıkışta bu olasılığa karşılık gelen t kriteri değerini elde ederiz. Olasılık sayısı soldadır. Bu nedenle sol kuyruk, anlamlılık düzeyinin kendisini gerektirir α , ve doğru olan için 1 - α .

STUDENT.OBR.2X – iki taraflı Öğrenci dağılımının ters değeri, yani t-test değeri (modülo). Anlamlılık düzeyi de girdiye sağlanır α . Ancak bu sefer sayım her iki taraftan da aynı anda gerçekleştirilir, böylece olasılık iki kuyruğa dağıtılır. Yani, STUDENT.ARV(1-0,025;5) = STUDENT.ARV.2X(0,05;5) = 2,57058

STUDENT.TEST, iki örnekte matematiksel beklentilerin eşitliği hakkındaki hipotezi test etmeye yönelik bir fonksiyondur. Bir dizi hesaplamanın yerini alır, çünkü Verilerle yalnızca iki aralık ve birkaç parametre daha belirtmek yeterlidir. Çıktı p düzeyindedir.

GÜVEN.ÖĞRENCİ – t-dağılımı dikkate alınarak ortalamanın güven aralığının hesaplanması.

Bu eğitim örneğini ele alalım. İşletmede çimento 50 kg'lık torbalarda paketlenmektedir. Rastgelelik nedeniyle, tek bir torbada beklenen kütleden bir miktar sapmaya izin verilir, ancak genel ortalama 50 kg olarak kalmalıdır. Kalite kontrol departmanı rastgele 9 torbayı tarttı ve aşağıdaki sonuçları elde etti: ortalama ağırlık ( X) 50,3 kg, standart sapma ( S) – 0,5 kg.

Bu sonuç genel ortalamanın 50 kg olduğu sıfır hipoteziyle tutarlı mıdır? Yani ekipmanın düzgün çalışıp ortalama 50 kg dolum yapması durumunda böyle bir sonucun tesadüfen elde edilmesi mümkün müdür? Hipotez reddedilmezse ortaya çıkan fark rastgele dalgalanmalar aralığına uyuyor, ancak hipotez reddedilirse büyük olasılıkla torbaları dolduran makinenin ayarlarında bir arıza vardı. Kontrol edilmesi ve yapılandırılması gerekiyor.

Genel kabul görmüş gösterimde kısa bir koşul şuna benzer.

H0: μ = 50 kg

H1: μ ≠ 50 kg

Torba dolumlarının dağılımının normal bir dağılım izlediğini (veya bundan çok da farklı olmadığını) varsaymak için nedenler vardır. Bu, matematiksel beklentiyle ilgili hipotezi test etmek için Öğrenci t-testini kullanabileceğiniz anlamına gelir. Herhangi bir yönde rastgele sapmalar meydana gelebilir, bu da iki taraflı bir t testinin gerekli olduğu anlamına gelir.

İlk olarak, tufan öncesi araçları kullanacağız: t kriterini manuel olarak hesaplayacak ve onu kritik tablo değeriyle karşılaştıracağız. Hesaplanan t testi:

Şimdi ortaya çıkan sayının anlamlılık seviyesinde kritik seviyeyi aşıp aşmadığını tespit edelim. α = 0,05. Öğrencinin t-dağılımı tablosunu kullanalım (herhangi bir istatistik ders kitabında mevcuttur).

Sütunlar dağılımın sağ tarafının olasılığını, satırlar ise serbestlik derecesi sayısını gösterir. Sağdaki anlamlılık düzeyinin yarısı için t değerine eşdeğer olan 0,05 anlamlılık düzeyine sahip iki kuyruklu bir t testiyle ilgileniyoruz: 1 - 0,05/2 = 0,975. Serbestlik derecesi sayısı örneklem büyüklüğü eksi 1'dir, yani. 9 - 1 = 8. Kesişme noktasında t-testinin tablo değerini - 2,306 buluyoruz. Standart normal dağılımı kullansaydık kritik nokta 1,96 olurdu ama burada daha büyük çünkü Küçük örneklerdeki t dağılımı daha düzleştirilmiş bir görünüme sahiptir.

Gerçek (1.8) ile tablo değerini (2.306) karşılaştıralım. Hesaplanan kriterin tablodakinden daha az olduğu ortaya çıktı. Sonuç olarak, mevcut veriler genel ortalamanın 50 kg olduğu H 0 hipoteziyle çelişmemektedir (ama bunu da kanıtlamamaktadır). Tabloları kullanarak öğrenebileceğimiz tek şey bu. Elbette p-düzeyini de bulmayı deneyebilirsiniz, ancak bu yaklaşık olacaktır. Ve kural olarak hipotezleri test etmek için kullanılan p düzeyidir. Bu nedenle daha sonra Excel'e geçiyoruz.

Excel'de t-testini hesaplamak için hazır bir fonksiyon yoktur. Ancak bu korkutucu değil çünkü Öğrencinin t-testi formülü oldukça basittir ve doğrudan bir Excel hücresinde kolayca oluşturulabilir.

Aynı 1.8'i aldık. Önce kritik değeri bulalım. Alfa 0,05'i alıyoruz, kriter iki kuyrukludur. STUDENT.OBR.2X iki yönlü hipotezi için ters t-dağılımı fonksiyonuna ihtiyacımız var.

Ortaya çıkan değer kritik bölgeyi keser. Gözlemlenen t testi bu kapsama girmediğinden hipotez reddedilmez.

Ancak bu, bir tablo değerini kullanarak bir hipotezi test etmenin aynı yoludur. P-düzeyini hesaplamak daha bilgilendirici olacaktır; eğer bu hipotez doğruysa, ortalama 50 kg'dan gözlemlenen veya daha büyük sapmayı elde etme olasılığı. STUDENT.DIST.2X iki taraflı hipotezi için Öğrenci dağıtım fonksiyonuna ihtiyacınız olacak.

P düzeyi 0,1096'dır ve bu kabul edilebilir anlamlılık düzeyi olan 0,05'ten daha yüksektir; hipotezi reddetmiyoruz. Ama artık kanıtın derecesini yargılayabiliriz. P düzeyinin hipotezin reddedildiği duruma oldukça yakın çıkması farklı düşüncelere yol açmaktadır. Örneğin, numunenin önemli bir sapmayı tespit edemeyecek kadar küçük olması.

Bir süre sonra kontrol departmanı torba doldurma standardının nasıl korunduğunu tekrar kontrol etmeye karar verdi. Bu sefer daha fazla güvenilirlik için 9 değil 25 torba seçildi. Ortalamanın yayılmasının azalacağı ve dolayısıyla sistemde bir arıza bulma şansının artacağı sezgisel olarak açıktır.

Diyelim ki numune için ortalama ve standart sapmanın aynı değerleri ilk seferde elde edildi (sırasıyla 50,3 ve 0,5). T-testini hesaplayalım.


24 serbestlik derecesi ve α = 0,05 için kritik değer 2,064'tür. Aşağıdaki resim t-testinin hipotez reddi aralığında olduğunu göstermektedir.

%95'in üzerinde bir güven olasılığı ile genel ortalamanın 50 kg'dan farklı olduğu sonucuna varabiliriz. Daha ikna edici olmak için p düzeyine (tablonun son satırı) bakalım. Hipotez doğruysa, 50'den aynı veya hatta daha büyük sapma gösteren bir ortalama elde etme olasılığı 0,0062 veya %0,62'dir ve bu, tek bir ölçümle neredeyse imkansızdır. Genel olarak hipotezi olası olmadığı gerekçesiyle reddediyoruz.

Öğrencinin t-Dağılımını Kullanarak Güven Aralığını Hesaplamak

Başka bir istatistiksel yöntem hipotez testiyle yakından ilgilidir - güven aralıklarının hesaplanması. Ortaya çıkan aralık, sıfır hipotezine karşılık gelen bir değer içeriyorsa, bu, sıfır hipotezinin reddedilmediği gerçeğine eşdeğerdir. Aksi takdirde hipotez karşılık gelen güven düzeyiyle reddedilir. Bazı durumlarda analistler hipotezleri klasik biçimde hiç test etmezler, yalnızca güven aralıklarını hesaplarlar. Bu yaklaşım daha da yararlı bilgiler çıkarmanıza olanak tanır.

9 ve 25 gözlemin ortalaması için güven aralıklarını hesaplayalım. Bunu yapmak için Excel'in GÜVENİLİR.ÖĞRENCİ fonksiyonunu kullanacağız. Burada, garip bir şekilde, her şey oldukça basit. İşlev argümanlarının yalnızca önem düzeyini belirtmesi gerekir α , numune standart sapması ve numune büyüklüğü. Çıktıda güven aralığının yarı genişliğini, yani ortalamanın her iki tarafına yerleştirilmesi gereken değeri elde ederiz. Hesaplamaları yaptıktan ve görsel bir diyagram çizdikten sonra aşağıdakileri elde ederiz.

Gördüğünüz gibi 9 gözlemlik bir örnekle 50 değeri güven aralığına giriyor (hipotez reddedilmiyor), 25 gözlemle ise güven aralığına girmiyor (hipotez reddedildi). Ayrıca 25 torba ile yapılan bir deneyde %97,5 olasılıkla genel ortalamanın 50,1 kg'ı aştığı (güven aralığının alt sınırı 50,094 kg) ifade edilebilir. Ve bu oldukça değerli bir bilgi.

Böylece aynı sorunu üç şekilde çözdük:

1. Eski bir yaklaşım kullanarak t-testinin hesaplanan ve tablolaştırılan değerlerini karşılaştırarak
2. Daha modern, p-düzeyini hesaplayarak hipotezi reddederken bir güven derecesi ekler.
3. Güven aralığının hesaplanması ve genel ortalamanın minimum değerinin elde edilmesi daha da bilgilendiricidir.

T-testinin parametrik yöntemlere atıfta bulunduğunu hatırlamak önemlidir, çünkü normal dağılıma dayanır (iki parametresi vardır: ortalama ve varyans). Bu nedenle, başarılı bir uygulama için, başlangıç ​​verilerinin en azından yaklaşık normalliği ve aykırı değerlerin olmaması önemlidir.

Son olarak Excel'de Öğrenci t-testi ile ilgili hesaplamaların nasıl yapılacağına dair videoyu izlemenizi öneririm.

Örnek boyunca okuyucunun gerekli dönüşümleri kendi başına yapabilmesi için hayali bilgiler kullanacağız.

Diyelim ki, araştırma sırasında A ilacının C dokusundaki B maddesi içeriği (mmol/g cinsinden) ve hastalarda kandaki D maddesi konsantrasyonu (mmol/l cinsinden) üzerindeki etkisini inceledik. bazı E kriterlerine göre eşit hacimli 3 gruba bölünmüştür (n = 10). Böyle hayali bir çalışmanın sonuçları tabloda gösterilmektedir:

B maddesinin içeriği, mmol/g

Madde D, mmol/l

konsantrasyon artışı


Uygulamada veri sunumu ve hesaplama kolaylığı açısından 10 büyüklüğündeki örneklemleri dikkate aldığımızı belirtmek isteriz; bu tür bir örneklem büyüklüğü genellikle istatistiksel bir sonuç oluşturmak için yeterli değildir.

Örnek olarak tablonun 1. sütunundaki verileri düşünün.

Tanımlayıcı İstatistikler

Örnek ortalama

Genellikle basitçe "ortalama" olarak adlandırılan aritmetik ortalama, tüm değerlerin toplanması ve bu toplamın kümedeki değer sayısına bölünmesiyle elde edilir. Bu cebirsel bir formül kullanılarak gösterilebilir. Bir x değişkeninin n gözlem kümesi, x 1 , x 2 , x 3 , ..., x n olarak temsil edilebilir

Gözlemlerin aritmetik ortalamasını belirleme formülü (“Çizgili X” olarak telaffuz edilir):

= (X 1 + X 2 + ... + X n) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Örnek varyans

Veri dağılımını ölçmenin bir yolu, her gözlemin aritmetik ortalamadan ne kadar saptığını belirlemektir. Açıkçası, sapma ne kadar büyük olursa, gözlemlerin değişkenliği, değişkenliği de o kadar büyük olur. Ancak bu sapmaların ortalamasını kullanamayız. bir dağılım ölçüsü olarak kullanılır, çünkü pozitif sapmalar negatif sapmaları telafi eder (toplamları sıfırdır). Bu sorunu çözmek için her sapmanın karesini alırız ve sapmaların karelerinin ortalamasını buluruz; bu miktara varyasyon veya dağılım denir. n tane gözlem alalım x 1, x 2, x 3, ..., x n, ortalama hangisi eşittir. Varyansın hesaplanması bu, genellikle şu şekilde anılır:s2,bu gözlemler:

Bu göstergenin örneklem varyansı s 2 = 3,2'dir.

Standart sapma

Standart (ortalama kare) sapma, varyansın pozitif kareköküdür. Örnek olarak n gözlem kullanıldığında şuna benzer:

Standart sapmayı, gözlemlerin ortalamadan bir tür ortalama sapması olarak düşünebiliriz. Orijinal verilerle aynı birimlerde (boyutlarda) hesaplanır.

s = sqrt (s 2) = sqrt (3,2) = 1,79.

Değişim katsayısı

Standart sapmayı aritmetik ortalamaya bölüp sonucu yüzde olarak ifade ederseniz varyasyon katsayısını elde edersiniz.

CV = (1,79 / 13,1) * %100 = 13,7

Örnek ortalama hatası

1,79/sqrt(10) = 0,57;

Öğrencinin t katsayısı (tek örnekli t testi)

Ortalama değer ile bilinen bazı m değerleri arasındaki fark hakkındaki hipotezi test etmek için kullanılır

Serbestlik derecesi sayısı f=n-1 olarak hesaplanır.

Bu durumda ortalamanın güven aralığı 11,87 ile 14,39 sınırları arasındadır.

%95 güven düzeyi için m=11,87 veya m=14,39, yani= |13,1-11,82| = |13.1-14.38| = 1,28

Buna göre bu durumda serbestlik derecesi sayısı için f = 10 – 1 = 9 ve %95 güven düzeyi için t = 2,26 olur.

Diyalog Temel İstatistikleri ve Tabloları

Modülde Temel istatistikler ve tablolar hadi seçelim Tanımlayıcı İstatistikler.

Bir iletişim kutusu açılacaktır Tanımlayıcı İstatistikler.

sahada Değişkenler hadi seçelim Grup 1.

Tıklamak TAMAM, seçilen değişkenlerin tanımlayıcı istatistiklerini içeren sonuç tabloları elde ederiz.

Bir iletişim kutusu açılacaktır Tek örnek t testi.

C dokusundaki B maddesinin ortalama içeriğinin 11 olduğunu bildiğimizi varsayalım.

Tanımlayıcı istatistikler ve Öğrenci t testi ile sonuç tablosu aşağıdaki gibidir:

C dokusundaki ortalama B maddesi içeriğinin 11 olduğu hipotezini reddetmek zorunda kaldık.

Kriterin hesaplanan değeri tablo değerinden (2.26) büyük olduğundan seçilen anlamlılık seviyesinde sıfır hipotezi reddedilir ve örneklem ile bilinen değer arasındaki farklar istatistiksel olarak anlamlı kabul edilir. Böylece, Öğrenci testi kullanılarak yapılan farklılıkların varlığına ilişkin sonuç bu yöntem kullanılarak doğrulanır.

Test sonuçlarını yorumlamaya yönelik eşdeğer bir yaklaşım, sıfır hipotezinin doğru olduğunu varsaymaktır; ne kadar büyük olduğunu hesaplayabiliriz. olasılık elde etmek T- mevcut örnek verilerden hesapladığımız gerçek değere eşit veya daha büyük bir kriter. Bu olasılığın daha önce kabul edilen bir anlamlılık seviyesinden daha düşük olduğu ortaya çıkarsa (örneğin, P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

11 kadının gıdalardan aldığı günlük enerji alımına (kJ/gün) ilişkin verilerimiz olduğunu varsayalım (örnek kitaptan alınmıştır) Altman D. G. (1981) Tıbbi Araştırmalar için Pratik İstatistikler, Chapman & Hall, Londra):


Bu 11 gözlemin ortalaması:


Soru: Bu numune ortalaması, belirlenmiş olan 7725 kJ/gün normundan farklı mıdır? Örnek değerimiz ile bu standart arasındaki fark oldukça anlamlıdır: 7725 - 6753,6 = 971,4. Peki bu fark istatistiksel olarak ne kadar büyük? Tek bir örnek bu soruyu yanıtlamaya yardımcı olacaktır. T-test. Diğer seçenekler gibi T-test, R'de t.test() işlevi kullanılarak tek örnekli bir t testi gerçekleştirilir:


Soru: Bu ortalamalar istatistiksel olarak farklı mıdır? Kullanarak hiçbir fark olmadığı hipotezini kontrol edelim. T-test:

Peki böyle durumlarda müdahalenin etkisinin varlığını istatistiksel olarak nasıl değerlendirebiliriz? Genel olarak, Öğrenci t-testi şu şekilde temsil edilebilir:

Test sonuçlarını yorumlamaya yönelik eşdeğer bir yaklaşım, sıfır hipotezinin doğru olduğunu varsaymaktır; ne kadar büyük olduğunu hesaplayabiliriz. olasılık elde etmek T- mevcut örnek verilerden hesapladığımız gerçek değere eşit veya daha büyük bir kriter. Bu olasılığın daha önce kabul edilen bir anlamlılık seviyesinden daha düşük olduğu ortaya çıkarsa (örneğin, P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

11 kadının gıdalardan aldığı günlük enerji alımına (kJ/gün) ilişkin verilerimiz olduğunu varsayalım (örnek kitaptan alınmıştır) Altman D. G. (1981) Tıbbi Araştırmalar için Pratik İstatistikler, Chapman & Hall, Londra):


Bu 11 gözlemin ortalaması:


Soru: Bu numune ortalaması, belirlenmiş olan 7725 kJ/gün normundan farklı mıdır? Örnek değerimiz ile bu standart arasındaki fark oldukça anlamlıdır: 7725 - 6753,6 = 971,4. Peki bu fark istatistiksel olarak ne kadar büyük? Tek bir örnek bu soruyu yanıtlamaya yardımcı olacaktır. T-test. Diğer seçenekler gibi T-test, R'de t.test() işlevi kullanılarak tek örnekli bir t testi gerçekleştirilir:


Soru: Bu ortalamalar istatistiksel olarak farklı mıdır? Kullanarak hiçbir fark olmadığı hipotezini kontrol edelim. T-test:

Peki böyle durumlarda müdahalenin etkisinin varlığını istatistiksel olarak nasıl değerlendirebiliriz? Genel olarak, Öğrenci t-testi şu şekilde temsil edilebilir:

Eşleştirilmiş Öğrenci t-testi, eşleştirilmiş (tekrarlanan) ölçümlerdeki farklılıkların istatistiksel önemini belirlemek için kullanılan Öğrenci yönteminin modifikasyonlarından biridir.

1. T-testinin gelişim tarihi

t-testi geliştirildi William Gossett Guinness şirketindeki biranın kalitesini değerlendirmek için. Ticari sırların ifşa edilmemesi konusunda şirkete karşı yükümlülükler nedeniyle Gosset'in makalesi 1908 yılında Biometrics dergisinde "Öğrenci" takma adıyla yayınlandı.

2. Eşleştirilmiş Öğrenci t testi ne için kullanılır?

Karşılaştırma için Eşleştirilmiş Öğrenci t testi kullanılır iki bağımlı (eşleştirilmiş) örnek. Aynı hastalarda ancak farklı zamanlarda alınan ölçümler bağımlıdır; örneğin hipertansiyonlu hastalarda kan basıncı önce ve sonra antihipertansif ilaç almak. Sıfır hipotezi, karşılaştırılan örnekler arasında hiçbir fark olmadığını, alternatif hipotez ise istatistiksel olarak anlamlı farkların olduğunu belirtir.

3. Eşleştirilmiş Öğrenci t-testini hangi durumlarda kullanabilirsiniz?

Ana koşul: örnek bağımlılığı yani karşılaştırılan değerlerin bir parametrenin tekrarlanan ölçümlerinden elde edilmesi gerekir.

Bağımsız örneklerin karşılaştırılması durumunda olduğu gibi, eşleştirilmiş bir t-testi kullanmak için orijinal verilerin normal dağılım. Bu koşul karşılanmazsa numune ortalamalarını karşılaştırmak için yöntemler kullanılmalıdır. parametrik olmayan istatistikler, örneğin G işareti testi Ve Wilcoxon T testi.

Eşleştirilmiş t testi yalnızca karşılaştırma yaparken kullanılabilir ikiörnekler. Karşılaştırmanız gerekirse üç veya daha fazla tekrarlanan ölçümler kullanılmalıdır Tekrarlanan ölçümler için tek yönlü ANOVA.

4. Eşleştirilmiş Öğrenci t testi nasıl hesaplanır?

Eşleştirilmiş Öğrenci t testi aşağıdaki formül kullanılarak hesaplanır:

Nerede MD - öncesi ve sonrası ölçülen göstergeler arasındaki farkların aritmetik ortalaması, σd - göstergelerdeki farklılıkların standart sapması, N - konu sayısı.

5. Öğrenci t-testi değeri nasıl yorumlanır?

Ortaya çıkan eşleştirilmiş Öğrenci t-testi değerinin yorumlanması, ilgisiz popülasyonlar için t-testinin değerlendirilmesinden farklı değildir. Öncelikle serbestlik derecesinin sayısını bulmanız gerekir. F aşağıdaki formüle göre:

f = n - 1

Bundan sonra gerekli anlamlılık düzeyi için Öğrenci t-testinin kritik değerini belirliyoruz (örneğin, p<0,05) и при данном числе степеней свободы F tabloya göre ( aşağıya bakın).

Kriterin kritik ve hesaplanan değerlerini karşılaştırıyoruz:

  • Eşleştirilmiş Öğrenci t-testinin hesaplanan değeri eşit veya daha büyük kritik, tablodan bulduğumuz, karşılaştırılan değerler arasındaki farkların istatistiksel olarak anlamlı olduğu sonucuna varıyoruz.
  • Hesaplanan eşleştirilmiş Öğrenci t-testinin değeri az tablo halinde, yani karşılaştırılan değerler arasındaki farklar istatistiksel olarak anlamlı değildir.

6. Öğrenci t-testini hesaplama örneği

Yeni hipoglisemik ilacın etkinliğini değerlendirmek için, diyabetli hastalarda ilacı almadan önce ve aldıktan sonra kan şekeri seviyeleri ölçüldü. Sonuç olarak aşağıdaki veriler elde edildi:

Çözüm:

1. Her değer çiftinin farkını hesaplayın ( D):

Hasta N Kan şekeri seviyesi, mmol/l Fark (d)
ilacı almadan önce ilacı aldıktan sonra
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. Aşağıdaki formülü kullanarak farkların aritmetik ortalamasını bulun:

3. Aşağıdaki formülü kullanarak ortalamadan farkların standart sapmasını bulun:

4. Eşleştirilmiş Öğrenci t-testini hesaplayın:

5. Öğrenci t-testi 8.6'nın elde edilen değerini, serbestlik derecesi sayısını içeren tablo değeriyle karşılaştıralım. F 10 - 1 = 9'a eşit olup anlamlılık düzeyi p=0,05 2,262'dir. Elde edilen değer kritik değerden büyük olduğundan, yeni ilacı almadan önce ve aldıktan sonra kan şekeri seviyelerinde istatistiksel olarak anlamlı farklılıklar olduğu sonucuna varıyoruz.



Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!