Güven aralığı denilen şey. Özgül ağırlığın nokta ve aralık tahminleri

FREKANSLAR VE KESİRLER İÇİN GÜVEN ARALIKLARI

© 2008

Ulusal Halk Sağlığı Enstitüsü, Oslo, Norveç

Makalede Wald, Wilson, Clopper - Pearson yöntemleri, açısal dönüşüm ve Agresti - Coull düzeltmeli Wald yöntemi kullanılarak frekanslar ve oranlar için güven aralıklarının hesaplanması açıklanmakta ve tartışılmaktadır. Sunulan materyal, frekanslar ve oranlar için güven aralıklarını hesaplama yöntemleri hakkında genel bilgi sağlar ve dergi okuyucularının yalnızca kendi araştırmalarının sonuçlarını sunarken güven aralıklarını kullanma konusunda değil, aynı zamanda çalışmaya başlamadan önce özel literatürü okuma konusunda da ilgisini çekmeyi amaçlamaktadır. gelecekteki yayınlar hakkında.

Anahtar Kelimeler: güven aralığı, frekans, oran

Önceki yayınlardan biri, nitel verilerin tanımından kısaca bahsetmiş ve popülasyonda incelenen özelliğin ortaya çıkma sıklığını tanımlamak için aralık tahminlerinin nokta tahminine göre tercih edildiğini bildirmiştir. Aslında, araştırma örnek veriler kullanılarak yürütüldüğünden, sonuçların evrene yansıtılmasında örnekleme belirsizliği unsuru bulunmalıdır. Güven aralığı, tahmin edilen parametrenin doğruluğunun bir ölçüsüdür. Doktorlara yönelik temel istatistiklerle ilgili bazı kitapların frekanslara ilişkin güven aralıkları konusunu tamamen göz ardı etmesi ilginçtir. Bu makalede, tekrarlanmama ve temsil edilebilirlik gibi örnek özelliklerin yanı sıra gözlemlerin birbirinden bağımsızlığını ima eden frekanslar için güven aralıklarını hesaplamanın çeşitli yollarına bakacağız. Bu makalede frekans, belirli bir değerin toplamda kaç kez oluştuğunu gösteren mutlak bir sayı olarak değil, çalışılan özelliğin çalışma katılımcılarının hangisinde oluştuğunu belirleyen göreceli bir değer olarak anlaşılmaktadır.

Biyomedikal araştırmalarda en yaygın olarak %95 güven aralıkları kullanılır. Bu güven aralığı, gerçek oranın %95 oranında düştüğü alandır. Yani bir özelliğin popülasyonda ortaya çıkma sıklığının gerçek değerinin %95 güven aralığında olacağını %95 güvenilirlikle söyleyebiliriz.

Tıbbi araştırmacılara yönelik çoğu istatistik kılavuzu, frekans hatasının şu formül kullanılarak hesaplandığını bildirmektedir:

burada p, numunedeki özelliğin ortaya çıkma sıklığıdır (0'dan 1'e kadar değer). Yerli bilimsel makalelerin çoğu, bir örnekte (p) bir özelliğin ortaya çıkma sıklığını ve ayrıca p ± s formundaki hatalarını (hatalarını) gösterir. Bununla birlikte, bir özelliğin popülasyonda ortaya çıkma sıklığı için aşağıdaki değerleri içerecek %95'lik bir güven aralığı sunmak daha uygundur:

önce.

Bazı kılavuzlar, küçük numuneler için, N – 1 serbestlik derecesi için 1,96 değerini t değeriyle değiştirmenizi önerir; burada N, numunedeki gözlemlerin sayısıdır. T değeri, hemen hemen tüm istatistik ders kitaplarında bulunan t-dağılımı tablolarından bulunur. Wald yöntemi için t dağılımının kullanılması, aşağıda tartışılan diğer yöntemlere kıyasla gözle görülür avantajlar sağlamamaktadır ve bu nedenle bazı yazarlar tarafından önerilmemektedir.

Yukarıda frekanslar veya oranlar için güven aralıklarını hesaplamak için sunulan yönteme, Wald ve Wolfowitz'in 1939'da yayınlanmasından sonra yaygın kullanımı başladığı için Abraham Wald'ın (1902–1950) onuruna Wald adı verilmiştir. Ancak yöntemin kendisi 1812'de Pierre Simon Laplace (1749-1827) tarafından önerildi.

Wald yöntemi çok popülerdir ancak uygulanması önemli sorunlarla ilişkilidir. Yöntem, küçük numune boyutları için ve ayrıca bir özelliğin ortaya çıkma sıklığının 0 veya 1 (%0 veya %100) eğiliminde olduğu ve 0 ve 1 frekansları için basitçe imkansız olduğu durumlarda önerilmez. Hatayı hesaplarken kullanılan normal dağılım yaklaşımı, n · p olduğu durumlarda “işe yaramaz”< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Yeni değişken normal dağıldığı için φ değişkeni için %95 güven aralığının alt ve üst sınırları φ-1,96 ve φ+1,96left"> olacaktır.

Küçük örnekler için 1,96 yerine N – 1 serbestlik derecesi yerine t değerinin kullanılması tavsiye edilir. Bu yöntem negatif değerler üretmez ve frekanslar için güven aralıklarının Wald yöntemine göre daha doğru tahmin edilmesine olanak sağlar. Ek olarak, tıbbi istatistiklerle ilgili birçok yerli referans kitabında anlatılmaktadır, ancak bu, tıbbi araştırmalarda yaygın kullanımına yol açmamıştır. 0 veya 1'e yaklaşan frekanslar için açısal dönüşüm kullanılarak güven aralıklarının hesaplanması önerilmez.

Tıp araştırmacıları için istatistiğin temelleri hakkındaki kitapların çoğunda güven aralıklarını tahmin etmeye yönelik yöntemlerin tanımı genellikle burada sona ermektedir ve bu sorun yalnızca yerli literatür için değil aynı zamanda yabancı literatür için de tipiktir. Her iki yöntem de büyük bir örneklem anlamına gelen merkezi limit teoremine dayanmaktadır.

Yukarıdaki yöntemleri kullanarak güven aralıklarını tahmin etmenin eksikliklerini hesaba katarak, Clopper ve Pearson 1934'te incelenen özelliğin binom dağılımı göz önüne alındığında tam güven aralığını hesaplamak için bir yöntem önerdiler. Bu yöntem birçok çevrimiçi hesap makinesinde mevcuttur, ancak bu şekilde elde edilen güven aralıkları çoğu durumda çok geniştir. Aynı zamanda konservatif bir değerlendirmenin gerekli olduğu durumlarda bu yöntemin kullanılması tavsiye edilir. Örneklem boyutu azaldıkça, özellikle N olduğunda, yöntemin muhafazakarlık derecesi artar.< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Birçok istatistikçiye göre, frekanslar için güven aralıklarının en uygun değerlendirmesi, 1927'de önerilen, ancak pratik olarak yerli biyomedikal araştırmalarda kullanılmayan Wilson yöntemiyle gerçekleştirilir. Bu yöntem hem çok küçük hem de çok büyük frekanslar için güven aralıklarının tahmin edilmesine olanak sağlamakla kalmaz, aynı zamanda az sayıda gözlem için de uygulanabilir. Genel olarak Wilson formülüne göre güven aralığı şu şekildedir:



%95 güven aralığı hesaplanırken 1,96 değerini alır, N gözlem sayısını, p ise özelliğin örneklemde ortaya çıkma sıklığını gösterir. Bu yöntem çevrimiçi hesap makinelerinde mevcuttur, dolayısıyla kullanımı sorunlu değildir. ve bu yöntemin n p için kullanılmasını önermiyoruz.< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Wilson yöntemine ek olarak, Agresti-Coll düzeltmeli Wald yönteminin de frekanslar için güven aralığının optimal tahminini sağladığına inanılmaktadır. Agresti-Coll düzeltmesi, paya hangi 2'nin ve paydaya 4'ün eklendiğini hesaplarken Wald formülünde bir numunedeki (p) bir özelliğin ortaya çıkma sıklığının p` ile değiştirilmesidir; yani, p` = (X + 2) / (N + 4), burada X, çalışılan özelliğe sahip çalışma katılımcılarının sayısıdır ve N, örneklem büyüklüğüdür. Bu değişiklik, olay sıklığının %0 veya %100'e yaklaşması ve numunenin küçük olması haricinde Wilson formülüne çok benzer sonuçlar üretir. Frekanslar için güven aralıklarının hesaplanmasına yönelik yukarıdaki yöntemlere ek olarak, küçük örnekler için hem Wald hem de Wilson yöntemleri için süreklilik düzeltmeleri önerilmiştir, ancak çalışmalar bunların kullanımının uygun olmadığını göstermiştir.

İki örnek kullanarak güven aralıklarını hesaplamak için yukarıdaki yöntemlerin uygulanmasını ele alalım. İlk durumda, rastgele seçilmiş 1.000 çalışma katılımcısından oluşan geniş bir örneklem üzerinde çalışıyoruz; bunların 450'si, 0,45 veya 45 frekansını temsil eden, incelenen özelliğe (bu bir risk faktörü, bir sonuç veya başka bir özellik olabilir) sahiptir. %. İkinci durumda, çalışma küçük bir örneklem, örneğin sadece 20 kişi kullanılarak gerçekleştirilir ve yalnızca 1 katılımcı (%5) incelenen özelliğe sahiptir. Wald yöntemini, Agresti-Coll düzeltmeli Wald yöntemini ve Wilson yöntemini kullanan güven aralıkları, Jeff Sauro (http://www. /wald. htm) tarafından geliştirilen çevrimiçi bir hesap makinesi kullanılarak hesaplandı. Wilson'ın sürekliliği düzeltilmiş güven aralıkları, Wassar Stats: Web Sitesi for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html) tarafından sağlanan hesap makinesi kullanılarak hesaplandı. Açısal Fisher dönüşümü hesaplamaları sırasıyla 19 ve 999 serbestlik derecesi için kritik t değeri kullanılarak manuel olarak yapıldı. Hesaplama sonuçları her iki örnek için tabloda sunulmaktadır.

Metinde anlatılan iki örnek için altı farklı şekilde hesaplanan güven aralıkları

Güven aralığı hesaplama yöntemi

P=0,0500 veya %5

X=450, N=1000, P=0,4500 veya %45 için %95 GA

–0,0455–0,2541

Agresti-Coll düzeltmeli Wald

<,0001–0,2541

Süreklilik düzeltmeli Wilson

Clopper – Pearson "kesin yöntem"

Açısal dönüşüm

<0,0001–0,1967

Tablodan da görüleceği üzere ilk örnekte “genel kabul görmüş” Wald yöntemi kullanılarak hesaplanan güven aralığı negatif bölgeye girmektedir ki bu durum frekanslarda söz konusu olamamaktadır. Ne yazık ki bu tür olaylar Rus edebiyatında nadir değildir. Verileri frekans ve hata açısından sunmanın geleneksel yolu bu sorunu kısmen maskelemektedir. Örneğin, bir özelliğin ortaya çıkma sıklığı (yüzde olarak) 2,1 ± 1,4 olarak sunulursa bu, %2,1 (%95 GA: –0,7; 4,9) kadar "göze rahatsız edici" değildir, ancak ve şu anlama gelir: aynı şey. Agresti-Coll düzeltmeli Wald yöntemi ve açısal dönüşüm kullanılarak yapılan hesaplama, sıfıra yaklaşan bir alt sınır verir. Wilson'ın sürekliliği düzeltilmiş yöntemi ve "kesin yöntem", Wilson'ın yönteminden daha geniş güven aralıkları üretir. İkinci örnek için, tüm yöntemler yaklaşık olarak aynı güven aralıklarını verir (farklar yalnızca binde bir oranında görünür), bu şaşırtıcı değildir, çünkü bu örnekte olayın meydana gelme sıklığı %50'den çok farklı değildir ve örneklem büyüklüğü oldukça büyük.

Bu problemle ilgilenen okuyuculara, güven aralıklarını hesaplamak için sırasıyla 7 ve 10 farklı yöntem kullanmanın artılarını ve eksilerini sunan R. G. Newcombe ve Brown, Cai ve Dasgupta'nın çalışmalarını önerebiliriz. Yerli kılavuzlar arasında, teorinin ayrıntılı bir açıklamasına ek olarak Wald ve Wilson'ın yöntemlerini ve ayrıca binom frekans dağılımını dikkate alarak güven aralıklarını hesaplamaya yönelik bir yöntemi sunan kitabı öneriyoruz. Ücretsiz çevrimiçi hesaplayıcılara ek olarak (http://www. /wald.htm ve http://faculty.vassar.edu/lowry/prop1.html), frekanslar için güven aralıkları (ve sadece değil!) aşağıdakiler kullanılarak hesaplanabilir: http://www.CIA programı (Güven Aralıkları Analizi) indirilebilir. tıp fakültesi. Soton. AC. İngiltere/cia/ .

Bir sonraki makale niteliksel verileri karşılaştırmanın tek değişkenli yollarını inceleyecek.

Kaynakça

Banerji A. Anlaşılır bir dille tıbbi istatistikler: giriş kursu / A. Banerjee. – M.: Pratik Tıp, 2007. – 287 s. Tıbbi istatistikler / . – M.: Tıbbi Bilgi Ajansı, 2007. – 475 s. Glanz S. Tıbbi ve biyolojik istatistikler / S. Glanz. – M.: Praktika, 1998. Veri türleri, dağıtım testi ve tanımlayıcı istatistikler // İnsan Ekolojisi – 2008. – No. 1. – S. 52–58. Zhizhin K.S.. Tıbbi istatistikler: ders kitabı / . – Rostov tarih: Phoenix, 2007. – 160 s. Uygulamalı tıbbi istatistikler / , . – St.Petersburg. : Foliot, 2003. – 428 s. Lakin G.F.. Biyometri / . – M.: Yüksekokul, 1990. – 350 s. Doktor V.A. Tıpta matematiksel istatistik / , . – M.: Finans ve İstatistik, 2007. – 798 s. Klinik araştırmalarda matematiksel istatistik / , . – M.: GEOTAR-MED, 2001. – 256 s. Junkerov V. VE. Tıbbi araştırma verilerinin tıbbi ve istatistiksel işlenmesi / , . – St.Petersburg. : VmedA, 2002. – 266 s. Agresti A. Binom oranlarının aralık tahmini için yaklaşık, kesinden daha iyidir / A. Agresti, B. Coull // Amerikalı istatistikçi. – 1998. – N 52. – S. 119–126. Altman D. Güvenle istatistikler // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – Londra: BMJ Books, 2000. – 240 s. Kahverengi L.D. Binom oranı için aralık tahmini / L. D. Brown, T. T. Cai, A. Dasgupta // İstatistik bilimi. – 2001. – N 2. – S. 101–133. Clopper C.J. Binom durumunda gösterilen güven veya güven sınırlarının kullanımı / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – S. 404–413. Garcia-Perez MA. Binom parametresi için güven aralığında / M. A. Garcia-Perez // Nitelik ve nicelik. – 2005. – N 39. – S. 467–481. Motulsky H. Sezgisel biyoistatistik // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 s. Newcombe R.G. Tek Oran İçin İki Taraflı Güven Aralıkları: Yedi Yöntemin Karşılaştırılması / R. G. Newcombe // Tıpta İstatistik. – 1998. – N. 17. – S. 857–872. Sauro J. Binom güven aralıklarını kullanarak küçük örneklerden tamamlanma oranlarının tahmin edilmesi: karşılaştırmalar ve öneriler / J. Sauro, J. R. Lewis // İnsan faktörleri ve ergonomi derneği yıllık toplantısı tutanakları. – Orlando, Florida, 2005. Wald A. Sürekli dağıtım fonksiyonları için güven sınırları // A. Wald, J. Wolfovitz // Annals of Mathematical İstatistik. – 1939. – N 10. – S. 105–118. Wilson EB. Olası çıkarım, ardıllık yasası ve istatistiksel çıkarım / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – S. 209–212.

ORANLAR İÇİN GÜVEN ARALIKLARI

A. M. Grjibovski

Ulusal Halk Sağlığı Enstitüsü, Oslo, Norveç

Makale, binom oranları için güven aralıklarının hesaplanmasına yönelik Wald, Wilson, arcsine, Agresti-Coull ve kesin Clopper-Pearson yöntemleri gibi çeşitli yöntemler sunmaktadır. Bu makale, binom oranının güven aralığı tahmini sorununa yalnızca genel bir giriş sunmaktadır ve amacı, okuyucuları yalnızca kendi ampirik araştırmalarının sonuçlarını sunarken güven aralıklarını kullanmaya teşvik etmek değil, aynı zamanda onları istatistik kitaplarına başvurmaya teşvik etmektir. Kendi verilerini analiz etmeden ve taslakları hazırlamadan önce.

Anahtar kelimeler: güven aralığı, oran

İletişim bilgileri:

Kıdemli Danışman, Ulusal Halk Sağlığı Enstitüsü, Oslo, Norveç

Güvenilirlik aralığı ( İngilizce Güvenilirlik aralığı) istatistiklerde kullanılan ve belirli bir önem düzeyi için hesaplanan aralık tahmin türlerinden biri. Nüfusun bilinmeyen bir istatistiksel parametresinin gerçek değerinin, seçilen istatistiksel anlamlılık düzeyine göre belirlenen olasılıkla elde edilen değerler aralığında olduğu açıklamasını yapmamıza izin veriyorlar.

Normal dağılım

Veri popülasyonunun varyansı (σ 2) bilindiğinde, z-puanı güven sınırlarını (güven aralığının bitiş noktaları) hesaplamak için kullanılabilir. T dağılımını kullanmakla karşılaştırıldığında, z-puanını kullanmak yalnızca daha dar bir güven aralığı oluşturmanıza değil, aynı zamanda z-puanı bir temele dayalı olduğundan beklenen değer ve standart sapmaya (σ) ilişkin daha güvenilir tahminler oluşturmanıza da olanak tanır. normal dağılım.

Formül

Veri popülasyonunun standart sapmasının bilinmesi koşuluyla, güven aralığının sınır noktalarını belirlemek için aşağıdaki formül kullanılır:

L = X - Zα/2 σ
√n

Örnek

Örnek büyüklüğünün 25 gözlem, örneğin beklenen değerinin 15 ve popülasyon standart sapmasının 8 olduğunu varsayalım. α=%5 anlamlılık düzeyi için Z-skoru Z α/2 =1,96'dır. Bu durumda güven aralığının alt ve üst sınırları şu şekilde olacaktır:

U = 15 - 1,96 8 = 11,864
√25
U = 15 + 1,96 8 = 18,136
√25

Böylece nüfusun matematiksel beklentisinin %95 olasılıkla 11.864 ila 18.136 aralığına düşeceğini söyleyebiliriz.

Güven aralığını daraltma yöntemleri

Aralığın çalışmamızın amaçları açısından çok geniş olduğunu varsayalım. Güven aralığı aralığını azaltmanın iki yolu vardır.

  1. İstatistiksel anlamlılık düzeyini azaltın α.
  2. Örnek boyutunu artırın.

İstatistiksel anlamlılık düzeyini α=%10'a düşürerek Z α/2 =1,64'e eşit bir Z-puanı elde ederiz. Bu durumda aralığın alt ve üst sınırları şu şekilde olacaktır:

U = 15 - 1,64 8 = 12,376
√25
U = 15 + 1,64 8 = 17,624
√25

Ve güven aralığının kendisi şu şekilde yazılabilir:

Bu durumda popülasyonun matematiksel beklentisinin %90 olasılıkla aralığına düşeceğini varsayabiliriz.

İstatistiksel anlamlılık düzeyini (α) düşürmemek istiyorsak tek alternatif örneklem büyüklüğünü arttırmaktır. Bunu 144 gözleme çıkararak aşağıdaki güven limiti değerlerini elde ediyoruz

U = 15 - 1,96 8 = 13,693
√144
U = 15 + 1,96 8 = 16,307
√144

Güven aralığının kendisi aşağıdaki forma sahip olacaktır

Dolayısıyla istatistiksel anlamlılık düzeyini düşürmeden güven aralığını daraltmak ancak örneklem büyüklüğünün arttırılmasıyla mümkündür. Örneklem boyutunun arttırılması mümkün değilse, güven aralığının daraltılması yalnızca istatistiksel anlamlılık düzeyinin azaltılmasıyla sağlanabilir.

Normalin dışındaki bir dağılım için güven aralığı oluşturma

Popülasyonun standart sapması bilinmiyorsa veya dağılım normalden farklıysa, bir güven aralığı oluşturmak için t dağılımı kullanılır. Bu teknik, Z-skoruna dayalı tekniğe kıyasla daha muhafazakardır ve bu da daha geniş güven aralıklarına yansır.

Formül

T dağılımına göre güven aralığının alt ve üst sınırlarını hesaplamak için aşağıdaki formülleri kullanın

L = X - tα σ
√n

Öğrenci dağılımı veya t-dağılımı yalnızca bir parametreye bağlıdır - özelliğin bireysel değerlerinin sayısına (örnekteki gözlemlerin sayısı) eşit olan serbestlik derecesinin sayısı. Belirli bir serbestlik derecesi (n) sayısı için Öğrenci t-testinin değeri ve istatistiksel anlamlılık düzeyi α, referans tablolarında bulunabilir.

Örnek

Örnek büyüklüğünün 25 bireysel değer, örneklem beklenen değerinin 50 ve örneklem standart sapmasının 28 olduğunu varsayalım. İstatistiksel anlamlılık düzeyi α=%5 için bir güven aralığı oluşturmak gereklidir.

Bizim durumumuzda serbestlik derecesi sayısı 24'tür (25-1), dolayısıyla α=%5 istatistiksel anlamlılık düzeyi için Öğrenci t-testinin karşılık gelen tablo değeri 2,064'tür. Bu nedenle güven aralığının alt ve üst sınırları şu şekilde olacaktır:

L = 50 - 2,064 28 = 38,442
√25
U = 50 + 2,064 28 = 61,558
√25

Ve aralığın kendisi şu şekilde yazılabilir:

Yani %95 olasılıkla nüfusun matematiksel beklentisinin aralığında olacağını söyleyebiliriz.

T dağılımını kullanmak, istatistiksel anlamlılığı azaltarak veya örneklem boyutunu artırarak güven aralığını daraltmanıza olanak tanır.

Örneğimizin koşullarında istatistiksel anlamlılığı %95'ten %90'a düşürerek, Öğrenci t-testinin karşılık gelen tablo değeri olan 1,711'i elde ederiz.

U = 50 - 1,711 28 = 40,418
√25
U = 50 + 1,711 28 = 59,582
√25

Bu durumda popülasyonun matematiksel beklentisinin %90 olasılıkla aralığında olacağını söyleyebiliriz.

İstatistiksel anlamlılığı azaltmak istemiyorsak tek alternatif örneklem büyüklüğünü arttırmaktır. Örneğin orijinal halindeki gibi 25 değil de 64 bireysel gözlem olduğunu varsayalım. 63 serbestlik derecesi (64-1) ve istatistiksel anlamlılık düzeyi α=%5 için Öğrenci t-testinin tablo değeri 1,998'dir.

U = 50 - 1,998 28 = 43,007
√64
U = 50 + 1,998 28 = 56,993
√64

Bu bize nüfusun matematiksel beklentisinin %95 olasılıkla aralıkta olacağını söylememize olanak sağlar.

Büyük örnekler

Büyük örnekler, bireysel gözlem sayısının 100'ü aştığı bir veri popülasyonundan alınan örneklerdir. İstatistiksel çalışmalar, popülasyonun dağılımı normal olmasa bile daha büyük örneklerin normal dağılma eğiliminde olduğunu göstermiştir. Ek olarak, bu tür örnekler için z-puanı ve t-dağılımı kullanımı, güven aralıkları oluşturulurken yaklaşık olarak aynı sonuçları verir. Bu nedenle, büyük örnekler için normal dağılım için t dağılımı yerine z puanının kullanılması kabul edilebilir.

Özetleyelim

Güvenilirlik aralığı.

Güven aralığının hesaplanması, ilgili parametrenin ortalama hatasına dayanır. Güven aralığı tahmin edilen parametrenin gerçek değerinin olasılık (1-a) ile hangi sınırlar dahilinde olduğunu gösterir. Burada a anlamlılık düzeyidir, (1-a) ise güven olasılığı olarak da adlandırılır.

İlk bölümde, örneğin aritmetik ortalama için gerçek popülasyon ortalamasının vakaların yaklaşık %95'inde ortalamanın 2 standart hatası dahilinde olduğunu gösterdik. Böylece ortalama için %95 güven aralığının sınırları, örnek ortalamasından ortalamanın ortalama hatasının iki katı kadar ayrılacaktır; ortalamanın ortalama hatasını güven düzeyine bağlı olarak belirli bir katsayı ile çarpıyoruz. Ortalama ve ortalamaların farkı için Öğrenci katsayısı (Student testinin kritik değeri), payların payı ve farkı için z kriterinin kritik değeri alınır. Katsayı ve ortalama hatanın çarpımı, belirli bir parametrenin maksimum hatası olarak adlandırılabilir, yani. değerlendirirken elde edebileceğimiz maksimum değer.

için güven aralığı aritmetik ortalama : .

İşte örnek ortalama;

Aritmetik ortalamanın ortalama hatası;

S - Numune standart sapması;

N

f = n-1 (Öğrenci katsayısı).

için güven aralığı aritmetik ortalamaların farklılıkları :

Örnek ortalamalar arasındaki fark şudur;

- aritmetik ortalamalar arasındaki farkın ortalama hatası;

s 1 , s 2 –örnek standart sapmalar;

n1,n2

Belirli bir anlamlılık düzeyi a için Öğrenci testinin kritik değeri ve serbestlik derecesi sayısı f=n 1 +n 2-2 (Öğrenci katsayısı).

için güven aralığı hisseler :

.

Burada d örnek kesirdir;

– ortalama kesir hatası;

N– örneklem büyüklüğü (grup büyüklüğü);

için güven aralığı hisse farkı :

İşte örnek paylaşımlardaki fark;

– aritmetik ortalamalar arasındaki farkın ortalama hatası;

n1,n2– numune boyutları (grup sayısı);

Belirli bir anlamlılık düzeyinde z kriterinin kritik değeri a ( , , ).

Göstergeler arasındaki fark için güven aralıklarını hesaplayarak öncelikle etkinin sadece nokta tahminini değil, olası değerlerini de doğrudan görüyoruz. İkinci olarak sıfır hipotezinin kabulü veya reddi hakkında bir sonuca varabiliriz ve üçüncü olarak testin gücü hakkında bir sonuca varabiliriz.

Güven aralıklarını kullanarak hipotezleri test ederken aşağıdaki kurala uymanız gerekir:

Ortalamalardaki farkın yüzde 100(1-a) güven aralığı sıfır içermiyorsa, bu durumda farklar a anlamlılık düzeyinde istatistiksel olarak anlamlıdır; tam tersine, eğer bu aralık sıfır içeriyorsa, o zaman farklar istatistiksel olarak anlamlı değildir.

Aslında, eğer bu aralık sıfır içeriyorsa, bu, karşılaştırılan göstergenin gruplardan birinde diğerine göre daha büyük veya daha az olabileceği anlamına gelir; gözlenen farklılıklar tesadüften kaynaklanmaktadır.

Testin gücü, güven aralığı içindeki sıfırın konumuna göre değerlendirilebilir. Sıfır, aralığın alt veya üst sınırına yakınsa, daha fazla sayıda grubun karşılaştırılmasıyla farklılıkların istatistiksel anlamlılığa ulaşması mümkündür. Sıfır aralığın ortasına yakınsa, bu, deney grubundaki göstergede hem artış hem de azalmanın eşit derecede muhtemel olduğu ve muhtemelen gerçekten hiçbir fark olmadığı anlamına gelir.

Örnekler:

İki farklı anestezi türü kullanıldığında cerrahi mortaliteyi karşılaştırmak için: Birinci tür anesteziyle 61 kişi ameliyat edildi, 8 kişi öldü, ikinci tür anesteziyle 67 kişi, 10 kişi öldü.

d1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Karşılaştırılan yöntemlerin öldürücülük farkı, 100(1-a) = %95 olasılıkla (-0,018 - 0,122; -0,018 + 0,122) veya (-0,14; 0,104) aralığında olacaktır. Aralık sıfır içerir, yani. iki farklı anestezi tipinde mortalitenin eşit olduğu hipotezi reddedilemez.

Böylece ölüm oranı yüzde 14'e düşebilir ve düşecek ve yüzde 95 olasılıkla yüzde 10,4'e yükselecek, yani. sıfır yaklaşık olarak aralığın ortasındadır, bu nedenle büyük olasılıkla bu iki yöntemin öldürücülük açısından gerçekten farklı olmadığı iddia edilebilir.

Daha önce tartışılan örnekte, dokunma testi sırasındaki ortalama basma süresi, sınav puanları farklı olan dört öğrenci grubunda karşılaştırıldı. Sınavı 2. ve 5. notla geçen öğrencilerin ortalama pres süresine ilişkin güven aralıklarını ve bu ortalamalar arasındaki farka ilişkin güven aralığını hesaplayalım.

Öğrenci katsayıları Öğrenci dağılım tabloları kullanılarak bulunur (eklere bakınız): birinci grup için: = t(0,05;48) = 2,011; ikinci grup için: = t(0,05;61) = 2,000. Böylece birinci grup için güven aralıkları: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), ikinci grup için (156,55- 2,000*1,88 ; 156,55+2,000*1,88) = (152,8) 160.3). Yani sınavı 2 ile geçenler için ortalama basma süresi %95 olasılıkla 157,8 ms ile 166,6 ms arasında değişirken, 5 ile sınavı geçenler için %95 olasılıkla 152,8 ms ile 160,3 ms arasında değişmektedir. .

Sıfır hipotezini yalnızca ortalamalar arasındaki fark için değil, ortalamalar için de güven aralıklarını kullanarak test edebilirsiniz. Örneğin bizim durumumuzda olduğu gibi ortalamaların güven aralıkları örtüşüyorsa sıfır hipotezi reddedilemez. Seçilen bir anlamlılık düzeyinde bir hipotezi reddetmek için karşılık gelen güven aralıklarının çakışmaması gerekir.

Sınavı 2. ve 5. notla geçen grupların ortalama pres süresi farkının güven aralığını bulalım. Ortalamalar farkı: 162,19 – 156,55 = 5,64. Öğrenci katsayısı: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Grup standart sapmaları şuna eşit olacaktır: ; . Ortalamalar arasındaki farkın ortalama hatasını hesaplıyoruz: . Güven aralığı: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Yani sınavı 2 ve 5 ile geçen gruplarda ortalama presleme süresi farkı -0,044 ms ile 11,33 ms aralığında olacaktır. Bu aralık sıfırı içerir, yani. Sınavı iyi geçenlerin ortalama presleme süresi, sınavı yetersiz geçenlere göre artabilir veya azalabilir. sıfır hipotezi reddedilemez. Ama sıfır alt limite çok yakın ve iyi geçenler için pres süresinin azalma ihtimali çok daha fazla. Dolayısıyla 2 ile 5'i geçenler arasında ortalama pres süresi açısından hala farklar olduğu, ancak ortalama sürenin değişimi, ortalama sürenin yayılımı ve örneklem büyüklükleri göz önüne alındığında bunları tespit edemediğimiz sonucuna varabiliriz.



Bir testin gücü, yanlış bir sıfır hipotezini reddetme olasılığıdır; farklılıkları gerçekte var oldukları yerde bulun.

Testin gücü, anlamlılık düzeyine, gruplar arasındaki farkların büyüklüğüne, değerlerin gruplardaki yayılımına ve örneklem büyüklüğüne göre belirlenir.

Öğrenci t testi ve varyans analizi için duyarlılık diyagramları kullanılabilir.

Kriterin gücü, gerekli grup sayısını ön olarak belirlemek için kullanılabilir.

Güven aralığı, tahmin edilen parametrenin gerçek değerinin belirli bir olasılıkla hangi sınırlar içinde bulunduğunu gösterir.

Güven aralıklarını kullanarak istatistiksel hipotezleri test edebilir ve kriterlerin duyarlılığı hakkında sonuçlar çıkarabilirsiniz.

EDEBİYAT.

Glanz S. – Bölüm 6,7.

Rebrova O.Yu. – s.112-114, s.171-173, s.234-238.

Sidorenko E.V. – s.32-33.

Öğrencilerin kendilerini test etmeleri için sorular.

1. Kriterin gücü nedir?

2. Kriterlerin gücünün değerlendirilmesi hangi durumlarda gereklidir?

3. Gücü hesaplama yöntemleri.

6. Bir istatistiksel hipotez güven aralığı kullanılarak nasıl test edilir?

7. Güven aralığı hesaplanırken kriterin gücü hakkında ne söylenebilir?

Görevler.

Çoğu zaman değerleme uzmanı, değerlendirilen mülkün bulunduğu segmentin emlak piyasasını analiz etmek zorundadır. Pazar gelişmişse, sunulan nesnelerin tamamını analiz etmek zor olabilir, bu nedenle analiz için bir nesne örneği kullanılır. Bu numune her zaman homojen çıkmayabilir; bazen aşırı noktalardan (çok yüksek veya çok düşük piyasa teklifleri) arındırmak gerekebilir. Bu amaçla kullanılır güven aralığı. Bu çalışmanın amacı, güven aralığını hesaplamak için iki yöntemin karşılaştırmalı analizini yapmak ve estimatica.pro sisteminde farklı örneklerle çalışırken en uygun hesaplama seçeneğini seçmektir.

Güven aralığı, bilinen bir olasılıkla genel popülasyonun tahmini parametresini içeren bir örnek temelinde hesaplanan bir nitelik değerleri aralığıdır.

Bir güven aralığı hesaplamanın amacı, tahmin edilen parametrenin değerinin bu aralıkta olduğunun belirli bir olasılıkla ifade edilebilmesi için örnek verilere dayalı böyle bir aralık oluşturmaktır. Başka bir deyişle güven aralığı, tahmin edilen değerin belirli bir olasılıkla bilinmeyen değerini içerir. Aralık ne kadar geniş olursa, yanlışlık da o kadar yüksek olur.

Güven aralığını belirlemek için farklı yöntemler vardır. Bu yazıda 2 yönteme bakacağız:

  • medyan ve standart sapma yoluyla;
  • t-istatistiklerinin kritik değeri (Öğrenci katsayısı) aracılığıyla.

CI'yi hesaplamak için farklı yöntemlerin karşılaştırmalı analizinin aşamaları:

1. bir veri örneği oluşturun;

2. istatistiksel yöntemler kullanarak işleriz: ortalama değeri, medyanı, varyansı vb. hesaplarız;

3. Güven aralığını iki şekilde hesaplayabilecektir;

4. Temizlenmiş numuneleri ve ortaya çıkan güven aralıklarını analiz edebilecektir.

Aşama 1. Veri örneklemesi

Örnek estimatica.pro sistemi kullanılarak oluşturuldu. Örnek, 3. fiyat bölgesinde "Kruşçev" tipi yerleşim planına sahip 1 odalı dairelerin satışına yönelik 91 teklifi içeriyordu.

Tablo 1. Başlangıç ​​örneği

Fiyat 1 m2, adet

Şekil 1. İlk örnek



Aşama 2. İlk numunenin işlenmesi

Bir numunenin istatistiksel yöntemler kullanılarak işlenmesi aşağıdaki değerlerin hesaplanmasını gerektirir:

1. Aritmetik ortalama

2. Medyan - numuneyi karakterize eden bir sayı: numune elemanlarının tam olarak yarısı medyandan büyük, diğer yarısı medyandan küçük

(tek sayıda değere sahip bir örnek için)

3. Aralık - numunedeki maksimum ve minimum değerler arasındaki fark

4. Varyans – verilerin varyasyonunu daha doğru bir şekilde tahmin etmek için kullanılır

5. Örnek standart sapma (bundan sonra - SD), ayar değerlerinin aritmetik ortalama etrafındaki dağılımının en yaygın göstergesidir.

6. Değişim katsayısı - ayarlama değerlerinin dağılım derecesini yansıtır

7. salınım katsayısı - numunedeki aşırı fiyat değerlerinin ortalama etrafındaki göreceli dalgalanmasını yansıtır

Tablo 2. Orijinal örneklemin istatistiksel göstergeleri

Verilerin homojenliğini karakterize eden varyasyon katsayısı %12,29'dur ancak salınım katsayısı çok yüksektir. Dolayısıyla orijinal numunenin homojen olmadığını söyleyebiliriz, o yüzden güven aralığını hesaplamaya geçelim.

Aşama 3. Güven aralığı hesaplaması

Yöntem 1. Medyan ve standart sapmayı kullanarak hesaplama.

Güven aralığı şu şekilde belirlenir: minimum değer - standart sapma medyandan çıkarılır; maksimum değer - ortalamaya standart sapma eklenir.

Böylece güven aralığı (47179 CU; 60689 CU)

Pirinç. 2. Güven aralığına giren değerler 1.



Yöntem 2. T-istatistiklerinin kritik değerini (Öğrenci katsayısı) kullanarak bir güven aralığı oluşturmak

S.V. Gribovsky, “Özellik Değerini Tahmin Etmek için Matematiksel Yöntemler” adlı kitabında Öğrenci katsayısını kullanarak güven aralığını hesaplamak için bir yöntem anlatıyor. Bu yöntemi kullanarak hesaplama yaparken tahmincinin, güven aralığının oluşturulma olasılığını belirleyen önem düzeyini (∝) kendisinin ayarlaması gerekir. Tipik olarak 0,1'lik anlamlılık düzeyleri kullanılır; 0,05 ve 0,01. 0,9'luk güven olasılıklarına karşılık gelirler; 0,95 ve 0,99. Bu yöntemle, matematiksel beklenti ve varyansın gerçek değerlerinin pratikte bilinmediği varsayılır (bu, pratik tahmin problemlerini çözerken neredeyse her zaman doğrudur).

Güven aralığı formülü:

n - örneklem büyüklüğü;

T-istatistiklerinin kritik değeri (Öğrenci dağılımı), anlamlılık seviyesi ∝ ile, özel istatistiksel tablolardan veya MS Excel kullanılarak belirlenen serbestlik derecesi sayısı n-1 ( → "İstatistik" → STUDRIST);

∝ - anlamlılık düzeyi, ∝=0,01 alın.

Pirinç. 2. Güven aralığına giren değerler 2.

Aşama 4. Güven aralığını hesaplamak için farklı yöntemlerin analizi

Güven aralığını hesaplamanın iki yöntemi - medyan ve Öğrenci katsayısı aracılığıyla - aralıkların farklı değerlerine yol açtı. Buna göre iki farklı temizlenmiş numune elde ettik.

Tablo 3. Üç örnek için istatistikler.

Dizin

İlk örnek

1 seçenek

seçenek 2

Ortalama değer

Dağılım

Katsayı. varyasyonlar

Katsayı. salınımlar

Kullanımdan kaldırılan nesnelerin sayısı, adet.

Yapılan hesaplamalara dayanarak farklı yöntemlerle elde edilen güven aralığı değerlerinin kesiştiğini söyleyebiliriz, dolayısıyla değerleme uzmanının takdirine bağlı olarak hesaplama yöntemlerinden herhangi birini kullanabilirsiniz.

Ancak estimatica.pro sisteminde çalışırken, piyasanın gelişim derecesine bağlı olarak güven aralığını hesaplamak için bir yöntem seçmeniz tavsiye edilir:

  • pazar gelişmemişse, bu durumda kullanımdan kaldırılan nesnelerin sayısı az olduğundan, medyan ve standart sapmayı kullanan hesaplama yöntemini kullanın;
  • Piyasa gelişmişse, büyük bir başlangıç ​​örneklemi oluşturmak mümkün olduğundan, hesaplamayı t-istatistiklerinin kritik değeri (Öğrenci katsayısı) aracılığıyla uygulayın.

Makalenin hazırlanmasında aşağıdakiler kullanıldı:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Gayrimenkul değerini belirlemek için matematiksel yöntemler. Moskova, 2014

2. Sistem verileri estimatica.pro

Güven aralığı bize istatistik alanından gelir. Bu, bilinmeyen bir parametreyi yüksek derecede güvenilirlikle tahmin etmeye yarayan belirli bir aralıktır. Bunu açıklamanın en kolay yolu bir örnektir.

Örneğin, sunucunun bir istemci isteğine yanıt verme hızı gibi bazı rastgele değişkenleri incelemeniz gerektiğini varsayalım. Bir kullanıcı belirli bir sitenin adresini her yazdığında, sunucu farklı hızlarda yanıt verir. Bu nedenle, incelenen yanıt süresi rastgeledir. Yani güven aralığı bu parametrenin sınırlarını belirlememizi sağlıyor ve sonrasında %95 olasılıkla sunucunun hesapladığımız aralıkta olacağını söyleyebiliriz.

Veya şirketin ticari markasını kaç kişinin bildiğini öğrenmeniz gerekiyor. Güven aralığı hesaplandığında örneğin %95 olasılıkla bunun farkında olan tüketicilerin payının %27 ila %34 aralığında olduğunu söylemek mümkün olacaktır.

Bu terimle yakından ilgili olan, güven olasılığının değeridir. İstenilen parametrenin güven aralığına dahil olma olasılığını temsil eder. İstediğimiz aralığın ne kadar geniş olacağı bu değere bağlıdır. Aldığı değer büyüdükçe güven aralığı daralır ve bunun tersi de geçerlidir. Tipik olarak %90, %95 veya %99'a ayarlanır. %95 değeri en popüler olanıdır.

Bu gösterge aynı zamanda gözlemlerin dağılımından da etkilenir ve tanımı, incelenen özelliğin uyduğu varsayımına dayanır. Bu ifade aynı zamanda Gauss Yasası olarak da bilinir. Ona göre normal, bir olasılık yoğunluğuyla tanımlanabilen sürekli bir rastgele değişkenin tüm olasılıklarının dağılımıdır. Normal dağılım varsayımı yanlışsa tahmin de yanlış olabilir.

Öncelikle güven aralığının nasıl hesaplanacağını bulalım. Burada iki olası durum vardır. Dağılım (rastgele bir değişkenin yayılma derecesi) bilinebilir veya bilinmeyebilir. Eğer biliniyorsa güven aralığımız aşağıdaki formül kullanılarak hesaplanır:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - işareti,

t - Laplace dağılım tablosundan parametre,

σ varyansın kareköküdür.

Varyans bilinmiyorsa, istenen özelliğin tüm değerlerini biliyorsak hesaplanabilir. Bunun için aşağıdaki formül kullanılır:

σ2 = х2ср - (хср)2, burada

х2ср - incelenen özelliğin karelerinin ortalama değeri,

(хср)2 bu özelliğin karesidir.

Bu durumda güven aralığının hesaplandığı formül biraz değişir:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - örnek ortalama,

α - işareti,

t, Öğrenci dağılım tablosu t = t(ɣ;n-1) kullanılarak bulunan bir parametredir,

sqrt(n) - toplam örneklem boyutunun karekökü,

s varyansın kareköküdür.

Bu örneği düşünün. 7 ölçümün sonuçlarına göre incelenen özelliğin 30'a ve örneklem varyansının 36'ya eşit olduğunun belirlendiğini varsayalım. %99 olasılıkla gerçek değeri içeren bir güven aralığı bulmak gerekir. Ölçülen parametrenin değeri.

Öncelikle t'nin neye eşit olduğunu belirleyelim: t = t (0,99; 7-1) = 3,71. Yukarıdaki formülü kullanarak şunu elde ederiz:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (kare(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Varyansa ilişkin güven aralığı, hem bilinen bir ortalama durumunda hem de matematiksel beklentiye ilişkin veri bulunmadığında hesaplanır ve yalnızca varyansın noktasal tarafsız tahmininin değeri bilinir. Oldukça karmaşık oldukları ve istenirse her zaman internette bulunabilecekleri için burada hesaplamak için formüller vermeyeceğiz.

Sadece güven aralığını Excel veya bu şekilde adlandırılan bir ağ servisini kullanarak belirlemenin uygun olduğunu belirtelim.



Makaleyi beğendin mi? Arkadaşlarınla ​​paylaş!