Bir rastgele değişkenin güven aralığı. Frekanslar ve oranlar için güven aralıkları

Ve diğerleri, bunların hepsi, bir örnek olmasa da genel bir popülasyon mevcut olsaydı elde edilebilecek teorik analoglarının tahminleridir. Ancak ne yazık ki genel nüfus çok pahalı ve çoğu zaman erişilemiyor.

Aralık tahmini kavramı

Herhangi bir örnek tahmininin bir miktar yayılması vardır, çünkü belirli bir örnekteki değerlere bağlı rastgele bir değişkendir. Bu nedenle, daha güvenilir istatistiksel sonuçlar için, yalnızca nokta tahmini değil, aynı zamanda yüksek olasılıklı aralık da bilinmelidir. γ (gama) değerlendirilen göstergeyi kapsar θ (teta).

Resmi olarak bunlar böyle iki değerdir (istatistik) T 1 (X) Ve T 2 (X), Ne T 1< T 2 , bunun için belirli bir olasılık seviyesinde γ koşul yerine getirildi:

Kısacası büyük ihtimalle γ veya daha fazlası gerçek gösterge noktaların arasındadır T 1 (X) Ve T 2 (X) alt ve üst sınırlar olarak adlandırılan güven aralığı.

Güven aralıkları oluşturmanın koşullarından biri maksimum darlığıdır, yani. mümkün olduğu kadar kısa olmalıdır. Arzu oldukça doğal, çünkü... araştırmacı istenen parametrenin konumunu daha doğru bir şekilde lokalize etmeye çalışır.

Buradan güven aralığının dağılımın maksimum olasılıklarını kapsaması gerektiği sonucu çıkar. ve değerlendirmenin kendisi merkezde olmalıdır.

Yani, (gerçek göstergenin tahminden) yukarıya doğru sapma olasılığı aşağı doğru sapma olasılığına eşittir. Asimetrik dağılımlarda sağdaki aralığın soldaki aralığa eşit olmadığını da belirtmek gerekir.

Yukarıdaki şekil, güven olasılığı ne kadar yüksekse aralığın da o kadar geniş olduğunu, doğrudan bir ilişki olduğunu açıkça göstermektedir.

Bu, bilinmeyen parametrelerin aralık tahmini teorisine kısa bir girişti. Matematiksel beklenti için güven sınırlarını bulmaya geçelim.

Matematiksel beklenti için güven aralığı

Orijinal veriler üzerinden dağıtılırsa ortalama normal bir değer olacaktır. Bu, normal değerlerin doğrusal bir kombinasyonunun da normal dağılıma sahip olduğu kuralından kaynaklanır. Bu nedenle olasılıkları hesaplamak için normal dağılım yasasının matematiksel aygıtını kullanabiliriz.

Ancak bu, genellikle bilinmeyen iki parametrenin (beklenti ve varyans) bilinmesini gerektirir. Elbette parametreler (aritmetik ortalama ve ) yerine tahminler kullanabilirsiniz, ancak bu durumda ortalamanın dağılımı tamamen normal olmayacak, aşağıya doğru hafifçe düzleşecektir. Bu gerçek, keşfini Biometrica dergisinin Mart 1908 sayısında yayınlayan İrlandalı vatandaş William Gosset tarafından akıllıca not edildi. Gizlilik amacıyla Gosset kendisini Öğrenci olarak imzaladı. Öğrenci t dağılımı bu şekilde ortaya çıktı.

Ancak K. Gauss'un astronomik gözlemlerdeki hataları analiz ederken kullandığı verilerin normal dağılımı, dünya yaşamında son derece nadirdir ve tespit edilmesi oldukça zordur (yüksek doğruluk için yaklaşık 2 bin gözleme ihtiyaç vardır). Bu nedenle normallik varsayımını bir kenara bırakıp orijinal verilerin dağılımına bağlı olmayan yöntemleri kullanmak en iyisidir.

Şu soru ortaya çıkıyor: Bilinmeyen bir dağılımın verilerinden hesaplanırsa aritmetik ortalamanın dağılımı nedir? Cevap olasılık teorisinde iyi bilinenler tarafından verilmektedir. Merkezi limit teoremi(CPT). Matematikte bunun birkaç çeşidi vardır (formülasyonlar yıllar içinde geliştirilmiştir), ancak bunların hepsi, kabaca konuşursak, çok sayıda bağımsız rastgele değişkenin toplamının normal dağılım yasasına uyduğu ifadesine indirgenir.

Aritmetik ortalama hesaplanırken rastgele değişkenlerin toplamı kullanılır. Buradan aritmetik ortalamanın, beklentinin orijinal verinin beklentisi olduğu ve varyansın olduğu normal bir dağılıma sahip olduğu ortaya çıkıyor.

Akıllı insanlar CLT'yi nasıl kanıtlayacaklarını biliyorlar, ancak bunu Excel'de yapılan bir deney yardımıyla doğrulayacağız. 50 eşit şekilde dağıtılmış rastgele değişkenden oluşan bir örneği simüle edelim (RASTGELE ARASINDA Excel işlevini kullanarak). Daha sonra bu tür 1000 örnek oluşturacağız ve her birinin aritmetik ortalamasını hesaplayacağız. Bunların dağılımına bakalım.

Ortalamanın dağılımının normal yasaya yakın olduğu görülmektedir. Örneklem büyüklüğü ve sayısı daha da büyütülürse benzerlik daha da iyi olacaktır.

Artık CLT'nin geçerliliğini kendi gözlerimizle gördüğümüze göre, belirli bir olasılıkla gerçek ortalamayı veya matematiksel beklentiyi kapsayan aritmetik ortalama için güven aralıklarını kullanarak hesaplayabiliriz.

Üst ve alt limitleri belirlemek için normal dağılımın parametrelerini bilmeniz gerekir. Kural olarak hiçbiri yoktur, bu nedenle tahminler kullanılır: aritmetik ortalama Ve örnek varyans. Tekrar ediyorum, bu yöntem yalnızca büyük örneklerde iyi bir yaklaşım sağlar. Örnekler küçük olduğunda genellikle Öğrenci dağılımının kullanılması önerilir. İnanmayın! Ortalamaya ilişkin Öğrenci dağılımı yalnızca orijinal veriler normal şekilde dağıtıldığında oluşur, yani neredeyse hiçbir zaman gerçekleşmez. Bu nedenle, gerekli veri miktarı için hemen bir minimum çubuk belirlemek ve asimptotik olarak doğru yöntemleri kullanmak daha iyidir. 30 gözlemin yeterli olduğunu söylüyorlar. 50 alın - yanılmayacaksınız.

T 1.2– güven aralığının alt ve üst sınırları

– örnek aritmetik ortalama

0– numunenin standart sapması (tarafsız)

N – numune boyutu

γ – güven olasılığı (genellikle 0,9, 0,95 veya 0,99'a eşittir)

c γ =Φ -1 ((1+γ)/2)– standart normal dağılım fonksiyonunun ters değeri. Basitçe söylemek gerekirse, bu, aritmetik ortalamadan alt veya üst sınıra kadar olan standart hataların sayısıdır (bu üç olasılık, 1,64, 1,96 ve 2,58 değerlerine karşılık gelir).

Formülün özü, aritmetik ortalamanın alınması ve ardından belirli bir miktarın ayrılmasıdır ( γ ile) standart hatalar ( s 0 /√n). Her şey biliniyor, alın ve düşünün.

Kişisel bilgisayarların yaygınlaşmasından önce normal dağılım fonksiyonu ve bunun tersinin değerleri elde ediliyordu. Günümüzde hala kullanılmaktadırlar ancak hazır Excel formüllerini kullanmak daha etkilidir. Yukarıdaki formüldeki ( , ve ) tüm öğeler Excel'de kolayca hesaplanabilir. Ancak güven aralığını hesaplamak için hazır bir formül var - GÜVEN NORMU. Sözdizimi aşağıdaki gibidir.

GÜVENİLİRLİK.NORM(alfa;standart_kapalı;boyut)

alfa- yukarıda benimsenen gösterimde 1- γ'ya eşit olan anlamlılık düzeyi veya güven düzeyi, yani. matematiksel olasılığıbeklenti güven aralığının dışında olacaktır. 0,95 güven düzeyiyle alfa 0,05'tir vb.

standart_kapalı– örnek verilerin standart sapması. Standart hatayı hesaplamaya gerek yoktur; Excel'in kendisi n'nin köküne bölünür.

boyut– örneklem büyüklüğü (n).

GÜVEN NORMU fonksiyonunun sonucu, güven aralığını hesaplama formülündeki ikinci terimdir; yarım aralık Buna göre alt ve üst noktalar ortalama ± elde edilen değerdir.

Böylece, aritmetik ortalama için güven aralıklarının hesaplanmasına yönelik, orijinal verilerin dağılımına bağlı olmayan evrensel bir algoritma oluşturmak mümkündür. Evrenselliğin bedeli asimptotik doğasıdır, yani. nispeten büyük numunelerin kullanılması ihtiyacı. Ancak modern teknoloji çağında gerekli miktarda veriyi toplamak genellikle zor değildir.

Güven aralıklarını kullanarak istatistiksel hipotezleri test etme

(modül 111)

İstatistikte çözülen temel sorunlardan biri. Özü kısaca şu şekildedir. Örneğin genel nüfusun beklentisinin bir değere eşit olduğu varsayımı yapılır. Daha sonra belirli bir beklenti için gözlemlenebilecek örnek ortalamaların dağılımı oluşturulur. Daha sonra, bu koşullu dağılımda gerçek ortalamanın nerede bulunduğuna bakarlar. Kabul edilebilir sınırların ötesine geçerse, böyle bir ortalamanın ortaya çıkması pek olası değildir ve deney bir kez tekrarlanırsa neredeyse imkansızdır; bu, başarılı bir şekilde reddedilen hipotezle çelişir. Ortalama kritik seviyenin ötesine geçmezse, hipotez reddedilmez (ama aynı zamanda kanıtlanmaz!).

Dolayısıyla, beklenti durumumuzda güven aralıklarının yardımıyla bazı hipotezleri de test edebilirsiniz. Bunu yapmak çok kolaydır. Diyelim ki belirli bir örneklem için aritmetik ortalama 100'e eşit. Hipotez, beklenen değerin örneğin 90 olduğu test ediliyor. Yani soruyu ilkel olarak sorarsak, kulağa şu şekilde geliyor: doğru olabilir mi? Ortalamanın değeri 90'a eşit olduğunda gözlenen ortalamanın 100 olduğu ortaya çıktı mı?

Bu soruyu cevaplamak için ayrıca standart sapma ve örneklem büyüklüğü hakkında bilgiye ihtiyacınız olacak. Standart sapmanın 30 ve gözlem sayısının 64 olduğunu varsayalım (kökü kolayca çıkarabilmek için). O halde ortalamanın standart hatası 30/8 veya 3,75'tir. %95 güven aralığını hesaplamak için ortalamanın her iki tarafına iki standart hata (daha kesin olarak 1,96) eklemeniz gerekir. Güven aralığı yaklaşık 100±7,5 veya 92,5 ile 107,5 arasında olacaktır.

Daha fazla gerekçe aşağıdaki gibidir. Test edilen değer güven aralığı dahilindeyse hipotezle çelişmez çünkü rastgele dalgalanmaların sınırları dahilindedir (%95 olasılıkla). Kontrol edilen nokta güven aralığının dışındaysa, böyle bir olayın olasılığı çok düşüktür, her halükarda kabul edilebilir seviyenin altındadır. Bu, gözlemlenen verilerle çeliştiği için hipotezin reddedildiği anlamına gelir. Bizim durumumuzda beklenen değere ilişkin hipotez güven aralığının dışındadır (test edilen 90 değeri 100±7,5 aralığına dahil değildir), dolayısıyla reddedilmelidir. Yukarıdaki ilkel soruyu yanıtlayarak şunu söylemek gerekir: hayır, olamaz, her halükarda bu çok nadiren olur. Genellikle, hipotezin hatalı bir şekilde reddedilmesinin spesifik olasılığını (p-seviyesi) gösterirler ve güven aralığının oluşturulduğu belirtilen seviyeyi değil, daha fazlasını başka bir zamanda belirtirler.

Gördüğünüz gibi ortalama (veya matematiksel beklenti) için bir güven aralığı oluşturmak zor değildir. Önemli olan özü kavramak, sonra işler yoluna girecek. Uygulamada çoğu durumda, ortalamanın her iki tarafında yaklaşık iki standart hata genişliğinde olan %95'lik bir güven aralığı kullanılır.

Şimdilik bu kadar. Herşey gönlünce olsun!

Güven Aralıklarının Tahmini

Öğrenme Hedefleri

İstatistikler aşağıdakileri dikkate alır iki ana görev:

    Örnek verilere dayanan bazı tahminlerimiz var ve tahmin edilen parametrenin gerçek değerinin nerede olduğuna dair bazı olasılıksal açıklamalar yapmak istiyoruz.

    Örnek veriler kullanılarak test edilmesi gereken belirli bir hipotezimiz var.

Bu başlıkta ilk görevi ele alıyoruz. Ayrıca güven aralığının tanımını da verelim.

Güven aralığı, bir parametrenin tahmini değeri etrafında oluşturulan ve tahmin edilen parametrenin gerçek değerinin önceden belirlenmiş bir olasılıkla nerede bulunduğunu gösteren bir aralıktır.

Bu konuyla ilgili materyali inceledikten sonra:

    bir tahmin için güven aralığının ne olduğunu öğrenin;

    istatistiksel problemleri sınıflandırmayı öğrenmek;

    hem istatistiksel formülleri hem de yazılım araçlarını kullanarak güven aralıkları oluşturma tekniğinde ustalaşın;

    İstatistiksel tahminlerin doğruluğunun belirli parametrelerini elde etmek için gerekli örnek boyutlarını belirlemeyi öğrenin.

Örnek özelliklerin dağılımları

T dağılımı

Yukarıda tartışıldığı gibi, rastgele değişkenin dağılımı, 0 ve 1 parametreleriyle standartlaştırılmış normal dağılıma yakındır. σ değerini bilmediğimizden, onu bir miktar s tahminiyle değiştiririz. Miktarın zaten farklı bir dağılımı var, yani veya Öğrenci dağılımı n -1 parametresi (serbestlik derecesi sayısı) tarafından belirlenir. Bu dağılım normal dağılıma yakındır (n ne kadar büyük olursa dağılımlar da o kadar yakın olur).

Şek. 95
30 serbestlik derecesine sahip Öğrenci dağılımı sunulmaktadır. Gördüğünüz gibi normal dağılıma çok yakın.

Normal dağılım NORMIDIST ve NORMINV ile çalışmaya yönelik işlevlere benzer şekilde, t-dağılımı - STUDIST (TDIST) ve STUDRASOBR (TINV). Bu fonksiyonların kullanımına ilişkin bir örnek STUDRASP.XLS dosyasında (şablon ve çözüm) ve Şekil 2'de görülebilir. 96
.

Diğer özelliklerin dağılımları

Zaten bildiğimiz gibi, matematiksel beklentiyi tahmin etmenin doğruluğunu belirlemek için bir t dağılımına ihtiyacımız var. Varyans gibi diğer parametreleri tahmin etmek için farklı dağılımlar gereklidir. Bunlardan ikisi F dağılımı ve x 2 -dağıtım.

Ortalama için güven aralığı

Güven aralığı- bu, parametrenin tahmini değeri etrafında oluşturulan bir aralıktır ve tahmin edilen parametrenin gerçek değerinin önceden belirlenmiş bir olasılıkla nerede bulunduğunu gösterir.

Ortalama değer için bir güven aralığının oluşturulması gerçekleşir aşağıdaki gibi:

Örnek

Fast food restoranı, ürün yelpazesini yeni bir sandviç türüyle genişletmeyi planlıyor. Yönetici, talebi tahmin etmek için, daha önce denemiş olanlardan 40 ziyaretçiyi rastgele seçmeyi ve onlardan yeni ürüne yönelik tutumlarını 1'den 10'a kadar bir ölçekte derecelendirmelerini istemeyi planlıyor. Yönetici, beklenen talebi tahmin etmek istiyor. yeni ürünün alacağı puan sayısı ve bu tahmin için %95'lik bir güven aralığı oluşturur. Bu nasıl yapılır? (bkz. SANDWICH1.XLS dosyası (şablon ve çözüm).

Çözüm

Bu sorunu çözmek için kullanabilirsiniz. Sonuçlar Şekil 2'de sunulmaktadır. 97
.

Toplam değer için güven aralığı

Bazen örnek verileri kullanarak matematiksel beklentiyi değil, değerlerin toplamını tahmin etmek gerekir. Örneğin, bir denetçinin söz konusu olduğu bir durumda ilgi, ortalama hesap boyutunun değil tüm hesapların toplamının tahmin edilmesi olabilir.

N toplam eleman sayısı, n örneklem büyüklüğü, T 3 örneklemdeki değerlerin toplamı, T" tüm popülasyonun toplamına ilişkin tahmin olsun, o zaman ve güven aralığı formülle hesaplanır; burada s, numunenin standart sapma tahmini ve numunenin ortalamasının tahminidir.

Örnek

Diyelim ki bir vergi dairesi 10.000 vergi mükellefi için toplam vergi iadesini tahmin etmek istiyor. Vergi mükellefi ya para iadesi alır ya da ek vergi öder. Örnek boyutunun 500 kişi olduğunu varsayarak, geri ödeme tutarı için %95 güven aralığını bulun (AMOUNT OF REFUND.XLS (şablon ve çözüm) dosyasına bakın).

Çözüm

StatPro'nun bu durum için özel bir prosedürü yoktur ancak yukarıdaki formüllere dayalı olarak ortalama için sınırlardan sınırların elde edilebileceği belirtilebilir (Şekil 98).
).

Orantı için güven aralığı

P, müşterilerin payının matematiksel beklentisi olsun ve p b, n büyüklüğündeki bir örneklemden elde edilen bu payın tahmini olsun. Yeterince büyük olduğu gösterilebilir değerlendirme dağılımı matematiksel beklenti p ve standart sapma ile normale yakın olacaktır . Bu durumda tahminin standart hatası şu şekilde ifade edilir: ve güven aralığı şu şekildedir: .

Örnek

Fast food restoranı, ürün yelpazesini yeni bir sandviç türüyle genişletmeyi planlıyor. Yönetici, talebi değerlendirmek için, daha önce denemiş olanlardan 40 ziyaretçiyi rastgele seçti ve onlardan yeni ürüne yönelik tutumlarını 1'den 10'a kadar bir ölçekte derecelendirmelerini istedi. Yönetici, talebin beklenen oranını tahmin etmek istiyor. Yeni ürüne en az 6 puan veren müşteriler (bu müşterilerin yeni ürünün tüketicileri olmasını bekliyor).

Çözüm

Başlangıçta, müşterinin derecelendirmesi 6 puandan fazlaysa 1, aksi takdirde 0'dan fazlaysa öznitelik 1'e dayalı yeni bir sütun oluştururuz (SANDWICH2.XLS dosyasına bakın (şablon ve çözüm).

Yöntem 1

1 sayısını sayarak payı tahmin ediyoruz ve ardından formülleri kullanıyoruz.

Zcr değeri özel normal dağılım tablolarından alınır (örneğin %95 güven aralığı için 1,96).

%95'lik bir aralık oluşturmak için bu yaklaşımı ve spesifik verileri kullanarak aşağıdaki sonuçları elde ederiz (Şekil 99).
). zcr parametresinin kritik değeri 1,96'dır. Tahminin standart hatası 0,077'dir. Güven aralığının alt sınırı 0,475'tir. Güven aralığının üst sınırı 0,775'tir. Dolayısıyla yönetici, yeni ürünü 6 veya daha yüksek puanla derecelendiren müşterilerin yüzdesinin 47,5 ile 77,5 arasında olacağına %95 güvenle inanma hakkına sahiptir.

Yöntem 2

Bu sorun standart StatPro araçları kullanılarak çözülebilir. Bunu yapmak için bu durumda payın Tür sütununun ortalama değeriyle örtüştüğünü not etmek yeterlidir. Daha sonra başvuruyoruz StatPro/İstatistiksel Çıkarım/Tek Örnek Analizi Tür sütunu için ortalamanın (matematiksel beklentinin tahmini) bir güven aralığını oluşturmak. Bu durumda elde edilen sonuçlar 1. yöntemin sonuçlarına çok yakın olacaktır (Şekil 99).

Standart sapma için güven aralığı

s, standart sapmanın bir tahmini olarak kullanılır (formül Bölüm 1'de verilmiştir). Tahmin s'nin yoğunluk fonksiyonu, t-dağılımı gibi n-1 serbestlik derecesine sahip olan ki-kare fonksiyonudur. Bu dağıtım CHIDIST ve CHIINV ile çalışmak için özel işlevler vardır.

Bu durumda güven aralığı artık simetrik olmayacaktır. Geleneksel bir sınır diyagramı Şekil 2'de gösterilmektedir. 100.

Örnek

Makinanın 10 cm çapında parça üretmesi gerekmektedir. Ancak çeşitli sebeplerden dolayı hatalar meydana gelmektedir. Kalite kontrolörü iki durumla ilgilenir: birincisi ortalama değerin 10 cm olması gerekir; ikincisi, bu durumda bile sapmalar büyükse birçok parça reddedilecektir. Her gün 50 parçadan oluşan bir numune hazırlıyor (KALİTE KONTROL.XLS dosyasına bakın (şablon ve çözüm). Böyle bir numune ne gibi sonuçlar verebilir?

Çözüm

Ortalama ve standart sapma için %95 güven aralıklarını aşağıdakileri kullanarak oluşturalım: StatPro/İstatistiksel Çıkarım/Tek Örnek Analizi(Şek. 101
).

Daha sonra, çapların normal dağılımı varsayımını kullanarak kusurlu ürünlerin oranını hesaplıyoruz ve maksimum sapmayı 0,065 olarak ayarlıyoruz. İkame tablosunun yeteneklerini kullanarak (iki parametre durumu), kusur oranının ortalama değere ve standart sapmaya bağımlılığını çizeriz (Şekil 102).
).

İki ortalama arasındaki fark için güven aralığı

Bu istatistiksel yöntemlerin en önemli uygulamalarından biridir. Durum örnekleri.

    Bir giyim mağazası müdürü, ortalama kadın müşterinin mağazada ortalama erkek müşteriye göre ne kadar fazla veya az harcadığını bilmek istiyor.

    İki havayolu da benzer rotalarda uçuyor. Bir tüketici kuruluşu, her iki havayolunun ortalama beklenen uçuş gecikme süreleri arasındaki farkı karşılaştırmak istiyor.

    Şirket belirli ürün türleri için kuponları bir şehirde gönderiyor, diğer şehirde göndermiyor. Yöneticiler bu ürünlerin önümüzdeki iki aydaki ortalama satın alma hacimlerini karşılaştırmak istiyor.

    Bir araba satıcısı sunumlarda genellikle evli çiftlerle ilgilenir. Sunuma yönelik kişisel tepkilerini anlamak için çiftlerle genellikle ayrı ayrı röportaj yapılır. Yönetici, kadın ve erkeklerin verdiği derecelendirmelerdeki farkı değerlendirmek istiyor.

Bağımsız örnekler durumu

Ortalamalar arasındaki fark, n 1 + n 2 - 2 serbestlik derecesine sahip bir t dağılımına sahip olacaktır. μ 1 - μ 2 için güven aralığı şu ilişkiyle ifade edilir:

Bu sorun yalnızca yukarıdaki formüller kullanılarak değil, aynı zamanda standart StatPro araçları kullanılarak da çözülebilir. Bunu yapmak için kullanmak yeterlidir

Oranlar arasındaki fark için güven aralığı

Hisselerin matematiksel beklentisi olsun. Sırasıyla n 1 ve n 2 büyüklüğündeki örneklerden oluşturulmuş örnek tahminleri olsun. Daha sonra fark için bir tahmin yapılır. Dolayısıyla bu farkın güven aralığı şu şekilde ifade edilir:

Burada zcr, özel tablolar kullanılarak normal dağılımdan elde edilen bir değerdir (örneğin, %95 güven aralığı için 1,96).

Tahminin standart hatası bu durumda aşağıdaki ilişkiyle ifade edilir:

.

Örnek

Büyük bir satışa hazırlanan mağaza aşağıdaki pazarlama araştırmasını gerçekleştirdi. En iyi 300 alıcı seçildi ve her biri 150 üyeden oluşan iki gruba rastgele bölündü. Seçilen tüm müşterilere satışa katılmaları için davetiye gönderildi, ancak yalnızca ilk grubun üyeleri kendilerine %5 indirim hakkı tanıyan bir kupon aldı. Satış sırasında seçilen 300 alıcının tamamının alımları kayıt altına alındı. Bir yönetici sonuçları nasıl yorumlayabilir ve kuponların etkinliği hakkında nasıl bir yargıya varabilir? (COUPONS.XLS dosyasına bakın (şablon ve çözüm)).

Çözüm

Bizim özel durumumuz için, indirim kuponu alan 150 müşteriden 55'i indirimde alışveriş yaptı ve kupon almayan 150 müşteriden yalnızca 35'i alışveriş yaptı (Şekil 103).
). Daha sonra numune oranlarının değerleri sırasıyla 0,3667 ve 0,2333'tür. Ve aralarındaki örneklem farkı sırasıyla 0,1333'e eşittir. %95'lik bir güven aralığı varsayarsak, normal dağılım tablosundan zcr = 1,96'yı buluruz. Örneklem farkının standart hatasının hesaplanması 0,0524'tür. Sonunda %95 güven aralığının alt sınırının sırasıyla 0,0307, ​​üst sınırının ise 0,2359 olduğunu buluyoruz. Elde edilen sonuçlar şu şekilde yorumlanabilir: İndirim kuponu alan her 100 müşteriye karşılık 3 ila 23 yeni müşteri bekleyebiliriz. Ancak, bu sonucun tek başına kupon kullanmanın etkinliği anlamına gelmediğini aklımızda tutmalıyız (çünkü indirim sağlayarak kar kaybederiz!). Bunu belirli verilerle gösterelim. Ortalama satın alma büyüklüğünün 50 ruble olmak üzere 400 ruble olduğunu varsayalım. mağazanın kârı var. Kupon almayan 100 müşteriden beklenen kar şu şekildedir:

50 0,2333 100 = 1166,50 ovmak.

Kupon alan 100 müşteri için benzer hesaplamalar şunları verir:

30 0,3667 100 = 1100,10 ovmak.

Ortalama kârın 30'a düşmesi, kupon alan müşterilerin indirim kullanılarak ortalama 380 ruble satın alma yapmasıyla açıklanıyor.

Dolayısıyla nihai sonuç, bu özel durumda bu tür kuponların kullanılmasının etkisizliğini göstermektedir.

Yorum. Bu sorun standart StatPro araçları kullanılarak çözülebilir. Bunu yapmak için, bu sorunu, yöntemi kullanarak iki ortalama arasındaki farkın tahmin edilmesi sorununa indirgemek ve ardından uygulamak yeterlidir. StatPro/İstatistiksel Çıkarım/İki Örnekli Analizİki ortalama değer arasındaki fark için bir güven aralığı oluşturmak.

Güven Aralığı Uzunluğunun Kontrol Edilmesi

Güven aralığının uzunluğu şunlara bağlıdır: aşağıdaki koşullar:

    doğrudan veriler (standart sapma);

    önem düzeyi;

    numune boyutu.

Ortalamayı tahmin etmek için örnek boyutu

Öncelikle sorunu genel durumda ele alalım. Bize verilen güven aralığı uzunluğunun yarısının değerini B olarak gösterelim (Şekil 104).
). Bazı rastgele değişken X'in ortalama değeri için güven aralığının şu şekilde ifade edildiğini biliyoruz: , Nerede . İnanmak:

ve n'yi ifade edersek şunu elde ederiz.

Maalesef X rastgele değişkeninin varyansının tam değerini bilmiyoruz. Ayrıca serbestlik derecesi sayısı aracılığıyla n'ye bağlı olduğundan tcr'nin değerini de bilmiyoruz. Bu durumda aşağıdakileri yapabiliriz. Varyans yerine, incelenen rastgele değişkenin mevcut uygulamalarına dayanan bazı varyans tahminlerini kullanırız. Normal dağılım için t cr değeri yerine z cr değerini kullanıyoruz. Normal ve t-dağılımları için dağılım yoğunluk fonksiyonları çok yakın olduğundan (küçük n durumu hariç) bu oldukça kabul edilebilirdir. Böylece gerekli formül şu şekli alır:

.

Formül genel anlamda tamsayı olmayan sonuçlar verdiğinden, sonucun fazla olduğu yuvarlama istenen örneklem büyüklüğü olarak alınır.

Örnek

Fast food restoranı, ürün yelpazesini yeni bir sandviç türüyle genişletmeyi planlıyor. Yönetici, talebi değerlendirmek için, daha önce denemiş olan ziyaretçiler arasından rastgele bir sayıda ziyaretçi seçmeyi ve onlardan yeni ürüne yönelik tutumlarını 1'den 10'a kadar bir ölçekte derecelendirmelerini istemeyi planlıyor. Yeni ürünün alacağı beklenen puan sayısını hesaplayın ve bu tahmin için %95'lik bir güven aralığı oluşturun. Aynı zamanda güven aralığının yarı genişliğinin de 0,3'ü geçmemesini istiyor. Kaç ziyaretçiyle röportaj yapması gerekiyor?

şuna benziyor:

Burada çürükler p oranının bir tahminidir ve B, güven aralığı uzunluğunun belirli bir yarısıdır. Değer kullanılarak n için fazla bir tahmin elde edilebilir çürükler= 0,5. Bu durumda güven aralığının uzunluğu, p'nin herhangi bir gerçek değeri için belirtilen B değerini aşmayacaktır.

Örnek

Önceki örnekteki yöneticinin, yeni bir ürün türünü tercih eden müşterilerin payını tahmin etmeyi planlamasına izin verin. Yarı uzunluğu 0,05'i aşmayan %90'lık bir güven aralığı oluşturmak istiyor. Rastgele örneğe kaç müşteri dahil edilmelidir?

Çözüm

Bizim durumumuzda z cr değeri = 1,645. Bu nedenle gerekli miktar şu şekilde hesaplanır: .

Yöneticinin istenen p değerinin örneğin yaklaşık 0,3 olduğuna inanması için bir nedeni olsaydı, o zaman bu değeri yukarıdaki formülde yerine koyarsak daha küçük bir rastgele örnek değeri, yani 228 elde ederdik.

Belirleme formülü İki ortalama arasında fark olması durumunda rastgele örneklem büyüklüğüşu şekilde yazılmıştır:

.

Örnek

Bazı bilgisayar şirketlerinin müşteri hizmetleri merkezi vardır. Son zamanlarda müşterilerden hizmet kalitesinin düşüklüğüne ilişkin şikayetlerin sayısı arttı. Servis merkezinde esas olarak iki tür çalışan istihdam edilmektedir: fazla deneyimi olmayan ancak özel hazırlık kurslarını tamamlamış olanlar ve kapsamlı pratik deneyimi olan ancak özel kursları tamamlamamış olanlar. Şirket, son altı aydaki müşteri şikayetlerini analiz etmek ve iki çalışan grubunun her biri için ortalama şikayet sayısını karşılaştırmak istiyor. Her iki grup için örneklerdeki sayıların aynı olacağı varsayılmaktadır. Yarı uzunluğu 2'den fazla olmayan %95'lik bir aralık elde etmek için örneğe kaç çalışanın dahil edilmesi gerekir?

Çözüm

Burada σ ots, yakın oldukları varsayımı altında her iki rastgele değişkenin standart sapmasının bir tahminidir. Dolayısıyla problemimizde bir şekilde bu tahmini elde etmemiz gerekiyor. Bu, örneğin aşağıdaki gibi yapılabilir. Son altı aydaki müşteri şikayetleriyle ilgili verilere bakan bir yönetici, her çalışanın genellikle 6 ila 36 arasında şikayet aldığını fark edebilir. Normal bir dağılım için neredeyse tüm değerlerin ortalamadan en fazla üç standart sapma uzakta olduğunu bilerek, makul bir şekilde şuna inanabilir:

σ ots = 5'ten itibaren.

Bu değeri formülde yerine koyarsak, şunu elde ederiz: .

Belirleme formülü Oranlar arasındaki farkın tahmin edilmesi durumunda rastgele örneklem büyüklüğüşu forma sahiptir:

Örnek

Bazı şirketlerin benzer ürünler üreten iki fabrikası var. Bir şirket yöneticisi her iki fabrikadaki kusurlu ürünlerin yüzdesini karşılaştırmak istiyor. Mevcut bilgilere göre her iki fabrikada da kusur oranı %3 ile %5 arasında değişmektedir. Yarı uzunluğu 0,005'i (veya %0,5'i) aşmayan %99'luk bir güven aralığı oluşturması amaçlanır. Her fabrikadan kaç ürün seçilmelidir?

Çözüm

Burada p 1ot ve p 2ot, 1. ve 2. fabrikadaki bilinmeyen iki kusur payının tahminleridir. Eğer p 1ots = p 2ots = 0,5 koyarsak, n için olduğundan fazla tahmin edilen bir değer elde ederiz. Ancak bizim durumumuzda bu paylara ilişkin önsel bilgilerimiz olduğundan, bu payların üst tahminini yani 0,05'i alıyoruz. Aldık

Örnek verilerden bazı popülasyon parametrelerini tahmin ederken, yalnızca parametrenin nokta tahminini vermek değil, aynı zamanda tahmin edilen parametrenin tam değerinin nerede olabileceğini gösteren bir güven aralığı sağlamak da faydalıdır.

Bu bölümde ayrıca çeşitli parametreler için bu tür aralıklar oluşturmamıza olanak sağlayan niceliksel ilişkilerle de tanıştık; Güven aralığının uzunluğunu kontrol etmenin yollarını öğrendi.

Ayrıca, numune büyüklüklerini tahmin etme probleminin (bir deney planlama problemi), standart StatPro araçları kullanılarak çözülebileceğini de unutmayın; StatPro/İstatistiksel Çıkarım/Örnek Boyutu Seçimi.

Güven aralığı(CI; İngilizce'de güven aralığı - CI), bir örneklemle yapılan bir çalışmada elde edilen, bu tür tüm hastaların popülasyonu (genel popülasyon) hakkında sonuçlara varmak amacıyla çalışma sonuçlarının doğruluğunun (veya belirsizliğinin) bir ölçüsünü verir. %95 GA'nın doğru tanımı şu şekilde formüle edilebilir: Bu tür aralıkların %95'i popülasyondaki gerçek değeri içerecektir. Bu yorum biraz daha az doğrudur: CI, gerçek değeri içerdiğinden %95 emin olabileceğiniz değer aralığıdır. Bir CI kullanıldığında, istatistiksel anlamlılığın test edilmesiyle elde edilen P değerinin aksine, niceliksel etkinin belirlenmesine vurgu yapılır. P değeri herhangi bir niceliği tahmin etmez, bunun yerine "etki yok" boş hipotezine karşı kanıtın gücünün bir ölçüsü olarak hizmet eder. P'nin değeri tek başına bize farkın büyüklüğü ve hatta yönü hakkında hiçbir şey söylemez. Bu nedenle bağımsız P değerleri makalelerde veya özetlerde kesinlikle bilgi verici değildir. Buna karşılık, CI hem tedavinin faydası gibi acil ilginin etkisinin boyutunu hem de kanıtların gücünü gösterir. Bu nedenle DI doğrudan KDT uygulamasıyla ilgilidir.

CI ile örneklenen istatistiksel analize yönelik tahmin yaklaşımı, ilgilenilen etkinin miktarını (tanı testinin duyarlılığı, öngörülen vakaların oranı, tedaviyle göreceli risk azalması vb.) ölçmeyi ve ayrıca bu konudaki belirsizliği ölçmeyi amaçlar. etki. Çoğu zaman CI, tahminin her iki tarafındaki gerçek değerin muhtemelen yer aldığı değer aralığıdır ve bundan %95 emin olabilirsiniz. %95 olasılığın kullanılmasına ilişkin anlaşma, P değeri gibi keyfidir.<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

CI, farklı hasta örnekleri üzerinde yapılan aynı çalışmanın aynı sonuçları üretmeyeceği, ancak sonuçlarının gerçek ancak bilinmeyen bir değer etrafında dağılacağı fikrine dayanmaktadır. Başka bir deyişle CI bunu "örneğe bağlı değişkenlik" olarak tanımlıyor. CI, diğer sebeplerden kaynaklanan ilave belirsizliği yansıtmamaktadır; özellikle seçici kaybın takip üzerindeki etkisini, zayıf uyumu veya hatalı sonuç ölçümünü, körleme eksikliğini vb. içermez. Bu nedenle CI her zaman toplam belirsizlik miktarını eksik tahmin eder.

Güven Aralığı Hesaplaması

Tablo A1.1. Seçilen klinik ölçümler için standart hatalar ve güven aralıkları

Tipik olarak bir CI, iki oran arasındaki fark (d) gibi bir miktarın gözlemlenen tahmininden ve bu farkın tahminindeki standart hatadan (SE) hesaplanır. Bu şekilde elde edilen yaklaşık %95 GA d ± 1,96 SE'dir. Formül, sonuç ölçüsünün niteliğine ve CI'nin kapsamına göre değişir. Örneğin, aselüler boğmaca aşısının randomize, plasebo kontrollü bir deneyinde, aşı alan 1670 bebekten 72'sinde (%4,3) boğmaca gelişti ve kontrol grubunda 1665 bebekten 240'ında (%14,4) boğmaca gelişti. Mutlak risk azalması olarak bilinen yüzde farkı %10,1'dir. Bu farkın SE'si %0,99'dur. Buna göre %95 GA, %10,1 + %1,96 x %0,99'dur; 8,2'den 12,0'a.

Farklı felsefi yaklaşımlarına rağmen CI'ler ve istatistiksel anlamlılık testleri matematiksel olarak yakından ilişkilidir.

Dolayısıyla P değeri “anlamlıdır”, yani. R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Tahminin CI cinsinden ifade edilen belirsizliği (kesinliksizliği) büyük ölçüde örneklem boyutunun kareköküyle ilgilidir. Küçük numuneler büyük numunelerden daha az bilgi sağlar ve CI daha küçük bir numunede buna uygun olarak daha geniştir. Örneğin, Helicobacter pylori enfeksiyonunu teşhis etmek için kullanılan üç testin performansını karşılaştıran bir makale, üre nefes testinin duyarlılığının %95,8 (%95 CI 75-100) olduğunu bildirdi. %95,8'lik rakam etkileyici olsa da, J. pylori'li 24 yetişkin hastadan oluşan küçük bir örneklem, geniş güven aralığının da gösterdiği gibi, bu tahminde önemli bir belirsizlik olduğu anlamına geliyor. Nitekim yüzde 75'lik alt sınır, yüzde 95,8'lik tahminin çok altında. Aynı duyarlılık 240 kişilik bir örneklemde gözlemlenirse %95 GA 92,5-98,0 olur ve bu da testin oldukça duyarlı olduğuna dair daha fazla güvence sağlar.

Randomize kontrollü çalışmalarda (RKÇ'ler), anlamlı olmayan sonuçlar (yani P>0.05 olanlar) yanlış yorumlanmaya özellikle duyarlıdır. CI burada özellikle faydalıdır çünkü sonuçların klinik olarak faydalı gerçek etkiyle ne kadar tutarlı olduğunu gösterir. Örneğin kolonik sütür ve zımba anastomozunu karşılaştıran bir RKÇ'de yara enfeksiyonu hastaların sırasıyla %10,9 ve %13,5'inde gelişti (P ​​= 0,30). Bu fark için %95 GA %2,6'dır (−2 ila +8). 652 hastayı içeren bu çalışmada bile, iki prosedürden kaynaklanan enfeksiyonların görülme sıklığında az da olsa bir fark olması mümkündür. Ne kadar az araştırma o kadar belirsizlik demektir. Sung ve diğerleri. 100 hastada akut varis kanamasında oktreotid infüzyonunu akut skleroterapiyle karşılaştırmak için bir RKÇ gerçekleştirdi. Oktreotid grubunda kanama kontrol oranı %84; skleroterapi grubunda - %90, bu da P = 0,56'yı verir. Devam eden kanama oranlarının söz konusu çalışmada yara enfeksiyonuna ilişkin oranlarla benzer olduğunu unutmayın. Ancak bu durumda müdahaleler arasındaki fark için %95 GA %6'dır (-7 ila +19). Bu aralık, klinik açıdan ilgi çekici olabilecek %5'lik farkla karşılaştırıldığında oldukça geniştir. Açıkçası, çalışma etkililik açısından önemli bir farkı göz ardı etmiyor. Bu nedenle yazarların varis kanamasının tedavisinde oktreotid infüzyonu ve skleroterapinin eşit derecede etkili olduğu yönündeki sonucu kesinlikle geçersizdir. Burada olduğu gibi mutlak risk azaltımı (ARR) için %95 CI'nın sıfır içerdiği bu gibi durumlarda, NNT için CI'nın (tedavi edilmesi gereken sayı) yorumlanması oldukça zordur. TGA ve CI, ACP'nin karşılıklarından elde edilir (bu değerler yüzde olarak verilmişse 100 ile çarpılır). Burada NPL = 100: 6 = 16,6 ve %95 GA -14,3 ile 5,3 arasında elde edilir. Tablodaki “d” dipnotundan da anlaşılacağı üzere. A1.1, bu CI, 5,3'ten sonsuza kadar NPL ve 14,3'ten sonsuza kadar NPL değerlerini içerir.

CI'ler en sık kullanılan istatistiksel tahminler veya karşılaştırmalar için oluşturulabilir. RCT'ler için ortalama oranlar, göreceli riskler, olasılık oranları ve NLR'ler arasındaki farkı içerir. Benzer şekilde, tanısal test doğruluğu çalışmalarında yapılan tüm önemli tahminler için (duyarlılık, özgüllük, pozitif tahmin değeri (hepsi basit oranlardır) ve olasılık oranları) meta analizlerde ve kontrolle karşılaştırmada elde edilen tahminler için CI'ler elde edilebilir. çalışmalar. MDI'lerin bu kullanımlarının çoğunu kapsayan bir kişisel bilgisayar programı, İstatistiklerin Güvenle kitabının ikinci baskısında mevcuttur. Oranlar için CI'lerin hesaplanmasına yönelik makrolar, Excel ve SPSS ve Minitab istatistik programları için ücretsiz olarak http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm adresinde mevcuttur.

Tedavi etkisine ilişkin çoklu tahminler

CI'ler birincil çalışma sonuçları için tercih edilirken, tüm sonuçlar için gerekli değildir. CI klinik olarak önemli karşılaştırmalarla ilgilidir. Örneğin, iki grubu karşılaştırırken doğru GA, yukarıdaki örneklerde gösterildiği gibi gruplar arasındaki farka göre oluşturulan güven aralığıdır, her gruptaki tahmin için oluşturulabilen güven aralığı değildir. Her gruptaki tahminler için ayrı CI'lar sağlamak yararlı olmayacağı gibi, bu sunum yanıltıcı da olabilir. Benzer şekilde, farklı alt gruplardaki tedavilerin etkinliğini karşılaştırırken doğru yaklaşım, iki (veya daha fazla) alt grubu doğrudan karşılaştırmaktır. Eğer CI hiçbir etkiye karşılık gelen değeri hariç tutmuyorsa ve diğerleri bunu dışlamıyorsa, bir tedavinin yalnızca bir alt grupta etkili olduğunu varsaymak yanlıştır. CI'ler aynı zamanda birden fazla alt gruptaki sonuçları karşılaştırırken de faydalıdır. Şek. A 1.1, magnezyum sülfatla ilgili plasebo kontrollü bir RCT'deki kadın alt gruplarında preeklampsili kadınlarda göreceli eklampsi riskini göstermektedir.

Pirinç. A1.2. Orman grafiği, sığır rotavirüs aşısının ishalin önlenmesinde plaseboyla karşılaştırıldığında kullanıldığı 11 randomize klinik çalışmanın sonuçlarını göstermektedir. Göreceli ishal riskini tahmin etmek için %95'lik bir güven aralığı kullanıldı. Siyah karenin boyutu bilgi miktarıyla orantılıdır. Ayrıca tedavi etkinliğinin özet tahmini ve %95 güven aralığı (baklava deseniyle gösterilir) gösterilir. Meta-analiz, önceden belirlenmiş bazı modellerden daha büyük bir rastgele etki modeli kullanmıştır; örneğin bu, örneklem büyüklüğünün hesaplanmasında kullanılan boyut olabilir. Daha sıkı bir kriter, tüm CI aralığının önceden belirlenmiş bir minimum değerden daha fazla fayda göstermesini gerektirir.

İstatistiksel önem eksikliğini iki tedavinin eşit derecede etkili olduğunun bir göstergesi olarak almanın yanlışlığını daha önce tartışmıştık. İstatistiksel önemi klinik önemle eşitlememek de aynı derecede önemlidir. Sonuç istatistiksel olarak anlamlı olduğunda ve tedavi etkinliği tahmininin büyüklüğü olduğunda klinik önem varsayılabilir.

Çalışmalar, sonuçların istatistiksel olarak anlamlı olup olmadığını, hangilerinin klinik açıdan önemli olduğunu ve hangilerinin olmadığını gösterebilir. Şek. A1.2, tüm CI'nin geçerli olduğu dört testin sonuçlarını gösterir.<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Çoğu zaman değerleme uzmanı, değerlendirilen mülkün bulunduğu segmentin emlak piyasasını analiz etmek zorundadır. Pazar gelişmişse, sunulan nesnelerin tamamını analiz etmek zor olabilir, bu nedenle analiz için bir nesne örneği kullanılır. Bu numune her zaman homojen çıkmayabilir; bazen aşırı noktalardan (çok yüksek veya çok düşük piyasa teklifleri) arındırmak gerekebilir. Bu amaçla kullanılır güven aralığı. Bu çalışmanın amacı, güven aralığını hesaplamak için iki yöntemin karşılaştırmalı analizini yapmak ve estimatica.pro sisteminde farklı örneklerle çalışırken en uygun hesaplama seçeneğini seçmektir.

Güven aralığı, bilinen bir olasılıkla genel popülasyonun tahmini parametresini içeren bir örnek temelinde hesaplanan bir nitelik değerleri aralığıdır.

Bir güven aralığı hesaplamanın amacı, tahmin edilen parametrenin değerinin bu aralıkta olduğunun belirli bir olasılıkla ifade edilebilmesi için örnek verilere dayalı böyle bir aralık oluşturmaktır. Başka bir deyişle güven aralığı, tahmin edilen değerin belirli bir olasılıkla bilinmeyen değerini içerir. Aralık ne kadar geniş olursa, yanlışlık da o kadar yüksek olur.

Güven aralığını belirlemek için farklı yöntemler vardır. Bu yazıda 2 yönteme bakacağız:

  • medyan ve standart sapma yoluyla;
  • t-istatistiklerinin kritik değeri (Öğrenci katsayısı) aracılığıyla.

CI'yi hesaplamak için farklı yöntemlerin karşılaştırmalı analizinin aşamaları:

1. bir veri örneği oluşturun;

2. istatistiksel yöntemler kullanarak işleriz: ortalama değeri, medyanı, varyansı vb. hesaplarız;

3. Güven aralığını iki şekilde hesaplayabilecektir;

4. Temizlenmiş numuneleri ve ortaya çıkan güven aralıklarını analiz edebilecektir.

Aşama 1. Veri örneklemesi

Örnek estimatica.pro sistemi kullanılarak oluşturuldu. Örnek, 3. fiyat bölgesinde "Kruşçev" tipi yerleşim planına sahip 1 odalı dairelerin satışına yönelik 91 teklifi içeriyordu.

Tablo 1. Başlangıç ​​örneği

Fiyat 1 m2, adet

Şekil 1. İlk örnek



Aşama 2. İlk numunenin işlenmesi

Bir numunenin istatistiksel yöntemler kullanılarak işlenmesi aşağıdaki değerlerin hesaplanmasını gerektirir:

1. Aritmetik ortalama

2. Medyan, numuneyi karakterize eden bir sayıdır: numune elemanlarının tam olarak yarısı medyandan büyük, diğer yarısı medyandan küçüktür.

(tek sayıda değere sahip bir örnek için)

3. Aralık - numunedeki maksimum ve minimum değerler arasındaki fark

4. Varyans – verilerin varyasyonunu daha doğru bir şekilde tahmin etmek için kullanılır

5. Örnek standart sapma (bundan sonra - SD), ayar değerlerinin aritmetik ortalama etrafındaki dağılımının en yaygın göstergesidir.

6. Değişim katsayısı - ayarlama değerlerinin dağılım derecesini yansıtır

7. salınım katsayısı - numunedeki aşırı fiyat değerlerinin ortalama etrafındaki göreceli dalgalanmasını yansıtır

Tablo 2. Orijinal örneklemin istatistiksel göstergeleri

Verilerin homojenliğini karakterize eden varyasyon katsayısı %12,29'dur ancak salınım katsayısı çok yüksektir. Dolayısıyla orijinal numunenin homojen olmadığını söyleyebiliriz, o yüzden güven aralığını hesaplamaya geçelim.

Aşama 3. Güven aralığı hesaplaması

Yöntem 1. Medyan ve standart sapmayı kullanarak hesaplama.

Güven aralığı şu şekilde belirlenir: minimum değer - standart sapma medyandan çıkarılır; maksimum değer - ortalamaya standart sapma eklenir.

Böylece güven aralığı (47179 CU; 60689 CU)

Pirinç. 2. Güven aralığına giren değerler 1.



Yöntem 2. T-istatistiklerinin kritik değerini (Öğrenci katsayısı) kullanarak bir güven aralığı oluşturmak

S.V. Gribovsky, “Özellik Değerini Tahmin Etmek için Matematiksel Yöntemler” adlı kitabında, Öğrenci katsayısı aracılığıyla güven aralığını hesaplamak için bir yöntem anlatıyor. Bu yöntemi kullanarak hesaplama yaparken tahmincinin, güven aralığının oluşturulma olasılığını belirleyen önem düzeyini (∝) kendisinin ayarlaması gerekir. Tipik olarak 0,1'lik anlamlılık düzeyleri kullanılır; 0,05 ve 0,01. Bunlar 0,9'luk güven olasılıklarına karşılık gelir; 0,95 ve 0,99. Bu yöntemle, matematiksel beklenti ve varyansın gerçek değerlerinin pratikte bilinmediği varsayılır (bu, pratik tahmin problemlerini çözerken neredeyse her zaman doğrudur).

Güven aralığı formülü:

n - örneklem büyüklüğü;

Özel istatistiksel tablolardan veya MS Excel (→"İstatistik"→ STUDIST) kullanılarak belirlenen t-istatistiklerinin kritik değeri (Öğrenci dağılımı), anlamlılık düzeyi ∝, serbestlik derecesi sayısı n-1;

∝ - anlamlılık düzeyi, ∝=0,01'i alın.

Pirinç. 2. Güven aralığına giren değerler 2.

Aşama 4. Güven aralığını hesaplamak için farklı yöntemlerin analizi

Güven aralığını hesaplamanın iki yöntemi - medyan ve Öğrenci katsayısı aracılığıyla - aralıkların farklı değerlerine yol açtı. Buna göre iki farklı temizlenmiş numune elde ettik.

Tablo 3. Üç örnek için istatistikler.

Gösterge

İlk örnek

1 seçenek

Seçenek 2

Ortalama değer

Dağılım

Katsayı. varyasyonlar

Katsayı. salınımlar

Kullanımdan kaldırılan nesnelerin sayısı, adet.

Yapılan hesaplamalara dayanarak farklı yöntemlerle elde edilen güven aralığı değerlerinin kesiştiğini söyleyebiliriz, dolayısıyla değerleme uzmanının takdirine bağlı olarak hesaplama yöntemlerinden herhangi birini kullanabilirsiniz.

Ancak estimatica.pro sisteminde çalışırken, piyasanın gelişim derecesine bağlı olarak güven aralığını hesaplamak için bir yöntem seçmeniz tavsiye edilir:

  • pazar gelişmemişse, bu durumda kullanımdan kaldırılan nesnelerin sayısı az olduğundan, medyan ve standart sapmayı kullanan hesaplama yöntemini kullanın;
  • Piyasa gelişmişse, büyük bir başlangıç ​​örneklemi oluşturmak mümkün olduğundan, hesaplamayı t-istatistiklerinin kritik değeri (Öğrenci katsayısı) aracılığıyla uygulayın.

Makalenin hazırlanmasında aşağıdakiler kullanıldı:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Mülkiyet değerini değerlendirmek için matematiksel yöntemler. Moskova, 2014

2. Sistem verileri estimatica.pro

Önceki alt bölümlerde bilinmeyen bir parametrenin tahmin edilmesi konusunu ele almıştık. A bir numara. Buna “nokta” tahmini denir. Bazı görevlerde yalnızca parametreyi bulmanız gerekmez. A uygun sayısal değer, aynı zamanda doğruluğunu ve güvenilirliğini de değerlendirmektir. Bir parametreyi değiştirmenin hangi hatalara yol açabileceğini bilmeniz gerekir A nokta tahmini A ve bu hataların bilinen sınırları aşmamasını ne derece güvenle bekleyebiliriz?

Bu tür problemler özellikle az sayıda gözlemle ilgilidir; nokta tahmini ve içinde büyük ölçüde rastgeledir ve a'nın yaklaşık olarak a ile değiştirilmesi ciddi hatalara yol açabilir.

Tahminin doğruluğu ve güvenilirliği hakkında fikir vermek A,

Matematiksel istatistiklerde güven aralıkları ve güven olasılıkları adı verilen değerler kullanılır.

Parametre için izin ver A deneyimlerden elde edilen tarafsız tahmin A. Bu durumda olası hatayı tahmin etmek istiyoruz. Yeterince büyük bir p olasılığı atayalım (örneğin, p = 0,9, 0,95 veya 0,99), p olasılığına sahip bir olayın pratik olarak güvenilir kabul edilebilmesini sağlayalım ve bunun için bir s değeri bulalım.

Daha sonra değiştirme sırasında ortaya çıkan hatanın pratik olarak olası değerlerinin aralığı A Açık A, ± s olacaktır; Mutlak değerdeki büyük hatalar yalnızca a = 1 - p gibi düşük bir olasılıkla ortaya çıkacaktır. (14.3.1)’i şu şekilde yeniden yazalım:

Eşitlik (14.3.2), p olasılığı ile parametrenin bilinmeyen değerinin olduğu anlamına gelir A aralığın içine düşüyor

Bir durumu belirtmek gerekir. Daha önce, rastgele bir değişkenin belirli bir rastgele olmayan aralığa düşme olasılığını tekrar tekrar değerlendirmiştik. Burada durum farklı: büyüklük A rastgele değildir ancak /p aralığı rastgeledir. X eksenindeki konumu rastgeledir ve merkezi tarafından belirlenir A; Genel olarak, 2s aralığının uzunluğu da rastgeledir, çünkü s'nin değeri kural olarak deneysel verilerden hesaplanır. Dolayısıyla bu durumda p değerini noktaya “vurma” olasılığı olarak değil de yorumlamak daha doğru olacaktır. A/ p aralığında ve rastgele bir / p aralığının noktayı kapsama olasılığı olarak A(Şekil 14.3.1).

Pirinç. 14.3.1

Olasılık p genellikle denir güven olasılığı, ve aralık / p - güven aralığı. Aralık sınırları Eğer. ax =a- kum bir 2 = bir + ve çağrılırlar sınırlara güvenin.

Güven aralığı kavramına başka bir yorum verelim: parametre değerlerinin aralığı olarak düşünülebilir A, Deneysel verilerle uyumlu ve onlarla çelişmeyen. Gerçekten de, a = 1-p olasılığı olan bir olayı pratik olarak imkansız olarak kabul edersek, o zaman a parametresinin değerleri bir - bir> s'nin deneysel verilerle çeliştiği kabul edilmelidir ve |a - A bir na 2.

Parametre için izin ver A tarafsız bir tahmin var A. Miktarın dağılım yasasını bilseydik A güven aralığını bulma görevi çok basit olacaktır: s değerini bulmak yeterli olacaktır.

Zorluk, tahminlerin dağılım yasasının A miktarın dağıtım yasasına bağlıdır X ve dolayısıyla bilinmeyen parametrelerinde (özellikle parametrenin kendisinde) A).

Bu zorluğu aşmak için aşağıdaki kabaca yaklaşık tekniği kullanabilirsiniz: s ifadesindeki bilinmeyen parametreleri nokta tahminleriyle değiştirin. Nispeten fazla sayıda deneyle N(yaklaşık 20...30) bu teknik genellikle doğruluk açısından tatmin edici sonuçlar verir.

Örnek olarak matematiksel beklenti için güven aralığı problemini düşünün.

Üretilsin N X,özellikleri matematiksel beklenti olan T ve varyans D- bilinmiyor. Bu parametreler için aşağıdaki tahminler elde edilmiştir:

Matematiksel beklenti için p güven olasılığına karşılık gelen bir güven aralığı / p oluşturmak gerekir. T miktarlar X.

Bu sorunu çözerken miktarın olduğu gerçeğini kullanacağız. T toplamı temsil eder N bağımsız özdeş dağıtılmış rastgele değişkenler Xh ve merkezi limit teoremine göre, yeterince büyük bir değer için N dağıtım kanunu normale yakındır. Uygulamada, nispeten az sayıda terimle (yaklaşık 10...20) bile, toplamın dağılım yasası yaklaşık olarak normal kabul edilebilir. Değerin olduğunu varsayacağız T normal kanuna göre dağıtılır. Bu yasanın özellikleri (matematiksel beklenti ve varyans) sırasıyla eşittir T Ve

(bkz. bölüm 13 alt bölüm 13.3). değeri olduğunu varsayalım. D bir Ep değeri biliyoruz ve bulacağız.

Bölüm 6'daki formül (6.3.5)'i kullanarak, (14.3.5)'in sol tarafındaki olasılığı normal dağılım fonksiyonuyla ifade ederiz.

tahminin standart sapması nerede T.

Denklemden.

Sp'nin değerini bulun:

burada arg Ф* (х), Ф*'ın ters fonksiyonudur (X), onlar. normal dağılım fonksiyonunun eşit olduğu argümanın böyle bir değeri X.

Dağılım D, miktarın ifade edildiği araç A 1P, tam olarak bilmiyoruz; yaklaşık değeri olarak tahmini kullanabilirsiniz D(14.3.4) ve yaklaşık olarak şunu belirtin:

Böylece, bir güven aralığı oluşturma sorunu yaklaşık olarak çözülmüştür ve bu şuna eşittir:

burada gp formül (14.3.7) ile belirlenir.

Sp hesaplanırken Ф* (l) fonksiyonunun tablolarında ters enterpolasyonu önlemek için, miktarın değerlerini veren özel bir tablonun (Tablo 14.3.1) derlenmesi uygundur.

r'ye bağlı olarak. (p) değeri, normal yasa için, ortaya çıkan alana girme olasılığının p'ye eşit olması için dağılım merkezinden sağa ve sola çizilmesi gereken standart sapmaların sayısını belirler.

7 p değeri kullanılarak güven aralığı şu şekilde ifade edilir:

Tablo 14.3.1

Örnek 1. Miktar üzerinde 20 deney yapıldı X; sonuçlar tabloda gösterilmektedir. 14.3.2.

Tablo 14.3.2

Miktarın matematiksel beklentisi için bir tahmin bulmak gerekir. X ve güven olasılığı p = 0,8'e karşılık gelen bir güven aralığı oluşturun.

Çözüm. Sahibiz:

Referans noktası olarak l: = 10'u seçerek, üçüncü formülü (14.2.14) kullanarak tarafsız tahmini buluruz D :

Tabloya göre 14.3.1 bulduk

Güven sınırları:

Güven aralığı:

Parametre değerleri T, Bu aralıkta yer alan değerler tabloda verilen deneysel verilerle uyumludur. 14.3.2.

Varyans için bir güven aralığı da benzer şekilde oluşturulabilir.

Üretilsin N rastgele bir değişken üzerinde bağımsız deneyler X hem A hem de dağılım için bilinmeyen parametrelerle D tarafsız bir tahmin elde edildi:

Varyans için yaklaşık olarak bir güven aralığı oluşturmak gerekir.

Formül (14.3.11)'den miktarın açık olduğu açıktır. D temsil etmek

miktar N formun rastgele değişkenleri. Bu değerler değil

bağımsızdır, çünkü bunlardan herhangi biri miktarı içerir T, herkese bağımlı. Ancak şunu söyleyebiliriz ki artan N toplamlarının dağılım yasası da normale yaklaşır. Neredeyse N= 20...30 zaten normal kabul edilebilir.

Bunun böyle olduğunu varsayalım ve bu yasanın özelliklerini bulalım: matematiksel beklenti ve dağılım. Değerlendirmeden bu yana D- tarafsız o zaman M[D] = D.

Fark hesaplaması D D nispeten karmaşık hesaplamalarla ilişkilidir, bu nedenle ifadesini türetmeden sunuyoruz:

burada q4 büyüklüğün dördüncü merkezi momentidir X.

Bu ifadeyi kullanmak için \u003d 4 değerlerini değiştirmeniz gerekir ve D(en azından yakın olanlar). Yerine D onun değerlendirmesini kullanabilirsin D. Prensip olarak, dördüncü merkezi moment aynı zamanda bir tahminle de değiştirilebilir, örneğin şu formun değeri:

ancak böyle bir değiştirme son derece düşük doğruluk sağlayacaktır, çünkü genel olarak sınırlı sayıda deneyle yüksek dereceli momentler büyük hatalarla belirlenir. Ancak uygulamada miktar dağıtım kanununun türü sıklıkla ortaya çıkar. Xönceden biliniyor: yalnızca parametreleri bilinmiyor. Daha sonra μ 4'ü ifade etmeyi deneyebilirsiniz. D.

En yaygın durumu ele alalım, değer X normal kanuna göre dağıtılır. Daha sonra dördüncü merkezi momenti dağılım cinsinden ifade edilir (bkz. Bölüm 6, alt bölüm 6.2);

ve formül (14.3.12) şunu verir: veya

(14.3.14)'teki bilinmeyenin değiştirilmesi D onun değerlendirmesi D, şunu alıyoruz: nereden

Moment μ 4 şu şekilde ifade edilebilir: D ayrıca bazı diğer durumlarda değerin dağılımı X normal değildir ancak görünümü bilinmektedir. Örneğin, düzgün yoğunluk yasası için (bkz. Bölüm 5) elimizde:

burada (a, P) yasanın belirtildiği aralıktır.

Buradan,

Formül (14.3.12)'yi kullanarak şunu elde ederiz: yaklaşık olarak nerede bulabiliriz

26 miktarı için dağıtım kanununun türünün bilinmediği durumlarda, a/) değerinin yaklaşık bir tahmini yapılırken, bu kanunun geçerli olduğuna inanmak için özel nedenler olmadığı sürece, yine de (14.3.16) formülünün kullanılması tavsiye edilir. normalden çok farklıdır (gözle görülür bir pozitif veya negatif basıklığa sahiptir).

Yaklaşık a/) değeri şu veya bu şekilde elde edilirse, matematiksel beklenti için oluşturduğumuz gibi varyans için de bir güven aralığı oluşturabiliriz:

burada verilen p olasılığına bağlı değer tabloya göre bulunur. 14.3.1.

Örnek 2. Bir rastgele değişkenin varyansı için yaklaşık %80 güven aralığını bulun Xörnek 1'deki koşullar altında, eğer değer biliniyorsa X normale yakın bir yasaya göre dağıtılıyor.

Çözüm. Değer tablodakiyle aynı kalır. 14.3.1:

Formüle göre (14.3.16)

Formül (14.3.18)'i kullanarak güven aralığını buluruz:

İlgili standart sapma değerleri aralığı: (0,21; 0,29).

14.4. Normal bir yasaya göre dağıtılan bir rastgele değişkenin parametreleri için güven aralıkları oluşturmak için kesin yöntemler

Önceki alt bölümde, matematiksel beklenti ve varyans için güven aralıkları oluşturmaya yönelik kabaca yaklaşık yöntemleri inceledik. Burada aynı sorunu çözmenin kesin yöntemleri hakkında bir fikir vereceğiz. Güven aralıklarını doğru bir şekilde bulmak için miktarın dağılım yasasının biçimini önceden bilmenin kesinlikle gerekli olduğunu vurguluyoruz. X, yaklaşık yöntemlerin uygulanması için bu gerekli değildir.

Güven aralıkları oluşturmak için doğru yöntemler fikri şu şekilde ortaya çıkıyor. Herhangi bir güven aralığı, ilgilendiğimiz tahmini de içeren belirli eşitsizliklerin gerçekleşme olasılığını ifade eden bir koşuldan bulunur. A. Değerleme dağılımı kanunu A genel durumda miktarın bilinmeyen parametrelerine bağlıdır X. Ancak bazen eşitsizlikleri rastgele bir değişkenden aktarmak mümkündür. A gözlemlenen değerlerin başka bir fonksiyonuna XpX2, ..., X s. bilinmeyen parametrelere bağlı olmayan, yalnızca deney sayısına ve miktarın dağılım yasasının türüne bağlı olan dağıtım yasası X. Bu tür rastgele değişkenler matematiksel istatistikte önemli bir rol oynar; miktarın normal dağılımı durumunda en ayrıntılı şekilde incelenmiştir. X.

Örneğin, değerin normal dağılımı ile kanıtlanmıştır. X rastgele değişken

sözde itaat eder Öğrenci dağıtım kanunuİle N- 1 serbestlik derecesi; bu yasanın yoğunluğu şu şekildedir

burada G(x) bilinen gama fonksiyonudur:

Ayrıca rastgele değişkenin olduğu da kanıtlanmıştır.

"%2 dağılımına" sahiptir N- Yoğunluğu formülle ifade edilen 1 serbestlik derecesi (bkz. Bölüm 7)

(14.4.2) ve (14.4.4) dağılımlarının türevleri üzerinde durmadan, parametreler için güven aralıkları oluşturulurken bunların nasıl uygulanabileceğini göstereceğiz. ty D.

Üretilsin N rastgele bir değişken üzerinde bağımsız deneyler X, bilinmeyen parametrelerle normal olarak dağıtılır İLE. Bu parametreler için tahminler elde edildi

Güven olasılığı p'ye karşılık gelen her iki parametre için güven aralıklarının oluşturulması gerekir.

Önce matematiksel beklenti için bir güven aralığı oluşturalım. Bu aralığın simetrik olarak alınması doğaldır. T; s p aralığın uzunluğunun yarısını göstersin. Koşulun sağlanması için s p değeri seçilmelidir.

Rastgele değişkenden eşitliğin (14.4.5) sol tarafına doğru ilerlemeye çalışalım T rastgele bir değişkene T,Öğrenci kanununa göre dağıtılır. Bunu yapmak için |m-w?| eşitsizliğinin her iki tarafını da çarpın.

pozitif bir değerle: veya (14.4.1) gösterimini kullanarak,

Koşuldan /p değerinin bulunabileceği bir sayı/p bulalım.

Formül (14.4.2)'den (1)'in çift fonksiyon olduğu açıktır, dolayısıyla (14.4.8) şunu verir:

Eşitlik (14.4.9), p'ye bağlı olarak /p değerini belirler. Eğer elinizde integral değerlerin yer aldığı bir tablo varsa

daha sonra /p değeri tabloda ters enterpolasyonla bulunabilir. Ancak önceden /p değerleri tablosu hazırlamak daha uygundur. Böyle bir tablo Ek'te verilmiştir (Tablo 5). Bu tablo p güven düzeyine ve serbestlik derecesi sayısına bağlı değerleri gösterir. N- 1. Tablodan / p'yi belirledikten sonra. 5 ve varsayıyorum

güven aralığının genişliğinin yarısını / p ve aralığın kendisini bulacağız

Örnek 1. Rastgele bir değişken üzerinde 5 bağımsız deney yapıldı X, bilinmeyen parametrelerle normal olarak dağıtılır T ve o. Deneylerin sonuçları tabloda verilmiştir. 14.4.1.

Tablo 14.4.1

Derecelendirmeyi bul T matematiksel beklenti için %90'lık bir güven aralığı / p oluşturun (yani güven olasılığına karşılık gelen aralık p = 0,9).

Çözüm. Sahibiz:

Başvurunun Tablo 5'ine göre P - 1 = 4 ve p = 0,9'u buluruz Neresi

Güven aralığı

Örnek 2. Alt bölüm 14.3'teki örnek 1'in koşulları için, değer varsayılarak X normal dağıldığına göre tam güven aralığını bulun.

Çözüm. Bulduğumuz ekteki tablo 5'e göre P - 1 = 19ir =

0,8 / p = 1,328; buradan

Alt bölüm 14.3'teki örnek 1'in çözümüyle (e p = 0.072) karşılaştırıldığında, tutarsızlığın çok önemsiz olduğuna inanıyoruz. Doğruluğu ikinci ondalık basamağa kadar korursak, kesin ve yaklaşık yöntemlerle bulunan güven aralıkları çakışır:

Varyans için bir güven aralığı oluşturmaya devam edelim. Tarafsız varyans tahmincisini düşünün

ve rastgele değişkeni ifade edin D büyüklükte V(14.4.3), x 2 (14.4.4) dağılımına sahip:

Miktarın dağılım yasasını bilmek V, belirli bir p olasılığı ile düştüğü /(1) aralığını bulabilirsiniz.

Dağıtım kanunu kn_x(v) Büyüklük I 7, Şekil 2'de gösterilen forma sahiptir. 14.4.1.

Pirinç. 14.4.1

Soru ortaya çıkıyor: / p aralığı nasıl seçilir? Büyüklük dağılım yasası ise V Simetrik olsaydı (normal yasa veya Öğrenci dağılımı gibi), matematiksel beklentiye göre /p aralığını simetrik almak doğal olurdu. Bu durumda kanun k p_x (v) asimetrik. Çıkış değerinin olasılıklarını sağlayacak şekilde /p aralığını seçmeyi kabul edelim. V sağ ve sol aralığın ötesinde (Şekil 14.4.1'deki gölgeli alanlar) aynı ve eşitti

Bu özellik ile bir /p aralığı oluşturmak için tabloyu kullanırız. 4 uygulama: sayıları içerir e)Öyle ki

değer için V, r serbestlik derecesi ile x 2 dağılımına sahip. Bizim durumumuzda r = n- 1. Haydi düzeltelim r = n- 1 ve tablonun ilgili satırında bulun. 4 iki anlam x 2 - biri olasılığa karşılık gelir diğeri - olasılık Bunları gösterelim

değerler saat 2'de Ve xl? Aralık var y 2, solunuzla ve evet~ sağ uç.

Şimdi /p aralığından D sınırları olan dağılım için istenen güven aralığını /| bulalım ve D2, bu noktayı kapsıyor D p olasılığı ile:

Noktayı kapsayan bir / (, = (?> ü А) aralığı oluşturalım. D ancak ve ancak değer V/r aralığına düşer. aralığın olduğunu gösterelim.

bu koşulu karşılıyor. Aslında eşitsizlikler eşitsizliklere eşdeğerdir

ve bu eşitsizlikler p olasılığı ile sağlanır. Böylece varyansın güven aralığı bulunmuş ve formül (14.4.13) ile ifade edilmiştir.

Örnek 3. Değerin şu şekilde olduğu biliniyorsa, alt bölüm 14.3'teki örnek 2'deki koşullar altında varyans için güven aralığını bulun. X normal olarak dağılmıştır.

Çözüm. Sahibiz . Ekteki tablo 4'e göre

bulduğumuz yer r = n - 1 = 19

(14.4.13) formülünü kullanarak varyansın güven aralığını buluruz

Standart sapmaya karşılık gelen aralık (0,21; 0,32)'dir. Bu aralık, yaklaşık yöntem kullanılarak alt bölüm 14.3'ün 2. örneğinde elde edilen aralığı (0,21; 0,29) yalnızca biraz aşmaktadır.

  • Şekil 14.3.1'de a'ya göre simetrik bir güven aralığı ele alınmaktadır. Genel olarak daha sonra göreceğimiz gibi bu gerekli değildir.


Makaleyi beğendin mi? Arkadaşlarınızla paylaşın!