Apa yang disebut interval kepercayaan. Estimasi titik dan interval berat jenis

INTERVAL KEPERCAYAAN UNTUK FREKUENSI DAN FRAKSI

© 2008

Institut Kesehatan Masyarakat Nasional, Oslo, Norwegia

Artikel ini menjelaskan dan membahas tentang perhitungan interval kepercayaan frekuensi dan proporsi menggunakan metode Wald, Wilson, Clopper – Pearson, menggunakan transformasi sudut dan metode Wald dengan koreksi Agresti – Coull. Materi yang disajikan memberikan informasi umum tentang metode penghitungan interval kepercayaan frekuensi dan proporsi dan dimaksudkan untuk membangkitkan minat pembaca jurnal tidak hanya dalam menggunakan interval kepercayaan ketika mempresentasikan hasil penelitiannya sendiri, tetapi juga dalam membaca literatur khusus sebelum mulai bekerja. pada publikasi mendatang.

Kata kunci: interval kepercayaan, frekuensi, proporsi

Salah satu publikasi sebelumnya secara singkat menyebutkan deskripsi data kualitatif dan melaporkan bahwa estimasi intervalnya lebih baik daripada estimasi titik untuk menggambarkan frekuensi kemunculan karakteristik yang sedang dipelajari dalam populasi. Memang, karena penelitian dilakukan dengan menggunakan data sampel, maka proyeksi hasilnya ke populasi harus mengandung unsur ketidaktepatan pengambilan sampel. Interval kepercayaan adalah ukuran keakuratan parameter yang diestimasi. Menariknya, beberapa buku tentang statistik dasar untuk dokter sama sekali mengabaikan topik interval kepercayaan untuk frekuensi. Dalam artikel ini kita akan melihat beberapa cara untuk menghitung interval kepercayaan untuk frekuensi, yang menyiratkan karakteristik sampel seperti non-pengulangan dan keterwakilan, serta independensi observasi satu sama lain. Dalam artikel ini, frekuensi dipahami bukan sebagai angka absolut yang menunjukkan berapa kali suatu nilai tertentu muncul secara agregat, tetapi sebagai nilai relatif yang menentukan proporsi partisipan penelitian yang memiliki karakteristik yang diteliti.

Dalam penelitian biomedis, interval kepercayaan 95% paling sering digunakan. Interval kepercayaan ini adalah wilayah di mana proporsi sebenarnya turun 95% dari keseluruhan waktu. Dengan kata lain, kita dapat mengatakan dengan reliabilitas 95% bahwa nilai sebenarnya dari frekuensi kemunculan suatu sifat dalam populasi akan berada dalam interval kepercayaan 95%.

Kebanyakan manual statistik untuk peneliti medis melaporkan bahwa kesalahan frekuensi dihitung menggunakan rumus

dimana p adalah frekuensi kemunculan suatu karakteristik dalam sampel (nilai dari 0 hingga 1). Sebagian besar artikel ilmiah dalam negeri menunjukkan nilai frekuensi kemunculan suatu sifat dalam suatu sampel (p), serta kesalahannya dalam bentuk p ± s. Namun, akan lebih tepat untuk menyajikan interval kepercayaan 95% untuk frekuensi kemunculan suatu sifat dalam populasi, yang akan mencakup nilai-nilai dari

ke.

Beberapa manual merekomendasikan bahwa untuk sampel kecil, ganti nilai 1,96 dengan nilai t untuk N – 1 derajat kebebasan, dimana N adalah jumlah observasi dalam sampel. Nilai t dicari dengan menggunakan tabel distribusi t yang tersedia di hampir semua buku teks statistika. Penggunaan distribusi t untuk metode Wald tidak memberikan keuntungan nyata dibandingkan metode lain yang dibahas di bawah, dan oleh karena itu tidak direkomendasikan oleh beberapa penulis.

Metode yang disajikan di atas untuk menghitung interval kepercayaan untuk frekuensi atau proporsi diberi nama Wald untuk menghormati Abraham Wald (1902–1950), karena penggunaannya secara luas dimulai setelah publikasi Wald dan Wolfowitz pada tahun 1939. Namun, metode ini sendiri diusulkan oleh Pierre Simon Laplace (1749–1827) pada tahun 1812.

Metode Wald sangat populer, namun penerapannya penuh dengan masalah yang signifikan. Metode ini tidak direkomendasikan untuk ukuran sampel yang kecil, serta dalam kasus di mana frekuensi kemunculan suatu karakteristik cenderung ke 0 atau 1 (0% atau 100%) dan tidak mungkin dilakukan untuk frekuensi 0 dan 1. Selain itu, perkiraan distribusi normal, yang digunakan saat menghitung kesalahan, “tidak berfungsi” dalam kasus di mana n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Karena variabel baru terdistribusi normal, batas bawah dan atas selang kepercayaan 95% untuk variabel φ adalah φ-1,96 dan φ+1,96kiri">

Daripada 1,96 untuk sampel kecil, disarankan untuk mengganti nilai t dengan N – 1 derajat kebebasan. Metode ini tidak menghasilkan nilai negatif dan memungkinkan estimasi interval kepercayaan frekuensi yang lebih akurat dibandingkan metode Wald. Selain itu, hal ini dijelaskan dalam banyak buku referensi domestik tentang statistik medis, namun belum menyebabkan penggunaannya secara luas dalam penelitian medis. Perhitungan interval kepercayaan menggunakan transformasi sudut tidak disarankan untuk frekuensi mendekati 0 atau 1.

Di sinilah uraian tentang metode memperkirakan interval kepercayaan di sebagian besar buku tentang dasar-dasar statistik untuk peneliti medis biasanya berakhir, dan masalah ini tidak hanya terjadi pada literatur dalam negeri tetapi juga pada literatur asing. Kedua metode ini didasarkan pada teorema limit pusat, yang menyiratkan sampel yang besar.

Mempertimbangkan kekurangan dalam memperkirakan interval kepercayaan menggunakan metode di atas, Clopper dan Pearson pada tahun 1934 mengusulkan metode untuk menghitung apa yang disebut interval kepercayaan eksak, dengan mempertimbangkan distribusi binomial dari sifat yang sedang dipelajari. Metode ini tersedia di banyak kalkulator online, namun interval kepercayaan yang diperoleh dengan cara ini dalam banyak kasus terlalu lebar. Pada saat yang sama, metode ini direkomendasikan untuk digunakan jika penilaian konservatif diperlukan. Tingkat konservatif metode ini meningkat seiring dengan berkurangnya ukuran sampel, terutama ketika N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Menurut banyak ahli statistik, penilaian interval kepercayaan yang paling optimal untuk frekuensi dilakukan dengan metode Wilson, yang diusulkan pada tahun 1927, tetapi praktis tidak digunakan dalam penelitian biomedis dalam negeri. Metode ini tidak hanya memungkinkan seseorang memperkirakan interval kepercayaan untuk frekuensi yang sangat kecil dan sangat besar, namun juga dapat diterapkan untuk sejumlah kecil observasi. Secara umum selang kepercayaan menurut rumus Wilson berbentuk



dimana mengambil nilai 1,96 saat menghitung interval kepercayaan 95%, N adalah jumlah observasi, dan p adalah frekuensi kemunculan suatu karakteristik dalam sampel. Cara ini tersedia di kalkulator online, sehingga penggunaannya tidak bermasalah. dan tidak menyarankan penggunaan metode ini untuk n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Selain metode Wilson, metode Wald dengan koreksi Agresti–Coll juga diyakini dapat memberikan estimasi interval kepercayaan frekuensi yang optimal. Koreksi Agresti-Coll adalah penggantian dalam rumus Wald frekuensi kemunculan suatu sifat dalam sampel (p) dengan p`, dalam perhitungannya ditambah 2 pada pembilangnya dan 4 pada penyebutnya, yaitu, p` = (X + 2) / (N + 4), dimana X adalah jumlah partisipan penelitian yang mempunyai karakteristik yang diteliti, dan N adalah besarnya sampel. Modifikasi ini memberikan hasil yang sangat mirip dengan rumus Wilson, kecuali jika frekuensi kejadian mendekati 0% atau 100% dan sampelnya kecil. Selain metode di atas untuk menghitung interval kepercayaan untuk frekuensi, koreksi kontinuitas telah diusulkan untuk metode Wald dan Wilson untuk sampel kecil, namun penelitian menunjukkan bahwa penggunaannya tidak tepat.

Mari kita pertimbangkan penerapan metode di atas untuk menghitung interval kepercayaan menggunakan dua contoh. Dalam kasus pertama, kami mempelajari sampel besar yang terdiri dari 1.000 peserta studi yang dipilih secara acak, 450 di antaranya memiliki sifat yang sedang dipelajari (ini bisa berupa faktor risiko, hasil, atau sifat lainnya), yang mewakili frekuensi 0,45, atau 45. %. Pada kasus kedua, penelitian dilakukan dengan menggunakan sampel yang kecil, katakanlah hanya 20 orang, dan hanya 1 peserta penelitian (5%) yang memiliki sifat yang diteliti. Interval kepercayaan menggunakan metode Wald, metode Wald dengan koreksi Agresti–Coll, dan metode Wilson dihitung menggunakan kalkulator online yang dikembangkan oleh Jeff Sauro (//www./wald.htm). Interval kepercayaan terkoreksi kontinuitas Wilson dihitung menggunakan kalkulator yang disediakan oleh Wassar Stats: Situs Web untuk Perhitungan Statistik (//faculty.vassar.edu/lowry/prop1.html). Perhitungan transformasi Angular Fisher dilakukan secara manual menggunakan nilai t kritis untuk masing-masing 19 dan 999 derajat kebebasan. Hasil perhitungan disajikan dalam tabel untuk kedua contoh.

Interval kepercayaan dihitung dengan enam cara berbeda untuk dua contoh yang dijelaskan dalam teks

Metode perhitungan interval kepercayaan

P=0,0500, atau 5%

CI 95% untuk X=450, N=1000, P=0,4500, atau 45%

–0,0455–0,2541

Wald dengan koreksi Agresti – Coll

<,0001–0,2541

Wilson dengan koreksi kontinuitas

Clopper–Pearson "metode yang tepat"

Transformasi sudut

<0,0001–0,1967

Seperti dapat dilihat dari tabel, untuk contoh pertama, interval kepercayaan yang dihitung menggunakan metode Wald yang “diterima secara umum” memasuki wilayah negatif, yang tidak berlaku untuk frekuensi. Sayangnya, kejadian seperti itu sering terjadi dalam sastra Rusia. Cara tradisional dalam menyajikan data dalam hal frekuensi dan kesalahannya menutupi sebagian masalah ini. Misalnya, jika frekuensi kemunculan suatu sifat (dalam persentase) disajikan sebagai 2,1 ± 1,4, maka ini tidak “menyinggung mata” seperti 2,1% (95% CI: –0,7; 4,9), meskipun dan berarti hal yang sama. Metode Wald dengan koreksi Agresti–Coll dan perhitungan menggunakan transformasi sudut memberikan batas bawah yang cenderung nol. Metode Wilson yang dikoreksi kontinuitas dan "metode eksak" menghasilkan interval kepercayaan yang lebih luas dibandingkan metode Wilson. Untuk contoh kedua, semua metode memberikan interval kepercayaan yang kira-kira sama (perbedaan hanya muncul dalam seperseribu), yang tidak mengherankan, karena frekuensi kejadian dalam contoh ini tidak jauh berbeda dari 50%, dan ukuran sampelnya adalah cukup besar.

Bagi pembaca yang tertarik dengan masalah ini, kami dapat merekomendasikan karya R. G. Newcombe dan Brown, Cai dan Dasgupta, yang memberikan pro dan kontra penggunaan 7 dan 10 metode berbeda untuk menghitung interval kepercayaan. Di antara manual domestik, kami merekomendasikan buku dan, yang, selain penjelasan rinci tentang teorinya, menyajikan metode Wald dan Wilson, serta metode untuk menghitung interval kepercayaan dengan mempertimbangkan distribusi frekuensi binomial. Selain kalkulator online gratis (http://www. /wald.htm dan http://faculty.vassar.edu/lowry/prop1.html), interval kepercayaan untuk frekuensi (dan tidak hanya!) dapat dihitung menggunakan Program CIA ( Confidence Intervals Analysis), yang dapat diunduh dari http://www. sekolah kedokteran. soton. ac. Inggris/cia/ .

Artikel berikutnya akan membahas cara univariat untuk membandingkan data kualitatif.

Referensi

Banerji A. Statistik medis dalam bahasa yang jelas: kursus pengantar / A. Banerjee. – M.: Praktek Kedokteran, 2007. – 287 hal. Statistik medis / . – M.: Badan Penerangan Medis, 2007. – 475 hal. Glanz S. Statistik medis dan biologi / S. Glanz. – M.: Praktika, 1998. Tipe data, pengujian distribusi dan statistik deskriptif // Ekologi Manusia – 2008. – No. 1. – P. 52–58. Zhizhin K.S.. Statistik medis: buku teks / . – Rostov tidak ada: Phoenix, 2007. – 160 hal. Statistik medis terapan / , . – Sankt Peterburg. : Foliot, 2003. – 428 hal. Lakin G.F. Biometrik / . – M.: Sekolah Tinggi, 1990. – 350 hal. Medis V.A. Statistik matematika dalam kedokteran / , . – M.: Keuangan dan Statistik, 2007. – 798 hal. Statistik matematika dalam penelitian klinis / , . – M.: GEOTAR-MED, 2001. – 256 hal. Junkerov V.Sejarah pertemuanJunkerov V. DAN. Pemrosesan medis dan statistik dari data penelitian medis / , . – Sankt Peterburg. : VmedA, 2002. – 266 hal. Agresti A. Perkiraan lebih baik daripada eksak untuk estimasi interval proporsi binomial / A. Agresti, B. Coull // Ahli statistik Amerika. – 1998. – N 52. – Hal.119–126. Altman D. Statistik dengan percaya diri // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – London: BMJ Books, 2000. – 240 hal. LD Coklat Estimasi interval untuk proporsi binomial / L. D. Brown, T. T. Cai, A. Dasgupta // Ilmu statistik. – 2001. – N 2. – Hal.101–133. Clopper C.J. Penggunaan batas keyakinan atau fidusia diilustrasikan dalam kasus binomial / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – Hal.404–413. Garcia-Perez M.A. Tentang selang kepercayaan untuk parameter binomial / M. A. Garcia-Perez // Kualitas dan kuantitas. – 2005. – N 39. – Hal.467–481. Motulsky H.Sejarah pertemuanMotulsky H. Biostatistik intuitif // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 hal. Newcombe R.G. Interval Keyakinan Dua Sisi untuk Proporsi Tunggal: Perbandingan Tujuh Metode / R. G. Newcombe // Statistik dalam Kedokteran. – 1998. – N.17. – Hal.857–872. Sauro J. Memperkirakan tingkat penyelesaian dari sampel kecil menggunakan interval kepercayaan binomial: perbandingan dan rekomendasi / J. Sauro, J. R. Lewis // Prosiding pertemuan tahunan masyarakat faktor manusia dan ergonomi. –Orlando, FL, 2005. Wald A. Batas kepercayaan untuk fungsi distribusi kontinu // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – Hal.105–118. Wilson E.B. Kemungkinan inferensi, hukum suksesi, dan inferensi statistik / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – Hal.209–212.

INTERVAL KEPERCAYAAN UNTUK PROPORSI

A. M.Grjibovski

Institut Kesehatan Masyarakat Nasional, Oslo, Norwegia

Artikel ini menyajikan beberapa metode perhitungan interval kepercayaan untuk proporsi binomial, yaitu metode Wald, Wilson, arcsine, Agresti-Coull dan eksak Clopper-Pearson. Makalah ini hanya memberikan pengenalan umum terhadap masalah estimasi interval kepercayaan dari proporsi binomial dan tujuannya tidak hanya untuk merangsang pembaca untuk menggunakan interval kepercayaan ketika menyajikan hasil penelitian empiris mereka sendiri, tetapi juga untuk mendorong mereka untuk membaca buku statistik. sebelum menganalisis data sendiri dan menyiapkan naskah.

Kata-kata kunci: interval kepercayaan, proporsi

Informasi kontak:

Penasihat Senior, Institut Kesehatan Masyarakat Nasional, Oslo, Norwegia

Interval kepercayaan ( Bahasa inggris Interval Keyakinan) salah satu jenis estimasi interval yang digunakan dalam statistik, yang dihitung untuk tingkat signifikansi tertentu. Mereka memungkinkan kita untuk membuat pernyataan bahwa nilai sebenarnya dari parameter statistik populasi yang tidak diketahui berada dalam kisaran nilai yang diperoleh dengan probabilitas yang ditentukan oleh tingkat signifikansi statistik yang dipilih.

Distribusi biasa

Ketika varians (σ 2) dari populasi data diketahui, maka z-score dapat digunakan untuk menghitung batas kepercayaan (titik akhir interval kepercayaan). Dibandingkan dengan menggunakan distribusi-t, menggunakan skor-z akan memungkinkan Anda membuat tidak hanya interval kepercayaan yang lebih sempit, namun juga estimasi yang lebih andal atas nilai yang diharapkan dan deviasi standar (σ), karena skor-z didasarkan pada a distribusi normal.

Rumus

Untuk menentukan titik batas selang kepercayaan, asalkan diketahui simpangan baku populasi data, digunakan rumus sebagai berikut:

L = X - Z α/2 σ
√n

Contoh

Asumsikan ukuran sampel adalah 25 observasi, nilai ekspektasi sampel adalah 15, dan deviasi standar populasi adalah 8. Untuk tingkat signifikansi α=5%, skor Z adalah Z α/2 =1,96. Dalam hal ini, batas bawah dan atas dari interval kepercayaan adalah

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Jadi, kita dapat mengatakan bahwa dengan probabilitas 95% ekspektasi matematis populasi akan berada pada kisaran 11.864 hingga 18.136.

Metode untuk mempersempit interval kepercayaan

Mari kita asumsikan bahwa kisaran tersebut terlalu luas untuk tujuan penelitian kita. Ada dua cara untuk mengurangi rentang interval kepercayaan.

  1. Kurangi tingkat signifikansi statistik α.
  2. Tingkatkan ukuran sampel.

Mengurangi tingkat signifikansi statistik menjadi α=10%, kita memperoleh skor Z yang sama dengan Z α/2 =1,64. Dalam hal ini, batas bawah dan atas intervalnya adalah

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

Dan selang kepercayaannya sendiri dapat dituliskan dalam bentuk

Dalam hal ini, kita dapat membuat asumsi bahwa dengan probabilitas 90% ekspektasi matematis populasi akan berada dalam kisaran tersebut.

Jika kita tidak ingin mengurangi tingkat signifikansi statistik α, maka satu-satunya alternatif adalah menambah ukuran sampel. Menambahnya menjadi 144 observasi, diperoleh nilai batas kepercayaan sebagai berikut

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Interval kepercayaan itu sendiri akan berbentuk sebagai berikut

Dengan demikian, mempersempit interval kepercayaan tanpa mengurangi tingkat signifikansi statistik hanya dapat dilakukan dengan meningkatkan ukuran sampel. Jika peningkatan ukuran sampel tidak memungkinkan, maka penyempitan interval kepercayaan dapat dicapai hanya dengan mengurangi tingkat signifikansi statistik.

Membangun interval kepercayaan untuk distribusi selain normal

Jika simpangan baku populasi tidak diketahui atau distribusinya berbeda dari normal, distribusi t digunakan untuk membangun interval kepercayaan. Teknik ini lebih konservatif yang tercermin pada interval kepercayaan yang lebih lebar dibandingkan dengan teknik berdasarkan Z-score.

Rumus

Untuk menghitung batas bawah dan atas selang kepercayaan berdasarkan distribusi t, gunakan rumus berikut

L = X - t α σ
√n

Distribusi Student atau distribusi t hanya bergantung pada satu parameter - jumlah derajat kebebasan, yang sama dengan jumlah nilai individu dari atribut (jumlah observasi dalam sampel). Nilai uji-t Student untuk sejumlah derajat kebebasan (n) tertentu dan tingkat signifikansi statistik α dapat ditemukan pada tabel referensi.

Contoh

Asumsikan ukuran sampel adalah 25 nilai individu, nilai harapan sampel adalah 50, dan deviasi standar sampel adalah 28. Interval kepercayaan perlu dibuat untuk tingkat signifikansi statistik α=5%.

Dalam kasus kami, jumlah derajat kebebasan adalah 24 (25-1), oleh karena itu nilai tabel uji-t Student untuk tingkat signifikansi statistik α=5% adalah 2,064. Oleh karena itu, batas bawah dan batas atas selang kepercayaan adalah

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

Dan intervalnya sendiri dapat dituliskan dalam bentuk

Jadi, kita dapat mengatakan bahwa dengan probabilitas 95% ekspektasi matematis populasi akan berada dalam kisaran tersebut.

Penggunaan distribusi t memungkinkan Anda mempersempit interval kepercayaan dengan mengurangi signifikansi statistik atau dengan meningkatkan ukuran sampel.

Dengan mengurangi signifikansi statistik dari 95% menjadi 90% berdasarkan kondisi contoh kita, kita memperoleh nilai tabel uji-t Student yang sesuai sebesar 1,711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

Dalam hal ini, kita dapat mengatakan bahwa dengan probabilitas 90% ekspektasi matematis populasi akan berada dalam kisaran tersebut.

Jika kita tidak ingin mengurangi signifikansi statistik, maka satu-satunya alternatif adalah menambah ukuran sampel. Katakanlah itu adalah 64 pengamatan individu, dan bukan 25 seperti pada kondisi awal contoh. Nilai tabel uji-t Student untuk 63 derajat kebebasan (64-1) dan tingkat signifikansi statistik α=5% adalah 1,998.

L = 50 - 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Hal ini memungkinkan kita untuk mengatakan bahwa dengan probabilitas 95% ekspektasi matematis populasi akan berada dalam kisaran tersebut.

Sampel besar

Sampel besar adalah sampel dari suatu populasi data yang jumlah observasi individunya melebihi 100. Studi statistik menunjukkan bahwa sampel yang lebih besar cenderung berdistribusi normal, meskipun sebaran populasinya tidak normal. Selain itu, untuk sampel seperti itu, penggunaan skor-z dan distribusi-t memberikan hasil yang kira-kira sama ketika membangun interval kepercayaan. Jadi, untuk sampel besar, penggunaan skor-z untuk distribusi normal dapat diterima, bukan distribusi-t.

Mari kita simpulkan

Interval kepercayaan.

Perhitungan interval kepercayaan didasarkan pada kesalahan rata-rata dari parameter yang bersangkutan. Interval kepercayaan menunjukkan dalam batas berapa probabilitas (1-a) terletak nilai sebenarnya dari parameter yang diestimasi. Di sini a adalah tingkat signifikansi, (1-a) disebut juga probabilitas keyakinan.

Pada bab pertama kita telah menunjukkan bahwa, misalnya, untuk mean aritmatika, mean populasi sebenarnya pada sekitar 95% kasus terletak pada 2 kesalahan standar dari mean tersebut. Dengan demikian, batas selang kepercayaan 95% untuk mean akan dipisahkan dari mean sampel sebesar dua kali lipat error mean dari mean, yaitu. kita mengalikan kesalahan rata-rata dari mean dengan koefisien tertentu tergantung pada tingkat kepercayaan. Untuk mean dan selisih mean diambil koefisien Student (nilai kritis uji Student), untuk share dan selisih share diambil nilai kritis uji z. Produk dari koefisien dan kesalahan rata-rata dapat disebut kesalahan maksimum dari suatu parameter tertentu, yaitu. maksimal yang bisa kita peroleh saat menilainya.

Interval kepercayaan untuk rata-rata aritmatika : .

Berikut adalah contoh meannya;

Kesalahan rata-rata dari mean aritmatika;

S - standar deviasi sampel;

N

f = n-1 (Koefisien Siswa).

Interval kepercayaan untuk perbedaan cara aritmatika :

Berikut perbedaan antara mean sampel;

- kesalahan rata-rata selisih antara rata-rata aritmatika;

s 1 , s 2 – contoh deviasi standar;

n1,n2

Nilai kritis uji Siswa untuk taraf signifikansi tertentu a dan banyaknya derajat kebebasan f=n 1 +n 2-2 (Koefisien Siswa).

Interval kepercayaan untuk saham :

.

Di sini d adalah fraksi sampel;

– kesalahan pecahan rata-rata;

N– ukuran sampel (ukuran kelompok);

Interval kepercayaan untuk perbedaan saham :

Berikut perbedaan sampel sahamnya;

– kesalahan rata-rata selisih antara rata-rata aritmatika;

n1,n2– volume sampel (jumlah kelompok);

Nilai kritis kriteria z pada tingkat signifikansi tertentu a ( , , ).

Dengan menghitung interval kepercayaan untuk perbedaan antar indikator, pertama-tama kita melihat secara langsung kemungkinan nilai efeknya, dan bukan hanya perkiraan titiknya. Kedua, kita dapat menarik kesimpulan tentang diterima atau ditolaknya hipotesis nol dan ketiga, kita dapat menarik kesimpulan tentang kekuatan pengujian.

Saat menguji hipotesis menggunakan interval kepercayaan, Anda harus mematuhi aturan berikut:

Jika selang kepercayaan 100(1-a) persen perbedaan rata-rata tidak mengandung nol, maka perbedaan tersebut signifikan secara statistik pada tingkat signifikansi a; sebaliknya, jika interval ini mengandung nol, maka perbedaannya tidak signifikan secara statistik.

Memang, jika interval ini mengandung nol, maka indikator yang dibandingkan mungkin lebih besar atau lebih kecil pada salah satu kelompok dibandingkan dengan kelompok lainnya, yaitu. perbedaan yang diamati disebabkan oleh kebetulan.

Kekuatan tes dapat dinilai dari letak angka nol dalam selang kepercayaan. Jika angka nol mendekati batas bawah atau batas atas interval, maka mungkin dengan jumlah kelompok yang dibandingkan lebih banyak, perbedaannya akan mencapai signifikansi statistik. Jika nol mendekati pertengahan interval, berarti kenaikan dan penurunan indikator pada kelompok eksperimen memiliki kemungkinan yang sama, dan mungkin memang tidak ada perbedaan.

Contoh:

Untuk membandingkan angka kematian akibat pembedahan dengan menggunakan dua jenis anestesi yang berbeda: 61 orang dioperasi dengan anestesi jenis pertama, 8 orang meninggal, dengan tipe kedua – 67 orang, 10 orang meninggal.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Selisih tingkat kematian metode yang dibandingkan akan berada pada kisaran (-0,018 - 0,122; -0,018 + 0,122) atau (-0,14; 0,104) dengan probabilitas 100(1-a) = 95%. Intervalnya berisi nol, mis. hipotesis kematian yang sama dengan dua jenis anestesi yang berbeda tidak dapat ditolak.

Dengan demikian, angka kematian dapat dan akan turun menjadi 14% dan meningkat menjadi 10,4% dengan probabilitas 95%, yaitu nol kira-kira berada di tengah-tengah interval, sehingga dapat dikatakan bahwa, kemungkinan besar, kedua metode ini sebenarnya tidak berbeda dalam hal mematikan.

Pada contoh yang telah dibahas sebelumnya, rata-rata waktu penekanan selama tes sadap dibandingkan pada empat kelompok siswa yang berbeda nilai ujiannya. Mari kita hitung interval kepercayaan rata-rata waktu menekan siswa yang lulus ujian dengan nilai 2 dan 5 dan interval kepercayaan selisih antara rata-rata tersebut.

Koefisien Student dicari dengan menggunakan tabel distribusi Student (lihat lampiran): untuk kelompok pertama: = t(0,05;48) = 2,011; untuk kelompok kedua: = t(0,05;61) = 2,000. Jadi selang kepercayaan kelompok pertama: = (162.19-2.011*2.18; 162.19+2.011*2.18) = (157.8; 166.6), untuk kelompok kedua (156.55- 2.000*1.88 ; 156.55+2.000*1.88) = (152.8 ; 160.3). Jadi, bagi mereka yang lulus ujian dengan 2, rata-rata waktu menekan berkisar antara 157,8 ms hingga 166,6 ms dengan probabilitas 95%, bagi mereka yang lulus ujian dengan 5 – dari 152,8 ms hingga 160,3 ms dengan probabilitas 95% .

Anda juga dapat menguji hipotesis nol menggunakan interval kepercayaan untuk rata-rata, dan bukan hanya untuk perbedaan rata-rata. Misalnya, seperti dalam kasus kita, jika interval kepercayaan untuk rata-rata tumpang tindih, maka hipotesis nol tidak dapat ditolak. Untuk menolak hipotesis pada tingkat signifikansi yang dipilih, interval kepercayaan yang bersangkutan tidak boleh tumpang tindih.

Mari kita cari selang kepercayaan selisih rata-rata waktu menekan pada kelompok yang lulus ujian dengan nilai 2 dan 5. Selisih rata-rata: 162,19 – 156,55 = 5,64. Koefisien siswa: = t(0.05;49+62-2) = t(0.05;109) = 1.982. Simpangan baku kelompok akan sama dengan: ; . Kami menghitung kesalahan rata-rata dari perbedaan rata-rata: . Interval kepercayaan: =(5.64-1.982*2.87; 5.64+1.982*2.87) = (-0.044; 11.33).

Jadi, selisih rata-rata waktu menekan pada kelompok yang lulus ujian dengan 2 dan 5 berkisar antara -0,044 ms hingga 11,33 ms. Interval ini mencakup nol, mis. Rata-rata waktu mendesak bagi mereka yang lulus ujian dengan baik dapat bertambah atau berkurang dibandingkan dengan mereka yang lulus ujian dengan kurang memuaskan, yaitu. hipotesis nol tidak dapat ditolak. Namun angka nol sangat mendekati batas bawah, dan waktu menekannya kemungkinan besar akan berkurang bagi mereka yang lulus dengan baik. Dengan demikian, kita dapat menyimpulkan bahwa masih terdapat perbedaan rata-rata waktu pengepresan antara mereka yang melewati 2 dan 5, hanya saja kita tidak dapat mendeteksinya mengingat perubahan waktu rata-rata, penyebaran waktu rata-rata dan ukuran sampel.



Kekuatan suatu tes adalah probabilitas menolak hipotesis nol yang salah, yaitu menemukan perbedaan di tempat yang sebenarnya ada.

Kekuatan tes ditentukan berdasarkan tingkat signifikansi, besarnya perbedaan antar kelompok, penyebaran nilai dalam kelompok dan besarnya sampel.

Untuk uji t Student dan analisis varians, diagram sensitivitas dapat digunakan.

Kekuatan kriteria dapat digunakan untuk menentukan terlebih dahulu jumlah kelompok yang dibutuhkan.

Interval kepercayaan menunjukkan dalam batas mana nilai sebenarnya dari parameter yang diperkirakan terletak pada probabilitas tertentu.

Dengan menggunakan interval kepercayaan, Anda dapat menguji hipotesis statistik dan menarik kesimpulan tentang sensitivitas kriteria.

LITERATUR.

Glanz S. – Bab 6,7.

Rebrova O.Yu. – hal.112-114, hal.171-173, hal.234-238.

Sidorenko E.V. – hal.32-33.

Pertanyaan untuk menguji diri siswa.

1. Apa kekuatan kriterianya?

2. Dalam hal apa perlunya mengevaluasi kekuatan kriteria?

3. Metode penghitungan daya.

6. Bagaimana cara menguji hipotesis statistik menggunakan interval kepercayaan?

7. Apa yang dapat dikatakan tentang kekuatan kriteria ketika menghitung selang kepercayaan?

Tugas.

Seringkali penilai harus menganalisis pasar real estat di segmen di mana properti yang dinilai berada. Jika pasar berkembang, akan sulit untuk menganalisis seluruh rangkaian objek yang disajikan, sehingga sampel objek digunakan untuk analisis. Sampel ini tidak selalu homogen; terkadang perlu untuk menghilangkan titik-titik ekstrem - penawaran pasar yang terlalu tinggi atau terlalu rendah. Untuk tujuan ini digunakan interval kepercayaan. Tujuan dari penelitian ini adalah untuk melakukan analisis komparatif dari dua metode untuk menghitung interval kepercayaan dan memilih opsi perhitungan yang optimal ketika bekerja dengan sampel yang berbeda dalam sistem estimatica.pro.

Interval kepercayaan adalah interval nilai atribut yang dihitung berdasarkan suatu sampel, yang dengan probabilitas yang diketahui memuat parameter estimasi populasi umum.

Maksud menghitung interval kepercayaan adalah untuk membangun interval tersebut berdasarkan data sampel sehingga dapat dinyatakan dengan probabilitas tertentu bahwa nilai parameter estimasi berada pada interval tersebut. Dengan kata lain, selang kepercayaan memuat nilai taksiran yang tidak diketahui nilainya dengan probabilitas tertentu. Semakin lebar intervalnya, semakin tinggi ketidakakuratannya.

Ada beberapa metode berbeda untuk menentukan interval kepercayaan. Pada artikel ini kita akan melihat 2 metode:

  • melalui median dan standar deviasi;
  • melalui nilai kritis t-statistik (koefisien Student).

Tahapan analisis komparatif berbagai metode penghitungan CI:

1. membentuk sampel data;

2. kami mengolahnya menggunakan metode statistik: kami menghitung nilai rata-rata, median, varians, dll;

3. menghitung selang kepercayaan dengan dua cara;

4. menganalisis sampel yang telah dibersihkan dan interval kepercayaan yang dihasilkan.

Tahap 1. Pengambilan sampel data

Sampel dibentuk dengan menggunakan sistem estimatica.pro. Sampelnya mencakup 91 penawaran untuk penjualan apartemen 1 kamar di zona harga ke-3 dengan tipe tata letak “Khrushchev”.

Tabel 1. Sampel awal

Harga 1 m2, satuan

Gambar.1. Sampel awal



Tahap 2. Pengolahan sampel awal

Pemrosesan sampel menggunakan metode statistik memerlukan perhitungan nilai-nilai berikut:

1. Rata-rata aritmatika

2. Median - angka yang mencirikan sampel: tepat separuh elemen sampel lebih besar dari median, separuh lainnya lebih kecil dari median

(untuk sampel dengan jumlah nilai ganjil)

3. Range – selisih antara nilai maksimum dan minimum dalam sampel

4. Varians - digunakan untuk memperkirakan variasi data dengan lebih akurat

5. Standar deviasi sampel (selanjutnya disebut SD) adalah indikator paling umum dari dispersi nilai penyesuaian di sekitar mean aritmatika.

6. Koefisien variasi - mencerminkan tingkat hamburan nilai penyesuaian

7. koefisien osilasi - mencerminkan fluktuasi relatif nilai harga ekstrem dalam sampel di sekitar rata-rata

Tabel 2. Indikator statistik sampel asli

Koefisien variasi yang mencirikan homogenitas data adalah 12,29%, namun koefisien osilasinya terlalu tinggi. Oleh karena itu, kita dapat mengatakan bahwa sampel asli tidak homogen, jadi mari kita lanjutkan menghitung interval kepercayaan.

Tahap 3. Perhitungan interval kepercayaan

Metode 1. Perhitungan menggunakan median dan standar deviasi.

Interval kepercayaan ditentukan sebagai berikut: nilai minimum - deviasi standar dikurangi dari median; nilai maksimum - deviasi standar ditambahkan ke median.

Jadi, selang kepercayaan (47179 CU; 60689 CU)

Beras. 2. Nilai yang berada dalam selang kepercayaan 1.



Metode 2. Membangun interval kepercayaan menggunakan nilai kritis t-statistik (koefisien Student)

S.V. Gribovsky dalam bukunya “Mathematical Methods for Estimating Property Value” menjelaskan metode untuk menghitung interval kepercayaan melalui koefisien Student. Saat menghitung menggunakan metode ini, penduga sendiri harus menetapkan tingkat signifikansi ∝, yang menentukan probabilitas untuk membangun interval kepercayaan. Biasanya, tingkat signifikansi 0,1 digunakan; 0,05 dan 0,01. Mereka sesuai dengan probabilitas kepercayaan 0,9; 0,95 dan 0,99. Dengan metode ini, nilai sebenarnya dari ekspektasi dan varians matematis diasumsikan secara praktis tidak diketahui (yang hampir selalu benar ketika memecahkan masalah estimasi praktis).

Rumus interval kepercayaan:

n - ukuran sampel;

Nilai kritis t-statistik (Distribusi Siswa) dengan tingkat signifikansi ∝, banyaknya derajat kebebasan n-1, yang ditentukan dari tabel statistik khusus atau menggunakan MS Excel (→"Statistik"→ STUDIST);

∝ - tingkat signifikansi, ambil ∝=0,01.

Beras. 2. Nilai yang berada dalam selang kepercayaan 2.

Tahap 4. Analisis berbagai metode untuk menghitung interval kepercayaan

Dua metode penghitungan interval kepercayaan - melalui median dan koefisien Student - menghasilkan nilai interval yang berbeda. Oleh karena itu, kami mendapat dua sampel berbeda yang dibersihkan.

Tabel 3. Statistik untuk tiga sampel.

Indikator

Sampel awal

1 pilihan

pilihan 2

Nilai rata-rata

Penyebaran

Koefisien. variasi

Koefisien. osilasi

Jumlah objek pensiunan, pcs.

Berdasarkan perhitungan yang dilakukan, kita dapat mengatakan bahwa nilai interval kepercayaan yang diperoleh dengan metode yang berbeda berpotongan, sehingga Anda dapat menggunakan metode perhitungan mana pun sesuai kebijaksanaan penilai.

Namun, kami percaya bahwa ketika bekerja di sistem estimatica.pro, disarankan untuk memilih metode untuk menghitung interval kepercayaan tergantung pada tingkat perkembangan pasar:

  • jika pasar belum berkembang, gunakan metode perhitungan dengan menggunakan median dan standar deviasi, karena jumlah benda pensiunan dalam hal ini sedikit;
  • jika pasar sudah berkembang, terapkan perhitungan melalui nilai kritis t-statistik (koefisien Student), karena dimungkinkan untuk membentuk sampel awal yang besar.

Dalam mempersiapkan artikel berikut ini digunakan:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Metode matematika untuk menilai nilai properti. Moskow, 2014

2. Sistem data estimatica.pro

Interval kepercayaan berasal dari bidang statistik. Ini adalah rentang tertentu yang berfungsi untuk memperkirakan parameter yang tidak diketahui dengan tingkat keandalan yang tinggi. Cara termudah untuk menjelaskan hal ini adalah dengan sebuah contoh.

Misalkan Anda perlu mempelajari beberapa variabel acak, misalnya kecepatan respons server terhadap permintaan klien. Setiap kali pengguna mengetik alamat situs tertentu, server merespons dengan kecepatan berbeda. Dengan demikian, waktu respon yang diteliti adalah acak. Jadi, interval kepercayaan memungkinkan kita untuk menentukan batas-batas parameter ini, dan kemudian kita dapat mengatakan bahwa dengan probabilitas 95% server akan berada dalam kisaran yang kita hitung.

Atau Anda perlu mencari tahu berapa banyak orang yang mengetahui tentang merek dagang perusahaan tersebut. Ketika interval kepercayaan dihitung, kita dapat mengatakan, misalnya, bahwa dengan probabilitas 95%, jumlah konsumen yang mengetahui hal ini berada pada kisaran 27% hingga 34%.

Terkait erat dengan istilah ini adalah nilai probabilitas kepercayaan. Ini mewakili probabilitas bahwa parameter yang diinginkan termasuk dalam interval kepercayaan. Seberapa besar rentang yang kita inginkan bergantung pada nilai ini. Semakin besar nilai yang dibutuhkan maka semakin sempit interval kepercayaannya, begitu pula sebaliknya. Biasanya diatur ke 90%, 95% atau 99%. Nilai 95% adalah yang paling populer.

Indikator ini juga dipengaruhi oleh sebaran pengamatan dan definisinya didasarkan pada asumsi bahwa sifat yang diteliti mematuhi. Pernyataan ini dikenal juga dengan Hukum Gauss. Menurutnya, normal adalah distribusi seluruh probabilitas suatu variabel acak kontinu yang dapat digambarkan dengan kepadatan probabilitas. Jika asumsi distribusi normal salah, maka estimasi tersebut mungkin salah.

Pertama, mari kita cari tahu cara menghitung interval kepercayaan untuk Ada dua kemungkinan kasus di sini. Dispersi (derajat penyebaran variabel acak) mungkin diketahui atau tidak. Jika diketahui, maka selang kepercayaan kita dihitung dengan menggunakan rumus berikut:

xsr - t*σ / (akar(n))<= α <= хср + t*σ / (sqrt(n)), где

α - tanda,

t - parameter dari tabel distribusi Laplace,

σ adalah akar kuadrat dari varians.

Jika variansnya tidak diketahui, maka dapat dihitung jika kita mengetahui semua nilai fitur yang diinginkan. Rumus berikut digunakan untuk ini:

σ2 = х2ср - (хср)2, dimana

х2ср - nilai rata-rata kuadrat dari karakteristik yang dipelajari,

(хср)2 adalah kuadrat dari karakteristik ini.

Rumus yang digunakan untuk menghitung interval kepercayaan dalam kasus ini sedikit berubah:

xsr - t*s / (akar(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - rata-rata sampel,

α - tanda,

t adalah parameter yang ditemukan menggunakan tabel distribusi Student t = t(ɣ;n-1),

sqrt(n) - akar kuadrat dari total ukuran sampel,

s adalah akar kuadrat dari varians.

Perhatikan contoh ini. Misalkan berdasarkan hasil 7 pengukuran, karakteristik yang diteliti ditentukan sama dengan 30 dan varians sampel sama dengan 36. Perlu dicari, dengan probabilitas 99%, selang kepercayaan yang mengandung kebenaran. nilai parameter yang diukur.

Pertama, mari kita tentukan berapa t sama dengan: t = t (0,99; 7-1) = 3,71. Dengan menggunakan rumus di atas, kita mendapatkan:

xsr - t*s / (akar(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (persegi(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Interval kepercayaan untuk varians dihitung baik dalam kasus mean yang diketahui maupun ketika tidak ada data tentang ekspektasi matematis, dan hanya nilai estimasi varians yang tidak bias yang diketahui. Kami tidak akan memberikan rumus untuk menghitungnya di sini, karena rumus tersebut cukup rumit dan, jika diinginkan, selalu dapat ditemukan di Internet.

Kami hanya mencatat bahwa lebih mudah untuk menentukan interval kepercayaan menggunakan Excel atau layanan jaringan, yang disebut demikian.



Apakah Anda menyukai artikelnya? Bagikan dengan teman Anda!