Menghitung chi kuadrat. Soal tes mandiri untuk siswa

). Rumusan spesifik hipotesis yang diuji akan bervariasi dari satu kasus ke kasus lainnya.

Dalam postingan kali ini saya akan menjelaskan cara kerja kriteria \(\chi^2\) menggunakan contoh (hipotetis) dari imunologi. Bayangkan kita telah melakukan percobaan untuk menentukan efektivitas menekan perkembangan penyakit mikroba ketika antibodi yang tepat dimasukkan ke dalam tubuh. Sebanyak 111 tikus dilibatkan dalam percobaan, yang kami bagi menjadi dua kelompok, masing-masing termasuk 57 dan 54 hewan. Tikus kelompok pertama mendapat suntikan bakteri patogen, dilanjutkan dengan pengenalan serum darah yang mengandung antibodi terhadap bakteri tersebut. Hewan dari kelompok kedua berperan sebagai kontrol - mereka hanya menerima suntikan bakteri. Setelah beberapa waktu diinkubasi, ternyata 38 ekor tikus mati dan 73 ekor selamat. Dari korban tewas, 13 orang termasuk kelompok pertama, dan 25 orang termasuk kelompok kedua (kontrol). Hipotesis nol yang diuji dalam percobaan ini dapat dirumuskan sebagai berikut: pemberian serum dengan antibodi tidak berpengaruh terhadap kelangsungan hidup mencit. Dengan kata lain, kami berpendapat bahwa perbedaan yang diamati dalam kelangsungan hidup tikus (77,2% pada kelompok pertama versus 53,7% pada kelompok kedua) sepenuhnya acak dan tidak terkait dengan efek antibodi.

Data yang diperoleh dalam percobaan dapat disajikan dalam bentuk tabel:

Total

Bakteri + serum

Hanya bakteri

Total

Tabel seperti yang ditampilkan disebut tabel kontingensi. Pada contoh yang dipertimbangkan, tabel memiliki dimensi 2x2: terdapat dua kelas objek (“Bakteri + serum” dan “Hanya Bakteri”), yang diperiksa berdasarkan dua kriteria (“Mati” dan “Bertahan”). Ini adalah kasus paling sederhana dari tabel kontingensi: tentu saja, jumlah kelas yang dipelajari dan jumlah fiturnya bisa lebih banyak.

Untuk menguji hipotesis nol yang disebutkan di atas, kita perlu mengetahui apa yang akan terjadi jika antibodi sebenarnya tidak berpengaruh pada kelangsungan hidup tikus. Dengan kata lain, Anda perlu menghitung frekuensi yang diharapkan untuk sel yang sesuai pada tabel kontingensi. Bagaimana cara melakukan ini? Dalam percobaan tersebut, total 38 tikus mati, yaitu 34,2% dari total jumlah hewan yang terlibat. Jika pemberian antibodi tidak mempengaruhi kelangsungan hidup mencit, maka persentase kematian yang sama harus diamati pada kedua kelompok eksperimen, yaitu 34,2%. Menghitung berapa 34,2% dari 57 dan 54, kita mendapatkan 19,5 dan 18,5. Ini adalah angka kematian yang diharapkan pada kelompok eksperimen kami. Tingkat kelangsungan hidup yang diharapkan dihitung dengan cara yang sama: karena total 73 tikus yang selamat, atau 65,8% dari jumlah total, maka tingkat kelangsungan hidup yang diharapkan adalah 37,5 dan 35,5. Mari kita buat tabel kontingensi baru, sekarang dengan frekuensi yang diharapkan:

Mati

Yang selamat

Total

Bakteri + serum

Hanya bakteri

Total

Seperti yang bisa kita lihat, frekuensi yang diharapkan sangat berbeda dari frekuensi yang diamati, yaitu. Pemberian antibodi tampaknya berdampak pada kelangsungan hidup tikus yang terinfeksi patogen tersebut. Kita dapat mengukur kesan ini menggunakan uji kesesuaian Pearson \(\chi^2\):

\[\chi^2 = \sum_()\frac((f_o - f_e)^2)(f_e),\]


dimana \(f_o\) dan \(f_e\) masing-masing adalah frekuensi yang diamati dan diharapkan. Penjumlahan dilakukan pada semua sel tabel. Jadi, untuk contoh yang sedang kita pertimbangkan

\[\chi^2 = (13 – 19,5)^2/19,5 + (44 – 37,5)^2/37,5 + (25 – 18,5)^2/18,5 + (29 – 35,5)^2/35,5 = \]

Apakah nilai \(\chi^2\) yang dihasilkan cukup besar untuk menolak hipotesis nol? Untuk menjawab pertanyaan ini perlu dicari nilai kritis kriteria yang sesuai. Jumlah derajat kebebasan untuk \(\chi^2\) dihitung sebagai \(df = (R - 1)(C - 1)\), dengan \(R\) dan \(C\) adalah bilangan baris dan kolom dalam konjugasi tabel. Dalam kasus kita \(df = (2 -1)(2 - 1) = 1\). Mengetahui jumlah derajat kebebasan, sekarang kita dapat dengan mudah mencari nilai kritis \(\chi^2\) menggunakan fungsi R standar qchisq() :


Jadi, dengan satu derajat kebebasan, hanya dalam 5% kasus nilai kriteria \(\chi^2\) melebihi 3,841. Nilai yang kami peroleh, 6,79, secara signifikan melebihi nilai kritis ini, yang memberi kami hak untuk menolak hipotesis nol bahwa tidak ada hubungan antara pemberian antibodi dan kelangsungan hidup tikus yang terinfeksi. Dengan menolak hipotesis ini, kita berisiko salah dengan probabilitas kurang dari 5%.

Perlu dicatat bahwa rumus kriteria \(\chi^2\) di atas memberikan nilai yang sedikit meningkat saat bekerja dengan tabel kontingensi berukuran 2x2. Alasannya adalah distribusi kriteria \(\chi^2\) itu sendiri adalah kontinu, sedangkan frekuensi fitur biner (“mati” / “selamat”) menurut definisi adalah diskrit. Dalam hal ini, ketika menghitung kriteria, biasanya memperkenalkan apa yang disebut koreksi kontinuitas, atau amandemen Yates :

\[\chi^2_Y = \sum_()\frac((|f_o - f_e| - 0,5)^2)(f_e).\]

Data koreksi kontinuitas "s Chi-squared test with Yates": mencit X-squared = 5,7923, df = 1, p-value = 0,0161


Seperti yang bisa kita lihat, R secara otomatis menerapkan koreksi kontinuitas Yates ( Uji Chi-kuadrat Pearson dengan koreksi kontinuitas Yates). Nilai \(\chi^2\) yang dihitung oleh program adalah 5,79213. Kita dapat menolak hipotesis nol tentang tidak adanya efek antibodi dengan risiko salah dengan probabilitas lebih dari 1% (nilai p = 0,0161).

Uji independensi chi-square digunakan untuk mengetahui hubungan antara dua variabel kategori. Contoh pasangan variabel kategori adalah: Status perkawinan vs. tingkat pekerjaan Responden; Jenis anjing vs. Profesi pemilik, Tingkat Gaji vs. Spesialisasi seorang insinyur, dll. Saat menghitung kriteria independensi, hipotesis diuji bahwa tidak ada hubungan antar variabel. Kami akan melakukan penghitungan menggunakan fungsi MS EXCEL 2010 CHI2.TEST() dan rumus konvensional.

Anggap saja kita punya mencicipi data yang mewakili hasil survei terhadap 500 orang. Masyarakat ditanyai 2 pertanyaan: tentang status perkawinan mereka (menikah, pasangan sipil, tidak menjalin hubungan) dan tingkat pekerjaan mereka (penuh waktu, paruh waktu, sementara tidak bekerja, di rumah, pensiun, belajar). Semua jawaban ditempatkan di tabel:

Tabel ini disebut tabel kontingensi(atau tabel faktor, tabel Kontingensi Bahasa Inggris). Unsur-unsur pada perpotongan baris dan kolom tabel biasanya dilambangkan dengan O ij (dari bahasa Inggris Observed, yaitu mengamati, frekuensi aktual).

Kami tertarik dengan pertanyaan “Apakah Status Perkawinan Mempengaruhi Pekerjaan?”, yaitu. apakah ada ketergantungan antara kedua metode klasifikasi sampel?

Pada pengujian hipotesis dari bentuk ini biasanya diterima bahwa hipotesis nol menyatakan bahwa tidak ada ketergantungan metode klasifikasi.

Mari kita pertimbangkan untuk membatasi kasus. Contoh ketergantungan penuh dua variabel kategori adalah hasil survei berikut:

Dalam hal ini, status perkawinan jelas menentukan pekerjaan (lihat. contoh lembar file Penjelasan). Sebaliknya, contoh independensi penuh adalah hasil survei lainnya:

Perlu diketahui bahwa tingkat pekerjaan dalam hal ini tidak bergantung pada status perkawinan (sama untuk orang yang sudah menikah dan belum menikah). Ini sangat cocok dengan kata-katanya hipotesis nol. Jika hipotesis nol adil, maka hasil survei harus didistribusikan sedemikian rupa sehingga persentase penduduk yang bekerja akan sama tanpa memandang status perkawinan. Dengan menggunakan ini, kami menghitung hasil survei yang sesuai hipotesis nol(cm. contoh file lembar Contoh).

Pertama, kita menghitung estimasi probabilitas elemen tersebut sampel akan mempunyai hunian tertentu (lihat kolom u i):

Di mana Dengan– jumlah kolom (kolom) sama dengan jumlah level variabel “Status perkawinan”.

Kemudian kita menghitung estimasi probabilitas elemen tersebut sampel akan mempunyai status perkawinan tertentu (lihat baris v j).

Di mana R– jumlah baris yang sama dengan jumlah level variabel “Hunian”.

Frekuensi teoritis untuk setiap sel E ij (dari bahasa Inggris Expected, yaitu frekuensi yang diharapkan) dalam hal independensi variabel dihitung dengan rumus:
E ij =n* kamu saya * v j

Diketahui bahwa statistik X 2 0 untuk n besar mempunyai kira-kira (r-1)(c-1) derajat kebebasan (df – derajat kebebasan):

Jika dihitung berdasarkan sampel maka nilai statistik ini “terlalu besar” (lebih besar dari ambang batas). hipotesis nol ditolak. Nilai ambang batas dihitung berdasarkan , misalnya menggunakan rumus =HI2.OBR.PH(0.05; df) .

Catatan: Tingkat signifikansi biasanya diambil sama dengan 0,1; 0,05; 0,01.

Pada pengujian hipotesis juga mudah untuk menghitung, yang kita bandingkan tingkat signifikansi. P-arti dihitung menggunakan (r-1)*(c-1)=df derajat kebebasan.

Jika peluang suatu variabel acak mempunyai c (r-1)(c-1) derajat kebebasan akan mengambil nilai lebih besar dari statistik yang dihitung X 2 0, yaitu. P(Х 2 (r-1)*(c-1) >Х 2 0 ), kurang tingkat signifikansi, Itu hipotesis nol ditolak.

Di MS EXCEL nilai p dapat dihitung dengan menggunakan rumus =HI2.DIST.PH(X 2 0 ;df), tentu saja, setelah menghitung nilai statistik X 2 0 segera sebelum ini (ini dilakukan pada file contoh). Namun, cara yang paling nyaman adalah menggunakan fungsi CH2.TEST(). Sebagai argumen untuk fungsi ini, referensi ke rentang yang berisi frekuensi aktual (Diamati) dan frekuensi teoretis yang dihitung (Diharapkan) ditentukan.

Jika tingkat signifikansi > P-nilai, maka yang dimaksud adalah frekuensi aktual dan teoritis yang dihitung dari asumsi kewajaran hipotesis nol, sangat berbeda. Itu sebabnya, hipotesis nol harus ditolak.

Menggunakan fungsi CH2.TEST() memungkinkan Anda mempercepat prosedur pengujian hipotesis, Karena tidak perlu menghitung nilainya statistik. Sekarang cukup membandingkan hasil fungsi CH2.TEST() dengan yang diberikan tingkat signifikansi.

Catatan: Fungsi CHISQ.TEST(), nama Inggris CHISQ.TEST, muncul di MS EXCEL 2010. Versi sebelumnya CHISQEST(), tersedia di MS EXCEL 2007, memiliki fungsi yang sama. Namun, untuk CH2.TEST(), Anda perlu menghitung sendiri frekuensi teoretisnya.

Penggunaan kriteria ini didasarkan pada penggunaan ukuran (statistik) ketidaksesuaian antara teori dan F(X) dan distribusi empiris F* N (X) , yang kira-kira mematuhi hukum distribusi χ 2 . Hipotesa N 0 Konsistensi distribusi diperiksa dengan menganalisis distribusi statistik tersebut. Penerapan kriteria ini memerlukan konstruksi rangkaian statistik.

Jadi, biarkan sampel disajikan secara statistik di sebelah jumlah digitnya M. Tingkat keberhasilan yang diamati Saya- peringkat ke-th N Saya. Sesuai dengan hukum distribusi teoretis, frekuensi tumbukan yang diharapkan masuk Saya kategori -th adalah F Saya. Perbedaan antara frekuensi yang diamati dan yang diharapkan adalah ( N SayaF Saya). Untuk menemukan tingkat perbedaan secara keseluruhan F(X) Dan F* N (X) perlu menghitung jumlah tertimbang dari selisih kuadrat di semua digit deret statistik

Nilai χ 2 dengan pembesaran tak terbatas N memiliki distribusi χ 2 (terdistribusi secara asimtotik sebagai χ 2). Distribusi ini bergantung pada jumlah derajat kebebasan k, yaitu jumlah nilai independen dari suku-suku dalam ekspresi (3.7). Jumlah derajat kebebasan sama dengan angkanya kamu dikurangi jumlah hubungan linier yang dikenakan pada sampel. Satu koneksi ada karena fakta bahwa frekuensi apa pun dapat dihitung dari totalitas frekuensi yang tersisa M–1 angka. Selain itu, jika parameter distribusi tidak diketahui sebelumnya, maka ada batasan lain karena penyesuaian distribusi dengan sampel. Jika sampel menentukan S parameter distribusi, maka banyaknya derajat kebebasannya adalah k= MS–1.

Daerah Penerimaan Hipotesis N 0 ditentukan oleh kondisi χ 2 < χ 2 (k; A) , di mana χ 2 (k; A) – titik kritis distribusi χ2 dengan tingkat signifikansi A. Kemungkinan kesalahan tipe I adalah A, kemungkinan kesalahan tipe II tidak dapat ditentukan dengan jelas, karena terdapat banyak sekali cara berbeda yang mungkin tidak cocok dengan distribusi. Kekuatan pengujian bergantung pada jumlah digit dan ukuran sampel. Kriteria ini direkomendasikan untuk diterapkan ketika N>200, penggunaan diperbolehkan bila N>40, dalam kondisi seperti itulah kriteria tersebut valid (sebagai aturan, kriteria tersebut menolak hipotesis nol yang salah).

Algoritma untuk memeriksa berdasarkan kriteria

1. Buatlah histogram menggunakan metode probabilitas yang sama.

2. Berdasarkan tampilan histogram, ajukan hipotesis

H 0: F(X) = F 0 (X),

H 1: F(X) ¹ F 0 (X),

Di mana F 0 (X) - kepadatan probabilitas hukum distribusi hipotetis (misalnya seragam, eksponensial, normal).

Komentar. Hipotesis tentang hukum distribusi eksponensial dapat diajukan jika semua bilangan dalam sampel bernilai positif.

3. Hitung nilai kriteria menggunakan rumus

,

Di mana
tingkat hit Saya interval -th;

P Saya- probabilitas teoritis dari variabel acak yang jatuh ke dalam Saya- interval ke-th asalkan hipotesisnya H 0 benar.

Rumus untuk perhitungan P Saya dalam kasus hukum eksponensial, seragam, dan normal, keduanya sama.

hukum eksponensial

. (3.8)

Pada saat yang sama A 1 = 0, B M = +¥.

Hukum seragam

Hukum Biasa

. (3.10)

Pada saat yang sama A 1 = -¥, B M = +¥.

Catatan. P Saya Setelah menghitung semua kemungkinan

periksa apakah hubungan referensi terpenuhi Fungsi ( X

) - aneh. (+¥) = 1.
4. Dari tabel Chi-kuadrat pada Lampiran, pilih nilainya k, dimana a adalah tingkat signifikansi yang ditentukan (a = 0,05 atau a = 0,01), dan

k = M - 1 - S.

- jumlah derajat kebebasan, ditentukan oleh rumus S Di Sini H- jumlah parameter yang menjadi dasar hipotesis yang dipilih S 0 hukum distribusi. Nilai-nilai

untuk hukum seragam adalah 2, untuk hukum eksponensial adalah 1, untuk hukum normal adalah 2.
5. Jika H, lalu hipotesisnya

0 ditolak. Jika tidak, tidak ada alasan untuk menolaknya: dengan probabilitas 1 - b benar, dan dengan probabilitas - b salah, tetapi nilai b tidak diketahui. . Contoh3 1. Dengan menggunakan kriteria c 2, ajukan dan uji hipotesis tentang hukum distribusi suatu variabel acak X

, deret variasi, tabel interval, dan histogram distribusinya diberikan pada contoh 1.2. Tingkat signifikansi a sebesar 0,05. Larutan 1. Dengan menggunakan kriteria c 2, ajukan dan uji hipotesis tentang hukum distribusi suatu variabel acak. Berdasarkan kemunculan histogram, kami mengajukan hipotesis bahwa variabel acak

H 0: F(X) = didistribusikan menurut hukum normal:(M N

H 1: F(X) ¹ didistribusikan menurut hukum normal:(M, S);

, S).

(3.11)

Nilai kriteria dihitung dengan menggunakan rumus:

Seperti disebutkan di atas, saat menguji hipotesis, lebih baik menggunakan histogram probabilitas yang sama. Dalam hal ini P Saya Probabilitas teoretis

P Kami menghitung menggunakan rumus (3.10). Pada saat yang sama, kami percaya akan hal itu

0,5(-0,845+1) = 0,078.

P 1 = 0,5(F((-4,5245+1,7)/1,98)-F((-¥+1,7)/1,98)) = 0,5(F(-1,427) -F(-¥)) =

2 = 0,5(F((-3,8865+1,7)/1,98)-F((-4,5245+1,7)/1,98)) =

P 3 = 0,094; P 4 = 0,135; P 5 = 0,118; P 6 = 0,097; P 7 = 0,073; P 8 = 0,059; P 9 = 0,174;

P 0,5(F(-1,104)+0,845) = 0,5(-0,729+0,845) = 0,058.

10 = 0,5(F((+¥+1,7)/1,98)-F((0,6932+1,7)/1,98)) = 0,114.

Setelah itu kita periksa pemenuhan rasio pengendaliannya

100 × (0,0062 + 0,0304 + 0,0004 + 0,0091 + 0,0028 + 0,0001 + 0,0100 +

Setelah ini, dari tabel “Chi-kuadrat” kita pilih nilai kritis

.

Karena
lalu hipotesisnya H 0 diterima (tidak ada alasan untuk menolaknya).

Uji chi-kuadrat adalah metode universal untuk memeriksa kesesuaian antara hasil eksperimen dan model statistik yang digunakan.

Jarak Pearson X 2

Pyatnitsky A.M.

Universitas Kedokteran Negeri Rusia

Pada tahun 1900, Karl Pearson mengusulkan cara sederhana, universal dan efektif untuk menguji kesesuaian antara prediksi model dan data eksperimen. “Uji chi-kuadrat” yang ia usulkan adalah uji statistik yang paling penting dan paling umum digunakan. Sebagian besar masalah yang terkait dengan memperkirakan parameter model yang tidak diketahui dan memeriksa kesesuaian antara model dan data eksperimen dapat diselesaikan dengan bantuannya.

Misalkan ada model apriori (“pra-eksperimental”) dari objek atau proses yang dipelajari (dalam statistik mereka berbicara tentang “hipotesis nol” H 0), dan hasil eksperimen dengan objek tersebut. Penting untuk memutuskan apakah model tersebut memadai (apakah sesuai dengan kenyataan)? Apakah hasil eksperimen bertentangan dengan gagasan kita tentang cara kerja realitas, atau dengan kata lain, apakah H0 harus ditolak? Seringkali tugas ini dapat direduksi menjadi membandingkan frekuensi rata-rata terjadinya peristiwa tertentu yang diamati (O i = Diamati) dan diharapkan menurut model (E i = Diharapkan). Dipercaya bahwa frekuensi yang diamati diperoleh dalam serangkaian N pengamatan independen (!) yang dilakukan dalam kondisi konstan (!). Sebagai hasil dari setiap observasi, salah satu dari M peristiwa dicatat. Peristiwa-peristiwa ini tidak dapat terjadi secara bersamaan (tidak berpasangan) dan salah satunya harus terjadi (kombinasinya membentuk peristiwa yang dapat diandalkan). Totalitas semua pengamatan direduksi menjadi tabel (vektor) frekuensi (O i )=(O 1 ,… O M ), yang menggambarkan secara lengkap hasil percobaan. Nilai O 2 =4 berarti kejadian nomor 2 terjadi sebanyak 4 kali. Jumlah frekuensi O 1 +… O M =N. Penting untuk membedakan dua kasus: N – tetap, non-acak, N – variabel acak. Untuk jumlah percobaan N yang tetap, frekuensinya memiliki distribusi polinomial. Mari kita ilustrasikan skema umum ini dengan contoh sederhana.

Menggunakan uji chi-square untuk menguji hipotesis sederhana.

Misalkan model (hipotesis nol H 0) adalah dadu itu adil - semua permukaan muncul sama seringnya dengan probabilitas p i =1/6, i =, M=6. Suatu percobaan dilakukan dengan pelemparan sebuah dadu sebanyak 60 kali (N = 60 percobaan bebas dilakukan). Menurut model, kami berharap semua frekuensi yang diamati O i kejadian 1,2,... 6 poin harus mendekati nilai rata-ratanya E i =Np i =60∙(1/6)=10. Menurut H 0, vektor frekuensi rata-rata (E i )=(Np i )=(10, 10, 10, 10, 10, 10). (Hipotesis yang frekuensi rata-ratanya diketahui sepenuhnya sebelum percobaan dimulai disebut sederhana.) Jika vektor yang diamati (O i ) sama dengan (34,0,0,0,0,26), maka vektor tersebut segera jelas bahwa modelnya salah - tulang tidak mungkin benar, karena hanya 1 dan 6 yang dilempar sebanyak 60 kali. Peluang kejadian seperti itu untuk dadu yang benar dapat diabaikan: P = (2/6) 60 =2,4*10 -29. Namun, munculnya perbedaan nyata antara model dan pengalaman merupakan pengecualian. Misalkan vektor frekuensi observasi (O i ) sama dengan (5, 15, 6, 14, 4, 16). Apakah ini konsisten dengan H0? Jadi, kita perlu membandingkan dua vektor frekuensi (E i) dan (O i). Dalam hal ini, vektor frekuensi yang diharapkan (Ei) tidak acak, tetapi vektor frekuensi yang diamati (Oi) acak - selama percobaan berikutnya (dalam rangkaian 60 lemparan baru) hasilnya akan berbeda. Hal ini berguna untuk memperkenalkan interpretasi geometris dari masalah dan mengasumsikan bahwa dalam ruang frekuensi (dalam hal ini 6 dimensi) diberikan dua titik dengan koordinat (5, 15, 6, 14, 4, 16) dan (10, 10, 10, 10, 10, 10 ). Apakah jaraknya cukup jauh untuk dianggap tidak kompatibel dengan H 0 ? Dengan kata lain, kita membutuhkan:

  1. belajar mengukur jarak antar frekuensi (titik dalam ruang frekuensi),
  2. mempunyai kriteria mengenai jarak yang dianggap terlalu besar (“tidak masuk akal”), yaitu tidak konsisten dengan H 0 .

Kuadrat jarak Euclidean biasa sama dengan:

X 2 Euclid = S(O i -E i) 2 = (5-10) 2 +(15-10) 2 + (6-10) 2 +(14-10) 2 +(4-10) 2 +(16-10) 2

Dalam hal ini, permukaan X 2 Euclid = const selalu berbentuk bola jika kita menetapkan nilai E i dan mengubah O i . Karl Pearson mencatat bahwa penggunaan jarak Euclidean dalam ruang frekuensi tidak boleh digunakan. Oleh karena itu, salah jika berasumsi bahwa titik-titik (O = 1030 dan E = 1000) dan (O = 40 dan E = 10) berada pada jarak yang sama satu sama lain, meskipun dalam kedua kasus tersebut selisihnya adalah O -E = 30. Lagi pula, semakin tinggi frekuensi yang diharapkan, semakin besar kemungkinan penyimpangan dari frekuensi tersebut. Oleh karena itu, titik-titik (O =1030 dan E =1000) dianggap “dekat”, dan titik-titik (O =40 dan E =10) dianggap “jauh” satu sama lain. Dapat ditunjukkan bahwa jika hipotesis H 0 benar, maka fluktuasi frekuensi O i relatif terhadap E i adalah orde akar kuadrat (!) dari E i . Oleh karena itu, Pearson mengusulkan, ketika menghitung jarak, untuk mengkuadratkan bukan perbedaannya (O i -E i), tetapi perbedaan yang dinormalisasi (O i -E i)/E i 1/2. Jadi, inilah rumus untuk menghitung jarak Pearson (sebenarnya adalah kuadrat jarak):

X 2 Pearson = S((O saya -E saya )/E saya 1/2) 2 = S(HAI saya -E saya ) 2 /E saya

Dalam contoh kita:

X 2 Pearson = (5-10) 2 /10+(15-10) 2 /10 +(6-10) 2 /10+(14-10) 2 /10+(4-10) 2 /10+( 16-10) 2 /10=15,4

Untuk dadu biasa, semua frekuensi yang diharapkan E i adalah sama, tetapi biasanya berbeda, sehingga permukaan yang jarak Pearsonnya konstan (X 2 Pearson =const) berubah menjadi ellipsoid, bukan bola.

Sekarang rumus untuk menghitung jarak telah dipilih, kita perlu mencari tahu jarak mana yang dianggap “tidak terlalu besar” (konsisten dengan H 0). ? Dalam persentase kasus berapa (atau dengan probabilitas berapa) kita akan mendapatkan jarak yang lebih besar dari 15,4 ketika melakukan percobaan dengan dadu biasa? Jika persentase ini kecil (<0.05), то H 0 надо отвергнуть. Иными словами требуется найти распределение длярасстояния Пирсона. Если все ожидаемые частоты E i не слишком малы (≥5), и верна H 0 , то нормированные разности (O i - E i )/E i 1/2 приближенно эквивалентны стандартным гауссовским случайным величинам: (O i - E i )/E i 1/2 ≈N (0,1). Это, например, означает, что в 95% случаев| (O i - E i )/E i 1/2 | < 1.96 ≈ 2 (правило “двух сигм”).

Penjelasan. Banyaknya pengukuran O i yang dimasukkan ke dalam sel tabel bernomor i berdistribusi binomial dengan parameter: m =Np i =E i,σ =(Np i (1-p i)) 1/2, dimana N adalah bilangannya pengukuran (N " 1), pi adalah probabilitas satu pengukuran masuk ke dalam sel tertentu (ingat bahwa pengukuran bersifat independen dan dilakukan dalam kondisi konstan). Jika p i kecil, maka: σ≈(Np i ) 1/2 =E i dan distribusi binomial mendekati Poisson, dimana rata-rata jumlah pengamatan E i =λ, dan simpangan baku σ=λ 1/2 = E saya 1/ 2. Untuk λ≥5, distribusi Poisson mendekati normal N (m =E i =λ, σ=E i 1/2 =λ 1/2), dan nilai ternormalisasi (O i - E i )/E i 1 /2 ≈ N (0 ,1).

Pearson mendefinisikan variabel acak χ 2 n – “chi-kuadrat dengan n derajat kebebasan”, sebagai jumlah kuadrat dari n variabel acak normal standar independen:

χ 2 n = T 1 2 + T 2 2 + …+ T n 2 , dimana semua orang T saya = N(0,1) - N. HAI. R. Dengan. V.

Mari kita coba memahami dengan jelas arti dari variabel acak terpenting dalam statistik ini. Untuk melakukan ini, pada bidang (dengan n = 2) atau di ruang angkasa (dengan n = 3) kita menampilkan awan titik-titik yang koordinatnya independen dan mempunyai distribusi normal standarf T (x) ~exp (-x 2 /2 ). Pada sebuah bidang, menurut aturan “dua sigma”, yang diterapkan secara independen pada kedua koordinat, 90% (0,95*0,95≈0,90) titik terdapat dalam persegi (-2

f χ 2 2 (a) = Сexp(-a/2) = 0,5exp(-a/2).

Dengan jumlah derajat kebebasan yang cukup besar n (n > 30), distribusi chi-kuadrat mendekati normal: N (m = n; σ = (2n) ½). Hal ini merupakan konsekuensi dari “teorema limit pusat”: jumlah besaran-besaran yang terdistribusi secara identik dengan varian berhingga mendekati hukum normal seiring dengan bertambahnya jumlah suku.

Dalam praktiknya, perlu diingat bahwa kuadrat rata-rata jarak adalah m (χ 2 n) = n, dan variansnya adalah σ 2 (χ 2 n) = 2n. Dari sini mudah untuk menyimpulkan nilai chi-kuadrat mana yang harus dianggap terlalu kecil dan terlalu besar: sebagian besar distribusinya terletak pada rentang dari n -2∙(2n) ½ hingga n +2∙(2n) ½.

Jadi, jarak Pearson yang secara signifikan melebihi n +2∙ (2n) ½ harus dianggap sangat besar (tidak konsisten dengan H 0). Jika hasilnya mendekati n +2∙(2n) ½, maka Anda harus menggunakan tabel di mana Anda dapat mengetahui dengan tepat dalam proporsi kasus berapa nilai chi-kuadrat yang besar dapat muncul.

Penting untuk mengetahui cara memilih nilai yang tepat untuk jumlah derajat kebebasan (disingkat n.d.f.). Tampaknya wajar untuk berasumsi bahwa n sama dengan jumlah digit: n =M. Dalam artikelnya, Pearson mengemukakan hal yang sama. Dalam contoh dadu, ini berarti n =6. Namun, beberapa tahun kemudian terbukti bahwa Pearson salah. Banyaknya derajat kebebasan selalu lebih kecil dari jumlah digit jika terdapat hubungan antar variabel acak O i. Untuk contoh dadu, jumlah O i adalah 60, dan hanya 5 frekuensi yang dapat diubah secara independen, sehingga nilai yang benar adalah n = 6-1 = 5. Untuk nilai n ini kita mendapatkan n +2∙(2n) ½ =5+2∙(10) ½ =11,3. Karena 15.4>11.3, maka hipotesis H 0 - dadu benar, harus ditolak.

Setelah memperjelas kesalahannya, tabel χ 2 yang ada harus ditambah, karena pada awalnya tidak ada kasus n = 1, karena jumlah digit terkecilnya = 2. Sekarang ternyata ada kasus ketika jarak Pearson memiliki distribusi χ 2 n =1.

Contoh. Pada pelemparan uang logam sebanyak 100 kali, banyaknya kepala adalah O 1 = 65, dan banyaknya ekor adalah O 2 = 35. Banyaknya angka M = 2. Jika koinnya simetris, maka frekuensi yang diharapkan adalah E 1 =50, E 2 =50.

X 2 Pearson = S(O i -E i) 2 /E i = (65-50) 2 /50 + (35-50) 2 /50 = 2*225/50 = 9.

Nilai yang dihasilkan harus dibandingkan dengan nilai yang dapat diambil oleh variabel acak χ 2 n =1, yang didefinisikan sebagai kuadrat dari nilai normal standar χ 2 n =1 =T 1 2 ≥ 9 ó T 1 ≥3 atau T 1 ≤-3. Peluang kejadian seperti itu sangat rendah P (χ 2 n =1 ≥9) = 0,006. Oleh karena itu, koin tidak dapat dianggap simetris: H 0 harus ditolak. Fakta bahwa jumlah derajat kebebasan tidak bisa sama dengan jumlah digit terlihat dari fakta bahwa jumlah frekuensi yang diamati selalu sama dengan jumlah frekuensi yang diharapkan, misalnya O 1 +O 2 =65+ 35 = E 1 +E 2 =50+50=100. Oleh karena itu, titik-titik acak dengan koordinat O 1 dan O 2 terletak pada suatu garis lurus: O 1 +O 2 =E 1 +E 2 =100 dan jarak ke pusat ternyata lebih kecil dibandingkan jika batasan ini tidak ada dan mereka berada di seluruh pesawat. Memang, untuk dua variabel acak independen dengan ekspektasi matematis E 1 =50, E 2 =50, jumlah realisasinya tidak selalu sama dengan 100 - misalnya, nilai O 1 =60, O 2 =55 akan dapat diterima.

Penjelasan. Mari kita bandingkan hasil kriteria Pearson pada M = 2 dengan rumus Moivre-Laplace ketika memperkirakan fluktuasi acak dalam frekuensi terjadinya suatu peristiwa ν =K /N yang memiliki probabilitas p dalam serangkaian N uji Bernoulli independen ( K adalah jumlah keberhasilan):

χ 2 n =1 = S(O i -E i) 2 /E i = (O 1 -E 1) 2 /E 1 + (O 2 -E 2) 2 /E 2 = (Nν -Np) 2 /(Np) + (N ( 1-ν )-N (1-p )) 2 /(N (1-p ))=

=(Nν-Np) 2 (1/p + 1/(1-p))/N=(Nν-Np) 2 /(Np(1-p))=((K-Np)/(Npq) ½ ) 2 = T 2

Nilai T =(K -Np)/(Npq) ½ = (K -m (K))/σ(K) ≈N (0,1) dengan σ(K)=(Npq) ½ ≥3. Kita melihat bahwa dalam kasus ini hasil Pearson sama persis dengan perkiraan normal untuk distribusi binomial.

Sejauh ini kita telah mempertimbangkan hipotesis sederhana dimana frekuensi rata-rata yang diharapkan E i telah diketahui sepenuhnya sebelumnya. Untuk informasi tentang cara memilih jumlah derajat kebebasan yang tepat untuk hipotesis kompleks, lihat di bawah.

Menggunakan uji chi-kuadrat untuk menguji hipotesis yang kompleks

Dalam contoh dengan dadu dan koin biasa, frekuensi yang diharapkan dapat ditentukan sebelum(!) percobaan. Hipotesis seperti ini disebut “sederhana”. Dalam praktiknya, “hipotesis kompleks” lebih umum. Selain itu, untuk menemukan frekuensi yang diharapkan E i perlu dilakukan estimasi terlebih dahulu satu atau beberapa besaran (parameter model), dan ini hanya dapat dilakukan dengan menggunakan data eksperimen. Akibatnya, untuk “hipotesis kompleks”, frekuensi yang diharapkan E i ternyata bergantung pada frekuensi yang diamati O i dan oleh karena itu frekuensi itu sendiri menjadi variabel acak, bervariasi bergantung pada hasil eksperimen. Dalam proses pemilihan parameter, jarak Pearson berkurang - parameter dipilih untuk meningkatkan kesesuaian antara model dan eksperimen. Oleh karena itu, jumlah derajat kebebasannya harus dikurangi.

Bagaimana cara memperkirakan parameter model? Ada banyak metode estimasi yang berbeda - “metode kemungkinan maksimum”, “metode momen”, “metode substitusi”. Namun, Anda tidak dapat menggunakan dana tambahan apa pun dan menemukan estimasi parameter dengan meminimalkan jarak Pearson. Di era pra-komputer, pendekatan ini jarang digunakan: pendekatan ini tidak nyaman untuk perhitungan manual dan, biasanya, tidak dapat diselesaikan secara analitis. Saat menghitung di komputer, minimalisasi numerik biasanya mudah dilakukan, dan keunggulan metode ini adalah keserbagunaannya. Jadi, menurut “metode minimalisasi chi-kuadrat”, kami memilih nilai parameter yang tidak diketahui sehingga jarak Pearson menjadi yang terkecil. (Omong-omong, dengan mempelajari perubahan jarak ini dengan perpindahan kecil relatif terhadap minimum yang ditemukan, Anda dapat memperkirakan ukuran keakuratan perkiraan: buatlah interval kepercayaan.) Setelah parameter dan jarak minimum ini ditemukan, maka sekali lagi perlu menjawab pertanyaan apakah itu cukup kecil.

Urutan tindakan umum adalah sebagai berikut:

  1. Pemilihan model (hipotesis H 0).
  2. Pemilihan bit dan penentuan vektor frekuensi yang diamati O saya .
  3. Estimasi parameter model yang tidak diketahui dan konstruksi interval kepercayaannya (misalnya, dengan mencari jarak minimum Pearson).
  4. Perhitungan frekuensi yang diharapkan E i .
  5. Perbandingan nilai temuan jarak Pearson X 2 dengan nilai kritis chi-kuadrat χ 2 crit - yang terbesar, yang masih dianggap masuk akal, kompatibel dengan H 0. Kami menemukan nilai χ 2 crit dari tabel dengan menyelesaikan persamaan

P (χ 2 n > χ 2 krit)=1-α,

dimana α adalah “tingkat signifikansi” atau “ukuran kriteria” atau “besarnya kesalahan tipe pertama” (nilai tipikal α = 0,05).

Biasanya jumlah derajat kebebasan n dihitung dengan menggunakan rumus

n = (jumlah digit) – 1 – (jumlah parameter yang akan diestimasi)

Jika X 2 > χ 2 krit, maka hipotesis H 0 ditolak, sebaliknya diterima. Dalam α∙100% kasus (yaitu, sangat jarang), metode pemeriksaan H 0 ini akan menghasilkan “kesalahan jenis pertama”: hipotesis H 0 akan ditolak secara keliru.

Contoh. Dalam penelitian terhadap 10 seri yang terdiri dari 100 benih, jumlah benih yang terinfeksi lalat mata hijau dihitung. Data yang diterima: O i =(16, 18, 11, 18, 21, 10, 20, 18, 17, 21);

Di sini vektor frekuensi yang diharapkan tidak diketahui sebelumnya. Jika datanya homogen dan diperoleh dengan distribusi binomial, maka satu parameter tidak diketahui: proporsi p benih yang terinfeksi. Perhatikan bahwa dalam tabel asli sebenarnya bukan 10 tetapi 20 frekuensi yang memenuhi 10 koneksi: 16+84=100, ... 21+79=100.

X 2 = (16-100p) 2 /100p +(84-100(1-p)) 2 /(100(1-p))+…+

(21-100p) 2 /100p +(79-100(1-hal)) 2 /(100(1-hal))

Menggabungkan suku-suku secara berpasangan (seperti pada contoh dengan koin), kita memperoleh bentuk penulisan kriteria Pearson, yang biasanya langsung ditulis:

X 2 = (16-100p) 2 /(100p(1-p))+…+ (21-100p) 2 /(100p(1-p)).

Sekarang, jika jarak minimum Pearson digunakan sebagai metode untuk memperkirakan p, maka perlu dicari p yang mana X 2 =min. (Model mencoba, jika memungkinkan, untuk “menyesuaikan” dengan data eksperimen.)

Kriteria Pearson adalah kriteria yang paling universal digunakan dalam statistik. Hal ini dapat diterapkan pada data univariat dan multivariat, fitur kuantitatif dan kualitatif. Namun, justru karena keserbagunaannya, seseorang harus berhati-hati agar tidak membuat kesalahan.

Poin penting

1.Pemilihan kategori.

  • Jika distribusinya diskrit, maka biasanya tidak ada kesewenang-wenangan dalam pemilihan angka.
  • Jika pendistribusiannya berlangsung terus-menerus, maka kesewenang-wenangan tidak bisa dihindari. Blok yang setara secara statistik dapat digunakan (semua O sama, misalnya =10). Namun, panjang intervalnya berbeda-beda. Saat melakukan perhitungan manual, mereka mencoba membuat intervalnya sama. Haruskah interval dalam mempelajari distribusi sifat univariat harus sama? TIDAK.
  • Digit-digit tersebut harus digabungkan sedemikian rupa sehingga frekuensi yang diharapkan (tidak teramati!) tidak terlalu kecil (≥5). Mari kita ingat bahwa mereka (E i)lah yang menjadi penyebut saat menghitung X 2! Saat menganalisis karakteristik satu dimensi, aturan ini diperbolehkan untuk dilanggar pada dua digit ekstrem E 1 =E maks =1. Jika jumlah digitnya besar dan frekuensi yang diharapkan mendekati, maka X 2 merupakan perkiraan yang baik untuk χ 2 bahkan untuk E i =2.

Estimasi Parameter. Penggunaan metode estimasi “buatan sendiri” yang tidak efisien dapat menyebabkan nilai jarak Pearson meningkat.

Memilih jumlah derajat kebebasan yang tepat. Jika estimasi parameter dibuat bukan dari frekuensi, tetapi langsung dari data (misalnya, mean aritmatika diambil sebagai estimasi mean), maka jumlah pasti derajat kebebasan n tidak diketahui. Kita hanya tahu bahwa ini memenuhi ketimpangan:

(jumlah digit – 1 – jumlah parameter yang dievaluasi)< n < (число разрядов – 1)

Oleh karena itu, X 2 perlu dibandingkan dengan nilai kritis χ 2 krit yang dihitung pada rentang n ini.

Bagaimana menafsirkan nilai chi-kuadrat yang sangat kecil? Haruskah sebuah koin dianggap simetris jika, setelah 10.000 kali pelemparan, koin tersebut mendarat di lambang negara sebanyak 5.000 kali? Sebelumnya, banyak ahli statistik percaya bahwa H 0 juga harus ditolak. Sekarang pendekatan lain diusulkan: terima H 0, tetapi data dan metodologi analisisnya perlu diverifikasi lebih lanjut. Ada dua kemungkinan: jarak Pearson yang terlalu kecil berarti peningkatan jumlah parameter model tidak disertai dengan penurunan jumlah derajat kebebasan, atau data itu sendiri dipalsukan (mungkin secara tidak sengaja disesuaikan dengan perkiraan). hasil).

Contoh. Dua peneliti A dan B menghitung proporsi homozigot resesif aa pada generasi kedua persilangan monohibrid AA*aa. Menurut hukum Mendel, pecahan ini adalah 0,25. Setiap peneliti melakukan 5 percobaan, dan 100 organisme dipelajari dalam setiap percobaan.

Hasil A : 25, 24, 26, 25, 24. Kesimpulan peneliti : Hukum Mendel benar(?).

Hasil B: 29, 21, 23, 30, 19. Kesimpulan peneliti: Hukum Mendel tidak adil(?).

Namun, hukum Mendel bersifat statistik, dan analisis kuantitatif terhadap hasil membalikkan kesimpulan tersebut! Menggabungkan lima percobaan menjadi satu, kita sampai pada distribusi chi-kuadrat dengan 5 derajat kebebasan (hipotesis sederhana diuji):

X 2 A = ((25-25) 2 +(24-25) 2 +(26-25) 2 +(25-25) 2 +(24-25) 2)/(100∙0.25∙0.75)=0.16

X 2 B = ((29-25) 2 +(21-25) 2 +(23-25) 2 +(30-25) 2 +(19-25) 2)/(100∙0.25∙0.75)=5.17

Nilai rata-rata m [χ 2 n =5 ]=5, simpangan baku σ[χ 2 n =5 ]=(2∙5) 1/2 =3.2.

Oleh karena itu, tanpa mengacu pada tabel, jelas bahwa nilai X 2 B adalah tipikal, dan nilai X 2 A sangat kecil. Menurut tabel P (χ 2 n =5<0.16)<0.0001.

Contoh ini merupakan adaptasi dari kasus nyata yang terjadi pada tahun 1930-an (lihat karya Kolmogorov “On Another Proof of Mendel’s Laws”). Menariknya, Peneliti A mendukung genetika, dan Peneliti B menentangnya.

Kebingungan dalam notasi. Jarak Pearson, yang memerlukan konvensi tambahan dalam perhitungannya, perlu dibedakan dari konsep matematika variabel acak chi-kuadrat. Jarak Pearson pada kondisi tertentu mempunyai distribusi mendekati chi-kuadrat dengan n derajat kebebasan. Oleh karena itu, disarankan untuk TIDAK menyatakan jarak Pearson dengan simbol χ 2 n, tetapi menggunakan notasi yang serupa tetapi berbeda X 2. .

Kriteria Pearson tidaklah mahakuasa. Ada banyak sekali alternatif untuk H 0 yang tidak dapat dia perhitungkan. Misalkan Anda menguji hipotesis bahwa fitur tersebut memiliki distribusi yang seragam, Anda memiliki 10 digit dan vektor frekuensi yang diamati sama dengan (130,125,121,118,116,115,114,113,111,110). Kriteria Pearson tidak dapat “memperhatikan” bahwa frekuensi menurun secara monoton dan H 0 tidak akan ditolak. Jika dilengkapi dengan kriteria seri, maka ya!

23. Konsep chi-kuadrat dan distribusi Student, serta tampilan grafis

1) Distribusi (chi-kuadrat) dengan n derajat kebebasan adalah distribusi jumlah kuadrat dari n variabel acak normal standar bebas.

Distribusi (chi-kuadrat)– distribusi variabel acak (dan ekspektasi matematis masing-masing variabel adalah 0, dan deviasi standarnya adalah 1)

di mana variabel acaknya mandiri dan mempunyai distribusi yang sama. Dalam hal ini, banyaknya suku disebut “jumlah derajat kebebasan” dari distribusi chi-kuadrat. Bilangan chi-kuadrat ditentukan oleh satu parameter, yaitu jumlah derajat kebebasan. Ketika jumlah derajat kebebasan meningkat, distribusi perlahan-lahan mendekati normal.

Kemudian jumlah kuadratnya

adalah variabel acak yang terdistribusi menurut hukum chi-kuadrat dengan k = n derajat kebebasan; jika suku-suku tersebut dihubungkan oleh suatu relasi (misalnya ), maka banyaknya derajat kebebasan k = n – 1.

Kepadatan distribusi ini

- jumlah derajat kebebasan, ditentukan oleh rumus - fungsi gamma; khususnya, Г(n + 1) = n! .

Oleh karena itu, distribusi chi-kuadrat ditentukan oleh satu parameter - jumlah derajat kebebasan k.

Catatan 1. Dengan bertambahnya jumlah derajat kebebasan, distribusi chi-kuadrat secara bertahap mendekati normal.

Catatan 2. Dengan menggunakan distribusi chi-kuadrat, banyak distribusi lain yang ditemui dalam praktik ditentukan, misalnya distribusi variabel acak - panjang vektor acak (X1, X2,..., Xn), koordinat dari yang berdiri sendiri dan tersebar menurut hukum adat.

Distribusi χ2 pertama kali diperhatikan oleh R. Helmert (1876) dan K. Pearson (1900).

Matematika.mengharapkan.=n; D=2n

2) Distribusi siswa

Pertimbangkan dua variabel acak independen: Z, yang berdistribusi normal dan ternormalisasi (yaitu, M(Z) = 0, σ(Z) = 1), dan V, yang terdistribusi menurut hukum chi-kuadrat dengan k derajat kebebasan. Lalu nilainya

mempunyai distribusi yang disebut distribusi t atau distribusi Student dengan derajat kebebasan k. Dalam hal ini, k disebut “bilangan derajat kebebasan” dari distribusi Student.

Ketika jumlah derajat kebebasan bertambah, distribusi Student dengan cepat mendekati normal.

Distribusi ini diperkenalkan pada tahun 1908 oleh ahli statistik Inggris W. Gosset, yang bekerja di sebuah pabrik bir. Metode probabilistik dan statistik digunakan untuk mengambil keputusan ekonomi dan teknis di pabrik ini, sehingga manajemennya melarang V. Gosset menerbitkan artikel ilmiah atas namanya sendiri. Dengan cara ini, rahasia dagang dan “pengetahuan” dalam bentuk metode probabilistik dan statistik yang dikembangkan oleh V. Gosset dilindungi. Namun, ia mendapat kesempatan untuk menerbitkan dengan nama samaran "Mahasiswa". Kisah Gosset-Student menunjukkan bahwa bahkan seratus tahun yang lalu, para manajer di Inggris menyadari efisiensi ekonomi yang lebih besar dari metode pengambilan keputusan probabilistik dan statistik.



Apakah Anda menyukai artikelnya? Bagikan dengan teman Anda!