3 konsekuensi dari hukum bilangan besar. Hukum bilangan besar dalam bentuk Chebyshev

Hukum jumlah yang besar adalah hukum pusat teori probabilitas karena ia merumuskan hubungan mendasar antara keteraturan dan keacakan. Yakni, ia berpendapat bahwa banyaknya kecelakaan mengarah pada suatu pola, yang memungkinkan untuk memprediksi jalannya peristiwa. Paling banyak bentuk umum dia mengekspresikan dirinya teorema Chebyshev:

Membiarkan ( Χ 1; X 2 ; … X n ; ...) variabel acak independen (diasumsikan demikian jumlah yang tak terbatas). Dan biarkan variansnya dibatasi secara seragam (yaitu, varians dari semua variabel acak ini tidak melebihi suatu konstanta DENGAN):

Kemudian, betapapun kecilnya bilangan positifnya, hubungan probabilitas pembatasnya terpenuhi:

jika jumlah variabel acak cukup besar. Atau, hal yang sama, probabilitas

Jadi, teorema Chebyshev menyatakan bahwa jika kita mempertimbangkan bilangan yang cukup besar N variabel acak independen ( Χ 1; X 2 ; … Xn), maka kejadian tersebut dapat dianggap hampir dapat diandalkan (dengan probabilitas mendekati kesatuan) bahwa deviasi mean aritmatika variabel acak tersebut dari mean aritmatika ekspektasi matematisnya akan sesuai dengan nilai mutlak sekecil yang Anda suka.

Bukti. Χ 1; X 2 ; … Xn):

(4)

; (5)

Dengan mempertimbangkan kondisi (1), kami menetapkan bahwa

(6)

Jadi, ketika variansnya adalah . Artinya, ketika terjadi penyebaran nilai-nilai variabel acak di sekelilingnya harapan matematis berkurang tanpa batas waktu. Dan ini berarti ketika nilainya, yaitu, . Atau, lebih tepatnya, probabilitas bahwa suatu variabel acak setidaknya akan menyimpang dari ekspektasi matematisnya - sebuah konstanta - cenderung nol. Yaitu, untuk bilangan positif kecil apa pun

Jadi, menurut teorema Chebyshev yang terbukti, mean aritmatika dari sejumlah besar variabel acak independen ( Χ 1; X 2 ; … Xn), sebagai variabel acak, sebenarnya kehilangan karakter keacakan, bahkan menjadi konstanta yang tidak dapat diubah. Konstanta ini sama dengan rata-rata aritmatika dari ekspektasi matematis dari nilai-nilai tersebut ( Χ 1; X 2 ; … Xn). Ini adalah hukum bilangan besar.

Bukti lain dari teorema Chebyshev dapat diberikan. Untuk melakukan ini, kami menggunakan pertidaksamaan Chebyshev. Ini berlaku untuk variabel acak diskrit dan kontinu dan memiliki nilai tersendiri. Pertidaksamaan Chebyshev memungkinkan kita memperkirakan probabilitas bahwa deviasi suatu variabel acak dari ekspektasi matematisnya tidak melebihi nilai absolutnya. angka positif. Mari kita berikan bukti pertidaksamaan Chebyshev untuk variabel acak diskrit.



Ketimpangan Chebyshev: Probabilitas terjadinya penyimpangan suatu variabel acak X dari ekspektasi matematisnya pada nilai absolut kurang dari suatu bilangan positif, tidak kurang dari:

.

Bukti: Sejak peristiwa yang terdiri dari implementasi ketimpangan Dan , berlawanan, maka jumlah probabilitasnya sama dengan 1, yaitu. . Oleh karena itu kemungkinan yang kami minati. (*)

Kami akan menemukannya . Untuk melakukan ini, kita mencari varians dari variabel acak X.

Semua suku dari jumlah ini adalah non-negatif. Mari kita buang istilah-istilah itu (untuk sisa ketentuan ), akibatnya jumlahnya hanya bisa berkurang. Mari kita sepakat untuk berasumsi, demi kepastian, bahwa k istilah pertama (kita akan berasumsi bahwa dalam tabel distribusi nilai yang mungkin diberi nomor dalam urutan itu). Dengan demikian,

Karena kedua sisi pertidaksamaan positif, oleh karena itu, dengan mengkuadratkannya, kita memperoleh pertidaksamaan yang setara . Mari kita gunakan pernyataan ini, dengan mengganti masing-masing faktor dalam jumlah yang tersisa angka (dalam hal ini ketimpangan hanya bisa meningkat), kita dapatkan. (**)

Menurut teorema penjumlahan, jumlah probabilitas adalah probabilitas bahwa X akan mengambil satu, tidak peduli yang mana, dari nilai-nilai tersebut , dan untuk salah satu dari mereka, deviasinya memenuhi ketimpangan . Oleh karena itu, jumlah tersebut menyatakan probabilitas . Hal ini memungkinkan kita untuk menulis ulang pertidaksamaan (**) sebagai berikut: . (***).

Mari kita gantikan (***) V (*) dan kita mendapatkan , itulah yang perlu dibuktikan.

Bukti Teorema Chebyshev 2:

Mari kita mempertimbangkan variabel acak baru - rata-rata aritmatika dari variabel acak ( Χ 1; X 2 ; … Xn):

Dengan menggunakan sifat ekspektasi dan dispersi matematis, kita memperoleh:

; . (*)

Menerapkan pertidaksamaan Chebyshev pada kuantitas, kita punya.

Mengingat rasio (*),

Dengan syarat, artinya . (***) Penggantian sisi kanan(***) menjadi pertidaksamaan (**) yang kita miliki

Dari sini, melewati batas di , kita peroleh

Karena probabilitasnya tidak boleh melebihi satu, akhirnya kita mendapatkan:

Itu yang perlu kami buktikan.

Mari kita memikirkan satu kasus penting dari teorema Chebyshev. Yaitu, pertimbangkan kasus ketika variabel acak independen ( Χ 1; X 2 ; … Xn) memiliki hukum distribusi yang sama, dan akibatnya, sama karakteristik numerik:

(8)

Kemudian untuk variabel acak, menurut (5), kita mempunyai:

(9)

Relasi probabilitas pembatas (7) dalam hal ini akan berbentuk:

(10)

Kesimpulan berikut dari (10) memiliki nilai yang besar untuk mengatasi kesalahan acak saat melakukan berbagai jenis pengukuran.

Misalnya, Anda perlu mengukur besaran tertentu A. Kami akan memproduksi bukan hanya satu, tetapi beberapa ( N) pengukuran berulang yang independen terhadap nilai besaran ini. Setiap pengukuran melekat pada kesalahan acak yang terkait dengan ketidaksempurnaan alat pengukur, segala jenis gangguan acak dalam pengukuran, dll. Oleh karena itu hasilnya ( Χ 1; X 2 ; … Xn) pengukuran berurutan individu dari nilai yang diinginkan A, secara umum, tidak akan diberikan - variabel tersebut akan berupa variabel acak. Apalagi dengan jumlah yang dimiliki distribusi yang identik, karena pengukuran dilakukan berulang kali, yaitu konstan kondisi eksternal. Kemudian untuk kuantitas – mean aritmatika dari hasil semuanya N pengukuran - hubungan probabilitas pembatas (10) akan terpenuhi. Artinya rata-rata aritmatika ini kehilangan sifat keacakan dan berubah menjadi Aarti sebenarnya kuantitas yang diukur. Hal ini dibuktikan dengan rumus (9), yang menurutnya:

(11)

Artinya, setelah melakukan pengukuran berulang dalam jumlah yang cukup besar terhadap jumlah yang diinginkan A, yang masing-masing kesalahan pengukuran acak dimungkinkan, dan kemudian menemukan rata-ratanya hasil aritmatika pengukuran ini, kami menggunakan rumus

A(12)

kita bisa mendapatkan nilainya dan praktis tanpa kesalahan acak.

Kesimpulan ini merupakan konsekuensi dari hukum bilangan besar. DI DALAM dalam hal ini hukum ini diwujudkan dalam kenyataan bahwa ketika menjumlahkan hasil pengukuran pada (4) kesalahan acak dimensi individu, yang pada prinsipnya sering muncul dengan tanda plus dan minus, umumnya akan saling meniadakan. Dan kesalahan yang tersisa akan tetap dibagi menjadi N, artinya, akan semakin berkurang sebesar N sekali. Jadi kapan nilai-nilai besar N nilainya akan hampir sama persis dengan nilai yang diukur A. Kesimpulan ini tentu saja banyak digunakan dalam praktik.

Catatan. Besarnya mereka saling meniadakan satu sama lain saja kesalahan acak pengukuran, yaitu kesalahan yang berhubungan dengan tindakan faktor acak (interferensi). Tetapi kesalahan sistematis (permanen), yaitu kesalahan yang melekat pada setiap pengukuran, secara alami tetap ada. Misalnya, anak panah yang terjatuh (tidak disetel) pada suatu alat menyebabkan kesalahan yang konstan (sistematis) pada setiap pengukuran, dan oleh karena itu menyebabkannya pada rata-rata aritmatika dari hasil pengukuran tersebut. Kesalahan sistematis harus dihilangkan bahkan sebelum pengukuran dilakukan dan tidak diperbolehkan selama proses pengukuran.

Kemudian, jika α adalah nilai pembagian alat ukur, maka semua pengukuran berulang dilakukan dengan ketelitian α. Namun tentu saja, rata-rata aritmatika dari hasil semua pengukuran hanya dapat ditunjukkan dengan ketelitian , yaitu dengan ketelitian yang ditentukan oleh ketelitian alat.

Oleh karena itu, orang tidak boleh berpikir demikian, setelah melakukan pengukuran kuantitas yang berulang-ulang dalam jumlah yang cukup besar A dan kemudian mencari mean aritmatika dari hasil pengukuran tersebut, kita peroleh akurat arti A. Kami akan mendapatkannya hanya dalam keakuratan alat pengukur. Itupun jika kita mengecualikan kesalahan pengukuran sistematis.

Ini satu hal penting lainnya kasus khusus hukum jumlah besar. Membiarkan X=k– jumlah kemunculan suatu peristiwa A V N pengujian berulang ( X– variabel acak). Dan biarkan dan – kemungkinan terjadinya dan tidak terjadinya suatu peristiwa A dalam satu tes. Pertimbangkan variabel acak - frekuensi relatif terjadinya suatu peristiwa A V N tes. Mari kita perkenalkan juga N variabel acak ( X 1, X 2, …X n), yang mewakili jumlah kemunculan peristiwa tersebut A di yang pertama, kedua,... N tes -th. Kemudian k = X 1 + X 2 +…+ X hal, dan terjadinya suatu peristiwa A praktis bertepatan dengan kemungkinan terjadinya peristiwa tersebut A dalam satu tes. Kesimpulan ini menjadi dasar untuk mencari peluang dari banyak kejadian acak, yang peluangnya tidak dapat ditemukan dengan cara lain (secara teoritis).

Misalnya, tesnya berupa pelemparan uang logam yang cacat (asimetris), dan kejadiannya A untuk tantangan ini, ini adalah penurunan puncak. Kemungkinan kejadian A Oleh rumus klasik atau cara lain rumus teoritis sulit ditemukan, karena rumus seperti itu pasti mencerminkan karakteristik deformasi koin. Oleh karena itu, jalan sebenarnya menuju tujuan adalah satu: melempar koin berulang kali (semakin banyak jumlah pelemparannya N, semakin baik) dan menentukan secara empiris frekuensi relatif kemunculan lambang tersebut. Jika N besar, maka sesuai dengan hukum bilangan besar dimungkinkan dengan probabilitas tinggi tegaskan itu .

Hukum bilangan besar memanifestasikan dirinya dalam banyak fenomena alam dan sosial.

Contoh 1. Sebagaimana diketahui, gas yang ditempatkan dalam bejana tertutup memberikan tekanan pada dinding bejana. Menurut hukum keadaan gas, pada suhu gas konstan, tekanan ini juga konstan. Tekanan gas disebabkan oleh dampak kacau masing-masing molekul terhadap dinding bejana. Kecepatan dan arah pergerakan semua molekul berbeda-beda, oleh karena itu gaya tumbukan berbagai molekul pada dinding bejana juga berbeda. Namun, tekanan gas pada dinding bejana tidak ditentukan oleh gaya tumbukan masing-masing molekul, tetapi oleh molekulnya rata-rata dengan paksa. Tapi dia seperti rata-rata jumlah yang sangat besar tanpa memedulikan kekuatan aktif, menurut hukum bilangan besar, praktis tidak akan berubah. Oleh karena itu, tekanan gas pada dinding bejana praktis tidak berubah.

Contoh 2. Perusahaan asuransi yang menangani, misalnya, asuransi mobil, membayar jumlah asuransi yang berbeda untuk berbagai peristiwa yang diasuransikan (kecelakaan mobil dan kecelakaan lalu lintas). Namun, nilai rata-rata jumlah asuransi ini, karena rata-ratanya banyak berbeda N jumlah asuransi independen, menurut hukum jumlah besar, praktis tidak berubah. Hal ini dapat ditentukan dengan memeriksa statistik klaim asuransi yang sebenarnya. Agar suatu perusahaan asuransi terhindar dari kerugian, maka rata-rata premi asuransi yang dibebankan kepada kliennya harus lebih tinggi dari rata-rata premi yang dibayarkan perusahaan kepada kliennya. Namun premi ini tidak boleh terlalu tinggi agar perusahaan dapat bersaing (bersaing menarik dengan perusahaan asuransi lain).

1. /PB-MS-teori/Kuliah-1(4p.).doc
2. /PB-MS-teori/Kuliah-2 (4 hal.).doc
3. /PB-MS-teori/Kuliah-3(4p.).doc
4. /PB-MS-teori/Kuliah-4(4p.).doc
5. /PB-MS-teori/Isi.doc
Kuliah 1
Kuliah 19. Pengujian statistik hipotesis statistik. Prinsip umum pengujian hipotesis. Konsep hipotesis statistik (sederhana dan kompleks), hipotesis nol dan hipotesis bersaing,
Hukum bilangan besar. Ketimpangan Chebyshev. Teorema Chebyshev dan Bernoulli
Kuliah Karakteristik numerik dasar variabel acak diskrit dan kontinu: ekspektasi matematis, dispersi dan deviasi standar. Sifat-sifatnya dan contohnya
Kuliah Mata kuliah teori probabilitas. Peristiwa acak. Aljabar peristiwa. Frekuensi relatif dan probabilitas kejadian acak. Kumpulan acara lengkap. Definisi klasik tentang probabilitas. Sifat dasar probabilitas. Rumus dasar kombinatorik

Kuliah 13.

Hukum bilangan besar. Ketimpangan Chebyshev. Teorema Chebyshev dan Bernoulli.
Studi tentang pola statistik memungkinkan untuk menetapkan bahwa, dalam kondisi tertentu, perilaku umum jumlah besar variabel acak hampir kehilangan karakter acaknya dan menjadi alami (dengan kata lain, penyimpangan acak dari beberapa perilaku rata-rata menghilangkan satu sama lain). Khususnya, jika pengaruh terhadap jumlah suku-suku individual kecil secara seragam, hukum distribusi jumlah tersebut mendekati normal. Formulasi matematika Pernyataan ini diberikan dalam sekelompok teorema yang disebut hukum jumlah besar.

Ketimpangan Chebyshev.
Pertidaksamaan Chebyshev, yang digunakan untuk membuktikan teorema lebih lanjut, berlaku baik untuk variabel acak kontinu maupun diskrit. Mari kita buktikan untuk variabel acak diskrit.
Teorema 13.1 (Ketidaksetaraan Chebyshev). P( | XM(X)| D( X) /ε². (13.1)

Bukti. Membiarkan X diberikan oleh seri distribusi


X

X 1

X 2



X N

R

R 1

R 2



R N

Sejak peristiwa | XM(X)| X M(X)| ≥ ε adalah kebalikannya R (|XM(X)| hal(| XM(X)| ≥ ε) = 1, oleh karena itu, R (|XM(X)| hal(| XM(X)| ≥ε). Kami akan menemukannya R (|XM(X)| ≥ ε).

D(X) = (X 1 – M(X))² P 1 + (X 2 – M(X))² P 2 + … + (X N M(X))² P N . Mari kita kecualikan dari jumlah ini istilah-istilah yang | XM(X)| k ketentuan. Kemudian

D(X) ≥ (X k + 1 – M(X))² P k + 1 + (X k + 2 – M(X))² P k +2 + … + (X N M(X))² P N ≥ ε² ( P k + 1 + P k + 2 + … + P N).

Perhatikan itu P k + 1 + P k + 2 + … + P N ada kemungkinan | XM(X)| ≥ ε, karena ini adalah jumlah probabilitas dari semua nilai yang mungkin X, yang mana ketidaksetaraan ini benar. Karena itu, D(X) ≥ ε² R(|XM(X)| ≥ ε), atau R (|XM(X)| ≥ ε) ≤ D(X) /ε². Maka kemungkinan terjadinya kejadian sebaliknya P( | XM(X)| D( X) / ε², yang perlu dibuktikan.
Teorema Chebyshev dan Bernoulli.

Teorema 13.2 (Teorema Chebyshev). Jika X 1 , X 2 ,…, X N– variabel acak independen berpasangan yang variansnya terbatas secara seragam ( D(X Saya) ≤ C), maka untuk sejumlah kecil ε probabilitas ketidaksetaraan

akan mendekati 1 jika jumlah variabel acak cukup besar.

Komentar. Dengan kata lain, jika syarat tersebut terpenuhi

Bukti. Pertimbangkan variabel acak baru
dan temukan ekspektasi matematisnya. Dengan menggunakan sifat-sifat ekspektasi matematis, kita memperolehnya. Terapkan ke Pertidaksamaan Chebyshev: Karena variabel acak yang dipertimbangkan adalah bebas, maka, dengan mempertimbangkan kondisi teorema, kita mendapatkan: Dengan menggunakan hasil ini, kita menyajikan pertidaksamaan sebelumnya dalam bentuk:

Mari kita mencapai batas di
: Karena probabilitasnya tidak boleh lebih besar dari 1, maka dapat dinyatakan sebagai berikut

Teorema tersebut telah terbukti.
Konsekuensi.

Jika X 1 , X 2 , …, X N– variabel acak independen berpasangan dengan varian terbatas seragam, memiliki ekspektasi matematis yang sama A, maka untuk ε kecil > 0 kemungkinan terjadinya ketimpangan
akan mendekati 1 sesuai keinginan jika jumlah variabel acak cukup besar. Dengan kata lain,
.

Kesimpulan: mean aritmatika dari sejumlah besar variabel acak mengambil nilai yang mendekati jumlah ekspektasi matematisnya, yaitu kehilangan karakter variabel acak. Misalnya saja jika dilakukan serangkaian pengukuran kuantitas fisik, dan: a) hasil setiap pengukuran tidak bergantung pada hasil pengukuran lainnya, yaitu semua hasil merupakan variabel acak bebas berpasangan; b) pengukuran dilakukan tanpa kesalahan sistematis (ekspektasi matematisnya sama satu sama lain dan sama dengan nilai sebenarnya A kuantitas terukur); c) keakuratan pengukuran tertentu dipastikan, oleh karena itu, penyebaran variabel acak yang dipertimbangkan terbatas secara seragam; lalu dengan secukupnya jumlah besar pengukuran, rata-rata aritmatikanya akan mendekati nilai sebenarnya dari nilai yang diukur.
teorema Bernoulli.
Teorema 13.3 (Teorema Bernoulli). Jika di masing-masing N probabilitas percobaan independen R terjadinya suatu peristiwa A adalah konstan, maka dengan jumlah pengujian yang cukup besar probabilitas modulus deviasi frekuensi relatif kemunculannya A V N percobaan dari R akan menjadi sekecil yang diinginkan, mendekati 1 sesuai keinginan:

(13.2)

Bukti. Mari kita perkenalkan variabel acak X 1 , X 2 , …, X N, Di mana X Saya jumlah penampilan A V Saya-Saya pengalaman. Pada saat yang sama X Saya hanya dapat mengambil dua nilai: 1 (dengan probabilitas R) dan 0 (dengan probabilitas Q = 1 – P). Selain itu, variabel acak yang dipertimbangkan bersifat independen berpasangan dan variansnya berbatas seragam (karena D(X Saya) = hal, P + Q = 1, dari mana hal ≤ ¼). Akibatnya, teorema Chebyshev dapat diterapkan pada mereka kapan M Saya = P:

.

Tetapi
, Karena X Saya mengambil nilai 1 saat muncul A V pengalaman ini, dan nilai sama dengan 0 jika A tidak terjadi. Dengan demikian,

Q.E.D.
Komentar. Dari teorema Bernoulli tidak seharusnya, Apa
Ini tentang hanya tentang probabilitas bahwa perbedaan antara frekuensi relatif dan probabilitas absolut dapat menjadi sangat kecil. Perbedaannya adalah sebagai berikut: dengan konvergensi yang biasa dipertimbangkan dalam analisis matematis, untuk semua N, dimulai dari beberapa nilai, ketidaksetaraan
selalu dieksekusi; dalam kasus kami mungkin ada nilai seperti itu N, yang mana ketidaksetaraan ini tidak benar. Konvergensi seperti ini disebut konvergensi dalam probabilitas.

Kuliah 14.

Teorema limit pusat Lyapunov. Teorema limit De Moivre-Laplace.
Hukum bilangan besar tidak mengkaji bentuk membatasi hukum distribusi jumlah variabel acak. Pertanyaan ini dibahas dalam sekelompok teorema yang disebut teorema limit pusat. Mereka berpendapat bahwa hukum distribusi sejumlah variabel acak, yang masing-masing dapat mempunyai distribusi berbeda, mendekati normal jika jumlah sukunya cukup besar. Hal ini menjelaskan pentingnya hukum normal untuk penerapan praktis.
Fungsi karakteristik.

Untuk membuktikan pusatnya teorema batas Metode fungsi karakteristik yang digunakan.
Definisi 14.1.Fungsi karakteristik variabel acak X disebut fungsi

G(T) = M (e ituX ) (14.1)

Dengan demikian, G (T) mewakili ekspektasi matematis dari beberapa variabel acak kompleks kamu = e ituX, terkait dengan nilai X. Khususnya, jika X– variabel acak diskrit, diberikan di dekatnya distribusi, kalau begitu

. (14.2)

Untuk variabel acak kontinu dengan kepadatan distribusi F(X)

(14.3)

Contoh 1. Biarkan X– jumlah 6 poin dalam satu lemparan dadu. Kemudian menurut rumus (14.2) G(T) =

Contoh 2. Mari kita cari fungsi karakteristik untuk variabel acak kontinu ternormalisasi yang terdistribusi hukum biasa
. Menurut rumus (14.3) (kami menggunakan rumus
dan apa Saya² = -1).

Sifat-sifat fungsi karakteristik.
1. Fungsi F(X) dapat ditemukan di fungsi yang diketahui G(T) sesuai rumus

(14.4)

(transformasi (14.3) disebut Transformasi Fourier, dan transformasi (14.4) – transformasi terbalik Fourier).

2. Jika variabel acak X Dan Y dihubungkan oleh relasi tersebut Y = kapak, maka fungsi karakteristiknya dihubungkan oleh relasi

G kamu (T) = G X (pada). (14.5)

3. Fungsi karakteristik dari jumlah variabel acak bebas sama dengan hasil kali fungsi karakteristik suku-suku: for

(14.6)
Teorema 14.1 (teorema limit pusat untuk suku-suku yang terdistribusi identik). Jika X 1 , X 2 ,…, X N,… - variabel acak independen dengan hukum yang sama distribusi, ekspektasi matematis T dan varians σ 2, lalu dengan peningkatan tak terbatas N hukum distribusi jumlah
mendekati normal tanpa batas.

Bukti.

Mari kita buktikan teorema variabel acak kontinu X 1 , X 2 ,…, X N(bukti untuk jumlah yang terpisah demikian pula). Menurut ketentuan teorema, fungsi karakteristik suku-suku tersebut adalah identik:
Kemudian, berdasarkan sifat 3, fungsi karakteristik dari jumlah tersebut Y N akan
Mari kita perluas fungsinya G X (T) dalam deret Maclaurin:

, Di mana
pada
.

Dengan asumsi itu T= 0 (yaitu memindahkan titik asal ke titik T), Itu
.

(Karena T= 0). Mengganti hasil yang diperoleh ke dalam rumus Maclaurin, kami menemukan bahwa

.

Pertimbangkan variabel acak baru
, berbeda dari Y N dalam hal itu penyebarannya untuk apa pun N sama dengan 0. Sejak Y N Dan Z N terhubung ketergantungan linier, itu sudah cukup untuk membuktikannya Z N didistribusikan menurut hukum normal, atau, yang sama, mendekati fungsi karakteristiknya fungsi karakteristik hukum normal (lihat contoh 2). Berdasarkan sifat fungsi karakteristik

Mari kita logaritma ekspresi yang dihasilkan:

Di mana

Mari kita terurai
berturut-turut di N→ ∞, membatasi diri pada dua suku pemuaian, lalu ln(1 - k) ≈ - k. Dari sini

Dimana limit terakhirnya adalah 0, karena pada . Karena itu,
, itu
- fungsi karakteristik distribusi normal. Jadi, dengan pertambahan jumlah suku yang tidak terbatas, fungsi karakteristik kuantitas Z N mendekati fungsi karakteristik hukum normal secara tidak terbatas; oleh karena itu, hukum distribusi Z N (Dan Y N) mendekati normal tanpa batas. Teorema tersebut telah terbukti.

A.M. Lyapunov membuktikan teorema limit pusat untuk kondisi lebih lanjut pandangan umum:
Teorema 14.2 (Teorema Lyapunov). Jika variabel acak X adalah jumlah dari sejumlah besar variabel acak yang saling bebas dan memenuhi kondisi berikut:

, (14.7)

Di mana B k – besaran momen sentral mutlak ketiga X Ke, A D k adalah variansnya X memiliki distribusi mendekati normal (kondisi Lyapunov berarti pengaruh setiap suku terhadap jumlah dapat diabaikan).
Dalam praktiknya, seseorang dapat menggunakan teorema limit pusat secara memadai jumlah kecil istilah, karena perhitungan probabilistik memerlukan akurasi yang relatif rendah. Pengalaman menunjukkan bahwa untuk jumlah sepuluh suku atau kurang, hukum distribusinya dapat digantikan dengan hukum normal.

Kasus khusus dari teorema limit pusat untuk variabel acak diskrit adalah teorema Moivre-Laplace.

Teorema 14.3 (Teorema Moivre-Laplace). Jika diproduksi N eksperimen independen, yang masing-masing berisi peristiwa A muncul dengan probabilitas R, maka relasi berikut ini valid:

(14.8)

Di mana Y – jumlah kemunculan peristiwa tersebut A V N eksperimen, Q = 1 – P.

Bukti.

Kami akan berasumsi demikian
, Di mana X Saya– jumlah kemunculan peristiwa tersebut A V Saya-Saya pengalaman. Kemudian variabel acak
(lihat Teorema 14.1) dapat dianggap berdistribusi normal dan ternormalisasi, oleh karena itu peluang jatuhnya ke dalam interval (α, β) dapat dicari dengan rumus

Sejak Y memiliki distribusi binomial, . Kemudian
. Mengganti ekspresi ini ke dalam rumus sebelumnya, kita memperoleh persamaan (14.8).

Konsekuensi.

Di bawah kondisi teorema Moivre-Laplace, probabilitas
itu acaranya A akan muncul di N eksperimen dengan tepat k kali, dengan jumlah percobaan yang banyak dapat dicari dengan menggunakan rumus:

(14.9)

Di mana
, A
(nilai fungsi ini diberikan dalam tabel khusus).

Contoh 3. Tentukan peluang bahwa pada pelemparan 100 koin, jumlah lambang akan berkisar antara 40 hingga 60.

Mari kita terapkan rumus (14.8), dengan mempertimbangkan hal itu N= 0,5. Kemudian pr= 100·0,5 = 50, Maka, jika
Karena itu,

Contoh 4. Berdasarkan kondisi contoh sebelumnya, tentukan peluang munculnya 45 lambang.

Kami akan menemukannya
, Kemudian

Kuliah 15.

Konsep Dasar statistik matematika. Populasi dan sampel. Seri variasi, seri statistik. Sampel yang dikelompokkan. Seri statistik yang dikelompokkan. Poligon frekuensi. Fungsi distribusi sampel dan histogram.
Statistik matematika berkaitan dengan pembentukan pola yang mengatur massa fenomena acak, berdasarkan pengolahan data statistik yang diperoleh dari hasil observasi. Dua tugas utama statistik matematika adalah:

Menentukan cara mengumpulkan dan mengelompokkan statistik tersebut;

Pengembangan metode analisis data yang diperoleh tergantung pada tujuan penelitian, yang meliputi:

a) penilaian kemungkinan suatu peristiwa yang tidak diketahui; estimasi fungsi distribusi yang tidak diketahui; pendugaan parameter sebaran yang diketahui jenisnya; penilaian ketergantungan pada variabel acak lainnya, dll;

b) memeriksa hipotesis statistik tentang jenis distribusi yang tidak diketahui atau tentang nilai parameter dari distribusi yang diketahui.

Untuk mengatasi masalah ini, Anda harus memilih populasi besar benda homogen jumlah terbatas suatu benda, berdasarkan hasil kajiannya dapat dibuat suatu prakiraan mengenai sifat-sifat yang dipelajari dari benda-benda itu.

Mari kita definisikan konsep dasar statistik matematika.

Populasi – seluruh rangkaian objek yang tersedia.

Mencicipi– sekumpulan objek yang dipilih secara acak populasi.

Ukuran populasiN dan ukuran sampelN – jumlah objek dalam populasi yang dipertimbangkan.

Jenis pengambilan sampel:

Ulang– setiap objek yang dipilih dikembalikan ke populasi umum sebelum memilih objek berikutnya;

Tanpa pengulangan– objek yang dipilih tidak dikembalikan ke populasi umum.
Komentar. Untuk dapat menarik kesimpulan dari kajian sampel tentang perilaku karakteristik masyarakat umum yang menarik perhatian kita, sampel perlu mewakili dengan benar proporsi populasi umum, yaitu perwakilan(perwakilan). Dengan memperhatikan hukum bilangan besar, dapat dikatakan bahwa kondisi ini terpenuhi jika setiap objek dipilih secara acak, dan untuk objek apa pun peluang untuk dimasukkan ke dalam sampel adalah sama.
Pemrosesan hasil primer.

Biarkan variabel acak yang kita minati X mengambil nilai dalam sampel X 1 N 1 kali, X 2 – N 2 kali, ..., X Ke - P Ke kali, dan
Di mana N– ukuran sampel. Kemudian nilai observasi dari variabel acak X 1 , X 2 ,…, X Ke ditelepon pilihan, A N 1 , N 2 ,…, N Kefrekuensi. Jika kita membagi setiap frekuensi dengan ukuran sampel, kita mendapatkan frekuensi relatif
Urutan opsi yang ditulis dalam urutan menaik disebut variasional di sebelahnya, dan daftar opsi dan frekuensi yang sesuai atau frekuensi relatifseri statistik:


X Saya

X 1

X 2



X k

N Saya

N 1

N 2



N k

w Saya

w 1

w 2



w k

Saat melakukan 20 rangkaian lemparan 10 dadu, jumlah enam poin ternyata 1,1,4,0,1,2,1,2,2,0,5,3,3,1,0,2, 2,3 ,4,1.Ayo menulis seri variasi: 0,1,2,3,4,5. Seri statistik untuk frekuensi absolut dan relatif berbentuk:


X Saya

0

1

2

3

4

5

N Saya

3

6

5

3

2

1

w Saya

0,15

0,3

0,25

0,15

0,1

0,05

Jika suatu ciri kontinu sedang dipelajari, maka deret variasi dapat terdiri dari sejumlah besar angka. Dalam hal ini akan lebih nyaman digunakan sampel yang dikelompokkan. Untuk memperolehnya, interval yang berisi semua nilai atribut yang diamati dibagi menjadi beberapa interval parsial yang sama panjangnya H, lalu temukan untuk setiap interval parsial N Saya– jumlah frekuensi varian yang termasuk di dalamnya Saya interval ke-th. Tabel yang disusun dari hasil ini disebut dikelompokkan dekat secara statistik :

Poligon frekuensi. Fungsi distribusi sampel dan histogram.
Untuk memvisualisasikan perilaku variabel acak yang diteliti dalam sampel, Anda dapat membuat berbagai grafik. Salah satunya adalah rentang frekuensi: garis putus-putus yang ruas-ruasnya menghubungkan titik-titik dengan koordinat ( X 1 , N 1), (X 2 , N 2),…, (X k , N k), Di mana X Saya diplot pada sumbu x, dan N Saya – pada sumbu ordinat. Jika nilai non-absolut diplot pada sumbu ordinat ( N Saya), dan relatif ( w Saya) frekuensi, kita peroleh poligon frekuensi relatif(Gbr.1) . Beras. 1.

Dengan analogi fungsi distribusi variabel acak, Anda dapat menentukan fungsi tertentu, frekuensi relatif kejadian X X.

Definisi 15.1.Fungsi distribusi sampel (empiris). panggil fungsinya F* (X), mendefinisikan untuk setiap nilai X frekuensi relatif kejadian tersebut X X. Dengan demikian,

, (15.1)

Di mana N X– jumlah opsi, lebih kecil X, N– ukuran sampel.
Komentar. Berbeda dengan fungsi distribusi empiris yang ditemukan secara eksperimental, fungsi distribusi F(X) dari populasi umum disebut fungsi teoritis distribusi. F(X) menentukan probabilitas suatu kejadian X X, A F* (X) – frekuensi relatifnya. Untuk cukup besar N, sebagai berikut dari teorema Bernoulli, F* (X) cenderung kemungkinannya F(X).

Dari definisi fungsi distribusi empiris jelas bahwa sifat-sifatnya bertepatan dengan sifat-sifatnya F(X), yaitu:


  1. 0 ≤F* (X) ≤ 1.

  2. F* (X) adalah fungsi yang tidak menurun.

  3. Jika X Kalau begitu, 1 adalah pilihan terkecil F* (X) = 0 pada XX 1 ; Jika X Ke – kalau begitu, pilihan terbaik F* (X) = 1 jam X> X Ke .
Untuk fitur berkelanjutan, ilustrasi grafis adalah histogram, yaitu bangun datar bertingkat yang terdiri dari persegi panjang yang alasnya adalah interval parsial panjang H, dan ketinggian panjang N Saya / H(histogram frekuensi) atau w Saya / H (histogram frekuensi relatif). Dalam kasus pertama, luas histogram sama dengan volume sampel, dalam kasus kedua – satu kesatuan (Gbr. 2). Gambar.2.

Kuliah 16.

Karakteristik numerik distribusi statistik: mean sampel, estimasi varians, estimasi mode dan median, estimasi momen awal dan sentral. Deskripsi Statistik dan menghitung perkiraan parameter vektor acak dua dimensi.
Salah satu tugas statistik matematika adalah memperkirakan nilai karakteristik numerik dari variabel acak yang dipelajari dengan menggunakan sampel yang tersedia.

Definisi 16.1.Rata-rata sampel adalah mean aritmatika dari nilai variabel acak yang diambil dalam sampel:

, (16.1)

Di mana X Saya– pilihan, N Saya- frekuensi.

Komentar. Rata-rata sampel berfungsi untuk memperkirakan ekspektasi matematis dari variabel acak yang diteliti. Pertanyaan tentang seberapa akurat perkiraan tersebut akan dibahas nanti.

Definisi 16.2.Varians sampel ditelepon

, (16.2)

A deviasi standar sampel

(16.3)

Seperti halnya dalam teori variabel acak, hal itu dapat dibuktikan rumus berikut untuk menghitung varians sampel:

. (16.4)

Contoh 1. Mari kita cari karakteristik numerik suatu sampel yang diberikan oleh deret statistik


X Saya

2

5

7

8

N Saya

3

8

7

2

Ciri-ciri lain dari rangkaian variasi adalah:

- modeM 0 – memiliki pilihan frekuensi tertinggi(pada contoh sebelumnya M 0 = 5).

- medianT e - opsi, yang membagi rangkaian variasi menjadi dua bagian, dengan jumlah opsi yang sama. Jika pilihan bilangan ganjil ( N = 2k+ 1), lalu M e = X k + 1 , dan bahkan N = 2k
. Secara khusus, dalam contoh 1

Perkiraan momen awal dan momen sentral (yang disebut momen empiris) ditentukan serupa dengan momen teoretis terkait:

- momen keteraturan empiris awalk ditelepon

. (16.5)

Secara khusus,
, yaitu momen empiris awal orde pertama sama dengan rata-rata sampel.

- momen keteraturan empiris sentralk ditelepon

. (16.6)

Secara khusus,
, yaitu momen empiris pusat orde kedua sama dengan varians sampel.
Deskripsi statistik dan perhitungan karakteristik

vektor acak dua dimensi.
Pada penelitian statistik Untuk variabel acak dua dimensi, tugas utamanya biasanya mengidentifikasi hubungan antar komponen.

Sampel dua dimensi adalah himpunan nilai vektor acak: ( X 1 , pada 1), (X 2 , pada 2), …, (X N , kamu N). Untuk itu, Anda dapat menentukan rata-rata sampel dari komponen:

dan varians sampel serta deviasi standar yang sesuai. Selain itu, seseorang dapat menghitung rata-rata bersyarat: - rata-rata aritmatika dari nilai yang diamati Y, sesuai x = x, Dan - rata-rata nilai yang diamati X, sesuai Y = kamu.

Jika terdapat ketergantungan antara komponen-komponen variabel acak dua dimensi, hal tersebut mungkin ada tipe yang berbeda: ketergantungan fungsional jika setiap nilai yang mungkin X cocok dengan satu nilai Y, dan statistik, di mana perubahan suatu besaran menyebabkan perubahan distribusi besaran lainnya. Jika akibat perubahan suatu nilai terjadi perubahan nilai rata-rata nilai lainnya, maka ketergantungan statistik di antara keduanya disebut korelasi.

Kuliah 17.

Sifat dasar karakteristik statistik parameter distribusi: ketidakberpihakan, konsistensi, efisiensi. Ketidakbiasan dan konsistensi sampel berarti sebagai perkiraan ekspektasi matematis. Bias varians pengambilan sampel. Contoh penduga varians tak bias. Estimasi yang tidak bias secara asimtotik. Metode untuk membuat estimasi: metode kemungkinan besar, metode momen, metode kuantil, metode kuadrat terkecil, Pendekatan Bayesian terhadap estimasi.
Setelah memperoleh estimasi statistik dari parameter distribusi (rata-rata sampel, varians sampel, dll.), Anda perlu memastikan bahwa estimasi tersebut cukup berfungsi sebagai perkiraan karakteristik populasi yang sesuai. Mari kita tentukan persyaratan yang harus dipenuhi.

Misalkan Θ* merupakan perkiraan statistik dari parameter Θ yang tidak diketahui distribusi teoritis. Mari kita ambil beberapa sampel dengan ukuran yang sama dari populasi umum N dan hitung untuk masing-masing estimasi parameter Θ:
Maka estimasi Θ* dapat dianggap sebagai variabel acak yang mengambil nilai yang mungkin. Jika ekspektasi matematis Θ* tidak sama dengan parameter estimasi, yang akan kita terima saat menghitung estimasi kesalahan sistematik satu tanda (dengan kelebihan jika M(Θ*) >Θ, dan dengan kerugian jika M(Θ*) M (Θ*) = Θ.
Definisi 17.2. Estimasi statistik Θ* disebut tidak memihak, jika ekspektasi matematisnya sama dengan estimasi parameter Θ untuk ukuran sampel apa pun:

M(Θ*) = Θ. (17.1)

Terlantar disebut estimasi yang ekspektasi matematisnya tidak sama dengan parameter estimasi.

Namun, sikap tidak memihak tidaklah demikian kondisi cukup perkiraan yang baik terhadap nilai sebenarnya dari parameter yang diestimasi. Jika dalam hal ini kemungkinan nilai Θ* dapat menyimpang secara signifikan dari nilai rata-rata, yaitu dispersi Θ* besar, maka nilai yang ditemukan dari data satu sampel dapat berbeda secara signifikan dari parameter yang diperkirakan. Oleh karena itu, perlu dilakukan pembatasan penyebaran.
Definisi 17.2. Penilaian statistik disebut efektif, jika itu untuk ukuran sampel tertentu N mempunyai variansi sekecil mungkin.
Ketika mempertimbangkan sampel yang besar, estimasi statistik juga harus memenuhi persyaratan konsistensi.
Definisi 17.3.Kaya disebut perkiraan statistik itu, kapan N→∞ cenderung probabilitas terhadap parameter estimasi (jika estimasi ini tidak bias, maka akan konsisten jika pada N→∞ variansnya cenderung 0).
Mari kita pastikan itu mewakili perkiraan ekspektasi matematis yang tidak bias M(X).

Kami akan menganggapnya sebagai variabel acak, dan X 1 , X 2 ,…, X N, yaitu nilai-nilai variabel acak yang diteliti yang membentuk sampel, – sebagai variabel acak independen yang terdistribusi secara identik X 1 , X 2 ,…, X N, memiliki ekspektasi matematis A. Dari sifat-sifat ekspektasi matematis berikut ini

Tapi, karena jumlahnya masing-masing X 1 , X 2 ,…, X N memiliki distribusi yang sama dengan populasi umum, A = M(X), yaitu M(
) = M(X), itulah yang perlu dibuktikan. Rata-rata sampel bukan hanya merupakan perkiraan yang tidak bias, tetapi juga merupakan perkiraan ekspektasi matematis yang konsisten. Dengan asumsi itu X 1 , X 2 ,…, X N memiliki varian yang terbatas, maka dari teorema Chebyshev dapat disimpulkan bahwa rata-rata aritmatikanya, yaitu dengan meningkatnya N cenderung probabilitasnya terhadap ekspektasi matematis A masing-masing nilainya, yaitu M(X). Akibatnya, mean sampel adalah perkiraan ekspektasi matematis yang konsisten.

Berbeda dengan mean sampel, varians sampel adalah perkiraan bias dari varians populasi. Hal ini dapat dibuktikan

, (17.2)

Di mana D G – nilai sebenarnya dari varians populasi. Perkiraan penyebaran lainnya dapat diusulkan: varians yang dikoreksiS ² , dihitung dengan rumus

. (17.3)

Perkiraan seperti itu tidak bias. Itu sesuai dengan rata-rata yang dikoreksi deviasi standar

. (17.4)

Definisi 17.4. Evaluasi beberapa atribut disebut tidak memihak secara asimtotik, jika untuk sampel X 1 , X 2 , …, X N

, (17.5)

Di mana X– nilai sebenarnya dari besaran yang dipelajari.
Metode untuk membangun penilaian.
1. Metode kemungkinan maksimum.
Membiarkan X– variabel acak diskrit, yang sebagai hasilnya N tes mengambil nilai X 1 , X 2 , …, X N. Mari kita asumsikan bahwa kita mengetahui hukum distribusi besaran ini, yang ditentukan oleh parameter Θ, tetapi kita tidak mengetahuinya nilai numerik parameter ini. Mari kita cari perkiraan titiknya.

Membiarkan R(X Saya, Θ) adalah peluang bahwa sebagai hasil pengujian bernilai X akan mengambil nilainya X Saya. Mari kita menelepon fungsi kemungkinan variabel acak diskrit X fungsi argumen Θ, ditentukan oleh rumus:

L (X 1 , X 2 , …, X N ; Θ) = P(X 1 ,Θ) P(X 2 ,Θ)… P(X N ,Θ).

Kemudian, sebagai estimasi titik dari parameter Θ, kita ambil nilainya Θ* = Θ( X 1 , X 2 , …, X N), saat fungsi kemungkinan mencapai maksimum. Estimasi Θ* disebut perkiraan kemungkinan maksimum.

Sejak fungsinya L dan ln L mencapai maksimum pada nilai Θ yang sama, akan lebih mudah untuk mencari ln maksimum Lfungsi logaritma kredibilitas. Untuk melakukan ini, Anda perlu:


Keuntungan dari metode kemungkinan maksimum: estimasi yang diperoleh konsisten (walaupun mungkin bias), terdistribusi secara normal asimtotik untuk nilai yang besar N dan memiliki varian terkecil dibandingkan estimasi normal asimtotik lainnya; jika untuk parameter taksiran Θ ada penilaian yang efektifΘ*, maka persamaan kemungkinannya memiliki satu-satunya solusiΘ*; metode ini memanfaatkan data sampel secara paling lengkap dan oleh karena itu sangat berguna dalam kasus sampel kecil.

Kerugian dari metode kemungkinan maksimum: kompleksitas komputasi.
Untuk variabel acak kontinu dengan jenis kepadatan distribusi yang diketahui F(X) dan parameter Θ yang tidak diketahui, fungsi kemungkinannya berbentuk:

L (X 1 , X 2 , …, X N ; Θ) = F(X 1 ,Θ) F(X 2 ,Θ)… F(X N ,Θ).

Estimasi kemungkinan maksimum dari parameter yang tidak diketahui dilakukan dengan cara yang sama seperti variabel acak diskrit.
2. Metode momen.
Metode momen didasarkan pada fakta bahwa momen empiris awal dan momen sentral masing-masing merupakan taksiran yang konsisten terhadap momen teoretis awal dan sentral, sehingga dapat kita persamaankan. poin teoretis momen empiris yang bersesuaian dengan orde yang sama.

Jika jenis kepadatan distribusi ditentukan F(X, Θ), ditentukan oleh satu parameter Θ yang tidak diketahui, maka untuk memperkirakan parameter ini cukup memiliki satu persamaan. Misalnya saja bisa disamakan momen awal pesanan pertama:

,

sehingga diperoleh persamaan untuk menentukan Θ. Solusinya Θ* akan menjadi estimasi titik dari parameter, yang merupakan fungsi dari mean sampel dan, oleh karena itu, dari varian sampel:

Θ = ψ ( X 1 , X 2 , …, X N).

Jika spesies yang diketahui kepadatan distribusi F(X, Θ 1, Θ 2) ditentukan oleh dua parameter yang tidak diketahui Θ 1 dan Θ 2, maka perlu dibuat dua persamaan, misalnya

ν 1 = M 1 , μ 2 = T 2 .

Dari sini
- sistem dua persamaan dengan dua yang tidak diketahui Θ 1 dan Θ 2. Solusinya adalah estimasi titik Θ 1 * dan Θ 2 * - fungsi opsi pengambilan sampel:

Θ 1 = ψ 1 ( X 1 , X 2 , …, X N),

Θ 2 = ψ 2 ( X 1 , X 2 , …, X N).
3. Metode kuadrat terkecil.

Jika Anda perlu memperkirakan ketergantungan kuantitas pada Dan X, dan bentuk fungsi yang menghubungkannya diketahui, tetapi nilai koefisien yang termasuk di dalamnya tidak diketahui; nilainya dapat diperkirakan dari sampel yang tersedia dengan menggunakan metode kuadrat terkecil. Untuk tujuan ini fungsinya pada = φ ( X) dipilih sehingga merupakan jumlah deviasi kuadrat dari nilai yang diamati pada 1 , pada 2 ,…, pada N dari φ( X Saya) sangat minim:

Dalam hal ini perlu untuk menemukannya titik stasioner fungsi φ( X; A, B, C), yaitu, selesaikan sistem:

(solusinya, tentu saja, hanya mungkin jika diketahui tipe tertentu fungsi φ).

Mari kita perhatikan sebagai contoh pemilihan parameter fungsi linier metode kuadrat terkecil.

Untuk mengevaluasi parameter A Dan B dalam fungsi kamu = kapak + B, kita akan menemukannya
Kemudian
. Dari sini
. Membagi kedua persamaan yang dihasilkan dengan N dan mengingat definisi momen empiris, kita dapat memperoleh ekspresi untuk A Dan B dalam bentuk:

. Oleh karena itu, hubungan antara X Dan pada dapat ditentukan dalam bentuk:


4. Pendekatan Bayesian untuk memperoleh estimasi.
Membiarkan ( Y, X) – vektor acak yang kepadatannya diketahui R(pada|X) distribusi bersyarat Y pada setiap nilai x = x. Jika percobaan hanya menghasilkan nilai Y, dan nilai yang sesuai X tidak diketahui, lalu memperkirakan beberapa fungsi yang diberikan φ( X) sebagai nilai perkiraannya, diusulkan untuk mencari ekspektasi matematis bersyarat M (φ‌‌( X)‌‌‌‌‌‌|Y), dihitung dengan rumus:

, Di mana , R(X X, Q(kamu) – kepadatan distribusi tanpa syarat Y. Suatu permasalahan hanya dapat diselesaikan jika permasalahan tersebut diketahui R(X). Namun terkadang, estimasi yang konsisten dapat dibuat Q(kamu), hanya bergantung pada nilai yang diperoleh dalam sampel Y.

Kuliah 18.

Estimasi interval parameter yang tidak diketahui. Akurasi estimasi, probabilitas kepercayaan(keandalan), interval kepercayaan. Konstruksi interval kepercayaan untuk memperkirakan ekspektasi matematis dari distribusi normal dengan varians yang diketahui dan tidak diketahui. Interval kepercayaan untuk memperkirakan simpangan baku dari distribusi normal.
Dengan ukuran sampel yang kecil, estimasi titik mungkin berbeda secara signifikan dari parameter estimasi, sehingga menyebabkan kesalahan besar. Oleh karena itu, dalam hal ini lebih baik digunakan perkiraan interval , yaitu menunjukkan interval di mana probabilitas yang diberikan nilai sebenarnya dari parameter yang diperkirakan turun. Tentu saja, semakin pendek panjang interval ini, semakin akurat estimasi parameternya. Oleh karena itu, jika pertidaksamaan | Θ* - Θ | 0 mencirikan akurasi estimasi(semakin kecil δ, semakin akurat perkiraannya). Tetapi metode statistik izinkan kami mengatakan saja bahwa ketidaksetaraan ini dipenuhi dengan beberapa kemungkinan.

Definisi 18.1.Keandalan (probabilitas kepercayaan) estimasi Θ* dari parameter Θ adalah probabilitas γ terpenuhinya pertidaksamaan | Θ* - Θ |
P (Θ* - δ
Jadi, γ adalah peluang Θ berada pada interval (Θ* - δ, Θ* + δ).

Definisi 18.2.Tepercaya disebut interval jatuhnya parameter yang tidak diketahui dengan keandalan tertentu γ.
Membangun interval kepercayaan.
1. Interval kepercayaan untuk memperkirakan ekspektasi matematis dari distribusi normal dengan varians yang diketahui.

Biarkan variabel acak yang diteliti X didistribusikan menurut hukum normal dengan kuadrat rata-rata yang diketahui, dan ekspektasi matematisnya harus diperkirakan berdasarkan nilai rata-rata sampel A. Kami akan menganggap mean sampel sebagai variabel acak dan nilainya adalah pilihan sampel X 1 , X 2 ,…, X N sebagai variabel acak independen yang terdistribusi secara identik X 1 , X 2 ,…, X N, yang masing-masing memiliki ekspektasi matematis A dan simpangan baku σ. Pada saat yang sama M() = A,
(kami menggunakan sifat ekspektasi matematis dan dispersi jumlah variabel acak independen). Mari kita perkirakan kemungkinan terjadinya ketimpangan
. Mari kita terapkan rumus peluang suatu variabel acak berdistribusi normal masuk ke dalam interval tertentu:

R (
) = 2F
. Kemudian, dengan mempertimbangkan fakta bahwa, R() = 2F
=

2F( T), Di mana
. Dari sini
, dan persamaan sebelumnya dapat ditulis ulang sebagai berikut:

. (18.1)

Jadi, nilai ekspektasi matematisnya A dengan probabilitas (keandalan) γ masuk dalam interval
, di mana nilainya T ditentukan dari tabel fungsi Laplace sehingga persamaan 2Ф( T) = γ.
Contoh. Mari kita cari interval kepercayaan untuk ekspektasi matematis dari variabel acak yang terdistribusi normal jika ukuran sampelnya N = 49,
σ = 1,4, dan probabilitas keyakinan γ = 0,9.

Mari kita definisikan T, di mana Ф( T) = 0,9:2 = 0,45: T= 1,645. Kemudian

, atau 2,471 a a dengan reliabilitas 0,9.
2. Interval kepercayaan untuk memperkirakan ekspektasi matematis dari distribusi normal dengan varians yang tidak diketahui.

Jika diketahui variabel acak yang diteliti X didistribusikan menurut hukum normal dengan simpangan baku yang tidak diketahui, kemudian dicari interval kepercayaan untuk ekspektasi matematisnya, kami membuat variabel acak baru

, (18.2)

Di mana - rata-rata sampel, S– varians yang dikoreksi, N– ukuran sampel. Variabel acak ini, nilai yang mungkin akan dilambangkan dengan T, memiliki distribusi Student (lihat Kuliah 12) dengan k = N– 1 derajat kebebasan.

Karena kepadatan sebaran Mahasiswa
, Di mana
, tidak bergantung secara eksplisit A dan σ, Anda dapat mengatur kemungkinan jatuhnya ke dalam interval tertentu (- T γ , T γ ), dengan memperhatikan pemerataan kepadatan sebaran, sebagai berikut:
. Dari sini kita mendapatkan:

(18.3)

Dengan demikian, interval kepercayaan diperoleh untuk A, Di mana T γ dapat ditemukan dari tabel yang sesuai untuk diberikan N dan γ.

Contoh. Biarkan ukuran sampel N = 25, = 3, S= 1,5. Mari kita cari interval kepercayaannya A pada = 0,99. Dari tabel kami menemukan itu T γ (N= 25, γ = 0,99) = 2,797. Kemudian
, atau 2,161a a dengan probabilitas 0,99.
3. Interval kepercayaan untuk memperkirakan simpangan baku suatu distribusi normal.

Kita akan mencari interval kepercayaan yang berbentuk ( S – δ, S), Di mana S adalah simpangan baku sampel yang dikoreksi, dan untuk δ kondisi berikut terpenuhi: P (|σ – S|
Mari kita tuliskan pertidaksamaan ini dalam bentuk:
atau, menunjuk
,

Mari kita perhatikan variabel acak χ, yang ditentukan oleh rumus

,

yang didistribusikan menurut hukum chi-kuadrat dengan N-1 derajat kebebasan (lihat kuliah 12). Kepadatan distribusinya

tidak bergantung pada parameter estimasi σ, tetapi hanya bergantung pada ukuran sampel N. Mari kita transformasikan pertidaksamaan (18.4) sehingga menjadi bentuk χ 1 Mari kita asumsikan demikian Q

,

atau, setelah dikalikan dengan
,
. Karena itu,
. Kemudian
Terdapat tabel distribusi chi-kuadrat yang dapat Anda temukan Q sesuai dengan yang diberikan N dan γ tanpa menyelesaikan persamaan ini. Jadi, setelah menghitung nilai dari sampel S dan menentukan nilai dari tabel Q, Anda dapat menemukan interval kepercayaan (18.4), di mana nilai σ turun dengan probabilitas tertentu γ.
Komentar. Jika Q> 1, maka dengan memperhatikan kondisi σ > 0, selang kepercayaan untuk σ akan mempunyai batas

. (18.5)

Membiarkan N = 20, S= 1.3. Mari kita cari interval kepercayaan σ untuk reliabilitas tertentu γ = 0,95. Dari tabel yang sesuai kami temukan Q (N= 20, γ = 0,95) = 0,37. Oleh karena itu, batas selang kepercayaannya adalah: 1,3(1-0,37) = 0,819 dan 1,3(1+0,37) = 1,781. Jadi, 0,819

Jika fenomena stabilitas rata-rata terjadi dalam kenyataan, lalu di model matematika, yang dengannya kita mempelajari fenomena acak, pasti ada teorema yang mencerminkan fakta ini.
Berdasarkan ketentuan teorema ini, kami memperkenalkan batasan pada variabel acak X 1 , X 2 , …, Xn:

a) setiap variabel acak X saya memiliki ekspektasi matematis

M(X saya) = A;

b) varians setiap variabel acak berhingga atau, kita dapat mengatakan bahwa varians tersebut dibatasi dari atas oleh bilangan yang sama, misalnya DENGAN, yaitu.

D(X saya) < C, i = 1, 2, …, N;

c) variabel acak bersifat independen berpasangan, yaitu dua variabel mana saja X saya Dan Xj pada Saya¹ J mandiri.

Maka tentu saja

D(X 1 + X 2 + … + Xn)=D(X 1) +D(X 2) + ... + D(Xn).

Mari kita rumuskan hukum bilangan besar dalam bentuk Chebyshev.

Teorema Chebyshev: dengan peningkatan jumlah yang tidak terbatas N tes mandiri" rata-rata aritmatika dari nilai-nilai yang diamati dari suatu variabel acak kemungkinan konvergen dengan ekspektasi matematisnya ", yaitu untuk hal positif apa pun ε

R(| sebuah| < ε ) = 1. (4.1.1)

Arti ungkapan "rata-rata aritmatika = probabilitasnya konvergen ke " apakah itu kemungkinannya akan berbeda sesedikit mungkin dari A, mendekati 1 tanpa batas seiring bertambahnya jumlah N.

Bukti. Untuk nomor terbatas N uji independen, kami menerapkan pertidaksamaan Chebyshev untuk variabel acak = :

R(|– M()| < ε ) ≥ 1 – . (4.1.2)

Dengan memperhatikan batasan a – b, kami menghitung M( ) Dan D( ):

M( ) = = = = = = A;

D( ) = = = = = = .

Mengganti M( ) Dan D( ) menjadi pertidaksamaan (4.1.2), kita peroleh

R(| sebuah| < ε )≥1 .

Jika dalam pertidaksamaan (4.1.2) kita ambil sembarang kecil ε >0i N® ¥, lalu kita dapatkan

= 1,

yang membuktikan teorema Chebyshev.

Dari teorema yang dianggap penting berikut ini kesimpulan praktis: kita berhak mengganti nilai ekspektasi matematis yang tidak diketahui dari variabel acak dengan rata-rata nilai aritmatika, diperoleh dari sejumlah percobaan yang cukup besar. Selain itu, semakin banyak eksperimen yang harus dihitung, semakin banyak pula lebih mungkin(keandalan) kita dapat memperkirakan bahwa kesalahan terkait dengan penggantian ini ( - A) tidak akan melebihi nilai yang ditentukan ε .

Selain itu, Anda dapat menyelesaikan masalah lainnya masalah praktis. Misalnya menurut nilai probabilitas (reliabilitas). R=R(| sebuah|< ε ) dan kesalahan maksimum yang diizinkan ε menentukan jumlah percobaan yang diperlukan N; Oleh R Dan N mendefinisikan ε; Oleh ε Dan N menentukan batas peluang suatu kejadian | sebuah |< ε.

Kasus khusus. Biarkan di N tes yang diamati N nilai variabel acak X, memiliki ekspektasi matematis M(X) dan varians D(X). Nilai yang diperoleh dapat dianggap sebagai variabel acak X 1 ,X 2 ,X 3 , ... ,Xn,. Hal ini harus dipahami sebagai berikut: rangkaian N tes dilakukan berulang kali, sehingga hasilnya Saya tes ke-th Saya= aku, 2, 3, ..., N, dalam setiap rangkaian pengujian, satu atau beberapa nilai variabel acak akan muncul X, tidak diketahui sebelumnya. Karena itu, Saya-e nilai x saya variabel acak diperoleh di Saya Tes ke-th, berubah secara acak jika Anda berpindah dari satu rangkaian tes ke seri lainnya. Jadi setiap nilai x saya dapat dianggap sebagai variabel acak Xi.


Mari kita asumsikan bahwa pengujian tersebut memenuhi persyaratan berikut:

1. Tes bersifat independen. Artinya hasilnya X 1 , X 2 ,
X 3 , ..., Xn tes – variabel acak independen.

2. Pengujian dilakukan dalam kondisi yang sama - ini berarti, dari sudut pandang teori probabilitas, bahwa masing-masing variabel acak X 1 ,X 2 ,X 3 , ... ,Xn mempunyai hukum distribusi yang sama dengan nilai aslinya X, Itu sebabnya M(X saya) = M(X)Dan D(X saya) = D(X), Saya = 1, 2, .... P.

Dengan mempertimbangkan kondisi di atas, kami memperoleh

R(| sebuah| < ε )≥1 . (4.1.3)

Contoh 4.1.1. X sama dengan 4. Berapa banyak percobaan bebas yang diperlukan agar, dengan probabilitas paling sedikit 0,9, kita dapat mengharapkan bahwa nilai rata-rata aritmatika dari variabel acak ini akan berbeda dari ekspektasi matematis kurang dari 0,5?

Larutan.Sesuai dengan kondisi permasalahan ε = 0,5; R(| sebuah|< 0,5) 0,9. Menerapkan rumus (4.1.3) untuk variabel acak X, kita dapatkan

P(|– M(X)| < ε ) ≥ 1 .

Dari relasinya

1 = 0,9

mari kita definisikan

N= = = 160.

Menjawab: Diperlukan 160 percobaan independen.

Jika kita berasumsi bahwa mean aritmatika berdistribusi normal, kita peroleh:

R(| sebuah|< ε )= 2Φ () 0,9.

Dari mana, dengan menggunakan tabel fungsi Laplace, kita peroleh
1,645, atau ≥ 6,58, yaitu N ≥49.

Contoh4.1.2. Varians dari variabel acak X sama dengan D( X) = 5. 100 percobaan independen dilakukan, yang kemudian dihitung . Alih-alih nilai ekspektasi matematis yang tidak diketahui A diterima . Tentukan nilai kesalahan maksimum yang diperbolehkan dengan probabilitas minimal 0,8.

Larutan. Sesuai dengan kondisi permasalahannya N= 100, R(| sebuah|< ε ) ≥0,8. Mari kita terapkan rumus (4.1.3)

R(| sebuah|< ε ) ≥1 .

Dari relasinya

1 = 0,8

mari kita definisikan ε :

ε 2 = = = 0,25.

Karena itu, ε = 0,5.

Menjawab: nilai kesalahan maksimum ε = 0,5.

4.2. Hukum bilangan besar dalam bentuk Bernoulli

Meskipun dasar dari semua inferensi statistik adalah konsep probabilitas, hanya ada beberapa kasus di mana kita dapat menentukan probabilitas suatu peristiwa secara langsung. Terkadang probabilitas ini dapat ditentukan berdasarkan pertimbangan simetri, persamaan peluang, dll., namun tidak ada metode universal yang memungkinkan seseorang untuk menunjukkan probabilitasnya untuk suatu peristiwa yang berubah-ubah. Teorema Bernoulli memungkinkan untuk memperkirakan probabilitas jika suatu peristiwa menarik bagi kita A tes independen berulang dapat dilakukan. Biarkan itu diproduksi N uji coba independen, yang masing-masing uji kemungkinan terjadinya suatu peristiwa A adalah konstan dan setara R.

teorema Bernoulli. Dengan peningkatan jumlah tes independen yang tidak terbatas N frekuensi relatif terjadinya suatu peristiwa A menyatu dalam probabilitas ke probabilitas P terjadinya suatu peristiwa A,T. e.

P(½ - P½≤ ε) = 1, (4.2.1)

Di mana ε – bilangan positif yang sangat kecil.

Untuk final N asalkan , pertidaksamaan Chebyshev untuk variabel acak akan berbentuk:

P(| –p|< ε ) 1 .(4.2.2)

Bukti. Mari kita terapkan teorema Chebyshev. Membiarkan X saya– jumlah kemunculan peristiwa tersebut A V Saya tes -th, Saya= 1, 2, . . . , N. Masing-masing besarannya X saya hanya dapat mengambil dua nilai:

X saya= 1 (peristiwa A terjadi) dengan probabilitas P,

X saya= 0 (peristiwa A tidak terjadi) dengan probabilitas Q= 1- P.

Membiarkan Y n= . Jumlah X 1 + X 2 + … + Xn sama dengan nomornya M kejadian peristiwa tersebut A V N tes (0 M N), yang artinya Y n= – frekuensi relatif terjadinya peristiwa A V N tes. Ekspektasi dan varians X saya masing-masing sama:

M( ) = 1∙P + 0∙Q = P,

“Hukum bilangan besar” dalam teori probabilitas dipahami sebagai serangkaian teorema matematika, yang masing-masing, dalam kondisi tertentu, menetapkan fakta bahwa karakteristik rata-rata dari sejumlah besar eksperimen mendekati konstanta tertentu.

Hal ini didasarkan pada ketidaksetaraan Chebyshev:

Peluang penyimpangan suatu variabel acak X dari ekspektasi matematisnya dalam nilai absolut kurang dari bilangan positif ε tidak kurang dari:

Berlaku untuk r.v. diskrit dan kontinu.

53. Teorema Chebyshev.

Misalkan ada barisan variabel acak bebas yang tak terhingga dengan ekspektasi matematis yang sama dan varians dibatasi oleh konstanta C yang sama:

Lalu, berapa pun bilangan positifnya, peluang kejadiannya cenderung satu.

54. Teorema Bernoulli.

Misalkan n percobaan bebas dilakukan, yang masing-masing percobaan mempunyai peluang terjadinya kejadian A sama dengan p.

55. Konsep teorema limit pusat Lyapunov.

Distribusi jumlah sejumlah besar variabel acak independen dalam kondisi yang sangat umum mendekati distribusi normal.

Variabel acak yang terdistribusi normal diketahui terdistribusi luas dalam praktiknya. Penjelasan mengenai hal ini diberikan oleh A.M. Lyapunov dalam teorema limit pusat: jika suatu variabel acak adalah jumlah dari sejumlah besar variabel acak yang saling independen, yang pengaruhnya masing-masing terhadap keseluruhan jumlah dapat diabaikan, maka ia mempunyai distribusi mendekati normal.

56. Populasi umum dan sampel: definisi dan konsep dasar.

Statistika matematika adalah ilmu yang mempelajari pengembangan metode untuk memperoleh, mendeskripsikan, dan mengolah data eksperimen guna mempelajari pola fenomena massa acak.

Masalah statistik matematika:

    Estimasi fungsi distribusi yang tidak diketahui berdasarkan hasil pengukuran.

    Estimasi parameter distribusi yang tidak diketahui.

    Pengujian hipotesis statis.

Mari kita pelajari beberapa karakteristik kuantitatif x.

Kemudian totalitas dipahami sebagai himpunan semua nilai yang mungkin.

Untuk mempelajari sifat-sifat suatu sifat tertentu, sebagian unsur dipilih secara acak dari populasi umum dengan varian Xi, yang membentuk populasi sampel atau sampel.

Banyaknya elemen suatu koleksi disebut objeknya n.

Pengambilan sampel: 1) pengambilan sampel berulang, yaitu objek yang dipilih (sebelum memilih objek berikutnya) dikembalikan ke populasi umum.

2) non-repetition sampling, dimana objek yang dipilih dikembalikan ke populasi umum.

Agar data sampel dapat digunakan untuk menilai dengan keyakinan yang cukup mengenai karakteristik populasi umum yang kita minati, sampel harus representatif)

Berdasarkan hukum bilangan besar, dapat dikatakan bahwa suatu sampel akan representatif jika dilakukan secara acak: setiap objek dalam populasi harus mempunyai peluang yang sama untuk dimasukkan ke dalam sampel.

Jika objek populasi cukup besar, dan sampel hanya merupakan sebagian kecil dari populasi tersebut, maka perbedaan antara sampel berulang dan sampel tidak berulang akan terhapus.

Daftar pilihan yang disusun dalam urutan menaik disebut rangkaian variasi.

Banyaknya pengamatan pada suatu pilihan tertentu disebut frekuensi ni, dan rasio frekuensi ni terhadap objek sampel adalah n-frekuensi relatif wi.

Wajar jika kita perlu mengklarifikasi secara kuantitatif pernyataan bahwa dalam rangkaian pengujian “besar”, frekuensi terjadinya suatu peristiwa “mendekati” probabilitasnya. Kehalusan tertentu dari tugas ini harus dipahami dengan jelas. Dalam kasus yang paling umum untuk teori probabilitas, situasinya adalah bahwa dalam serangkaian pengujian yang panjang dan sewenang-wenang, kedua nilai frekuensi ekstrem secara teoritis tetap mungkin.

\frac(\mu)(n)=\frac(n)(n)=1 Dan \frac(\mu)(n)=\frac(0)(n)=0

Oleh karena itu, berapa pun jumlah pengujian n, tidak dapat dinyatakan dengan pasti bahwa, katakanlah, pertidaksamaan tersebut akan terpenuhi

<\frac{1}{10}

Misalnya kejadian A adalah pelemparan angka enam pada saat pelemparan sebuah dadu, maka dengan n pelemparan dengan probabilitas (\kiri(\frac(1)(6)\kanan)\^n>0 !} kami akan selalu menerima hanya angka enam, yaitu dengan probabilitas (\kiri(\frac(1)(6)\kanan)\^n !} kita memperoleh frekuensi kemunculan angka enam sama dengan satu, dan dengan probabilitas (\kiri(1-\frac(1)(6)\kanan)\^n>0 !} angka enam tidak muncul satu kali pun, yaitu frekuensi kemunculan angka enam akan sama dengan nol.

Dalam semua permasalahan seperti itu, estimasi kedekatan antara frekuensi dan probabilitas yang nontrivial tidak dapat diandalkan sepenuhnya, namun hanya dengan probabilitas yang kurang dari satu. Misalnya, dapat dibuktikan bahwa dalam kasus uji coba bebas dengan probabilitas konstan p terjadinya suatu peristiwa, pertidaksamaan

\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02

untuk frekuensi \frac(\mu)(n) akan terpenuhi pada n=10\,000 (dan p apa pun) dengan probabilitas

P>0,\!9999.

Di sini pertama-tama kami ingin menekankan bahwa dalam rumusan di atas, penilaian kuantitatif kedekatan frekuensi \frac(\mu)(n) dengan probabilitas p dikaitkan dengan pengenalan probabilitas baru P .

Arti sebenarnya dari estimasi (8) adalah: jika kita melakukan N rangkaian n pengujian dan menghitung banyaknya M rangkaian yang memenuhi pertidaksamaan (7), maka untuk N yang cukup besar maka akan menjadi kira-kira

\frac(M)(N)\kira-kira P>0,\!9999.

Tetapi jika kita ingin memperjelas hubungan (9) baik dalam kaitannya dengan derajat kedekatan \frac(M)(N) terhadap probabilitas P, dan dalam kaitannya dengan reliabilitas yang dengannya kita dapat menyatakan bahwa kedekatan tersebut akan terjadi, maka kita harus beralih ke pertimbangan serupa dengan yang telah kita lakukan dalam penerapan kedekatan \frac(\mu)(n) dan p . Jika diinginkan, alasan seperti itu dapat diulangi dalam jumlah yang tidak terbatas, tetapi cukup jelas bahwa hal ini tidak akan memungkinkan kita untuk sepenuhnya membebaskan diri dari kebutuhan untuk tahap terakhir mengacu pada probabilitas dalam pemahaman primitif dan kasar tentang istilah ini.

Kita tidak boleh berpikir bahwa kesulitan semacam ini adalah semacam kekhasan teori probabilitas. Saat belajar matematika fenomena nyata kami selalu membuat skemanya. Penyimpangan jalannya fenomena aktual dari skema teoritis pada gilirannya dapat dikenakan studi matematika. Namun untuk melakukan hal ini, penyimpangan-penyimpangan itu sendiri harus dimasukkan ke dalam skema tertentu dan skema ini harus digunakan tanpa formal analisis matematis penyimpangan darinya.

Namun, perhatikan bahwa dalam penerapan estimasi yang sebenarnya

P\!\kiri\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}>0,\!9999.


untuk satu rangkaian n pengujian, kami juga mengandalkan beberapa pertimbangan simetri: pertidaksamaan (10) menunjukkan bahwa dengan jumlah N rangkaian yang sangat besar, relasi (7) akan dipenuhi tidak kurang dari 99,99% kasus; Wajar untuk mengharapkan dengan penuh keyakinan bahwa, khususnya, pertidaksamaan (7) akan terwujud dalam rangkaian n pengujian tertentu yang menarik minat kita, jika kita memiliki alasan untuk meyakini bahwa rangkaian ini menempati posisi biasa di antara rangkaian lainnya, tidak ditandai oleh sesuatu yang istimewa.

Probabilitas yang biasanya diabaikan dalam berbagai situasi praktis berbeda-beda. Telah disebutkan di atas bahwa ketika membuat perhitungan perkiraan konsumsi proyektil yang menjamin penyelesaian tugas yang diberikan, mereka puas dengan tingkat konsumsi proyektil di mana tugas yang diberikan diselesaikan dengan probabilitas 0,95, yaitu, mereka mengabaikan probabilitas bukan melebihi 0,05. Hal ini dijelaskan oleh fakta bahwa transisi ke perhitungan berdasarkan pengabaian, katakanlah, hanya probabilitas kurang dari 0,01, akan menyebabkan peningkatan besar dalam tingkat konsumsi proyektil, yaitu, dalam hampir banyak kasus, pada kesimpulan bahwa penyelesaian tidak mungkin dilakukan. tugas dalam jangka waktu sesingkat yang tersedia untuk itu, atau dengan stok cangkang yang benar-benar dapat digunakan.

Terkadang dalam penelitian ilmiah mereka dibatasi pada teknik statistik yang dihitung berdasarkan pengabaian probabilitas 0,05. Namun hal ini sebaiknya dilakukan hanya jika pengumpulan materi yang lebih luas sangat sulit dilakukan. Pertimbangkan masalah berikut sebagai contoh teknik tersebut. Mari kita asumsikan bahwa, dalam kondisi tertentu, obat yang digunakan untuk mengobati suatu penyakit memberikan hasil positif dalam 50%, yaitu dengan probabilitas 0,5. Sebuah obat baru diusulkan dan, untuk menguji keunggulannya dibandingkan obat lama, direncanakan untuk menggunakannya dalam sepuluh kasus, dipilih secara tidak memihak dari antara pasien dalam situasi yang sama dengan mereka yang efektivitas obat lamanya telah ditetapkan. pada 50%. Diketahui bahwa keunggulan suatu obat baru akan dianggap terbukti jika memberikan hasil positif pada setidaknya delapan dari sepuluh kasus. Sangat mudah untuk menghitung bahwa keputusan seperti itu dikaitkan dengan pengabaian kemungkinan memperoleh kesimpulan yang salah (yaitu, kesimpulan bahwa manfaat obat baru terbukti, padahal obat tersebut setara atau bahkan lebih buruk daripada obat lama) dari hampir semua hal. 0,05. Faktanya, jika dalam setiap sepuluh percobaan probabilitas hasil positif sama dengan p, maka probabilitas memperoleh 10,9 atau 8 hasil positif dalam sepuluh percobaan adalah sama.

P_(10)=p^(10),\qquad P_9=10p^9(1-p),\qquad P_8=45p^8(1-p)^2.

Singkatnya, untuk kasus p=\frac(1)(2) kita dapatkan P=P_(10)+P_9+P_8=\frac(56)(1024)\kira-kira0,\!05.

Jadi, dengan asumsi bahwa obat baru sebenarnya setara dengan obat lama, kita berisiko keliru menyimpulkan bahwa obat baru lebih unggul dari obat lama dengan probabilitas sekitar 0,05. Untuk mengurangi probabilitas ini menjadi sekitar 0,01, tanpa menambah jumlah percobaan n = 10, perlu ditetapkan bahwa keunggulan suatu obat baru akan dianggap terbukti hanya jika penggunaannya memberikan hasil positif pada setidaknya sembilan kasus dari sepuluh. Jika persyaratan ini tampaknya terlalu keras bagi para pendukung obat baru, maka sejumlah tes perlu dilakukan n secara signifikan lebih besar dari 10. Jika, misalnya, dengan n = 100 diketahui bahwa manfaat obat baru tersebut akan dianggap terbukti pada \mu>65, maka kemungkinan kesalahannya hanya P\approx0,\!0015 .

Jika normanya adalah 0,05 untuk serius riset ilmiah jelas tidak mencukupi, maka probabilitas kesalahan sebesar 0,001 atau 0,003 umumnya diabaikan bahkan dalam penelitian akademis dan menyeluruh seperti pemrosesan observasi astronomi. Namun, terkadang kesimpulan ilmiah berdasarkan penerapan hukum probabilistik juga memiliki keandalan yang jauh lebih besar (yaitu, kesimpulan tersebut didasarkan pada pengabaian probabilitas yang jauh lebih rendah). Hal ini akan dibahas lebih lanjut di bawah ini.

Dalam contoh yang dipertimbangkan, kami telah berulang kali menggunakan kasus khusus dari rumus binomial (6)

P_m=C_n^mp^m(1-p)^(n-m)

untuk probabilitas P_m mendapatkan tepat m hasil positif untuk n tes independen, yang masing-masing hasil positif memiliki probabilitas p. Dengan menggunakan rumus ini, mari kita perhatikan pertanyaan yang diajukan di awal bagian ini tentang probabilitas

<\varepsilon\right\},

dimana \mu adalah jumlah hasil positif sebenarnya. Jelasnya, probabilitas ini dapat ditulis sebagai jumlah dari P_m yang m memenuhi pertidaksamaan

\vline\,\frac(m)(n)-p\,\vline\,<\varepsilon,


yaitu dalam bentuk

P=\jumlah_(m=m_1)^(m_2)P_m,

dimana m_1 adalah nilai terkecil dari m yang memenuhi pertidaksamaan (12), dan m_2 adalah nilai terbesar dari m tersebut.

Rumus (13) untuk n yang besar tidak banyak berguna untuk perhitungan langsung. Oleh karena itu, penemuan Moivre untuk kasus p=\frac(1)(2) dan oleh Laplace untuk setiap p dari rumus asimtotik sangatlah penting, yang membuatnya sangat mudah untuk menemukan dan mempelajari perilaku probabilitas P_m untuk skala besar N. Rumusnya seperti ini

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\exp\!\left[-\frac((m-np)^2)(2np(1-p)) \Kanan].

Jika p tidak terlalu mendekati nol atau satu, maka p sudah cukup akurat untuk n orde 100. Jika kita masukkan

T=\frac(m-np)(\sqrt(np(1-p))),

Maka rumus (14) akan berbentuk

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\,e^(-t^2/2).


Dari (13) dan (16) kita dapat memperoleh perkiraan representasi probabilitas (11)

P\sim\frac(1)(\sqrt(2\pi))\int\limits_(-T)^(T)e^(-t^2/2)\,dt=F(T),


Di mana

T=\varepsilon\sqrt(\frac(n)(p(1-p)))

Selisih antara ruas kiri dan kanan pada (17), dengan p konstan dan berbeda dari nol dan satu, cenderung nol karena n\to\infty seragam relatif terhadap \varepsilon. Tabel terperinci telah dikompilasi untuk fungsi F(T). Berikut kutipan singkat dari mereka

\begin(array)(c|c|c|c|c)T&1&2&3&4\\\hline F&0,\!68269&0,\!95450&0,\!99730&0,\!99993\end(array)


Pada T\to\infty nilai fungsi F(T) cenderung kesatuan.

Mari kita gunakan rumus (17) untuk memperkirakan probabilitas

P=\mathbf(P)\!\kiri\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}\approx F\!\left(\frac{2}{\sqrt{p(1-p)}}\right) pada n=10\,000,~\varepsilon=0,\!02, Karena T=\frac(2)(\sqrt(p(1-p))).

Karena fungsi F(T) meningkat secara monoton dengan meningkatnya T, maka untuk estimasi P yang lebih rendah yang tidak bergantung pada p, kita harus mengambil nilai T yang terkecil (untuk p berbeda). Nilai terkecil ini akan diperoleh pada p=\frac(1)(2) , dan akan sama dengan 4. Oleh karena itu, kira-kira

P\geqslant F(4)=0,\!99993.

Pertidaksamaan (19) tidak memperhitungkan kesalahan yang terjadi karena sifat perkiraan rumus (17). Dengan menilai kesalahan yang terkait dengan keadaan ini, kita dapat menetapkan bahwa P>0.\!9999.

Sehubungan dengan contoh penerapan rumus (17), perlu dicatat bahwa perkiraan sisa suku rumus (17), yang diberikan dalam karya teoretis tentang teori probabilitas, tetap tidak memuaskan untuk waktu yang lama. Oleh karena itu, penerapan rumus (17) dan rumus serupa pada perhitungan untuk n yang tidak terlalu besar atau untuk probabilitas p yang sangat mendekati 0 atau 1 (dan probabilitas seperti itu dalam banyak kasus sangat penting) sering kali hanya didasarkan pada pengalaman memeriksa hal tersebut. hasil untuk sejumlah contoh yang terbatas, dan bukan berdasarkan estimasi kemungkinan kesalahan yang dapat diandalkan. Selain itu, studi yang lebih rinci menunjukkan bahwa dalam banyak kasus yang praktis penting, rumus asimtotik di atas tidak hanya memerlukan perkiraan suku sisa, tetapi juga klarifikasi (karena tanpa klarifikasi tersebut suku sisa akan terlalu besar). Di kedua arah, hasil terlengkap adalah milik S.N. Bernstein.

Relasi (11), (17) dan (18) dapat ditulis ulang menjadi

\mathbf(P)\!\left\(\,\vline\,\frac(\mu)(n)-p\,\vline\,

Untuk t yang cukup besar, ruas kanan rumus (20), yang tidak mengandung n, mendekati kesatuan, yaitu dengan nilai probabilitas yang sesuai dengan reliabilitas penuh. Oleh karena itu, kita melihat bahwa, Biasanya, deviasi frekuensi \frac(\mu)(n) dari probabilitas p adalah sebesar \frac(1)(\sqrt(n)). Proporsionalitas keakuratan hukum probabilistik terhadap akar kuadrat jumlah pengamatan juga merupakan hal yang umum dalam banyak masalah lainnya. Kadang-kadang mereka bahkan berbicara, sebagai popularisasi yang agak disederhanakan, tentang “hukum akar kuadrat dari n” sebagai hukum dasar teori probabilitas. Gagasan ini mendapat kejelasan penuh berkat pengenalan matematikawan besar Rusia P. L. Chebyshev ke dalam penggunaan sistematis metode mereduksi berbagai masalah probabilistik menjadi perhitungan "ekspektasi matematis" dan "varians" untuk jumlah dan sarana aritmatika "variabel acak".

Variabel acak adalah besaran yang, dalam kondisi tertentu S, dapat mempunyai nilai berbeda dengan probabilitas tertentu. Bagi kami, cukup dengan mempertimbangkan variabel acak yang hanya dapat mengambil sejumlah nilai berbeda yang terbatas. Untuk menunjukkan, seperti yang mereka katakan, distribusi probabilitas dari variabel acak semacam ini \xi , cukup untuk menunjukkan nilai yang mungkin x_1,x_2,\ltitik,x_r dan probabilitas

P_r=\mathbf(P)\(\xi=x_r\).


Singkatnya, probabilitas untuk semua kemungkinan nilai kuantitas \xi yang berbeda selalu sama dengan satu:

\jumlah_(r=1)^(s)P_r=1.

Contoh variabel acak adalah jumlah hasil positif yang dipelajari di atas dalam n percobaan.

Harapan matematis besaran \xi disebut ekspresi

M(\xi)=\jumlah_(r=1)^(s)P_rx_r,


A penyebaran besaran \xi disebut ekspektasi matematis dari deviasi kuadrat \xi-M(\xi), yaitu ekspresi

D(\xi)=\jumlah_(r=1)^(s)P_r(x_r-M(\xi))^2.


Akar kuadrat dari varians

\sigma_(\xi)=\sqrt(D(\xi))=\sqrt(\sum_(r=1)^(s)P_r(x_r-M(\xi))^2)


ditelepon deviasi standar(nilai dari ekspektasi matematisnya M(\xi) ).

Penerapan varians dan deviasi standar yang paling sederhana didasarkan pada yang terkenal Ketimpangan Chebyshev

\mathbf(P)\(|\xi-M(\xi)|\leqslant t_(\sigma_(\xi))\)\geqslant1-\frac(1)(t^2),

Hal ini menunjukkan bahwa deviasi variabel acak \xi dari ekspektasi matematisnya M(\xi) yang secara signifikan melebihi deviasi standar \sigma_(\xi) jarang terjadi.

Saat membentuk jumlah variabel acak \xi=\xi^((1))+ \xi^((2))+\cdots+\xi^((n)) ekspektasi matematis mereka selalu memiliki kesetaraan

M(\xi)=M(\xi^((1)))+M(\xi^((2)))+\cdots+M(\xi^((n))).


Persamaan serupa untuk varians

D(\xi)=D(\xi^((1)))+D(\xi^((2)))+\cdots+D(\xi^((n))).

benar hanya di bawah batasan tertentu. Agar persamaan (23) valid, cukuplah, misalnya, besaran \xi^((i)) dan \xi^((j)) dengan bilangan yang berbeda, sebagaimana disebut, “berkorelasi” dengan satu sama lain, yaitu ketika i\ne j persamaan berlaku

M\Bigl\((\xi^((i))-M(\xi^((i))))(\xi^((j))-M(\xi^((j))))\ Besar\)=0

Koefisien korelasi antara variabel acak \xi^((i)) dan \xi^((j)) adalah ekspresi

R=\frac(M\Bigl\(\Bigl(\xi^((i))-M(\xi^((i)))\Bigl)\Bigl(\xi^((j))-M( \xi^((j)))\Bigl)\Bigl\))(\sigma_(\xi^((i)))\,\sigma_(\xi^((j)))).

Jika \sigma_(\xi^((i)))>0 V \sigma_(\xi^((j)))>0, maka kondisi (24) ekuivalen dengan fakta bahwa R=0.

Koefisien korelasi R mencirikan derajat ketergantungan antar variabel acak. Selalu |R|\leqslant1 , dan R=\pm1 hanya jika ada koneksi linier

\eta=a\xi+b\kuad(a\ne0).

Untuk variabel bebas R=0.

Secara khusus, persamaan (24) terpenuhi jika besaran \xi^((i)) dan \xi^((j)) tidak bergantung satu sama lain. Jadi, untuk suku-suku yang saling bebas, persamaan (23) selalu berlaku. Untuk rata-rata aritmatika

\zeta=\frac(1)(n)\Bigl(\xi^((1))+\xi^((2))+\cdots+\xi^((n))\Bigl) dari (23) berikut ini

D(\zeta_=\frac(1)(n^2)\Bigl(D(\xi^((1)))+ D(\xi^((2)))+\cdots+ D(\xi^( (n)))\Besar).

Sekarang mari kita asumsikan bahwa untuk semua suku, variansnya tidak melebihi suatu konstanta

D(\xi^((i)))\leqslant C^2. Kemudian pada (25) D(\zeta)\leqslant\frac(C^2)(n),


dan berdasarkan ketidaksetaraan Chebyshev untuk setiap t

\mathbf(P)\!\left\(|\zeta-M(\zeta)|\leqslant\frac(tC)(\sqrt(n))\right\)\geqslant1-\frac(1)(t^ 2)

Pertidaksamaan (26) memuat apa yang disebut hukum bilangan besar dalam bentuk yang ditetapkan oleh Chebyshev: jika besaran-besaran \xi^((i)) saling bebas dan mempunyai varian terbatas, maka seiring bertambahnya n rata-rata aritmatikanya \zeta menjadi lebih kecil dan kecil kemungkinannya untuk menyimpang dari ekspektasi matematisnya M(\zeta) .

Lebih tepatnya mereka mengatakan itu urutan variabel acak

\xi^((1)),\,\xi^((2)),\,\ltitik\,\xi^((n)),\,\ltitik


mematuhi hukum bilangan besar jika untuk mean aritmatika yang bersesuaian \zeta dan untuk konstanta apa pun \varepsilon>0

\mathbf(P)\(|\zeta-M(\zeta)|\leqslant \varepsilon\)\to1\quad (n\to\infty).

Untuk memperoleh relasi limit (27) dari pertidaksamaan (26), cukup dengan himpunan

T=\varepsilon\cdot\frac(\sqrt(n))(C).

Sejumlah besar penelitian oleh A.A. Markova, S.N. Bernstein, A.Ya. Khinchin dan yang lainnya dikhususkan untuk pertanyaan tentang kemungkinan ekspansi yang lebih besar syarat berlakunya hubungan limit (27), yaitu syarat berlakunya hukum bilangan besar. Studi-studi ini sangat penting. Namun, yang lebih penting adalah studi akurat tentang distribusi probabilitas penyimpangan \zeta-M(\zeta) .

Kelebihan besar orang Rusia sekolah klasik dalam teori probabilitas adalah untuk menetapkan fakta bahwa, dalam kondisi yang sangat luas, persamaannya tidak menunjukkan gejala (yaitu, dengan akurasi yang meningkat untuk n yang tumbuh tanpa batas)

\mathbf(P)\!\kiri\(t_1\sigma_(\zeta)<\zeta-M(\zeta)

Chebyshev memberikan bukti yang hampir lengkap tentang rumus ini untuk kasus suku-suku bebas dan terikat. Markov mengisi mata rantai yang hilang dalam alasan Chebyshev dan memperluas kondisi penerapan rumus (28). Kondisi yang lebih umum diberikan oleh Lyapunov. Pertanyaan tentang perluasan rumus (28) ke jumlah suku-suku terikat dipelajari dengan sangat lengkap oleh S. N. Bernstein.

Rumus (28) mencakup begitu banyak masalah tertentu sehingga untuk waktu yang lama disebut teorema limit sentral dalam teori probabilitas. Meskipun dengan perkembangan terkini dari teori probabilitas, teori ini ternyata dimasukkan dalam sejumlah undang-undang yang lebih umum, pentingnya hal ini sulit untuk ditaksir terlalu tinggi di masa sekarang.

Waktu.

Jika suku-suku tersebut bebas dan variansinya sama dan setara: D(\xi^((i)))=\sigma^2, maka akan lebih mudah untuk memberikan rumus (28), dengan mempertimbangkan relasi (25), bentuk

\mathbf(P)\!\left\(\frac(t_1\sigma)(\sqrt(n))<\zeta-M(\zeta)<\frac{t_2\sigma}{\sqrt{n}}\right\}\sim\frac{1}{\sqrt{2\pi}}\int\limits_{t_1}^{t_2}e^{-t^2/2}\,dt\,.

Mari kita tunjukkan bahwa relasi (29) berisi solusi terhadap masalah deviasi frekuensi \frac(\mu)(n) dari probabilitas p, yang telah kita bahas sebelumnya. Untuk melakukan ini, kami memperkenalkan variabel acak \xi^((i)) yang mendefinisikannya dengan kondisi berikut:

\xi^((i))=0, jika pengujian ke-i hasilnya negatif,

\xi^((i))=1 jika tes ke-i memberikan hasil positif.

Maka mudah untuk memeriksanya


dan rumus (29) memberi

\mathbf(P)\!\left\(t_1\sqrt(\frac(p(1-p))(n))<\frac{\mu}{n}-p
yang untuk t_1=-t,~t_2=t kembali mengarah ke rumus (20).
Lihat juga Batasi teorema dalam teori probabilitas Javascript dinonaktifkan di browser Anda.
Untuk melakukan penghitungan, Anda harus mengaktifkan kontrol ActiveX!


Apakah Anda menyukai artikelnya? Bagikan dengan teman Anda!