3 pasoja nga ligji i numrave të mëdhenj. Ligji i numrave të mëdhenj në formën e Chebyshev

Ligji numra të mëdhenjështë ligji qendror teoria e probabilitetit për faktin se formulon një lidhje themelore midis rregullsisë dhe rastësisë. Gjegjësisht, ai argumenton se një numër i madh i aksidenteve çon në një model, i cili bën të mundur parashikimin e rrjedhës së ngjarjeve. Në shumicën formë e përgjithshme shprehet ai Teorema e Chebyshev:

le ( Χ 1; X2; … X n; ...) ndryshore të pavarura të rastësishme (supozohen të jenë numër i pafund). Dhe le të kufizohen në mënyrë të njëtrajtshme variancat e tyre (d.m.th., variancat e të gjitha këtyre ndryshoreve të rastësishme nuk kalojnë një konstante ME):

Atëherë, sado i vogël të jetë numri pozitiv, relacioni i probabilitetit kufizues plotësohet:

nëse numri i variablave të rastësishëm është mjaft i madh. Ose, çfarë është e njëjta gjë, probabiliteti

Kështu, teorema e Chebyshev thotë se nëse marrim parasysh një numër mjaft të madh n variabla të rastësishme të pavarura ( Χ 1; X2; … Xn), atëherë ngjarja mund të konsiderohet pothuajse e besueshme (me një probabilitet afër unitetit) që devijimi i mesatares aritmetike të këtyre variablave të rastit nga mesatarja aritmetike e pritjeve të tyre matematikore do të jetë sipas vlere absolute e vogël sa të duash.

Dëshmi. Χ 1; X2; … Xn):

(4)

; (5)

Duke marrë parasysh kushtet (1), ne konstatojmë se

(6)

Kështu, kur varianca është . Domethënë kur përhapja e vlerave ndryshore e rastësishme rreth saj pritje matematikore zvogëlohet në mënyrë të pacaktuar. Dhe kjo do të thotë se kur vlera, që është, . Ose, për të qenë më të saktë, probabiliteti që një ndryshore e rastësishme të paktën të devijojë disi nga pritshmëria e saj matematikore - një konstante - priret në zero. Domethënë, për çdo numër pozitiv arbitrarisht të vogël

Pra, sipas teoremës së provuar të Chebyshev, mesatarja aritmetike e një numri të madh të ndryshoreve të rastësishme të pavarura ( Χ 1; X2; … Xn), duke qenë një ndryshore e rastësishme, në fakt humbet karakterin e rastësisë, duke u bërë, në fakt, një konstante e pandryshueshme. Kjo konstante është e barabartë me mesataren aritmetike të pritjeve matematikore të vlerave ( Χ 1; X2; … Xn). Ky është ligji i numrave të mëdhenj.

Mund të jepet një tjetër provë e teoremës së Chebyshev. Për ta bërë këtë, ne përdorim pabarazinë e Chebyshev. Është i vlefshëm si për ndryshoret e rastësishme diskrete ashtu edhe për ato të vazhdueshme dhe ka vlerë në vetvete. Pabarazia e Chebyshev na lejon të vlerësojmë probabilitetin që devijimi i një ndryshoreje të rastësishme nga pritshmëria e tij matematikore të mos kalojë në vlerë absolute numër pozitiv. Le të paraqesim një provë të pabarazisë së Chebyshev për variabla diskrete të rastësishme.



Pabarazia e Chebyshev: Probabiliteti që devijimi i një ndryshoreje të rastësishme X nga pritshmëria e tij matematikore në vlerë absolute është më e vogël se një numër pozitiv, jo më pak se:

.

Dëshmi: Që nga ngjarjet që konsistojnë në zbatimin e pabarazive Dhe , janë të kundërta, atëherë shuma e probabiliteteve të tyre është e barabartë me 1, d.m.th. . Prandaj probabiliteti që na intereson. (*)

Ne do të gjejmë . Për ta bërë këtë, gjejmë variancën e ndryshores së rastësishme X.

Të gjitha kushtet e kësaj shume janë jonegative. Le t'i hedhim poshtë ato kushte për të cilat (për kushtet e mbetura ), si rezultat i së cilës shuma mund të ulet vetëm. Le të pajtohemi të supozojmë, për saktësi, se k termat e parë (do të supozojmë se në tabelën e shpërndarjes vlerat e mundshme numëruar në atë rend). Kështu,

Meqenëse të dyja anët e pabarazisë janë pozitive, prandaj, duke i kuadruar ato, marrim pabarazinë ekuivalente . Le të përdorim këtë vërejtje, duke zëvendësuar secilin prej faktorëve në shumën e mbetur numri (në këtë rast pabarazia mund të rritet vetëm), marrim. (**)

Sipas teoremës së mbledhjes, shuma e probabiliteteve është probabiliteti që X do të marrë një, pa marrë parasysh cila, vlerë , dhe për cilindo prej tyre devijimi plotëson pabarazinë . Nga kjo rezulton se shuma shpreh probabilitetin . Kjo na lejon të rishkruajmë pabarazinë (**) si më poshtë: . (***).

Le të zëvendësojmë (***) V (*) dhe marrim , që ishte ajo që duhej vërtetuar.

Vërtetimi i Teoremës 2 të Chebyshev:

Le të prezantojmë një ndryshore të re të rastësishme në konsideratë - mesataren aritmetike të ndryshoreve të rastësishme ( Χ 1; X2; … Xn):

Duke përdorur vetitë e pritjes dhe shpërndarjes matematikore, marrim:

; . (*)

Duke aplikuar pabarazinë e Chebyshev në sasi, ne kemi.

Duke marrë parasysh raportin (*),

Me kusht, do të thotë . (***) Zëvendësimi anën e djathtë(***) në ​​pabarazi (**) kemi

Nga këtu, duke kaluar në kufirin në , marrim

Meqenëse probabiliteti nuk mund të kalojë një, më në fund marrim:

Kjo është ajo që na duhej të vërtetonim.

Le të ndalemi në një rast të veçantë të rëndësishëm të teoremës së Chebyshev. Gjegjësisht, merrni parasysh rastin kur ndryshoret e pavarura të rastësishme ( Χ 1; X2; … Xn) kanë të njëjtat ligje të shpërndarjes, dhe, rrjedhimisht, të njëjtat karakteristikat numerike:

(8)

Pastaj për ndryshoren e rastësishme , sipas (5), kemi:

(9)

Lidhja e probabilitetit kufizues (7) në këtë rast do të marrë formën:

(10)

Përfundimi që vjen nga (10) ka rëndësi të madhe për të luftuar gabimet e rastësishme gjatë kryerjes së llojeve të ndryshme të matjeve.

Le të, për shembull, duhet të matni një sasi të caktuar A. Ne do të prodhojmë jo një, por disa ( n) matje të pavarura të përsëritura të vlerës së kësaj sasie. Çdo matje është e natyrshme në një gabim të rastësishëm që lidhet me papërsosmërinë e pajisjes matëse, të gjitha llojet e ndërhyrjeve të rastësishme në matje, etj. Prandaj rezultatet ( Χ 1; X2; … Xn) matjet sekuenciale individuale të vlerës së dëshiruar A, në përgjithësi, nuk do të jepen - ato do të jenë variabla të rastësishme. Për më tepër, me sasitë që kanë shpërndarje identike, sepse matjet bëhen në mënyrë të përsëritur, pra në konstante kushtet e jashtme. Pastaj për sasinë - mesatarja aritmetike e rezultateve të të gjithave n matjet - relacioni i probabilitetit kufizues (10) do të përmbushet. Kjo do të thotë se kjo mesatare aritmetike humbet karakterin e rastësisë, duke u shndërruar në Akuptimin e vërtetë sasia e matur. Kjo, nga rruga, dëshmohet nga formula (9), sipas të cilave:

(11)

Kjo do të thotë, pasi të keni kryer një numër mjaft të madh të matjeve të përsëritura të sasisë së dëshiruar A, në secilën prej të cilave është i mundur një gabim i rastësishëm i matjes dhe më pas gjetja e mesatares rezultatet aritmetike këto matje, ne përdorim formulën

A(12)

ne mund të marrim vlerën dhe praktikisht pa gabime të rastësishme.

Ky përfundim është pasojë e ligjit të numrave të mëdhenj. NË në këtë rast ky ligj manifestohet në faktin se gjatë përmbledhjes së matjeve rezulton në (4) gabime të rastësishme dimensionet individuale, që ndodhin në parim njëlloj shpesh me një shenjë plus dhe një minus, në përgjithësi do të anulojnë njëra-tjetrën. Dhe gabimi i mbetur do të ndahet akoma në P, domethënë do të ulet më tej me P një herë. Kështu që kur vlera të mëdha n vlera do të jetë pothuajse saktësisht e barabartë me vlerën e matur A. Ky përfundim natyrshëm përdoret gjerësisht në praktikë.

shënim. Në madhësi ato anulojnë vetëm njëra-tjetrën gabime të rastësishme matjet, domethënë gabimet që lidhen me veprimin e faktorëve të rastësishëm (ndërhyrje). Por gabimet sistematike (të përhershme), domethënë gabimet e natyrshme në secilën matje, natyrisht mbeten në . Për shembull, një shigjetë e rrëzuar (jo e rregulluar) në një pajisje shkakton një gabim konstant (sistematik) në çdo matje, dhe për këtë arsye e shkakton atë në mesataren aritmetike të rezultateve të këtyre matjeve. Gabimet sistematike duhet të eliminohen edhe përpara se të bëhen matjet dhe të mos lejohen gjatë procesit të matjes.

Atëherë, nëse α është vlera e ndarjes së pajisjes matëse, atëherë të gjitha matjet e përsëritura bëhen me një saktësi prej α. Por atëherë, natyrisht, mesatarja aritmetike e rezultateve të të gjitha matjeve mund të tregohet vetëm me një saktësi prej α, domethënë me një saktësi të përcaktuar nga saktësia e pajisjes.

Prandaj, nuk duhet menduar se, pasi të ketë bërë një numër mjaft të madh të matjeve të përsëritura të sasisë A dhe më pas duke gjetur mesataren aritmetike të rezultateve të këtyre matjeve, marrim saktë kuptimi A. Ne do ta marrim atë vetëm brenda saktësisë së pajisjes matëse. Dhe edhe atëherë, nëse përjashtojmë gabimin sistematik të matjes.

Këtu është një tjetër e rëndësishme rast i veçantë ligji i numrave të mëdhenj. Le X=k– numri i dukurive të ndonjë ngjarjeje A V P teste të përsëritura ( X- vlera e rastësishme). Dhe le dhe – probabiliteti i ndodhjes dhe mosngjarjes së një ngjarjeje A në një provë. Konsideroni një ndryshore të rastësishme - frekuencën relative të shfaqjes së një ngjarjeje A V P testet. Le të prezantojmë gjithashtu n variablat e rastit ( X 1, X 2, …X n), të cilat përfaqësojnë numrin e dukurive të ngjarjes A ne te paren, te dyten,... P-th teste. Pastaj k = X 1 + X 2 +…+ X f, dhe ndodhja e një ngjarjeje A praktikisht përkon me probabilitetin e ndodhjes së ngjarjes A në një provë. Ky përfundim është baza për gjetjen e probabiliteteve të shumë ngjarjeve të rastësishme, probabilitetet e të cilave nuk mund të gjenden në ndonjë mënyrë tjetër (teorikisht).

Për shembull, le të jetë testi hedhja e një monedhe të deformuar (asimetrike) dhe ngjarja A për këtë sfidë, është një rënie e kreshtës. Probabiliteti i ngjarjes A Nga formula klasike ose ndonjë mënyrë tjetër formulë teorikeështë e vështirë të gjendet, sepse një formulë e tillë duhet të pasqyrojë disi karakteristikat e deformimit të monedhës. Prandaj, rruga e vërtetë që çon drejt qëllimit është një: hidhni monedhën në mënyrë të përsëritur (sa më i madh të jetë numri i hedhjeve n, aq më mirë) dhe të përcaktojë në mënyrë empirike shpeshtësinë relative të paraqitjes së stemës. Nëse nështë i madh, atëherë në përputhje me ligjin e numrave të mëdhenj është e mundur me probabilitet të lartë pohojnë se .

Ligji i numrave të mëdhenj manifestohet në shumë dukuri natyrore dhe shoqërore.

Shembulli 1. Siç dihet, gazi i vendosur në një enë të mbyllur ushtron presion në muret e enës. Sipas ligjeve të gjendjes së gazit, në një temperaturë konstante të gazit, ky presion është konstant. Presioni i gazit shkaktohet nga ndikimet kaotike të molekulave individuale në muret e enës. Shpejtësitë dhe drejtimet e lëvizjes së të gjitha molekulave janë të ndryshme, prandaj edhe forcat e ndikimeve të molekulave të ndryshme në muret e enës janë të ndryshme. Sidoqoftë, presioni i gazit në muret e enës përcaktohet jo nga forca e ndikimit të molekulave individuale, por nga mesatare me forcë. Por ajo është si mesatarja numër i madh pavarësisht forcat aktive, sipas ligjit të numrave të mëdhenj, do të mbetet praktikisht i pandryshuar. Prandaj, presioni i gazit në muret e anijes mbetet praktikisht i pandryshuar.

Shembulli 2. Një kompani sigurimesh që merret, për shembull, me sigurimin e automjeteve, paguan shuma të ndryshme sigurimi për ngjarje të ndryshme të siguruara (aksidente automobilistike dhe aksidente trafiku rrugor). Megjithatë, vlera mesatare e kësaj shume të sigurimit, si një mesatare prej shumë të ndryshme n shumat e pavarura të sigurimit, sipas ligjit të numrave të mëdhenj, praktikisht do të jenë të pandryshuara. Mund të përcaktohet duke ekzaminuar statistikat aktuale të dëmeve nga sigurimet. Në mënyrë që një kompani sigurimi të shmangë humbjet, primi mesatar i sigurimit i ngarkuar për klientët e saj duhet të jetë më i lartë se primi mesatar i paguar nga kompania për klientët e saj. Por ky premium nuk duhet të jetë shumë i lartë që kompania të jetë konkurruese (për të konkurruar në atraktivitet me kompanitë e tjera të sigurimit).

1. /PB-MS-teori/Leksione-1(4f.).doc
2. /PB-MS-teori/Leksione-2 (4 fq.).doc
3. /PB-MS-teori/Leksione-3(4f.).doc
4. /PB-MS-teori/Leksione-4(4f.).doc
5. /PB-MS-teoria/Përmbajtja.doc
Leksioni 1
Leksioni 19. Testimi statistikor i hipotezave statistikore. Parimet e përgjithshme të testimit të hipotezave. Konceptet e hipotezës statistikore (të thjeshta dhe komplekse), hipoteza zero dhe konkurruese,
Ligji i numrave të mëdhenj. Pabarazia e Chebyshev. Teoremat e Chebyshev dhe Bernoulli
Leksion Karakteristikat numerike bazë të ndryshoreve të rastësishme diskrete dhe të vazhdueshme: pritshmëria matematikore, dispersioni dhe devijimi standard. Karakteristikat dhe shembujt e tyre
Leksion Lënda e teorisë së probabilitetit. Ngjarje të rastësishme. Algjebra e ngjarjeve. Frekuenca relative dhe probabiliteti i një ngjarjeje të rastësishme. Grupi i plotë i ngjarjeve. Përkufizimi klasik i probabilitetit. Vetitë themelore të probabilitetit. Formulat bazë të kombinatorikës

Leksioni 13.

Ligji i numrave të mëdhenj. Pabarazia e Chebyshev. Teoremat e Chebyshev dhe Bernoulli.
Studimi i modeleve statistikore bëri të mundur vërtetimin se, në kushte të caktuara, sjellja e përgjithshme sasi e madhe variablat e rastësishëm pothuajse humbasin karakterin e tyre të rastësishëm dhe bëhen të natyrshme (me fjalë të tjera, devijimet e rastësishme nga disa sjellje mesatare anulojnë njëra-tjetrën). Në veçanti, nëse ndikimi në shumën e termave individualë është uniformisht i vogël, ligji i shpërndarjes së shumës i afrohet normales. Formulimi matematikor Ky pohim është dhënë në një grup teoremash të quajtur ligji i numrave të mëdhenj.

Pabarazia e Chebyshev.
Pabarazia e Chebyshev, e përdorur për të vërtetuar teorema të mëtejshme, është e vlefshme si për ndryshoret e rastësishme të vazhdueshme ashtu edhe për ato diskrete. Le ta vërtetojmë atë për variabla diskrete të rastësishme.
Teorema 13.1 (pabarazia e Chebyshev). fq( | XM(X)| D( X) / ε². (13.1)

Dëshmi. Le X jepet nga seria e shpërndarjes


X

X 1

X 2



X P

R

R 1

R 2



R P

Që nga ngjarjet | XM(X)| X M(X)| ≥ ε janë të kundërta, atëherë R (|XM(X)| p(| XM(X)| ≥ ε) = 1, pra, R (|XM(X)| p(| XM(X)| ≥ ε). Ne do të gjejmë R (|XM(X)| ≥ ε).

D(X) = (x 1 – M(X))² fq 1 + (x 2 – M(X))² fq 2 + … + (x n M(X))² fq n . Le të përjashtojmë nga kjo shumë ato terma për të cilët | XM(X)| k kushtet. Pastaj

D(X) ≥ (x k + 1 – M(X))² fq k + 1 + (x k + 2 – M(X))² fq k +2 + … + (x n M(X))² fq n ≥ ε² ( fq k + 1 + fq k + 2 + … + fq n).

Vini re se fq k + 1 + fq k + 2 + … + fq n ekziston mundësia që | XM(X)| ≥ ε, pasi kjo është shuma e probabiliteteve të të gjitha vlerave të mundshme X, për të cilën kjo pabarazi është e vërtetë. Prandaj, D(X) ≥ ε² R(|XM(X)| ≥ ε), ose R (|XM(X)| ≥ ε) ≤ D(X) / ε². Pastaj probabiliteti i ngjarjes së kundërt fq( | XM(X)| D( X) / ε², që është ajo që duhej vërtetuar.
Teoremat e Chebyshev dhe Bernoulli.

Teorema 13.2 (teorema e Chebyshev). Nëse X 1 , X 2 ,…, X P– variabla të rastësishme të pavarura në çift, variancat e të cilave janë të kufizuara në mënyrë uniforme ( D(X i) ≤ C), atëherë për një numër arbitrarisht të vogël ε probabiliteti i pabarazisë

do të jetë në mënyrë arbitrare afër 1 nëse numri i variablave të rastësishëm është mjaft i madh.

Koment. Me fjalë të tjera, nëse plotësohen këto kushte

Dëshmi. Konsideroni një ndryshore të re të rastësishme
dhe gjeni pritshmërinë e tij matematikore. Duke përdorur vetitë e pritjes matematikore, marrim se . Aplikoni në Pabarazia e Chebyshev: Meqenëse ndryshoret e rastësishme në shqyrtim janë të pavarura, atëherë, duke marrë parasysh kushtet e teoremës, kemi: Duke përdorur këtë rezultat, ne paraqesim pabarazinë e mëparshme në formën:

Le të shkojmë në kufirin në
: Meqenëse probabiliteti nuk mund të jetë më i madh se 1, mund të thuhet se

Teorema është e vërtetuar.
Pasoja.

Nëse X 1 , X 2 , …, X P– variabla të rastësishme të pavarura në çift me varianca të kufizuara uniforme, që kanë të njëjtën pritshmëri matematikore të barabartë me A, atëherë për çdo ε > 0 arbitrarisht të vogël probabiliteti i pabarazisë
do të jetë aq afër 1 sa të dëshirohet nëse numri i variablave të rastësishëm është mjaft i madh. Me fjale te tjera,
.

konkluzioni: mesatarja aritmetike e një numri mjaft të madh të ndryshoreve të rastit merr vlera afër shumës së pritjeve të tyre matematikore, domethënë humbet karakterin e një ndryshoreje të rastësishme. Për shembull, nëse kryhet një seri matjesh sasi fizike, dhe: a) rezultati i secilës matje nuk varet nga rezultatet e të tjerave, domethënë, të gjitha rezultatet janë variabla të rastësishme të pavarura në çift; b) matjet janë bërë pa gabime sistematike (pritshmëritë e tyre matematikore janë të barabarta me njëra-tjetrën dhe të barabarta me vlerën e vërtetë A sasia e matur); c) sigurohet një saktësi e caktuar e matjeve, prandaj dispersionet e variablave të rastësishëm në shqyrtim janë të kufizuara në mënyrë uniforme; pastaj me mjaftueshëm numer i madh matjet, mesatarja e tyre aritmetike do të rezultojë të jetë arbitrarisht afër vlerës së vërtetë të vlerës së matur.
Teorema e Bernulit.
Teorema 13.3 (teorema e Bernulit). Nëse në secilën prej P probabiliteti i eksperimenteve të pavarura R ndodhja e një ngjarjeje Aështë konstante, atëherë me një numër mjaftueshëm të madh testesh probabiliteti që moduli i devijimit të frekuencës relative të dukurive A V P eksperimente nga R do të jetë aq i vogël sa dëshironi, sa më afër 1 sa dëshironi:

(13.2)

Dëshmi. Le të prezantojmë ndryshore të rastësishme X 1 , X 2 , …, X P, Ku X i numri i paraqitjeve A V i-m përvojë. Ku X i mund të marrë vetëm dy vlera: 1 (me probabilitet R) dhe 0 (me probabilitet q = 1 – fq). Përveç kësaj, variablat e rastësishëm në shqyrtim janë të pavarura në çift dhe variancat e tyre janë të kufizuara në mënyrë uniforme (pasi D(X i) = pq, fq + q = 1, nga pq ≤ ¼). Rrjedhimisht, teorema e Chebyshev mund të zbatohet për ta kur M i = fq:

.

Por
, sepse X i merr vlerën 1 kur shfaqet A V këtë përvojë, dhe një vlerë të barabartë me 0 nëse A Nuk ndodhi. Kështu,

Q.E.D.
Koment. Nga teorema e Bernulit mos e bej, Çfarë
Bëhet fjalë për vetëm rreth probabilitetet se diferenca ndërmjet frekuencës relative dhe probabilitetit absolut mund të bëhet arbitrarisht e vogël. Dallimi është si më poshtë: me konvergjencën e zakonshme të konsideruar në analizën matematikore, për të gjithë P, duke u nisur nga disa vlera, pabarazia
ekzekutuar gjithmonë; në rastin tonë mund të ketë vlera të tilla P, për të cilat kjo pabarazi nuk është e vërtetë. Ky lloj konvergjence quhet konvergjenca në probabilitet.

Leksioni 14.

Teorema e kufirit qendror të Lyapunovit. Teorema e kufirit Moivre-Laplace.
Ligji i numrave të mëdhenj nuk e shqyrton formën ligji kufizues shpërndarja e shumës së variablave të rastit. Kjo pyetje konsiderohet në një grup teoremash të quajtur teorema e kufirit qendror. Ata argumentojnë se ligji i shpërndarjes së një shume variablash të rastësishëm, secila prej të cilave mund të ketë shpërndarje të ndryshme, i afrohet normales kur numri i termave është mjaftueshëm i madh. Kjo shpjegon rëndësinë e ligjit normal për aplikime praktike.
Funksionet karakteristike.

Për të vërtetuar qendroren teorema e kufirit Përdoret metoda e funksioneve karakteristike.
Përkufizimi 14.1.Funksioni karakteristik ndryshore e rastësishme X i quajtur funksion

g(t) = M (e itX ) (14.1)

Kështu, g (t) paraqet pritshmërinë matematikore të disa ndryshoreve komplekse të rastit U = e itX, lidhur me vlerën X. Në veçanti, nëse X– ndryshore diskrete e rastësishme, dhënë aty pranë shpërndarjet, atëherë

. (14.2)

Për një ndryshore të rastësishme të vazhdueshme me densitet të shpërndarjes f(x)

(14.3)

Shembulli 1. Le X– numri prej 6 pikësh në një gjuajtje zare. Pastaj sipas formulës (14.2) g(t) =

Shembulli 2. Le të gjejmë funksionin karakteristik për një ndryshore të rastësishme të vazhdueshme të normalizuar të shpërndarë mbi ligj normal
. Sipas formulës (14.3) (ne kemi përdorur formulën
dhe ç'farë i² = -1).

Vetitë e funksioneve karakteristike.
1. Funksioni f(x) mund të gjendet në funksion i njohur g(t) sipas formulës

(14.4)

(transformimi (14.3) quhet Transformimi i Furierit, dhe transformimi (14.4) - transformim i anasjelltë Furieri).

2. Nëse ndryshoret e rastit X Dhe Y të lidhura nga relacioni Y = aX, atëherë funksionet e tyre karakteristike lidhen me relacionin

g y (t) = g x (). (14.5)

3. Funksioni karakteristik i shumës së ndryshoreve të rastësishme të pavarura është i barabartë me produktin e funksioneve karakteristike të termave: për

(14.6)
Teorema 14.1 (teorema e kufirit qendror për termat e shpërndarë në mënyrë identike). Nëse X 1 , X 2 ,…, X P,… - variabla të rastësishme të pavarura me të njëjtin ligj shpërndarja, pritshmëria matematikore T dhe variancë σ 2, pastaj me rritje të pakufizuar P ligji i shpërndarjes së shumës
i afrohet pafundësisht normales.

Dëshmi.

Le të vërtetojmë teoremën për ndryshoret e rastësishme të vazhdueshme X 1 , X 2 ,…, X P(provë për sasi diskrete në mënyrë të ngjashme). Sipas kushteve të teoremës, funksionet karakteristike të termave janë identike:
Pastaj, nga vetia 3, funksioni karakteristik i shumës Y n do
Le të zgjerojmë funksionin g x (t) në serinë Maclaurin:

, Ku

.

Duke supozuar se T= 0 (d.m.th., zhvendosni origjinën në pikën T), Kjo
.

(sepse T= 0). Duke zëvendësuar rezultatet e marra në formulën Maclaurin, ne gjejmë se

.

Konsideroni një ndryshore të re të rastësishme
, i ndryshëm nga Y n në atë shpërndarjen e saj për ndonjë P barazohet me 0. Meqenëse Y n Dhe Z n lidhur varësia lineare, mjafton ta vërtetojmë këtë Z n shpërndahet sipas ligjit normal, ose, që është e njëjta gjë, që funksioni i tij karakteristik i afrohet funksioni karakteristik ligji normal (shih shembullin 2). Nga vetia e funksioneve karakteristike

Le të logaritmojmë shprehjen që rezulton:

Ku

Le të shpërbëhemi
me radhë në P→ ∞, duke u kufizuar në dy terma të zgjerimit, pastaj ln(1 - k) ≈ - k. Nga këtu

Ku kufiri i fundit është 0, pasi në . Prandaj,
, kjo eshte
- funksioni karakteristik shpërndarje normale. Pra, me një rritje të pakufizuar të numrit të termave, funksioni karakteristik i sasisë Z n i qaset në mënyrë të pakufizuar funksionit karakteristik të ligjit normal; pra ligji i shpërndarjes Z n (Dhe Y n) i afrohet normales pa kufi. Teorema është e vërtetuar.

A.M Lyapunov vërtetoi teoremën e kufirit qendror për kushte më shumë pamje e përgjithshme:
Teorema 14.2 (teorema e Lyapunovit). Nëse ndryshorja e rastit Xështë shuma e një numri shumë të madh të ndryshoreve të rastësishme të pavarura reciprokisht për të cilat plotësohet kushti i mëposhtëm:

, (14.7)

Ku b k – momenti i tretë absolut qendror i madhësisë X për të, A D kështë varianca e tij, pra X ka një shpërndarje afër normales (gjendja e Lyapunov do të thotë që ndikimi i secilit term në shumë është i papërfillshëm).
Në praktikë, mund të përdoret mjaftueshëm teorema e kufirit qendror sasi e vogël terma, pasi llogaritjet probabilistike kërkojnë saktësi relativisht të ulët. Përvoja tregon se për një shumë prej dhjetë ose më pak termash, ligji i shpërndarjes së tyre mund të zëvendësohet nga një normal.

Një rast i veçantë i teoremës së kufirit qendror për ndryshoret diskrete të rastit është teorema Moivre-Laplace.

Teorema 14.3 (teorema Moivre-Laplace). Nëse prodhohet P eksperimente të pavarura, në secilën prej të cilave një ngjarje A shfaqet me probabilitet R, atëherë relacioni i mëposhtëm është i vlefshëm:

(14.8)

Ku Y – numri i dukurive të ngjarjes A V P eksperimente, q = 1 – fq.

Dëshmi.

Ne do të supozojmë se
, Ku X i– numri i dukurive të ngjarjes A V i-m përvojë. Pastaj ndryshorja e rastësishme
(shih Teoremën 14.1) mund të konsiderohet i shpërndarë dhe normalizuar, prandaj, probabiliteti i rënies së tij në intervalin (α, β) mund të gjendet me formulën;

Sepse Y Ajo ka shpërndarja binomiale, . Pastaj
. Duke e zëvendësuar këtë shprehje në formulën e mëparshme, marrim barazinë (14.8).

Pasoja.

Në kushtet e teoremës Moivre-Laplace, probabiliteti
se ngjarja A do të shfaqet në P eksperimente saktësisht k herë, me një numër të madh eksperimentesh mund të gjenden duke përdorur formulën:

(14.9)

Ku
, A
(vlerat e këtij funksioni janë dhënë në tabela të veçanta).

Shembulli 3. Gjeni probabilitetin që me 100 hedhje monedhash, numri i stemave të jetë në intervalin nga 40 në 60.

Le të zbatojmë formulën (14.8), duke marrë parasysh këtë P= 0,5. Pastaj etj= 100·0,5 = 50, Pastaj, nëse
Prandaj,

Shembulli 4. Në kushtet e shembullit të mëparshëm, gjeni probabilitetin që të shfaqen 45 stema.

Ne do të gjejmë
, Pastaj

Leksioni 15.

Konceptet Bazë statistika matematikore. Popullsia dhe mostra. Seritë e variacioneve, seritë statistikore. Mostra e grupuar. Seritë statistikore të grupuara. Shumëkëndëshi i frekuencës. Funksioni i shpërndarjes së mostrës dhe histogrami.
Statistikat matematikore merren me vendosjen e modeleve që rregullojnë masën dukuritë e rastësishme, bazuar në përpunimin e të dhënave statistikore të marra si rezultat i vëzhgimeve. Dy detyrat kryesore të statistikave matematikore janë:

Përcaktimi i mënyrës së mbledhjes dhe grupimit të këtyre statistikave;

Zhvillimi i metodave për analizimin e të dhënave të marra në varësi të objektivave të studimit, të cilat përfshijnë:

a) vlerësimi i probabilitetit të panjohur të një ngjarjeje; vlerësimi i funksionit të panjohur të shpërndarjes; vlerësimi i parametrave të shpërndarjes, lloji i të cilave dihet; vlerësimi i varësisë nga variabla të tjerë të rastësishëm etj.;

b) kontrolloni hipoteza statistikore për llojin e shpërndarjes së panjohur ose për vlerat e parametrave të një shpërndarjeje të njohur.

Për të zgjidhur këto probleme, duhet të zgjidhni popullsi e madhe objekte homogjene sasi e kufizuar objekte, bazuar në rezultatet e studimit të të cilave është e mundur të bëhet një parashikim në lidhje me karakteristikën e studiuar të këtyre objekteve.

Le të përcaktojmë konceptet themelore të statistikave matematikore.

Popullatë – të gjithë grupin e objekteve të disponueshme.

Mostra– një grup objektesh të zgjedhura rastësisht nga popullatë.

Madhësia e popullsisëN dhe madhësia e mostrësn – numri i objekteve në popullsinë në shqyrtim.

Llojet e kampionimit:

Të përsëritura– çdo objekt i përzgjedhur i kthehet popullatës së përgjithshme përpara se të zgjidhet objekti tjetër;

E pa përsëritur– objekti i përzgjedhur nuk i kthehet popullatës së përgjithshme.
Koment. Për të qenë në gjendje të nxjerrim përfundime nga studimi i kampionit në lidhje me sjelljen e karakteristikës së popullatës së përgjithshme që na intereson, është e nevojshme që kampioni të përfaqësojë saktë proporcionet e popullsisë së përgjithshme, d.m.th. përfaqësuese(përfaqësues). Duke marrë parasysh ligjin e numrave të mëdhenj, mund të argumentohet se ky kusht plotësohet nëse secili objekt zgjidhet në mënyrë të rastësishme dhe për çdo objekt probabiliteti për t'u përfshirë në mostër është i njëjtë.
Përpunimi primar i rezultateve.

Lëreni variablin e rastësishëm që na intereson X merr vlerën në mostër X 1 P 1 here, X 2 – P 2 herë, …, X për të - P për të herë, dhe
Ku P- Madhësia e mostrës. Pastaj vlerat e vëzhguara të ndryshores së rastësishme X 1 , X 2 ,…, X për të thirrur opsione, A P 1 , P 2 ,…, P për tëfrekuencave. Nëse e ndajmë secilën frekuencë me madhësinë e kampionit, marrim frekuenca relative
Quhet një sekuencë opsionesh të shkruara në rend rritës variacionale pranë tij, dhe një listë opsionesh dhe frekuencat e tyre përkatëse ose frekuenca relativeseri statistikore:


x i

x 1

x 2



x k

n i

n 1

n 2



n k

w i

w 1

w 2



w k

Kur kryeni 20 seri me 10 hedhje zare, numri i gjashtë pikëve doli të ishte 1,1,4,0,1,2,1,2,2,0,5,3,3,1,0,2, 2,3 ,4,1.Le të kompozojmë seri variacionesh: 0,1,2,3,4,5. Seritë statistikore për frekuenca absolute dhe relative ka formën:


x i

0

1

2

3

4

5

n i

3

6

5

3

2

1

w i

0,15

0,3

0,25

0,15

0,1

0,05

Nëse po studiohet ndonjë tipar i vazhdueshëm, atëherë seria e variacionit mund të përbëhet nga një numër shumë i madh numrash. Në këtë rast është më i përshtatshëm për t'u përdorur kampion i grupuar. Për ta marrë atë, intervali që përmban të gjitha vlerat e vëzhguara të atributit ndahet në disa intervale të barabarta të pjesshme të gjatësisë h, dhe më pas gjeni për çdo interval të pjesshëm n i– shuma e frekuencave të variantit të përfshirë në i intervali i th. Tabela e përpiluar nga këto rezultate quhet të grupuara statistikisht afër :

Shumëkëndëshi i frekuencës. Funksioni i shpërndarjes së mostrës dhe histogrami.
Për të vizualizuar sjelljen e ndryshores së rastësishme në studim në mostër, mund të ndërtoni grafikë të ndryshëm. Një prej tyre - diapazoni i frekuencës: një vijë e thyer, segmentet e së cilës lidhin pikat me koordinatat ( x 1 , n 1), (x 2 , n 2),…, (x k , n k), Ku x i janë paraqitur në boshtin x, dhe n i – në boshtin e ordinatave. Nëse vlerat jo-absolute vizatohen në boshtin e ordinatave ( n i), dhe të afërm ( w i) frekuenca, marrim poligonin e frekuencës relative(Fig. 1) . Oriz. 1.

Për analogji me funksionin e shpërndarjes së një ndryshoreje të rastësishme, mund të specifikoni një funksion të caktuar, frekuencën relative të ngjarjes X x.

Përkufizimi 15.1.Funksioni i shpërndarjes së mostrës (empirike). thirrni funksionin F* (x), duke përcaktuar për secilën vlerë X Frekuenca relative e ngjarjes X x. Kështu,

, (15.1)

Ku P X– numri i opsioneve, më i vogël X, P- Madhësia e mostrës.
Koment. Në ndryshim nga funksioni empirik i shpërndarjes i gjetur në mënyrë eksperimentale, funksioni i shpërndarjes F(x) të popullatës së përgjithshme quhet funksioni teorik shpërndarja. F(x) përcakton probabilitetin e një ngjarjeje X x, A F* (x) – frekuenca e saj relative. Për mjaftueshëm të mëdha P, siç vijon nga teorema e Bernulit, F* (x) tenton sipas gjasave të F(x).

Nga përkufizimi i funksionit të shpërndarjes empirike është e qartë se vetitë e tij përkojnë me vetitë F(x), domethënë:


  1. 0 ≤F* (x) ≤ 1.

  2. F* (x) është një funksion që nuk zvogëlohet.

  3. Nëse X Atëherë 1 është opsioni më i vogël F* (x) = 0 në XX 1 ; Nëse X për të - opsioni më i madh, pra F* (x) = 1 në X> X për të .
Për një veçori të vazhdueshme, një ilustrim grafik është grafik me shtylla, pra një figurë me shkallë të përbërë nga drejtkëndësha, bazat e të cilave janë intervale të pjesshme gjatësia h, dhe lartësitë gjatesite n i / h(histogrami i frekuencës) ose w i / h (histogram i frekuencave relative). Në rastin e parë, zona e histogramit është e barabartë me vëllimin e mostrës, në të dytën - uniteti (Fig. 2). Fig.2.

Leksioni 16.

Karakteristikat numerike shpërndarje statistikore: mesataren e mostrës, vlerësimet e variancës, vlerësimet e modës dhe mesatares, vlerësimet e momentit fillestar dhe qendror. Përshkrimi statistikor dhe llogaritja e vlerësimeve të parametrave të një vektori të rastësishëm dydimensional.
Një nga detyrat e statistikave matematikore është të vlerësojë vlerat e karakteristikave numerike të ndryshores së rastësishme që studiohet duke përdorur mostrën e disponueshme.

Përkufizimi 16.1.Mesatarja e mostrësështë mesatarja aritmetike e vlerave të variablave të rastësishme të marra në mostër:

, (16.1)

Ku x i- opsione, n i- frekuencat.

Koment. Mesatarja e mostrës shërben për të vlerësuar pritshmërinë matematikore të ndryshores së rastësishme në studim. Çështja se sa i saktë është një vlerësim i tillë do të diskutohet më vonë.

Përkufizimi 16.2.Varianca e mostrës thirrur

, (16.2)

A devijimi standard i mostrës

(16.3)

Ashtu si në teorinë e ndryshoreve të rastit, mund të vërtetohet se formulën e mëposhtme për të llogaritur variancën e mostrës:

. (16.4)

Shembulli 1. Gjeni karakteristikat numerike të një kampioni të dhëna nga një seri statistikore


x i

2

5

7

8

n i

3

8

7

2

Karakteristikat e tjera të serisë së variacioneve janë:

- modësM 0 – opsioni që ka frekuenca më e lartë(në shembullin e mëparshëm M 0 = 5).

- mesatareT e - opsioni, i cili e ndan serinë e variacioneve në dy pjesë, të barabarta në numër opsionesh. Nëse opsioni i numrit është tek ( n = 2k+ 1), atëherë m e = x k + 1, dhe për madje n = 2k
. Në veçanti, në shembullin 1

Vlerësimet e momenteve fillestare dhe qendrore (të ashtuquajturat momente empirike) përcaktohen në mënyrë të ngjashme me momentet teorike përkatëse:

- momenti fillestar empirik i renditk thirrur

. (16.5)

Veçanërisht,
, domethënë, momenti empirik fillestar i rendit të parë është i barabartë me mesataren e mostrës.

- momenti qendror empirik i renditk thirrur

. (16.6)

Veçanërisht,
, domethënë, momenti empirik qendror i rendit të dytë është i barabartë me variancën e mostrës.
Përshkrimi statistikor dhe llogaritja e karakteristikave

vektor i rastësishëm dydimensional.
hulumtim statistikor Për variablat e rastësishëm dydimensionale, detyra kryesore është zakonisht identifikimi i marrëdhënies midis komponentëve.

Një mostër dy-dimensionale është një grup vlerash vektoriale të rastësishme: ( X 1 , 1), (X 2 , 2), …, (X P , y P). Për të, ju mund të përcaktoni mesataret e mostrave të përbërësve:

dhe variancat përkatëse të mostrës dhe devijimet standarde. Përveç kësaj, mund të llogaritet mesataret e kushtëzuara: - mesatarja aritmetike e vlerave të vëzhguara Y, përkatëse X = x, Dhe - mesatarja e vlerave të vëzhguara X, përkatëse Y = y.

Nëse ka një varësi midis përbërësve të një ndryshoreje të rastësishme dy-dimensionale, ajo mund të ketë lloj të ndryshëm: varësi funksionale nëse çdo vlerë e mundshme X përputhet me një vlerë Y, dhe statistikore, në të cilat një ndryshim në një sasi çon në një ndryshim në shpërndarjen e një tjetre. Nëse, si rezultat i një ndryshimi në një vlerë, ndryshon vlera mesatare e një tjetre, atëherë varësia statistikore midis tyre quhet korrelacion.

Leksioni 17.

Vetitë themelore të karakteristikave statistikore të parametrave të shpërndarjes: paanshmëria, qëndrueshmëria, efikasiteti. Paanshmëria dhe konsistenca e kampionit do të thotë si një vlerësim i pritshmërisë matematikore. Paragjykimi i variancës së kampionimit. Një shembull i një vlerësuesi të paanshëm të variancës. Vlerësime asimptotike të paanshme. Metodat për ndërtimin e vlerësimeve: metoda me shumë gjasa, metoda momentale, metoda kuantile, metoda katrorët më të vegjël,Qasja Bayesiane për vlerësimin.
Pasi të keni marrë vlerësime statistikore të parametrave të shpërndarjes (mesatarja e mostrës, varianca e mostrës, etj.), Ju duhet të siguroheni që ato të shërbejnë mjaftueshëm si një përafrim i karakteristikave përkatëse të popullatës. Le të përcaktojmë kërkesat që duhet të plotësohen.

Le të jetë Θ* një vlerësim statistikor i parametrit të panjohur Θ shpërndarja teorike. Le të nxjerrim disa mostra me të njëjtën madhësi nga popullata e përgjithshme P dhe llogaritni për secilën prej tyre vlerësimin e parametrit Θ:
Atëherë vlerësimi Θ* mund të konsiderohet si një ndryshore e rastësishme që merr vlera të mundshme Nëse pritshmëria matematikore e Θ* nuk është e barabartë me parametrin e vlerësuar, ne do të marrim gjatë llogaritjes së vlerësimeve. gabime sistematike një shenjë (me tepricë nëse M(Θ*) >Θ, dhe me një disavantazh nëse M(Θ*) M (Θ*) = Θ.
Përkufizimi 17.2. Vlerësimi statistikor Θ* quhet i paanshëm, nëse pritshmëria e tij matematikore është e barabartë me parametrin e vlerësuar Θ për çdo madhësi kampioni:

M(Θ*) = Θ. (17.1)

I zhvendosur quhet një vlerësim, pritshmëria matematikore e të cilit nuk është e barabartë me parametrin e vlerësuar.

Megjithatë, paanshmëria nuk është gjendje e mjaftueshme përafrim i mirë me vlerën e vërtetë të parametrit të vlerësuar. Nëse, në këtë rast, vlerat e mundshme të Θ* mund të devijojnë ndjeshëm nga vlera mesatare, domethënë shpërndarja e Θ* është e madhe, atëherë vlera e gjetur nga të dhënat e një kampioni mund të ndryshojë ndjeshëm nga parametri i vlerësuar. Prandaj, është e nevojshme të vendosen kufizime në shpërndarje.
Përkufizimi 17.2. Vlerësimi statistikor quhet efektive, nëse është për një madhësi të caktuar kampioni P ka variancën më të vogël të mundshme.
Kur merren parasysh mostra të mëdha, vlerësimet statistikore i nënshtrohen gjithashtu kërkesës për konsistencë.
Përkufizimi 17.3.I pasur quhet vlerësim statistikor që, kur P→∞ priret në probabilitet te parametri i vlerësuar (nëse ky vlerësim është i paanshëm, atëherë do të jetë konsistent nëse në P→∞ varianca e tij tenton në 0).
Le të sigurohemi që paraqet një vlerësim të paanshëm të pritshmërisë matematikore M(X).

Ne do ta konsiderojmë atë si një ndryshore të rastësishme, dhe X 1 , X 2 ,…, X P, pra vlerat e variablit të rastësishëm në studim që përbëjnë kampionin, – si variabla të rastësishme të pavarura, të shpërndara identike X 1 , X 2 ,…, X P, duke pasur pritshmëri matematikore A. Nga vetitë e pritshmërisë matematikore del se

Por, meqenëse secila nga sasitë X 1 , X 2 ,…, X P ka të njëjtën shpërndarje si popullsia e përgjithshme, A = M(X), kjo eshte M(
) = M(X), që ishte ajo që duhej vërtetuar. Mesatarja e mostrës nuk është vetëm një vlerësim i paanshëm, por edhe i qëndrueshëm i pritshmërisë matematikore. Duke supozuar se X 1 , X 2 ,…, X P kanë varianca të kufizuara, atëherë nga teorema e Chebyshev rrjedh se mesatarja e tyre aritmetike, domethënë me rritje P priret në probabilitet ndaj pritshmërisë matematikore A secila prej vlerave të tyre, pra të M(X). Rrjedhimisht, mesatarja e mostrës është një vlerësim konsistent i pritshmërisë matematikore.

Ndryshe nga mesatarja e mostrës, varianca e mostrësështë një vlerësim i njëanshëm i variancës së popullsisë. Mund të vërtetohet se

, (17.2)

Ku D G – vlera e vërtetë e variancës së popullsisë. Një vlerësim tjetër i shpërndarjes mund të propozohet: variancë e korrigjuars ² , llogaritur me formulë

. (17.3)

Një vlerësim i tillë do të jetë i paanshëm. Ajo korrespondon me mesatare e korrigjuar devijimi standard

. (17.4)

Përkufizimi 17.4. Vlerësimi i disa atributeve quhet asimptotikisht i paanshëm, nëse për mostër X 1 , X 2 , …, X P

, (17.5)

Ku X– vlera e vërtetë e sasisë së studiuar.
Metodat për ndërtimin e vlerësimeve.
1. Metoda e gjasave maksimale.
Le X– ndryshore e rastësishme diskrete, e cila si rezultat P testet morën vlera X 1 , X 2 , …, X P. Le të supozojmë se ne e dimë ligjin e shpërndarjes së kësaj sasie, të përcaktuar nga parametri Θ, por nuk e dimë vlerë numerike këtë parametër. Le të gjejmë vlerësimin e pikës së tij.

Le R(X i, Θ) është probabiliteti që si rezultat i testit vlera X do të marrë vlerën X i. Le të thërrasim funksioni i gjasave ndryshore diskrete e rastësishme X Funksioni i argumentit Θ, i përcaktuar nga formula:

L (X 1 , X 2 , …, X P ; Θ) = fq(x 1,Θ) fq(x 2, Θ)… fq(x n ,Θ).

Pastaj, si vlerësim pikësor i parametrit Θ, marrim vlerën e tij Θ* = Θ( X 1 , X 2 , …, X P), në të cilën funksioni i gjasave arrin maksimumin e tij. Vlerësimi Θ* quhet vlerësimi i gjasave maksimale.

Që nga funksionet L dhe ln L arrini një maksimum në të njëjtën vlerë të Θ, është më e përshtatshme të kërkoni maksimumin ln Lfunksioni logaritmik besueshmërinë. Për ta bërë këtë ju duhet:


Përparësitë e metodës së gjasave maksimale: vlerësimet e marra janë konsistente (edhe pse mund të jenë të njëanshme), të shpërndara në mënyrë asimptotike normalisht për vlera të mëdha P dhe kanë variancën më të vogël në krahasim me vlerësimet e tjera asimptotike normale; nëse për parametrin e vlerësuar Θ ekziston vlerësim efektivΘ*, atëherë ekuacioni i gjasave ka vetëm vendimΘ*; metoda bën përdorimin më të plotë të të dhënave të mostrës dhe për këtë arsye është veçanërisht e dobishme në rastin e mostrave të vogla.

Disavantazhi i metodës së gjasave maksimale: kompleksiteti llogaritës.
Për një ndryshore të rastësishme të vazhdueshme me një lloj të njohur të densitetit të shpërndarjes f(x) dhe një parametër të panjohur Θ, funksioni i gjasave ka formën:

L (X 1 , X 2 , …, X P ; Θ) = f(x 1,Θ) f(x 2, Θ)… f(x n ,Θ).

Vlerësimi maksimal i gjasave për një parametër të panjohur kryhet në të njëjtën mënyrë si për një ndryshore të rastësishme diskrete.
2. Metoda e momenteve.
Metoda e momenteve bazohet në faktin se momentet empirike fillestare dhe qendrore janë vlerësime konsistente të momenteve teorike fillestare dhe qendrore, përkatësisht, kështu që mund të barazojmë pika teorike momentet përkatëse empirike të të njëjtit rend.

Nëse specifikohet lloji i densitetit të shpërndarjes f(x, Θ), e përcaktuar nga një parametër i panjohur Θ, atëherë për të vlerësuar këtë parametër mjafton të kemi një ekuacion. Për shembull, mund të barazohet momentet fillestare Porosia e pare:

,

duke marrë kështu një ekuacion për përcaktimin e Θ. Zgjidhja e tij Θ* do të jetë një vlerësim pikësor i parametrit, i cili është një funksion i mesatares së mostrës dhe, rrjedhimisht, i variantit të mostrës:

Θ = ψ ( X 1 , X 2 , …, X P).

Nëse specie të njohura dendësia e shpërndarjes f(x, Θ 1, Θ 2) përcaktohet nga dy parametra të panjohur Θ 1 dhe Θ 2, atëherë është e nevojshme të krijohen dy ekuacione, për shembull

ν 1 = M 1, μ 2 = T 2 .

Nga këtu
- një sistem me dy ekuacione me dy të panjohura Θ 1 dhe Θ 2. Zgjidhjet e tij do të jenë vlerësimet e pikës Θ 1 * dhe Θ 2 * - funksionet e opsionit të kampionimit:

Θ 1 = ψ 1 ( X 1 , X 2 , …, X P),

Θ 2 = ψ 2 ( X 1 , X 2 , …, X P).
3. Metoda e katrorëve më të vegjël.

Nëse keni nevojë të vlerësoni varësinë e sasive Dhe X, dhe forma e funksionit që i lidh ato është e njohur, por vlerat e koeficientëve të përfshirë në të janë të panjohura, vlerat e tyre mund të vlerësohen nga mostra e disponueshme duke përdorur metodën e katrorëve më të vegjël; Për këtë qëllim funksioni = φ ( X) zgjidhet ashtu që shuma e devijimeve në katror të vlerave të vëzhguara 1 , 2 ,…, P nga φ( X i) ishte minimale:

Në këtë rast është e nevojshme të gjendet pikë e palëvizshme funksionet φ( x; a, b, c), domethënë, zgjidhni sistemin:

(zgjidhja, natyrisht, është e mundur vetëm në rastin kur dihet lloj specifik funksionet φ).

Le të shqyrtojmë si shembull zgjedhjen e parametrave funksion linear Metoda e katrorëve më të vegjël.

Për të vlerësuar parametrat A Dhe b në funksion y = sëpatë + b, do të gjejmë
Pastaj
. Nga këtu
. Pjesëtimi i të dy ekuacioneve rezultuese me P dhe duke kujtuar përkufizimet e momenteve empirike, mund të marrim shprehje për A Dhe b si:

. Prandaj, lidhja ndërmjet X Dhe mund të specifikohet në formën:


4. Qasja Bayesian për marrjen e vlerësimeve.
le ( Y, X) – vektor i rastësishëm për të cilin dihet dendësia R(|x) shpërndarja e kushtëzuar Y në çdo vlerë X = x. Nëse eksperimenti rezulton vetëm me vlera Y, dhe vlerat përkatëse X e panjohur, pastaj për të vlerësuar disa funksioni i dhënë φ( X) si vlerë e përafërt e tij, propozohet të kërkohet pritshmëria matematikore e kushtëzuar M (φ‌‌( X)‌‌‌‌‌‌|Y), e llogaritur me formulën:

, Ku, R(X X, q(y) – dendësia e shpërndarjes së pakushtëzuar Y. Një problem mund të zgjidhet vetëm kur dihet R(X). Ndonjëherë, megjithatë, është e mundur të ndërtohet një vlerësim i qëndrueshëm për q(y), në varësi vetëm nga vlerat e marra në mostër Y.

Leksioni 18.

Vlerësimi i intervalit të parametrave të panjohur. Saktësia e vlerësimit, probabiliteti i besimit(besueshmëria), intervali i besimit. Ndërtimi i intervaleve të besimit për vlerësimin e pritshmërisë matematikore të një shpërndarjeje normale me variancë të njohur dhe të panjohur. Intervalet e besimit për vlerësimin e devijimit standard të një shpërndarjeje normale.
Me një madhësi të vogël kampioni, vlerësimi i pikës mund të ndryshojë ndjeshëm nga parametri i vlerësuar, gjë që çon në gabime të mëdha. Prandaj, në këtë rast është më mirë të përdoret vlerësimet e intervalit , domethënë, tregoni intervalin në të cilin dhënë probabilitet vlera e vërtetë e parametrit të vlerësuar bie. Natyrisht, sa më e shkurtër të jetë gjatësia e këtij intervali, aq më i saktë është vlerësimi i parametrave. Prandaj, nëse pabarazia | Θ* - Θ | 0 karakterizon saktësia e vlerësimit(sa më i vogël δ, aq më i saktë është vlerësimi). Por metodat statistikore na lejoni të themi vetëm se kjo pabarazi është e kënaqur me njëfarë probabiliteti.

Përkufizimi 18.1.Besueshmëria (probabiliteti i besimit) vlerësimi Θ* i parametrit Θ është probabiliteti γ që pabarazia të plotësohet | Θ* - Θ |
fq (Θ* - δ
Kështu, γ është probabiliteti që Θ bie në intervalin (Θ* - δ, Θ* + δ).

Përkufizimi 18.2.I besuar quhet intervali në të cilin bie parametër i panjohur me një besueshmëri të dhënë γ.
Ndërtimi i intervaleve të besimit.
1. Intervali i besimit për vlerësimin e pritshmërisë matematikore të një shpërndarjeje normale me një variancë të njohur.

Lëreni variablin e rastësishëm në studim X shpërndahet sipas ligjit normal me një katror mesatar të njohur σ, dhe kërkohet të vlerësohet pritshmëria e tij matematikore bazuar në vlerën e mesatares së mostrës A. Ne do ta konsiderojmë mesataren e mostrës si një ndryshore të rastësishme dhe vlerat janë opsioni i mostrës X 1 , X 2 ,…, X P si variabla të rastësishme të pavarura të shpërndara në mënyrë identike X 1 , X 2 ,…, X P, secila prej të cilave ka një pritje matematikore A dhe devijimi standard σ. Ku M() = A,
(përdorim vetitë e pritjes matematikore dhe dispersionit të shumës së ndryshoreve të pavarura të rastit). Le të vlerësojmë probabilitetin e pabarazisë
. Le të zbatojmë formulën për probabilitetin që një ndryshore e rastësishme e shpërndarë normalisht të bjerë në një interval të caktuar:

R (
) = 2F
. Më pas, duke marrë parasysh faktin se, R() = 2F
=

2F( t), Ku
. Nga këtu
, dhe barazia e mëparshme mund të rishkruhet si më poshtë:

. (18.1)

Pra, vlera e pritjes matematikore A me probabilitet (besueshmëri) γ bie në interval
, ku vlera t përcaktohet nga tabelat për funksionin Laplace në mënyrë që barazia 2Ф( t) = γ.
Shembull. Le të gjejmë intervalin e besimit për pritshmërinë matematikore të një ndryshoreje të rastësishme të shpërndarë normalisht nëse madhësia e kampionit P = 49,
σ = 1,4, dhe probabiliteti i besimit γ = 0,9.

Le të përcaktojmë t, në të cilën Ф( t) = 0,9:2 = 0,45: t= 1.645. Pastaj

, ose 2,471 a a me një besueshmëri prej 0,9.
2. Intervali i besimit për vlerësimin e pritshmërisë matematikore të një shpërndarjeje normale me variancë të panjohur.

Nëse dihet se ndryshorja e rastësishme në studim X shpërndahet sipas ligjit normal me një devijim standard të panjohur, pastaj për të kërkuar intervali i besimit për pritshmërinë e tij matematikore, ne ndërtojmë një ndryshore të re të rastësishme

, (18.2)

Ku - mesatarja e mostrës, s- varianca e korrigjuar, P- Madhësia e mostrës. Kjo ndryshore e rastësishme, vlerat e mundshme të së cilës do të shënohen me t, ka një shpërndarje Studenti (shih Leksionin 12) me k = n– 1 shkallë lirie.

Që nga dendësia e shpërndarjes Student
, Ku
, nuk varet shprehimisht nga A dhe σ, ju mund të vendosni probabilitetin që ai të bjerë në një interval të caktuar (- t γ , t γ ), duke marrë parasysh barazinë e densitetit të shpërndarjes, si më poshtë:
. Nga këtu marrim:

(18.3)

Kështu, u mor një interval besimi për A, Ku t γ mund të gjenden nga tabela përkatëse për të dhënë P dhe γ.

Shembull. Lëreni madhësinë e mostrës P = 25, = 3, s= 1.5. Le të gjejmë intervalin e besimit për A në γ = 0,99. Nga tabela gjejmë se t γ (P= 25, γ = 0,99) = 2,797. Pastaj
, ose 2,161a a me një probabilitet prej 0,99.
3. Intervalet e besimit për vlerësimin e devijimit standard të një shpërndarjeje normale.

Ne do të kërkojmë një interval besimi të formularit ( s – δ, s), Ku sështë devijimi standard i mostrës së korrigjuar dhe për δ plotësohet kushti i mëposhtëm: fq (|σ – s|
Le ta shkruajmë këtë pabarazi në formën:
ose, duke caktuar
,

Le të shqyrtojmë variablin e rastësishëm χ, të përcaktuar nga formula

,

e cila shpërndahet sipas ligjit chi-katror me P-1 shkallë lirie (shih leksionin 12). Dendësia e shpërndarjes së tij

nuk varet nga parametri i vlerësuar σ, por varet vetëm nga madhësia e kampionit P. Le të transformojmë pabarazinë (18.4) në mënyrë që të marrë formën χ 1 Le të supozojmë se q

,

ose, pas shumëzimit me
,
. Prandaj,
. Pastaj
Ka tabela për shpërndarjen chi-square nga të cilat mund të gjeni q sipas dhënë P dhe γ pa zgjidhur këtë ekuacion. Kështu, duke llogaritur vlerën nga mostra s dhe përcaktimi i vlerës nga tabela q, mund të gjeni intervalin e besimit (18.4), në të cilin vlera σ bie me një probabilitet të dhënë γ.
Koment. Nëse q> 1, atëherë, duke marrë parasysh kushtin σ > 0, intervali i besimit për σ do të ketë kufij

. (18.5)

Le P = 20, s= 1.3. Le të gjejmë intervalin e besueshmërisë për σ për një besueshmëri të caktuar γ = 0,95. Nga tabela përkatëse gjejmë q (n= 20, γ = 0,95) = 0,37. Prandaj, kufijtë e intervalit të besimit janë: 1,3(1-0,37) = 0,819 dhe 1,3 (1+0,37) = 1,781. Pra, 0.819

Nëse dukuria e stabilitetit mesatare ndodh në realitet, pastaj në modeli matematik, me ndihmën e së cilës studiojmë dukuritë e rastësishme, duhet të ekzistojë një teoremë që pasqyron këtë fakt.
Në kushtet e kësaj teoreme, ne vendosim kufizime në variablat e rastësishëm X 1 , X 2 , …, Xn:

a) çdo ndryshore e rastësishme Xi ka një pritshmëri matematikore

M(Xi) = a;

b) varianca e çdo ndryshoreje të rastësishme është e fundme ose, mund të themi se variancat kufizohen nga lart me të njëjtin numër, p.sh. ME, d.m.th.

D(Xi) < C, i = 1, 2, …, n;

c) variablat e rastësishëm janë të pavarura në çift, pra çdo dy X i Dhe Xji¹ j i pavarur.

Pastaj padyshim

D(X 1 + X 2 + … + Xn)=D(X 1) +D(X 2) + ... + D(Xn).

Le të formulojmë ligjin e numrave të mëdhenj në formën Chebyshev.

Teorema e Chebyshev: me rritje të pakufizuar në numër n teste të pavarura " mesatarja aritmetike e vlerave të vëzhguara të një ndryshoreje të rastësishme konvergjon në probabilitet me pritshmërinë e saj matematikore “, pra për çdo pozitiv ε

R(| a| < ε ) = 1. (4.1.1)

Kuptimi i shprehjes "mesatarja aritmetike = konvergon sipas probabilitetit në një" është se probabiliteti që do të ndryshojnë sa më pak nga a, i afrohet 1 pa kufi ndërsa numri rritet n.

Dëshmi. Për numër i kufizuar n teste të pavarura, ne aplikojmë pabarazinë e Chebyshev për ndryshoren e rastësishme = :

R(|– M()| < ε ) ≥ 1 – . (4.1.2)

Duke marrë parasysh kufizimet a – b, ne llogarisim M( ) Dhe D( ):

M( ) = = = = = = A;

D( ) = = = = = = .

Zëvendësimi M( ) Dhe D( ) në pabarazi (4.1.2), marrim

R(| a| < ε )≥1 .

Nëse në pabarazi (4.1.2) marrim në mënyrë arbitrare të vogla ε >0i n® ¥, atëherë marrim

= 1,

që vërteton teoremën e Chebyshev.

Nga teorema e shqyrtuar rrjedh një e rëndësishme përfundim praktik: kemi të drejtë të zëvendësojmë vlerën e panjohur të pritshmërisë matematikore të një ndryshoreje të rastësishme me mesataren vlera aritmetike, të marra nga një numër mjaft i madh eksperimentesh. Për më tepër, sa më shumë eksperimente të ketë për të llogaritur, aq më shumë më shumë gjasa(besueshmëria) mund të presim që gabimi i lidhur me këtë zëvendësim ( - A) nuk do të kalojë vlerën e specifikuar ε .

Përveç kësaj, ju mund të zgjidhni të tjera probleme praktike. Për shembull, sipas vlerave të probabilitetit (besueshmërisë). R=R(| a|< ε ) dhe gabimi maksimal i lejuar ε përcaktoni numrin e kërkuar të eksperimenteve n; Nga R Dhe P përcaktojnë ε; Nga ε Dhe P përcaktoni kufirin e probabilitetit të një ngjarjeje | a |< ε.

Rast special. Lëreni në n testet e vëzhguara n vlerat e ndryshoreve të rastësishme X, duke pasur një pritshmëri matematikore M(X) dhe variancë D(X). Vlerat e marra mund të konsiderohen si variabla të rastit X 1 ,X 2 ,X 3 , ... ,Xn,. Kjo duhet kuptuar si më poshtë: një seri e P testet kryhen në mënyrë të përsëritur, kështu që si rezultat i-testi i= l, 2, 3, ..., P, në çdo seri testesh do të shfaqet një ose një vlerë tjetër e një ndryshoreje të rastësishme X, nuk dihet paraprakisht. Prandaj, i-e vlerë x i ndryshore e rastësishme e marrë në i-Testi, ndryshon në mënyrë të rastësishme nëse kaloni nga një seri testesh në tjetrën. Pra çdo vlerë x i mund të konsiderohet si një ndryshore e rastësishme Xi.


Le të supozojmë se testet plotësojnë kërkesat e mëposhtme:

1. Testet janë të pavarura. Kjo do të thotë se rezultatet X 1 , X 2 ,
X 3 , ..., Xn teste – variabla të rastësishme të pavarura.

2. Testet kryhen në të njëjtat kushte - kjo do të thotë, nga pikëpamja e teorisë së probabilitetit, se secili nga variablat e rastësishëm X 1 ,X 2 ,X 3 , ... ,Xn ka të njëjtin ligj të shpërndarjes me vlerën origjinale X, Kjo është arsyeja pse M(X i) = M(X) Dhe D(X i) = D(X), i = 1, 2, .... P.

Duke marrë parasysh kushtet e mësipërme, marrim

R(| a| < ε )≥1 . (4.1.3)

Shembulli 4.1.1. Xështë e barabartë me 4. Sa eksperimente të pavarura kërkohen në mënyrë që me një probabilitet prej të paktën 0,9 mund të pritet që vlera mesatare aritmetike e kësaj ndryshoreje të rastësishme të ndryshojë nga pritshmëria matematikore me më pak se 0,5?

Zgjidhje.Sipas kushteve të problemit ε = 0,5; R(| a|< 0,5) 0.9. Zbatimi i formulës (4.1.3) për variablin e rastësishëm X, marrim

P(|– M(X)| < ε ) ≥ 1 .

Nga marrëdhënia

1 = 0,9

le të përcaktojmë

P= = = 160.

Përgjigju: Kërkohen 160 eksperimente të pavarura.

Nëse supozojmë se mesatarja aritmetike shpërndahet normalisht, marrim:

R(| a|< ε )= 2Φ () 0,9.

Nga ku, duke përdorur tabelën e funksionit Laplace, marrim
1,645, ose ≥ 6,58, d.m.th. n ≥49.

Shembull 4.1.2. Varianca e një ndryshoreje të rastësishme X barazohet me D( X) = 5. Janë kryer 100 eksperimente të pavarura nga të cilat është llogaritur . Në vend të vlerës së panjohur të pritjes matematikore A pranuar . Përcaktoni vlerën maksimale të gabimit të lejuar me një probabilitet prej të paktën 0.8.

Zgjidhje. Sipas kushteve të problemit n= 100, R(| a|< ε ) ≥0.8. Le të zbatojmë formulën (4.1.3)

R(| a|< ε ) ≥1 .

Nga marrëdhënia

1 = 0,8

le të përcaktojmë ε :

ε 2 = = = 0,25.

Prandaj, ε = 0,5.

Përgjigju: vlera maksimale e gabimit ε = 0,5.

4.2. Ligji i numrave të mëdhenj në formën e Bernulit

Megjithëse baza e të gjitha konkluzioneve statistikore është koncepti i probabilitetit, ka vetëm disa raste në të cilat ne mund të përcaktojmë drejtpërdrejt probabilitetin e një ngjarjeje. Ndonjëherë kjo probabilitet mund të përcaktohet bazuar në konsideratat e simetrisë, mundësive të barabarta, etj., por nuk ka asnjë metodë universale që do të lejonte dikë që të tregojë probabilitetin e saj për një ngjarje arbitrare. Teorema e Bernulit bën të mundur përafrimin e probabilitetit nëse për ngjarjen me interes për ne A mund të kryhen teste të pavarura të përsëritura. Le të prodhohet P prova të pavarura, në secilën prej të cilave probabiliteti i ndodhjes së ndonjë ngjarjeje Aështë konstante dhe e barabartë R.

Teorema e Bernulit. Me një rritje të pakufizuar të numrit të testeve të pavarura P frekuenca relative e shfaqjes së një ngjarjeje A konvergon në probabilitet në probabilitet fq ndodhja e një ngjarjeje A,T. e.

P(½ - fq½≤ ε) = 1, (4.2.1)

Ku ε – një numër pozitiv arbitrarisht i vogël.

Për finalen n me kusht që , pabarazia Chebyshev për një ndryshore të rastësishme do të ketë formën:

P(| – p|< ε ) 1 .(4.2.2)

Dëshmi. Le të zbatojmë teoremën e Chebyshev. Le X i– numri i dukurive të ngjarjes A V i- testi i i= 1, 2, . . . , n. Secila nga sasitë X i mund të marrë vetëm dy vlera:

X i= 1 (ngjarje A ka ndodhur) me probabilitet fq,

X i= 0 (ngjarje A nuk ka ndodhur) me probabilitet q= 1– fq.

Le Y n= . Shuma X 1 + X 2 + … + Xn e barabartë me numrin m dukuritë e ngjarjes A V n teste (0 m n), që do të thotë Y n= – frekuenca relative e ndodhjes së ngjarjes A V n testet. Pritshmëria dhe varianca X i janë përkatësisht të barabarta:

M( ) = 1∙fq + 0∙q = fq,

"Ligji i numrave të mëdhenj" në teorinë e probabilitetit kuptohet si një seri teoremash matematikore, secila prej të cilave, për kushte të caktuara, përcakton faktin se karakteristikat mesatare të një numri të madh eksperimentesh i afrohen konstanteve të caktuara.

Ai bazohet në pabarazinë e Chebyshev:

Probabiliteti që devijimi i një variabli të rastësishëm X nga pritshmëria e tij matematikore në vlerë absolute është më i vogël se një numër pozitiv ε nuk është më i vogël se:

E vlefshme për r.v diskrete dhe të vazhdueshme.

53. Teorema e Chebyshev.

Le të ketë një sekuencë të pafundme variablash të rastësishëm të pavarur me të njëjtat pritshmëri matematikore dhe varianca të kufizuara nga e njëjta konstante C:

Atëherë, cilido qoftë numri pozitiv, probabiliteti i ngjarjes priret në një.

54. Teorema e Bernulit.

Le të kryhen n prova të pavarura, në secilën prej të cilave probabiliteti i ndodhjes së ngjarjes A është i barabartë me p.

55. Koncepti i teoremës së kufirit qendror të Lyapunov.

Shpërndarja e shumës së një numri të madh të ndryshoreve të rastësishme të pavarura në kushte shumë të përgjithshme është afër shpërndarjes normale.

Dihet se variablat e rastësishëm të shpërndarë normalisht janë të shpërndara gjerësisht në praktikë. Shpjegimi për këtë u dha nga A.M Lyapunov në teoremën e kufirit qendror: nëse një ndryshore e rastësishme është shuma e një numri shumë të madh të ndryshoreve të rastit reciprokisht të pavarura, ndikimi i secilës prej të cilave në të gjithë shumën është i papërfillshëm. shpërndarja afër normales.

56. Popullata e përgjithshme dhe kampioni: përkufizimet dhe konceptet bazë.

Statistikat matematikore janë një shkencë që merret me zhvillimin e metodave për marrjen, përshkrimin dhe përpunimin e të dhënave eksperimentale me qëllim të studimit të modeleve të dukurive masive të rastësishme.

Problemet e statistikave matematikore:

    Vlerësimi i një funksioni të panjohur të shpërndarjes bazuar në rezultatet e matjes.

    Vlerësimi i parametrave të panjohur të shpërndarjes.

    Testimi i hipotezave statike.

Le të studiojmë disa karakteristikë sasiore x.

Atëherë tërësia kuptohet si tërësia e të gjitha vlerave të saj të mundshme.

Për të studiuar vetitë e një karakteristike të caktuar, një pjesë e elementeve zgjidhet rastësisht nga popullata e përgjithshme nga variantet Xi, të cilat formojnë një popullatë ose kampion kampion.

Numri i elementeve të një koleksioni quhet objekti i tij n.

Marrja e mostrave: 1) kampionimi i përsëritur, në të cilin objekti i përzgjedhur (para se të zgjidhni atë të radhës) i kthehet popullatës së përgjithshme.

2) kampionim jo-përsëritës, në të cilin objekti i përzgjedhur i kthehet popullatës së përgjithshme.

Për të përdorur të dhënat e kampionit për të gjykuar me besim të mjaftueshëm për karakteristikat e popullatës së përgjithshme që na interesojnë, është e nevojshme që kampioni të jetë përfaqësues)

Në bazë të ligjit të numrave të mëdhenj, mund të argumentohet se një kampion do të jetë përfaqësues nëse kryhet në mënyrë të rastësishme: çdo objekt në popullatë duhet të ketë të njëjtën probabilitet për t'u përfshirë në kampion.

Nëse objekti i popullsisë është mjaft i madh, dhe kampioni përbën vetëm një pjesë të vogël të kësaj popullate, atëherë dallimi midis mostrave të përsëritura dhe jo-përsëritëse fshihet.

Një listë opsionesh të renditura në rend rritës quhet një seri variacionesh.

Numri i vëzhgimeve të një opsioni të caktuar quhet frekuenca e tij ni, dhe raporti i frekuencës ni me objektin e mostrës quhet n-frekuencë relative wi.

Është krejt e natyrshme që të duhet të sqarohet në mënyrë sasiore pohimi se në seritë "të mëdha" të testeve frekuencat e ndodhjes së një ngjarjeje janë "afër" probabilitetit të saj. Delikatesa e caktuar e kësaj detyre duhet të kuptohet qartë. Në rastet më tipike për teorinë e probabilitetit, situata është që në një seri arbitrare të gjatë testesh, të dyja vlerat ekstreme të frekuencës mbeten teorikisht të mundshme.

\frac(\mu)(n)=\frac(n)(n)=1 Dhe \frac(\mu)(n)=\frac(0)(n)=0

Prandaj, cilido qoftë numri i testeve n, nuk mund të thuhet me siguri të plotë se, të themi, pabarazia do të plotësohet

<\frac{1}{10}

Për shembull, nëse ngjarja A është se një gjashtë hidhet kur hedh një kërpudhë, atëherë me n hedh me probabilitet (\majtas(\frac(1)(6)\djathtas)\^n>0 !} do të marrim gjithmonë vetëm gjashtëshe, pra me probabilitet (\majtas(\frac(1)(6)\djathtas)\^n !} marrim frekuencën e shfaqjes së gjashtëshe të barabartë me një, dhe me probabilitet (\majtas(1-\frac(1)(6)\djathtas)\^n>0 !} një gjashtë nuk shfaqet as edhe një herë, pra frekuenca e shfaqjes së gjashtëshe do të jetë e barabartë me zero.

Në të gjitha problemet e tilla, çdo vlerësim jo i parëndësishëm i afërsisë midis frekuencës dhe probabilitetit nuk funksionon me besueshmëri të plotë, por vetëm me një probabilitet më të vogël se një. Mund të vërtetohet, për shembull, se në rastin e provave të pavarura me një probabilitet konstant p të ndodhjes së një ngjarjeje, pabarazia

\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02

për frekuencën \frac(\mu)(n) do të përmbushet në n=10\,000 (dhe çdo p) me probabilitet

P>0,\!9999.

Këtu para së gjithash duam të theksojmë se në formulimin e mësipërm, vlerësimi sasior i afërsisë së frekuencës \frac(\mu)(n) me probabilitetin p shoqërohet me futjen e një probabiliteti të ri P.

Kuptimi i vërtetë i vlerësimit (8) është ky: nëse kryejmë N seri të n testeve dhe numërojmë numrin M të serive në të cilat plotësohet pabarazia (7), atëherë për një N mjaftueshëm të madh do të jetë afërsisht

\frac(M)(N)\afërsisht P>0,\!9999.

Por nëse duam të sqarojmë relacionin (9) si në lidhje me shkallën e afërsisë \frac(M)(N) me probabilitetin P, ashtu edhe në lidhje me besueshmërinë me të cilën mund të pohojmë se një afërsi e tillë do të ndodhë, atëherë ne do të duhet t'i drejtohemi konsideratave të ngjashme me ato që kemi kryer tashmë në zbatimin e afërsisë së \frac(\mu)(n) dhe p . Nëse dëshironi, një arsyetim i tillë mund të përsëritet një numër të pakufizuar herë, por është mjaft e qartë se kjo nuk do të na lejojë të çlirohemi plotësisht nga nevoja për fazën e fundit referojuni probabiliteteve në kuptimin primitiv dhe të përafërt të këtij termi.

Nuk duhet menduar se vështirësitë e këtij lloji janë një lloj veçorie e teorisë së probabilitetit. Kur studion matematikën fenomene reale ne i skematizojmë gjithmonë. Devijimet në rrjedhën e dukurive aktuale nga skema teorike nga ana tjetër mund t'i nënshtrohet studimit matematikor. Por për këtë, vetë këto devijime duhet të futen në një skemë dhe kjo e fundit të përdoret pa formale analiza matematikore devijimet prej saj.

Megjithatë, vini re se në zbatimin real të vlerësimit

P\!\majtas\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}>0,\!9999.


për një seri të vetme testesh n, ne mbështetemi gjithashtu në disa konsiderata të simetrisë: pabarazia (10) tregon se me një numër shumë të madh N të serive, relacioni (7) do të plotësohet në jo më pak se 99,99% të rasteve; Është e natyrshme të presim me shumë besim se, në veçanti, pabarazia (7) do të realizohet në serinë specifike të n testeve që na interesojnë, nëse kemi arsye të besojmë se kjo seri zë një pozicion të zakonshëm midis serive të tjera, të pa shënuara. nga çdo gjë e veçantë.

Probabilitetet që zakonisht neglizhohen në situata të ndryshme praktike janë të ndryshme. U vu re tashmë më lart se kur bëjnë llogaritjet e përafërta të konsumit të predhës që garanton përfundimin e detyrës së caktuar, ata janë të kënaqur me shkallën e konsumit të predhës në të cilën detyra e caktuar zgjidhet me një probabilitet prej 0,95, d.m.th., ata neglizhojnë probabilitetet që nuk mbi 0.05. Kjo shpjegohet me faktin se kalimi në llogaritjet bazuar në neglizhimin, të themi, vetëm probabilitete më të vogla se 0.01, do të çonte në një rritje të madhe të normave të konsumit të predhave, d.m.th., në pothuajse shumë raste, në përfundimin se është e pamundur të kryhet Detyra në një periudhë kaq të shkurtër kohore që është në dispozicion për këtë, ose me furnizimin e predhave që mund të përdoren në të vërtetë.

Ndonjëherë në kërkimin shkencor ato kufizohen në teknikat statistikore të llogaritura në bazë të probabiliteteve të neglizhimit prej 0.05. Por kjo duhet bërë vetëm në rastet kur mbledhja e materialit më të gjerë është shumë e vështirë. Konsideroni problemin e mëposhtëm si një shembull të teknikave të tilla. Le të supozojmë se, në kushte të caktuara, një ilaç që përdoret për të trajtuar një sëmundje jep rezultat pozitiv në 50%, pra me një probabilitet prej 0.5. Propozohet një medikament i ri dhe, për të provuar epërsinë e tij ndaj të vjetrit, është planifikuar të përdoret në dhjetë raste, të përzgjedhura në mënyrë të paanshme nga pacientët në të njëjtën situatë si ata për të cilët është vërtetuar efektiviteti i ilaçit të vjetër. në 50%. Është vërtetuar se avantazhi i një ilaçi të ri do të konsiderohet i provuar nëse jep një rezultat pozitiv në të paktën tetë raste nga dhjetë. Është e lehtë të llogaritet se një vendim i tillë shoqërohet me neglizhencën e probabilitetit të marrjes së një përfundimi të gabuar (d.m.th., përfundimi se përfitimet e një ilaçi të ri janë të provuara, ndërkohë që është ekuivalent ose edhe më keq se ai i vjetër). 0.05. Në fakt, nëse në secilën prej dhjetë provave probabiliteti i një rezultati pozitiv është i barabartë me p, atëherë probabilitetet për të marrë 10.9 ose 8 rezultate pozitive në dhjetë prova janë përkatësisht të barabarta.

P_(10)=p^(10),\qquad P_9=10p^9(1-p),\qquad P_8=45p^8(1-p)^2.

Si përmbledhje, për rastin p=\frac(1)(2) marrim P=P_(10)+P_9+P_8=\frac(56)(1024)\afërsisht 0,\!05.

Kështu, duke supozuar se ilaçi i ri është në fakt saktësisht i barabartë me atë të vjetër, rrezikojmë të konkludojmë gabimisht se ilaçi i ri është superior ndaj atij të vjetër me një probabilitet prej rreth 0.05. Për të reduktuar këtë probabilitet në afërsisht 0.01, pa rritur numrin e provave n = 10, do të ishte e nevojshme të përcaktohet se avantazhi i një ilaçi të ri do të konsiderohet i provuar vetëm kur përdorimi i tij jep një rezultat pozitiv në të paktën nëntë raste nga dhjetë. Nëse kjo kërkesë duket shumë e ashpër për mbështetësit e ilaçit të ri, atëherë numri i testeve n do të duhet të caktohet dukshëm më i madh se 10. Nëse, për shembull, me n = 100 vërtetohet se përfitimet e ilaçit të ri do të të konsiderohet i provuar në \mu>65, atëherë probabiliteti i gabimit do të jetë vetëm P\approx0,\!0015 .

Nëse norma është 0.05 për serioze kërkimin shkencorështë qartësisht e pamjaftueshme, atëherë probabiliteti i një gabimi prej 0.001 ose 0.003 përgjithësisht neglizhohet edhe në një hulumtim të tillë akademik dhe të plotë si përpunimi i vëzhgimeve astronomike. Sidoqoftë, ndonjëherë konkluzionet shkencore të bazuara në zbatimin e ligjeve probabiliste kanë gjithashtu besueshmëri dukshëm më të madhe (d.m.th., ato bazohen në neglizhimin e probabiliteteve dukshëm më të ulëta). Kjo do të diskutohet më tej më poshtë.

Në shembujt e shqyrtuar, ne kemi përdorur në mënyrë të përsëritur raste të veçanta të formulës binomiale (6)

P_m=C_n^mp^m(1-p)^(n-m)

për probabilitetin P_m për të marrë saktësisht m rezultate pozitive për n teste të pavarura, në secilën prej të cilave një rezultat pozitiv ka probabilitet p. Duke përdorur këtë formulë, le të shqyrtojmë pyetjen e parashtruar në fillim të këtij seksioni në lidhje me probabilitetin

<\varepsilon\right\},

ku \mu është numri aktual i rezultateve pozitive. Natyrisht, kjo probabilitet mund të shkruhet si shuma e atyre P_m për të cilat m plotëson pabarazinë

\vline\,\frac(m)(n)-p\,\vline\,<\varepsilon,


pra në formë

P=\shuma_(m=m_1)^(m_2)P_m,

ku m_1 është më e vogla nga vlerat e pabarazisë m të kënaqshme (12), dhe m_2 është më e madhja e m të tillë.

Formula (13) për çdo n të madh ka pak përdorim për llogaritjet e drejtpërdrejta. Prandaj, zbulimi nga Moivre për rastin p=\frac(1)(2) dhe nga Laplace për çdo p të një formule asimptotike ishte shumë i rëndësishëm, gjë që e bën shumë të lehtë gjetjen dhe studimin e sjelljes së probabiliteteve P_m për të mëdha n. Kjo formulë duket si

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\exp\!\majtas[-\frac((m-np)^2)(2np(1-p)) \djathtas].

Nëse p nuk është shumë afër zeros ose një, atëherë është mjaft e saktë tashmë për n të rendit 100. Nëse vendosim

T=\frac(m-np)(\sqrt(np(1-p))),

Atëherë formula (14) do të marrë formën

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\,e^(-t^2/2).


Nga (13) dhe (16) mund të nxjerrim një paraqitje të përafërt të probabilitetit (11)

P\sim\frac(1)(\sqrt(2\pi))\int\limits_(-T)^(T)e^(-t^2/2)\,dt=F(T),


Ku

T=\varepsilon\sqrt(\frac(n)(p(1-p)))

Diferenca midis anëve të majta dhe të djathta në (17), me p konstante dhe të ndryshme nga zero dhe uniteti, priret në zero si n\në\infty në mënyrë uniforme në raport me \varepsilon. Tabelat e detajuara janë përpiluar për funksionin F(T). Ja një fragment i shkurtër prej tyre

\fillimi(grupi)(c|c|c|c|c)T&1&2&3&4\\\hlinja F&0,\!68269&0,\!95450&0,\!99730&0,\!99993\fundi (vargu)


Në T\to\infty vlera e funksionit F(T) tenton në unitet.

Le të përdorim formulën (17) për të vlerësuar probabilitetin

P=\mathbf(P)\!\majtas\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}\approx F\!\left(\frac{2}{\sqrt{p(1-p)}}\right) në n=10\,000,~\varepsilon=0,\!02, sepse T=\frac(2)(\sqrt(p(1-p))).

Meqenëse funksioni F(T) rritet monotonisht me rritjen e T, atëherë për një vlerësim më të ulët të P që nuk varet nga p, duhet të marrim vlerën më të vogël të mundshme (për p të ndryshme) të T. Kjo vlerë më e vogël do të merret në p=\frac(1)(2) dhe do të jetë e barabartë me 4. Prandaj, përafërsisht

P\geqslant F(4)=0,\!99993.

Pabarazia (19) nuk merr parasysh gabimin që ndodh për shkak të natyrës së përafërt të formulës (17). Duke vlerësuar gabimin që lidhet me këtë rrethanë, në çdo rast mund të konstatojmë se P>0.\!9999.

Në lidhje me shembullin e konsideruar të aplikimit të formulës (17), duhet të theksohet se vlerësimet e termit të mbetur të formulës (17), të dhëna në punimet teorike mbi teorinë e probabilitetit, mbetën të pakënaqshme për një kohë të gjatë. Prandaj, aplikimi i formulës (17) dhe të ngjashme me llogaritjet për n jo shumë të mëdha ose për probabilitete p shumë afër 0 ose 1 (dhe probabilitete të tilla në shumë raste janë veçanërisht të rëndësishme) shpesh bazoheshin vetëm në përvojën e kontrollit të tillë. rezulton për një numër të kufizuar shembujsh, dhe jo në vlerësime të besueshme të gabimeve të mundshme. Një studim më i detajuar, gjithashtu, tregoi se në shumë raste praktikisht të rëndësishme, formulat asimptotike të mësipërme kanë nevojë jo vetëm për një vlerësim të termit të mbetur, por edhe për sqarim (pasi pa një sqarim të tillë termi i mbetur është shumë i madh). Në të dy drejtimet, rezultatet më të plota i përkasin S. N. Bernstein.

Marrëdhëniet (11), (17) dhe (18) mund të rishkruhen si

\mathbf(P)\!\majtas\(\,\vline\,\frac(\mu)(n)-p\,\vline\,

Për t mjaftueshëm të mëdha, ana e djathtë e formulës (20), e cila nuk përmban n, është arbitrarisht afër unitetit, d.m.th., me vlerën e probabilitetit që korrespondon me besueshmërinë e plotë. Ne shohim, pra, se, Si rregull, devijimet e frekuencës \frac(\mu)(n) nga probabiliteti p janë të rendit \frac(1)(\sqrt(n)). Ky përpjestim i saktësisë së veprimit të ligjeve probabiliste me rrënjën katrore të numrit të vëzhgimeve është tipik për shumë çështje të tjera. Ndonjëherë ata madje flasin, si një popullarizimi disi i thjeshtuar, për "ligjin e rrënjës katrore të n" si ligjin themelor të teorisë së probabilitetit. Kjo ide u qartësua plotësisht falë futjes nga matematikani i madh rus P. L. Chebyshev në përdorimin sistematik të metodës së reduktimit të problemeve të ndryshme probabilistike në llogaritjet e "pritshmërive matematikore" dhe "variancave" për shumat dhe mesataret aritmetike të "ndryshoreve të rastësishme".

Ndryshore e rastësishmeështë një sasi që, në kushte të dhëna S, mund të marrë vlera të ndryshme me probabilitete të caktuara. Për ne mjafton të konsiderojmë variabla të rastësishëm që mund të marrin vetëm një numër të kufizuar vlerash të ndryshme. Për të treguar, siç thonë ata, shpërndarja e probabilitetit të këtij lloji të ndryshores së rastësishme \xi, mjafton të tregohen vlerat e mundshme të saj x_1,x_2,\ldots,x_r dhe probabilitetet

P_r=\mathbf(P)\(\xi=x_r\).


Si përmbledhje, këto probabilitete për të gjitha vlerat e ndryshme të mundshme të sasisë \xi janë gjithmonë të barabarta me një:

\shuma_(r=1)^(s)P_r=1.

Një shembull i një ndryshoreje të rastësishme është numri \mu i rezultateve pozitive të studiuara më sipër në n prova.

Pritshmëria matematikore sasia \xi quhet shprehje

M(\xi)=\sum_(r=1)^(s)P_rx_r,


A dispersion madhësitë \xi quhen pritshmëri matematikore e devijimit në katror \xi-M(\xi), pra shprehja

D(\xi)=\sum_(r=1)^(s)P_r(x_r-M(\xi))^2.


Rrënja katrore e variancës

\sigma_(\xi)=\sqrt(D(\xi))=\sqrt(\sum_(r=1)^(s)P_r(x_r-M(\xi))^2)


thirrur devijimi standard(vlerat nga pritshmëria e tij matematikore M(\xi) ).

Aplikimet më të thjeshta të variancave dhe devijimeve standarde bazohen në të famshmet pabarazia e Chebyshev

\mathbf(P)\(|\xi-M(\xi)|\leqslant t_(\sigma_(\xi))\)\geqslant1-\frac(1)(t^2),

Ai tregon se devijimet e një ndryshoreje të rastësishme \xi nga pritshmëria e saj matematikore M(\xi) që tejkalojnë dukshëm devijimin standard \sigma_(\xi) janë të rralla.

Gjatë formimit të shumave të ndryshoreve të rastit \xi=\xi^((1))+ \xi^((2))+\cdots+\xi^((n)) pritjet e tyre matematikore kanë gjithmonë të barabarta

M(\xi)=M(\xi^((1)))+M(\xi^((2)))+\cdots+M(\xi^((n))).


Një barazi e ngjashme për variancat

D(\xi)=D(\xi^((1)))+D(\xi^((2)))+\cdots+D(\xi^((n))).

e vërtetë vetëm nën kufizime të caktuara. Që barazia (23) të jetë e vlefshme, mjafton, për shembull, që sasitë \xi^((i)) dhe \xi^(j)) me numra të ndryshëm nuk janë, siç thonë ata, "të ndërlidhura" me njëri-tjetrin, d.m.th., që kur i\ne j barazia vlen

M\Bigl\((\xi^(i))-M(\xi^((i))))(\xi^((j))-M(\xi^((j))))\ Bigl\)=0

Koeficienti i korrelacionit midis variablave të rastësishëm \xi^((i)) dhe \xi^(j)) është shprehja

R=\frac(M\Bigl\(\Bigl(\xi^((i))-M(\xi^((i)))\Bigl)\Bigl(\xi^((j))-M( \xi^((j)))\Bigl)\Bigl\))(\sigma_(\xi^((i)))\,\sigma_(\xi^((j)))).

Nëse \sigma_(\xi^((i)))>0 V \sigma_(\xi^((j)))>0, atëherë kushti (24) është ekuivalent me faktin se R=0.

Koeficienti i korrelacionit R karakterizon shkallën e varësisë ndërmjet variablave të rastit. Gjithmonë |R|\leqslant1, dhe R=\pm1 vetëm nëse ka një lidhje lineare

\eta=a\xi+b\quad(a\ne0).

Për variablat e pavarur R=0.

Në veçanti, barazia (24) plotësohet nëse sasitë \xi^((i)) dhe \xi^((j)) janë të pavarura nga njëra-tjetra. Kështu, për kushte reciprokisht të pavarura, barazia (23) vlen gjithmonë. Për mesataret aritmetike

\zeta=\frac(1)(n)\Bigl(\xi^((1))+\xi^((2))+\cdots+\xi^((n))\Bigl) nga (23) vijon

D(\zeta_=\frac(1)(n^2)\Bigl(D(\xi^((1)))+ D(\xi^((2)))+\cdots+ D(\xi^( (n)))\Bigl).

Le të supozojmë tani se për të gjithë termat variancat nuk e kalojnë një konstante

D(\xi^((i)))\leqslant C^2. Pastaj nga (25) D(\zeta)\leqslant\frac(C^2)(n),


dhe për shkak të pabarazisë së Chebyshev për çdo t

\mathbf(P)\!\left\(|\zeta-M(\zeta)|\leqslant\frac(tC)(\sqrt(n))\right\)\geqslant1-\frac(1)(t^ 2)

Pabarazia (26) përmban të ashtuquajturin ligj të numrave të mëdhenj në formën e vendosur nga Chebyshev: nëse sasitë \xi^((i)) janë reciprokisht të pavarura dhe kanë varianca të kufizuara, atëherë me rritjen n mesataret e tyre aritmetike \zeta janë më pak dhe më pak gjasa për të devijuar dukshëm nga pritshmëritë e tyre matematikore M(\zeta) .

Më saktë thonë se sekuenca e ndryshoreve të rastësishme

\xi^((1)),\,\xi^(2)),\,\ldots\,\xi^(n)),\,\ldots


i bindet ligjit të numrave të mëdhenj nëse për aritmetikën përkatëse do të thotë \zeta dhe për çdo konstante \varepsilon>0

\mathbf(P)\(|\zeta-M(\zeta)|\leqslant \varepsilon\)\to1\quad (n\to\infty).

Për të marrë relacionin kufi (27) nga pabarazia (26), mjafton të vendoset

T=\varepsilon\cdot\frac(\sqrt(n))(C).

Një numër i madh studimesh nga A.A. Markova, S.N. Bernstein, A.Ya. Khinchin dhe të tjerët janë të përkushtuar ndaj çështjes së mundshme zgjerim më të madh kushtet për zbatueshmërinë e relacionit kufi (27), d.m.th., kushtet për zbatueshmërinë e ligjit të numrave të mëdhenj. Këto studime kanë një rëndësi thelbësore. Megjithatë, edhe më i rëndësishëm është një studim i saktë i shpërndarjes së probabilitetit të devijimeve \zeta-M(\zeta) .

Meritë e madhe e rusit shkolla klasike në teorinë e probabilitetit është të vërtetohet fakti se, në kushte shumë të gjera, barazia është asimptotike (d.m.th., me saktësi në rritje për rritjen e pakufizuar të n)

\mathbf(P)\!\majtas\(t_1\sigma_(\zeta)<\zeta-M(\zeta)

Chebyshev dha një provë pothuajse të plotë të kësaj formule për rastin e termave të pavarur dhe të kufizuar. Markov plotësoi hallkën që mungonte në arsyetimin e Chebyshev dhe zgjeroi kushtet për zbatueshmërinë e formulës (28). Kushtet edhe më të përgjithshme u dhanë nga Lyapunov. Çështja e shtrirjes së formulës (28) në shumat e termave të varur u studiua me plotësi të veçantë nga S. N. Bernstein.

Formula (28) mbuloi një numër kaq të madh problemesh të veçanta saqë për një kohë të gjatë u quajt teorema e kufirit qendror të teorisë së probabilitetit. Edhe pse me zhvillimin e fundit të teorisë së probabilitetit, ajo doli të përfshihej në një numër ligjesh më të përgjithshme, rëndësia e saj është e vështirë të mbivlerësohet në ditët e sotme.

Koha.

Nëse termat janë të pavarur dhe variancat e tyre janë të njëjta dhe të barabarta: D(\xi^((i)))=\sigma^2, atëherë është e përshtatshme për të dhënë formulën (28), duke marrë parasysh relacionin (25), formën

\mathbf(P)\!\majtas\(\frac(t_1\sigma)(\sqrt(n))<\zeta-M(\zeta)<\frac{t_2\sigma}{\sqrt{n}}\right\}\sim\frac{1}{\sqrt{2\pi}}\int\limits_{t_1}^{t_2}e^{-t^2/2}\,dt\,.

Le të tregojmë se relacioni (29) përmban një zgjidhje për problemin e devijimeve të frekuencës \frac(\mu)(n) nga probabiliteti p, të cilin e trajtuam më herët. Për ta bërë këtë, ne prezantojmë variablat e rastësishëm \xi^((i)) duke i përcaktuar ato me kushtin e mëposhtëm:

\xi^((i))=0, nëse testi i i-të kishte një rezultat negativ,

\xi^((i))=1 nëse testi i i-të kishte një rezultat pozitiv.

Është e lehtë ta kontrollosh atë atëherë


dhe formula (29) jep

\mathbf(P)\!\majtas\(t_1\sqrt(\frac(p(1-p))(n))<\frac{\mu}{n}-p
e cila për t_1=-t,~t_2=t përsëri çon në formulën (20).
Shihni gjithashtu teoremat e kufirit në teorinë e probabilitetit Javascript është i çaktivizuar në shfletuesin tuaj.
Për të kryer llogaritjet, duhet të aktivizoni kontrollet ActiveX!


Ju pëlqeu artikulli? Ndani me miqtë tuaj!