Ligji i numrave të mëdhenj në formën e Chebyshev. Rëndësia e teoremës së Chebyshev për praktikën

Në fillim të kursit kemi folur tashmë për faktin se ligjet matematikore teoritë e probabilitetit përftohen duke abstraktuar modele reale statistikore të qenësishme në dukuritë e rastësishme masive. Prania e këtyre modeleve lidhet pikërisht me natyrën masive të fenomeneve, pra me një numër të madh eksperimentesh homogjene të kryera ose me një numër të madh ndikimesh kumulative të rastësishme, të cilat në tërësinë e tyre gjenerojnë një variabël të rastësishëm që i nënshtrohet një ligj të mirëpërcaktuar. Vetia e stabilitetit në masë dukuritë e rastësishme i njohur për njerëzimin që nga kohërat e lashta. Cilado qoftë zona që shfaqet, thelbi i saj zbret në sa vijon: veçori specifikeçdo fenomen i rastësishëm individual nuk ka pothuajse asnjë ndikim në rezultatin mesatar të masave dhe fenomeneve të tilla; Devijimet e rastësishme nga mesatarja, të pashmangshme në çdo fenomen individual, anulohen reciprokisht, rrafshohen, rrafshohen në masë. Është ky qëndrueshmëri mesataresh që paraqet përmbajtjen fizike të “ligjit numra të mëdhenj“, kuptohet në kuptimin e gjerë të fjalës: me shumë numer i madh Në rastin e dukurive të rastësishme, rezultati mesatar i tyre praktikisht pushon së qeni i rastësishëm dhe mund të parashikohet me një shkallë të lartë sigurie.

në kuptimin e ngushtë fjala "ligji i numrave të mëdhenj" në teorinë e probabilitetit do të thotë një seri teorema matematikore, në secilën prej të cilave, për kushte të caktuara, vërtetohet fakti që karakteristikat mesatare të një numri të madh eksperimentesh i afrohen konstanteve të caktuara.

Në 2.3 ne kemi formuluar tashmë më të thjeshtën nga këto teorema - teorema e J. Bernoulli. Ajo pretendon se me një numër të madh eksperimentesh, frekuenca e një ngjarjeje i afrohet (më saktë, konvergon në probabilitet) me probabilitetin e kësaj ngjarjeje. Ne do të njihemi me forma të tjera, më të përgjithshme të ligjit të numrave të mëdhenj në këtë kapitull. Të gjithë ata vendosin faktin dhe kushtet e konvergjencës në probabilitetin e caktuar variablat e rastësishëm në sasi konstante, jo të rastësishme.

Ligji i numrave të mëdhenj luan një rol të rëndësishëm në aplikime praktike teoria e probabilitetit. Vetia e variablave të rastësishëm, në kushte të caktuara, të sillen pothuajse si ato jo të rastësishme, lejon që njeriu të veprojë me besim me këto sasi dhe të parashikojë rezultatet e fenomeneve të rastësishme masive me pothuajse siguri të plotë.

Mundësitë e parashikimeve të tilla në fushën e dukurive të rastësishme masive zgjerohen më tej nga prania e një grupi tjetër. teorema kufizuese, që nuk lidhet më me vlerat kufizuese të variablave të rastësishëm, por me ligjet kufizuese të shpërndarjes. Bëhet fjalë për rreth një grupi teoremash të njohura si "teorema e kufirit qendror". Ne kemi thënë tashmë se kur përmbledhim një numër mjaft të madh të ndryshoreve të rastit, ligji i shpërndarjes së shumës i afrohet në mënyrë të pacaktuar normales, duke iu nënshtruar kushteve të caktuara. Këto kushte, të cilat mund të formulohen matematikisht në mënyra të ndryshme - në një formë pak a shumë të përgjithshme - në thelb zbresin në kërkesën që ndikimi në shumën e termave individualë të jetë uniformisht i vogël, domethënë që shuma të mos përfshijë anëtarët që dominojnë qartë tërësinë pjesa tjetër sipas ndikimit të tyre në shpërndarjen e shumës. Format e ndryshme të teoremës së kufirit qendror ndryshojnë nga njëra-tjetra në kushtet për të cilat krijohet kjo veti kufizuese e shumës së ndryshoreve të rastit.

Forma të ndryshme të ligjit të numrave të mëdhenj së bashku me forma të ndryshme Teorema e kufirit qendror formon një grup të ashtuquajturave teorema kufitare të teorisë së probabilitetit. Teoremat kufitare bëjnë të mundur jo vetëm kryerjen e parashikimeve shkencore në fushën e dukurive të rastësishme, por edhe vlerësimin e saktësisë së këtyre parashikimeve.

Në këtë kapitull do të shqyrtojmë vetëm disa nga më forma të thjeshta teorema kufizuese. Së pari, ne do të shqyrtojmë teoremat që lidhen me grupin "ligji i numrave të mëdhenj", pastaj teoremat që lidhen me grupin "teorema e kufirit qendror".

()

Kuptimi i ligjit Chebyshev të numrave të mëdhenj është si më poshtë. Ndërsa një ndryshore individuale e rastësishme mund të marrë vlera shumë larg nga ajo pritje matematikore, mesatarja aritmetike e një numri të madh ndryshoresh të rastësishme me një probabilitet afër unitetit merr një vlerë që ndryshon pak nga mesatarja aritmetike e pritjeve të tyre matematikore.
Një rast i veçantë i ligjit Chebyshev të numrave të mëdhenj. Le - një sekuencë e variablave të rastësishme të pavarura në çift që kanë varianca të kufizuara së bashku, d.m.th. dhe të njëjtat pritshmëri matematikore . Pastaj, çfarëdo që të jetë , relacioni është i vlefshëm

Kjo rrjedh drejtpërdrejt nga formula (), pasi

Komentoni. Ata thonë se një ndryshore e rastësishme konvergon në probabilitet tek numri A, nëse për një probabilitet të vogël arbitrarisht të pabarazisë me rritje n i afrohet unitetit pa kufi. Konvergjenca në probabilitet nuk do të thotë se . Në të vërtetë, në rastin e fundit pabarazia vlen për të gjitha vlerat mjaftueshëm të mëdha n. Në rastin e konvergjencës në probabilitet, kjo pabarazi për vlerat individuale arbitrarisht të mëdha n Ndoshta nuk ekzekutohet. Megjithatë, dështimi për të kënaqur pabarazinë për vlera të mëdha n Ka një ngjarje shumë të rrallë (të pamundur). Duke marrë parasysh këtë, rast i veçantë Ligji i Chebyshev për numrat e mëdhenj mund të formulohet si më poshtë.
Mesatarja aritmetike variabla të rastësishme të pavarura në çift , duke pasur së bashku varianca të kufizuara dhe pritshmëri identike matematikore , konvergjon në probabilitet në a.
Le të shpjegojmë kuptimin e një rasti të veçantë të ligjit të numrave të mëdhenj të Chebyshev. Le të kërkohet për të gjetur kuptimin e vërtetë A disa sasi fizike(për shembull, madhësia e një pjese). Për ta bërë këtë, ne do të bëjmë një sërë matjesh të pavarura nga njëra-tjetra. Çdo matje shoqërohet me ndonjë gabim (). Prandaj, çdo rezultat i mundshëm i matjes është një ndryshore e rastësishme (indeks i- numri i matjes). Le të supozojmë se në çdo matje nuk ka gabim sistematik, d.m.th. devijim nga vlera e vërtetë A të sasisë së matur në të dy drejtimet janë njësoj të mundshme. Në këtë rast, pritshmëritë matematikore të të gjitha variablave të rastit janë të njëjta dhe të barabarta me vlerën e matur A, d.m.th.
Së fundi, le të supozojmë se matjet janë bërë me njëfarë saktësie të garantuar. Kjo do të thotë se për të gjitha matjet. Kështu, ne jemi në kushtet e ligjit të Chebyshev për numrat e mëdhenj, dhe për këtë arsye, nëse numri i matjeve është mjaft i madh, atëherë me siguri praktike mund të themi se sido që të jetë, mesatarja aritmetike e rezultateve të matjes ndryshon nga vlera e vërtetë. A më pak se

Ligji i numrave të mëdhenj është ligji qendror teoria e probabilitetit për faktin se formulon një lidhje themelore midis rregullsisë dhe rastësisë. Gjegjësisht, ai argumenton se një numër i madh i aksidenteve çon në një model, i cili bën të mundur parashikimin e rrjedhës së ngjarjeve. Në shumicën formë e përgjithshme shprehet ai Teorema e Chebyshev:

le ( Χ 1; X2; … X n; ...) ndryshore të pavarura të rastësishme (supozohen të jenë numër i pafund). Dhe le të kufizohen në mënyrë të njëtrajtshme variancat e tyre (d.m.th., variancat e të gjitha këtyre ndryshoreve të rastësishme nuk kalojnë një konstante ME):

Atëherë, sado i vogël të jetë numri pozitiv, relacioni i probabilitetit kufizues plotësohet:

nëse numri i variablave të rastësishëm është mjaft i madh. Ose, që është e njëjta gjë, probabiliteti

Kështu, teorema e Chebyshev thotë se nëse marrim parasysh një numër mjaft të madh n variabla të rastësishme të pavarura ( Χ 1; X2; … Xn), atëherë ngjarja mund të konsiderohet pothuajse e besueshme (me një probabilitet afër unitetit) që devijimi i mesatares aritmetike të këtyre variablave të rastit nga mesatarja aritmetike e pritjeve të tyre matematikore do të jetë sipas vlere absolute e vogël sa të duash.

Dëshmi. Χ 1; X2; … Xn):

(4)

; (5)

Duke marrë parasysh kushtet (1), ne konstatojmë se

(6)

Kështu, kur varianca është . Kjo do të thotë, kur përhapja e vlerave të një ndryshoreje të rastësishme rreth pritshmërisë së saj matematikore zvogëlohet pa kufi. Dhe kjo do të thotë se kur vlera, domethënë, . Ose, për të qenë më të saktë, probabiliteti që një ndryshore e rastësishme të paktën të devijojë disi nga pritshmëria e saj matematikore - një konstante - priret në zero. Domethënë, për çdo numër pozitiv arbitrarisht të vogël

Pra, sipas teoremës së provuar Chebyshev, mesatarja aritmetike e një numri të madh të ndryshoreve të rastësishme të pavarura ( Χ 1; X2; … Xn), duke qenë një ndryshore e rastësishme, në fakt humbet karakterin e rastësisë, duke u bërë, në fakt, një konstante e pandryshueshme. Kjo konstante është e barabartë me mesataren aritmetike të pritjeve matematikore të vlerave ( Χ 1; X2; … Xn). Ky është ligji i numrave të mëdhenj.

Një tjetër provë e teoremës së Chebyshev mund të jepet. Për ta bërë këtë, ne përdorim pabarazinë e Chebyshev. Është i vlefshëm si për ndryshoret e rastësishme diskrete ashtu edhe për ato të vazhdueshme dhe ka vlerë në vetvete. Pabarazia e Chebyshev na lejon të vlerësojmë probabilitetin që devijimi i një ndryshoreje të rastësishme nga pritshmëria e tij matematikore të mos kalojë në vlerë absolute numër pozitiv. Le të paraqesim një provë të pabarazisë së Chebyshev për ndryshoret diskrete të rastësishme.



Pabarazia e Chebyshev: Probabiliteti që devijimi i një ndryshoreje të rastësishme X nga pritshmëria e tij matematikore në vlerë absolute është më e vogël se një numër pozitiv, jo më pak se:

.

Dëshmi: Që nga ngjarjet që konsistojnë në zbatimin e pabarazive Dhe , janë të kundërta, atëherë shuma e probabiliteteve të tyre është e barabartë me 1, d.m.th. . Prandaj probabiliteti që na intereson. (*)

Ne do të gjejmë . Për këtë le të gjejmë variancën ndryshore e rastësishme X.

Të gjitha kushtet e kësaj shume janë jonegative. Le të hedhim poshtë ato kushte për të cilat (për kushtet e mbetura ), si rezultat i së cilës shuma mund të ulet vetëm. Le të biem dakord të supozojmë, për saktësi, se k termat e parë (do të supozojmë se në tabelën e shpërndarjes vlerat e mundshme numëruar në atë rend). Kështu,

Meqenëse të dyja anët e pabarazisë janë pozitive, prandaj, duke i kuadruar ato, marrim pabarazinë ekuivalente . Le të përdorim këtë vërejtje, duke zëvendësuar secilin prej faktorëve në shumën e mbetur numri (në këtë rast pabarazia mund të rritet vetëm), marrim. (**)

Sipas teoremës së mbledhjes, shuma e probabiliteteve është probabiliteti që X do të marrë një, pavarësisht se cila, nga vlerat , dhe për cilindo prej tyre devijimi plotëson pabarazinë . Nga kjo rrjedh se shuma shpreh probabilitetin . Kjo na lejon të rishkruajmë pabarazinë (**) si më poshtë: . (***).

Le të zëvendësojmë (***) V (*) dhe marrim , që ishte ajo që duhej vërtetuar.

Vërtetimi i Teoremës 2 të Chebyshev:

Le të prezantojmë një ndryshore të re të rastësishme në konsideratë - mesataren aritmetike të ndryshoreve të rastësishme ( Χ 1; X2; … Xn):

Duke përdorur vetitë e pritjes dhe shpërndarjes matematikore, marrim:

; . (*)

Duke aplikuar pabarazinë e Chebyshev në sasi, ne kemi.

Duke marrë parasysh raportin (*),

Me kusht, do të thotë . (***) Zëvendësimi anën e djathtë(***) në ​​pabarazi (**) kemi

Nga këtu, duke kaluar në kufirin në , marrim

Meqenëse probabiliteti nuk mund të kalojë një, më në fund marrim:

Kjo është ajo që na duhej të vërtetonim.

Le të ndalemi në një rast të veçantë të rëndësishëm të teoremës së Chebyshev. Gjegjësisht, merrni parasysh rastin kur ndryshoret e pavarura të rastësishme ( Χ 1; X2; … Xn) kanë të njëjtat ligje shpërndarjet, dhe, për rrjedhojë, identike karakteristikat numerike:

(8)

Pastaj për ndryshoren e rastësishme , sipas (5), kemi:

(9)

Lidhja e probabilitetit kufizues (7) në këtë rast do të marrë formën:

(10)

Përfundimi që vjen nga (10) ka rëndësi të madhe për të luftuar gabimet e rastësishme gjatë kryerjes së llojeve të ndryshme të matjeve.

Le të, për shembull, duhet të matni një sasi të caktuar A. Ne do të prodhojmë jo një, por disa ( n) matje të pavarura të përsëritura të vlerës së kësaj sasie. Çdo matje është e natyrshme në një gabim të rastësishëm që lidhet me papërsosmërinë e pajisjes matëse, të gjitha llojet e ndërhyrjeve të rastësishme në matje, etj. Prandaj rezultatet ( Χ 1; X2; … Xn) matjet sekuenciale individuale të vlerës së dëshiruar A, në përgjithësi, nuk do të jepen - ato do të jenë variabla të rastësishme. Për më tepër, me sasitë që kanë shpërndarje identike, sepse matjet bëhen në mënyrë të përsëritur, pra në konstante kushtet e jashtme. Pastaj për sasinë - mesatarja aritmetike e rezultateve të të gjithave n matjet - do të përmbushet relacioni i probabilitetit kufizues (10). Kjo do të thotë se kjo mesatare aritmetike humbet karakterin e rastësisë, duke u shndërruar në A– vlera e vërtetë e sasisë së matur. Kjo, nga rruga, dëshmohet nga formula (9), sipas të cilave:

(11)

Kjo do të thotë, pasi të keni kryer një numër mjaft të madh të matjeve të përsëritura të sasisë së dëshiruar A, në secilën prej të cilave është i mundur një gabim i rastësishëm i matjes dhe më pas gjetja e mesatares rezultatet aritmetike këto matje, ne përdorim formulën

A(12)

ne mund të marrim vlerën dhe praktikisht pa gabime të rastësishme.

Ky përfundim është pasojë e ligjit të numrave të mëdhenj. NË në këtë rast ky ligj manifestohet në faktin se gjatë përmbledhjes së matjeve rezulton në (4) gabime të rastësishme dimensionet individuale, që ndodhin në parim njëlloj shpesh me një shenjë plus dhe një minus, në përgjithësi do të anulojnë njëra-tjetrën. Dhe gabimi i mbetur do të ndahet akoma në P, domethënë do të ulet më tej me P një herë. Kështu që kur vlera të mëdha n vlera do të jetë pothuajse saktësisht e barabartë me vlerën e matur A. Ky përfundim natyrshëm përdoret gjerësisht në praktikë.

shënim. Në madhësi ato anulojnë vetëm njëra-tjetrën gabime të rastësishme matjet, domethënë gabimet që lidhen me veprimin e faktorëve të rastësishëm (ndërhyrje). Por gabimet sistematike (të përhershme), d.m.th., gabimet e natyrshme në secilën matje, mbeten natyrisht në . Për shembull, një shigjetë e rrëzuar (jo e rregulluar) në një pajisje shkakton një gabim konstant (sistematik) në çdo matje, dhe për këtë arsye e shkakton atë në mesataren aritmetike të rezultateve të këtyre matjeve. Gabimet sistematike duhet të eliminohen edhe përpara se të bëhen matjet dhe të mos lejohen gjatë procesit të matjes.

Atëherë, nëse α është vlera e ndarjes së pajisjes matëse, atëherë të gjitha matjet e përsëritura bëhen me një saktësi prej α. Por atëherë, natyrisht, mesatarja aritmetike e rezultateve të të gjitha matjeve mund të tregohet vetëm me një saktësi prej α, domethënë me një saktësi të përcaktuar nga saktësia e pajisjes.

Prandaj, nuk duhet menduar se, pasi të ketë bërë një numër mjaft të madh të matjeve të përsëritura të sasisë A dhe më pas duke gjetur mesataren aritmetike të rezultateve të këtyre matjeve, marrim saktë kuptimi A. Ne do ta marrim atë vetëm brenda saktësisë së pajisjes matëse. Dhe edhe atëherë, nëse e përjashtojmë gabim sistematik matjet.

Le të paraqesim një rast tjetër të rëndësishëm të veçantë të ligjit të numrave të mëdhenj. Le X=k– numri i ndodhive të ndonjë ngjarjeje A V P teste të përsëritura ( X- vlera e rastësishme). Dhe le dhe – probabiliteti i ndodhjes dhe mosngjarjes së një ngjarjeje A në një provë. Le të shqyrtojmë një ndryshore të rastësishme - frekuencë relative ndodhja e një ngjarjeje A V P testet. Le të prezantojmë gjithashtu n variablat e rastit ( X 1, X 2, …X n), të cilat përfaqësojnë numrin e dukurive të ngjarjes A ne te paren, te dyten,... P-th teste. Pastaj k = X 1 + X 2 +…+ X f, dhe ndodhja e një ngjarjeje A praktikisht përkon me probabilitetin e ndodhjes së ngjarjes A në një test. Ky përfundim bazohet në gjetjen e probabiliteteve të shumë ngjarje të rastësishme, probabilitetet e të cilit nuk mund të gjenden në ndonjë mënyrë tjetër (teorikisht).

Për shembull, le të jetë testi hedhja e një monedhe të deformuar (asimetrike) dhe ngjarja A për këtë sfidë, është një rënie e kreshtës. Probabiliteti i ngjarjes A Nga formula klasike ose ndonjë mënyrë tjetër formulë teorikeështë e vështirë të gjendet, sepse një formulë e tillë duhet të pasqyrojë disi karakteristikat e deformimit të monedhës. Prandaj, rruga e vërtetë që çon drejt qëllimit është një: hidhni monedhën në mënyrë të përsëritur (sa më i madh të jetë numri i hedhjeve n, aq më mirë) dhe të përcaktojë në mënyrë empirike shpeshtësinë relative të paraqitjes së stemës. Nëse nështë i madh, atëherë në përputhje me ligjin e numrave të mëdhenj është e mundur me probabilitet të lartë pohojnë se .

Ligji i numrave të mëdhenj manifestohet në shumë dukuri natyrore dhe shoqërore.

Shembulli 1. Siç dihet, gazi i vendosur në një enë të mbyllur ushtron presion në muret e enës. Sipas ligjeve të gjendjes së gazit, në një temperaturë konstante të gazit, ky presion është konstant. Presioni i gazit shkaktohet nga ndikimet kaotike të molekulave të tij individuale në muret e enës. Shpejtësitë dhe drejtimet e lëvizjes së të gjitha molekulave janë të ndryshme, prandaj edhe forcat e ndikimeve të molekulave të ndryshme në muret e enës janë të ndryshme. Sidoqoftë, presioni i gazit në muret e enës përcaktohet jo nga forca e ndikimit të molekulave individuale, por nga mesatare me forcë. Por ajo është si ajo mesatare numër i madh pavarësisht forcat aktive, sipas ligjit të numrave të mëdhenj, do të mbetet praktikisht i pandryshuar. Prandaj, presioni i gazit në muret e anijes mbetet praktikisht i pandryshuar.

Shembulli 2. Një kompani sigurimesh që merret, për shembull, me sigurimin e automjeteve, paguan shuma të ndryshme sigurimi për ngjarje të ndryshme të siguruara (aksidente automobilistike dhe aksidente trafiku rrugor). Megjithatë, vlera mesatare e kësaj shume të sigurimit, si një mesatare prej shumë të ndryshme n shumat e pavarura të sigurimit, sipas ligjit të numrave të mëdhenj, praktikisht do të jenë të pandryshuara. Mund të përcaktohet duke ekzaminuar statistikat aktuale të dëmeve nga sigurimet. Në mënyrë që një kompani sigurimi të shmangë humbjet, primi mesatar i sigurimit i ngarkuar për klientët e saj duhet të jetë më i lartë se primi mesatar i paguar nga kompania për klientët e saj. Por ky premium nuk duhet të jetë shumë i lartë që kompania të jetë konkurruese (për të konkurruar në atraktivitet me kompanitë e tjera të sigurimit).

Është krejt e natyrshme që të duhet të sqarohet në mënyrë sasiore pohimi se në seritë "të mëdha" të testeve frekuencat e ndodhjes së një ngjarjeje janë "afër" probabilitetit të saj. Delikatesa e caktuar e kësaj detyre duhet të kuptohet qartë. Në rastet më tipike për teorinë e probabilitetit, situata është që në një seri arbitrare të gjatë testesh, të dyja mbeten teorikisht të mundshme. vlerat ekstreme frekuencave

\frac(\mu)(n)=\frac(n)(n)=1 Dhe \frac(\mu)(n)=\frac(0)(n)=0

Prandaj, cilido qoftë numri i testeve n, nuk mund të thuhet me siguri të plotë se, të themi, pabarazia do të plotësohet

<\frac{1}{10}

Për shembull, nëse ngjarja A është se një gjashtë hidhet kur hedh një kërpudhë, atëherë me n hedh me probabilitet (\majtas(\frac(1)(6)\djathtas)\^n>0 !} do të marrim gjithmonë vetëm gjashtëshe, pra me probabilitet (\majtas(\frac(1)(6)\djathtas)\^n !} marrim frekuencën e shfaqjes së gjashtëshe, e barabartë me një, dhe me probabilitet (\majtas(1-\frac(1)(6)\djathtas)\^n>0 !} një gjashtë nuk shfaqet as edhe një herë, pra frekuenca e shfaqjes së gjashtëshe do të jetë e barabartë me zero.

Ne te gjithe detyra të ngjashmeçdo vlerësim jo i parëndësishëm i afërsisë midis frekuencës dhe probabilitetit nuk funksionon me besueshmëri të plotë, por vetëm me një probabilitet më të vogël se një. Mund të vërtetohet, për shembull, se në rastin e testeve të pavarura me probabilitet konstant p dukuri e pabarazisë së ngjarjes

\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02

për frekuencën \frac(\mu)(n) do të përmbushet në n=10\,000 (dhe çdo p) me probabilitet

P>0,\!9999.

Këtu para së gjithash duam të theksojmë se në formulimin e mësipërm kuantifikimi afërsia e frekuencës \frac(\mu)(n) me probabilitetin p shoqërohet me paraqitjen e një probabiliteti të ri P.

Kuptimi i vërtetë i vlerësimit (8) është ky: nëse kryejmë N seri të n testeve dhe numërojmë numrin M të serive në të cilat plotësohet pabarazia (7), atëherë për një N mjaftueshëm të madh do të jetë afërsisht

\frac(M)(N)\afërsisht P>0,\!9999.

Por nëse duam të sqarojmë relacionin (9) si në lidhje me shkallën e afërsisë \frac(M)(N) me probabilitetin P, ashtu edhe në lidhje me besueshmërinë me të cilën mund të pohojmë se një afërsi e tillë do të ndodhë, atëherë ne do të duhet t'i drejtohemi konsideratave të ngjashme me ato që kemi kryer tashmë në zbatimin e afërsisë së \frac(\mu)(n) dhe p . Nëse dëshironi, një arsyetim i tillë mund të përsëritet një numër të pakufizuar herë, por është mjaft e qartë se kjo nuk do të na lejojë të çlirohemi plotësisht nga nevoja për të fazën e fundit referojuni probabiliteteve në kuptimin primitiv dhe të përafërt të këtij termi.

Nuk duhet menduar se vështirësitë e këtij lloji janë një lloj veçorie e teorisë së probabilitetit. Kur studion matematikën fenomene reale ne i skematizojmë gjithmonë. Devijimet në rrjedhën e dukurive aktuale nga skema teorike nga ana tjetër mund t'i nënshtrohet studimit matematikor. Por për këtë, vetë këto devijime duhet të futen në një skemë dhe kjo e fundit të përdoret pa formale analiza matematikore devijimet prej saj.

Megjithatë, vini re se në zbatimin real të vlerësimit

P\!\majtas\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}>0,\!9999.


për një seri të vetme testesh n, ne mbështetemi gjithashtu në disa konsiderata të simetrisë: pabarazia (10) tregon se me një numër shumë të madh N të serive, relacioni (7) do të plotësohet në jo më pak se 99,99% të rasteve; Është e natyrshme të presim me shumë besim se, në veçanti, pabarazia (7) do të realizohet në serinë specifike të n testeve që na interesojnë, nëse kemi arsye të besojmë se kjo seri zë një pozicion të zakonshëm midis serive të tjera, të pa shënuara. nga çdo gjë e veçantë.

Probabilitetet që zakonisht neglizhohen në situata të ndryshme praktike janë të ndryshme. U vu re tashmë më lart se kur bëjnë llogaritjet e përafërta të konsumit të predhës që garanton përfundimin e detyrës së caktuar, ata janë të kënaqur me shkallën e konsumit të predhës në të cilën detyra e caktuar zgjidhet me një probabilitet prej 0,95, d.m.th., ata neglizhojnë probabilitetet që nuk mbi 0.05. Kjo shpjegohet me faktin se kalimi në llogaritjet bazuar në neglizhimin, të themi, vetëm probabilitete më të vogla se 0.01, do të çonte në një rritje të madhe të normave të konsumit të predhave, d.m.th., në pothuajse shumë raste, në përfundimin se është e pamundur të kryhet Detyra në një periudhë kaq të shkurtër kohore që është në dispozicion për këtë, ose me furnizimin e predhave që mund të përdoren në të vërtetë.

Ndonjëherë në kërkimin shkencor ato kufizohen në teknikat statistikore të llogaritura në bazë të probabiliteteve të neglizhimit prej 0.05. Por kjo duhet bërë vetëm në rastet kur mbledhja e materialit më të gjerë është shumë e vështirë. Konsideroni problemin e mëposhtëm si një shembull të teknikave të tilla. Le të supozojmë se, në kushte të caktuara, një ilaç që përdoret për të trajtuar një sëmundje jep rezultat pozitiv në 50%, pra me një probabilitet prej 0.5. Propozohet një medikament i ri dhe, për të provuar epërsinë e tij ndaj të vjetrit, është planifikuar të përdoret në dhjetë raste, të përzgjedhura në mënyrë të paanshme nga pacientët në të njëjtën situatë si ata për të cilët është vërtetuar efektiviteti i ilaçit të vjetër. në 50%. Është vërtetuar se avantazhi i një ilaçi të ri do të konsiderohet i provuar nëse jep një rezultat pozitiv në të paktën tetë raste nga dhjetë. Është e lehtë të llogaritet se një vendim i tillë shoqërohet me neglizhencën e probabilitetit të marrjes së një përfundimi të gabuar (d.m.th., përfundimi se përfitimet e një ilaçi të ri janë të provuara, ndërkohë që është ekuivalent ose edhe më keq se ai i vjetër). 0.05. Në fakt, nëse në secilën prej dhjetë provave probabiliteti i një rezultati pozitiv është i barabartë me p, atëherë probabilitetet për të marrë 10.9 ose 8 rezultate pozitive në dhjetë prova janë përkatësisht të barabarta.

P_(10)=p^(10),\qquad P_9=10p^9(1-p),\qquad P_8=45p^8(1-p)^2.

Në total, për rastin p=\frac(1)(2) marrim P=P_(10)+P_9+P_8=\frac(56)(1024)\afërsisht 0,\!05.

Kështu, duke supozuar se ilaçi i ri është në fakt saktësisht i barabartë me atë të vjetër, rrezikojmë të konkludojmë gabimisht se ilaçi i ri është superior ndaj atij të vjetër me një probabilitet prej rreth 0.05. Për të reduktuar këtë probabilitet në afërsisht 0.01, pa rritur numrin e provave n = 10, do të ishte e nevojshme të përcaktohet se avantazhi i një ilaçi të ri do të konsiderohet i provuar vetëm kur përdorimi i tij jep një rezultat pozitiv në të paktën nëntë raste nga dhjetë. Nëse kjo kërkesë duket shumë e ashpër për mbështetësit e ilaçit të ri, atëherë numri i testeve n do të duhet të caktohet dukshëm më i madh se 10. Nëse, për shembull, me n = 100 vërtetohet se përfitimet e ilaçit të ri do të të konsiderohet i provuar në \mu>65, atëherë probabiliteti i gabimit do të jetë vetëm P\approx0,\!0015 .

Nëse norma është 0.05 për serioze kërkimin shkencorështë qartësisht e pamjaftueshme, atëherë probabiliteti i një gabimi prej 0.001 ose 0.003 përgjithësisht neglizhohet edhe në kërkime të tilla akademike dhe të plota si përpunimi i vëzhgimeve astronomike. Sidoqoftë, ndonjëherë konkluzionet shkencore të bazuara në zbatimin e ligjeve probabiliste kanë gjithashtu besueshmëri dukshëm më të madhe (d.m.th., ato bazohen në neglizhimin e probabiliteteve dukshëm më të ulëta). Kjo do të diskutohet më tej më poshtë.

Në shembujt e shqyrtuar, ne kemi përdorur në mënyrë të përsëritur raste të veçanta të formulës binomiale (6)

P_m=C_n^mp^m(1-p)^(n-m)

për probabilitetin P_m për të marrë saktësisht m rezultate pozitive për n teste të pavarura, në secilën prej të cilave një rezultat pozitiv ka probabilitet p. Duke përdorur këtë formulë, le të shqyrtojmë pyetjen e parashtruar në fillim të këtij seksioni në lidhje me probabilitetin

<\varepsilon\right\},

ku \mu është numri aktual i rezultateve pozitive. Natyrisht, kjo probabilitet mund të shkruhet si shuma e atyre P_m për të cilat m plotëson pabarazinë

\vline\,\frac(m)(n)-p\,\vline\,<\varepsilon,


pra në formë

P=\shuma_(m=m_1)^(m_2)P_m,

ku m_1 është më e vogla nga vlerat e pabarazisë m të kënaqshme (12), dhe m_2 është më e madhja e m të tillë.

Formula (13) për çdo n të madh ka pak përdorim për llogaritjet e drejtpërdrejta. Prandaj, zbulimi nga Moivre për rastin p=\frac(1)(2) dhe nga Laplace për çdo p të një formule asimptotike ishte shumë i rëndësishëm, gjë që e bën shumë të lehtë gjetjen dhe studimin e sjelljes së probabiliteteve P_m për të mëdha n. Kjo formulë duket si

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\exp\!\majtas[-\frac((m-np)^2)(2np(1-p)) \djathtas].

Nëse p nuk është shumë afër zeros ose një, atëherë është mjaft e saktë tashmë për n të rendit 100. Nëse vendosim

T=\frac(m-np)(\sqrt(np(1-p))),

Atëherë formula (14) do të marrë formën

P\sim\frac(1)(\sqrt(2\pi np(1-p)))\,e^(-t^2/2).


Nga (13) dhe (16) mund të nxjerrim një paraqitje të përafërt të probabilitetit (11)

P\sim\frac(1)(\sqrt(2\pi))\int\limits_(-T)^(T)e^(-t^2/2)\,dt=F(T),


Ku

T=\varepsilon\sqrt(\frac(n)(p(1-p)))

Diferenca midis anëve të majta dhe të djathta në (17), me p konstante dhe të ndryshme nga zero dhe uniteti, priret në zero si n\në\infty në mënyrë uniforme në raport me \varepsilon. Tabelat e detajuara janë përpiluar për funksionin F(T). Ja një fragment i shkurtër prej tyre

\fillimi(grupi)(c|c|c|c|c)T&1&2&3&4\\\hlinja F&0,\!68269&0,\!95450&0,\!99730&0,\!99993\fundi (vargu)


Në T\to\infty vlera e funksionit F(T) tenton në unitet.

Le të përdorim formulën (17) për të vlerësuar probabilitetin

P=\mathbf(P)\!\majtas\(\,\vline\,\frac(\mu)(n)-p\,\vline\,<0,\!02\right\}\approx F\!\left(\frac{2}{\sqrt{p(1-p)}}\right) në n=10\,000,~\varepsilon=0,\!02, sepse T=\frac(2)(\sqrt(p(1-p))).

Meqenëse funksioni F(T) rritet monotonisht me rritjen e T, atëherë për një vlerësim më të ulët të P që nuk varet nga p, duhet të marrim vlerën më të vogël të mundshme (për p të ndryshme) të T. Kjo vlerë më e vogël do të merret në p=\frac(1)(2) dhe do të jetë e barabartë me 4. Prandaj, përafërsisht

P\geqslant F(4)=0,\!99993.

Pabarazia (19) nuk merr parasysh gabimin që ndodh për shkak të natyrës së përafërt të formulës (17). Duke vlerësuar gabimin që lidhet me këtë rrethanë, në çdo rast mund të konstatojmë se P>0.\!9999.

Në lidhje me shembullin e konsideruar të aplikimit të formulës (17), duhet të theksohet se vlerësimet e termit të mbetur të formulës (17), të dhëna në punimet teorike mbi teorinë e probabilitetit, mbetën të pakënaqshme për një kohë të gjatë. Prandaj, aplikimi i formulës (17) dhe të ngjashme me llogaritjet për n jo shumë të mëdha ose për probabilitete p shumë afër 0 ose 1 (dhe probabilitete të tilla në shumë raste janë veçanërisht të rëndësishme) shpesh bazoheshin vetëm në përvojën e kontrollit të tillë. rezulton për një numër të kufizuar shembujsh, dhe jo në vlerësime të besueshme të gabimeve të mundshme. Një studim më i detajuar, gjithashtu, tregoi se në shumë raste praktikisht të rëndësishme, formulat asimptotike të mësipërme kanë nevojë jo vetëm për një vlerësim të termit të mbetur, por edhe për sqarim (pasi pa një sqarim të tillë termi i mbetur është shumë i madh). Në të dy drejtimet, rezultatet më të plota i përkasin S. N. Bernstein.

Marrëdhëniet (11), (17) dhe (18) mund të rishkruhen si

\mathbf(P)\!\majtas\(\,\vline\,\frac(\mu)(n)-p\,\vline\,

Për t mjaftueshëm të mëdha, ana e djathtë e formulës (20), e cila nuk përmban n, është arbitrarisht afër unitetit, d.m.th., me vlerën e probabilitetit që korrespondon me besueshmërinë e plotë. Pra, ne shohim se, Si rregull, devijimet e frekuencës \frac(\mu)(n) nga probabiliteti p janë të rendit \frac(1)(\sqrt(n)). Ky përpjestim i saktësisë së veprimit të ligjeve probabiliste me rrënjën katrore të numrit të vëzhgimeve është tipik për shumë çështje të tjera. Ndonjëherë ata madje flasin, si një popullarizimi disi i thjeshtuar, për "ligjin e rrënjës katrore të n" si ligjin themelor të teorisë së probabilitetit. Kjo ide u qartësua plotësisht falë futjes nga matematikani i madh rus P. L. Chebyshev në përdorimin sistematik të metodës së reduktimit të problemeve të ndryshme probabilistike në llogaritjet e "pritshmërive matematikore" dhe "variancave" për shumat dhe mesataret aritmetike të "ndryshoreve të rastësishme".

Ndryshore e rastësishmeështë një sasi që, në kushte të dhëna S, mund të marrë vlera të ndryshme me probabilitete të caktuara. Për ne mjafton të marrim në konsideratë variabla të rastësishme që mund të marrin vetëm një numër të kufizuar vlerash të ndryshme. Për të treguar, siç thonë ata, shpërndarja e probabilitetit të këtij lloji të ndryshores së rastësishme \xi, mjafton të tregohen vlerat e mundshme të saj x_1,x_2,\ldots,x_r dhe probabilitetet

P_r=\mathbf(P)\(\xi=x_r\).


Si përmbledhje, këto probabilitete për të gjitha vlerat e ndryshme të mundshme të sasisë \xi janë gjithmonë të barabarta me një:

\shuma_(r=1)^(s)P_r=1.

Një shembull i një ndryshoreje të rastësishme është numri \mu i rezultateve pozitive të studiuara më sipër në n prova.

Pritshmëria matematikore sasia \xi quhet shprehje

M(\xi)=\sum_(r=1)^(s)P_rx_r,


A dispersion madhësitë \xi quhen pritshmëri matematikore e devijimit në katror \xi-M(\xi), pra shprehja

D(\xi)=\sum_(r=1)^(s)P_r(x_r-M(\xi))^2.


Rrënja katrore e variancës

\sigma_(\xi)=\sqrt(D(\xi))=\sqrt(\sum_(r=1)^(s)P_r(x_r-M(\xi))^2)


thirrur devijimi standard(vlerat nga pritshmëria e tij matematikore M(\xi) ).

Aplikimet më të thjeshta të variancave dhe devijimeve standarde bazohen në të famshmet pabarazia e Chebyshev

\mathbf(P)\(|\xi-M(\xi)|\leqslant t_(\sigma_(\xi))\)\geqslant1-\frac(1)(t^2),

Ai tregon se devijimet e një ndryshoreje të rastësishme \xi nga pritshmëria e saj matematikore M(\xi) që tejkalojnë dukshëm devijimin standard \sigma_(\xi) janë të rralla.

Gjatë formimit të shumave të ndryshoreve të rastit \xi=\xi^((1))+ \xi^((2))+\cdots+\xi^((n)) pritjet e tyre matematikore kanë gjithmonë të barabarta

M(\xi)=M(\xi^(1))+M(\xi^((2)))+\cdots+M(\xi^((n))).


Një barazi e ngjashme për variancat

D(\xi)=D(\xi^((1)))+D(\xi^((2)))+\cdots+D(\xi^((n))).

e vërtetë vetëm nën kufizime të caktuara. Që barazia (23) të jetë e vlefshme, mjafton, për shembull, që sasitë \xi^((i)) dhe \xi^(j)) me numra të ndryshëm nuk janë, siç thonë ata, "të ndërlidhura" me njëri-tjetrin, d.m.th., që kur i\ne j barazia vlen

M\Bigl\((\xi^(i))-M(\xi^((i))))(\xi^((j))-M(\xi^((j))))\ Bigl\)=0

Koeficienti i korrelacionit midis variablave të rastësishëm \xi^((i)) dhe \xi^(j)) është shprehja

R=\frac(M\Bigl\(\Bigl(\xi^((i))-M(\xi^((i)))\Bigl)\Bigl(\xi^((j))-M( \xi^((j)))\Bigl)\Bigl\))(\sigma_(\xi^((i)))\,\sigma_(\xi^((j)))).

Nëse \sigma_(\xi^((i)))>0 V \sigma_(\xi^((j)))>0, atëherë kushti (24) është ekuivalent me faktin se R=0.

Koeficienti i korrelacionit R karakterizon shkallën e varësisë ndërmjet variablave të rastit. Gjithmonë |R|\leqslant1, dhe R=\pm1 vetëm nëse ka një lidhje lineare

\eta=a\xi+b\quad(a\ne0).

Për variablat e pavarur R=0.

Në veçanti, barazia (24) plotësohet nëse sasitë \xi^((i)) dhe \xi^((j)) janë të pavarura nga njëra-tjetra. Kështu, për kushte reciprokisht të pavarura, barazia (23) vlen gjithmonë. Për mesataret aritmetike

\zeta=\frac(1)(n)\Bigl(\xi^((1))+\xi^((2))+\cdots+\xi^((n))\Bigl) nga (23) vijon

D(\zeta_=\frac(1)(n^2)\Bigl(D(\xi^((1)))+ D(\xi^((2)))+\cdots+ D(\xi^( (n)))\Bigl).

Le të supozojmë tani se për të gjithë termat variancat nuk e kalojnë një konstante

D(\xi^((i)))\leqslant C^2. Pastaj nga (25) D(\zeta)\leqslant\frac(C^2)(n),


dhe për shkak të pabarazisë së Chebyshev për çdo t

\mathbf(P)\!\left\(|\zeta-M(\zeta)|\leqslant\frac(tC)(\sqrt(n))\right\)\geqslant1-\frac(1)(t^ 2)

Pabarazia (26) përmban të ashtuquajturin ligj të numrave të mëdhenj në formën e vendosur nga Chebyshev: nëse sasitë \xi^((i)) janë reciprokisht të pavarura dhe kanë varianca të kufizuara, atëherë me rritjen n mesataret e tyre aritmetike \zeta janë më pak dhe më pak gjasa për të devijuar dukshëm nga pritshmëritë e tyre matematikore M(\zeta) .

Më saktë thonë se sekuenca e ndryshoreve të rastësishme

\xi^((1)),\,\xi^(2)),\,\ldots\,\xi^(n)),\,\ldots


i bindet ligjit të numrave të mëdhenj nëse për aritmetikën përkatëse do të thotë \zeta dhe për çdo konstante \varepsilon>0

\mathbf(P)\(|\zeta-M(\zeta)|\leqslant \varepsilon\)\to1\quad (n\to\infty).

Për të marrë relacionin kufi (27) nga pabarazia (26), mjafton të vendoset

T=\varepsilon\cdot\frac(\sqrt(n))(C).

Një numër i madh studimesh nga A.A. Markova, S.N. Bernstein, A.Ya. Khinchin dhe të tjerët janë të përkushtuar ndaj çështjes së mundshme zgjerim më të madh kushtet për zbatueshmërinë e relacionit kufi (27), d.m.th., kushtet për zbatueshmërinë e ligjit të numrave të mëdhenj. Këto studime kanë një rëndësi thelbësore. Megjithatë, edhe më i rëndësishëm është një studim i saktë i shpërndarjes së probabilitetit të devijimeve \zeta-M(\zeta) .

Meritë e madhe e rusit shkolla klasike në teorinë e probabilitetit është të vërtetohet fakti që, në kushte shumë të gjera, barazia është asimptotike (d.m.th., me saktësi në rritje për rritjen e pakufizuar të n)

\mathbf(P)\!\majtas\(t_1\sigma_(\zeta)<\zeta-M(\zeta)

Chebyshev dha një provë pothuajse të plotë të kësaj formule për rastin e termave të pavarur dhe të kufizuar. Markov plotësoi hallkën që mungonte në arsyetimin e Chebyshev dhe zgjeroi kushtet për zbatueshmërinë e formulës (28). Kushtet edhe më të përgjithshme u dhanë nga Lyapunov. Çështja e shtrirjes së formulës (28) në shumat e termave të varur u studiua me plotësi të veçantë nga S. N. Bernstein.

Formula (28) mbuloi një numër kaq të madh problemesh të veçanta saqë për një kohë të gjatë u quajt teorema e kufirit qendror të teorisë së probabilitetit. Edhe pse me zhvillimin e fundit të teorisë së probabilitetit ajo rezultoi të përfshihet në një sërë ligjesh më të përgjithshme, rëndësia e saj nuk mund të mbivlerësohet edhe sot.

Koha.

Nëse termat janë të pavarur dhe variancat e tyre janë të njëjta dhe të barabarta: D(\xi^((i)))=\sigma^2, atëherë është e përshtatshme për të dhënë formulën (28), duke marrë parasysh relacionin (25), formën

\mathbf(P)\!\majtas\(\frac(t_1\sigma)(\sqrt(n))<\zeta-M(\zeta)<\frac{t_2\sigma}{\sqrt{n}}\right\}\sim\frac{1}{\sqrt{2\pi}}\int\limits_{t_1}^{t_2}e^{-t^2/2}\,dt\,.

Le të tregojmë se relacioni (29) përmban një zgjidhje për problemin e devijimeve të frekuencës \frac(\mu)(n) nga probabiliteti p, të cilin e trajtuam më herët. Për ta bërë këtë, ne prezantojmë variablat e rastësishëm \xi^((i)) duke i përcaktuar ato me kushtin e mëposhtëm:

\xi^((i))=0, nëse testi i i-të kishte një rezultat negativ,

\xi^((i))=1 nëse testi i i-të kishte një rezultat pozitiv.

Është e lehtë ta kontrollosh atë atëherë


dhe formula (29) jep

\mathbf(P)\!\majtas\(t_1\sqrt(\frac(p(1-p))(n))<\frac{\mu}{n}-p
e cila për t_1=-t,~t_2=t përsëri çon në formulën (20).
Shihni gjithashtu teoremat e kufirit në teorinë e probabilitetit Javascript është i çaktivizuar në shfletuesin tuaj.
Për të kryer llogaritjet, duhet të aktivizoni kontrollet ActiveX!

1. /PB-MS-teori/Leksione-1(4f.).doc
2. /PB-MS-teori/Leksione-2 (4 fq.).doc
3. /PB-MS-teori/Leksione-3(4f.).doc
4. /PB-MS-teori/Leksione-4(4f.).doc
5. /PB-MS-teoria/Përmbajtja.doc
Leksioni 1
Leksioni 19. Testimi statistikor i hipotezave statistikore. Parimet e përgjithshme të testimit të hipotezave. Konceptet e hipotezës statistikore (të thjeshta dhe komplekse), hipoteza zero dhe konkurruese,
Ligji i numrave të mëdhenj. Pabarazia e Chebyshev. Teoremat e Chebyshev dhe Bernoulli
Leksion Karakteristikat numerike bazë të ndryshoreve të rastësishme diskrete dhe të vazhdueshme: pritshmëria matematikore, dispersioni dhe devijimi standard. Karakteristikat dhe shembujt e tyre
Leksion Lënda e teorisë së probabilitetit. Ngjarje të rastësishme. Algjebra e ngjarjeve. Frekuenca relative dhe probabiliteti i një ngjarjeje të rastësishme. Grupi i plotë i ngjarjeve. Përkufizimi klasik i probabilitetit. Vetitë themelore të probabilitetit. Formulat themelore të kombinatorikës

Leksioni 13.

Ligji i numrave të mëdhenj. Pabarazia e Chebyshev. Teoremat e Chebyshev dhe Bernoulli.
Studimi i modeleve statistikore ka bërë të mundur vërtetimin se, në kushte të caktuara, sjellja totale e një numri të madh variablash të rastësishëm pothuajse humbet karakterin e saj të rastësishëm dhe bëhet e natyrshme (me fjalë të tjera, devijimet e rastësishme nga një sjellje mesatare anulojnë njëra-tjetrën. ). Në veçanti, nëse ndikimi në shumën e termave individualë është uniformisht i vogël, ligji i shpërndarjes së shumës i afrohet normales. Formulimi matematik i këtij pohimi është dhënë në një grup teoremash të quajtur ligji i numrave të mëdhenj.

Pabarazia e Chebyshev.
Pabarazia e Chebyshev, e përdorur për të vërtetuar teorema të mëtejshme, është e vlefshme si për ndryshoret e rastësishme të vazhdueshme ashtu edhe për ato diskrete. Le ta vërtetojmë atë për variabla diskrete të rastësishme.
Teorema 13.1 (pabarazia e Chebyshev). fq( | XM(X)| D( X) / ε². (13.1)

Dëshmi. Le X jepet nga seria e shpërndarjes


X

X 1

X 2



X P

R

R 1

R 2



R P

Që nga ngjarjet | XM(X)| X M(X)| ≥ ε janë të kundërta, atëherë R (|XM(X)| p(| XM(X)| ≥ ε) = 1, pra, R (|XM(X)| p(| XM(X)| ≥ ε). Ne do të gjejmë R (|XM(X)| ≥ ε).

D(X) = (x 1 – M(X))² fq 1 + (x 2 – M(X))² fq 2 + … + (x n M(X))² fq n . Le të përjashtojmë nga kjo shumë ato terma për të cilët | XM(X)| k kushtet. Pastaj

D(X) ≥ (x k + 1 – M(X))² fq k + 1 + (x k + 2 – M(X))² fq k +2 + … + (x n M(X))² fq n ≥ ε² ( fq k + 1 + fq k + 2 + … + fq n).

Vini re se fq k + 1 + fq k + 2 + … + fq n ekziston mundësia që | XM(X)| ≥ ε, pasi kjo është shuma e probabiliteteve të të gjitha vlerave të mundshme X, për të cilën kjo pabarazi është e vërtetë. Prandaj, D(X) ≥ ε² R(|XM(X)| ≥ ε), ose R (|XM(X)| ≥ ε) ≤ D(X) / ε². Pastaj probabiliteti i ngjarjes së kundërt fq( | XM(X)| D( X) / ε², që është ajo që duhej vërtetuar.
Teoremat e Chebyshev dhe Bernoulli.

Teorema 13.2 (teorema e Chebyshev). Nëse X 1 , X 2 ,…, X P– variabla të rastësishme të pavarura në çift, variancat e të cilave janë të kufizuara në mënyrë uniforme ( D(X i) ≤ C), atëherë për një numër arbitrarisht të vogël ε probabiliteti i pabarazisë

do të jetë në mënyrë arbitrare afër 1 nëse numri i variablave të rastësishëm është mjaft i madh.

Komentoni. Me fjalë të tjera, nëse plotësohen këto kushte

Dëshmi. Konsideroni një ndryshore të re të rastësishme
dhe gjeni pritshmërinë e tij matematikore. Duke përdorur vetitë e pritjes matematikore, marrim se . Aplikoni në Pabarazia e Chebyshev: Meqenëse ndryshoret e rastësishme në shqyrtim janë të pavarura, atëherë, duke marrë parasysh kushtet e teoremës, kemi: Duke përdorur këtë rezultat, ne paraqesim pabarazinë e mëparshme në formën:

Le të shkojmë në kufirin në
: Meqenëse probabiliteti nuk mund të jetë më i madh se 1, mund të thuhet se

Teorema është vërtetuar.
Pasoja.

Nëse X 1 , X 2 , …, X P– variabla të rastësishme të pavarura në çift me varianca uniforme të kufizuara, që kanë të njëjtën pritshmëri matematikore të barabartë me A, atëherë për çdo ε > 0 arbitrarisht të vogël probabiliteti i pabarazisë
do të jetë aq afër 1 sa të dëshirohet nëse numri i variablave të rastësishëm është mjaft i madh. Me fjale te tjera,
.

konkluzioni: mesatarja aritmetike e një numri mjaft të madh të ndryshoreve të rastit merr vlera afër shumës së pritjeve të tyre matematikore, domethënë humbet karakterin e një ndryshoreje të rastësishme. Për shembull, nëse kryhet një seri matjesh të çdo sasie fizike dhe: a) rezultati i secilës matje nuk varet nga rezultatet e të tjerave, domethënë, të gjitha rezultatet janë variabla të rastësishme të pavarura në çift; b) matjet janë bërë pa gabime sistematike (pritshmëritë e tyre matematikore janë të barabarta me njëra-tjetrën dhe të barabarta me vlerën e vërtetë A sasia e matur); c) sigurohet një saktësi e caktuar e matjeve, prandaj dispersionet e variablave të rastësishëm në shqyrtim janë të kufizuara në mënyrë uniforme; atëherë, me një numër mjaft të madh matjesh, mesatarja aritmetike e tyre do të rezultojë të jetë arbitrarisht afër vlerës së vërtetë të sasisë së matur.
Teorema e Bernulit.
Teorema 13.3 (teorema e Bernulit). Nëse në secilën prej P probabiliteti i eksperimenteve të pavarura R ndodhja e një ngjarjeje Aështë konstante, atëherë me një numër mjaftueshëm të madh testesh, probabiliteti që moduli i devijimit të frekuencës relative të dukurive A V P eksperimente nga R do të jetë aq i vogël sa dëshironi, sa më afër 1 sa dëshironi:

(13.2)

Dëshmi. Le të prezantojmë ndryshore të rastësishme X 1 , X 2 , …, X P, Ku X i numri i paraqitjeve A V i-m përvojë. ku X i mund të marrë vetëm dy vlera: 1 (me probabilitet R) dhe 0 (me probabilitet q = 1 – fq). Përveç kësaj, variablat e rastësishëm në shqyrtim janë të pavarura në çift dhe variancat e tyre janë të kufizuara në mënyrë uniforme (pasi D(X i) = pq, fq + q = 1, nga pq ≤ ¼). Rrjedhimisht, teorema e Chebyshev mund të zbatohet për ta M i = fq:

.

Por
, sepse X i merr vlerën 1 kur shfaqet A në një eksperiment të caktuar, dhe një vlerë të barabartë me 0 nëse A nuk ndodhi. Kështu,

Q.E.D.
Komentoni. Nga teorema e Bernulit mos e bej, Çfarë
Bëhet fjalë vetëm për probabilitetet se diferenca ndërmjet frekuencës relative dhe probabilitetit absolut mund të bëhet arbitrarisht e vogël. Dallimi është si më poshtë: me konvergjencën e zakonshme të konsideruar në analizën matematikore, për të gjithë P, duke u nisur nga disa vlera, pabarazia
ekzekutuar gjithmonë; në rastin tonë mund të ketë vlera të tilla P, për të cilat kjo pabarazi nuk është e vërtetë. Ky lloj konvergjence quhet konvergjenca në probabilitet.

Leksioni 14.

Teorema e kufirit qendror të Lyapunovit. Teorema e kufirit Moivre-Laplace.
Ligji i numrave të mëdhenj nuk shqyrton formën e ligjit limit të shpërndarjes së një shume variablash të rastësishëm. Kjo pyetje konsiderohet në një grup teoremash të quajtur teorema e kufirit qendror. Ata argumentojnë se ligji i shpërndarjes së një shume variablash të rastësishëm, secila prej të cilave mund të ketë shpërndarje të ndryshme, i afrohet normales kur numri i termave është mjaftueshëm i madh. Kjo shpjegon rëndësinë e ligjit normal për aplikime praktike.
Funksionet karakteristike.

Për të vërtetuar teoremën e kufirit qendror, përdoret metoda e funksioneve karakteristike.
Përkufizimi 14.1.Funksioni karakteristik ndryshore e rastësishme X i quajtur funksion

g(t) = M (e itX ) (14.1)

Kështu, g (t) paraqet pritshmërinë matematikore të disa ndryshoreve komplekse të rastit U = e itX, lidhur me vlerën X. Në veçanti, nëse Xështë një ndryshore e rastësishme diskrete e specifikuar nga një seri shpërndarjeje, atëherë

. (14.2)

Për një ndryshore të rastësishme të vazhdueshme me densitet të shpërndarjes f(x)

(14.3)

Shembulli 1. Le X– numri prej 6 pikësh i fituar me një hedhje të zarit. Pastaj sipas formulës (14.2) g(t) =

Shembulli 2. Gjeni funksionin karakteristik për një ndryshore të rastësishme të vazhdueshme të normalizuar të shpërndarë sipas ligjit normal
. Sipas formulës (14.3) (ne kemi përdorur formulën
dhe ç'farë i² = -1).

Vetitë e funksioneve karakteristike.
1. Funksioni f(x) mund të gjendet duke përdorur funksionin e njohur g(t) sipas formulës

(14.4)

(transformimi (14.3) quhet Transformimi Furier, dhe transformimi (14.4) - transformimi i anasjelltë i Furierit).

2. Nëse variablat e rastësishëm X Dhe Y të lidhura nga relacioni Y = aX, atëherë funksionet e tyre karakteristike lidhen me relacionin

g y (t) = g x (). (14.5)

3. Funksioni karakteristik i shumës së ndryshoreve të rastësishme të pavarura është i barabartë me produktin e funksioneve karakteristike të termave: për

(14.6)
Teorema 14.1 (teorema e kufirit qendror për termat e shpërndarë në mënyrë identike). Nëse X 1 , X 2 ,…, X P,… - variabla të rastësishme të pavarura me të njëjtin ligj shpërndarjeje, pritshmëri matematikore T dhe variancë σ 2, pastaj me rritje të pakufizuar P ligji i shpërndarjes së shumës
i afrohet pafundësisht normales.

Dëshmi.

Le të vërtetojmë teoremën për ndryshoret e rastësishme të vazhdueshme X 1 , X 2 ,…, X P(prova për sasitë diskrete është e ngjashme). Sipas kushteve të teoremës, funksionet karakteristike të termave janë identike:
Pastaj, nga vetia 3, funksioni karakteristik i shumës Y n do
Le të zgjerojmë funksionin g x (t) në serinë Maclaurin:

, Ku

.

Duke supozuar se T= 0 (d.m.th., zhvendosni origjinën në pikën T), Kjo
.

(sepse T= 0). Duke zëvendësuar rezultatet e marra në formulën Maclaurin, ne gjejmë se

.

Konsideroni një ndryshore të re të rastësishme
, i ndryshëm nga Y n në atë shpërndarjen e saj për ndonjë P barazohet me 0. Meqenëse Y n Dhe Z n janë të lidhura me një marrëdhënie lineare, mjafton të vërtetohet kjo Z n shpërndahet sipas një ligji normal, ose, që është e njëjta gjë, që funksioni i tij karakteristik i afrohet funksionit karakteristik të një ligji normal (shih shembullin 2). Nga vetia e funksioneve karakteristike

Le të marrim logaritmin e shprehjes që rezulton:

Ku

Le të shpërbëhemi
me radhë në P→ ∞, duke u kufizuar në dy terma të zgjerimit, pastaj ln(1 - k) ≈ - k. Nga këtu

Ku kufiri i fundit është 0, pasi në . Prandaj,
, kjo eshte
- funksioni karakteristik i shpërndarjes normale. Pra, me një rritje të pakufizuar të numrit të termave, funksioni karakteristik i sasisë Z n i qaset në mënyrë të pakufizuar funksionit karakteristik të ligjit normal; pra ligji i shpërndarjes Z n (Dhe Y n) i afrohet normales pa kufi. Teorema është vërtetuar.

A.M. Lyapunov vërtetoi teoremën e kufirit qendror për kushtet e një forme më të përgjithshme:
Teorema 14.2 (teorema e Lyapunovit). Nëse ndryshorja e rastit Xështë shuma e një numri shumë të madh të ndryshoreve të rastësishme të pavarura reciprokisht për të cilat plotësohet kushti i mëposhtëm:

, (14.7)

Ku b k – momenti i tretë absolut qendror i madhësisë X për të, A D kështë varianca e tij, pra X ka një shpërndarje afër normales (gjendja e Lyapunov do të thotë që ndikimi i secilit term në shumë është i papërfillshëm).
Në praktikë, është e mundur të përdoret teorema e kufirit qendror me një numër mjaft të vogël termash, pasi llogaritjet probabiliste kërkojnë saktësi relativisht të ulët. Përvoja tregon se për një shumë prej dhjetë ose më pak termash, ligji i shpërndarjes së tyre mund të zëvendësohet me një normal.

Një rast i veçantë i teoremës së kufirit qendror për ndryshoret diskrete të rastit është teorema Moivre-Laplace.

Teorema 14.3 (teorema Moivre-Laplace). Nëse prodhohet P eksperimente të pavarura, në secilën prej të cilave një ngjarje A shfaqet me probabilitet R, atëherë relacioni i mëposhtëm është i vlefshëm:

(14.8)

Ku Y – numri i dukurive të ngjarjes A V P eksperimente, q = 1 – fq.

Dëshmi.

Ne do të supozojmë se
, Ku X i– numri i dukurive të ngjarjes A V i-m përvojë. Pastaj ndryshorja e rastësishme
(shih Teoremën 14.1) mund të konsiderohet i shpërndarë dhe normalizuar, prandaj, probabiliteti i rënies së tij në intervalin (α, β) mund të gjendet me formulën;

Sepse Y ka një shpërndarje binomiale, . Pastaj
. Duke e zëvendësuar këtë shprehje në formulën e mëparshme, marrim barazinë (14.8).

Pasoja.

Në kushtet e teoremës Moivre-Laplace, probabiliteti
se ngjarja A do të shfaqet në P eksperimente saktësisht k herë, me një numër të madh eksperimentesh mund të gjenden duke përdorur formulën:

(14.9)

Ku
, A
(vlerat e këtij funksioni janë dhënë në tabela të veçanta).

Shembulli 3. Gjeni probabilitetin që me 100 hedhje monedhash, numri i stemave të jetë në intervalin nga 40 në 60.

Le të zbatojmë formulën (14.8), duke marrë parasysh këtë P= 0,5. Pastaj etj= 100·0,5 = 50, Pastaj, nëse
Prandaj,

Shembulli 4. Në kushtet e shembullit të mëparshëm, gjeni probabilitetin që të shfaqen 45 stema.

Ne do të gjejmë
, Pastaj

Leksioni 15.

Konceptet bazë të statistikave matematikore. Popullsia dhe mostra. Seritë e variacioneve, seritë statistikore. Mostra e grupuar. Seritë statistikore të grupuara. Shumëkëndëshi i frekuencës. Funksioni i shpërndarjes së mostrës dhe histogrami.
Statistikat matematikore merren me vendosjen e modeleve të cilave u nënshtrohen dukuritë e rastësishme masive, bazuar në përpunimin e të dhënave statistikore të marra si rezultat i vëzhgimeve. Dy detyrat kryesore të statistikave matematikore janë:

Përcaktimi i mënyrës së mbledhjes dhe grupimit të këtyre statistikave;

Zhvillimi i metodave për analizimin e të dhënave të marra në varësi të objektivave të studimit, të cilat përfshijnë:

a) vlerësimi i probabilitetit të panjohur të një ngjarjeje; vlerësimi i funksionit të panjohur të shpërndarjes; vlerësimi i parametrave të shpërndarjes, lloji i të cilave dihet; vlerësimi i varësisë nga variabla të tjerë të rastësishëm etj.;

b) testimin e hipotezave statistikore për llojin e shpërndarjes së panjohur ose vlerat e parametrave të një shpërndarjeje të njohur.

Për të zgjidhur këto probleme, është e nevojshme të zgjidhni një numër të kufizuar objektesh nga një grup i madh objektesh homogjene, bazuar në rezultatet e studimit të të cilave mund të bëhet një parashikim në lidhje me karakteristikën e studiuar të këtyre objekteve.

Le të përcaktojmë konceptet themelore të statistikave matematikore.

Popullatë – të gjithë grupin e objekteve të disponueshme.

Mostra– një grup objektesh të zgjedhura rastësisht nga popullata e përgjithshme.

Madhësia e popullsisëN dhe madhësia e mostrësn – numri i objekteve në popullsinë në shqyrtim.

Llojet e kampionimit:

Të përsëritura– çdo objekt i përzgjedhur i kthehet popullatës së përgjithshme përpara se të zgjidhet objekti tjetër;

E pa përsëritur– objekti i përzgjedhur nuk i kthehet popullatës së përgjithshme.
Komentoni. Për të qenë në gjendje të nxjerrim përfundime nga studimi i kampionit në lidhje me sjelljen e karakteristikës së popullatës së përgjithshme që na intereson, është e nevojshme që kampioni të përfaqësojë saktë proporcionet e popullsisë së përgjithshme, d.m.th. përfaqësues(përfaqësues). Duke marrë parasysh ligjin e numrave të mëdhenj, mund të argumentohet se ky kusht plotësohet nëse secili objekt zgjidhet në mënyrë të rastësishme dhe për çdo objekt probabiliteti për t'u përfshirë në mostër është i njëjtë.
Përpunimi primar i rezultateve.

Lëreni variablin e rastësishëm që na intereson X merr vlerën në mostër X 1 P 1 here, X 2 – P 2 herë, …, X për të - P për të herë, dhe
Ku P- Madhësia e mostrës. Pastaj vlerat e vëzhguara të ndryshores së rastësishme X 1 , X 2 ,…, X për të thirrur opsione, A P 1 , P 2 ,…, P për tëfrekuencave. Nëse e ndajmë secilën frekuencë me madhësinë e kampionit, marrim frekuenca relative
Quhet një sekuencë opsionesh të shkruara në rend rritës variacionale afër, dhe një listë opsionesh dhe frekuencat e tyre përkatëse ose frekuencat relative - seri statistikore:


x i

x 1

x 2



x k

n i

n 1

n 2



n k

w i

w 1

w 2



w k

Kur kryeni 20 seri me 10 hedhje zare, numri i gjashtë pikëve doli të ishte 1,1,4,0,1,2,1,2,2,0,5,3,3,1,0,2, 2,3 ,4,1 Le të bëjmë një seri variacionesh: 0,1,2,3,4,5. Seria statistikore për frekuencat absolute dhe relative ka formën:


x i

0

1

2

3

4

5

n i

3

6

5

3

2

1

w i

0,15

0,3

0,25

0,15

0,1

0,05

Nëse studiohet ndonjë tipar i vazhdueshëm, atëherë seria e variacionit mund të përbëhet nga një numër shumë i madh numrash. Në këtë rast është më i përshtatshëm për t'u përdorur kampion i grupuar. Për ta marrë atë, intervali që përmban të gjitha vlerat e vëzhguara të atributit ndahet në disa intervale të barabarta të pjesshme të gjatësisë h, dhe më pas gjeni për çdo interval të pjesshëm n i– shuma e frekuencave të variantit të përfshirë në i intervali i th. Tabela e përpiluar nga këto rezultate quhet seritë statistikore të grupuara:

Shumëkëndëshi i frekuencës. Funksioni i shpërndarjes së mostrës dhe histogrami.
Për të vizualizuar sjelljen e ndryshores së rastësishme në studim në mostër, mund të ndërtoni grafikë të ndryshëm. Një prej tyre - diapazoni i frekuencës: një vijë e thyer, segmentet e së cilës lidhin pikat me koordinatat ( x 1 , n 1), (x 2 , n 2),…, (x k , n k), Ku x i janë paraqitur në boshtin x, dhe n i – në boshtin e ordinatave. Nëse vlerat jo-absolute vizatohen në boshtin e ordinatave ( n i), dhe të afërm ( w i) frekuenca, marrim poligonin e frekuencës relative(Fig. 1) . Oriz. 1.

Për analogji me funksionin e shpërndarjes së një ndryshoreje të rastësishme, mund të specifikoni një funksion të caktuar, frekuencën relative të ngjarjes X x.

Përkufizimi 15.1.Funksioni i shpërndarjes së mostrës (empirike). thirrni funksionin F* (x), duke përcaktuar për secilën vlerë X Frekuenca relative e ngjarjes X x. Kështu,

, (15.1)

Ku P X– numri i opsioneve, më i vogël X, P- Madhësia e mostrës.
Komentoni. Në ndryshim nga funksioni empirik i shpërndarjes i gjetur në mënyrë eksperimentale, funksioni i shpërndarjes F(x) të popullatës së përgjithshme quhet funksioni teorik i shpërndarjes. F(x) përcakton probabilitetin e një ngjarjeje X x, A F* (x) – frekuenca e saj relative. Për mjaftueshëm të mëdha P, siç vijon nga teorema e Bernulit, F* (x) tenton sipas gjasave të F(x).

Nga përkufizimi i funksionit të shpërndarjes empirike është e qartë se vetitë e tij përkojnë me vetitë F(x), domethënë:


  1. 0 ≤F* (x) ≤ 1.

  2. F* (x) është një funksion që nuk zvogëlohet.

  3. Nëse X Atëherë 1 është opsioni më i vogël F* (x) = 0 në XX 1 ; Nëse X për të - opsioni më i madh, pra F* (x) = 1 në X> X për të .
Për një veçori të vazhdueshme, një ilustrim grafik është grafik me shtylla, domethënë një figurë me shkallë të përbërë nga drejtkëndësha, bazat e të cilave janë intervale të pjesshme të gjatësisë h, dhe lartësitë gjatesite n i / h(histogrami i frekuencës) ose w i / h (histogram i frekuencave relative). Në rastin e parë, zona e histogramit është e barabartë me vëllimin e mostrës, në të dytën - uniteti (Fig. 2). Fig.2.

Leksioni 16.

Karakteristikat numerike të një shpërndarje statistikore: mesatarja e mostrës, vlerësimet e variancës, vlerësimet e modës dhe mesatares, vlerësimet e momenteve fillestare dhe qendrore. Përshkrimi statistikor dhe llogaritja e vlerësimeve të parametrave për një vektor të rastësishëm dydimensional.
Një nga detyrat e statistikave matematikore është të vlerësojë vlerat e karakteristikave numerike të ndryshores së rastësishme që studiohet duke përdorur mostrën e disponueshme.

Përkufizimi 16.1.Mesatarja e mostrësështë mesatarja aritmetike e vlerave të variablave të rastësishme të marra në mostër:

, (16.1)

Ku x i- opsione, n i- frekuencat.

Komentoni. Mesatarja e kampionit shërben për të vlerësuar pritshmërinë matematikore të ndryshores së rastësishme në studim. Çështja se sa i saktë është një vlerësim i tillë do të diskutohet më vonë.

Përkufizimi 16.2.Varianca e mostrës thirrur

, (16.2)

A devijimi standard i mostrës

(16.3)

Ashtu si në teorinë e variablave të rastësishëm, mund të vërtetohet se formula e mëposhtme për llogaritjen e variancës së mostrës është e vlefshme:

. (16.4)

Shembulli 1. Le të gjejmë karakteristikat numerike të një kampioni të dhënë nga një seri statistikore


x i

2

5

7

8

n i

3

8

7

2

Karakteristikat e tjera të serisë së variacioneve janë:

- modësM 0 – opsioni me frekuencën më të lartë (në shembullin e mëparshëm M 0 = 5).

- mesatareT e - opsioni, i cili e ndan serinë e variacioneve në dy pjesë, të barabarta në numër opsionesh. Nëse opsioni i numrit është tek ( n = 2k+ 1), atëherë m e = x k + 1, dhe për madje n = 2k
. Në veçanti, në shembullin 1

Vlerësimet e momenteve fillestare dhe qendrore (të ashtuquajturat momente empirike) përcaktohen në mënyrë të ngjashme me momentet teorike përkatëse:

- momenti fillestar empirik i renditk thirrur

. (16.5)

Veçanërisht,
, domethënë, momenti empirik fillestar i rendit të parë është i barabartë me mesataren e mostrës.

- momenti qendror empirik i renditk thirrur

. (16.6)

Veçanërisht,
, domethënë, momenti empirik qendror i rendit të dytë është i barabartë me variancën e mostrës.
Përshkrimi statistikor dhe llogaritja e karakteristikave

vektor i rastësishëm dydimensional.
Në studimin statistikor të variablave të rastësishëm dydimensionale, detyra kryesore është zakonisht identifikimi i marrëdhënies midis komponentëve.

Një mostër dy-dimensionale është një grup vlerash vektoriale të rastësishme: ( X 1 , 1), (X 2 , 2), …, (X P , y P). Për të, ju mund të përcaktoni mesataret e mostrave të përbërësve:

dhe variancat përkatëse të mostrës dhe devijimet standarde. Përveç kësaj, mund të llogaritet mesataret e kushtëzuara: - mesatarja aritmetike e vlerave të vëzhguara Y, përkatëse X = x, Dhe - mesatarja e vlerave të vëzhguara X, përkatëse Y = y.

Nëse ka një varësi midis përbërësve të një ndryshoreje të rastësishme dy-dimensionale, ajo mund të ketë forma të ndryshme: varësi funksionale, nëse çdo vlerë e mundshme X përputhet me një vlerë Y, dhe statistikore, në të cilat një ndryshim në një sasi çon në një ndryshim në shpërndarjen e një tjetre. Nëse, si rezultat i një ndryshimi në një vlerë, ndryshon vlera mesatare e një tjetre, atëherë varësia statistikore midis tyre quhet korrelacion.

Leksioni 17.

Vetitë themelore të karakteristikave statistikore të parametrave të shpërndarjes: paanshmëria, qëndrueshmëria, efikasiteti. Paanshmëria dhe konsistenca e kampionit do të thotë si një vlerësim i pritshmërisë matematikore. Paragjykimi i variancës së kampionimit. Një shembull i një vlerësuesi të paanshëm të variancës. Vlerësime asimptotike të paanshme. Metodat për ndërtimin e vlerësimeve: metoda e gjasave maksimale, metoda e momenteve, metoda kuantile, metoda e katrorëve më të vegjël, qasja Bayesian për marrjen e vlerësimeve.
Pasi të keni marrë vlerësime statistikore të parametrave të shpërndarjes (mesatarja e mostrës, varianca e mostrës, etj.), Ju duhet të siguroheni që ato të shërbejnë mjaftueshëm si një përafrim i karakteristikave përkatëse të popullatës. Le të përcaktojmë kërkesat që duhet të plotësohen.

Le të jetë Θ* një vlerësim statistikor i parametrit të panjohur Θ të shpërndarjes teorike. Le të nxjerrim disa mostra me të njëjtën madhësi nga popullata e përgjithshme P dhe llogaritni për secilën prej tyre vlerësimin e parametrit Θ:
Atëherë vlerësimi Θ* mund të konsiderohet si një ndryshore e rastësishme që merr vlera të mundshme Nëse pritshmëria matematikore Θ* nuk është e barabartë me parametrin e vlerësuar, do të marrim gabime sistematike të së njëjtës shenjë gjatë llogaritjes së vlerësimeve (në tejkalim, nëse). M(Θ*) >Θ, dhe me një disavantazh nëse M(Θ*) М (Θ*) = Θ.
Përkufizimi 17.2. Vlerësimi statistikor Θ* quhet i paanshëm, nëse pritshmëria e tij matematikore është e barabartë me parametrin e vlerësuar Θ për çdo madhësi kampioni:

M(Θ*) = Θ. (17.1)

I zhvendosur quhet një vlerësim, pritshmëria matematikore e të cilit nuk është e barabartë me parametrin e vlerësuar.

Megjithatë, paanshmëria nuk është një kusht i mjaftueshëm për një përafrim të mirë me vlerën e vërtetë të parametrit të vlerësuar. Nëse, në këtë rast, vlerat e mundshme të Θ* mund të devijojnë ndjeshëm nga vlera mesatare, domethënë shpërndarja e Θ* është e madhe, atëherë vlera e gjetur nga të dhënat e një kampioni mund të ndryshojë ndjeshëm nga parametri i vlerësuar. Prandaj, është e nevojshme të vendosen kufizime në shpërndarje.
Përkufizimi 17.2. Vlerësimi statistikor quhet efektive, nëse është për një madhësi të caktuar kampioni P ka variancën më të vogël të mundshme.
Kur merren parasysh mostra të mëdha, vlerësimet statistikore i nënshtrohen gjithashtu kërkesës për konsistencë.
Përkufizimi 17.3.I pasur quhet vlerësim statistikor që, kur P→∞ tenton në probabilitet te parametri i vlerësuar (nëse ky vlerësim është i paanshëm, atëherë do të jetë konsistent nëse, P→∞ varianca e tij tenton në 0).
Le të sigurohemi që paraqet një vlerësim të paanshëm të pritshmërisë matematikore M(X).

Ne do ta konsiderojmë atë si një ndryshore të rastësishme, dhe X 1 , X 2 ,…, X P, pra vlerat e variablit të rastësishëm në studim që përbëjnë kampionin, – si variabla të rastësishme të pavarura, të shpërndara identike X 1 , X 2 ,…, X P, duke pasur pritshmëri matematikore A. Nga vetitë e pritshmërisë matematikore del se

Por, meqenëse secila nga sasitë X 1 , X 2 ,…, X P ka të njëjtën shpërndarje si popullsia e përgjithshme, A = M(X), kjo eshte M(
) = M(X), që ishte ajo që duhej vërtetuar. Mesatarja e mostrës nuk është vetëm një vlerësim i paanshëm, por edhe i qëndrueshëm i pritshmërisë matematikore. Duke supozuar se X 1 , X 2 ,…, X P kanë varianca të kufizuara, atëherë nga teorema e Chebyshev rrjedh se mesatarja e tyre aritmetike, domethënë me rritje P priret në probabilitet ndaj pritshmërisë matematikore A secila prej vlerave të tyre, pra të M(X). Rrjedhimisht, mesatarja e mostrës është një vlerësim konsistent i pritshmërisë matematikore.

Ndryshe nga mesatarja e mostrës, varianca e mostrës është një vlerësim i njëanshëm i variancës së popullatës. Mund të vërtetohet se

, (17.2)

Ku D G – vlera e vërtetë e variancës së popullsisë. Një vlerësim tjetër i shpërndarjes mund të propozohet: variancë e korrigjuars ² , llogaritur me formulë

. (17.3)

Një vlerësim i tillë do të jetë i paanshëm. Përputhet korrigjuar devijimin standard

. (17.4)

Përkufizimi 17.4. Vlerësimi i disa atributeve quhet asimptotikisht i paanshëm, nëse për mostër X 1 , X 2 , …, X P

, (17.5)

Ku X– vlera e vërtetë e sasisë së studiuar.
Metodat për ndërtimin e vlerësimeve.
1. Metoda e gjasave maksimale.
Le X– ndryshore e rastësishme diskrete, e cila si rezultat P testet morën vlera X 1 , X 2 , …, X P. Le të supozojmë se e dimë ligjin e shpërndarjes së kësaj sasie, të përcaktuar nga parametri Θ, por nuk e dimë vlerën numerike të këtij parametri. Le të gjejmë vlerësimin e pikës së tij.

Le R(X i, Θ) është probabiliteti që si rezultat i testit vlera X do të marrë vlerën X i. Le të thërrasim funksioni i gjasave ndryshore diskrete e rastësishme X Funksioni i argumentit Θ, i përcaktuar nga formula:

L (X 1 , X 2 , …, X P ; Θ) = fq(x 1, Θ) fq(x 2, Θ)… fq(x n ,Θ).

Pastaj, si vlerësim pikësor i parametrit Θ, marrim vlerën e tij Θ* = Θ( X 1 , X 2 , …, X P), në të cilën funksioni i gjasave arrin maksimumin e tij. Vlerësimi Θ* quhet vlerësimi i gjasave maksimale.

Që nga funksionet L dhe ln L arrini një maksimum në të njëjtën vlerë të Θ, është më e përshtatshme të kërkoni maksimumin ln Lfunksioni i gjasave log. Për ta bërë këtë ju duhet:


Përparësitë e metodës së gjasave maksimale: vlerësimet e marra janë konsistente (edhe pse mund të jenë të njëanshme), të shpërndara në mënyrë asimptotike normalisht për vlera të mëdha P dhe kanë variancën më të vogël në krahasim me vlerësimet e tjera asimptotike normale; nëse për parametrin e vlerësuar Θ ka një vlerësim efektiv Θ*, atëherë ekuacioni i gjasave ka një zgjidhje unike Θ*; Metoda bën përdorimin më të plotë të të dhënave të mostrës dhe për këtë arsye është veçanërisht e dobishme në rastin e mostrave të vogla.

Disavantazhi i metodës së gjasave maksimale: kompleksiteti llogaritës.
Për një ndryshore të rastësishme të vazhdueshme me një lloj të njohur të densitetit të shpërndarjes f(x) dhe një parametër të panjohur Θ, funksioni i gjasave ka formën:

L (X 1 , X 2 , …, X P ; Θ) = f(x 1, Θ) f(x 2, Θ)… f(x n ,Θ).

Vlerësimi maksimal i gjasave për një parametër të panjohur kryhet në të njëjtën mënyrë si për një ndryshore të rastësishme diskrete.
2. Metoda e momenteve.
Metoda e momenteve bazohet në faktin se momentet empirike fillestare dhe qendrore janë vlerësime konsistente të momenteve teorike fillestare dhe qendrore, përkatësisht, kështu që është e mundur të barazohen momentet teorike me momentet empirike përkatëse të rendit të njëjtë.

Nëse specifikohet lloji i densitetit të shpërndarjes f(x, Θ), i përcaktuar nga një parametër i panjohur Θ, atëherë për të vlerësuar këtë parametër mjafton të kemi një ekuacion. Për shembull, mund të barazoni momentet fillestare të rendit të parë:

,

duke marrë kështu një ekuacion për përcaktimin e Θ. Zgjidhja e saj Θ* do të jetë një vlerësim pikësor i parametrit, i cili është një funksion i mesatares së mostrës dhe, për rrjedhojë, i variantit të mostrës:

Θ = ψ ( X 1 , X 2 , …, X P).

Nëse tipi i njohur i densitetit të shpërndarjes f(x, Θ 1, Θ 2) përcaktohet nga dy parametra të panjohur Θ 1 dhe Θ 2, atëherë është e nevojshme të krijohen dy ekuacione, për shembull

ν 1 = M 1, μ 2 = T 2 .

Nga këtu
- një sistem me dy ekuacione me dy të panjohura Θ 1 dhe Θ 2. Zgjidhjet e tij do të jenë vlerësimet e pikës Θ 1 * dhe Θ 2 * - funksionet e opsionit të kampionimit:

Θ 1 = ψ 1 ( X 1 , X 2 , …, X P),

Θ 2 = ψ 2 ( X 1 , X 2 , …, X P).
3. Metoda e katrorëve më të vegjël.

Nëse keni nevojë të vlerësoni varësinë e sasive Dhe X, dhe forma e funksionit që i lidh ato është e njohur, por vlerat e koeficientëve të përfshirë në të janë të panjohura, vlerat e tyre mund të vlerësohen nga mostra e disponueshme duke përdorur metodën e katrorëve më të vegjël; Për këtë qëllim funksioni = φ ( X) zgjidhet në mënyrë që shuma e devijimeve në katror të vlerave të vëzhguara 1 , 2 ,…, P nga φ( X i) ishte minimale:

Në këtë rast, është e nevojshme të gjendet pika e palëvizshme e funksionit φ( x; a, b, c), domethënë, zgjidhni sistemin:

(zgjidhja, natyrisht, është e mundur vetëm në rastin kur dihet forma specifike e funksionit φ).

Le të shqyrtojmë, si shembull, zgjedhjen e parametrave të një funksioni linear duke përdorur metodën e katrorëve më të vegjël.

Për të vlerësuar parametrat A Dhe b në funksion y = sëpatë + b, do të gjejmë
Pastaj
. Nga këtu
. Pjesëtimi i të dy ekuacioneve rezultuese me P dhe duke kujtuar përkufizimet e momenteve empirike, mund të marrim shprehje për A Dhe b si:

. Prandaj, lidhja ndërmjet X Dhe mund të specifikohet në formën:


4. Qasja Bayesian për marrjen e vlerësimeve.
le ( Y, X) – vektor i rastësishëm për të cilin dihet dendësia R(|x) shpërndarja e kushtëzuar Y në çdo vlerë X = x. Nëse eksperimenti rezulton vetëm me vlera Y, dhe vlerat përkatëse X e panjohur, pastaj për të vlerësuar një funksion të dhënë φ( X) si vlerë e përafërt e tij, propozohet të kërkohet pritshmëria matematikore e kushtëzuar M (φ‌‌( X)‌‌‌‌‌‌|Y), e llogaritur me formulën:

, Ku, R(X X, q(y) – dendësia e shpërndarjes së pakushtëzuar Y. Një problem mund të zgjidhet vetëm kur dihet R(X). Ndonjëherë, megjithatë, është e mundur të ndërtohet një vlerësim i qëndrueshëm për q(y), në varësi vetëm nga vlerat e marra në mostër Y.

Leksioni 18.

Vlerësimi i intervalit të parametrave të panjohur. Saktësia e vlerësimit, niveli i besimit (besueshmëria), intervali i besueshmërisë. Ndërtimi i intervaleve të besimit për vlerësimin e pritshmërisë matematikore të një shpërndarjeje normale me variancë të njohur dhe të panjohur. Intervalet e besimit për vlerësimin e devijimit standard të një shpërndarjeje normale.
Me një madhësi të vogël kampioni, vlerësimi i pikës mund të ndryshojë ndjeshëm nga parametri i vlerësuar, gjë që çon në gabime të mëdha. Prandaj, në këtë rast është më mirë të përdoret vlerësimet e intervalit, domethënë, tregoni intervalin në të cilin vlera e vërtetë e parametrit të vlerësuar bie me një probabilitet të caktuar. Natyrisht, sa më e shkurtër të jetë gjatësia e këtij intervali, aq më i saktë është vlerësimi i parametrave. Prandaj, nëse pabarazia | Θ* - Θ | 0 karakterizon saktësia e vlerësimit(sa më i vogël δ, aq më i saktë është vlerësimi). Por metodat statistikore na lejojnë të themi vetëm se kjo pabarazi është e kënaqur me njëfarë probabiliteti.

Përkufizimi 18.1.Besueshmëria (probabiliteti i besimit) vlerësimi Θ* i parametrit Θ është probabiliteti γ që pabarazia të plotësohet | Θ* - Θ |
fq (Θ* - δ
Kështu, γ është probabiliteti që Θ bie në intervalin (Θ* - δ, Θ* + δ).

Përkufizimi 18.2.I besuarështë intervali në të cilin bie parametri i panjohur me një besueshmëri të caktuar γ.
Ndërtimi i intervaleve të besimit.
1. Intervali i besimit për vlerësimin e pritshmërisë matematikore të një shpërndarjeje normale me një variancë të njohur.

Lëreni variablin e rastësishëm në studim X shpërndahet sipas ligjit normal me një katror mesatar të njohur σ, dhe kërkohet të vlerësohet pritshmëria e tij matematikore bazuar në vlerën e mesatares së mostrës A. Ne do ta konsiderojmë mesataren e mostrës si një ndryshore të rastësishme dhe vlerat janë opsioni i mostrës X 1 , X 2 ,…, X P si variabla të rastësishme të pavarura të shpërndara në mënyrë identike X 1 , X 2 ,…, X P, secila prej të cilave ka një pritje matematikore A dhe devijimi standard σ. ku M() = A,
(përdorim vetitë e pritjes matematikore dhe dispersionit të shumës së variablave të rastësishme të pavarura). Le të vlerësojmë probabilitetin e pabarazisë
. Le të zbatojmë formulën për probabilitetin që një ndryshore e rastësishme e shpërndarë normalisht të bjerë në një interval të caktuar:

R (
) = 2F
. Më pas, duke marrë parasysh faktin se, R() = 2F
=

2F( t), Ku
. Nga këtu
, dhe barazia e mëparshme mund të rishkruhet si më poshtë:

. (18.1)

Pra, vlera e pritjes matematikore A me probabilitet (besueshmëri) γ bie në interval
, ku vlera t përcaktohet nga tabelat për funksionin Laplace në mënyrë që barazia 2Ф( t) = γ.
Shembull. Le të gjejmë intervalin e besimit për pritshmërinë matematikore të një ndryshoreje të rastësishme të shpërndarë normalisht nëse madhësia e kampionit P = 49,
σ = 1,4, dhe probabiliteti i besimit γ = 0,9.

Le të përcaktojmë t, në të cilën Ф( t) = 0,9:2 = 0,45: t= 1.645. Pastaj

, ose 2,471 a a me një besueshmëri prej 0,9.
2. Intervali i besimit për vlerësimin e pritshmërisë matematikore të një shpërndarjeje normale me variancë të panjohur.

Nëse dihet se ndryshorja e rastësishme në studim X shpërndahet sipas një ligji normal me një devijim standard të panjohur, më pas për të gjetur një interval besimi për pritshmërinë e tij matematikore, ndërtojmë një ndryshore të re të rastësishme.

, (18.2)

Ku - mesatarja e mostrës, s- varianca e korrigjuar, P- Madhësia e mostrës. Kjo ndryshore e rastësishme, vlerat e mundshme të së cilës do të shënohen me t, ka një shpërndarje Studenti (shih Leksionin 12) me k = n– 1 shkallë lirie.

Që nga dendësia e shpërndarjes Student
, Ku
, nuk varet shprehimisht nga A dhe σ, ju mund të vendosni probabilitetin që ai të bjerë në një interval të caktuar (- t γ , t γ ), duke marrë parasysh barazinë e densitetit të shpërndarjes, si më poshtë:
. Nga këtu marrim:

(18.3)

Kështu, u mor një interval besimi për A, Ku t γ mund të gjenden nga tabela përkatëse për të dhënë P dhe γ.

Shembull. Lëreni madhësinë e mostrës P = 25, = 3, s= 1.5. Le të gjejmë intervalin e besimit për A në γ = 0,99. Nga tabela gjejmë se t γ (P= 25, γ = 0,99) = 2,797. Pastaj
, ose 2,161a a me një probabilitet prej 0,99.
3. Intervalet e besimit për vlerësimin e devijimit standard të një shpërndarjeje normale.

Ne do të kërkojmë një interval besimi të formularit ( s – δ, s), Ku sështë devijimi standard i mostrës së korrigjuar dhe për δ plotësohet kushti i mëposhtëm: fq (|σ – s|
Le ta shkruajmë këtë pabarazi në formën:
ose, duke caktuar
,

Le të shqyrtojmë variablin e rastësishëm χ, të përcaktuar nga formula

,

e cila shpërndahet sipas ligjit chi-katror me P-1 shkallë lirie (shih leksionin 12). Dendësia e shpërndarjes së tij

nuk varet nga parametri i vlerësuar σ, por varet vetëm nga madhësia e kampionit P. Le të transformojmë pabarazinë (18.4) në mënyrë që të marrë formën χ 1 Le të supozojmë se q

,

ose, pas shumëzimit me
,
. Prandaj,
. Pastaj
Ka tabela për shpërndarjen chi-square nga të cilat mund të gjeni q sipas dhënë P dhe γ pa zgjidhur këtë ekuacion. Kështu, duke llogaritur vlerën nga mostra s dhe përcaktimi i vlerës nga tabela q, mund të gjejmë intervalin e besimit (18.4), në të cilin vlera σ bie me një probabilitet të dhënë γ.
Komentoni. Nëse q> 1, atëherë, duke marrë parasysh kushtin σ > 0, intervali i besimit për σ do të ketë kufij

. (18.5)

Le P = 20, s= 1.3. Le të gjejmë intervalin e besueshmërisë për σ për një besueshmëri të caktuar γ = 0,95. Nga tabela përkatëse gjejmë q (n= 20, γ = 0,95) = 0,37. Prandaj, kufijtë e intervalit të besimit janë: 1,3(1-0,37) = 0,819 dhe 1,3 (1+0,37) = 1,781. Pra, 0.819



Ju pëlqeu artikulli? Ndani me miqtë tuaj!