Tikimybių pasiskirstymas priklausomai nuo parametrų. Normalaus tikimybių skirstinio dėsnis

Kokia tikimybinio samprotavimo idėja?

Pirmas, pats natūraliausias tikimybinio samprotavimo žingsnis yra toks: jei turite kokį nors kintamąjį, kuris įgauna reikšmes atsitiktinai, tuomet norėtumėte sužinoti, su kokiomis tikimybėmis tas kintamasis įgauna tam tikras reikšmes. Šių tikimybių visuma nurodo tikimybių skirstinį. Pavyzdžiui, duotas kauliukas, galite a priori darykime prielaidą, kad su lygiomis 1/6 tikimybėmis jis kris ant bet kurio krašto. Ir tai atsitinka, jei kaulas yra simetriškas. Jei kauliukas yra asimetriškas, tuomet remiantis eksperimentiniais duomenimis galima nustatyti didesnę tikimybę tiems veidams, kurie iškrenta dažniau, o mažesnes – tiems, kurie iškrenta rečiau. Jei koks nors veidas visai nepasirodo, tada jam galima priskirti tikimybę 0. Tai paprasčiausias tikimybinis dėsnis, kuriuo galima apibūdinti kauliuko metimo rezultatus. Žinoma, tai itin paprastas pavyzdys, tačiau panašių problemų kyla, pavyzdžiui, atliekant aktuarinius skaičiavimus, kai reali rizika išduodant draudimo liudijimą apskaičiuojama remiantis realiais duomenimis.

Šiame skyriuje apžvelgsime dažniausiai praktikoje atsirandančius tikimybinius dėsnius.

Šių skirstinių grafikus galima lengvai nubraižyti STATISTIKA.

Normalus pasiskirstymas

Normalusis tikimybių skirstinys ypač dažnai naudojamas statistikoje. Normalus pasiskirstymas yra geras realaus pasaulio reiškinių modelis, kuriame:

1) yra didelė tendencija, kad duomenys telkiasi aplink centrą;

2) vienodai tikėtini teigiami ir neigiami nukrypimai nuo centro;

3) nukrypimų dažnis greitai krenta, kai nukrypimai nuo centro tampa dideli.

Mechanizmas, kuriuo grindžiamas normalusis skirstinys, paaiškintas naudojant vadinamąją centrinės ribos teoremą, gali būti vaizdžiai apibūdintas taip. Įsivaizduokite, kad turite žiedadulkių dalelių, kurias atsitiktinai įmetėte į stiklinę vandens. Žvelgdami į vieną dalelę po mikroskopu, pamatysite nuostabų reiškinį – dalelė juda. Žinoma, taip nutinka todėl, kad vandens molekulės juda ir savo judėjimą perduoda suspenduotoms žiedadulkių dalelėms.

Bet kaip tiksliai vyksta judėjimas? Čia įdomesnis klausimas. Ir šis judėjimas yra labai keistas!

Yra be galo daug nepriklausomų įtakų atskiroms žiedadulkių dalelėms vandens molekulių poveikio pavidalu, dėl kurių dalelė juda labai keista trajektorija. Žiūrint į mikroskopą, šis judesys primena pakartotinai ir chaotiškai nutrūkstamą liniją. Šių kinkų neįmanoma numatyti, juose nėra modelio, kuris tiksliai atitinka chaotišką molekulių poveikį dalelei. Pakibusioji dalelė, atsitiktiniu laiko momentu patyrusi vandens molekulės smūgį, pakeičia savo judėjimo kryptį, po to kurį laiką juda pagal inerciją, tada vėl patenka į kitos molekulės poveikį ir pan. Nuostabus biliardas pasirodo vandens stiklinėje!

Kadangi molekulių judėjimas turi atsitiktinę kryptį ir greitį, trajektorijos kinkų dydis ir kryptis taip pat yra visiškai atsitiktiniai ir nenuspėjami. Šis nuostabus reiškinys, vadinamas Browno judesiu, atrastas XIX amžiuje, suteikia mums daug pamąstymų.

Jeigu įvesime tinkamą sistemą ir pažymėsime dalelės koordinates tam tikrais laiko momentais, tai gausime normalųjį dėsnį. Tiksliau, žiedadulkių dalelių poslinkiai, atsirandantys dėl molekulinio poveikio, paklus įprastam dėsniui.

Pirmą kartą tokios dalelės judėjimo dėsnį, vadinamą Brownianu, fiziniu griežtumo lygiu aprašė A. Einšteinas. Tada Lenževanas sukūrė paprastesnį ir intuityvesnį požiūrį.

XX amžiaus matematikai šiai teorijai skyrė savo geriausius puslapius, o pirmasis žingsnis buvo žengtas prieš 300 metų, kai buvo atrasta paprasčiausia centrinės ribos teoremos versija.

Tikimybių teorijoje centrinė ribos teorema, iš pradžių žinoma dar XVII amžiuje suformuluojant Moivre'ą ir Laplasą, kaip garsiojo J. Bernoulli (1654-1705) didelių skaičių dėsnio plėtrą (žr. J. Bernoulli (1713)). , Ars Conjectandi), šiuo metu yra itin išvystytas ir pasiekė savo aukštumas. šiuolaikiniame nekintamumo principu, kurio kūrime reikšmingą vaidmenį suvaidino rusų matematikos mokykla. Būtent šiuo principu Brauno dalelės judėjimas randa savo griežtą matematinį paaiškinimą.

Idėja ta, kad susumavus daug nepriklausomų dydžių (molekulių susidūrimai su žiedadulkių dalelėmis), tam tikromis pagrįstomis sąlygomis gaunami normaliai pasiskirstę dydžiai. Ir tai vyksta nepriklausomai, tai yra, nekintant, nuo pradinių reikšmių pasiskirstymo. Kitaip tariant, jei tam tikrą kintamąjį įtakoja daug veiksnių, šie poveikiai yra nepriklausomi, santykinai nedideli ir sumuojasi vienas su kitu, tada gauta reikšmė turi normalųjį pasiskirstymą.

Pavyzdžiui, beveik be galo daug veiksnių lemia žmogaus svorį (tūkstančiai genų, polinkis, ligos ir kt.). Taigi būtų galima tikėtis normalaus svorio pasiskirstymo visų asmenų populiacijoje.

Jei esate finansininkas ir žaidžiate akcijų rinkoje, tuomet, žinoma, žinote atvejų, kai akcijų kainos elgiasi kaip Brauno dalelės, patiriančios chaotišką daugelio veiksnių poveikį.

Formaliai normalaus pasiskirstymo tankis parašytas taip:

kur a ir õ 2 yra dėsnio parametrai, atitinkamai interpretuojami kaip duoto atsitiktinio dydžio vidurkis ir dispersija (dėl ypatingo normaliojo skirstinio vaidmens jo tankio funkcijai ir pasiskirstymo funkcijai žymėti naudosime specialius simbolius). Vizualiai normalaus tankio grafikas yra garsioji varpo formos kreivė.

Atitinkama normalaus atsitiktinio dydžio (a,õ 2) pasiskirstymo funkcija žymima Ф(x; a,õ 2) ir pateikiama ryšiu:


Normalusis dėsnis, kurio parametrai a = 0 ir õ 2 = 1, vadinamas standartiniu.

Atvirkštinė standartinio normaliojo skirstinio funkcija, taikoma z reikšmei, 0

Norėdami apskaičiuoti z iš x ir atvirkščiai, naudokite STATISTICA tikimybių skaičiuoklę.

Pagrindinės įprasto įstatymo ypatybės:

Vidurkis, režimas, mediana: E=x mod =x med =a;

Sklaida: D=õ 2 ;

Asimetrija:

Perteklius:

Iš formulių aišku, kad normalusis skirstinys apibūdinamas dviem parametrais:

a - vidurkis - vidutinis;

õ - standartinis nuokrypis - standartinis nuokrypis, skaitykite: „sigma“.

Kartais su standartinis nuokrypis vadinamas standartiniu nuokrypiu, bet tai jau pasenusi terminija.

Štai keletas naudingų faktų apie normalųjį pasiskirstymą.

Vidutinė vertė nustato tankio vietos matą. Normaliojo skirstinio tankis yra simetriškas vidurkio atžvilgiu. Normaliojo skirstinio vidurkis sutampa su mediana ir moda (žr. grafikus).

Normaliojo pasiskirstymo tankis su dispersija 1 ir vidurkiu 1

Normalaus pasiskirstymo tankis, kai vidurkis 0 ir dispersija 0,01

Normaliojo pasiskirstymo tankis, kai vidurkis 0 ir dispersija 4

Didėjant dispersijai, normalaus pasiskirstymo tankis išsiskleidžia arba plinta išilgai OX ašies, kai dispersija mažėja, ji, priešingai, susitraukia, susitelkdama aplink vieną tašką – didžiausios vertės tašką, kuris sutampa su vidutine verte; . Ribiniu nulinės dispersijos atveju atsitiktinis dydis išsigimsta ir įgauna vieną reikšmę, lygią vidurkiui.

Naudinga žinoti 2 ir 3 sigmų arba 2 ir 3 standartinių nuokrypių taisykles, kurios yra susijusios su normaliuoju pasiskirstymu ir naudojamos įvairiose srityse. Šių taisyklių prasmė labai paprasta.

Jei nuo vidutinio arba, kas yra tas pats, nuo normalaus skirstinio maksimalaus tankio taško, atitinkamai į dešinę ir į kairę dedame du ir tris standartinius nuokrypius (2 ir 3 sigmas), tada plotas po normalaus tankio grafiku, apskaičiuotas pagal šį intervalą, bus atitinkamai lygus 95,45% ir 99,73% viso ploto po grafiku (patikrinkite STATISTICA tikimybių skaičiuoklėje!).

Kitaip tariant, jis gali būti išreikštas taip: 95,45% ir 99,73% visų nepriklausomų stebėjimų normalioje populiacijoje, pavyzdžiui, dalies dydis ar akcijų kaina, yra 2 ir 3 standartinių nuokrypių nuo vidurkio ribose.

Vienodas paskirstymas

Vienodas paskirstymas yra naudingas aprašant kintamuosius, kurių kiekviena reikšmė yra vienodai tikėtina, kitaip tariant, kintamojo reikšmės yra tolygiai paskirstytos tam tikram regionui.

Žemiau pateikiamos vienodo atsitiktinio dydžio tankio ir pasiskirstymo funkcijos formulės, imant reikšmes intervale [a, b].

Iš šių formulių nesunku suprasti, kad tikimybė, kad vienodas atsitiktinis kintamasis paims reikšmes iš aibės [c, d] [a, b], lygus (d – c)/(b – a).

Padėkime a=0,b=1. Žemiau pateikiamas vienodo tikimybės tankio grafikas, kurio centras yra segmentas.

Vienodo įstatymo skaitinės charakteristikos:

Eksponentinis pasiskirstymas

Atsiranda įvykių, kuriuos kasdienėje kalboje galima pavadinti retais. Jei T yra laikas tarp retų įvykių, kurių intensyvumas vidutiniškai pasireiškia X, tada reikšmė
T turi eksponentinį skirstinį su parametru (lambda). Eksponentinis pasiskirstymas dažnai naudojamas apibūdinti intervalus tarp nuoseklių atsitiktinių įvykių, pvz., intervalus tarp apsilankymų nepopuliarioje svetainėje, nes šie apsilankymai yra reti įvykiai.

Šis paskirstymas turi labai įdomią savybę, kad nėra poveikio, arba, kaip jie taip pat sako, Markovo savybę garsaus rusų matematiko A. A. Markovo garbei, kurią galima paaiškinti taip. Jei pasiskirstymas tarp tam tikrų įvykių momentų yra orientacinis, tada pasiskirstymas skaičiuojamas nuo bet kurio momento t iki kito įvykio, taip pat turi eksponentinį skirstinį (su tuo pačiu parametru).

Kitaip tariant, retų įvykių sraute kito lankytojo laukimo laikas visada pasiskirsto eksponentiškai, nepaisant to, kiek laiko jau laukėte jo.

Eksponentinis skirstinys yra susijęs su Puasono skirstiniu: vienetiniame laiko intervale įvykių, tarp kurių intervalai yra nepriklausomi ir pasiskirstę eksponentiškai, skaičius turi Puasono skirstinį. Jei intervalai tarp apsilankymų svetainėje yra pasiskirstę eksponentinį, tai apsilankymų skaičius, pavyzdžiui, per valandą, paskirstomas pagal Puasono dėsnį.

Eksponentinis skirstinys yra ypatingas Weibull skirstinio atvejis.

Jei laikas yra ne tolydis, o diskretus, tai eksponentinės skirstinio analogas yra geometrinis skirstinys.

Eksponentinis pasiskirstymo tankis apibūdinamas formule:

Šis skirstinys turi tik vieną parametrą, kuris lemia jo charakteristikas.

Eksponentinio pasiskirstymo tankio grafikas atrodo taip:

Pagrindinės skaitinės eksponentinio skirstinio charakteristikos:

Erlang platinimas

Šis nuolatinis pasiskirstymas yra orientuotas į (0,1) ir jo tankis:

Lūkesčiai ir dispersija yra atitinkamai vienodi

Erlango paskirstymas pavadintas A. Erlango vardu, kuris pirmą kartą panaudojo jį eilių ir telefonijos teorijos uždaviniuose.

Erlango skirstinys su parametrais µ ir n yra n nepriklausomų, vienodai paskirstytų atsitiktinių dydžių, kurių kiekvienas turi eksponentinį skirstinį su parametru nµ, sumos skirstinys.

At n = 1 Erlang skirstinys yra toks pat kaip eksponentinis arba eksponentinis skirstinys.

Laplaso pasiskirstymas

Laplaso tankio funkcija arba dvigubas eksponentinis, kaip ji dar vadinama, naudojama, pavyzdžiui, apibūdinti klaidų pasiskirstymą regresijos modeliuose. Žvelgdami į šio skirstinio grafiką pamatysite, kad jis susideda iš dviejų eksponentinių skirstinių, simetriškų OY ašiai.

Jei padėties parametras yra 0, Laplaso pasiskirstymo tankio funkcija yra tokia:

Pagrindinės šio pasiskirstymo įstatymo skaitinės charakteristikos, darant prielaidą, kad padėties parametras yra nulis, yra šios:

Apskritai Laplaso pasiskirstymo tankis turi tokią formą:

a yra skirstinio vidurkis; b - mastelio parametras; e – Eilerio skaičius (2,71...).

Gama pasiskirstymas

Eksponentinio skirstinio tankis turi režimą taške 0, ir tai kartais yra nepatogu praktiniam pritaikymui. Daugelyje pavyzdžių iš anksto žinoma, kad nagrinėjamo atsitiktinio dydžio režimas nėra lygus 0, pavyzdžiui, intervalai tarp pirkėjo atvykimo į elektroninės prekybos parduotuvę ar apsilankymų svetainėje turi ryškų režimą. Tokiems įvykiams modeliuoti naudojamas gama skirstinys.

Gama pasiskirstymo tankis turi tokią formą:

kur Г yra Eulerio Г funkcija, a > 0 yra „formos“ parametras, o b > 0 yra mastelio parametras.

Konkrečiu atveju turime Erlango skirstinį ir eksponentinį skirstinį.

Pagrindinės gama pasiskirstymo charakteristikos:

Žemiau yra du gama tankio grafikai, kurių skalės parametras yra 1, o formos parametrai yra 3 ir 5.

Naudinga gama skirstinio savybė: bet kokio nepriklausomų gama paskirstytų atsitiktinių dydžių (su tuo pačiu skalės parametru b) suma

(a l ,b) + (a 2 ,b) + --- +(a n ,b) taip pat paklūsta gama skirstiniui, bet su parametrais a 1 + a 2 + + a n ir b.

Lognormalus pasiskirstymas

Atsitiktinis dydis h vadinamas logaritminiu normaliuoju arba lognormaliu, jei jo natūraliajam logaritmui (lnh) taikomas normalusis skirstymo dėsnis.

Lognormalus skirstinys naudojamas, pavyzdžiui, modeliuojant tokius kintamuosius kaip pajamos, jaunavedžių amžius arba leistinas nuokrypis nuo maiste esančių kenksmingų medžiagų standarto.

Taigi, jei vertė x turi normalųjį skirstinį, tada reikšmę y = e x turi lognormalųjį skirstinį.

Jei normaliąją reikšmę pakeičiate eksponento laipsniu, galite lengvai suprasti, kad lognormali reikšmė yra pakartotinio nepriklausomų kintamųjų dauginimo rezultatas, kaip ir įprastas atsitiktinis kintamasis yra pakartotinio sumavimo rezultatas.

Lognormalaus pasiskirstymo tankis turi tokią formą:

Pagrindinės lognormaliojo skirstinio charakteristikos:


Chi kvadrato skirstinys

M nepriklausomų normaliųjų kintamųjų, kurių vidurkis 0 ir dispersija 1, kvadratų suma turi chi kvadrato skirstinį su m laisvės laipsnių. Šis skirstinys dažniausiai naudojamas duomenų analizei.

Formaliai gerai kvadratinio skirstinio tankis su m laisvės laipsniais turi tokią formą:

Už neigiamą x tankis tampa 0.

Pagrindinės skaitinės chi kvadrato skirstinio charakteristikos:

Tankio grafikas parodytas paveikslėlyje žemiau:

Binominis skirstinys

Binominis skirstinys yra svarbiausias diskretusis skirstinys, kuris sutelktas vos keliuose taškuose. Binominis skirstinys šiems taškams priskiria teigiamas tikimybes. Taigi binominis skirstinys skiriasi nuo tolydinių skirstinių (normaliojo, chi kvadrato ir kt.), kurie individualiai parinktiems taškams priskiria nulines tikimybes ir vadinami tolydžiomis.

Galite geriau suprasti dvinarį pasiskirstymą, atsižvelgdami į šį žaidimą.

Įsivaizduokite, kad metate monetą. Tegul yra tikimybė, kad herbas iškris p, o galvų nusileidimo tikimybė yra q = 1 - p (nagrinėjame patį bendriausią atvejį, kai moneta yra asimetriška, turi, pavyzdžiui, pasislinkusį svorio centrą - monetoje yra skylė).

Herbo nusileidimas laikomas sėkme, o uodega – nesėkme. Tada nubrėžtų galvų (arba uodegų) skaičius turi dvinarį pasiskirstymą.

Atkreipkite dėmesį, kad asimetriškų monetų ar netaisyklingų kauliukų svarstymas yra praktiškai naudingas. Kaip savo elegantiškoje knygoje „Tikimybių teorijos ir matematinės statistikos įvadinis kursas“ pažymėjo J. Neumannas, žmonės jau seniai spėjo, kad taškų dažnis ant kauliuko priklauso nuo paties kauliuko savybių ir gali būti dirbtinai keičiamas. Archeologai faraono kape aptiko dvi kauliukų poras: „sąžiningus“ - su vienoda tikimybe, kad visos pusės iškris, ir netikrus - su sąmoningu svorio centro poslinkiu, o tai padidino šešių iškritimo tikimybę.

Binominio skirstinio parametrai yra sėkmės tikimybė p (q = 1 - p) ir bandymų skaičius n.

Binominis skirstinys yra naudingas apibūdinant binominių įvykių pasiskirstymą, pvz., vyrų ir moterų skaičių atsitiktinai atrinktose įmonėse. Ypač svarbus yra dvinario skirstinio naudojimas žaidimo problemose.

Tiksli sėkmės tikimybės m formulė n bandymai parašyti taip:

p-sėkmės tikimybė

q lygus 1-p, q>=0, p+q==1

n- bandymų skaičius, m =0,1...m

Pagrindinės dvinario skirstinio charakteristikos:

Šio skirstinio grafikas įvairiems bandymų n skaičiams ir sėkmės tikimybei p turi tokią formą:

Binominis skirstinys yra susijęs su normaliuoju ir Puasono skirstiniais (žr. toliau); tam tikroms parametrų reikšmėms ir daugybei testų jis virsta šiais skirstiniais. Tai lengva parodyti naudojant STATISTICA.

Pavyzdžiui, atsižvelgiant į dvinario skirstinio grafiką su parametrais p = 0,7, n = 100 (žr. pav.), naudojome STATISTICA BASIC – matote, kad grafikas labai panašus į normalaus skirstinio tankį (tikrai taip!).

Dvejetainis pasiskirstymo grafikas su parametrais p=0,05, n=100 labai panašus į Puasono skirstinį.

Kaip jau minėta, binominis skirstinys atsirado stebint paprasčiausią azartinį žaidimą – sąžiningos monetos metimą. Daugeliu atvejų šis modelis yra geras pirmasis apytikslis sudėtingesnių žaidimų ir atsitiktinių procesų, atsirandančių prekiaujant akcijomis, aproksimacija. Pastebėtina, kad daugelio sudėtingų procesų esmines ypatybes galima suprasti iš paprasto binominio modelio.

Pavyzdžiui, apsvarstykite šią situaciją.

Herbo praradimą pažymėkime kaip 1, o uodegos praradimą – minus 1 ir sudėsime laimėjimus bei nuostolius nuosekliais laiko momentais. Grafikai rodo tipines tokio žaidimo trajektorijas 1000 metimų, 5000 metimų ir 10 000 metimų. Pastebėkite, kaip trajektorija ilgą laiką yra aukščiau arba žemiau nulio, kitaip tariant, laikas, per kurį vienas iš žaidėjų laimi visiškai sąžiningame žaidime, yra labai ilgas, o perėjimai nuo laimėjimo prie pralaimėjimo yra gana reti, o su tuo sunku susitaikyti nepasiruošusiam protui, kuriam posakis „visiškai sąžiningas žaidimas“ skamba kaip magiškas burtas. Taigi, nors žaidimas yra sąžiningas pagal savo sąlygas, tipinės trajektorijos elgesys nėra sąžiningas ir neparodo pusiausvyros!

Žinoma, empiriškai šis faktas yra žinomas visiems žaidėjams, kai žaidėjui neleidžiama išeiti su laimėjimais, bet jis yra priverstas žaisti toliau.


Panagrinėkime metimų skaičių, per kuriuos vienas žaidėjas laimi (trajektorija virš 0), o antrasis pralaimi (trajektorija žemiau 0). Iš pirmo žvilgsnio atrodo, kad tokių metimų yra maždaug tiek pat. Tačiau (žr. įdomią knygą: Feller V. „Įvadas į tikimybių teoriją ir jos taikymą“. Maskva: Mir, 1984, p. 106) su 10 000 idealios monetos metimų (t. p = q = 0,5, n=10 000) tikimybė, kad viena iš šalių pirmauja daugiau nei 9930 bandymų, o antroji – mažiau nei 70, viršija 0,1.

Stebėtina, kad 10 000 sąžiningų monetų metimų žaidime tikimybė, kad vadovybė pasikeis daugiausiai 8 kartus, yra didesnė nei 0,14, o daugiau nei 78 vadovų pasikeitimų tikimybė yra maždaug 0,12.

Taigi, turime paradoksalią situaciją: simetriškame Bernulio eisenoje „bangos“ grafike tarp nuoseklių grįžimų į nulį (žr. grafikus) gali būti stebėtinai ilgos. Su tuo susijusi kita aplinkybė, būtent, kad už T n /n (laiko dalis, kai grafikas yra virš x ašies), mažiausiai tikėtina, kad vertės yra artimos 1/2.

Matematikai atrado vadinamąjį arcsininį dėsnį, pagal kurį kiekvienam 0< а <1 вероятность неравенства , где Т n - число шагов, в течение которых первый игрок находится в выигрыше, стремится к

Arcino pasiskirstymas

Šis nuolatinis pasiskirstymas yra orientuotas į intervalą (0, 1) ir jo tankis:

Arkosinis pasiskirstymas yra susijęs su atsitiktiniu ėjimu. Tai yra laiko dalies, per kurią pirmasis žaidėjas laimi metęs simetrišką monetą, ty monetą, kurios tikimybė yra lygi, pasiskirstymas. S patenka ant herbo ir uodegos. Kitaip tokį žaidimą galima vertinti kaip atsitiktinį dalelės ėjimą, kuris, pradėdamas nuo nulio, vienodomis tikimybėmis atlieka pavienius šuolius į dešinę arba į kairę. Kadangi dalelių šuoliai – nukritusios galvos ar uodegos – yra vienodai tikėtini, toks ėjimas dažnai vadinamas simetrišku. Jei tikimybės būtų skirtingos, tada turėtume asimetrinį ėjimą.

Arkosinio pasiskirstymo tankio grafikas parodytas šiame paveikslėlyje:

Įdomiausia yra kokybinė grafiko interpretacija, iš kurios galima padaryti stebinančias išvadas apie pergalių ir pralaimėjimų seriją sąžiningame žaidime. Žvelgdami į grafiką matote, kad mažiausias tankis yra taške 1/2 "Na ir kas?!" - klausi tu. Bet jei pagalvosite apie šį pastebėjimą, jūsų nuostabai nebus ribų! Pasirodo, nors žaidimas apibrėžiamas kaip sąžiningas, jis iš tikrųjų nėra toks sąžiningas, kaip gali atrodyti iš pirmo žvilgsnio.

Simetrinės atsitiktinės trajektorijos, kuriose dalelė praleidžia vienodą laiką tiek teigiamoje, tiek neigiamoje pusašyje, ty į dešinę arba į kairę nuo nulio, yra būtent mažiausiai tikėtinos. Pereinant prie žaidėjų kalbos, galima teigti, kad metant simetrišką monetą, mažiausiai tikėtini žaidimai, kuriuose žaidėjai praleidžia vienodą laiką laimėdami ir pralaimėdami.

Priešingai, žaidimai, kuriuose vienas žaidėjas turi žymiai didesnę tikimybę laimėti, o kitas – pralaimėti, yra labiausiai tikėtini. Nuostabus paradoksas!

Apskaičiuoti tikimybę, kad laiko dalis t, per kurią pirmasis žaidėjas laimi, yra tarp t1 iki t2, reikalinga iš paskirstymo funkcijos reikšmės F(t2) atima paskirstymo funkcijos F(t1) reikšmę.

Formaliai gauname:

P(t1

Remiantis šiuo faktu, naudojant STATISTIKĄ galima apskaičiuoti, kad 10 000 žingsnių dalelė išlieka teigiamoje pusėje daugiau nei 9930 kartų su tikimybe 0,1, tai yra, grubiai tariant, tokia padėtis bus pastebėta bent vienu atveju. iš dešimties (nors iš pirmo žvilgsnio atrodo absurdiška; žr. nepaprastą Yu. V. Prokhorovo pastabą „Bernoulli's Rambler“ enciklopedijoje „Tikimybių ir matematinė statistika“, p. 42-43, M.: Didžioji rusų enciklopedija, 1999 m. ).

Neigiamas binominis skirstinys

Tai yra atskiras skirstinys, priskiriamas sveikiesiems skaičiams k = 0,1,2,... tikimybės:

p k =P(X=k)=C k r+k-1 p r (l-p) k ", kur 0<р<1,r>0.

Neigiamas binominis skirstinys randamas daugelyje programų.

Apskritai r > 0, neigiamas binominis skirstinys interpretuojamas kaip r-osios „sėkmės“ laukimo laiko pasiskirstymas Bernulio testo schemoje su „sėkmės“ tikimybe. p, pavyzdžiui, metimų skaičius, kurį reikia padaryti prieš nubrėžiant antrąją emblemą, tokiu atveju jis kartais vadinamas Paskalio skirstiniu ir yra atskiras gama skirstinio analogas.

At r = 1 neigiamas dvinario skirstinys sutampa su geometriniu skirstiniu.

Jei Y yra atsitiktinis dydis, turintis Puasono skirstinį su atsitiktiniu parametru, kuris savo ruožtu turi gama skirstinį su tankiu

Tada U turės neigiamą dvinarį skirstinį su parametrais;

Puasono pasiskirstymas

Puasono skirstinys kartais vadinamas retų įvykių pasiskirstymu. Kintamųjų, paskirstytų pagal Puasono dėsnį, pavyzdžiai: nelaimingų atsitikimų skaičius, gamybos proceso defektų skaičius ir kt. Puasono skirstinys apibrėžiamas formule:

Pagrindinės Puasono atsitiktinio dydžio charakteristikos:

Puasono skirstinys yra susijęs su eksponentiniu ir Bernulio skirstiniu.

Jei įvykių skaičius turi Puasono skirstinį, tada intervalai tarp įvykių turi eksponentinį arba eksponentinį pasiskirstymą.

Puasono pasiskirstymo grafikas:

Palyginkite Puasono skirstinio su 5 parametru grafiką su Bernulio skirstinio grafiku, kai p=q=0,5,n=100.

Pamatysite, kad grafikai yra labai panašūs. Bendru atveju yra toks modelis (žr., pavyzdžiui, puikią knygą: Shiryaev A.N. „Tikimybė“. Maskva: Nauka, p. 76): jei Bernoulli testuose n ima dideles reikšmes, o sėkmės tikimybė / ? yra santykinai mažas, todėl vidutinis pasisekimų skaičius (produktas ir nar) nėra nei mažas, nei didelis, tuomet Bernulio skirstinys su parametrais n, p gali būti pakeistas Puasono skirstiniu, kurio parametras = np.

Puasono skirstinys plačiai naudojamas praktikoje, pavyzdžiui, kokybės kontrolės lentelėse kaip retų įvykių pasiskirstymas.

Kaip kitą pavyzdį apsvarstykite šią problemą, susijusią su telefono linijomis ir paimtą iš praktikos (žr.: Feller V. Įvadas į tikimybių teoriją ir jos taikymą. Moscow: Mir, 1984, p. 205, taip pat Molina E. S. (1935). Tikimybė inžinerijoje, Elektros inžinerija, 54, p. 423-427 „Bell Telefono sistemos techniniai leidiniai B-854“ Šią užduotį galima nesunkiai išversti į šiuolaikinę kalbą, pavyzdžiui, į mobiliojo ryšio kalbą – būtent tai ir kviečiami besidomintys skaitytojai.

Problema suformuluota taip. Tebūnie dvi telefono stotys – A ir B.

Telefono stotis A turi užtikrinti ryšį tarp 2000 abonentų ir stotis B. Ryšio kokybė turi būti tokia, kad tik 1 skambutis iš 100 lauktų, kol linija atsilaisvins.

Kyla klausimas: kiek telefono linijų reikia įrengti norint užtikrinti reikiamą ryšio kokybę? Akivaizdu, kad kvaila sukurti 2000 eilučių, nes daugelis jų ilgą laiką bus nemokamos. Iš intuityvių svarstymų aišku, kad, matyt, yra koks nors optimalus eilučių skaičius N. Kaip apskaičiuoti šį skaičių?

Pradėkime nuo tikroviško modelio, kuriame aprašomas abonento prieigos prie tinklo intensyvumas, atkreipiant dėmesį, kad modelio tikslumą, žinoma, galima patikrinti naudojant standartinius statistinius kriterijus.

Taigi, tarkime, kad kiekvienas abonentas linija naudojasi vidutiniškai 2 minutes per valandą, o abonentų ryšiai yra nepriklausomi (tačiau, kaip teisingai pažymi Felleris, pastarasis įvyksta nebent įvyksta koks nors įvykis, paliečiantis visus abonentus, pavyzdžiui, karas ar uraganas).

Tada turime 2000 Bernoulli bandymų (monetų metimų) arba tinklo jungčių su sėkmės tikimybe p=2/60=1/30.

Turime rasti tokį N, kad tikimybė, kad daugiau nei N vartotojų vienu metu prisijungtų prie tinklo, neviršytų 0,01. Šiuos skaičiavimus nesunkiai galima išspręsti STATISTICA sistemoje.

Problemos sprendimas naudojant STATISTICA.

1 veiksmas. Atidarykite modulį Pagrindinė statistika. Sukurkite binoml.sta failą, kuriame yra 110 stebėjimų. Pavadinkite pirmąjį kintamąjį DVINOMINIS, antrasis kintamasis - NUODAI.

2 veiksmas. DVINOMINIS, atidarykite langą 1 kintamasis(žr. paveikslėlį). Lange įveskite formulę, kaip parodyta paveikslėlyje. Spustelėkite mygtuką Gerai.


3 veiksmas. Dukart spustelėkite pavadinimą NUODAI, atidarykite langą 2 kintamasis(žr. paveikslėlį)

Lange įveskite formulę, kaip parodyta paveikslėlyje. Atkreipkite dėmesį, kad Puasono pasiskirstymo parametrą apskaičiuojame naudodami formulę =n×p. Gerai.


Todėl = 2000 × 1/30. Spustelėkite mygtuką

STATISTIKA apskaičiuos tikimybes ir įrašys jas į sugeneruotą failą. 4 veiksmas.

Slinkite žemyn iki stebėjimo numerio 86. Pamatysite, kad 86 ar daugiau vienu metu esančių vartotojų iš 2000 tinklo vartotojų tikimybė per valandą yra 0,01347, jei naudojamas dvinario skirstinys.

Tikimybė, kad per valandą vienu metu dirba 86 ar daugiau žmonių iš 2000 tinklo vartotojų, yra 0,01293, naudojant Binominio skirstinio Puasono aproksimaciją.

Kadangi mums reikia ne didesnės nei 0,01 tikimybės, norint užtikrinti reikiamą ryšio kokybę, pakaks 87 eilučių.

Panašius rezultatus galima gauti naudojant įprastą binominio skirstinio aproksimaciją (žr. tai!).

Atkreipkite dėmesį, kad V. Felleris neturėjo STATISTICA sistemos ir naudojo lenteles dvinariams ir normaliajam skirstiniams.

Naudojant tą patį samprotavimą, galima išspręsti šią W. Fellerio aptartą problemą. Suskirstant juos į 2 grupes po 1000 žmonių, būtina patikrinti, ar norint patikimai aptarnauti vartotojus reikia daugiau ar mažiau linijų.

Pasirodo, kad vartotojus suskirstant į grupes, norint pasiekti tą patį kokybės lygį, reikės papildomų 10 eilučių.

Taip pat galite atsižvelgti į tinklo ryšio intensyvumo pokyčius per dieną.

Geometrinis pasiskirstymas

Jei atliekami nepriklausomi Bernoulli testai ir skaičiuojamas bandymų skaičius iki kitos „sėkmės“, šis skaičius turi geometrinį pasiskirstymą. Taigi, jei metate monetą, metimų skaičius, kurį turite atlikti prieš pasirodant kitam herbui, atitinka geometrinį dėsnį.

Geometrinis pasiskirstymas nustatomas pagal formulę:

p - sėkmės tikimybė, x = 1, 2,3...

Paskirstymo pavadinimas yra susijęs su geometrine progresija.

Taigi, geometrinis skirstinys nurodo tikimybę, kad sėkmė įvyko tam tikrame žingsnyje.

Geometrinis skirstinys yra diskretusis eksponentinės skirstinio analogas. Jei laikas kinta kvantais, tada sėkmės tikimybė kiekvienu laiko momentu apibūdinama geometriniu dėsniu. Jei laikas yra nenutrūkstamas, tada tikimybė apibūdinama eksponentiniu arba eksponentiniu dėsniu.

Hipergeometrinis pasiskirstymas

Tai yra diskretus atsitiktinio dydžio X tikimybių skirstinys, imant sveikąsias reikšmes m = 0, 1,2,...,n su tikimybėmis:

kur N, M ir n yra neneigiami sveikieji skaičiai, o M< N, n < N.

Hipergeometrinis pasiskirstymas paprastai siejamas su pasirinkimu be pakeitimo ir nustato, pavyzdžiui, tikimybę rasti tiksliai m juodų rutuliukų atsitiktinėje n dydžio imtyje iš populiacijos, kurioje yra N rutuliukų, įskaitant M juodą ir N - M baltą (žr. Pavyzdžiui, enciklopedija „Tikimybė“ ir matematinė statistika“, M.: Didžioji rusų enciklopedija, p. 144).

Hipergeometrinio skirstinio matematinė lūkestis nepriklauso nuo N ir sutampa su atitinkamo dvinario skirstinio matematine tikėtimi µ=np.

Hipergeometrinio skirstinio dispersija neviršija dvinario skirstinio dispersijos npq. Bet kurios hipergeometrinio skirstinio eilės momentais linkstama į atitinkamas dvinario skirstinio momentų vertes.

Šis pasiskirstymas labai dažnai pasitaiko kokybės kontrolės programose.

Polinominis skirstinys

Dauginaminis arba daugianario skirstinys natūraliai apibendrina skirstinį. Nors dvinario pasiskirstymas įvyksta, kai moneta metama su dviem rezultatais (galvomis arba ketera), o daugianario pasiskirstymas įvyksta, kai metamas kauliukas ir galimi daugiau nei du rezultatai. Formaliai tai yra bendras atsitiktinių dydžių X 1,...,X k tikimybių skirstinys, imant neneigiamas sveikųjų skaičių reikšmes n 1,...,n k, tenkinantis sąlygą n 1 + ... + n k = n, su tikimybėmis:

Pavadinimas „daugianominis skirstinys“ paaiškinamas tuo, kad daugianario tikimybės atsiranda plečiant daugianarį (p 1 + ... + p k) n

Beta platinimas

Beta paskirstymo tankis yra toks:


Standartinis beta pasiskirstymas yra orientuotas į intervalą nuo 0 iki 1. Naudojant tiesines transformacijas, beta vertė gali būti transformuojama taip, kad ji gautų reikšmes bet kuriame intervale.

Pagrindinės beta pasiskirstymo dydžio skaitinės charakteristikos:


Kraštutinių vertybių pasiskirstymas

Kraštutinių verčių pasiskirstymas (I tipas) turi tokios formos tankį:

Šis skirstinys kartais dar vadinamas kraštutinės vertės skirstiniu.

Ekstremalių verčių pasiskirstymas naudojamas modeliuojant ekstremalius įvykius, pavyzdžiui, potvynių lygius, sūkurių greitį, tam tikrų metų akcijų rinkos indeksų maksimumą ir kt.

Šis skirstinys naudojamas patikimumo teorijoje, pavyzdžiui, apibūdinant elektros grandinių gedimo laiką, taip pat atliekant aktuarinius skaičiavimus.

Rayleigh skirstiniai

Rayleigh skirstinio tankis yra toks:

kur b yra skalės parametras.

Rayleigh skirstinys sutelktas diapazone nuo 0 iki begalybės. Vietoj reikšmės 0, STATISTICA leidžia įvesti kitą slenksčio parametro reikšmę, kuri bus atimta iš pradinių duomenų prieš pritaikant Rayleigh skirstinį. Todėl slenksčio parametro reikšmė turi būti mažesnė už visas stebimas reikšmes.

Jei du kintamieji 1 ir 2 yra nepriklausomi vienas nuo kito ir paprastai yra pasiskirstę ta pačia dispersija, tada kintamasis turės Rayleigh paskirstymą.

Rayleigh skirstinys naudojamas, pavyzdžiui, šaudymo teorijoje.


Weibull paskirstymas

Weibull skirstinys pavadintas švedų mokslininko Waloddi Weibull vardu, kuris naudojo šį skirstinį apibūdindamas įvairių tipų gedimų laikus patikimumo teorijoje.

Formaliai Weibull pasiskirstymo tankis parašytas taip:

Kartais Weibull pasiskirstymo tankis taip pat rašomas taip:

B - skalės parametras;

C - formos parametras;

E yra Eilerio konstanta (2,718...).

Padėties parametras. Paprastai Weibull skirstinys yra sutelktas į pusiau ašį nuo 0 iki begalybės. Jei vietoj ribos 0 įvedame dažnai praktikoje reikalingą parametrą a, tai atsiranda vadinamasis trijų parametrų Veibulo skirstinys.

Weibull paskirstymas plačiai naudojamas patikimumo teorijoje ir draudime.

Kaip aprašyta aukščiau, eksponentinis pasiskirstymas dažnai naudojamas kaip laiko iki gedimo įvertinimo modelis, darant prielaidą, kad objekto gedimo tikimybė yra pastovi. Jei laikui bėgant gedimo tikimybė kinta, taikomas Weibull skirstinys.

At su =1 arba, kitoje parametrizacijoje, su Weibull skirstiniu, kaip galima nesunkiai matyti iš formulių, virsta eksponentiniu skirstiniu, o su - į Rayleigh skirstinį.

Sukurti specialūs Weibull skirstinio parametrų įvertinimo metodai (žr., pavyzdžiui, knygą: Lawless (1982) Statistical models and method for lifetime data, Belmont, CA: Lifetime Learning, kurioje aprašomi įvertinimo metodai, taip pat problemos. atsirandančius vertinant padėties parametrą trijų parametrų skirstiniui Weibull).

Dažnai atliekant patikimumo analizę reikia atsižvelgti į gedimo tikimybę per trumpą laiko tarpą po laiko momento t su sąlyga, kad iki šio momento t gedimas neįvyko.

Ši funkcija vadinama rizikos funkcija arba gedimų dažnio funkcija ir formaliai apibrėžiama taip:

H(t) – gedimo koeficiento funkcija arba rizikos funkcija momentu t;

f(t) - gedimo laikų pasiskirstymo tankis;

F(t) - gedimo laiko pasiskirstymo funkcija (tankio integralas per intervalą).

Apskritai gedimo koeficiento funkcija parašyta taip:

Kai rizikos funkcija lygi konstantai, kuri atitinka įprastą įrenginio veikimą (žr. formules).

Kai rizikos funkcija sumažėja, o tai atitinka įrenginio įjungimą.

Kai rizikos funkcija sumažėja, o tai atitinka įrenginio senėjimą. Tipinės rizikos funkcijos parodytos diagramoje.


Toliau pateikiami Veibulo tankio grafikai su įvairiais parametrais. Būtina atkreipti dėmesį į tris parametro a verčių diapazonus:

Pirmajame regione rizikos funkcija mažėja (koregavimo periodas), antrame regione rizikos funkcija lygi konstantai, trečiame – didėja.

Tai, kas buvo pasakyta, nesunkiai suprasite pasitelkę naujo automobilio pirkimo pavyzdį: pirmiausia yra automobilio adaptacijos laikotarpis, po to ilgas normalaus eksploatavimo laikotarpis, tada susidėvi automobilio dalys ir kyla jo gedimo pavojus. smarkiai padidėja.

Svarbu, kad visus veikimo laikotarpius būtų galima apibūdinti ta pačia paskirstymo šeima. Tai yra Weibull paskirstymo idėja.


Pateiksime pagrindines Weibull skirstinio skaitines charakteristikas.


Pareto paskirstymas

Įvairiose taikomosios statistikos problemose gana dažni yra vadinamieji sutrumpinti skirstiniai.

Pavyzdžiui, šis paskirstymas naudojamas draudime arba apmokestinant, kai palūkanos yra pajamos, kurios viršija tam tikrą vertę c 0

Pagrindinės Pareto skirstinio skaitinės charakteristikos:


Logistinis paskirstymas

Logistinis paskirstymas turi tankio funkciją:

A - padėties parametras;

B - skalės parametras;

E – Eulerio skaičius (2,71...).


Viešbučių T 2 paskirstymas

Šis nuolatinis pasiskirstymas, kurio centre yra intervalas (0, Г), turi tokį tankį:

kur parametrai n ir k, n >_k >_1, vadinami laisvės laipsniais.

At k = 1 Viešbutyje, P skirstinys sumažinamas iki Studento pasiskirstymo ir bet kuriam k >1 galima laikyti Stjudento skirstinio apibendrinimu į daugiamatį atvejį.

Viešbučių pasiskirstymas yra pagrįstas normaliuoju pasiskirstymu.

Tegul k-matmens atsitiktinis vektorius Y turi normalųjį skirstinį su nuliniu vidurkių vektoriumi ir kovariacijos matrica.

Apsvarstykime kiekį

kur atsitiktiniai vektoriai Z i yra nepriklausomi vienas nuo kito ir Y ir yra pasiskirstę taip pat kaip Y.

Tada atsitiktinis dydis T 2 =Y T S -1 Y turi T 2 -Hotelling skirstinį su n laisvės laipsnių (Y yra stulpelio vektorius, T yra transpozicijos operatorius).

kur yra atsitiktinis dydis t n turi Stjudento skirstinį su n laisvės laipsnių (žr. „Tikimybių ir matematinė statistika“, enciklopedija, p. 792).

Jei Y turi normalųjį skirstinį, kurio vidurkis skiriasi nuo nulio, tada vadinamas atitinkamas skirstinys ne centrinis Viešbučių T 2 pasiskirstymas su n laisvės laipsnių ir necentralumo parametru v.

Hotellingo T 2 skirstinys naudojamas matematinėje statistikoje toje pačioje situacijoje kaip ir Stjudento ^ skirstinys, bet tik daugiamačiu atveju. Jei stebėjimų X 1,..., X n rezultatai yra nepriklausomi, normaliai pasiskirstę atsitiktiniai vektoriai su vidurkių µ vektoriumi ir nevienetine kovariacijos matrica, tada statistika


turi Hotelling T 2 -paskirstymą su n - 1 laisvės laipsniai. Šis faktas yra viešbučių kriterijaus pagrindas.

STATISTICA, viešbučių testas pasiekiamas, pavyzdžiui, pagrindinės statistikos ir lentelių modulyje (žr. dialogo langą žemiau).


Maksvelo paskirstymas

Maksvelo skirstinys atsirado fizikoje aprašant idealių dujų molekulių greičių pasiskirstymą.

Šis nuolatinis pasiskirstymas yra orientuotas į (0, ) ir jo tankis:

Paskirstymo funkcija yra tokia:

čia Ф(x) yra standartinė normaliojo pasiskirstymo funkcija. Maksvelo skirstinys turi teigiamą iškrypimo koeficientą ir vieną modą taške (ty pasiskirstymas yra unimodalinis).

Maxwell paskirstymas turi bet kokios eilės pabaigos momentus; matematinis lūkestis ir dispersija yra atitinkamai lygūs ir

Maksvelo skirstinys natūraliai yra susijęs su normaliuoju pasiskirstymu.

Jei X 1, X 2, X 3 yra nepriklausomi atsitiktiniai dydžiai, kurių normalusis pasiskirstymas su parametrais 0 ir õ 2, tai atsitiktinis dydis turi Maxwell paskirstymą. Taigi Maksvelo skirstinys gali būti laikomas atsitiktinio vektoriaus, kurio koordinatės Dekarto koordinačių sistemoje trimatėje erdvėje yra nepriklausomos ir normaliai pasiskirsčiusios su vidurkiu 0 ir dispersija õ 2, ilgio skirstiniu.

Cauchy pasiskirstymas

Šis nuostabus pasiskirstymas kartais neturi vidutinės vertės, nes jo tankis labai lėtai linkęs į nulį, kai x didėja absoliučia verte. Tokie skirstiniai vadinami sunkiaisiais skirstiniais. Jei jums reikia sugalvoti paskirstymą, kuris neturi vidurkio, nedelsdami pavadinkite jį Cauchy skirstiniu.

Koši skirstinys yra vienarūšis ir simetriškas režimo atžvilgiu, kuris yra ir mediana, ir turi formos tankio funkciją:

Kur c > 0 – skalės parametras ir a yra centrinis parametras, kuris vienu metu nustato režimo ir medianos reikšmes.

Tankio integralas, tai yra, pasiskirstymo funkcija, pateikiama santykiu:

Studentų paskirstymas

Anglų statistikas W. Gossetas, žinomas slapyvardžiu „Student“ ir savo karjerą pradėjęs nuo statistinio angliško alaus kokybės tyrimo, 1908 m. gavo tokį rezultatą. Leiskite x 0 , x 1 ,.., x m - nepriklausomi, (0, s 2) - normaliai paskirstyti atsitiktiniai dydžiai:


Šis paskirstymas, dabar žinomas kaip Studento paskirstymas (sutrumpintai kaip T(m) skirstinys, kur m yra laisvės laipsnių skaičius), yra garsiojo t testo, skirto palyginti dviejų populiacijų vidurkius, pagrindas.

Tankio funkcija f t (x) nepriklauso nuo atsitiktinių dydžių dispersijos õ 2 ir, be to, yra unimodalinis ir simetriškas taško x = 0 atžvilgiu.

Pagrindinės skaitinės Studentų pasiskirstymo charakteristikos:

T pasiskirstymas yra svarbus tais atvejais, kai svarstomi vidurkio įverčiai, o imties dispersija nežinoma. Šiuo atveju naudojama imties dispersija ir t skirstinys.

Esant dideliems laisvės laipsniams (didesniems nei 30), t skirstinys praktiškai sutampa su standartiniu normaliuoju skirstiniu.

T pasiskirstymo tankio funkcijos grafikas, didėjant laisvės laipsnių skaičiui, deformuojasi taip: smailė didėja, uodegos eina stačiau iki 0, o t pasiskirstymo tankio funkcijos grafikas atrodo suspaustas į šoną.


F-paskirstymas

Pasvarstykime m 1 + m 2 nepriklausomi ir (0, s 2) normaliai pasiskirstę dydžiai

ir įdėti

Akivaizdu, kad tas pats atsitiktinis kintamasis taip pat gali būti apibrėžtas kaip dviejų nepriklausomų ir tinkamai normalizuotų chi kvadrato paskirstytų kintamųjų santykis ir , tai yra

Žymus anglų statistikas R. Fišeris 1924 metais parodė, kad atsitiktinio dydžio F(m 1, m 2) tikimybės tankis pateikiamas funkcija:


kur Г(у) yra Eilerio gama funkcijos reikšmė. tašką y, o pats dėsnis vadinamas F skirstiniu, kai skaitiklio ir vardiklio laisvės laipsnių skaičiai yra lygūs atitinkamai m,1l m7

Pagrindinės skaitinės F skirstinio charakteristikos:


F skirstinys atsiranda atliekant diskriminacinę analizę, regresinę analizę, dispersinę analizę ir kitų tipų daugiamatę duomenų analizę.

Praktikoje dauguma atsitiktinių dydžių, kuriems įtakos turi daugybė atsitiktinių veiksnių, paklūsta normaliam tikimybių pasiskirstymo dėsniui. Todėl įvairiuose tikimybių teorijos taikymuose šis dėsnis yra ypač svarbus.

Atsitiktinis kintamasis $X$ paklūsta normaliam tikimybių pasiskirstymo dėsniui, jei jo tikimybių pasiskirstymo tankis turi tokią formą

$$f\left(x\right)=((1)\over (\sigma \sqrt(2\pi )))e^(-(((\left(x-a\right))^2)\over ( 2(\sigma )^2)))$$

Funkcijos $f\left(x\right)$ grafikas pavaizduotas schematiškai paveikslėlyje ir vadinamas „Gauso kreive“. Šio grafiko dešinėje yra Vokietijos 10 markių banknotas, kuris buvo naudojamas prieš įvedant eurą. Atidžiau pažvelgus, ant šio banknoto galima pamatyti Gauso kreivę ir jos atradėją – didžiausią matematiką Carlą Friedrichą Gaussą.

Grįžkime prie mūsų tankio funkcijos $f\left(x\right)$ ir pateiksime keletą paaiškinimų dėl pasiskirstymo parametrų $a,\ (\sigma )^2$. Parametras $a$ apibūdina atsitiktinio dydžio reikšmių sklaidos centrą, tai yra, jis turi matematinio lūkesčio reikšmę. Pasikeitus parametrui $a$, o parametrui $(\sigma )^2$ nepasikeitus, galime stebėti funkcijos $f\left(x\right)$ grafiko poslinkį išilgai abscisės, o tankio grafikas pati nekeičia savo formos.

Parametras $(\sigma )^2$ yra dispersija ir apibūdina tankio grafiko kreivės $f\left(x\right)$ formą. Keičiant parametrą $(\sigma )^2$, išlaikant parametrą $a$ nepakeistą, galime stebėti, kaip tankio grafikas keičia savo formą, susispaudžia arba tempiasi, nejudant išilgai abscisių ašies.

Tikimybė, kad normaliai pasiskirstęs atsitiktinis dydis pateks į tam tikrą intervalą

Kaip žinoma, tikimybė, kad atsitiktinis dydis $X$ pateks į intervalą $\left(\alpha ;\ \beta \right)$, gali būti apskaičiuota $P\left(\alpha< X < \beta \right)=\int^{\beta }_{\alpha }{f\left(x\right)dx}$. Для нормального распределения случайной величины $X$ с параметрами $a,\ \sigma $ справедлива следующая формула:

$$P\left(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right)$$

Čia funkcija $\Phi \left(x\right)=((1)\over (\sqrt(2\pi )))\int^x_0(e^(-t^2/2)dt)$ yra Laplaso funkcija. Šios funkcijos reikšmės paimtos iš . Galima pastebėti šias funkcijos $\Phi \left(x\right)$ savybes.

1 . $\Phi \left(-x\right)=-\Phi \left(x\right)$, tai yra, funkcija $\Phi \left(x\right)$ yra nelyginė.

2 . $\Phi \left(x\right)$ yra monotoniškai didėjanti funkcija.

3 . $(\mathop(lim)_(x\to +\infty ) \Phi \left(x\right)\ )=0,5$, $(\mathop(lim)_(x\to -\infty ) \ Phi \ kairėje(x\dešinėje)\ )=-0,5$.

Norėdami apskaičiuoti funkcijos $\Phi \left(x\right)$ reikšmes, programoje Excel taip pat galite naudoti funkcijos $f_x$ vedlį: $\Phi \left(x\right)=NORMDIST\left(x ;0;1;1\dešinė )-0,5$. Pavyzdžiui, apskaičiuokime funkcijos $\Phi \left(x\right)$ reikšmes $x=2$.

Tikimybę, kad normaliai paskirstytas atsitiktinis kintamasis $X\in N\left(a;\ (\sigma )^2\right)$ pateks į intervalą, simetrišką matematinio lūkesčio $a$ atžvilgiu, galima apskaičiuoti naudojant formulę

$$P\left(\left|X-a\right|< \delta \right)=2\Phi \left({{\delta }\over {\sigma }}\right).$$

Trijų sigmų taisyklė. Beveik neabejotina, kad normaliai paskirstytas atsitiktinis kintamasis $X$ pateks į intervalą $\left(a-3\sigma ;a+3\sigma \right)$.

1 pavyzdys . Atsitiktiniam dydžiui $X$ taikomas normalus tikimybių skirstymo dėsnis su parametrais $a=2,\ \sigma =3$. Raskite tikimybę, kad $X$ pateks į intervalą $\left(0.5;1\right)$ ir nelygybės $\left|X-a\right|< 0,2$.

Naudojant formulę

$$P\left(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right),$$

randame $P\left(0.5;1\right)=\Phi \left(((1-2)\over (3))\right)-\Phi \left(((0.5-2)\ over (3) ))\right)=\Phi \left(-0,33\right)-\Phi \left(-0,5\right)=\Phi \left(0,5\right)-\Phi \ left(0,33\right)=0,191- 0,129 = 0,062 USD.

$$P\left(\left|X-a\right|< 0,2\right)=2\Phi \left({{\delta }\over {\sigma }}\right)=2\Phi \left({{0,2}\over {3}}\right)=2\Phi \left(0,07\right)=2\cdot 0,028=0,056.$$

2 pavyzdys . Tarkime, kad per metus tam tikros įmonės akcijų kaina yra atsitiktinis dydis, paskirstytas pagal normalųjį dėsnį, kurio matematinis lūkestis lygus 50 sutartinių piniginių vienetų, o standartinis nuokrypis lygus 10. Kokia tikimybė, kad atsitiktinai pasirinkus aptariamo laikotarpio dieną akcijos kaina bus:

a) daugiau nei 70 sutartinių piniginių vienetų?

b) mažiau nei 50 vienai akcijai?

c) nuo 45 iki 58 įprastinių piniginių vienetų vienai akcijai?

Tegul atsitiktinis dydis $X$ yra tam tikros įmonės akcijų kaina. Pagal sąlygą $X$ taikomas normalusis skirstinys, kurio parametrai $a=50$ – matematinis lūkestis, $\sigma =10$ – standartinis nuokrypis. Tikimybė $P\left(\alpha< X < \beta \right)$ попадания $X$ в интервал $\left(\alpha ,\ \beta \right)$ будем находить по формуле:

$$P\left(\alpha< X < \beta \right)=\Phi \left({{\beta -a}\over {\sigma }}\right)-\Phi \left({{\alpha -a}\over {\sigma }}\right).$$

$$а)\ P\left(X>70\right)=\Phi \left(((\infty -50)\over (10))\right)-\Phi \left(((70-50)\ virš (10))\right)=0,5-\Phi \left(2\right)=0,5-0,4772=0,0228.$$

$$b)\P\left(X< 50\right)=\Phi \left({{50-50}\over {10}}\right)-\Phi \left({{-\infty -50}\over {10}}\right)=\Phi \left(0\right)+0,5=0+0,5=0,5.$$

$$in)\ P\left(45< X < 58\right)=\Phi \left({{58-50}\over {10}}\right)-\Phi \left({{45-50}\over {10}}\right)=\Phi \left(0,8\right)-\Phi \left(-0,5\right)=\Phi \left(0,8\right)+\Phi \left(0,5\right)=$$

Nepaisant egzotiškų pavadinimų, įprasti platinimai yra tarpusavyje susiję intuityviai ir įdomiai, todėl juos lengva prisiminti ir drąsiai samprotauti. Kai kurie išplaukia natūraliai, pavyzdžiui, iš Bernulli skirstinio. Laikas parodyti šių ryšių žemėlapį.

Kiekvienas skirstinys iliustruojamas jo pasiskirstymo tankio funkcijos (DFF) pavyzdžiu. Šis straipsnis yra tik apie tuos paskirstymus, kurių rezultatai yra pavieniai skaičiai. Todėl kiekvieno grafiko horizontalioji ašis yra galimų rezultatų skaičių rinkinys. Vertikalus – kiekvieno rezultato tikimybė. Kai kurie skirstiniai yra diskretūs – jų rezultatai turi būti sveikieji skaičiai, pvz., 0 arba 5. Jie žymimi retomis linijomis, po vieną kiekvienam rezultatui, kurių aukštis atitinka tam tikro rezultato tikimybę. Kai kurie yra tęstiniai, jų rezultatai gali turėti bet kokią skaitinę reikšmę, pvz., -1,32 arba 0,005. Jie rodomi kaip tankios kreivės su sritimis po kreivės atkarpomis, kurios suteikia tikimybes. Linijų aukščių ir plotų po kreivėmis suma visada yra 1.

Atsispausdinkite, iškirpkite išilgai punktyrinės linijos ir nešiokitės su savimi piniginėje. Tai jūsų vadovas apie platinimo šalį ir jų gimines.

Bernulli ir uniforma

Aukščiau jau susidūrėte su Bernoulli paskirstymu su dviem rezultatais – galvomis arba uodegomis. Įsivaizduokite dabar kaip pasiskirstymą per 0 ir 1, 0 yra galvos, 1 yra uodegos. Kaip jau aišku, abu rezultatai yra vienodai tikėtini, ir tai atsispindi diagramoje. Bernoulli PDF faile yra dvi vienodo aukščio eilutės, atitinkančios 2 vienodai tikėtinus rezultatus: atitinkamai 0 ir 1.

Bernoulli skirstinys taip pat gali reikšti nevienodai tikėtinus rezultatus, pavyzdžiui, neteisingos monetos išvertimą. Tada galvų tikimybė bus ne 0,5, o kažkokia kita reikšmė p, o uodegų tikimybė bus 1-p. Kaip ir daugelis kitų paskirstymų, tai iš tikrųjų yra visa paskirstymo šeima, apibrėžta tam tikrais parametrais, pvz., p aukščiau. Kai galvojate apie „Bernoulli“, pagalvokite apie „(galbūt neteisingos) monetos išmetimą“.

Nuo čia labai mažas žingsnis, norint parodyti pasiskirstymą kartu su keliais vienodai tikėtinais rezultatais: vienodas paskirstymas, kuriam būdingas plokščias PDF failas. Įsivaizduokite įprastą kauliuką. Jo rezultatai 1-6 yra vienodai tikėtini. Jis gali būti nurodytas bet kokiam rezultatų skaičiui n ir netgi kaip nuolatinis skirstinys.

Pagalvokite apie tolygų paskirstymą kaip „tiesioginį kauliuką“.

Binominis ir hipergeometrinis

Binominis skirstinys gali būti laikomas tų dalykų, kurie seka Bernulio skirstiniu, rezultatų suma.

Mesti sąžiningą monetą du kartus – kiek kartų tai bus galvos? Tai skaičius, kuris seka dvinarį skirstinį. Jo parametrai yra n, bandymų skaičius ir p – „sėkmės“ tikimybė (mūsų atveju galvos arba 1). Kiekvienas metimas yra Bernoulli paskirstytas rezultatas arba testas. Skaičiuodami sėkmingų dalykų skaičių, pavyzdžiui, monetos metimą, naudokite dvinarį skirstinį, kai kiekvienas metimas nepriklauso nuo kitų ir turi tokią pat sėkmės tikimybę.

Arba įsivaizduokite urną su tiek pat baltų ir juodų rutuliukų. Užmerkite akis, išimkite kamuolį, užrašykite jo spalvą ir padėkite atgal. Pakartokite. Kiek kartų ištrauktas juodas rutulys? Šis skaičius taip pat atitinka binominį skirstinį.

Pateikėme šią keistą situaciją, kad būtų lengviau suprasti hipergeometrinio skirstinio reikšmę. Tai yra to paties skaičiaus pasiskirstymas, bet situacijoje, jei mes Ne grąžino kamuoliukus. Tai tikrai yra dvinario skirstinio pusbrolis, bet ne tas pats, nes sėkmės tikimybė keičiasi su kiekvienu ištrauktu kamuoliuku. Jei kamuoliukų skaičius yra pakankamai didelis, palyginti su lygiųjų skaičiumi, tai šie pasiskirstymai yra beveik identiški, nes sėkmės tikimybė su kiekvienu lygiuoju keičiasi labai nežymiai.

Kai kas nors kalba apie rutulių ištraukimą iš urnų jų negrąžinus, beveik visada galima pasakyti „taip, hipergeometrinis pasiskirstymas“, nes gyvenime nesu sutikęs nė vieno, kuris iš tikrųjų pripildytų urnas rutuliais, o paskui ištrauktų ir grąžintų. , arba atvirkščiai. Aš net nepažįstu nė vieno, turinčio šiukšliadėžes. Dar dažniau toks pasiskirstymas turėtų atsirasti, kai kaip imtį pasirenkamas reikšmingas kai kurios populiacijos pogrupis.

Pastaba vertimas

Galbūt čia nėra labai aišku, bet kadangi pamoka yra greitasis kursas pradedantiesiems, tai turėtų būti paaiškinta. Gyventojų skaičius yra tai, ką norime įvertinti statistiškai. Norėdami įvertinti, pasirenkame tam tikrą dalį (poaibį) ir joje atliekame reikiamą įvertinimą (tada šis poaibis vadinamas imtimi), darant prielaidą, kad visos visumos įvertis bus panašus. Tačiau tam, kad tai būtų tiesa, dažnai reikia papildomų apribojimų, susijusių su imties pogrupio apibrėžimu (arba, priešingai, atsižvelgiant į žinomą imtį, turime įvertinti, ar ji pakankamai tiksliai apibūdina populiaciją).

Praktinis pavyzdys – reikia atrinkti atstovus iš 100 žmonių kompanijos, kuri keliautų į E3. Yra žinoma, kad pernai ten jau keliavo 10 žmonių (bet niekas to nepripažįsta). Kiek mažiausiai reikia paimti, kad grupėje būtų didelė tikimybė, kad bent vienas patyręs bendražygis? Šiuo atveju populiacija yra 100, imtis 10, atrankos reikalavimai yra bent vienas asmuo, jau važiavęs E3.

Vikipedijoje yra ne toks juokingas, bet praktiškesnis pavyzdys apie sugedusias dalis partijoje.

Poisson

O kiek klientų kas minutę skambina techninės pagalbos karštąja linija? Tai yra rezultatas, kurio pasiskirstymas atrodo dvejopas, jei kiekvieną sekundę skaičiuosime kaip Bernulio testą, kurio metu klientas neskambina (0) arba skambina (1). Tačiau elektros tiekimo organizacijos puikiai žino: išjungus elektrą, du žmonės gali paskambinti per sekundę. ar net daugiau nei šimtąžmonių. Nepadeda ir 60 000 milisekundžių testų mąstymas – testų yra daugiau, tikimybė, kad skambučiai per milisekundę bus mažesnė, net jei neskaičiuojate dviejų ar daugiau tuo pačiu metu, bet techniškai tai vis tiek ne Bernulio testas. Tačiau loginis samprotavimas su perėjimu į begalybę veikia. Tegul n linksta į begalybę, o p į 0, kad np būtų pastovus. Tai tarsi padalijimas į vis mažesnes laiko dalis su vis mažesne skambučio tikimybe. Riboje gauname Puasono skirstinį.

Kaip ir dvejetainis, Puasono skirstinys yra skaičiaus skirstinys: kiek kartų kažkas įvyks. Jis parametrizuojamas ne tikimybe p ir bandymų skaičiumi n, o vidutiniu intensyvumu λ, kuris, analogiškai dvinariui, yra tiesiog pastovi reikšmė np. Puasono pasiskirstymas – kas tai būtina prisiminkite, kai kalbame apie įvykių per tam tikrą laiką skaičiavimą pastoviu duotu intensyvumu.

Kai kažkas, pavyzdžiui, paketai atkeliauja į maršrutizatorių, klientai pasirodo parduotuvėje ar kažkas laukia eilėje, pagalvokite „Poisson“.

Geometrinis ir neigiamas dvejetainis

Iš paprastų Bernoulli testų atsiranda kitoks skirstymas. Kiek kartų moneta nusileis ant galvų, kol ji nusileis ant galvų? Uodegų skaičius atitinka geometrinį pasiskirstymą. Kaip ir Bernulio skirstinys, jį parametrizuoja sėkmingo rezultato tikimybė, p. Jis nėra parametruojamas skaičiumi n, metimo bandymų skaičiumi, nes nesėkmingų testų skaičius yra būtent rezultatas.

Jei dvinario skirstinys yra „kiek sėkmingų“, tai geometrinis skirstinys yra „Kiek nesėkmių prieš sėkmę?

Neigiamas binominis skirstinys yra paprastas ankstesnio apibendrinimas. Tai yra nesėkmių skaičius prieš r, o ne 1 sėkmę. Todėl jį toliau parametrizuoja šis r. Kartais jis apibūdinamas kaip sėkmės ir nesėkmės skaičius. Bet kaip mano gyvenimo treneris sako: „Jūs nusprendžiate, kas yra sėkmė, o kas yra nesėkmė“, tai yra tas pats dalykas, jei atsimenate, kad tikimybė p taip pat turėtų būti atitinkamai teisinga sėkmės arba nesėkmės tikimybė.

Jei jums reikia pokšto, kad sumažintumėte įtampą, galite paminėti, kad dvinario ir hipergeometrinio skirstiniai yra akivaizdi pora, tačiau geometrinis ir neigiamas dvinaris taip pat yra gana panašūs, ir tada pasakyti: „Na, kas juos taip vadina, a? “

Eksponentinis ir Weibula

Dar kartą apie skambučius į techninę pagalbą: kiek laiko užtruks iki kito skambučio? Šio laukimo laiko pasiskirstymas atrodo geometrinis, nes kiekviena sekundė, kol niekas nepaskambina, yra kaip nesėkmė, iki antrosios, kol galiausiai įvyksta skambutis. Gedimų skaičius yra kaip sekundžių skaičius, kol niekas nepaskambino, ir tai praktiškai laiko iki kito skambučio, bet „praktiškai“ mums neužtenka. Esmė ta, kad šis laikas bus ištisų sekundžių suma, todėl nebus galima skaičiuoti laukimo per šią sekundę iki paties skambučio.

Na, kaip ir anksčiau, mes pereiname prie geometrinio pasiskirstymo ribos, atsižvelgiant į laiko dalis - ir voila. Gauname eksponentinį skirstinį, kuris tiksliai apibūdina laiką prieš skambutį. Tai yra nuolatinis paskirstymas, pirmasis toks, nes rezultatas nebūtinai yra ištisomis sekundėmis. Kaip ir Puasono skirstinys, jis parametruojamas pagal intensyvumą λ.

Pakartodamas ryšį tarp dvinario ir geometrinio, Puasono „kiek įvykių laike? yra susijęs su eksponentiniu „kiek laiko iki įvykio? Jei yra įvykių, kurių skaičius per laiko vienetą paklūsta Puasono skirstiniui, tai laikas tarp jų paklūsta eksponentiniam skirstiniui su tuo pačiu parametru λ. Šis dviejų paskirstymų atitikimas turi būti pastebėtas aptariant bet kurį iš jų.

Eksponentinis pasiskirstymas turėtų ateiti į galvą galvojant apie „laiką iki įvykio“, galbūt „laiką iki nesėkmės“. Tiesą sakant, tai yra tokia svarbi situacija, kad yra daugiau apibendrintų paskirstymų, apibūdinančių MTBF, pvz., Weibull paskirstymą. Nors eksponentinis pasiskirstymas yra tinkamas, kai, pavyzdžiui, susidėvėjimo arba gedimo dažnis yra pastovus, Weibull skirstinys gali modeliuoti gedimų dažnį, didėjantį (arba mažėjantį) laikui bėgant. Eksponentinis paprastai yra ypatingas atvejis.

Kalbėdami apie MTBF pagalvokite „Weibull“.

Normalus, lognormalus, Stjudento t ir chi kvadratas

Normalus arba Gauso skirstinys tikriausiai yra vienas svarbiausių. Jo varpelio forma iš karto atpažįstama. Kaip ir , tai ypač smalsus subjektas, kuris pasireiškia visur, net iš paprastų šaltinių. Paimkite verčių rinkinį, atitinkantį tą patį pasiskirstymą – bet kurį! - ir sulenkite juos. Jų sumos pasiskirstymas atitinka (apytiksliai) normalųjį pasiskirstymą. Kuo daugiau dalykų sumuojama, tuo jų suma artimesnė normaliajam skirstiniui (pagautas: terminų skirstinys turi būti nuspėjamas, nepriklausomas, linksta tik į normalųjį). Nuostabu, kad tai tiesa, nepaisant pradinio platinimo.

Pastaba vertimas

Nustebau, kad autorius nerašo apie palyginamos sumuojamų skirstinių skalės poreikį: jei vienas ženkliai dominuos už kitus, konvergencija bus labai bloga. Ir apskritai absoliučios abipusės nepriklausomybės pakanka silpnos priklausomybės.

Na, turbūt tinka vakarėliams, kaip jis rašė.


Tai vadinama „centrinės ribos teorema“, ir jūs turite žinoti, kas tai yra, kodėl ji taip vadinama ir ką tai reiškia, kitaip iškart nusijuoksite.

Jo kontekste normalus yra susijęs su visais skirstiniais. Nors iš esmės tai asocijuojasi su visokių sumų skirstymu. Bernoulli bandymų suma atitinka dvinarį skirstinį ir, didėjant bandymų skaičiui, šis binominis skirstinys priartėja prie normalaus skirstinio. Taip pat jo pusbrolis yra hipergeometrinis pasiskirstymas. Puasono skirstinys – ribinė dvinario forma – taip pat artėja prie normalaus, didėjant intensyvumo parametrui.

Rezultatai, atitinkantys lognormalųjį pasiskirstymą, sukuria reikšmes, kurių logaritmas yra normaliai pasiskirstęs. Arba kitaip: normaliai paskirstytos reikšmės eksponentas yra lognormaliai paskirstytas. Jei sumos paskirstytos įprastai, atminkite, kad produktai paskirstomi lognormaliai.

Studento t skirstinys yra t testo, kurį daugelis ne statistikų tiria kitose srityse, pagrindas. Jis naudojamas daryti prielaidas apie normalaus skirstinio vidurkį, taip pat linkęs į normalųjį skirstinį, kai jo parametras didėja. Išskirtinis t skirstinio bruožas yra jo uodegos, kurios storesnės nei normaliojo pasiskirstymo.

Jei riebus pokštas nepakankamai sukrėtė jūsų kaimyną, pereikite prie gana juokingos pasakos apie alų. Daugiau nei prieš 100 metų Guinnessas naudojo statistiką savo storumui pagerinti. Tada William Seely Gossetas išrado visiškai naują statistinę teoriją, kaip pagerinti miežių auginimą. Gossetas įtikino savo viršininką, kad kiti aludariai nesupras, kaip panaudoti jo idėjas, ir gavo leidimą publikuoti, bet slapyvardžiu „Studentas“. Garsiausias Gosseto pasiekimas yra būtent šis t-paskirstymas, kuris, galima sakyti, pavadintas jo vardu.

Galiausiai chi kvadrato skirstinys yra normaliai paskirstytų reikšmių kvadratų sumų pasiskirstymas. Chi kvadrato testas yra pagrįstas šiuo skirstiniu, kuris pats yra pagrįstas skirtumų, kurie turėtų būti normaliai pasiskirstę, kvadratų suma.

Gama ir beta

Šiuo metu, jei jau pradėjote kalbėti apie kažką chi kvadrato, pokalbis prasideda nuoširdžiai. Galbūt jau kalbatės su tikrais statistais ir tikriausiai jau turėtumėte nusilenkti, nes gali iškilti tokie dalykai kaip gama pasiskirstymas. Tai yra apibendrinimas Ir eksponentinis Ir chi kvadrato pasiskirstymas. Kaip ir eksponentinis pasiskirstymas, jis naudojamas sudėtingiems laukimo laiko modeliams. Pavyzdžiui, gama pasiskirstymas atsiranda, kai imituojamas laikas iki kitų n įvykių. Mašininiame mokyme jis pasirodo kaip „greitas išankstinis paskirstymas“ su keliais kitais paskirstymais.

Nekalbėkite apie šiuos konjuguotus skirstinius, bet jei reikia, nepamirškite pakalbėti apie beta paskirstymą, nes tai yra konjugatas prieš daugumą čia paminėtų paskirstymų. Duomenų mokslininkai įsitikinę, kad būtent tai ir buvo sukurta. Atsainiai paminėkite tai ir eikite prie durų.

Išminties pradžia

Tikimybių skirstiniai yra kažkas, apie ką negalite per daug žinoti. Tie, kurie tikrai domisi, gali peržiūrėti šį ypač išsamų visų tikimybių pasiskirstymo žemėlapį Pridėti žymas

Kaip žinoma, atsitiktinis kintamasis yra kintamasis dydis, kuris, priklausomai nuo atvejo, gali įgyti tam tikras reikšmes. Atsitiktiniai kintamieji žymimi lotyniškos abėcėlės didžiosiomis raidėmis (X, Y, Z), o jų reikšmės – atitinkamomis mažosiomis raidėmis (x, y, z). Atsitiktiniai kintamieji skirstomi į nenutrūkstamus (diskretuosius) ir tęstinius.

Diskretus atsitiktinis dydis yra atsitiktinis kintamasis, kuris ima tik baigtinę arba begalinę (skaičiuojamą) reikšmių rinkinį su tam tikromis nulinėmis tikimybėmis.

Diskretinio atsitiktinio dydžio pasiskirstymo dėsnis yra funkcija, jungianti atsitiktinio dydžio reikšmes su atitinkamomis tikimybėmis. Paskirstymo dėsnį galima nurodyti vienu iš šių būdų.

1 . Paskirstymo dėsnį galima pateikti pagal lentelę:

kur λ>0, k = 0, 1, 2, … .

V) naudojant paskirstymo funkcijos F(x) , kuri kiekvienai reikšmei x nustato tikimybę, kad atsitiktinis dydis X įgis mažesnę nei x reikšmę, t.y. F(x) = P(X< x).

Funkcijos F(x) savybės

3 . Paskirstymo dėsnį galima nurodyti grafiškai – paskirstymo daugiakampis (daugiakampis) (žr. 3 uždavinį).

Atkreipkite dėmesį, kad norint išspręsti kai kurias problemas, nebūtina žinoti paskirstymo dėsnio. Kai kuriais atvejais pakanka žinoti vieną ar kelis skaičius, atspindinčius svarbiausias skirstinio dėsnio ypatybes. Tai gali būti skaičius, turintis atsitiktinio dydžio „vidutinę reikšmę“, arba skaičius, rodantis vidutinį atsitiktinio dydžio nuokrypio nuo jo vidutinės vertės dydį.

Tokio pobūdžio skaičiai vadinami atsitiktinio dydžio skaitinėmis charakteristikomis. :

  • Pagrindinės skaitinės diskretinio atsitiktinio dydžio charakteristikos Matematinis lūkestis (vidutinė reikšmė) diskretinio atsitiktinio dydžio.
    M(X)=Σ x i p i
  • Binominiam skirstiniui M(X)=np, Puasono skirstiniui M(X)=λ Sklaida diskrečiųjų atsitiktinių dydžių D(X)=M2 arba D(X) = M(X 2)− 2
    . Skirtumas X–M(X) vadinamas atsitiktinio dydžio nuokrypiu nuo jo matematinio lūkesčio.
  • Dvinominiam skirstiniui D(X)=npq, Puasono skirstiniui D(X)=λ Standartinis nuokrypis (standartinis nuokrypis).

σ(X)=√D(X)

Problemų sprendimo pavyzdžiai tema „Diskrečiojo atsitiktinio dydžio pasiskirstymo dėsnis“

Buvo išleista 1000 loterijos bilietų: 5 iš jų laimės 500 rublių, 10 laimės 100 rublių, 20 laimės 50 rublių, 50 laimės 10 rublių. Nustatykite atsitiktinio dydžio X – laimėjimai už bilietą – tikimybių pasiskirstymo dėsnį.

Sprendimas. Atsižvelgiant į problemos sąlygas, galimos šios atsitiktinio dydžio X reikšmės: 0, 10, 50, 100 ir 500.

Bilietų skaičius be laimėjimo yra 1000 – (5+10+20+50) = 915, tada P(X=0) = 915/1000 = 0,915.

Panašiai randame ir visas kitas tikimybes: P(X=0) = 50/1000=0,05, P(X=50) = 20/1000=0,02, P(X=100) = 10/1000=0,01, P(X) =500) = 5/1000=0,005. Pateikiame gautą dėsnį lentelės pavidalu:

Raskime matematinę reikšmės X lūkesčius: M(X) = 1*1/6 + 2*1/6 + 3*1/6 + 4*1/6 + 5*1/6 + 6*1/6 = (1+ 2+3+4+5+6)/6 = 21/6 = 3,5

3 užduotis.

Prietaisas susideda iš trijų nepriklausomai veikiančių elementų.

Sprendimas. 1. Kiekvieno elemento gedimo tikimybė viename eksperimente yra 0,1. Sudarykite vieno eksperimento nepavykusių elementų skaičiaus pasiskirstymo dėsnį, sukonstruokite skirstinio daugiakampį. Raskite pasiskirstymo funkciją F(x) ir nubraižykite ją. Raskite diskretinio atsitiktinio dydžio matematinę lūkesčius, dispersiją ir standartinį nuokrypį.

Diskretus atsitiktinis kintamasis X = (nepavykusių elementų skaičius viename eksperimente) turi tokias galimas reikšmes: x 1 =0 (nė vienas įrenginio elementas nepavyko), x 2 =1 (vienas elementas nepavyko), x 3 =2 ( du elementai nepavyko ) ir x 4 =3 (trijų elementų nepavyko). Elementų gedimai nepriklauso vienas nuo kito, kiekvieno elemento gedimo tikimybė yra vienoda, todėl taikytina Bernulio formulė
. Atsižvelgiant į tai, kad pagal sąlygą n=3, p=0,1, q=1-p=0,9, nustatome reikšmių tikimybes:
P 3 (0) = C 3 0 p 0 q 3-0 = q 3 = 0,9 3 = 0,729;
P 3 (1) = C 3 1 p 1 q 3-1 = 3 * 0,1 * 0,9 2 = 0,243;
P 3 (2) = C 3 2 p 2 q 3-2 = 3 * 0,1 2 * 0,9 = 0,027;
P 3 (3) = C 3 3 p 3 q 3-3 = p 3 = 0,1 3 = 0,001;

Patikrinkite: ∑p i = 0,729+0,243+0,027+0,001=1.

Taigi norimas X dvinario skirstinio dėsnis turi tokią formą:

3. Galimas x i reikšmes nubraižome išilgai abscisių ašies, o atitinkamas tikimybes p i išilgai ordinačių ašies. Sukonstruokime taškus M 1 (0; 0,729), M 2 (1; 0,243), M 3 (2; 0,027), M 4 (3; 0,001). Šiuos taškus sujungę tiesių linijų atkarpomis, gauname norimą skirstymo daugiakampį.

Raskime skirstinio funkciją F(x) = Р(Х<0) = 0;
Jei x ≤ 0, turime F(x) = Р(Х< x ≤1 имеем F(x) = Р(Х<1) = Р(Х = 0) = 0,729;
už 0< x ≤ 2 F(x) = Р(Х<2) = Р(Х=0) + Р(Х=1) =0,729+ 0,243 = 0,972;
už 1< x ≤ 3 F(x) = Р(Х<3) = Р(Х = 0) + Р(Х = 1) + Р(Х = 2) = 0,972+0,027 = 0,999;
už 2

jei x > 3 bus F(x) = 1, nes renginys patikimas.

4. Funkcijos F(x) grafikas
Binominiam skirstiniui X:
- dispersija D(X) = npq = 3*0,1*0,9 = 0,27;
- standartinis nuokrypis σ(X) = √D(X) = √0,27 ≈ 0,52.

6 skyrius. Tipiniai atsitiktinių dydžių pasiskirstymo dėsniai ir skaitinės charakteristikos

Funkcijos F(x), p(x) arba surašymo p(x i) forma vadinama atsitiktinio dydžio pasiskirstymo dėsniu. Nors galime įsivaizduoti begalę atsitiktinių dydžių įvairovę, pasiskirstymo dėsnių yra daug mažiau. Pirma, skirtingi atsitiktiniai dydžiai gali turėti lygiai tuos pačius pasiskirstymo dėsnius. Pavyzdžiui: imkime tik 2 reikšmes 1 ir -1 su tikimybe 0,5; reikšmė z = -y turi lygiai tą patį skirstymo dėsnį.
Antra, labai dažnai atsitiktiniai dydžiai turi panašius pasiskirstymo dėsnius, t.y., pavyzdžiui, p(x) jiems išreiškiamas tos pačios formos formulėmis, besiskiriančiomis tik viena ar keliomis konstantomis. Šios konstantos vadinamos pasiskirstymo parametrais.

Nors iš esmės galimi įvairūs paskirstymo dėsniai, čia bus aptariami keli tipiškiausi dėsniai. Svarbu atkreipti dėmesį į jų atsiradimo sąlygas, šių skirstinių parametrus ir savybes.

1. Vienodas paskirstymas
Taip vadinamas atsitiktinio kintamojo skirstinys, kuris intervale (a,b) gali turėti bet kokias reikšmes, o tikimybė, kad jis pateks į bet kurį segmentą, esantį (a,b), yra proporcinga jo ilgiui. segmentas ir nepriklauso nuo jo padėties, o už (a,b ) ribų esančių verčių tikimybė yra lygi 0.


6.1 pav. Vienodo pasiskirstymo funkcija ir tankis

Paskirstymo parametrai: a, b

2. Normalus pasiskirstymas
Pasiskirstymas su tankiu, aprašytu formule

(6.1)

vadinamas normaliu.
Pasiskirstymo parametrai: a, σ


6.2 pav. Tipinio tankio ir normalaus pasiskirstymo funkcija

3. Bernulli paskirstymas
Jei atliekama nepriklausomų bandymų serija, kurių kiekviename įvykis A gali atsirasti su ta pačia tikimybe p, tada įvykio įvykių skaičius yra atsitiktinis dydis, paskirstytas pagal Bernulio dėsnį arba pagal dvinario dėsnį. (kitas platinimo pavadinimas).

Čia n yra bandymų skaičius serijoje, m yra atsitiktinis dydis (įvykio A atvejų skaičius), P n (m) yra tikimybė, kad A įvyks lygiai m kartų, q = 1 - p (tikimybė kad A nepasirodys teismo procese ).

1 pavyzdys: kauliukas metamas 5 kartus, kokia tikimybė, kad kauliukas 6 bus metamas du kartus?
n = 5, m = 2, p = 1/6, q = 5/6

Pasiskirstymo parametrai: n, p

4. Puasono pasiskirstymas
Puasono skirstinys gaunamas kaip ribinis Bernulio skirstinio atvejis, jei p linkęs į nulį, o n į begalybę, bet taip, kad jų sandauga liktų pastovi: nр = а. Formaliai toks perėjimas prie ribos veda prie formulės

Paskirstymo parametras: a

Daugelis atsitiktinių dydžių, aptinkamų moksle ir praktiniame gyvenime, priklauso nuo Puasono skirstinio.

2 pavyzdys: greitosios medicinos pagalbos stotyje per valandą gautų iškvietimų skaičius.
Laiko intervalą T (1 valanda) padalinkime į mažus intervalus dt, kad tikimybė sulaukti dviejų ar daugiau skambučių per dt būtų nereikšminga, o vieno iškvietimo tikimybė p proporcinga dt: p = μdt;
stebėjimą momentais dt laikysime nepriklausomais bandymais, tokių bandymų skaičius per laiką T: n = T / dt;
jei darysime prielaidą, kad iškvietimų tikimybė per valandą nekinta, tai bendras skambučių skaičius paklūsta Bernulio dėsniui su parametrais: n = T / dt, p = μdt. Nukreipę dt į nulį, matome, kad n linksta į begalybę, o sandauga n×р išlieka pastovi: a = n×р = μТ.

3 pavyzdys: idealių dujų molekulių skaičius tam tikrame fiksuotame tūryje V.
Tūrį V padalinkime į mažus tūrius dV taip, kad tikimybė rasti dvi ar daugiau dV molekulių būtų nereikšminga, o tikimybė rasti vieną molekulę būtų proporcinga dV: p = μdV; kiekvieno tūrio dV stebėjimą laikysime nepriklausomu testu, tokių bandymų skaičius n=V/dV; jei darome prielaidą, kad tikimybė rasti molekulę bet kurioje V viduje yra vienoda, bendras V tūrio molekulių skaičius atitinka Bernulio dėsnį su parametrais: n = V / dV, p = μdV. Nukreipę dV į nulį, matome, kad n linksta į begalybę, o sandauga n×р išlieka pastovi: a = n×р =μV.

Atsitiktinių dydžių skaitinės charakteristikos

1. Matematinis lūkestis (vidutinė vertė)

Apibrėžimas:
Matematinis lūkestis vadinamas
  (6.4)

Suma perimama per visas reikšmes, kurias įgauna atsitiktinis kintamasis. Serija turi būti absoliučiai konvergentiška (kitaip manoma, kad atsitiktinis kintamasis neturi matematinių lūkesčių)

;   (6,5)

Integralas turi būti absoliučiai konvergentiškas (kitaip sakoma, kad atsitiktinis dydis neturi matematinių lūkesčių)


Matematinės lūkesčių savybės:

a. Jei C yra pastovi reikšmė, tai MC = C
b. MCx = CMx
c. Atsitiktinių dydžių sumos matematinis lūkestis visada lygus jų matematinių lūkesčių sumai: M(x+y) = Mx + Mano d. Supažindinama su sąlyginio matematinio lūkesčio samprata. Jei atsitiktinis dydis įgauna savo reikšmes x i su skirtingomis tikimybėmis p(x i /H j) skirtingomis sąlygomis H j, tada nustatoma sąlyginė matematinė lūkestis

Kaip arba ;   (6.6)

Jei žinomos įvykių H j tikimybės, visa

matematiniai lūkesčiai: ;   (6.7)

4 pavyzdys: Kiek kartų vidutiniškai reikia mesti monetą, kol pasirodys pirmasis simbolis? Šią problemą galima išspręsti akimirksniu

x i 1 2 3 ... k...
p(x i) :  ,

bet šią sumą dar reikia paskaičiuoti. Tai galite padaryti paprasčiau, naudodami sąlyginio ir visiško matematinio lūkesčio sąvokas. Panagrinėkime hipotezes H 1 – herbas iškrito iš pirmo karto, H 2 – iškrito ne pirmą kartą. Akivaizdu, kad p(H1) = p(H2) = ½; Mx/N1 = 1;
Mx / N 2 yra 1 daugiau nei tikimasi, nes po pirmojo monetos metimo situacija nepasikeitė, bet jau kartą buvo išmesta. Naudodami bendros matematinio lūkesčio formulę, gauname Мх = Мx / Н 1 ×р(Н 1) + Мx / Н 2 ×р(Н 2) = 1 × 0,5 + (Мх + 1) × 0,5, išspręsdami lygtį Мх iš karto gauname Mx = 2.

e. Jei f(x) yra atsitiktinio dydžio x funkcija, tada apibrėžiama atsitiktinio dydžio funkcijos matematinio lūkesčio samprata:

Diskrečiajam atsitiktiniam dydžiui: ;   (6.8)

Suma perimama per visas reikšmes, kurias įgauna atsitiktinis kintamasis. Serija turi būti visiškai konvergentiška.

Ištisiniam atsitiktiniam dydžiui: ;   (6.9)

Integralas turi būti absoliučiai konvergentiškas.

2. Atsitiktinio dydžio dispersija
Apibrėžimas:
Atsitiktinio dydžio x dispersija yra matematinė reikšmės vertės kvadratinio nuokrypio nuo jos matematinio lūkesčio tikėtis: Dx = M(x-Mx) 2

Diskrečiajam atsitiktiniam dydžiui: ;   (6.10)

Suma perimama per visas reikšmes, kurias įgauna atsitiktinis kintamasis. Serija turi būti konvergencinė (kitaip manoma, kad atsitiktinis kintamasis neturi dispersijos)

Ištisiniam atsitiktiniam dydžiui: ;   (6.11)

Integralas turi būti konvergentinis (kitaip sakoma, kad atsitiktinis kintamasis neturi dispersijos)

Dispersijos savybės:
a. Jei C yra pastovi reikšmė, tai DC = 0
b. DСх = С 2 Dх
c. Atsitiktinių dydžių sumos dispersija visada lygi jų dispersijų sumai tik tuo atveju, jei šios reikšmės yra nepriklausomos (nepriklausomų kintamųjų apibrėžimas)
d. Norėdami apskaičiuoti dispersiją, patogu naudoti formulę:

Dx = Mx 2 – (Mx) 2 (6,12)

Ryšys tarp skaitinių charakteristikų
ir tipinių skirstinių parametrai

paskirstymasparametrusformulęMxDx
uniformaa, b (b+a) / 2(b-a) 2/12
normalusa, σ aσ 2
Bernulisn, p n.p.npq
Poissona aa


Ar jums patiko straipsnis? Pasidalinkite su draugais!