Normalus pasiskirstymas. Stabilūs paskirstymai

Normalus įstatymas tikimybių skirstiniai

Neperdedant jį galima pavadinti filosofiniu dėsniu. Stebėdami įvairius objektus ir procesus mus supančiame pasaulyje, dažnai susiduriame su tuo, kad kažko neužtenka ir kad yra norma:


Čia yra pagrindinis vaizdas tankio funkcijos normalų tikimybių pasiskirstymą ir sveikinu jus su šia įdomia pamoka.

Kokius pavyzdžius galite pateikti? Tiesiog jų tamsa. Tai, pavyzdžiui, žmonių (ir ne tik) ūgis, svoris, jų fizinės jėgos, protinius gebėjimus ir tt Yra „pagrindinė masė“ (dėl vienokių ar kitokių priežasčių) ir yra nukrypimų į abi puses.

Tai įvairių savybių negyvi daiktai (tokio pat dydžio, svorio). Tai atsitiktinė procesų trukmė..., vėl į galvą atėjo liūdnas pavyzdys, ir todėl pasakysiu lempučių "gyvenimo laiką" :) Iš fizikos prisiminiau oro molekules: tarp jų yra lėtųjų, yra greiti, bet dauguma juda „standartiniu“ greičiu.

Tada mes nukrypstame nuo centro dar vienu standartiniu nuokrypiu ir apskaičiuojame aukštį:

Taškų žymėjimas brėžinyje (žalias) ir matome, kad to visiškai pakanka.

Paskutiniame etape kruopščiai nubrėžiame grafiką ir ypač atsargiai atspindėti tai išgaubtas / įgaubtas! Na, tikriausiai jau seniai supratote, kad x ašis yra horizontalioji asimptote, ir už jo „lipti“ kategoriškai draudžiama!

At elektroninė registracija Sprendimo grafiką nesunku susikurti Excel programoje, o pačiam netikėtai šia tema net įrašiau trumpą filmuką. Bet pirmiausia pakalbėkime apie tai, kaip normalios kreivės forma keičiasi priklausomai nuo ir reikšmių.

Didinant arba mažinant "a" (su nuolatine „sigma“) grafikas išlaiko savo formą ir juda dešinėn/kairėn atitinkamai. Pavyzdžiui, kai funkcija įgauna formą ir mūsų grafikas „perkelia“ 3 vienetus į kairę - tiksliai iki koordinačių pradžios:


Normaliai paskirstytas dydis su nuliniais matematiniais lūkesčiais gavo visiškai natūralų pavadinimą - centre; jo tankio funkcija net, o grafikas yra simetriškas ordinatės atžvilgiu.

Pasikeitus „sigma“ (su konstanta "a"), grafikas „lieka toks pat“, bet keičia formą. Padidėjęs jis tampa žemesnis ir pailgėjęs, kaip aštuonkojis, ištempęs čiuptuvus. Ir, atvirkščiai, mažinant grafiką tampa siauresnis ir aukštesnis- pasirodo, kad tai „nustebęs aštuonkojis“. Taip, kada mažėti„sigma“ du kartus: ankstesnis grafikas susiaurėja ir pailgėja du kartus:

Viskas visiškai atitinka grafikų geometrinės transformacijos.

Vadinamas normalusis skirstinys su vienetine sigmos reikšme normalizuotas, o jei taip pat centre(mūsų atvejis), tada toks skirstinys vadinamas standartinis. Ji turi dar paprastesnę tankio funkciją, kuri jau buvo rasta Laplaso lokalinė teorema: . Standartinis platinimas buvo plačiai pritaikytas praktikoje, ir labai greitai mes pagaliau suprasime jo paskirtį.

Na, o dabar pažiūrėkime filmą:

Taip, visiškai teisingai – kažkaip nepelnytai tai liko šešėlyje tikimybių pasiskirstymo funkcija. Prisiminkime ją apibrėžimas:
– tikimybė, kad atsitiktinis kintamasis įgis reikšmę MAŽESNĖ, nei kintamasis, kuris „pereina“ visas realias reikšmes iki „pliuso“ begalybės.

Integralo viduje paprastai naudojama skirtinga raidė, kad nebūtų „persidengimų“ su užrašu, nes čia kiekviena reikšmė yra susieta su netinkamas integralas , kuris lygus kai kuriems numerį iš intervalo .

Beveik visos reikšmės nėra pritaikytos tikslus skaičiavimas, tačiau, kaip ką tik matėme, naudojant šiuolaikinę skaičiavimo galią tai nėra sunku. Taigi, dėl funkcijos standartinis paskirstymas, atitinkamoje „Excel“ funkcijoje paprastai yra vienas argumentas:

=NORMSDIST(z)

Vienas, du – ir viskas:

Brėžinyje aiškiai parodytas visų įgyvendinimas paskirstymo funkcijos savybės, o iš techninių niuansų čia reikėtų atkreipti dėmesį horizontalios asimptotės ir vingio tašką.

Dabar prisiminkime vieną iš pagrindinių temos užduočių, būtent, išsiaiškinkime, kaip rasti tikimybę, kad normalus atsitiktinis kintamasis paims vertę iš intervalo. Geometriškai ši tikimybė yra lygi plotas tarp normalios kreivės ir x ašies atitinkamame skyriuje:

bet kiekvieną kartą bandau gauti apytikslę vertę yra nepagrįstas, todėl jį naudoti racionaliau „lengva“ formulė:
.

! Taip pat prisimena , Ką

Čia galite vėl naudoti „Excel“, tačiau yra keletas reikšmingų „bet“: pirma, ji ne visada yra po ranka, antra, „paruoštos“ vertės greičiausiai sukels mokytojo klausimų. Kodėl?

Jau ne kartą apie tai kalbėjau: kažkada (ir ne taip seniai) įprastas skaičiuotuvas buvo prabanga, o m. mokomoji literatūra„Rankinis“ nagrinėjamos problemos sprendimo būdas vis dar išsaugomas. Jo esmė yra standartizuoti reikšmės „alfa“ ir „beta“, tai yra, sumažina sprendimą iki standartinio pasiskirstymo:

Pastaba : funkciją lengva pasiekti bendras atvejis naudojant linijinį pakaitalai. Tada taip pat:

ir atlikus pakeitimą pagal formulę: perėjimas nuo vertybių atsitiktinis pasiskirstymas– į atitinkamas standartinio skirstinio vertes.

Kodėl tai būtina? Faktas yra tas, kad vertes kruopščiai apskaičiavo mūsų protėviai ir sudarė į specialią lentelę, kuri yra daugelyje knygų apie terwer. Tačiau dar dažniau yra vertybių lentelė, kurią jau nagrinėjome Laplaso integralų teorema:

Jei turime Laplaso funkcijos verčių lentelę , tada sprendžiame per jį:

Trupmeninės reikšmės Tradiciškai apvaliname iki 4 skaitmenų po kablelio, kaip daroma standartinėje lentelėje. O kontrolei yra 5 punktas išdėstymas.

Aš jums tai primenu , ir siekiant išvengti painiavos visada kontroliuoti, prieš akis yra lentelė KOKIA funkcija.

Atsakymas reikalaujama pateikti procentais, todėl apskaičiuotą tikimybę reikia padauginti iš 100, o rezultatą pateikti su prasmingu komentaru:

– skrendant nuo 5 iki 70 m, kris maždaug 15,87% sviedinių

Treniruojamės savarankiškai:

3 pavyzdys

Gamykloje pagamintų guolių skersmuo yra atsitiktinis dydis, paprastai pasiskirstęs su 1,5 cm matematiniu nuokrypiu, o standartiniu nuokrypiu - 0,04 cm. Raskite tikimybę, kad atsitiktinai parinkto guolio dydis svyruoja nuo 1,4 iki 1,6 cm.

Pavyzdiniame sprendime ir toliau kaip dažniausiai pasitaikančią parinktį naudosiu Laplaso funkciją. Beje, atkreipkite dėmesį, kad pagal formuluotę čia į svarstymą galima įtraukti intervalo galus. Tačiau tai nėra kritiška.

Ir jau šiame pavyzdyje mes susitikome ypatingas atvejis– kai intervalas yra simetriškas matematinis lūkestis. Esant tokiai situacijai, jis gali būti parašytas forma ir, naudojant Laplaso funkcijos keistumą, supaprastinti darbo formulę:


Delta parametras vadinamas nukrypimas nuo matematinio lūkesčio, o dviguba nelygybė gali būti „supakuota“ naudojant modulis:

– tikimybė, kad atsitiktinio dydžio reikšmė nukryps nuo matematinio lūkesčio mažiau nei .

Gerai, kad sprendimas telpa vienoje eilutėje :)
– tikimybė, kad atsitiktinai paimto guolio skersmuo nuo 1,5 cm skiriasi ne daugiau kaip 0,1 cm.

Šios užduoties rezultatas pasirodė artimas vienybei, tačiau norėčiau dar didesnio patikimumo - būtent išsiaiškinti ribas, kuriose yra skersmuo beveik visi guoliai. Ar tam yra koks nors kriterijus? Egzistuoja! Į pateiktą klausimą atsako vadinamasis

trijų sigmų taisyklė

Jo esmė ta praktiškai patikimas yra faktas, kad normaliai paskirstytas atsitiktinis kintamasis paims reikšmę iš intervalo .

Iš tiesų, nukrypimo nuo numatomos vertės tikimybė yra mažesnė nei:
arba 99,73 proc.

Kalbant apie guolius, tai yra 9973 vienetai, kurių skersmuo nuo 1,38 iki 1,62 cm, ir tik 27 „nestandartinės“ kopijos.

Praktiniuose tyrimuose trijų sigmų taisyklė dažniausiai taikoma priešinga kryptimi: jei statistiškai Nustatyta, kad beveik visos vertybės tiriamas atsitiktinis kintamasis patenka į 6 standartinių nuokrypių intervalą, tada yra įtikinamų priežasčių manyti, kad ši reikšmė paskirstoma pagal įprastą dėsnį. Tikrinimas atliekamas naudojant teoriją statistines hipotezes , kurią tikiuosi anksčiau ar vėliau pasiekti :)

Tuo tarpu mes toliau sprendžiame sunkias sovietų problemas:

4 pavyzdys

Atsitiktinė svėrimo paklaidos reikšmė paskirstoma pagal įprastą dėsnį su nuline matematine tikėtina ir standartinis nuokrypis 3 gramai. Raskite tikimybę, kad kitas svėrimas bus atliktas su paklaida, neviršijančia 5 gramų absoliučia verte.

Sprendimas labai paprasta. Pagal sąlygą mes iš karto pažymime, kad kito svėrimo metu (kažkas ar kažkas) beveik 100% gausime rezultatą 9 gramų tikslumu. Tačiau problema susijusi su siauresniu nuokrypiu ir pagal formulę :

– tikimybė, kad kitas svėrimas bus atliktas su ne didesne kaip 5 gramų paklaida.

Atsakymas:

Išspręsta problema iš esmės skiriasi nuo iš pažiūros panašios. 3 pavyzdys pamoka apie vienodas paskirstymas. Įvyko klaida apvalinimas matavimo rezultatai, čia kalbama apie pačių matavimų atsitiktinę paklaidą. Tokios klaidos atsiranda dėl techninės charakteristikos patį įrenginį (priimtinų klaidų diapazonas paprastai nurodomas jo pase), taip pat dėl ​​eksperimentatoriaus kaltės - kai mes, pavyzdžiui, „iš akies“ imame rodmenis iš tų pačių svarstyklių adatos.

Tarp kitų yra ir vadinamųjų sistemingas matavimo paklaidos. Tai jau yra neatsitiktinis klaidų, atsirandančių dėl netinkamo įrenginio nustatymo ar veikimo. Pavyzdžiui, nereguliuojamos grindų svarstyklės gali stabiliai „pridėti“ kilogramų, o pardavėjas sistemingai apsunkina klientus. Arba jis gali būti skaičiuojamas nesistemingai. Tačiau bet kokiu atveju tokia klaida nebus atsitiktinė, o jos lūkesčiai yra nuliniai.

...Skubiai rengiu pardavimų mokymo kursą =)

Mes patys nusprendžiame atvirkštinė problema:

5 pavyzdys

Volelio skersmuo yra atsitiktinis normaliai paskirstytas atsitiktinis dydis, jo standartinis nuokrypis lygus mm. Raskite intervalo, simetriško matematinio lūkesčio, ilgį, į kurį greičiausiai patenka ritinėlio skersmens ilgis.

5 punktas* dizaino išdėstymas padėti. Atkreipkite dėmesį, kad matematinis lūkestis čia nėra žinomas, tačiau tai nė kiek netrukdo mums išspręsti problemos.

IR egzamino užduotis, kurį labai rekomenduoju medžiagai sutvirtinti:

6 pavyzdys

Normalaus pasiskirstymo atsitiktinis dydis nurodomas jo parametrais (matematinis lūkestis) ir (standartinis nuokrypis). Reikalinga:

a) užsirašykite tikimybių tankį ir schematiškai pavaizduokite jo grafiką;
b) Raskite tikimybę, kad ji paims reikšmę iš intervalo ;
c) rasti tikimybę, kad absoliuti reikšmė nukryps nuo ne daugiau kaip ;
d) naudodami „trijų sigmų“ taisyklę, raskite atsitiktinio dydžio reikšmes.

Tokios problemos siūlomos visur, o per ilgus praktikos metus jų išsprendžiau šimtus ir šimtus. Būtinai praktikuokite piešti piešinį ranka ir naudodami popierines lenteles;)

Na, aš jums pateiksiu pavyzdį padidėjęs sudėtingumas:

7 pavyzdys

Atsitiktinio dydžio tikimybių pasiskirstymo tankis turi formą . Rasti, matematinės lūkesčiai, dispersija, pasiskirstymo funkcija, sudaryti tankio grafikus ir pasiskirstymo funkcijas, rasti.

Sprendimas: Pirmiausia atkreipkime dėmesį, kad sąlyga nieko nesako apie atsitiktinio dydžio pobūdį. Rodiklio buvimas savaime nieko nereiškia: gali pasirodyti, pavyzdžiui, orientacinis ar net savavališkai nuolatinis paskirstymas. Ir todėl paskirstymo „normalumą“ vis dar reikia pagrįsti:

Nuo funkcijos nustatytas bet koks faktinė vertė, ir jis gali būti sumažintas iki formos , tada atsitiktinis dydis pasiskirsto pagal normalųjį dėsnį.

Štai mes einame. Už tai pasirinkite visą kvadratą ir organizuoti trijų aukštų trupmena:


Būtinai atlikite patikrinimą, grąžindami indikatorių į pradinę formą:

, ką norėjome pamatyti.

Taigi:
- Pagal operacijų su įgaliojimais taisyklė"nuimti" Ir čia galime iš karto užrašyti tai, kas akivaizdu skaitinės charakteristikos:

Dabar suraskime parametro reikšmę. Kadangi normalaus pasiskirstymo daugiklis turi formą ir , tada:
, iš kur mes išreiškiame ir pakeičiame savo funkciją:
, po kurio dar kartą peržvelgsime įrašą akimis ir įsitikinsime, kad gauta funkcija turi formą .

Sukurkime tankio grafiką:

ir pasiskirstymo funkcijos grafikas :

Jei po ranka neturite „Excel“ ar net įprasto skaičiuotuvo, paskutinę grafiką galite lengvai sudaryti rankiniu būdu! Taške paskirstymo funkcija įgauna reikšmę ir štai

Panagrinėkime du nepriklausomus atsitiktinius dydžius ir , atsižvelgiant į normalius dėsnius:

, (12.6.1)

. (12.6.2)

Būtina sudaryti šių dėsnių sudėtį, tai yra, rasti kiekio pasiskirstymo dėsnį:

Pasiskirstymo dėsnių sudarymui pritaikykime bendrąją formulę (12.5.3):

. (12.6.3)

Jei integrando eksponente atversime skliaustus ir atnešame panašių narių, gauname:

,

;

;

.

Pakeitę šias išraiškas į formulę (9.1.3), mes jau susidūrėme:

, (12.6.4)

po transformacijų gauname:

, (12.6.5)

ir tai yra ne kas kita, kaip normalus dėsnis su sklaidos centru

ir standartinis nuokrypis

. (12.6.7)

Tą pačią išvadą galima padaryti daug lengviau, naudojant šiuos kokybinius samprotavimus.

Neatverdami skliaustų ir neatlikdami jokių transformacijų integrande (12.6.3), iš karto darome išvadą, kad eksponentas yra kvadratinis trinaris dėl tipo

,

kur dydis į koeficientą visai neįtraukiamas, koeficientas įskaitomas į pirmą laipsnį, o koeficientas pakeliamas kvadratu. Turėdami tai omenyje ir pritaikę (12.6.4) formulę, darome išvadą, kad yra eksponentinė funkcija, kurios rodiklis yra kvadratinis trinaris , o šio tipo pasiskirstymo tankis atitinka normalųjį dėsnį. Taigi darome grynai kokybinę išvadą: kiekio pasiskirstymo dėsnis turi būti normalus.

Norėdami rasti šio dėsnio parametrus - ir - naudosime matematinių lūkesčių sudėjimo ir dispersijų sudėjimo teoremą. Pagal matematinių lūkesčių sudėjimo teoremą

Pagal dispersijų pridėjimo teoremą

iš kur seka formulė (12.6.7).

Pereinant nuo standartinių nuokrypių prie tikėtinų jiems proporcingų nuokrypių, gauname:

Taigi priėjome prie tokios taisyklės: jungiant normaliuosius dėsnius vėl gaunamas normalus dėsnis, sumuojami matematiniai lūkesčiai ir dispersijos (arba tikėtinų nuokrypių kvadratai).

Įprastų įstatymų sudarymo taisyklę galima apibendrinti šiuo atveju bet koks skaičius nepriklausomi atsitiktiniai dydžiai.

Jei yra nepriklausomų atsitiktinių dydžių:

kuriems galioja įprasti dėsniai su sklaidos centrais

ir standartiniai nuokrypiai

,

tada vertė

taip pat galioja normalus dėsnis su parametrais

Vietoj formulės (12.6.12) galite naudoti lygiavertę formulę:

Jei atsitiktinių dydžių sistema yra paskirstyta pagal normalų dėsnį, bet reikšmės yra priklausomos, tada nesunku įrodyti, kaip ir anksčiau, remiantis bendroji formulė(12.5.1) kad kiekio pasiskirstymo dėsnis

Yra ir normalus įstatymas. Sklaidos centrai vis dar pridedami algebriškai, tačiau standartiniams nuokrypiams taisyklė tampa sudėtingesnė:

, (12.6.14)

kur yra dydžių koreliacijos koeficientas ir .

Sudėjus kelis priklausomus atsitiktinius dydžius, kuriems galioja normalusis dėsnis, sumos pasiskirstymo dėsnis taip pat pasirodo esantis normalus su parametrais

, (12.6.16)

arba esant galimiems nukrypimams

, (12.6.17)

kur yra dydžių koreliacijos koeficientas, o sumavimas apima visus skirtingus dydžių porinius derinius.

Įsitikinome labai svarbia normaliojo dėsnio savybe: normalių dėsnių sudėtimi vėl gaunamas normalus dėsnis. Tai vadinamoji „stabilumo savybė“. Pasiskirstymo dėsnis vadinamas stabiliu, jei dviejų tokio tipo dėsnių sudėtis vėl lemia to paties tipo dėsnį. Aukščiau parodėme, kad įprastas įstatymas yra stabilus. Labai nedaug paskirstymo dėsnių turi stabilumo savybę. Ankstesniame (2 pavyzdys) buvome įsitikinę, kad, pavyzdžiui, vienodo tankio dėsnis yra nestabilus: sudarydami du vienodo tankio dėsnius skyriuose nuo 0 iki 1, gavome Simpsono dėsnį.

Normalios dėsnio stabilumas yra viena iš esminių sąlygų plačiam jo naudojimui praktikoje. Tačiau, be įprasto, stabilumo savybę turi ir kai kurie kiti skirstymo dėsniai. Ypatinga įprasto dėsnio ypatybė yra ta, kad esant pakankamai dideliam skaičiui, praktiškai savavališki įstatymai pasiskirstymas, suminis dėsnis pasirodo esantis tiek arti normalios, kiek norima, nepaisant to, kokie buvo terminų pasiskirstymo dėsniai. Tai galima iliustruoti, pavyzdžiui, sudarant tris vienodo tankio dėsnius srityse nuo 0 iki 1. Gautas pasiskirstymo dėsnis parodytas Fig. 12.6.1. Kaip matyti iš brėžinio, funkcijos grafikas labai panašus į normalaus dėsnio grafiką.

Normalus pasiskirstymas

Mes jau žinome paskirstymo, daugiakampio (arba privataus daugiakampio) ir pasiskirstymo kreivės sąvokas. Ypatingas šių sąvokų atvejis yra „normalus pasiskirstymas“ ir „normali kreivė“. Tačiau ši galimybė yra labai svarbi analizuojant bet kokius mokslinius duomenis, įskaitant psichologinius. Faktas yra tas, kad normalus pasiskirstymas, pavaizduotas grafiškai normali kreivė yra idealus pasiskirstymas, retai sutinkamas objektyvioje realybėje. Tačiau jo naudojimas labai palengvina ir supaprastina natūra gautų duomenų apdorojimą ir paaiškinimą. Be to, tik normaliam pasiskirstymui pateikti koreliacijos koeficientai gali būti interpretuojami kaip ryšio glaudumo matas, kitais atvejais jie tokios funkcijos neatlieka, o jų apskaičiavimas veda prie sunkiai paaiškinamų paradoksų.

IN moksliniai tyrimai paprastai priimama prielaida O realių duomenų pasiskirstymo normalumą ir tuo remiantis jie apdorojami, po to išsiaiškinama ir nurodoma, kiek realusis skirstinys skiriasi nuo įprasto, kuriam yra nemažai specialių statistikos metodų. Paprastai ši prielaida yra gana priimtina, nes dauguma psichiniai reiškiniai o jų charakteristikos pasiskirstymas labai artimas normaliajam.

Taigi koks yra normalusis skirstinys ir kokie jo bruožai traukia mokslininkus? Normalus Dydžio pasiskirstymu vadinamas toks, kad jo atsiradimo ir neįvykimo tikimybė yra vienoda. Klasikinė iliustracija – monetos metimas. Jei moneta yra teisinga ir metimai atliekami taip pat, tada vienodai tikėtina, kad gausite galvą ar uodegą. Tai yra, „galvos“ gali iškristi ir neiškristi su ta pačia tikimybe, ir tas pats pasakytina apie „uodegą“.

Mes pristatėme „tikimybės“ sąvoką. Pasiaiškinkime. Tikimybė– tai numatomas įvykio (įvykio – ne reikšmės atsiradimo) dažnis. Tikimybė išreiškiama trupmena, kurios skaitiklis yra išsipildžiusių įvykių skaičius (dažnis) ir V vardiklis – maksimalus galimas skaičiusšiuos įvykius. Kai mėginys (numeris galimi atvejai) yra ribotas, tada geriau kalbėti ne apie tikimybę, o O dažnis, su kuriuo mes jau pažįstami. Tikimybė rodo begalinis skaičius pavyzdžių Tačiau praktikoje šis subtilumas dažnai ignoruojamas.

Didelis matematikų susidomėjimas tikimybių teorija V apskritai ir ypač normaliam pasiskirstymui V XVII a. dėl dalyvių noro azartinių lošimų Raskite formulę maksimaliam laimėjimui su minimalia rizika. Šių klausimų ėmėsi žymūs matematikai J. Bernoulli (1654-1705) ir P. S. Laplasas (1749-1827). Pirma matematinis aprašymas kreivė, jungianti „galvų“ pasiskirstymo tikimybių, metant monetas kelis kartus, segmentus, davė Abraomas de Moivras(1667-1754). Ši kreivė yra labai arti normali kreivė tikslus aprašymas, kurį jis pateikė puikus matematikas K. F. Gaussas(1777-1855), kurios vardą ji tebeneša ir šiandien. Normalios (Gauso) kreivės grafikas ir formulė yra tokia.

kur P yra tikimybė (tiksliau, tikimybės tankis), t. y. kreivės aukštis aukščiau duota vertė Z; e – bazė natūralusis logaritmas(2,718...); π = 3,142...; M – imties vidurkis; σ – standartinis nuokrypis.

Normalios kreivės savybės

1. Vidurkis (M), režimas (Mo) ir mediana (Me) yra vienodi.

2. Simetrija, palyginti su vidutiniu M.

3. Vienareikšmiškai lemia tik du parametrai – M ir o.

4. Kreivės „šakos“ niekada nekerta abscisės Z, artėja prie jos asimptotiškai.

5. Jei M = 0 ir o = 1, gauname vienetinę normaliąją kreivę, nes plotas po ja lygus 1.

6. Vieneto kreivė: P m = 0,3989, o plotas po kreive yra diapazone:

-σ iki +σ = 68,26 %; nuo -2σ iki + 2σ = 95,46 %; -Зσ iki + Зσ = 99,74%.

7. Nevienetinių normaliųjų kreivių (M ≠0, σ ≠1) modelis srityse išlieka toks pat. Skirtumas yra šimtosiose dalyse.

Normaliojo skirstinio kitimai

Toliau pateikti variantai taikomi ne tik normaliajam pasiskirstymui, bet ir bet kuriam. Tačiau aiškumo dėlei juos pateikiame čia.

1. Asimetrija – netolygus pasiskirstymas centrinės reikšmės atžvilgiu.

Visada grojo normalusis skirstinys (Gauso skirstinys). centrinis vaidmuo tikimybių teorijoje, nes tai įvyksta labai dažnai dėl daugelio veiksnių įtakos, kurių bet kurio indėlis yra nereikšmingas. Centrinės ribos teorema (CLT) taikoma praktiškai visuose taikomuosiuose moksluose, todėl statistinis aparatas yra universalus. Tačiau labai dažnai pasitaiko atvejų, kai jo panaudojimas neįmanomas, o mokslininkai visais įmanomais būdais stengiasi organizuoti rezultatų pritaikymą prie Gauso. Tai maždaug alternatyvus požiūris Jei paskirstymui įtakos turi daug veiksnių, dabar aš jums pasakysiu.

Trumpa CPT istorija. Kai Niutonas dar buvo gyvas, Abraomas de Moivre'as įrodė teoremą apie centruoto ir normalizuoto įvykio stebėjimų skaičiaus konvergenciją. nepriklausomi testaiį normalų pasiskirstymą. Visą XIX amžių ir XX amžiaus pradžią ši teorema buvo mokslinis apibendrinimų modelis. Laplasas tai įrodė vienodas paskirstymas, Puasonas – lokali teorema skirtingos tikimybės atvejui. Poincaré, Legendre ir Gaussas sukūrė turtingą stebėjimo klaidų teoriją ir metodą mažiausių kvadratų, remiantis klaidų konvergencija į normalųjį skirstinį. Čebyševas, sukūręs momentų metodą, įrodė dar stipresnę atsitiktinių dydžių sumos teoremą. Liapunovas 1900 m., remdamasis Čebyševu ir Markovu, įrodė CLP dabartinę formą, bet tik turėdamas trečiosios eilės momentus. Ir tik 1934 m. Felleris padarė tam galą, parodydamas, kad antros eilės momentų egzistavimas yra ir būtina, ir pakankama sąlyga.

CLT galima suformuluoti taip: jei atsitiktiniai dydžiai yra nepriklausomi, vienodai pasiskirstę ir turi baigtinę nulinę dispersiją, tai šių kintamųjų sumos (centruotos ir normalizuotos) susilieja į normalųjį dėsnį. Būtent tokia forma ši teorema yra dėstoma universitetuose ir ją taip dažnai naudoja stebėtojai ir tyrėjai, kurie nėra profesionalūs matematikos srityje. Kas čia negerai? Tiesą sakant, teorema puikiai pritaikoma tose srityse, kuriose dirbo Gaussas, Poincaré, Chebyshev ir kiti XIX amžiaus genijai, būtent: stebėjimo klaidų teorija, statistinė fizika, daugiašalės įmonės, demografiniai tyrimai ir galbūt dar kažkas. Tačiau originalumo atradimams stokojantys mokslininkai užsiima apibendrinimais ir nori šią teoremą pritaikyti viskam, arba tiesiog už ausų tempti normalųjį skirstinį, kur jo tiesiog negali būti. Jei norite pavyzdžių, aš juos turiu.

Intelekto koeficientas IQ. Iš pradžių reiškia, kad žmonių intelektas yra įprastai paskirstytas. Jie atlieka testą, kuris yra paruoštas iš anksto taip, kad nebūtų atsižvelgiama į ypatingus gebėjimus, o atsižvelgiama į juos atskirai, naudojant tuos pačius veiksnius: loginį mąstymą, protinį dizainą, skaičiavimo gebėjimus, abstraktų mąstymą ir dar ką nors. Jokiu būdu neatsižvelgiama į gebėjimą išspręsti daugumai neprieinamas problemas ar testo išlaikymą per itin greitą laiką, o išlaikius testą anksčiau, rezultatas (bet ne intelektas) didėja ateityje. Tada filistinai tiki, kad „niekas negali būti dvigubai protingesnis už juos“, „paimkime tai iš protingų žmonių ir padalinkime“.

Antras pavyzdys: finansinių rodiklių pokyčiai. Norint ištirti akcijų kainų, valiutų kotiravimo ir prekių pasirinkimo sandorių pokyčius, reikia naudoti įrenginį matematinė statistika, o ypač čia svarbu nesuklysti su platinimo tipu. Pavyzdys: 1997 m Nobelio premija ekonomikoje buvo sumokėta už Black-Scholes modelio pasiūlymą, remiantis atsargų rodiklių augimo normaliojo pasiskirstymo prielaida (vad. baltas triukšmas). Tačiau autoriai tai aiškiai pareiškė šis modelis Reikia paaiškinimo, bet viskas, ką dauguma vėlesnių tyrinėtojų nusprendė padaryti, buvo tiesiog pridėti Puasono skirstinį prie normalaus skirstinio. Čia, aišku, bus netikslumų tiriant ilgas laiko eilutes, nes Puasono skirstinys per gerai tenkina CLT, o jau su 20 terminų jis nesiskiria nuo normalaus skirstinio. Pažvelkite į paveikslėlį žemiau (ir jis yra iš labai rimto ekonomikos žurnalo), jis rodo, kad, nepaisant gana didelis skaičius pastebėjimus ir akivaizdžius iškraipymus, daroma prielaida apie skirstinio normalumą.


Labai akivaizdu, kad skirstiniai nebus normalūs darbo užmokesčio tarp miesto gyventojų, diske esančių failų dydžio, miestų ir šalių gyventojų.

Šių pavyzdžių pasiskirstymas turi bendrą vadinamąją „sunkiąją uodegą“, ty vertes, kurios yra toli nuo vidurkio, ir pastebimą asimetriją, dažniausiai dešinėje. Panagrinėkime, kokie kiti skirstiniai, be įprastų, galėtų būti. Pradėkime nuo anksčiau minėto Puasono: jis turi uodegą, bet norime, kad dėsnis pasikartotų aibei grupių, kurių kiekvienoje jo laikomasi (apskaičiuokite bylų dydį įmonei, atlyginimus keliems miestams) arba mastelio (savavališkai padidinkite arba sumažinkite modelio intervalą Black - Scholes), kaip rodo stebėjimai, uodegos ir asimetrija neišnyksta, tačiau Puasono skirstinys, pagal CLT, turėtų tapti normalus. Dėl tų pačių priežasčių netinka Erlang, beta, lognormal ir visi kiti su dispersiniais skirstiniais. Belieka tik nupjauti Pareto skirstinį, tačiau jis netinka dėl režimo sutapimo su minimalia reikšme, ko beveik niekada nebūna analizuojant imties duomenis.

Paskirstymai, turintys reikalingos savybės, egzistuoja ir yra vadinami stabiliais skirstiniais. Jų istorija taip pat labai įdomi, o pagrindinė teorema bendromis pastangomis buvo įrodyta praėjus metams po Fellerio darbo, 1935 m. prancūzų matematikas Paulius Levy ir sovietinis matematikas A.Ya. Khinčinas. Iš jo buvo pašalinta dispersijos egzistavimo sąlyga. Skirtingai nuo įprastų, stabilių atsitiktinių dydžių nei tankio, nei pasiskirstymo funkcija neišreiškiama (su retomis išimtimis, kurios aptariamos toliau, yra tik būdingoji funkcija (); atvirkštinė konversija Furjė pasiskirstymo tankis, bet norint suprasti esmę, tai gali būti nežinoma).
Taigi, teorema: jei atsitiktiniai dydžiai yra nepriklausomi ir vienodai pasiskirstę, tai šių kintamųjų sumos susilieja į stabilų dėsnį.

Dabar apibrėžimas. Atsitiktinis kintamasis X bus stabilus tada ir tik tada, kai jo logaritmas būdinga funkcija Pateikiame jį tokia forma:

Kur.

Tiesą sakant, čia nėra nieko labai sudėtingo, tereikia paaiškinti keturių parametrų reikšmę. Parametrai sigma ir mu yra įprasta skalė ir poslinkis, nes normaliajame skirstinyje mu bus lygus matematiniam lūkesčiui, jei jis egzistuoja, ir jis egzistuoja, kai alfa yra didesnis už vienetą. Beta parametras yra asimetrija, jei jis lygus nuliui, pasiskirstymas yra simetriškas. Bet alfa yra būdingas parametras, jis parodo, kokio dydžio momentai egzistuoja, kuo jis arčiau dviejų, daugiau platinimo panašus į normalų, kai lygus dviem, skirstinys tampa normaliu, ir tik tokiu atveju jis turi didelių eilių momentus, taip pat esant normaliam skirstiniui asimetrija išsigimsta. Tuo atveju, kai alfa lygi vienetui, o beta lygi nuliui, gaunamas Koši skirstinys, o tuo atveju, kai alfa lygi pusei, o beta lygus vienetui, gaunamas Lévy skirstinys, kitais atvejais vaizdavimo nėra kvadratais tokių dydžių tankio pasiskirstymui.
XX amžiuje buvo sukurta turtinga teorija apie stabilius kiekius ir procesus (vadinamus Lévy procesais) ir jų ryšį su trupmeniniai integralai, pristatė įvairių būdų parametrizavimas ir modeliavimas, parametrai buvo įvertinti keliais būdais ir parodytas įverčių nuoseklumas ir stabilumas. Pažiūrėkite į paveikslėlį, jame parodyta imituota Levy proceso trajektorija su 15 kartų padidintu fragmentu.


Būtent studijuodamas tokius procesus ir jų taikymą finansuose Benoit Mandelbrotas sugalvojo fraktalus. Tačiau ne visur buvo taip gerai. XX amžiaus antroji pusė praėjo pagal bendrą taikomųjų ir kibernetinių mokslų kryptį, o tai reiškė grynosios matematikos krizę, visi norėjo gaminti, bet nenorėjo galvoti, humanistai su savo publicistika užėmė matematikos sferas. Pavyzdys: amerikiečių Mostellerio knyga „Penkiasdešimt linksmų tikimybių problemų su sprendimais“, užduotis Nr. 11:


Autoriaus šios problemos sprendimas yra tiesiog sveiko proto pralaimėjimas:

Ta pati situacija ir su 25 problema, kur pateikti TRYS prieštaringi atsakymai.

Bet grįžkime prie stabilių paskirstymų. Likusioje straipsnio dalyje pasistengsiu parodyti, kad dirbant su jais neturėtų kilti papildomų sunkumų. Būtent yra skaitiniai ir statistiniai metodai, leidžiantys įvertinti parametrus, apskaičiuoti pasiskirstymo funkciją ir juos modeliuoti, tai yra, veikia taip pat, kaip ir bet kuris kitas skirstinys.

Stabilių atsitiktinių dydžių modeliavimas. Kadangi viskas išmokstama lyginant, pirmiausia priminsiu skaičiavimo požiūriu patogiausią normaliosios vertės generavimo būdą (Box-Muller metodas): jei yra pagrindiniai atsitiktiniai dydžiai (vienodai pasiskirstę )

Ar jums patiko straipsnis? Pasidalinkite su draugais!