Normálne rozdelenie. Stabilné distribúcie

Normálny zákon rozdelenia pravdepodobnosti

Bez preháňania ho možno nazvať filozofickým zákonom. Pri pozorovaní rôznych predmetov a procesov vo svete okolo nás sa často stretávame s tým, že niečo nestačí a že existuje norma:


Tu je základný pohľad funkcie hustoty normálne rozdelenie pravdepodobnosti a vítam vás v tejto zaujímavej lekcii.

Aké príklady môžete uviesť? Je z nich jednoducho tma. To je napríklad výška, hmotnosť ľudí (nielen), ich fyzická sila, mentálna kapacita atď. Existuje „hlavná omša“ (z jedného alebo druhého dôvodu) a existujú odchýlky v oboch smeroch.

Toto rôzne vlastnosti neživé predmety (rovnaká veľkosť, hmotnosť). Ide o náhodné trvanie procesov..., opäť ma napadol smutný príklad, a preto poviem „životnosť“ žiaroviek :) Z fyziky som si spomenul na molekuly vzduchu: medzi nimi sú pomalé, sú rýchle, ale väčšina sa pohybuje „štandardnými“ rýchlosťami.

Ďalej sa od stredu odchýlime o jednu štandardnú odchýlku a vypočítame výšku:

Označenie bodov na výkrese (zelená farba) a vidíme, že je toho celkom dosť.

V záverečnej fáze opatrne nakreslíme graf a obzvlášť opatrne odrážať to konvexný/konkávny! No, pravdepodobne ste si už dávno uvedomili, že os x je horizontálna asymptota, a je absolútne zakázané za ním „liezť“!

O elektronická registrácia Graf riešenia sa dá ľahko zostaviť v Exceli a pre mňa nečakane som dokonca na túto tému nahral krátke video. Najprv si však povedzme, ako sa tvar normálnej krivky mení v závislosti od hodnôt a.

Pri zvyšovaní alebo znižovaní „a“ (s konštantnou sigmou) graf si zachová svoj tvar a sa pohybuje doprava/doľava resp. Napríklad, keď má funkcia formu a náš graf sa „posunie“ o 3 jednotky doľava – presne na začiatok súradníc:


Normálne rozložená veličina s nulovým matematickým očakávaním dostala úplne prirodzený názov - vycentrovaný; funkcia jeho hustoty dokonca a graf je symetrický podľa ordináty.

V prípade zmeny "sigma" (s konštantným „a“), graf „zostáva rovnaký“, ale mení tvar. Keď sa zväčší, stáva sa nižším a predĺženým, ako chobotnica naťahujúca chápadlá. A naopak pri znižovaní grafu sa stáva užším a vyšším- ukáže sa, že je to „prekvapená chobotnica“. Áno, kedy znížiť„sigma“ dvakrát: predchádzajúci graf sa dvakrát zužuje a naťahuje:

Všetko je v plnom súlade s geometrické transformácie grafov.

Normálne rozdelenie s jednotkovou hodnotou sigma sa nazýva normalizované, a ak je tiež vycentrovaný(náš prípad), potom sa takéto rozdelenie nazýva štandardné. Má ešte jednoduchšiu funkciu hustoty, ktorá už bola nájdená v Laplaceova lokálna veta: . Štandardná distribúcia našla široké uplatnenie v praxi a veľmi skoro konečne pochopíme jej účel.

Tak a teraz si pozrime film:

Áno, úplne správne - akosi nezaslúžene zostalo v tieni funkcia rozdelenia pravdepodobnosti. Spomeňme si na ňu definícia:
– pravdepodobnosť, že náhodná premenná bude mať hodnotu MENŠU ako premenná, ktorá „prebehne“ všetkými reálnymi hodnotami do „plus“ nekonečna.

Vo vnútri integrálu sa zvyčajne používa iné písmeno, aby nedochádzalo k „prekrývaniu“ so zápisom, pretože tu je každá hodnota spojená s nesprávny integrál , čo sa rovná niektorým číslo z intervalu .

Takmer všetky významy nie sú prístupné presný výpočet, ale ako sme práve videli, s moderným výpočtovým výkonom s tým nie sú žiadne ťažkosti. Takže pre funkciu štandardná distribúcia, zodpovedajúca funkcia Excel vo všeobecnosti obsahuje jeden argument:

=NORMSDIST(z)

Raz, dva - a máte hotovo:

Výkres jasne ukazuje realizáciu všetkých vlastnosti distribučnej funkcie, a z technických nuancií by ste mali venovať pozornosť horizontálne asymptoty a inflexný bod.

Teraz si spomeňme na jednu z kľúčových úloh témy, a to zistiť, ako nájsť pravdepodobnosť, že normálna náhodná premenná prevezme hodnotu z intervalu. Geometricky sa táto pravdepodobnosť rovná oblasť medzi normálnou krivkou a osou x v zodpovedajúcej časti:

ale zakaždým sa snažím získať približnú hodnotu je nerozumné, a preto je racionálnejšie použiť „ľahký“ vzorec:
.

! Tiež si pamätá , Čo

Tu môžete znova použiť Excel, ale existuje niekoľko významných „ale“: po prvé, nie je vždy po ruke, a po druhé, „hotové“ hodnoty s najväčšou pravdepodobnosťou vyvolajú otázky zo strany učiteľa. prečo?

Hovoril som o tom už veľakrát: kedysi (a nie veľmi dávno) bola bežná kalkulačka luxusom a v r. náučnej literatúry„Manuálny“ spôsob riešenia uvažovaného problému je stále zachovaný. Jeho podstatou je k štandardizovať hodnoty „alfa“ a „beta“, to znamená, že redukujú riešenie na štandardnú distribúciu:

Poznámka : funkcia je ľahko dostupná všeobecný prípad pomocou lineárneho náhrady. Potom tiež:

a z vykonanej výmeny je nasledujúci vzorec: prechod od hodnôt náhodné rozdelenie– na zodpovedajúce hodnoty štandardného rozdelenia.

Prečo je to potrebné? Faktom je, že hodnoty boli starostlivo vypočítané našimi predkami a zostavené do špeciálnej tabuľky, ktorá je v mnohých knihách o terwerovi. Ale ešte častejšie existuje tabuľka hodnôt, ktorej sme sa už venovali Laplaceova integrálna veta:

Ak máme k dispozícii tabuľku hodnôt Laplaceovej funkcie , potom cez to vyriešime:

Zlomkové hodnoty Tradične zaokrúhľujeme na 4 desatinné miesta, ako sa to robí v štandardnej tabuľke. A pre kontrolu existuje Bod 5 rozloženie.

Pripomínam ti to a aby nedošlo k zámene vždy kontrolovať, tabuľku AKEJ funkcie máte pred očami.

Odpoveď je potrebné uviesť v percentách, takže vypočítaná pravdepodobnosť sa musí vynásobiť 100 a výsledok sa musí uviesť zmysluplným komentárom:

– pri lete od 5 do 70 m padne približne 15,87 % nábojov

Cvičíme sami:

Príklad 3

Priemer továrensky vyrobených ložísk je náhodná veličina, normálne rozložená s matematickým očakávaním 1,5 cm a štandardnou odchýlkou ​​0,04 cm Nájdite pravdepodobnosť, že veľkosť náhodne vybraného ložiska sa pohybuje od 1,4 do 1,6 cm.

Vo vzorovom riešení a nižšie použijem funkciu Laplace ako najbežnejšiu možnosť. Mimochodom, všimnite si, že podľa znenia tu môžu byť konce intervalu zahrnuté do úvahy. To však nie je kritické.

A už v tomto príklade sme sa stretli špeciálny prípad– keď je interval symetrický vzhľadom k matematické očakávanie. V takejto situácii ho možno napísať vo forme a pomocou zvláštnosti Laplaceovej funkcie zjednodušiť pracovný vzorec:


Volá sa parameter delta odchýlka z matematického očakávania a dvojitú nerovnosť možno „zabaliť“ pomocou modul:

– pravdepodobnosť, že sa hodnota náhodnej premennej bude odchyľovať od matematického očakávania o menej ako .

Je dobré, že riešenie sedí v jednej línii :)
– pravdepodobnosť, že priemer náhodne vybratého ložiska sa líši od 1,5 cm najviac o 0,1 cm.

Výsledok tejto úlohy sa ukázal byť blízky jednote, ale chcel by som ešte väčšiu spoľahlivosť - konkrétne zistiť hranice, v ktorých sa priemer nachádza skoro každý ložiská. Existuje na to nejaké kritérium? Existuje! Na položenú otázku odpovedá tzv

pravidlo troch sigma

Jeho podstatou je to prakticky spoľahlivé je skutočnosť, že normálne rozložená náhodná premenná nadobudne hodnotu z intervalu .

Pravdepodobnosť odchýlky od očakávanej hodnoty je v skutočnosti menšia ako:
alebo 99,73 %

Z hľadiska ložísk ide o 9973 kusov s priemerom od 1,38 do 1,62 cm a len 27 „neštandardných“ exemplárov.

V praktickom výskume sa pravidlo troch sigma zvyčajne uplatňuje v opačnom smere: ak štatisticky Zistilo sa, že takmer všetky hodnoty skúmaná náhodná premenná spadajú do intervalu 6 štandardných odchýlok, potom existujú presvedčivé dôvody domnievať sa, že táto hodnota je rozdelená podľa normálneho zákona. Overenie sa vykonáva pomocou teórie štatistické hypotézy ku ktorej sa dúfam skôr či neskôr dostanem :)

Medzitým pokračujeme v riešení tvrdých sovietskych problémov:

Príklad 4

Náhodná hodnota chyby váženia je rozdelená podľa normálneho zákona s nulovým matematickým očakávaním a smerodajná odchýlka 3 gramy. Nájdite pravdepodobnosť, že ďalšie váženie sa uskutoční s chybou nepresahujúcou 5 gramov v absolútnej hodnote.

Riešenie veľmi jednoduché. Podľa stavu to okamžite zaznamenáme pri ďalšom vážení (niečo alebo niekto) takmer 100% dostaneme výsledok s presnosťou 9 gramov. Ale problém sa týka užšej odchýlky a podľa vzorca :

– pravdepodobnosť, že nasledujúce váženie sa vykoná s chybou nepresahujúcou 5 gramov.

Odpoveď:

Riešený problém sa zásadne líši od zdanlivo podobného. Príklad 3 lekcia o Rovnomerné rozdelenie. Vyskytla sa chyba zaokrúhľovanie výsledky meraní, tu hovoríme o náhodnej chybe samotných meraní. Takéto chyby vznikajú v dôsledku technické vlastnosti samotné zariadenie (rozsah prijateľných chýb je zvyčajne uvedený v jeho pase) a tiež vinou experimentátora - keď napríklad „od oka“ berieme údaje z ihly rovnakých mierok.

Okrem iných sú tu aj tzv systematický chyby merania. Už je nenáhodné chyby, ktoré sa vyskytnú v dôsledku nesprávneho nastavenia alebo prevádzky zariadenia. Napríklad neregulované podlahové váhy dokážu neustále „pridávať“ kilogramy a predajca zákazníkov systematicky váži. Alebo to možno počítať nie systematicky. V každom prípade však takáto chyba nebude náhodná a jej očakávanie je iné ako nula.

...naliehavo pripravujem kurz predaja =)

Rozhodujeme sa sami inverzný problém:

Príklad 5

Priemer valčeka je náhodná normálne rozložená náhodná veličina, jej smerodajná odchýlka sa rovná mm. Nájdite dĺžku intervalu, symetrickú vzhľadom na matematické očakávanie, do ktorej pravdepodobne spadá dĺžka priemeru valca.

bod 5* dizajnové rozloženie pomôcť. Upozorňujeme, že matematické očakávanie tu nie je známe, ale to nám ani v najmenšom nebráni v riešení problému.

A skúšobná úloha, ktoré na spevnenie materiálu vrelo odporúčam:

Príklad 6

Normálne rozdelená náhodná premenná je špecifikovaná svojimi parametrami (matematické očakávanie) a (štandardná odchýlka). Požadovaný:

a) zapíšte hustotu pravdepodobnosti a schematicky znázornite jej graf;
b) nájdite pravdepodobnosť, že nadobudne hodnotu z intervalu ;
c) nájdite pravdepodobnosť, že absolútna hodnota sa nebude líšiť od viac ako ;
d) pomocou pravidla „tri sigma“ nájdite hodnoty náhodnej premennej.

Takéto problémy sa ponúkajú všade a za roky praxe som ich vyriešil stovky a stovky. Nezabudnite si precvičiť kreslenie kresby ručne a pomocou papierových tabuliek;)

No, poviem vám príklad zvýšená zložitosť:

Príklad 7

Hustota rozdelenia pravdepodobnosti náhodnej premennej má tvar . Nájsť, matematické očakávanie, rozptyl, distribučná funkcia, zostaviť grafy hustoty a distribučné funkcie, nájsť.

Riešenie: V prvom rade si všimnime, že podmienka nehovorí nič o povahe náhodnej premennej. Prítomnosť exponentu sama o sebe nič neznamená: môže sa ukázať, že napr. orientačné alebo dokonca svojvoľné nepretržitá distribúcia. A preto „normálnosť“ distribúcie stále musí byť odôvodnená:

Od funkcie určený pri akýkoľvek skutočná hodnota, a dá sa zredukovať na formu , potom je náhodná premenná rozdelená podľa normálneho zákona.

Ideme na to. Pre to vyberte celý štvorec a organizovať trojposchodový zlomok:


Nezabudnite vykonať kontrolu a vráťte indikátor do pôvodnej podoby:

, čo sme chceli vidieť.

Takto:
- Podľa pravidlá operácií s právomocami"odtrhnúť" A tu si môžeme hneď zapísať samozrejmé číselné charakteristiky:

Teraz nájdime hodnotu parametra. Keďže multiplikátor normálneho rozdelenia má tvar a, potom:
, odkiaľ vyjadrujeme a nahrádzame do našej funkcie:
, po ktorom si ešte raz prejdeme záznam očami a presvedčíme sa, že výsledná funkcia má formu .

Zostavme graf hustoty:

a graf distribučnej funkcie :

Ak nemáte po ruke Excel alebo dokonca bežnú kalkulačku, posledný graf môžete ľahko zostaviť ručne! V tomto bode má distribučná funkcia hodnotu a je to tu

Uvažujme dve nezávislé náhodné premenné a , s výhradou normálnych zákonov:

, (12.6.1)

. (12.6.2)

Je potrebné vytvoriť zloženie týchto zákonov, to znamená nájsť zákon rozdelenia množstva:

Použime všeobecný vzorec (12.5.3) na zloženie distribučných zákonov:

. (12.6.3)

Ak otvoríme zátvorky v exponente integrandu a prinesieme podobní členovia, dostaneme:

,

;

;

.

S dosadením týchto výrazov do vzorca (9.1.3) sme sa už stretli:

, (12.6.4)

po transformáciách dostaneme:

, (12.6.5)

a to nie je nič iné ako normálny zákon s centrom rozptylu

a štandardná odchýlka

. (12.6.7)

K rovnakému záveru možno dospieť oveľa jednoduchšie pomocou nasledujúceho kvalitatívneho uvažovania.

Bez otvárania zátvoriek a bez akýchkoľvek transformácií v integrande (12.6.3) okamžite dospejeme k záveru, že exponent je kvadratická trojčlenka ohľadom typu

,

ak množstvo nie je vôbec zahrnuté v koeficiente, koeficient je zahrnutý v prvej mocnine a koeficient sa umocňuje na druhú. Keď si to uvedomíme a použijeme vzorec (12.6.4), dospejeme k záveru, že existuje exponenciálna funkcia, ktorej exponent je štvorcová trojčlenka vzhľadom na , a hustota rozdelenia tohto typu zodpovedá normálnemu zákonu. Dostávame sa teda k čisto kvalitatívnemu záveru: zákon rozdelenia množstva musí byť normálny.

Na nájdenie parametrov tohto zákona - a - použijeme vetu o sčítaní matematických očakávaní a vetu o sčítaní rozptylov. Podľa vety o sčítaní matematických očakávaní

Podľa vety o sčítaní rozptylov

odkiaľ nasleduje vzorec (12.6.7).

Prechodom od štandardných odchýlok k pravdepodobným odchýlkam, ktoré sú im úmerné, dostaneme:

Dospeli sme teda k nasledujúcemu pravidlu: pri spojení normálnych zákonov sa opäť získa normálny zákon a matematické očakávania a rozptyly (alebo druhé mocniny pravdepodobných odchýlok) sa spočítajú.

Pravidlo pre skladbu normálnych zákonov možno zovšeobecniť na prípad ľubovoľné číslo nezávislé náhodné premenné.

Ak existujú nezávislé náhodné premenné:

podlieha normálnym zákonom s centrami rozptylu

a štandardné odchýlky

,

potom hodnotu

podlieha aj normalnemu zakonu s parametrami

Namiesto vzorca (12.6.12) môžete použiť ekvivalentný vzorec:

Ak je systém náhodných premenných distribuovaný podľa normálneho zákona, ale hodnoty sú závislé, potom nie je ťažké dokázať, rovnako ako predtým, na základe všeobecný vzorec(12.5.1), že zákon rozdelenia množstva

Existuje aj normálny zákon. Stredy rozptylu sa stále pridávajú algebraicky, ale pre štandardné odchýlky sa pravidlo stáva zložitejším:

, (12.6.14)

kde je korelačný koeficient veličín a .

Pri sčítaní niekoľkých závislých náhodných premenných, ktoré ako celok podliehajú normálnemu zákonu, sa zákon rozdelenia súčtu ukáže ako normálny aj s parametrami

, (12.6.16)

alebo v pravdepodobných odchýlkach

, (12.6.17)

kde je korelačný koeficient veličín a súčet sa vzťahuje na všetky rôzne párové kombinácie veličín.

Presvedčili sme sa o veľmi dôležitej vlastnosti normálneho zákona: skladbou normálnych zákonov sa opäť získa normálny zákon. Ide o takzvanú „vlastnosť stability“. Distribučný zákon sa nazýva stabilný, ak zloženie dvoch zákonov tohto typu opäť vedie k zákonu rovnakého typu. Vyššie sme ukázali, že normálny zákon je stabilný. Len veľmi málo distribučných zákonov má vlastnosť stability. V predchádzajúcom (príklad 2) sme sa presvedčili, že napríklad zákon rovnomernej hustoty je nestabilný: zložením dvoch zákonov rovnomernej hustoty v úsekoch od 0 do 1 sme dostali Simpsonov zákon.

Stabilita normálneho práva je jednou z podstatných podmienok jeho širokého využitia v praxi. Vlastnosť stability však majú okrem normálneho aj niektoré ďalšie distribučné zákony. Znakom normálneho zákona je, že pri zložení dostatočne veľkého počtu prakticky svojvoľné zákony distribúcie, celkový zákon sa ukáže byť tak blízky normálu, ako si želáte, bez ohľadu na to, aké boli zákony distribúcie výrazov. Dá sa to ilustrovať napríklad zložením troch zákonov rovnomernej hustoty v oblastiach od 0 do 1. Výsledný zákon rozloženia je znázornený na obr. 12.6.1. Ako vidno z nákresu, graf funkcie je veľmi podobný grafu normálneho zákona.

Normálne rozdelenie

Už poznáme pojmy distribúcia, polygón (alebo súkromný polygón) a distribučná krivka. Špeciálnym prípadom týchto pojmov je „normálne rozdelenie“ a „normálna krivka“. Táto konkrétna možnosť je však veľmi dôležitá pri analýze akýchkoľvek vedeckých údajov vrátane psychologických. Faktom je, že normálne rozdelenie, znázornené graficky normálna krivka existuje ideálne rozdelenie, ktoré sa v objektívnej realite vyskytuje len zriedka. Ale jeho použitie značne uľahčuje a zjednodušuje spracovanie a vysvetlenie údajov získaných v naturáliách. Navyše len pre normálne rozdelenie možno dané korelačné koeficienty interpretovať ako mieru blízkosti súvislosti, v iných prípadoch takúto funkciu neplnia a ich výpočet vedie k ťažko vysvetliteľným paradoxom.

IN vedecký výskum predpoklad sa zvyčajne akceptuje O normalitu rozdelenia reálnych údajov a na tomto základe sa spracujú, po čom sa objasní a naznačí, nakoľko sa reálne rozdelenie líši od normálneho, na čo existuje množstvo špeciálnych štatistických techník. Spravidla je tento predpoklad celkom prijateľný, pretože väčšina psychické javy a ich charakteristiky majú distribúciu veľmi blízko normálu.

Aké je teda normálne rozdelenie a aké sú jeho vlastnosti, ktoré priťahujú vedcov? Normálne Rozdelenie veličiny sa nazýva také, že pravdepodobnosť jej výskytu a nevyskytnutia je rovnaká. Klasickou ilustráciou je hod mincou. Ak je minca spravodlivá a hádzanie sa robí rovnakým spôsobom, je rovnako pravdepodobné, že dostanete hlavu alebo chvost. To znamená, že „hlavy“ môžu vypadnúť a nevypadnúť s rovnakou pravdepodobnosťou, to isté platí pre „chvosty“.

Zaviedli sme pojem „pravdepodobnosť“. Poďme si to ujasniť. Pravdepodobnosť– ide o predpokladanú frekvenciu výskytu udalosti (výskyt – nie výskyt veličiny). Pravdepodobnosť je vyjadrená zlomkom, ktorého čitateľom je počet udalostí, ktoré sa naplnili (frekvencia) a V menovateľ - maximum možné číslo tieto udalosti. Keď vzorka (číslo možné prípady) je obmedzená, potom je lepšie hovoriť nie o pravdepodobnosti, ale O frekvenciu, ktorú už poznáme. Pravdepodobnosť naznačuje nekonečné číslo vzorky V praxi sa však táto jemnosť často ignoruje.

Veľký záujem matematikov o teóriu pravdepodobnosti V vo všeobecnosti a najmä k normálnemu rozdeleniu V XVII storočia kvôli túžbe účastníkov hazardných hier nájsť vzorec pre maximálne výhry s minimálnym rizikom. Týmito otázkami sa zaoberali slávni matematici J. Bernoulli (1654-1705) a P. S. Laplace (1749-1827). najprv matematický popis krivka spájajúca segmenty distribučného diagramu pravdepodobnosti získania „hlavy“ pri viacnásobnom hádzaní mincí Abraham de Moivre(1667-1754). Táto krivka je veľmi blízko normálna krivka presný popis, ktorý uviedol veľký matematik K. F. Gauss(1777-1855), ktorého meno nesie dodnes. Graf a vzorec normálnej (Gaussovej) krivky je nasledovný.

kde P je pravdepodobnosť (presnejšie hustota pravdepodobnosti), teda výška krivky nad daná hodnota Z; e – základňa prirodzený logaritmus(2,718...); π= 3,142...; M – výberový priemer; σ – smerodajná odchýlka.

Vlastnosti normálnej krivky

1. Priemer (M), modus (Mo) a medián (Me) sú rovnaké.

2. Symetria vo vzťahu k priemeru M.

3. Jednoznačne určené len dvoma parametrami - M a o.

4. „Vetvy“ krivky nikdy nepretínajú úsečku Z a približujú sa k nej asymptoticky.

5. Pre M = 0 a o = 1 dostaneme jednotkovú normálovú krivku, keďže plocha pod ňou sa rovná 1.

6. Pre jednotkovú krivku: P m = 0,3989 a plocha pod krivkou je v rozsahu:

-o až +o = 68,26 %; -2o až +2o = 95,46 %; -Зσ až + Зσ = 99,74 %.

7. Pre nejednotkové normálne krivky (M ≠0, σ ≠1) zostáva vzor v oblastiach rovnaký. Rozdiel je v stotinách.

Variácie normálneho rozdelenia

Variácie uvedené nižšie sa nevzťahujú len na normálnu distribúciu, ale na ktorúkoľvek z nich. Pre prehľadnosť ich tu však uvádzame.

1. Asymetria – nerovnomerné rozdelenie vzhľadom na centrálnu hodnotu.

Vždy sa hralo normálne rozdelenie (Gaussovo rozdelenie). ústrednú úlohu v teórii pravdepodobnosti, keďže vzniká veľmi často ako dôsledok vplyvu mnohých faktorov, pričom príspevok ktoréhokoľvek z nich je zanedbateľný. Centrálna limitná veta (CLT) nachádza uplatnenie prakticky vo všetkých aplikovaných vedách, vďaka čomu je štatistický aparát univerzálny. Existujú však veľmi časté prípady, keď je jeho použitie nemožné, a výskumníci sa snažia všetkými možnými spôsobmi organizovať prispôsobenie výsledkov Gaussovmu. To je asi alternatívny prístup Ak je distribúcia ovplyvnená mnohými faktormi, teraz vám to prezradím.

Stručná história CPT. Kým bol Newton ešte nažive, Abraham de Moivre dokázal teorém o konvergencii centrovaného a normalizovaného počtu pozorovaní udalosti v sérii. nezávislé testy do normálneho rozdelenia. V priebehu 19. a začiatku 20. storočia slúžila táto veta ako vedecký model pre zovšeobecnenia. Laplace to dokázal Rovnomerné rozdelenie, Jed - lokálna veta pre prípad s rôznymi pravdepodobnosťami. Poincaré, Legendre a Gauss vyvinuli bohatú teóriu pozorovacích chýb a metódu najmenších štvorcov, spoliehajúc sa na konvergenciu chýb k normálnemu rozdeleniu. Chebyshev dokázal ešte silnejšiu vetu pre súčet náhodných premenných, keď vyvinul metódu momentov. Ljapunov v roku 1900, spoliehajúc sa na Čebyševa a Markova, dokázal CLT v jeho súčasnej podobe, ale iba s existenciou momentov tretieho rádu. A až v roku 1934 to Feller ukončil a ukázal, že existencia momentov druhého rádu je nevyhnutnou aj dostatočnou podmienkou.

CLT možno formulovať nasledovne: ak sú náhodné premenné nezávislé, identicky rozdelené a majú konečný nenulový rozptyl, potom súčty (centrované a normalizované) týchto premenných konvergujú k normálnemu zákonu. Práve v tejto forme sa táto veta vyučuje na univerzitách a je tak často používaná pozorovateľmi a výskumníkmi, ktorí nie sú profesionálmi v matematike. Čo je s tým? V skutočnosti je teorém dokonale použiteľný v oblastiach, na ktorých pracovali Gauss, Poincaré, Čebyšev a ďalší géniovia 19. storočia, konkrétne: teória pozorovacích chýb, štatistická fyzika, nadnárodné spoločnosti, demografické štúdie a možno aj niečo iné. Ale vedci, ktorým chýba originalita pre objavy, sa zaoberajú zovšeobecňovaním a chcú túto vetu aplikovať na všetko, alebo jednoducho pretiahnuť normálne rozdelenie za uši, kde jednoducho nemôže existovať. Ak chcete príklady, mám ich.

Inteligenčný kvocient IQ. Spočiatku to znamená, že inteligencia ľudí je normálne rozložená. Vykonávajú test, ktorý je vopred pripravený tak, že sa neberú do úvahy mimoriadne schopnosti, ale sa berú do úvahy oddelene s rovnakými podielovými faktormi: logické myslenie, mentálny dizajn, výpočtové schopnosti, abstraktné myslenie a niečo iné. Schopnosť riešiť problémy, ktoré sú pre väčšinu nedostupné, či absolvovanie testu v superrýchlom čase sa nijako neberie do úvahy a skoršie absolvovanie testu zvyšuje výsledok (nie však inteligenciu) do budúcnosti. A potom filistí veria, že „nikto nemôže byť dvakrát múdrejší ako oni“, „zoberme to od šikovných ľudí a rozdeľme to“.

Druhý príklad: zmeny finančných ukazovateľov. Skúmanie zmien cien akcií, kotácií mien a možností komodít si vyžaduje použitie zariadenia matematickej štatistiky, a hlavne tu je dôležité nepomýliť sa typom distribúcie. Ukážkový prípad: v roku 1997 nobelová cena v ekonomike bola zaplatená za návrh Black-Scholesovho modelu, vychádzajúceho z predpokladu normálneho rozdelenia rastu akciových ukazovateľov (tzv. biely šum). Autori to však výslovne uviedli tento model potrebuje objasnenie, ale všetko, čo sa väčšina nasledujúcich výskumníkov rozhodla urobiť, bolo jednoducho pridať Poissonovo rozdelenie k normálnemu rozdeleniu. Tu sa samozrejme vyskytnú nepresnosti pri štúdiu dlhých časových radov, keďže Poissonovo rozdelenie až príliš vyhovuje CLT a už pri 20 členoch je na nerozoznanie od normálneho rozdelenia. Pozrite sa na obrázok nižšie (a je z veľmi seriózneho ekonomického časopisu), ukazuje, že napriek celkom veľké množstvo pozorovaní a zjavných skreslení sa predpokladá normalita rozdelenia.


Je veľmi zrejmé, že distribúcie nebudú normálne mzdy medzi obyvateľstvom mesta, veľkosťou súborov na disku, počtom obyvateľov miest a krajín.

Čo majú distribúcie z týchto príkladov spoločné, je prítomnosť takzvaného „ťažkého chvosta“, teda hodnôt, ktoré ležia ďaleko od priemeru, a viditeľná asymetria, zvyčajne vpravo. Uvažujme, aké iné distribúcie by mohli byť okrem normálneho. Začnime s predtým spomínaným Poissonom: má chvost, ale chceme, aby sa zákon opakoval pre množinu skupín, v každej z nich sa dodržiava (vypočítajte veľkosť spisov pre podnik, platy pre viaceré mestá) resp. škálované (ľubovoľne zvýšiť alebo znížiť modelový interval Black - Scholes), ako ukazujú pozorovania, chvosty a asymetria nezmiznú, ale Poissonovo rozdelenie by sa podľa CLP malo stať normálnym. Z rovnakých dôvodov nie sú vhodné Erlang, beta, lognormal a všetky ostatné s disperznými distribúciami. Zostáva len odrezať Paretovo rozdelenie, ale to nie je vhodné kvôli zhode módu s minimálnou hodnotou, ktorá sa pri analýze vzorových dát takmer nikdy nevyskytuje.

Distribúcie majúce potrebné vlastnosti existujú a nazývajú sa stabilné distribúcie. Ich história je tiež veľmi zaujímavá a hlavná veta bola dokázaná rok po Fellerovej práci, v roku 1935, spoločným úsilím francúzsky matematik Paul Levy a Sovietsky matematik A JA Khinchin. CLT bol zovšeobecnený, bola z neho odstránená podmienka existencie disperzie. Na rozdiel od normálu nie je vyjadrená ani hustota, ani distribučná funkcia stabilných náhodných premenných (až na zriedkavé výnimky, ktoré sú popísané nižšie); všetko, čo je o nich známe, je charakteristická funkcia ( inverzná konverzia Hustota Fourierovej distribúcie, ale pre pochopenie podstaty to nemusí byť známe).
Takže veta: ak sú náhodné premenné nezávislé a identicky rozdelené, potom súčty týchto premenných konvergujú k stabilnému zákonu.

Teraz definícia. Náhodná hodnota X bude stabilný vtedy a len vtedy, ak jeho logaritmus charakteristickú funkciu Predstavme si to v tvare:

Kde .

V skutočnosti tu nie je nič zložité, stačí si vysvetliť význam štyroch parametrov. Parametre sigma a mu sú zvyčajnou mierkou a posunom, ako pri normálnom rozdelení, mu sa bude rovnať matematickému očakávaniu, ak existuje, a existuje, keď je alfa väčšie ako jedna. Parameter beta je asymetria, ak sa rovná nule, rozdelenie je symetrické. Ale alfa je charakteristický parameter, udáva, o akú rádovú veľkosť existujú momenty veličiny, čím bližšie je k dvom, viac distribúcie podobne ako normálne, keď sa rovná dvom, rozdelenie sa stáva normálnym a iba v tomto prípade má momenty veľkých rádov, tiež v prípade normálneho rozdelenia asymetria degeneruje. V prípade, že alfa sa rovná jednej a beta je nula, získa sa Cauchyho rozdelenie a v prípade, že sa alfa rovná polovici a beta sa rovná jednej, získa sa Lévyho rozdelenie, v ostatných prípadoch nie je znázornené žiadne v kvadratúre pre rozdelenie hustoty takýchto veličín.
V 20. storočí bola vypracovaná bohatá teória stabilných veličín a procesov (označovaných ako Lévyho procesy) a ich prepojenie s zlomkové integrály, predstavený rôznymi spôsobmi parametrizácii a modelovaní boli parametre odhadnuté niekoľkými spôsobmi a bola preukázaná konzistentnosť a stabilita odhadov. Pozrite sa na obrázok, ukazuje simulovanú trajektóriu Levyho procesu s 15-krát zväčšeným fragmentom.


Práve pri štúdiu takýchto procesov a ich aplikácie vo financiách prišiel Benoit Mandelbrot s fraktálmi. Nie všade to však bolo také dobré. Druhá polovica 20. storočia prešla pod všeobecný trend aplikovaných a kybernetických vied a to znamenalo krízu čistej matematiky, každý chcel produkovať, ale nechcel myslieť, humanisti svojou žurnalistikou obsadili matematické sféry. Príklad: kniha „Fifty Entertaining Probabilistic Problems with Solutions“ od American Mosteller, úloha č. 11:


Autorovo riešenie tohto problému je jednoducho porážka zdravého rozumu:

Rovnaká situácia je aj pri úlohe 25, kde sú uvedené TRI protichodné odpovede.

Vráťme sa však k stabilným distribúciám. Vo zvyšku článku sa pokúsim ukázať, že pri práci s nimi by nemali byť žiadne ďalšie ťažkosti. Totiž, existujú numerické a štatistické metódy, ktoré umožňujú odhadnúť parametre, vypočítať distribučnú funkciu a modelovať ich, čiže fungujú rovnako ako pri akomkoľvek inom rozdelení.

Modelovanie stabilných náhodných premenných. Keďže všetko sa učí porovnávaním, pripomeniem najskôr z výpočtového hľadiska najvhodnejší spôsob generovania normálnej hodnoty (Boxova–Mullerova metóda): ak sú základné náhodné premenné (rovnomerne rozdelené na )

Páčil sa vám článok? Zdieľajte so svojimi priateľmi!