Ligji normal i shpërndarjes së probabilitetit. Shpërndarja normale

Shpërndarja normale(Shpërndarja Gaussian) luajti gjithmonë rol qendror në teorinë e probabilitetit, pasi ajo lind shumë shpesh si rezultat i ndikimit të shumë faktorëve, kontributi i secilit prej të cilëve është i papërfillshëm. Teorema e Kufirit Qendror (CLT) gjen zbatim pothuajse në të gjitha Shkencat e aplikuara, duke e bërë aparatin statistikor universal. Megjithatë, ka raste shumë të shpeshta kur përdorimi i tij është i pamundur, dhe studiuesit përpiqen në çdo mënyrë të mundshme të organizojnë përshtatjen e rezultateve me Gaussian. Këtu bëhet fjalë për qasje alternative Nëse shpërndarja ndikohet nga shumë faktorë, tani do t'ju them.

Një histori e shkurtër e KPT. Ndërsa Njutoni ishte ende gjallë, Abraham de Moivre provoi një teoremë mbi konvergjencën e numrit të përqendruar dhe të normalizuar të vëzhgimeve të një ngjarjeje në një seri teste të pavarura në një shpërndarje normale. Gjatë gjithë shekullit të 19-të dhe fillimit të shekullit të 20-të, kjo teoremë shërbeu si një model shkencor për përgjithësime. Laplace e vërtetoi rastin shpërndarje uniforme, Poisson - teorema lokale për një rast me probabilitete të ndryshme. Poincaré, Lezhandre dhe Gauss zhvilluan një teori të pasur të gabimeve vëzhguese dhe një metodë katrorët më të vegjël, duke u mbështetur në konvergjencën e gabimeve në shpërndarjen normale. Chebyshev provoi një teoremë edhe më të fortë për shumën variabla të rastit, pasi ka zhvilluar metodën e momenteve. Lyapunov në 1900, duke u mbështetur në Chebyshev dhe Markov, vërtetoi CLP në formën e tij aktuale, por vetëm me ekzistencën e momenteve të rendit të tretë. Dhe vetëm në vitin 1934 Feller i dha fund, duke treguar se ekzistenca e momenteve të rendit të dytë është edhe e nevojshme dhe gjendje e mjaftueshme.

CLT mund të formulohet si më poshtë: nëse ndryshoret e rastësishme janë të pavarura, të shpërndara identike dhe kanë një variancë të fundme jo zero, atëherë shumat (të përqendruara dhe të normalizuara) të këtyre variablave konvergojnë në ligjin normal. Është në këtë formë që kjo teoremë mësohet në universitete dhe përdoret kaq shpesh nga vëzhgues dhe studiues që nuk janë profesionistë në matematikë. Çfarë nuk shkon me të? Në fakt, teorema është krejtësisht e zbatueshme në fushat në të cilat kanë punuar Gauss, Poincaré, Chebyshev dhe gjeni të tjerë të shekullit të 19-të, përkatësisht: teoria e gabimeve të vëzhgimit, fizika statistikore, MNC, studime demografike dhe ndoshta diçka tjetër. Por shkencëtarët të cilëve u mungon origjinaliteti për zbulime janë të angazhuar në përgjithësime dhe duan ta zbatojnë këtë teoremë për gjithçka, ose thjesht zvarritin shpërndarjen normale me veshët, aty ku thjesht nuk mund të ekzistojë. Nëse doni shembuj, i kam.

Koeficienti i inteligjencës IQ. Fillimisht nënkupton që inteligjenca e njerëzve shpërndahet normalisht. Bëhet një test i përgatitur paraprakisht në atë mënyrë që aftësitë e jashtëzakonshme të mos merren parasysh, por të merren parasysh veçmas me të njëjtët faktorë të pjesëmarrjes: të menduarit logjik, dizajni mendor, aftësitë llogaritëse, të menduarit abstrakt dhe diçka tjetër. Aftësia për të zgjidhur probleme që janë të paarritshme për shumicën, ose kalimi i një testi në një kohë super të shpejtë nuk merret parasysh në asnjë mënyrë, dhe kalimi i testit më herët rrit rezultatin (por jo inteligjencën) në të ardhmen. Dhe pastaj filistinët besojnë se "askush nuk mund të jetë dy herë më i zgjuar se ata", "le ta marrim nga njerëzit e zgjuar dhe ta ndajmë".

Shembulli i dytë: ndryshimet në treguesit financiarë. Hulumtimi i ndryshimeve në çmimet e aksioneve, kuotat e monedhës dhe opsionet e mallrave kërkon përdorimin e një pajisjeje statistika matematikore, dhe sidomos këtu është e rëndësishme të mos gaboni me llojin e shpërndarjes. Rasti në pikë: në vitin 1997 Çmimi Nobël në ekonomi është paguar për propozimin e modelit Black-Scholes, bazuar në supozimin e shpërndarjes normale të rritjes së treguesve të aksioneve (të ashtuquajturat Zhurma e bardhë). Sidoqoftë, autorët e deklaruan në mënyrë eksplicite këtë këtë model ka nevojë për sqarime, por gjithçka që shumica e studiuesve të mëvonshëm vendosën të bënin ishte thjesht të shtonin shpërndarjen Poisson në shpërndarjen normale. Këtu, padyshim, do të ketë pasaktësi gjatë studimit të serive të gjata kohore, pasi shpërndarja Poisson plotëson shumë mirë CLT, dhe tashmë me 20 terma është e padallueshme nga shpërndarja normale. Shikoni foton më poshtë (dhe është nga një revistë shumë serioze ekonomike), kjo tregon se, pavarësisht mjaft nje numer i madh i vëzhgime dhe shtrembërime të dukshme, bëhet një supozim për normalitetin e shpërndarjes.

Është shumë e qartë se shpërndarjet nuk do të jenë normale pagat midis popullsisë së qytetit, madhësia e skedarëve në disk, popullsia e qyteteve dhe vendeve.

E përbashkëta e shpërndarjeve nga këta shembuj është prania e të ashtuquajturit "bisht i rëndë", domethënë vlera që qëndrojnë larg mesatares dhe një asimetri e dukshme, zakonisht në të djathtë. Le të shqyrtojmë se cilat mund të jenë shpërndarjet e tjera, përveç normales. Le të fillojmë me Poisson-in e përmendur më parë: ai ka një bisht, por ne duam që ligji të përsëritet për një grup grupesh, në secilin prej të cilëve respektohet (llogaritni madhësinë e dosjeve për një ndërmarrje, pagat për disa qytete) ose shkallëzuar (rritja ose zvogëlimi arbitrar i intervalit të modelit Black - Scholes), siç tregojnë vëzhgimet, bishtat dhe asimetria nuk zhduken, por shpërndarja Poisson, sipas CLP, duhet të bëhet normale. Për të njëjtat arsye, Erlang, beta, lognormal dhe të gjitha të tjerat me shpërndarje dispersioni nuk janë të përshtatshme. E tëra që mbetet është të ndërpritet shpërndarja Pareto, por nuk është e përshtatshme për shkak të koincidencës së mënyrës me vlerë minimale, e cila pothuajse kurrë nuk ndodh kur analizohen të dhënat e mostrës.

Shpërndarjet që kanë vetitë e nevojshme, ekzistojnë dhe quhen shpërndarje të qëndrueshme. Historia e tyre është gjithashtu shumë interesante, dhe teorema kryesore u vërtetua një vit pas punës së Feller, në 1935, me përpjekje të përbashkëta. Matematikan francez Paul Levy dhe Matematikan sovjetik EDHE UNE. Khinçin. CLT u përgjithësua nga ai kusht për ekzistencën e dispersionit. Ndryshe nga normalja, nuk shprehet as dendësia dhe as funksioni i shpërndarjes së variablave të rastësishëm të qëndrueshëm (me përjashtime të rralla, të cilat diskutohen më poshtë, gjithçka që dihet rreth tyre është funksioni karakteristik); konvertim i anasjelltë Dendësia e shpërndarjes së Furierit, por për të kuptuar thelbin, kjo mund të mos dihet).
Pra, teorema: nëse ndryshoret e rastësishme janë të pavarura dhe të shpërndara në mënyrë identike, atëherë shumat e këtyre variablave konvergojnë në ligji i qëndrueshëm.

Tani përkufizimi. Vlera e rastësishme X do të jetë i qëndrueshëm nëse dhe vetëm nëse logaritmi i tij funksioni karakteristik Le ta paraqesim në formën:

Në fakt, nuk ka asgjë shumë të komplikuar këtu, thjesht duhet të shpjegoni kuptimin e katër parametrave. Parametrat sigma dhe mu janë shkalla dhe kompensimi i zakonshëm, pasi në shpërndarjen normale, mu do të jetë e barabartë me pritshmërinë matematikore nëse ekziston, dhe ekziston kur alfa është më e madhe se një. Parametri beta është asimetri, nëse është i barabartë me zero, shpërndarja është simetrike. Por alfa është një parametër karakteristik, ai tregon se çfarë rendi të madhësisë ekzistojnë momentet e një sasie, sa më afër të jetë me dy, më shumë shpërndarje e ngjashme me normalen, kur është e barabartë me dy, shpërndarja bëhet normale dhe vetëm në këtë rast ka momente të rendit të mëdha, gjithashtu në rastin e një shpërndarjeje normale, asimetria degjeneron. Në rastin kur alfa është e barabartë me një dhe beta është zero, fitohet shpërndarja Cauchy, dhe në rastin kur alfa është e barabartë me gjysmën dhe beta është e barabartë me një, fitohet shpërndarja Lévy, në raste të tjera nuk ka përfaqësim. në kuadratura për shpërndarjen e densitetit të sasive të tilla.
Në shekullin e 20-të, u zhvillua një teori e pasur e sasive dhe proceseve të qëndrueshme (të referuara si proceset Lévy) dhe lidhja e tyre me integrale thyesore, prezantuar mënyra të ndryshme parametrizimi dhe modelimi, parametrat u vlerësuan në disa mënyra dhe u tregua konsistenca dhe qëndrueshmëria e vlerësimeve. Shikoni foton, ajo tregon një trajektore të simuluar të procesit Levy me një fragment të zmadhuar 15 herë.

Ishte gjatë studimit të proceseve të tilla dhe aplikimit të tyre në financa që Benoit Mandelbrot doli me fraktale. Megjithatë, nuk ishte aq mirë kudo. Gjysma e dytë e shekullit të 20-të kaloi nën prirjen e përgjithshme të shkencave të aplikuara dhe kibernetike, dhe kjo nënkuptonte një krizë të matematikës së pastër, të gjithë donin të prodhonin, por nuk donin të mendonin, humanistët me gazetarinë e tyre pushtuan sferat matematikore. Shembull: libri “Fifty Entertaining Probabilistic Problems with Solutions” nga American Mosteller, detyra nr. 11:

Zgjidhja e autorit për këtë problem është thjesht një humbje e sensit të përbashkët:

E njëjta situatë është edhe me problemin 25, ku jepen TRI përgjigje kontradiktore.

Por le të kthehemi te shpërndarjet e qëndrueshme. Në pjesën tjetër të artikullit do të përpiqem të tregoj se nuk duhet të ketë vështirësi shtesë kur punoni me ta. Gjegjësisht, ekzistojnë metoda numerike dhe statistikore që ju lejojnë të vlerësoni parametrat, të llogaritni funksionin e shpërndarjes dhe t'i modeloni ato, domethënë të punoni në të njëjtën mënyrë si me çdo shpërndarje tjetër.

Modelimi i variablave të rastësishëm të qëndrueshëm. Meqenëse gjithçka mësohet nga krahasimi, së pari do të kujtoj metodën më të përshtatshme, nga pikëpamja llogaritëse, e gjenerimit të një vlere normale (metoda Box–Muller): nëse janë variablat bazë të rastit (të shpërndara në mënyrë uniforme në )