Shpërndarja normale. Shpërndarje të qëndrueshme

Ligji normal shpërndarjet e probabilitetit

Pa ekzagjerim, mund të quhet një ligj filozofik. Duke vëzhguar objekte dhe procese të ndryshme në botën përreth, shpesh hasim në faktin se diçka nuk mjafton dhe se ekziston një normë:


Këtu është një pamje themelore funksionet e densitetit Shpërndarja normale e probabilitetit, dhe ju mirëpres në këtë mësim interesant.

Çfarë shembujsh mund të jepni? Ka thjesht errësirë ​​prej tyre. Kjo, për shembull, është lartësia, pesha e njerëzve (dhe jo vetëm), e tyre forca fizike, aftësitë mendore etj. Ekziston një "masë kryesore" (për një arsye ose një tjetër) dhe ka devijime në të dy drejtimet.

Kjo karakteristika të ndryshme objekte të pajetë (të njëjtën madhësi, peshë). Kjo është një kohëzgjatje e rastësishme e proceseve ..., përsëri një shembull i trishtuar më erdhi në mendje, dhe për këtë arsye do të them "jetën" e llambave :) Nga fizika, m'u kujtuan molekulat e ajrit: midis tyre ka të ngadalta, ka ato të shpejta, por shumica lëvizin me shpejtësi "standarde".

Tjetra, ne devijojmë nga qendra me një devijim standard tjetër dhe llogarisim lartësinë:

Shënimi i pikave në vizatim (jeshile) dhe ne shohim se kjo është mjaft e mjaftueshme.

Në fazën përfundimtare, ne vizatojmë me kujdes një grafik dhe veçanërisht me kujdes pasqyrojnë atë konveks/konkave! Epo, me siguri e keni kuptuar shumë kohë më parë se boshti x është asimptotë horizontale, dhe është absolutisht e ndaluar të “ngjitet” pas saj!

regjistrim elektronik Grafiku i zgjidhjes është i lehtë për t'u ndërtuar në Excel, dhe papritur për veten time, madje regjistrova një video të shkurtër për këtë temë. Por së pari, le të flasim se si ndryshon forma e kurbës normale në varësi të vlerave të dhe.

Kur rritet ose zvogëlohet "a" (me “sigma” konstante) grafiku ruan formën e tij dhe lëviz djathtas/majtas përkatësisht. Kështu, për shembull, kur funksioni merr formën dhe grafiku ynë "lëviz" 3 njësi në të majtë - saktësisht në origjinën e koordinatave:


Një sasi e shpërndarë normalisht me pritshmëri matematikore zero mori një emër krejtësisht natyror - të përqendruar; funksioni i densitetit të tij madje, dhe grafiku është simetrik ndaj ordinatës.

Në rast të ndryshimit të "sigmës" (me konstante "a"), grafiku “qëndron i njëjtë”, por ndryshon formë. Kur zmadhohet, ai bëhet më i ulët dhe i zgjatur, si një oktapod që shtrin tentakulat e tij. Dhe, anasjelltas, kur zvogëlohet grafiku bëhet më i ngushtë dhe më i gjatë- rezulton të jetë një "oktapod i befasuar". Po, kur zvogëlohet"sigma" dy herë: grafiku i mëparshëm ngushtohet dhe shtrihet dy herë:

Gjithçka është në përputhje të plotë me shndërrimet gjeometrike të grafikëve.

Një shpërndarje normale me një vlerë sigma njësi quhet normalizuar, dhe nëse është gjithashtu të përqendruar(rasti ynë), atëherë quhet një shpërndarje e tillë standarde. Ai ka një funksion edhe më të thjeshtë të densitetit, i cili tashmë është gjetur në Teorema lokale e Laplace: . Shpërndarja standarde ka gjetur zbatim të gjerë në praktikë dhe shumë shpejt do ta kuptojmë më në fund qëllimin e saj.

Epo, tani le të shikojmë filmin:

Po, absolutisht e drejtë - disi në mënyrë të pamerituar mbeti në hije funksioni i shpërndarjes së probabilitetit. Le ta kujtojmë atë përkufizimi:
– probabiliteti që një ndryshore e rastësishme të marrë një vlerë MË MË MË TË VOGËL se ndryshorja që “përshkon” të gjitha vlerat reale deri në “plus” pafundësi.

Brenda integralit, zakonisht përdoret një shkronjë e ndryshme në mënyrë që të mos ketë "mbivendosje" me shënimin, sepse këtu çdo vlerë shoqërohet me integral jo i duhur , e cila është e barabartë me disa numri nga intervali.

Pothuajse të gjitha kuptimet nuk janë të përshtatshme llogaritje e saktë, por siç e pamë sapo, me fuqinë moderne kompjuterike nuk ka asnjë vështirësi me këtë. Pra, për funksionin Shpërndarja standarde, funksioni përkatës i Excel në përgjithësi përmban një argument:

=NORMSDIST(z)

Një, dy - dhe keni mbaruar:

Vizatimi tregon qartë zbatimin e të gjithëve vetitë e funksionit të shpërndarjes, dhe nga nuancat teknike këtu duhet t'i kushtoni vëmendje asimptota horizontale dhe pika e përkuljes.

Tani le të kujtojmë një nga detyrat kryesore të temës, domethënë, të zbulojmë se si të gjejmë probabilitetin që një ndryshore normale e rastësishme do të marrë vlerën nga intervali. Gjeometrikisht, ky probabilitet është i barabartë me zonë ndërmjet lakores normale dhe boshtit x në seksionin përkatës:

por sa herë që përpiqem të marr një vlerë të përafërt është e paarsyeshme, dhe për këtë arsye është më racionale të përdoret formula "e lehtë".:
.

! Gjithashtu kujton , Çfarë

Këtu mund të përdorni përsëri Excel, por ka disa "por" domethënëse: së pari, nuk është gjithmonë pranë, dhe së dyti, vlerat "të gatshme" me shumë mundësi do të ngrenë pyetje nga mësuesi. Pse?

Unë kam folur për këtë shumë herë më parë: në një kohë (dhe jo shumë kohë më parë) një kalkulator i rregullt ishte një luks, dhe në literaturë edukative Metoda "manuale" e zgjidhjes së problemit në shqyrtim është ruajtur ende. Thelbi i saj është që standardizoj vlerat "alfa" dhe "beta", domethënë, zvogëlojnë zgjidhjen në shpërndarjen standarde:

Shënim : funksioni është i lehtë për t'u marrë rast i përgjithshëm duke përdorur lineare zëvendësimet. Pastaj gjithashtu:

dhe nga zëvendësimi i kryer formula vijon: kalimi nga vlerat shpërndarja e rastësishme- në vlerat përkatëse të shpërndarjes standarde.

Pse është e nevojshme kjo? Fakti është se vlerat u llogaritën me përpikëri nga paraardhësit tanë dhe u përpiluan në një tabelë të veçantë, e cila gjendet në shumë libra në terwer. Por edhe më shpesh ekziston një tabelë vlerash, të cilën e kemi trajtuar tashmë Teorema integrale e Laplasit:

Nëse kemi në dispozicion një tabelë vlerash të funksionit Laplace , pastaj zgjidhim përmes tij:

Vlerat thyesore Tradicionalisht, ne rrumbullakojmë në 4 shifra dhjetore, siç bëhet në tabelën standarde. Dhe për kontroll ka Pika 5 faqosje.

Ju kujtoj se , dhe për të shmangur konfuzionin gjithmonë kontroll, një tabelë e funksionit WHAT është para syve tuaj.

Përgjigju kërkohet të jepet si përqindje, kështu që probabiliteti i llogaritur duhet të shumëzohet me 100 dhe rezultati të jepet me një koment kuptimplotë:

– me një fluturim nga 5 në 70 m, afërsisht 15.87% e predhave do të bien

Ne stërvitemi vetë:

Shembulli 3

Diametri i kushinetave të prodhuara në fabrikë është një variabël i rastësishëm, i shpërndarë normalisht me një pritje matematikore prej 1,5 cm dhe një devijim standard prej 0,04 cm.

Në zgjidhjen e mostrës dhe më poshtë, unë do të përdor funksionin Laplace si opsionin më të zakonshëm. Nga rruga, vini re se sipas formulimit, skajet e intervalit mund të përfshihen në shqyrtim këtu. Megjithatë, kjo nuk është kritike.

Dhe tashmë në këtë shembull u takuam rast i veçantë– kur intervali është simetrik në raport me pritje matematikore. Në një situatë të tillë, mund të shkruhet në formë dhe, duke përdorur çuditshmërinë e funksionit Laplace, të thjeshtoni formulën e punës:


Parametri delta quhet devijimi nga pritshmëria matematikore, dhe pabarazia e dyfishtë mund të “paketohet” duke përdorur modul:

– probabiliteti që vlera e një ndryshoreje të rastësishme të devijojë nga pritshmëria matematikore me më pak se .

Është mirë që zgjidhja përshtatet në një rresht :)
– probabiliteti që diametri i një kushinete të marrë rastësisht të ndryshojë nga 1,5 cm me jo më shumë se 0,1 cm.

Rezultati i kësaj detyre doli të ishte afër unitetit, por unë do të doja një besueshmëri edhe më të madhe - domethënë, të zbuloja kufijtë brenda të cilëve ndodhet diametri pothuajse të gjithë kushinetat. A ka ndonjë kriter për këtë? Ekziston! Pyetjes së shtruar i përgjigjen të ashtuquajturit

rregulli tre sigma

Thelbi i saj është se praktikisht i besueshëm është fakti që një ndryshore e rastësishme e shpërndarë normalisht do të marrë një vlerë nga intervali .

Në të vërtetë, probabiliteti i devijimit nga vlera e pritur është më pak se:
ose 99.73%

Për sa i përket kushinetës, këto janë 9973 copë me diametër nga 1.38 në 1.62 cm dhe vetëm 27 kopje "nën standarde".

Në kërkimin praktik, rregulli tre sigma zakonisht zbatohet në drejtim të kundërt: nëse statistikisht U konstatua se pothuajse të gjitha vlerat variabli i rastësishëm në studim bien brenda një intervali prej 6 devijimesh standarde, atëherë ka arsye bindëse për të besuar se kjo vlerë shpërndahet sipas një ligji normal. Verifikimi kryhet duke përdorur teorinë hipoteza statistikore , të cilin shpresoj ta arrij herët a vonë :)

Ndërkohë, ne vazhdojmë të zgjidhim problemet e ashpra sovjetike:

Shembulli 4

Vlera e rastësishme e gabimit të peshimit shpërndahet sipas ligjit normal me pritshmëri matematikore zero dhe devijimi standard 3 gram. Gjeni probabilitetin që peshimi tjetër të kryhet me një gabim jo më shumë se 5 gram në vlerë absolute.

Zgjidhje shumë e thjeshtë. Me kusht, vërejmë menjëherë se në peshimin tjetër (diçka ose dikush) ne do të marrim pothuajse 100% rezultatin me një saktësi prej 9 gram. Por problemi përfshin një devijim më të ngushtë dhe sipas formulës :

– probabiliteti që peshimi i radhës të kryhet me një gabim jo më shumë se 5 gram.

Përgjigju:

Problemi i zgjidhur është thelbësisht i ndryshëm nga një problem në dukje i ngjashëm. Shembulli 3 mësim rreth shpërndarje uniforme. Pati një gabim rrumbullakimi rezultatet e matjeve, këtu bëhet fjalë për gabimin e rastësishëm të vetë matjeve. Gabime të tilla lindin për shkak të karakteristikat teknike vetë pajisja (sfera e gabimeve të pranueshme zakonisht tregohet në pasaportën e tij), dhe gjithashtu për fajin e eksperimentuesit - kur ne, për shembull, "me sy" marrim lexime nga gjilpëra e të njëjtave peshore.

Ndër të tjera ka edhe të ashtuquajturat sistematike gabimet e matjes. Është tashmë jo të rastësishme gabime që ndodhin për shkak të konfigurimit ose funksionimit të gabuar të pajisjes. Për shembull, peshoret e parregulluara të dyshemesë mund të "shtojnë" vazhdimisht kilogramë dhe shitësi rëndon sistematikisht klientët. Ose mund të llogaritet jo sistematikisht. Sidoqoftë, në çdo rast, një gabim i tillë nuk do të jetë i rastësishëm dhe pritshmëria e tij është e ndryshme nga zero.

…Unë po zhvilloj urgjentisht një kurs trajnimi për shitje =)

Ne vendosim vetë problem i anasjelltë:

Shembulli 5

Diametri i rulit është një ndryshore e rastësishme e shpërndarë normalisht, devijimi standard i tij është i barabartë me mm. Gjeni gjatësinë e intervalit, simetrik në lidhje me pritjen matematikore, në të cilën gjatësia e diametrit të rulit ka të ngjarë të bjerë.

Pika 5* paraqitjen e dizajnit për të ndihmuar. Ju lutemi vini re se pritshmëria matematikore nuk dihet këtu, por kjo nuk na pengon aspak të zgjidhim problemin.

DHE detyrë provimi, të cilin e rekomandoj shumë për konsolidimin e materialit:

Shembulli 6

Një ndryshore e rastësishme e shpërndarë normalisht përcaktohet nga parametrat e saj (pritshmëria matematikore) dhe (devijimi standard). Kërkohet:

a) shkruani densitetin e probabilitetit dhe përshkruani skematikisht grafikun e tij;
b) gjeni probabilitetin që do të marrë një vlerë nga intervali ;
c) gjeni probabilitetin që vlera absolute të devijojë nga jo më shumë se ;
d) duke përdorur rregullin "tre sigma", gjeni vlerat e ndryshores së rastësishme.

Probleme të tilla ofrohen kudo dhe gjatë viteve të praktikës kam zgjidhur qindra e qindra të tilla. Sigurohuni që të praktikoni të vizatoni një vizatim me dorë dhe duke përdorur tabela letre;)

Epo, unë do t'ju jap një shembull kompleksiteti i shtuar:

Shembulli 7

Dendësia e shpërndarjes së probabilitetit të një ndryshoreje të rastësishme ka formën . Gjeni, pritjet matematikore, variancën, funksionin e shpërndarjes, ndërtoni grafikët e densitetit dhe funksionet e shpërndarjes, gjeni.

Zgjidhje: Së pari, le të vërejmë se kushti nuk thotë asgjë për natyrën e ndryshores së rastit. Prania e një eksponenti në vetvete nuk do të thotë asgjë: mund të rezultojë, për shembull, tregues apo edhe arbitrare shpërndarja e vazhdueshme. Dhe për këtë arsye "normaliteti" i shpërndarjes ende duhet të justifikohet:

Që nga funksioni përcaktuar në ndonjë vlera aktuale, dhe mund të reduktohet në formë , atëherë ndryshorja e rastësishme shpërndahet sipas ligjit normal.

Ja ku po shkojmë. Për këtë zgjidhni një katror të plotë dhe të organizojnë thyesë trekatëshe:


Sigurohuni që të kryeni një kontroll, duke e kthyer treguesin në formën e tij origjinale:

, që është ajo që ne donim të shihnim.

Kështu:
- Nga rregulli i operacioneve me kompetenca"hiq" Dhe këtu mund të shkruajmë menjëherë të dukshmen karakteristikat numerike:

Tani le të gjejmë vlerën e parametrit. Meqenëse shumëzuesi i shpërndarjes normale ka formën dhe , atëherë:
, nga ku shprehemi dhe zëvendësojmë në funksionin tonë:
, pas së cilës do të kalojmë përsëri regjistrimin me sytë tanë dhe do të sigurohemi që funksioni që rezulton të ketë formën .

Le të ndërtojmë një grafik densiteti:

dhe grafiku i funksionit të shpërndarjes :

Nëse nuk keni Excel apo edhe një kalkulator të rregullt në dorë, atëherë grafiku i fundit mund të ndërtohet lehtësisht me dorë! Në pikën funksioni i shpërndarjes merr vlerën dhe ja ku është

Le të shqyrtojmë dy ndryshore të rastësishme të pavarura dhe , duke iu nënshtruar ligjeve normale:

, (12.6.1)

. (12.6.2)

Kërkohet të prodhohet një përbërje e këtyre ligjeve, domethënë të gjendet ligji i shpërndarjes së sasisë:

Le të zbatojmë formulën e përgjithshme (12.5.3) për përbërjen e ligjeve të shpërndarjes:

. (12.6.3)

Nëse hapim kllapat në eksponentin e integrandit dhe sjellim anëtarë të ngjashëm, marrim:

,

;

;

.

Duke zëvendësuar këto shprehje në formulën (9.1.3) kemi hasur tashmë:

, (12.6.4)

pas transformimeve marrim:

, (12.6.5)

dhe ky nuk është gjë tjetër veçse një ligj normal me një qendër shpërndarjeje

dhe devijimi standard

. (12.6.7)

I njëjti përfundim mund të arrihet shumë më lehtë duke përdorur arsyetimin cilësor të mëposhtëm.

Pa hapur kllapat dhe pa bërë asnjë transformim në integrandin (12.6.3), arrijmë menjëherë në përfundimin se eksponenti është trinom kuadratik në lidhje me llojin

,

ku sasia nuk përfshihet fare në koeficient, koeficienti përfshihet në fuqinë e parë dhe koeficienti është në katror. Duke e mbajtur këtë parasysh dhe duke zbatuar formulën (12.6.4), arrijmë në përfundimin se ekziston një funksion eksponencial, eksponenti i të cilit është një trinom katror në lidhje me , dhe dendësia e shpërndarjes së këtij lloji korrespondon me ligjin normal. Kështu, arrijmë në një përfundim thjesht cilësor: ligji i shpërndarjes së sasisë duhet të jetë normal.

Për të gjetur parametrat e këtij ligji - dhe - do të përdorim teoremën e mbledhjes së pritjeve matematikore dhe teoremën e mbledhjes së variancave. Sipas teoremës së mbledhjes së pritjeve matematikore

Nga teorema e mbledhjes së variancave

prej nga vijon formula (12.6.7).

Duke kaluar nga devijimet standarde në devijimet e mundshme proporcionale me to, marrim:

Kështu, arritëm në rregullin e mëposhtëm: kur kombinohen ligjet normale, përsëri fitohet një ligj normal dhe përmblidhen pritjet dhe variancat matematikore (ose katrorët e devijimeve të mundshme).

Rregulli për përbërjen e ligjeve normale mund të përgjithësohet për rastin çdo numër variabla të rastësishme të pavarura.

Nëse ka variabla të rastësishëm të pavarur:

subjekt i ligjeve normale me qendra dispersioni

dhe devijimet standarde

,

pastaj vlera

i nënshtrohet edhe ligjit normal me parametra

Në vend të formulës (12.6.12), mund të përdorni një formulë ekuivalente:

Nëse një sistem variablash të rastësishëm shpërndahet sipas një ligji normal, por vlerat janë të varura, atëherë nuk është e vështirë të vërtetohet, ashtu si më parë, bazuar në formulë e përgjithshme(12.5.1) se ligji i shpërndarjes së sasisë

Ekziston edhe një ligj normal. Qendrat e shpërndarjes shtohen ende në mënyrë algjebrike, por për devijimet standarde rregulli bëhet më kompleks:

, (12.6.14)

ku është koeficienti i korrelacionit të sasive dhe .

Kur shtohen disa ndryshore të rastësishme të varura, të cilat në tërësinë e tyre i nënshtrohen ligjit normal, ligji i shpërndarjes së shumës rezulton gjithashtu normal me parametrat

, (12.6.16)

ose në devijime të mundshme

, (12.6.17)

ku është koeficienti i korrelacionit të sasive, dhe përmbledhja shtrihet në të gjitha kombinimet e ndryshme në çift të sasive.

Jemi bindur për një veti shumë të rëndësishme të ligjit normal: me përbërjen e ligjeve normale, përsëri fitohet një ligj normal. Kjo është e ashtuquajtura "pronë e stabilitetit". Një ligj i shpërndarjes quhet i qëndrueshëm nëse përbërja e dy ligjeve të këtij lloji rezulton përsëri në një ligj të të njëjtit lloj. Më sipër treguam se ligji normal është i qëndrueshëm. Shumë pak ligje të shpërndarjes kanë vetinë e stabilitetit. Në të mëparshmen (shembulli 2), ne ishim të bindur se, për shembull, ligji i densitetit uniform është i paqëndrueshëm: duke kombinuar dy ligje të densitetit uniform në seksionet nga 0 në 1, ne morëm ligjin e Simpson.

Stabiliteti i ligjit normal është një nga kushtet thelbësore për përdorimin e tij të gjerë në praktikë. Mirëpo veç asaj normale vetinë e qëndrueshmërisë kanë edhe disa ligje të tjera të shpërndarjes. Një tipar i veçantë i ligjit normal është se me përbërjen e një numri mjaft të madh, praktikisht ligjet arbitrare shpërndarja, ligji total rezulton të jetë aq afër normales sa dëshirohet, pavarësisht se cilat ishin ligjet e shpërndarjes së termave. Kjo mund të ilustrohet, për shembull, duke kompozuar tre ligjet e densitetit uniform në zonat nga 0 në 1. Ligji i shpërndarjes që rezulton është paraqitur në Fig. 12.6.1. Siç shihet nga vizatimi, grafiku i funksionit është shumë i ngjashëm me grafikun e ligjit normal.

Shpërndarja normale

Tashmë jemi njohur me konceptet e shpërndarjes, poligonit (ose poligonit privat) dhe kurbës së shpërndarjes. Një rast i veçantë i këtyre koncepteve është "shpërndarja normale" dhe "lakorja normale". Por ky opsion i veçantë është shumë i rëndësishëm kur analizohen të dhënat shkencore, përfshirë ato psikologjike. Fakti është se shpërndarja normale, e përshkruar në mënyrë grafike kurbë normale ka një shpërndarje ideale, e gjetur rrallë në realitetin objektiv. Por përdorimi i tij lehtëson dhe thjeshton shumë përpunimin dhe shpjegimin e të dhënave të marra në natyrë. Për më tepër, vetëm për një shpërndarje normale koeficientët e dhënë të korrelacionit mund të interpretohen si një masë e afërsisë së lidhjes në raste të tjera ata nuk i shërbejnë një funksioni të tillë dhe llogaritja e tyre çon në paradokse që janë të vështira për t'u shpjeguar.

kërkimin shkencor supozimi zakonisht pranohet O normalitetin e shpërndarjes së të dhënave reale dhe mbi këtë bazë përpunohen, pas së cilës sqarohet dhe tregohet se sa ndryshon shpërndarja reale nga ajo normale, për të cilën ekzistojnë një sërë teknikash të veçanta statistikore. Si rregull, ky supozim është mjaft i pranueshëm, pasi shumica dukuritë psikike dhe karakteristikat e tyre kanë shpërndarje shumë afër normales.

Pra, cila është shpërndarja normale dhe cilat janë tiparet e saj që tërheqin shkencëtarët? Normale Një shpërndarje e një sasie quhet e tillë që probabiliteti i shfaqjes dhe mosndodhjes së saj është i njëjtë. Ilustrimi klasik është hedhja e monedhës. Nëse monedha është e drejtë dhe hedhjet bëhen në të njëjtën mënyrë, atëherë marrja e kokave ose bishtave është po aq e mundshme. Kjo do të thotë, "kokat" mund të bien dhe të mos bien me të njëjtën probabilitet, dhe e njëjta gjë vlen edhe për "bishtin".

Ne prezantuam konceptin e "probabilitetit". Le ta sqarojmë. Probabilitetiështë frekuenca e pritur e ndodhjes së një ngjarjeje (ndodhja - jo ndodhja e një sasie). Probabiliteti shprehet përmes një thyese, numëruesi i së cilës është numri i ngjarjeve që janë realizuar (frekuenca), dhe V emërues - maksimal numri i mundshëm këto ngjarje. Kur mostra (numri rastet e mundshme) është i kufizuar, atëherë është më mirë të flasim jo për probabilitetin, por O frekuenca me të cilën jemi njohur tashmë. Probabiliteti sugjeron numër i pafund mostrat Por në praktikë kjo hollësi shpesh injorohet.

Interesi i madh i matematikanëve në teorinë e probabilitetit V në përgjithësi dhe ndaj shpërndarjes normale në veçanti shfaqet V Shekulli XVII për shkak të dëshirës së pjesëmarrësve kumar gjeni një formulë për fitimet maksimale me rrezik minimal. Matematikanët e famshëm J. Bernoulli (1654-1705) dhe P. S. Laplace (1749-1827) morën këto pyetje. Së pari përshkrimi matematik kurba që lidh segmentet e diagramit të shpërndarjes së probabiliteteve për të marrë "kokë" gjatë hedhjes së monedhave disa herë, dha Abraham de Moivre(1667-1754). Kjo kurbë është shumë afër kurbë normale përshkrimin e saktë të së cilës ai dha matematikan i madh K. F. Gauss(1777-1855), emrin e të cilit e mban edhe sot. Grafiku dhe formula e kurbës normale (Gaussian) janë si më poshtë.

ku P është probabiliteti (më saktë, densiteti i probabilitetit), d.m.th. lartësia e kurbës sipër vlerën e dhënë Z; e – bazë logaritmi natyror(2.718...); π= 3,142...; M – mesatarja e mostrës; σ – devijimi standard.

Vetitë e një kurbë normale

1. Mesatarja (M), mënyra (Mo) dhe mesatarja (Me) janë të njëjta.

2. Simetria në raport me mesataren M.

3. Përcaktohet pa mëdyshje nga vetëm dy parametra - M dhe o.

4. “Degët” e kurbës nuk e kalojnë asnjëherë abshisën Z, duke iu afruar asimptotike.

5. Për M = 0 dhe o = 1, marrim një kurbë normale njësi, pasi sipërfaqja nën të është e barabartë me 1.

6. Për një kurbë njësi: P m = 0,3989, dhe zona nën kurbë është në intervalin:

-σ në +σ = 68,26%; -2σ në + 2σ = 95,46%; -Зσ në + Зσ = 99,74%.

7. Për kurbat normale jo njësi (M ≠0, σ ≠1), modeli në zona mbetet i njëjtë. Dallimi është në të qindtat.

Ndryshimet e shpërndarjes normale

Ndryshimet e paraqitura më poshtë vlejnë jo vetëm për shpërndarjen normale, por për cilindo. Megjithatë, për qartësi, ne i paraqesim ato këtu.

1. Asimetria – shpërndarja e pabarabartë në raport me vlerën qendrore.

Shpërndarja normale (shpërndarja Gaussian) luajti gjithmonë rol qendror në teorinë e probabilitetit, pasi ndodh shumë shpesh si rezultat i ndikimit të shumë faktorëve, kontributi i secilit prej të cilëve është i papërfillshëm. Teorema e Kufirit Qendror (CLT) gjen zbatim pothuajse në të gjitha shkencat e aplikuara, duke e bërë aparatin statistikor universal. Megjithatë, ka raste shumë të shpeshta kur përdorimi i tij është i pamundur, dhe studiuesit përpiqen në çdo mënyrë të mundshme të organizojnë përshtatjen e rezultateve me Gaussian. Kjo është rreth qasje alternative Nëse shpërndarja ndikohet nga shumë faktorë, tani do t'ju them.

Një histori e shkurtër e KPT. Ndërsa Njutoni ishte ende gjallë, Abraham de Moivre provoi një teoremë mbi konvergjencën e numrit të përqendruar dhe të normalizuar të vëzhgimeve të një ngjarjeje në një seri teste të pavarura në një shpërndarje normale. Gjatë gjithë shekullit të 19-të dhe fillimit të shekullit të 20-të, kjo teoremë shërbeu si një model shkencor për përgjithësime. Laplace e vërtetoi rastin shpërndarje uniforme, Poisson - teorema lokale për një rast me probabilitete të ndryshme. Poincaré, Lezhandre dhe Gauss zhvilluan një teori të pasur të gabimeve vëzhguese dhe një metodë katrorët më të vegjël, duke u mbështetur në konvergjencën e gabimeve në shpërndarjen normale. Chebyshev provoi një teoremë edhe më të fortë për shumën e ndryshoreve të rastësishme, duke zhvilluar metodën e momenteve. Lyapunov në 1900, duke u mbështetur në Chebyshev dhe Markov, vërtetoi CLP në formën e tij aktuale, por vetëm me ekzistencën e momenteve të rendit të tretë. Dhe vetëm në vitin 1934 Feller i dha fund, duke treguar se ekzistenca e momenteve të rendit të dytë është një kusht i domosdoshëm dhe i mjaftueshëm.

CLT mund të formulohet si më poshtë: nëse ndryshoret e rastësishme janë të pavarura, të shpërndara identike dhe kanë një variancë të fundme jo zero, atëherë shumat (të përqendruara dhe të normalizuara) të këtyre variablave konvergojnë në ligjin normal. Është në këtë formë që kjo teoremë mësohet në universitete dhe përdoret kaq shpesh nga vëzhgues dhe studiues që nuk janë profesionistë në matematikë. Çfarë nuk shkon me të? Në fakt, teorema është plotësisht e zbatueshme në fushat në të cilat kanë punuar Gauss, Poincaré, Chebyshev dhe gjeni të tjerë të shekullit të 19-të, përkatësisht: teoria e gabimeve të vëzhgimit, fizika statistikore, MNC, studime demografike dhe ndoshta diçka tjetër. Por shkencëtarët të cilëve u mungon origjinaliteti për zbulime janë të angazhuar në përgjithësime dhe duan ta zbatojnë këtë teoremë për gjithçka, ose thjesht zvarritin shpërndarjen normale me veshët, aty ku thjesht nuk mund të ekzistojë. Nëse doni shembuj, i kam.

Koeficienti i inteligjencës IQ. Fillimisht nënkupton që inteligjenca e njerëzve shpërndahet normalisht. Ata kryejnë një test që përgatitet paraprakisht në atë mënyrë që aftësitë e jashtëzakonshme të mos merren parasysh, por të merren parasysh veçmas me të njëjtin faktorë të përbashkët: të menduarit logjik, dizajni mendor, aftësitë llogaritëse, të menduarit abstrakt dhe diçka tjetër. Aftësia për të zgjidhur probleme që janë të paarritshme për shumicën, ose kalimi i një testi në një kohë super të shpejtë nuk merret parasysh në asnjë mënyrë, dhe kalimi i testit më herët rrit rezultatin (por jo inteligjencën) në të ardhmen. Dhe pastaj filistinët besojnë se "askush nuk mund të jetë dy herë më i zgjuar se ata", "le ta marrim nga njerëzit e zgjuar dhe ta ndajmë".

Shembulli i dytë: ndryshimet në treguesit financiarë. Hulumtimi i ndryshimeve në çmimet e aksioneve, kuotat e monedhës dhe opsionet e mallrave kërkon përdorimin e një pajisjeje statistika matematikore, dhe sidomos këtu është e rëndësishme të mos gaboni me llojin e shpërndarjes. Rasti në pikë: në vitin 1997 Çmimin Nobel në ekonomi është paguar për propozimin e modelit Black-Scholes, bazuar në supozimin e shpërndarjes normale të rritjes së treguesve të aksioneve (të ashtuquajturat zhurmë e bardhë). Megjithatë, autorët e deklaruan në mënyrë eksplicite këtë këtë model ka nevojë për sqarime, por gjithçka që shumica e studiuesve të mëvonshëm vendosën të bënin ishte thjesht të shtonin shpërndarjen Poisson në shpërndarjen normale. Këtu, padyshim, do të ketë pasaktësi gjatë studimit të serive të gjata kohore, pasi shpërndarja Poisson kënaq shumë mirë CLT, dhe tashmë me 20 terma është e padallueshme nga shpërndarja normale. Shikoni foton më poshtë (dhe është nga një revistë shumë serioze ekonomike), kjo tregon se, pavarësisht mjaft numër i madh vëzhgime dhe shtrembërime të dukshme, bëhet një supozim për normalitetin e shpërndarjes.


Është shumë e qartë se shpërndarjet nuk do të jenë normale pagat midis popullsisë së qytetit, madhësia e skedarëve në disk, popullsia e qyteteve dhe vendeve.

E përbashkëta e shpërndarjeve nga këta shembuj është prania e të ashtuquajturit "bisht i rëndë", domethënë vlera që qëndrojnë larg mesatares dhe një asimetri e dukshme, zakonisht në të djathtë. Le të shqyrtojmë se cilat mund të jenë shpërndarjet e tjera, përveç normales. Le të fillojmë me Poisson-in e përmendur më parë: ai ka një bisht, por ne duam që ligji të përsëritet për një grup grupesh, në secilin prej të cilëve respektohet (llogaritni madhësinë e dosjeve për një ndërmarrje, pagat për disa qytete) ose shkallëzuar (rritja ose zvogëlimi arbitrar i intervalit të modelit Black - Scholes), siç tregojnë vëzhgimet, bishtat dhe asimetria nuk zhduken, por shpërndarja Poisson, sipas CLT, duhet të bëhet normale. Për të njëjtat arsye, Erlang, beta, lognormal dhe të gjitha të tjerat me shpërndarje dispersioni nuk janë të përshtatshme. Mbetet vetëm për të ndërprerë shpërndarjen Pareto, por nuk është e përshtatshme për shkak të koincidencës së mënyrës me vlerën minimale, e cila pothuajse kurrë nuk ndodh kur analizohen të dhënat e mostrës.

Shpërndarjet që kanë vetitë e nevojshme, ekzistojnë dhe quhen shpërndarje të qëndrueshme. Historia e tyre është gjithashtu shumë interesante, dhe teorema kryesore u vërtetua një vit pas punës së Feller, në 1935, me përpjekje të përbashkëta. Matematikan francez Paul Levy dhe Matematikan sovjetik A.Ya. Khinçin. CLT u përgjithësua nga ai kusht për ekzistencën e dispersionit. Ndryshe nga normalja, nuk shprehet as dendësia dhe as funksioni i shpërndarjes së variablave të rastësishëm të qëndrueshëm (me përjashtime të rralla, të cilat diskutohen më poshtë, gjithçka që dihet rreth tyre është funksioni karakteristik); konvertim i anasjelltë Dendësia e shpërndarjes së Furierit, por për të kuptuar thelbin, kjo mund të mos dihet).
Pra, teorema: nëse ndryshoret e rastësishme janë të pavarura dhe të shpërndara në mënyrë identike, atëherë shumat e këtyre variablave konvergojnë në një ligj të qëndrueshëm.

Tani përkufizimi. Ndryshore e rastësishme X do të jetë i qëndrueshëm nëse dhe vetëm nëse logaritmi i tij funksioni karakteristik Le ta paraqesim në formën:

Ku .

Në fakt, nuk ka asgjë shumë të komplikuar këtu, thjesht duhet të shpjegoni kuptimin e katër parametrave. Parametrat sigma dhe mu janë shkalla dhe kompensimi i zakonshëm, pasi në shpërndarjen normale, mu do të jetë e barabartë me pritshmërinë matematikore nëse ekziston, dhe ekziston kur alfa është më e madhe se një. Parametri beta është asimetri, nëse është i barabartë me zero, shpërndarja është simetrike. Por alfa është një parametër karakteristik, ai tregon se çfarë rendi të madhësisë ekzistojnë momentet e një sasie, sa më afër të jetë me dy, më shumë shpërndarje e ngjashme me normalen, kur është e barabartë me dy, shpërndarja bëhet normale dhe vetëm në këtë rast ka momente të rendit të mëdha, gjithashtu në rastin e një shpërndarjeje normale, asimetria degjeneron. Në rastin kur alfa është e barabartë me një dhe beta është zero, fitohet shpërndarja Cauchy, dhe në rastin kur alfa është e barabartë me gjysmën dhe beta është e barabartë me një, fitohet shpërndarja Lévy, në raste të tjera nuk ka përfaqësim. në kuadratura për shpërndarjen e densitetit të sasive të tilla.
Në shekullin e 20-të, u zhvillua një teori e pasur e sasive dhe proceseve të qëndrueshme (të referuara si proceset Lévy) dhe lidhja e tyre me integrale thyesore, prezantuar mënyra të ndryshme parametrizimi dhe modelimi, parametrat u vlerësuan në disa mënyra dhe u tregua konsistenca dhe qëndrueshmëria e vlerësimeve. Shikoni foton, ajo tregon një trajektore të simuluar të procesit Levy me një fragment të zmadhuar 15 herë.


Ishte gjatë studimit të proceseve të tilla dhe aplikimit të tyre në financa që Benoit Mandelbrot doli me fraktale. Megjithatë, nuk ishte aq mirë kudo. Gjysma e dytë e shekullit të 20-të kaloi nën prirjen e përgjithshme të shkencave të aplikuara dhe kibernetike, dhe kjo nënkuptonte një krizë të matematikës së pastër, të gjithë donin të prodhonin, por nuk donin të mendonin, humanistët me gazetarinë e tyre pushtuan sferat matematikore. Shembull: libri “Fifty Entertaining Probabilistic Problems with Solutions” nga American Mosteller, detyra nr. 11:


Zgjidhja e autorit për këtë problem është thjesht një humbje e sensit të përbashkët:

E njëjta situatë është edhe me problemin 25, ku jepen TRI përgjigje kontradiktore.

Por le të kthehemi te shpërndarjet e qëndrueshme. Në pjesën tjetër të artikullit do të përpiqem të tregoj se nuk duhet të ketë vështirësi shtesë kur punoni me ta. Gjegjësisht, ekzistojnë metoda numerike dhe statistikore që ju lejojnë të vlerësoni parametrat, të llogaritni funksionin e shpërndarjes dhe t'i modeloni ato, domethënë të punoni në të njëjtën mënyrë si me çdo shpërndarje tjetër.

Modelimi i variablave të rastësishëm të qëndrueshëm. Meqenëse gjithçka mësohet nga krahasimi, së pari do të kujtoj metodën më të përshtatshme, nga pikëpamja llogaritëse, e gjenerimit të një vlere normale (metoda Box–Muller): nëse janë variablat bazë të rastit (të shpërndara në mënyrë uniforme në )

Ju pëlqeu artikulli? Ndani me miqtë tuaj!