Vlerësimi i gjasave maksimale. Vlerësimi pikësor i parametrave të shpërndarjes

Thelbi i detyrës vlerësim pikësh parametrave

VLERËSIMI PIKOR I PARAMETRAVE TË SHPËRNDARJES

Vlerësimi me pikë përfshin gjetjen e të vetmes vlerë numerike, e cila merret si vlerë e parametrit. Është e këshillueshme që të përcaktohet një vlerësim i tillë në rastet kur vëllimi i ED është mjaft i madh. Për më tepër, nuk ka asnjë koncept të vetëm të një vëllimi të mjaftueshëm të ED, vlera e tij varet nga lloji i parametrit që vlerësohet (kjo çështje do të duhet të kthehet kur studiohen metodat vlerësimi i intervalit parametrat, dhe paraprakisht do të konsiderojmë një mostër të mjaftueshme që përmban të paktën 10 vlera). Kur vëllimi i ED është i vogël, vlerësimet e pikëve mund të ndryshojnë ndjeshëm nga vlerat e vërteta të parametrave, gjë që i bën ato të papërshtatshme për përdorim.

Problemi i vlerësimit të parametrave të pikës V version standard prodhimi është si më poshtë.

Në dispozicion: mostra e vëzhgimeve ( x 1, x 2, …, x n) pas një ndryshoreje të rastësishme X. Madhësia e mostrës n fikse

Forma e njohur e ligjit të shpërndarjes së sasisë X, për shembull, në formën e densitetit të shpërndarjes f(Θ , x), Ku Θ - e panjohur (në rast i përgjithshëm vektori) parametri i shpërndarjes. Parametri është një vlerë jo e rastësishme.

Duhet gjetur një vlerësim Θ* parametri Θ ligji i shpërndarjes.

Kufizimet: Mostra është përfaqësuese.

Ekzistojnë disa metoda për zgjidhjen e problemit të vlerësimit të parametrave të pikës, më të zakonshmet prej të cilave janë metodat e gjasave maksimale, momenteve dhe kuantileve.

Metoda u propozua nga R. Fisher në vitin 1912. Metoda bazohet në studimin e probabilitetit të marrjes së një kampioni vëzhgimesh (x 1 , x 2, ..., x n). Ky probabilitet është i barabartë me

f(x 1, Θ) f(x 2, Θ) … f(x n, Θ) dx 1 dx 2 … dx n.

Dendësia e probabilitetit të përbashkët

L(x 1, x 2 ..., x n; Θ) = f(x 1, Θ) f(x 2, Θ) ... f(x n, Θ),(2.7)

konsiderohet si funksion i parametrit Θ , thirri funksioni i gjasave .

Si vlerësim Θ* parametri Θ duhet marrë vlerën që e bën funksionin e gjasave maksimale. Për të gjetur vlerësimin, është e nevojshme të zëvendësohet në funksionin e gjasave Tq dhe zgjidhni ekuacionin

dL/dΘ* = 0.

Për të thjeshtuar llogaritjet, kalojmë nga funksioni i gjasave në logaritmin e tij ln L. Ky transformim është i lejueshëm, pasi funksioni i gjasave është funksion pozitiv, dhe arrin maksimumin në të njëjtën pikë me logaritmin e tij. Nëse parametri i shpërndarjes sasia vektoriale

Θ* =(q 1, q 2, ..., q n),

pastaj vlerësimet gjasat maksimale gjetur nga sistemi i ekuacioneve


d ln L(q 1, q 2, …, q n) /d q 1 = 0;

d ln L(q 1, q 2, …, q n) /d q 2 = 0;

. . . . . . . . .



d ln L(q 1, q 2, …, q n) /d q n = 0.

Për të kontrolluar që pika optimale korrespondon me maksimumin e funksionit të gjasave, është e nevojshme të gjendet derivati ​​i dytë i këtij funksioni. Dhe nëse derivati ​​i dytë në pikën optimale është negativ, atëherë vlerat e parametrave të gjetur maksimizojnë funksionin.

Pra, gjetja e vlerësimeve të gjasave maksimale përfshin hapat e mëposhtëm: ndërtimi i funksionit të gjasave (logaritmi i tij natyror); diferencimi i një funksioni sipas parametrave të kërkuar dhe përpilimi i një sistemi ekuacionesh; zgjidhja e një sistemi ekuacionesh për të gjetur vlerësime; përcaktimi i derivatit të dytë të një funksioni, kontrollimi i shenjës së tij në pikën optimale të derivatit të parë dhe nxjerrja e përfundimeve.

Zgjidhje. Funksioni i gjasave për një mostër ED të vëllimit n

Funksioni i gjasave të regjistrit

Sistemi i ekuacioneve për gjetjen e vlerësimeve të parametrave

Nga ekuacioni i parë rezulton:

ose në fund

Kështu, mesatarja aritmetike është vlerësimi maksimal i gjasave për pritshmërinë matematikore.

Nga ekuacioni i dytë mund të gjejmë

.

Varianca empirike është e njëanshme. Pas heqjes së kompensimit

Vlerat aktuale vlerësimet e parametrave: m =27,51, s 2 = 0,91.

Për të kontrolluar që vlerësimet e marra maksimizojnë vlerën e funksionit të gjasave, marrim derivatet e dytë

Derivatet e dyte te funksionit ln( L(m, S)) pavarësisht nga vlerat e parametrave më pak se zero Prandaj, vlerat e parametrave të gjetur janë vlerësime maksimale të gjasave.

Metoda e gjasave maksimale na lejon të marrim konsistencë, efektive (nëse ekziston, atëherë zgjidhja që rezulton do të japë vlerësime efektive), vlerësime të mjaftueshme, normalisht të shpërndara asimptotike. Kjo metodë mund të prodhojë vlerësime të njëanshme dhe të paanshme. Paragjykimi mund të eliminohet duke futur korrigjime. Metoda është veçanërisht e dobishme me mostra të vogla.

ndryshore e vazhdueshme e rastësishme me densitet Lloji i densitetit është i njohur, por vlerat e parametrave janë të panjohura. Funksioni i gjasave është një funksion (këtu - një mostër e vëllimit n nga shpërndarja e ndryshores së rastësishme £). Është e lehtë të shihet se funksionit të gjasave mund t'i jepet një kuptim probabilistik, domethënë: konsideroni një vektor të rastësishëm, përbërësit e të cilit janë të pavarur, variabla të rastësishëm të shpërndarë kolektivisht identikisht me ligjin D(z). Atëherë elementi i probabilitetit të vektorit E ka formën d.m.th. Funksioni i gjasave shoqërohet me probabilitetin e marrjes së një kampioni fiks në sekuencën e eksperimenteve P. Ideja kryesore e metodës së gjasave është që, si vlerësime të parametrave A, propozohet të merren vlera të tilla (3) që sigurojnë maksimumin e funksionit të gjasave për një kampion të caktuar fiks, d.m.th. propozohet të konsiderohet mostra e marrë në eksperiment si më e mundshme. Gjetja e vlerësimeve të parametrave pj reduktohet në zgjidhjen e një sistemi k ekuacionesh (k është numri i parametrave të panjohur): Meqenëse funksioni log L ka një maksimum në të njëjtën pikë me funksionin e gjasave, sistemi i ekuacioneve të gjasave (19) është shpesh shkruhen në formën Si vlerësime të parametrave të panjohur Duhet të merren zgjidhje të sistemit (19) ose (20) që varen vërtet nga kampioni dhe nuk janë konstante. Në rastin kur £ është diskrete me një seri shpërndarjeje, funksioni i gjasave quhet funksion dhe vlerësimet kërkohen si zgjidhje për sistemin ose ekuivalentin e gjasave maksimale. Duhet të theksohet se metoda e gjasave maksimale çon në më shumë llogaritjet komplekse sesa metoda e momenteve, por teorikisht është më efektive, pasi vlerësimet maksimale të gjasave devijojnë më pak nga vlerat e vërteta të parametrave të vlerësuar sesa vlerësimet e marra duke përdorur metodën e momenteve. Për shpërndarjet që hasen më shpesh në aplikacione, vlerësimet e parametrave të marra duke përdorur metodën e momenteve dhe metodën e gjasave maksimale përkojnë në shumicën e rasteve. Prshir 1. Devijimi (i madhësisë së pjesës nga vlera nominale është një variabël e rastësishme e shpërndarë normalisht. Kërkohet të përcaktohet gabimi sistematik dhe varianca e devijimit nga kampioni. M Sipas kushtit (është një variabël e rastësishme e shpërndarë normalisht me pritje matematikore (gabim sistematik) dhe varianca që do të vlerësohet nga një kampion i madhësisë n: X\>...yXn. Në këtë rast, funksioni Likelihood System (19) ka formën Pra, duke përjashtuar zgjidhjet që nuk varen nga Xx, marrim d.m.th., vlerësimet maksimale të gjasave në këtë rast përkojnë me mesataren empirike dhe variancën tashmë të njohur për ne > Shembulli 2. Vlerësoni parametrin /i nga variabli i rastësishëm i shpërndarë në mënyrë eksponenciale. 4 Funksioni i gjasave ka formën Ekuacioni i gjasave na çon në një zgjidhje që përkon me vlerësimin e të njëjtit parametër të marrë me metodën e momenteve, shih (17). ^ Shembulli 3. Duke përdorur metodën e gjasave maksimale, vlerësoni probabilitetin e shfaqjes së një steme nëse, gjatë dhjetë hedhjeve të një monedhe, stema u shfaq 8 herë. -4 Le të jetë e barabartë probabiliteti për t'u vlerësuar me p. Le të shqyrtojmë ndryshore e rastësishme(me nje seri shperndarjeje. Funksioni i gjasave (21) ka formën Metoda e gjasave maksimale Ekuacioni jep si vlerësim të probabilitetit të panjohur p shpeshtësinë e paraqitjes së stemës në eksperiment. Përmbyllja e diskutimit të metodave për gjetjen vlerësime, theksojmë se, edhe duke pasur një sasi shumë të madhe të dhënash eksperimentale, ne ende nuk mund të tregojmë vlerën e saktë parametri që vlerësohet, për më tepër, siç është vënë re në mënyrë të përsëritur, vlerësimet që marrim janë afër vlerat e vërteta parametrat e vlerësuar vetëm "mesatarisht" ose "në shumicën e rasteve". Prandaj e rëndësishme problem statistikor, të cilën do ta shqyrtojmë në vijim, është detyra e përcaktimit të saktësisë dhe besueshmërisë së vlerësimit që bëjmë.

Taksonomisti i njohur Joe Felsenstein (1978) ishte i pari që propozoi që teoritë filogjenetike duhet të vlerësohen mbi një bazë joparsimologjike.

kërkimore, por me anë të statistikave matematikore. Si rezultat, u zhvillua metoda e gjasave maksimale. .

Kjo metodë bazohet në njohuritë e mëparshme rreth mënyrat e mundshme evolucioni, pra kërkon krijimin e një modeli të ndryshimeve në tipare përpara analizës. Pikërisht për të ndërtuar këto modele përdoren ligjet e statistikave.

Nën e besueshme kuptohet probabiliteti i vëzhgimit të të dhënave nëse pranohet një model i caktuar ngjarjesh. Modele te ndryshme mund të bëjë pak a shumë të mundshme të dhënat e vëzhguara. Për shembull, nëse hidhni një monedhë dhe merrni koka vetëm një në njëqind herë, atëherë mund të supozoni se monedha është e gabuar. Nëse e pranoni këtë model, gjasat e rezultatit të marrë do të jenë mjaft të larta. Nëse përdorni modelin se monedha është e gabuar, atëherë mund të prisni të shihni koka në pesëdhjetë raste dhe jo në një. Të marrësh vetëm një kokë në 100 hedhje të një monedhe të keqe është statistikisht e pamundur. Me fjalë të tjera, probabiliteti i marrjes së një rezultati një kokë në njëqind bishta është shumë i ulët në modelin e një monedhe pa defekt.

Besueshmëria është sasia matematikore. Zakonisht llogaritet duke përdorur formulën:

ku Pr(D|H) është probabiliteti i marrjes së të dhënave D nëse hipoteza H pranohet . Shiriti vertikal në formulë lexon "për një të dhënë". Meqenëse L shpesh rezulton të jetë një vlerë e vogël, studimet zakonisht përdorin logaritmi natyror besueshmërinë.

Është e rëndësishme të bëhet dallimi midis probabilitetit të marrjes së të dhënave të vëzhguara dhe probabilitetit që modeli i pranuar i ngjarjeve të jetë i saktë. Mundësia e të dhënave nuk thotë asgjë për gjasat e vetë modelit. Filozof-biologu E. Sober përdori shembulli tjetër në mënyrë që të bëhet i qartë ky dallim. Imagjinoni sikur dëgjoni një zhurmë të madhe në dhomën sipër jush. Ju mund të supozoni se kjo është shkaktuar nga gnomes që luajnë bowling në papafingo. Për këtë model, vëzhgimi juaj (një zhurmë e madhe sipër jush) ka një probabilitet të lartë (nëse xhuxhët në të vërtetë do të lundronin sipër jush, pothuajse me siguri do ta dëgjonit atë). Megjithatë, gjasat që hipoteza juaj të jetë e vërtetë, domethënë që ishin xhuxhët ata që shkaktuan zhurmën, është diçka krejtësisht tjetër. Ata pothuajse me siguri nuk ishin xhuxha. Pra, në këtë rast, hipoteza juaj i jep të dhënat me besueshmëri të lartë, por në vetvete shkallën më të lartë nuk ka gjasa.

Duke përdorur këtë sistem me arsyetim, metoda e gjasave maksimale bën të mundur vlerësimin statistikor të pemëve filogjenetike të marra duke përdorur kladistikët tradicionalë. Në thelb, kjo metodë përfundon

kërkon për kladogramin që ofron probabilitetin më të lartë të grupit të të dhënave të disponueshme.

Le të shqyrtojmë një shembull që ilustron përdorimin e metodës së gjasave maksimale. Le të supozojmë se kemi katër takson për të cilat janë vendosur sekuencat nukleotide të një vendi të caktuar të ADN-së (Fig. 16).

Nëse modeli supozon mundësinë e rikthimit, atëherë ne mund ta çrrënjosim këtë pemë në çdo nyje. Një nga pemët rrënjësore të mundshme është paraqitur në Fig. 17.2.

Ne nuk e dimë se cilat nukleotide ishin të pranishme në vendndodhjen në fjalë paraardhësit e përbashkët takson 1-4 (këta paraardhës korrespondojnë me nyjet X dhe Y në kladogram). Për secilën prej këtyre nyjeve, ka katër variante nukleotide që mund të kenë qenë të pranishme atje në forma stërgjyshore, duke rezultuar në 16 skenarë filogjenetikë që çojnë në pemën 2. Një nga këta skenarë është paraqitur në Fig. 17.3.

Probabiliteti i këtij skenari mund të përcaktohet me formulën:

ku P A është probabiliteti i pranisë së nukleotidit A në rrënjën e pemës, e cila është e barabartë me frekuencën mesatare të nukleotidit A (në rastin e përgjithshëm = 0,25); P AG – probabiliteti i zëvendësimit të A me G; P AC – probabiliteti i zëvendësimit të A me C; P AT – probabiliteti i zëvendësimit të A me T; dy shumëzuesit e fundit janë probabiliteti që nukleotidi T të ruhet në nyjet X dhe Y, përkatësisht.

Një tjetër skenar i mundshem, e cila ju lejon të merrni të njëjtat të dhëna, është paraqitur në Fig. 17.4. Meqenëse ekzistojnë 16 skenarë të tillë, probabiliteti i secilit prej tyre mund të përcaktohet, dhe shuma e këtyre probabiliteteve do të jetë probabiliteti i pemës së paraqitur në Fig. 17.2:

Ku pema P 2 është probabiliteti i vëzhgimit të të dhënave në vendndodhjen e treguar nga një yll për pemën 2.

Probabiliteti i vëzhgimit të të gjitha të dhënave në të gjitha lokuset e një sekuence të caktuar është produkti i probabiliteteve për çdo vendburim i nga 1 në N:

Meqenëse këto vlera janë shumë të vogla, përdoret një tregues tjetër - logaritmi natyror i gjasave lnL i për secilin lokus i. Në këtë rast, gjasat e log-ut të pemës është shuma e gjasave të log-it për çdo vend:

Vlera e pemës lnL është logaritmi i mundësisë së vëzhgimit të të dhënave kur zgjedh një model të caktuar evolucionar dhe një pemë me karakteristikën e saj

sekuenca e degëzimit dhe gjatësia e degëve. Programet kompjuterike, e përdorur në metodën e gjasave maksimale (për shembull, paketa kladistike e përmendur tashmë PAUP), kërkoni për një pemë me treguesi maksimal lnL. Diferenca e dyfishuar e gjasave log të dy modeleve 2Δ (ku Δ = lnL pemë A- lnL pemëB) i bindet të njohurës shpërndarje statistikore x 2. Kjo ju lejon të vlerësoni nëse një model është më i mirë se një tjetër. Kjo e bën mundësinë maksimale një mjet të fuqishëm për testimin e hipotezave.

Në rastin e katër taksave, llogaritjet lnL kërkohen për 15 pemë. Në numër i madh Rezulton të jetë e pamundur të vlerësohen të gjitha taksat, kështu që përdoren metoda heuristike për kërkimin (shih më lart).

Në shembullin e konsideruar, ne kemi përdorur vlerat e probabiliteteve të zëvendësimit (zëvendësimit) të nukleotideve në procesin e evolucionit. Llogaritja e këtyre probabiliteteve është në vetvete një detyrë statistikore. Për të rindërtuar pemën evolucionare, duhet të bëjmë supozime të caktuara në lidhje me procesin e zëvendësimit dhe t'i shprehim këto supozime në formën e një modeli.

Në modelin më të thjeshtë, probabilitetet e zëvendësimit të çdo nukleotidi me ndonjë nukleotid tjetër konsiderohen të barabarta. Kjo model i thjeshtë ka vetëm një parametër - shkallën e zëvendësimit dhe njihet si Modeli Jukes-Cantor me një parametra ose JC (Jukes dhe Cantor, 1969). Kur përdorim këtë model, duhet të dimë shpejtësinë me të cilën ndodh zëvendësimi i nukleotideve. Nëse e dimë këtë në një moment në kohë t= 0 në një vend të caktuar ka një nukleotid G, atëherë mund të llogarisim probabilitetin që në këtë vend pas një periudhe të caktuar kohore t do të mbetet nukleotidi G, dhe probabiliteti që ky vend të zëvendësohet nga një nukleotid tjetër, për shembull A. Këto probabilitete shënohen përkatësisht si P(gg) dhe P(ga). Nëse shpejtësia e zëvendësimit është e barabartë me një vlerë α për njësi të kohës, atëherë

Meqenëse, sipas modelit me një parametër, çdo zëvendësim është po aq i mundshëm, një deklaratë më e përgjithshme do të dukej kështu:

Janë zhvilluar gjithashtu modele më komplekse evolucionare. Vëzhgime empirike tregojnë se mund të ndodhin disa zëvendësime

më shpesh se të tjerët. Zëvendësimet, si rezultat i të cilave një purinë zëvendësohet nga një purinë tjetër, quhen tranzicionet, dhe quhen zevendesimet e purines me pirimidine ose pirimidines me purine transversionet. Mund të pritet që transversionet të ndodhin më shpesh sesa tranzicionet, pasi vetëm një në tre zëvendësime të mundshme për çdo nukleotid është një tranzicion. Megjithatë, zakonisht ndodh e kundërta: tranzicionet priren të ndodhin më shpesh sesa transversionet. Kjo është veçanërisht e vërtetë për ADN-në mitokondriale.

Një arsye tjetër që disa zëvendësime të nukleotideve ndodhin më shpesh se të tjerët është për shkak të raporteve të pabarabarta të bazës. Për shembull, ADN-ja mitokondriale e insekteve është më e pasur me adeninë dhe timinë në krahasim me vertebrorët. Nëse disa arsye janë më të zakonshme, mund të presim që disa zëvendësime të ndodhin më shpesh se të tjerët. Për shembull, nëse një sekuencë përmban shumë pak guaninë, zëvendësimi i këtij nukleotidi nuk ka gjasa të ndodhë.

Modelet ndryshojnë në atë që në disa një parametër ose parametra të caktuar (për shembull, raporti i bazave, shkalla e zëvendësimit) mbeten fikse dhe ndryshojnë në të tjerët. Ka dhjetëra modele evolucionare. Më poshtë po ju paraqesim më të famshmit prej tyre.

E përmendur tashmë Modeli Jukes-Cantor (JC). karakterizohet nga fakti se frekuencat bazë janë të njëjta: π A = πC = πG = π T , transversionet dhe kalimet kanë të njëjtat shpejtësi α=β, dhe të gjitha zëvendësimet janë njësoj të mundshme.

Modeli Kimura me dy parametra (K2P). supozon frekuenca të barabarta baza π A =π C =π G =π T , dhe transversionet dhe kalimet kanë shpejtësi të ndryshme α≠β.

Modeli Felsenstein (F81) supozon se frekuencat bazë janë të ndryshme π A ≠π C ≠π G ≠π T , dhe ritmet e zëvendësimit janë të njëjta α=β.

Modeli i përgjithshëm i kthyeshëm (REV) supozon frekuenca të ndryshme bazë π A ≠π C ≠π G ≠π T , dhe të gjashtë palët e zëvendësimeve kanë shpejtësi të ndryshme.

Modelet e përmendura më sipër supozojnë se normat e zëvendësimit janë të njëjta në të gjitha vendet. Megjithatë, modeli gjithashtu mund të marrë parasysh ndryshimet në normat e zëvendësimit në vende të ndryshme. Vlerat e frekuencave bazë dhe normat e zëvendësimit mund të caktohen a priori ose këto vlera mund të merren nga të dhënat duke përdorur programe të veçanta, për shembull PAUP.

Analiza Bayesiane

Metoda e gjasave maksimale vlerëson gjasat e modeleve filogjenetike pasi ato të gjenerohen nga të dhënat e disponueshme. Megjithatë, njohuri modele të përgjithshme evolucioni i një grupi të caktuar bën të mundur krijimin e një serie modelesh më të mundshme të filogjenisë pa përdorimin e të dhënave bazë (për shembull, sekuencat nukleotide). Pasi të merren këto të dhëna, është e mundur të vlerësohet përshtatja midis tyre dhe modeleve të para-ndërtuara dhe të rishqyrtohet mundësia e këtyre modeleve fillestare. Metoda që lejon këtë të bëhet quhet Analiza Bayesiane , dhe është më e reja nga metodat për studimin e filogjenisë (shih. shqyrtim i detajuar: Huelsenbeck et al., 2001).

Sipas terminologjisë standarde, zakonisht quhen probabilitete fillestare probabilitetet e mëparshme (pasi pranohen para se të merren të dhënat) dhe probabilitetet e rishikuara janë a posteriori (pasi llogariten pas marrjes së të dhënave).

Baza matematikore Analiza Bayesian është teorema e Bayes-it, në të cilën probabilitet paraprak pema Pr[ Pemë] dhe gjasat Pr[ Të dhënat|Pema] përdoren për të llogaritur probabilitetin e pasëm të pemës Pr[ Pema|Të dhënat]:

Probabiliteti i pasëm i një peme mund të mendohet si probabiliteti që pema të pasqyrojë rrjedhën e vërtetë të evolucionit. Pema me probabilitetin më të lartë të pasmë zgjidhet si modeli më i mundshëm i filogjenisë. Shpërndarja e pasme e probabilitetit të pemëve llogaritet duke përdorur metoda të modelimit kompjuterik.

Probabiliteti maksimal dhe analiza Bayesian kërkojnë modele evolucionare që përshkruajnë ndryshimet në tipare. Krijimi modele matematikore Evolucioni morfologjik aktualisht nuk është i mundur. Për këtë arsye, metodat statistikore të analizës filogjenetike zbatohen vetëm për të dhënat molekulare.

Dhe të tjerët).

Vlerësimi i gjasave maksimale është i popullarizuar metodë statistikore, i cili përdoret për të krijuar një model statistikor nga të dhënat dhe për të ofruar vlerësime të parametrave të modelit.

Korrespondon me shumë metoda të njohura të vlerësimit në fushën e statistikave. Për shembull, le të themi se jeni të interesuar për rritjen e popullit të Ukrainës. Le të themi se keni të dhëna për lartësinë për një numër njerëzish dhe jo për të gjithë popullsinë. Për më tepër, rritja supozohet të jetë normale sasia e shpërndarë me variancë dhe mesatare të panjohur. Mesatarja dhe varianca e rritjes së mostrës ka më shumë gjasa të jetë mesatarja dhe varianca e të gjithë popullatës.

Për një grup të dhënash fikse dhe bazë model probabilistik, duke përdorur metodën e gjasave maksimale, do të marrim vlerat e parametrave të modelit që i bëjnë të dhënat "më afër" me ato reale. Vlerësimi i gjasave maksimale ofron një mënyrë unike dhe të thjeshtë për të përcaktuar zgjidhjet në rastin e një shpërndarje normale.

Metoda e vlerësimit të gjasave maksimale përdoret për të gamë të gjerë modele statistikore, duke përfshirë:

  • modele lineare dhe modele lineare të përgjithësuara;
  • analiza e faktorëve;
  • modelimi i ekuacioneve strukturore;
  • shumë situata, si pjesë e testimit të hipotezave dhe intervali i besimit formimi;
  • modele me zgjedhje diskrete.

Thelbi i metodës

thirrur vlerësimi maksimal i gjasave parametri Kështu, një vlerësues maksimal i gjasave është një vlerësues që maksimizon funksionin e gjasave duke pasur parasysh një realizim fiks të mostrës.

Shpesh, funksioni log-lihood përdoret në vend të funksionit të gjasave. Meqenëse funksioni rritet në mënyrë monotonike në të gjithë domenin e përkufizimit, maksimumi i çdo funksioni është maksimumi i funksionit dhe anasjelltas. Kështu

,

Nëse funksioni i gjasave është i diferencueshëm, atëherë kusht i nevojshëm ekstrem - barazi me zero të gradientit të tij:

Gjendje e mjaftueshme ekstremi mund të formulohet si definiciteti negativ i Hessian - matrica e derivateve të dytë:

E rëndësishme Për të vlerësuar vetitë e vlerësimeve të metodës së gjasave maksimale, përdoret e ashtuquajtura matricë informacioni, e barabartë sipas përkufizimit:

Në pikën optimale, matrica e informacionit përkon me pritjen matematikore të Hessian, marrë me një shenjë minus:

Vetitë

  • Vlerësimet e gjasave maksimale, në përgjithësi, mund të jenë të njëanshme (shih shembujt), por janë të qëndrueshme. asimptotikisht efikase dhe asimptotike normale vlerësimet. Normaliteti asimptotik do të thotë se

ku është matrica e informacionit asimptotik

Efikasiteti asimptotik do të thotë që matrica e kovariancës asimptotike është një kufi më i ulët për të gjithë vlerësuesit e qëndrueshëm asimptotikisht normalë.

Shembuj

Barazia e fundit mund të rishkruhet si:

ku , nga ku shihet se funksioni i gjasave arrin maksimumin e tij në pikën . Kështu

. .

Për të gjetur maksimumin e tij, ne barazojmë derivatet e pjesshme me zero:

- mesatarja e mostrës, dhe - varianca e mostrës.

Metoda e probabilitetit maksimal të kushtëzuar

Mundësia maksimale e kushtëzuar (ML e kushtëzuar) përdoret në modelet e regresionit. Thelbi i metodës është se nuk është i plotë shpërndarja e përbashkët të gjitha variablat (të varur dhe regresorët), por vetëm kushtëzuar shpërndarja e ndryshores së varur ndërmjet faktorëve, që është, në fakt, shpërndarja gabime të rastësishme modeli i regresionit. Funksion i plotë vërtetësia është produkti" funksioni i kushtëzuar gjasat” dhe dendësia e shpërndarjes së faktorëve. MMP e kushtëzuar është ekuivalente versioni i plotë MMP në rastin kur shpërndarja e faktorëve nuk varet në asnjë mënyrë nga parametrat e vlerësuar. Kjo gjendje shpesh shkelet në modelet e serive kohore, siç është modeli autoregresiv. NË në këtë rast, regresorët janë vlerat e kaluara të ndryshores së varur, që do të thotë se vlerat e tyre gjithashtu i binden të njëjtit model AR, domethënë shpërndarja e regresorëve varet nga parametrat e vlerësuar. Në raste të tilla, rezultatet e aplikimit të kushtëzuar dhe metodë e plotë gjasat maksimale do të ndryshojnë.

Shihni gjithashtu

Shënime

Letërsia

  • Magnus Y.R., Katyshev P.K., Peresetsky A.A. Ekonometria. Kursi fillestar. - M.: Delo, 2007. - 504 f. - ISBN 978-5-7749-0473-0

Fondacioni Wikimedia.

2010.



Ju pëlqeu artikulli? Ndani me miqtë tuaj!