Didžiausios tikimybės įvertinimas. Paskirstymo parametrų taškinis įvertinimas

Užduoties esmė taško įvertinimas parametrus

PASKIRSTYMO PARAMETRŲ TAŠKAS ĮVERTINIMAS

Taško įvertinimas apima vienintelio radimą skaitinė reikšmė, kuri laikoma parametro verte. Tokį įvertinimą patartina nustatyti tais atvejais, kai ED tūris yra pakankamai didelis. Be to, nėra vienos pakankamo ED tūrio sąvokos, jo vertė priklauso nuo vertinamo parametro tipo (prie šio klausimo grįšime tiriant metodus; intervalo įvertinimas parametrus, o preliminariai apsvarstysime pakankamą imtį, kurioje yra bent 10 reikšmių). Kai ED tūris yra mažas, taškiniai įverčiai gali labai skirtis nuo tikrųjų parametrų verčių, todėl jie netinkami naudoti.

Taško parametrų įvertinimo problema V standartinė versija gamyba yra tokia.

Galima: stebėjimų pavyzdys ( x 1 , x 2 , …, x n) už atsitiktinio dydžio X. Mėginio dydis n pataisyta

Kiekybinio paskirstymo dėsnio forma yra žinoma X, pavyzdžiui, pasiskirstymo tankio forma f(Θ , x), Kur Θ – nežinomas (in bendras atvejis vektorius) pasiskirstymo parametras. Parametras yra neatsitiktinė reikšmė.

Reikia rasti sąmatą Θ* parametras Θ paskirstymo įstatymas.

Apribojimai: pavyzdys yra reprezentatyvus.

Egzistuoja keli taškinių parametrų vertinimo problemos sprendimo būdai, iš kurių dažniausiai naudojami maksimalios tikimybės, momentų ir kvantilių metodai.

Metodą pasiūlė R. Fisheris 1912 m. Metodas pagrįstas stebėjimų imties gavimo tikimybės tyrimu. (x 1 , x 2, …, x n). Ši tikimybė yra lygi

f(x 1, Θ) f(x 2, Θ) … f(x n, Θ) dx 1 dx 2 … dx n.

Sąnario tikimybės tankis

L(x 1, x 2 ..., x n; Θ) = f(x 1, Θ) f(x 2, Θ) ... f(x n, Θ),(2.7)

laikoma parametro funkcija Θ , paskambino tikimybės funkcija .

Kaip įvertinimas Θ* parametras Θ reikėtų paimti reikšmę, kuri padidina tikimybės funkciją. Norint rasti įvertinimą, reikia pakeisti tikimybės funkcijoje Tįjungta q ir išspręskite lygtį

dl/dΘ* = 0.

Norėdami supaprastinti skaičiavimus, nuo tikimybės funkcijos pereiname prie jos logaritmo ln L. Ši transformacija yra leistina, nes tikimybės funkcija yra teigiama funkcija, ir jis pasiekia maksimumą tame pačiame taške kaip ir jo logaritmas. Jei paskirstymo parametras vektorinis kiekis

Θ* =(q 1, q 2, …, q n),

tada sąmatos didžiausia tikimybė rasta iš lygčių sistemos


d ln L(q 1, q 2, …, q n) /d q 1 = 0;

d ln L(q 1, q 2, …, q n) /d q 2 = 0;

. . . . . . . . .



d ln L(q 1, q 2, …, q n) /d q n = 0.

Norint patikrinti, ar optimalus taškas atitinka tikimybės funkcijos maksimumą, reikia rasti antrąją šios funkcijos išvestinę. Ir jei antroji išvestinė optimaliame taške yra neigiama, tada rastos parametrų reikšmės maksimaliai padidina funkciją.

Taigi, ieškant maksimalios tikimybės įverčių, reikia atlikti šiuos veiksmus: tikimybės funkcijos (jos natūraliojo logaritmo) sukūrimas; funkcijos diferencijavimas pagal reikiamus parametrus ir lygčių sistemos sudarymas; lygčių sistemos sprendimas įverčiams rasti; funkcijos antrosios išvestinės nustatymas, jos ženklo patikrinimas optimaliame pirmosios išvestinės taške ir išvadų darymas.

Sprendimas. Tikimybės funkcija ED tūrio mėginiui n

Žurnalo tikimybės funkcija

Lygčių sistema parametrų įverčiams rasti

Iš pirmosios lygties išplaukia:

arba pagaliau

Taigi aritmetinis vidurkis yra didžiausias matematinio lūkesčio tikimybės įvertinimas.

Iš antrosios lygties galime rasti

.

Empirinė dispersija yra šališka. Pašalinus ofsetą

Faktinės vertės parametrų įvertinimai: m =27,51, s 2 = 0,91.

Norėdami patikrinti, ar gauti įverčiai maksimaliai padidina tikimybės funkcijos reikšmę, imame antrąsias išvestines

Funkcijos ln() antrosios išvestinės L(m,S)) neatsižvelgiant į parametrų reikšmes mažiau nei nulis Todėl rastos parametrų reikšmės yra didžiausios tikimybės įverčiai.

Didžiausios tikimybės metodas leidžia mums gauti nuoseklų, veiksmingą (jei toks yra, tada gautas sprendimas duos veiksmingi vertinimai), pakankami, asimptotiškai normaliai pasiskirstę įverčiai. Šis metodas gali sudaryti ir šališkus, ir nešališkus įvertinimus. Šališkumas gali būti pašalintas įvedant pataisymus. Šis metodas ypač naudingas mažiems mėginiams.

ištisinis atsitiktinis kintamasis su tankiu Tankio tipas žinomas, bet parametrų reikšmės nežinomos Tikimybės funkcija yra funkcija (čia - n tūrio pavyzdys iš atsitiktinio dydžio £ pasiskirstymo). Nesunku pastebėti, kad tikimybės funkcijai gali būti suteikta tikimybinė reikšmė, būtent: apsvarstykite atsitiktinį vektorių, kurio komponentai yra nepriklausomi, kolektyviai identiškai pasiskirstę atsitiktiniai dydžiai su dėsniu D(z). Tada vektoriaus E tikimybinis elementas turi formą t.y. Tikimybės funkcija siejama su tikimybe gauti fiksuotą pavyzdį eksperimentų sekoje P. Pagrindinė tikimybės metodo idėja yra ta, kad kaip parametrų A įverčius, siūloma paimti tokias vertes (3). kurios suteikia tam tikros fiksuotos imties tikimybės funkcijos maksimumą, ty eksperimento metu gautą imtį siūloma laikyti labiausiai tikėtinu. Parametrų pj įverčių radimas redukuojamas į k lygčių sistemos sprendimą (k yra nežinomų parametrų skaičius): Kadangi funkcija log L turi maksimumą tame pačiame taške kaip tikimybės funkcija, tikimybės lygčių sistema (19) yra dažnai rašoma forma Kaip nežinomų parametrų įverčiai Reikėtų imti (19) arba (20) sistemos sprendinius, kurie tikrai priklauso nuo imties ir nėra pastovūs. Tuo atveju, kai £ yra diskreti su pasiskirstymo eilute, tikimybės funkcija vadinama funkcija ir ieškoma įverčių kaip didžiausios tikimybės metodo arba ekvivalento. Reikėtų pažymėti, kad didžiausios tikimybės metodas lemia daugiau sudėtingi skaičiavimai nei momentų metodas, tačiau teoriškai jis yra efektyvesnis, nes didžiausios tikimybės įverčiai mažiau nukrypsta nuo tikrųjų įvertintų parametrų verčių nei įverčiai, gauti naudojant momentų metodą. Paskirstymams, su kuriais dažniausiai susiduriama programose, parametrų įverčiai, gauti naudojant momentų metodą ir didžiausios tikimybės metodą, daugeliu atvejų sutampa. Prshir 1. Nuokrypis (dalies dydžio nuo vardinės vertės yra normaliai paskirstytas atsitiktinis dydis. Reikia nustatyti nuokrypio nuo imties sisteminę paklaidą ir dispersiją. M Pagal sąlygą (yra normaliai paskirstytas atsitiktinis dydis su matematinis lūkestis (sisteminė klaida) ir dispersija, kurią reikia įvertinti iš n dydžio imties: X\>...yXn. Šiuo atveju Tikimybės funkcijos Sistema (19) turi formą Taigi, neįskaitant sprendinių, kurie nepriklauso nuo Xx, gauname, t.y. maksimalios tikimybės įverčiai šiuo atveju sutampa su mums jau žinomu empiriniu vidurkiu ir dispersija > 2 pavyzdys. Įvertinkite parametrą /i iš imties eksponentiškai pasiskirstyto atsitiktinio kintamojo. 4 Tikimybės funkcija turi formą Tikimybės lygtis veda į sprendimą, kuris sutampa su to paties parametro įverčiu, gautu momentų metodu, žr. (17). ^ 3 pavyzdys. Naudodami didžiausios tikimybės metodą, įvertinkite herbo atsiradimo tikimybę, jei per dešimt monetos metimų herbas pasirodytų 8 kartus. -4 Tegul tikimybė, kurią reikia įvertinti, lygi p. Pasvarstykime atsitiktinis kintamasis(su pasiskirstymo eilute. Tikimybės funkcija (21) turi formą Maksimalios tikimybės metodas Lygtyje kaip nežinomos tikimybės p įvertis pateikiamas herbo atsiradimo eksperimente dažnis. Baigiant suradimo metodų aptarimą apskaičiavimais, pabrėžiame, kad net ir turėdami labai daug eksperimentinių duomenų, vis tiek negalime nurodyti tikslią vertę be to, kaip jau ne kartą buvo pažymėta, gaunami įverčiai yra artimi tikrosios vertybės parametrai vertinami tik „vidutiniškai“ arba „daugeliu atvejų“. Todėl svarbu statistinė problema, kurį apsvarstysime toliau, yra mūsų atliekamo vertinimo tikslumo ir patikimumo nustatymo užduotis.

Garsus taksonomas Joe Felsensteinas (1978) pirmasis pasiūlė, kad filogenetinės teorijos turėtų būti vertinamos ne parsimologiniu pagrindu.

tyrimais, bet pasitelkiant matematinę statistiką. Dėl to buvo sukurtas didžiausios tikimybės metodas. .

Šis metodas pagrįstas išankstinėmis žiniomis apie galimi būdai evoliucija, tai yra, prieš analizę reikia sukurti požymių pokyčių modelį. Būtent šiems modeliams sukurti naudojami statistikos dėsniai.

Pagal tikėtina suprantama duomenų stebėjimo tikimybė, jei priimamas tam tikras įvykių modelis. Įvairūs modeliai gali padaryti stebimus duomenis daugiau ar mažiau tikėtinus. Pavyzdžiui, jei išmetate monetą ir gaunate tik vieną galvutę iš šimto, galite manyti, kad moneta yra sugedusi. Jei priimsite šį modelį, gauto rezultato tikimybė bus gana didelė. Jei laikysitės modelio, kad moneta yra sugedusi, galite tikėtis, kad galvutės bus penkiasdešimties atvejų, o ne viena. Statistiškai mažai tikėtina, kad iš 100 blogos monetos išmetimų gausite tik vieną galvą. Kitaip tariant, sugedusio monetos modelio tikimybė gauti rezultatą – viena galva iš šimto uodegų yra labai maža.

Patikimumas yra matematinis dydis. Paprastai jis apskaičiuojamas pagal formulę:

čia Pr(D|H) yra duomenų D gavimo tikimybė, jei priimama H hipotezė . Vertikali formulės juosta rašoma „tam tikram“. Kadangi L dažnai pasirodo esanti maža reikšmė, tyrimai dažniausiai naudojami natūralusis logaritmas patikimumas.

Labai svarbu atskirti tikimybę gauti stebimus duomenis ir tikimybę, kad priimtas įvykių modelis yra teisingas. Duomenų tikimybė nieko nesako apie paties modelio tikimybę. Filosofas-biologas E. Soberas naudojo sekantis pavyzdys kad šis skirtumas būtų aiškus. Įsivaizduokite, kad virš jūsų esančiame kambaryje girdite didelį triukšmą. Galite manyti, kad tai sukelia nykštukai, žaidžiantys boulingą palėpėje. Šio modelio atveju jūsų stebėjimas (garsus triukšmas virš jūsų) yra labai tikėtinas (jei nykštukai iš tikrųjų boulinguotų virš jūsų, jūs beveik neabejotinai tai išgirstumėte). Tačiau tikimybė, kad jūsų hipotezė yra teisinga, tai yra, kad triukšmą sukėlė nykštukai, yra visai kas kita. Beveik neabejotinai jie nebuvo nykštukai. Taigi šiuo atveju jūsų hipotezė suteikia duomenis labai patikimai, bet savaime aukščiausias laipsnis mažai tikėtina.

Naudojant šią sistemą samprotavimus, maksimalios tikimybės metodas leidžia statistiškai įvertinti filogenetinius medžius, gautus naudojant tradicinę kladistiką. Iš esmės šis metodas daro išvadą

ieško kladogramos, kuri suteikia didžiausią turimo duomenų rinkinio tikimybę.

Panagrinėkime pavyzdį, iliustruojantį didžiausios tikimybės metodo naudojimą. Tarkime, kad turime keturis taksonus, kuriems nustatytos tam tikros DNR vietos nukleotidų sekos (16 pav.).

Jei modelis numato reversijų galimybę, mes galime įšaknyti šį medį bet kuriame mazge. Vienas iš galimų šaknų medžių parodytas fig. 17.2.

Mes nežinome, kurie nukleotidai buvo nagrinėjamame lokuse bendri protėviai taksonai 1-4 (šie protėviai atitinka kladogramos mazgus X ir Y). Kiekviename iš šių mazgų yra keturi nukleotidų variantai, kurie galėjo būti ten protėvių formomis, todėl susidaro 16 filogenetinių scenarijų, vedančių į medį 2. Vienas iš šių scenarijų pavaizduotas Fig. 17.3.

Šio scenarijaus tikimybę galima nustatyti pagal formulę:

čia P A – nukleotido A buvimo medžio šaknyje tikimybė, kuri lygi vidutiniam nukleotido A dažniui (bendruoju atveju = 0,25); P AG – tikimybė A pakeisti G; P AC – tikimybė A pakeisti C; P AT – tikimybė A pakeisti T; paskutiniai du veiksniai yra tikimybė, kad nukleotidas T bus saugomas atitinkamai X ir Y mazguose.

Kitas galimas scenarijus, kuri leidžia gauti tuos pačius duomenis, parodyta fig. 17.4. Kadangi yra 16 tokių scenarijų, galima nustatyti kiekvieno iš jų tikimybę, o šių tikimybių suma bus medžio, parodyto Fig., tikimybė. 17.2:

Kur P medis 2 yra tikimybė, kad duomenys bus stebimi vietoje, pažymėtoje 2 medžio žvaigždute.

Tikimybė stebėti visus duomenis visuose tam tikros sekos lokusuose yra kiekvieno lokuso i tikimybių sandauga nuo 1 iki N:

Kadangi šios reikšmės yra labai mažos, naudojamas kitas rodiklis - kiekvieno lokuso i tikimybės natūralusis logaritmas lnL i. Šiuo atveju medžio log-tikimybė yra kiekvieno lokuso log-tikimybių suma:

LnL medžio reikšmė yra duomenų stebėjimo tikimybės logaritmas renkantis tam tikrą evoliucinį modelį ir medį su jo charakteristika.

šakojimosi seka ir šakos ilgis. Kompiuterinės programos, naudojamas maksimalios tikimybės metodu (pvz., jau minėtas kladistinis paketas PAUP), ieškokite medžio su maksimalus indikatorius lnL. Dviejų modelių 2Δ (kur Δ = lnL medis A- lnL medisB) dvigubas loginių tikimybių skirtumas paklūsta žinomam statistinis pasiskirstymas x 2. Tai leidžia įvertinti, ar vienas modelis patikimai geresnis už kitą. Dėl to didžiausia tikimybė yra galinga hipotezių tikrinimo priemonė.

Keturių taksonų atveju lnL skaičiavimai reikalingi 15 medžių. At didelis skaičius Pasirodo, visų taksonų įvertinti neįmanoma, todėl paieškai naudojami euristiniai metodai (žr. aukščiau).

Nagrinėjamame pavyzdyje naudojome nukleotidų pakeitimo (pakeitimo) tikimybių reikšmes evoliucijos procese. Šių tikimybių apskaičiavimas yra statistinis uždavinys. Norėdami atkurti evoliucinį medį, turime padaryti tam tikras prielaidas apie pakeitimo procesą ir išreikšti šias prielaidas modelio forma.

Paprasčiausiame modelyje tikimybė pakeisti bet kurį nukleotidą bet kuriuo kitu nukleotidu laikoma lygiaverte. Tai paprastas modelis turi tik vieną parametrą – pakeitimo greitį ir yra žinomas kaip vieno parametro Jukes-Cantor modelis arba JC (Jukes ir Cantor, 1969). Naudodami šį modelį turime žinoti nukleotidų pakeitimo greitį. Jei žinome, kad tam tikru momentu t= 0 tam tikroje vietoje yra nukleotidas G, tada galime apskaičiuoti tikimybę, kad šioje vietoje po tam tikro laiko t išliks nukleotidas G, ir tikimybę, kad ši vieta bus pakeista kitu nukleotidu, pvz. A. Šios tikimybės žymimos atitinkamai P(gg) ir P(ga). Jei pakeitimo greitis yra lygus kokiai nors reikšmei α per laiko vienetą, tada

Kadangi pagal vieno parametro modelį bet kokie pakeitimai yra vienodai tikėtini, bendresnis teiginys atrodytų taip:

Taip pat buvo sukurti sudėtingesni evoliuciniai modeliai. Empiriniai stebėjimai rodo, kad gali atsirasti kai kurių pakaitalų

dažniau nei kiti. Vadinami pakaitalai, dėl kurių vienas purinas pakeičiamas kitu purinu perėjimai, ir vadinami purino pakeitimai pirimidinu arba pirimidino pakeitimai purinu transversijos. Galima tikėtis, kad transversijos įvyksta dažniau nei perėjimai, nes tik vienas iš trijų galimų bet kurio nukleotido pakeitimų yra perėjimas. Tačiau dažniausiai atsitinka priešingai: perėjimai būna dažniau nei transversijos. Tai ypač pasakytina apie mitochondrijų DNR.

Kita priežastis, dėl kurios kai kurie nukleotidų pakaitalai vyksta dažniau nei kiti, yra dėl nevienodo bazių santykio. Pavyzdžiui, vabzdžių mitochondrijų DNR, palyginti su stuburiniais, yra turtingesnė adeninu ir timinu. Jei kai kurios priežastys yra dažnesnės, galime tikėtis, kad kai kurie pakeitimai įvyks dažniau nei kiti. Pavyzdžiui, jei sekoje yra labai mažai guanino, šio nukleotido pakeitimas mažai tikėtinas.

Modeliai skiriasi tuo, kad kai kuriuose tam tikras parametras ar parametrai (pavyzdžiui, bazių santykis, pakeitimo greitis) išlieka fiksuoti, o kituose kinta. Yra dešimtys evoliucinių modelių. Žemiau pateikiame garsiausius iš jų.

Jau minėta Jukes-Cantor (JC) modelis pasižymi tuo, kad baziniai dažniai yra vienodi: π A = πC = π G = π T , transversijos ir perėjimai turi tuos pačius greičius α=β, o visi pakaitalai yra vienodai tikėtini.

Kimura dviejų parametrų (K2P) modelis daro prielaidą vienodais dažniais bazės π A =π C =π G =π T , o transversijos ir perėjimai turi skirtingi greičiai α≠β.

Felsenstein modelis (F81) daroma prielaida, kad baziniai dažniai yra skirtingi π A ≠π C ≠π G ≠π T , o pakeitimo laipsniai yra vienodi α=β.

Bendras apverčiamas modelis (REV) priima skirtingus bazinius dažnius π A ≠π C ≠π G ≠π T , ir visos šešios pakeitimų poros turi skirtingą greitį.

Pirmiau minėti modeliai daro prielaidą, kad pakeitimo rodikliai yra vienodi visose svetainėse. Tačiau modelyje taip pat galima atsižvelgti į pakeitimo dažnių skirtumus įvairiose vietose. Bazinių dažnių ir pakeitimo dažnių reikšmės gali būti priskirtos a priori arba šias reikšmes galima gauti iš duomenų naudojant specialios programos, pavyzdžiui, PAUP.

Bajeso analizė

Didžiausios tikimybės metodas įvertina filogenetinių modelių tikimybę po to, kai jie buvo sukurti iš turimų duomenų. Tačiau žinios bendrus modelius tam tikros grupės evoliucija leidžia sukurti labiausiai tikėtinų filogenezės modelių seriją nenaudojant pagrindinių duomenų (pavyzdžiui, nukleotidų sekų). Gavus šiuos duomenis, galima įvertinti jų ir iš anksto sukurtų modelių atitikimą bei persvarstyti šių pradinių modelių tikimybę. Metodas, leidžiantis tai padaryti, vadinamas Bajeso analizė , ir yra naujausias iš filogenijos tyrimo metodų (žr. išsami apžvalga: Huelsenbeck ir kt., 2001).

Pagal standartinę terminologiją pradinės tikimybės paprastai vadinamos išankstinės tikimybės (nes jie priimami prieš gaunant duomenis), o patikslintos tikimybės yra a posteriori (nes jie skaičiuojami gavus duomenis).

Matematinis pagrindas Bajeso analizė yra Bajeso teorema, kurioje išankstinė tikimybė medis Pr[ Medis] ir tikimybė Pr[ Data|Medis] yra naudojami apskaičiuojant užpakalinę medžio tikimybę Pr[ Medis|Duomenys]:

Užpakalinė medžio tikimybė gali būti laikoma tikimybe, kad medis atspindi tikrąją evoliucijos eigą. Labiausiai tikėtinu filogenezės modeliu pasirenkamas medis, turintis didžiausią užpakalinę tikimybę. Medžių užpakalinis tikimybių pasiskirstymas apskaičiuojamas kompiuterinio modeliavimo metodais.

Didžiausiai tikimybei ir Bajeso analizei reikalingi evoliuciniai modeliai, apibūdinantys bruožų pokyčius. Kūrimas matematiniai modeliai morfologinė evoliucija šiuo metu neįmanoma. Dėl šios priežasties statistiniai filogenetinės analizės metodai taikomi tik molekuliniams duomenims.

Ir kiti).

Populiarus yra didžiausios tikimybės įvertinimas statistinis metodas, kuris naudojamas kuriant statistinį modelį iš duomenų ir pateikiant modelio parametrų įverčius.

Atitinka daugelį statistikos srityje žinomų vertinimo metodų. Pavyzdžiui, tarkime, kad jus domina Ukrainos žmonių augimas. Tarkime, kad turite kelių žmonių, o ne visos populiacijos ūgio duomenis. Be to, manoma, kad augimas yra normalus paskirstytas kiekis su nežinoma dispersija ir vidurkiu. Labiausiai tikėtina, kad imties augimo vidurkis ir dispersija bus visos populiacijos vidurkis ir dispersija.

Fiksuotam duomenų rinkiniui ir pagrindiniam tikimybinis modelis, naudodamiesi didžiausios tikimybės metodu, gausime modelio parametrų reikšmes, kurios padaro duomenis „arčiau“ tikriems. Didžiausios tikimybės įvertinimas yra unikalus ir paprastas būdas nustatyti sprendimus normaliojo skirstinio atveju.

Naudojamas didžiausios tikimybės įvertinimo metodas platus asortimentas statistiniai modeliai, įskaitant:

  • tiesiniai modeliai ir apibendrinti tiesiniai modeliai;
  • faktorių analizė;
  • struktūrinių lygčių modeliavimas;
  • daugelyje situacijų, kaip hipotezių tikrinimo dalis ir pasitikėjimo intervalas formavimas;
  • diskretiško pasirinkimo modeliai.

Metodo esmė

paskambino didžiausios tikimybės įvertinimas parametras Taigi, didžiausios tikimybės įvertis yra įvertis, kuris maksimaliai padidina tikimybės funkciją, atsižvelgiant į fiksuotą imties realizavimą.

Dažnai vietoj tikimybės funkcijos naudojama log-likelihood funkcija. Kadangi funkcija monotoniškai didėja visoje apibrėžimo srityje, bet kurios funkcijos maksimumas yra funkcijos maksimumas ir atvirkščiai. Taigi

,

Jei tikimybės funkcija yra diferencijuota, tada būtina sąlyga ekstremumas - jo gradiento lygybė iki nulio:

Pakankama būklė ekstremumas gali būti suformuluotas kaip neigiamas Heseno – antrųjų darinių matricos – apibrėžtumas:

Svarbu Norint įvertinti didžiausios tikimybės metodo įverčių savybes, naudojama vadinamoji informacinė matrica, kuri pagal apibrėžimą yra lygi:

Optimaliame taške informacijos matrica sutampa su matematiniais Heseno lūkesčiais, paimtais su minuso ženklu:

Savybės

  • Didžiausios tikimybės įverčiai, paprastai kalbant, gali būti šališki (žr. pavyzdžius), tačiau yra nuoseklūs. asimptotiškai efektyvus ir asimptotiškai normalus sąmatos. Asimptotinis normalumas reiškia

kur yra asimptotinė informacijos matrica

Asimptotinis efektyvumas reiškia, kad asimptotinė kovariacijos matrica yra apatinė visų nuoseklių asimptotiškai normalių įverčių riba.

Pavyzdžiai

Paskutinę lygybę galima perrašyti taip:

kur , iš kurio matyti, kad tikimybės funkcija pasiekia maksimumą taške . Taigi

. .

Norėdami rasti jo maksimumą, dalines išvestis prilyginsime nuliui:

- imties vidurkis ir - imties dispersija.

Sąlyginės didžiausios tikimybės metodas

Sąlyginė didžiausia tikimybė (sąlyginė ML) naudojami regresijos modeliuose. Metodo esmė ta, kad neišsami bendras paskirstymas visi kintamieji (priklausomi ir regresoriai), bet tik sąlyginis priklausomo kintamojo pasiskirstymas tarp veiksnių, ty iš tikrųjų pasiskirstymas atsitiktinių klaidų regresijos modelis. Pilna funkcija patikimumas yra produktas " sąlyginė funkcija tikimybė“ ir faktorių pasiskirstymo tankis. Sąlyginis MMP yra lygiavertis pilna versija MMP tuo atveju, kai veiksnių pasiskirstymas niekaip nepriklauso nuo įvertintų parametrų. Ši sąlyga dažnai pažeidžiama laiko eilučių modeliuose, pvz., autoregresiniame modelyje. IN šiuo atveju, regresoriai yra priklausomo kintamojo praeities reikšmės, o tai reiškia, kad jų reikšmės taip pat paklūsta tam pačiam AR modeliui, tai yra, regresorių pasiskirstymas priklauso nuo įvertintų parametrų. Tokiais atvejais sąlyginio ir pilnas metodas didžiausios tikimybės skirsis.

Taip pat žr

Pastabos

Literatūra

  • Magnusas Y.R., Katyshevas P.K., Peresetskis A.A. Ekonometrija. Pradedantysis kursas. - M.: Delo, 2007. - 504 p. - ISBN 978-5-7749-0473-0

Wikimedia fondas.

2010 m.



Ar jums patiko straipsnis? Pasidalinkite su draugais!