Хамгийн оновчтой утга нь хамгийн их магадлалтай арга юм. Тооцооллыг олж авах арга

тасралтгүй санамсаргүй хувьсагчнягтралтай Нягтын төрөл нь мэдэгдэж байгаа боловч параметрийн утга нь тодорхойгүй байна Магадлалын функц нь функц юм (энд - £ санамсаргүй хэмжигдэхүүний тархалтаас авсан эзлэхүүний түүвэр). Магадлалын функцэд магадлалын утгыг өгч болохыг хялбархан харж болно, тухайлбал: бүрэлдэхүүн хэсгүүд нь бие даасан, D(z) хуулийн дагуу ижил тархсан санамсаргүй хэмжигдэхүүнтэй санамсаргүй векторыг авч үзье. Тэгвэл Е векторын магадлалын элемент нь i.e хэлбэртэй байна. Магадлалын функц нь P туршилтын дарааллаар тогтмол түүврийг авах магадлалтай холбоотой юм. Магадлалын аргын гол санаа нь А параметрийн тооцооллын хувьд ийм утгыг авахыг санал болгож байна (3) Энэ нь өгөгдсөн тогтмол түүврийн магадлалын функцийн дээд хэмжээг өгдөг, өөрөөр хэлбэл туршилтаар олж авсан дээжийг хамгийн их магадлалтай гэж үзэхийг санал болгож байна. pj параметрийн тооцооллыг олох нь k тэгшитгэлийн системийг шийдвэрлэхэд буурдаг (k нь үл мэдэгдэх параметрүүдийн тоо): L функцийн log нь магадлалын функцтэй ижил цэг дээр максимумтай тул магадлалын тэгшитгэлийн систем (19) нь дараах байдалтай байна. ихэвчлэн хэлбэрээр бичдэг Үл мэдэгдэх параметрийн тооцоололын хувьд түүврээс үнэхээр хамааралтай, тогтмол биш (19) эсвэл (20) системийн шийдлүүдийг авах хэрэгтэй. £ нь тархалтын цуваатай салангид тохиолдолд магадлалын функцийг функц гэж нэрлэх ба тооцооллыг системийн шийдэл болгон хайдаг хамгийн их магадлалэсвэл түүнтэй адилтгах Хамгийн их магадлалтай тооцоолол нь тууштай байх шинж чанартай болохыг харуулж болно. Хамгийн их магадлалтай арга нь илүү их зүйлд хүргэдэг гэдгийг тэмдэглэх нь зүйтэй нарийн төвөгтэй тооцоомоментийн аргаас илүү боловч онолын хувьд илүү үр дүнтэй байдаг, учир нь хамгийн их магадлал нь моментийн аргыг ашиглан олж авсан тооцооллоос тооцоолсон параметрийн бодит утгаас бага зөрүүтэй байдаг. Аппликешнүүдэд хамгийн их тохиолддог тархалтын хувьд моментийн арга ба хамгийн их магадлалын аргыг ашиглан олж авсан параметрийн тооцоолол ихэнх тохиолдолд давхцдаг. Пршир 1. хазайлт (хэсгийн хэмжээ нь нэрлэсэн утгаас хэвийн тархсан санамсаргүй хэмжигдэхүүн юм. Түүврээс хазайх системчилсэн алдаа ба дисперсийг тодорхойлох шаардлагатай. М Нөхцөлөөр (хэвийн тархалттай санамсаргүй хэмжигдэхүүн). математикийн хүлээлт (системчилсэн алдаа) болон n хэмжээтэй түүврээс тооцоолох дисперс: X\>...yXn. Энэ тохиолдолд Магадлалын функцийн систем (19) нь Xx-ээс хамааралгүй шийдлүүдийг эс тооцвол бид олж авна, өөрөөр хэлбэл, энэ тохиолдолд магадлалын хамгийн их тооцоо нь бидэнд аль хэдийн мэдэгдэж байсан эмпирик дундаж ба дисперстэй давхцаж байна > Жишээ 2. Экспоненциал тархсан санамсаргүй хэмжигдэхүүнээс /i параметрийг тооцоол. 4 Магадлалын функц нь хэлбэртэй байна. Магадлалын тэгшитгэл нь моментийн аргаар олж авсан ижил параметрийн тооцоотой давхцах шийдэлд хүргэдэг, (17) үзнэ үү. ^ Жишээ 3. Хамгийн их магадлалын аргыг ашиглан зоосыг арван шидэх үед сүлд 8 удаа гарч ирсэн тохиолдолд сүлд харагдах магадлалыг тооцоол. -4 Үнэлгээний магадлалыг p-тэй тэнцүү болго. Санамсаргүй хэмжигдэхүүнийг авч үзье (тархалтын цуваатай. Магадлалын функц (21) нь хамгийн их магадлалын арга хэлбэртэй байна. Тэгшитгэл нь үл мэдэгдэх магадлалын p тооцоогоор туршилтад сүлд харагдах давтамжийг өгдөг. Дүгнэлт. Тооцооллыг олох аргуудын талаар ярилцахдаа маш их хэмжээний туршилтын өгөгдөлтэй байсан ч бид үүнийг хэлж чадахгүй гэдгийг онцлон тэмдэглэж байна. яг үнэ цэнэтооцоолсон параметр, үүнээс гадна бидний олж авсан тооцоолол нь зөвхөн "дунджаар" эсвэл "ихэнх тохиолдолд" тооцоолсон параметрүүдийн үнэн утгатай ойролцоо байна; Тиймээс чухал статистикийн асуудал, бидний дараа авч үзэх зүйл бол бидний хийж буй үнэлгээний үнэн зөв, найдвартай байдлыг тодорхойлох ажил юм.

Хамгийн их магадлалтай арга.

Энэ арга нь магадлалын функц хамгийн ихдээ хүрэх параметрийн утгыг параметрийн цэгийн үнэлгээ болгон авахаас бүрдэнэ.

Магадлалын нягт f(t, ) бүхий санамсаргүй хугацааны бүтэлгүйтлийн хувьд магадлалын функцийг 12.11 томъёогоор тодорхойлно. , өөрөөр хэлбэл магадлалын нягттай τ санамсаргүй хэмжигдэхүүний бие даасан хэмжилтийн хамтарсан магадлалын нягт юм. f(t, ).

Хэрэв санамсаргүй хэмжигдэхүүн нь дискрет бөгөөд утгыг авдаг Z 1, Z 2..., P 1 (α), P 2 (α) ... магадлалын хувьд, магадлалын функцийг өөр хэлбэрээр авна, тухайлбал: , энд магадлалын индексүүд нь утгууд ажиглагдсан болохыг харуулж байна.

Параметрийн магадлалын хамгийн их тооцоог магадлалын тэгшитгэлээс (12.12) тодорхойлно.

Хамгийн их магадлалын аргын утгыг дараах хоёр таамаглалаар тодорхойлно.

Хэрэв параметр байгаа бол үр дүнтэй үнэлгээ, тэгвэл магадлалын тэгшитгэл (12.12) байна цорын ганц шийдэл.

Зарим хүмүүсийн хувьд ерөнхий нөхцөлфункц дээр давхардсан аналитик шинж чанар f(t, )магадлалын тэгшитгэлийн шийдэл k дээр нийлдэг жинхэнэ утгапараметр.

Ердийн тархалтын параметрүүдэд хамгийн их магадлалтай аргыг ашиглах жишээг авч үзье.

Жишээ:

Бидэнд: , , t i (i=1..N)нягтралын тархалттай популяциас авсан дээж.

Бид хамгийн их ижил төстэй байдлын тооцоог олох хэрэгтэй.

Магадлалын функц: ;

.

Магадлалын тэгшитгэл: ;

;

Эдгээр тэгшитгэлийн шийдэл нь дараах хэлбэртэй байна: - статистикийн дундаж; - статистикийн тархалт. Тооцоолол нь өрөөсгөл юм. Шударга бус тооцоо нь: .

Хамгийн их магадлалын аргын гол сул тал бол магадлалын тэгшитгэлийг шийдвэрлэхэд үүсдэг тооцооллын хүндрэлүүд бөгөөд энэ нь дүрмээр бол трансцендент юм.

Агшин зуурын арга.

Энэ аргыг К.Пирсон санал болгосон бөгөөд үл мэдэгдэх параметрийн цэгийн үнэлгээний хамгийн анхны ерөнхий арга юм. Энэ нь харьцангуй энгийн тооцооллын процедурт хүргэдэг тул практик статистикт өргөн хэрэглэгддэг хэвээр байна. Энэ аргын санаа нь үл мэдэгдэх параметрүүдээс хамааран тархалтын моментуудыг эмпирик моментуудтай тэнцүүлэх явдал юм. Хормын тоог аваад, тоотой тэнцүү байнаүл мэдэгдэх параметрүүд ба харгалзах тэгшитгэлийг зохиох замаар бид шаардлагатай тооны тэгшитгэлийг олж авна. Эхний хоёр статистик цэгийг ихэвчлэн тооцдог: түүврийн дундаж; Тэгээд түүврийн зөрүү . Моментийн аргыг ашиглан олж авсан тооцоолол нь үр ашгийн хувьд хамгийн сайн биш юм. Гэсэн хэдий ч ихэнхдээ тэдгээрийг эхний ойролцоо байдлаар ашигладаг.

Моментийн аргыг ашиглах жишээг авч үзье.

Жишээ: Экспоненциал тархалтыг авч үзье.

t>0; λ<0; t i (i=1..N) – тархалтын нягтрал бүхий популяциас авсан дээж. Бид λ параметрийн тооцоог олох хэрэгтэй.

Тэгшитгэл хийцгээе: . Тиймээс, өөрөөр.

Тоон арга.

Энэ бол моментийн аргатай ижил эмпирик арга юм. Энэ нь онолын тархалтын квантилууд нь эмпирик квантилуудтай тэнцүү байх явдал юм. Хэрэв хэд хэдэн параметрийг үнэлэх шаардлагатай бол хэд хэдэн квантилуудын хувьд харгалзах тэгшитгэлийг бичнэ.

Хуваарилалтын хууль гарсан тохиолдолд хэргийг авч үзье F(t,α,β)хоёр үл мэдэгдэх параметртэй α, β . Функцийг зөвшөөр F(t,α,β) боломжит параметрийн утгын хувьд эерэг утгыг авдаг тасралтгүй ялгах нягттай α, β. Туршилтыг төлөвлөгөөний дагуу явуулсан бол , r>>1, дараа нь алдаа гарах мөчийг түвшний эмпирик квантил гэж үзэж болно. i=1.2… , - эмпирик тархалтын функц. Хэрэв т лТэгээд т r - l-р ба r-р эвдрэл гарах мөчүүд яг тодорхой, параметрийн утгууд. α Тэгээд β тэгшитгэлээс олж болно

Мөн бусад).

Хамгийн их магадлалын тооцоолол нь өгөгдлөөс статистик загвар үүсгэх, загварын параметрүүдийн тооцоог гаргахад хэрэглэгддэг түгээмэл статистик арга юм.

Статистикийн салбарт алдартай олон тооны тооцооллын аргуудтай нийцдэг. Жишээлбэл, та Украины ард түмний өсөлтийг сонирхож байна гэж бодъё. Танд нийт хүн амаас илүү олон хүний ​​өндрийн мэдээлэл байна гэж бодъё. Үүнээс гадна өсөлт хэвийн байна гэж үздэг тараасан тоо хэмжээүл мэдэгдэх дисперс болон дундажтай. Түүврийн өсөлтийн дундаж ба дисперс нь нийт популяцийн дундаж ба дисперс байх магадлалтай.

Тогтмол өгөгдлийн багц болон үндсэн магадлалын загвар, хамгийн их магадлалтай аргыг ашиглан бид өгөгдлийг бодит байдалд "илүү ойртуулах" загварын параметрүүдийн утгыг олж авах болно. Хамгийн их магадлалын тооцоолол нь хэвийн тархалтын тохиолдолд шийдлийг тодорхойлох өвөрмөц бөгөөд энгийн аргыг өгдөг.

Хамгийн их магадлалын үнэлгээний аргыг ашигладаг өргөн хүрээтэйстатистик загварууд, үүнд:

  • шугаман загвар ба ерөнхий шугаман загвар;
  • хүчин зүйлийн шинжилгээ;
  • бүтцийн тэгшитгэлийн загварчлал;
  • олон нөхцөл байдал, таамаглалыг шалгах хүрээнд болон итгэлийн интервалүүсэх;
  • салангид сонголттой загварууд.

Аргын мөн чанар

дуудсан хамгийн их магадлалын тооцоопараметр. Тиймээс, хамгийн их магадлалын тооцоологч нь тогтсон түүврийн бодит байдлын өгөгдсөн магадлалын функцийг хамгийн их болгодог тооцоологч юм.

Ихэнхдээ магадлалын функцийн оронд log-likelihood функцийг ашигладаг. Функц нь тодорхойлолтын бүх мужид нэг хэвийн өсдөг тул аливаа функцын хамгийн их нь функцийн хамгийн их хэмжээ, мөн эсрэгээр. Тиймээс

,

Хэрэв магадлалын функц ялгах боломжтой бол шаардлагатай нөхцөлэкстремум - түүний градиентийн тэгтэй тэнцүү байдал:

Хангалттай нөхцөлэкстремумыг Hessian-ийн сөрөг тодорхойлолт гэж томъёолж болно - хоёр дахь деривативын матриц:

ЧухалХамгийн их магадлалын аргын шинж чанарыг үнэлэхийн тулд мэдээллийн матриц гэж нэрлэгддэг тодорхойлолтыг ашиглана:

Хамгийн оновчтой цэг дээр мэдээллийн матриц нь хасах тэмдгээр авсан Гессийн математикийн хүлээлттэй давхцдаг.

Үл хөдлөх хөрөнгө

  • Хамгийн их магадлалын тооцоог ерөнхийд нь авч үзвэл өрөөсгөл (жишээг харна уу) байж болох ч тогтвортой байна. асимптот үр ашигтай ба асимптот хэвийнтооцоолол. Асимптотик хэвийн гэдэг нь үүнийг хэлнэ

Асимптот мэдээллийн матриц хаана байна

Асимптотик үр ашиг гэдэг нь асимптот ковариацын матриц нь бүх тогтмол асимптотын хэвийн үнэлгээний доод хязгаарыг хэлнэ.

Жишээ

Сүүлийн тэгш байдлыг дараах байдлаар дахин бичиж болно.

Эндээс магадлалын функц тухайн цэг дээр хамгийн ихдээ хүрч байгааг харж болно. Тиймээс

. .

Түүний дээд хэмжээг олохын тулд хэсэгчилсэн деривативуудыг тэгтэй тэнцүүлнэ.

- түүврийн дундаж, - түүврийн хэлбэлзэл.

Болзолт хамгийн их магадлалын арга

Нөхцөлт аргахамгийн их магадлал (Нөхцөлт ML)регрессийн загварт ашигладаг. Аргын мөн чанар нь бүрэн бус юм хамтарсан хуваарилалтбүх хувьсагчид (хамааралтай ба регрессүүд), гэхдээ зөвхөн нөхцөлтхамааралтай хувьсагчийг хүчин зүйлүүдээр хуваарилах, өөрөөр хэлбэл тархалт санамсаргүй алдаа регрессийн загвар. Бүрэн функцүнэн төстэй байдал бол бүтээгдэхүүн" нөхцөлт функцмагадлал” болон хүчин зүйлийн тархалтын нягт. Нөхцөлт MMP нь тэнцүү байна бүрэн хувилбарХүчин зүйлийн хуваарилалт нь тооцоолсон параметрүүдээс ямар ч хамааралгүй тохиолдолд MMP. Энэ нөхцөл нь авторегресс загвар гэх мэт хугацааны цуврал загваруудад ихэвчлэн зөрчигддөг. IN энэ тохиолдолд, регрессүүд нь хамааралтай хувьсагчийн өнгөрсөн үеийн утгууд бөгөөд энэ нь тэдгээрийн утга нь ижил AR загварт захирагддаг, өөрөөр хэлбэл регрессүүдийн тархалт нь тооцоолсон параметрүүдээс хамаарна гэсэн үг юм. Ийм тохиолдолд нөхцөлт болон хэрэглэх үр дүн бүрэн аргахамгийн их магадлал өөр байх болно.

Мөн үзнэ үү

Тэмдэглэл

Уран зохиол

  • Магнус Ю.Р., Катышев П.К., Пересецкий А.А.Эконометрик. Анхан шатны курс. - М.: Дело, 2007. - 504 х. - ISBN 978-5-7749-0473-0

Викимедиа сан.

  • 2010 он.
  • Маршак, Борис Ильич

Байтын дараалал

Мөн бусад).

Хамгийн их магадлалын тооцоолол нь өгөгдлөөс статистик загвар үүсгэх, загварын параметрүүдийн тооцоог гаргахад хэрэглэгддэг түгээмэл статистик арга юм.

Статистикийн салбарт алдартай олон тооны тооцооллын аргуудтай нийцдэг. Жишээлбэл, та Украины ард түмний өсөлтийг сонирхож байна гэж бодъё. Танд нийт хүн амаас илүү олон хүний ​​өндрийн мэдээлэл байна гэж бодъё. Түүнчлэн өндөр нь тодорхойгүй дисперс болон дундажтай хэвийн тархсан хувьсагч гэж үздэг. Түүврийн өсөлтийн дундаж ба дисперс нь нийт популяцийн дундаж ба дисперс байх магадлалтай.

Тогтсон багц өгөгдлүүд болон магадлалын үндсэн загварыг өгснөөр бид хамгийн их магадлалтай аргыг ашиглан өгөгдлийг бодит ертөнцөд "илүү ойртуулах" загварын параметрүүдийн утгыг авах болно. Хамгийн их магадлалын тооцоолол нь хэвийн тархалтын тохиолдолд шийдлийг тодорхойлох өвөрмөц бөгөөд энгийн аргыг өгдөг.

Хамгийн их магадлалын тооцоог статистикийн өргөн хүрээний загваруудад ашигладаг, үүнд:

  • шугаман загвар ба ерөнхий шугаман загвар;
  • хүчин зүйлийн шинжилгээ;
  • бүтцийн тэгшитгэлийн загварчлал;
  • таамаглалыг шалгах, итгэлцлийн интервал үүсгэх хүрээнд олон нөхцөл байдал;
  • салангид сонголттой загварууд.

Аргын мөн чанар

дуудсан хамгийн их магадлалын тооцоопараметр. Тиймээс, хамгийн их магадлалын тооцоологч нь тогтсон түүврийн бодит байдлын өгөгдсөн магадлалын функцийг хамгийн их болгодог тооцоологч юм.

Ихэнхдээ магадлалын функцийн оронд log-likelihood функцийг ашигладаг. Функц нь тодорхойлолтын бүх мужид нэг хэвийн өсдөг тул аливаа функцын хамгийн их нь функцийн хамгийн их хэмжээ, мөн эсрэгээр. Тиймээс

,

Хэрэв магадлалын функц ялгах боломжтой бол экстремумын зайлшгүй нөхцөл бол түүний градиент тэгтэй тэнцүү байх явдал юм.

Экстремумын хангалттай нөхцөлийг Hessian-ийн сөрөг тодорхойлолт гэж томъёолж болно - хоёр дахь деривативын матриц.

Тодорхойлолтоор дараахтай тэнцүү мэдээллийн матриц гэж нэрлэгддэг.

Хамгийн оновчтой цэг дээр мэдээллийн матриц нь хасах тэмдгээр авсан Гессийн математикийн хүлээлттэй давхцдаг.

Үл хөдлөх хөрөнгө

  • Хамгийн их магадлалын тооцоог ерөнхийд нь авч үзвэл өрөөсгөл (жишээг харна уу) байж болох ч тогтвортой байна. асимптот үр ашигтай ба асимптот хэвийнтооцоолол. Асимптотик хэвийн гэдэг нь үүнийг хэлнэ

Асимптот мэдээллийн матриц хаана байна

Асимптотик үр ашиг гэдэг нь асимптот ковариацын матриц нь бүх тогтмол асимптотын хэвийн үнэлгээний доод хязгаарыг хэлнэ.

Жишээ

Сүүлийн тэгш байдлыг дараах байдлаар дахин бичиж болно.

Эндээс магадлалын функц тухайн цэг дээр хамгийн ихдээ хүрч байгааг харж болно. Тиймээс

. .

Түүний дээд хэмжээг олохын тулд хэсэгчилсэн деривативуудыг тэгтэй тэнцүүлнэ.

- түүврийн дундаж, - түүврийн хэлбэлзэл.

Болзолт хамгийн их магадлалын арга

Нөхцөлт хамгийн их магадлал (Нөхцөлт ML)регрессийн загварт ашигладаг. Аргын мөн чанар нь бүх хувьсагчийн (хамааралтай ба регресс) бүрэн хамтарсан хуваарилалтыг ашигладаггүй, харин зөвхөн нөхцөлтхүчин зүйлээс хамааралтай хувьсагчийн хуваарилалт, өөрөөр хэлбэл регрессийн загварт санамсаргүй алдааны хуваарилалт. Нийт магадлалын функц нь “нөхцөлт магадлалын функц” ба хүчин зүйлийн тархалтын нягтын үржвэр юм. Хүчин зүйлийн хуваарилалт нь тооцоолсон параметрүүдээс ямар ч хамааралгүй тохиолдолд нөхцөлт MMP нь MMP-ийн бүрэн хувилбартай тэнцэнэ. Энэ нөхцөл нь авторегресс загвар гэх мэт хугацааны цуврал загваруудад ихэвчлэн зөрчигддөг. Энэ тохиолдолд регрессүүд нь хамааралтай хувьсагчийн өнгөрсөн үеийн утгууд бөгөөд энэ нь тэдний утгууд нь ижил AR загварт захирагддаг, өөрөөр хэлбэл регрессийн тархалт нь тооцоолсон параметрүүдээс хамаарна гэсэн үг юм. Ийм тохиолдолд нөхцөлт ба бүрэн магадлалын аргуудыг хэрэглэсний үр дүн өөр байх болно.

Мөн үзнэ үү

Тэмдэглэл

Уран зохиол

  • Магнус Ю.Р., Катышев П.К., Пересецкий А.А.Эконометрик. Анхан шатны курс. - М.: Дело, 2007. - 504 х. - ISBN 978-5-7749-0473-0

Викимедиа сан.

Байтын дараалал

    Бусад толь бичгүүдээс "Хамгийн их магадлалтай арга" гэж юу болохыг харна уу:- - хамгийн их магадлалын арга Математикийн статистикт магадлалын функц гэж нэрлэгддэг функцийг дээд зэргээр нэмэгдүүлэхэд үндэслэсэн тархалтын параметрүүдийг тооцоолох арга ... ...

    Түүврээс F(s; α1,..., αs) түгээлтийн функцийн үл мэдэгдэх параметрүүдийг тооцох арга, α1, ..., αs нь үл мэдэгдэх параметрүүд. Хэрэв n ажиглалтын түүврийг r салангид бүлэгт хуваавал s1,..., sr; р1,..., pr… … . Хэрэв n ажиглалтын түүврийг r салангид бүлэгт хуваавал s1,..., sr; р1,..., pr… …

    Геологийн нэвтэрхий толь бичиг- Математик статистикийн хувьд магадлалын функц гэж нэрлэгддэг (ажиглалтын хамтарсан магадлалын нягтралыг бүрдүүлдэг утга бүхий ... ... -тэй тэнцүү утгатай ажиглалтын магадлал ... ...

    Бусад толь бичгүүдээс "Хамгийн их магадлалтай арга" гэж юу болохыг харна уу:Эдийн засаг, математикийн толь бичиг

    - T sritis automatika atitikmenys: англи хэл. хамгийн их магадлалтай арга vok. Methode der maksimalen Mutmaßlichkeit, f rus. хамгийн их магадлалын арга, m pranc. méthode de maximum de vraisemblance, f;… … Автоматикийн хэллэгүүд žodynas- Витерби дохиог илрүүлэх арга, энэ нь тэмдэг хоорондын гажуудлын хамгийн бага түвшинг баталгаажуулдаг. Мөн үзнэ үү. Витерби алгоритм. [Л.М. Невдяев. Харилцаа холбооны технологи. Англи-Орос тайлбар толь бичгийн лавлах ном. Ю.М найруулсан... лавлах. Ю.М найруулсан...

    Техникийн орчуулагчийн гарын авлагахамгийн их магадлалын аргыг ашиглан дараалал илрүүлэгч лавлах. Ю.М найруулсан...

    - Хүлээн авсан дохионы магадлалын функцийг нэмэгдүүлэх тэмдэгтүүдийн хамгийн их магадлалтай дарааллын тооцоог тооцоолох төхөөрөмж. [Л.М. Невдяев. Харилцаа холбооны технологи. Англи-Орос тайлбар толь бичгийн лавлах ном. Ю.М найруулсан...- хамгийн их магадлалтай арга - [Л.Г. Мэдээллийн технологийн англи-орос толь бичиг. М.: ЦНИС-ийн улсын аж ахуйн нэгж, 2003.] Мэдээллийн технологийн ерөнхий сэдвүүд Синонимын хамгийн их магадлалтай арга EN хамгийн их магадлалын арга ... лавлах. Ю.М найруулсан...

    хамгийн их магадлалын арга- Параметрийн тооцоог тооцоолох ерөнхий арга. Ажиглагдсан өгөгдлийн утга бүрийн тархалтын функцийн утгуудын үржвэртэй тэнцүү түүврийн магадлалын функцийг нэмэгдүүлэх тооцоог хайж байна. Хамгийн их магадлалын арга нь илүү дээр ... Социологийн статистикийн толь бичиг

Нэрт ангилал зүйч Жо Фэлсенштейн (1978) филогенетик онолыг парсимологийн бус үндэслэлээр үнэлэхийг анх санал болгосон.

судалгаа, гэхдээ математик статистикийн тусламжтайгаар. Үүний үр дүнд хамгийн их магадлалын аргыг боловсруулсан. .

Энэ арга нь өмнөх мэдлэг дээр суурилдаг боломжит арга замуудхувьсал, өөрөөр хэлбэл дүн шинжилгээ хийхээс өмнө шинж чанаруудын өөрчлөлтийн загварыг бий болгохыг шаарддаг. Эдгээр загварыг бий болгохын тулд статистикийн хуулиудыг ашигладаг.

Доод үнэмшилтэй үйл явдлын тодорхой загварыг хүлээн зөвшөөрсөн тохиолдолд өгөгдлийг ажиглах магадлалыг ойлгодог. Төрөл бүрийн загваруудажиглагдсан өгөгдлийг их эсвэл бага магадлалтай болгож чадна. Жишээлбэл, хэрэв та зоос шидээд зуугаас нэг л толгой авсан бол зоосыг алдаатай гэж үзэж болно. Хэрэв та энэ загварыг хүлээн зөвшөөрвөл үр дүнд хүрэх магадлал нэлээд өндөр байх болно. Хэрэв та зоос алдаатай гэсэн загвараар явах юм бол толгойг нэг биш тавин тохиолдлоор харах болно гэж найдаж болно. Муу зоос шидэхэд 100 толгойг л авах нь статистикийн хувьд бага юм. Өөрөөр хэлбэл, гажигтай зоосны загварт зуун сүүлт нэг толгойн үр дүн гарах магадлал маш бага байна.

Найдвартай байдал математик хэмжигдэхүүн. Үүнийг ихэвчлэн томъёогоор тооцоолно:

Энд Pr(D|H) нь H таамаглалыг хүлээн зөвшөөрсөн тохиолдолд D өгөгдлийг олж авах магадлал . Томъёоны босоо зураас нь "өгөгдсөн" гэсэн утгатай. L нь ихэвчлэн бага утга болж хувирдаг тул судалгааг ихэвчлэн ашигладаг байгалийн логарифмнайдвартай байдал.

Ажиглагдсан өгөгдлийг олж авах магадлал болон үйл явдлын хүлээн зөвшөөрөгдсөн загвар зөв байх магадлалыг хооронд нь ялгах нь маш чухал юм. Өгөгдлийн магадлал нь тухайн загварын магадлалын талаар юу ч хэлдэггүй. Философич-биологич Э.Собер ашигласан дараагийн жишээЭнэ ялгааг тодорхой болгохын тулд. Таны дээгүүр байгаа өрөөнд чанга дуу чимээ сонсогдож байна гэж төсөөлөөд үз дээ. Энэ нь мансарда дээр боулинг тоглодог гномуудаас болсон гэж та таамаглаж магадгүй юм. Энэ загварын хувьд таны ажиглалт (таны дээгүүр чанга дуу чимээ) өндөр магадлалтай (хэрэв одойнууд чам дээр боулинг тоглож байсан бол та бараг л сонсох байсан). Гэсэн хэдий ч таны таамаглал үнэн байх, өөрөөр хэлбэл одойнууд шуугиан тарьсан байх магадлал нь огт өөр зүйл юм. Тэд бараг л одой биш байсан. Тиймээс, энэ тохиолдолд таны таамаглал нь өгөгдлийг өндөр үнэмшилтэй болгодог, гэхдээ өөрөө хамгийн дээд зэрэгмагадлал багатай.

Ашиглаж байна энэ системХамгийн их магадлалын арга нь уламжлалт кладистик ашиглан олж авсан филогенетик модыг статистикийн хувьд үнэлэх боломжийг олгодог. Үндсэндээ энэ аргыг дүгнэж байна

боломжтой өгөгдлийн багцын хамгийн өндөр магадлалыг өгдөг кладограммыг хайдаг.

Хамгийн их магадлалын аргыг ашиглах жишээг авч үзье. ДНХ-ийн тодорхой хэсгийн нуклеотидын дараалал тогтоогдсон дөрвөн такса байна гэж бодъё (Зураг 16).

Хэрэв загвар нь урвуу өөрчлөлт хийх боломжтой гэж үзвэл бид энэ модыг дурын зангилаанд үндэслэж болно. Боломжит үндэс модны нэгийг Зураг дээр үзүүлэв. 17.2.

Тухайн байршилд ямар нуклеотидууд байгааг бид мэдэхгүй нийтлэг өвөг дээдэстакса 1-4 (эдгээр өвөг дээдэс нь кладограмм дээрх X ба Y зангилаатай тохирч байна). Эдгээр зангилаа бүрийн хувьд нуклеотидын дөрвөн хувилбар байдаг бөгөөд тэдгээр нь өвөг дээдсийн хэлбэрээр байж болох бөгөөд үүний үр дүнд 2-р мод руу чиглэсэн 16 филогенетик хувилбар бий болно. Эдгээр хувилбаруудын нэгийг Зураг дээр дүрсэлсэн болно. 17.3.

Энэ хувилбарын магадлалыг дараах томъёогоор тодорхойлж болно.

Энд P A нь модны үндэст нуклеотид А байх магадлал бөгөөд энэ нь А нуклеотидын дундаж давтамжтай тэнцүү байна. ерөнхий тохиолдол= 0.25); P AG – А-г G-ээр солих магадлал; P AC – А-г С-ээр солих магадлал; P AT – А-г Т-ээр солих магадлал; Сүүлийн хоёр үржүүлэгч нь нуклеотид Т-ийг X ба Y зангилаанд тус тус хадгалах магадлал юм.

Өөр боломжит хувилбар, энэ нь танд ижил өгөгдлийг олж авах боломжийг Зураг дээр үзүүлэв. 17.4. Ийм 16 хувилбар байгаа тул тэдгээрийн магадлалыг тодорхойлж болох бөгөөд эдгээр магадлалын нийлбэр нь Зураг дээр үзүүлсэн модны магадлал болно. 17.2:

Энд P мод 2 нь 2-р модыг одоор тэмдэглэсэн байрлал дахь өгөгдлийг ажиглах магадлал юм.

Өгөгдсөн дарааллын бүх локус дахь бүх өгөгдлийг ажиглах магадлал нь 1-ээс N хүртэлх i байршил бүрийн магадлалын үржвэр юм.

Эдгээр утгууд нь маш бага тул өөр нэг үзүүлэлтийг ашигладаг - i байршил бүрийн хувьд lnL i магадлалын натурал логарифм. Энэ тохиолдолд модны лог-магадлал нь байршил бүрийн лог-магадлалын нийлбэр юм.

lnL модны утга нь хувьслын тодорхой загвар ба түүний шинж чанар бүхий модыг сонгохдоо өгөгдлийг ажиглах магадлалын логарифм юм.

салбарлалтын дараалал ба мөчрүүдийн урт. Компьютерийн програмууд, хамгийн их магадлалтай аргад ашигласан (жишээлбэл, аль хэдийн дурдсан cladistic багц PAUP), мод хайх хамгийн их үзүүлэлт lnL. Хоёр загварын 2Δ (үүнд Δ = lnL мод A- lnL модB) загваруудын лог-магадлалын хоёр дахин их зөрүү нь мэдэгдэж буйд захирагдана. статистикийн тархалт x 2. Энэ нь нэг загвар нь нөгөөгөөсөө найдвартай сайн эсэхийг үнэлэх боломжийг танд олгоно. Энэ нь хамгийн их магадлалыг таамаглалыг шалгах хүчирхэг хэрэгсэл болгодог.

Дөрвөн таксны хувьд 15 модны хувьд lnL тооцоолол хийх шаардлагатай. At их тооБүх таксыг үнэлэх боломжгүй болж байгаа тул хайлт хийхэд эвристик аргыг ашигладаг (дээрхийг үзнэ үү).

Үзсэн жишээн дээр бид хувьслын явцад нуклеотидыг солих (орлуулах) магадлалын утгыг ашигласан. Эдгээр магадлалыг тооцоолох нь өөрөө статистикийн ажил юм. Хувьслын модыг сэргээхийн тулд бид орлуулах үйл явцын талаар тодорхой таамаглал дэвшүүлж, эдгээр таамаглалыг загвар хэлбэрээр илэрхийлэх ёстой.

Хамгийн энгийн загварт аливаа нуклеотидыг өөр нуклеотидээр солих магадлалыг тэнцүү гэж үздэг. Энэ энгийн загварзөвхөн нэг параметртэй байдаг - орлуулах хурд гэж нэрлэдэг нэг параметрийн Jukes-Cantor загвар эсвэл JC (Жүкс ба Кантор, 1969). Энэ загварыг ашиглахдаа бид нуклеотидын орлуулах хурдыг мэдэх хэрэгтэй. Хэрэв бид үүнийг цаг хугацааны хувьд мэддэг бол t= 0 нь тодорхой газарт G нуклеотид байдаг бол бид тодорхой хугацааны дараа энэ сайтад G нуклеотид үлдэх магадлалыг тооцоолж болно, мөн энэ сайт нь өөр нуклеотид, жишээ нь А-аар солигдох магадлалыг тооцоолж болно. Эдгээр магадлалыг тус тус P(gg) болон P(ga) гэж тэмдэглэнэ. Хэрэв орлуулах хурд нь нэгж хугацаанд α α-тай тэнцүү бол

Нэг параметрийн загварын дагуу аливаа орлуулалт ижил магадлалтай тул илүү ерөнхий мэдэгдэл дараах байдалтай байна.

Илүү нарийн төвөгтэй хувьслын загваруудыг мөн боловсруулсан. Эмпирик ажиглалтуудзарим орлуулалт тохиолдож болохыг харуулж байна

бусдаас илүү олон удаа. Үүний үр дүнд нэг пурин өөр пуриноор солигддог орлуулалт гэж нэрлэдэг шилжилт,ба пуриныг пиримидинээр эсвэл пиримидинийг пуринаар солихыг нэрлэдэг хөрвүүлэлтүүд.Аливаа нуклеотидын 3 орлуулалт тутмын нэг нь л шилжилт байдаг тул хөрвүүлэлт нь шилжилтээс илүү олон удаа тохиолддог гэж таамаглаж болно. Гэсэн хэдий ч эсрэгээрээ ихэвчлэн тохиолддог: шилжилт нь хөрвүүлснээс илүү олон удаа тохиолддог. Энэ нь ялангуяа митохондрийн ДНХ-ийн хувьд үнэн юм.

Зарим нуклеотидын орлуулалт бусадтай харьцуулахад илүү олон тохиолддог бас нэг шалтгаан нь суурь харьцааны тэгш бус байдалтай холбоотой юм. Жишээлбэл, шавьжны митохондрийн ДНХ нь сээр нуруутан амьтдынхтай харьцуулахад аденин, тиминээр баялаг байдаг. Хэрэв зарим үндэслэл илүү нийтлэг байвал бид зарим орлуулалт бусдаас илүү олон удаа тохиолддог гэж найдаж болно. Жишээлбэл, хэрэв дараалал нь маш бага гуанин агуулдаг бол энэ нуклеотидыг орлуулах магадлал багатай.

Загварууд нь заримд нь тодорхой параметр эсвэл параметрүүд (жишээлбэл, суурийн харьцаа, орлуулах хурд) тогтмол хэвээр үлдэж, бусад нь өөр өөр байдгаараа ялгаатай. Хувьслын олон арван загвар байдаг. Доор бид тэдний хамгийн алдартайг нь танилцуулж байна.

Аль хэдийн дурдсан Жукс-Кантор (JC) загвар үндсэн давтамжууд ижил байгаагаар тодорхойлогддог: π A = π C = π Г = π Т , хөрвүүлэлт ба шилжилтийн хурд ижил α=β байх ба бүх орлуулалт ижил магадлалтай.

Кимура хоёр параметрт (K2P) загвар гэж үздэг тэнцүү давтамжуудсууриуд π A =π C =π G =π T ба хөрвүүлэлт болон шилжилтүүд нь өөр өөр хурдтай α≠β.

Felsenstein загвар (F81) үндсэн давтамжууд өөр π A ≠π C ≠π G ≠π T гэж үздэг. , ба орлуулах хурд нь ижил α=β байна.

Ерөнхий урвуу загвар (REV) өөр өөр суурь давтамжийг π A ≠π C ≠π G ≠π T гэж үздэг. , мөн бүх зургаан хос орлуулалт өөр өөр хурдтай байдаг.

Дээр дурдсан загварууд нь орлуулалтын хувь хэмжээ бүх сайтуудад ижил байна гэж үздэг. Гэсэн хэдий ч, загвар нь өөр өөр сайтууд дахь орлуулах ханшийн ялгааг харгалзан үзэх боломжтой. Суурь давтамж ба орлуулах хурдны утгыг априори өгч болно, эсвэл эдгээр утгыг өгөгдлөөс авч болно. тусгай хөтөлбөрүүд, жишээ нь PAUP.

Байесийн шинжилгээ

Хамгийн их магадлалын арга нь боломжтой өгөгдлөөс үүссэн филогенетик загваруудын магадлалыг тооцдог. Гэсэн хэдий ч мэдлэг ерөнхий хэв маягТухайн бүлгийн хувьсал нь үндсэн өгөгдлийг (жишээлбэл, нуклеотидын дараалал) ашиглахгүйгээр филогенезийн хамгийн их магадлалтай загваруудыг бий болгох боломжийг олгодог. Эдгээр өгөгдлүүдийг олж авсны дараа тэдгээрийн болон урьдчилан бүтээгдсэн загваруудын хоорондын нийцлийг үнэлж, эдгээр анхны загваруудын магадлалыг дахин авч үзэх боломжтой. Үүнийг хийх боломжийг олгодог аргыг нэрлэдэг Байесийн шинжилгээ , бөгөөд энэ нь филогенийг судлах хамгийн сүүлийн үеийн аргууд юм (харна уу. нарийвчилсан тойм: Хуэлсенбек гэх мэт., 2001).

Стандарт нэр томъёоны дагуу эхний магадлалыг ихэвчлэн дууддаг өмнөх магадлал (мэдээлэл хүлээн авахаас өмнө тэдгээрийг хүлээн зөвшөөрсөн тул) болон шинэчилсэн магадлалууд байна a posteriori (мэдээлэл хүлээн авсны дараа тэдгээрийг тооцдог тул).

Математикийн үндэсБайесийн шинжилгээ нь Бэйсийн теорем бөгөөд үүнд өмнөх магадлалмод Pr[ Мод] ба магадлал Pr[ Өгөгдөл|Мод] нь Pr[ модны арын магадлалыг тооцоолоход хэрэглэгддэг. Мод|Өгөгдөл]:

Модны арын магадлалыг тухайн мод хувьслын жинхэнэ замыг тусгах магадлал гэж үзэж болно. Хамгийн өндөр магадлалтай модыг филогенезийн загвараар сонгосон. Модны арын магадлалын тархалтыг компьютерийн загварчлалын аргаар тооцдог.

Хамгийн их магадлал ба Байесийн шинжилгээ нь шинж чанарын өөрчлөлтийг дүрсэлсэн хувьслын загваруудыг шаарддаг. Бүтээл математик загваруудморфологийн хувьсал одоогоор боломжгүй байна. Энэ шалтгааны улмаас статистикийн аргуудФилогенетик шинжилгээ нь зөвхөн молекулын өгөгдөлд хамаарна.



Танд нийтлэл таалагдсан уу? Найзуудтайгаа хуваалцаарай!