Хи квадратыг тооцоолох. Оюутнуудад зориулсан өөрийгөө шалгах асуултууд

). Туршиж буй таамаглалын тодорхой томъёолол нь тохиолдол бүрт өөр өөр байх болно.

Энэ нийтлэлд би \(\chi^2\) шалгуур хэрхэн ажилладаг талаар дархлаа судлалын (таамаглал) жишээг ашиглан тайлбарлах болно. Бие махбодид тохирох эсрэгбиемүүдийг нэвтрүүлэх үед бичил биетний өвчний хөгжлийг дарах үр нөлөөг тодорхойлох туршилт хийсэн гэж төсөөлөөд үз дээ. Туршилтанд нийт 111 хулгана оролцсон бөгөөд бид 57, 54 амьтан гэсэн хоёр бүлэгт хуваасан. Эхний бүлгийн хулгануудад эмгэг төрүүлэгч бактерийн тарилга хийж, дараа нь эдгээр бактерийн эсрэг эсрэгбие агуулсан цусны ийлдсийг нэвтрүүлсэн. Хоёр дахь бүлгийн амьтад хяналтын үүрэг гүйцэтгэдэг байсан - тэд зөвхөн бактерийн тарилга хийсэн. Хэсэг хугацааны дараа инкубацийн дараа 38 хулгана үхэж, 73 нь амьд үлджээ. Амь үрэгдэгсдийн 13 нь нэгдүгээр бүлэгт, 25 нь хоёрдугаар бүлэгт (хяналтын) багтсан байна. Энэ туршилтаар шалгасан тэг таамаглалыг дараах байдлаар томъёолж болно: эсрэгбие бүхий ийлдэс хэрэглэх нь хулганын амьд үлдэхэд ямар ч нөлөө үзүүлэхгүй. Өөрөөр хэлбэл, хулгана амьд үлдэхэд ажиглагдсан ялгаа (эхний бүлэгт 77.2%, хоёрдугаар бүлэгт 53.7%) нь бүрэн санамсаргүй бөгөөд эсрэгбиеийн нөлөөлөлтэй холбоогүй гэдгийг бид баталж байна.

Туршилтаар олж авсан өгөгдлийг хүснэгт хэлбэрээр танилцуулж болно.

Нийт

Бактери + ийлдэс

Зөвхөн бактери

Нийт

Үзүүлсэнтэй адил хүснэгтүүдийг гэнэтийн хүснэгт гэж нэрлэдэг. Харж буй жишээн дээр хүснэгт нь 2х2 хэмжээтэй байна: хоёр ангиллын объектууд ("Бактери + ийлдэс" ба "Зөвхөн бактери") байдаг бөгөөд эдгээрийг хоёр шалгуурын дагуу ("Үхсэн" ба "Амьд үлдсэн") шалгадаг. Энэ бол гэнэтийн хүснэгтийн хамгийн энгийн тохиолдол юм: мэдээжийн хэрэг, судалж буй ангиудын тоо болон онцлог шинж чанаруудын тоо хоёулаа илүү байж болно.

Дээр дурдсан тэг таамаглалыг шалгахын тулд эсрэгбие нь хулганын амьд үлдэхэд ямар ч нөлөө үзүүлэхгүй бол нөхцөл байдал ямар байхыг мэдэх хэрэгтэй. Өөрөөр хэлбэл та тооцоолох хэрэгтэй хүлээгдэж буй давтамжуудэрсдэлийн хүснэгтийн харгалзах нүднүүдийн хувьд. Үүнийг хэрхэн хийх вэ? Туршилтанд нийт 38 хулгана үхсэн нь нийт амьтдын 34.2% болж байна. Хэрэв эсрэгбие нь хулганын амьд үлдэхэд нөлөөлөхгүй бол туршилтын хоёр бүлэгт нас баралтын ижил хувь, тухайлбал 34.2% байх ёстой. 57 ба 54-ийн 34.2% нь хэд болохыг тооцоолоход 19.5 ба 18.5 болно. Эдгээр нь манай туршилтын бүлгүүдийн хүлээгдэж буй нас баралтын түвшин юм. Хүлээгдэж буй амьд үлдэх түвшинг ижил төстэй байдлаар тооцдог: нийт 73 хулгана буюу нийт тооны 65.8% амьд үлдсэн тул хүлээгдэж буй амьд үлдэх хувь 37.5 ба 35.5 байна. Хүлээгдэж буй давтамжтай шинэ гэнэтийн хүснэгтийг үүсгэцгээе:

Үхсэн

Амьд үлдсэн хүмүүс

Нийт

Бактери + ийлдэс

Зөвхөн бактери

Нийт

Бидний харж байгаагаар хүлээгдэж буй давтамжууд нь ажиглагдсан давтамжаас эрс ялгаатай, жишээлбэл. эсрэгбие хэрэглэх нь эмгэг төрүүлэгчийн халдвар авсан хулганыг амьд үлдэхэд нөлөөлдөг бололтой. Бид энэ сэтгэгдлийг Пирсоны тохирох байдлын тест \(\chi^2\) ашиглан тоолж болно:

\[\chi^2 = \sum_()\frac((f_o - f_e)^2)(f_e),\]


Энд \(f_o\) ба \(f_e\) нь ажиглагдсан болон хүлээгдэж буй давтамжууд юм. Дүгнэлт нь хүснэгтийн бүх нүднүүдэд хийгддэг. Тиймээс бид авч үзэж буй жишээн дээр байна

\[\chi^2 = (13 – 19,5)^2/19,5 + (44 – 37,5)^2/37,5 + (25 – 18,5)^2/18,5 + (29 – 35,5)^2/35,5 = \]

Үр дүнд нь \(\chi^2\) утга нь тэг таамаглалыг үгүйсгэх хангалттай том уу? Энэ асуултад хариулахын тулд шалгуур үзүүлэлтийн харгалзах чухал утгыг олох шаардлагатай. \(\chi^2\)-ийн эрх чөлөөний зэрэглэлийн тоог \(df = (R - 1)(C - 1)\ гэж тооцдог бөгөөд \(R\) ба \(C\) нь тоо юм. хүснэгтийн нэгдэл дэх мөр, баганын . Манай тохиолдолд \(df = (2 -1)(2 - 1) = 1\). Эрх чөлөөний зэрэглэлийн тоог мэдсэнээр бид qchisq() стандарт R функцийг ашиглан эгзэгтэй утгыг \(\chi^2\) хялбархан олох боломжтой боллоо:


Тиймээс нэг зэрэглэлийн эрх чөлөөний хувьд зөвхөн 5% тохиолдолд \(\chi^2\) шалгуурын утга 3.841-ээс давсан байна. Бидний олж авсан 6.79 утга нь энэ чухал утгаас үлэмж давсан бөгөөд энэ нь эсрэгбиемийг нэвтрүүлэх, халдвар авсан хулганыг амьд үлдэх хоёрын хооронд ямар ч холбоо байхгүй гэсэн хоосон таамаглалыг үгүйсгэх эрхийг бидэнд олгож байна. Энэ таамаглалыг няцааснаар бид 5%-иас бага магадлалтайгаар алдаа гаргах эрсдэлтэй.

\(\chi^2\) шалгуурын дээрх томьёо нь 2х2 хэмжээтэй гэнэтийн хүснэгттэй ажиллахдаа бага зэрэг хөөрөгдсөн утгыг өгдөг гэдгийг тэмдэглэх нь зүйтэй. Шалтгаан нь \(\chi^2\) шалгуурын тархалт өөрөө тасралтгүй үргэлжилдэг бол хоёртын шинж чанаруудын давтамж ("нас барсан" / "амьд үлдсэн") нь салангид байдаг. Үүнтэй холбогдуулан шалгуур үзүүлэлтийг тооцоолохдоо энэ гэж нэрлэгддэг зүйлийг нэвтрүүлэх нь заншилтай байдаг тасралтгүй байдлын залруулга, эсвэл Йейтсийн нэмэлт өөрчлөлт :

\[\chi^2_Y = \sum_()\frac((|f_o - f_e| - 0.5)^2)(f_e).\]

"Ятестай хийсэн Хи квадратын тест" тасралтгүй байдлын залруулгын өгөгдөл: хулгана X квадрат = 5.7923, df = 1, p-утга = 0.0161


Бидний харж байгаагаар R нь Yates тасралтгүй байдлын засварыг автоматаар ашигладаг ( Pearson's Chi-squared test with Yates" тасралтгүй байдлын засвар). Програмаар тооцоолсон \(\chi^2\)-ийн утга 5.79213. Бид эсрэгбиеийн нөлөө байхгүй гэсэн тэг таамаглалыг 1% -иас дээш магадлалаар (p-утга = 0.0161) буруу байх эрсдэлтэй үгүйсгэж чадна.

Бие даасан байдлын хи-квадрат тестийг хоёр категориал хувьсагчийн хоорондын хамаарлыг тодорхойлоход ашигладаг. Категорийн хувьсагчийн хосын жишээ нь: Гэр бүлийн байдал vs. Хариуцагчийн ажил эрхлэлтийн түвшин; Нохойн үүлдэр vs. Эзэмшигчийн мэргэжил, Цалингийн түвшин vs. Инженерийн мэргэшил гэх мэт Бие даасан байдлын шалгуур үзүүлэлтийг тооцохдоо хувьсагчдын хооронд холбоо байхгүй гэсэн таамаглалыг шалгадаг. Бид MS EXCEL 2010 CHI2.TEST() функц болон ердийн томъёог ашиглан тооцоо хийнэ.

Бидэнд байгаа гэж бодъё дээж 500 хүний ​​дунд явуулсан санал асуулгын үр дүнг харуулсан өгөгдөл. Хүмүүсээс 2 асуулт асуусан: гэр бүлийн байдал (гэрлэсэн, нийтлэг хууль ёсны, харилцаагүй) болон тэдний ажил эрхлэлтийн түвшин (бүтэн цагийн, хагас цагийн, түр ажил хийдэггүй, гэртээ, тэтгэвэрт гарсан, сурч байгаа). Бүх хариултыг хүснэгтэд байрлуулсан:

Энэ хүснэгтийг нэрлэдэг болзошгүй байдлын хүснэгт(эсвэл хүчин зүйлийн хүснэгт, Англи хэлний Болзошгүй байдлын хүснэгт). Хүснэгтийн мөр, баганын огтлолцол дээрх элементүүдийг ихэвчлэн O ij гэж тэмдэглэдэг (Англи хэлнээс ажигласан, өөрөөр хэлбэл ажиглагдсан, бодит давтамж).

Бид "Гэр бүлийн байдал ажил эрхлэлтэд нөлөөлдөг үү?" Гэсэн асуултыг сонирхож байна. ангиллын хоёр аргын хооронд хамаарал байгаа эсэх дээж?

At таамаглалыг шалгахЭнэ хэлбэрийг ихэвчлэн хүлээн зөвшөөрдөг тэг таамаглалангиллын аргуудаас хамаарал байхгүй гэж заасан.

Хэргийг хязгаарлах талаар авч үзье. Хоёр ангиллын хувьсагчийн бүрэн хамаарлын жишээ нь дараах судалгааны үр дүн юм.

Энэ тохиолдолд гэр бүлийн байдал нь ажил эрхлэлтийг тодорхой тодорхойлдог (харна уу. Жишээ файлын хуудасны тайлбар). Үүний эсрэгээр, бүрэн бие даасан байдлын жишээ бол өөр нэг судалгааны үр дүн юм.

Энэ тохиолдолд ажил эрхлэлтийн түвшин нь гэр бүлийн байдлаас хамаарахгүй гэдгийг анхаарна уу (гэрлэсэн болон гэрлээгүй хүмүүст адилхан). Энэ нь үг хэллэгтэй яг таарч байна тэг таамаглал. Хэрэв тэг таамаглалшударга бол судалгааны үр дүнг гэр бүлийн байдлаас үл хамааран ажил эрхэлж буй хүмүүсийн хувь ижил байхаар хуваарилах ёстой. Үүнийг ашиглан бид тохирох судалгааны үр дүнг тооцдог тэг таамаглал(см. жишээ хуудас файл Жишээ).

Эхлээд бид элементийн магадлалыг тооцоолно дээжтодорхой оршин суугчтай байх болно (u i баганыг харна уу):

Хаана -тай– “Гэр бүлийн байдал” хувьсагчийн түвшний тоотой тэнцүү баганын (баганын) тоо.

Дараа нь бид элементийн магадлалыг тооцоолно дээжтодорхой гэр бүлийн статустай байх болно (v j мөрийг үзнэ үү).

Хаана r– “Эзлэлт” хувьсагчийн түвшний тоотой тэнцүү эгнээний тоо.

Хувьсагчдын бие даасан байдлын хувьд E ij нүд бүрийн онолын давтамжийг (Англи хэлнээс Хүлээгдэж буй давтамжаас) дараах томъёогоор тооцоолно.
E ij =n* u i * v j

Том n-ийн хувьд X 2 0 статистик нь ойролцоогоор (r-1)(c-1) эрх чөлөөний зэрэгтэй (df - эрх чөлөөний зэрэг) байдаг нь мэдэгдэж байна.

үндэслэн тооцсон бол дээжЭнэ статистикийн утга нь "хэт том" (босго хэмжээнээс их) байвал тэг таамаглалтатгалзсан. Босго утгыг жишээлбэл =HI2.OBR.PH(0.05; df) томъёог ашиглан тооцоолно.

Анхаарна уу: Ач холбогдолын түвшинихэвчлэн 0.1-тэй тэнцүү авдаг; 0.05; 0.01.

At таамаглалыг шалгахЭнэ нь бас тооцоолоход тохиромжтой бөгөөд бид үүнийг харьцуулж үздэг ач холбогдлын түвшин. х-утга(r-1)*(c-1)=df эрх чөлөөний зэргийг ашиглан тооцоолсон.

Хэрэв санамсаргүй хэмжигдэхүүн нь c (r-1)(c-1) байх магадлал эрх чөлөөний зэрэгтооцоолсон статистик X 2 0-ээс их утгыг авна, i.e. P(Х 2 (r-1)*(c-1) >Х 2 0 ), бага ач холбогдлын түвшин, Тэр тэг таамаглалтатгалзсан.

MS EXCEL дээр p-утгатомъёог ашиглан тооцоолж болно =HI2.DIST.PH(X 2 0 ;df)Мэдээжийн хэрэг, үүнээс өмнө X 2 0 статистикийн утгыг тооцоолсны дараа (үүнийг жишээ файлд хийсэн болно). Гэхдээ CH2.TEST() функцийг ашиглах нь хамгийн тохиромжтой. Энэ функцийн аргументуудын хувьд бодит (Ажигласан) болон тооцоолсон онолын давтамж (Хүлээж буй) агуулсан мужуудын лавлагааг зааж өгсөн болно.

Хэрэв ач холбогдлын түвшин > х- үнэ цэнэ, тэгвэл энэ нь шударга байдлын таамаглалаас тооцсон бодит болон онолын давтамжийг хэлнэ. тэг таамаглал, ноцтой ялгаатай. Тийм ч учраас, тэг таамаглалтатгалзах ёстой.

CH2.TEST() функцийг ашигласнаар процедурыг хурдасгах боломжтой таамаглалыг шалгах, учир нь үнэ цэнийг тооцоолох шаардлагагүй статистик. Одоо CH2.TEST() функцийн үр дүнг өгөгдсөнтэй харьцуулахад л хангалттай ач холбогдлын түвшин.

Анхаарна уу: CHISQ.TEST(), англи нэр нь CHISQ.TEST функц нь MS EXCEL 2010 дээр гарч ирсэн. Түүний өмнөх хувилбар нь MS EXCEL 2007 дээр гарсан CHISQEST() нь ижил функцтэй. Харин CH2.TEST()-ийн хувьд та онолын давтамжийг өөрөө тооцоолох хэрэгтэй.

Энэ шалгуурыг ашиглах нь онолын хоорондын зөрүүг хэмжих ийм хэмжүүр (статистик) ашиглахад үндэслэсэн болно. Ф(x) ба эмпирик хуваарилалт Ф* П (x) , энэ нь ойролцоогоор χ тархалтын хуулийг дагаж мөрддөг 2 . Таамаглал Н 0 Эдгээр статистикийн тархалтад дүн шинжилгээ хийх замаар тархалтын тууштай байдлыг шалгана. Шалгуурыг хэрэглэхийн тулд статистикийн цувралыг бий болгох шаардлагатай.

Тиймээс түүврийг тоонуудын хажууд статистик байдлаар үзүүлье М. Ажиглагдсан цохилтын хувь би- -р зэрэглэл n би. Онолын тархалтын хуулийн дагуу хүлээгдэж буй цохилтын давтамж би--р ангилал Ф би. Ажиглагдсан болон хүлээгдэж буй давтамжийн хоорондох ялгаа нь ( n биФ би). хоорондын зөрүүний ерөнхий түвшинг олох Ф(x) Мөн Ф* П (x) статистикийн цувралын бүх цифрүүдийн квадрат зөрүүний жигнэсэн нийлбэрийг тооцоолох шаардлагатай.

Утга χ 2 хязгааргүй томруулдаг n χ 2 тархалттай (асимптотоор χ 2 гэж тархсан). Энэ хуваарилалт нь эрх чөлөөний зэрэглэлийн тооноос хамаарна к, өөрөөр хэлбэл илэрхийлэл дэх нэр томъёоны бие даасан утгуудын тоо (3.7). Эрх чөлөөний зэрэглэлийн тоо нь тоотой тэнцүү байна yтүүвэрт ногдуулсан шугаман харилцааны тоог хассан. Үлдсэн давтамжийн нийлбэрээс дурын давтамжийг тооцоолох боломжтой тул нэг холболт бий. М-1 цифр. Нэмж дурдахад, хэрэв тархалтын параметрүүд нь урьдчилан мэдэгдээгүй бол тархалтыг түүвэрт тохируулахтай холбоотой өөр нэг хязгаарлалт бий. Хэрэв дээж нь тогтоовол С тархалтын параметрүүд, дараа нь эрх чөлөөний градусын тоо байх болно к= МС–1.

Таамаглалыг хүлээн авах талбар Н 0 χ нөхцөлөөр тодорхойлогдоно 2 < χ 2 (к; а) , хаана χ 2 (к; а) – ач холбогдлын түвшин бүхий χ2 тархалтын эгзэгтэй цэг а. I төрлийн алдаа гарах магадлал а, II төрлийн алдаа гарах магадлалыг тодорхой тодорхойлох боломжгүй, учир нь тархалт таарахгүй байж болох хязгааргүй олон тооны янз бүрийн арга байдаг. Туршилтын хүч нь цифрүүдийн тоо болон түүврийн хэмжээнээс хамаарна. Шалгуурыг хэзээ хэрэглэхийг зөвлөж байна n>200, хэрэглэхийг зөвшөөрнө n>40, яг ийм нөхцөлд шалгуур хүчинтэй байна (дүрмээр бол энэ нь буруу тэг таамаглалыг үгүйсгэдэг).

Шалгуураар шалгах алгоритм

1. Тэнцүү магадлалын аргыг ашиглан гистограммыг байгуул.

2. Гистограмын харагдах байдалд үндэслэн таамаглал дэвшүүл

Х 0: е(x) = е 0 (x),

Х 1: е(x) ¹ е 0 (x),

Хаана е 0 (x) - таамагласан тархалтын хуулийн магадлалын нягтрал (жишээлбэл, жигд, экспоненциал, хэвийн).

Сэтгэгдэл. Түүвэр дэх бүх тоо эерэг байвал экспоненциал тархалтын хуулийн таамаглал дэвшүүлж болно.

3. Томъёог ашиглан шалгуур үзүүлэлтийн утгыг тооцоол

,

Хаана
цохилтын хувь би-р интервал;

х би- санамсаргүй хэмжигдэхүүн орох онолын магадлал би- th интервал нь таамаглалд нийцсэн тохиолдолд Х 0 зөв байна.

Тооцооллын томъёо х биэкспоненциал, жигд ба хэвийн хуулиудын хувьд тэдгээр нь тэнцүү байна.

экспоненциал хууль

. (3.8)

Хаана А 1 = 0, Б м = +¥.

Нэгдмэл хууль

Ердийн хууль

. (3.10)

Хаана А 1 = -¥, B M = +¥.

Тэмдэглэл. Бүх магадлалыг тооцоолсны дараа х билавлагааны хамаарал хангагдсан эсэхийг шалгана

Функц Ф( X) - хачин. Ф(+¥) = 1.

4. Хавсралт дахь Хи квадрат хүснэгтээс утгыг сонгоно
, энд a нь заасан ач холбогдлын түвшин (a = 0.05 эсвэл a = 0.01), ба к- томъёогоор тодорхойлогдсон эрх чөлөөний зэрэглэлийн тоо

к = М - 1 - С.

Энд С- сонгосон таамаглалаас хамаарах параметрийн тоо Х 0 хуваарилалтын хууль. Үнэ цэнэ Сжигд хуулийн хувьд 2, экспоненциал хуулийн хувьд 1, хэвийн хуулийн хувьд 2 байна.

5. Хэрэв
, дараа нь таамаглал Х 0 татгалзсан. Үгүй бол татгалзах шалтгаан байхгүй: 1 - b магадлалтай бол үнэн, b магадлалаар энэ нь буруу, гэхдээ b-ийн утга тодорхойгүй байна.

Жишээ 3 . 1. c 2 шалгуурыг ашиглан санамсаргүй хэмжигдэхүүний тархалтын хуулийн таамаглал дэвшүүлж, шалгана уу. X, вариацын цуваа, интервалын хүснэгт, тархалтын гистограммыг жишээ 1.2-т өгсөн болно. А ач холбогдлын түвшин a 0.05 байна.

Шийдэл . Гистограммуудын харагдах байдал дээр үндэслэн бид санамсаргүй хэмжигдэхүүн гэсэн таамаглал дэвшүүлэв Xердийн хуулийн дагуу хуваарилагдсан:

Х 0: е(x) = Н(м, s);

Х 1: е(x) ¹ Н(м, s).

Шалгуурын утгыг дараах томъёогоор тооцоолно.

(3.11)

Дээр дурдсанчлан таамаглалыг шалгахдаа магадлалын тэнцүү гистограммыг ашиглах нь зүйтэй. Энэ тохиолдолд

Онолын магадлал х биБид (3.10) томъёог ашиглан тооцоолно. Үүний зэрэгцээ бид үүнд итгэж байна

х 1 = 0.5(F((-4.5245+1.7)/1.98)-F((-¥+1.7)/1.98)) = 0.5(F(-1.427) -F(-¥)) =

0,5(-0,845+1) = 0,078.

х 2 = 0.5(F((-3.8865+1.7)/1.98)-F((-4.5245+1.7)/1.98)) =

0.5(F(-1.104)+0.845) = 0.5(-0.729+0.845) = 0.058.

х 3 = 0,094; х 4 = 0,135; х 5 = 0,118; х 6 = 0,097; х 7 = 0,073; х 8 = 0,059; х 9 = 0,174;

х 10 = 0.5(F((+¥+1.7)/1.98)-F((0.6932+1.7)/1.98)) = 0.114.

Үүний дараа бид хяналтын харьцааны биелэлтийг шалгана

100 × (0.0062 + 0.0304 + 0.0004 + 0.0091 + 0.0028 + 0.0001 + 0.0100 +

0.0285 + 0.0315 + 0.0017) = 100 × 0.1207 = 12.07.

Үүний дараа "Хи квадрат" хүснэгтээс чухал утгыг сонгоно уу

.

Учир нь
дараа нь таамаглал Х 0-г хүлээн зөвшөөрсөн (үүнийг татгалзах шалтгаан байхгүй).

Хи-квадрат тест нь туршилтын үр дүн болон ашигласан статистик загвар хоорондын тохирлыг шалгах бүх нийтийн арга юм.

Пирсон зай X 2

Пятницкий A.M.

Оросын Улсын Анагаах Ухааны Их Сургууль

1900 онд Карл Пирсон загвар таамаглал болон туршилтын өгөгдлийн хоорондын тохирлыг шалгах энгийн, түгээмэл бөгөөд үр дүнтэй аргыг санал болгосон. Түүний санал болгосон "хи-квадрат тест" нь хамгийн чухал бөгөөд хамгийн түгээмэл хэрэглэгддэг статистик тест юм. Үл мэдэгдэх загварын параметрүүдийг тооцоолох, загвар болон туршилтын өгөгдлийн хоорондын тохирлыг шалгахтай холбоотой ихэнх асуудлыг түүний тусламжтайгаар шийдэж болно.

Судалж буй объект эсвэл үйл явцын априори (туршилтын өмнөх) загвар (статистикийн хувьд тэд "тэгш таамаглал" H 0 гэж ярьдаг), энэ объекттой хийсэн туршилтын үр дүн байх болтугай. Загвар нь хангалттай эсэхийг шийдэх шаардлагатай байна (энэ нь бодит байдалд нийцэж байна уу)? Туршилтын үр дүн нь бодит байдал хэрхэн ажилладаг тухай бидний санаатай зөрчилдөж байна уу, эсвэл өөрөөр хэлбэл H0-ээс татгалзах ёстой юу? Ихэнхдээ энэ даалгаврыг ажиглагдсан (O i = Ажиглагдсан) болон загварын дагуу хүлээгдэж буй (E i = Хүлээгдэж буй) тодорхой үйл явдлын дундаж давтамжийг харьцуулах хүртэл багасгаж болно. Ажиглагдсан давтамжийг тогтмол (!) нөхцөлд хийсэн N бие даасан (!) ажиглалтаар авсан гэж үздэг. Ажиглалт бүрийн үр дүнд М үйл явдлын аль нэгийг тэмдэглэнэ. Эдгээр үйл явдлууд нэгэн зэрэг тохиолдох боломжгүй (тэдгээр нь хос хосоороо үл нийцдэг) бөгөөд тэдгээрийн аль нэг нь зайлшгүй тохиолддог (тэдгээрийн хослол нь найдвартай үйл явдлыг бүрдүүлдэг). Бүх ажиглалтын нийлбэрийг давтамжийн хүснэгт (вектор) болгон бууруулж (O i )=(O 1 ,… O M ) туршилтын үр дүнг бүрэн дүрсэлсэн болно. O 2 =4 утга нь 2-р үйл явдал 4 удаа болсон гэсэн үг юм. Давтамжийн нийлбэр O 1 +… O M =N. N – тогтмол, санамсаргүй бус, N – санамсаргүй хэмжигдэхүүн гэсэн хоёр тохиолдлыг ялгах нь чухал. Тогтсон нийт N туршилтын хувьд давтамж нь олон гишүүнт тархалттай байна. Энэхүү ерөнхий схемийг энгийн жишээгээр тайлбарлая.

Энгийн таамаглалыг шалгахын тулд хи-квадрат тестийг ашиглах.

Загвар (нэг таамаглал H 0) нь тэгш хэмтэй байна гэж үзье - бүх нүүр царай p i =1/6, i =, M=6 магадлалаар ижил давтамжтайгаар гарч ирдэг. Туршилтыг 60 удаа шидсэн үхрийг хийсэн (N = 60 бие даасан туршилт явуулсан). Загварын дагуу бид O i үзэгдлийн бүх ажиглагдсан давтамжууд 1,2,... 6 оноо нь тэдний дундаж утгатай ойролцоо байх ёстой гэж найдаж байна E i =Np i =60∙(1/6)=10. H 0-ийн дагуу дундаж давтамжийн вектор (E i )=(Np i )=(10, 10, 10, 10, 10, 10). (Туршилт эхлэхээс өмнө дундаж давтамжийг бүрэн мэддэг таамаглалыг энгийн гэж нэрлэдэг.) Хэрэв ажиглагдсан вектор (O i ) нь (34,0,0,0,0,26) тэнцүү байсан бол тэр даруй болно. Загвар буруу байгаа нь тодорхой байна - яс зөв байж болохгүй, учир нь зөвхөн 1 ба 6-г 60 удаа өнхрүүлэв. Гэсэн хэдий ч загвар ба туршлага хоёрын хооронд ийм илэрхий зөрүү гарч байгаа нь үл хамаарах зүйл юм. Ажиглагдсан давтамжийн вектор (O i ) нь (5, 15, 6, 14, 4, 16) тэнцүү байг. Энэ нь H0-тэй нийцэж байна уу? Тиймээс бид хоёр давтамжийн векторыг (E i) ба (O i) харьцуулах хэрэгтэй. Энэ тохиолдолд хүлээгдэж буй давтамжийн вектор (Ei) нь санамсаргүй биш боловч ажиглагдсан давтамжийн вектор (Oi) нь санамсаргүй байдаг - дараагийн туршилтын үед (60 шидэлтийн шинэ цувралд) энэ нь өөр байх болно. Асуудлын геометрийн тайлбарыг танилцуулж, давтамжийн орон зайд (энэ тохиолдолд 6 хэмжээст) хоёр цэгийг координатууд (5, 15, 6, 14, 4, 16) ба (10, 10,) өгсөн гэж үзэх нь зүйтэй. 10, 10, 10, 10). Үүнийг H 0-тэй нийцэхгүй гэж үзэхэд тэдгээр нь хангалттай хол уу? Өөрөөр хэлбэл, бидэнд хэрэгтэй:

  1. давтамж хоорондын зайг хэмжиж сурах (давтамжийн орон зайн цэгүүд),
  2. ямар зайг хэтэрхий том (“үнэмжгүй”) гэж үзэх ёстой вэ гэсэн шалгууртай, өөрөөр хэлбэл H 0-тэй нийцэхгүй байна.

Энгийн Евклидийн зайны квадрат нь дараахтай тэнцүү байна.

X 2 Евклид = С(O i -E i) 2 = (5-10) 2 +(15-10) 2 + (6-10) 2 +(14-10) 2 +(4-10) 2 +(16-10) 2

Энэ тохиолдолд E i-ийн утгыг засаж, O i-г өөрчилвөл X 2 Евклид = const гадаргуу нь үргэлж бөмбөрцөг хэлбэртэй байдаг. Карл Пирсон давтамжийн орон зайд Евклидийн зайг ашиглах ёсгүй гэж тэмдэглэжээ. Иймд (O = 1030 ба E = 1000) болон (O = 40 ба E = 10) цэгүүд хоорондоо ижил зайд байна гэж үзэх нь буруу боловч хоёр тохиолдолд ялгаа нь O -E = 30 байна. Эцсийн эцэст, хүлээгдэж буй давтамж өндөр байх тусам үүнээс илүү их хазайлт боломжтой гэж үзэх хэрэгтэй. Иймд (O =1030 ба E =1000) цэгүүдийг "ойрхон", (O =40 ба E =10) цэгүүдийг бие биенээсээ "хол" гэж үзэх хэрэгтэй. Хэрэв H 0 таамаглал үнэн бол E i -тэй харьцуулахад O i давтамжийн хэлбэлзэл нь E i -ийн квадрат язгуурын (!) дарааллаар байгааг харуулж болно. Тиймээс Пирсон зайг тооцоолохдоо ялгааг (O i -E i) биш харин нормчлогдсон зөрүүг (O i -E i)/E i 1/2 квадрат болгохыг санал болгосон. Пирсоны зайг тооцоолох томъёо энд байна (энэ нь уг зайны квадрат):

X 2 Пирсон = С((O i -E i )/E i 1/2) 2 = С(O i -E i ) 2 /E i

Бидний жишээнд:

X 2 Пирсон = (5-10) 2 /10+(15-10) 2 /10 +(6-10) 2 /10+(14-10) 2 /10+(4-10) 2 /10+( 16-10) 2 /10=15.4

Ердийн үхрийн хувьд E i бүх хүлээгдэж буй давтамжууд ижил боловч ихэвчлэн өөр өөр байдаг тул Пирсоны зай тогтмол (X 2 Pearson =const) байх гадаргуу нь бөмбөрцөг биш эллипсоид хэлбэртэй байдаг.

Одоо зайг тооцоолох томъёог сонгосон тул аль зайг "хэт том биш" гэж үзэх ёстойг олж мэдэх шаардлагатай (H 0-тэй нийцэж байгаа бол жишээлбэл, бидний тооцоолсон зайны талаар бид юу хэлж чадах вэ 15.4). ? Тохиолдолын хэдэн хувьд (эсвэл ямар магадлалтайгаар) бид ердийн үхэртэй туршилт хийхэд 15.4-ээс их зай авах вэ? Хэрэв энэ хувь бага бол (<0.05), то H 0 надо отвергнуть. Иными словами требуется найти распределение длярасстояния Пирсона. Если все ожидаемые частоты E i не слишком малы (≥5), и верна H 0 , то нормированные разности (O i - E i )/E i 1/2 приближенно эквивалентны стандартным гауссовским случайным величинам: (O i - E i )/E i 1/2 ≈N (0,1). Это, например, означает, что в 95% случаев| (O i - E i )/E i 1/2 | < 1.96 ≈ 2 (правило “двух сигм”).

Тайлбар. i тоотой хүснэгтийн нүдэнд унасан хэмжилтийн тоо O i нь дараах параметрүүдтэй бином тархалттай байна: m =Np i =E i,σ =(Np i (1-p i)) 1/2, N нь тоо. хэмжилтийн тоо (N "1), p i - нэг хэмжилт нь тухайн нүдэнд унах магадлал (хэмжилт нь бие даасан бөгөөд тогтмол нөхцөлд хийгддэг гэдгийг санаарай). Хэрэв p i нь бага бол: σ≈(Np i ) 1/2 =E i ба бином тархалт нь ажиглалтын дундаж тоо E i =λ, стандарт хазайлт σ=λ 1/2 байх Пуассонтой ойролцоо байна. = E i 1/ 2. λ≥5-ын хувьд Пуассоны тархалт нь хэвийн N (m =E i =λ, σ=E i 1/2 =λ 1/2), нормчлогдсон утга (O i - E i )/E i 1-тэй ойролцоо байна. /2 ≈ N (0 ,1).

Пирсон санамсаргүй хэмжигдэхүүн χ 2 n - “n зэрэгтэй чөлөөт хи-квадрат”-ыг n бие даасан стандарт хэвийн санамсаргүй хэмжигдэхүүний квадратуудын нийлбэр гэж тодорхойлсон:

χ 2 n = T 1 2 + T 2 2 + …+ T n 2,бүгд хаана байна T i = N(0,1) - n. О. Р. -тай. В.

Статистикийн энэхүү хамгийн чухал санамсаргүй хэмжигдэхүүний утгыг тодорхой ойлгохыг хичээцгээе. Үүнийг хийхийн тулд хавтгайд (n = 2-той) эсвэл орон зайд (n = 3-тай) бид координат нь бие даасан, стандарт хэвийн тархалттай (-x 2 / 2) цэгүүдийн үүлийг үзүүлэв. ). Хавтгай дээр хоёр координатад бие даан хэрэгждэг "хоёр сигма" дүрмийн дагуу цэгүүдийн 90% (0.95*0.95≈0.90) нь квадрат дотор (-2) агуулагддаг.

f χ 2 2 (a) = Сexp(-a/2) = 0.5exp(-a/2).

Хангалттай олон тооны эрх чөлөөний зэрэгтэй n (n > 30) хи-квадрат тархалт хэвийн хэмжээнд ойртоно: N (m = n; σ = (2n) ½). Энэ нь "төв хязгаарын теорем"-ын үр дагавар юм: хязгаарлагдмал дисперстэй ижил тархсан хэмжигдэхүүнүүдийн нийлбэр нь гишүүний тоо нэмэгдэх тусам хэвийн хуульд ойртоно.

Практик дээр та зайны дундаж квадрат нь m (χ 2 n) = n, түүний дисперс нь σ 2 (χ 2 n) = 2n байна гэдгийг санах хэрэгтэй. Эндээс аль хи-квадрат утгыг хэт жижиг, хэт том гэж үзэхийг хялбархан дүгнэж болно: тархалтын ихэнх нь n -2∙(2n) ½-аас n +2∙(2n) ½ хооронд хэлбэлздэг.

Тиймээс, n +2∙ (2n) ½-ээс хэтэрсэн Пирсон зайг үнэмшмээргүй том (H 0-тэй нийцэхгүй) гэж үзэх хэрэгтэй. Хэрэв үр дүн нь n +2∙(2n) ½-тэй ойролцоо байвал ийм болон том хи-квадрат утгууд тохиолдлын хэдэн хувь нь гарч болохыг олж мэдэх боломжтой хүснэгтүүдийг ашиглах хэрэгтэй.

Эрх чөлөөний зэрэглэлд (товчилсон n.d.f.) тохирох утгыг хэрхэн сонгохыг мэдэх нь чухал юм. n нь ердөө л цифрүүдийн тоотой тэнцүү гэж таамаглах нь зүй ёсны юм шиг санагдав: n =M. Пирсон нийтлэлдээ ийм зүйлийг санал болгосон. Шооны жишээнд энэ нь n =6 гэсэн үг юм. Гэсэн хэдий ч хэдэн жилийн дараа Пирсон андуурч байсныг харуулсан. O i санамсаргүй хэмжигдэхүүнүүдийн хооронд холболт байгаа тохиолдолд эрх чөлөөний зэрэглэлийн тоо нь цифрүүдийн тооноос үргэлж бага байна. Шооны жишээний хувьд O i нийлбэр нь 60 бөгөөд зөвхөн 5 давтамжийг бие даан өөрчлөх боломжтой тул зөв утга нь n = 6-1 = 5 байна. Энэ n утгын хувьд бид n +2∙(2n) ½ =5+2∙(10) ½ =11.3-ыг авна. 15.4>11.3 байгаа тул H 0 таамаглалыг үгүйсгэх хэрэгтэй.

Алдааг тодруулсны дараа одоо байгаа χ 2 хүснэгтүүдийг нэмж оруулах шаардлагатай болсон, учир нь тэд хамгийн бага оронтой тоо = 2 байсан тул n = 1 тохиолдол байгаагүй. Одоо Пирсон зай нь χ 2 n =1 тархалттай байх тохиолдол гарч магадгүй юм.

Жишээ. 100 зоос шидэхэд толгойн тоо O 1 = 65, сүүл O 2 = 35. Цифрүүдийн тоо M = 2 байна. Хэрэв зоос тэгш хэмтэй байвал хүлээгдэж буй давтамжууд нь E 1 =50, E 2 =50 байна.

X 2 Пирсон = С(O i -E i) 2 /E i = (65-50) 2 /50 + (35-50) 2 /50 = 2*225/50 = 9.

Үр дүнгийн утгыг стандарт хэвийн утгын квадрат гэж тодорхойлсон χ 2 n =1 санамсаргүй хэмжигдэхүүнтэй харьцуулах хэрэгтэй χ 2 n =1 =T 1 2 ≥ 9. ó T 1 ≥3 эсвэл T 1 ≤-3. Ийм үйл явдлын магадлал маш бага P (χ 2 n =1 ≥9) = 0.006. Тиймээс зоосыг тэгш хэмтэй гэж үзэх боломжгүй: H 0-ээс татгалзах нь зүйтэй. Эрх чөлөөний зэрэглэлийн тоо нь цифрүүдийн тоотой тэнцүү байж болохгүй гэдэг нь ажиглагдсан давтамжуудын нийлбэр нь хүлээгдэж буй давтамжуудын нийлбэртэй үргэлж тэнцүү байдгаас тодорхой харагдаж байна, жишээ нь O 1 +O 2 =65+ 35 = E 1 +E 2 =50+50=100. Тиймээс O 1 ба O 2 координаттай санамсаргүй цэгүүд шулуун дээр байрладаг: O 1 +O 2 =E 1 +E 2 =100 бөгөөд төв хүртэлх зай нь энэ хязгаарлалт байхгүй байсантай харьцуулахад бага байна. Тэд бүхэл бүтэн онгоцонд байрлаж байсан. Үнэн хэрэгтээ, математикийн хүлээлт E 1 =50, E 2 =50 гэсэн хоёр бие даасан санамсаргүй хэмжигдэхүүний хувьд тэдгээрийн хэрэгжилтийн нийлбэр нь үргэлж 100-тай тэнцүү байх ёсгүй - жишээлбэл, O 1 =60, O 2 =55 утгууд байх болно. хүлээн зөвшөөрөгдөхүйц байх.

Тайлбар. Пирсоны шалгуурын M = 2-ын үр дүнг, Бернуллигийн N бие даасан туршилтын үр дүнд p магадлал бүхий ν =K /N үзэгдлийн тохиолдлын давтамжийн санамсаргүй хэлбэлзлийг тооцоолохдоо Мойвр-Лапласын томьёо өгч буй үр дүнг харьцуулж үзье. K нь амжилтын тоо):

χ 2 n =1 = С(O i -E i) 2 /E i = (O 1 -E 1) 2 /E 1 + (O 2 -E 2) 2 /E 2 = (Nν -Np) 2 /(Np) + (N () 1-ν )-N (1-p )) 2 /(N (1-p ))=

=(Nν-Np) 2 (1/p + 1/(1-p))/N=(Nν-Np) 2 /(Np(1-p))=((K-Np)/(Npq) ½ ) 2 = T 2

Утга T =(K -Np)/(Npq) ½ = (K -m (K))/σ(K) ≈N (0.1) σ(K)=(Npq) ½ ≥3. Энэ тохиолдолд Пирсоны үр дүн нь хоёр нэрийн тархалтын хувьд ердийн ойролцоолсон үзүүлэлттэй яг таарч байгааг бид харж байна.

Одоогийн байдлаар бид E i хүлээгдэж буй дундаж давтамжийг урьдчилан бүрэн мэддэг энгийн таамаглалуудыг авч үзсэн. Нарийн төвөгтэй таамаглалуудын эрх чөлөөний зэрэглэлийг хэрхэн зөв сонгох тухай мэдээллийг доороос үзнэ үү.

Нарийн төвөгтэй таамаглалыг шалгахын тулд хи-квадрат тестийг ашиглах

Тогтмол хэмжигдэхүүн, зоос бүхий жишээнүүдэд туршилтын өмнө (!) хүлээгдэж буй давтамжийг тодорхойлж болно. Ийм таамаглалыг "энгийн" гэж нэрлэдэг. Практикт "нарийн төвөгтэй таамаглал" илүү түгээмэл байдаг. Түүнчлэн, E i хүлээгдэж буй давтамжийг олохын тулд эхлээд нэг буюу хэд хэдэн хэмжигдэхүүнийг (загварын параметрүүдийг) тооцоолох шаардлагатай бөгөөд үүнийг зөвхөн туршилтын өгөгдлийг ашиглан хийж болно. Үүний үр дүнд "нарийн төвөгтэй таамаглал" -ын хувьд хүлээгдэж буй E i давтамжууд нь ажиглагдсан O i давтамжаас хамаардаг тул туршилтын үр дүнгээс хамааран өөр өөр байдаг санамсаргүй хэмжигдэхүүн болдог. Параметрүүдийг сонгох явцад Пирсон зай багасдаг - загвар ба туршилтын хоорондын тохиролцоог сайжруулахын тулд параметрүүдийг сонгосон. Тиймээс эрх чөлөөний зэрэглэлийн тоо буурах ёстой.

Загварын параметрүүдийг хэрхэн тооцоолох вэ? Үнэлгээний олон янзын аргууд байдаг - "хамгийн их магадлалтай арга", "моментийн арга", "орлуулах арга". Гэсэн хэдий ч та нэмэлт мөнгө ашиглах боломжгүй бөгөөд Pearson зайг багасгах замаар параметрийн тооцоог олох боломжгүй. Компьютерийн өмнөх эрин үед энэ аргыг бараг ашигладаггүй: гар аргаар тооцоолоход тохиромжгүй бөгөөд дүрмээр бол аналитик аргаар шийдвэрлэх боломжгүй юм. Компьютер дээр тооцоолохдоо тоон хэмжээг багасгах нь ихэвчлэн хялбар байдаг бөгөөд энэ аргын давуу тал нь олон талт байдал юм. Тиймээс, "хи-квадратыг багасгах арга" -ын дагуу бид үл мэдэгдэх параметрүүдийн утгыг сонгох бөгөөд ингэснээр Пирсоны зай хамгийн бага байх болно. (Дашрамд хэлэхэд, олсон минимумтай харьцуулахад бага хэмжээний шилжилттэй энэ зайд гарсан өөрчлөлтийг судалснаар та тооцооллын нарийвчлалын хэмжүүрийг тооцоолж болно: итгэлцлийн интервалыг бий болгох.) Параметрүүд болон энэ хамгийн бага зайг өөрөө олсны дараа энэ нь хангалттай бага эсэх талаар дахин хариулах шаардлагатай.

Үйлдлийн ерөнхий дараалал дараах байдалтай байна.

  1. Загвар сонгох (таамаглал H 0).
  2. Цифрүүдийг сонгох, ажиглагдсан давтамжийн векторыг тодорхойлох O i .
  3. Үл мэдэгдэх загварын параметрүүдийг тооцоолох, тэдгээрийн итгэлцлийн интервалыг бий болгох (жишээлбэл, Пирсоны хамгийн бага зайг хайх замаар).
  4. Хүлээгдэж буй давтамжийн тооцоо E i .
  5. Пирсоны X 2 зайны олсон утгыг хи-квадрат χ 2 критийн эгзэгтэй утгатай харьцуулах нь хамгийн том нь үнэмшилтэй хэвээр байгаа бөгөөд H 0-тэй нийцдэг. Бид тэгшитгэлийг шийдэж хүснэгтүүдээс χ 2 крит утгыг олно

P (χ 2 n > χ 2 crit)=1-α,

Энд α нь "ач холбогдлын түвшин" эсвэл "шалгуурын хэмжээ" эсвэл "эхний төрлийн алдааны хэмжээ" (ердийн утга α = 0.05).

Ихэвчлэн n эрх чөлөөний зэрэглэлийн тоог томъёогоор тооцоолдог

n = (цифрүүдийн тоо) – 1 – (тооцох параметрийн тоо)

Хэрэв X 2 > χ 2 crit бол H 0 таамаглалыг үгүйсгэж, үгүй ​​бол хүлээн зөвшөөрнө. α∙100% тохиолдолд (өөрөөр хэлбэл маш ховор) H 0-ийг шалгах энэ арга нь "эхний төрлийн алдаа" -д хүргэдэг: H 0 таамаглалыг буруугаар үгүйсгэх болно.

Жишээ. 100 үрийн 10 цуврал судалгаанд ногоон нүдтэй ялаагаар халдварласан хүмүүсийн тоог тоолжээ. Хүлээн авсан өгөгдөл: O i =(16, 18, 11, 18, 21, 10, 20, 18, 17, 21);

Энд хүлээгдэж буй давтамжийн вектор урьдаас тодорхойгүй байна. Хэрэв өгөгдөл нь нэгэн төрлийн бөгөөд бином тархалтаар авсан бол нэг параметр тодорхойгүй байна: халдвар авсан үрийн эзлэх хувь p. Анхны хүснэгтэд 10 холболтыг хангах 10 биш харин 20 давтамж байгааг анхаарна уу: 16+84=100, ... 21+79=100.

X 2 = (16-100p) 2 /100p +(84-100(1-p)) 2 /(100(1-p))+…+

(21-100p) 2 /100p +(79-100(1-p)) 2 /(100(1-p))

Нэр томьёог хосоор нь нэгтгэж (зоосны жишээн дээрх шиг) бид Пирсоны шалгуурыг бичих хэлбэрийг олж авдаг бөгөөд үүнийг ихэвчлэн шууд бичдэг.

X 2 = (16-100p) 2 /(100p(1-p))+…+ (21-100p) 2 /(100p(1-p)).

Одоо, хэрэв хамгийн бага Пирсон зайг p-ийг тооцоолох арга болгон ашиглаж байгаа бол X 2 = min байх p-г олох шаардлагатай. (Загвар нь боломжтой бол туршилтын өгөгдөлд "тохируулах" оролдлого хийдэг.)

Пирсоны шалгуур нь статистикт хэрэглэгддэг бүх шалгуур юм. Үүнийг нэг болон олон хувьсах өгөгдөл, тоон болон чанарын шинж чанаруудад хэрэглэж болно. Гэсэн хэдий ч түүний олон талт байдлаас шалтгаалан алдаа гаргахаас болгоомжлох хэрэгтэй.

Чухал цэгүүд

1. Ангилал сонгох.

  • Хэрэв хуваарилалт нь салангид байвал цифрийг сонгохдоо дур зоргоороо байдаггүй.
  • Хэрэв хуваарилалт тасралтгүй байвал дур зоргоороо байх нь гарцаагүй. Статистикийн хувьд тэнцүү блокуудыг ашиглаж болно (бүх O ижил байна, жишээ нь =10). Гэсэн хэдий ч интервалын урт нь өөр өөр байдаг. Гарын авлагын тооцоолол хийхдээ тэд интервалыг ижил болгохыг оролдсон. Нэг хувьсах шинж чанарын тархалтыг судлах интервалууд тэнцүү байх ёстой юу? Үгүй
  • Хүлээгдэж буй (мөн ажиглагдаагүй!) давтамж хэт бага биш (≥5) байхын тулд цифрүүдийг нэгтгэх ёстой. X 2-ийг тооцоолохдоо тэд (E i) хуваагчдад байдаг гэдгийг санацгаая! Нэг хэмжээст шинж чанарыг шинжлэхдээ E 1 =E max =1 гэсэн хоёр туйлын цифрээр энэ дүрмийг зөрчихийг зөвшөөрнө. Хэрэв цифрүүдийн тоо их, хүлээгдэж буй давтамж нь ойролцоо байвал X 2 нь E i =2-ийн хувьд ч гэсэн χ 2-ын сайн ойролцоо байна.

Параметрийн тооцоо. "Гэрээр хийсэн", үр дүнгүй үнэлгээний аргуудыг ашиглах нь Pearson зайны утгыг хэтрүүлэхэд хүргэдэг.

Эрх чөлөөний зэрэглэлийн тоог зөв сонгох. Хэрэв параметрийн тооцоог давтамжаас биш, харин өгөгдлөөс шууд хийсэн бол (жишээлбэл, арифметик дундажийг дундаж утгын тооцоо болгон авдаг) n-ийн эрх чөлөөний тодорхой тоо тодорхойгүй байна. Энэ нь тэгш бус байдлыг хангадаг гэдгийг л бид мэднэ:

(цифрүүдийн тоо - 1 - үнэлж буй параметрийн тоо)< n < (число разрядов – 1)

Тиймээс X 2-ийг энэ n мужид тооцоолсон χ 2 критийн чухал утгатай харьцуулах шаардлагатай.

Үл итгэмээргүй жижиг хи-квадрат утгыг хэрхэн тайлбарлах вэ?Зоос 10,000 шидсэний дараа 5,000 удаа төрийн сүлдэнд буувал тэгш хэмтэй гэж үзэх ёстой юу? Өмнө нь олон статистикчид H 0-ийг мөн үгүйсгэх ёстой гэж үздэг. Одоо өөр аргыг санал болгож байна: H 0-ийг хүлээн зөвшөөрөх боловч өгөгдөл, тэдгээрийн дүн шинжилгээ хийх аргачлалыг нэмэлт баталгаажуулалтад оруулна. Хоёр боломж бий: эсвэл Пирсоны зай хэт бага байна гэдэг нь загварын параметрүүдийн тоог нэмэгдүүлэх нь эрх чөлөөний зэрэглэлийг зохих ёсоор бууруулаагүй гэсэн үг юмуу эсвэл өгөгдөл өөрөө хуурамчаар хийгдсэн (магадгүй санамсаргүйгээр хүлээгдэж буй хэмжээнд тохируулсан байж магадгүй) үр дүн).

Жишээ.Хоёр судлаач А ба В моногибрид загалмайн AA * aa хоёр дахь үеийн рецессив гомозигот aa-ийн эзлэх хувийг тооцоолсон. Менделийн хуулиудын дагуу энэ бутархай нь 0.25 байна. Судлаач бүр 5 туршилт хийсэн бөгөөд туршилт бүрт 100 организмыг судалсан.

Үр дүн A: 25, 24, 26, 25, 24. Судлаачийн дүгнэлт: Менделийн хууль үнэн(?).

Үр дүн B: 29, 21, 23, 30, 19. Судлаачийн дүгнэлт: Менделийн хууль шударга бус байна(?).

Гэсэн хэдий ч Менделийн хууль нь статистик шинж чанартай бөгөөд үр дүнгийн тоон дүн шинжилгээ нь дүгнэлтийг өөрчилдөг! Таван туршилтыг нэг болгон нэгтгэснээр бид 5 зэрэглэлийн эрх чөлөө бүхий хи-квадрат тархалтад хүрнэ (энгийн таамаглалыг шалгасан):

X 2 A = ((25-25) 2 +(24-25) 2 +(26-25) 2 +(25-25) 2 +(24-25) 2)/(100∙0.25∙0.75)=0.16

X 2 B = ((29-25) 2 +(21-25) 2 +(23-25) 2 +(30-25) 2 +(19-25) 2)/(100∙0.25∙0.75)=5.17

Дундаж утга m [χ 2 n =5 ]=5, стандарт хазайлт σ[χ 2 n =5 ]=(2∙5) 1/2 =3.2.

Тиймээс, хүснэгтүүдийг дурдаагүй бол X 2 B-ийн утга нь ердийн, X 2 A-ийн утга нь үнэмшилгүй бага байх нь тодорхой байна. P хүснэгтийн дагуу (χ 2 n =5<0.16)<0.0001.

Энэ жишээ бол 1930-аад онд тохиолдсон бодит хэргийн дасан зохицох явдал юм (Колмогоровын "Менделийн хуулиудын өөр нэг нотолгооны тухай" бүтээлийг үзнэ үү). Судлаач А нь генетикийг дэмжигч байсан бол судлаач Б үүний эсрэг байсан нь сонирхолтой юм.

Тэмдэглэгээний төөрөгдөл.Тооцоолохдоо нэмэлт конвенц шаарддаг Пирсон зайг хи квадрат санамсаргүй хэмжигдэхүүний математикийн ойлголтоос ялгах шаардлагатай. Тодорхой нөхцөлд Пирсон зай нь n зэрэгтэй эрх чөлөөний хи-квадраттай ойролцоо тархалттай байна. Иймд Пирсон зайг χ 2 n тэмдгээр БИШ, харин ижил төстэй боловч өөр X 2 тэмдэглэгээг ашиглахыг зөвлөж байна.

Пирсоны шалгуур нь бүхнийг чадагч биш юм. H 0-ийн хязгааргүй олон хувилбарууд байдаг бөгөөд тэр үүнийг анхаарч үзэх боломжгүй юм. Та онцлог нь жигд тархалттай байсан гэсэн таамаглалыг шалгаж байна гэж бодъё, танд 10 орон байгаа бөгөөд ажиглагдсан давтамжийн вектор (130,125,121,118,116,115,114,113,111,110) тэнцүү байна. Пирсоны шалгуур нь давтамжууд нэг хэвийн буурч байгааг анзаарч чадахгүй бөгөөд H 0-ийг үгүйсгэхгүй. Хэрэв үүнийг цуврал шалгуураар нэмсэн бол тийм ээ!

23. Хи квадрат ба оюутны тархалтын тухай ойлголт, график дүрслэл

1) Эрх чөлөөний n зэрэгтэй тархалт (хи квадрат) нь n бие даасан стандарт хэвийн санамсаргүй хэмжигдэхүүний квадратуудын нийлбэрийн тархалтыг хэлнэ.

Тархалт (хи квадрат)- санамсаргүй хэмжигдэхүүний тархалт (мөн тус бүрийн математикийн хүлээлт 0, стандарт хазайлт нь 1)

санамсаргүй хэмжигдэхүүнүүд хаана байна бие даасан, ижил тархалттай. Энэ тохиолдолд нэр томъёоны тоог, өөрөөр хэлбэл, хи-квадрат тархалтын "чөлөөний зэрэглэлийн тоо" гэж нэрлэдэг. Хи-квадрат тоог нэг параметр буюу эрх чөлөөний зэрэглэлийн тоогоор тодорхойлно. Эрх чөлөөний зэрэглэлийн тоо нэмэгдэх тусам тархалт аажмаар хэвийн хэмжээнд ойртдог.

Дараа нь тэдгээрийн квадратуудын нийлбэр

k = n эрх чөлөөний зэрэгтэй хи-квадрат хуулийн дагуу тархсан санамсаргүй хэмжигдэхүүн; хэрэв нэр томьёо нь ямар нэг хамаарлаар (жишээ нь, ) хамааралтай бол эрх чөлөөний зэрэглэлийн тоо k = n – 1 байна.

Энэ хуваарилалтын нягтрал

Энд - гамма функц; ялангуяа Г(n + 1) = n! .

Тиймээс хи-квадрат тархалтыг нэг параметрээр тодорхойлно - эрх чөлөөний зэрэглэлийн тоо k.

Тайлбар 1. Чөлөөт байдлын зэрэг нэмэгдэхийн хэрээр хи квадратын тархалт аажмаар хэвийн хэмжээнд ойртож байна.

Тайлбар 2. Хи-квадрат тархалтыг ашиглан практикт учирч буй бусад олон тархалтыг, тухайлбал, санамсаргүй хэмжигдэхүүний тархалт - санамсаргүй векторын урт (X1, X2,..., Xn), координатыг тодорхойлдог. Эдгээр нь бие даасан бөгөөд ердийн хуулийн дагуу хуваарилагдсан.

χ2 тархалтыг анх Р.Хелмерт (1876), К.Пирсон (1900) нар авч үзсэн.

Math.expect.=n; D=2n

2) Оюутны хуваарилалт

Хоёр бие даасан санамсаргүй хэмжигдэхүүнийг авч үзье: Z нь хэвийн тархалттай ба нормчлогдсон (өөрөөр хэлбэл M(Z) = 0, σ(Z) = 1), k-тэй хи-квадрат хуулийн дагуу тархсан V V. эрх чөлөөний зэрэг. Дараа нь үнэ цэнэ

нь t-тархалт буюу Оюутны хуваарилалт гэж нэрлэгдэх k эрх чөлөөний зэрэгтэй тархалттай. Энэ тохиолдолд k-г Оюутны тархалтын “чөлөөний зэрэглэлийн тоо” гэж нэрлэдэг.

Эрх чөлөөний зэрэглэлийн тоо нэмэгдэхийн хэрээр Оюутны тархалт хэвийн хэмжээнд хурдан ойртдог.

Энэхүү хуваарилалтыг 1908 онд шар айрагны үйлдвэрт ажиллаж байсан Английн статистикч В.Госсет нэвтрүүлсэн. Энэ үйлдвэрт эдийн засаг, техникийн шийдвэр гаргахдаа магадлал, статистикийн аргыг ашигладаг байсан тул удирдлага нь В.Госсетийг өөрийн нэрээр шинжлэх ухааны өгүүлэл хэвлүүлэхийг хоригложээ. Ийнхүү В.Госсетийн боловсруулсан магадлалын болон статистикийн арга хэлбэрийн худалдааны нууц, “ноу-хау”-г хамгаалсан. Гэсэн хэдий ч түүнд "Оюутан" гэсэн нууц нэрээр хэвлэх боломж олдсон. Госсет-Оюутны түүхээс харахад 100 жилийн өмнө ч Их Британийн менежерүүд магадлал-статистикийн шийдвэр гаргах аргууд нь эдийн засгийн хувьд илүү үр дүнтэй болохыг мэддэг байсан.



Танд нийтлэл таалагдсан уу? Найзуудтайгаа хуваалцаарай!