Хи квадрат тестийг ашиглах. Статистикийн сонгодог аргууд: хи-квадрат тест

χ 2 шалгуурын зорилго - Пирсоны шалгуур χ 2 шалгуурыг хоёр зорилгоор ашигладаг: 1) шинж чанарын эмпирик тархалтыг онолын шинжтэй харьцуулах - жигд, хэвийн эсвэл бусад; 2) ижил шинж чанарын хоёр, гурав ба түүнээс дээш эмпирик тархалтыг харьцуулах.Шалгуурын тодорхойлолт χ 2 шалгуур нь ижил давтамжтай тохиолдох уу гэсэн асуултад хариулдаг. өөр өөр утгатайэмпирик болон онолын хуваарилалтэсвэл хоёр ба түүнээс дээш эмпирик хуваарилалтаар. Аргын давуу тал нь нэрсийн масштабаас эхлээд дурын масштабаар танилцуулсан шинж чанаруудын тархалтыг харьцуулах боломжийг олгодог. Маш ихэнгийн тохиолдол өөр хуваарилалт "тийм - үгүй", "гажиг зөвшөөрсөн - согогийг зөвшөөрөөгүй", "асуудлыг шийдсэн - асуудлыг шийдээгүй" гэх мэт. Бид аль хэдийн χ 2 шалгуурыг хэрэглэж болно.Хоёр харьцуулсан хуваарилалтын хоорондох зөрүү их байх тусам илүү их байна эмпирик ач холбогдолχ 2. χ 2 - Pearson шалгуурыг автоматаар тооцоолох χ 2 - Pearson шалгуурыг автоматаар тооцоолохын тулд та дараах хоёр алхамыг хийх ёстой.Алхам 1

. Эмпирик тархалтын тоог зааж өгөх (1-ээс 10 хүртэл); Алхам 2. Эмпирик давтамжийг хүснэгтэд оруулна уу;

Алхам 3

. Хариултаа аваарай. Пирсоны шалгуурын давуу тал нь түүний түгээмэл байдал юм: энэ нь таамаглалыг шалгахад ашиглаж болноянз бүрийн хууль хуваарилалт. 1. Хэвийн тархалтын таамаглалыг шалгах.Хангалттай том дээж авъя n-тай

их тоо өөр өөр утгатай 1 өөр өөр утгатай 2 … сонголт. Үүнийг боловсруулахад тав тухтай байхын тулд бид интервалыг сонголтын хамгийн багаас хамгийн том утга хүртэл хуваадаг

с Пирсоны шалгуурын давуу тал нь түүний түгээмэл байдал юм: энэ нь таамаглалыг шалгахад ашиглаж болно 1 Пирсоны шалгуурын давуу тал нь түүний түгээмэл байдал юм: энэ нь таамаглалыг шалгахад ашиглаж болно 2 … тэнцүү хэсгүүд байх ба интервал бүрт хамаарах сонголтуудын утгууд нь интервалын дундыг зааж буй тоотой ойролцоогоор тэнцүү байна гэж бид таамаглах болно. Интервал бүрт багтах сонголтуудын тоог тоолсноор бид бүлэглэсэн түүврийг бий болгоно. ,

сонголтууд ……….. Xх с давтамж ………….н с Хаана x i



интервалуудын дунд цэгүүдийн утгууд ба n i - багтсан сонголтуудын тооби хүн амдаяар тархсан ердийн хуульпараметрүүдтэй М(X) = , Д(X) =. Дараа нь та түүврийн хэмжээнээс тооны тоог олох боломжтой Пирсоны шалгуурын давуу тал нь түүний түгээмэл байдал юм: энэ нь таамаглалыг шалгахад ашиглаж болно, энэ таамаглалын дагуу интервал бүрт гарч ирэх ёстой (өөрөөр хэлбэл онолын давтамж). Үүнийг хийхийн тулд Лаплас функцийн утгуудын хүснэгтийг ашиглан бид орох магадлалыг олно Хаана th интервал:

,

сонголтууд ……….. мөн биТэгээд б би- хил хязгаар би-р интервал. Олж авсан магадлалыг түүврийн хэмжээ n-ээр үржүүлснээр бид онолын давтамжийг олно. p i =n·p i.Бидний зорилго бол мэдээжийн хэрэг өөр хоорондоо ялгаатай эмпирик болон онолын давтамжийг харьцуулж, эдгээр ялгаа нь ач холбогдолгүй бөгөөд судлагдсаны хэвийн тархалтын таамаглалыг үгүйсгэхгүй эсэхийг олж мэдэх явдал юм. санамсаргүй хувьсагч, эсвэл тэдгээр нь маш том тул энэ таамаглалтай зөрчилддөг. Энэ зорилгоор санамсаргүй хэмжигдэхүүн хэлбэрийн шалгуурыг ашигладаг

. (20.1)

Үүний утга нь тодорхой байна: хазайлтын квадратууд болох хэсгүүдийг нэгтгэн дүгнэв эмпирик давтамжуудонолын давтамжаас харгалзах онолын давтамжаас бүрддэг. Хүн амын бодит тархалтын хуулиас үл хамааран санамсаргүй хэмжигдэхүүний (20.1) тархалтын хууль нь эрх чөлөөний зэрэгтэй тархалтын хууль (12-р лекцийг үзнэ үү) руу чиглэдэг болохыг баталж болно. k = s - 1 – r, Хаана r– түүврийн өгөгдлөөр тооцоолсон хүлээгдэж буй тархалтын параметрүүдийн тоо. Тиймээс хэвийн тархалт нь хоёр параметрээр тодорхойлогддог k = s - 3. Сонгосон шалгуурын хувьд нөхцөлөөр тодорхойлогддог баруун талын эгзэгтэй мужийг байгуулна

(20.2)

сонголтууд ……….. α - ач холбогдлын түвшин. Үүний үр дүнд эгзэгтэй бүсийг тэгш бус байдлаар өгнө ба таамаглалыг хүлээн авах талбар нь .

Тиймээс тэг таамаглалыг шалгах Н 0: популяци хэвийн тархсан - та түүврээс шалгуур үзүүлэлтийн ажиглагдсан утгыг тооцоолох хэрэгтэй.

, (20.1`)

ба тархалтын эгзэгтэй цэгүүдийн хүснэгтээс χ 2 олно чухал цэгашиглах мэдэгдэж байгаа үнэ цэнэα ба k = s - 3. Хэрэв - тэг таамаглалыг хүлээн зөвшөөрч, татгалзвал.

2. Нэг төрлийн тархалтын таамаглалыг шалгах.

Тооцоолсон магадлалын нягтаршилтай хүн ам жигд тархсан гэсэн таамаглалыг шалгахын тулд Пирсон тестийг ашиглахдаа

Боломжтой дээжээс утгыг тооцоолсны дараа параметрүүдийг тооцоолох шаардлагатай АТэгээд бтомъёоны дагуу:

сонголтууд ……….. А*Тэгээд б*- үнэлгээ АТэгээд б. Үнэхээр, төлөө жигд хуваарилалт М(X) = , , тодорхойлох системийг хаанаас авах боломжтой А*Тэгээд б*: , шийдэл нь илэрхийллүүд (20.3).

Дараа нь тэгж тооцвол , та томъёог ашиглан онолын давтамжийг олох боломжтой

Энд n– дээжийг хуваах интервалын тоо.

Пирсоны шалгуурын ажиглагдсан утгыг (20.1`) томъёогоор, эгзэгтэй утгыг хүснэгтээр тооцож, эрх чөлөөний зэрэглэлийн тоог харгалзан үзнэ. k = s - 3. Үүний дараа эгзэгтэй бүсийн хил хязгаарыг хэвийн тархалтын таамаглалыг шалгахтай адил тодорхойлно.

3. Экспоненциал тархалтын талаарх таамаглалыг шалгах.

Энэ тохиолдолд одоо байгаа дээжийг ижил урттай интервалд хувааж, бие биенээсээ ижил зайтай сонголтуудын дарааллыг авч үзье (бид үүнд хамаарах бүх сонголтууд гэж үздэг. Хаана- th интервал, түүний дундажтай давхцаж буй утгыг авна уу), тэдгээрийн харгалзах давтамж n i(түүний сонголтуудын тоо Хаана- th интервал). Эдгээр өгөгдлүүдээс тооцоолж, параметрийн тооцооллыг авч үзье λ хэмжээ. Дараа нь онолын давтамжийг томъёогоор тооцоолно

Дараа нь ажиглагдсан ба чухал үнэ цэнэПирсоны шалгуур нь эрх чөлөөний зэрэглэлийн тоог харгалзан үздэг k = s - 2.

1. Харьцуулж болох үзүүлэлтүүдийг хэмжинэ нэрлэсэн масштаб(жишээлбэл, өвчтөний хүйс нь эрэгтэй эсвэл эмэгтэй) эсвэл дотор дараалал(жишээлбэл, артерийн гипертензийн зэрэг, 0-ээс 3 хүртэлх утгыг авна).

2. Энэ аргахүчин зүйл ба үр дүн нь хоёртын хувьсагч, өөрөөр хэлбэл зөвхөн хоёр хувьсагч байх үед зөвхөн дөрвөн талбарын хүснэгтэд дүн шинжилгээ хийх боломжийг танд олгоно. боломжит утгууд(жишээлбэл, эрэгтэй, эмэгтэй хүйс, анамнезид тодорхой өвчин байгаа эсэх ...). Хүчин зүйл ба (эсвэл) үр дүн нь гурав ба түүнээс дээш утгыг авах тохиолдолд олон талбарт хүснэгтэд дүн шинжилгээ хийх тохиолдолд Пирсон хи-квадрат тестийг ашиглаж болно.

3. Харьцуулсан бүлгүүд нь бие даасан байх ёстой, өөрөөр хэлбэл “өмнө-дараа” ажиглалтыг харьцуулахдаа хи-квадрат тестийг ашиглаж болохгүй. МакНемарын тест(холбоотой хоёр популяцийг харьцуулах үед) эсвэл тооцоолсон Кочраны Q тест(гурав ба түүнээс дээш бүлгийг харьцуулах тохиолдолд).

4. Дөрвөн талбарт хүснэгтэд дүн шинжилгээ хийх үед хүлээгдэж буй утгууднүд бүр дор хаяж 10 байх ёстой. Хэрэв дор хаяж нэг нүдэнд хүлээгдэж буй үзэгдэл 5-аас 9 хүртэлх утгыг авч байвал хи-квадрат тестийг тооцоолох шаардлагатай. Йейтсийн нэмэлт өөрчлөлтөөр. Хэрэв дор хаяж нэг нүдэнд хүлээгдэж буй үзэгдэл 5-аас бага байвал шинжилгээг ашиглах ёстой Фишерийн нарийн тест.

5. Олон талбарт хүснэгтэд дүн шинжилгээ хийхдээ хүлээгдэж буй ажиглалтын тоо 20%-иас дээш нүдэнд 5-аас багагүй байна.

Хи-квадрат тестийг тооцоолохын тулд та дараахь зүйлийг хийх хэрэгтэй.

1. Хүлээгдэж буй ажиглалтын тоог тооцоолмөр, баганын нийлбэрийг үржүүлж, дараа нь гарсан үр дүнг хуваах замаар (харилцаа байхгүй гэсэн тэг таамаглалын үнэн зөвийг харгалзан) болзошгүй хүснэгтийн нүд бүрийн хувьд нийт тооажиглалт. Ерөнхий үзэлХүлээгдэж буй утгуудын хүснэгтийг доор үзүүлэв.

Үр дүн байна (1) Үр дүн байхгүй (0) Нийт
Эрсдлийн хүчин зүйл байдаг (1) (A+B)*(A+C) / (A+B+C+D) (A+B)*(B+D)/ (A+B+C+D) A+B
Эрсдлийн хүчин зүйл байхгүй (0) (C+D)*(A+C)/ (A+B+C+D) (C+D)*(B+D)/ (A+B+C+D) C+D
Нийт A+C B+D A+B+C+D

2. χ 2 шалгуурын утгыг олох By дараах томъёо:

сонголтууд ……….. Хаана- мөрийн дугаар (1-ээс r хүртэл), j- баганын дугаар (1-ээс c хүртэл), О ij– ij нүдэн дэх ажиглалтын бодит тоо, Э ij– ij нүдэнд хүлээгдэж буй ажиглалтын тоо.

Хүлээгдэж буй үзэгдлийн тоо дор хаяж нэг нүдэнд 10-аас бага байвал дөрвөн талбарын хүснэгтэд дүн шинжилгээ хийхдээ үүнийг тооцоолох хэрэгтэй. Йейтс залруулга бүхий хи-квадрат тест. Энэхүү нэмэлт өөрчлөлт нь 1-р төрлийн алдаа гарах магадлалыг бууруулж, өөрөөр хэлбэл ялгаа байхгүй тохиолдолд алдааг илрүүлэх боломжийг олгодог. Йейтсийн залруулга нь 0.5-ыг хасах явдал юм үнэмлэхүй үнэ цэнэнүд тус бүрийн бодит болон хүлээгдэж буй ажиглалтын тоо хоорондын зөрүү бөгөөд энэ нь хи-квадрат тестийн үнэ цэнийг бууруулахад хүргэдэг.

Yates засварын тусламжтайгаар χ 2 шалгуурыг тооцоолох томъёо нь дараах байдалтай байна.

3. Эрх чөлөөний зэрэглэлийн тоог тодорхойлохтомъёоны дагуу: f = (r – 1) × (c – 1). Үүний дагуу 2 мөр (r = 2) ба 2 багана (c = 2) бүхий дөрвөн талбарт хүснэгтийн хувьд эрх чөлөөний зэрэглэлийн тоо f 2x2 = (2 - 1)*(2 - 1) = 1 байна.

4. Бид χ 2 шалгуурын утгыг чухал утгатай харьцуулна f эрх чөлөөний зэрэглэлийн тоогоор (хүснэгтийн дагуу).

Энэ алгоритмдөрвөн талбар болон олон талбарт хүснэгтэд аль алинд нь хамаарна.

Пирсоны хи-квадрат тестийн утгыг хэрхэн тайлбарлах вэ?

Хэрэв χ 2 шалгуурын олж авсан утга нь эгзэгтэй утгаас их байвал судлагдсан эрсдэлийн хүчин зүйл болон үр дүнгийн хооронд зохих түвшний ач холбогдлын статистик хамаарал байгаа гэж бид дүгнэж байна.

Пирсоны хи-квадрат тестийг тооцоолох жишээ

Тодорхойлъё статистикийн ач холбогдолДээр дурдсан хүснэгтийн дагуу артерийн гипертензийн өвчлөлд тамхи татах хүчин зүйлийн нөлөөлөл:

1. Нүд бүрийн хүлээгдэж буй утгыг тооцоолно уу:

2. Пирсоны хи-квадрат тестийн утгыг ол:

χ 2 = (40-33.6) 2 /33.6 + (30-36.4) 2 /36.4 + (32-38.4) 2 /38.4 + (48-41.6) 2 /41.6 = 4.396.

3. Эрх чөлөөний зэрэглэлийн тоо f = (2-1)*(2-1) = 1. Хүснэгтийг ашиглан бид ач холбогдлын түвшинд p=0.05 болон эрх чөлөөний зэрэглэлийн тоо 1 нь 3.841.

4. Бид хи-квадрат тестийн олж авсан утгыг чухал үзүүлэлттэй харьцуулж үздэг: 4.396 > 3.841, иймээс артерийн гипертензийн өвчлөл нь тамхи татах эсэхээс хамаарах нь статистикийн хувьд чухал юм. Энэ харилцааны ач холбогдлын түвшин p-тэй тохирч байна<0.05.

Эрх чөлөөний зэрэглэлийн тоо, f p=0.05 үед χ 2 p=0.01 үед χ 2
3.841 6.635
5.991 9.21
7.815 11.345
9.488 13.277
11.07 15.086
12.592 16.812
14.067 18.475
15.507 20.09
16.919 21.666
18.307 23.209
19.675 24.725
21.026 26.217
22.362 27.688
23.685 29.141
24.996 30.578
26.296
27.587 33.409
28.869 34.805
30.144 36.191
31.41 37.566

Энэ тэмдэглэлд χ 2 тархалтыг тогтмол магадлалын тархалттай өгөгдлийн багцын нийцтэй байдлыг шалгахад ашигладаг. Гэрээний шалгуур нь ихэвчлэн ОТаныг тодорхой ангилалд хамаарах давтамжтай харьцуулж, өгөгдөл нь үнэхээр тодорхой тархалттай байсан бол онолын хувьд хүлээгдэж буй давтамжтай харьцуулна.

χ 2-ийн сайн чанарын шалгуурыг ашиглан туршилтыг хэд хэдэн үе шаттайгаар гүйцэтгэдэг. Нэгдүгээрт, тодорхой магадлалын тархалтыг тодорхойлж, анхны өгөгдөлтэй харьцуулна. Хоёрдугаарт, сонгосон магадлалын тархалтын параметрүүдийн талаар таамаглал дэвшүүлж (жишээлбэл, түүний математик хүлээлт) эсвэл тэдгээрийн үнэлгээг хийдэг. Гуравдугаарт, онолын тархалтад үндэслэн ангилал тус бүрт тохирох онолын магадлалыг тодорхойлно. Эцэст нь χ2 тестийн статистикийг өгөгдөл ба тархалтын нийцтэй байдлыг шалгахад ашигладаг.

сонголтууд ……….. f 0- ажиглагдсан давтамж, f e- онолын эсвэл хүлээгдэж буй давтамж, к- нэгтгэсний дараа үлдсэн ангиллын тоо, r- тооцоолох параметрийн тоо.

Тэмдэглэлийг эсвэл форматаар, жишээнүүдийг форматаар татаж аваарай

Пуассоны тархалтад χ2-ийн сайн чанарын тестийг ашиглах

Excel-д энэ томъёог ашиглан тооцоолохын тулд =SUMPRODUCT() функцийг ашиглах нь тохиромжтой (Зураг 1).

Параметрийг тооцоолох λ Та тооцоог ашиглаж болно . Онолын давтамж Xпараметрт тохирох амжилт (X = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ба түүнээс дээш) λ = 2.9-ийг =POISSON.DIST(X;;FALSE) функцийг ашиглан тодорхойлж болно. Пуассоны магадлалыг түүврийн хэмжээгээр үржүүлэх n, бид онолын давтамжийг авдаг f e(Зураг 2).

Цагаан будаа. 2. Нэг минутанд ирэх бодит болон онолын хувь хэмжээ

Зураг дээр дурдсанчлан. 2, есөн ба түүнээс дээш ирэлтийн онолын давтамж 1.0-ээс хэтрэхгүй. Ангилал бүр 1.0 ба түүнээс дээш давтамжтай байхын тулд "9 ба түүнээс дээш" ангилалыг "8" ангилалтай хослуулах хэрэгтэй. Өөрөөр хэлбэл, есөн ангилал (0, 1, 2, 3, 4, 5, 6, 7, 8 ба түүнээс дээш) хэвээр байна. Пуассоны тархалтын математик хүлээлтийг түүврийн өгөгдөл дээр үндэслэн тодорхойлдог тул эрх чөлөөний зэрэг нь k – p – 1 = 9 – 1 – 1 = 7 байна. 0.05-ын ач холбогдлын түвшинг ашиглан бид =CHI2.OBR(1-0.05;7) = 14.067 томъёогоор 7 зэрэглэлийн эрх чөлөө бүхий χ 2 статистикийн эгзэгтэй утга. Шийдвэрлэх дүрмийг дараах байдлаар томъёолсон: таамаглал H 0χ 2 > 14.067 бол таамаглалыг үгүйсгэнэ H 0хазайдаггүй.

χ 2-ийг тооцоолохын тулд бид (1) томъёог ашиглана (Зураг 3).

Цагаан будаа. 3. χ 2-ийн тооцоо - Пуассоны тархалтын сайн чанарын шалгуур.

χ 2 = 2.277 тул< 14,067, следует, что гипотезу H 0татгалзах боломжгүй. Өөрөөр хэлбэл, банкинд үйлчлүүлэгчид ирэх нь Пуассоны хуваарилалтыг дагаж мөрддөггүй гэж бид нотлох шалтгаан байхгүй.

Хэвийн тархалтад χ 2 - тохирох байдлын тестийг хэрэглэх

Өмнөх тэмдэглэлд тоон хувьсагчдын талаархи таамаглалыг шалгахдаа бид судалж буй хүн амын тархалт хэвийн байна гэж үзсэн. Энэ таамаглалыг шалгахын тулд та график хэрэгслийг ашиглаж болно, жишээлбэл, хайрцагны график эсвэл ердийн тархалтын график (дэлгэрэнгүй мэдээллийг үзнэ үү). At их хэмжээний эзэлхүүндээжийн хувьд эдгээр таамаглалыг шалгахын тулд та хэвийн тархалтын хувьд χ 2 сайн чанарын тестийг ашиглаж болно.

158 хөрөнгө оруулалтын сангийн 5 жилийн өгөөжийн талаарх мэдээллийг жишээ болгон авч үзье (Зураг 4). Та өгөгдөл хэвийн тархсан эсэхэд итгэхийг хүсч байна гэж бодъё. Тэг ба альтернатив таамаглалыг дараах байдлаар томъёолсон болно. H 0: 5 жилийн өгөөж нь хэвийн тархалтын дагуу, H 1: 5 жилийн ургац нь хэвийн тархалтыг дагаж мөрддөггүй. Хэвийн тархалт нь хоёр параметртэй байдаг - математикийн хүлээлт μ ба стандарт хазайлтσ, түүврийн өгөгдөлд үндэслэн тооцоолж болно. IN энэ тохиолдолд = 10.149 ба С = 4,773.

Цагаан будаа. 4. 158 сангийн таван жилийн дундаж жилийн өгөөжийн мэдээллийг агуулсан эрэмбэлэгдсэн массив

Сангийн өгөөжийн талаархи мэдээллийг жишээлбэл, 5% -ийн өргөнтэй ангиуд (интервал) болгон бүлэглэж болно (Зураг 5).

Цагаан будаа. 5. 158 сангийн таван жилийн дундаж жилийн өгөөжийн давтамжийн хуваарилалт

Хэвийн тархалт тасралтгүй байдаг тул хэвийн тархалтын муруйгаар хязгаарлагдсан тоонуудын талбай болон интервал бүрийн хил хязгаарыг тодорхойлох шаардлагатай. Нэмж дурдахад, хэвийн тархалт нь онолын хувьд –∞-аас +∞ хооронд хэлбэлздэг тул ангийн хилээс гадуур байрлах хэлбэрийн талбайг харгалзан үзэх шаардлагатай. Тэгэхээр -10 цэгийн зүүн талд байгаа хэвийн муруйн доорх талбай нь Z утгын зүүн талд байгаа стандартчилагдсан хэвийн муруйн доор байрлах зургийн талбайтай тэнцүү байна.

Z = (–10 – 10,149) / 4,773 = –4,22

Z = –4.22 утгын зүүн талд байгаа стандартчилагдсан хэвийн муруйн доор байрлах зургийн талбайг =NORM.DIST(-10;10.149;4.773;ҮНЭН) томъёогоор тодорхойлж, ойролцоогоор 0.00001-тэй тэнцүү байна. -10 ба -5 цэгүүдийн хоорондох хэвийн муруйн дор байрлах зургийн талбайг тооцоолохын тулд эхлээд -5 цэгийн зүүн талд байрлах зургийн талбайг тооцоолох хэрэгтэй: =NORM.DIST( -5,10.149,4.773,ҮНЭН) = 0.00075 . Тэгэхээр -10 ба -5 цэгүүдийн хоорондох хэвийн муруй дор байрлах зургийн талбай нь 0.00075 - 0.00001 = 0.00074 байна. Үүний нэгэн адил та анги бүрийн хил хязгаараар хязгаарлагдсан зургийн талбайг тооцоолж болно (Зураг 6).

Цагаан будаа. 6. 5 жилийн өгөөжийн анги тус бүрийн бүс нутаг, хүлээгдэж буй давтамж

Эндээс харахад дөрвөн туйлын ангиллын онолын давтамж (хоёр хамгийн бага ба хоёр хамгийн их) 1-ээс бага байгаа тул бид 7-р зурагт үзүүлсэн шиг ангиудыг нэгтгэх болно.

Цагаан будаа. 7. Хэвийн тархалтын хувьд χ 2-ийн сайн чанарын тестийг ашиглахтай холбоотой тооцоолол.

Бид өгөгдөлтэй тохиролцохдоо χ 2 шалгуурыг ашигладаг хэвийн тархалт(1) томъёог ашиглан. Бидний жишээн дээр нэгтгэсний дараа зургаан анги үлддэг. Хүлээгдэж буй утга ба стандарт хазайлтыг түүврийн өгөгдлөөс тооцдог тул эрх чөлөөний градусын тоо байна кх – 1 = 6 – 2 – 1 = 3. 0.05-ын ач холбогдлын түвшинг ашиглан бид гурван зэрэглэлийн эрх чөлөөтэй χ 2 статистикийн критик утга = CI2.OBR(1-0.05;F3) = 7.815 болохыг олж мэдэв. χ 2-ийн сайн чанарын шалгуурыг ашиглахтай холбоотой тооцооллыг Зураг дээр үзүүлэв. 7.

χ 2 -статистик = 3.964 болохыг харж болно< χ U 2 7,815, следовательно гипотезу H 0татгалзах боломжгүй. Өөрөөр хэлбэл, өндөр өсөлтөд чиглэсэн хөрөнгө оруулалтын сангуудын 5 жилийн өгөөж нь хэвийн хуваарилалтад хамаарахгүй гэж бидэнд хэлэх үндэслэл байхгүй.

Хэд хэдэн хамгийн сүүлийн үеийн тэмдэглэлүүдавч үзсэн өөр өөр хандлагаангилсан өгөгдөлд дүн шинжилгээ хийх. Хоёр ба түүнээс дээш бие даасан түүврийн шинжилгээнээс олж авсан ангиллын өгөгдлийн талаархи таамаглалыг шалгах аргуудыг тайлбарласан болно. Хи-квадрат тестээс гадна параметрийн бус процедурыг авч үздэг. Wilcoxon зэрэглэлийн тестийг тайлбарласан бөгөөд энэ нь өргөдлийн нөхцөл хангаагүй тохиолдолд хэрэглэгддэг т-тэгш байдлын таамаглалыг шалгах шалгуур математикийн хүлээлтбие даасан хоёр бүлэг, түүнчлэн нэг хүчин зүйлийн өөр хувилбар болох Крускал-Уоллис тест дисперсийн шинжилгээ(Зураг 8).

Цагаан будаа. 8. Блок диаграмангилсан өгөгдлийн талаархи таамаглалыг шалгах арга

Левин нар Менежерүүдэд зориулсан статистик номны материалыг ашигласан. – М.: Уильямс, 2004. – х. 763–769

Хэрэв χ 2 шалгуурын олж авсан утга нь эгзэгтэй утгаас их байвал судлагдсан эрсдэлийн хүчин зүйл болон үр дүнгийн хооронд зохих түвшний ач холбогдлын статистик хамаарал байгаа гэж бид дүгнэж байна.

Пирсоны хи-квадрат тестийг тооцоолох жишээ

Артерийн гипертензийн өвчлөлд тамхи татах хүчин зүйлийн нөлөөллийн статистик ач холбогдлыг дээр дурдсан хүснэгтийг ашиглан тодорхойлъё.

1. Нүд бүрийн хүлээгдэж буй утгыг тооцоолно уу:

2. Пирсоны хи-квадрат тестийн утгыг ол:

χ 2 = (40-33.6) 2 /33.6 + (30-36.4) 2 /36.4 + (32-38.4) 2 /38.4 + (48-41.6) 2 /41.6 = 4.396.

3. Эрх чөлөөний зэрэглэлийн тоо f = (2-1)*(2-1) = 1. Хүснэгтийг ашиглан бид ач холбогдлын түвшинд p=0.05 болон эрх чөлөөний зэрэглэлийн тоо 1 нь 3.841.

4. Бид хи-квадрат тестийн олж авсан утгыг чухал үзүүлэлттэй харьцуулж үздэг: 4.396 > 3.841, иймээс артерийн гипертензийн өвчлөл нь тамхи татах эсэхээс хамаарах нь статистикийн хувьд чухал юм. Энэ харилцааны ач холбогдлын түвшин p-тэй тохирч байна<0.05.

Мөн Pearson chi-square тестийг томъёогоор тооцоолно

Гэхдээ 2х2 хүснэгтийн хувьд Йейтесийн залруулгын шалгуураар илүү нарийвчлалтай үр дүнг олж авдаг

Хэрэв Тэр N(0)хүлээн зөвшөөрсөн,

тохиолдолд хүлээн зөвшөөрсөн H(1)

Ажиглалтын тоо бага, хүснэгтийн нүднүүд 5-аас бага давтамжтай байвал хи-квадрат тестийг ашиглах боломжгүй бөгөөд таамаглалыг шалгахад ашигладаг. Фишерийн нарийн тест . Энэ шалгуурыг тооцоолох журам нь нэлээд хөдөлмөр их шаарддаг бөгөөд энэ тохиолдолд компьютерийн статистик шинжилгээний програмуудыг ашиглах нь дээр.

Болзошгүй байдлын хүснэгтийг ашиглан та чанарын хоёр шинж чанарын хоорондох холболтын хэмжүүрийг тооцоолж болно - энэ бол Yule холбооны коэффициент юм. Q (корреляцийн коэффициенттэй адил)

Q 0-ээс 1 хүртэлх мужид оршдог. Нэгтэй ойролцоо коэффициент нь шинж чанаруудын хооронд хүчтэй холбоо байгааг илтгэнэ. Хэрэв тэгтэй тэнцүү бол холболт байхгүй болно .

Үүнтэй адилаар phi-квадрат коэффициент (φ 2) ашигладаг

ЖИШИГ ДААЛГАВАР

Хүснэгтэнд хооллолттой болон хооллолтгүй Дрозофилагийн бүлгүүдийн мутацийн давтамж хоорондын хамаарлыг дүрсэлсэн болно



Болзошгүй байдлын хүснэгтийн шинжилгээ

Болзошгүй байдлын хүснэгтэд дүн шинжилгээ хийхийн тулд H 0 таамаглал дэвшүүлсэн, өөрөөр хэлбэл, судалгааны үр дүнд судалж буй шинж чанар нь нөлөөлөлгүй байхын тулд хүлээгдэж буй давтамжийг тооцоолж, хүлээлтийн хүснэгтийг байгуулна.

Хүлээлгийн ширээ

бүлгүүд Чило үр тариа Нийт
Мутаци өгсөн Мутаци өгөөгүй
Бодит давтамж Хүлээгдэж буй давтамж Бодит давтамж Хүлээгдэж буй давтамж
Хооллохтой хамт
Хооллохгүйгээр
нийт

Арга №1

Хүлээх давтамжийг тодорхойлох:

2756 - X ;

2. 3561 – 3124

Хэрэв бүлгүүдийн ажиглалтын тоо бага бол X 2-г ашиглахдаа дискрет тархалтын бодит болон хүлээгдэж буй давтамжийг харьцуулах тохиолдолд алдаатай байдлыг багасгахын тулд Йейтс засварыг ашиглана.

Энэ нийтлэл нь Chi квадрат шалгуурыг зарчмын хувьд хэрхэн тооцоолох талаар хариулдаггүй бөгөөд түүний зорилго нь хэрхэн автоматжуулахыг харуулах явдал юм Excel дээр хи квадратын тооцоолол, Chi квадрат шалгуурыг тооцоолох ямар функцууд байдаг. Учир нь танд үргэлж SPSS эсвэл R програм байдаггүй.
Нэг ёсондоо, энэ бол Хүний нөөцийн аналитик семинарт оролцогчдод сануулга, зөвлөгөө юм, та эдгээр аргуудыг ажилдаа ашиглаарай гэж найдаж байна, энэ нийтлэл нь бас нэг зөвлөгөө байх болно.
Би файлыг татаж авах холбоосоор хангаагүй ч та миний өгсөн жишээ хүснэгтүүдийг хялбархан хуулж, миний өгсөн өгөгдөл, томьёог дагаж болно.

Танилцуулга

Жишээлбэл, бид аж ахуйн нэгжийн судалгааны үр дүнгийн хуваарилалтын бие даасан байдлыг (санамсаргүй / санамсаргүй бус) шалгахыг хүсч байна, үүнд санал асуулгын аль ч асуултын хариултыг мөрөнд, баганад уртаар хуваарилах болно. үйлчилгээ.

Таны өгөгдлийг нэгтгэх хүснэгтэд, жишээлбэл, энэ хэлбэрээр хураангуйлах үед та пивот хүснэгтээр дамжуулан Чи квадратыг тооцоолоход очно.
Хүснэгт №1

1 жилээс бага

Мөрөөр нийлбэр

Баганаар нийлбэр

Excel дээр Chi квадратыг тооцоолохын тулд дараах томьёо байдаг

CHI2.ТУРШИЛТ

CH2.TEST томьёо нь тархалтын бие даасан (санамсаргүй/санамсаргүй) магадлалыг тооцдог.

Синтакс нь иймэрхүү байна

CHI2.TEST(бодит_интервал, хүлээгдэж буй_интервал)

Манай тохиолдолд бодит интервал нь хүснэгтийн агуулга, i.e.

Тэдгээр. Эмпирик ба хүлээгдэж буй (эсвэл онолын давтамж) гэсэн хоёр хүснэгтийг хүлээн авсны дараа бид ялгааг олж авах, квадрат болон бусад тооцоолол хийх, мөн чухал утгуудын хүснэгтийг шалгах ажлаасаа чөлөөлөгддөг.

Манай тохиолдолд CHI2.DIST.PH = 0.000466219908895455, CHI2.TEST-ийн жишээн дээрх шиг.

Анхаарна уу

Excel дээр Chi квадратыг тооцоолох энэхүү томъёо нь 2X2 хэмжээтэй хүснэгтийг тооцоолоход тохиромжтой, учир нь та өөрөө Чи квадратыг эмпирик гэж үздэг бөгөөд тооцоололд тасралтгүй байдлын залруулга оруулж чаддаг.

Тайлбар 2

Мөн CHI2.DIST томъёо байдаг (та үүнийг excel дээр зайлшгүй харах болно) - энэ нь зүүн талын магадлалыг тооцоолдог (энгийнээр хэлбэл, зүүн талыг 1 гэж үздэг - баруун гартай, өөрөөр хэлбэл бид зүгээр л эргүүлдэг. Томъёо дууссан тул би үүнийг Chi квадратын тооцоонд өгөөгүй, бидний жишээнд CHI2.DIST = 0.999533780091105 байна.
Нийт CH2.DIST + CH2.DIST.PH = 1.

CH2.OBR.PH

Хи-квадрат тархалтын баруун сүүлт магадлалын урвуу утгыг буцаана (эсвэл зүгээр л тодорхой магадлалын түвшин болон эрх чөлөөний зэрэглэлийн тооны хи-квадрат утга)

Синаксис

CH2.OBR.PH(магадлал;чөлөөний_зэрэг)

Дүгнэлт

Үнэнийг хэлэхэд, ямар үр дүнд хүрсэн талаар үнэн зөв мэдээлэл надад алга Excel дээр хи квадратын тооцоолол SPSS дээрх Хи квадратын үр дүнгээс ялгаатай. Би яг ойлгож байна. Чи квадратыг бие даан тооцоолохдоо утгууд нь бөөрөнхийлж, тодорхой тооны аравтын бутархай алга болдог тул тэдгээр нь ялгаатай байдаг. Гэхдээ би үүнийг шүүмжлэлтэй гэж бодохгүй байна. Би зөвхөн Чи квадратын тархалтын магадлал 0.05 босго (p-утга) ойрхон байгаа тохиолдолд л өөрийгөө даатгахыг зөвлөж байна.

Тасралтгүй байдлын засварыг тооцохгүй байгаа нь тийм ч таатай биш юм - бид 2X2 хүснэгтэд маш их тооцоолдог. Тиймээс бид 2X2 хүснэгтийг тооцоолоход бараг ямар ч оновчлолд хүрдэггүй

Гэсэн хэдий ч дээрх мэдлэг нь илүү чухал зүйлд цаг хэмнэхийн тулд Excel дээр Chi квадратын тооцоог бага зэрэг хурдан хийхэд хангалттай гэж би бодож байна.



Танд нийтлэл таалагдсан уу? Найзуудтайгаа хуваалцаарай!