Буудлагын үеэр цохилт өгөх магадлалын талаархи асуудлыг шийдвэрлэх. Үйл явдлын магадлал, статистикийн тархалтыг тодорхойлох

Шалгуур үзүүлэлтийн тодорхойлолт

Шалгуурын зорилго

Пирсоны хи-квадрат тест

Лекцийн материал

Сэдэв 6. Шинж тэмдгийн тархалтын ялгааг тодорхойлох

Пирсоны шалгуур: шалгуурын зорилго, түүний тодорхойлолт, хэрэглээний хамрах хүрээ, тооцоолох алгоритм.

Үр дүнг харьцуулах Колмогоров-Смирновын тест тоон хэмжилт: шалгуур үзүүлэлтийн зорилго, түүний тодорхойлолт, хамрах хүрээ, тооцоолох алгоритм.

Энэ сэдвийг судлахдаа хоёр шалгуур үзүүлэлт нь давтамжтай ажилладаг гэдгийг анхаарч үзэх хэрэгтэй. Та төлнө үү Онцгой анхааралхаргалзан үзсэн шалгуурын шийдвэр гаргах дүрмийн талаар: эдгээр дүрмүүд эсрэгээрээ байж болно. Шалгуурыг хэрэглэхэд тавигдах хязгаарлалтуудыг сайтар нягталж үзнэ үү.

Лекцийн материалыг судалсны дараа хариулна уу Хяналтын асуултууд, хариултаа тэмдэглэлдээ бичээрэй.

Пирсоны хи-квадрат тест нь тархалтыг харьцуулах зэрэг хэд хэдэн асуудлыг шийдэж чадна.

χ 2 тестийг хоёр зорилгоор ашигладаг;

1) харьцуулах эмпирикшинж чанарын хуваарилалт онолын -жигд, хэвийн эсвэл өөр хэлбэрээр;

2) харьцуулах хоёр, гурав ба түүнээс дээш эмпирикижил шинж чанарын хуваарилалт, өөрөөр хэлбэл тэдгээрийн нэгэн төрлийн байдлыг шалгах;

3) систем дэх стохастик (магадлал) бие даасан байдлыг үнэлэх санамсаргүй үйл явдлуудгэх мэт.

χ 2 шалгуур нь тэдгээр нь ижил давтамжтай тохиолддог уу гэсэн асуултад хариулдаг өөр өөр утгатайэмпирик болон онолын хуваарилалтэсвэл хоёр ба түүнээс дээш эмпирик хуваарилалтаар.

Аргын давуу тал нь нэрсийн масштабаас эхлээд дурын масштабаар танилцуулсан шинж чанаруудын тархалтыг харьцуулах боломжийг олгодог. Маш их энгийн тохиолдолөөр хуваарилалт ("тийм - үгүй", "гажиг зөвшөөрсөн - согогийг зөвшөөрөөгүй", "асуудлыг шийдсэн - асуудлыг шийдээгүй" гэх мэт), бид χ 2 шалгуурыг аль хэдийн хэрэглэж болно.

1. Түүврийн хэмжээ хангалттай том байх ёстой: N>30. Хэзээ Н<30 критерий χ 2 дает весьма приближенные значения. Точность крите­рия повышается при больших N.

2. Хүснэгтийн нүд бүрийн онолын давтамж 5-аас багагүй байна: f ≥ 5 . Энэ нь хэрэв цифрүүдийн тоог урьдчилан тодорхойлсон бөгөөд өөрчлөх боломжгүй бол χ 2 аргыг ашиглах боломжгүй гэсэн үг юм. , хамгийн бага тооны ажиглалтыг хуримтлуулахгүйгээр. Жишээлбэл, бид Итгэмжлэгдсэн утасны үйлчилгээний давтамж долоо хоногийн 7 хоногт жигд бус тархсан гэсэн таамаглалыг шалгахыг хүсч байвал бидэнд 5-7 = 35 дуудлага хэрэгтэй болно. Тиймээс, хэрэв цифрүүдийн тоо (к)Энэ тохиолдолд ажиглалтын хамгийн бага тоог (N мин) дараахь томъёогоор тодорхойлно. .



3. Сонгосон категориуд нь бүхэл бүтэн тархалтыг, өөрөөр хэлбэл шинж чанарын хэлбэлзлийн бүх хүрээг хамрах ёстой. Энэ тохиолдолд ангиллаар бүлэглэх нь харьцуулсан бүх хуваарилалтад ижил байх ёстой.

4. Зөвхөн 2 утгыг авсан шинж чанаруудын тархалтыг харьцуулахдаа "тасралтгүй байдлын засвар" хийх шаардлагатай. Залруулга хийх үед χ 2-ийн утга буурдаг (тасралтгүй байдлын засвартай жишээг үзнэ үү).

5. Ангилалууд нь давхцахгүй байх ёстой: хэрэв ажиглалтыг нэг ангилалд хамааруулсан бол өөр ангилалд хамааруулах боломжгүй. Зэрэглэлээр хийсэн ажиглалтын нийлбэр нь нийт ажиглалтын тоотой үргэлж тэнцүү байх ёстой.

χ 2 шалгуурыг тооцоолох алгоритм

1. Дараах төрлийн шинж чанарын утгуудын харилцан хамаарлын хүснэгтийг үүсгэнэ үү (үндсэндээ энэ нь хамтарсан шинж чанарын утгуудын давтамжийг харуулсан хоёр хэмжээст өөрчлөлтийн цуврал юм) - хүснэгт 19. Хүснэгтэнд агуулагдах болно. нөхцөлт давтамжийг бид ерөнхий хэлбэрээр f ij гэж тэмдэглэнэ. Жишээлбэл, шинж чанарын зэрэглэлийн тоо X 3-тай тэнцүү (k=3), шинж чанарын зэрэглэлийн тоо цагттэнцүү 4 (m=4); Дараа нь би 1-ээс k хооронд хэлбэлздэг ба j 1-ээс м-ийн хооронд хэлбэлздэг.

Хүснэгт 19

x i y j x 1 x 2 x 3
1 цагт f 11 f 21 f 31 f –1
2 цагт f 12 f 22 f 32 f –2
3 цагт f 13 f 23 f 33 f –3
4 цагт f 14 f 24 f 34 f –4
f 1– f 2– f 3– Н

2. Дараа нь тооцоо хийхэд хялбар болгох үүднээс бид харилцан болзошгүй байдлын анхны хүснэгтийг дараах хэлбэрийн хүснэгт болгон хувиргаж (Хүснэгт 20) нөхцөлт давтамжтай багануудыг нэг нэгээр нь доор байрлуулна: Хүснэгтэд ангиллын нэрийг оруулна. (1 ба 2-р багана) ба харгалзах эмпирик давтамжууд (3-р багана).

Хүснэгт 20

x i y j f ij f ij * f ij – f ij * (f ij – f ij *) 2 (f ij – f ij *) 2 / f ij *
1 2 3 4 5 6 7
x 1 1 цагт f 11 f 11*
x 1 2 цагт f 12 f 12*
x 1 3 цагт f 13 f 13*
x 1 4 цагт f 14 f 14*
x 2 1 цагт f 21 f 21 *
x 2 2 цагт f 22 f 22 *
x 2 3 цагт f 23 f 23 *
x 2 4 цагт f 24 f 24 *
x 3 1 цагт f 31 f 31 *
x 3 2 цагт f 32 f 32 *
x 3 3 цагт f 33 f 33 *
x 3 4 цагт f 34 f 34*
∑=………….

3. Эмпирик давтамж бүрийн хажууд онолын давтамжийг (4-р багана) бичнэ үү, үүнийг дараах томъёогоор (харгалзах мөрөнд байгаа нийт давтамжийг харгалзах баганад байгаа нийт давтамжаар үржүүлж, нийт давтамжид хуваана) бичнэ. ажиглалт):

5. Эрх чөлөөний зэрэглэлийн тоог томъёогоор тодорхойлно уу. ν=(k-1)(m-1) , Хаана к-шинж чанарын цифрүүдийн тоо X, m - тэмдгийн цифрүүдийн тоо цагт.

Хэрэв ν=1 бол “тасралтгүй байдал”-ын залруулга хийж 5a баганад бичнэ.

Тасралтгүй байдлын залруулга нь нөхцөлт болон онолын давтамжийн зөрүүгээс өөр 0.5-ыг хасахаас бүрдэнэ. Дараа нь манай хүснэгтийн баганын гарчиг дараах байдлаар харагдах болно (Хүснэгт 21):

Хүснэгт 21

X цагт f ij f ij * f ij – f ij * f ij – f ij * – 0.5 (f ij – f ij * – 0.5) 2 (f ij – f ij * – 0.5) 2 / f ij *
1 2 3 4 5 6 7

6. Үүссэн зөрүүг квадрат болгож 6-р баганад оруулна.

7. Үүссэн квадратын зөрүүг онолын давтамжид хувааж үр дүнг 7-р баганад бичнэ.

8. 7-р баганын утгыг нэгтгэн гарга. Үр дүнгийн хэмжээг χ 2 em гэж тэмдэглэнэ.

9. Шийдвэрлэх дүрэм:

Шалгуурын тооцоолсон утгыг эгзэгтэй (эсвэл хүснэгтэн) утгатай харьцуулах ёстой. Чухал утга нь Pearson χ 2 шалгуурын чухал утгуудын хүснэгтийн дагуу эрх чөлөөний зэрэглэлийн тооноос хамаарна (Хавсралт 1.6-г үзнэ үү).

Хэрэв χ 2 calc ≥ χ 2 хүснэгт бол тархалтын хоорондын зөрүү нь статистикийн ач холбогдолтой, эсвэл шинж чанар нь тогтмол өөрчлөгддөг, эсвэл шинж чанаруудын хоорондын хамаарал нь статистикийн хувьд чухал юм.

Хэрэв χ 2 тооцоолсон бол< χ 2 табл, то расхождения между рас­пределениями статистически недостоверны, или признаки изменяются несогласованно, или связи между признаками нет.

23. Хи квадрат ба оюутны тархалтын тухай ойлголт, график дүрслэл

1) Эрх чөлөөний n зэрэгтэй тархалт (хи квадрат) нь n бие даасан стандарт хэвийн санамсаргүй хэмжигдэхүүний квадратуудын нийлбэрийн тархалтыг хэлнэ.

Тархалт (хи квадрат)- хуваарилалт санамсаргүй хувьсагч(мөн тус бүрийн математикийн хүлээлт 0, стандарт хазайлт нь 1)

санамсаргүй хэмжигдэхүүнүүд хаана байна бие даасан, ижил тархалттай. Энэ тохиолдолд нэр томъёоны тоог, өөрөөр хэлбэл, хи квадратын тархалтын "чөлөөний зэрэглэлийн тоо" гэж нэрлэдэг. Хи-квадрат тоог нэг параметр буюу эрх чөлөөний зэрэглэлийн тоогоор тодорхойлно. Эрх чөлөөний зэрэглэлийн тоо нэмэгдэх тусам тархалт аажмаар хэвийн хэмжээнд ойртдог.

Дараа нь тэдгээрийн квадратуудын нийлбэр

k = n эрх чөлөөний зэрэгтэй хи-квадрат хуулийн дагуу тархсан санамсаргүй хэмжигдэхүүн; хэрэв нэр томьёо нь ямар нэг хамаарлаар (жишээлбэл, ) хамааралтай бол эрх чөлөөний зэрэглэлийн тоо k = n – 1 байна.

Энэ хуваарилалтын нягтрал

Энд - гамма функц; ялангуяа Г(n + 1) = n! .

Тиймээс хи-квадрат тархалтыг нэг параметрээр тодорхойлно - эрх чөлөөний зэрэглэлийн тоо k.

Тайлбар 1. Чөлөөт байдлын зэрэг нэмэгдэхийн хэрээр хи-квадрат тархалт аажмаар хэвийн хэмжээнд ойртож байна.

Тайлбар 2. Хи-квадрат тархалтыг ашиглан практикт учирч буй бусад олон тархалтыг, тухайлбал, санамсаргүй хэмжигдэхүүний тархалт - санамсаргүй векторын урт (X1, X2,..., Xn), координатыг тодорхойлдог. Эдгээр нь бие даасан бөгөөд ердийн хуулийн дагуу хуваарилагдсан.

χ2 тархалтыг анх Р.Хелмерт (1876), К.Пирсон (1900) нар авч үзсэн.

Math.expect.=n; D=2n

2) Оюутны хуваарилалт

Хоёр бие даасан санамсаргүй хэмжигдэхүүнийг авч үзье: Z нь хэвийн тархалттай ба нормчлогдсон (өөрөөр хэлбэл M(Z) = 0, σ(Z) = 1), k-тэй хи-квадрат хуулийн дагуу тархсан V V. эрх чөлөөний зэрэг. Дараа нь үнэ цэнэ

нь t-тархалт буюу Оюутны хуваарилалт гэж нэрлэгдэх k эрх чөлөөний зэрэгтэй тархалттай. Энэ тохиолдолд k-г Оюутны тархалтын “чөлөөний зэрэглэлийн тоо” гэж нэрлэдэг.

Эрх чөлөөний зэрэглэлийн тоо нэмэгдэхийн хэрээр Оюутны тархалт хэвийн хэмжээнд хурдан ойртдог.

Энэхүү хуваарилалтыг 1908 онд шар айрагны үйлдвэрт ажиллаж байсан Английн статистикч В.Госсет нэвтрүүлсэн. Энэ үйлдвэрт эдийн засаг, техникийн шийдвэр гаргахдаа магадлал, статистикийн аргыг ашигладаг байсан тул удирдлага нь В.Госсетийг өөрийн нэрээр шинжлэх ухааны өгүүлэл хэвлүүлэхийг хоригложээ. Ийнхүү В.Госсетийн боловсруулсан магадлалын болон статистикийн арга хэлбэрийн худалдааны нууц, “ноу-хау”-г хамгаалсан. Гэсэн хэдий ч түүнд "Оюутан" хэмээх нууц нэрээр хэвлэх боломж олдсон. Госсет-Оюутны түүхээс харахад 100 жилийн өмнө ч гэсэн Их Британийн менежерүүд магадлал-статистикийн шийдвэр гаргах аргууд нь эдийн засгийн хувьд илүү үр дүнтэй болохыг мэддэг байсан.

Хи-квадратПирсон бол хоёр ангилсан хувьсагчийн хоорондын хамаарлын ач холбогдлыг шалгах хамгийн энгийн тест юм. Пирсоны шалгуур нь хоёр оролттой хүснэгтэд суурилдаг хүлээгдэж буй"Хувьсагчдын хооронд хамаарал байхгүй" гэсэн таамаглалын дагуу давтамжийг шууд тооцоолж болно. 20 эрэгтэй, 20 эмэгтэй хүнээс оргилуун усыг сонгох талаар асуусан гээд бод доо Аэсвэл брэнд Б). Хэрэв давуу болон хүйсийн хооронд ямар ч холбоо байхгүй бол мэдээжийн хэрэг хүлээж байнабрэндийн тэгш сонголт Аболон брэндүүд Бхүйс бүрийн хувьд.

Статистикийн утга хи-квадратмөн түүний ач холбогдлын түвшин нь нийт ажиглалтын тоо болон хүснэгтийн нүднүүдийн тооноос хамаарна. хэсэгт авч үзсэн зарчмын дагуу , ажиглалтын тоо их байвал ажиглагдсан давтамжийн хүлээгдэж буй давтамжаас харьцангуй бага хазайлт нь мэдэгдэхүйц байх болно.

Шалгуурыг ашиглахад зөвхөн нэг чухал хязгаарлалт байдаг хи-квадрат(ажиглалтын санамсаргүй сонголтын тодорхой таамаглалыг эс тооцвол) нь хүлээгдэж буй давтамж нь маш бага байх ёсгүй. Энэ нь шалгуур үзүүлэлттэй холбоотой юм хи-квадратбайгалийн шалгалтаар магадлалэс бүрт; хэрэв эсүүд дэх хүлээгдэж буй давтамжууд бага бол, жишээ нь 5-аас бага бол эдгээр магадлалыг байгаа давтамжийг ашиглан хангалттай нарийвчлалтайгаар тооцоолох боломжгүй. Нэмэлт хэлэлцүүлгийг Everitt (1977), Hays (1988), эсвэл Kendall and Stuart (1979) хэсгээс үзнэ үү.

Хи-квадрат тест (хамгийн их магадлалын арга).Хамгийн их магадлалтай хи-квадратшалгуур үзүүлэлтийн хувьд болзошгүй байдлын хүснэгтүүд дэх харилцааны талаархи ижил таамаглалыг шалгах зорилготой юм хи-квадратПирсон. Гэсэн хэдий ч түүний тооцоолол нь хамгийн их магадлалтай арга дээр суурилдаг. Практикт УИХ-ын статистик хи-квадратПирсоны ердийн статистиктай маш ойрхон байна хи-квадрат. Эдгээр статистикийн талаарх дэлгэрэнгүй мэдээллийг Bishop, Fienberg, and Holland (1975) эсвэл Fienberg (1977) -аас олж болно. Бүлэгт Логлайн шинжилгээЭдгээр статистикийг илүү нарийвчлан авч үзсэн болно.

Йейтсийн нэмэлт өөрчлөлт.Статистикийн ойролцоо тооцоолол хи-квадратНүдэнд цөөн тооны ажиглалт бүхий 2х2 хүснэгтийн хувьд квадрат болгохын өмнө хүлээгдэж буй болон ажиглагдсан давтамжийн ялгааны үнэмлэхүй утгыг 0.5-аар бууруулах замаар сайжруулж болно (гэж нэрлэнэ). Йейтсийн нэмэлт өөрчлөлт). Тооцооллыг илүү дунд зэрэг болгодог Йейтесийн залруулга нь хүснэгтэд зөвхөн жижиг давтамж агуулсан тохиолдолд, жишээлбэл, зарим хүлээгдэж буй давтамж 10-аас бага болсон тохиолдолд ашиглагддаг (цаашид Conover, 1974; Everitt, 1977; Hays-ыг үзнэ үү). , 1988; Кендалл ба Стюарт, 1979, Мантел, 1974).

Фишерийн нарийн тест.Энэ шалгуур нь зөвхөн 2х2 хүснэгтэд хамаарна. Шалгуур нь дараахь үндэслэлд үндэслэсэн болно. Хүснэгт дэх ахиу давтамжийг харгалзан хүснэгтэд оруулсан хувьсагч хоёулаа бие даасан байна гэж үзье. Бид өөрөөсөө асуулт асууя: өгөгдсөн ахиу давтамж дээр үндэслэн хүснэгтэд ажиглагдсан давтамжийг олж авах магадлал хэд вэ? Энэ магадлалыг тооцоолж байгаа нь харагдаж байна ягахиу дээр үндэслэн барьж болох бүх хүснэгтийг тоолох. Тиймээс Фишерийн шалгуурыг тооцоолно үнэн зөвтэг таамаглалын дагуу ажиглагдсан давтамжууд үүсэх магадлал (хүснэгтийн хувьсагчдын хоорондын хамаарал байхгүй). Үр дүнгийн хүснэгт нь нэг талт болон хоёр талт түвшинг харуулж байна.

Макнемар хи-дөрвөлжин.Энэ шалгуур нь 2х2 хүснэгтийн давтамжийг илэрхийлэх үед хэрэгжинэ хамааралтайдээж. Жишээлбэл, туршилт хийхээс өмнө болон дараа нь ижил хүмүүсийн ажиглалт. Тодруулбал, та улирлын эхэн ба төгсгөлд математикийн хичээлээр хамгийн бага амжилт гаргасан оюутнуудын тоо, эсвэл сурталчилгааны өмнөх болон дараа ижил судалгаанд оролцогчдын давуу талыг тоолж болно. Хоёр утгыг тооцоолно хи-квадрат: А/ДТэгээд B/C. A/D хи-дөрвөлжинэс дэх давтамж гэсэн таамаглалыг шалгадаг АТэгээд Д(зүүн дээд, баруун доод) ижил байна. B/C хи-дөрвөлжинэсийн давтамжийн тэгш байдлын талаархи таамаглалыг шалгадаг БТэгээд C(баруун дээд, зүүн доод).

Phi коэффициент.Фи талбай 2х2 хүснэгтийн хоёр хувьсагчийн хоорондын хамаарлын хэмжүүрийг илэрхийлнэ. Түүний үнэ цэнэ нь өөр өөр байдаг 0 (хувьсагчийн хооронд хамаарал байхгүй; хи-квадрат = 0.0 ) өмнө 1 (хүснэгт дэх хоёр хүчин зүйлийн хоорондын үнэмлэхүй хамаарал). Дэлгэрэнгүйг Castellan and Siegel (1988, p. 232) -аас үзнэ үү.

Тетрахорик хамаарал.Энэ статистикийг зөвхөн 2х2 хөндлөн таблицын хүснэгтэд тооцдог (мөн хэрэглэнэ). Хэрэв 2х2 хүснэгтийг хоёр тасралтгүй хувьсагчийн утгыг хоёр ангилалд (хиймэл) хуваах үр дүн гэж үзэж болох юм бол тетрахор корреляцийн коэффициент нь эдгээр хоёр хувьсагчийн хоорондын хамаарлыг тооцоолох боломжийг олгодог.

Коньюгацийн коэффициент.Болзошгүй байдлын коэффициент нь статистикийн үндэслэлтэй байдаг хи-квадратБолзошгүй байдлын хүснэгт дэх шинж чанаруудын хамаарлын хэмжүүр (Пирсоны санал болгосон). Уламжлалт статистик үзүүлэлтээс энэ коэффициентийн давуу тал хи-квадраттайлбарлахад хялбар байдаг, учир нь түүний өөрчлөлтийн хүрээ нь -ээс байна 0 өмнө 1 (Хаана 0 Хүснэгт дэх шинж чанаруудын бие даасан байдалтай тохирч байгаа бөгөөд коэффициентийн өсөлт нь холболтын зэрэг нэмэгдэж байгааг харуулж байна). Гэнэтийн коэффициентийн сул тал нь түүний хамгийн их утга нь хүснэгтийн хэмжээнээс "хамааралдах" явдал юм. Ангиудын тоог хязгаарлаагүй тохиолдолд л энэ коэффициент 1-д хүрч чадна (Siegel, 1956, p. 201).

Харилцааны арга хэмжээний тайлбар.Холбооны хэмжүүрүүдийн мэдэгдэхүйц сул тал нь (дээр дурдсан) тэдгээрийг корреляцийн коэффициентийн нэгэн адил магадлалын эсвэл "тайлбарласан хэлбэлзлийн хувь хэмжээ" гэсэн уламжлалт нөхцөлөөр тайлбарлахад хэцүү байдаг. rПирсон (Харилцан хамаарлыг үзнэ үү). Тиймээс нийтээр хүлээн зөвшөөрөгдсөн нэг хэмжүүр, нэгдлийн коэффициент байдаггүй.

Зэрэглэлд суурилсан статистик.Практикт гарч буй олон асуудалд бид зөвхөн хэмжилт хийдэг дараалал масштаб (харна уу Статистикийн үндсэн ойлголтууд). Энэ нь ялангуяа сэтгэл судлал, социологи болон хүнийг судлахтай холбоотой бусад салбар дахь хэмжилтэд хамаарна. Та тодорхой спортод хандах хандлагыг мэдэхийн тулд хэд хэдэн судалгаанд оролцогчидтой ярилцлага хийсэн гэж бодъё. Та хэмжилтийг масштабаар дараах байрлалаар илэрхийлнэ: (1) Үргэлж, (2) ихэвчлэн, (3) Заримдааба (4) хэзээ ч. Хариулт нь ойлгомжтой заримдаа би гайхдагхариултаас илүү хариулагчийн сонирхол бага байгааг харуулж байна Би ихэвчлэн сонирхдоггэх мэт. Тиймээс судалгаанд оролцогчдын сонирхлын зэрэглэлийг эрэмбэлэх боломжтой. Энэ бол ординаль масштабын ердийн жишээ юм. Ординаль хэмжигдэхүүнээр хэмжигдэх хувьсагч нь хамаарлыг үнэлэх боломжийг олгодог өөр өөр төрлийн хамааралтай байдаг.

Р Спирман.Статистик РСпирманыг Пирсон корреляцитай адилаар тайлбарлаж болно ( rПирсон) тайлбарласан дисперсийн хувь хэмжээгээр (Гэхдээ Спирманы статистикийг зэрэглэлээр тооцдог гэдгийг санаарай). Хувьсагчдыг дор хаяж онд хэмждэг гэж үздэг дараалалмасштаб. Спирманы зэрэглэлийн хамаарал, түүний хүч, үр дүнтэй байдлын талаархи дэлгэрэнгүй хэлэлцүүлгийг жишээлбэл, Гиббонс (1985), Хейс (1981), МакНемар (1969), Сигел (1956), Сигел ба Кастеллан (1988), Кендалл (1948) зэрэг номноос олж болно. , Olds (1949) болон Hotelling and Pabst (1936).

Тау Кендалл.Статистик tauКендаллтай дүйцэхүйц РСпирман зарим үндсэн таамаглалын дагуу. Тэдний эрх мэдэл нь мөн адил юм. Гэсэн хэдий ч ихэвчлэн утгууд байдаг РСпирман ба tauКендалл нь дотоод логик болон тооцоолох арга барилаараа ялгаатай байдаг тул ялгаатай. Сигел, Кастеллан (1988)-д зохиогчид эдгээр хоёр статистикийн хоорондын хамаарлыг дараах байдлаар илэрхийлжээ.

1 < = 3 * Тау Кендалла - 2 * R Спирмена < = 1

Хамгийн чухал нь Кендаллын статистик tauболон Спирман Рөөр өөр тайлбартай: статистикийн үед РСпирманыг статистикийн шууд аналог гэж үзэж болно rПирсон, зэрэглэлээр тооцсон, Кендалл статистик tauхарин дээр тулгуурласан магадлал. Бүр нарийн яривал хоёр хэмжигдэхүүнд ажиглагдсан өгөгдөл ижил дарааллаар байх магадлал болон өөр дарааллаар байх магадлалын хооронд ялгаа байгааг шалгадаг. Кендалл (1948, 1975), Эверитт (1977), Сигел, Кастеллан (1988) нар дэлгэрэнгүй ярилцсан. tauКендалл. Ихэвчлэн хоёр статистикийг тооцдог tauКендалл: tau бТэгээд tau в. Эдгээр арга хэмжээ нь зөвхөн тохирох зэрэглэлийг зохицуулах арга барилаараа ялгаатай. Ихэнх тохиолдолд тэдгээрийн утга нь маш төстэй байдаг. Хэрэв зөрөлдөөн үүсвэл хоёр утгын багыг авч үзэх нь хамгийн найдвартай арга юм.

Соммерийн d коэффициент: d(X|Y), d(Y|X).Статистик гСоммерийн хэмжүүр нь хоёр хувьсагчийн хоорондын хамаарлын тэгш хэмтэй бус хэмжигдэхүүн юм. Энэ статистик ойролцоо байна tau б(Siegel and Castellan, 1988, pp. 303-310-ыг үзнэ үү).

Гамма статистик.Хэрэв өгөгдөлд олон тохирох утгууд байгаа бол статистик гаммаилүүд үздэг РСпирман эсвэл tauКендалл. Үндсэн таамаглалын хувьд статистик гаммастатистиктай дүйцэхүйц РСпирман эсвэл Кендаллын тау. Түүний тайлбар, тооцоолол нь Спирманы R статистик гэхээсээ илүү Кендаллийн Таугийн статистиктай төстэй юм. Товчхондоо хэлэхэд, гаммамөн төлөөлдөг магадлал; илүү нарийвчлалтай, хоёр хувьсагчийн эрэмбийн дараалал таарах магадлалын зөрүүг тохирохгүй байх магадлалыг хасч, тохирох магадлалыг нэгээр хуваана. Тэгэхээр статистик гаммаүндсэндээ тэнцүү tauКендалл, эс тооцвол тоглолтыг хэвийн болгоход тодорхой харгалзан үздэг. Статистикийн дэлгэрэнгүй хэлэлцүүлэг гамма Goodman and Kruskal (1954, 1959, 1963, 1972), Siegel (1956), Siegel and Castellan (1988) нараас олж болно.

Тодорхой бус байдлын коэффициентүүд.Эдгээр коэффициентүүд нь хэмжигддэг мэдээллийн харилцаа холбоохүчин зүйлсийн хооронд (хүснэгтийн мөр ба багана). Үзэл баримтлал мэдээллийн хамааралЭнэ нь давтамжийн хүснэгтэд дүн шинжилгээ хийх мэдээлэл-онолын хандлагаас үүдэлтэй тул энэ асуудлыг тодруулахын тулд холбогдох гарын авлагаас лавлаж болно (Kullback, 1959; Ku and Kullback, 1968; Ku, Varner, and Kullback, 1971; мөн Bishop-ыг үзнэ үү. , Fienberg, and Holland, 1975, pp. 344-348). Статистик С(Ү,Х) нь тэгш хэмтэй бөгөөд хувьсагчийн мэдээллийн хэмжээг хэмждэг Юхувьсагчтай харьцангуй Xэсвэл хувьсагчаар Xхувьсагчтай харьцангуй Ю. Статистик S(X|Y)Тэгээд S(Y|X)чиглэлийн хамаарлыг илэрхийлнэ.

Олон хэмжээст хариултууд ба дихотомууд. Судлаач үйл явдлын "энгийн" давтамж төдийгүй эдгээр үйл явдлын зарим (ихэвчлэн бүтэцгүй) чанарын шинж чанарыг сонирхож байгаа нөхцөл байдалд олон хувьсагчийн хариу үйлдэл, олон хувьсагчийн дихотоми зэрэг хувьсагчид үүсдэг. Олон хэмжээст хувьсагчдын (хүчин зүйл) мөн чанарыг жишээн дээр хамгийн сайн ойлгодог.

  • · Олон хэмжээст хариултууд
  • · Олон хэмжээст дихотоми
  • · Олон талт хариу үйлдэл ба дихотомийг хооронд нь харьцуулах
  • Олон хувьсагчтай хариулт бүхий хувьсагчдын хосоор хөндлөн таблиц
  • · Эцсийн тайлбар

Олон хэмжээст хариултууд.Та томоохон маркетингийн судалгааны явцад үйлчлүүлэгчдээс хамгийн сайн 3 ундааг нэрлэхийг хүссэн гэж төсөөлөөд үз дээ. Ердийн асуулт иймэрхүү харагдаж болно.

Програмыг авч үзьеMSEXCELЭнгийн таамаглалыг шалгах Пирсон хи-квадрат тест.

Туршилтын өгөгдлийг олж авсны дараа (жишээ нь зарим нь байгаа үед дээж) ихэвчлэн өгөгдсөн санамсаргүй хэмжигдэхүүнийг хамгийн сайн дүрслэх тархалтын хуулийн сонголтыг хийдэг дээж авах. Сонгосон онолын тархалтын хуулиар туршилтын өгөгдлийг хэр сайн тайлбарлаж байгааг шалгахдаа ашиглан хийж байна гэрээний шалгуур. Үгүй таамаглал, санамсаргүй хэмжигдэхүүний тархалтын зарим онолын хуультай тэнцүү байх тухай таамаглал ихэвчлэн байдаг.

Эхлээд програмыг харцгаая Пирсоны тохирох байдлын тест X 2 (хи квадрат)энгийн таамаглалтай холбоотой (онолын тархалтын параметрүүдийг мэдэгдэж байгаа гэж үзнэ). Дараа нь - , зөвхөн тархалтын хэлбэрийг зааж өгөх үед, мөн энэ тархалтын параметрүүд болон утга статистик X 2 үүн дээр үндэслэн үнэлдэг/тооцолдог дээж.

Анхаарна уу: Англи хэл дээрх уран зохиолд өргөдөл гаргах журам Пирсоны тохирох байдлын тест X 2 нэртэй байна Чи квадратын сайн байдлын тест.

Таамаглалыг шалгах процедурыг эргэн санацгаая.

  • суурилсан дээжүнэ цэнийг тооцдог статистик, энэ нь шалгагдаж буй таамаглалын төрөлтэй тохирч байна. Жишээлбэл, ашигласан т- статистик(хэрэв мэдэгдээгүй бол);
  • үнэнд захирагддаг тэг таамаглал, үүний хуваарилалт статистикмэдэгдэж байгаа бөгөөд магадлалыг тооцоолоход ашиглаж болно (жишээлбэл, for т- статистикЭнэ);
  • үндэслэн тооцсон дээжутга учир статистикөгөгдсөн утгын чухал утгатай харьцуулсан ();
  • тэг таамаглалүнэ цэнэ бол татгалзах статистикэгзэгтэй хэмжээнээс их (эсвэл энэ утгыг авах магадлал). статистик() бага ач холбогдлын түвшин, энэ нь ижил төстэй арга юм).

Гүйцэе таамаглалыг шалгахянз бүрийн түгээлтийн хувьд.

Салангид тохиолдол

Хоёр хүн шоо тоглож байна гэж бодъё. Тоглогч бүр өөрийн гэсэн шоотой. Тоглогчид ээлжлэн 3 шоо нэг дор шиднэ. Нэг удаад хамгийн олон зургаа өнхрүүлсэн хүн тойрог бүрийг хождог. Үр дүнг бүртгэж байна. Тоглогчдын нэг нь 100 тойргийн дараа өрсөлдөгчийнхөө шоо тэгш хэмтэй биш гэж сэжиглэжээ. тэр ихэвчлэн хождог (тэр ихэвчлэн зургаа шиддэг). Тэрээр ийм олон тооны дайсны үр дагавар хэр магадлалтай болохыг шинжлэхээр шийджээ.

Анхаарна уу: Учир нь 3 шоо байна, дараа нь та нэг удаад 0 өнхрүүлж болно; 1; 2 эсвэл 3 зургаа, өөрөөр хэлбэл. санамсаргүй хэмжигдэхүүн нь 4 утгыг авч болно.

Магадлалын онолоос бид шоо нь тэгш хэмтэй байвал зургаа авах магадлал нь дагадаг гэдгийг бид мэднэ. Тиймээс 100 тойргийн дараа зургаагийн давтамжийг томъёогоор тооцоолж болно
=BINOM.DIST(A7,3,1/6,FALSE)*100

Томъёо нь нүдэнд байгаа гэж үздэг A7 нэг тойрогт цувисан зургаан ширхэг харгалзах тоог агуулна.

Анхаарна уу: Тооцооллыг өгөгдсөн Discrete хуудас дээрх жишээ файл.

Харьцуулбал ажиглагдсан(Ажигласан) ба онолын давтамжууд(Хүлээгдэж буй) ашиглахад тохиромжтой.

Хэрэв ажиглагдсан давтамжууд онолын тархалтаас ихээхэн хазайсан бол, тэг таамаглалсанамсаргүй хэмжигдэхүүнийг онолын хуулийн дагуу хуваарилах талаар үгүйсгэх хэрэгтэй. Өөрөөр хэлбэл, хэрэв өрсөлдөгчийн шоо тэгш хэмтэй биш бол ажиглагдсан давтамжууд нь "илээд ялгаатай" байх болно. бином тархалт.

Бидний хувьд эхлээд харахад давтамж нь нэлээд ойрхон бөгөөд тооцоололгүйгээр хоёрдмол утгагүй дүгнэлт хийхэд хэцүү байдаг. Хэрэглэх боломжтой Пирсоны сайн чанарын тест X 2, ингэснээр харьцуулалтад үндэслэн хийж болох "үлэмж өөр" субьектив мэдэгдлийн оронд гистограмууд, математикийн хувьд зөв хэллэг ашиглах.

Үүний улмаас бид үүнийг ашигладаг их тооны хуульажиглагдсан давтамж (Ажигласан) хэмжээ нэмэгдэж дээж n нь онолын хуульд нийцэх магадлалд ханддаг (манай тохиолдолд, бином хууль). Манай тохиолдолд түүврийн хэмжээ n нь 100 байна.

Ингээд танилцуулъя тест статистик, бид үүнийг X 2 гэж тэмдэглэнэ:

Энд O l нь санамсаргүй хэмжигдэхүүн тодорхой зөвшөөрөгдөх утгыг авсан үйл явдлын ажиглагдсан давтамж, E l нь харгалзах онолын давтамж (Хүлээгдэж буй) юм. L нь санамсаргүй хэмжигдэхүүний авч болох утгуудын тоо (бидний тохиолдолд 4 байна).

Томъёоноос харахад энэ статистикЭнэ нь ажиглагдсан давтамжуудын онолын давтамжтай ойролцоо байдлын хэмжүүр юм. Энэ нь эдгээр давтамжуудын хоорондох "зай"-ыг тооцоолоход ашиглаж болно. Хэрэв эдгээр "зайны" нийлбэр "хэт том" байвал эдгээр давтамжууд нь "үлэмжтэй" байна. Хэрэв бидний шоо тэгш хэмтэй бол (жишээ нь хэрэглэх боломжтой) нь тодорхой байна бином хууль), тэгвэл "зайны" нийлбэр "хэт их" байх магадлал бага байх болно. Энэ магадлалыг тооцоолохын тулд бид тархалтыг мэдэх хэрэгтэй статистик X 2 ( статистик X 2 санамсаргүй байдлаар тооцоолсон дээж, тиймээс энэ нь санамсаргүй хэмжигдэхүүн тул өөрийн гэсэн утгатай магадлалын хуваарилалт).

Олон хэмжээст аналогоос Мойвр-Лапласын интеграл теорем n->∞-ийн хувьд бидний санамсаргүй хэмжигдэхүүн X 2 нь L - 1 зэрэглэлийн эрх чөлөөтэй асимптот шинжтэй байдаг нь мэдэгдэж байна.

Тэгэхээр хэрэв тооцоолсон утга статистик X 2 (давтамж хоорондын "зайны" нийлбэр) тодорхой хязгаарлагдмал утгаас их байх болно, тэгвэл бид татгалзах шалтгаантай болно. тэг таамаглал. Шалгаж байгаатай адил параметрийн таамаглал, хязгаарын утгыг дамжуулан тохируулна ач холбогдлын түвшин. Хэрэв X 2 статистик нь тооцоолсон утгаас бага буюу тэнцүү утгыг авах магадлал ( х-утга), бага байх болно ач холбогдлын түвшин, Тэр тэг таамаглалтатгалзаж болно.

Манай тохиолдолд статистикийн утга нь 22.757 байна. X2 статистик 22.757-ээс их буюу тэнцүү утгыг авах магадлал маш бага (0.000045) бөгөөд томъёог ашиглан тооцоолж болно.
=CHI2.DIST.PH(22.757,4-1)эсвэл
=CHI2.ТУРШИЛТ(Ажиглагдсан; Хүлээгдэж буй)

Анхаарна уу: CHI2.TEST() функц нь хоёр категорийн хувьсагчийн хоорондын хамаарлыг шалгахад зориулагдсан (харна уу).

0.000045 магадлал нь ердийнхөөс хамаагүй бага байна ач холбогдлын түвшин 0.05. Тиймээс тоглогч өрсөлдөгчөө шударга бус гэж сэжиглэх бүх шалтгаан бий ( тэг таамаглалтүүний шударга байдлыг үгүйсгэдэг).

Хэрэглэх үед шалгуур X 2эзлэхүүнийг хангах шаардлагатай байна дээж n нь хангалттай том байсан, эс тэгвээс тархалтын ойролцоо тооцоолол хүчин төгөлдөр бус байх болно статистик X 2. Үүний тулд Ажиглагдсан давтамжууд 5-аас их байх нь хангалттай гэж ихэвчлэн үздэг. Хэрэв тийм биш бол жижиг давтамжуудыг нэг болгон нэгтгэж эсвэл бусад давтамж руу нэмж, хосолсон утгыг онооно. нийт магадлалүүний дагуу эрх чөлөөний зэрэглэлийн тоо буурдаг X 2 хуваарилалт.

Хэрэглээний чанарыг сайжруулах зорилгоор шалгуур X 2(), хуваалтын интервалыг багасгах шаардлагатай (L-ийг нэмэгдүүлж, үүний дагуу тоог нэмэгдүүлнэ эрх чөлөөний зэрэг), гэхдээ интервал бүрт (db>5) орсон ажиглалтын тоог хязгаарласнаар үүнийг сэргийлдэг.

Тасралтгүй тохиолдол

Пирсоны тохирох байдлын тест X 2 тохиолдолд мөн хэрэглэж болно.

Тодорхой зүйлийг авч үзье дээж, 200 утгаас бүрдэнэ. Үгүй таамаглалгэж мэдэгддэг дээжаас хийсэн .

Анхаарна уу: Санамсаргүй хувьсагч Тасралтгүй хуудас дээрх жишээ файлтомъёог ашиглан үүсгэсэн =NORM.ST.INV(RAND()). Тиймээс шинэ үнэт зүйлс дээжхуудсыг дахин тооцоолох бүрд үүсдэг.

Одоо байгаа өгөгдлийн багц тохиромжтой эсэхийг нүдээр үнэлэх боломжтой.

Диаграмаас харахад түүврийн утгууд нь шулуун шугамын дагуу маш сайн тохирч байна. Гэсэн хэдий ч, хувьд таамаглалыг шалгаххамааралтай Pearson X 2 тохирох байдлын тест.

Үүнийг хийхийн тулд бид санамсаргүй хэмжигдэхүүний өөрчлөлтийн мужийг 0.5 алхамтай интервалд хуваана. Ажиглагдаж байгаа болон тооцоолъё онолын давтамжууд. Бид ажиглагдсан давтамжийг FREQUENCY() функцээр, онолын давтамжийг NORM.ST.DIST() функцээр тооцдог.

Анхаарна уу: Үүнтэй адил салангид тохиолдол, үүнийг баталгаажуулах шаардлагатай байна дээжнэлээд том байсан бөгөөд интервал нь >5 утгыг багтаасан.

X2 статистикийг тооцоолж, өгөгдсөн чухал утгатай харьцуулцгаая ач холбогдлын түвшин(0.05). Учир нь бид санамсаргүй хэмжигдэхүүний өөрчлөлтийн мужийг 10 интервалд хуваасан, дараа нь чөлөөт байдлын зэрэг нь 9. Чухал утгыг томъёогоор тооцоолж болно.
=CHI2.OBR.PH(0.05;9) эсвэл
=CHI2.OBR(1-0.05;9)

Дээрх графикаас харахад статистикийн утга 8.19 байгаа нь мэдэгдэхүйц өндөр байна чухал үнэ цэнэ тэг таамаглалтатгалзсангүй.

Доорх нь хаана байна дээжмагадлал багатай ач холбогдолтой болж, дээр тулгуурласан шалгуур Пирсоны зөвшөөрөл X 2тэг таамаглалыг няцаасан (гэхдээ санамсаргүй утгуудтомъёог ашиглан үүсгэсэн =NORM.ST.INV(RAND()), хангах дээж-аас стандарт хэвийн тархалт).

Үгүй таамаглалняцаагдсан боловч харааны хувьд өгөгдөл нь шулуун шугамтай нэлээд ойрхон байрладаг.

Мөн жишээ болгон авч үзье дээж U(-3; 3)-аас. Энэ тохиолдолд графикаас ч гэсэн тодорхой байна тэг таамаглалтатгалзах ёстой.

Шалгуур Пирсоны зөвшөөрөл X 2мөн үүнийг баталж байна тэг таамаглалтатгалзах ёстой.



Танд нийтлэл таалагдсан уу? Найзуудтайгаа хуваалцаарай!