Хуваарилалт x2. Статистикийн сонгодог аргууд: хи-квадрат тест

Хи квадратын тархалтыг авч үзье. MS EXCEL функцийг ашиглахCH2.DIST() Тархалтын функц ба магадлалын нягтын графикийг зурж, энэ тархалтыг математик статистикийн зорилгоор ашиглахыг тайлбарлая.

Хи квадратын тархалт (X 2, XI2,АнглиЧи- дөрвөлжинхуваарилалт) Математик статистикийн янз бүрийн аргуудад ашигладаг:

  • барилгын ажлын явцад;
  • үед;
  • at (эмпирик өгөгдөл нь онолын тархалтын функцийн талаарх бидний таамаглалтай нийцэж байна уу, үгүй ​​юу, англи хэлний сайн чанар)
  • at (хоёр ангиллын хувьсагчийн хоорондын хамаарлыг тодорхойлоход ашигладаг, англи хэлний Chi-square test of association).

Тодорхойлолт: Хэрэв x 1 , x 2 , …, x n нь N(0;1) дээр тархсан бие даасан санамсаргүй хэмжигдэхүүн бол Y=x 1 2 + x 2 2 +…+ x n 2 санамсаргүй хэмжигдэхүүний тархалт дараах байдалтай байна. хуваарилалт X 2 эрх чөлөөний n зэрэгтэй.

Хуваарилалт X 2 гэж нэрлэгддэг нэг параметрээс хамаарна эрх чөлөөний зэрэг (df, градус-ийнэрх чөлөө). Жишээлбэл, барилга барих үед эрх чөлөөний зэрэглэлийн тоотэнцүү df=n-1, энд n нь хэмжээ дээж.

Түгээлтийн нягтрал X 2 томъёогоор илэрхийлнэ:

Функцийн графикууд

Хуваарилалт X 2 тэгш бус хэлбэртэй, n-тэй тэнцүү, 2n-тэй тэнцүү байна.

IN График хуудас дээрх жишээ файлөгсөн тархалтын нягтын графикуудмагадлал ба хуримтлагдсан хуваарилалтын функц.

Ашигтай өмч CH2 тархалт

x 1, x 2, …, x n нь бие даасан санамсаргүй хэмжигдэхүүнүүд дээр тархсан байг ердийн хуульижил параметртэй μ ба σ, ба X avбайна арифметик дундажэдгээр x утгууд.
Дараа нь санамсаргүй хэмжигдэхүүн yтэнцүү

Байна X 2 - хуваарилалт n-1 зэрэглэлийн эрх чөлөөтэй. Тодорхойлолтыг ашиглан дээрх илэрхийллийг дараах байдлаар дахин бичиж болно.

Тиймээс, түүврийн хуваарилалтстатистик y, at дээж-аас хэвийн тархалт, байна X 2 - хуваарилалт n-1 эрх чөлөөний зэрэгтэй.

Бидэнд энэ өмч хэрэгтэй болно. Учир нь тархалтзөвхөн эерэг тоо байж болно, мөн X 2 - хуваарилалтүүнийг үнэлэхэд ашигладаг y d.b. >0, тодорхойлолтод заасан.

MS EXCEL дээрх CH2 тархалт

MS EXCEL-д 2010 оны хувилбараас эхлэн X 2 - хуваарилалт CHISQ.DIST() гэсэн тусгай функц байдаг бөгөөд энэ нь танд тооцоолох боломжийг олгодог магадлалын нягт(дээрх томъёог үзнэ үү) ба (х санамсаргүй хэмжигдэхүүнтэй байх магадлал CI2-хуваарилалт, x-ээс бага буюу тэнцүү утгыг авна, P(X<= x}).

Анхаарна уу: Учир нь CH2 тархалтонцгой тохиолдол, дараа нь томъёо =ГАММА.DIST(x;n/2;2;ҮНЭН)эерэг бүхэл тооны хувьд n нь томьёотой ижил үр дүнг буцаана =CHI2.DIST(x;n; ҮНЭН)эсвэл =1-CHI2.DIST.PH(x;n) . Мөн томъёо =ГАММА.DIST(x;n/2;2;ХУДАЛ)томъёотой ижил үр дүнг буцаана =CHI2.DIST(x;n; ХУДАЛ), өөрөөр хэлбэл магадлалын нягт CH2 тархалт.

HI2.DIST.PH() функц буцаана түгээлтийн функц, илүү нарийвчлалтай, баруун талын магадлал, i.e. P(X > x). Тэгш эрх үнэн гэдэг нь ойлгомжтой
=CHI2.DIST.PH(x;n)+CHI2.DIST(x;n;ҮНЭН)=1
учир нь эхний гишүүн P(X > x), хоёр дахь P(X) магадлалыг тооцдог<= x}.

MS EXCEL 2010-аас өмнө EXCEL нь зөвхөн CH2DIST() функцтэй байсан бөгөөд энэ нь баруун талын магадлалыг тооцоолох боломжийг олгодог. P(X > x). MS EXCEL 2010-ын шинэ XI2.DIST() ба XI2.DIST.PH() функцүүдийн боломжууд нь энэ функцийн боломжуудыг хамардаг. CH2DIST() функцийг MS EXCEL 2010-д нийцтэй байлгах үүднээс үлдээсэн.

CHI2.DIST() нь буцах цорын ганц функц юм chi2 тархалтын магадлалын нягт(гурав дахь аргумент нь ХУДАЛ байх ёстой). Үлдсэн функцууд буцаж ирдэг хуримтлагдсан хуваарилалтын функц, өөрөөр хэлбэл Санамсаргүй хэмжигдэхүүн нь заасан мужаас утгыг авах магадлал: P(X<= x}.

Дээрх MS EXCEL функцуудыг -д өгөв.

Жишээ

Х санамсаргүй хэмжигдэхүүн нь өгөгдсөнөөс бага буюу тэнцүү утгыг авах магадлалыг олъё x: P(X<= x}. Это можно сделать несколькими функциями:

CHI2.DIST(x; n; ҮНЭН)
=1-HI2.DIST.PH(x; n)
=1-CHI2DIST(x; n)

CH2.DIST.PH() функц нь баруун талын магадлал гэж нэрлэгддэг P(X > x) магадлалыг буцаадаг тул P(X)-ийг олно.<= x}, необходимо вычесть ее результат от 1.

Санамсаргүй хэмжигдэхүүн X нь өгөгдсөн хэмжээнээс их утгыг авах магадлалыг олъё x: P(X > x). Үүнийг хэд хэдэн функцээр хийж болно:

1-CHI2.DIST(x; n; ҮНЭН)
=HI2.DIST.PH(x; n)
=CHI2DIST(x; n)

Чи2 тархалтын урвуу функц

Тооцоолохдоо урвуу функцийг ашигладаг альфа-, i.e. утгыг тооцоолох xөгөгдсөн магадлалын хувьд альфа, ба X P(X) илэрхийллийг хангах ёстой<= x}=альфа.

CH2.INV() функцийг тооцоолоход ашигладаг хэвийн тархалтын дисперсийн итгэлцлийн интервалууд.

CHI2.OBR.PH() функцийг тооцоолоход ашигладаг, i.e. хэрэв ач холбогдлын түвшинг функцийн аргумент болгон зааж өгсөн бол жишээ нь 0.05 бол функц нь P(X>x)=0.05 гэсэн санамсаргүй хэмжигдэхүүн x-ийн утгыг буцаана. Харьцуулбал: XI2.INR() функц нь P(X) санамсаргүй хувьсагчийн утгыг буцаана.<=x}=0,05.

MS EXCEL 2007 болон түүнээс өмнөх хувилбаруудад HI2.OBR.PH()-ийн оронд HI2OBR() функцийг ашигласан.

Дээрх функцуудыг сольж болно, учир нь Дараах томъёо нь ижил үр дүнг буцаана:
=CHI.OBR(альфа;н)
=HI2.OBR.PH(1-альфа;n)
=CHI2INV(1- альфа;n)

Тооцооллын зарим жишээг энд оруулав Функцийн хуудас дээрх жишээ файл.

MS EXCEL нь CH2 тархалтыг ашиглан ажилладаг

Орос, англи хэлний функцын нэрсийн хоорондын захидал харилцааг доор харуулав.
CH2.DIST.PH() - Англи хэл. нэр CHISQ.DIST.RT, i.e. CHI-дөрвөлжин тархалт Баруун сүүл, баруун сүүлт Chi-square(d) тархалт
CH2.OBR() - Англи. нэр CHISQ.INV, i.e. CHI-квадрат тархалт урвуу
CH2.PH.OBR() - Англи хэл. нэр CHISQ.INV.RT, i.e. CHI-Squared тархалт урвуу баруун сүүл
CH2DIST() - Англи хэл. нэр CHIDIST, CHISQ.DIST.RT-тэй тэнцэх функц
CH2OBR() - Англи. нэр CHIINV, i.e. CHI-квадрат тархалт урвуу

Түгээлтийн параметрийн тооцоо

Учир нь ихэвчлэн CH2 тархалтматематик статистикийн зорилгоор ашигладаг (тооцоолол итгэлцлийн интервал, таамаглалыг шалгах гэх мэт),Бодит утгын загварыг бий болгоход бараг хэзээ ч байдаггүй, тэгвэл энэ хуваарилалтын хувьд тархалтын параметрүүдийг тооцоолох хэлэлцүүлгийг энд хийдэггүй.

CI2 тархалтыг хэвийн тархалтаар ойртуулах

Эрх чөлөөний зэрэглэлийн тоо n>30 хуваарилалт X 2сайн ойролцоолсон хэвийн тархалтхамт дундаж утгаμ=n ба хэлбэлзэл σ=2*n (харна уу жишээ хуудас файл Ойролцоо).

U 1, U 2, ..,U k нь бие даасан стандарт хэвийн утгууд байг. K = U 1 2 +U 2 2 + .. + U k 2 санамсаргүй хэмжигдэхүүний тархалтыг хи-квадрат тархалт гэнэ. кэрх чөлөөний зэрэг (K~χ 2 (k) гэж бичнэ). Энэ нь эерэг хазайлттай, дараах шинж чанаруудтай нэг модаль тархалт юм: горим M=k-2 математикийн хүлээлт m=k дисперс D=2k (Зураг). Параметрийн хангалттай том утгатай ктархалт χ 2 (k) нь параметртэй ойролцоогоор хэвийн тархалттай байна

Математик статистикийн асуудлыг шийдвэрлэхдээ өгөгдсөн α магадлал ба эрх чөлөөний зэрэглэлийн тооноос хамааран χ 2 (k) чухал цэгүүдийг ашигладаг. к(Хавсралт 2). Χ 2 kr = Χ 2 (k; α) эгзэгтэй цэг нь тархалтын нягтын муруйн доорх талбайн 100- α % -тай тэнцэх баруун талд байрлах бүсийн хил юм. Туршилтын явцад санамсаргүй хэмжигдэхүүний K~χ 2 (k) утга χ 2 (k) цэгийн баруун талд унах магадлал α P(K≥χ 2 kp)≤ α) -аас хэтрэхгүй байна. Жишээлбэл, санамсаргүй хэмжигдэхүүн K~χ 2 (20)-ын хувьд α=0.05 магадлалыг тогтоосон. Хи-квадрат тархалтын чухал цэгүүдийн хүснэгтийг (хүснэгт) ашиглан бид χ 2 kp = χ 2 (20;0.05) = 31.4-ийг олно. Энэ нь санамсаргүй хэмжигдэхүүний магадлал гэсэн үг юм К 31.4-ээс их, 0.05-аас бага утгыг хүлээн авна (Зураг).

Цагаан будаа. Эрх чөлөөний зэрэглэлийн янз бүрийн утгуудын хувьд тархалтын нягтын график χ 2 (k) к

Чухал цэгүүд χ 2 (k) нь дараах тооцоолууруудад ашиглагддаг.

  1. Multicollinearity байгаа эсэхийг шалгах (олон коллинеарын тухай).
Чи-квадрат ашиглан таамаглалыг шалгах нь зөвхөн "харилцаа байна уу?" Гэсэн асуултад хариулах бөгөөд харилцааны чиглэлийг шалгахын тулд цаашдын судалгаа шаардлагатай. Түүнээс гадна Chi-square тест нь бага давтамжийн өгөгдөлтэй ажиллахад тодорхой алдаатай байдаг.

Тиймээс холболтын чиглэлийг шалгахын тулд корреляцийн шинжилгээ, ялангуяа Пирсоны корреляцийн коэффициентийг ашиглан таамаглалыг шалгах, t-тестийг ашиглан ач холбогдлын цаашдын шалгалтыг сонгосон.

Ач холбогдлын түвшний аль ч утгын хувьд α Χ 2-ийг MS Excel функцийг ашиглан олж болно: =HI2OBR(α;чөлөөний зэрэг)

n-1 .995 .990 .975 .950 .900 .750 .500 .250 .100 .050 .025 .010 .005
1 0.00004 0.00016 0.00098 0.00393 0.01579 0.10153 0.45494 1.32330 2.70554 3.84146 5.02389 6.63490 7.87944
2 0.01003 0.02010 0.05064 0.10259 0.21072 0.57536 1.38629 2.77259 4.60517 5.99146 7.37776 9.21034 10.59663
3 0.07172 0.11483 0.21580 0.35185 0.58437 1.21253 2.36597 4.10834 6.25139 7.81473 9.34840 11.34487 12.83816
4 0.20699 0.29711 0.48442 0.71072 1.06362 1.92256 3.35669 5.38527 7.77944 9.48773 11.14329 13.27670 14.86026
5 0.41174 0.55430 0.83121 1.14548 1.61031 2.67460 4.35146 6.62568 9.23636 11.07050 12.83250 15.08627 16.74960
6 0.67573 0.87209 1.23734 1.63538 2.20413 3.45460 5.34812 7.84080 10.64464 12.59159 14.44938 16.81189 18.54758
7 0.98926 1.23904 1.68987 2.16735 2.83311 4.25485 6.34581 9.03715 12.01704 14.06714 16.01276 18.47531 20.27774
8 1.34441 1.64650 2.17973 2.73264 3.48954 5.07064 7.34412 10.21885 13.36157 15.50731 17.53455 20.09024 21.95495
9 1.73493 2.08790 2.70039 3.32511 4.16816 5.89883 8.34283 11.38875 14.68366 16.91898 19.02277 21.66599 23.58935
10 2.15586 2.55821 3.24697 3.94030 4.86518 6.73720 9.34182 12.54886 15.98718 18.30704 20.48318 23.20925 25.18818
11 2.60322 3.05348 3.81575 4.57481 5.57778 7.58414 10.34100 13.70069 17.27501 19.67514 21.92005 24.72497 26.75685
12 3.07382 3.57057 4.40379 5.22603 6.30380 8.43842 11.34032 14.84540 18.54935 21.02607 23.33666 26.21697 28.29952
13 3.56503 4.10692 5.00875 5.89186 7.04150 9.29907 12.33976 15.98391 19.81193 22.36203 24.73560 27.68825 29.81947
14 4.07467 4.66043 5.62873 6.57063 7.78953 10.16531 13.33927 17.11693 21.06414 23.68479 26.11895 29.14124 31.31935
15 4.60092 5.22935 6.26214 7.26094 8.54676 11.03654 14.33886 18.24509 22.30713 24.99579 27.48839 30.57791 32.80132
16 5.14221 5.81221 6.90766 7.96165 9.31224 11.91222 15.33850 19.36886 23.54183 26.29623 28.84535 31.99993 34.26719
17 5.69722 6.40776 7.56419 8.67176 10.08519 12.79193 16.33818 20.48868 24.76904 27.58711 30.19101 33.40866 35.71847
18 6.26480 7.01491 8.23075 9.39046 10.86494 13.67529 17.33790 21.60489 25.98942 28.86930 31.52638 34.80531 37.15645
19 6.84397 7.63273 8.90652 10.11701 11.65091 14.56200 18.33765 22.71781 27.20357 30.14353 32.85233 36.19087 38.58226
20 7.43384 8.26040 9.59078 10.85081 12.44261 15.45177 19.33743 23.82769 28.41198 31.41043 34.16961 37.56623 39.99685
21 8.03365 8.89720 10.28290 11.59131 13.23960 16.34438 20.33723 24.93478 29.61509 32.67057 35.47888 38.93217 41.40106
22 8.64272 9.54249 10.98232 12.33801 14.04149 17.23962 21.33704 26.03927 30.81328 33.92444 36.78071 40.28936 42.79565
23 9.26042 10.19572 11.68855 13.09051 14.84796 18.13730 22.33688 27.14134 32.00690 35.17246 38.07563 41.63840 44.18128
24 9.88623 10.85636 12.40115 13.84843 15.65868 19.03725 23.33673 28.24115 33.19624 36.41503 39.36408 42.97982 45.55851
25 10.51965 11.52398 13.11972 14.61141 16.47341 19.93934 24.33659 29.33885 34.38159 37.65248 40.64647 44.31410 46.92789
26 11.16024 12.19815 13.84390 15.37916 17.29188 20.84343 25.33646 30.43457 35.56317 38.88514 41.92317 45.64168 48.28988
27 11.80759 12.87850 14.57338 16.15140 18.11390 21.74940 26.33634 31.52841 36.74122 40.11327 43.19451 46.96294 49.64492
28 12.46134 13.56471 15.30786 16.92788 18.93924 22.65716 27.33623 32.62049 37.91592 41.33714 44.46079 48.27824 50.99338
29 13.12115 14.25645 16.04707 17.70837 19.76774 23.56659 28.33613 33.71091 39.08747 42.55697 45.72229 49.58788 52.33562
30 13.78672 14.95346 16.79077 18.49266 20.59923 24.47761 29.33603 34.79974 40.25602 43.77297 46.97924 50.89218 53.67196
Эрх чөлөөний зэрэглэлийн тоо к Ач холбогдолын түвшин a
0,01 0,025 0.05 0,95 0,975 0.99
1 6.6 5.0 3.8 0.0039 0.00098 0.00016
2 9.2 7.4 6.0 0.103 0.051 0.020
3 11.3 9.4 7.8 0.352 0.216 0.115
4 13.3 11.1 9.5 0.711 0.484 0.297
5 15.1 12.8 11.1 1.15 0.831 0.554
6 16.8 14.4 12.6 1.64 1.24 0.872
7 18.5 16.0 14.1 2.17 1.69 1.24
8 20.1 17.5 15.5 2.73 2.18 1.65
9 21.7 19.0 16.9 3.33 2.70 2.09
10 23.2 20.5 18.3 3.94 3.25 2.56
11 24.7 21.9 19.7 4.57 3.82 3.05
12 26.2 23.3 21 .0 5.23 4.40 3.57
13 27.7 24.7 22.4 5.89 5.01 4.11
14 29.1 26.1 23.7 6.57 5.63 4.66
15 30.6 27.5 25.0 7.26 6.26 5.23
16 32.0 28.8 26.3 7.96 6.91 5.81
17 33.4 30.2 27.6 8.67 7.56 6.41
18 34.8 31.5 28.9 9.39 8.23 7.01
19 36.2 32.9 30.1 10.1 8.91 7.63
20 37.6 34.2 31.4 10.9 9.59 8.26
21 38.9 35.5 32.7 11.6 10.3 8.90
22 40.3 36.8 33.9 12.3 11.0 9.54
23 41.6 38.1 35.2 13.1 11.7 10.2
24 43.0 39.4 36.4 13.8 12.4 10.9
25 44.3 40.6 37.7 14.6 13.1 11.5
26 45.6 41.9 38.9 15.4 13.8 12.2
27 47.0 43.2 40.1 16.2 14.6 12.9
28 48.3 44.5 41.3 16.9 15.3 13.6
29 49.6 45.7 42.6 17.7 16.0 14.3
30 50.9 47.0 43.8 18.5 16.8 15.0

Хи-квадрат тархалт нь статистикийн таамаглалыг шалгахад хамгийн өргөн хэрэглэгддэг статистикийн нэг юм. Хи-квадрат хуваарилалт дээр үндэслэн хамгийн хүчирхэг тохирох сайн чанарын тестүүдийн нэг болох Пирсон хи-квадрат тестийг бүтээжээ.

Зөвшилцлийн шалгуур нь үл мэдэгдэх тархалтын таамагласан хуулийн талаархи таамаглалыг шалгах шалгуур юм.

Янз бүрийн тархалтын таамаглалыг шалгахын тулд χ2 (хи-квадрат) тестийг ашигладаг. Энэ бол түүний нэр төр юм.

Шалгуурын тооцооны томъёо нь тэнцүү байна

Энд m ба m’ нь эмпирик болон онолын давтамж юм

тухайн хуваарилалт;

n нь эрх чөлөөний зэрэглэлийн тоо юм.

Шалгахын тулд бид эмпирик (ажиглагдсан) ба онолын (хэвийн тархалтын таамаглалаар тооцоолсон) давтамжийг харьцуулах хэрэгтэй.

Хэрэв эмпирик давтамжууд нь тооцоолсон эсвэл хүлээгдэж буй давтамжтай бүрэн давхцаж байвал S (E – T) = 0 ба χ2 шалгуур нь мөн тэгтэй тэнцүү байна. Хэрэв S (E – T) нь тэгтэй тэнцүү биш бол энэ нь тооцоолсон давтамж болон цувралын эмпирик давтамжуудын хоорондын зөрүүг илэрхийлнэ. Ийм тохиолдолд онолын хувьд тэгээс хязгааргүй хүртэл хэлбэлзэж болох χ2 шалгуурын ач холбогдлыг үнэлэх шаардлагатай. Үүнийг χ2ф-ийн бодит утгыг түүний чухал утгатай (χ2-р) харьцуулах замаар хийдэг. Тэг таамаглал, өөрөөр хэлбэл эмпирик ба онолын эсвэл хүлээгдэж буй давтамжийн зөрүү нь санамсаргүй байна гэсэн таамаглалыг χ2ф нь χ2-ээс их буюу тэнцүү бол няцаана. хүлээн зөвшөөрөгдсөн ач холбогдлын түвшин (a) ба эрх чөлөөний зэрэглэлийн тоо (n).

χ2 санамсаргүй хэмжигдэхүүний боломжит утгуудын тархалт тасралтгүй бөгөөд тэгш бус байна. Энэ нь эрх чөлөөний зэрэглэлийн тооноос (n) хамаардаг ба ажиглалтын тоо нэмэгдэх тусам хэвийн тархалтад ойртоно. Тиймээс χ2 шалгуурыг салангид тархалтын үнэлгээнд хэрэглэх нь түүний үнэ цэнэд нөлөөлдөг зарим алдаа, ялангуяа жижиг түүвэрт байдаг. Илүү үнэн зөв тооцоолол гаргахын тулд вариацын цувралд хуваарилагдсан түүвэр нь дор хаяж 50 сонголттой байх ёстой. χ2 шалгуурыг зөв хэрэглэхийн тулд хэт ангиллын хувилбаруудын давтамж 5-аас багагүй байх шаардлагатай; хэрэв тэдгээрийн 5-аас бага бол тэдгээрийг хөрш зэргэлдээх ангиудын давтамжтай нэгтгэж нийт дүн нь 5-аас их буюу тэнцүү байна. Давтамжийн хослолын дагуу ангиллын тоо (N) буурдаг. Эрх чөлөөний зэрэглэлийн тоог өөрчлөлтийн эрх чөлөөг хязгаарлах тоог харгалзан хоёрдогч ангиудын тоогоор тогтооно.



χ2 шалгуурыг тодорхойлох нарийвчлал нь онолын давтамжийг (T) тооцоолох нарийвчлалаас ихээхэн хамаардаг тул эмпирик болон тооцоолсон давтамжийн зөрүүг олж авахын тулд дугуйраагүй онолын давтамжийг ашиглах хэрэгтэй.

Жишээлбэл, хүмүүнлэгийн шинжлэх ухаанд статистикийн аргыг хэрэглэхэд зориулагдсан вэбсайтад нийтлэгдсэн судалгааг авч үзье.

Chi-square тест нь давтамжийн тархалтыг хэвийн тархсан эсэхээс үл хамааран харьцуулах боломжийг олгодог.

Давтамж гэдэг нь үйл явдлын тохиолдлын тоог илэрхийлдэг. Ихэвчлэн хувьсагчдыг нэрсийн масштабаар хэмжиж, давтамжаас гадна бусад шинж чанаруудыг сонгох боломжгүй эсвэл асуудалтай байдаг тохиолдолд үйл явдлын давтамжийг авч үздэг. Өөрөөр хэлбэл, хувьсагч нь чанарын шинж чанартай байх үед. Түүнчлэн, олон судлаачид тестийн оноог түвшин (өндөр, дунд, бага) болгон хувиргаж, эдгээр түвшинд байгаа хүмүүсийн тоог олохын тулд онооны хуваарилалтын хүснэгтийг бүтээх хандлагатай байдаг. Түвшингийн аль нэгэнд (нэг ангилалд) хүмүүсийн тоо үнэхээр их (бага) байгааг нотлохын тулд Chi-square коэффициентийг ашигладаг.

Хамгийн энгийн жишээг авч үзье.

Өөрийгөө үнэлэх чадварыг тодорхойлохын тулд өсвөр насныхны дунд тест хийсэн. Туршилтын оноог өндөр, дунд, бага гэсэн гурван түвшинд шилжүүлсэн. Давтамжийг дараах байдлаар хуваарилав.

Өндөр (B) 27 хүн.

Дунджаар (C) 12 хүн.

Бага (L) 11 хүн

Хүүхдүүдийн дийлэнх нь өөрийгөө өндөр үнэлдэг нь ойлгомжтой боловч үүнийг статистикаар нотлох шаардлагатай. Үүнийг хийхийн тулд бид Chi-square тестийг ашигладаг.

Бидний даалгавар бол олж авсан эмпирик өгөгдөл нь онолын хувьд адил магадлалтайгаас ялгаатай эсэхийг шалгах явдал юм. Үүнийг хийхийн тулд та онолын давтамжийг олох хэрэгтэй. Манай тохиолдолд онолын давтамжууд нь бүх давтамжийг нэмж, ангиллын тоонд хуваах замаар олддог ижил магадлалтай давтамжууд юм.

Манай тохиолдолд:

(B + C + H)/3 = (27+12+11)/3 = 16.6

Хи-квадрат тестийг тооцоолох томъёо:

χ2 = ∑(E - T)I / T

Бид хүснэгтийг бүтээдэг:

Сүүлийн баганын нийлбэрийг ол:

Одоо та чухал утгуудын хүснэгтийг ашиглан шалгуурын чухал утгыг олох хэрэгтэй (Хавсралт дахь Хүснэгт 1). Үүнийг хийхийн тулд бидэнд эрх чөлөөний зэрэг (n) хэрэгтэй.

n = (R - 1) * (C - 1)

Энд R нь хүснэгтийн мөрийн тоо, C нь баганын тоо юм.

Манай тохиолдолд зөвхөн нэг багана (анхны эмпирик давтамж гэсэн үг) ба гурван мөр (категори) байдаг тул томъёо өөрчлөгддөг - бид багануудыг хасдаг.

n = (R - 1) = 3-1 = 2

p≤0.05 ба n = 2 алдааны магадлалын хувьд чухал утга нь χ2 = 5.99 байна.

Хүлээн авсан эмпирик утга нь эгзэгтэй утгаас их байна - давтамжийн ялгаа нь мэдэгдэхүйц байна (χ2= 9.64; p≤0.05).

Таны харж байгаагаар шалгуур үзүүлэлтийг тооцоолох нь маш энгийн бөгөөд их цаг хугацаа шаарддаггүй. Хи-квадрат тестийн практик ач холбогдол нь асар их юм. Энэ арга нь асуулгад өгсөн хариултыг шинжлэхэд хамгийн үнэ цэнэтэй юм.


Илүү төвөгтэй жишээг авч үзье.

Жишээлбэл, багш нар охидоос илүү хөвгүүдэд ханддаг нь үнэн эсэхийг сэтгэл зүйч мэдэхийг хүсдэг. Тэдгээр. охидыг магтах магадлал өндөр. Үүнийг хийхийн тулд сэтгэл судлаач багш нарын бичсэн сурагчдын онцлог шинж чанарыг "идэвхтэй", "хичээл зүтгэлтэй", "сахилга баттай" гэсэн гурван үг гарах давтамжаар шинжилж, үгсийн ижил утгатай үгсийг мөн тоолсон. Үгсийн давтамжийн талаархи мэдээллийг хүснэгтэд оруулсан болно.

Хүлээн авсан өгөгдлийг боловсруулахын тулд бид хи-квадрат тестийг ашигладаг.

Үүнийг хийхийн тулд бид эмпирик давтамжийн тархалтын хүснэгтийг бүтээх болно, жишээлбэл. Бидний ажиглаж буй давтамжууд:

Онолын хувьд бид давтамжийг тэгш хуваарилна гэж найдаж байна, өөрөөр хэлбэл. давтамжийг охид, хөвгүүдийн хооронд пропорциональ хуваарилах болно. Онолын давтамжийн хүснэгтийг байгуулъя. Үүнийг хийхийн тулд мөрийн нийлбэрийг баганын нийлбэрээр үржүүлж, гарсан тоог нийт нийлбэрт хуваана.

Тооцооллын эцсийн хүснэгт дараах байдалтай байна.

χ2 = ∑(E - T)I / T

n = (R - 1), энд R нь хүснэгтийн мөрүүдийн тоо юм.

Манай тохиолдолд хи-квадрат = 4.21; n = 2.

Шалгуурын эгзэгтэй утгуудын хүснэгтийг ашиглан бид олж мэднэ: n = 2, алдааны түвшин 0.05 бол чухал утга нь χ2 = 5.99 байна.

Үүссэн утга нь эгзэгтэй утгаас бага байгаа нь тэг таамаглалыг хүлээн зөвшөөрсөн гэсэн үг юм.

Дүгнэлт: багш нар хүүхдэд зориулсан шинж чанарыг бичихдээ түүний хүйсийг анхаарч үздэггүй.


Дүгнэлт.

К.Пирсон математик статистикийн хөгжилд ихээхэн хувь нэмэр оруулсан (олон тооны суурь ойлголт). Пирсоны философийн үндсэн байр суурийг дараах байдлаар томъёолсон: шинжлэх ухааны ойлголтууд нь хиймэл бүтээц, мэдрэхүйн туршлагыг дүрслэх, эмхлэх хэрэгсэл юм; тэдгээрийг шинжлэх ухааны өгүүлбэр болгон холбох дүрэм нь шинжлэх ухааны философи болох шинжлэх ухааны дүрмээр тусгаарлагдсан байдаг. Бүх нийтийн сахилга бат - хэрэглээний статистик нь Пирсоны хэлснээр энэ нь субъектив шинж чанартай боловч өөр өөр ойлголт, үзэгдлийг хооронд нь холбох боломжийг бидэнд олгодог.

К.Пирсоны ихэнх бүтээн байгуулалтууд нь антропологийн материалыг ашиглан шууд холбоотой буюу боловсруулсан байдаг. Тэрээр шинжлэх ухааны бүхий л салбарт хэрэглэгддэг тоон ангилал, статистикийн шалгууруудын олон аргыг боловсруулсан.


Уран зохиол.

1. Боголюбов А.Н. Математик. Механик. Намтар судлалын лавлах ном. - Киев: Наукова Думка, 1983 он.

2. Колмогоров А.Н., Юшкевич А.П. (ред.). 19-р зууны математик. - М .: Шинжлэх ухаан. - Т.И.

3. 3. Боровков А.А. Математик статистик. М.: Наука, 1994 он.

4. 8. Феллер V. Магадлалын онолын танилцуулга, түүний хэрэглээ. - М.: Мир, Т.2, 1984.

5. 9. Харман Г., Орчин үеийн хүчин зүйлийн шинжилгээ. - М.: Статистик, 1972.

ОХУ-ын Боловсрол, шинжлэх ухааны яам

Эрхүү хотын Холбооны боловсролын агентлаг

Байгаль нуурын улсын эдийн засаг, хуулийн их сургууль

Мэдээлэл зүй, кибернетикийн тэнхим

Хи квадрат тархалт ба түүний хэрэглээ

Колмыкова Анна Андреевна

2-р курсын оюутан

бүлэг IS-09-1

Хүлээн авсан өгөгдлийг боловсруулахын тулд бид хи-квадрат тестийг ашигладаг.

Үүнийг хийхийн тулд бид эмпирик давтамжийн тархалтын хүснэгтийг бүтээх болно, жишээлбэл. Бидний ажиглаж буй давтамжууд:

Онолын хувьд бид давтамжийг тэгш хуваарилна гэж найдаж байна, өөрөөр хэлбэл. давтамжийг охид, хөвгүүдийн хооронд пропорциональ хуваарилах болно. Онолын давтамжийн хүснэгтийг байгуулъя. Үүнийг хийхийн тулд мөрийн нийлбэрийг баганын нийлбэрээр үржүүлж, гарсан тоог нийт нийлбэрт хуваана.


Тооцооллын эцсийн хүснэгт дараах байдалтай байна.

χ2 = ∑(E - T)² / T

n = (R - 1), энд R нь хүснэгтийн мөрүүдийн тоо юм.

Манай тохиолдолд хи-квадрат = 4.21; n = 2.

Шалгуурын эгзэгтэй утгуудын хүснэгтийг ашиглан бид олж мэднэ: n = 2, алдааны түвшин 0.05 бол чухал утга нь χ2 = 5.99 байна.

Үүссэн утга нь эгзэгтэй утгаас бага байгаа нь тэг таамаглалыг хүлээн зөвшөөрсөн гэсэн үг юм.

Дүгнэлт: багш нар хүүхдэд зориулсан шинж чанарыг бичихдээ түүний хүйсийг анхаарч үздэггүй.

Өргөдөл

χ2 тархалтын чухал цэгүүд

Хүснэгт 1

Дүгнэлт

Бараг бүх мэргэжлийн оюутнууд дээд математикийн курсын төгсгөлд "Магадлалын онол ба математикийн статистик" хэсгийг судалж, бодит байдал дээр зөвхөн зарим үндсэн ойлголт, үр дүнтэй танилцдаг бөгөөд энэ нь практик ажилд хангалтгүй юм. Оюутнуудыг тусгай хичээлээр математикийн судалгааны зарим аргуудтай (жишээлбэл, "Урьдчилан таамаглах, техник-эдийн засгийн төлөвлөлт", "Техник-эдийн засгийн шинжилгээ", "Бүтээгдэхүүний чанарын хяналт", "Маркетинг", "Хяналт", "Таамаглах математик аргууд"-тай танилцуулдаг. ”) ", "Статистик" гэх мэт - эдийн засгийн мэргэжлээр суралцаж буй оюутнуудын хувьд), гэхдээ ихэнх тохиолдолд танилцуулга нь маш товчилсон бөгөөд томъёололтой байдаг. Үүний үр дүнд хэрэглээний статистикийн мэргэжилтнүүдийн мэдлэг хангалтгүй байна.

Иймд техникийн их дээд сургуулиудад “Хэрэглээний статистик” хичээл, эдийн засгийн их, дээд сургуулиудад “Эконометрик” хичээл нь чухал ач холбогдолтой бөгөөд учир нь эконометрикс нь эдийн засгийн тодорхой өгөгдөлд статистик дүн шинжилгээ хийдэг.

Магадлалын онол, математик статистик нь хэрэглээний статистик болон эконометрикийн суурь мэдлэгийг өгдөг.

Эдгээр нь мэргэжилтнүүдэд практик ажилд шаардлагатай байдаг.

Үргэлжилсэн магадлалын загварыг үзээд түүний хэрэглээг жишээгээр харуулахыг хичээсэн.

Ашигласан уран зохиолын жагсаалт

1. Орлов А.И. Хэрэглээний статистик. М .: "Шалгалт" хэвлэлийн газар, 2004 он.

2. Гмурман В.Е. Магадлалын онол, математик статистик. М.: Дээд сургууль, 1999. – 479 х.

3. Айвозян С.А. Магадлалын онол ба хэрэглээний статистик, 1-р боть. М.: Эв нэгдэл, 2001. – 656 х.

4. Хамитов Г.П., Ведерникова Т.И. Магадлал ба статистик. Эрхүү: BGUEP, 2006 – 272 х.

5. Ежова Л.Н. Эконометрик. Эрхүү: БГУЭП, 2002. – 314 х.

6. Mosteller F. Шийдэл бүхий тавин хөгжилтэй магадлалын бодлого. М.: Наука, 1975. – 111 х.

7. Мостеллер Ф.Магадлал. М.: Мир, 1969. – 428 х.

8. Яглом А.М. Магадлал ба мэдээлэл. М.: Наука, 1973. – 511 х.

9. Чистяков В.П. Магадлалын онолын хичээл. М.: Наука, 1982. – 256 х.

10. Кремер Н.Ш. Магадлалын онол, математик статистик. М.: НЭГДЭЛ, 2000. – 543 х.

11. Математик нэвтэрхий толь, 1-р боть. М.: Зөвлөлтийн нэвтэрхий толь бичиг, 1976. – 655 х.

12. http://psystat.at.ua/ - Сэтгэл судлал, сурган хүмүүжүүлэх ухааны статистик. Нийтлэл Хи-квадрат тест.

ОХУ-ын Боловсрол, шинжлэх ухааны яам

Эрхүү хотын Холбооны боловсролын агентлаг

Байгаль нуурын улсын эдийн засаг, хуулийн их сургууль

Мэдээлэл зүй, кибернетикийн тэнхим

Хи квадрат тархалт ба түүний хэрэглээ

Колмыкова Анна Андреевна

2-р курсын оюутан

бүлэг IS-09-1

Эрхүү 2010 он

Танилцуулга

1. Хи квадратын тархалт

Өргөдөл

Дүгнэлт

Ашигласан уран зохиолын жагсаалт

Танилцуулга

Магадлалын онолын арга барил, санаа, үр дүнг бидний амьдралд хэрхэн ашигладаг вэ?

Үүний үндэс нь бодит үзэгдэл, үйл явцын магадлалын загвар юм. объектив харилцааг магадлалын онолоор илэрхийлдэг математик загвар. Магадлалыг голчлон шийдвэр гаргахдаа анхаарах ёстой тодорхой бус байдлыг тодорхойлоход ашигладаг. Энэ нь хүсээгүй боломж (эрсдэл) болон сонирхол татахуйц боломжуудыг ("азтай боломж") хоёуланг нь хэлнэ. Заримдаа санамсаргүй байдлыг нөхцөл байдалд зориудаар нэвтрүүлдэг, жишээлбэл, сугалаа сугалах, хяналтын нэгжийг санамсаргүй байдлаар сонгох, сугалаа явуулах эсвэл хэрэглэгчийн санал асуулга явуулах үед.

Магадлалын онол нь нэг магадлалыг ашиглан судлаачийн сонирхсон бусад зүйлийг тооцоолох боломжийг олгодог.

Аливаа үзэгдэл, үйл явцын магадлалын загвар нь математик статистикийн үндэс суурь болдог. Онол (магадлалын загвар) ба практикт хамаарах (ажиглалтын үр дүнгийн түүвэр) гэсэн хоёр зэрэгцээ цуврал ойлголтыг ашигладаг. Жишээлбэл, онолын магадлал нь дээжээс олдсон давтамжтай тохирч байна. Математикийн хүлээлт (онолын цуваа) нь түүврийн арифметик дундажтай (практик цуврал) тохирч байна. Дүрмээр бол түүврийн шинж чанарууд нь онолын тооцоолол юм. Үүний зэрэгцээ "судлаачдын толгойд байдаг" онолын цувралтай холбоотой хэмжигдэхүүнүүд нь үзэл бодлын ертөнцтэй холбоотой (Эртний Грекийн гүн ухаантан Платоны хэлснээр) бөгөөд шууд хэмжих боломжгүй байдаг. Судлаачид зөвхөн өөрсдийн сонирхсон онолын магадлалын загварын шинж чанарыг тогтоохыг оролдсон түүвэр өгөгдөлтэй байдаг.

Яагаад бидэнд магадлалын загвар хэрэгтэй байна вэ? Баримт нь зөвхөн түүний тусламжтайгаар тодорхой дээжийн шинжилгээнээс олж авсан шинж чанарыг бусад дээж, түүнчлэн нийт хүн ам гэж нэрлэгддэг бүх хүмүүст шилжүүлэх боломжтой юм. "Хүн ам" гэсэн нэр томъёог судалж буй нэгжийн том боловч хязгаарлагдмал цуглуулгыг илэрхийлэхэд ашигладаг. Жишээлбэл, Оросын бүх оршин суугчид эсвэл Москва дахь уусдаг кофены бүх хэрэглэгчдийн нийт тухай. Маркетингийн болон социологийн судалгааны зорилго нь түүвэр судалгаанаас хэдэн зуу, мянган хүнээс олж авсан мэдэгдлийг хэдэн сая хүн амд шилжүүлэх явдал юм. Чанарын хяналтад бүтээгдэхүүний багц нь нийт хүн амын үүрэг гүйцэтгэдэг.

Дүгнэлтийг түүврээс илүү том популяци руу шилжүүлэхийн тулд түүврийн шинж чанар нь энэ том популяцийн шинж чанаруудтай холбоотой зарим таамаглалыг шаарддаг. Эдгээр таамаглалууд нь тохирох магадлалын загвар дээр суурилдаг.

Мэдээжийн хэрэг, нэг эсвэл өөр магадлалын загвар ашиглахгүйгээр түүврийн өгөгдлийг боловсруулах боломжтой. Жишээлбэл, та арифметик дундажийг тооцоолж, тодорхой нөхцлийн биелэлтийн давтамжийг тоолж болно. Гэсэн хэдий ч тооцооллын үр дүн нь зөвхөн тодорхой түүвэрт хамаарах болно, тэдгээрийн тусламжтайгаар олж авсан дүгнэлтийг бусад хүн амд шилжүүлэх нь буруу юм. Энэ үйл ажиллагааг заримдаа "өгөгдлийн шинжилгээ" гэж нэрлэдэг. Магадлал-статистикийн аргуудтай харьцуулахад өгөгдөлд дүн шинжилгээ хийх нь боловсролын ач холбогдол багатай байдаг.

Тиймээс түүврийн шинж чанарыг ашиглан таамаглалыг үнэлэх, шалгахад суурилсан магадлалын загварыг ашиглах нь шийдвэр гаргах магадлал-статистик аргын мөн чанар юм.

Хи квадратын тархалт

Ердийн тархалтыг ашиглан одоо статистик мэдээлэл боловсруулахад ихэвчлэн хэрэглэгддэг гурван тархалтыг тодорхойлсон. Эдгээр нь Пирсон ("хи-дөрвөлжин"), Оюутны болон Фишерийн хуваарилалт юм.

Бид хуваарилалтад анхаарлаа хандуулах болно

("чи - дөрвөлжин"). Энэхүү тархалтыг одон орон судлаач Ф.Хелмерт 1876 онд анх судалжээ. Гауссын алдааны онолтой холбогдуулан тэрээр n бие даасан стандарт хэвийн тархалттай санамсаргүй хэмжигдэхүүний квадратуудын нийлбэрийг судалсан. Карл Пирсон хожим энэ хуваарилалтын функцийг "хи-квадрат" гэж нэрлэсэн. Тэгээд одоо түгээлт нь түүний нэрээр нэрлэгдсэн.

Хэвийн тархалттай нягт холбоотой учраас χ2 тархалт магадлалын онол болон математик статистикт чухал үүрэг гүйцэтгэдэг. χ2 тархалт болон χ2 тархалтаар тодорхойлогддог бусад олон тархалт (жишээлбэл, Оюутны тархалт) нь ердийн тархсан ажиглалтын үр дүнгээс янз бүрийн функцүүдийн түүврийн тархалтыг тайлбарлаж, итгэлийн интервал болон статистик тестийг бий болгоход ашиглагддаг.

Пирсоны хуваарилалт

(chi - квадрат) – X1, X2,..., Xn нь хэвийн бие даасан санамсаргүй хэмжигдэхүүн бөгөөд тус бүрийн математикийн хүлээлт тэг, стандарт хазайлт нь нэг байх санамсаргүй хэмжигдэхүүний тархалт.

Квадратуудын нийлбэр


хуулийн дагуу хуваарилсан

("чи - дөрвөлжин").

Энэ тохиолдолд нэр томъёоны тоо, i.e. n-ийг хи-квадрат тархалтын “чөлөөний зэрэглэлийн тоо” гэж нэрлэдэг.Эрх чөлөөний зэрэглэлийн тоо нэмэгдэхийн хэрээр тархалт аажмаар хэвийн хэмжээнд ойртдог.

Энэ хуваарилалтын нягтрал

Тиймээс χ2-ийн тархалт нь нэг параметр болох n - чөлөөт байдлын зэрэгээс хамаарна.

χ2 тархалтын функц нь дараах хэлбэртэй байна.

хэрэв χ2≥0. (2.7.)

1-р зурагт магадлалын нягт ба χ2 тархалтын функцын янз бүрийн зэрэглэлийн эрх чөлөөний графикийг үзүүлэв.

Зураг 1χ2 (хи – квадрат) тархалт дахь магадлалын нягтын φ (x) хамаарал нь янз бүрийн тооны эрх чөлөөний зэрэг юм.

Хи квадратын тархалтын мөчүүд:

Хи-квадрат тархалтыг дисперсийг тооцох (итгэлийн интервал ашиглан), тохироо, нэгэн төрлийн байдал, бие даасан байдлын таамаглалыг шалгах, үндсэндээ хязгаарлагдмал тооны утгыг авдаг чанарын (ангилсан) хувьсагчдад болон статистик мэдээллийн шинжилгээний бусад олон ажлуудад ашигладаг. .

2. Статистикийн мэдээллийн шинжилгээний асуудалд "Хи-квадрат"

Мэдээллийн шинжилгээний статистик аргуудыг хүний ​​үйл ажиллагааны бараг бүх салбарт ашигладаг. Тэдгээрийг зарим дотоод ялгаатай байдал бүхий бүлэг (объект эсвэл субьект) -ийн талаархи аливаа дүгнэлтийг олж авах, зөвтгөх шаардлагатай үед ашигладаг.

Статистикийн аргуудын хөгжлийн орчин үеийн үе шатыг англи хүн К.Пирсон "Биометрика" сэтгүүлийг үүсгэн байгуулсан 1900 оноос эхлэн тоолж болно. ХХ зууны эхний гуравны нэг. параметрийн статистикийн тэмдгийн дор дамжсан. Пирсоны гэр бүлийн муруйгаар тодорхойлсон тархалтын параметрийн бүлгүүдийн өгөгдлийн шинжилгээнд үндэслэн аргуудыг судалсан. Хамгийн алдартай нь хэвийн тархалт байв. Таамаглалыг шалгахын тулд Pearson, Student, Fisher тестүүдийг ашигласан. Хамгийн их магадлалын арга, дисперсийн шинжилгээг санал болгож, туршилтын төлөвлөлтийн үндсэн санааг томъёолсон.

Хи-квадрат тархалт нь статистикийн таамаглалыг шалгахад хамгийн өргөн хэрэглэгддэг статистикийн нэг юм. Хи-квадрат хуваарилалт дээр үндэслэн хамгийн хүчирхэг тохирох сайн чанарын тестүүдийн нэг болох Пирсон хи-квадрат тестийг бүтээжээ.

Зөвшилцлийн шалгуур нь үл мэдэгдэх тархалтын таамагласан хуулийн талаархи таамаглалыг шалгах шалгуур юм.

Янз бүрийн тархалтын таамаглалыг шалгахын тулд χ2 (хи-квадрат) тестийг ашигладаг. Энэ бол түүний нэр төр юм.

Шалгуурын тооцооны томъёо нь тэнцүү байна

Энд m ба m’ нь эмпирик болон онолын давтамж юм

тухайн хуваарилалт;

n нь эрх чөлөөний зэрэглэлийн тоо юм.

Шалгахын тулд бид эмпирик (ажиглагдсан) ба онолын (хэвийн тархалтын таамаглалаар тооцоолсон) давтамжийг харьцуулах хэрэгтэй.

Хэрэв эмпирик давтамжууд нь тооцоолсон эсвэл хүлээгдэж буй давтамжтай бүрэн давхцаж байвал S (E – T) = 0 ба χ2 шалгуур нь мөн тэгтэй тэнцүү байна. Хэрэв S (E – T) нь тэгтэй тэнцүү биш бол энэ нь тооцоолсон давтамж болон цувралын эмпирик давтамжуудын хоорондын зөрүүг илэрхийлнэ. Ийм тохиолдолд онолын хувьд тэгээс хязгааргүй хүртэл хэлбэлзэж болох χ2 шалгуурын ач холбогдлыг үнэлэх шаардлагатай. Үүнийг χ2ф-ийн бодит утгыг түүний чухал утгатай (χ2-р) харьцуулах замаар хийдэг. Тэг таамаглал, өөрөөр хэлбэл эмпирик ба онолын эсвэл хүлээгдэж буй давтамжийн зөрүү нь санамсаргүй байна гэсэн таамаглалыг χ2ф нь χ2-ээс их буюу тэнцүү бол няцаана. хүлээн зөвшөөрөгдсөн ач холбогдлын түвшин (a) ба эрх чөлөөний зэрэглэлийн тоо (n).



Танд нийтлэл таалагдсан уу? Найзуудтайгаа хуваалцаарай!