Статистикт хи квадрат гэж юу вэ. Нарийн таамаглалыг шалгахын тулд хи-квадрат тестийг ашиглах

Пирсоны χ 2 тест нь ангилал тус бүрт хамаарах түүврийн үр дүнгийн бодит (илчлэгдсэн) тоо, чанарын шинж чанар ба судалж буй судалгаанд хүлээгдэж буй онолын тоо хоорондын ялгааны ач холбогдлыг үнэлэх боломжийг олгодог параметрийн бус арга юм. тэг таамаглал үнэн бол бүлэг. Энгийнээр хэлбэл, энэ арга нь хоёр ба түүнээс дээш харьцангуй үзүүлэлтүүдийн (давтамж, пропорциональ) ялгааны статистик ач холбогдлыг үнэлэх боломжийг олгодог.

1. χ 2 шалгуурын хөгжлийн түүх

Гэнэтийн хүснэгтэд дүн шинжилгээ хийх хи-квадрат тестийг 1900 онд Английн математикч, статистикч, биологич, философич, математикийн статистикийг үндэслэгч, биометрикийг үндэслэгчдийн нэг боловсруулж, санал болгосон. Карл Пирсон(1857-1936).

2. Пирсоны χ 2 тестийг яагаад ашигладаг вэ?

Шинжилгээнд хи-квадрат тестийг ашиглаж болно гэнэтийн хүснэгтүүдэрсдэлт хүчин зүйл байгаа эсэхээс хамааран үр дүнгийн давтамжийн талаарх мэдээллийг агуулсан. Жишээлбэл, дөрвөн талбарын болзошгүй ослын хүснэгтиймэрхүү харагдаж байна:

Үр дүн байна (1) Үр дүн байхгүй (0) Нийт
Эрсдлийн хүчин зүйл байдаг (1) А Б A+B
Эрсдлийн хүчин зүйл байхгүй (0) C Д C+D
Нийт A+C B+D A+B+C+D

Ийм гэнэтийн хүснэгтийг хэрхэн бөглөх вэ? Жижигхэн жишээг харцгаая.

Тамхи татах нь артерийн гипертензи үүсэх эрсдэлд хэрхэн нөлөөлдөг талаар судалгаа хийж байна. Энэ зорилгоор хоёр бүлгийн субьектийг сонгосон - эхнийх нь өдөрт дор хаяж 1 хайрцаг тамхи татдаг 70 хүн, хоёрдугаарт ижил насны 80 тамхи татдаггүй хүмүүс багтсан. Эхний бүлэгт 40 хүн цусны даралт ихсэлттэй байсан. Хоёрдугаарт артерийн гипертензи 32 хүн ажиглагдсан. Үүний дагуу тамхичдын бүлэгт цусны даралт хэвийн 30 хүн (70 - 40 = 30), тамхи татдаггүй хүмүүсийн бүлэгт 48 (80 - 32 = 48) байна.

Бид дөрвөн талбарын болзошгүй байдлын хүснэгтийг анхны өгөгдлөөр бөглөнө.

Үүссэн болзошгүй нөхцөл байдлын хүснэгтэд мөр бүр нь тодорхой бүлэг субъектуудтай тохирч байна. Багана - артерийн даралт ихсэх эсвэл хэвийн даралттай хүмүүсийн тоог харуулна.

Судлаачийн өмнө тавьсан даалгавар бол: Тамхи татдаг болон татдаггүй хүмүүсийн цусны даралт ихсэх давтамжийн хооронд статистикийн хувьд мэдэгдэхүйц ялгаа байдаг уу? Энэ асуултын хариултыг Pearson хи-квадрат тестийг тооцоолж, үр дүнгийн утгыг чухал утгатай харьцуулж болно.

3. Пирсоны хи-квадрат тестийг хэрэглэх нөхцөл, хязгаарлалт

  1. Харьцуулж болох үзүүлэлтүүдийг хэмжсэн байх ёстой нэрлэсэн масштаб(жишээлбэл, өвчтөний хүйс нь эрэгтэй эсвэл эмэгтэй) эсвэл дотор дараалал(жишээлбэл, артерийн гипертензийн зэрэг, 0-ээс 3 хүртэлх утгыг авна).
  2. Энэ арга нь хүчин зүйл ба үр дүн хоёулаа хоёртын хувьсагч байх үед зөвхөн дөрвөн талбарын хүснэгтэд дүн шинжилгээ хийх боломжийг олгодог, өөрөөр хэлбэл тэдгээр нь зөвхөн хоёр боломжит утгатай байдаг (жишээлбэл, эрэгтэй эсвэл эмэгтэй хүйс, байгаа эсэх, байхгүй эсэх). Анамнез дахь тодорхой өвчин ...). Пирсон хи-квадрат тестийг хүчин зүйл ба (эсвэл) үр дүн нь гурав ба түүнээс дээш утгыг авсан тохиолдолд олон талт хүснэгтэд дүн шинжилгээ хийх тохиолдолд ашиглаж болно.
  3. Харьцуулж буй бүлгүүд нь бие даасан байх ёстой, өөрөөр хэлбэл ажиглалтын өмнөх ба дараа нь харьцуулахдаа хи-квадрат тестийг ашиглаж болохгүй. МакНемарын тест(холбоотой хоёр популяцийг харьцуулах үед) эсвэл тооцоолсон Кочраны Q тест(гурав ба түүнээс дээш бүлгийг харьцуулах тохиолдолд).
  4. Дөрвөн талбарт хүснэгтэд дүн шинжилгээ хийх үед хүлээгдэж буй утгууднүд бүр дор хаяж 10 байх ёстой. Хэрэв дор хаяж нэг нүдэнд хүлээгдэж буй үзэгдэл 5-аас 9 хүртэлх утгыг авч байвал хи-квадрат тестийг тооцоолох шаардлагатай. Йейтсийн нэмэлт өөрчлөлтөөр. Хэрэв дор хаяж нэг нүдэнд хүлээгдэж буй үзэгдэл 5-аас бага байвал шинжилгээг ашиглах ёстой Фишерийн нарийн тест.
  5. Олон талт хүснэгтэд дүн шинжилгээ хийхдээ хүлээгдэж буй ажиглалтын тоо 20% -иас илүү нүдэнд 5-аас багагүй байх ёстой.

4. Пирсоны хи-квадрат тестийг хэрхэн тооцоолох вэ?

Хи-квадрат тестийг тооцоолохын тулд танд дараахь зүйлс хэрэгтэй болно.

Энэ алгоритм нь дөрвөн талбар болон олон талбарт хүснэгтэд тохиромжтой.

5. Пирсоны хи-квадрат тестийн утгыг хэрхэн тайлбарлах вэ?

Хэрэв χ 2 шалгуурын олж авсан утга нь эгзэгтэй утгаас их байвал судлагдсан эрсдэлийн хүчин зүйл болон үр дүнгийн хооронд зохих түвшний ач холбогдлын статистик хамаарал байгаа гэж бид дүгнэж байна.

6. Пирсоны хи-квадрат тестийг тооцоолох жишээ

Артерийн гипертензийн өвчлөлд тамхи татах хүчин зүйлийн нөлөөллийн статистик ач холбогдлыг дээр дурдсан хүснэгтийг ашиглан тодорхойлъё.

  1. Бид нүд бүрийн хүлээгдэж буй утгыг тооцоолно.
  2. Пирсоны хи-квадрат тестийн утгыг ол:

    χ 2 = (40-33.6) 2 /33.6 + (30-36.4) 2 /36.4 + (32-38.4) 2 /38.4 + (48-41.6) 2 /41.6 = 4.396.

  3. Эрх чөлөөний зэрэглэлийн тоо f = (2-1)*(2-1) = 1. Хүснэгтийг ашиглан бид ач холбогдлын түвшинд p=0.05 болон тоо нь Пирсон хи-квадрат тестийн критик утгыг олно. Эрх чөлөөний зэрэг 1 нь 3.841.
  4. Бид хи-квадрат тестийн олж авсан утгыг чухал үзүүлэлттэй харьцуулж үздэг: 4.396 > 3.841, иймээс артерийн гипертензийн өвчлөл нь тамхи татах эсэхээс хамаарал нь статистик ач холбогдолтой юм. Энэ харилцааны ач холбогдлын түвшин p-тэй тохирч байна<0.05.

Энэ шалгуурыг ашиглах нь онолын хоорондын зөрүүг хэмжих ийм хэмжүүр (статистик) ашиглахад үндэслэсэн болно. Ф(x) ба эмпирик хуваарилалт Ф* n (x) , энэ нь ойролцоогоор χ тархалтын хуулийг дагаж мөрддөг 2 . Таамаглал Н 0 Эдгээр статистикийн тархалтад дүн шинжилгээ хийх замаар тархалтын тууштай байдлыг шалгана. Шалгуурыг хэрэглэхийн тулд статистикийн цувралыг бий болгох шаардлагатай.

Тиймээс түүврийг тоонуудын хажууд статистик байдлаар үзүүлье М. Ажиглагдсан цохилтын хувь би- -р зэрэглэл n би. Онолын тархалтын хуулийн дагуу хүлээгдэж буй цохилтын давтамж би--р ангилал Ф би. Ажиглагдсан болон хүлээгдэж буй давтамжийн хоорондох ялгаа нь ( n биФ би). хоорондын зөрүүний ерөнхий түвшинг олох Ф(x) Мөн Ф* n (x) статистикийн цувралын бүх цифрүүдийн квадрат зөрүүний жигнэсэн нийлбэрийг тооцоолох шаардлагатай.

Утга χ 2 хязгааргүй томруулдаг n χ 2 тархалттай (асимптотоор χ 2 гэж тархсан). Энэ хуваарилалт нь эрх чөлөөний зэрэглэлийн тооноос хамаарна к, өөрөөр хэлбэл илэрхийлэл дэх нэр томъёоны бие даасан утгуудын тоо (3.7). Эрх чөлөөний зэрэглэлийн тоо нь тоотой тэнцүү байна yтүүвэрт ногдуулсан шугаман харилцааны тоог хассан. Үлдсэн давтамжийн нийлбэрээс дурын давтамжийг тооцоолох боломжтой тул нэг холболт бий. М-1 цифр. Нэмж дурдахад, тархалтын параметрүүдийг урьдчилан мэдэхгүй бол тархалтыг түүвэрт тохируулахтай холбоотой өөр нэг хязгаарлалт бий. Хэрэв дээж нь тогтоовол С тархалтын параметрүүд, дараа нь эрх чөлөөний градусын тоо байх болно к= МС–1.

Таамаглалыг хүлээн авах талбар Н 0 χ нөхцөлөөр тодорхойлогдоно 2 < χ 2 (к; а) , хаана χ 2 (к; а) – ач холбогдлын түвшин бүхий χ2 тархалтын эгзэгтэй цэг а. I төрлийн алдаа гарах магадлал а, II төрлийн алдаа гарах магадлалыг тодорхой тодорхойлох боломжгүй, учир нь тархалт таарахгүй байж болох хязгааргүй олон тооны янз бүрийн арга байдаг. Туршилтын хүч нь цифрүүдийн тоо болон түүврийн хэмжээнээс хамаарна. Шалгуурыг хэзээ хэрэглэхийг зөвлөж байна n>200, хэрэглэхийг зөвшөөрнө n>40, яг ийм нөхцөлд шалгуур хүчинтэй байна (дүрмээр бол энэ нь буруу тэг таамаглалыг үгүйсгэдэг).

Шалгуураар шалгах алгоритм

1. Тэнцүү магадлалын аргыг ашиглан гистограммыг байгуул.

2. Гистограмын харагдах байдалд үндэслэн таамаглал дэвшүүл

Х 0: е(x) = е 0 (x),

Х 1: е(x) ¹ е 0 (x),

Хаана е 0 (x) - таамагласан тархалтын хуулийн магадлалын нягтрал (жишээлбэл, жигд, экспоненциал, хэвийн).

Сэтгэгдэл. Түүвэр дэх бүх тоо эерэг байвал экспоненциал тархалтын хуулийн таамаглал дэвшүүлж болно.

3. Томъёог ашиглан шалгуур үзүүлэлтийн утгыг тооцоол

,

Хаана
цохилтын хувь би-р интервал;

х би- санамсаргүй хэмжигдэхүүн орох онолын магадлал би- th интервал нь таамаглалд нийцсэн тохиолдолд Х 0 зөв байна.

Тооцооллын томъёо х биэкспоненциал, жигд ба хэвийн хуулиудын хувьд тэдгээр нь тэнцүү байна.

экспоненциал хууль

. (3.8)

Үүний зэрэгцээ А 1 = 0, Б м = +¥.

Нэгдмэл хууль

Ердийн хууль

. (3.10)

Үүний зэрэгцээ А 1 = -¥, B M = +¥.

Тэмдэглэл. х биБүх магадлалыг тооцоолсны дараа

лавлагааны хамаарал хангагдсан эсэхийг шалгана Функц Ф( X

) - хачин. Ф(+¥) = 1.
4. Хавсралт дахь Хи квадрат хүснэгтээс утгыг сонгоно к, энд a нь заасан ач холбогдлын түвшин (a = 0.05 эсвэл a = 0.01), ба

к = М - 1 - С.

- томъёогоор тодорхойлогдсон эрх чөлөөний зэрэглэлийн тоо СЭнд Х- сонгосон таамаглалаас хамаарах параметрүүдийн тоо С 0 хуваарилалтын хууль. Үнэ цэнэ

жигд хуулийн хувьд 2, экспоненциал хуулийн хувьд 1, хэвийн хуулийн хувьд 2 байна.
5. Хэрэв Х, дараа нь таамаглал

0 татгалзсан. Үгүй бол татгалзах шалтгаан байхгүй: 1 - b магадлалтай бол үнэн, b магадлалаар энэ нь буруу, гэхдээ b-ийн утга тодорхойгүй байна. . Жишээ 3 1. c 2 шалгуурыг ашиглан санамсаргүй хэмжигдэхүүний тархалтын хуулийн таамаглал дэвшүүлж, шалгана уу. X

, вариацын цуваа, интервалын хүснэгт, тархалтын гистограммыг жишээ 1.2-т өгсөн болно. А ач холбогдлын түвшин a 0.05 байна. Шийдэл 1. c 2 шалгуурыг ашиглан санамсаргүй хэмжигдэхүүний тархалтын хуулийн таамаглал дэвшүүлж, шалгана уу.. Гистограммуудын харагдах байдал дээр үндэслэн бид санамсаргүй хэмжигдэхүүн гэсэн таамаглал дэвшүүлэв

Х 0: е(x) = ердийн хуулийн дагуу хуваарилагдсан:(мН

Х 1: е(x) ¹ ердийн хуулийн дагуу хуваарилагдсан:(м, s);

, s).

(3.11)

Шалгуурын утгыг дараах томъёогоор тооцоолно.

Дээр дурдсанчлан таамаглалыг шалгахдаа магадлалын тэнцүү гистограммыг ашиглах нь зүйтэй. Энэ тохиолдолд х биОнолын магадлал

хБид (3.10) томъёог ашиглан тооцоолно. Үүний зэрэгцээ бид үүнд итгэж байна

0,5(-0,845+1) = 0,078.

х 1 = 0.5(F((-4.5245+1.7)/1.98)-F((-¥+1.7)/1.98)) = 0.5(F(-1.427) -F(-¥)) =

2 = 0.5(F((-3.8865+1.7)/1.98)-F((-4.5245+1.7)/1.98)) =

х 3 = 0,094; х 4 = 0,135; х 5 = 0,118; х 6 = 0,097; х 7 = 0,073; х 8 = 0,059; х 9 = 0,174;

х 0.5(F(-1.104)+0.845) = 0.5(-0.729+0.845) = 0.058.

10 = 0.5(F((+¥+1.7)/1.98)-F((0.6932+1.7)/1.98)) = 0.114.

100 × (0.0062 + 0.0304 + 0.0004 + 0.0091 + 0.0028 + 0.0001 + 0.0100 +

0.0285 + 0.0315 + 0.0017) = 100 × 0.1207 = 12.07.

Үүний дараа "Хи квадрат" хүснэгтээс чухал утгыг сонгоно уу

.

Учир нь
дараа нь таамаглал Х 0-г хүлээн зөвшөөрсөн (үүнийг татгалзах шалтгаан байхгүй).

Хэрэв χ 2 шалгуурын олж авсан утга нь эгзэгтэй утгаас их байвал судлагдсан эрсдэлийн хүчин зүйл болон үр дүнгийн хооронд зохих түвшний ач холбогдлын статистик хамаарал байгаа гэж бид дүгнэж байна.

Пирсоны хи-квадрат тестийг тооцоолох жишээ

Артерийн гипертензийн өвчлөлд тамхи татах хүчин зүйлийн нөлөөллийн статистик ач холбогдлыг дээр дурдсан хүснэгтийг ашиглан тодорхойлъё.

1. Нүд бүрийн хүлээгдэж буй утгыг тооцоолно уу:

2. Пирсоны хи-квадрат тестийн утгыг ол:

χ 2 = (40-33.6) 2 /33.6 + (30-36.4) 2 /36.4 + (32-38.4) 2 /38.4 + (48-41.6) 2 /41.6 = 4.396.

3. Эрх чөлөөний зэрэглэлийн тоо f = (2-1)*(2-1) = 1. Хүснэгтийг ашиглан бид ач холбогдлын түвшинд p=0.05 болон эрх чөлөөний зэрэглэлийн тоо 1 нь 3.841.

4. Бид хи-квадрат тестийн олж авсан утгыг чухал үзүүлэлттэй харьцуулж үздэг: 4.396 > 3.841, иймээс артерийн гипертензийн өвчлөл нь тамхи татах эсэхээс хамаарах нь статистикийн хувьд чухал юм. Энэ харилцааны ач холбогдлын түвшин p-тэй тохирч байна<0.05.

Мөн Pearson chi-square тестийг томъёогоор тооцоолно

Гэхдээ 2х2 хүснэгтийн хувьд Йейтесийн залруулгын шалгуураар илүү нарийвчлалтай үр дүнг олж авдаг

Хэрэв Тэр N(0)хүлээн зөвшөөрсөн,

тохиолдолд хүлээн зөвшөөрсөн H(1)

Ажиглалтын тоо бага, хүснэгтийн нүднүүд 5-аас бага давтамжтай байвал хи-квадрат тестийг ашиглах боломжгүй бөгөөд таамаглалыг шалгахад ашигладаг. Фишерийн нарийн тест . Энэ шалгуурыг тооцоолох журам нь нэлээд хөдөлмөр их шаарддаг бөгөөд энэ тохиолдолд компьютерийн статистик шинжилгээний програмуудыг ашиглах нь дээр.

Болзошгүй байдлын хүснэгтийг ашиглан та чанарын хоёр шинж чанарын хоорондох холболтын хэмжүүрийг тооцоолж болно - энэ бол Yule холбооны коэффициент юм. Q (корреляцийн коэффициенттэй адил)

Q 0-ээс 1-ийн хооронд байна. Нэгтэй ойролцоо коэффициент нь шинж чанаруудын хооронд хүчтэй холбоо байгааг илтгэнэ. Хэрэв тэгтэй тэнцүү бол холболт байхгүй болно .

Үүнтэй адилаар phi-квадрат коэффициент (φ 2) ашигладаг

ЖИШИГ ДААЛГАВАР

Хүснэгтэнд хооллолттой болон хооллолтгүй Дрозофилагийн бүлгүүдийн мутацийн давтамж хоорондын хамаарлыг дүрсэлсэн болно



Болзошгүй байдлын хүснэгтийн шинжилгээ

Болзошгүй байдлын хүснэгтэд дүн шинжилгээ хийхийн тулд H 0 таамаглал дэвшүүлсэн, өөрөөр хэлбэл, судалгааны үр дүнд судалж буй шинж чанар нь нөлөөлөлгүй байхын тулд хүлээгдэж буй давтамжийг тооцоолж, хүлээлтийн хүснэгтийг байгуулна.

Хүлээлгийн ширээ

бүлгүүд Чило үр тариа Нийт
Мутаци өгсөн Мутаци өгөөгүй
Бодит давтамж Хүлээгдэж буй давтамж Бодит давтамж Хүлээгдэж буй давтамж
Хооллохтой хамт
Хооллохгүйгээр
нийт

Арга №1

Хүлээх давтамжийг тодорхойлох:

2756 - X ;

2. 3561 – 3124

Хэрэв бүлгүүдийн ажиглалтын тоо бага бол X 2-г ашиглахдаа дискрет тархалтын бодит болон хүлээгдэж буй давтамжийг харьцуулах тохиолдолд алдаатай байдлыг багасгахын тулд Йейтс засварыг ашиглана.

Биологийн судалгааны практикт ихэвчлэн нэг эсвэл өөр таамаглалыг шалгах шаардлагатай байдаг, өөрөөр хэлбэл туршилт хийгчийн олж авсан бодит материал нь онолын таамаглалыг хэр зэрэг баталж, дүн шинжилгээ хийсэн өгөгдөл нь онолын хүлээгдэж буйтай хэр зэрэг давхцаж байгааг олж мэдэх шаардлагатай байдаг. нэг. Бодит өгөгдөл ба онолын хүлээлт хоёрын хоорондын ялгааг статистикийн хувьд үнэлэх, энэ ялгааг ямар тохиолдолд, ямар магадлалаар найдвартай гэж үзэж болохыг тогтоох, харин эсрэгээр, боломжийн хязгаарт хэзээ ч ач холбогдолгүй, ач холбогдолгүй гэж үзэх даалгавар гарч ирдэг. Сүүлчийн тохиолдолд таамаглалыг хэвээр үлдээж, үүний үндсэн дээр онолын хувьд хүлээгдэж буй өгөгдөл эсвэл үзүүлэлтүүдийг тооцдог. Таамаглалыг шалгах ийм вариаци-статистик арга нь арга юм хи-квадрат (χ 2). Энэ хэмжүүрийг ихэвчлэн "тохирох шалгуур" эсвэл "Пирсоны сайн чанарын тест" гэж нэрлэдэг. Түүний тусламжтайгаар эмпирик байдлаар олж авсан өгөгдлүүд нь онолын хувьд хүлээгдэж буй өгөгдөлтэй нийцэж байгаа эсэхийг янз бүрийн магадлалаар шүүж болно.

Албан ёсны үүднээс авч үзвэл хоёр вариацын цуврал, хоёр популяцийг харьцуулж үздэг: нэг нь эмпирик тархалт, нөгөө нь ижил параметртэй түүвэр ( n, М, Сгэх мэт) нь эмпириктэй ижил боловч түүний давтамжийн тархалтыг судалж буй санамсаргүй хэмжигдэхүүний зан төлөвийг дагаж мөрдөх ёстой сонгосон онолын хуульд (хэвийн, Пуассон, бином гэх мэт) хатуу нийцүүлэн бүтээдэг. .

Ерөнхийдөө дагаж мөрдөх шалгуурын томъёог дараах байдлаар бичиж болно.

Хаана a -ажиглалтын бодит давтамж,

А -тухайн ангийн онолын хувьд хүлээгдэж буй давтамж.

Тэг таамаглал нь харьцуулсан тархалтын хооронд мэдэгдэхүйц ялгаа байхгүй гэж үздэг. Эдгээр ялгааны ач холбогдлыг үнэлэхийн тулд та чухал хи-квадрат утгуудын тусгай хүснэгтэд хандах хэрэгтэй (Хүснэгт 9). П) болон тооцоолсон утгыг харьцуулах χ 2-р хүснэгтийн дагуу эмпирик тархалт нь онолынхоос найдвартай эсвэл найдваргүй зөрүүтэй эсэхийг шийднэ. Тиймээс эдгээр ялгаа байхгүй гэсэн таамаглал нь няцаагдах эсвэл хүчинтэй хэвээр үлдэх болно. Хэрэв тооцоолсон утга χ 2 нь хүснэгттэй тэнцүү буюу давсан χ ² ( α , df), эмпирик тархалт нь онолынхоос эрс ялгаатай болохыг шийднэ. Тиймээс эдгээр ялгаа байхгүй гэсэн таамаглал няцаагдах болно. Хэрэв χ ² < χ ² ( α , df), тэг таамаглал хүчинтэй хэвээр байна. Ач холбогдлын хүлээн зөвшөөрөгдөх түвшин гэж нийтээр хүлээн зөвшөөрдөг α = 0.05, учир нь энэ тохиолдолд тэг таамаглал зөв байх магадлал ердөө 5%, тиймээс үүнийг үгүйсгэх хангалттай шалтгаан (95%) байна.


Тодорхой асуудал бол эрх чөлөөний зэрэглэлийн тоог зөв тодорхойлох явдал юм ( df), шалгуур үзүүлэлтийн утгыг хүснэгтээс авсан болно. Нийт ангиудын тооноос эрх чөлөөний зэрэглэлийн тоог тодорхойлох кта хязгаарлалтын тоог (өөрөөр хэлбэл онолын давтамжийг тооцоолоход ашигласан параметрийн тоог) хасах хэрэгтэй.

Судалж буй шинж чанарын тархалтын төрлөөс хамааран эрх чөлөөний зэрэглэлийн тоог тооцоолох томъёо өөрчлөгдөнө. Учир нь хувилбархуваарилалт ( к= 2) тооцоонд зөвхөн нэг параметр (түүврийн хэмжээ) оролцдог тул эрх чөлөөний зэрэг нь df= к−1=2−1=1. Учир нь олон гишүүнтТархалтын томъёо нь ижил төстэй байна: df= к−1. Вариацын цувралын тархалттай тохирч байгаа эсэхийг шалгах Пуассонхоёр параметрийг аль хэдийн ашигласан - дээжийн хэмжээ ба дундаж утга (тоон хувьд тархалттай давхцах); эрх чөлөөний зэрэглэлийн тоо df= к−2. Эмпирик тархалтын тууштай байдлыг шалгахдаа сонголт хэвийнэсвэл биномХуулийн дагуу эрх чөлөөний зэрэглэлийн тоог бодит ангиудын тооноос цуваа байгуулах гурван нөхцөлийг хасч авна - түүврийн хэмжээ, дундаж ба дисперс, df= к−3. χ² шалгуур нь зөвхөн дээжийн хувьд ажилладаг гэдгийг нэн даруй тэмдэглэх нь зүйтэй хамгийн багадаа 25 хувилбарын эзэлхүүн, мөн бие даасан ангиудын давтамж байх ёстой 4-өөс багагүй байна.

Нэгдүгээрт, бид дүн шинжилгээний жишээн дээр хи-квадрат тестийн хэрэглээг дүрслэн харуулав альтернатив хэлбэлзэл. Улаан лоолийн удамшлыг судлах нэг туршилтанд 3629 улаан, 1176 шар жимс илэрсэн байна. Хоёр дахь эрлийз үеийн тэмдэгтүүдийг хуваах давтамжийн онолын харьцаа нь 3: 1 (75% -аас 25%) байх ёстой. Хэрэгжиж байгаа юу? Өөрөөр хэлбэл, энэ түүврийг давтамжийн харьцаа 3:1 эсвэл 0,75:0,25 байгаа популяциас авсан уу?

Эмпирик давтамжийн утгууд болон онолын давтамжийг тооцоолох үр дүнг томъёогоор бөглөж хүснэгтийг (Хүснэгт 4) байгуулцгаая.

A = n∙p,

Хаана х- онолын давтамж (энэ төрлийн хувилбарын фракцууд),

n -дээжийн хэмжээ.

Жишээлбэл, А 2 = n∙p 2 = 4805∙0.25 = 1201.25 ≈ 1201.

Энэ тэмдэглэлд χ 2 тархалтыг тогтмол магадлалын тархалттай өгөгдлийн багцын нийцтэй байдлыг шалгахад ашигладаг. Гэрээний шалгуур нь ихэвчлэн ОТаныг тодорхой ангилалд хамаарах давтамжтай харьцуулж, өгөгдөл нь үнэхээр тодорхой тархалттай байсан бол онолын хувьд хүлээгдэж буй давтамжтай харьцуулна.

χ 2-ийн сайн чанарын шалгуурыг ашиглан туршилтыг хэд хэдэн үе шаттайгаар гүйцэтгэдэг. Нэгдүгээрт, тодорхой магадлалын тархалтыг тодорхойлж, анхны өгөгдөлтэй харьцуулна. Хоёрдугаарт, сонгосон магадлалын тархалтын параметрүүдийн талаар таамаглал дэвшүүлж (жишээлбэл, түүний математик хүлээлт) эсвэл тэдгээрийн үнэлгээг хийдэг. Гуравдугаарт, онолын тархалтад үндэслэн ангилал тус бүрт тохирох онолын магадлалыг тодорхойлно. Эцэст нь χ2 тестийн статистикийг өгөгдөл ба тархалтын нийцтэй байдлыг шалгахад ашигладаг.

Хаана f 0- ажиглагдсан давтамж, f e- онолын эсвэл хүлээгдэж буй давтамж, к- нэгтгэсний дараа үлдсэн ангиллын тоо, r- тооцоолох параметрийн тоо.

Тэмдэглэлийг эсвэл форматаар, жишээнүүдийг форматаар татаж аваарай

Пуассоны тархалтад χ2-ийн сайн чанарын тестийг ашиглах

Excel дээр энэ томьёог ашиглан тооцоолохын тулд =SUMPRODUCT() функцийг ашиглах нь тохиромжтой (Зураг 1).

Параметрийг тооцоолох λ Та тооцоог ашиглаж болно . Онолын давтамж 1. c 2 шалгуурыг ашиглан санамсаргүй хэмжигдэхүүний тархалтын хуулийн таамаглал дэвшүүлж, шалгана уу.параметрт тохирох амжилт (X = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ба түүнээс дээш) λ = 2.9-ийг =POISSON.DIST(X;;FALSE) функцийг ашиглан тодорхойлж болно. Пуассоны магадлалыг түүврийн хэмжээгээр үржүүлэх n, бид онолын давтамжийг авдаг f e(Зураг 2).

Цагаан будаа. 2. Нэг минутанд ирэх бодит болон онолын хувь хэмжээ

Зураг дээр дурдсанчлан. 2, есөн ба түүнээс дээш ирэлтийн онолын давтамж 1.0-ээс хэтрэхгүй. Ангилал бүр 1.0 ба түүнээс дээш давтамжтай байхын тулд "9 ба түүнээс дээш" гэсэн ангилалыг "8" ангилалтай хослуулах хэрэгтэй. Өөрөөр хэлбэл, есөн ангилал (0, 1, 2, 3, 4, 5, 6, 7, 8 ба түүнээс дээш) хэвээр байна. Пуассоны тархалтын математик хүлээлтийг түүврийн өгөгдөл дээр үндэслэн тодорхойлдог тул эрх чөлөөний зэрэг нь k – p – 1 = 9 – 1 – 1 = 7 байна. 0.05-ын ач холбогдлын түвшинг ашиглан бид =CHI2.OBR(1-0.05;7) = 14.067 томъёогоор 7 зэрэглэлийн эрх чөлөө бүхий χ 2 статистикийн эгзэгтэй утга. Шийдвэрлэх дүрмийг дараах байдлаар томъёолсон: таамаглал H 0χ 2 > 14.067 бол таамаглалыг үгүйсгэнэ H 0хазайдаггүй.

χ 2-ийг тооцоолохын тулд бид (1) томъёог ашиглана (Зураг 3).

Цагаан будаа. 3. Пуассоны тархалтын χ 2 - сайн тохирох шалгуурын тооцоо

χ 2 = 2.277 тул< 14,067, следует, что гипотезу H 0татгалзах боломжгүй. Өөрөөр хэлбэл, банкинд үйлчлүүлэгчид ирэх нь Пуассоны хуваарилалтыг дагаж мөрддөггүй гэж бид нотлох шалтгаан байхгүй.

Хэвийн тархалтад χ 2 - тохирох байдлын тестийг хэрэглэх

Өмнөх тэмдэглэлд тоон хувьсагчдын талаархи таамаглалыг шалгахдаа бид судалж буй хүн амын тархалт хэвийн байна гэж үзсэн. Энэ таамаглалыг шалгахын тулд та график хэрэгслийг ашиглаж болно, жишээлбэл, хайрцагны график эсвэл ердийн тархалтын график (дэлгэрэнгүй мэдээллийг үзнэ үү). Том хэмжээтэй түүврийн хувьд эдгээр таамаглалыг шалгахын тулд хэвийн тархалтын χ 2 сайн чанарын тестийг ашиглаж болно.

158 хөрөнгө оруулалтын сангийн 5 жилийн өгөөжийн талаарх мэдээллийг жишээ болгон авч үзье (Зураг 4). Та өгөгдөл хэвийн тархсан эсэхэд итгэхийг хүсч байна гэж бодъё. Тэг ба альтернатив таамаглалыг дараах байдлаар томъёолсон болно. H 0: 5 жилийн өгөөж нь хэвийн тархалтын дагуу, H 1: 5 жилийн ургац нь хэвийн тархалтыг дагаж мөрддөггүй. Хэвийн тархалт нь математикийн хүлээлт μ ба стандарт хазайлт σ гэсэн хоёр параметртэй бөгөөд түүврийн өгөгдөлд үндэслэн тооцоолж болно. Энэ тохиолдолд = 10.149 ба С = 4,773.

Цагаан будаа. 4. 158 сангийн таван жилийн дундаж жилийн өгөөжийн мэдээллийг агуулсан эрэмбэлэгдсэн массив

Сангийн өгөөжийн талаархи мэдээллийг жишээлбэл, 5% -ийн өргөнтэй ангиуд (интервал) болгон бүлэглэж болно (Зураг 5).

Цагаан будаа. 5. 158 сангийн таван жилийн дундаж жилийн өгөөжийн давтамжийн хуваарилалт

Хэвийн тархалт тасралтгүй байдаг тул хэвийн тархалтын муруйгаар хязгаарлагдсан тоонуудын талбай болон интервал бүрийн хил хязгаарыг тодорхойлох шаардлагатай. Нэмж дурдахад, хэвийн тархалт нь онолын хувьд –∞-аас +∞ хооронд хэлбэлздэг тул ангийн хилээс гадуур байрлах хэлбэрийн талбайг харгалзан үзэх шаардлагатай. Тэгэхээр -10 цэгийн зүүн талд байгаа хэвийн муруйн доорх талбай нь Z утгын зүүн талд байгаа стандартчилагдсан хэвийн муруйн доор байрлах зургийн талбайтай тэнцүү байна.

Z = (–10 – 10,149) / 4,773 = –4,22

Z = –4.22 утгын зүүн талд байгаа стандартчилагдсан хэвийн муруйн доор байрлах зургийн талбайг =NORM.DIST(-10;10.149;4.773;ҮНЭН) томъёогоор тодорхойлж, ойролцоогоор 0.00001-тэй тэнцүү байна. -10 ба -5 цэгүүдийн хоорондох хэвийн муруйн дор байрлах зургийн талбайг тооцоолохын тулд эхлээд -5 цэгийн зүүн талд байрлах зургийн талбайг тооцоолох хэрэгтэй: =NORM.DIST( -5,10.149,4.773,ҮНЭН) = 0.00075 . Тэгэхээр -10 ба -5 цэгүүдийн хоорондох хэвийн муруй дор байрлах зургийн талбай нь 0.00075 - 0.00001 = 0.00074 байна. Үүний нэгэн адил та анги бүрийн хил хязгаараар хязгаарлагдсан зургийн талбайг тооцоолж болно (Зураг 6).

Цагаан будаа. 6. 5 жилийн өгөөжийн анги тус бүрийн бүс нутаг, хүлээгдэж буй давтамж

Эндээс харахад дөрвөн туйлын ангиллын онолын давтамж (хоёр хамгийн бага ба хоёр хамгийн их) 1-ээс бага байгаа тул бид 7-р зурагт үзүүлсэн шиг ангиудыг нэгтгэх болно.

Цагаан будаа. 7. Хэвийн тархалтын хувьд χ 2-ийн сайн чанарын тестийг ашиглахтай холбоотой тооцоолол.

Бид χ 2 тестийг (1) томъёог ашиглан өгөгдөл болон хэвийн тархалтын хоорондын тохирлыг тодорхойлоход ашигладаг. Бидний жишээн дээр нэгтгэсний дараа зургаан анги үлддэг. Хүлээгдэж буй утга ба стандарт хазайлтыг түүврийн өгөгдлөөс тооцдог тул эрх чөлөөний градусын тоо байна кх – 1 = 6 – 2 – 1 = 3. 0.05-ын ач холбогдлын түвшинг ашиглан бид гурван зэрэглэлийн эрх чөлөөтэй χ 2 статистикийн критик утга = CI2.OBR(1-0.05;F3) = 7.815 болохыг олж мэдэв. χ 2-ийн сайн чанарын шалгуурыг ашиглахтай холбоотой тооцооллыг Зураг дээр үзүүлэв. 7.

χ 2 -статистик = 3.964 болохыг харж болно< χ U 2 7,815, следовательно гипотезу H 0татгалзах боломжгүй. Өөрөөр хэлбэл, өндөр өсөлттэй хөрөнгө оруулалтын сангуудын 5 жилийн өгөөж хэвийн хувиарлагдаагүй гэж үзэх үндэслэл бидэнд байхгүй.

Сүүлийн үеийн хэд хэдэн нийтлэлүүд ангилсан өгөгдөлд дүн шинжилгээ хийх янз бүрийн арга барилыг судалсан. Хоёр ба түүнээс дээш бие даасан түүврийн шинжилгээнээс олж авсан ангиллын өгөгдлийн талаархи таамаглалыг шалгах аргуудыг тайлбарласан болно. Хи-квадрат тестээс гадна параметрийн бус процедурыг авч үздэг. Wilcoxon зэрэглэлийн тестийг тайлбарласан бөгөөд энэ нь өргөдлийн нөхцөл хангаагүй тохиолдолд хэрэглэгддэг т-бие даасан хоёр бүлгийн математик хүлээлтийн тэгш байдлын талаарх таамаглалыг шалгах шалгуур, мөн дисперсийн нэг хүчин зүйлийн шинжилгээний хувилбар болох Крускал-Уоллис тест (Зураг 8).

Цагаан будаа. 8. Категорийн өгөгдлийн талаархи таамаглалыг шалгах аргуудын блок схем

Левин нар Менежерүүдэд зориулсан статистик номны материалыг ашигласан. – М.: Уильямс, 2004. – х. 763–769



Танд нийтлэл таалагдсан уу? Найзуудтайгаа хуваалцаарай!