Статистикийн найдвартай байдлын тухай ойлголт. Статистикийн ач холбогдлын тухай ойлголт, статистикийн шалгуур үзүүлэлт

Статистикийн ач холбогдлын түвшин нь олж авсан (урьдчилан таамагласан) мэдээллийн үнэн зөв, үнэнд итгэх итгэлийн түвшинг илэрхийлдэг чухал үзүүлэлт юм. Энэхүү үзэл баримтлал нь социологийн судалгаа хийхээс эхлээд шинжлэх ухааны таамаглалыг статистикийн туршилт хийх хүртэл янз бүрийн салбарт өргөн хэрэглэгддэг.

Тодорхойлолт

Статистикийн ач холбогдлын түвшин (эсвэл статистикийн ач холбогдолтой үр дүн) нь судлагдсан үзүүлэлтүүдийн тохиолдлын тохиолдлоор үүсэх магадлалыг харуулдаг. Аливаа үзэгдлийн нийт статистик ач холбогдлыг p-утгийн коэффициент (p-түвшин)-ээр илэрхийлнэ. Аливаа туршилт, ажиглалтын явцад олж авсан өгөгдөл нь түүвэрлэлтийн алдаанаас үүдэлтэй байх магадлалтай. Энэ нь ялангуяа социологийн хувьд үнэн юм.

Өөрөөр хэлбэл, статистикийн ач холбогдолтой утга нь санамсаргүй тохиолдох магадлал нь маш бага эсвэл туйлын хандлагатай утгыг хэлнэ. Энэ нөхцөл байдлын хамгийн туйл нь статистик нь тэг таамаглалаас (олж авсан түүврийн өгөгдөлтэй нийцэж байгаа эсэхийг шалгасан таамаглал) хазайх түвшин юм. Шинжлэх ухааны практикт ач холбогдлын түвшинг өгөгдөл цуглуулахаас өмнө сонгодог бөгөөд дүрмээр бол түүний коэффициент 0.05 (5%) байна. Нарийвчилсан утгууд нь маш чухал байдаг системүүдийн хувьд энэ үзүүлэлт 0.01 (1%) буюу түүнээс бага байж болно.

Суурь

Ач холбогдлын түвшний тухай ойлголтыг Английн статистикч, генетикч Рональд Фишер 1925 онд статистикийн таамаглалыг шалгах аргачлалыг боловсруулж байх үед нэвтрүүлсэн. Аливаа үйл явцыг шинжлэхэд тодорхой үзэгдлийн тодорхой магадлал байдаг. "Хэмжилтийн алдаа" гэсэн ойлголтод хамаарах магадлалын бага (эсвэл тодорхой бус) хувьтай ажиллахад хүндрэл гардаг.

Туршилтын хувьд тодорхой бус статистик мэдээлэлтэй ажиллахдаа эрдэмтэд бага тоо хэмжээгээр ажиллахаас "урьдчилан сэргийлдэг" тэг таамаглалын асуудалтай тулгардаг. Фишер ийм системд тохиолдлын магадлалыг 5% (0.05) -аар тодорхойлохыг санал болгосон бөгөөд энэ нь тооцоололд тэг таамаглалыг үгүйсгэх боломжийг олгодог түүвэрлэлтийн тайралт юм.

Тогтмол магадлалын танилцуулга

1933 онд эрдэмтэд Жерзи Нейманн, Эгон Пирсон нар өөрсдийн бүтээлдээ тодорхой түвшний ач холбогдлыг урьдчилан тогтоохыг зөвлөж байна (мэдээлэл цуглуулахаас өмнө). Эдгээр дүрмүүдийг ашигласан жишээ сонгуулийн үеэр тодорхой харагдаж байна. Нэг нь олны танил, нөгөөг нь төдийлөн танигдаагүй хоёр нэр дэвшигч байна гэж бодъё. Нэгдүгээр нэр дэвшигч сонгуульд ялах нь ойлгомжтой, хоёрдугаарт орох магадлал тэглэх хандлагатай байна. Тэд хичээж байгаа боловч тэнцүү биш: давагдашгүй хүчин зүйл, сенсаацтай мэдээлэл, урьдчилан таамагласан сонгуулийн үр дүнг өөрчлөх гэнэтийн шийдвэр гарах магадлал үргэлж байдаг.

Нейман, Пирсон нар Фишерийн ач холбогдлын түвшин 0.05 (α-аар тэмдэглэгдсэн) хамгийн тохиромжтой гэдэгтэй санал нэгджээ. Гэсэн хэдий ч Фишер өөрөө 1956 онд энэ үнэ цэнийг тогтоохыг эсэргүүцсэн. Тэрээр α-ийн түвшинг тодорхой нөхцөл байдалд тохируулан тогтоох ёстой гэж үзсэн. Жишээ нь бөөмийн физикт 0.01 байна.

p түвшний утга

P-утга гэдэг нэр томъёог анх 1960 онд Браунли ашигласан. P-түвшин (p-утга) нь үр дүнгийн үнэнтэй урвуу хамааралтай үзүүлэлт юм. Хамгийн өндөр p-утгийн коэффициент нь хувьсагчдын хоорондын түүврийн хамааралд итгэх итгэлийн хамгийн бага түвшинтэй тохирч байна.

Энэ утга нь үр дүнг тайлбарлахтай холбоотой алдаа гарах магадлалыг илэрхийлдэг. p-түвшин = 0.05 (1/20) гэж үзье. Энэ нь түүвэрт олдсон хувьсагчдын хоорондын хамаарал нь түүврийн санамсаргүй шинж чанар болох таван хувийн магадлалыг харуулж байна. Өөрөөр хэлбэл, хэрэв энэ хамаарал байхгүй бол ижил төстэй туршилтуудыг давтан хийснээр дунджаар хорь дахь судалгаа бүрт хувьсагчдын хооронд ижил эсвэл илүү хамааралтай байх болно. p-түвшинг ихэвчлэн алдааны түвшингийн "маржин" гэж үздэг.

Дашрамд хэлэхэд, p-утга нь хувьсагчдын хоорондын бодит хамаарлыг тусгаагүй байж болох ч таамаглалын хүрээнд зөвхөн тодорхой дундаж утгыг харуулдаг. Ялангуяа өгөгдлийн эцсийн дүн шинжилгээ нь энэ коэффициентийн сонгосон утгуудаас хамаарна. p-түвшин = 0.05 үед зарим үр дүн гарах ба 0.01-тэй тэнцэх коэффициенттэй үед өөр өөр үр дүн гарна.

Статистикийн таамаглалыг шалгах

Таамаглалыг шалгахдаа статистикийн ач холбогдлын түвшин онцгой чухал байдаг. Жишээлбэл, хоёр талт тестийг тооцоолохдоо татгалзсан бүсийг түүвэрлэлтийн тархалтын хоёр төгсгөлд (тэг координаттай харьцуулахад) тэнцүү хувааж, үр дүнд нь гарсан өгөгдлийн үнэнийг тооцоолно.

Тодорхой үйл явцыг (үзэгдэл) хянахдаа шинэ статистик мэдээлэл нь өмнөх утгуудтай харьцуулахад бага өөрчлөлтийг харуулж байна гэж бодъё. Үүний зэрэгцээ үр дүнгийн зөрүү нь бага, тодорхой биш боловч судалгаанд чухал ач холбогдолтой юм. Мэргэжилтэн бэрхшээлтэй тулгараад байна: өөрчлөлтүүд үнэхээр гарч байна уу эсвэл эдгээр түүвэрлэлтийн алдаа (хэмжилтийн алдаа) байна уу?

Энэ тохиолдолд тэд тэг таамаглалыг ашигладаг эсвэл үгүйсгэдэг (бүх зүйлийг алдаатай холбоно, эсвэл системийн өөрчлөлтийг амжилттай гэж хүлээн зөвшөөрдөг). Асуудлыг шийдвэрлэх үйл явц нь ерөнхий статистикийн ач холбогдол (p-утга) болон ач холбогдлын түвшний (α) харьцаанд суурилдаг. Хэрэв p түвшний< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Ашигласан үнэ цэнэ

Ач холбогдлын түвшин нь дүн шинжилгээ хийж буй материалаас хамаарна. Практикт дараахь тогтмол утгуудыг ашигладаг.

α = 0.1 (эсвэл 10%);
α = 0.05 (эсвэл 5%);
α = 0.01 (эсвэл 1%);
α = 0.001 (эсвэл 0.1%).

Тооцоолол илүү нарийвчлалтай байх тусам α коэффициент бага байх болно. Мэдээжийн хэрэг, физик, хими, эм зүй, генетикийн статистикийн таамаглал нь улс төрийн шинжлэх ухаан, социологиос илүү нарийвчлал шаарддаг.

Тодорхой газар нутагт ач холбогдлын босго

Бөөмийн физик, үйлдвэрлэл зэрэг өндөр нарийвчлалтай салбарт статистикийн ач холбогдлыг ердийн магадлалын тархалттай (Гаусын тархалт) харьцуулсан стандарт хазайлтын харьцаа (сигма коэффициент - σ) гэж ихэвчлэн илэрхийлдэг. σ нь математикийн хүлээлттэй харьцуулахад тодорхой хэмжигдэхүүний утгуудын тархалтыг тодорхойлдог статистик үзүүлэлт юм. Үйл явдлын магадлалыг зурахад ашигладаг.

Мэдлэгийн салбараас хамааран σ коэффициент нь ихээхэн ялгаатай байдаг. Жишээлбэл, Хиггс бозоны оршин тогтнохыг урьдчилан таамаглах үед σ параметр нь тавтай тэнцүү (σ = 5) бөгөөд энэ нь геномын судалгаанд ач холбогдлын түвшин нь 5 × 10 байж болно. 8, энэ бүс нутагт тийм ч ховор биш юм.

Үр ашиг

α ба p-утга коэффициентүүд нь яг шинж чанар биш гэдгийг анхаарч үзэх хэрэгтэй. Судалж буй үзэгдлийн статистикийн ач холбогдлын түвшин ямар ч байсан энэ нь таамаглалыг хүлээн зөвшөөрөх болзолгүй үндэслэл биш юм. Жишээлбэл, α-ийн утга бага байх тусам таамаглалыг тогтоох магадлал өндөр болно. Гэсэн хэдий ч алдаа гарах эрсдэлтэй бөгөөд энэ нь судалгааны статистик хүчийг (ач холбогдол) бууруулдаг.

Зөвхөн статистикийн ач холбогдолтой үр дүнд анхаарлаа төвлөрүүлдэг судлаачид алдаатай дүгнэлтэд хүрч болно. Үүний зэрэгцээ тэд таамаглалуудыг (үнэндээ α ба p-утгууд) ашигладаг тул тэдний ажлыг давхар шалгахад хэцүү байдаг. Тиймээс статистикийн ач холбогдлыг тооцоолохын зэрэгцээ өөр нэг үзүүлэлт болох статистик нөлөөллийн хэмжээг тодорхойлохыг үргэлж зөвлөж байна. Үр нөлөөний хэмжээ нь нөлөөллийн хүчийг тоон хэмжүүр юм.

ТӨЛБӨРТЭЙ ОНЦЛОГ.Статистикийн ач холбогдлын онцлогийг зөвхөн сонгосон төлөвлөгөөнд ашиглах боломжтой. байгаа эсэхийг шалгана уу.

Судалгаанд оролцогчдын янз бүрийн бүлгүүдийн асуултуудад өгсөн хариултуудад статистикийн хувьд мэдэгдэхүйц ялгаа байгаа эсэхийг олж мэдэх боломжтой. SurveyMonkey-д статистикийн ач холбогдлын онцлогийг ашиглахын тулд та:

Судалгааны асуултанд харьцуулах дүрэм нэмэх үед статистикийн ач холбогдлын функцийг идэвхжүүлнэ үү. Судалгааны үр дүнг нүдээр харьцуулахын тулд бүлгүүдэд ангилахын тулд харьцуулах судалгаанд оролцогчдын бүлгийг сонго.
Судалгаанд хамрагдагсдын янз бүрийн бүлгээс хүлээн авсан хариултуудын статистикийн ач холбогдол бүхий ялгааг тодорхойлохын тулд судалгааны асуултынхаа өгөгдлийн хүснэгтүүдийг шалгана уу.

Статистикийн ач холбогдлыг харах

Доорх алхмуудыг хийснээр та статистикийн ач холбогдлыг харуулсан судалгааг үүсгэж болно.

1. Судалгаандаа хаалттай асуултуудыг нэмнэ үү

Үр дүнд дүн шинжилгээ хийхдээ статистикийн ач холбогдлыг харуулахын тулд та судалгааныхаа аливаа асуултанд харьцуулах дүрмийг хэрэглэх шаардлагатай болно.

Хэрэв та судалгааны загвартаа дараах төрлийн асуултуудын аль нэгийг ашиглавал харьцуулах дүрмийг хэрэглэж, статистикийн ач холбогдлыг тооцоолж болно.

Санал болгож буй хариултын хувилбаруудыг бүрэн бүлэгт хувааж болох эсэхийг шалгах шаардлагатай. Харьцуулах дүрэм үүсгэх үед таны сонгосон хариултын сонголтууд нь судалгааны явцад өгөгдлийг хөндлөн таб болгон зохион байгуулахад ашиглагдана.

2. Хариултуудыг цуглуул

Судалгаагаа дуусгасны дараа түүнийг түгээх цуглуулагч үүсгэ. Хэд хэдэн арга бий.

Та статистикийн ач холбогдлыг идэвхжүүлж, харахын тулд харьцуулах дүрэмдээ ашиглахаар төлөвлөж буй хариултын сонголт бүрдээ дор хаяж 30 хариулт авах ёстой.

Судалгааны жишээ

Танай бүтээгдэхүүнд эрчүүд эмэгтэйчүүдээс хамаагүй илүү сэтгэл ханамжтай байгаа эсэхийг мэдэхийг хүсч байна.

Судалгаанд олон сонголттой хоёр асуулт нэмнэ үү:
Таны хүйс хэд вэ? (эрэгтэй, эмэгтэй)
Та манай бүтээгдэхүүнд сэтгэл хангалуун байна уу, эсвэл сэтгэл дундуур байна уу? (сэтгэл хангалуун, сэтгэл хангалуун бус)
Судалгаанд оролцогчдын 30-аас доошгүй нь жендэрийн асуултанд "эрэгтэй" гэж, 30-аас доошгүй нь "эмэгтэй" гэсэн хүйсийг сонгосон эсэхийг шалгаарай.
"Таны хүйс юу вэ?" гэсэн асуултанд харьцуулах дүрмийг нэмж оруулаарай. хариултын хоёр сонголтыг бүлгээрээ сонго.
"Та манай бүтээгдэхүүнд сэтгэл хангалуун байна уу эсвэл сэтгэл хангалуун бус байна уу?" Гэсэн асуултын хүснэгтийн доорх өгөгдлийн хүснэгтийг ашиглана уу. хариултын сонголтууд нь статистикийн ач холбогдолтой ялгааг харуулж байгаа эсэхийг харах

Статистикийн хувьд чухал ялгаа юу вэ?

Статистикийн ач холбогдол бүхий ялгаа гэдэг нь нэг бүлгийн санал асуулгад оролцогчдын хариулт болон нөгөө бүлгийн хариултын хооронд мэдэгдэхүйц ялгаа байгааг статистик шинжилгээгээр тогтоосон гэсэн үг юм. Статистикийн ач холбогдол нь олж авсан тоо нь мэдэгдэхүйц ялгаатай байна гэсэн үг юм. Ийм мэдлэг танд өгөгдөлд дүн шинжилгээ хийхэд ихээхэн тус болно. Гэсэн хэдий ч та олж авсан үр дүнгийн ач холбогдлыг тодорхойлно. Судалгааны үр дүнг хэрхэн тайлбарлах, түүн дээр үндэслэн ямар арга хэмжээ авахыг та өөрөө шийднэ.

Жишээлбэл, та эрэгтэй үйлчлүүлэгчдээс илүү эмэгтэй үйлчлүүлэгчдээс илүү их гомдол хүлээн авдаг. Ийм ялгаа бодитой эсэх, үүнтэй холбоотой арга хэмжээ авах шаардлагатай эсэхийг бид хэрхэн тодорхойлох вэ? Ажиглалтаа шалгах нэг сайхан арга бол эрэгтэй үйлчлүүлэгчид танай бүтээгдэхүүнд илүү сэтгэл ханамжтай байгаа эсэхийг харуулах судалгаа юм. Статистикийн томьёог ашиглан манай статистикийн ач холбогдлын функц нь таны бүтээгдэхүүн эмэгтэйчүүдийнхээс илүү эрчүүдэд илүү таалагдаж байгаа эсэхийг тодорхойлох боломжийг танд олгоно. Ингэснээр та таамаглалаас илүүтэй баримтад тулгуурлан арга хэмжээ авах боломжтой болно.

Статистикийн хувьд мэдэгдэхүйц ялгаа

Хэрэв таны үр дүнг өгөгдлийн хүснэгтэд онцлон тэмдэглэсэн бол энэ нь хариулагчдын хоёр бүлэг бие биенээсээ эрс ялгаатай гэсэн үг юм. "Чухал" гэсэн нэр томъёо нь үр дүнгийн тоо нь ямар нэгэн онцгой ач холбогдол, ач холбогдолтой гэсэн үг биш, зөвхөн тэдгээрийн хооронд статистикийн ялгаа байгаа гэсэн үг юм.

Статистикийн хувьд мэдэгдэхүйц ялгаа байхгүй

Хэрэв таны үр дүнг харгалзах өгөгдлийн хүснэгтэд тодруулаагүй бол энэ нь харьцуулж буй хоёр үзүүлэлтийн хооронд зөрүүтэй байж болох ч тэдгээрийн хооронд статистикийн ялгаа байхгүй гэсэн үг юм.

Статистикийн хувьд мэдэгдэхүйц ялгаагүй хариултууд нь таны хэрэглэж буй түүврийн хэмжээг харгалзан харьцуулж буй хоёр зүйлийн хооронд мэдэгдэхүйц ялгаа байхгүй гэдгийг харуулж байгаа боловч энэ нь тэдгээр нь чухал биш гэсэн үг биш юм. Магадгүй түүврийн хэмжээг нэмэгдүүлснээр та статистикийн хувьд мэдэгдэхүйц ялгааг тодорхойлох боломжтой болно.

Дээжийн хэмжээ

Хэрэв танд маш бага түүврийн хэмжээ байгаа бол хоёр бүлгийн хооронд маш том ялгаа л чухал байх болно. Хэрэв та маш том түүврийн хэмжээтэй бол жижиг, том ялгааг хоёуланг нь чухал гэж үзнэ.

Гэсэн хэдий ч, хэрэв хоёр тоо статистикийн хувьд ялгаатай бол энэ нь үр дүнгийн ялгаа нь танд ямар нэгэн практик ач холбогдолтой гэсэн үг биш юм. Судалгаанд ямар ялгаа чухал болохыг та өөрөө шийдэх хэрэгтэй.

Статистикийн ач холбогдлыг тооцоолох

Бид стандарт 95% итгэлийн түвшинг ашиглан статистикийн ач холбогдлыг тооцдог. Хэрэв хариултын сонголтыг статистикийн хувьд ач холбогдолтой гэж харуулсан бол энэ нь тохиолдлоор эсвэл түүвэрлэлтийн алдаанаас болж хоёр бүлгийн хоорондох зөрүү үүсэх магадлал 5%-иас бага байна гэсэн үг (ихэнхдээ: p<0,05).

Бүлгүүдийн хоорондын статистик ач холбогдолтой ялгааг тооцоолохын тулд бид дараах томъёог ашиглана.

Параметр	Тодорхойлолт
a1	Асуултанд тодорхой байдлаар хариулсан эхний бүлгийн оролцогчдын хувийг энэ бүлгийн түүврийн хэмжээгээр үржүүлнэ.
b1	Асуултанд тодорхой байдлаар хариулсан хоёр дахь бүлгийн оролцогчдын хувийг энэ бүлгийн түүврийн хэмжээгээр үржүүлнэ.
Цуглуулсан түүврийн хувь (p)	Хоёр бүлгийн хоёр хувьцааны хослол.
Стандарт алдаа (SE)	Таны хувь хэмжээ бодит хувиас хэр их ялгаатай байгааг илтгэх үзүүлэлт. Бага утга нь бутархай нь бодит бутархайтай ойролцоо байна гэсэн үг, өндөр утга нь бутархай нь бодит бутархайгаас эрс ялгаатай гэсэн үг юм.
Туршилтын статистик (t)	Туршилтын статистик. Өгөгдсөн утга нь дунджаас ялгаатай стандарт хазайлтын тоо.
Статистикийн ач холбогдол	Туршилтын статистикийн үнэмлэхүй утга нь дунджаас 1.96* стандарт хазайлтаас их байвал статистикийн ач холбогдол бүхий зөрүү гэж үзнэ.

*1.96 нь Оюутны t-тархалтын функцээр зохицуулагдах мужын 95% нь дунджаас 1.96 стандарт хазайлт дотор оршдог тул 95%-ийн итгэлийн түвшинд ашигласан утга юм.

Тооцооллын жишээ

Дээрх жишээг үргэлжлүүлж, танай бүтээгдэхүүнд сэтгэл хангалуун байна гэсэн эрчүүдийн хувь эмэгтэйчүүдийнхээс хамаагүй өндөр байгаа эсэхийг олж мэдье.

Таны санал асуулгад 1000 эрэгтэй, 1000 эмэгтэй оролцсон гэж бодъё, судалгааны үр дүнгээс харахад эрэгтэйчүүдийн 70%, эмэгтэйчүүдийн 65% нь таны бүтээгдэхүүнд сэтгэл хангалуун байна гэж хариулсан. 70% -ийн түвшин 65% -иас хамаагүй өндөр байна уу?

Өгөгдсөн томъёонд санал асуулгын дараах өгөгдлийг орлуулна уу.

p1 (бүтээгдэхүүнд сэтгэл хангалуун байгаа эрчүүдийн%) = 0.7
p2 (бүтээгдэхүүнд сэтгэл хангалуун байгаа эмэгтэйчүүдийн%) = 0.65
n1 (Судалгаанд хамрагдсан эрчүүдийн тоо) = 1000
n2 (ярилцсан эмэгтэйчүүдийн тоо) = 1000

Туршилтын статистикийн үнэмлэхүй утга 1.96-аас их байгаа тул эрэгтэй, эмэгтэй хүмүүсийн ялгаа мэдэгдэхүйц байна гэсэн үг юм. Эмэгтэйчүүдтэй харьцуулахад эрчүүд танай бүтээгдэхүүнд сэтгэл хангалуун байдаг.

Статистикийн ач холбогдлыг нууж байна

Бүх асуултын статистикийн ач холбогдлыг хэрхэн нуух вэ

Зүүн талын самбар дээрх харьцуулах дүрмийн баруун талд байрлах доош сумыг товшино уу.
Нэг зүйлийг сонгоно уу Дүрмийг засах.
Энэ функцийг идэвхгүй болгох Статистикийн ач холбогдлыг харуулахунтраалга ашиглан.
Товчлуур дээр дарна уу Өргөдөл гаргах.

Нэг асуултын статистикийн ач холбогдлыг нуухын тулд та дараахь зүйлийг хийх хэрэгтэй.

Товчлуур дээр дарна уу АялахЭнэ асуудлын диаграмын дээр.
Табыг нээ Дэлгэцийн сонголтууд.
Хажууд байгаа хайрцгийн сонголтыг арилгана уу Статистикийн ач холбогдол.
Товчлуур дээр дарна уу Хадгалах.

Статистикийн ач холбогдлын дэлгэц идэвхжсэн үед дэлгэцийн сонголт автоматаар идэвхждэг. Хэрэв та энэ дэлгэцийн сонголтыг арилгавал статистикийн ач холбогдлын дэлгэц мөн идэвхгүй болно.

Судалгааны асуултанд харьцуулах дүрэм нэмэхдээ статистикийн ач холбогдлын функцийг асаана уу. Судалгаанд хамрагдагсдын янз бүрийн бүлгээс хүлээн авсан хариултуудад статистикийн хувьд мэдэгдэхүйц ялгаа байгаа эсэхийг тодорхойлохын тулд судалгааны асуултынхаа өгөгдлийн хүснэгтүүдийг шалгана уу.

Таны “нөгөө тал”-ыг юугаараа онцгой, утга учиртай болгодог гэж та бодож байна вэ? Энэ нь түүний зан чанартай холбоотой юу эсвэл таны энэ хүнийг гэсэн мэдрэмжтэй холбоотой юу? Эсвэл судалгаагаар таны өрөвдөх сэтгэлийн санамсаргүй байдлын талаархи таамаглал 5% -иас бага магадлалтай гэсэн энгийн баримттай байж болох уу? Хэрэв бид сүүлчийн мэдэгдлийг найдвартай гэж үзвэл амжилттай болзох сайтууд зарчмын хувьд байхгүй болно.

Та өөрийн сайтын хуваах тест эсвэл бусад дүн шинжилгээ хийхдээ "статистикийн ач холбогдол"-ыг буруу ойлгох нь үр дүнг буруу тайлбарлах, улмаар хөрвүүлэх оновчлолын явцад буруу үйлдэл хийхэд хүргэдэг. Энэ нь одоо байгаа салбар бүрт өдөр бүр хийгддэг бусад олон мянган статистик туршилтуудын хувьд үнэн юм.

"Статистикийн ач холбогдол" гэж юу болохыг ойлгохын тулд та энэ нэр томъёоны түүхэнд шумбаж, жинхэнэ утгыг нь мэдэж, энэхүү "шинэ" хуучин ойлголт нь судалгааныхаа үр дүнг зөв тайлбарлахад хэрхэн туслахыг ойлгох хэрэгтэй.

Жаахан түүх

Хэдийгээр хүн төрөлхтөн олон зууны турш янз бүрийн асуудлыг шийдвэрлэхийн тулд статистикийг ашиглаж ирсэн ч статистикийн ач холбогдол, таамаглалыг шалгах, санамсаргүй байдлаар ангилах, тэр ч байтугай Туршилтын загвар (ТМБ) гэх мэт орчин үеийн ойлголт 20-р зууны эхэн үеэс л бий болж эхэлсэн бөгөөд энэ нь шинжлэх ухаантай салшгүй холбоотой юм. Сэр Рональд Фишерийн нэр (Сэр Рональд Фишер, 1890-1962):

Рональд Фишер бол амьтан, ургамлын хаант улс дахь хувьсал, байгалийн шалгарлыг судлах онцгой хүсэл эрмэлзэлтэй хувьслын биологич, статистикч байсан. Тэрээр өөрийн нэр хүндтэй карьерийнхаа туршид бидний өнөөг хүртэл ашигладаг статистикийн олон хэрэглүүр хэрэгслүүдийг боловсруулж, дэлгэрүүлсэн.

Фишер давамгайлал, мутаци, генетикийн хазайлт зэрэг биологийн үйл явцыг тайлбарлахдаа өөрийн боловсруулсан арга техникийг ашигласан. Өнөөдөр бид вэб нөөцийн агуулгыг оновчтой болгох, сайжруулахын тулд ижил хэрэгслийг ашиглаж болно. Эдгээр шинжилгээний хэрэгслүүдийг бүтээх үедээ огт байгаагүй объектуудтай ажиллахад ашиглаж болно гэдэг нь үнэхээр гайхмаар санагдаж байна. Хүмүүс тооцоолуур, компьютергүйгээр нарийн төвөгтэй тооцооллыг хийдэг байсан нь бас гайхмаар юм.

Статистикийн туршилтын үр дүнг үнэн байх магадлал өндөр гэж тайлбарлахын тулд Фишер "ач холбогдол" гэдэг үгийг ашигласан.

Мөн Фишерийн хамгийн сонирхолтой үйл явдлуудын нэгийг "тачаангуй хүү" гэсэн таамаглал гэж нэрлэж болно. Энэ онолын дагуу эмэгтэйчүүд садар самуунтай эрчүүдийг (садар самуун) илүүд үздэг, учир нь энэ нь эдгээр эрчүүдээс төрсөн хөвгүүдэд ижил төстэй хандлагатай байж, илүү үр удмаа төрүүлэх боломжийг олгоно (энэ бол зүгээр л онол гэдгийг анхаарна уу).

Гэхдээ хэн ч, тэр байтугай гайхалтай эрдэмтэд ч алдаа гаргахаас хамгаалдаггүй. Фишерийн алдаа өнөөг хүртэл мэргэжилтнүүдийг зовоож байна. Гэхдээ Альберт Эйнштэйний хэлсэн үгийг санаарай: "Хэн хэзээ ч алдаа гаргаж байгаагүй хүн хэзээ ч шинэ зүйлийг бүтээгээгүй."

Дараагийн цэг рүү шилжихээсээ өмнө санаарай: статистикийн ач холбогдол нь туршилтын үр дүнгийн зөрүү нь санамсаргүй хүчин зүйлээр тайлбарлах боломжгүй маш их байх үед юм.

Таны таамаглал юу вэ?

"Статистикийн ач холбогдол" гэж юу болохыг ойлгохын тулд эхлээд "таамаглалыг шалгах" гэж юу болохыг ойлгох хэрэгтэй, учир нь энэ хоёр нэр томъёо нь хоорондоо нягт холбоотой байдаг.
Таамаглал бол зүгээр л онол юм. Онол боловсруулсны дараа та хангалттай нотлох баримт цуглуулж, тэр нотлох баримтыг бодитоор цуглуулах үйл явцыг бий болгох хэрэгтэй болно. Хоёр төрлийн таамаглал байдаг.

Алим эсвэл жүрж - аль нь дээр вэ?

Үгүй таамаглал

Дүрмээр бол энэ нь олон хүн бэрхшээлтэй тулгардаг. Нэг анхаарах зүйл бол вэб сайтын тодорхой өөрчлөлт нь хөрвүүлэлт нэмэгдэхэд хүргэнэ гэдгийг нотлох шиг тэг таамаглал нь нотлогдох шаардлагагүй, харин эсрэгээр. Тэг таамаглал нь хэрэв та сайтад ямар нэгэн өөрчлөлт хийвэл юу ч болохгүй гэсэн онол юм. Мөн судлаачийн зорилго бол энэ онолыг батлах биш няцаах явдал юм.

Гэмт хэргийг илрүүлэх туршлагыг авч үзвэл, мөрдөн байцаагчид гэмт хэрэгтэн хэн болох талаар таамаглал дэвшүүлдэг бол тэг таамаглал нь гэм буруугүй байдлын таамаглал хэмээх хэлбэрийг авдаг бөгөөд үүний дагуу яллагдагчийг гэм буруутай нь нотлогдох хүртэл гэм буруугүй гэж үздэг. шүүх дээр.

Хэрэв тэг таамаглал нь хоёр объект шинж чанараараа тэнцүү бөгөөд та тэдгээрийн аль нэг нь илүү сайн болохыг нотлохыг оролдож байгаа бол (жишээлбэл, А нь В-ээс илүү) бол та альтернатив хувилбарын төлөө тэг таамаглалыг үгүйсгэх хэрэгтэй. Жишээлбэл, та хөрвүүлэх оновчлолын нэг буюу өөр хэрэгслийг харьцуулж байна. Тэг таамаглалд хоёулаа зорилтот түвшинд ижил нөлөө үзүүлдэг (эсвэл ямар ч нөлөө үзүүлэхгүй). Альтернатив хувилбарт аль нэгнийх нь нөлөө илүү сайн байдаг.

Таны өөр таамаглал нь B - A > 20% гэх мэт тоон утгыг агуулж болно. Энэ тохиолдолд тэг таамаглал ба хувилбар нь дараах хэлбэртэй байж болно.

Альтернатив таамаглалын өөр нэг нэр нь судлаач энэ тодорхой таамаглалыг батлах сонирхолтой байдаг тул судалгааны таамаглал юм.

Статистикийн ач холбогдол ба p утга

Рональд Фишер болон түүний статистикийн ач холбогдлын тухай ойлголт руу дахин орцгооё.

Нэгэнт тэг таамаглал, өөр хувилбар байгаа бол яаж нэгийг нь баталж нөгөөг нь үгүйсгэх вэ?

Статистик нь мөн чанараараа тодорхой популяцийн (түүвэр) судалгаанд хамрагддаг тул та олж авсан үр дүндээ хэзээ ч 100% итгэлтэй байж чадахгүй. Сайн жишээ: сонгуулийн үр дүн нь урьдчилсан санал хураалтын үр дүнгээс, тэр ч байтугай гарах цөөрөмөөс ихэвчлэн ялгаатай байдаг.

Доктор Фишер таны туршилт амжилттай болсон эсэхийг танд мэдэгдэх хуваах шугам үүсгэхийг хүссэн. Найдвартай байдлын индекс ингэж гарч ирсэн. Итгэмжтэй байдал гэдэг нь бидний "чухал" гэж үзсэн болон үл тоомсорлодог зүйлээ хэлэхийн тулд авдаг түвшин юм. Хэрэв "p" ач холбогдлын индекс нь 0.05 ба түүнээс бага байвал үр дүн найдвартай болно.

Санаа зоволтгүй, энэ нь үнэндээ санагдаж байгаа шигээ будлиантай биш юм.

Гауссын магадлалын тархалт. Ирмэгүүдийн дагуу хувьсагчийн магадлал багатай утгууд нь төв хэсэгт хамгийн их магадлалтай байдаг. P оноо (ногоон сүүдэртэй хэсэг) нь ажиглагдсан үр дүн санамсаргүй тохиолдох магадлал юм.

Хэвийн магадлалын тархалт (Гауссын тархалт) нь график дээрх тодорхой хувьсагчийн бүх боломжит утгуудын (дээрх зурагт) болон тэдгээрийн давтамжийн дүрслэл юм. Хэрэв та судалгаагаа зөв хийгээд дараа нь бүх хариултаа график дээр буулгавал яг ийм хуваарилалтыг авах болно. Хэвийн хуваарилалтын дагуу та ижил төстэй хариултуудын ихээхэн хувийг хүлээн авах бөгөөд үлдсэн сонголтууд нь графикийн ирмэг дээр ("сүүл" гэж нэрлэгддэг) байрлах болно. Энэхүү үнэт зүйлсийн хуваарилалт нь байгальд ихэвчлэн байдаг тул үүнийг "хэвийн" гэж нэрлэдэг.

Түүвэр болон туршилтын үр дүнд тулгуурласан тэгшитгэлийг ашиглан та "туршилтын статистик" гэж нэрлэгддэг зүйлийг тооцоолж болох бөгөөд энэ нь таны үр дүн хэр зэрэг хазайж байгааг харуулах болно. Энэ нь мөн та тэг таамаг үнэнд хэр ойрхон байгааг хэлэх болно.

Үүнийг ойлгоход тань туслахын тулд статистикийн ач холбогдлыг тооцоолохын тулд онлайн тооцоолуур ашиглана уу:

Ийм тооны машинуудын нэг жишээ

"p" үсэг нь тэг таамаглал үнэн байх магадлалыг илэрхийлдэг. Хэрэв тоо нь бага бол энэ нь туршилтын бүлгүүдийн хоорондын ялгааг илтгэнэ, харин тэг таамаглал нь ижил байна. Графикийн хувьд таны тестийн статистик таны хонх хэлбэртэй тархалтын сүүлний аль нэгэнд ойр байх болно.

Доктор Фишер ач холбогдлын босгыг p ≤ 0.05 гэж тогтоохоор шийдсэн. Гэсэн хэдий ч энэ мэдэгдэл нь маргаантай байгаа тул энэ нь хоёр бэрхшээлийг дагуулдаг.

1. Нэгдүгээрт, та тэг таамаглал худал болохыг нотолсон нь өөр таамаглалыг баталсан гэсэн үг биш юм. Энэ бүх ач холбогдол нь зүгээр л та A эсвэл B аль алиныг нь баталж чадахгүй гэсэн үг юм.

2. Хоёрдугаарт, хэрэв p оноо 0.049 бол тэг таамаглалын магадлал 4.9% болно гэсэн үг юм. Энэ нь таны шинжилгээний хариу нэгэн зэрэг үнэн, худал байж болно гэсэн үг юм.

Та p оноог ашиглаж болно, эсвэл ашиглахгүй ч байж болно, гэхдээ дараа нь та тэг таамаглалын магадлалыг тохиолдол тус бүрээр тооцож, энэ нь таны төлөвлөж, туршиж үзсэн өөрчлөлтүүдийг хийхээс сэргийлж хангалттай том эсэхийг шийдэх шаардлагатай болно. .

Өнөөдөр статистикийн тест хийх хамгийн түгээмэл хувилбар бол тестийг өөрөө явуулахын өмнө ач холбогдлын босгыг p ≤ 0.05 болгох явдал юм. Үр дүнг шалгахдаа p-утгыг сайтар ажиглаарай.

Алдаа 1 ба 2

Маш их цаг хугацаа өнгөрсөн тул статистикийн ач холбогдлын хэмжигдэхүүнийг ашиглахад гарч болох алдаануудыг бүр өөрийн гэсэн нэрээр нэрлэсэн.

1-р төрлийн алдаа

Дээр дурдсанчлан p-утга 0.05 нь тэг таамаглал үнэн байх магадлал 5% байна гэсэн үг. Хэрэв тэгэхгүй бол та 1-р алдаа гаргах болно. Үр дүн нь таны шинэ вэб сайт таны хөрвүүлэх хурдыг нэмэгдүүлсэн гэсэн боловч 5% -иар тийм биш байх магадлалтай.

2-р төрлийн алдаа

Энэ алдаа нь 1-р алдааны эсрэг байна: та тэг таамаглал худал бол түүнийг хүлээн зөвшөөрнө. Жишээлбэл, туршилтын үр дүнгээс харахад сайтад хийсэн өөрчлөлтүүд нь ямар ч сайжруулалт хийгээгүй, гэхдээ өөрчлөлт орсон. Үүний үр дүнд та гүйцэтгэлээ сайжруулах боломжийг алддаг.

Энэ алдаа нь түүврийн хэмжээ хангалтгүй тестүүдэд нийтлэг байдаг тул түүврийн хэмжээ их байх тусам үр дүн нь илүү найдвартай байх болно гэдгийг санаарай.

Дүгнэлт

Судлаачдын дунд статистикийн ач холбогдол шиг алдартай нэр томъёо байдаггүй байх. Туршилтын үр дүн статистикийн хувьд ач холбогдолгүй болох нь тогтоогдоогүй тохиолдолд үр дагавар нь хөрвөх ханшийн өсөлтөөс эхлээд компаний уналт хүртэл байдаг.

Маркетерууд нөөцөө оновчтой болгохдоо энэ нэр томъёог ашигладаг тул та энэ нь юу гэсэн үг болохыг мэдэх хэрэгтэй. Туршилтын нөхцөл өөр өөр байж болох ч түүврийн хэмжээ болон амжилтын шалгуур нь үргэлж чухал байдаг. Үүнийг санаарай.

Туршилтын гол үр дүн нь статистикийн ач холбогдол буюу ач холбогдлын p түвшин юм

статистик таамаглал. Техникийн хувьд энэ нь өгөгдсөн зүйлийг хүлээн авах магадлал юм

түүвэр судалгааны үр дүн, үнэндээ ерөнхий

Нийтдээ статистикийн тэг таамаглал үнэн - өөрөөр хэлбэл ямар ч холбоо байхгүй. Өөрөөр хэлбэл, энэ

илэрсэн харилцаа нь өмч биш санамсаргүй байх магадлал

нийт. Энэ нь статистикийн ач холбогдол, ач холбогдлын p түвшин, өөрөөр хэлбэл

Харилцаа холбооны найдвартай байдлын тоон үнэлгээ: энэ магадлал бага байх тусам холболт найдвартай байх болно.

Хоёр түүврийн дундаж утгыг харьцуулахдаа түвшний утгыг олж авлаа гэж бодъё

статистик ач холбогдол p=0.05. Энэ нь статистикийн таамаглалыг шалгах гэсэн үг юм

Хүн амын дундах хөрөнгийн тэгш байдал нь үнэн бол магадлалыг харуулсан

Илэрсэн ялгааны санамсаргүй тохиолдлын хэмжээ 5% -иас ихгүй байна. Өөрөөр хэлбэл, хэрэв

нэг популяциас хоёр дээжийг дахин дахин, дараа нь 1-д нь авсан

20 тохиолдлын хувьд эдгээр дээжийн дундажийн хооронд ижил эсвэл илүү их ялгаа олдох болно.

Өөрөөр хэлбэл, олсон ялгаа нь тохиолдлоос үүдэлтэй байх магадлал 5% байна.

шинж чанартай бөгөөд тэдгээр нь нэгтгэлийн өмч биш юм.

Шинжлэх ухааны таамаглалтай холбоотойгоор статистикийн ач холбогдлын түвшин нь тоон үзүүлэлт юм

үр дүнгээс тооцсон холболт байгаа эсэх талаархи дүгнэлтэд үл итгэх байдлын үзүүлэлт

энэ таамаглалыг сонгон, эмпирик шалгах. p түвшний утга бага байх тусам өндөр байна

шинжлэх ухааны таамаглалыг батлах судалгааны үр дүнгийн статистик ач холбогдол.

Ач холбогдлын түвшинд юу нөлөөлж байгааг мэдэх нь ашигтай. Ач холбогдолын түвшин, бусад зүйлс тэнцүү байна

Нөхцөл байдал илүү өндөр (p түвшний утга бага байна) хэрэв:

Холболтын хэмжээ (ялгаа) илүү их байна;

Шинж чанаруудын хувьсах чадвар бага;

Түүврийн хэмжээ (үүд) илүү том байна.

Нэг талынХоёр талын ач холбогдлын тестүүд

Судалгааны зорилго нь хоёр ерөнхий параметрийн ялгааг тодорхойлох юм бол

байгалийн янз бүрийн нөхцөлд тохирсон агрегатууд (амьдрах нөхцөл,

Субъектуудын нас гэх мэт), дараа нь эдгээр параметрүүдийн аль нь илүү байх нь тодорхойгүй байдаг

Аль нь жижиг вэ?

Жишээлбэл, хэрэв та туршилтын үр дүнгийн хэлбэлзлийг сонирхож байгаа бол ба

туршилтын бүлгүүд, дараа нь, дүрмээр бол, хэлбэлзэл эсвэл ялгааны шинж тэмдэгт итгэх итгэл байдаггүй.

хувьсах чанарыг үнэлэх үр дүнгийн стандарт хазайлт. Энэ тохиолдолд

тэг таамаглал нь хэлбэлзэл нь тэнцүү бөгөөд судалгааны зорилго нь

эсрэгээр нь нотлох, өөрөөр хэлбэл. хэлбэлзлийн ялгаа байгаа эсэх. Үүнийг зөвшөөрдөг

ялгаа нь ямар ч шинж тэмдэг байж болно. Ийм таамаглалыг хоёр талт гэж нэрлэдэг.

Гэхдээ заримдаа сорилт нь параметрийн өсөлт, бууралтыг нотлох явдал юм;

жишээ нь, туршилтын бүлгийн дундаж үр дүн хяналтын бүлгийнхээс өндөр байна. Үүний зэрэгцээ

Ялгаа нь өөр шинж тэмдэгтэй байж болохыг цаашид зөвшөөрөхгүй. Ийм таамаглалыг нэрлэдэг

Нэг талын.

Хоёр талт таамаглалыг шалгахад ашигладаг ач холбогдлын тест гэж нэрлэдэг

Хоёр талт, нэг талын хувьд - нэг талт.

Тухайн тохиолдолд ямар шалгуурыг сонгох вэ гэдэг асуулт гарч ирнэ. Хариулах

Энэ асуулт нь албан ёсны статистикийн аргуудын хамрах хүрээнээс гадуур бөгөөд бүрэн юм

Судалгааны зорилгоос хамаарна. Ямар ч тохиолдолд та дараа нь нэг эсвэл өөр шалгуурыг сонгох ёсгүй

Туршилтын өгөгдлийн шинжилгээнд үндэслэн туршилт хийх, энэ нь магадгүй юм

Буруу дүгнэлт хийхэд хүргэнэ. Хэрэв туршилт хийхээс өмнө ялгаа байна гэж үзвэл

Харьцуулсан параметрүүд нь эерэг эсвэл сөрөг байж болно, тэгвэл та үүнийг хийх хэрэгтэй

Хувьсагчдын хоорондын аливаа харилцааны үндсэн шинж чанарууд.

Бид хувьсагчдын хоорондын харилцааны хамгийн энгийн хоёр шинж чанарыг тэмдэглэж болно: (а) харилцааны хэмжээ, (б) харилцааны найдвартай байдал.

- Хэмжээ . Хараат байдлын хэмжигдэхүүнийг ойлгох, хэмжих нь найдвартай байдлаас илүү хялбар байдаг. Жишээлбэл, хэрэв дээжийн аль нэг эрэгтэй цусны цагаан эсийн тоо (WCC) аль ч эмэгтэйгээс өндөр байсан бол энэ хоёр хувьсагч (Хүйс ба WCC) хоорондын хамаарал маш өндөр байна гэж хэлж болно. Өөрөөр хэлбэл, та нэг хувьсагчийн утгыг нөгөөгийнхээс урьдчилан таамаглах боломжтой.

- Найдвартай байдал ("үнэн"). Харилцан хамаарлын найдвартай байдал нь хамаарлын хэмжээнээс бага зөн совингийн ойлголт боловч энэ нь туйлын чухал юм. Харилцааны найдвартай байдал нь дүгнэлт гаргахад үндэслэсэн тодорхой түүврийн төлөөлөлтэй шууд холбоотой. Өөрөөр хэлбэл, найдвартай байдал гэдэг нь тухайн хүн амын дундаас авсан өөр түүврийн өгөгдлийг ашиглан харилцааг дахин илрүүлэх (өөрөөр хэлбэл баталгаажуулах) магадлалыг хэлнэ.

Эцсийн зорилго бол үнэт зүйлсийн тодорхой жишээг бараг хэзээ ч судлахгүй гэдгийг санах нь зүйтэй; түүвэр нь нийт хүн амын тухай мэдээлэл өгөхдөө л сонирхолтой байдаг. Хэрэв судалгаа нь тодорхой шалгуурыг хангасан бол түүврийн хувьсагчдын хоорондын хамаарлын найдвартай байдлыг стандарт статистикийн хэмжүүр ашиглан тоолж, танилцуулж болно.

Хараат байдлын хэмжээ ба найдвартай байдал нь хувьсагчдын хоорондын хамаарлын хоёр өөр шинж чанарыг илэрхийлдэг. Гэхдээ бүрэн бие даасан гэж хэлж болохгүй. Хэвийн хэмжээтэй түүвэр дэх хувьсагчдын хоорондын хамаарлын хэмжээ (холболт) их байх тусам найдвартай байх болно (дараагийн хэсгийг үзнэ үү).

Үр дүнгийн статистик ач холбогдол (p-түвшин) нь түүний "үнэн"-д итгэх итгэлийн тооцоолсон хэмжүүр юм ("түүврийн төлөөлөл" гэсэн утгаараа). Техникийн хувьд p-түвшин нь үр дүнгийн найдвартай байдлаас хамааран багасах дарааллаар өөрчлөгддөг хэмжүүр юм. Өндөр p түвшин нь түүвэрт олдсон хувьсагчдын хоорондын хамааралд итгэх итгэлийн доод түвшинтэй тохирч байна. Тухайлбал, p-түвшин нь ажиглагдсан үр дүнг нийт хүн амд хуваарилахтай холбоотой алдааны магадлалыг илэрхийлдэг.

Жишээлбэл, p-түвшин = 0.05(жишээ нь 1/20) нь түүвэрт олдсон хувьсагчдын хоорондын хамаарал нь түүврийн санамсаргүй шинж чанар байх магадлал 5% байгааг харуулж байна. Олон судалгаанд p-түвшин 0.05 нь алдааны түвшний хувьд "хүлээн зөвшөөрөгдөх маржин" гэж үздэг.

Ямар түвшний ач холбогдлыг үнэхээр "чухал" гэж үзэх ёстойг шийдэхдээ дур зоргоос зайлсхийх арга байхгүй. Үр дүнг худал гэж үгүйсгэх тодорхой ач холбогдлын түвшинг сонгох нь дур зоргоороо юм.

Практикт эцсийн шийдвэр нь янз бүрийн өгөгдөл дээр хийсэн олон дүн шинжилгээ, харьцуулалтын үр дүнд априори (жишээ нь туршилт хийхээс өмнө) үр дүнг урьдчилан таамаглаж байсан эсэхээс хамаарна. судалгааны салбарын уламжлал.

Ерөнхийдөө олон талбарт p .05-ын үр дүн нь статистикийн ач холбогдлын хувьд хүлээн зөвшөөрөгдөхүйц хязгаар юм, гэхдээ энэ түвшинд нэлээд том алдааны зөрүү (5%) байдгийг санаарай.

p .01 түвшний үр дүнг ерөнхийд нь статистикийн ач холбогдолтой гэж үздэг бол p .005 эсвэл p .00 түвшний үр дүнг ерөнхийд нь статистикийн ач холбогдолтой гэж үздэг. 001 нь маш чухал юм. Гэсэн хэдий ч ач холбогдлын түвшний энэхүү ангилал нь нэлээд дур зоргоороо бөгөөд практик туршлага дээр үндэслэн батлагдсан албан бус хэлэлцээр гэдгийг ойлгох хэрэгтэй. тодорхой судалгааны чиглэлээр.

Цуглуулсан өгөгдлийн нийт дүн дээр дүн шинжилгээ хийх тусам олон чухал (сонгосон түвшинд) үр дүн нь санамсаргүй байдлаар илрэх нь тодорхой байна.

Олон тооны харьцуулалтыг багтаасан статистикийн зарим аргууд нь энэ төрлийн алдааг давтах магадлал өндөр байдаг тул харьцуулалтын нийт тоонд тусгай тохируулга эсвэл тохируулга хийдэг. Гэсэн хэдий ч статистикийн олон аргууд (ялангуяа хайгуулын өгөгдлийн шинжилгээний энгийн аргууд) энэ асуудлыг шийдэх ямар ч арга замыг санал болгодоггүй.

Хэрэв хувьсагчдын хоорондын хамаарал “объектив” сул байвал том түүврийг судлахаас өөр ийм хамаарлыг шалгах арга байхгүй. Түүвэр нь бүрэн төлөөлөлтэй байсан ч түүврийн хэмжээ бага байвал нөлөө нь статистикийн хувьд чухал биш юм. Үүний нэгэн адил, хэрэв харилцаа нь "объектив" маш хүчтэй бол түүнийг маш бага түүвэрт ч гэсэн өндөр ач холбогдолтойгоор илрүүлж болно.

Хувьсагчдын хоорондын хамаарал сул байх тусам түүнийг утга учиртай илрүүлэхэд шаардагдах түүврийн хэмжээ их байх болно.

Олон янз харилцааны хэмжүүр хувьсагчдын хооронд. Тодорхой судалгаанд тодорхой хэмжүүрийг сонгох нь хувьсагчийн тоо, ашигласан хэмжүүр, харилцааны шинж чанар гэх мэтээс хамаарна.

Гэсэн хэдий ч эдгээр хэмжүүрүүдийн ихэнх нь ерөнхий зарчмыг баримталдаг: тэдгээр нь ажиглагдаж буй хамаарлыг тухайн хувьсагчдын хоорондох "хамгийн их боломжит хамаарал"-тай харьцуулах замаар үнэлэхийг оролддог. Техникийн хувьд ийм тооцоолол хийх ердийн арга бол хувьсагчдын утгууд хэрхэн өөрчлөгдөж байгааг харж, дараа нь "нийтлэг" ("хамтарсан") хэлбэлзэлтэй байгаа нийт өөрчлөлтийн хэдийг тайлбарлаж болохыг тооцоолох явдал юм. хоёр (эсвэл түүнээс дээш) хувьсагч.

Ач холбогдол нь түүврийн хэмжээнээс ихээхэн хамаардаг. Өмнө дурьдсанчлан, маш том түүврийн хувьд хувьсагчдын хоорондын маш сул хамаарал нь мэдэгдэхүйц байх болно, харин жижиг түүврийн хувьд маш хүчтэй хамаарал ч найдвартай биш юм.

Иймд статистикийн ач холбогдлын түвшинг тодорхойлохын тулд түүврийн хэмжээ тус бүрийн хувьсагчдын хоорондын хамаарлын “том” ба “ач холбогдол” хоорондын хамаарлыг илэрхийлэх функц хэрэгтэй.

Ийм функц нь "популяцид ийм хамаарал байхгүй гэж үзвэл өгөгдсөн хэмжээний түүвэрт өгөгдсөн утгын (эсвэл түүнээс дээш) хамаарлыг олж авах магадлал хэр байгааг" яг таг харуулах болно. Өөрөөр хэлбэл, энэ функц нь ач холбогдлын түвшинг өгөх болно
(p-түвшин), улмаар хүн амд энэ хамаарал байхгүй гэсэн таамаглалыг буруугаар үгүйсгэх магадлал.

Энэхүү "алтернатив" таамаглалыг (хүн амын дунд ямар ч хамаарал байхгүй) ихэвчлэн нэрлэдэг тэг таамаглал.

Алдаа гарах магадлалыг тооцдог функц нь шугаман бөгөөд зөвхөн өөр өөр түүврийн хэмжээтэй өөр өөр налуутай байвал тохиромжтой байх болно. Харамсалтай нь энэ функц нь илүү төвөгтэй бөгөөд үргэлж ижил байдаггүй. Гэсэн хэдий ч ихэнх тохиолдолд түүний хэлбэр нь мэдэгдэж байгаа бөгөөд өгөгдсөн хэмжээтэй дээжийг судлахад ач холбогдлын түвшинг тодорхойлоход ашиглаж болно. Эдгээр функцүүдийн ихэнх нь хуваарилалтын ангилалтай холбоотой байдаг хэвийн .