Статистикт вариацын цуврал гэж юу вэ. Вариацын цувралын тодорхойлолт

Энэ бүлгийг эзэмшсэний үр дүнд оюутан дараахь зүйлийг хийх ёстой. мэдэх

  • өөрчлөлтийн үзүүлэлтүүд ба тэдгээрийн хамаарал;
  • шинж чанарын тархалтын үндсэн хуулиуд;
  • зөвшөөрлийн шалгуурын мөн чанар; чадвартай байх
  • хэлбэлзлийн индекс ба тохирох байдлын шалгуурыг тооцоолох;
  • тархалтын шинж чанарыг тодорхойлох;
  • статистикийн тархалтын цувралын үндсэн тоон шинж чанарыг үнэлэх;

эзэмшдэг

  • тархалтын цувааны статистик шинжилгээний арга;
  • дисперсийн шинжилгээний үндэс;
  • Статистикийн тархалтын цувааг тархалтын үндсэн хуулиудад нийцэж байгаа эсэхийг шалгах арга техник.

Өөрчлөлтийн үзүүлэлтүүд

Төрөл бүрийн статистикийн популяцийн шинж чанарын статистикийн судалгаанд популяцийн бие даасан статистикийн нэгжийн шинж чанарын өөрчлөлт, түүнчлэн энэ шинж чанарын дагуу нэгжийн тархалтын шинж чанарыг судлах нь ихээхэн сонирхол татаж байна. Хувилбар -Эдгээр нь судалж буй хүн амын нэгжийн шинж чанарын хувь хүний ​​утгын ялгаа юм. Хувилбарыг судлах нь практик ач холбогдолтой. Хувилбарын зэрэглэлээр тухайн шинж чанарын хэлбэлзлийн хязгаар, тухайн шинж чанарын популяцийн нэгэн төрлийн байдал, дундажийн ердийн байдал, өөрчлөлтийг тодорхойлдог хүчин зүйлсийн хамаарлыг шүүж болно. Вариацын үзүүлэлтүүдийг статистикийн популяцийг тодорхойлох, зохион байгуулахад ашигладаг.

Статистикийн тархалтын цуврал хэлбэрээр үзүүлсэн статистикийн ажиглалтын материалын хураангуй, бүлэглэлтийн үр дүн нь судалж буй хүн амын нэгжийн бүлэглэх (өөрчлөх) шалгуурын дагуу бүлэгт хуваагдсан эрэмблэгдсэн хуваарилалтыг илэрхийлдэг. Хэрэв чанарын шинж чанарыг бүлэглэх үндэс болгон авсан бол ийм тархалтын цуваа гэж нэрлэдэг атрибут(мэргэжил, хүйс, өнгө гэх мэтээр хуваарилалт). Хэрэв тархалтын цуваа тоон үзүүлэлтээр хийгдсэн бол ийм цувааг дуудна хувьсах(өндөр, жин, цалин гэх мэтээр хуваарилах). Вариацын цуваа байгуулах гэдэг нь популяцийн нэгжийн тоон тархалтыг шинж чанарын утгуудын дагуу зохион байгуулж, эдгээр утгууд (давтамж) бүхий популяцийн нэгжийн тоог тоолж, үр дүнг хүснэгтэд оруулахыг хэлнэ.

Хувилбарын давтамжийн оронд түүний ажиглалтын нийт эзлэхүүнтэй харьцуулсан харьцааг ашиглах боломжтой бөгөөд үүнийг давтамж (харьцангуй давтамж) гэж нэрлэдэг.

Дискрет ба интервал гэсэн хоёр төрлийн вариацын цуваа байдаг. Дискрет цуврал- Энэ бол завсарлагатай өөрчлөлтүүд (дискрет шинж чанарууд) бүхий шинж чанарууд дээр суурилдаг вариацын цуврал юм. Сүүлийнх нь аж ахуйн нэгжийн ажилчдын тоо, тарифын ангилал, гэр бүлийн хүүхдийн тоо гэх мэт орно. Дискрет вариацын цуврал нь хоёр баганаас бүрдэх хүснэгтийг илэрхийлдэг. Эхний баганад атрибутын тодорхой утгыг, хоёр дахь багана нь атрибутын тодорхой утгатай популяцийн нэгжийн тоог заана. Хэрэв шинж чанар нь тасралтгүй өөрчлөгдөж байвал (орлогын хэмжээ, үйлчилгээний хугацаа, аж ахуйн нэгжийн үндсэн хөрөнгийн өртөг гэх мэт тодорхой хязгаарт ямар ч үнэ цэнийг авч болно) байвал энэ шинж чанарыг бий болгох боломжтой. интервалын өөрчлөлтийн цуврал.Интервалын вариацын цувралыг байгуулахдаа хүснэгт нь мөн хоёр баганатай байна. Эхнийх нь "-ээс" (сонголт) хоорондын атрибутын утгыг, хоёр дахь нь интервалд (давтамж) орсон нэгжийн тоог заана. Давтамж (давталтын давтамж) - шинж чанарын утгын тодорхой хувилбарын давталтын тоо. Интервалууд нь хаалттай эсвэл нээлттэй байж болно. Хаалттай интервал нь хоёр талдаа хязгаарлагдмал, i.e. доод ("-ээс") болон дээд ("хүртэл") хилийн аль аль нь байна. Нээлттэй интервалууд нь нэг хилтэй байдаг: дээд эсвэл доод. Хэрэв сонголтуудыг өсөх эсвэл буурах дарааллаар байрлуулсан бол мөрүүдийг дуудна эрэмбэлсэн.

Вариацын цувралын хувьд хоёр төрлийн давтамжийн хариу сонголт байдаг: хуримтлагдсан давтамж ба хуримтлагдсан давтамж. Хуримтлагдсан давтамж нь шинж чанарын утга нь заасан хэмжээнээс бага утгыг авсан хэдэн ажиглалтыг харуулдаг. Хуримтлагдсан давтамжийг өмнөх бүлгүүдийн бүх давтамжтай тухайн бүлгийн шинж чанарын давтамжийн утгыг нэгтгэн тодорхойлно. Хуримтлагдсан давтамж нь шинж чанарын утга нь тухайн бүлгийн дээд хязгаараас хэтрэхгүй ажиглалтын нэгжийн эзлэх хувийг тодорхойлдог. Тиймээс хуримтлагдсан давтамж нь өгөгдсөн хэмжээнээс ихгүй утгатай нийт сонголтуудын эзлэх хувийг харуулдаг. Давтамж, давтамж, үнэмлэхүй ба харьцангуй нягтрал, хуримтлагдсан давтамж, давтамж нь хувилбарын цар хүрээний шинж чанар юм.

Популяцийн статистикийн нэгжийн шинж чанарын өөрчлөлт, тархалтын шинж чанарыг цувралын дундаж түвшин, дундаж шугаман хазайлт, стандарт хазайлт, тархалт зэргийг багтаасан вариацын цувралын үзүүлэлт, шинж чанарыг ашиглан судалдаг. , хэлбэлзлийн коэффициент, хэлбэлзэл, тэгш бус байдал, куртоз гэх мэт.

Түгээх төвийг тодорхойлохын тулд дундаж утгыг ашигладаг. Дундаж гэдэг нь судалж буй хүн амын гишүүдийн эзэмшдэг шинж чанарын ердийн түвшинг тоон байдлаар илэрхийлдэг ерөнхий статистик үзүүлэлт юм. Гэсэн хэдий ч янз бүрийн тархалтын хэв маягтай арифметик дундажууд давхцах тохиолдол гарч болзошгүй тул вариацын цувралын статистик шинж чанаруудын хувьд бүтцийн хэрэгсэл гэж нэрлэгддэг горим, медиан, түүнчлэн тархалтын цувааг тэнцүү болгон хуваадаг квантилуудыг тооцдог. хэсгүүд (квартил, дециль, хувь гэх мэт).

Загвар -Энэ нь тархалтын цувралд бусад утгуудаас илүү олон удаа тохиолддог шинж чанарын утга юм. Дискрет цувралын хувьд энэ нь хамгийн өндөр давтамжтай сонголт юм. Интервалын вариацын цувралд горимыг тодорхойлохын тулд эхлээд модаль интервал гэж нэрлэгддэг интервалыг тодорхойлох шаардлагатай. Тэнцүү интервалтай вариацын цувралд модаль интервалыг хамгийн өндөр давтамжаар, тэгш бус интервалтай цувралд - гэхдээ хамгийн их тархалтын нягтаар тодорхойлно. Дараа нь ижил интервалтайгаар эгнээн дэх горимыг тодорхойлохын тулд томъёог ашиглана

хаана Мо бол загварын үнэ цэнэ; xMo - модаль интервалын доод хязгаар; h-модаль интервалын өргөн; / Mo - модаль интервалын давтамж; / Mo j нь премодалийн интервалын давтамж; / Mo+1 нь постмодалийн интервалын давтамж бөгөөд энэ тооцооны томъёонд тэгш бус интервалтай цувралын хувьд / Mo, / Mo, / Mo давтамжийн оронд тархалтын нягтыг ашиглах нь зүйтэй. Оюун ухаан 0 _| , Оюун ухаан 0> UMO+"

Хэрэв нэг горим байгаа бол санамсаргүй хэмжигдэхүүний магадлалын тархалтыг unimodal гэж нэрлэдэг; хэрэв нэгээс олон горим байгаа бол үүнийг multimodal (полимодаль, multimodal), хоёр горимын хувьд - bimodal гэж нэрлэдэг. Дүрмээр бол multimodality нь судалж буй тархалт нь ердийн тархалтын хуульд захирагдахгүй байгааг харуулж байна. Нэг төрлийн популяци нь дүрмээр бол нэг оройн тархалтаар тодорхойлогддог. Multivertex нь мөн судалж буй популяцийн нэг төрлийн бус байдлыг илтгэнэ. Хоёр ба түүнээс дээш оройн харагдах байдал нь илүү нэгэн төрлийн бүлгүүдийг тодорхойлохын тулд өгөгдлийг дахин бүлэглэх шаардлагатай болдог.

Интервалын вариацын цувралд горимыг гистограмм ашиглан графикаар тодорхойлж болно. Үүнийг хийхийн тулд гистограмын хамгийн өндөр баганын дээд цэгээс зэргэлдээх хоёр баганын дээд цэг хүртэл огтлолцсон хоёр шугам зурна. Дараа нь тэдгээрийн огтлолцлын цэгээс абсцисса тэнхлэгт перпендикуляр буулгана. Перпендикуляртай харгалзах x тэнхлэг дээрх шинж чанарын утга нь горим юм. Ихэнх тохиолдолд популяцийг тодорхойлохдоо ерөнхий үзүүлэлт болгон арифметик дундажаас илүү горимыг илүүд үздэг.

Медиан -Энэ нь хуваарилалтын эрэмблэгдсэн цувралын төв гишүүний эзэмшдэг атрибутын төв утга юм. Дискрет цувралд медианы утгыг олохын тулд эхлээд түүний серийн дугаарыг тодорхойлно. Үүнийг хийхийн тулд нэгжийн тоо сондгой байвал бүх давтамжийн нийлбэр дээр нэгийг нэмж, тоог хоёр хуваана. Хэрэв эгнээнд тэгш тооны нэгж байвал хоёр медиан нэгж байх тул энэ тохиолдолд медианыг хоёр медиан нэгжийн утгын дундажаар тодорхойлно. Тиймээс дискрет вариацын цувралын медиан нь цувралыг ижил тооны сонголт агуулсан хоёр хэсэгт хуваах утга юм.

Интервалын цувралд медианы серийн дугаарыг тодорхойлсны дараа хуримтлагдсан давтамж (давтамж) ашиглан медиан интервалыг олоод дараа нь медианыг тооцоолох томъёог ашиглан медианы утгыг өөрөө тодорхойлно.

Энд Би бол дундаж утга; x Би -дундаж интервалын доод хязгаар; h-дундаж интервалын өргөн; - түгээлтийн цувралын давтамжийн нийлбэр; /D - өмнөх дундаж интервалын хуримтлагдсан давтамж; / Me - дундаж интервалын давтамж.

Дундаж утгыг хуримтлал ашиглан графикаар олж болно. Үүнийг хийхийн тулд хуримтлагдсан давтамжийн (давтамж) хуваарь дээр медианы дарааллын дугаарт харгалзах цэгээс хуримтлагдсан тэнхлэгтэй огтлолцох хүртэл абсцисса тэнхлэгтэй параллель шулуун шугам татна. Дараа нь заасан шугамын хуримтлалтай огтлолцох цэгээс абсцисса тэнхлэгт перпендикуляр доошлоно. Зурсан ордонд (перпендикуляр) харгалзах x тэнхлэг дээрх шинж чанарын утга нь медиан байна.

Медиан нь дараах шинж чанаруудаар тодорхойлогддог.

  • 1. Энэ нь түүний хоёр талд байрлах шинж чанарын утгуудаас хамаарахгүй.
  • 2. Энэ нь хамгийн бага шинж чанартай бөгөөд энэ нь атрибутын утгуудын дундаж утгаас үнэмлэхүй хазайлтын нийлбэр нь шинж чанарын утгуудын бусад утгаас хазайлттай харьцуулахад хамгийн бага утгыг илэрхийлнэ гэсэн үг юм.
  • 3. Хоёр тархалтыг мэдэгдэж буй медиануудтай хослуулах үед шинэ тархалтын медиан утгыг урьдчилан таамаглах боломжгүй юм.

Сургууль, эмнэлэг, шатахуун түгээх станц, усны насос гэх мэт нийтийн үйлчилгээний цэгүүдийн байршлыг төлөвлөхдөө медианы эдгээр шинж чанаруудыг өргөн ашигладаг. Жишээлбэл, хотын тодорхой хороололд эмнэлэг барихаар төлөвлөж байгаа бол хорооллын уртыг биш, оршин суугчдын тоог хоёр дахин багасгасан цэгт байрлуулах нь илүү оновчтой байх болно.

Мод, медиан ба арифметик дундажийн харьцаа нь нийлбэр дэх шинж чанарын тархалтын шинж чанарыг харуулж, тархалтын тэгш хэмийг үнэлэх боломжийг олгодог. Хэрэв x Me дараа нь цувралын баруун талын тэгш бус байдал байна. Хэвийн тархалттай X -Би - Мо.

К.Пирсон янз бүрийн төрлийн муруйн уялдаа холбоонд үндэслэн дунд зэргийн тэгш бус тархалтын хувьд арифметик дундаж, медиан ба горимын хоорондох дараах ойролцоо хамаарал хүчинтэй болохыг тогтоосон.

Энд Би бол дундаж утга; Мо - загварын утга учир; x арифметик - арифметик дундажийн утга.

Хэрэв вариацын цувралын бүтцийг илүү нарийвчлан судлах шаардлагатай бол дундаж утгатай төстэй шинж чанарын утгыг тооцоолно. Ийм шинж чанарын утгууд нь бүх хуваарилалтын нэгжийг тэнцүү тоонд хуваадаг бөгөөд тэдгээрийг квантил эсвэл градиент гэж нэрлэдэг. Квантилыг квартил, дециль, хувь гэх мэтээр хуваана.

Квартилууд хүн амыг дөрвөн тэнцүү хэсэгт хуваадаг. Эхний улирлын интервалыг өмнө нь тодорхойлсон эхний дөрөвний нэгийг тооцоолох томъёог ашиглан медиантай адил тооцоолно.

энд Qi нь эхний квартилийн утга; xQ^-эхний квартилийн хязгаарын доод хязгаар; h- эхний улирлын интервалын өргөн; /, - интервалын цувралын давтамж;

Эхний квартилийн интервалаас өмнөх интервал дахь хуримтлагдсан давтамж; Jq ( - эхний квартиль интервалын давтамж.

Эхний квартиль нь хүн амын нэгжийн 25% нь түүний үнэ цэнээс бага, 75% нь илүү байгааг харуулж байна. Хоёр дахь квартиль нь медиантай тэнцүү, i.e. Q 2 =Би.

Үүнтэй адилтгаж, гурав дахь улирлын интервалыг олж аваад гурав дахь квартилыг тооцоолно.

Гурав дахь квартилийн хязгаарын доод хязгаар хаана байна; h- гурав дахь квартилийн интервалын өргөн; /, - интервалын цувралын давтамж; /X" -өмнөх интервал дахь хуримтлагдсан давтамж

Г

гурав дахь квартилийн интервал; Jq нь гурав дахь квартилийн интервалын давтамж юм.

Гурав дахь квартиль нь хүн амын нэгжийн 75% нь түүний үнэ цэнээс бага, 25% нь илүү байгааг харуулж байна.

Гурав дахь болон эхний дөрөвний хоорондох ялгаа нь квартил хоорондын муж юм.

энд Aq нь квартиль хоорондын хязгаарын утга; Q 3 -гурав дахь квартилийн утга; Q, эхний квартилийн утга.

Дециль нь хүн амыг 10 тэнцүү хэсэгт хуваадаг. Аравтын тоо нь популяцийн аравны нэгтэй тэнцэх тархалтын цувралын шинж чанарын утга юм. Квартилуудтай зүйрлэвэл эхний аравтын тоо нь хүн амын нэгжийн 10% нь түүний үнэ цэнээс бага, 90% нь их, ес дэх аравтын тоо нь 90% нь түүний үнэ цэнээс бага, 10% нь илүү. Ес дэх ба эхний аравтын харьцаа, i.e. Децилийн коэффициентийг орлогын ялгааг судлахад хамгийн чинээлэг 10%, хамгийн бага чинээлэг хүн амын 10% -ийн орлогын түвшний харьцааг хэмжихэд өргөн хэрэглэгддэг. Хувьцаа нь эрэмбэлсэн хүн амыг 100 тэнцүү хэсэгт хуваадаг. Процентилийн тооцоо, утга, хэрэглээ нь децильтэй төстэй.

Квартил, дециль болон бусад бүтцийн шинж чанаруудыг хуримтлалыг ашиглан медиантай харьцуулан графикаар тодорхойлж болно.

Өөрчлөлтийн хэмжээг хэмжихийн тулд дараахь үзүүлэлтүүдийг ашигладаг: хэлбэлзлийн хүрээ, дундаж шугаман хазайлт, стандарт хазайлт, тархалт. Вариацын хүрээний хэмжээ нь цувралын туйлын гишүүдийн тархалтын санамсаргүй байдлаас бүрэн хамаарна. Энэ үзүүлэлт нь шинж чанарын утгын хэлбэлзлийн далайц гэж юу болохыг мэдэх нь чухал тохиолдолд сонирхолтой байдаг.

Хаана R-хэлбэлзлийн хүрээний утга; x max - шинж чанарын хамгийн их утга; х тт -шинж чанарын хамгийн бага утга.

Хувилбарын мужийг тооцоолохдоо цувралын гишүүдийн дийлэнх олонхийн утгыг харгалздаггүй, харин хэлбэлзэл нь цувралын гишүүн бүрийн утгатай холбоотой байдаг. Нэг шинж чанарын бие даасан утгуудын дундаж утгуудын хазайлтаас олж авсан дундаж үзүүлэлтүүд нь ийм сул талтай байдаггүй: дундаж шугаман хазайлт ба стандарт хазайлт. Дунджаас хувь хүний ​​хазайлт ба тодорхой шинж чанарын хувьсах чадварын хооронд шууд хамаарал байдаг. Хэлбэлзэл хүчтэй байх тусам дундаж хэмжээнээс хазайх үнэмлэхүй хэмжээ их байна.

Дундаж шугаман хазайлт нь хувь хүний ​​сонголтуудын дундаж утгаас хазайсан үнэмлэхүй утгын арифметик дундаж юм.

Бүлэглэгдээгүй өгөгдлийн дундаж шугаман хазайлт

энд /pr нь дундаж шугаман хазайлтын утга; x, - шинж чанарын утга; X - p -хүн амын нэгжийн тоо.

Бүлэглэсэн цувааны дундаж шугаман хазайлт

хаана / vz - дундаж шугаман хазайлтын утга; x - шинж чанарын утга; X -судалж буй популяцийн шинж чанарын дундаж утга; / - тусдаа бүлэгт хамаарах хүн амын тоо.

Энэ тохиолдолд хазайлтын шинж тэмдгийг үл тоомсорлодог, эс тэгвээс бүх хазайлтын нийлбэр нь тэгтэй тэнцүү байна. Шинжилсэн өгөгдлийн бүлэглэлээс хамааран дундаж шугаман хазайлтыг янз бүрийн томъёогоор тооцоолно: бүлэглэсэн ба бүлэггүй өгөгдлийн хувьд. Конвенцийн дагуу дундаж шугаман хазайлтыг бусад өөрчлөлтийн үзүүлэлтүүдээс тусад нь практикт харьцангуй ховор ашигладаг (ялангуяа нийлүүлэлтийн жигд байдлын талаархи гэрээний үүргийн биелэлтийг тодорхойлоход; гадаад худалдааны эргэлтэд дүн шинжилгээ хийхдээ ажилчид, үйлдвэрлэлийн хэмнэл, бүтээгдэхүүний чанар, үйлдвэрлэлийн технологийн онцлогийг харгалзан үзэх гэх мэт).

Стандарт хазайлт нь судалж буй шинж чанарын бие даасан утгууд нь хүн амын дундаж утгаас дунджаар хэр их хазайж байгааг тодорхойлдог бөгөөд судалж буй шинж чанарын хэмжилтийн нэгжээр илэрхийлэгддэг. Стандарт хазайлт нь хувьсах гол хэмжүүрүүдийн нэг бөгөөд нэгэн төрлийн популяци дахь шинж чанарын хэлбэлзлийн хязгаарыг үнэлэх, хэвийн тархалтын муруйн ординатын утгыг тодорхойлох, түүнчлэн холбогдох тооцоололд өргөн хэрэглэгддэг. түүврийн ажиглалтыг зохион байгуулах, түүврийн шинж чанарын нарийвчлалыг тогтоох. Бүлэглэгдээгүй өгөгдлийн стандарт хазайлтыг дараах алгоритмыг ашиглан тооцоолно: дунджаас гарсан хазайлт бүрийг квадрат болгож, бүх квадратуудыг нэгтгэн, дараа нь квадратуудын нийлбэрийг цувралын гишүүний тоонд хувааж, квадрат язгуурыг гарган авна. коэффициент:

энд a Iip нь стандарт хазайлтын утга; Xj-шинж чанарын үнэ цэнэ; X- судалж буй популяцийн шинж чанарын дундаж утга; p -хүн амын нэгжийн тоо.

Бүлэглэсэн дүн шинжилгээ хийсэн өгөгдлийн хувьд өгөгдлийн стандарт хазайлтыг жинлэсэн томъёогоор тооцоолно

Хаана - стандарт хазайлтын утга; Xj-шинж чанарын үнэ цэнэ; X -судалж буй популяцийн шинж чанарын дундаж утга; f x -тодорхой бүлгийн хүн амын тоо.

Хоёр тохиолдолд язгуурын доорх илэрхийлэлийг дисперс гэнэ. Тиймээс дисперсийг шинж чанарын утгуудын дундаж утгаас хазайсан дундаж квадратаар тооцдог. Жинлээгүй (энгийн) атрибутын утгуудын хувьд хэлбэлзлийг дараах байдлаар тодорхойлно.

Жинлэсэн шинж чанарын утгын хувьд

Мөн дисперсийг тооцоолох тусгай хялбаршуулсан арга байдаг: ерөнхийдөө

жингүй (энгийн) шинж чанарын утгуудын хувьд жигнэсэн шинж чанарын утгын хувьд
тэг дээр суурилсан аргыг ашиглан

энд 2 нь тархалтын утга; x, - шинж чанарын утга; X -шинж чанарын дундаж утга, h-бүлгийн интервалын утга, t 1 -жин (A =

Тархалт нь статистикт өөрийн гэсэн илэрхийлэлтэй бөгөөд өөрчлөлтийн хамгийн чухал үзүүлэлтүүдийн нэг юм. Үүнийг судалж буй шинж чанарын хэмжлийн нэгжийн квадратад харгалзах нэгжээр хэмждэг.

Тархалт нь дараах шинж чанартай байдаг.

  • 1. Тогтмол утгын дисперс нь тэг байна.
  • 2. Шинж чанарын бүх утгыг ижил А утгаар бууруулах нь дисперсийн утгыг өөрчлөхгүй. Энэ нь хазайлтын дундаж квадратыг шинж чанарын өгөгдсөн утгуудаас бус, харин тэдгээрийн зарим тогтмол тооноос хазайлтаар тооцоолж болно гэсэн үг юм.
  • 3. Аливаа шинж чанарын утгыг багасгах кудаа дисперсийг багасгадаг к 2 удаа, стандарт хазайлт нь байна кудаа, өөрөөр хэлбэл. шинж чанарын бүх утгыг зарим тогтмол тоогоор (цувралын интервалын утгаар гэх мэт) хувааж, стандарт хазайлтыг тооцоолж, дараа нь тогтмол тоогоор үржүүлж болно.
  • 4. Хэрэв бид ямар нэгэн утгаас хазайлтын дундаж квадратыг тооцвол Тэгээдарифметик дунджаас нэг градусаар ялгаатай бол энэ нь арифметик дунджаас тооцоолсон хазайлтын дундаж квадратаас үргэлж их байх болно. Хазайлын дундаж квадрат нь маш тодорхой хэмжээгээр их байх болно - дундаж ба энэ уламжлалт утгын хоорондох зөрүүний квадратаар.

Альтернатив шинж чанарын өөрчлөлт нь хүн амын нэгжид судлагдсан эд хөрөнгө байгаа эсэхээс бүрдэнэ. Альтернатив шинж чанарын өөрчлөлтийг тоон хувьд хоёр утгаар илэрхийлнэ: судлагдсан шинж чанарын нэгж байгаа эсэхийг нэг (1), байхгүйг тэг (0) гэж тэмдэглэнэ. Судалгаанд хамрагдаж буй эд хөрөнгөтэй нэгжийн эзлэх хувийг P-ээр, энэ өмчгүй нэгжийн эзлэх хувийг гэж тэмдэглэнэ. Г.Тиймээс, альтернатив шинж чанарын дисперс нь энэ өмчийг эзэмшдэг нэгжийн эзлэх хувийн жинг (P) энэ өмчийг эзэмшдэггүй нэгжийн эзлэх хувьтай тэнцүү байна. (G).Хүн амын хамгийн их хэлбэлзэл нь хүн амын нийт эзлэхүүний 50% -ийг бүрдүүлдэг хүн амын нэг хэсэг нь шинж чанартай, 50% -тай тэнцэх хүн амын өөр нэг хэсэг нь энэ шинж чанарыг агуулаагүй тохиолдолд хүрдэг. ба тархалт нь 0.25-ийн хамгийн их утгад хүрдэг, t .e. P = 0.5, G= 1 - P = 1 - 0.5 = 0.5 ба o 2 = 0.5 0.5 = 0.25. Энэ үзүүлэлтийн доод хязгаар нь тэг бөгөөд энэ нь нийлбэрийн өөрчлөлтгүй нөхцөл байдалд тохирч байна. Альтернатив шинж чанарын дисперсийн практик хэрэглээ нь түүврийн ажиглалт хийх үед итгэлцлийн интервалыг бий болгох явдал юм.

Вариац болон стандарт хазайлт бага байх тусам популяци нь нэг төрлийн, дундаж нь илүү нийтлэг байх болно. Статистикийн практикт янз бүрийн шинж чанаруудын өөрчлөлтийг харьцуулах шаардлагатай байдаг. Жишээлбэл, ажилчдын нас, тэдний мэргэшил, ажилласан хугацаа ба цалин хөлс, зардал ба ашиг, ажилласан хугацаа, хөдөлмөрийн бүтээмж гэх мэт өөрчлөлтүүдийг харьцуулах нь сонирхолтой юм. Ийм харьцуулалт хийхэд шинж чанарын үнэмлэхүй хэлбэлзлийн үзүүлэлтүүд тохиромжгүй байдаг: жилээр илэрхийлсэн ажлын туршлагын хэлбэлзлийг рубльээр илэрхийлсэн цалингийн өөрчлөлттэй харьцуулах боломжгүй юм. Ийм харьцуулалт хийх, түүнчлэн янз бүрийн арифметик үзүүлэлт бүхий хэд хэдэн популяцид ижил шинж чанарын хувьсах чадварыг харьцуулахын тулд хэлбэлзлийн коэффициент, хэлбэлзлийн шугаман коэффициент, хэмжүүрийг харуулсан хэлбэлзлийн коэффициентийг ашигладаг. дундаж орчимд хэт их утгын хэлбэлзэл.

Хэлбэлзлийн коэффициент:

Хаана V R -хэлбэлзлийн коэффициентийн утга; Р- өөрчлөлтийн хүрээний утга; X -

Шугаман хэлбэлзлийн коэффициент".

Хаана Vj-шугаман хэлбэлзлийн коэффициентийн утга; би -дундаж шугаман хазайлтын утга; X -судалж буй популяцийн шинж чанарын дундаж утга.

Өөрчлөлтийн коэффициент:

Хаана V a -хэлбэлзлийн утгын коэффициент; a нь стандарт хазайлтын утга; X -судалж буй популяцийн шинж чанарын дундаж утга.

Хэлбэлзлийн коэффициент нь вариацын хүрээг судалж буй шинж чанарын дундаж утгад эзлэх хувийн харьцаа, шугаман хэлбэлзлийн коэффициент нь судалж буй шинж чанарын дундаж утгын харьцааг хэлнэ. хувь. Вариацын коэффициент нь стандарт хазайлтаас судалж буй шинж чанарын дундаж утгад эзлэх хувь юм. Хувиар илэрхийлсэн харьцангуй утгын хувьд хэлбэлзлийн коэффициентийг янз бүрийн шинж чанаруудын хэлбэлзлийн түвшинг харьцуулахад ашигладаг. Вариацын коэффициентийг ашиглан статистикийн популяцийн нэгэн төрлийн байдлыг үнэлдэг. Хэрэв вариацын коэффициент 33% -иас бага бол судалж буй популяци нь нэгэн төрлийн, хэлбэлзэл нь сул байна. Хэрэв вариацын коэффициент 33% -иас дээш байвал судалж буй популяци нь нэг төрлийн бус, хэлбэлзэл хүчтэй, дундаж утга нь хэвийн бус бөгөөд энэ популяцийн ерөнхий үзүүлэлт болгон ашиглах боломжгүй юм. Үүнээс гадна янз бүрийн популяци дахь нэг шинж чанарын хувьсах чадварыг харьцуулахын тулд вариацын коэффициентийг ашигладаг. Жишээлбэл, хоёр аж ахуйн нэгжийн ажилчдын үйлчилгээний урт хугацааны өөрчлөлтийг үнэлэх. Коэффициентийн утга өндөр байх тусам шинж чанарын өөрчлөлт нь илүү их ач холбогдолтой болно.

Тооцоолсон квартил дээр үндэслэн улирлын хэлбэлзлийн харьцангуй үзүүлэлтийг томъёогоор тооцоолох боломжтой.

хаана Q 2 Тэгээд

Квартиль хоорондын мужийг томъёогоор тодорхойлно

Хэт их утгыг ашиглахтай холбоотой сул талуудаас зайлсхийхийн тулд дөрвөлжин хазайлтыг хэлбэлзлийн хүрээний оронд ашигладаг.

Тэгш бус интервалын хэлбэлзлийн цувааны хувьд тархалтын нягтыг мөн тооцдог. Энэ нь интервалын утгад хуваагдсан харгалзах давтамж эсвэл давтамжийн коэффициент гэж тодорхойлогддог. Тэгш бус интервалын цувралд үнэмлэхүй ба харьцангуй тархалтын нягтыг ашигладаг. Түгээлтийн үнэмлэхүй нягт нь интервалын нэгж урт дахь давтамж юм. Харьцангуй тархалтын нягт нь интервалын нэгж урт дахь давтамж юм.

Дээрх бүх зүйл нь тархалтын хууль нь хэвийн тархалтын хуулиар сайн тодорхойлогдсон эсвэл түүнтэй ойролцоо тархалтын цувралын хувьд үнэн юм.

Статистикийн шинжилгээнд онцгой байр суурь нь судалж буй шинж чанар эсвэл үзэгдлийн дундаж түвшинг тодорхойлох явдал юм. Тухайн шинж чанарын дундаж түвшинг дундаж утгуудаар хэмждэг.

Дундаж утга нь судалж буй шинж чанарын ерөнхий тоон түвшинг тодорхойлдог бөгөөд статистикийн хүн амын бүлгийн шинж чанар юм. Энэ нь нэг чиглэлд эсвэл өөр чиглэлд бие даасан ажиглалтын санамсаргүй хазайлтыг тэгшитгэж, сулруулж, судалж буй шинж чанарын үндсэн, ердийн шинж чанарыг тодотгож өгдөг.

Дундажуудыг өргөн ашигладаг:

1. Хүн амын эрүүл мэндийн байдлыг үнэлэхийн тулд: бие бялдрын хөгжлийн онцлог (өндөр, жин, цээжний тойрог гэх мэт), янз бүрийн өвчний тархалт, үргэлжлэх хугацааг тодорхойлох, хүн ам зүйн үзүүлэлтүүдэд дүн шинжилгээ хийх (хүн амын амин чухал хөдөлгөөн, дундаж наслалт, хүн амын нөхөн үржихүй, хүн амын дундаж тоо гэх мэт).

2. Эмнэлгийн байгууллага, эмнэлгийн ажилтны үйл ажиллагааг судалж, ажлын чанарт нь үнэлэлт дүгнэлт өгөх, хүн амын төрөл бүрийн эмнэлгийн тусламж үйлчилгээний хэрэгцээг төлөвлөх, тодорхойлох (жилд нэг оршин суугчд ногдох хүсэлт, хандалтын дундаж тоо, оршин суух дундаж хугацаа. Эмнэлэгт байгаа өвчтөн, өвчтөний үзлэгт хамрагдах дундаж хугацаа, эмч, ортой дундаж хүрэлцээ гэх мэт).

3. Ариун цэврийн болон эпидемиологийн төлөв байдлыг тодорхойлох (цех дэх агаарын тоосны дундаж хэмжээ, нэг хүнд ногдох талбайн дундаж хэмжээ, уураг, өөх тос, нүүрс усны дундаж хэрэглээ гэх мэт).

4. Лабораторийн мэдээллийг боловсруулахдаа хэвийн болон эмгэгийн нөхцөлд эмнэлгийн болон физиологийн үзүүлэлтүүдийг тодорхойлох, түүвэр судалгааны үр дүнгийн найдвартай байдлыг нийгэм, эрүүл ахуй, эмнэлзүйн болон туршилтын судалгаанд тогтоох.

Дундаж утгын тооцоог вариацын цувааны үндсэн дээр гүйцэтгэдэг. Вариацын цувралнь чанарын хувьд нэгэн төрлийн статистикийн багц бөгөөд тус тусын нэгжүүд нь судалж буй шинж чанар, үзэгдлийн тоон ялгааг тодорхойлдог.

Тоон хэлбэлзэл нь тасалдалгүй (дискрет) ба тасралтгүй гэсэн хоёр төрөлтэй байж болно.

Тасралтгүй (дискрет) шинж чанар нь зөвхөн бүхэл тоогоор илэрхийлэгддэг бөгөөд ямар ч завсрын утгатай байж болохгүй (жишээлбэл, зочилсон тоо, сайтын хүн ам, гэр бүлийн хүүхдийн тоо, өвчний хүндийн зэрэг) , гэх мэт).

Тасралтгүй тэмдэг нь тодорхой хязгаарт ямар ч утгыг, түүний дотор бутархай утгыг авч болох бөгөөд зөвхөн ойролцоогоор илэрхийлэгддэг (жишээлбэл, жин нь насанд хүрэгчдэд килограммаар, нярай хүүхдэд граммаар хязгаарлагдаж болно; өндөр, цусны даралт, цаг хугацаа өвчтөнтэй уулзах гэх мэт).



Вариацын цувралд багтсан бие даасан шинж чанар, үзэгдэл бүрийн тоон утгыг хувилбар гэж нэрлэдэг бөгөөд үсгээр тэмдэглэнэ. В . Жишээлбэл, бусад тэмдэглэгээг математикийн ном зохиолоос олж болно x эсвэл y.

Сонголт бүрийг нэг удаа зааж өгсөн хувилбарын цувралыг энгийн гэж нэрлэдэг.Ийм цувралыг компьютерийн өгөгдөл боловсруулах тохиолдолд статистикийн ихэнх асуудалд ашигладаг.

Ажиглалтын тоо нэмэгдэхийн хэрээр давтагдах хувилбарын утгууд гарах хандлагатай байдаг. Энэ тохиолдолд үүнийг бүтээдэг бүлэглэсэн вариацын цуврал, давталтын тоог зааж өгсөн (давтамж, "үсгээр тэмдэглэгдсэн" r »).

Эрэмбэлэгдсэн вариацын цувралөсөх эсвэл буурах дарааллаар байрлуулсан сонголтуудаас бүрдэнэ. Энгийн болон бүлэглэсэн цувралуудыг зэрэглэлээр эмхэтгэж болно.

Интервалын өөрчлөлтийн цувралмаш олон тооны ажиглалтын нэгжтэй (1000 гаруй) компьютер ашиглахгүйгээр хийсэн дараагийн тооцооллыг хялбарчлах зорилгоор эмхэтгэсэн.

Тасралтгүй вариацын цувралямар ч утга байж болох сонголтын утгыг агуулдаг.

Хэрэв вариацын цувралд шинж чанарын утгууд (хувилбарууд) нь бие даасан тодорхой тоон хэлбэрээр өгөгдсөн бол ийм цувралыг нэрлэдэг. салангид.

Вариацын цувралд тусгагдсан шинж чанарын утгуудын ерөнхий шинж чанарууд нь дундаж утгууд юм. Тэдгээрийн дотроос хамгийн их ашиглагддаг нь: арифметик дундаж М,загвар Моба дундаж Би.Эдгээр шинж чанарууд тус бүр нь өвөрмөц юм. Тэд бие биенээ орлож чадахгүй бөгөөд зөвхөн хамтдаа вариацын цувралын шинж чанарыг бүрэн, хураангуй хэлбэрээр илэрхийлдэг.

Загвар (Сар) хамгийн их тохиолддог сонголтуудын утгыг нэрлэнэ үү.

Медиан (Би) – энэ нь эрэмбэлсэн вариацын цувралыг хагасаар хуваах сонголтын утга юм (дундаж тал бүр дээр сонголтын тал нь байна). Ховор тохиолдолд, тэгш хэмтэй вариацын цуваа байх үед горим ба медиан нь хоорондоо тэнцүү бөгөөд арифметик дундажийн утгатай давхцдаг.

Опционы утгуудын хамгийн нийтлэг шинж чанар нь арифметик дундажүнэ цэнэ( М ). Математикийн уран зохиолд үүнийг тэмдэглэсэн байдаг .

Арифметик дундаж (М, ) нь чанарын хувьд нэгэн төрлийн статистикийн популяцийг бүрдүүлдэг судалж буй үзэгдлийн тодорхой шинж чанарын ерөнхий тоон шинж чанар юм. Энгийн бөгөөд жигнэсэн арифметик дундажууд байдаг. Энгийн арифметик дундажийг энгийн вариацын цувралын хувьд бүх хувилбаруудыг нэгтгэж, энэ нийлбэрийг энэ вариацын цувралд багтсан сонголтуудын нийт тоонд хуваах замаар тооцдог. Тооцооллыг дараахь томъёоны дагуу гүйцэтгэнэ.

,

Хаана: М - энгийн арифметик дундаж;

Σ В - үнийн сонголт;

n- ажиглалтын тоо.

Бүлэглэсэн вариацын цувралд жигнэсэн арифметик дундажийг тодорхойлно. Үүнийг тооцоолох томъёо:

,

Хаана: М - арифметик жигнэсэн дундаж;

Σ Vp - хувилбарын бүтээгдэхүүний нийлбэр давтамжаар;

n- ажиглалтын тоо.

Олон тооны ажиглалтаар гараар тооцоолсон тохиолдолд моментийн аргыг ашиглаж болно.

Арифметик дундаж нь дараахь шинж чанартай байдаг.

· дунджаас хазайлтын нийлбэр ( Σ г ) тэгтэй тэнцүү (Хүснэгт 15-ыг үзнэ үү);

· бүх сонголтыг ижил хүчин зүйлээр (хуваагч) үржүүлэх (хуваах) үед арифметик дундажийг ижил хүчин зүйлээр (хуваагч) үржүүлнэ (хуваах);

· хэрэв та бүх хувилбарт ижил тоог нэмэх (хасах) тохиолдолд арифметик дундаж нь ижил тоогоор өсөх (багарах) болно.

Тооцоолсон цувааны хувьсах чанарыг харгалзахгүйгээр өөрсдөө авсан арифметик дундаж нь вариацын цувралын шинж чанарыг бүрэн тусгадаггүй, ялангуяа бусад дундаж үзүүлэлттэй харьцуулах шаардлагатай үед. Ойролцоох дундаж утгыг тархалтын янз бүрийн зэрэгтэй цувралаас авч болно. Хувь хүний ​​сонголтууд нь тоон шинж чанараараа бие биентэйгээ ойр байх тусам бага байна тархалт (хэлбэлзэл, хэлбэлзэл)цуврал байх тусам түүний дундаж нь илүү нийтлэг байдаг.

Зан чанарын хувьсах чадварыг үнэлэх гол үзүүлэлтүүд нь:

· Хамрах хүрээ;

· Далайц;

· Стандарт хазайлт;

· Өөрчлөлтийн коэффициент.

Тухайн шинж чанарын хувьсах чанарыг вариацын цувралын далайц ба далайцаар ойролцоогоор дүгнэж болно. Энэ муж нь цувралын хамгийн их (V max) ба хамгийн бага (V мин) сонголтуудыг заана. Далайн далайц (А м) нь эдгээр сонголтуудын хоорондох ялгаа юм: A m = V max - V мин.

Вариацын цувралын хувьсах чанарыг тодорхойлох гол, нийтээр хүлээн зөвшөөрөгдсөн хэмжүүр нь тархалт (Д ). Гэхдээ хамгийн түгээмэл хэрэглэгддэг зүйл бол тархалтын үндсэн дээр тооцсон илүү тохиромжтой параметр юм - стандарт хазайлт ( σ ). Энэ нь хазайлтын хэмжээг харгалзан үздэг ( г ) вариацын цуваа бүрийн арифметик дундажаас ( d=V - М ).

Дунджаас хазайх нь эерэг ба сөрөг байж болох тул нийлбэр дүнгээр "0" гэсэн утгыг өгдөг (С d=0). Үүнээс зайлсхийхийн тулд хазайлтын утгууд ( г) хоёр дахь зэрэглэлд хүргэж, дундажаар хэмжигддэг. Тиймээс вариацын цувралын тархалт нь хувилбарын арифметик дунджаас хазайсан дундаж квадрат бөгөөд дараах томъёогоор тооцоолно.

.

Энэ нь хувьсах байдлын хамгийн чухал шинж чанар бөгөөд статистикийн олон шалгуурыг тооцоолоход хэрэглэгддэг.

Тархалтыг хазайлтын квадратаар илэрхийлдэг тул түүний утгыг арифметик дундажтай харьцуулахад ашиглах боломжгүй. Эдгээр зорилгоор үүнийг ашигладаг стандарт хазайлт, үүнийг "Сигма" тэмдгээр тэмдэглэсэн ( σ ). Энэ нь вариацын цувралын бүх хувилбаруудын арифметик дундаж утгаас дундаж хазайлтыг дундаж утгатай ижил нэгжээр тодорхойлдог тул тэдгээрийг хамтад нь ашиглах боломжтой.

Стандарт хазайлтыг дараах томъёогоор тодорхойлно.

Заасан томъёог ажиглалтын тоо ( n ) 30-аас дээш. Бага тоогоор n стандарт хазайлтын утга нь математикийн зөрүүтэй холбоотой алдаатай байх болно ( n - 1). Үүнтэй холбогдуулан стандарт хазайлтыг тооцоолох томъёонд ийм хазайлтыг харгалзан илүү нарийвчлалтай үр дүнг авч болно.

стандарт хазайлт (с ) нь санамсаргүй хэмжигдэхүүний стандарт хазайлтын тооцоо юм Xтүүний дисперсийн бодитой тооцоололд үндэслэсэн математикийн хүлээлттэй харьцуулахад.

Үнэт зүйлстэй n > 30 стандарт хазайлт ( σ ) ба стандарт хазайлт ( с ) ижил байх болно ( σ =s ). Тиймээс ихэнх практик гарын авлагад эдгээр шалгуурыг өөр өөр утгатай гэж үздэг. Excel-д стандарт хазайлтыг =STDEV(муж) функцийг ашиглан тооцоолж болно. Стандарт хазайлтыг тооцоолохын тулд та тохирох томьёог үүсгэх хэрэгтэй.

Дундаж квадрат буюу стандарт хазайлт нь шинж чанарын утга нь дундаж утгаас хэр их ялгаатай болохыг тодорхойлох боломжийг олгодог. Зуны өдрийн дундаж температур ижил хоёр хот байна гэж бодъё. Эдгээр хотуудын нэг нь далайн эрэг дээр, нөгөө нь тивд байрладаг. Далайн эрэг дээр байрладаг хотуудад өдрийн температурын ялгаа нь дотоодод байрладаг хотуудаас бага байдаг нь мэдэгдэж байна. Тиймээс далайн эргийн хотын өдрийн температурын стандарт хазайлт нь хоёр дахь хотынхоос бага байх болно. Практикт энэ нь тивд байрладаг хотын тодорхой өдөр бүрийн агаарын дундаж температур далайн эрэг дээрх хотынхоос илүү их ялгаатай байна гэсэн үг юм. Нэмж дурдахад стандарт хазайлт нь температурын боломжит хазайлтыг дунджаас шаардлагатай магадлалын түвшингээр үнэлэх боломжийг олгодог.

Магадлалын онолын дагуу ердийн тархалтын хуульд захирагддаг үзэгдлүүдэд арифметик дундаж, стандарт хазайлт ба сонголтуудын хооронд хатуу хамаарал байдаг ( гурван сигма дүрэм). Жишээлбэл, янз бүрийн шинж чанарын утгын 68.3% нь M ± 1 дотор байна σ , 95.5% - M ± 2 дотор σ ба 99.7% - M ± 3 дотор σ .

Стандарт хазайлтын утга нь вариацын цуврал болон судалгааны бүлгийн нэгэн төрлийн шинж чанарыг дүгнэх боломжийг олгодог. Хэрэв стандарт хазайлтын утга бага байвал энэ нь судалж буй үзэгдлийн нэлээд өндөр нэгэн төрлийн байгааг илтгэнэ. Энэ тохиолдолд арифметик дундажийг өгөгдсөн вариацын цувралын хувьд нэлээд онцлог шинж чанартай гэж үзэх хэрэгтэй. Гэсэн хэдий ч хэт бага сигма утга нь ажиглалтыг зохиомлоор сонгох талаар бодоход хүргэдэг. Маш том сигматай бол арифметик дундаж нь вариацын цувааг бага хэмжээгээр тодорхойлдог бөгөөд энэ нь судалж буй шинж чанар, үзэгдлийн мэдэгдэхүйц хэлбэлзэл эсвэл судалж буй бүлгийн нэг төрлийн бус байдлыг илэрхийлдэг. Гэсэн хэдий ч стандарт хазайлтын утгыг харьцуулах нь зөвхөн ижил хэмжээсийн шинж чанаруудын хувьд боломжтой юм. Үнэн хэрэгтээ, хэрэв бид шинэ төрсөн хүүхэд болон насанд хүрэгчдийн жингийн олон янз байдлыг харьцуулж үзвэл бид насанд хүрэгсдэд үргэлж өндөр сигма утгыг авах болно.

Төрөл бүрийн хэмжээсийн шинж чанаруудын хувьсах чадварыг харьцуулах аргыг ашиглан хийж болно хэлбэлзлийн коэффициент. Энэ нь олон янз байдлыг дундаж утгын хувиар илэрхийлж, өөр өөр шинж чанаруудыг харьцуулах боломжийг олгодог. Эмнэлгийн ном зохиол дахь өөрчлөлтийн коэффициентийг " тэмдгээр тэмдэглэсэн байдаг. ХАМТ ", мөн математикийн хувьд" v"болон томъёогоор тооцоолно:

.

10% -иас бага хэлбэлзлийн коэффициентийн утгууд нь жижиг сарнилыг, 10-20% - дундаж, 20% -иас дээш - арифметик дундажийн эргэн тойронд хүчтэй тархалтыг илэрхийлдэг.

Арифметик дундажийг ихэвчлэн түүвэр популяциас авсан мэдээлэлд үндэслэн тооцдог. Давтан судалгаа хийснээр санамсаргүй үзэгдлийн нөлөөн дор арифметик дундаж нь өөрчлөгдөж болно. Энэ нь дүрмээр бол ажиглалтын боломжит нэгжийн зөвхөн нэг хэсгийг буюу түүвэр популяцийг судалж байгаатай холбоотой юм. Судалж буй үзэгдлийг илэрхийлэх бүх боломжит нэгжийн талаарх мэдээллийг нийт хүн амыг судлах замаар олж авах боломжтой бөгөөд энэ нь үргэлж боломжгүй байдаг. Үүний зэрэгцээ, туршилтын өгөгдлийг нэгтгэх зорилгоор нийт хүн амын дунджийн утгыг сонирхож байна. Тиймээс судалж буй үзэгдлийн талаар ерөнхий дүгнэлт гаргахын тулд түүврийн популяцийн үндсэн дээр олж авсан үр дүнг статистикийн аргыг ашиглан нийт хүн амд шилжүүлэх ёстой.

Түүврийн судалгаа болон нийт хүн амын хоорондын тохирлын түвшинг тодорхойлохын тулд түүврийн ажиглалтын явцад зайлшгүй гарах алдааны хэмжээг тооцоолох шаардлагатай. Энэ алдааг " Төлөөлөгчийн алдаа"эсвэл "Арифметик дундажийн дундаж алдаа." Энэ нь үнэндээ сонгомол статистик ажиглалтаас олж авсан дундаж үзүүлэлтүүд болон ижил объектыг тасралтгүй судлах явцад олж авах ижил төстэй утгуудын хоорондох ялгаа юм. нийт хүн амыг судлах үед. Түүврийн дундаж нь санамсаргүй хэмжигдэхүүн тул ийм таамаглалыг судлаачийн хүлээн зөвшөөрөх магадлалын түвшинд гүйцэтгэдэг. Анагаах ухааны судалгаанд энэ нь дор хаяж 95% байдаг.

Төлөөлөгчийн алдааг бүртгэлийн алдаа эсвэл анхаарал болгоомжийн алдаатай (хулсалт, буруу тооцоолол, үсгийн алдаа гэх мэт) андуурч болохгүй, үүнийг туршилтын явцад ашигласан зохих арга, хэрэгслээр багасгах хэрэгтэй.

Төлөөлөгчийн алдааны хэмжээ нь түүврийн хэмжээ болон шинж чанарын хувьсах чадвараас хамаарна. Ажиглалтын тоо их байх тусам түүвэр популяцид ойртож, алдаа багасна. Тэмдэг нь илүү их хувьсах тусам статистикийн алдаа их болно.

Практикт вариацын цувааны төлөөллийн алдааг тодорхойлохын тулд дараахь томъёог ашигладаг.

,

Хаана: м - төлөөллийн алдаа;

σ - стандарт хазайлт;

n– түүвэр дэх ажиглалтын тоо.

Томъёо нь дундаж алдааны хэмжээ нь стандарт хазайлттай шууд пропорциональ, өөрөөр хэлбэл судалж буй шинж чанарын хэлбэлзэлтэй, ажиглалтын тооны квадрат язгууртай урвуу пропорциональ байгааг харуулж байна.

Харьцангуй утгыг тооцоолоход үндэслэн статистикийн шинжилгээ хийхдээ вариацын цуваа байгуулах шаардлагагүй. Энэ тохиолдолд харьцангуй үзүүлэлтүүдийн дундаж алдааг тодорхойлохдоо хялбаршуулсан томъёог ашиглан хийж болно.

,

Хаана: Р– хувь, ppm гэх мэтээр илэрхийлсэн харьцангуй үзүүлэлтийн утга;

q– P-ийн харилцан хамаарал ба үзүүлэлтийг тооцоолох үндэслэлээс хамааран (1-P), (100-P), (1000-P) гэх мэтээр илэрхийлэгдэнэ;

n– түүвэр популяци дахь ажиглалтын тоо.

Гэсэн хэдий ч харьцангуй утгын төлөөллийн алдааг тооцоолох томъёог зөвхөн индикаторын утга нь суурь хэмжээнээс бага байх үед л хэрэглэж болно. Эрчимтэй үзүүлэлтүүдийг тооцоолох хэд хэдэн тохиолдолд энэ нөхцөл хангагдаагүй бөгөөд үзүүлэлтийг 100% эсвэл 1000% -ийн тоогоор илэрхийлж болно. Ийм нөхцөлд вариацын цуваа байгуулж, төлөөллийн алдааг стандарт хазайлт дээр үндэслэн дундаж утгын томъёог ашиглан тооцоолно.

Популяци дахь арифметик дундаж утгыг урьдчилан таамаглахдаа хамгийн бага ба хамгийн их гэсэн хоёр утгыг зааж өгнө. Хүн амын хүссэн дундаж утга хэлбэлзэж болох боломжит хазайлтын эдгээр хэт утгыг "гэж нэрлэдэг" Итгэлийн хил хязгаар».

Магадлалын онолын постулатууд нь 99.7% магадлалтай шинж чанарын хэвийн тархалтаар дундажийн хазайлтын туйлын утга нь төлөөллийн алдааны гурвалсан утгаас ихгүй байх болно гэдгийг нотолсон. М ± 3 м ); 95.5% - дундаж утгын дундаж алдаанаас хоёр дахин ихгүй байна ( М ± 2 м ); 68.3% - нэгээс илүү дундаж алдаа ( М ± 1 м ) (Зураг 9).

P%

Цагаан будаа. 9. Хэвийн тархалтын магадлалын нягт.

Дээрх мэдэгдэл нь зөвхөн Гауссын ердийн тархалтын хуульд захирагддаг шинж чанарын хувьд үнэн болохыг анхаарна уу.

Ихэнх туршилтын судалгаанууд, түүний дотор анагаах ухааны салбарт хийсэн хэмжилтүүд нь үр дүн нь өгөгдсөн интервалд бараг ямар ч утгыг авч чаддаг хэмжилттэй холбоотой байдаг тул дүрмээр бол тэдгээрийг тасралтгүй санамсаргүй хэмжигдэхүүний загвараар тодорхойлдог. Үүнтэй холбоотойгоор ихэнх статистик аргууд нь тасралтгүй тархалтыг авч үздэг. Математик статистикт үндсэн үүрэг гүйцэтгэдэг ийм тархалтын нэг нь юм хэвийн буюу Гауссын тархалт.

Энэ нь хэд хэдэн шалтгаантай холбоотой юм.

1. Юуны өмнө олон туршилтын ажиглалтуудыг хэвийн тархалтыг ашиглан амжилттай дүрсэлж болно. Ердийн тархалттай санамсаргүй хэмжигдэхүүн нь практикт хэзээ ч тохиолдохгүй, -ээс хооронд хэлбэлздэг тул яг хэвийн байх эмпирик өгөгдлийн тархалт байхгүй гэдгийг нэн даруй тэмдэглэх нь зүйтэй. Гэсэн хэдий ч ердийн тархалт нь ихэвчлэн ойролцоо утгатай байдаг.

Хүний биеийн жин, өндөр болон бусад физиологийн үзүүлэлтүүдийг хэмжиж байгаа эсэхээс үл хамааран үр дүнд нь маш олон тооны санамсаргүй хүчин зүйл (байгалийн шалтгаан, хэмжилтийн алдаа) нөлөөлдөг.

Түүнээс гадна, дүрмээр бол эдгээр хүчин зүйлүүд тус бүрийн нөлөө нь ач холбогдолгүй юм. Туршлагаас харахад ийм тохиолдлын үр дүн нь ойролцоогоор хэвийн тархсан байх болно.

2. Санамсаргүй түүвэрлэлттэй холбоотой олон тархалт сүүлийнх нь эзлэхүүн ихсэх тусам хэвийн болдог.

3. Хэвийн тархалт нь бусад тасралтгүй тархалтын ойролцоо (жишээ нь, хазайсан) хувьд маш тохиромжтой.

4. Хэвийн тархалт нь хэд хэдэн таатай математик шинж чанартай бөгөөд энэ нь түүнийг статистикт өргөнөөр ашиглах боломжийг ихээхэн хангадаг.

Үүний зэрэгцээ эмнэлгийн өгөгдөлд ердийн тархалтын загвараар тайлбарлах боломжгүй олон туршилтын тархалт байдаг гэдгийг тэмдэглэх нь зүйтэй. Үүний тулд статистик нь "параметрийн бус" гэж нэрлэгддэг аргуудыг боловсруулсан.

Тодорхой туршилтын өгөгдлийг боловсруулахад тохиромжтой статистикийн аргыг сонгохдоо олж авсан өгөгдөл нь ердийн тархалтын хуульд хамаарах эсэхээс хамаарна. Тэмдгийг ердийн тархалтын хуульд захируулах таамаглалыг давтамжийн тархалтын гистограм (график), түүнчлэн статистикийн хэд хэдэн шалгуурыг ашиглан хийдэг. Тэдний дунд: Тэгш хэмийн шалгуур ( );

б Куртозыг илрүүлэх шалгуур ( );

g Шапиро-Вилкс тест ( ) .

Өгөгдлийн тархалтын шинж чанарын шинжилгээг (мөн тархалтын хэвийн байдлын тест гэж нэрлэдэг) параметр тус бүрээр хийдэг. Параметрийн тархалт хэвийн хуультай тохирч байгаа эсэхийг итгэлтэйгээр дүгнэхийн тулд хангалттай олон тооны ажиглалтын нэгж (дор хаяж 30 утга) шаардлагатай.

Хэвийн тархалтын хувьд хазайлт ба муруйлт шалгуур нь 0 утгыг авна. Хэрэв тархалтыг баруун тийш шилжүүлсэн бол Тэгш хэмийн шалгуур ( > 0 (эерэг тэгш бус), хамт Тэгш хэмийн шалгуур ( < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона Куртозыг илрүүлэх шалгуур ( =0. At Куртозыг илрүүлэх шалгуур ( > 0 бол тархалтын муруй илүү хурц байна Куртозыг илрүүлэх шалгуур ( < 0 пик более сглаженный, чем функция нормального распределения.

Шапиро-Вилксийн шалгуурыг ашиглан хэвийн эсэхийг шалгахын тулд шаардлагатай ач холбогдлын түвшинд, ажиглалтын нэгжийн тооноос (чөлөөний зэрэг) хамааран статистикийн хүснэгтүүдийг ашиглан энэ шалгуурын утгыг олох шаардлагатай. Хавсралт 1. Дүрмээр бол энэ шалгуурын бага утгуудад хэвийн байдлын таамаглалыг үгүйсгэдэг. w <0,8.

Вариацын цувралшинж чанарын тоон утгуудын цуврал юм.

Вариацын цувралын үндсэн шинж чанарууд: v – хувилбар, p – үүсэх давтамж.

Вариацын цувралын төрлүүд:

    сонголтуудын давтамжийн дагуу: энгийн - сонголт нэг удаа тохиолддог, жигнэсэн - сонголт нь хоёр ба түүнээс дээш удаа тохиолддог;

    сонголтуудын байршлаар: эрэмбэлэгдсэн - опционыг буурах ба өсөх дарааллаар байрлуулсан, эрэмбэгүй - сонголтуудыг тодорхой дарааллаар бичээгүй;

    сонголтыг бүлэг болгон нэгтгэх замаар: бүлэглэсэн - сонголтуудыг бүлэгт нэгтгэсэн, бүлэггүй - сонголтуудыг бүлэгт нэгтгэдэггүй;

    хэмжээний сонголтоор: тасралтгүй - сонголтууд нь бүхэл ба бутархай тоогоор илэрхийлэгдэнэ, дискрет - сонголтууд нь бүхэл тоогоор илэрхийлэгдэнэ, комплекс - сонголтууд нь харьцангуй эсвэл дундаж утгаар илэрхийлэгдэнэ.

Дундаж утгыг тооцоолохын тулд вариацын цувралыг эмхэтгэж, албан ёсны болгодог.

Вариацын цуврал бичлэгийн хэлбэр:

8. Дундаж утга, төрөл, тооцоолох арга, эрүүл мэндийн салбарт хэрэглэх

Дундаж утгууд- тоон шинж чанарын хуримтлагдсан ерөнхий шинж чанар. Дундаж үзүүлэлтүүдийн хэрэглээ:

1. Эмнэлгийн байгууллагын ажлын зохион байгуулалтыг тодорхойлж, үйл ажиллагаанд нь үнэлгээ өгөх:

а) эмнэлэгт: эмч нарын ажлын ачаалал, ирж буй дундаж тоо, тухайн нутаг дэвсгэрт оршин суугчдын дундаж тоо;

б) эмнэлэгт: жилд дунджаар ор онгорхой байх өдрийн тоо; эмнэлэгт хэвтэх дундаж хугацаа;

в) эрүүл ахуй, халдвар судлал, нийгмийн эрүүл мэндийн төвд: нэг хүнд ногдох талбайн дундаж хэмжээ (эсвэл куб багтаамж), хоол тэжээлийн дундаж стандарт (уураг, өөх тос, нүүрс ус, витамин, эрдэс давс, калори), ариун цэврийн норм, стандарт гэх мэт;

2. Бие махбодийн хөгжлийг тодорхойлох (антропометрийн үндсэн шинж чанар, морфологи ба функциональ);

3. Эмнэлзүйн болон туршилтын судалгаагаар хэвийн болон эмгэгийн нөхцөлд биеийн эрүүл мэнд, физиологийн үзүүлэлтүүдийг тодорхойлох.

4. Шинжлэх ухааны тусгай судалгаанд.

Дундаж утга ба үзүүлэлтүүдийн ялгаа:

1. Коэффициент нь зөвхөн статистикийн популяцийн тодорхой хэсэгт л тохиолдох, тохиолдож болох, эс тохиолдох альтернатив шинж чанарыг тодорхойлдог.

Дундаж утгууд нь багийн бүх гишүүдэд нийтлэг байдаг шинж чанаруудыг хамардаг, гэхдээ янз бүрийн түвшинд (жин, өндөр, эмнэлэгт хэвтсэн өдрүүд).

2. Чанарын шинж чанарыг хэмжихэд коэффициент ашигладаг. Дундаж утгууд - янз бүрийн тоон шинж чанаруудын хувьд.

Дундаж төрлүүд:

    арифметик дундаж, түүний шинж чанар нь стандарт хазайлт ба дундаж алдаа юм

    горим ба медиан. Загвар (Сар)- тухайн популяцид бусдаас илүү олон удаа тохиолддог шинж чанарын утгатай тохирч байна. Медиан (Би)– тухайн популяцид дундаж утгыг эзэлдэг шинж чанарын утга. Энэ нь ажиглалтын тоогоор цувралыг 2 тэнцүү хэсэгт хуваадаг. Арифметик дундаж (M)- горим ба медианаас ялгаатай нь энэ нь хийсэн бүх ажиглалт дээр үндэслэсэн тул бүх тархалтын чухал шинж чанар юм.

    Тусгай судалгаанд ашигладаг бусад төрлийн дундажууд: язгуур квадрат, куб, гармоник, геометр, прогрессив.

Арифметик дундажстатистикийн хүн амын дундаж түвшинг тодорхойлдог.

Энгийн цувралын хувьд, хаана

∑v – дүнгийн сонголт,

n - ажиглалтын тоо.

жинлэсэн цувралын хувьд, хаана

∑vр – сонголт бүрийн бүтээгдэхүүний нийлбэр ба түүний тохиолдох давтамж

n - ажиглалтын тоо.

Стандарт хазайлтарифметик дундаж буюу сигма (σ) нь шинж чанарын олон янз байдлыг тодорхойлдог

- энгийн эгнээний хувьд

Σd 2 – арифметик дундаж ба сонголт бүрийн ялгааны квадратуудын нийлбэр (d = │M-V│)

n - ажиглалтын тоо

- жинлэсэн эгнээний хувьд

∑d 2 p – арифметик дундаж ба сонголт бүрийн ялгаа ба түүний үүсэх давтамжийн квадратуудын үржвэрийн нийлбэр;

n - ажиглалтын тоо.

Янз бүрийн байдлын түвшинг хэлбэлзлийн коэффициентийн хэмжээгээр шүүж болно
. 20% -иас дээш нь хүчтэй олон янз байдал, 10-20% нь дунд зэргийн олон янз байдал, 10% -иас бага нь сул олон янз байдал юм.

Хэрэв бид арифметик дундаж утгад нэг сигма (M ± 1σ) нэмж хасах юм бол хэвийн тархалттай үед бүх хувилбарын (ажиглалтын) дор хаяж 68.3% нь эдгээр хязгаарт багтах бөгөөд энэ нь судалж буй үзэгдлийн норм гэж тооцогддог. . Хэрэв k 2 ± 2σ бол бүх ажиглалтын 95.5% нь эдгээр хязгаарт, хэрэв k M ± 3σ бол бүх ажиглалтын 99.7% нь эдгээр хязгаарт багтана. Тиймээс стандарт хазайлт нь заасан хил хязгаар дотор байгаа судалж буй шинж чанарын ийм утга үүсэх магадлалыг урьдчилан таамаглах боломжийг олгодог стандарт хазайлт юм.

Арифметик дундажийн дундаж алдааэсвэл төлөөллийн хэв шинж. Энгийн, жигнэсэн цуврал ба мөчүүдийн дүрмийн хувьд:

.

Дундаж утгыг тооцоолохын тулд дараахь зүйлийг хийх шаардлагатай: материалын нэгэн төрлийн байдал, хангалттай тооны ажиглалт. Хэрэв ажиглалтын тоо 30-аас бага бол σ ба m-ийг тооцоолох томъёонд n-1-ийг ашиглана.

Дундаж алдааны хэмжээгээр олж авсан үр дүнг үнэлэхдээ итгэлийн коэффициентийг ашигладаг бөгөөд энэ нь зөв хариултын магадлалыг тодорхойлох боломжийг олгодог, өөрөөр хэлбэл түүврийн алдааны үр дүнд үүссэн утга нь түүврийн алдаанаас ихгүй байхыг харуулж байна. тасралтгүй ажиглалтын үр дүнд гарсан бодит алдаа. Үүний үр дүнд итгэх магадлал нэмэгдэхийн хэрээр итгэлцлийн интервалын өргөн нэмэгдэж, улмаар дүгнэлтэд итгэх итгэл, олж авсан үр дүнг дэмжих чадварыг нэмэгдүүлдэг.

Мөр барьсан тоон үзүүлэлтээр, гэж нэрлэдэг хувьсах.

Түгээлтийн цуврал нь дараахь зүйлсээс бүрдэнэ сонголтууд(шинж чанар) ба давтамжууд(бүлгийн тоо). Харьцангуй утгууд (бутархай, хувь) хэлбэрээр илэрхийлэгдсэн давтамжийг дууддаг давтамжууд. Бүх давтамжийн нийлбэрийг тархалтын цувралын эзэлхүүн гэж нэрлэдэг.

Түгээлтийн цувралуудыг төрлөөр нь хуваана салангид(шинж чанарын тасалдалтай утгууд дээр үндэслэн бүтээгдсэн) ба интервал(шинж чанарын тасралтгүй утгуудад үндэслэн).

Вариацын цувралхоёр багана (эсвэл мөр) илэрхийлнэ; тэдгээрийн нэг нь хувилбар гэж нэрлэгддэг, X-ээр тэмдэглэгдсэн янз бүрийн шинж чанарын хувь хүний ​​утгыг өгдөг; нөгөө хэсэгт - сонголт бүр хэдэн удаа (хэр олон удаа) тохиолдож байгааг харуулсан үнэмлэхүй тоонууд. Хоёрдахь баганад байгаа үзүүлэлтүүдийг давтамж гэж нэрлэдэг ба уламжлалт байдлаар f-ээр тэмдэглэдэг. Хоёрдахь баганад давтамжийн нийт нийлбэрт хувь хүний ​​сонголтуудын давтамжийн эзлэх хувийг тодорхойлдог харьцангуй үзүүлэлтүүдийг ашиглаж болно гэдгийг дахин нэг удаа тэмдэглэе. Эдгээр харьцангуй үзүүлэлтүүдийг давтамж гэж нэрлэдэг бөгөөд уламжлалт байдлаар ω гэж тэмдэглэдэг Энэ тохиолдолд бүх давтамжийн нийлбэр нь нэгтэй тэнцүү байна. Гэсэн хэдий ч давтамжийг хувиар илэрхийлж болох бөгөөд дараа нь бүх давтамжийн нийлбэр нь 100% болно.

Хэрэв вариацын цувааны хувилбаруудыг салангид хэмжигдэхүүн хэлбэрээр илэрхийлдэг бол ийм вариацын цувааг нэрлэнэ. салангид.

Тасралтгүй шинж чанарын хувьд вариацын цувааг дараах байдлаар байгуулна интервал, өөрөөр хэлбэл тэдгээрийн доторх шинж чанарын утгыг "...-ээс ... хүртэл" илэрхийлнэ. Энэ тохиолдолд ийм интервал дахь шинж чанарын хамгийн бага утгыг интервалын доод хязгаар, дээд хязгаарыг дээд хязгаар гэж нэрлэдэг.

Интервал вариацын цувааг бас том мужид хэлбэлздэг салангид шинж чанаруудад зориулан бүтээдэг. Интервал цуврал байж болно тэнцүүТэгээд тэгш бусинтервалтайгаар.

Тэнцүү интервалуудын утгыг хэрхэн тодорхойлохыг авч үзье. Дараах тэмдэглэгээг танилцуулъя.

би- интервалын хэмжээ;

- популяцийн нэгжийн шинж чанарын хамгийн их утга;

- популяцийн нэгжийн шинж чанарын хамгийн бага утга;

n -хуваарилагдсан бүлгүүдийн тоо.

, хэрэв n мэдэгдэж байвал.

Хэрэв тодорхойлогдох бүлгүүдийн тоог урьдчилан тодорхойлоход хэцүү байвал хангалттай тооны хүн амтай интервалын оновчтой хэмжээг тооцоолохын тулд 1926 онд Стержессийн санал болгосон томъёог санал болгож болно.

n = 1+ 3.322 log N, энд N нь агрегат дахь нэгжийн тоо.

Тэгш бус интервалын хэмжээг тухайн тохиолдол бүрт судалгааны объектын шинж чанарыг харгалзан тодорхойлно.

Статистикийн түүврийн тархалтсонголтуудын жагсаалт ба тэдгээрийн холбогдох давтамжийг (эсвэл харьцангуй давтамж) дуудах.

Түүврийн статистик тархалтыг хүснэгт хэлбэрээр зааж өгч болох бөгөөд эхний баганад сонголтууд, хоёрдугаарт - эдгээр сонголтуудад тохирох давтамжууд байрладаг. ни, эсвэл харьцангуй давтамж Пи .

Түүврийн статистикийн тархалт

Интервалын цувралууд нь тэдгээрийн үүсэх үндсэн шинж чанаруудын утгыг тодорхой хязгаарт (интервал) илэрхийлдэг вариацын цувралууд юм. Энэ тохиолдолд давтамж нь атрибутын бие даасан утгыг биш, харин бүхэл бүтэн интервалыг илэрхийлдэг.

Интервалын тархалтын цуваа нь тасралтгүй тоон шинж чанар, түүнчлэн мэдэгдэхүйц хязгаарт өөрчлөгддөг салангид шинж чанарууд дээр суурилдаг.

Интервалын цуваа нь интервалууд болон тэдгээрийн харгалзах давтамжийг харуулсан түүврийн статистик тархалтаар дүрслэгдэж болно. Энэ тохиолдолд энэ интервалд багтах хувилбаруудын давтамжийн нийлбэрийг интервалын давтамж гэж авна.

Тоон тасралтгүй шинж чанараар бүлэглэхдээ интервалын хэмжээг тодорхойлох нь чухал юм.

Түүврийн дундаж ба түүврийн дисперсээс гадна вариацын цувралын бусад шинж чанаруудыг мөн ашигладаг.

ЗагварХамгийн их давтамжтай хувилбарыг дуудна.

Статистикийн тархалтын цуврал- энэ нь хүн амын нэгжийг тодорхой өөр өөр шинж чанарын дагуу бүлэгт хуваарилах явдал юм.
Түгээлтийн цуваа үүсэх үндсэн шинж чанараас хамааран байдаг атрибутив ба вариацын тархалтын цуврал.

Нийтлэг шинж чанар байгаа нь судалгааны объектын ерөнхий шинж чанарыг тодорхойлох эсвэл хэмжих үр дүнг илэрхийлдэг статистикийн популяци үүсэх үндэс суурь болдог.

Статистикийн судалгааны сэдэв нь өөрчлөгдөж буй (өөрчлөгдөж буй) шинж чанар эсвэл статистик шинж чанар юм.

Статистик шинж чанарын төрлүүд.

Түгээлтийн цувралыг атрибутив гэж нэрлэдэгчанарын шалгуурын дагуу барьсан. Атрибутив- энэ бол нэртэй тэмдэг юм (жишээлбэл, мэргэжил: оёдолчин, багш гэх мэт).
Түгээлтийн цувралыг ихэвчлэн хүснэгт хэлбэрээр үзүүлэв. Хүснэгтэнд 2.8-д атрибутын тархалтын цувралыг харуулав.
Хүснэгт 2.8 - ОХУ-ын аль нэг бүс нутгийн иргэдэд хуульчдаас үзүүлж буй хууль зүйн туслалцааны төрлүүдийн хуваарилалт.

Вариацын цуврал- эдгээр нь шинж чанарын утгууд (эсвэл утгын интервал) ба тэдгээрийн давтамж юм.
Вариацын цувралууд нь түгээлтийн цувралууд юм, тоон үзүүлэлтээр баригдсан. Аливаа вариацын цуврал нь сонголт ба давтамж гэсэн хоёр элементээс бүрдэнэ.
Хувилбарууд нь вариацын цувралд авч буй шинж чанарын бие даасан утгууд гэж тооцогддог.
Давтамж нь бие даасан хувилбаруудын тоо эсвэл вариацын цувралын бүлэг тус бүрийн тоо юм. Эдгээр нь түгээлтийн цувралд тодорхой сонголтууд хэр олон удаа тохиолдож байгааг харуулсан тоонууд юм. Бүх давтамжийн нийлбэр нь нийт хүн амын хэмжээ, түүний эзлэхүүнийг тодорхойлдог.
Давтамж гэдэг нь нэгжийн бутархай эсвэл нийт дүнгийн хувиар илэрхийлсэн давтамж юм. Үүний дагуу давтамжийн нийлбэр нь 1 эсвэл 100% -тай тэнцүү байна. Вариацын цуваа нь бодит өгөгдөл дээр үндэслэн хуваарилалтын хуулийн хэлбэрийг тооцоолох боломжийг олгодог.

Зан чанарын өөрчлөлтийн шинж чанараас хамааран байдаг дискрет ба интервалын хэлбэлзлийн цуваа.
Дискрет вариацын цувралын жишээг хүснэгтэд үзүүлэв. 2.9.
Хүснэгт 2.9 - ОХУ-д 1989 онд тусдаа орон сууцанд амьдардаг өрөөнүүдийн тоогоор гэр бүлийн хуваарилалт.

Хүснэгтийн эхний баганад салангид вариацын цувралын сонголтууд, хоёр дахь баганад вариацын цувралын давтамжууд, гурав дахь баганад давтамжийн үзүүлэлтүүд багтсан болно.

Вариацын цуврал

Нийт хүн амд тодорхой тоон шинж чанарыг судалдаг. Үүнээс эзэлхүүний дээжийг санамсаргүй байдлаар гаргаж авдаг n, өөрөөр хэлбэл түүврийн элементүүдийн тоо тэнцүү байна n. Статистик боловсруулалтын эхний шатанд хүрээтэйдээж, жишээ нь. дугаарын захиалга x 1 , x 2 , …, x nӨгсөж байна. Ажиглагдсан утга бүр x iдуудсан сонголт. Давтамж м биүнэ цэнийн ажиглалтын тоо юм x iдээжинд. Харьцангуй давтамж (давтамж) w iдавтамжийн харьцаа юм м бидээжийн хэмжээгээр n: .
Вариацын цувааг судлахдаа хуримтлагдсан давтамж ба хуримтлагдсан давтамж гэсэн ойлголтыг бас ашигладаг. Болъё xзарим тоо. Дараа нь сонголтуудын тоо , тэдний үнэ цэнэ бага байна x, хуримтлагдсан давтамж гэж нэрлэдэг: хувьд x i nхуримтлагдсан давтамж гэж нэрлэдэг w i max.
Хэрэв түүний бие даасан утгууд (хувилбарууд) нь тодорхой хязгаарлагдмал утгаараа (ихэвчлэн бүхэл тоо) өөр хоорондоо ялгаатай бол шинж чанарыг салангид хувьсагч гэж нэрлэдэг. Ийм шинж чанарын вариацын цувааг салангид вариацын цуваа гэж нэрлэдэг.

Хүснэгт 1. Дискрет вариацын давтамжийн цувааны ерөнхий дүр зураг

Онцлог үнэт зүйлсx i x 1 x 2 x n
Давтамжуудм би м 1 м 2 м н

Хэрэв шинж чанар нь бие биенээсээ дур мэдэн бага хэмжээгээр ялгаатай байвал түүнийг тасралтгүй өөрчлөгддөг гэж нэрлэдэг. тэмдэг нь тодорхой интервалд ямар ч утгыг авч болно. Ийм шинж чанарын тасралтгүй вариацын цувааг интервал гэнэ.

Хүснэгт 2. Давтамжийн интервалын вариацын цувааны ерөнхий дүр зураг

Хүснэгт 3. Вариацын цувралын график зургууд

МөрПолигон буюу гистограмЭмпирик тархалтын функц
Дискрет
Интервал
Ажиглалтын үр дүнг хянаж үзээд тодорхой интервал бүрт сонголтуудын хэдэн утга багтаж байгааг тодорхойлно. Интервал бүр нь түүний төгсгөлүүдийн аль нэгэнд хамаарна гэж үздэг: бүх тохиолдолд зүүн (илүү олон удаа) эсвэл бүх тохиолдолд баруун, давтамж эсвэл давтамж нь заасан хил хязгаарт багтсан сонголтуудын тоог заана. Ялгаа a i – a i +1хэсэгчилсэн интервал гэж нэрлэдэг. Дараагийн тооцооллыг хялбарчлахын тулд интервалын өөрчлөлтийн цувааг нөхцөлт дискретээр сольж болно. Энэ тохиолдолд дундаж утга би-интервалыг сонголт болгон авсан x i, ба харгалзах интервалын давтамж м би– энэ интервалын давтамжийн хувьд.
Вариацын цувааг графикаар дүрслэхийн тулд полигон, гистограмм, хуримтлагдсан муруй, эмпирик тархалтын функцийг хамгийн их ашигладаг.

Хүснэгтэнд 2.3 (1994 оны 4-р сард Оросын хүн амыг нэг хүнд ногдох дундаж орлогоор бүлэглэх) танилцуулав. интервалын өөрчлөлтийн цуврал.
График дүрс ашиглан түгээлтийн цувралд дүн шинжилгээ хийх нь тохиромжтой бөгөөд энэ нь тархалтын хэлбэрийг шүүх боломжийг олгодог. Вариацын цувааны давтамжийн өөрчлөлтийн мөн чанарыг харуулсан дүрслэлийг дараах байдлаар үзүүлэв олон өнцөгт ба гистограм.
Дискрет вариацын цувааг дүрслэхдээ олон өнцөгтийг ашигладаг.
Жишээлбэл, орон сууцны төрлөөр орон сууцны хуваарилалтыг графикаар дүрсэлцгээе (Хүснэгт 2.10).
Хүснэгт 2.10 - Хот суурин газрын орон сууцны нөөцийг орон сууцны төрлөөр нь хуваарилах (нөхцөлт тоо).


Цагаан будаа. Орон сууцны хуваарилалтын талбай


Ординатын тэнхлэг дээр зөвхөн давтамжийн утгууд төдийгүй вариацын цувааны давтамжийг зурж болно.
Гистограммыг интервалын өөрчлөлтийн цувааг дүрслэхэд ашигладаг. Гистограммыг бүтээхдээ интервалын утгыг абсцисса тэнхлэг дээр зурж, давтамжийг харгалзах интервал дээр барьсан тэгш өнцөгт хэлбэрээр дүрсэлдэг. Тэнцүү интервалтай тохиолдолд баганын өндөр нь давтамжтай пропорциональ байх ёстой. Гистограмм нь цувралыг бие биетэйгээ зэргэлдээх баар хэлбэрээр дүрсэлсэн график юм.
Хүснэгтэнд өгөгдсөн интервалын тархалтын цувааг графикаар дүрсэлцгээе. 2.11.
Хүснэгт 2.11 - Нэг хүнд ногдох орон сууцны талбайн хэмжээгээр гэр бүлийн хуваарилалт (нөхцөлт тоо).
N p/p Нэг хүнд ногдох амьдрах талбайн хэмжээгээр гэр бүлийн бүлгүүд Өгөгдсөн талбай бүхий гэр бүлийн тоо Гэр бүлийн нийт тоо
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
НИЙТ 115 ----


Цагаан будаа. 2.2. Нэг хүнд ногдох амьдрах талбайн хэмжээгээр гэр бүлийн хуваарилалтын гистограмм


Хуримтлагдсан цувралын өгөгдлийг ашиглан (Хүснэгт 2.11) бид бүтээдэг хуримтлагдсан хуваарилалт.


Цагаан будаа. 2.3. Нэг хүнд ногдох амьдрах талбайн хэмжээгээр гэр бүлийн хуримтлагдсан хуваарилалт


Вариацын цувааг хуримтлал хэлбэрээр дүрслэх нь ялангуяа давтамжийг цувааны давтамжийн нийлбэрийн бутархай эсвэл хувиар илэрхийлдэг вариацын цувралд үр дүнтэй байдаг.
Хэрэв бид вариацын цувааг хуримтлал хэлбэрээр графикаар дүрслэхдээ тэнхлэгүүдийг өөрчилвөл бид олж авна. огив. Зураг дээр. 2.4-т Хүснэгтийн өгөгдлийн үндсэн дээр бүтээгдсэн огивыг харуулав. 2.11.
Тэгш өнцөгтүүдийн талуудын дунд цэгүүдийг олж, дараа нь эдгээр цэгүүдийг шулуун шугамаар холбосноор гистограммыг тархалтын полигон болгон хувиргаж болно. Үүссэн тархалтын полигоныг Зураг дээр үзүүлэв. 2.2 тасархай шугамтай.
Тэгш бус интервалтай вариацын цувааны тархалтын гистограммыг байгуулахдаа ординатын дагуу давтамжийг бус харин харгалзах интервал дахь шинж чанарын тархалтын нягтыг тодорхойлно.
Түгээлтийн нягтрал нь нэгж интервалын өргөнөөр тооцсон давтамж, i.e. интервалын утгын нэгжид бүлэг тус бүрт хэдэн нэгж байна. Тархалтын нягтыг тооцоолох жишээг хүснэгтэд үзүүлэв. 2.12.
Хүснэгт 2.12 - Аж ахуйн нэгжүүдийн ажилчдын тоогоор хуваарилалт (болзолт тоо)
N p/p Аж ахуйн нэгжүүдийн бүлгүүдийг ажилчдын тоо, хүн. Аж ахуйн нэгжийн тоо Интервалын хэмжээ, хүмүүс. Түгээлтийн нягтрал
А 1 2 3=1/2
1 20 хүртэл 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
НИЙТ 147 ---- ----

Мөн вариацын цувааны график дүрслэлд ашиглаж болно хуримтлагдсан муруй. Хуримтлалтыг (нийлбэрийн муруй) ашиглан хэд хэдэн хуримтлагдсан давтамжийг дүрсэлсэн болно. Хуримтлагдсан давтамжийг бүлгүүдийн давтамжийг дараалан нэгтгэх замаар тодорхойлж, популяцийн хэдэн нэгж нь авч үзэж буй утгаас ихгүй шинж чанартай болохыг харуулдаг.


Цагаан будаа. 2.4. Нэг хүнд ногдох орон сууцны талбайн хэмжээгээр гэр бүлийн хуваарилалт

Интервалын вариацын цувааны хуримтлалыг бүтээхдээ абсцисса тэнхлэгийн дагуу цувааны хувилбаруудыг, ордны тэнхлэгийн дагуу хуримтлагдсан давтамжийг зурна.



Танд нийтлэл таалагдсан уу? Найзуудтайгаа хуваалцаарай!