Вариацын цувралыг хэрхэн бүтээх вэ. Статистикийн хураангуй ба бүлэглэл

Лабораторийн ажил No1. Статистикийн мэдээллийн анхан шатны боловсруулалт

Түгээх цувралын бүтээн байгуулалт

Популяцийн нэгжийг аль нэг шинж чанарын дагуу бүлэгт хуваахыг нэрлэдэг түгээлтийн ойролцоо . Энэ тохиолдолд шинж чанар нь тоон шинж чанартай байж болно, дараа нь цувралыг дуудна хувьсах , болон чанарын, дараа нь цуврал гэж нэрлэдэг атрибут . Жишээлбэл, хотын хүн амыг насны бүлгээр нь янз бүрийн цувралаар эсвэл мэргэжлийн харьяаллаар нь ялгаж салгаж болно (мэдээжийн хэрэг, тархалтын цувралыг бий болгоход илүү олон чанарын болон тоон шинж чанаруудыг санал болгож болно; шинж чанарыг статистик судалгааны даалгавраар тодорхойлдог).

Аливаа түгээлтийн цуврал нь хоёр элементээр тодорхойлогддог.

- сонголт(x i) - эдгээр нь түүвэр популяцийн нэгжийн шинж чанарын бие даасан утгууд юм. Вариацын цувралын хувьд сонголт нь тоон утгыг, аттрибутив цувралын хувьд - чанарын (жишээлбэл, x = "төрийн албан хаагч");

- давтамж(n би) – тодорхой шинж чанарын утга хэдэн удаа тохиолдож байгааг харуулсан тоо. Хэрэв давтамжийг харьцангуй тоогоор илэрхийлсэн бол (өөрөөр хэлбэл популяцийн нийт эзлэхүүн дэх сонголтуудын өгөгдсөн утгатай тохирох популяцийн элементүүдийн эзлэх хувь) үүнийг нэрлэдэг. харьцангуй давтамжэсвэл давтамж.

Хувилбарын цуврал нь дараахь байж болно.

- салангид, судалж буй шинж чанар нь тодорхой тоогоор (ихэвчлэн бүхэл тоо) тодорхойлогддог бол.

- интервал, "-ээс" болон "хүртэл" хил хязгаарыг тасралтгүй өөрчлөгддөг шинж чанарын хувьд тодорхойлсон үед. Хэрэв салангид хэлбэлзэлтэй шинж чанарын утгуудын багц их байвал интервалын цувралыг байгуулна.

Интервалын цувааг ижил урттай (тэнцүү интервалын цуваа) ба тэгш бус интервалтай хоёуланг нь байгуулж болно, хэрэв энэ нь статистик судалгааны нөхцлөөр тодорхойлогдвол. Жишээлбэл, дараахь интервалтай хүн амын орлогын хуваарилалтыг авч үзэж болно.<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



Энд k нь интервалын тоо, n нь түүврийн хэмжээ. (Мэдээжийн хэрэг, томъёо нь ихэвчлэн бутархай тоог өгдөг бөгөөд үр дүнд нь хамгийн ойр бүхэл тоог интервалын тоогоор сонгоно.) Энэ тохиолдолд интервалын уртыг томъёогоор тодорхойлно.

.

Графикийн хувьд вариацын цувааг хэлбэрээр үзүүлж болно гистограмууд(Интервалын цувааны интервал бүрийн дээр энэ интервал дахь давтамжтай тохирох өндрийн "багана" баригдсан) түгээлтийн полигон(цэгүүдийг холбосон тасархай шугам ( x i;n i) эсвэл хуримтлагддаг(хуримтлагдсан давтамж дээр үндэслэн бүтээгдсэн, өөрөөр хэлбэл шинж чанарын утга тус бүрийн хувьд өгөгдсөн хэмжээнээс бага шинж чанарын утгатай объектын багцад тохиолдох давтамжийг авна).

Excel дээр ажиллахдаа вариацын цуваа үүсгэхийн тулд дараах функцуудыг ашиглаж болно.

ШАЛГАХ( өгөгдлийн массив) – түүврийн хэмжээг тодорхойлох. Аргумент нь түүврийн өгөгдөл байрлах нүднүүдийн муж юм.

COUNTIF( хүрээ; шалгуур) – шинж чанар эсвэл вариацын цуваа бүтээхэд ашиглаж болно. Аргументууд нь атрибутын түүврийн утгуудын массив ба шалгуур үзүүлэлт - атрибутын тоон эсвэл текстийн утга эсвэл түүний байрлах нүдний тоо юм. Үр дүн нь дээжинд тухайн утгын тохиолдох давтамж юм.

ДАВТАТ( өгөгдлийн массив; интервалын массив) – вариацын цуваа бүтээхэд зориулагдсан. Аргументууд нь түүвэр өгөгдлийн массивын муж ба интервалын багана юм. Хэрэв та салангид цуврал үүсгэх шаардлагатай бол интервалын цуврал бол сонголтуудын утгыг энд зааж өгсөн болно (тэдгээрийг мөн "халаас" гэж нэрлэдэг). Үр дүн нь давтамжийн багана тул та CTRL+SHIFT+ENTER товчийг дарж функцийн оруулгыг дуусгах ёстой. Функцийг нэвтрүүлэхдээ интервалын массивыг зааж өгөхдөө хамгийн сүүлийн утгыг зааж өгөх шаардлагагүй гэдгийг анхаарна уу - өмнөх "халаасанд" ороогүй бүх утгыг харгалзах "халаасанд" байрлуулах болно. Энэ нь заримдаа хамгийн том дээжийн утгыг сүүлчийн халаасанд автоматаар оруулахгүй байх алдаанаас зайлсхийхэд тусалдаг.

Нэмж дурдахад, нарийн төвөгтэй бүлэглэлийн хувьд (хэд хэдэн шинж чанарт үндэслэн) "пивот хүснэгт" хэрэгслийг ашиглана уу. Тэдгээрийг мөн шинж чанар, өөрчлөлтийн цувралыг бүтээхэд ашиглаж болох боловч энэ нь даалгаврыг шаардлагагүйгээр хүндрүүлдэг. Мөн вариацын цуврал болон гистограм бүтээхийн тулд "Шинжилгээний багц" нэмэлтээс "гистограм" процедур байдаг (Excel дээр нэмэлтүүдийг ашиглахын тулд эхлээд тэдгээрийг татаж авах шаардлагатай; тэдгээрийг анхдагчаар суулгаагүй)

Анхдагч өгөгдөл боловсруулах үйл явцыг дараах жишээн дээр харуулъя.

Жишээ 1.1. 60 айлын тоон бүрэлдэхүүний тухай мэдээлэл бий.

Вариацын цуваа ба тархалтын олон өнцөгтийг байгуул

Шийдэл.

Excel хүснэгтүүдийг нээцгээе. Өгөгдлийн массивыг A1:L5 мужид оруулъя. Хэрэв та баримт бичгийг цахим хэлбэрээр (жишээ нь Word форматаар) судалж байгаа бол үүнийг хийхийн тулд өгөгдөл бүхий хүснэгтийг сонгоод санах ойд хуулж, A1 нүдийг сонгоод өгөгдлийг буулгана уу - тэдгээр нь автоматаар эзэлнэ. тохирох хүрээ. Түүврийн хэмжээг n - түүврийн өгөгдлийн тоог тооцоолъё, B7 нүдэнд =COUNT(A1:L5) томъёог оруулна уу; Хүссэн мужийг томьёо руу оруулахын тулд гарнаас түүний тэмдэглэгээг оруулах шаардлагагүй гэдгийг анхаарна уу. B8 нүдэнд =MIN(A1:L5), В9 нүдэнд: =MAX(A1:L5) томъёог оруулан түүврийн хамгийн бага ба хамгийн их утгыг тодорхойлъё.

Зураг.1.1 Жишээ 1. Excel хүснэгт дэх статистик мэдээллийг анхан шатны боловсруулалт

Дараа нь бид интервалын багана (хувилбарын утга) болон давтамжийн баганын нэрийг оруулан вариацын цуваа байгуулах хүснэгтийг бэлтгэнэ. Интервалын баганад B12: B17 мужийг эзэлдэг хамгийн бага (1) -ээс хамгийн их (6) хүртэлх шинж чанарын утгыг оруулна уу. Давтамжийн баганыг сонгоод =FREQUENCY(A1:L5,B12:B17) томъёог оруулаад CTRL+SHIFT+ENTER товчлуурын хослолыг дарна уу.

Зураг 1.2 Жишээ 1. Вариацын цуваа байгуулах

Хянахын тулд SUM функцийг ашиглан давтамжийн нийлбэрийг тооцоолъё ("Нүүр хуудас" таб дээрх "Засварлах" бүлгийн S функцийн дүрс), тооцоолсон нийлбэр нь B7 нүдэн дэх урьд нь тооцоолсон түүврийн эзэлхүүнтэй давхцах ёстой.

Одоо олон өнцөгт байгуулъя: үүссэн давтамжийн мужийг сонгоод "Оруулах" таб дээрх "График" командыг сонгоно уу. Анхдагч байдлаар, хэвтээ тэнхлэг дээрх утгууд нь дарааллын тоо байх болно - манай тохиолдолд 1-ээс 6 хүртэлх тоонууд нь сонголтуудын утгатай (тарифын ангиллын тоо) давхцдаг.

"Цуврал 1" диаграммын нэрийг "Дизайн" табын ижил "өгөгдөл сонгох" сонголтыг ашиглан өөрчлөх эсвэл зүгээр л устгаж болно.

Зураг.1.3. Жишээ 1. Давтамжийн олон өнцөгт байгуулах

Жишээ 1.2. 50 эх үүсвэрээс бохирдуулагч бодисын ялгарлын талаарх мэдээлэл байна.

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Тэнцүү интервалтай цуврал зохиож, гистограмм байгуул

Шийдэл

Өгөгдлийн массивыг Excel хуудсанд оруулъя, энэ нь A1: J5 мужийг эзэлнэ. Өмнөх даалгаврын адил бид түүврийн хэмжээ n, түүврийн хамгийн бага ба хамгийн их утгыг тодорхойлно. Одоо бидэнд салангид цуваа биш, харин интервалын цуваа хэрэгтэй бөгөөд асуудлын интервалын тоог заагаагүй тул Sturgess томъёог ашиглан k интервалын тоог тооцоолно. Үүнийг хийхийн тулд B10 нүдэнд =1+3.322*LOG10(B7) томъёог оруулна.

Зураг 1.4. Жишээ 2. Тэнцүү интервалтай цуваа байгуулах

Үр дүнгийн утга нь бүхэл тоо биш, ойролцоогоор 6.64 байна. k=7 байхад интервалуудын урт нь бүхэл тоогоор илэрхийлэгдэх тул (k=6-аас ялгаатай) энэ утгыг C10 нүдэнд оруулан k=7 гэж сонгоно. Бид B11 нүдний d интервалын уртыг =(B9-B8)/C10 томьёог оруулан тооцоолно.

7 интервал тус бүрийн дээд хязгаарыг зааж интервалын массивыг тодорхойлъё. Үүнийг хийхийн тулд E8 нүдэнд =B8+B11 томъёог оруулан эхний интервалын дээд хязгаарыг тооцоолно; E9 нүдэнд хоёр дахь интервалын дээд хязгаарыг =E8+B11 томьёогоор оруулна. Интервалуудын дээд хилийн үлдсэн утгыг тооцоолохын тулд бид оруулсан томьёоны B11 нүдний тоог $ тэмдгээр засч, E9 нүдэнд томьёо =E8+B$11 хэлбэрийг авч, хуулж авна. E9 эсийн агуулгыг E10-E14 нүд рүү оруулна. Хамгийн сүүлд олж авсан утга нь B9 нүдэнд өмнө нь тооцоолсон түүврийн хамгийн их утгатай тэнцүү байна.

Зураг.1.5. Жишээ 2. Тэнцүү интервалтай цуваа байгуулах


Одоо жишээ 1 дээр хийсэн шиг FREQUENCY функцийг ашиглан "халаасны" массивыг дүүргэцгээе.

Зураг.1.6. Жишээ 2. Тэнцүү интервалтай цуваа байгуулах

Үүссэн вариацын цувралыг ашиглан бид гистограммыг байгуулна: давтамжийн баганыг сонгоод "Оруулах" таб дээрээс "Гистограмм" -ыг сонгоно уу. Гистограммыг хүлээн авсны дараа хэвтээ тэнхлэгийн шошгыг интервалын хүрээнд өөрчилье, "Дизайнер" табын "Өгөгдөл сонгох" сонголтыг сонгоно уу. Гарч ирсэн цонхон дээр "Хэвтээ тэнхлэгийн шошго" хэсэгт "Өөрчлөх" командыг сонгоод хулганаар сонгон сонголтуудын утгын мужийг оруулна уу.

Зураг 1.7. Жишээ 2. Гистограмм байгуулах

Зураг 1.8. Жишээ 2. Гистограмм байгуулах

Салангид шинж чанаруудын хувьд салангид вариацын цувралыг бүтээдэг.

Дискрет вариацын цувралыг бий болгохын тулд та дараах алхмуудыг хийх хэрэгтэй: 1) ажиглалтын нэгжийг шинж чанарын судлагдсан утгыг нэмэгдүүлэх дарааллаар байрлуулах;

2) x i шинж чанарын бүх боломжит утгыг тодорхойлж, тэдгээрийг өсөх дарааллаар байрлуулна.

шинж чанарын үнэ цэнэ, би .

шинж чанарын утгын давтамж болон тэмдэглэнэ е би . Цувралын бүх давтамжийн нийлбэр нь судалж буй популяцийн элементийн тоотой тэнцүү байна.

Жишээ 1 .

Шалгалтанд оюутнуудын авсан дүнгийн жагсаалт: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

Энд тоо байна X - зэрэгнь салангид санамсаргүй хэмжигдэхүүн бөгөөд тооцооллын үр дүнгийн жагсаалт ньстатистик (ажиглах боломжтой) өгөгдөл .

    ажиглалтын нэгжийг судлагдсан шинж чанарын утгын өсөх дарааллаар байрлуулна.

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) x i шинж чанарын бүх боломжит утгыг тодорхойлж, өсөх дарааллаар эрэмбэл:

Энэ жишээнд бүх тооцоог дараах утгуудаар дөрвөн бүлэгт хувааж болно: 2; 3; 4; 5.

Ажиглагдсан өгөгдлийн тодорхой бүлэгт тохирох санамсаргүй хэмжигдэхүүний утгыг нэрлэдэг шинж чанарын үнэ цэнэ, сонголт (сонголт) ба x гэж тэмдэглэнэ би .

Олон тооны ажиглалтад шинж чанарын харгалзах утга хэдэн удаа тохиолдож байгааг харуулсан тоог нэрлэнэ шинж чанарын утгын давтамж болон тэмдэглэнэ е би .

Бидний жишээн дээр

оноо 2 тохиолддог - 8 удаа,

оноо 3 тохиолддог - 12 удаа,

оноо 4 тохиолддог - 23 удаа,

оноо 5 тохиолддог - 17 удаа.

Нийтдээ 60 үнэлгээтэй.

4) хүлээн авсан өгөгдлийг хоёр мөр (багана) хүснэгтэд бичнэ үү - x i ба f i.

Эдгээр өгөгдөл дээр үндэслэн салангид вариацын цуваа үүсгэх боломжтой

Дискрет вариацын цуврал - энэ нь судалж буй шинж чанарын гарч буй утгуудыг өсөх дарааллаар тус тусын утгууд болон тэдгээрийн давтамжийг харуулсан хүснэгт юм.

  1. Интервалын вариацын цуваа байгуулах

Дискрет вариацын цувралаас гадна интервалын хэлбэлзлийн цуваа гэх мэт өгөгдлийг бүлэглэх арга ихэвчлэн тааралддаг.

Дараах тохиолдолд интервалын цувралыг байгуулна.

    тэмдэг нь байнгын өөрчлөлтийн шинж чанартай байдаг;

    Маш олон салангид утгууд байсан (10-аас дээш)

    салангид утгын давтамж нь маш бага (харьцангуй олон тооны ажиглалтын нэгжээр 1-3-аас хэтрэхгүй);

    ижил давтамжтай шинж чанарын олон салангид утгууд.

Интервалын хэлбэлзлийн цуврал нь өгөгдлийг хоёр баганатай хүснэгт хэлбэрээр бүлэглэх арга юм (шинж чанарын утгууд нь утгын интервал ба интервал бүрийн давтамж хэлбэрээр).

Дискрет цувралаас ялгаатай нь интервалын цувралын шинж чанарын утгыг бие даасан утгуудаар биш харин утгын интервалаар ("ээс - хүртэл") төлөөлдөг.

Сонгосон интервал бүрт хэдэн ажиглалтын нэгж унасныг харуулсан тоог дуудна шинж чанарын утгын давтамж болон тэмдэглэнэ е би . Цувралын бүх давтамжийн нийлбэр нь судалж буй популяцийн элементийн тоо (ажиглалтын нэгж)-тэй тэнцүү байна.

Хэрэв нэгж нь интервалын дээд хязгаартай тэнцэх шинж чанартай байвал дараагийн интервалд онооно.

Жишээлбэл, 100 см өндөртэй хүүхэд эхнийх нь биш харин 2-р завсарт унах болно; мөн 130 см өндөртэй хүүхэд гурав дахь нь биш харин сүүлчийн интервалд унах болно.

Эдгээр өгөгдөл дээр үндэслэн интервалын вариацын цувралыг байгуулж болно.

Интервал бүр доод хязгаар (xn), дээд хязгаар (xw) ба интервалын өргөнтэй ( би).

Интервалын хил гэдэг нь хоёр интервалын хил дээр байрлах атрибутын утга юм.

хүүхдийн өндөр (см)

хүүхдийн өндөр (см)

хүүхдийн тоо

130 гаруй

Хэрэв интервал нь дээд ба доод хилтэй бол түүнийг дуудна хаалттай интервал. Хэрэв интервал нь зөвхөн доод эсвэл зөвхөн дээд хилтэй бол энэ нь - нээлттэй интервал.Зөвхөн эхний эсвэл хамгийн сүүлчийн интервал нээлттэй байж болно. Дээрх жишээнд сүүлийн интервал нээлттэй байна.

Интервалын өргөн (би) - дээд ба доод хязгаарын ялгаа.

би = x n - x in

Нээлттэй интервалын өргөн нь зэргэлдээх хаалттай интервалын өргөнтэй ижил байна гэж үзнэ.

хүүхдийн өндөр (см)

хүүхдийн тоо

Интервалын өргөн (i)

тооцооны хувьд 130+20=150

20 (зэргэлдээх хаалттай интервалын өргөн нь 20 учраас)

Бүх интервалын цувааг тэнцүү интервалтай интервалын цуваа, тэгш бус интервалтай интервал цувралд хуваана . Тэнцүү интервалтай зайтай эгнээнд бүх интервалын өргөн ижил байна. Тэгш бус интервалтай интервалын цувралд интервалын өргөн өөр байна.

Харж буй жишээнд - тэгш бус интервалтай интервалын цуваа.

Нөхцөл:

Ажилчдын насны бүтцийн талаархи мэдээлэл (жил): 18, 38, 28, 29, 26, 38, 34, 22, 28, 30, 22, 23, 35, 33, 27, 24, 30, 32, 28 , 25, 29, 26, 31, 24, 29, 27, 32, 25, 29, 29.

    1. Интервалын тархалтын цувралыг байгуул.
    2. Цувралын график дүрслэлийг бүтээх.
    3. Мод ба медианыг графикаар тодорхойлно.

Шийдэл:

1) Стергессийн томъёоны дагуу хүн амыг 1 + 3.322 lg 30 = 6 бүлэгт хуваах ёстой.

Хамгийн дээд нас - 38, доод тал нь - 18.

Интервалын өргөн Интервалуудын төгсгөлүүд бүхэл тоо байх ёстой тул бид хүн амыг 5 бүлэгт хуваана. Интервалын өргөн - 4.

Тооцооллыг хөнгөвчлөхийн тулд бид өгөгдлийг өсөх дарааллаар байрлуулна: 18, 22, 22, 23, 24, 24, 25, 25, 26, 26, 27, 27, 28, 28, 28, 29, 29, 29, 29, 29, 30, 30, 31, 32, 32, 33, 34, 35, 38, 38.

Ажилчдын насны хуваарилалт

Графикийн хувьд цувралыг гистограм эсвэл олон өнцөгт хэлбэрээр дүрсэлж болно. Гистограм - баганан график. Баганын суурь нь интервалын өргөн юм. Баганын өндөр нь давтамжтай тэнцүү байна.

Полигон (эсвэл түгээлтийн полигон) - давтамжийн график. Үүнийг гистограмм ашиглан бүтээхийн тулд бид тэгш өнцөгтүүдийн дээд талуудын дунд цэгүүдийг холбоно. Бид Окс тэнхлэг дээрх олон өнцөгтийг туйлын x утгуудын интервалын хагастай тэнцүү зайд хаадаг.

Горим (Mo) нь тухайн хүн амд хамгийн их тохиолддог, судалж буй шинж чанарын утга юм.

Гистограмаас горимыг тодорхойлохын тулд та хамгийн өндөр тэгш өнцөгтийг сонгох хэрэгтэй бөгөөд энэ тэгш өнцөгтийн баруун оройноос өмнөх тэгш өнцөгтийн баруун дээд булан хүртэл шугам татах ба модаль тэгш өнцөгтийн зүүн оройноос зураас зурах хэрэгтэй. дараагийн тэгш өнцөгтийн зүүн орой. Эдгээр шугамын огтлолцолоос х тэнхлэгт перпендикуляр зур. Абсцисса нь загварлаг байх болно. Mo ≈ 27.5. Энэ хүн амын дунд хамгийн түгээмэл нас нь 27-28 насныхан гэсэн үг.

Медиан (Me) нь эрэмбэлэгдсэн вариацын цувааны дунд байгаа судлагдсан шинж чанарын утга юм.

Бид хуримтлалыг ашиглан медианыг олдог. Хуримтлал - хуримтлагдсан давтамжийн график. Abscissa нь цувралын хувилбарууд юм. Ординатууд нь хуримтлагдсан давтамж юм.

Хуримтлагдсан дээрх медианыг тодорхойлохын тулд ординатын тэнхлэгийн дагуу хуримтлагдсан давтамжийн 50% -д (бидний тохиолдолд 15) тохирох цэгийг олж, түүгээр шулуун шугамыг Ox тэнхлэгтэй параллель, цэгээс зурна. түүний хуримтлалтай огтлолцол х тэнхлэгт перпендикуляр зурна. Abscissa нь медиан юм. Би ≈ 25.9. Энэ хүн амын ажилчдын тал хувь нь 26-аас доош насныхан байна гэсэн үг.

2. Түгээлтийн цувралын тухай ойлголт. Дискрет ба интервалын тархалтын цуваа

Түгээлтийн эгнээшинж чанар, шинж чанарын бүлэг, шинж чанарын ангилал тус бүрийн хувьд бүлгийн нэгжийн тоо эсвэл нийт дэх энэ тооны эзлэх хувь нь тодорхойлогддог тусгай төрлийн бүлэг гэж нэрлэгддэг. Тэдгээр. түгээлтийн цуврал– харгалзах жингийн хамт өсөх эсвэл буурах дарааллаар байрлуулсан шинж чанарын утгуудын эрэмбэлэгдсэн багц. Тархалтын цувааг тоон болон шинж чанарын аль алинаар нь байгуулж болно.

Тоон үзүүлэлтээр бүтээгдсэн тархалтын цувааг вариацын цуваа гэж нэрлэдэг. Тэд тохиолддог дискрет ба интервал. Түгээлтийн цувралыг тасралтгүй өөрчлөгддөг шинж чанар (шинж чанар нь дурын интервалд ямар ч утгыг авч болох үед) болон салангид хэлбэлзэлтэй шинж чанар (хатуу тодорхойлсон бүхэл утгыг авдаг) дээр үндэслэн байгуулж болно.

ДискретТүгээлтийн вариацын цуврал нь тэдгээрийн харгалзах давтамж эсвэл дэлгэрэнгүй мэдээлэл бүхий сонголтуудын эрэмблэгдсэн багц юм. Дискрет цувралын хувилбарууд нь шинж чанарын утгууд нь салангид тасралтгүй өөрчлөгддөг бөгөөд энэ нь ихэвчлэн тооллогын үр дүн юм.

Дискрет

Хэрэв судалж буй шинж чанарын утгууд нь тодорхой хязгаарлагдмал хэмжээнээс багагүй ялгаатай байвал вариацын цувралыг ихэвчлэн байгуулдаг. Дискрет цувралд шинж чанарын цэгийн утгыг зааж өгсөн болно. Жишээ : Дэлгүүрүүдээр сард худалдаалагдаж буй эрэгтэй костюмыг размераар нь хуваах.

Интервал

Вариацын цуваа гэдэг нь санамсаргүй хэмжигдэхүүний утгыг өөрчлөх интервалуудын эмх цэгцтэй багц бөгөөд тэдгээр нь тус бүрт хамаарах хувьсагчийн утгын давтамж эсвэл давтамж юм. Интервал цувралууд нь байнга өөрчлөгдөж байдаг шинж чанарын тархалтыг шинжлэхэд зориулагдсан бөгөөд түүний утгыг ихэвчлэн хэмжилт эсвэл жинлэх замаар бүртгэдэг. Ийм цувралын хувилбарууд нь бүлэглэлүүд юм.

Жишээ : Хүнсний дэлгүүрийн худалдан авалтыг дүнгээр нь хуваарилах.

Хэрэв салангид вариацын цувралд давтамжийн хариу үйлдэл нь цувралын хувилбартай шууд хамааралтай бол интервалын цувралд энэ нь бүлэг хувилбаруудыг хэлнэ.

Тархалтын цувааг график дүрслэлээр нь шинжлэх нь тохиромжтой бөгөөд энэ нь тархалтын хэлбэр, хэв маягийг шүүх боломжийг олгодог. Дискрет цувралыг график дээр тасархай шугамаар дүрсэлсэн - түгээлтийн полигон. Үүнийг байгуулахын тулд тэгш өнцөгт координатын системд янз бүрийн шинж чанарын эрэмбэлсэн (захиалсан) утгуудыг абсцисса тэнхлэгийн дагуу ижил масштабаар, давтамжийг илэрхийлэх хуваарийг ординатын тэнхлэгийн дагуу зурна.

Интервалын цувааг дараах байдлаар дүрсэлсэн тархалтын гистограм(өөрөөр хэлбэл баганан график).

Гистограммыг бүтээхдээ интервалын утгыг абсцисса тэнхлэг дээр зурж, давтамжийг харгалзах интервал дээр барьсан тэгш өнцөгт хэлбэрээр дүрсэлдэг. Тэнцүү интервалтай тохиолдолд баганын өндөр нь давтамжтай пропорциональ байх ёстой.

Аливаа гистограммыг түгээлтийн олон өнцөгт болгон хувиргах боломжтой бөгөөд үүнийг хийхийн тулд тэгш өнцөгтүүдийн оройг шулуун сегментүүдээр холбох шаардлагатай.

2. Үйлдвэрлэлийн хэмжээ өөрчлөгдөхөд дундаж гарц болон дундаж ажилтны тоо нөлөөллийг шинжлэх индексийн арга

Индекс аргадинамик байдалд дүн шинжилгээ хийх, ерөнхий үзүүлэлтүүдийг харьцуулах, түүнчлэн эдгээр үзүүлэлтүүдийн түвшний өөрчлөлтөд нөлөөлж буй хүчин зүйлсийг ашиглана. Индексийг ашиглан үйлдвэрлэлийн хэмжээ өөрчлөгдөхөд дундаж гарц, дундаж ажилтны тоо нөлөөллийг тодорхойлох боломжтой. Энэ асуудлыг аналитик индексийн системийг бий болгох замаар шийддэг.

Үйлдвэрлэлийн биетийн индекс нь ажилчдын дундаж тоотой, үйлдвэрлэлийн хэмжээ (Q) нь үйлдвэрлэлийн хэмжээтэй (Q) хамааралтай байдагтай адил үйлдвэрлэлийн дундаж индекс ( w)болон тоонууд ( r) .

Үйлдвэрлэлийн хэмжээ нь дундаж бүтээгдэхүүн ба дундаж хүн амын тоотой тэнцүү байна гэж бид дүгнэж болно.

Q = w r,Энд Q нь үйлдвэрлэлийн хэмжээ,

w - дундаж гаралт,

r – ажилчдын дундаж тоо.

Таны харж байгаагаар бид статик дахь үзэгдлийн харилцааны тухай ярьж байна: хоёр хүчин зүйлийн үржвэр нь үүссэн үзэгдлийн нийт хэмжээг өгдөг. Энэ холболт нь функциональ байх нь ойлгомжтой тул энэ холболтын динамикийг индекс ашиглан судалдаг. Өгөгдсөн жишээний хувьд энэ нь дараах систем юм.

Jw × Jr = Jwr.

Жишээлбэл, үйлдвэрлэлийн хэмжээний индекс Jwr нь бүтээмжтэй үзэгдлийн индекс болох үйлдвэрлэлийн дундаж индекс (Jw) ба боловсон хүчний дундаж индекс (Jr) гэсэн хоёр хүчин зүйлийн индекс болгон задалж болно.

Index Index Index

дундаж цалингийн хэмжээ

үйлдвэрлэлийн гарцын тоо

Хаана Ж w- Ласпейресийн томъёогоор тооцсон хөдөлмөрийн бүтээмжийн индекс;

Ж р- Пааше томъёогоор тооцоолсон ажилчдын тооны индекс.

Гүйцэтгэлийн үзүүлэлтийн түвшинг бүрдүүлэхэд хувь хүний ​​хүчин зүйлсийн нөлөөллийг тодорхойлохын тулд индексийн системийг ашигладаг бөгөөд тэдгээр нь мэдэгдэж буй 2 индексийн утгуудаас үл мэдэгдэх утгыг тодорхойлох боломжийг олгодог.

Дээр дурдсан индексийн системд үндэслэн хүчин зүйлийн нөлөөнд хуваагдсан үйлдвэрлэлийн хэмжээн дэх үнэмлэхүй өсөлтийг олж болно.

1. Үйлдвэрлэлийн хэмжээг ерөнхийд нь нэмэгдүүлэх:

∆wr = ∑w 1 r 1 - ∑w 0 r 0 .

2. Дундаж гаралтын үзүүлэлтийн үйлчлэлээр өсөх:

∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

3. Ажилтны дундаж үзүүлэлтийн нөлөөгөөр өсөх:

∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

∆wr = ∆wr/w + ∆wr/r.

Жишээ.Дараахь өгөгдөл мэдэгдэж байна

Үйлдвэрлэлийн хэмжээ харьцангуй ба үнэмлэхүй утгаараа хэрхэн өөрчлөгдсөн, хувь хүний ​​хүчин зүйлүүд энэ өөрчлөлтөд хэрхэн нөлөөлснийг бид тодорхойлж чадна.

Үйлдвэрлэлийн хэмжээ нь:

үндсэн хугацаанд

w 0 * r 0 = 2000 * 90 = 180000,

болон тайланд

w 1 * r 1 = 2100 * 100 = 210000.

Улмаар үйлдвэрлэлийн хэмжээ 30 мянгаар буюу 1.16%-иар өссөн байна.

∆wr=∑w 1 r 1 -∑w 0 r 0= (210000-180000)=30000

эсвэл (210000:180000)*100%=1.16%.

Үйлдвэрлэлийн хэмжээ дараахь өөрчлөлтөөс шалтгаална.

1) дундаж ажилтны тоо 10 хүнээр буюу 111.1%-иар өссөн

r 1 / r 0 = 100 / 90 = 1.11 буюу 111.1%.

Үнэмлэхүй утгаараа энэ хүчин зүйлээс шалтгаалан үйлдвэрлэлийн хэмжээ 20,000-аар нэмэгджээ.

w 0 r 1 – w 0 r 0 = w 0 (r 1 -r 0) = 2000 (100-90) = 20000.

2) дундаж гарцыг 105% буюу 10,000-аар нэмэгдүүлэх:

w 1 r 1 /w 0 r 1 = 2100*100/2000*100 = 1.05 буюу 105%.

Үнэмлэхүй утгаараа өсөлт нь:

w 1 r 1 – w 0 r 1 = (w 1 -w 0)r 1 = (2100-2000)*100 = 10000.

Тиймээс хүчин зүйлсийн нийлмэл нөлөөлөл нь:

1. Үнэмлэхүй утгаараа

10000 + 20000 = 30000

2. Харьцангуй утгаараа

1,11 * 1,05 = 1,16 (116%)

Тиймээс өсөлт нь 1.16% байна. Хоёр үр дүнг өмнө нь авсан.

Орчуулгын "индекс" гэдэг үг нь заагч, заагч гэсэн утгатай. Статистикийн хувьд индексийг аливаа үзэгдлийн өөрчлөлтийг цаг хугацаа, орон зайд эсвэл төлөвлөгөөтэй харьцуулах харьцангуй үзүүлэлт гэж тайлбарладаг. Индекс нь харьцангуй утга учир индексүүдийн нэр нь харьцангуй утгуудын нэртэй нийцдэг.

Цаг хугацааны явцад харьцуулсан бүтээгдэхүүний өөрчлөлтөд дүн шинжилгээ хийх тохиолдолд индексийн бүрэлдэхүүн хэсгүүд (үнэ, биет хэмжээ, үйлдвэрлэлийн бүтэц, бие даасан бүтээгдэхүүний борлуулалт) янз бүрийн нөхцөлд (янз бүрийн чиглэлээр) хэрхэн өөрчлөгдөх тухай асуулт гарч ирж болно. ). Үүнтэй холбогдуулан байнгын найрлага, хувьсах найрлага, бүтцийн өөрчлөлтийн индексүүдийг байгуулдаг.

Байнгын (тогтмол) бүрэлдэхүүний индекс -Энэ нь хүн амын ижил тогтсон бүтцийн дундаж утгын динамикийг тодорхойлдог индекс юм.

Тогтмол найрлагатай индексийг байгуулах зарчим нь жингийн бүтцийн өөрчлөлтийн индексжүүлсэн үзүүлэлтийн жигнэсэн дундаж түвшинг ижил жингээр тооцох замаар индексжүүлсэн утгад үзүүлэх нөлөөллийг арилгахад оршино.

Тогтмол найрлагын индекс нь нэгтгэсэн индекстэй ижил хэлбэртэй байна. Агрегат хэлбэр нь хамгийн түгээмэл байдаг.

Тогтмол найрлагын индексийг нэг үеийн түвшинд тогтоосон жингээр тооцдог бөгөөд зөвхөн индексжүүлсэн утгын өөрчлөлтийг харуулдаг. Тогтмол найрлагын индекс нь ижил жинтэй индексжүүлсэн үзүүлэлтийн жигнэсэн дундаж түвшинг тооцоолох замаар жингийн бүтцийн өөрчлөлтийн индексжүүлсэн утгад үзүүлэх нөлөөллийг арилгадаг. Тогтмол найрлагын индексүүд нь үзэгдлийн тогтмол бүтцэд үндэслэн тооцсон үзүүлэлтүүдийг харьцуулдаг.

Орчин үеийн шинжлэх ухааны хөгжлийг хэрэгжүүлэхэд онцгой ач холбогдолтой их хэмжээний мэдээллийг боловсруулахдаа судлаач эх сурвалжийг зөв бүлэглэх ноцтой ажилтай тулгардаг. Хэрэв өгөгдөл нь салангид шинж чанартай бол бидний харж байгаагаар ямар ч асуудал гарахгүй - та функц бүрийн давтамжийг тооцоолох хэрэгтэй. Хэрэв судалж буй шинж чанар нь байвал тасралтгүйтэмдэгт (энэ нь практикт илүү түгээмэл байдаг), дараа нь функцийг бүлэглэх интервалын оновчтой тоог сонгох нь тийм ч хялбар ажил биш юм.

Тасралтгүй санамсаргүй хэмжигдэхүүнүүдийг бүлэглэхийн тулд шинж чанарын бүх вариацын хүрээг тодорхой тооны интервалд хуваана. руу.

Бүлэглэсэн интервал (тасралтгүй) вариацын цуврал r"-р интервалд орсон ажиглалтын тоо эсвэл харьцангуй давтамж () -ийг харгалзах давтамжийн () -ийн хамт тэмдэглэсэн атрибутын () утгаар эрэмблэгдсэн интервалууд гэж нэрлэдэг.

Онцлог утгын интервалууд

ми давтамж

ГистограмТэгээд хуримтлагдах (огива),Бид аль хэдийн нарийвчлан хэлэлцсэн бөгөөд эдгээр нь өгөгдлийн бүтцийн талаархи үндсэн санааг олж авах боломжийг олгодог өгөгдлийг дүрслэх маш сайн хэрэгсэл юм. Ийм графикуудыг (Зураг 1.15) тасралтгүй өгөгдөлд зориулж салангид өгөгдлийн нэгэн адил бүтээдэг бөгөөд зөвхөн тасралтгүй өгөгдөл нь боломжит утгуудын мужийг бүрэн дүүргэж, ямар ч утгыг авч байгааг харгалзан үздэг.

Цагаан будаа. 1.15.

Тийм ч учраас гистограм дээрх баганууд ба хуримтлал нь бие биедээ хүрч, атрибутын утгууд нь боломжит бүх хэсэгт багтахгүй байх ёстой.(жишээ нь, гистограмм болон хуримтлал нь 1.16-р зурагт үзүүлсэн шиг судлагдсан хувьсагчийн утгыг агуулаагүй абсцисса тэнхлэгийн дагуу "нүх" байх ёсгүй). Баарны өндөр нь давтамжтай тохирч байна - өгөгдсөн интервал доторх ажиглалтын тоо эсвэл харьцангуй давтамж - ажиглалтын эзлэх хувь. Интервалууд огтлолцох ёсгүйихэвчлэн ижил өргөнтэй байдаг.

Цагаан будаа. 1.16.

Гистограм ба олон өнцөгт нь магадлалын нягтын муруй (дифференциал функц) f(x)магадлалын онолын хүрээнд авч үзсэн онолын тархалт. Тиймээс тэдгээрийн бүтэц нь тоон тасралтгүй өгөгдлийн анхан шатны статистик боловсруулалтад маш чухал байдаг - тэдгээрийн гадаад төрхөөр нь таамаглалын тархалтын хуулийг шүүж болно.

Хуримтлал – интервалын өөрчлөлтийн цувралын хуримтлагдсан давтамжийн (давтамж) муруй. Хуримтлагдсан тархалтын функцийн графикийг хуримтлалтай харьцуулна F(x), мөн магадлалын онолын хичээлээр хэлэлцсэн.

Үндсэндээ гистограмм ба хуримтлал гэсэн ойлголтууд нь тасралтгүй өгөгдөл болон тэдгээрийн интервалын хэлбэлзлийн цуваатай холбоотой байдаг, учир нь тэдгээрийн графикууд нь магадлалын нягтын функц ба тархалтын функцийн эмпирик тооцоолол юм.

Интервалын вариацын цувралыг бүтээх нь интервалын тоог тодорхойлохоос эхэлдэг к.Энэ даалгавар нь судалж буй асуудлын хамгийн хэцүү, чухал, маргаантай байж магадгүй юм.

Интервалын тоо хэт бага байж болохгүй, учир нь энэ нь гистограмыг хэт жигд болгоно ( хэт гөлгөр),анхны өгөгдлийн хувьсах бүх шинж чанараа алддаг - Зураг дээр. 1.17. Зураг дээрх графиктай ижил өгөгдөл хэрхэн байгааг харж болно. 1.15, цөөн тооны интервалтай гистограммыг бүтээхэд ашигладаг (зүүн график).

Үүний зэрэгцээ интервалын тоо хэт том байх ёсгүй - эс тэгвээс бид тоон тэнхлэгийн дагуу судлагдсан өгөгдлийн тархалтын нягтыг тооцоолох боломжгүй болно: гистограмм нь дутуу тэгшлэгдэх болно. (дутуу гөлгөр),хоосон зайтай, тэгш бус (Зураг 1.17, баруун талын графикийг үз).

Цагаан будаа. 1.17.

Хамгийн тохиромжтой интервалын тоог хэрхэн тодорхойлох вэ?

1926 онд Герберт Стергес судалж буй шинж чанарын анхны багц утгыг хуваах шаардлагатай интервалын тоог тооцоолох томъёог санал болгосон. Энэ томьёо үнэхээр их алдартай болсон - ихэнх статистикийн сурах бичгүүд үүнийг санал болгодог бөгөөд олон статистикийн багцууд үүнийг анхдагч байдлаар ашигладаг. Энэ нь хэр үндэслэлтэй, бүх тохиолдолд маш ноцтой асуулт юм.

Тэгэхээр Стержсийн томъёо юунд үндэслэсэн бэ?

бином тархалтыг авч үзье)

Танд нийтлэл таалагдсан уу? Найзуудтайгаа хуваалцаарай!