Variacijų serijų tipai eilučių intervalų variacijų eilučių tipai. Variacinė ir statistinio skirstinio eilutės

Variacijų serija - tai statistinė eilutė, rodanti tiriamo reiškinio pasiskirstymą pagal bet kurios kiekybinės charakteristikos reikšmę. Pavyzdžiui, pacientai pagal amžių, gydymo trukmę, naujagimiai pagal svorį ir kt.

Parinktis - individualios charakteristikos, pagal kurią atliekamas grupavimas, reikšmės (pažymėtos V ) .

Dažnis - skaičius, rodantis, kaip dažnai įvyksta tam tikra parinktis (pažymėta P ) . Visų dažnių suma rodo bendras skaičius pastabas ir yra paskirtas n . Skirtumas tarp didžiausio ir mažiausio variacijų serijos variantų vadinamas intervalas arba amplitudė .

Yra variacijų serijos:

1. Nenutrūkstamasis (atskirasis) ir tęstinis.

Serija laikoma tęstine, jei grupavimo charakteristika gali būti išreikšta trupmeninėmis reikšmėmis (svoris, ūgis ir kt.), Nenutrūkstama, jei grupavimo charakteristika išreiškiama tik sveikuoju skaičiumi (neįgalumo dienos, pulso dūžių skaičius ir kt.). .

2. Paprasta ir subalansuota.

Paprasta variacijų serija yra serija, kurioje kintamos charakteristikos kiekybinė reikšmė atsiranda vieną kartą. Svertinėse variacijų serijose kintančios charakteristikos kiekybinės vertės kartojamos tam tikru dažnumu.

3. Sugrupuoti (intervaliniai) ir negrupuoti.

Sugrupuotos serijos parinktys yra sujungtos į grupes, kurios sujungia jas pagal dydį tam tikru intervalu. Nesugrupuotoje serijoje kiekviena atskira parinktis atitinka tam tikrą dažnį.

4. Lyginiai ir nelyginiai.

Lyginių variacijų eilutėse dažnių suma arba bendras stebėjimų skaičius išreiškiamas lyginiu skaičiumi, nelyginiuose - nelyginiu skaičiumi.

5. Simetriška ir asimetrinė.

Simetriškoje variacijų serijoje visų tipų vidutinės reikšmės sutampa arba yra labai artimos (režimas, mediana, aritmetinis vidurkis).

Atsižvelgiant į tiriamų reiškinių pobūdį, nuo konkrečių statistinio tyrimo uždavinių ir tikslų, taip pat nuo šaltinio turinio, sanitarinėje statistikoje Naudojami šie vidurkių tipai:

struktūrinės priemonės (režimas, mediana);

aritmetinis vidurkis;

harmoninis vidurkis;

geometrinis vidurkis;

vidutinis progresyvus.

Mada (M O ) - kintamos charakteristikos reikšmė, kuri dažniau aptinkama tiriamoje populiacijoje, t.y. parinktis, atitinkanti aukščiausią dažnį. Jie randa jį tiesiogiai iš variacijų serijos struktūros, nesiimdami jokių skaičiavimų. Paprastai tai yra vertė, labai artima aritmetiniam vidurkiui ir yra labai patogi praktikoje.

Mediana (M e ) - variacijų serijos padalijimas (reitinguotas, t. y. pasirinkimo reikšmės išdėstytos didėjančia arba mažėjančia tvarka) į dvi lygias dalis. Mediana apskaičiuojama naudojant vadinamąją nelyginę eilutę, kuri gaunama nuosekliai sudedant dažnius. Jei dažnių suma atitinka lyginį skaičių, tada dviejų vidutinių verčių aritmetinis vidurkis paprastai laikomas mediana.

Mode ir mediana vartojami esant atvirai populiacijai, t.y. kai didžiausi ar mažiausi variantai neturi tikslios kiekybinės charakteristikos (pavyzdžiui, iki 15 metų, 50 ir vyresni ir pan.). Šiuo atveju aritmetinio vidurkio (parametrinių charakteristikų) apskaičiuoti negalima.

Vidutinis Esu aritmetikas – labiausiai paplitusi vertė. Aritmetinis vidurkis dažnai žymimas M.

Yra paprasti ir svertiniai aritmetiniai vidurkiai.

Paprastas aritmetinis vidurkis paskaičiuota:

- tais atvejais, kai aibę sudaro paprastas kiekvieno vieneto charakteristikos žinių sąrašas;

- jei negalima nustatyti kiekvienos parinkties pakartojimų skaičiaus;

- jei kiekvienos parinkties pakartojimų skaičius yra artimas vienas kitam.

Paprastas aritmetinis vidurkis apskaičiuojamas pagal formulę:

kur V - individualios charakteristikos reikšmės; n - atskirų reikšmių skaičius;
- sumavimo ženklas.

Taigi paprastasis vidurkis yra variantų sumos ir stebėjimų skaičiaus santykis.

Pavyzdys: nustatyti vidutinę buvimo lovoje trukmę 10 pacientų, sergančių plaučių uždegimu:

16 dienų - 1 pacientas; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

lovos diena

Svertinis aritmetinis vidurkis apskaičiuojamas tais atvejais, kai pasikartoja atskiros charakteristikos reikšmės. Jį galima apskaičiuoti dviem būdais:

1. Tiesiogiai (aritmetinis vidurkis arba tiesioginis metodas) pagal formulę:

,

čia P yra kiekvienos parinkties stebėjimų dažnis (atvejų skaičius).

Taigi svertinis aritmetinis vidurkis yra varianto ir dažnio sandaugų sumos santykis su stebėjimų skaičiumi.

2. Apskaičiuojant nuokrypius nuo sąlyginio vidurkio (naudojant momentų metodą).

Svertinio aritmetinio vidurkio apskaičiavimo pagrindas yra:

― sugrupuota medžiaga pagal kiekybinės charakteristikos variantus;

— visos parinktys turi būti išdėstytos atributo vertės didėjimo arba mažėjimo tvarka (reitinguota eilutė).

Norint apskaičiuoti naudojant momentinį metodą, būtina sąlyga yra vienodas visų intervalų dydis.

Taikant momentų metodą, aritmetinis vidurkis apskaičiuojamas pagal formulę:

,

čia M o – sąlyginis vidurkis, kuris dažnai laikomas didžiausią dažnį atitinkančios charakteristikos reikšme, t.y. kuri kartojama dažniau (Mada).

i yra intervalo reikšmė.

a yra sąlyginis nuokrypis nuo vidurkio sąlygų, tai yra nuosekli skaičių serija (1, 2 ir tt) su + ženklu didelių sąlyginių vidurkių variantams ir su – ženklu (–1, –2 ir kt. .) variantams, kurie yra mažesni už įprastą vidurkį. Sąlyginis nuokrypis nuo varianto, imamo sąlyginiu vidurkiu, yra 0.

P – dažniai.

- bendras stebėjimų skaičius arba n.

Pavyzdys: tiesiogiai nustatyti vidutinį 8 metų berniukų ūgį (1 lentelė).

1 lentelė

Aukštis cm

vaikinai P

Centrinė

V variantas

Centrinė parinktis - intervalo vidurys - apibrėžiama kaip dviejų gretimų grupių pradinių verčių pusiau suma:

;
ir tt

Produktas VP gaunamas centrinius variantus padauginus iš dažnių
;
ir tt Tada pridedami gauti produktai ir gaunami
, kuris padalinamas iš stebėjimų skaičiaus (100) ir gaunamas svertinis aritmetinis vidurkis.

cm.

Tą pačią problemą išspręsime momentų metodu, kuriam sudaryta ši 2 lentelė:

2 lentelė

Aukštis cm (V)

vaikinai P

n = 100

122 imame kaip M o, nes iš 100 stebėjimų 33 žmonės buvo 122 cm ūgio. Sąlyginius nuokrypius (a) randame nuo sąlyginio vidurkio pagal tai, kas išdėstyta aukščiau. Tada gauname sąlyginių nuokrypių sandaugą pagal dažnius (aP) ir susumuojame gautas vertes (
). Rezultatas yra 17. Galiausiai duomenis pakeičiame į formulę:

Tiriant kintamą charakteristiką, negalima apsiriboti vien vidutinių verčių skaičiavimu. Taip pat būtina apskaičiuoti rodiklius, apibūdinančius tiriamų savybių įvairovės laipsnį. Vienos ar kitos kiekybinės charakteristikos reikšmė nėra vienoda visiems statistinės visumos vienetams.

Variacijų serijos charakteristika yra standartinis nuokrypis ( ), kuris parodo tirtų charakteristikų sklaidą (dispersiją) aritmetinio vidurkio atžvilgiu, t.y. apibūdina variacijų eilučių kintamumą. Jį galima nustatyti tiesiogiai naudojant formulę:

Standartinis nuokrypis yra lygus kiekvieno varianto nuokrypių nuo aritmetinio vidurkio (V–M) 2 kvadratų sandaugų kvadratinei šaknei iš jo dažnių, padalytų iš dažnių sumos (
).

Skaičiavimo pavyzdys: nustatyti vidutinį klinikoje per dieną išduodamų nedarbingumo lapelių skaičių (3 lentelė).

3 lentelė

Ligos dienų skaičius

išduoti lapai

gydytojas per dieną (V)

Gydytojų skaičius (P)

;

Vardiklyje, kai stebėjimų skaičius mažesnis nei 30, būtina nuo
atimti vieną.

Jei serija sugrupuojama vienodais intervalais, standartinį nuokrypį galima nustatyti naudojant momentų metodą:

,

kur i yra intervalo reikšmė;

- sąlyginis nuokrypis nuo sąlyginio vidurkio;

P - atitinkamų intervalų dažnio variantas;

- bendras stebėjimų skaičius.

Skaičiavimo pavyzdys : Nustatykite vidutinę pacientų buvimo gydomojoje lovoje trukmę (naudojant momentų metodą) (4 lentelė):

4 lentelė

Dienų skaičius

likti lovoje (V)

serga (P)

;

Belgų statistikas A. Quetelet atrado, kad masės reiškinių kitimai paklūsta paklaidos pasiskirstymo dėsniui, kurį beveik vienu metu atrado K. Gaussas ir P. Laplasas. Šį pasiskirstymą vaizduojanti kreivė yra varpo formos. Pagal normalaus pasiskirstymo dėsnį individualių charakteristikos verčių kintamumas yra ribose
, kuri apima 99,73% visų gyventojų vienetų.

Apskaičiuota, kad jei prie aritmetinio vidurkio pridėsite ir atimsite 2 , tada 95,45% visų variacijų eilutės narių yra gautų verčių ribose ir galiausiai, jei prie aritmetinio vidurkio pridėsime ir atimsime 1 , tada 68,27 % visų šios variacijų eilutės narių bus gautų verčių ribose. Medicinoje su dydžiu
1siejamas su normos samprata. Nuokrypis nuo aritmetinio vidurkio yra didesnis nei 1 , bet mažiau nei 2 yra nenormalus, o nuokrypis yra didesnis nei 2 nenormalus (virš arba žemiau normos).

Sveikatos statistikoje trijų sigmų taisyklė taikoma tiriant fizinį vystymąsi, vertinant sveikatos priežiūros įstaigų veiklą, gyventojų sveikatą. Ta pati taisyklė plačiai naudojama šalies ūkyje nustatant standartus.

Taigi standartinis nuokrypis naudojamas:

— svyravimų eilučių sklaidos matavimai;

— charakteristikų įvairovės laipsnio charakteristikos, kurios nustatomos pagal variacijos koeficientą:

Jei variacijos koeficientas didesnis nei 20 % – stipri įvairovė, nuo 20 iki 10 % – vidutinė, mažiau nei 10 % – silpna požymių įvairovė. Variacijos koeficientas tam tikru mastu yra aritmetinio vidurkio patikimumo kriterijus.

Grupavimo metodas taip pat leidžia išmatuoti variacijaženklų (kintamumas, svyravimas). Kai vienetų skaičius populiacijoje yra santykinai mažas, pokytis matuojamas pagal populiaciją sudarančių vienetų skaičių. Serialas vadinamas reitinguojamas, jei vienetai išdėstyti charakteristikos didėjimo (mažėjimo) tvarka.

Tačiau reitinguotos serijos yra gana orientacinės, kai reikia lyginamosios variacijos charakteristikos. Be to, daugeliu atvejų tenka susidurti su statistinėmis populiacijomis, susidedančiomis iš daugybės vienetų, kurias praktiškai sunku pavaizduoti konkrečios serijos pavidalu. Atsižvelgiant į tai, pirminiam bendram susipažinimui su statistiniais duomenimis ir ypač siekiant palengvinti charakteristikų kitimo tyrimą, tiriami reiškiniai ir procesai dažniausiai sujungiami į grupes, o grupavimo rezultatai pateikiami grupinių lentelių pavidalu.

Jei grupių lentelėje yra tik du stulpeliai – grupės pagal pasirinktą charakteristiką (parinktys) ir grupių skaičių (dažnis arba dažnis), ji vadinama netoli platinimo.

Paskirstymo diapazonas - Paprasčiausias struktūrinio grupavimo tipas, pagrįstas viena charakteristika, rodomas grupių lentelėje su dviem stulpeliais, kuriuose pateikiami charakteristikos variantai ir dažniai. Daugeliu atvejų su tokiu struktūriniu grupavimu, t.y. Sudarius pasiskirstymo eilutes, pradedama tirti pradinė statistinė medžiaga.

Struktūrinė grupuotė pasiskirstymo eilutės forma gali būti paversta tikra struktūrine grupe, jei pasirinktos grupės pasižymi ne tik dažnumu, bet ir kitais statistiniais rodikliais. Pagrindinis paskirstymo serijų tikslas yra ištirti charakteristikų kitimą. Paskirstymo eilučių teoriją detaliai išplėtoja matematinė statistika.

Paskirstymo serijos skirstomos į atributinis(grupavimas pagal atributinius požymius, pvz., gyventojų skirstymas pagal lytį, tautybę, šeimyninę padėtį ir kt.) ir variacinis(grupavimas pagal kiekybines charakteristikas).

Variacijų serija yra grupinė lentelė, kurioje yra du stulpeliai: vienetų grupavimas pagal vieną kiekybinę charakteristiką ir vienetų skaičius kiekvienoje grupėje. Variacijų eilučių intervalai dažniausiai sudaromi lygūs ir uždari. Variacijų eilutė yra tokia Rusijos gyventojų grupuotė pagal vidutines pinigines pajamas vienam gyventojui (3.10 lentelė).

3.10 lentelė

Rusijos gyventojų pasiskirstymas pagal vidutines pajamas vienam gyventojui 2004-2009 m.

Gyventojų grupės pagal vidutines grynųjų pinigų pajamas vienam gyventojui, rub./mėn

Gyventojų skaičius grupėje, % nuo visų

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Daugiau nei 25 000,0

Visa populiacija

Variacijų serijos savo ruožtu skirstomos į diskrečiąsias ir intervalines. Diskretus variacijų serija sujungia atskirų charakteristikų variantus, kurie skiriasi siauromis ribomis. Diskrečių variacijų serijos pavyzdys yra rusų šeimų pasiskirstymas pagal jų turimų vaikų skaičių.

Intervalas Variacijų serija sujungia nuolatinių charakteristikų arba atskirų charakteristikų variantus, kurie skiriasi plačiu diapazonu. Intervalas yra Rusijos gyventojų pasiskirstymo pagal vidutines pinigines pajamas vienam gyventojui kitimo eilutė.

Atskiros variacijų serijos praktikoje nenaudojamos labai dažnai. Tuo tarpu juos sudaryti nėra sunku, nes grupių sudėtį lemia konkretūs variantai, kuriuos iš tikrųjų turi tiriamos grupavimo charakteristikos.

Intervalų variacijų serijos yra plačiau paplitusios. Sudarant juos, kyla sunkus klausimas dėl grupių skaičiaus, taip pat apie intervalų, kuriuos reikėtų nustatyti, dydį.

Šio klausimo sprendimo principai išdėstyti skyriuje „Statistinių grupuočių sudarymo metodika“ (žr. 3.3 pastraipą).

Variacijų serijos yra priemonė įvairiai informacijai sutraukti arba suspausti į kompaktišką formą, iš jų galima gana aiškiai spręsti apie variacijos pobūdį ir ištirti tiriamų reiškinių charakteristikų skirtumus. Tačiau svarbiausia variacijų eilučių reikšmė yra ta, kad jų pagrindu apskaičiuojamos specialios apibendrinančios variacijos charakteristikos (žr. 7 skyrių).

Pavadinkime skirtingas pavyzdines vertes parinktys reikšmių serija ir žymi: X 1 , X 2,…. Pirmiausia gaminsime diapazonas variantai, t.y. jų išdėstymas didėjančia arba mažėjančia tvarka. Kiekvienam variantui nurodomas jo svoris, t.y. skaičius, apibūdinantis tam tikro pasirinkimo indėlį į bendrą gyventojų skaičių. Dažniai arba dažniai veikia kaip svoriai.

Dažnis n i variantas x i yra skaičius, rodantis, kiek kartų tam tikra parinktis pasitaiko nagrinėjamoje imties populiacijoje.

Dažnis arba santykinis dažnis w i variantas x i yra skaičius, lygus varianto dažnio santykiui su visų variantų dažnių suma. Dažnis parodo, kokia dalis imties populiacijos vienetų turi tam tikrą variantą.

Parinkčių seka su atitinkamais svoriais (dažniais arba dažniais), parašyta didėjančia (arba mažėjančia) tvarka, vadinama variacijų serija.

Variacijų serijos yra diskrečios ir intervalinės.

Atskirai variacijų serijai nurodomos charakteristikos taško reikšmės, intervalų serijoms charakteristikų reikšmės nurodomos intervalų forma. Variacijų serijos gali parodyti dažnių pasiskirstymą arba santykinius dažnius (dažnius), priklausomai nuo to, kokia reikšmė nurodoma kiekvienam pasirinkimui – dažniui ar dažniui.

Diskrečiųjų dažnio pasiskirstymo variacijų eilutė turi formą:

Dažniai randami pagal formulę, i = 1, 2, …, m.

w 1 +w 2 + … + w m = 1.

Pavyzdys 4.1. Tam tikram skaičių rinkiniui

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

sudaryti diskrečiųjų dažnių ir dažnių skirstinių variacijų eilutes.

Sprendimas . Gyventojų skaičius lygus n= 10. Diskrečiojo dažnio pasiskirstymo eilutė turi formą

Intervalinės serijos turi panašią įrašymo formą.

Dažnio pasiskirstymo intervalų variacijų eilutė parašyta taip:

Visų dažnių suma lygi bendram stebėjimų skaičiui, t.y. bendras tūris: n = n 1 +n 2 + … + n m.

Santykinių dažnių (dažnių) pasiskirstymo intervalų kitimo eilutės turi formą:

Dažnis randamas pagal formulę, i = 1, 2, …, m.

Visų dažnių suma lygi vienetui: w 1 +w 2 + … + w m = 1.

Dažniausiai praktikoje naudojamos intervalinės serijos. Jei statistinių imties duomenų yra daug ir jų reikšmės viena nuo kitos skiriasi savavališkai mažai, tada atskira šių duomenų serija bus gana sudėtinga ir nepatogi tolesniam tyrimui. Šiuo atveju naudojamas duomenų grupavimas, t.y. Intervalas, kuriame yra visos atributo reikšmės, yra padalintas į kelis dalinius intervalus ir, apskaičiuojant kiekvieno intervalo dažnį, gaunama intervalų serija. Išsamiau surašykime intervalų eilutės sudarymo schemą, darant prielaidą, kad dalinių intervalų ilgiai bus vienodi.

2.2 Intervalų serijos sudarymas

Norėdami sukurti intervalų seriją, jums reikia:

Nustatyti intervalų skaičių;

Nustatykite intervalų ilgį;

Nustatykite intervalų vietą ašyje.

Norint nustatyti intervalų skaičius k Yra Sturgeso formulė, pagal kurią

,

Kur n- viso agregato tūris.

Pavyzdžiui, jei charakteristikos (varianto) reikšmių yra 100, tada intervalų serijai sudaryti rekomenduojama paimti intervalų skaičių, lygų intervalams.

Tačiau labai dažnai praktikoje intervalų skaičių pasirenka pats tyrėjas, atsižvelgdamas į tai, kad šis skaičius neturėtų būti labai didelis, kad serija nebūtų sudėtinga, bet ir ne labai maža, kad neprarastų kai kurių jo savybių. paskirstymas.

Intervalo ilgis h nustatoma pagal šią formulę:

,

Kur x maks. ir x min yra atitinkamai didžiausia ir mažiausia parinkčių reikšmės.

Dydis paskambino apimtis eilė.

Norėdami sukurti pačius intervalus, jie vyksta įvairiais būdais. Vienas iš paprasčiausių būdų yra toks. Pirmojo intervalo pradžia laikoma
. Tada pagal formulę randamos likusios intervalų ribos. Akivaizdu, kad paskutinio intervalo pabaiga a m+1 turi atitikti sąlygą

Suradus visas intervalų ribas, nustatomi šių intervalų dažniai (ar dažniai). Norėdami išspręsti šią problemą, peržiūrėkite visas parinktis ir nustatykite parinkčių, kurios patenka į tam tikrą intervalą, skaičių. Pažvelkime į visą intervalų serijos konstrukciją naudodami pavyzdį.

Pavyzdys 4.2. Šiems statistiniams duomenims, įrašytiems didėjančia tvarka, sudarykite intervalų eilutę, kurios intervalų skaičius lygus 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Sprendimas. Iš viso n=50 variantų verčių.

Intervalų skaičius nurodomas problemos teiginyje, t.y. k=5.

Intervalų ilgis yra
.

Apibrėžkime intervalų ribas:

a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

a 7 = 87,5 +17 = 104,5.

Norėdami nustatyti intervalų dažnį, suskaičiuojame parinkčių, patenkančių į tam tikrą intervalą, skaičių. Pavyzdžiui, pirmasis intervalas nuo 2,5 iki 19,5 apima 11, 12, 12, 14, 14, 15 parinktis. Jų skaičius yra 6, todėl pirmojo intervalo dažnis yra n 1 = 6. Pirmojo intervalo dažnis yra . Antrasis intervalas nuo 19,5 iki 36,5 apima 21, 21, 22, 23, 25 parinktis, kurių skaičius yra 5. Todėl antrojo intervalo dažnis yra n 2 =5 ir dažnis . Panašiai radę visų intervalų dažnius ir dažnius, gauname tokią intervalų eilutę.

Dažnio pasiskirstymo intervalų serija yra tokia:

Dažnių suma yra 6+5+9+11+8+11=50.

Dažnio pasiskirstymo intervalų serija yra tokia:

Dažnių suma yra 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

Konstruojant intervalų eilutes, atsižvelgiant į konkrečias nagrinėjamos problemos sąlygas, gali būti taikomos kitos taisyklės, būtent

1. Intervalinių variacijų serijas gali sudaryti skirtingo ilgio daliniai intervalai. Nevienodo ilgio intervalai leidžia išryškinti statistinės populiacijos savybes su netolygiu charakteristikos pasiskirstymu. Pavyzdžiui, jei intervalų ribos lemia gyventojų skaičių miestuose, tai šioje užduotyje patartina naudoti nevienodo ilgio intervalus. Akivaizdu, kad mažiems miestams nedidelis gyventojų skaičiaus skirtumas yra svarbus, tačiau dideliems dešimčių ar šimtų gyventojų skirtumas nėra reikšmingas. Intervalų serijos su nevienodo ilgio dalinių intervalų daugiausia tiriamos bendrojoje statistikos teorijoje ir jų svarstymas nepatenka į šio vadovo taikymo sritį.

2. Matematinėje statistikoje kartais atsižvelgiama į intervalų eilutes, kurių pirmojo intervalo kairioji riba yra lygi –∞, o dešinioji paskutinio intervalo riba +∞. Tai daroma siekiant priartinti statistinį pasiskirstymą prie teorinio.

3. Konstruojant intervalų eilutes gali pasirodyti, kad kurio nors varianto reikšmė tiksliai sutampa su intervalo riba. Geriausias dalykas šiuo atveju yra toks. Jei yra tik vienas toks sutapimas, tada apsvarstykite, kad svarstomas variantas su jo dažniu pateko į intervalą, esantį arčiau intervalų serijos vidurio, jei yra keletas tokių variantų, tada visi jie priskiriami intervalams dešinėje iš šių parinkčių arba visos jos priskirtos kairėje pusėje.

4. Nustačius intervalų skaičių ir jų ilgį, intervalų išdėstymas gali būti atliktas ir kitu būdu. Raskite visų svarstomų parinkčių verčių aritmetinį vidurkį X trečia ir sudaryti pirmąjį intervalą taip, kad šis imties vidurkis būtų tam tikrame intervale. Taigi, mes gauname intervalą nuo X trečia – 0,5 hį X vid.. + 0,5 h. Tada į kairę ir į dešinę, pridėdami intervalo ilgį, sudarome likusius intervalus iki x min ir x max nepateks atitinkamai į pirmąjį ir paskutinįjį intervalus.

5. Intervalų serijos su dideliu intervalų skaičiumi patogiai rašomos vertikaliai, t.y. intervalus rašykite ne pirmoje eilutėje, o pirmajame stulpelyje, o dažnius (arba dažnius) antrame stulpelyje.

Imties duomenys gali būti laikomi kai kurių atsitiktinių dydžių reikšmėmis X. Atsitiktinis dydis turi savo pasiskirstymo dėsnį. Iš tikimybių teorijos žinoma, kad diskrečiųjų atsitiktinių dydžių pasiskirstymo dėsnį galima nurodyti pasiskirstymo eilutės pavidalu, o ištisinio - naudojant pasiskirstymo tankio funkciją. Tačiau yra universalus pasiskirstymo dėsnis, kuris galioja tiek diskretiesiems, tiek nuolatiniams atsitiktiniams dydžiams. Šis skirstymo dėsnis pateikiamas kaip pasiskirstymo funkcija F(x) = P(X<x). Pavyzdiniams duomenims galite nurodyti pasiskirstymo funkcijos analogą – empirinę skirstymo funkciją.


Susijusi informacija.


Variacijų serija: apibrėžimas, tipai, pagrindinės charakteristikos. Skaičiavimo metodas
režimas, mediana, aritmetinis vidurkis medicininiuose ir statistiniuose tyrimuose
(rodyti su sąlyginiu pavyzdžiu).

Variacijų serija yra tiriamos charakteristikos skaitinių verčių serija, kurios skiriasi viena nuo kitos dydžiu ir yra išdėstytos tam tikra seka (didėjimo arba mažėjimo tvarka). Kiekviena skaitinė serijos reikšmė vadinama variantu (V), o skaičiai, rodantys, kaip dažnai tam tikroje serijoje atsiranda tam tikras variantas, vadinami dažniu (p).

Bendras stebėjimo atvejų, sudarančių variacijų eilutę, skaičius žymimas raide n. Tiriamų charakteristikų reikšmės skirtumas vadinamas variacija. Jei kintamoji charakteristika neturi kiekybinio mato, pokytis vadinamas kokybiniu, o pasiskirstymo serija vadinama atributine (pavyzdžiui, pasiskirstymas pagal ligos baigtį, sveikatos būklę ir pan.).

Jei kintamoji charakteristika turi kiekybinę išraišką, tokia variacija vadinama kiekybine, o pasiskirstymo serija vadinama variacine.

Variacijų serijos skirstomos į nenutrūkstamas ir ištisines – pagal kiekybinės charakteristikos pobūdį ir svertines – pagal varianto pasireiškimo dažnį.

Paprastoje variacijų serijoje kiekviena parinktis pasitaiko tik vieną kartą (p=1), svertinėje serijoje ta pati parinktis pasitaiko kelis kartus (p>1). Tokių serijų pavyzdžiai bus aptarti toliau tekste. Jeigu kiekybinė charakteristika yra ištisinė, t.y. Tarp sveikųjų skaičių yra tarpiniai trupmeniniai dydžiai.

Pavyzdžiui: 10,0 – 11,9

14,0 – 15,9 ir kt.

Jei kiekybinė charakteristika yra nenutrūkstama, t.y. jo atskiros reikšmės (variantai) skiriasi viena nuo kitos sveikuoju skaičiumi ir neturi tarpinių trupmeninių reikšmių.

Naudojant širdies ritmo duomenis iš ankstesnio pavyzdžio

21 mokiniui sudarysime variacijų eilutę (1 lentelė).

1 lentelė

Medicinos studentų pasiskirstymas pagal širdies ritmą (bpm)

Taigi, sukonstruoti variacijų eilutę reiškia susisteminti ir sutvarkyti turimas skaitines reikšmes (variantus), t.y. išdėstyti tam tikra seka (didėjimo arba mažėjimo tvarka) su atitinkamais dažniais. Nagrinėjamame pavyzdyje parinktys išdėstytos didėjančia tvarka ir išreiškiamos sveikaisiais netolydžiais (diskretiniais) skaičiais, kiekviena parinktis pasitaiko kelis kartus, t.y. mes susiduriame su svertine, nepertraukiama arba atskira variacijų serija.

Paprastai, jei mūsų tiriamoje statistinėje populiacijoje stebėjimų skaičius neviršija 30, pakanka visas tiriamos charakteristikos reikšmes išdėstyti didėjančioje variacijų eilutėje, kaip nurodyta lentelėje. 1 arba mažėjančia tvarka.

Esant dideliam stebėjimų skaičiui (n>30), pasitaikančių variantų skaičius gali būti labai didelis, tokiu atveju sudaroma intervalinė arba sugrupuota variacijų serija, kurioje, siekiant supaprastinti tolesnį apdorojimą ir išsiaiškinti pasiskirstymo pobūdį, variantai jungiami į grupes.

Paprastai grupių parinkčių skaičius svyruoja nuo 8 iki 15.

Jų turėtų būti bent 5, nes... kitu atveju jis bus per grubus, per didelis išplėtimas, kuris iškreipia bendrą variacijos vaizdą ir labai paveikia vidutinių verčių tikslumą. Kai grupės variantų skaičius yra didesnis nei 20-25, vidutinių reikšmių skaičiavimo tikslumas padidėja, tačiau charakteristikos kitimo charakteristikos yra žymiai iškraipomos, o matematinis apdorojimas tampa sudėtingesnis.

Sudarant sugrupuotą seriją, būtina atsižvelgti į

− opcionų grupės turi būti išdėstytos tam tikra tvarka (didėjančia arba mažėjančia);

− intervalai parinkčių grupėse turi būti vienodi;

- intervalų ribų reikšmės neturėtų sutapti, nes bus neaišku, į kurias grupes skirstyti atskirus variantus;

− nustatant intervalų ribas būtina atsižvelgti į surinktos medžiagos kokybines ypatybes (pvz., tiriant suaugusiųjų svorį, priimtinas 3-4 kg intervalas, o vaikams pirmaisiais gyvenimo mėnesiais neturėtų viršyti 100 g)

Sukurkime sugrupuotą (intervalinę) eilutę, apibūdinančią 55 medicinos studentų pulso dažnio (tvinksnių per minutę) duomenis prieš egzaminą: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Norėdami sukurti sugrupuotą seriją, jums reikia:

1. Nustatyti intervalo dydį;

2. Nustatykite variacijų serijos grupių vidurį, pradžią ir pabaigą.

● Intervalo (i) dydis nustatomas pagal spėjamų grupių skaičių (r), kurių skaičius nustatomas priklausomai nuo stebėjimų skaičiaus (n) pagal specialią lentelę.

Grupių skaičius, priklausomai nuo stebėjimų skaičiaus:

Mūsų atveju 55 mokiniams galite sukurti nuo 8 iki 10 grupių.

Intervalo (i) reikšmė nustatoma pagal šią formulę -

i = V max-V min/r

Mūsų pavyzdyje intervalo reikšmė yra 82-58/8= 3.

Jei intervalo reikšmė yra trupmena, rezultatas turi būti suapvalintas iki artimiausio sveikojo skaičiaus.

Yra keletas vidurkių tipų:

● aritmetinis vidurkis,

● geometrinis vidurkis,

● harmoninis vidurkis,

● kvadrato vidurkis,

● vidutinis progresyvus,

● mediana

Medicinos statistikoje dažniausiai naudojami aritmetiniai vidurkiai.

Aritmetinis vidurkis (M) yra apibendrinanti reikšmė, kuri nustato, kas būdinga visai populiacijai. Pagrindiniai M apskaičiavimo metodai yra: aritmetinio vidurkio metodas ir momentų (sąlyginių nuokrypių) metodas.

Paprastajam aritmetiniam vidurkiui ir svertiniam aritmetiniam vidurkiui apskaičiuoti naudojamas aritmetinio vidurkio metodas. Aritmetinio vidurkio apskaičiavimo metodo pasirinkimas priklauso nuo variacijų serijos tipo. Paprastų variacijų serijų atveju, kai kiekviena parinktis pasitaiko tik vieną kartą, paprastas aritmetinis vidurkis nustatomas pagal formulę:

čia: M – aritmetinis vidurkis;

V – kintamos charakteristikos (variantų) reikšmė;

Σ – nurodo veiksmą – sumavimą;

n – bendras stebėjimų skaičius.

Paprastojo aritmetinio vidurkio apskaičiavimo pavyzdys. Kvėpavimo dažnis (kvėpavimo judesių skaičius per minutę) 9 vyrams nuo 35 metų: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Norint nustatyti vidutinį 35 metų vyrų kvėpavimo dažnio lygį, būtina:

1. Sukurkite variacijų seriją, išdėstydami visas parinktis didėjimo arba mažėjimo tvarka. Gavome paprastą variacijų eilutę, nes parinkčių reikšmės pasitaiko tik vieną kartą.

M = ∑V/n = 171/9 = 19 įkvėpimų per minutę

Išvada. 35 metų vyrų kvėpavimo dažnis yra vidutiniškai 19 kvėpavimo judesių per minutę.

Jei kartojasi atskiros varianto reikšmės, kiekvieno varianto eilutėje rašyti nereikia, užtenka surašyti pasitaikančius varianto dydžius (V) ir šalia nurodyti jų pasikartojimų skaičių (p; ). Tokia variacijų eilutė, kurioje variantai tarsi sveriami pagal juos atitinkančių dažnių skaičių, vadinama svertine variacijų eilute, o skaičiuojama vidutinė reikšmė – svertinis aritmetinis vidurkis.

Svertinis aritmetinis vidurkis nustatomas pagal formulę: M= ∑Vp/n

čia n yra stebėjimų skaičius, lygus dažnių sumai – Σр.

Aritmetinio svertinio vidurkio apskaičiavimo pavyzdys.

Vietos gydytojo gydytiems 35 ligoniams, sergantiems ūminėmis kvėpavimo takų ligomis (ŪRI), invalidumo trukmė (dienomis) per pirmąjį einamųjų metų ketvirtį buvo: 6, 7, 5, 3, 9, 8, 7, 5, 6. , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 dienos.

Pacientų, sergančių ūminėmis kvėpavimo takų infekcijomis, vidutinės neįgalumo trukmės nustatymo metodas yra toks:

1. Sukurkime svertinę variacijų eilutę, nes Atskiros pasirinkimo reikšmės kartojasi keletą kartų. Norėdami tai padaryti, visas parinktis galite išdėstyti didėjančia arba mažėjančia tvarka pagal atitinkamus dažnius.

Mūsų atveju parinktys yra išdėstytos didėjančia tvarka

2. Apskaičiuokite aritmetinį svertinį vidurkį pagal formulę: M = ∑Vp/n = 233/35 = 6,7 dienos

Ūminėmis kvėpavimo takų infekcijomis sergančių pacientų pasiskirstymas pagal neįgalumo trukmę:

Neįgalumo trukmė (V) Pacientų skaičius (p) Vp
∑p = n = 35 ∑Vp = 233

Išvada. Ūmiomis kvėpavimo takų ligomis sergančių pacientų invalidumo trukmė vidutiniškai buvo 6,7 dienos.

Režimas (Mo) yra labiausiai paplitusi variantų serijos parinktis. Lentelėje pateiktam pasiskirstymui režimas atitinka parinktį, lygią 10, ji pasitaiko dažniau nei kiti - 6 kartus.

Pacientų pasiskirstymas pagal buvimo ligoninės lovoje trukmę (dienomis)

V
p

Kartais sunku nustatyti tikslų režimo dydį, nes tiriamuose duomenyse gali būti keletas „dažniausių“ stebėjimų.

Mediana (Me) yra neparametrinis rodiklis, kuris padalija variacijų eilutę į dvi lygias dalis: tiek pat variantų yra abiejose medianos pusėse.

Pavyzdžiui, lentelėje parodytam pasiskirstymui mediana yra 10, nes abiejose šios reikšmės pusėse yra 14 variantas, t.y. skaičius 10 šioje serijoje užima centrinę vietą ir yra jos mediana.

Atsižvelgiant į tai, kad stebėjimų skaičius šiame pavyzdyje yra lygus (n=34), medianą galima nustatyti taip:

Aš = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Tai reiškia, kad serijos vidurys patenka į septynioliktą variantą, kuris atitinka medianą, lygią 10. Lentelėje pateikto skirstinio aritmetinis vidurkis yra lygus:

M = ∑Vp/n = 334/34 = 10,1

Taigi, 34 stebėjimams iš lentelės. 8, gavome: Mo=10, Me=10, aritmetinis vidurkis (M) yra 10,1. Mūsų pavyzdyje visi trys rodikliai pasirodė lygūs arba artimi vienas kitam, nors ir visiškai skirtingi.

Aritmetinis vidurkis yra visų be išimties įtakų, įskaitant kraštutinius, dažnai netipiškus tam tikram reiškiniui ar populiacijai, suma.

Režimas ir mediana, skirtingai nei aritmetinis vidurkis, nepriklauso nuo visų atskirų kintamos charakteristikos verčių vertės (kraštutinių variantų vertės ir serijos sklaidos laipsnis). Aritmetinis vidurkis apibūdina visą stebėjimų masę, režimas ir mediana apibūdina didžiąją dalį

Variacijų serijos koncepcija. Pirmasis statistinės stebėjimo medžiagos sisteminimo žingsnis yra vienetų, turinčių tam tikrą charakteristiką, skaičius. Išdėstę vienetus jų kiekybinės charakteristikos didėjimo arba mažėjimo tvarka ir suskaičiavę vienetų su konkrečia charakteristikos reikšme skaičių, gauname variacijų eilutę. Variacijų eilutė apibūdina tam tikros statistinės visumos vienetų pasiskirstymą pagal kokią nors kiekybinę charakteristiką.

Variacijų seriją sudaro du stulpeliai, kairiajame stulpelyje pateikiamos kintamos charakteristikos reikšmės, vadinamos variantais ir pažymėtos (x), o dešiniajame stulpelyje yra absoliutūs skaičiai, rodantys, kiek kartų kiekvienas variantas pasitaiko. Šiame stulpelyje esantys rodikliai vadinami dažniais ir žymimi (f).

Variacijų serijas galima schematiškai pateikti 5.1 lentelės forma:

5.1 lentelė

Variacijų serijos tipas

Parinktys (x)

Dažniai (f)

Dešiniajame stulpelyje taip pat gali būti naudojami santykiniai rodikliai, apibūdinantys atskirų pasirinkimų dažnio dalį bendroje dažnių sumoje. Šie santykiniai rodikliai vadinami dažniais ir sutartinai žymimi , t.y. . Visų dažnių suma lygi vienetui. Dažnius galima išreikšti ir procentais, tada jų suma bus lygi 100%.

Įvairūs ženklai gali būti skirtingo pobūdžio. Kai kurių charakteristikų variantai išreiškiami sveikaisiais skaičiais, pavyzdžiui, kambarių skaičius bute, išleistų knygų skaičius ir kt. Šie ženklai vadinami nenutrūkstamais arba atskirais. Kitų charakteristikų variantai gali įgyti bet kokias reikšmes tam tikrose ribose, pavyzdžiui, suplanuotų užduočių įvykdymas, darbo užmokestis ir pan. Šios charakteristikos vadinamos nuolatinėmis.

Diskrečių variacijų serija. Jei variacijų serijos variantai išreiškiami diskrečiųjų dydžių forma, tai tokia variacijų serija vadinama diskrečiąja, pateikiama lentelėje. 5.2:

5.2 lentelė

Mokinių pasiskirstymas pagal egzaminų pažymius

Įvertinimai (x)

Studentų skaičius (f)

% viso ()

Diskrečiųjų serijų skirstinio pobūdis grafiškai pavaizduotas skirstinio daugiakampio pavidalu, 5.1 pav.

Ryžiai. 5.1. Mokinių pasiskirstymas pagal egzamine gautus pažymius.

Intervalų variacijų serija. Ištisinėms charakteristikoms variacijų eilutės konstruojamos kaip intervalinės, t.y. charakteristikos reikšmės jose išreiškiamos intervalais „nuo ir iki“. Tokiu atveju minimali charakteristikos reikšmė tokiame intervale vadinama apatine intervalo riba, o didžiausia – viršutine intervalo riba.

Intervalinių variacijų serijos yra sukurtos tiek nenutrūkstančioms charakteristikoms (diskrečioms), tiek toms, kurios kinta dideliame diapazone. Intervalų eilutės gali būti su vienodais arba nevienodais intervalais. Ekonominėje praktikoje naudojami dauguma nevienodų intervalų, kurie palaipsniui didėja arba mažėja. Šis poreikis ypač iškyla tais atvejais, kai charakteristikos svyravimas vyksta netolygiai ir didelėse ribose.

Panagrinėkime intervalų serijų su vienodais intervalais tipą, lentelę. 5.3:

5.3 lentelė

Darbuotojų pasiskirstymas pagal gamybą

Išėjimas, t.r. (X)

Darbuotojų skaičius (f)

Kaupiamasis dažnis (f')

Intervalų pasiskirstymo serija grafiškai pavaizduota kaip histograma, 5.2 pav.

5.2 pav. Darbuotojų pasiskirstymas pagal gamybą

Kaupiamasis (kaupiamasis) dažnis. Praktiškai reikia transformuoti paskirstymo serijas į kaupiamoji serija, pastatytas pagal sukauptus dažnius. Jų pagalba galite nustatyti struktūrinius vidurkius, palengvinančius paskirstymo eilučių duomenų analizę.

Kaupiamieji dažniai nustatomi nuosekliai pridedant prie pirmosios grupės dažnių (ar dažnių) šiuos paskesnių pasiskirstymo eilučių grupių rodiklius. Paskirstymo serijoms iliustruoti naudojami kumuliacijos ir ogives. Jas sukonstruoti, abscisių ašyje pažymimos diskrečiųjų charakteristikų reikšmės (arba intervalų galai), o ordinačių ašyje – suminės dažnių sumos (kumuliacijos), 5.3 pav.

Ryžiai. 5.3. Kaupiamasis darbuotojų pasiskirstymas pagal gamybą

Jei dažnių ir parinkčių skalės yra apverstos, t.y. abscisių ašyje atsispindi sukaupti dažniai, o ordinačių ašyje – variantų reikšmės, tada dažnių kaitą iš grupės į grupę charakterizuojanti kreivė bus vadinama pasiskirstymo rodikliu, 5.4 pav.

Ryžiai. 5.4. Ogiva darbininkų pasiskirstymo pagal gamybą

Variacijų eilutės vienodais intervalais pateikia vieną iš svarbiausių statistinių skirstinių eilučių reikalavimų, užtikrinančių jų palyginamumą laike ir erdvėje.

Pasiskirstymo tankis. Tačiau atskirų nelygių intervalų dažniai nurodytose serijose nėra tiesiogiai palyginami. Tokiais atvejais, siekiant užtikrinti reikiamą palyginamumą, apskaičiuojamas pasiskirstymo tankis, t.y. nustatyti, kiek vienetų kiekvienoje grupėje tenka intervalo vertės vienetui.

Sudarant variacijų eilučių su nelygiais intervalais pasiskirstymo grafiką, stačiakampių aukštis nustatomas proporcingai ne dažniams, o tiriamos charakteristikos reikšmių pasiskirstymo atitinkamame tankio rodikliams. intervalais.

Variacijų serijos sudarymas ir jos grafinis atvaizdavimas yra pirmasis pradinių duomenų apdorojimo ir pirmasis tiriamos populiacijos analizės etapas. Kitas variacijų eilučių analizės žingsnis – nustatyti pagrindinius bendruosius rodiklius, vadinamus eilučių charakteristikomis. Šios charakteristikos turėtų suteikti supratimą apie vidutinę charakteristikos vertę tarp gyventojų vienetų.

Vidutinė vertė. Vidutinė reikšmė yra apibendrinta tiriamos populiacijos charakteristika, atspindinti jos tipinį lygį populiacijos vienetui konkrečiomis vietos ir laiko sąlygomis.

Vidutinė reikšmė visada įvardijama ir turi tą patį matmenį, kaip ir atskirų populiacijos vienetų charakteristika.

Prieš skaičiuojant vidutines reikšmes, būtina sugrupuoti tiriamos populiacijos vienetus, išskiriant kokybiškai vienarūšes grupes.

Vidurkis, apskaičiuotas visai populiacijai, vadinamas bendruoju vidurkiu, o kiekvienos grupės – grupės vidurkiais.

Yra dviejų tipų vidurkiai: galia (aritmetinis vidurkis, harmoninis vidurkis, geometrinis vidurkis, kvadratinis vidurkis); struktūrinis (modas, mediana, kvartiliai, deciliai).

Skaičiavimo vidurkio pasirinkimas priklauso nuo tikslo.

Galios vidurkių tipai ir jų skaičiavimo metodai. Surinktos medžiagos statistinio apdorojimo praktikoje iškyla įvairios problemos, kurių sprendimui reikalingi skirtingi vidurkiai.

Matematinė statistika iš galios vidurkio formulių išveda įvairius vidurkius:

kur yra vidutinė vertė; x – individualios parinktys (ypatybių reikšmės); z – eksponentas (su z = 1 – aritmetinis vidurkis, z = 0 geometrinis vidurkis, z = - 1 – harmoninis vidurkis, z = 2 – kvadratinis vidurkis).

Tačiau klausimas, kokio tipo vidurkis turėtų būti taikomas kiekvienu atskiru atveju, sprendžiamas atliekant konkrečią tiriamos populiacijos analizę.

Dažniausias statistikos vidurkio tipas yra aritmetinis vidurkis. Jis apskaičiuojamas tais atvejais, kai vidutinės charakteristikos tūris sudaromas kaip atskirų tiriamos statistinės visumos vienetų reikšmių suma.

Priklausomai nuo šaltinio duomenų pobūdžio, aritmetinis vidurkis nustatomas įvairiais būdais:

Jei duomenys nesugrupuoti, tada skaičiavimas atliekamas naudojant paprastą vidurkio formulę

Aritmetinio vidurkio apskaičiavimas diskrečioje eilutėje atsiranda pagal 3.4 formulę.

Aritmetinio vidurkio skaičiavimas intervalų eilutėje. Intervalų variacijų serijoje, kai kiekvienos grupės charakteristikos reikšmė sutartinai laikoma intervalo viduriu, aritmetinis vidurkis gali skirtis nuo vidurkio, apskaičiuoto pagal nesugrupuotus duomenis. Be to, kuo didesnis intervalas grupėse, tuo didesni galimi vidurkio, apskaičiuoto pagal sugrupuotus duomenis, nuokrypiai nuo vidurkio, apskaičiuoto iš negrupuotų duomenų.

Skaičiuojant intervalo variacijų serijos vidurkį, norint atlikti reikiamus skaičiavimus, nuo intervalų pereinama į jų vidurio taškus. Ir tada vidurkis apskaičiuojamas naudojant svertinio aritmetinio vidurkio formulę.

Aritmetinio vidurkio savybės. Aritmetinis vidurkis turi tam tikrų savybių, kurios leidžia supaprastinti skaičiavimus.

1. Pastoviųjų skaičių aritmetinis vidurkis yra lygus šiam pastoviam skaičiui.

Jei x = a. Tada .

2. Jei proporcingai keičiami visų variantų svoriai, t.y. padidėti arba mažėti tiek pat kartų, tada naujosios eilutės aritmetinis vidurkis nepasikeis.

Jei visi svoriai f sumažinami k kartų, tada .

3. Atskirų opcionų teigiamų ir neigiamų nuokrypių nuo vidurkio suma, padauginta iš svorių, lygi nuliui, t.y.

Jei, tada. Iš čia.

Jei visos parinktys sumažinamos arba padidinamos bet kokiu skaičiumi, naujos serijos aritmetinis vidurkis sumažės arba padidės tiek pat.

Sumažinkime visas galimybes xįjungta a, t.y. x´ = xa.

Tada

Pradinės serijos aritmetinį vidurkį galima gauti prie sumažinto vidurkio pridedant skaičių, anksčiau atimtą iš parinkčių a, t.y. .

5. Jei visos parinktys sumažinamos arba padidinamos k kartų, tuomet naujosios eilutės aritmetinis vidurkis sumažės arba padidės tiek pat, t.y. V k vieną kartą.

Tebūnie tada .

Vadinasi, t.y. norint gauti pradinės serijos vidurkį, naujos serijos (su sumažintomis parinktimis) aritmetinis vidurkis turi būti padidintas k vieną kartą.

Harmoninis vidurkis. Harmoninis vidurkis yra aritmetinio vidurkio atvirkštinis dydis. Jis naudojamas, kai statistinėje informacijoje nėra atskirų populiacijos variantų dažnių, o pateikiama kaip jų sandauga (M = xf). Harmoninis vidurkis bus apskaičiuojamas pagal 3.5 formulę

Praktinis harmoninio vidurkio pritaikymas yra apskaičiuoti kai kuriuos indeksus, ypač kainų indeksą.

Geometrinis vidurkis. Naudojant geometrinį vidurkį, individualios charakteristikos reikšmės, kaip taisyklė, yra santykinės dinamikos vertės, sudarytos grandinės verčių pavidalu, kaip santykis su ankstesniu kiekvieno lygio dinamikos serijoje lygiu. Taigi vidurkis apibūdina vidutinį augimo tempą.

Geometrinė vidutinė vertė taip pat naudojama norint nustatyti vienodo atstumo vertę nuo didžiausios ir mažiausios charakteristikos verčių. Pavyzdžiui, draudimo bendrovė sudaro sutartis dėl automobilių draudimo paslaugų teikimo. Priklausomai nuo konkretaus draudžiamojo įvykio, draudimo išmoka gali svyruoti nuo 10 000 iki 100 000 dolerių per metus. Vidutinė draudimo išmokų suma bus USD.

Geometrinis vidurkis yra dydis, naudojamas kaip santykio vidurkis arba pasiskirstymo eilutėse, pateiktose geometrinės progresijos forma, kai z = 0. Šį vidurkį patogu naudoti, kai atkreipiamas dėmesys ne į absoliučius skirtumus, o į dviejų santykius. numeriai.

Skaičiavimo formulės yra tokios

kur yra rodiklio variantai, kurių vidurkis; – opcionų produktas; f– pasirinkimų dažnumas.

Apskaičiuojant vidutinius metinius augimo tempus, naudojamas geometrinis vidurkis.

Vidutinis kvadratas. Vidutinio kvadrato formulė naudojama atskirų charakteristikos verčių svyravimo laipsniui aplink aritmetinį vidurkį paskirstymo eilutėje. Taigi, skaičiuojant variacijos rodiklius, vidurkis apskaičiuojamas iš atskirų charakteristikos verčių nuokrypių kvadratu nuo aritmetinio vidurkio.

Vidutinė kvadratinė vertė apskaičiuojama pagal formulę

Ekonominiuose tyrimuose modifikuotas vidutinis kvadratas plačiai naudojamas skaičiuojant charakteristikos kitimo rodiklius, tokius kaip dispersija ir standartinis nuokrypis.

Daugumos taisyklė. Tarp galios vidurkių yra toks ryšys – kuo didesnis eksponentas, tuo didesnė vidurkio reikšmė, 5.4 lentelė:

5.4 lentelė

Ryšys tarp vidurkių

z reikšmė

Ryšys tarp vidurkių

Šis santykis vadinamas didžiumo taisykle.

Struktūriniai vidurkiai. Gyventojų struktūrai apibūdinti naudojami specialūs rodikliai, kuriuos galima pavadinti struktūriniais vidurkiais. Šie rodikliai apima režimą, medianą, kvartilius ir decilius.

Mada. Mode (Mo) yra dažniausiai pasitaikanti charakteristikos reikšmė tarp populiacijos vienetų. Režimas – tai atributo reikšmė, atitinkanti maksimalų teorinio pasiskirstymo kreivės tašką.

Mada plačiai naudojama komercinėje praktikoje tiriant vartotojų paklausą (nustatant itin paklausių drabužių ir avalynės dydžius), fiksuojant kainas. Iš viso gali būti keletas modifikacijų.

Režimo apskaičiavimas diskrečioje serijoje. Atskiros serijos režimas yra didžiausio dažnio variantas. Apsvarstykime galimybę rasti režimą atskiroje serijoje.

Režimo skaičiavimas intervalų serijoje. Intervalo variacijų serijoje režimas apytiksliai laikomas centriniu modalinio intervalo variantu, t.y. intervalas, kurio dažnis yra didžiausias (dažnis). Intervale turite rasti atributo, kuris yra režimas, reikšmę. Intervalų serijoms režimas bus nustatytas pagal formulę

kur yra apatinė modalinio intervalo riba; – modalinio intervalo reikšmė; – dažnis, atitinkantis modalinį intervalą; – dažnis prieš modalinį intervalą; – intervalo dažnis po modalinio.

Mediana. Mediana () yra reitinguojamos serijos vidurinio vieneto atributo reikšmė. Reitinguota serija yra serija, kurioje būdingos reikšmės rašomos didėjančia arba mažėjančia tvarka. Arba mediana yra reikšmė, padalijanti eilės variantų serijos skaičių į dvi lygias dalis: vienos dalies kintamos charakteristikos vertė yra mažesnė už vidutinę parinktį, o kitos vertė yra didesnė.

Norėdami rasti medianą, pirmiausia nustatykite jos eilės skaičių. Norėdami tai padaryti, jei vienetų skaičius yra nelyginis, prie visų dažnių sumos pridedamas vienas ir viskas dalijama iš dviejų. Esant lyginiam vienetų skaičiui, mediana randama kaip vieneto, kurio eilės numeris nustatomas bendra dažnių suma, padalyta iš dviejų, požymio reikšmė. Žinant medianos eilės numerį, naudojant sukauptus dažnius nesunku rasti jo vertę.

Medianos apskaičiavimas diskrečioje eilutėje. Atrankinės apklausos būdu gauti duomenys apie šeimų pasiskirstymą pagal vaikų skaičių, lentelė. 5.5. Norėdami nustatyti medianą, pirmiausia nustatome jos eilės skaičių

Šiose šeimose vaikų skaičius lygus 2, todėl = 2. Taigi 50 % šeimų vaikų skaičius neviršija 2.

– sukauptas dažnis prieš vidutinį intervalą;

Viena vertus, tai labai teigiama savybė, nes šiuo atveju atsižvelgiama į visų priežasčių, veikiančių visus tiriamos populiacijos vienetus, poveikį. Kita vertus, net vienas pastebėjimas, atsitiktinai įtrauktas į šaltinio duomenis, gali gerokai iškreipti idėją apie tiriamo požymio išsivystymo lygį nagrinėjamoje populiacijoje (ypač trumpose serijose).

Kvartiliai ir deciliai. Pagal analogiją su variacijų eilučių medianos nustatymu galite rasti bet kurio reitinguojamos serijos vieneto charakteristikos vertę. Taigi, ypač galite rasti atributo reikšmę vienetams, padalijantiems seriją į 4 lygias dalis, į 10 ir kt.

Kvartiliai. Parinktys, padalijančios reitinguotą seriją į keturias lygias dalis, vadinamos kvartiliais.

Šiuo atveju jie išskiria: apatinį (arba pirmąjį) kvartilį (Q1) - reitinguotos serijos vieneto atributo reikšmę, padalijančią populiaciją santykiu nuo ¼ iki ¾ ir viršutinį (arba trečiąjį) kvartilį ( Q3) - reitinguotos serijos vieneto požymio reikšmė, padalijant populiaciją santykiu nuo ¾ iki ¼.

- kvartilių intervalų dažniai (apatiniai ir viršutiniai)

Intervalai, kuriuose yra Q1 ir Q3, nustatomi pagal sukauptus dažnius (arba dažnius).

Deciliai. Be kvartilių, skaičiuojami deciliai – variantai, kurie reitinguojamą seriją padalija į 10 lygių dalių.

Jie žymimi D, pirmasis decilis D1 padalija eilutes santykiu 1/10 ir 9/10, antrasis D2 - 2/10 ir 8/10 ir kt. Jie apskaičiuojami pagal tą pačią schemą kaip mediana ir kvartiliai.

Tiek mediana, tiek kvartiliai, tiek deciliai priklauso vadinamajai eilės statistikai, kuri suprantama kaip parinktis, užimanti tam tikrą eilės vietą reitinguojamoje eilutėje.



Ar jums patiko straipsnis? Pasidalinkite su draugais!