Si të gjeni frekuencat e një serie intervali. Grupimi i të dhënave dhe ndërtimi i një serie shpërndarjeje

Ato janë paraqitur në formën e serive të shpërndarjes dhe janë paraqitur në formë.

Një seri shpërndarjeje është një nga llojet e grupimeve.

Gama e shpërndarjes- përfaqëson një shpërndarje të renditur të njësive të popullsisë që studiohen në grupe sipas një karakteristike të caktuar të ndryshueshme.

Në varësi të karakteristikës që qëndron në themel të formimit të serisë së shpërndarjes, ato dallohen atributive dhe variacionale rreshtat e shpërndarjes:

  • atributiv- quhen seri shpërndarjeje të ndërtuara sipas karakteristikave cilësore.
  • Seritë e shpërndarjes të ndërtuara në rend rritës ose zbritës të vlerave të një karakteristike sasiore quhen variacionale.
Seria e variacioneve të shpërndarjes përbëhet nga dy kolona:

Kolona e parë jep vlerat sasiore të karakteristikës së ndryshme, të cilat quhen opsionet dhe janë caktuar. Opsioni diskret - i shprehur si një numër i plotë. Opsioni i intervalit varion nga dhe në. Në varësi të llojit të opsioneve, mund të ndërtoni një seri variacionesh diskrete ose intervale.
Kolona e dytë përmban numri i opsioneve specifike, e shprehur në terma të frekuencave ose frekuencave:

Frekuencat- këta janë numra absolutë që tregojnë se sa herë ndodh gjithsej një vlerë e dhënë e një veçorie, të cilët tregojnë . Shuma e të gjitha frekuencave duhet të jetë e barabartë me numrin e njësive në të gjithë popullsinë.

Frekuencat() janë frekuenca të shprehura si përqindje e totalit. Shuma e të gjitha frekuencave e shprehur në përqindje duhet të jetë e barabartë me 100% në fraksione të një.

Paraqitja grafike e serive të shpërndarjes

Seritë e shpërndarjes janë paraqitur vizualisht duke përdorur imazhe grafike.

Seritë e shpërndarjes përshkruhen si:
  • Shumëkëndëshi
  • Histogramet
  • Kumulon
  • Ogives

Shumëkëndëshi

Kur ndërtohet një poligon, vlerat e karakteristikës së ndryshme vizatohen në boshtin horizontal (boshti x), dhe frekuencat ose frekuencat vizatohen në boshtin vertikal (boshti y).

Shumëkëndëshi në Fig. 6.1 bazohet në të dhënat nga mikroregjistrimi i popullsisë së Rusisë në 1994.

6.1. Shpërndarja e madhësisë së familjes

gjendja: Janë dhënë të dhëna për shpërndarjen e 25 punonjësve të njërës prej ndërmarrjeve sipas kategorive tarifore:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Detyrë: Ndërtoni një seri variacionesh diskrete dhe paraqisni atë grafikisht si një shumëkëndësh shpërndarjeje.
Zgjidhje:
Në këtë shembull, opsionet janë nota e pagës së punonjësit. Për të përcaktuar frekuencat, është e nevojshme të llogaritet numri i punonjësve me kategorinë përkatëse tarifore.

Shumëkëndëshi përdoret për seritë e variacioneve diskrete.

Për të ndërtuar një poligon të shpërndarjes (Fig. 1), ne grafikojmë vlerat sasiore të karakteristikave të ndryshme - opsionet - në boshtin e abshisës (X) dhe frekuencat ose frekuencat në boshtin e ordinatave.

Nëse vlerat e një karakteristike shprehen në formën e intervaleve, atëherë një seri e tillë quhet interval.
Seritë intervale shpërndarjet përshkruhen grafikisht në formën e një histogrami, kumulimi ose ogive.

Tabela statistikore

gjendja: Janë dhënë të dhëna për madhësinë e depozitave të 20 individëve në një bankë (mijë rubla) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Detyrë: Ndërtoni një seri variacionesh intervali me intervale të barabarta.
Zgjidhje:

  1. Popullsia fillestare përbëhet nga 20 njësi (N = 20).
  2. Duke përdorur formulën Sturgess, përcaktojmë numrin e kërkuar të grupeve të përdorura: n=1+3.322*lg20=5
  3. Le të llogarisim vlerën e intervalit të barabartë: i=(152 - 2) /5 = 30 mijë rubla
  4. Le ta ndajmë popullsinë fillestare në 5 grupe me një interval prej 30 mijë rubla.
  5. Rezultatet e grupimit i paraqesim në tabelë:

Me një regjistrim të tillë të një karakteristike të vazhdueshme, kur e njëjta vlerë ndodh dy herë (si kufiri i sipërm i një intervali dhe kufiri i poshtëm i një intervali tjetër), atëherë kjo vlerë i përket grupit ku kjo vlerë vepron si kufi i sipërm.

Histogrami

Për të ndërtuar një histogram, vlerat e kufijve të intervaleve tregohen në boshtin e abscisës dhe, në bazë të tyre, ndërtohen drejtkëndësha, lartësia e të cilave është në përpjesëtim me frekuencat (ose frekuencat).

Në Fig. 6.2. tregon një histogram të shpërndarjes së popullsisë ruse në 1997 sipas grupmoshës.

Oriz. 6.2. Shpërndarja e popullsisë ruse sipas grupmoshave

gjendja: Jepet shpërndarja e 30 punonjësve të kompanisë sipas pagës mujore

Detyrë: Shfaqni seritë e variacioneve të intervalit grafikisht në formën e një histogrami dhe grumbulloni.
Zgjidhje:

  1. Kufiri i panjohur i intervalit të hapur (të parë) përcaktohet nga vlera e intervalit të dytë: 7000 - 5000 = 2000 rubla. Me të njëjtën vlerë gjejmë kufirin e poshtëm të intervalit të parë: 5000 - 2000 = 3000 rubla.
  2. Për të ndërtuar një histogram në një sistem koordinativ drejtkëndor, ne grafikojmë përgjatë boshtit të abshisës segmentet, vlerat e të cilave korrespondojnë me intervalet e serisë varikoze.
    Këto segmente shërbejnë si bazë e poshtme, dhe frekuenca (frekuenca) përkatëse shërben si lartësia e drejtkëndëshave të formuar.
  3. Le të ndërtojmë një histogram:

Për të ndërtuar kumulat, është e nevojshme të llogariten frekuencat (frekuencat) e grumbulluara. Ato përcaktohen duke mbledhur në mënyrë sekuenciale frekuencat (frekuencat) e intervaleve të mëparshme dhe caktohen S. Frekuencat e grumbulluara tregojnë se sa njësi të popullsisë kanë një vlerë karakteristike jo më të madhe se ajo në shqyrtim.

Kumulon

Shpërndarja e një karakteristike në një seri variacionesh mbi frekuencat e akumuluara (frekuencat) përshkruhet duke përdorur një kumulate.

Kumulon ose një kurbë kumulative, ndryshe nga një shumëkëndësh, është ndërtuar nga frekuencat ose frekuencat e grumbulluara. Në këtë rast, vlerat e karakteristikës vendosen në boshtin e abshisave, dhe frekuencat ose frekuencat e grumbulluara vendosen në boshtin e ordinatave (Fig. 6.3).

Oriz. 6.3. Kumulimet e shpërndarjes së madhësisë së familjes

4. Le të llogarisim frekuencat e grumbulluara:
Frekuenca kumulative e intervalit të parë llogaritet si më poshtë: 0 + 4 = 4, për të dytin: 4 + 12 = 16; për të tretën: 4 + 12 + 8 = 24, etj.

Kur ndërtoni një kumulatë, frekuenca (frekuenca) e grumbulluar e intervalit përkatës i caktohet kufirit të sipërm të saj:

Ogiva

Ogivaështë ndërtuar në mënyrë të ngjashme me një kumulatë me ndryshimin e vetëm që frekuencat e grumbulluara vendosen në boshtin e abshisës dhe vlerat karakteristike vendosen në boshtin e ordinatave.

Një lloj kumulate është një kurbë përqendrimi ose grafik i Lorencit. Për të ndërtuar një kurbë përqendrimi, një shkallë në përqindje nga 0 në 100 është paraqitur në të dy akset e sistemit të koordinatave drejtkëndëshe, në të njëjtën kohë, frekuencat e grumbulluara tregohen në boshtin e abshisë dhe vlerat e grumbulluara të pjesës. (në përqindje) për nga vëllimi i karakteristikës tregohen në boshtin e ordinatave.

Shpërndarja uniforme e karakteristikës korrespondon me diagonalen e katrorit në grafik (Fig. 6.4). Me një shpërndarje të pabarabartë, grafiku paraqet një kurbë konkave në varësi të nivelit të përqendrimit të tiparit.

6.4. Kurba e përqendrimit

Mënyra më e thjeshtë për të përmbledhur materialin statistikor është ndërtimi i serive. Rezultati përmbledhës i një studimi statistikor mund të jetë seri e shpërndarjes. Një seri shpërndarjeje në statistika është një shpërndarje e renditur e njësive të popullsisë në grupe sipas çdo karakteristike: cilësore ose sasiore. Nëse një seri ndërtohet në bazë cilësore, atëherë ajo quhet atributive, dhe nëse në bazë sasiore, atëherë quhet variacionale.

Një seri variacionesh karakterizohet nga dy elementë: varianti (X) dhe frekuenca (f). Një variant është një vlerë e veçantë e një karakteristike të një njësie individuale ose grupi të një popullsie. Numri që tregon se sa herë ndodh një vlerë e caktuar e një veçorie quhet frekuencë. Nëse frekuenca shprehet si një numër relativ, atëherë quhet frekuencë. Një seri variacionesh mund të jetë intervalale, kur përcaktohen kufijtë "nga" dhe "deri", ose mund të jetë diskrete, kur karakteristika që studiohet karakterizohet nga një numër i caktuar.

Le të shohim ndërtimin e serive të variacioneve duke përdorur shembuj.

Shembull. dhe ka të dhëna për kategoritë tarifore të 60 punëtorëve në një nga punishtet e uzinës.

Shpërndani punëtorët sipas kategorisë së tarifave, ndërtoni një seri variacionesh.

Për ta bërë këtë, ne shkruajmë të gjitha vlerat e karakteristikës në rend rritës dhe numërojmë numrin e punëtorëve në secilin grup.

Tabela 1.4

Shpërndarja e punëtorëve sipas kategorive

Grada e punëtorëve (X)

Numri i punëtorëve

personi (f)

në % të totalit (në veçanti)

Ne morëm një seri diskrete variacionale në të cilën karakteristika që studiohet (grada e punëtorit) përfaqësohet nga një numër i caktuar. Për qartësi, seritë e variacioneve përshkruhen në mënyrë grafike. Bazuar në këtë seri shpërndarjeje, u ndërtua një sipërfaqe shpërndarëse.

Oriz. 1.1. Poligoni për shpërndarjen e punëtorëve sipas kategorive tarifore

Ne do të shqyrtojmë ndërtimin e një serie intervali me intervale të barabarta duke përdorur shembullin e mëposhtëm.

Shembull. Dihen të dhëna për vlerën e kapitalit fiks të 50 kompanive në milion rubla. Kërkohet të tregohet shpërndarja e firmave sipas kostos së kapitalit fiks.

Për të treguar shpërndarjen e firmave sipas kostos së kapitalit fiks, fillimisht zgjidhim çështjen e numrit të grupeve që duam të theksojmë. Supozoni se kemi vendosur të identifikojmë 5 grupe ndërmarrjesh. Pastaj përcaktojmë madhësinë e intervalit në grup. Për ta bërë këtë, ne përdorim formulën

Sipas shembullit tonë.

Duke shtuar vlerën e intervalit në vlerën minimale të atributit, marrim grupe firmash sipas kostos së kapitalit fiks.

Një njësi me vlerë të dyfishtë i përket grupit ku vepron si kufi i sipërm (d.m.th., vlera e atributit 17 do të shkojë në grupin e parë, 24 në të dytin, etj.).

Le të numërojmë numrin e fabrikave në secilin grup.

Tabela 1.5

Shpërndarja e firmave sipas vlerës së kapitalit fiks (milion rubla)

Kostoja e kapitalit fiks
në milion rubla (X)

Numri i firmave
(frekuenca) (f)

Frekuencat e grumbulluara
(kumulative)

Sipas kësaj shpërndarjeje, u përftua një seri intervali variacion, nga e cila rezulton se 36 firma kanë kapital fiks me vlerë nga 10 në 24 milion rubla. etj.

Seritë e shpërndarjes së intervalit mund të paraqiten grafikisht në formën e një histogrami.

Rezultatet e përpunimit të të dhënave janë paraqitur në tabelat statistikore. Tabelat statistikore përmbajnë temën dhe kallëzuesin e tyre.

Subjekti është tërësia ose pjesë e tërësisë që karakterizohet.

Kallëzuesit janë tregues që karakterizojnë temën.

Dallohen tabelat: të thjeshta dhe grupore, të kombinuara, me zhvillim të thjeshtë dhe kompleks të kallëzuesit.

Një tabelë e thjeshtë në subjekt përmban një listë të njësive individuale.

Nëse lënda përmban një grupim njësish, atëherë një tabelë e tillë quhet tabelë grupore. Për shembull, një grup ndërmarrjesh sipas numrit të punëtorëve, grupet e popullsisë sipas gjinisë.

Lënda e tabelës së kombinimit përmban grupimin sipas dy ose më shumë karakteristikave. Për shembull, popullsia ndahet sipas gjinisë në grupe sipas arsimit, moshës, etj.

Tabelat e kombinimit përmbajnë informacione që ju lejojnë të identifikoni dhe karakterizoni marrëdhënien e një numri treguesish dhe modelin e ndryshimeve të tyre si në hapësirë ​​ashtu edhe në kohë. Për ta bërë të qartë tabelën kur zhvilloni temën e saj, kufizoni veten në dy ose tre karakteristika, duke formuar një numër të kufizuar grupesh për secilën prej tyre.

Kallëzuesi në tabela mund të zhvillohet në mënyra të ndryshme. Me një zhvillim të thjeshtë të kallëzuesit, të gjithë treguesit e tij janë të vendosur në mënyrë të pavarur nga njëri-tjetri.

Me zhvillimin kompleks të kallëzuesit, treguesit kombinohen me njëri-tjetrin.

Gjatë ndërtimit të çdo tabele, duhet të vazhdohet nga qëllimet e studimit dhe nga përmbajtja e materialit të përpunuar.

Përveç tabelave, statistikat përdorin edhe grafikët dhe diagramet. Diagrami - të dhënat statistikore përshkruhen duke përdorur forma gjeometrike. Grafikët ndahen në grafikët linearë dhe me shtylla, por mund të ketë grafikët e figuruar (vizatimet dhe simbolet), grafikët me byrek (një rreth merret si madhësia e të gjithë popullsisë dhe zonat e sektorëve individualë shfaqin peshën specifike ose përqindjen e tij. komponentët), diagramet radiale (të ndërtuara në bazë të ordinatave polare). Një kartogram është një kombinim i një harte skicë ose planit të vendndodhjes me një diagram.

Nëse ndryshorja e rastësishme në studim është e vazhdueshme, atëherë renditja dhe grupimi i vlerave të vëzhguara shpesh nuk lejon identifikimin e tipareve karakteristike të variacionit në vlerat e tij. Kjo shpjegohet me faktin se vlerat individuale të një ndryshoreje të rastësishme mund të ndryshojnë nga njëra-tjetra aq pak sa të dëshirohet, dhe për këtë arsye, në tërësinë e të dhënave të vëzhguara, rrallë mund të ndodhin vlera identike të një sasie, dhe frekuencat e variantet ndryshojnë pak nga njëri-tjetri.

Është gjithashtu jopraktike të ndërtohet një seri diskrete për një ndryshore të rastësishme diskrete, numri i vlerave të mundshme të së cilës është i madh. Në raste të tilla, ju duhet të ndërtoni seritë e variacionit të intervalit shpërndarjet.

Për të ndërtuar një seri të tillë, i gjithë intervali i ndryshimit të vlerave të vëzhguara të një ndryshoreje të rastësishme ndahet në një seri. intervale të pjesshme dhe duke numëruar shpeshtësinë e shfaqjes së vlerave të vlerave në çdo interval të pjesshëm.

Seritë e variacionit të intervalit thirrni një grup të renditur intervalesh me vlera të ndryshme të një ndryshoreje të rastësishme me frekuencat përkatëse ose frekuencat relative të vlerave të ndryshores që bien në secilën prej tyre.

Për të ndërtuar një seri intervali ju nevojiten:

  1. përcaktojnë madhësia intervale të pjesshme;
  2. përcaktojnë gjerësia intervale;
  3. vendoseni për çdo interval krye Dhe kufiri i poshtëm ;
  4. gruponi rezultatet e vëzhgimit.

1 . Çështja e zgjedhjes së numrit dhe gjerësisë së intervaleve të grupimit duhet të vendoset në secilin rast specifik bazuar në qëllimet kërkime, vëllimi mostrat dhe shkalla e variacionit karakteristike në mostër.

Numri i përafërt i intervaleve k mund të vlerësohet bazuar vetëm në madhësinë e kampionit n në një nga mënyrat e mëposhtme:

  • sipas formulës Sturges : k = 1 + 3,32 log n ;
  • duke përdorur tabelën 1.

Tabela 1

2 . Në përgjithësi preferohen hapësira me gjerësi të barabartë. Për të përcaktuar gjerësinë e intervaleve h llogarit:

  • diapazoni i variacionit R - vlerat e mostrës: R = x max - x min ,

Ku xmax Dhe xmin - Opsionet maksimale dhe minimale të kampionimit;

  • gjerësia e çdo intervali h përcaktohet me formulën e mëposhtme: h = R/k .

3 . Kufiri më i ulët intervali i parë x h1 zgjidhet në mënyrë që opsioni minimal i mostrës xmin ra përafërsisht në mes të këtij intervali: x h1 = x min - 0,5 h .

Intervalet e ndërmjetme fitohet duke shtuar gjatësinë e intervalit të pjesshëm në fund të intervalit të mëparshëm h :

x hi = x hi-1 +h.

Ndërtimi i një shkalle intervali bazuar në llogaritjen e kufijve të intervalit vazhdon deri në vlerë x përshëndetje plotëson relacionin:

x përshëndetje< x max + 0,5·h .

4 . Në përputhje me shkallën e intervalit, vlerat karakteristike grupohen - për çdo interval të pjesshëm llogaritet shuma e frekuencave n i opsion i përfshirë në i intervali i th. Në këtë rast, intervali përfshin vlerat e ndryshores së rastësishme që janë më të mëdha ose të barabarta me kufirin e poshtëm dhe më të vogël se kufiri i sipërm i intervalit.

Shumëkëndëshi dhe histogrami

Për qartësi, ndërtohen grafikët e ndryshëm të shpërndarjes statistikore.

Bazuar në të dhënat e një serie variacionesh diskrete, ato ndërtojnë shumëkëndëshi frekuenca ose frekuenca relative.

Shumëkëndëshi i frekuencës x 1 ; n 1 ), (x 2 ; n 2 ), ..., (x k ; n k ). Për të ndërtuar një poligon të frekuencës, opsionet vizatohen në boshtin e abshisave. x i , dhe në ordinatë - frekuencat përkatëse n i . Pikat ( x i ; n i ) lidhen me segmente të drejta dhe fitohet një poligon i frekuencës (Fig. 1).

Shumëkëndëshi i frekuencave relative quhet një vijë e thyer, segmentet e së cilës lidhin pikat ( x 1 ; W 1 ), (x 2 ; W 2 ), ..., (x k ; Vk ). Për të ndërtuar një poligon të frekuencave relative, opsionet vizatohen në boshtin e abshisës x i , dhe në ordinatë - frekuencat përkatëse relative W i . Pikat ( x i ; W i ) lidhen me segmente të drejta dhe fitohet një shumëkëndësh me frekuenca relative.

Në rast shenjë e vazhdueshme këshillohet të ndërtohet histogrami .

Histogrami i frekuencës quhet një figurë me shkallë të përbërë nga drejtkëndësha, bazat e të cilave janë intervale të pjesshme të gjatësisë h , dhe lartësitë janë të barabarta me raportin NIH (dendësia e frekuencës).

Për të ndërtuar një histogram të frekuencës, në boshtin e abshisave vendosen intervale të pjesshme dhe sipër tyre vizatohen segmente paralele me boshtin e abshisave në një distancë. NIH .

Rezultatet e grupimit të të dhënave statistikore të mbledhura zakonisht paraqiten në formën e serive të shpërndarjes. Një seri shpërndarjeje është një shpërndarje e renditur e njësive të popullsisë në grupe sipas karakteristikës që studiohet.

Seritë e shpërndarjes ndahen në atributive dhe variacionale, në varësi të karakteristikës që përbën bazën e grupimit. Nëse atributi është cilësor, atëherë seria e shpërndarjes quhet atributive. Një shembull i një serie atributesh është shpërndarja e ndërmarrjeve dhe organizatave sipas llojit të pronësisë (shih Tabelën 3.1).

Nëse karakteristika me të cilën ndërtohet seria e shpërndarjes është sasiore, atëherë seria quhet variacionale.

Seria variacionale e një shpërndarjeje përbëhet gjithmonë nga dy pjesë: një variant dhe frekuencat (ose frekuencat) përkatëse. Një variant është vlera që një karakteristikë mund të marrë në njësi të popullsisë, ndërsa frekuenca është numri i njësive të vëzhgimit që kanë një vlerë të caktuar të karakteristikës. Shuma e frekuencave është gjithmonë e barabartë me vëllimin e popullatës. Ndonjëherë, në vend të frekuencave, llogariten frekuencat - këto janë frekuenca të shprehura ose si fraksione të një njësie (atëherë shuma e të gjitha frekuencave është e barabartë me 1), ose si përqindje e vëllimit të popullsisë (shuma e frekuencave do të të jetë e barabartë me 100%).

Seritë e variacioneve janë diskrete dhe intervale. Për seritë diskrete (Tabela 3.7), opsionet shprehen në numra specifikë, më shpesh në numra të plotë.

Tabela 3.8.
Shpërndarja e punonjësve sipas kohës së punës në shoqërinë e sigurimit Koha e punuar në kompani, vite të plota (opsione)
Numri i punonjësve Njeriu (frekuencat)
në % të totalit (frekuenca) 15 11,6
1 17 13,2
2 19 14,7
3 26 20,2
4 10 7,8
5 18 13,9
6 24 18,6
deri në një vit 129 100,0

Gjithsej

Në seritë e intervalit (shih tabelën 3.2), vlerat e treguesit specifikohen në formën e intervaleve. Intervalet kanë dy kufij: të poshtëm dhe të sipërm. Intervalet mund të jenë të hapura ose të mbyllura. Të hapurat nuk kanë një nga kufijtë, kështu që në tabelë. 3.2 intervali i parë nuk ka kufi të poshtëm dhe i fundit nuk ka kufi të sipërm. Kur ndërtohet një seri intervali, në varësi të natyrës së shpërndarjes së vlerave të atributeve, përdoren intervale të barabarta dhe të pabarabarta (Tabela 3.2 tregon një seri variacionesh me intervale të barabarta).

Nëse një karakteristikë merr një numër të kufizuar vlerash, zakonisht jo më shumë se 10, ndërtohen seri diskrete të shpërndarjes. Nëse opsioni është më i madh, atëherë seria diskrete humbet qartësinë e saj; në këtë rast, këshillohet përdorimi i formës së intervalit të serisë së variacionit. Me një ndryshim të vazhdueshëm të një karakteristike, kur vlerat e saj brenda kufijve të caktuar ndryshojnë nga njëra-tjetra në një sasi të vogël arbitrare, ndërtohet gjithashtu një seri shpërndarjeje intervali.

3.3.1. Ndërtimi i serive të variacioneve diskrete

Le të shqyrtojmë metodologjinë për ndërtimin e serive të variacioneve diskrete duke përdorur një shembull.

Shembulli 3.2. Të dhënat e mëposhtme janë të disponueshme për përbërjen sasiore të 60 familjeve:

Pastaj ju duhet të numëroni numrin e familjeve me të njëjtën përbërje. Numri i anëtarëve të familjes (vlera e një karakteristike të ndryshueshme) janë variante (do t'i shënojmë me x), numri i familjeve me të njëjtën përbërje janë frekuenca (do t'i shënojmë me f). Ne i paraqesim rezultatet e grupimit në formën e serisë së mëposhtme diskrete të shpërndarjes variacionale:

Tabela 3.11.
Numri i anëtarëve të familjes (x) Numri i familjeve (y)
1 8
2 14
3 20
4 9
5 5
6 4
deri në një vit 60

3.3.2. Ndërtimi i serive të variacionit të intervalit

Le të demonstrojmë metodologjinë për ndërtimin e serive të shpërndarjes së variacionit të intervalit duke përdorur shembullin e mëposhtëm.

Shembulli 3.3. Si rezultat i vëzhgimit statistikor, janë marrë të dhënat e mëposhtme për normën mesatare të interesit të 50 bankave tregtare (%):

Tabela 3.12.
14,7 19,0 24,5 20,8 12,3 24,6 17,0 14,2 19,7 18,8
18,1 20,5 21,0 20,7 20,4 14,7 25,1 22,7 19,0 19,6
19,0 18,9 17,4 20,0 13,8 25,6 13,0 19,0 18,7 21,1
13,3 20,7 15,2 19,9 21,9 16,0 16,9 15,3 21,4 20,4
12,8 20,8 14,3 18,0 15,1 23,8 18,5 14,4 14,4 21,0

Siç mund ta shohim, shikimi i një grupi të tillë të dhënash është jashtëzakonisht i papërshtatshëm, përveç kësaj, nuk ka modele të ndryshimeve në tregues. Le të ndërtojmë një seri shpërndarjeje intervali.

  1. Le të përcaktojmë numrin e intervaleve.

    Numri i intervaleve në praktikë shpesh përcaktohet nga vetë studiuesi bazuar në objektivat e çdo vëzhgimi specifik. Në të njëjtën kohë, ai gjithashtu mund të llogaritet matematikisht duke përdorur formulën Sturgess

    n = 1 + 3,322 lgN,

    ku n është numri i intervaleve;

    N është vëllimi i popullsisë (numri i njësive të vëzhgimit).

    Për shembullin tonë marrim: n = 1 + 3,322lgN = 1 + 3,322lg50 = 6,6"7.

  2. Le të përcaktojmë madhësinë e intervaleve (i) duke përdorur formulën

    ku x max është vlera maksimale e atributit;

    x min - vlera minimale e atributit.

    Për shembullin tonë

    Intervalet e një serie variacionesh janë të qarta nëse kufijtë e tyre kanë vlera "të rrumbullakëta", kështu që le të rrumbullakojmë vlerën e intervalit 1.9 në 2 dhe vlerën minimale të karakteristikës 12.3 në 12.0.

  3. Le të përcaktojmë kufijtë e intervaleve.

    Intervalet, si rregull, shkruhen në atë mënyrë që kufiri i sipërm i një intervali të jetë edhe kufiri i poshtëm i intervalit tjetër. Pra, për shembullin tonë marrim: 12.0-14.0; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24.0-26.0.

    Një hyrje e tillë do të thotë që atributi është i vazhdueshëm. Nëse variantet e një karakteristike marrin vlera të përcaktuara rreptësisht, për shembull, vetëm numra të plotë, por numri i tyre është shumë i madh për të ndërtuar një seri diskrete, atëherë mund të krijoni një seri intervali, ku kufiri i poshtëm i intervalit nuk do të përkojë me atë të sipërm. kufiri i intervalit të ardhshëm (kjo do të thotë që karakteristika është diskrete). Për shembull, në shpërndarjen e punonjësve të ndërmarrjes sipas moshës, mund të krijoni grupet e mëposhtme të intervalit të viteve: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 dhe më shumë.

    Për më tepër, në shembullin tonë, ne mund të hapim intervalin e parë dhe të fundit, etj. shkruani: deri në 14.0; 24.0 e lart.

  4. Bazuar në të dhënat fillestare, ne do të ndërtojmë një seri të renditur. Për ta bërë këtë, ne shkruajmë në rend rritës vlerat që merr shenja. Rezultatet i paraqesim në tabelë: Tabela 3.13.
    Seritë e renditura të normave të interesit të bankave tregtare
    12,3 17,0 19,9 23,8
    12,8 17,4 20,0 24,5
    13,0 18,0 20,0 24,6
    13,3 18,1 20,4 25,1
    13,8 18,5 20,4 25,6
    14,2 18,7 20,5
    14,3 18,8 20,7
    14,4 18,9 20,7
    14,7 19,0 20,8
    14,7 19,0 21,0
    15,1 19,0 21,0
    15,2 19,0 21,1
    15,3 19,0 21,4
    16,0 19,6 21,9
    16,9 19,7 22,7
  5. Norma bankare % (opsione)

    Le të numërojmë frekuencat.

Kur numëroni frekuencat, mund të lindë një situatë kur vlera e një veçorie bie në kufirin e një intervali. Në këtë rast, mund të udhëhiqeni nga rregulli: një njësi e caktuar i caktohet intervalit për të cilin vlera e saj është kufiri i sipërm. Pra, vlera 16.0 në shembullin tonë do t'i referohet intervalit të dytë.

Rezultatet e grupimit të marra në shembullin tonë do të paraqiten në një tabelë.
Tabela 3.14. Shpërndarja e bankave tregtare sipas normës së kreditimit Norma e shkurtër, %
12,0-14,0 5 5
14,0-16,0 9 14
16,0-18,0 4 18
18,0-20,0 15 33
20,0-22,0 11 44
22,0-24,0 2 46
24,0-26,0 4 50
deri në një vit 50 -

Numri i bankave, njësive (frekuencat)

Frekuencat e grumbulluara

Në shumë raste, kur një popullatë statistikore përfshin një numër të madh ose, aq më tepër, një numër të pafund variantesh, që më së shpeshti ndodh me variacion të vazhdueshëm, është praktikisht e pamundur dhe jopraktike të formohet një grup njësish për secilin variant. Në raste të tilla, kombinimi i njësive statistikore në grupe është i mundur vetëm në bazë të një intervali, d.m.th. një grup i tillë që ka kufij të caktuar për vlerat e një karakteristike të ndryshueshme. Këto kufij tregohen nga dy numra që tregojnë kufijtë e sipërm dhe të poshtëm të secilit grup. Përdorimi i intervaleve çon në formimin e një serie shpërndarjeje intervali.

Interval radështë një seri variacionesh, variantet e së cilës paraqiten në formë intervalesh.

Një seri intervali mund të formohet me intervale të barabarta dhe të pabarabarta, ndërsa zgjedhja e parimit për ndërtimin e kësaj serie varet kryesisht nga shkalla e përfaqësimit dhe komoditetit të popullatës statistikore. Nëse popullsia është mjaft e madhe (përfaqësuese) për sa i përket numrit të njësive dhe është plotësisht homogjene në përbërjen e saj, atëherë këshillohet që formimi i një serie intervali të bazohet në barazinë e intervaleve. Zakonisht, duke përdorur këtë parim, formohet një seri intervali për ato popullata ku diapazoni i variacionit është relativisht i vogël, d.m.th. opsionet maksimale dhe minimale zakonisht ndryshojnë nga njëri-tjetri disa herë. Në këtë rast, vlera e intervaleve të barabarta llogaritet nga raporti i diapazonit të ndryshimit të një karakteristike me një numër të caktuar intervalesh të formuara. Për të përcaktuar të barabartë Dhe intervali, formula Sturgess mund të përdoret (zakonisht me një ndryshim të vogël të karakteristikave të intervalit dhe një numër të madh njësish në popullatën statistikore):

ku x i - vlera e barabartë e intervalit; X max, X min - opsionet maksimale dhe minimale në një agregat statistikor; n . - numri i njësive në agregat.

Shembull. Këshillohet të llogaritet madhësia e një intervali të barabartë sipas densitetit të ndotjes radioaktive me cezium - 137 në 100 vendbanime të rrethit Krasnopolsky të rajonit Mogilev, nëse dihet që opsioni fillestar (minimumi) është i barabartë me 1 km. / km 2, finalja ( maksimumi) - 65 ki/km 2. Duke përdorur formulën 5.1. marrim:

Rrjedhimisht, për të formuar një seri intervali me intervale të barabarta për sa i përket densitetit të ndotjes së ceziumit - 137 vendbanime në rajonin e Krasnopolsky, madhësia e intervalit të barabartë mund të jetë 8 ki/km 2 .

Në kushtet e shpërndarjes së pabarabartë, d.m.th. kur opsionet maksimale dhe minimale janë qindra herë, kur formoni një seri intervali, mund të zbatoni parimin të pabarabartë intervale. Intervalet e pabarabarta zakonisht rriten ndërsa kalojmë në vlera më të mëdha të karakteristikës.

Forma e intervaleve mund të jetë e mbyllur ose e hapur. MbyllurËshtë zakon të quhen intervale që kanë kufijtë e poshtëm dhe të sipërm. Hapur intervalet kanë vetëm një kufi: në intervalin e parë ka një kufi të sipërm, në të fundit ka një kufi të poshtëm.

Është e këshillueshme që të vlerësohen seritë e intervalit, veçanërisht me intervale të pabarabarta, duke marrë parasysh dendësia e shpërndarjes, mënyra më e thjeshtë për të llogaritur se cila është raporti i frekuencës (ose frekuencës) lokale me madhësinë e intervalit.

Për të formuar praktikisht një seri intervali, mund të përdorni paraqitjen e tabelës. 5.3.

Tabela 5.3. Procedura për formimin e një serie intervalesh vendbanimesh në rajonin Krasnopolsky sipas densitetit të ndotjes radioaktive me cezium -137

Avantazhi kryesor i serisë së intervalit është maksimumi i tij kompaktësia. në të njëjtën kohë, në serinë e shpërndarjes së intervalit, variantet individuale të karakteristikës fshihen në intervalet përkatëse

Kur përshkruani grafikisht një seri intervali në një sistem koordinatash drejtkëndëshe, kufijtë e sipërm të intervaleve vizatohen në boshtin e abshisës dhe frekuencat lokale të serisë vizatohen në boshtin e ordinatave. Ndërtimi grafik i një serie intervali ndryshon nga ndërtimi i një poligoni të shpërndarjes në atë që çdo interval ka kufijtë e poshtëm dhe të sipërm, dhe dy abshisa korrespondojnë me një vlerë ordinate. Prandaj, në grafikun e një serie intervali, nuk shënohet një pikë, si në një shumëkëndësh, por një vijë që lidh dy pika. Këto vija horizontale lidhen me njëra-tjetrën me vija vertikale dhe fitohet figura e një shumëkëndëshi me shkallë, i cili zakonisht quhet histogrami shpërndarja (Fig. 5.3).

Kur ndërtohet grafikisht një seri intervali për një popullsi statistikore mjaft të madhe, histogrami afrohet simetrike forma e shpërndarjes. Në ato raste kur popullsia statistikore është e vogël, si rregull, asimetrike histogrami.

Në disa raste, këshillohet të formohen një sërë frekuencash të grumbulluara, d.m.th. kumulative rresht. Një seri kumulative mund të formohet në bazë të një serie diskrete ose intervali të shpërndarjes. Kur përshkruani grafikisht një seri kumulative në një sistem koordinatash drejtkëndëshe, variantet vizatohen në boshtin e abshisës dhe frekuencat (frekuencat) e grumbulluara vizatohen në boshtin e ordinatave. Vija e lakuar që rezulton zakonisht quhet kumulative shpërndarja (Fig. 5.4).

Formimi dhe paraqitja grafike e llojeve të ndryshme të serive të variacionit kontribuon në një llogaritje të thjeshtuar të karakteristikave kryesore statistikore, të cilat diskutohen në detaje në temën 6, dhe ndihmon për të kuptuar më mirë thelbin e ligjeve të shpërndarjes së popullatës statistikore. Analiza e një serie variacionesh merr një rëndësi të veçantë në rastet kur është e nevojshme të identifikohet dhe gjurmohet marrëdhënia midis opsioneve dhe frekuencave (frekuencave). Kjo varësi manifestohet në faktin se numri i rasteve për opsion është në një mënyrë të caktuar i lidhur me madhësinë e këtij opsioni, d.m.th. me rritjen e vlerave të karakteristikave të ndryshme, frekuencat (frekuencat) e këtyre vlerave përjetojnë ndryshime të caktuara, sistematike. Kjo do të thotë që numrat në kolonën e frekuencës (frekuencës) nuk luhaten në mënyrë kaotike, por ndryshojnë në një drejtim të caktuar, në një rend dhe sekuencë të caktuar.

Nëse frekuencat tregojnë një sistematikë të caktuar në ndryshimet e tyre, atëherë kjo do të thotë se ne jemi në rrugën e identifikimit të një modeli. Sistemi, rendi, sekuenca e ndryshimeve në frekuenca është një pasqyrim i shkaqeve të përgjithshme, kushteve të përgjithshme karakteristike për të gjithë popullsinë.

Nuk duhet të supozohet se modeli i shpërndarjes jepet gjithmonë në formë të gatshme. Ka mjaft seri variacionesh në të cilat frekuencat kërcejnë çuditërisht, ndonjëherë duke u rritur, nganjëherë duke u ulur. Në raste të tilla, këshillohet të zbulohet se me çfarë lloj shpërndarjeje ka të bëjë studiuesi: ose kjo shpërndarje nuk ka fare modele të qenësishme, ose natyra e saj nuk është zbuluar ende: Rasti i parë është i rrallë, por i dyti. rasti është një fenomen mjaft i zakonshëm dhe shumë i përhapur.

Kështu, kur formohet një seri intervali, numri i përgjithshëm i njësive statistikore mund të jetë i vogël, dhe çdo interval përmban një numër të vogël variantesh (për shembull, 1-3 njësi). Në raste të tilla, nuk mund të mbështetet në shfaqjen e ndonjë modeli. Që të merret një rezultat natyror në bazë të vëzhgimeve të rastësishme, duhet të hyjë në fuqi ligji i numrave të mëdhenj, d.m.th. kështu që për çdo interval do të kishte jo disa, por dhjetëra e qindra njësi statistikore. Për këtë qëllim, duhet të përpiqemi të rrisim sa më shumë numrin e vëzhgimeve. Kjo është mënyra më e sigurt për të zbuluar modelet në proceset masive. Nëse nuk ka mundësi reale për të rritur numrin e vëzhgimeve, atëherë identifikimi i një modeli mund të arrihet duke zvogëluar numrin e intervaleve në serinë e shpërndarjes. Duke zvogëluar numrin e intervaleve në një seri variacionesh, numri i frekuencave në çdo interval rritet në këtë mënyrë. Kjo do të thotë se luhatjet e rastësishme të secilës njësi statistikore mbivendosen mbi njëra-tjetrën, "zbuten", duke u kthyer në një model.

Formimi dhe ndërtimi i serive të variacioneve na lejon të marrim vetëm një pamje të përgjithshme, të përafërt të shpërndarjes së popullsisë statistikore. Për shembull, një histogram vetëm në formë të përafërt shpreh marrëdhënien midis vlerave të një karakteristike dhe frekuencave të saj (frekuencave). shpërndarja.

PYETJE TESTI PËR TEMËN 5

1. Çfarë është variacioni? Çfarë shkakton ndryshim në një tipar në një popullatë statistikore?

2. Cilat lloje të karakteristikave të ndryshme mund të shfaqen në statistika?

3. Çfarë është një seri variacionesh? Çfarë lloje të serive të variacioneve mund të ketë?

4. Çfarë është një seri e renditur? Cilat janë avantazhet dhe disavantazhet e tij?

5. Çfarë është një seri diskrete dhe cilat janë avantazhet dhe disavantazhet e saj?

6. Cila është procedura për formimin e një serie intervali, cilat janë avantazhet dhe disavantazhet e saj?

7. Çfarë është një paraqitje grafike e serive të renditura, diskrete, të shpërndarjes intervale?

8. Cila është kumulata e shpërndarjes dhe çfarë karakterizon?



Ju pëlqeu artikulli? Ndani me miqtë tuaj!