Çfarë është një seri variacionesh në statistika. Përkufizimi i serisë së variacionit

Si rezultat i zotërimit të këtij kapitulli, studenti duhet: e di

  • treguesit e variacionit dhe marrëdhëniet e tyre;
  • ligjet bazë të shpërndarjes së karakteristikave;
  • thelbi i kritereve të pëlqimit; të jetë në gjendje të
  • llogaritin indekset e variacionit dhe kriteret e përshtatshmërisë;
  • të përcaktojë karakteristikat e shpërndarjes;
  • të vlerësojë karakteristikat kryesore numerike të serive të shpërndarjes statistikore;

vet

  • metodat e analizës statistikore të serive të shpërndarjes;
  • bazat e analizës së variancës;
  • teknikat për kontrollimin e serive të shpërndarjes statistikore për pajtueshmërinë me ligjet bazë të shpërndarjes.

Treguesit e variacionit

Në studimin statistikor të karakteristikave të popullatave të ndryshme statistikore, është me interes të madh studimi i variacionit të karakteristikës së njësive individuale statistikore të popullsisë, si dhe natyra e shpërndarjes së njësive sipas kësaj karakteristike. Variacion - këto janë dallime në vlerat individuale të një karakteristike midis njësive të popullsisë që studiohen. Studimi i variacionit ka një rëndësi të madhe praktike. Nga shkalla e variacionit, mund të gjykohen kufijtë e variacionit të një karakteristike, homogjeniteti i popullsisë për një karakteristikë të caktuar, tipikiteti i mesatares dhe marrëdhënia e faktorëve që përcaktojnë variacionin. Treguesit e variacionit përdoren për të karakterizuar dhe organizuar popullatat statistikore.

Rezultatet e përmbledhjes dhe grupimit të materialeve të vëzhgimit statistikor, të paraqitura në formën e serive të shpërndarjes statistikore, përfaqësojnë një shpërndarje të renditur të njësive të popullsisë që studiohen në grupe sipas kritereve të grupimit (ndryshimit). Nëse një karakteristikë cilësore merret si bazë për grupimin, atëherë quhet një seri e tillë e shpërndarjes atributiv(shpërndarja sipas profesionit, gjinisë, ngjyrës etj.). Nëse një seri e shpërndarjes ndërtohet në bazë sasiore, atëherë një seri e tillë quhet variacionale(shpërndarja sipas gjatësisë, peshës, pagës, etj.). Të ndërtosh një seri variacionesh do të thotë të organizosh shpërndarjen sasiore të njësive të popullsisë sipas vlerave karakteristike, të numërosh numrin e njësive të popullsisë me këto vlera (frekuencë) dhe të renditësh rezultatet në një tabelë.

Në vend të frekuencës së një varianti, është e mundur të përdoret raporti i tij me vëllimin e përgjithshëm të vëzhgimeve, i cili quhet frekuencë (frekuencë relative).

Ekzistojnë dy lloje të serive të variacioneve: diskrete dhe intervale. Seri diskrete- Kjo është një seri variacionesh, ndërtimi i së cilës bazohet në karakteristika me ndryshime të ndërprera (karakteristika diskrete). Këto të fundit përfshijnë numrin e punonjësve në ndërmarrje, kategorinë tarifore, numrin e fëmijëve në familje, etj. Një seri variacionesh diskrete përfaqëson një tabelë që përbëhet nga dy kolona. Kolona e parë tregon vlerën specifike të atributit, dhe kolona e dytë tregon numrin e njësive në popullatë me një vlerë specifike të atributit. Nëse një karakteristikë ka një ndryshim të vazhdueshëm (shuma e të ardhurave, kohëzgjatja e shërbimit, kostoja e aseteve fikse të ndërmarrjes, etj., e cila brenda kufijve të caktuar mund të marrë çdo vlerë), atëherë për këtë karakteristikë është e mundur të ndërtohet seritë e variacionit të intervalit. Kur ndërtohet një seri e variacionit të intervalit, tabela ka gjithashtu dy kolona. E para tregon vlerën e atributit në intervalin "nga - në" (opsione), e dyta tregon numrin e njësive të përfshira në interval (frekuencë). Frekuenca (frekuenca e përsëritjes) - numri i përsëritjeve të një varianti të caktuar të vlerave të atributeve. Intervalet mund të jenë të mbyllura ose të hapura. Intervalet e mbyllura janë të kufizuara nga të dyja anët, d.m.th. kanë edhe një kufi të poshtëm (“nga”) dhe një kufi të sipërm (“në”). Intervalet e hapura kanë një kufi: ose të sipërm ose të poshtëm. Nëse opsionet janë të renditura në rend rritës ose zbritës, atëherë thirren rreshtat renditur.

Për seritë e variacioneve, ekzistojnë dy lloje opsionesh të përgjigjes së frekuencës: frekuenca e akumuluar dhe frekuenca e akumuluar. Frekuenca e akumuluar tregon se sa vëzhgime vlera e karakteristikës mori vlera më pak se vlera e specifikuar. Frekuenca e akumuluar përcaktohet duke përmbledhur vlerat e frekuencës së një karakteristike për një grup të caktuar me të gjitha frekuencat e grupeve të mëparshme. Frekuenca e akumuluar karakterizon proporcionin e njësive të vëzhgimit, vlerat e atributeve të të cilave nuk e kalojnë kufirin e sipërm të grupit të caktuar. Kështu, frekuenca e akumuluar tregon proporcionin e opsioneve në total që kanë një vlerë jo më të madhe se ajo e dhënë. Frekuenca, frekuenca, dendësia absolute dhe relative, frekuenca dhe frekuenca e grumbulluar janë karakteristika të madhësisë së variantit.

Ndryshimet në karakteristikat e njësive statistikore të popullsisë, si dhe natyra e shpërndarjes, studiohen duke përdorur tregues dhe karakteristika të serisë së variacionit, të cilët përfshijnë nivelin mesatar të serisë, devijimin mesatar linear, devijimin standard, dispersionin. , koeficientët e lëkundjes, variacionit, asimetrisë, kurtozës etj.

Vlerat mesatare përdoren për të karakterizuar qendrën e shpërndarjes. Mesatarja është një karakteristikë statistikore përgjithësuese në të cilën përcaktohet sasia e nivelit tipik të një karakteristike të zotëruar nga anëtarët e popullsisë që studiohet. Megjithatë, rastet e koincidencës së mesatareve aritmetike me modele të ndryshme të shpërndarjes janë të mundshme, prandaj, si karakteristika statistikore të serive të variacionit, llogariten të ashtuquajturat mesatare strukturore - modaliteti, mesatarja, si dhe sasitë, të cilat e ndajnë serinë e shpërndarjes në pjesë të barabarta. (kuartilët, decilat, përqindjet, etj.).

Moda - Kjo është vlera e një karakteristike që shfaqet në serinë e shpërndarjes më shpesh sesa vlerat e tjera të saj. Për seritë diskrete, ky është opsioni me frekuencën më të lartë. Në seritë e variacionit të intervalit, për të përcaktuar modalitetin, fillimisht është e nevojshme të përcaktohet intervali në të cilin ndodhet, i ashtuquajturi interval modal. Në një seri variacionesh me intervale të barabarta, intervali modal përcaktohet nga frekuenca më e lartë, në seri me intervale të pabarabarta - por nga dendësia më e lartë e shpërndarjes. Formula përdoret më pas për të përcaktuar modalitetin në rreshta në intervale të barabarta

ku Mo është vlera e modës; xMo - kufiri i poshtëm i intervalit modal; h- gjerësia e intervalit modal; / Mo - frekuenca e intervalit modal; / Mo j është frekuenca e intervalit premodal; / Mo+1 është frekuenca e intervalit post-modal, dhe për një seri me intervale të pabarabarta në këtë formulë llogaritëse, në vend të frekuencave / Mo, / Mo, / Mo, duhet të përdoren densitetet e shpërndarjes. Mendje 0 _| , Mendje 0> UMO+"

Nëse ekziston një modalitet i vetëm, atëherë shpërndarja e probabilitetit të ndryshores së rastësishme quhet unimodale; nëse ka më shumë se një modalitet, ai quhet multimodal (polimodal, multimodal), në rastin e dy mënyrave - bimodale. Si rregull, multimodaliteti tregon se shpërndarja në studim nuk i bindet ligjit normal të shpërndarjes. Popullatat homogjene, si rregull, karakterizohen nga shpërndarje me një kulm. Multivertex tregon gjithashtu heterogjenitetin e popullsisë që studiohet. Shfaqja e dy ose më shumë kulmeve e bën të nevojshme rigrupimin e të dhënave në mënyrë që të identifikohen grupe më homogjene.

Në një seri variacionesh intervali, modaliteti mund të përcaktohet grafikisht duke përdorur një histogram. Për ta bërë këtë, vizatoni dy linja kryqëzuese nga pikat e sipërme të kolonës më të lartë të histogramit në pikat e sipërme të dy kolonave ngjitur. Pastaj, nga pika e kryqëzimit të tyre, një pingul ulet në boshtin e abscisës. Vlera e veçorisë në boshtin x që i korrespondon pingules është modaliteti. Në shumë raste, kur karakterizohet një popullsi, preferenca i jepet mënyrës dhe jo mesatares aritmetike si një tregues i përgjithësuar.

mesatare - Kjo është vlera qendrore e atributit që zotërohet nga anëtari qendror i serisë së renditur të shpërndarjes. Në seritë diskrete, për të gjetur vlerën e medianës, fillimisht përcaktohet numri i saj serial. Për ta bërë këtë, nëse numri i njësive është tek, një i shtohet shumës së të gjitha frekuencave dhe numri pjesëtohet me dy. Nëse ka një numër çift njësish në një rresht, do të ketë dy njësi mesatare, kështu që në këtë rast mediana përcaktohet si mesatarja e vlerave të dy njësive mesatare. Kështu, mesatarja në një seri variacion diskrete është vlera që e ndan serinë në dy pjesë që përmbajnë të njëjtin numër opsionesh.

Në seritë e intervalit, pas përcaktimit të numrit serial të medianës, intervali medial gjendet duke përdorur frekuencat e grumbulluara (frekuencat), dhe më pas duke përdorur formulën për llogaritjen e medianës, përcaktohet vlera e vetë medianës:

ku Unë është vlera mesatare; x Une - kufiri i poshtëm i intervalit mesatar; h- gjerësia e intervalit mesatar; - shuma e frekuencave të serisë së shpërndarjes; /D - frekuenca e akumuluar e intervalit paramedian; /Me - frekuenca e intervalit mesatar.

Mesatarja mund të gjendet grafikisht duke përdorur një kumulatë. Për ta bërë këtë, në shkallën e frekuencave (frekuencave) të grumbulluara të grumbullimit, nga pika që korrespondon me numrin rendor të medianës, vizatohet një vijë e drejtë paralele me boshtin e abshisë derisa të kryqëzohet me kumulacionin. Tjetra, nga pika e kryqëzimit të vijës së treguar me kumulatin, një pingul ulet në boshtin e abscisës. Vlera e atributit në boshtin x që i korrespondon ordinatës së vizatuar (perpendikulare) është mediana.

Mesatarja karakterizohet nga vetitë e mëposhtme.

  • 1. Nuk varet nga ato vlera të atributeve që ndodhen në të dyja anët e tij.
  • 2. Ka vetinë e minimalitetit, që do të thotë se shuma e devijimeve absolute të vlerave të atributeve nga mediana përfaqëson një vlerë minimale në krahasim me devijimin e vlerave të atributeve nga çdo vlerë tjetër.
  • 3. Kur kombinohen dy shpërndarje me mediana të njohura, është e pamundur të parashikohet paraprakisht vlera e medianës së shpërndarjes së re.

Këto veti të mesatares përdoren gjerësisht gjatë projektimit të vendndodhjes së pikave të shërbimit publik - shkolla, klinika, stacione karburanti, pompa uji, etj. Për shembull, nëse planifikohet të ndërtohet një klinikë në një bllok të caktuar të qytetit, atëherë do të ishte më e leverdishme vendosja e saj në një pikë të bllokut që përgjysmon jo gjatësinë e bllokut, por numrin e banorëve.

Raporti i mënyrës, mesatares dhe mesatares aritmetike tregon natyrën e shpërndarjes së karakteristikës në agregat dhe na lejon të vlerësojmë simetrinë e shpërndarjes. Nëse x Me atëherë ka një asimetri në anën e djathtë të serisë. Me shpërndarje normale X - Unë - Mo.

K. Pearson, bazuar në shtrirjen e llojeve të ndryshme të kurbave, përcaktoi se për shpërndarje mesatarisht asimetrike janë të vlefshme marrëdhëniet e mëposhtme të përafërta midis mesatares aritmetike, mesatares dhe modës:

ku Unë është vlera mesatare; Mo - kuptimi i modës; x aritmi - vlera e mesatares aritmetike.

Nëse ekziston nevoja për të studiuar strukturën e serisë së variacionit në më shumë detaje, atëherë llogaritni vlerat karakteristike të ngjashme me mesataren. Vlerat e tilla karakteristike i ndajnë të gjitha njësitë e shpërndarjes në numër të barabartë ato quhen kuantile ose gradient. Kuantilet ndahen në kuartilë, decila, përqindje etj.

Kuartilët e ndajnë popullsinë në katër pjesë të barabarta. Kuartili i parë llogaritet në mënyrë të ngjashme me mesataren duke përdorur formulën për llogaritjen e kuartilit të parë, duke përcaktuar më parë intervalin e parë tremujor:

ku Qi është vlera e kuartilit të parë; xQ^- kufiri i poshtëm i diapazonit të kuartilit të parë; h- gjerësia e intervalit të tremujorit të parë; /, - frekuencat e serisë së intervalit;

Frekuenca kumulative në intervalin që i paraprin intervalit të kuartilit të parë; Jq ( - frekuenca e intervalit të kuartilit të parë.

Kuartili i parë tregon se 25% e njësive të popullsisë janë më pak se vlera e tij, dhe 75% janë më shumë. Kuartili i dytë është i barabartë me mesataren, d.m.th. Q 2 = Unë.

Për analogji, çerekteri i tretë llogaritet, pasi së pari ka gjetur intervalin e tretë tremujor:

ku është kufiri i poshtëm i gamës së kuartilit të tretë; h- gjerësia e intervalit të kuartilit të tretë; /, - frekuencat e serisë së intervalit; /X" - frekuenca e akumuluar në intervalin e mëparshëm

G

intervali i kuartilit të tretë; Jq është frekuenca e intervalit të kuartilit të tretë.

Kuartili i tretë tregon se 75% e njësive të popullsisë janë më pak se vlera e tij dhe 25% janë më shumë.

Dallimi midis kuartilit të tretë dhe të parë është diapazoni ndërkuartilor:

ku Aq është vlera e diapazonit ndërkuartil; Q 3 - vlera e kuartilit të tretë; Q, është vlera e kuartilit të parë.

Decilat e ndajnë popullsinë në 10 pjesë të barabarta. Një decil është një vlerë e një karakteristike në një seri shpërndarjeje që korrespondon me të dhjetat e madhësisë së popullsisë. Për analogji me kuartilët, decili i parë tregon se 10% e njësive të popullsisë janë më pak se vlera e tij, dhe 90% janë më të mëdha, dhe decili i nëntë tregon se 90% e njësive të popullsisë janë më pak se vlera e tij, dhe 10% janë më i madh. Raporti i decilit të nëntë dhe të parë, d.m.th. Koeficienti i decilit përdoret gjerësisht në studimin e diferencimit të të ardhurave për të matur raportin e niveleve të të ardhurave të 10% të popullsisë më të pasur dhe 10% të popullsisë më pak të pasur. Përqindjet e ndajnë popullsinë e renditur në 100 pjesë të barabarta. Llogaritja, kuptimi dhe zbatimi i përqindjeve janë të ngjashme me decilat.

Kuartilet, decilat dhe karakteristikat e tjera strukturore mund të përcaktohen grafikisht me analogji me mesataren duke përdorur kumulat.

Për të matur madhësinë e variacionit, përdoren treguesit e mëposhtëm: diapazoni i variacionit, devijimi mesatar linear, devijimi standard, dispersioni. Madhësia e diapazonit të variacionit varet tërësisht nga rastësia e shpërndarjes së anëtarëve ekstremë të serisë. Ky tregues është me interes në rastet kur është e rëndësishme të dihet se cila është amplituda e luhatjeve në vlerat e një karakteristike:

Ku R- vlera e gamës së variacionit; x max - vlera maksimale e atributit; x tt - vlera minimale e atributit.

Gjatë llogaritjes së diapazonit të variacionit, vlera e shumicës dërrmuese të anëtarëve të serisë nuk merret parasysh, ndërsa variacioni shoqërohet me secilën vlerë të anëtarit të serisë. Treguesit që janë mesatarë të marrë nga devijimet e vlerave individuale të një karakteristike nga vlera mesatare e tyre nuk e kanë këtë pengesë: devijimi mesatar linear dhe devijimi standard. Ekziston një lidhje e drejtpërdrejtë midis devijimeve individuale nga mesatarja dhe ndryshueshmërisë së një tipari të veçantë. Sa më i fortë të jetë luhatja, aq më e madhe është madhësia absolute e devijimeve nga mesatarja.

Devijimi mesatar linear është mesatarja aritmetike e vlerave absolute të devijimeve të opsioneve individuale nga vlera mesatare e tyre.

Devijimi mesatar linear për të dhënat e pagrupuara

ku /pr është vlera e devijimit mesatar linear; x, - është vlera e atributit; X - p - numri i njësive në popullatë.

Devijimi mesatar linear i serisë së grupuar

ku / vz - vlera e devijimit mesatar linear; x, është vlera e atributit; X - vlera mesatare e karakteristikës për popullsinë që studiohet; / - numri i njësive të popullsisë në një grup të veçantë.

Në këtë rast, shenjat e devijimeve injorohen, përndryshe shuma e të gjitha devijimeve do të jetë e barabartë me zero. Devijimi mesatar linear, në varësi të grupimit të të dhënave të analizuara, llogaritet duke përdorur formula të ndryshme: për të dhënat e grupuara dhe të pagrupuara. Për shkak të konventës së tij, devijimi mesatar linear, veçmas nga treguesit e tjerë të variacionit, përdoret në praktikë relativisht rrallë (në veçanti, për të karakterizuar përmbushjen e detyrimeve kontraktuale në lidhje me uniformitetin e dorëzimit; në analizën e qarkullimit të tregtisë së jashtme, përbërjen të punonjësve, ritmin e prodhimit, cilësinë e produktit, duke marrë parasysh veçoritë teknologjike të prodhimit etj.).

Devijimi standard karakterizon se sa mesatarisht devijojnë vlerat individuale të karakteristikës që studiohet nga vlera mesatare e popullsisë dhe shprehet në njësi matëse të karakteristikës që studiohet. Devijimi standard, duke qenë një nga matësit kryesorë të variacionit, përdoret gjerësisht në vlerësimin e kufijve të variacionit të një karakteristike në një popullatë homogjene, në përcaktimin e vlerave ordinate të një kurbë të shpërndarjes normale, si dhe në llogaritjet që lidhen me organizimi i vëzhgimit të mostrës dhe përcaktimi i saktësisë së karakteristikave të mostrës. Devijimi standard i të dhënave të pagrupuara llogaritet duke përdorur algoritmin e mëposhtëm: çdo devijim nga mesatarja është në katror, ​​të gjithë katrorët mblidhen, pas së cilës shuma e katrorëve pjesëtohet me numrin e termave të serisë dhe rrënja katrore nxirret nga koeficienti:

ku një Iip është vlera e devijimit standard; Xj- vlera e atributit; X- vlera mesatare e karakteristikës për popullsinë që studiohet; p - numri i njësive në popullatë.

Për të dhënat e analizuara të grupuara, devijimi standard i të dhënave llogaritet duke përdorur formulën e ponderuar

Ku - vlera e devijimit standard; Xj- vlera e atributit; X - vlera mesatare e karakteristikës për popullsinë që studiohet; f x - numri i njësive të popullsisë në një grup të caktuar.

Shprehja nën rrënjë në të dyja rastet quhet variancë. Kështu, dispersioni llogaritet si katrori mesatar i devijimeve të vlerave të atributeve nga vlera mesatare e tyre. Për vlerat e atributeve të papeshuara (të thjeshta), varianca përcaktohet si më poshtë:

Për vlerat karakteristike të ponderuara

Ekziston edhe një metodë e veçantë e thjeshtuar për llogaritjen e variancës: në përgjithësi

për vlerat karakteristike të papeshuara (të thjeshta). për vlerat karakteristike të ponderuara
duke përdorur metodën e bazuar në zero

ku a 2 është vlera e dispersionit; x, - është vlera e atributit; X - vlera mesatare e karakteristikës, h- vlera e intervalit në grup, t 1 - pesha (A =

Dispersioni ka shprehjen e vet në statistika dhe është një nga treguesit më të rëndësishëm të variacionit. Ajo matet në njësi që korrespondojnë me katrorin e njësive matëse të karakteristikës që studiohet.

Dispersioni ka vetitë e mëposhtme.

  • 1. Varianca e një vlere konstante është zero.
  • 2. Zvogëlimi i të gjitha vlerave të një karakteristike me të njëjtën vlerë A nuk e ndryshon vlerën e dispersionit. Kjo do të thotë që katrori mesatar i devijimeve mund të llogaritet jo nga vlerat e dhëna të një karakteristike, por nga devijimet e tyre nga një numër konstant.
  • 3. Reduktimi i çdo vlere karakteristike në k herë zvogëlon shpërndarjen nga k 2 herë, dhe devijimi standard është in k herë, d.m.th. të gjitha vlerat e atributit mund të ndahen me një numër konstant (të themi, me vlerën e intervalit të serisë), devijimi standard mund të llogaritet dhe më pas të shumëzohet me një numër konstant.
  • 4. Nëse llogarisim katrorin mesatar të devijimeve nga çdo vlerë Dhe duke ndryshuar në një shkallë ose në një tjetër nga mesatarja aritmetike, atëherë do të jetë gjithmonë më i madh se katrori mesatar i devijimeve të llogaritura nga mesatarja aritmetike. Sheshi mesatar i devijimeve do të jetë më i madh për një sasi shumë të caktuar - me katrorin e diferencës midis mesatares dhe kësaj vlere të marrë në mënyrë konvencionale.

Ndryshimi i një karakteristike alternative konsiston në praninë ose mungesën e pronës së studiuar në njësi të popullsisë. Në mënyrë sasiore, ndryshimi i një atributi alternativ shprehet me dy vlera: prania e një njësie të vetive të studiuara shënohet me një (1), dhe mungesa e saj shënohet me zero (0). Përqindja e njësive që kanë pronën që studiohet shënohet me P, dhe raporti i njësive që nuk e kanë këtë veti shënohet me G. Kështu, varianca e një atributi alternativ është e barabartë me produktin e proporcionit të njësive që zotërojnë këtë veti (P) me përqindjen e njësive që nuk e zotërojnë këtë pronë (G). Variacioni më i madh i popullsisë arrihet në rastet kur një pjesë e popullsisë, që përbën 50% të vëllimit të përgjithshëm të popullsisë, ka një karakteristikë, dhe një pjesë tjetër e popullsisë, gjithashtu e barabartë me 50%, nuk e ka këtë karakteristikë. dhe dispersioni arrin vlerën maksimale prej 0,25, t .e. P = 0.5, G= 1 - P = 1 - 0,5 = 0,5 dhe o 2 = 0,5 0,5 = 0,25. Kufiri i poshtëm i këtij treguesi është zero, i cili korrespondon me një situatë në të cilën nuk ka ndryshime në agregat. Zbatimi praktik i variancës së një karakteristike alternative është ndërtimi i intervaleve të besimit gjatë kryerjes së vëzhgimeve të mostrës.

Sa më i vogël të jetë varianca dhe devijimi standard, aq më homogjene do të jetë popullata dhe aq më tipike do të jetë mesatarja. Në praktikën e statistikave, shpesh lind nevoja për të krahasuar variacione të karakteristikave të ndryshme. Për shembull, është interesante të krahasohen ndryshimet në moshën e punëtorëve dhe kualifikimet e tyre, kohëzgjatja e shërbimit dhe pagat, kostoja dhe fitimi, kohëzgjatja e shërbimit dhe produktiviteti i punës, etj. Për krahasime të tilla, treguesit e ndryshueshmërisë absolute të karakteristikave janë të papërshtatshëm: është e pamundur të krahasohet ndryshueshmëria e përvojës së punës, e shprehur në vite, me ndryshimin e pagave, të shprehura në rubla. Për të kryer krahasime të tilla, si dhe krahasime të ndryshueshmërisë së së njëjtës karakteristikë në disa popullata me mesatare aritmetike të ndryshme, përdoren tregues të variacionit - koeficienti i lëkundjes, koeficienti linear i variacionit dhe koeficienti i variacionit, të cilët tregojnë masën të luhatjeve të vlerave ekstreme rreth mesatares.

Koeficienti i lëkundjes:

Ku V R - vlera e koeficientit të lëkundjes; R- vlera e gamës së variacionit; X -

Koeficienti linear i variacionit”.

Ku Vj- vlera e koeficientit linear të variacionit; une - vlera e devijimit mesatar linear; X - vlera mesatare e karakteristikës për popullsinë që studiohet.

Koeficienti i variacionit:

Ku V a - koeficienti i vlerës së variacionit; a është vlera e devijimit standard; X - vlera mesatare e karakteristikës për popullsinë që studiohet.

Koeficienti i lëkundjes është raporti në përqindje i diapazonit të variacionit me vlerën mesatare të karakteristikës që studiohet, dhe koeficienti linear i variacionit është raporti i devijimit mesatar linear ndaj vlerës mesatare të karakteristikës që studiohet, i shprehur si një përqindje. Koeficienti i variacionit është përqindja e devijimit standard ndaj vlerës mesatare të karakteristikës që studiohet. Si një vlerë relative, e shprehur në përqindje, koeficienti i variacionit përdoret për të krahasuar shkallën e ndryshimit të karakteristikave të ndryshme. Duke përdorur koeficientin e variacionit, vlerësohet homogjeniteti i një popullate statistikore. Nëse koeficienti i variacionit është më i vogël se 33%, atëherë popullsia në studim është homogjene dhe variacioni është i dobët. Nëse koeficienti i variacionit është më shumë se 33%, atëherë popullsia në studim është heterogjene, variacioni është i fortë dhe vlera mesatare është atipike dhe nuk mund të përdoret si tregues i përgjithshëm i kësaj popullate. Përveç kësaj, koeficientët e variacionit përdoren për të krahasuar ndryshueshmërinë e një tipari në popullata të ndryshme. Për shembull, për të vlerësuar ndryshimin në kohëzgjatjen e shërbimit të punëtorëve në dy ndërmarrje. Sa më e lartë të jetë vlera e koeficientit, aq më i rëndësishëm është ndryshimi i karakteristikës.

Bazuar në kuartilët e llogaritur, është gjithashtu e mundur të llogaritet treguesi relativ i variacionit tremujor duke përdorur formulën

ku Q 2 Dhe

Gama e interkuartileve përcaktohet nga formula

Devijimi kuartil përdoret në vend të gamës së variacionit për të shmangur disavantazhet që lidhen me përdorimin e vlerave ekstreme:

Për seritë e pabarabarta të variacionit të intervalit, llogaritet edhe dendësia e shpërndarjes. Përkufizohet si herësi i frekuencës ose frekuencës përkatëse pjesëtuar me vlerën e intervalit. Në seritë intervale të pabarabarta, përdoren dendësitë e shpërndarjes absolute dhe relative. Dendësia absolute e shpërndarjes është frekuenca për njësi gjatësi të intervalit. Dendësia relative e shpërndarjes është frekuenca për njësi gjatësi të intervalit.

E gjithë sa më sipër është e vërtetë për seritë e shpërndarjes, ligji i shpërndarjes së të cilave përshkruhet mirë nga ligji normal i shpërndarjes ose është afër tij.

Një vend të veçantë në analizën statistikore zë përcaktimi i nivelit mesatar të karakteristikës ose dukurisë që studiohet. Niveli mesatar i një tipari matet me vlera mesatare.

Vlera mesatare karakterizon nivelin e përgjithshëm sasior të karakteristikës që studiohet dhe është një pronë grupore e popullsisë statistikore. Ai nivelohet, dobëson devijimet e rastësishme të vëzhgimeve individuale në një drejtim ose në një tjetër dhe nxjerr në pah vetinë kryesore, tipike të karakteristikës që studiohet.

Mesataret përdoren gjerësisht:

1. Të vlerësojë gjendjen shëndetësore të popullatës: karakteristikat e zhvillimit fizik (gjatësia, pesha, perimetri i kraharorit, etj.), identifikimi i prevalencës dhe kohëzgjatjes së sëmundjeve të ndryshme, analizimi i treguesve demografikë (lëvizja vitale e popullsisë, jetëgjatësia mesatare, etj. riprodhimi i popullsisë, popullsia mesatare etj.).

2. Të studiojë veprimtarinë e institucioneve mjekësore, të personelit mjekësor dhe të vlerësojë cilësinë e punës së tyre, të planifikojë dhe të përcaktojë nevojat e popullsisë për lloje të ndryshme të kujdesit mjekësor (numri mesatar i kërkesave ose vizitave për banor në vit, kohëzgjatja mesatare e qëndrimit të një pacienti në spital, kohëzgjatja mesatare e ekzaminimit të pacientit, disponueshmëria mesatare e mjekëve, shtretërve, etj.).

3. Të karakterizojë gjendjen sanitare dhe epidemiologjike (përmbajtja mesatare e pluhurit të ajrit në punishte, sipërfaqja mesatare për person, konsumi mesatar i proteinave, yndyrave dhe karbohidrateve, etj.).

4. Të përcaktojë treguesit mjekësorë dhe fiziologjikë në kushte normale dhe patologjike, gjatë përpunimit të të dhënave laboratorike, të vendosë besueshmërinë e rezultateve të një studimi mostër në studimet sociale, higjienike, klinike dhe eksperimentale.

Llogaritja e vlerave mesatare kryhet në bazë të serive të variacioneve. Seritë e variacioneveështë një popullsi statistikore homogjene cilësore, njësitë individuale të së cilës karakterizojnë ndryshimet sasiore të karakteristikës ose dukurisë që studiohet.

Ndryshimi sasior mund të jetë dy llojesh: i ndërprerë (diskret) dhe i vazhdueshëm.

Një atribut i ndërprerë (diskret) shprehet vetëm si një numër i plotë dhe nuk mund të ketë ndonjë vlerë të ndërmjetme (për shembull, numri i vizitave, popullsia e sitit, numri i fëmijëve në familje, ashpërsia e sëmundjes në pikë , etj.).

Një shenjë e vazhdueshme mund të marrë çdo vlerë brenda kufijve të caktuar, duke përfshirë ato të pjesshme, dhe shprehet vetëm përafërsisht (për shembull, pesha - për të rriturit mund të kufizohet në kilogramë, dhe për të sapolindurit - gram; lartësia, presioni i gjakut, koha kaluar duke parë një pacient, etj.).



Vlera dixhitale e çdo karakteristike ose dukurie individuale të përfshirë në serinë e variacioneve quhet variant dhe përcaktohet me shkronjën V . Shënime të tjera gjenden gjithashtu në literaturën matematikore, për shembull x ose y.

Një seri variacionesh, ku çdo opsion tregohet një herë, quhet e thjeshtë. Seri të tilla përdoren në shumicën e problemeve statistikore në rastin e përpunimit të të dhënave kompjuterike.

Ndërsa numri i vëzhgimeve rritet, vlerat e varianteve të përsëritura priren të ndodhin. Në këtë rast, ajo krijohet seritë e grupuara të variacioneve, ku tregohet numri i përsëritjeve (frekuenca, e shënuar me shkronjën " r »).

Seritë e variacioneve të renditura përbëhet nga opsione të renditura në rend rritës ose zbritës. Si seritë e thjeshta ashtu edhe ato të grupuara mund të përpilohen me renditje.

Seritë e variacionit të intervalit e përpiluar për të thjeshtuar llogaritjet e mëvonshme të kryera pa përdorimin e kompjuterit, me një numër shumë të madh njësish vëzhgimi (më shumë se 1000).

Seritë e variacioneve të vazhdueshme përfshin vlerat e opsionit, të cilat mund të jenë çdo vlerë.

Nëse në një seri variacionesh vlerat e një karakteristike (variantesh) jepen në formën e numrave specifikë individualë, atëherë një seri e tillë quhet diskrete.

Karakteristikat e përgjithshme të vlerave të karakteristikës së pasqyruar në serinë e variacioneve janë vlerat mesatare. Ndër to më të përdorurat janë: mesatarja aritmetike M, modës Mo dhe mesatare Unë. Secila prej këtyre karakteristikave është unike. Ato nuk mund të zëvendësojnë njëra-tjetrën dhe vetëm së bashku përfaqësojnë tiparet e serisë së variacioneve plotësisht dhe në formë të kondensuar.

Moda (Mo) emërtoni vlerën e opsioneve më të shpeshta.

mesatare (Unë) – kjo është vlera e opsionit që ndan përgjysmë seritë e variacioneve të renditura (në secilën anë të medianës ka gjysmën e opsionit). Në raste të rralla, kur ka një seri variacionesh simetrike, mënyra dhe mediana janë të barabarta me njëra-tjetrën dhe përkojnë me vlerën e mesatares aritmetike.

Karakteristika më tipike e vlerave të opsioneve është mesatare aritmetike vlera( M ). Në literaturën matematikore shënohet .

Mesatarja aritmetike (M, ) është një karakteristikë e përgjithshme sasiore e një karakteristike të caktuar të dukurive që studiohen, duke përbërë një popullatë statistikore homogjene cilësore. Ka mesatare aritmetike të thjeshta dhe të ponderuara. Mesatarja e thjeshtë aritmetike llogaritet për një seri variacionesh të thjeshta duke mbledhur të gjitha opsionet dhe duke e pjesëtuar këtë shumë me numrin total të opsioneve të përfshira në këtë seri variacionesh. Llogaritjet kryhen sipas formulës:

,

Ku: M - mesatarja e thjeshtë aritmetike;

Σ V - opsioni i shumës;

n- numri i vëzhgimeve.

Në serinë e variacioneve të grupuara, përcaktohet mesatarja aritmetike e ponderuar. Formula për llogaritjen e saj:

,

Ku: M - mesatarja e ponderuar aritmetike;

Σ Vp - shuma e produkteve të variantit sipas frekuencave të tyre;

n- numri i vëzhgimeve.

Me një numër të madh vëzhgimesh, në rastin e llogaritjeve manuale, mund të përdoret metoda e momenteve.

Mesatarja aritmetike ka këto karakteristika:

· shuma e devijimeve nga mesatarja ( Σ d ) është e barabartë me zero (shih Tabelën 15);

· kur shumëzohen (pjestohen) të gjitha opsionet me të njëjtin faktor (pjesëtues), mesatarja aritmetike shumëzohet (pjestohet) me të njëjtin faktor (pjesëtues);

· nëse shtoni (zbrisni) të njëjtin numër në të gjitha opsionet, mesatarja aritmetike rritet (zvogëlohet) me të njëjtin numër.

Mesataret aritmetike, të marra vetë, pa marrë parasysh ndryshueshmërinë e serisë nga e cila janë llogaritur, mund të mos pasqyrojnë plotësisht vetitë e serive të variacionit, veçanërisht kur është i nevojshëm krahasimi me mesataret e tjera. Mesataret që janë të afërta në vlerë mund të merren nga seritë me shkallë të ndryshme shpërndarjeje. Sa më afër të jenë opsionet individuale me njëra-tjetrën për sa i përket karakteristikave të tyre sasiore, aq më pak dispersion (lëkundje, ndryshueshmëri) seri, aq më tipike është mesatarja e saj.

Parametrat kryesorë që na lejojnë të vlerësojmë ndryshueshmërinë e një tipari janë:

· Fushëveprimi;

· Amplituda;

· Devijimi standard;

· Koeficienti i variacionit.

Ndryshueshmëria e një tipari mund të gjykohet përafërsisht nga diapazoni dhe amplituda e serisë së variacionit. Gama tregon opsionet maksimale (V max) dhe minimale (V min) në seri. Amplituda (A m) është ndryshimi midis këtyre opsioneve: A m = V max - V min.

Masa kryesore, përgjithësisht e pranuar e ndryshueshmërisë së një serie variacionesh është dispersion (D ). Por parametri më i përdorur është më i përshtatshëm, i llogaritur në bazë të shpërndarjes - devijimi standard ( σ ). Ai merr parasysh madhësinë e devijimit ( d ) të çdo serie variacionesh nga mesatarja aritmetike e saj ( d=V - M ).

Meqenëse devijimet nga mesatarja mund të jenë pozitive dhe negative, kur përmblidhen ato japin vlerën "0" (S d=0). Për të shmangur këtë, vlerat e devijimit ( d) ngrihen në fuqinë e dytë dhe vlerësohen mesatarisht. Kështu, shpërndarja e një serie variacionesh është katrori mesatar i devijimeve të një varianti nga mesatarja aritmetike dhe llogaritet me formulën:

.

Është karakteristika më e rëndësishme e ndryshueshmërisë dhe përdoret për të llogaritur shumë kritere statistikore.

Meqenëse dispersioni shprehet si katror i devijimeve, vlera e tij nuk mund të përdoret në krahasim me mesataren aritmetike. Për këto qëllime përdoret devijimi standard, e cila shënohet me shenjën "Sigma" ( σ ). Ai karakterizon devijimin mesatar të të gjitha varianteve të një serie variacionesh nga vlera mesatare aritmetike në të njëjtat njësi si vetë vlera mesatare, kështu që ato mund të përdoren së bashku.

Devijimi standard përcaktohet nga formula:

Formula e specifikuar zbatohet kur numri i vëzhgimeve ( n ) më shumë se 30. Me një numër më të vogël n vlera e devijimit standard do të ketë një gabim të lidhur me kompensimin matematikor ( n - 1). Në këtë drejtim, një rezultat më i saktë mund të merret duke marrë parasysh një paragjykim të tillë në formulën për llogaritjen e devijimit standard:

devijimi standard (s ) është një vlerësim i devijimit standard të një ndryshoreje të rastësishme X në lidhje me pritshmërinë e tij matematikore bazuar në një vlerësim të paanshëm të variancës së tij.

Me vlera n > 30 devijimi standard ( σ ) dhe devijimi standard ( s ) do të jetë i njëjtë ( σ =s ). Prandaj, në shumicën e manualeve praktike këto kritere konsiderohen se kanë kuptime të ndryshme. Në Excel, devijimi standard mund të llogaritet duke përdorur funksionin =STDEV(range). Dhe për të llogaritur devijimin standard, duhet të krijoni një formulë të përshtatshme.

Sheshi mesatar ose devijimi standard ju lejon të përcaktoni se sa vlerat e një karakteristike mund të ndryshojnë nga vlera mesatare. Supozoni se ka dy qytete me të njëjtën temperaturë mesatare ditore në verë. Njëri prej këtyre qyteteve ndodhet në bregdet, dhe tjetri në kontinent. Dihet se në qytetet e vendosura në bregdet, ndryshimet në temperaturat e ditës janë më të vogla se në qytetet që ndodhen në brendësi. Prandaj, devijimi standard i temperaturave të ditës për qytetin bregdetar do të jetë më i vogël se për qytetin e dytë. Në praktikë, kjo do të thotë se temperatura mesatare e ajrit për çdo ditë specifike në një qytet të vendosur në kontinent do të ndryshojë më shumë nga mesatarja sesa në një qytet në bregdet. Për më tepër, devijimi standard ju lejon të vlerësoni devijimet e mundshme të temperaturës nga mesatarja me nivelin e kërkuar të probabilitetit.

Sipas teorisë së probabilitetit, në dukuritë që i binden ligjit të shpërndarjes normale, ekziston një marrëdhënie strikte midis vlerave të mesatares aritmetike, devijimit standard dhe opsioneve ( rregulli tre sigma). Për shembull, 68.3% e vlerave të një karakteristike të ndryshme janë brenda M ± 1 σ , 95.5% - brenda M ± 2 σ dhe 99.7% - brenda M ± 3 σ .

Vlera e devijimit standard na lejon të gjykojmë natyrën e homogjenitetit të serisë së variacionit dhe grupit të studimit. Nëse vlera e devijimit standard është e vogël, atëherë kjo tregon një homogjenitet mjaft të lartë të fenomenit që studiohet. Mesatarja aritmetike në këtë rast duhet të konsiderohet mjaft karakteristike për një seri variacionesh të dhëna. Megjithatë, një vlerë shumë e vogël sigma e bën njeriun të mendojë për një përzgjedhje artificiale të vëzhgimeve. Me një sigmë shumë të madhe, mesatarja aritmetike karakterizon në një masë më të vogël serinë e variacionit, gjë që tregon ndryshueshmëri të konsiderueshme të karakteristikës ose fenomenit që studiohet ose heterogjenitetin e grupit në studim. Megjithatë, krahasimi i vlerës së devijimit standard është i mundur vetëm për veçori të të njëjtit dimension. Në të vërtetë, nëse krahasojmë diversitetin e peshave të fëmijëve të porsalindur dhe të rriturve, gjithmonë do të marrim vlera më të larta sigma tek të rriturit.

Krahasimi i ndryshueshmërisë së veçorive të dimensioneve të ndryshme mund të bëhet duke përdorur koeficienti i variacionit. Ai shpreh diversitetin si përqindje e mesatares, duke lejuar krahasime midis tipareve të ndryshme. Koeficienti i variacionit në literaturën mjekësore tregohet me shenjën " ME ", dhe në matematikë" v"dhe llogaritet me formulën:

.

Vlerat e koeficientit të variacionit prej më pak se 10% tregojnë shpërndarje të vogël, nga 10 në 20% - rreth mesatare, më shumë se 20% - rreth shpërndarje të fortë rreth mesatares aritmetike.

Mesatarja aritmetike zakonisht llogaritet bazuar në të dhënat nga një popullsi mostër. Me studime të përsëritura, nën ndikimin e fenomeneve të rastësishme, mesatarja aritmetike mund të ndryshojë. Kjo për faktin se, si rregull, studiohet vetëm një pjesë e njësive të mundshme të vëzhgimit, domethënë popullata e mostrës. Informacioni për të gjitha njësitë e mundshme që përfaqësojnë fenomenin që studiohet mund të merret duke studiuar të gjithë popullsinë, gjë që nuk është gjithmonë e mundur. Në të njëjtën kohë, me qëllim të përgjithësimit të të dhënave eksperimentale, vlera e mesatares në popullatën e përgjithshme është me interes. Prandaj, për të formuluar një përfundim të përgjithshëm rreth fenomenit që studiohet, rezultatet e marra në bazë të popullatës së mostrës duhet të transferohen në popullatën e përgjithshme duke përdorur metoda statistikore.

Për të përcaktuar shkallën e marrëveshjes midis një studimi kampion dhe popullatës së përgjithshme, është e nevojshme të vlerësohet madhësia e gabimit që lind në mënyrë të pashmangshme gjatë vëzhgimit të mostrës. Ky gabim quhet " Gabimi i përfaqësimit"ose "Gabimi mesatar i mesatares aritmetike." Është në fakt ndryshimi midis mesatareve të marra nga vëzhgimi statistikor selektiv dhe vlerave të ngjashme që do të përftoheshin nga një studim i vazhdueshëm i të njëjtit objekt, d.m.th. kur studiohet një popullsi e përgjithshme. Meqenëse mesatarja e kampionit është një variabël rastësor, një parashikim i tillë kryhet me një nivel probabiliteti të pranueshëm për studiuesin. Në kërkimet mjekësore është të paktën 95%.

Gabimi i përfaqësimit nuk mund të ngatërrohet me gabimet e regjistrimit ose gabimet e vëmendjes (rrëshqitje, llogaritje të gabuara, gabime shkrimi, etj.), të cilat duhet të minimizohen me metoda dhe mjete adekuate të përdorura gjatë eksperimentit.

Madhësia e gabimit të përfaqësimit varet si nga madhësia e kampionit ashtu edhe nga ndryshueshmëria e tiparit. Sa më i madh të jetë numri i vëzhgimeve, aq më afër popullatës është kampioni dhe aq më i vogël është gabimi. Sa më e ndryshueshme të jetë shenja, aq më i madh është gabimi statistikor.

Në praktikë, për të përcaktuar gabimin e përfaqësimit në seritë e variacionit, përdoret formula e mëposhtme:

,

Ku: m – gabim përfaqësimi;

σ – devijimi standard;

n– numri i vëzhgimeve në kampion.

Formula tregon se madhësia e gabimit mesatar është drejtpërdrejt proporcionale me devijimin standard, d.m.th., ndryshueshmërinë e karakteristikës që studiohet, dhe në përpjesëtim të kundërt me rrënjën katrore të numrit të vëzhgimeve.

Gjatë kryerjes së analizave statistikore bazuar në llogaritjen e vlerave relative, ndërtimi i një serie variacionesh nuk është i nevojshëm. Në këtë rast, përcaktimi i gabimit mesatar për treguesit relativ mund të kryhet duke përdorur një formulë të thjeshtuar:

,

Ku: R– vlera e treguesit relativ, e shprehur në përqindje, ppm, etj.;

q– reciproku i P dhe i shprehur si (1-P), (100-P), (1000-P), etj., në varësi të bazës mbi të cilën llogaritet treguesi;

n– numri i vëzhgimeve në popullatën e mostrës.

Sidoqoftë, formula e specifikuar për llogaritjen e gabimit të përfaqësimit për vlerat relative mund të zbatohet vetëm kur vlera e treguesit është më e vogël se baza e tij. Në një numër rastesh të llogaritjes së treguesve intensivë, ky kusht nuk plotësohet dhe treguesi mund të shprehet si një numër më shumë se 100% ose 1000%. Në një situatë të tillë, ndërtohet një seri variacionesh dhe gabimi i përfaqësimit llogaritet duke përdorur formulën për vlerat mesatare bazuar në devijimin standard.

Parashikimi i vlerës së mesatares aritmetike në popullatë kryhet duke treguar dy vlera - minimale dhe maksimale. Këto vlera ekstreme të devijimeve të mundshme, brenda të cilave vlera mesatare e dëshiruar e popullsisë mund të luhatet, quhen " Kufijtë e besimit».

Postulatet e teorisë së probabilitetit kanë vërtetuar se me një shpërndarje normale të një karakteristike me një probabilitet prej 99,7%, vlerat ekstreme të devijimeve të mesatares nuk do të jenë më të mëdha se vlera e trefishit të gabimit të përfaqësimit ( M ± 3 m ); në 95.5% - jo më shumë se dyfishi i gabimit mesatar të vlerës mesatare ( M ± 2 m ); në 68.3% - jo më shumë se një gabim mesatar ( M ± 1 m ) (Fig. 9).

P%

Oriz. 9. Dendësia e probabilitetit të shpërndarjes normale.

Vini re se pohimi i mësipërm është i vërtetë vetëm për një veçori që i bindet ligjit normal të shpërndarjes Gaussian.

Shumica e studimeve eksperimentale, përfshirë në fushën e mjekësisë, shoqërohen me matje, rezultatet e të cilave mund të marrin pothuajse çdo vlerë në një interval të caktuar, prandaj, si rregull, ato përshkruhen nga një model i variablave të rastësishëm të vazhdueshëm. Në këtë drejtim, shumica e metodave statistikore marrin parasysh shpërndarjet e vazhdueshme. Një shpërndarje e tillë, e cila ka një rol themelor në statistikat matematikore, është shpërndarje normale ose gausiane.

Kjo është për shkak të një sërë arsyesh.

1. Para së gjithash, shumë vëzhgime eksperimentale mund të përshkruhen me sukses duke përdorur shpërndarjen normale. Duhet të theksohet menjëherë se nuk ka shpërndarje të të dhënave empirike që do të ishin saktësisht normale, pasi një ndryshore e rastësishme e shpërndarë normalisht varion nga deri në , gjë që nuk haset kurrë në praktikë. Megjithatë, shpërndarja normale shumë shpesh funksionon mirë si një përafrim.

Pavarësisht nëse maten pesha, gjatësia dhe parametrat e tjerë fiziologjikë të trupit të njeriut, rezultatet ndikohen gjithmonë nga një numër shumë i madh faktorësh të rastësishëm (shkaqet natyrore dhe gabimet e matjes).

Për më tepër, si rregull, efekti i secilit prej këtyre faktorëve është i parëndësishëm. Përvoja tregon se rezultatet në raste të tilla do të shpërndahen përafërsisht normalisht.

2. Shumë shpërndarje të lidhura me kampionimin e rastësishëm bëhen normale me rritjen e vëllimit të kësaj të fundit.

3. Shpërndarja normale është e përshtatshme si një përafrim i shpërndarjeve të tjera të vazhdueshme (për shembull, e anuar).

4. Shpërndarja normale ka një sërë veçorish të favorshme matematikore, të cilat sigurojnë në masë të madhe përdorimin e saj të gjerë në statistika.

Në të njëjtën kohë, duhet theksuar se në të dhënat mjekësore ka shumë shpërndarje eksperimentale që nuk mund të përshkruhen nga një model i shpërndarjes normale. Për këtë qëllim, statistikat kanë zhvilluar metoda që zakonisht quhen "joparametrike".

Zgjedhja e një metode statistikore që është e përshtatshme për përpunimin e të dhënave nga një eksperiment i caktuar duhet të bëhet në varësi të faktit nëse të dhënat e marra i përkasin ligjit normal të shpërndarjes. Testimi i hipotezës për nënrenditjen e një shenje ndaj ligjit të shpërndarjes normale kryhet duke përdorur një histogram (grafik) të shpërndarjes së frekuencës, si dhe një sërë kriteresh statistikore. Midis tyre: Kriteri i asimetrisë ( );

b Kriteri për testimin e kurtozës ( );

g Testi Shapiro-Wilks ( ) .

Një analizë e natyrës së shpërndarjes së të dhënave (i quajtur edhe një test për normalitetin e shpërndarjes) kryhet për çdo parametër. Për të gjykuar me siguri nëse shpërndarja e një parametri korrespondon me ligjin normal, kërkohet një numër mjaft i madh i njësive vëzhguese (të paktën 30 vlera).

Për një shpërndarje normale, kriteri i anshmërisë dhe kurtozës marrin vlerën 0. Nëse shpërndarja zhvendoset në të djathtë Kriteri i asimetrisë ( > 0 (asimetri pozitive), me Kriteri i asimetrisë ( < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона Kriteri për testimin e kurtozës ( =0. Në Kriteri për testimin e kurtozës ( > 0 kurba e shpërndarjes është më e mprehtë nëse Kriteri për testimin e kurtozës ( < 0 пик более сглаженный, чем функция нормального распределения.

Për të kontrolluar normalitetin duke përdorur kriterin Shapiro-Wilks, është e nevojshme të gjesh vlerën e këtij kriteri duke përdorur tabela statistikore në nivelin e kërkuar të rëndësisë dhe në varësi të numrit të njësive të vëzhgimit (shkallët e lirisë). Shtojca 1. Hipoteza e normalitetit refuzohet në vlera të vogla të këtij kriteri, si rregull, në w <0,8.

Seritë e variacioneveështë një seri vlerash numerike të një karakteristike.

Karakteristikat kryesore të serisë së variacionit: v – varianti, p – frekuenca e shfaqjes së tij.

Llojet e serive të variacioneve:

    sipas shpeshtësisë së paraqitjes së opsioneve: e thjeshtë - opsioni ndodh një herë, i peshuar - opsioni ndodh dy ose më shumë herë;

    sipas vendndodhjes së opsioneve: të renditura - opsionet janë renditur në rend zbritës dhe rritës, të pakënaqur - opsionet janë shkruar në asnjë rend të caktuar;

    duke kombinuar një opsion në grupe: të grupuara - opsionet kombinohen në grupe, të pagrupuara - opsionet nuk kombinohen në grupe;

    sipas opsioneve të madhësisë: e vazhdueshme - opsionet shprehen si numër i plotë dhe numër thyesor, diskrete - opsionet shprehen si numër i plotë, komplekse - opsionet përfaqësohen nga një vlerë relative ose mesatare.

Një seri variacionesh përpilohet dhe formalizohet për qëllimin e llogaritjes së vlerave mesatare.

Formulari i regjistrimit të serive të variacionit:

8. Vlerat mesatare, llojet, metodat e llogaritjes, aplikimi në shëndetësi

Vlerat mesatare– një karakteristikë përgjithësuese kumulative e karakteristikave sasiore. Zbatimi i mesatareve:

1. Të karakterizojë organizimin e punës së institucioneve mjekësore dhe të vlerësojë veprimtarinë e tyre:

a) në klinikë: treguesit e ngarkesës së mjekëve, numri mesatar i vizitave, numri mesatar i banorëve në zonë;

b) në spital: numri mesatar i ditëve të hapura të një shtrati në vit; kohëzgjatja mesatare e qëndrimit në spital;

c) në qendër të higjienës, epidemiologjisë dhe shëndetit publik: sipërfaqja mesatare (ose kapaciteti kub) për person, standardet mesatare ushqyese (proteinat, yndyrat, karbohidratet, vitaminat, kripërat minerale, kaloritë), normat dhe standardet sanitare, etj.;

2. Të karakterizojë zhvillimin fizik (karakteristikat kryesore antropometrike, morfologjike dhe funksionale);

3. Të përcaktojë parametrat mjekësorë dhe fiziologjikë të organizmit në kushte normale dhe patologjike në studimet klinike dhe eksperimentale.

4. Në kërkimin shkencor të veçantë.

Dallimi midis vlerave mesatare dhe treguesve:

1. Koeficientët karakterizojnë një karakteristikë alternative që shfaqet vetëm në një pjesë të caktuar të popullsisë statistikore, e cila mund të ndodhë ose jo.

Vlerat mesatare mbulojnë karakteristika që janë të përbashkëta për të gjithë anëtarët e ekipit, por në shkallë të ndryshme (pesha, gjatësia, ditët e trajtimit në spital).

2. Koeficientët përdoren për të matur karakteristikat cilësore. Vlerat mesatare - për karakteristika të ndryshme sasiore.

Llojet e mesatareve:

    mesatarja aritmetike, karakteristikat e tij janë devijimi standard dhe gabimi mesatar

    modaliteti dhe mesatarja. Moda (Moda)– korrespondon me vlerën e karakteristikës që shfaqet më shpesh se të tjerat në një popullatë të caktuar. mesatare (unë)– vlera e një karakteristike që zë vlerën mesatare në një popullsi të caktuar. Ai e ndan serinë në 2 pjesë të barabarta sipas numrit të vëzhgimeve. Mesatarja aritmetike (M)– ndryshe nga mënyra dhe mediana, bazohet në të gjitha vëzhgimet e bëra, prandaj është një karakteristikë e rëndësishme për të gjithë shpërndarjen.

    lloje të tjera mesataresh që përdoren në studime të veçanta: rrënja mesatare katrore, kubike, harmonike, gjeometrike, progresive.

Mesatarja aritmetike karakterizon nivelin mesatar të popullsisë statistikore.

Për një seri të thjeshtë, ku

∑v – opsioni i shumës,

n – numri i vëzhgimeve.

për një seri të peshuar, ku

∑vр – shuma e produkteve të secilit opsion dhe shpeshtësia e shfaqjes së tij

n – numri i vëzhgimeve.

Devijimi standard mesatarja aritmetike ose sigma (σ) karakterizon diversitetin e një karakteristike

- për një rresht të thjeshtë

Σd 2 - shuma e katrorëve të diferencës midis mesatares aritmetike dhe çdo opsioni (d = │M-V│)

n – numri i vëzhgimeve

- për një rresht të peshuar

∑d 2 p – shuma e prodhimeve të katrorëve të diferencës ndërmjet mesatares aritmetike dhe çdo opsioni dhe frekuenca e shfaqjes së saj,

n – numri i vëzhgimeve.

Shkalla e diversitetit mund të gjykohet nga madhësia e koeficientit të variacionit
. Më shumë se 20% është diversitet i fortë, 10-20% është diversitet mesatar, më pak se 10% është diversitet i dobët.

Nëse vlerës mesatare aritmetike i shtojmë dhe i zbresim një sigma (M ± 1σ), atëherë me një shpërndarje normale, të paktën 68,3% e të gjitha varianteve (vëzhgimeve) do të jenë brenda këtyre kufijve, që konsiderohet normë për fenomenin që studiohet. . Nëse k 2 ± 2σ, atëherë 95.5% e të gjitha vëzhgimeve do të jenë brenda këtyre kufijve, dhe nëse k M ± 3σ, atëherë 99.7% e të gjitha vëzhgimeve do të jenë brenda këtyre kufijve. Kështu, devijimi standard është një devijim standard që na lejon të parashikojmë probabilitetin e shfaqjes së një vlere të tillë të karakteristikës që studiohet që është brenda kufijve të specifikuar.

Gabim mesatar i mesatares aritmetike ose paragjykim përfaqësimi. Për një seri të thjeshtë, të peshuar dhe rregullin e momenteve:

.

Për të llogaritur vlerat mesatare, është e nevojshme: homogjeniteti i materialit, një numër i mjaftueshëm vëzhgimesh. Nëse numri i vëzhgimeve është më i vogël se 30, n-1 përdoret në formulat për llogaritjen e σ dhe m.

Kur vlerësoni rezultatin e marrë nga madhësia e gabimit mesatar, përdoret një koeficient besimi, i cili bën të mundur përcaktimin e probabilitetit të një përgjigjeje të saktë, domethënë tregon se vlera rezultuese e gabimit të kampionimit nuk do të jetë më e madhe se gabimi aktual i bërë si rezultat i vëzhgimit të vazhdueshëm. Rrjedhimisht, me një rritje të probabilitetit të besimit, gjerësia e intervalit të besimit rritet, e cila, nga ana tjetër, rrit besimin e gjykimit dhe qëndrueshmërinë e rezultatit të marrë.

Rreshtat e ndërtuara në bazë sasiore, quhen variacionale.

Seria e shpërndarjes përbëhet nga opsionet(vlerat karakteristike) dhe frekuencave(numri i grupeve). Frekuencat e shprehura si vlera relative (fraksione, përqindje) quhen frekuencave. Shuma e të gjitha frekuencave quhet vëllimi i serisë së shpërndarjes.

Sipas llojit, seritë e shpërndarjes ndahen në diskrete(ndërtuar në bazë të vlerave të ndërprera të karakteristikës) dhe intervali(bazuar në vlerat e vazhdueshme të karakteristikës).

Seritë e variacioneve përfaqëson dy kolona (ose rreshta); njëra prej të cilave jep vlera individuale të një karakteristike të ndryshme, të quajtur variante dhe të shënuara me X; dhe në tjetrën - numra absolut që tregojnë sa herë (sa shpesh) ndodh secili opsion. Treguesit në kolonën e dytë quhen frekuenca dhe në mënyrë konvencionale shënohen me f. Le të theksojmë edhe një herë se në kolonën e dytë mund të përdoren tregues relativë, duke karakterizuar pjesën e frekuencës së opsioneve individuale në shumën totale të frekuencave. Këta tregues relativë quhen frekuenca dhe në mënyrë konvencionale shënohen me ω Shuma e të gjitha frekuencave në këtë rast është e barabartë me një. Megjithatë, frekuencat mund të shprehen edhe si përqindje, dhe pastaj shuma e të gjitha frekuencave jep 100%.

Nëse variantet e një serie variacionesh shprehen në formën e sasive diskrete, atëherë një seri e tillë variacioni quhet diskrete.

Për karakteristikat e vazhdueshme, seritë e variacioneve janë ndërtuar si intervali, domethënë, vlerat e atributit në to shprehen "nga ... në ...". Në këtë rast, vlerat minimale të karakteristikës në një interval të tillë quhen kufiri i poshtëm i intervalit, dhe maksimumi - kufiri i sipërm.

Seritë e variacionit të intervalit janë ndërtuar gjithashtu për karakteristika diskrete që ndryshojnë në një gamë të madhe. Seritë intervale mund të jenë me të barabartë Dhe të pabarabartë në intervale.

Le të shqyrtojmë se si përcaktohet vlera e intervaleve të barabarta. Le të prezantojmë shënimin e mëposhtëm:

i– madhësia e intervalit;

- vlera maksimale e karakteristikës për njësitë e popullsisë;

– vlera minimale e karakteristikës për njësitë e popullsisë;

n - numri i grupeve të alokuara.

, nëse dihet n.

Nëse numri i grupeve që duhen dalluar është i vështirë të përcaktohet paraprakisht, atëherë për të llogaritur vlerën optimale të intervalit me një madhësi të mjaftueshme të popullsisë, formula e propozuar nga Sturgess në 1926 mund të rekomandohet:

n = 1+ 3,322 log N, ku N është numri i njësive në agregat.

Madhësia e intervaleve të pabarabarta përcaktohet në çdo rast individual, duke marrë parasysh karakteristikat e objektit të studimit.

Shpërndarja statistikore e mostrës thirrni një listë opsionesh dhe frekuencat e tyre përkatëse (ose frekuencat relative).

Shpërndarja statistikore e mostrës mund të specifikohet në formën e një tabele, në kolonën e parë të së cilës ndodhen opsionet, dhe në të dytën - frekuencat që korrespondojnë me këto opsione ni, ose frekuenca relative Pi .

Shpërndarja statistikore e kampionit

Seritë e intervalit janë seri variacionesh në të cilat vlerat e karakteristikave që qëndrojnë në themel të formimit të tyre shprehen brenda kufijve të caktuar (intervaleve). Frekuencat në këtë rast nuk i referohen vlerave individuale të atributit, por të gjithë intervalit.

Seritë e shpërndarjes intervale ndërtohen në bazë të karakteristikave sasiore të vazhdueshme, si dhe në karakteristika diskrete që ndryshojnë brenda kufijve të rëndësishëm.

Një seri intervali mund të përfaqësohet nga shpërndarja statistikore e një kampioni që tregon intervalet dhe frekuencat e tyre përkatëse. Në këtë rast, shuma e frekuencave të varianteve që bien brenda këtij intervali merret si frekuencë e intervalit.

Kur grupohet sipas karakteristikave sasiore të vazhdueshme, përcaktimi i madhësisë së intervalit është i rëndësishëm.

Përveç mesatares së mostrës dhe variancës së mostrës, përdoren edhe karakteristika të tjera të serisë së variacionit.

Moda Varianti që ka frekuencën më të madhe quhet.

Seritë e shpërndarjes statistikore- kjo është një shpërndarje e renditur e njësive të popullsisë në grupe sipas një karakteristike të caktuar të ndryshme.
Në varësi të karakteristikës që qëndron në themel të formimit të serisë së shpërndarjes, ekzistojnë seritë e shpërndarjes atributive dhe variacionale.

Prania e një karakteristike të përbashkët është baza për formimin e një popullate statistikore, e cila përfaqëson rezultatet e përshkrimit ose matjes së karakteristikave të përgjithshme të objekteve të studimit.

Lënda e studimit në statistikë janë karakteristikat (ndryshuese) ose karakteristikat statistikore.

Llojet e karakteristikave statistikore.

Seritë e shpërndarjes quhen atributive ndërtuar sipas kritereve të cilësisë. atributiv- kjo është një shenjë që ka një emër (për shembull, profesioni: rrobaqepëse, mësuese, etj.).
Seritë e shpërndarjes zakonisht paraqiten në formën e tabelave. Në tabelë 2.8 tregon serinë e shpërndarjes së atributeve.
Tabela 2.8 - Shpërndarja e llojeve të ndihmës juridike të ofruar nga avokatët për qytetarët e një prej rajoneve të Federatës Ruse.

Seritë e variacioneve- këto janë vlerat e karakteristikës (ose intervalet e vlerave) dhe frekuencat e tyre.
Seritë e variacioneve janë seri të shpërndarjes, i ndërtuar mbi bazë sasiore. Çdo seri variacionesh përbëhet nga dy elementë: opsionet dhe frekuencat.
Variantet konsiderohen të jenë vlerat individuale të një karakteristike që merr në një seri variacionesh.
Frekuencat janë numrat e varianteve individuale ose secili grup i një serie variacionesh, d.m.th. Këta janë numra që tregojnë se sa shpesh ndodhin disa opsione në një seri shpërndarjeje. Shuma e të gjitha frekuencave përcakton madhësinë e të gjithë popullsisë, vëllimin e saj.
Frekuencat janë frekuenca të shprehura si fraksione të një njësie ose si përqindje e totalit. Prandaj, shuma e frekuencave është e barabartë me 1 ose 100%. Seria e variacioneve lejon që dikush të vlerësojë formën e ligjit të shpërndarjes bazuar në të dhënat aktuale.

Në varësi të natyrës së variacionit të tiparit, ekzistojnë seritë e variacioneve diskrete dhe intervale.
Një shembull i një serie variacionesh diskrete është dhënë në tabelë. 2.9.
Tabela 2.9 - Shpërndarja e familjeve sipas numrit të dhomave të zëna në apartamente individuale në 1989 në Federatën Ruse.

Kolona e parë e tabelës paraqet opsionet për një seri variacionesh diskrete, kolona e dytë përmban frekuencat e serive të variacioneve dhe e treta përmban tregues të frekuencës.

Seritë e variacioneve

Një karakteristikë e caktuar sasiore studiohet në popullatën e përgjithshme. Një mostër e vëllimit nxirret rastësisht prej tij n, domethënë, numri i elementeve të mostrës është i barabartë me n. Në fazën e parë të përpunimit statistikor, duke filluar mostrat, d.m.th. renditja e numrit x 1, x 2, …, x n Në ngjitje. Çdo vlerë e vëzhguar x i thirrur opsion. Frekuenca m iështë numri i vëzhgimeve të vlerës x i në mostër. Frekuenca relative (frekuenca) w iështë raporti i frekuencës m i në madhësinë e mostrës n: .
Gjatë studimit të serive të variacioneve, përdoren gjithashtu konceptet e frekuencës së akumuluar dhe frekuencës së akumuluar. Le x disa numra. Pastaj numri i opsioneve , vlerat e të cilave janë më të vogla x, quhet frekuenca e akumuluar: për x i n quhet frekuenca e akumuluar w i max.
Një karakteristikë quhet e ndryshueshme në mënyrë diskrete nëse vlerat e saj individuale (variantet) ndryshojnë nga njëra-tjetra me një vlerë të caktuar të fundme (zakonisht një numër i plotë). Seria e variacionit të një karakteristike të tillë quhet seri variacione diskrete.

Tabela 1. Pamje e përgjithshme e një serie të frekuencave të variacioneve diskrete

Vlerat karakteristikex i x 1 x 2 x n
Frekuencatm i m 1 m 2 m n

Një karakteristikë quhet vazhdimisht e ndryshueshme nëse vlerat e saj ndryshojnë nga njëra-tjetra në një sasi të vogël arbitrare, d.m.th. atributi mund të marrë çdo vlerë në një interval të caktuar. Një seri variacionesh të vazhdueshme për një karakteristikë të tillë quhet interval.

Tabela 2. Pamje e përgjithshme e serisë së variacionit të intervalit të frekuencave

Tabela 3. Imazhet grafike të serisë së variacioneve

RreshtiShumëkëndëshi ose histogramiFunksioni empirik i shpërndarjes
Diskret
Intervali
Duke rishikuar rezultatet e vëzhgimeve, përcaktohet se sa vlera të opsioneve bien në çdo interval specifik. Supozohet se çdo interval i përket njërit prej skajeve të tij: ose në të gjitha rastet majtas (më shpesh) ose në të gjitha rastet djathtas, dhe frekuencat ose frekuencat tregojnë numrin e opsioneve që përmbahen brenda kufijve të specifikuar. Dallimet a i – a i +1 quhen intervale të pjesshme. Për të thjeshtuar llogaritjet pasuese, seria e variacionit të intervalit mund të zëvendësohet nga një seri diskrete me kusht. Në këtë rast, vlera mesatare i-intervali merret si opsion x i, dhe frekuencën përkatëse të intervalit m i– për frekuencën e këtij intervali.
Për paraqitjen grafike të serive të variacioneve, më të përdorurit janë poligoni, histogrami, kurba kumulative dhe funksioni i shpërndarjes empirike.

Në tabelë 2.3 (Grupimi i popullsisë ruse sipas të ardhurave mesatare për frymë në prill 1994) është paraqitur seritë e variacionit të intervalit.
Është i përshtatshëm për të analizuar seritë e shpërndarjes duke përdorur një imazh grafik, i cili ju lejon të gjykoni formën e shpërndarjes. Një paraqitje vizuale e natyrës së ndryshimeve në frekuencat e serisë së variacionit jepet nga poligonin dhe histogramin.
Shumëkëndëshi përdoret kur përshkruan seritë diskrete të variacioneve.
Le të paraqesim, për shembull, grafikisht shpërndarjen e stokut të banesave sipas llojit të apartamentit (Tabela 2.10).
Tabela 2.10 - Shpërndarja e stokut të banesave të zonës urbane sipas llojit të banesës (shifra të kushtëzuara).


Oriz. Zona e shpërndarjes së banesave


Jo vetëm vlerat e frekuencës, por edhe frekuencat e serisë së variacionit mund të vizatohen në boshtet e ordinatave.
Histogrami përdoret për të përshkruar një seri variacionesh intervali. Kur ndërtohet një histogram, vlerat e intervaleve vizatohen në boshtin e abshisës, dhe frekuencat përshkruhen nga drejtkëndësha të ndërtuar në intervalet përkatëse. Lartësia e kolonave në rastin e intervaleve të barabarta duhet të jetë proporcionale me frekuencat. Një histogram është një grafik në të cilin një seri përshkruhet si shirita ngjitur me njëri-tjetrin.
Le të përshkruajmë grafikisht serinë e shpërndarjes së intervalit të dhënë në tabelë. 2.11.
Tabela 2.11 - Shpërndarja e familjeve sipas madhësisë së hapësirës së banimit për person (shifra të kushtëzuara).
N p/p Grupet e familjeve sipas madhësisë së hapësirës së jetesës për person Numri i familjeve me një madhësi të caktuar të hapësirës së jetesës Numri kumulativ i familjeve
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTALI 115 ----


Oriz. 2.2. Histogrami i shpërndarjes së familjeve sipas madhësisë së hapësirës së jetesës për person


Duke përdorur të dhënat e serisë së grumbulluar (Tabela 2.11), ndërtojmë akumulojnë shpërndarjen.


Oriz. 2.3. Shpërndarja kumulative e familjeve sipas madhësisë së hapësirës së jetesës për person


Paraqitja e një serie variacionesh në formën e një kumulate është veçanërisht efektive për seritë e variacioneve, frekuencat e të cilave shprehen si fraksione ose përqindje të shumës së frekuencave të serive.
Nëse i ndryshojmë akset kur përshkruajmë grafikisht një seri variacionesh në formën e kumulateve, atëherë marrim ogiva. Në Fig. 2.4 tregon ogjivën e ndërtuar mbi bazën e të dhënave në tabelë. 2.11.
Një histogram mund të shndërrohet në një poligon të shpërndarjes duke gjetur mesin e brinjëve të drejtkëndëshave dhe më pas duke i lidhur këto pika me vija të drejta. Shumëkëndëshi i shpërndarjes që rezulton është paraqitur në Fig. 2.2 me një vijë me pika.
Kur ndërtohet një histogram i shpërndarjes së një serie variacionesh me intervale të pabarabarta, nuk janë frekuencat që vizatohen përgjatë ordinatës, por densiteti i shpërndarjes së karakteristikës në intervalet përkatëse.
Dendësia e shpërndarjes është frekuenca e llogaritur për njësi të gjerësisë së intervalit, d.m.th. sa njësi në secilin grup janë për njësi të vlerës së intervalit. Një shembull i llogaritjes së densitetit të shpërndarjes është paraqitur në tabelë. 2.12.
Tabela 2.12 - Shpërndarja e ndërmarrjeve sipas numrit të punonjësve (shifra të kushtëzuara)
N p/p Grupet e ndërmarrjeve sipas numrit të punonjësve, njerëzve. Numri i ndërmarrjeve Madhësia e intervalit, njerëzit. Dendësia e shpërndarjes
A 1 2 3=1/2
1 Deri në 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTALI 147 ---- ----

Mund të përdoret gjithashtu për paraqitje grafike të serive të variacioneve kurba kumulative. Duke përdorur një kumule (kurbë e shumës), përshkruhet një seri frekuencash të grumbulluara. Frekuencat kumulative përcaktohen duke përmbledhur në mënyrë sekuenciale frekuencat nëpër grupe dhe tregojnë se sa njësi në popullatë kanë vlera atribute jo më të mëdha se vlera në shqyrtim.


Oriz. 2.4. Paraqitja e shpërndarjes së familjeve sipas madhësisë së hapësirës së banimit për person

Kur ndërtohen kumulatet e një serie variacionesh intervali, variantet e serisë vizatohen përgjatë boshtit të abshisës dhe frekuencat e grumbulluara vizatohen përgjatë boshtit të ordinatave.



Ju pëlqeu artikulli? Ndani me miqtë tuaj!