Si të llogarisni devijimin standard. Devijimi standard

Vlerat e marra nga përvoja përmbajnë në mënyrë të pashmangshme gabime për shkak të një sërë arsyesh. Midis tyre, duhet bërë dallimi midis gabimeve sistematike dhe të rastësishme. Gabimet sistematike shkaktohen nga arsye që veprojnë në mënyrë shumë specifike dhe gjithmonë mund të eliminohen ose merren parasysh me mjaft saktësi. Gabimet e rastësishme shkaktohen nga një numër shumë i madh shkaqesh individuale që nuk mund të llogariten me saktësi dhe të veprojnë në mënyra të ndryshme në çdo matje individuale. Këto gabime nuk mund të përjashtohen plotësisht; ato mund të merren parasysh vetëm mesatarisht, për të cilat është e nevojshme të njihen ligjet që rregullojnë gabimet e rastësishme.

Madhësinë e matur do ta shënojmë me A dhe gabimin e rastësishëm në matje me x. Meqenëse gabimi x mund të marrë çdo vlerë, ai është një variabël i rastësishëm i vazhdueshëm, i cili karakterizohet plotësisht nga ligji i shpërndarjes së tij.

Realiteti më i thjeshtë dhe më i saktë që pasqyron (në shumicën dërrmuese të rasteve) është i ashtuquajturi ligji normal i shpërndarjes së gabimeve:

Ky ligj i shpërndarjes mund të merret nga premisa të ndryshme teorike, në veçanti, nga kërkesa që vlera më e mundshme e një sasie të panjohur për të cilën një seri vlerash me të njëjtën shkallë saktësie merret me matje të drejtpërdrejtë është mesatarja aritmetike e këto vlera. Sasia 2 quhet dispersion të këtij ligji normal.

Mesatarja aritmetike

Përcaktimi i dispersionit nga të dhënat eksperimentale. Nëse për çdo vlerë A, n vlerat a i përftohen me matje të drejtpërdrejtë me të njëjtën shkallë saktësie dhe nëse gabimet e vlerës A i nënshtrohen ligjit të shpërndarjes normale, atëherë vlera më e mundshme e A do të jetë mesatare aritmetike:

a - mesatarja aritmetike,

a i - vlera e matur në hapin i-të.

Devijimi i vlerës së vëzhguar (për çdo vëzhgim) a i i vlerës A nga mesatare aritmetike: a i - a.

Për të përcaktuar variancën e ligjit të shpërndarjes normale të gabimit në këtë rast, përdorni formulën:

2 - dispersion,
a - mesatarja aritmetike,
n - numri i matjeve të parametrave,

Devijimi standard

Devijimi standard tregon devijimin absolut të vlerave të matura nga mesatare aritmetike. Në përputhje me formulën për masën e saktësisë së një kombinimi linear gabimi mesatar katror Mesatarja aritmetike përcaktohet nga formula:

, Ku


a - mesatarja aritmetike,
n - numri i matjeve të parametrave,
a i - vlera e matur në hapin i-të.

Koeficienti i variacionit

Koeficienti i variacionit karakterizon masën relative të devijimit të vlerave të matura nga mesatare aritmetike:

, Ku

V - koeficienti i variacionit,
- devijimi standard,
a - mesatare aritmetike.

Sa më e lartë të jetë vlera koeficienti i variacionit, sa më e madhe të jetë shpërndarja dhe më pak uniformiteti i vlerave të studiuara. Nëse koeficienti i variacionit më pak se 10%, atëherë ndryshueshmëria e serisë së variacionit konsiderohet të jetë e parëndësishme, nga 10% në 20% konsiderohet mesatare, më shumë se 20% dhe më pak se 33% konsiderohet e rëndësishme dhe nëse koeficienti i variacionit kalon 33%, kjo tregon heterogjenitetin e informacionit dhe nevojën për të përjashtuar vlerat më të mëdha dhe më të vogla.

Devijimi mesatar linear

Një nga treguesit e shtrirjes dhe intensitetit të variacionit është devijimi mesatar linear(moduli i devijimit mesatar) nga mesatarja aritmetike. Devijimi mesatar linear llogaritur me formulën:

, Ku

_
a - devijimi mesatar linear,
a - mesatarja aritmetike,
n - numri i matjeve të parametrave,
a i - vlera e matur në hapin i-të.

Për të kontrolluar përputhshmërinë e vlerave të studiuara me ligjin e shpërndarjes normale, përdoret relacioni tregues i asimetrisë ndaj gabimit dhe qëndrimit të tij treguesi i kurtozës për gabimin e tij.

Treguesi i asimetrisë

Treguesi i asimetrisë(A) dhe gabimi i tij (m a) llogaritet duke përdorur formulat e mëposhtme:

, Ku

A - treguesi i asimetrisë,
- devijimi standard,
a - mesatarja aritmetike,
n - numri i matjeve të parametrave,
a i - vlera e matur në hapin i-të.

Treguesi i kurtozës

Treguesi i kurtozës(E) dhe gabimi i tij (m e) llogaritet duke përdorur formulat e mëposhtme:

, Ku

X i - variabla të rastësishme (aktuale);

vlera mesatare e variablave të rastit për kampionin llogaritet duke përdorur formulën:

Pra, varianca është katrori mesatar i devijimeve . Kjo është, vlera mesatare fillimisht llogaritet, pastaj merret diferenca midis secilës vlerë origjinale dhe mesatare është në katror , shtohet dhe më pas pjesëtohet me numrin e vlerave në popullatën e dhënë.

Dallimi midis një vlere individuale dhe mesatares pasqyron masën e devijimit. Ai është në katror në mënyrë që të gjitha devijimet të bëhen numra ekskluzivisht pozitivë dhe të shmanget shkatërrimi i ndërsjellë i devijimeve pozitive dhe negative gjatë përmbledhjes së tyre. Pastaj, duke pasur parasysh devijimet në katror, ​​ne thjesht llogarisim mesataren aritmetike.

Përgjigja për fjalën magjike "dispersion" qëndron vetëm në këto tre fjalë: mesatare - katror - devijime.

Devijimi standard (MSD)

Duke marrë rrënjën katrore të variancës, marrim të ashtuquajturën " devijimi standard”. Ka emra "devijimi standard" ose "sigma" (nga emri i shkronjës greke σ .). Formula për devijimin standard është:

Pra, dispersioni është sigma në katror, ​​ose devijimi standard është në katror.

Devijimi standard, padyshim, karakterizon gjithashtu masën e shpërndarjes së të dhënave, por tani (ndryshe nga dispersioni) mund të krahasohet me të dhënat origjinale, pasi ato kanë të njëjtat njësi matëse (kjo është e qartë nga formula e llogaritjes). Gama e variacionit është ndryshimi midis vlerave ekstreme. Devijimi standard, si masë e pasigurisë, është gjithashtu i përfshirë në shumë llogaritje statistikore. Me ndihmën e tij, përcaktohet shkalla e saktësisë së vlerësimeve dhe parashikimeve të ndryshme. Nëse ndryshimi është shumë i madh, atëherë devijimi standard do të jetë gjithashtu i madh, dhe për këtë arsye parashikimi do të jetë i pasaktë, i cili do të shprehet, për shembull, në intervale shumë të gjera besimi.

Prandaj, në metodat e përpunimit të të dhënave statistikore në vlerësimet e pasurive të paluajtshme, në varësi të saktësisë së kërkuar të detyrës, përdoret rregulli dy ose tre sigma.

Për të krahasuar rregullin e dy sigmës dhe rregullin e tre sigmës, ne përdorim formulën e Laplace:

F - F ,

ku Ф(x) është funksioni Laplace;



Vlera minimale

β = vlera maksimale

s = vlera sigma (devijimi standard)

a = mesatare

Në këtë rast, një formë e veçantë e formulës së Laplace përdoret kur kufijtë α dhe β të vlerave të ndryshores së rastësishme X janë të barabarta nga qendra e shpërndarjes a = M(X) me një vlerë të caktuar d: a. = a-d, b = a+d. Ose (1) Formula (1) përcakton probabilitetin e një devijimi të caktuar d të një ndryshoreje të rastësishme X me një ligj të shpërndarjes normale nga pritshmëria e saj matematikore M(X) = a.

Nëse në formulën (1) marrim në mënyrë sekuenciale d = 2s dhe d = 3s, fitojmë: (2), (3).

Rregulli dy sigma

Le të ilustrojmë gjeometrikisht rregullin e dy sigmave. Në Fig. Figura 6 tregon një kurbë Gaussian me qendrën e shpërndarjes a. Sipërfaqja e kufizuar nga e gjithë kurba dhe boshti Ox është e barabartë me 1 (100%), dhe sipërfaqja e trapezoidit lakor midis abscisave a–2s dhe a+2s, sipas rregullit dy-sigma, është e barabartë. në 0.954 (95.4% e sipërfaqes totale). Sipërfaqja e zonave me hije është 1-0,954 = 0,046 (»5% e sipërfaqes totale). Këto zona quhen rajoni kritik i ndryshores së rastit. Vlerat e një ndryshoreje të rastësishme që bien në rajonin kritik nuk kanë gjasa dhe në praktikë pranohen konvencionalisht si të pamundura.

Probabiliteti i vlerave të pamundura me kusht quhet niveli i rëndësisë së një ndryshoreje të rastësishme. Niveli i rëndësisë lidhet me probabilitetin e besimit me formulën:

ku q është niveli i rëndësisë i shprehur në përqindje.

Rregulli tre sigma

Kur zgjidhen çështje që kërkojnë besueshmëri më të madhe, kur probabiliteti i besimit (Pd) merret i barabartë me 0,997 (më saktë, 0,9973), në vend të rregullit dy-sigma, sipas formulës (3), përdoret rregulli. tre sigma



Sipas rregulli tre sigma me një probabilitet besimi prej 0,9973, zona kritike do të jetë zona e vlerave të atributeve jashtë intervalit (a-3s, a+3s). Niveli i rëndësisë është 0.27%.

Me fjalë të tjera, probabiliteti që vlera absolute e devijimit të kalojë trefishin e devijimit standard është shumë i vogël, përkatësisht 0,0027 = 1-0,9973. Kjo do të thotë se vetëm 0.27% e rasteve do të ndodhë kjo. Ngjarje të tilla, bazuar në parimin e pamundësisë së ngjarjeve të pamundura, mund të konsiderohen praktikisht të pamundura. ato. kampionimi është shumë i saktë.

Ky është thelbi i rregullit tre sigma:

Nëse një ndryshore e rastësishme shpërndahet normalisht, atëherë vlera absolute e devijimit të saj nga pritshmëria matematikore nuk e kalon trefishin e devijimit standard (MSD).

Në praktikë, rregulli tre-sigma zbatohet si më poshtë: nëse shpërndarja e ndryshores së rastësishme që studiohet është e panjohur, por kushti i specifikuar në rregullin e mësipërm është plotësuar, atëherë ka arsye të supozohet se ndryshorja që studiohet është e shpërndarë normalisht. ; përndryshe nuk shpërndahet normalisht.

Niveli i rëndësisë merret në varësi të shkallës së lejuar të rrezikut dhe detyrës në fjalë. Për vlerësimin e pasurive të paluajtshme, zakonisht miratohet një mostër më pak e saktë, duke ndjekur rregullin dy-sigma.

Në këtë artikull do të flas për si të gjeni devijimin standard. Ky material është jashtëzakonisht i rëndësishëm për një kuptim të plotë të matematikës, kështu që një mësues matematike duhet t'i kushtojë një mësim të veçantë ose edhe disa për studimin e tij. Në këtë artikull do të gjeni një lidhje me një video tutorial të detajuar dhe të kuptueshëm që shpjegon se çfarë është devijimi standard dhe si ta gjeni atë.

Devijimi standard bën të mundur vlerësimin e përhapjes së vlerave të marra si rezultat i matjes së një parametri të caktuar. Tregohet me simbolin (gërma greke "sigma").

Formula për llogaritjen është mjaft e thjeshtë. Për të gjetur devijimin standard, duhet të merrni rrënjën katrore të variancës. Pra, tani ju duhet të pyesni, "Çfarë është varianca?"

Çfarë është varianca

Përkufizimi i variancës shkon kështu. Dispersioni është mesatarja aritmetike e devijimeve në katror të vlerave nga mesatarja.

Për të gjetur variancën, kryeni llogaritjet e mëposhtme në mënyrë sekuenciale:

  • Përcaktoni mesataren (mesatarja e thjeshtë aritmetike e një serie vlerash).
  • Pastaj zbritni mesataren nga çdo vlerë dhe katrore diferencën që rezulton (ju merrni dallimi në katror).
  • Hapi tjetër është llogaritja e mesatares aritmetike të diferencave në katror që rezultojnë (Mund të zbuloni pse saktësisht katrorët janë më poshtë).

Le të shohim një shembull. Le të themi se ju dhe miqtë tuaj vendosni të matni lartësinë e qenve tuaj (në milimetra). Si rezultat i matjeve, keni marrë matjet e mëposhtme të lartësisë (në tharje): 600 mm, 470 mm, 170 mm, 430 mm dhe 300 mm.

Le të llogarisim mesataren, variancën dhe devijimin standard.

Së pari le të gjejmë vlerën mesatare. Siç e dini tashmë, për ta bërë këtë ju duhet të shtoni të gjitha vlerat e matura dhe të ndani me numrin e matjeve. Ecuria e llogaritjes:

Mesatare mm.

Pra, mesatarja (mesatarja aritmetike) është 394 mm.

Tani duhet të përcaktojmë devijimi i lartësisë së çdo qeni nga mesatarja:

Së fundi, për të llogaritur variancën, ne katrore secilin nga ndryshimet që rezultojnë, dhe më pas gjejmë mesataren aritmetike të rezultateve të marra:

Dispersion mm 2 .

Kështu, shpërndarja është 21704 mm 2.

Si të gjeni devijimin standard

Pra, si mund ta llogarisim tani devijimin standard, duke ditur variancën? Siç e kujtojmë, merrni rrënjën katrore të saj. Kjo do të thotë, devijimi standard është i barabartë me:

Mm (i rrumbullakosur në numrin e plotë më të afërt në mm).

Duke përdorur këtë metodë, ne zbuluam se disa qen (për shembull, Rottweilers) janë qen shumë të mëdhenj. Por ka edhe qen shumë të vegjël (për shembull, dachshunds, por ju nuk duhet t'u thoni atyre këtë).

Gjëja më interesante është se devijimi standard përmban informacione të dobishme. Tani mund të tregojmë se cilat nga rezultatet e marra të matjes së lartësisë janë brenda intervalit që marrim nëse vizatojmë devijimin standard nga mesatarja (në të dy anët e saj).

Kjo do të thotë, duke përdorur devijimin standard, marrim një metodë "standarde" që na lejon të zbulojmë se cila nga vlerat është normale (statistikisht mesatare), dhe cila është jashtëzakonisht e madhe ose, anasjelltas, e vogël.

Çfarë është devijimi standard

Por... çdo gjë do të jetë pak më ndryshe nëse analizojmë mostër të dhëna. Në shembullin tonë kemi konsideruar popullata e përgjithshme. Domethënë, 5 qentë tanë ishin qentë e vetëm në botë që na interesuan.

Por nëse të dhënat janë një mostër (vlerat e zgjedhura nga një popullsi e madhe), atëherë llogaritjet duhet të bëhen ndryshe.

Nëse ka vlera, atëherë:

Të gjitha llogaritjet e tjera kryhen në mënyrë të ngjashme, duke përfshirë përcaktimin e mesatares.

Për shembull, nëse pesë qentë tanë janë vetëm një mostër e popullsisë së qenve (të gjithë qentë në planet), ne duhet të ndajmë me 4, jo 5, gjegjësisht:

Varianca e mostrës = mm 2.

Në këtë rast, devijimi standard për mostrën është i barabartë me mm (i rrumbullakosur në numrin e plotë më të afërt).

Mund të themi se kemi bërë një “korrigjim” në rastin kur vlerat tona janë vetëm një mostër e vogël.

Shënim. Pse saktësisht diferencat në katror?

Por pse marrim saktësisht diferencat në katror kur llogaritim variancën? Le të themi kur matni disa parametra, keni marrë grupin e mëposhtëm të vlerave: 4; 4; -4; -4. Nëse thjesht shtojmë devijimet absolute nga mesatarja (ndryshimet) së bashku ... vlerat negative anulohen me ato pozitive:

.

Rezulton se ky opsion është i padobishëm. Atëherë ndoshta ia vlen të provoni vlerat absolute të devijimeve (d.m.th., modulet e këtyre vlerave)?

Në shikim të parë, rezulton mirë (vlera që rezulton, nga rruga, quhet devijimi mesatar absolut), por jo në të gjitha rastet. Le të provojmë një shembull tjetër. Lëreni që matja të rezultojë në grupin e vlerave të mëposhtme: 7; 1; -6; -2. Atëherë devijimi mesatar absolut është:

Uau! Përsëri morëm rezultatin 4, megjithëse diferencat kanë një përhapje shumë më të madhe.

Tani le të shohim se çfarë ndodh nëse i vendosim në katror dallimet (dhe më pas marrim rrënjën katrore të shumës së tyre).

Për shembullin e parë do të jetë:

.

Për shembullin e dytë do të jetë:

Tani është një çështje krejtësisht tjetër! Sa më i madh të jetë përhapja e diferencave, aq më i madh është devijimi standard... gjë që synonim.

Në fakt, kjo metodë përdor të njëjtën ide si në llogaritjen e distancës midis pikave, e aplikuar vetëm në një mënyrë tjetër.

Dhe nga pikëpamja matematikore, përdorimi i katrorëve dhe rrënjëve katrore ofron më shumë përfitime sesa mund të merrnim nga vlerat e devijimit absolut, duke e bërë devijimin standard të zbatueshëm për probleme të tjera matematikore.

Sergey Valerievich ju tha se si të gjeni devijimin standard

Një metodë e përafërt për vlerësimin e ndryshueshmërisë së një serie variacioni është përcaktimi i kufirit dhe amplitudës, por vlerat e variantit brenda serisë nuk merren parasysh. Masa kryesore e pranuar përgjithësisht e ndryshueshmërisë së një karakteristike sasiore brenda një serie variacionesh është devijimi standard (σ - sigma). Sa më i madh të jetë devijimi standard, aq më e lartë është shkalla e luhatjes së kësaj serie.

Metoda për llogaritjen e devijimit standard përfshin hapat e mëposhtëm:

1. Gjeni mesataren aritmetike (M).

2. Përcaktoni devijimet e opsioneve individuale nga mesatarja aritmetike (d=V-M). Në statistikat mjekësore, devijimet nga mesatarja përcaktohen si d (devijojnë). Shuma e të gjitha devijimeve është zero.

3. Katror çdo devijim d 2.

4. Shumëzoni katrorët e devijimeve me frekuencat përkatëse d 2 *p.

5. Gjeni shumën e prodhimeve å(d 2 *p)

6. Llogaritni devijimin standard duke përdorur formulën:

Kur n është më e madhe se 30, ose kur n është më e vogël ose e barabartë me 30, ku n është numri i të gjitha opsioneve.

Vlera e devijimit standard:

1. Devijimi standard karakterizon përhapjen e variantit në lidhje me vlerën mesatare (d.m.th., ndryshueshmërinë e serisë së variacionit). Sa më e madhe të jetë sigma, aq më e lartë është shkalla e diversitetit të kësaj serie.

2. Devijimi standard përdoret për një vlerësim krahasues të shkallës së korrespondencës së mesatares aritmetike me serinë e variacionit për të cilën është llogaritur.

Variacionet e dukurive masive i binden ligjit të shpërndarjes normale. Kurba që përfaqëson këtë shpërndarje duket si një kurbë simetrike e lëmuar në formë zile (kurba Gaussian). Sipas teorisë së probabilitetit, në dukuritë që i binden ligjit të shpërndarjes normale, ekziston një marrëdhënie e rreptë matematikore midis vlerave të mesatares aritmetike dhe devijimit standard. Shpërndarja teorike e një varianti në një seri variacione homogjene i bindet rregullit të tre sigmës.

Nëse në një sistem koordinatash drejtkëndëshe, vlerat e një karakteristike sasiore (variantet) vizatohen në boshtin e abshisës dhe frekuenca e shfaqjes së një varianti në një seri variacionesh paraqitet në boshtin e ordinatave, atëherë variantet me më të mëdha dhe më të vogla. vlerat janë të vendosura në mënyrë të barabartë në anët e mesatares aritmetike.



Është vërtetuar se me një shpërndarje normale të tiparit:

68.3% e vlerave të variantit janë brenda M±1s

95.5% e vlerave të variantit janë brenda M±2s

99.7% e vlerave të variantit janë brenda M±3s

3. Devijimi standard ju lejon të vendosni vlera normale për parametrat klinikë dhe biologjikë. Në mjekësi, intervali M±1s zakonisht merret si diapazoni normal për fenomenin që studiohet. Devijimi i vlerës së vlerësuar nga mesatarja aritmetike me më shumë se 1s tregon një devijim të parametrit të studiuar nga norma.

4. Në mjekësi, rregulli tre-sigma përdoret në pediatri për vlerësimin individual të nivelit të zhvillimit fizik të fëmijëve (metoda e devijimit të sigmës), për zhvillimin e standardeve për veshjen e fëmijëve.

5. Devijimi standard është i nevojshëm për të karakterizuar shkallën e diversitetit të karakteristikës që studiohet dhe për të llogaritur gabimin e mesatares aritmetike.

Vlera e devijimit standard zakonisht përdoret për të krahasuar ndryshueshmërinë e serive të të njëjtit lloj. Nëse krahasohen dy seri me karakteristika të ndryshme (lartësia dhe pesha, kohëzgjatja mesatare e trajtimit spitalor dhe vdekshmëria spitalore, etj.), atëherë një krahasim i drejtpërdrejtë i madhësive të sigmës është i pamundur. , sepse devijimi standard është një vlerë e emërtuar e shprehur në numra absolut. Në këto raste, përdorni koeficienti i variacionit (Cv), e cila është një vlerë relative: raporti në përqindje i devijimit standard me mesataren aritmetike.

Koeficienti i variacionit llogaritet duke përdorur formulën:

Sa më i lartë të jetë koeficienti i variacionit , aq më i madh është ndryshueshmëria e kësaj serie. Besohet se një koeficient variacion prej më shumë se 30% tregon heterogjenitetin cilësor të popullsisë.

Vlen të përmendet se kjo llogaritje e variancës ka një pengesë - rezulton të jetë e njëanshme, d.m.th. pritshmëria e tij matematikore nuk është e barabartë me vlerën e vërtetë të variancës. Lexoni më shumë për këtë. Në të njëjtën kohë, jo gjithçka është aq e keqe. Ndërsa madhësia e kampionit rritet, ajo ende i afrohet analogut të saj teorik, d.m.th. është asimptotikisht i paanshëm. Prandaj, kur punoni me madhësi të mëdha mostrash, mund të përdorni formulën e mësipërme.

Është e dobishme të përkthehet gjuha e shenjave në gjuhën e fjalëve. Rezulton se varianca është katrori mesatar i devijimeve. Kjo do të thotë, së pari llogaritet vlera mesatare, pastaj merret diferenca midis secilës vlerë origjinale dhe mesatare, në katror, ​​shtohet dhe më pas ndahet me numrin e vlerave në popullatë. Dallimi midis një vlere individuale dhe mesatares pasqyron masën e devijimit. Ai është në katror në mënyrë që të gjitha devijimet të bëhen numra ekskluzivisht pozitivë dhe të shmanget shkatërrimi i ndërsjellë i devijimeve pozitive dhe negative gjatë përmbledhjes së tyre. Pastaj, duke pasur parasysh devijimet në katror, ​​ne thjesht llogarisim mesataren aritmetike. Devijimet mesatare - katrore. Devijimet janë në katror dhe llogaritet mesatarja. Zgjidhja qëndron në vetëm tre fjalë.

Sidoqoftë, në formën e tij të pastër, siç është mesatarja aritmetike ose indeksi, shpërndarja nuk përdoret. Është më tepër një tregues ndihmës dhe i ndërmjetëm që është i nevojshëm për llojet e tjera të analizave statistikore. Nuk ka as një njësi matëse normale. Duke gjykuar nga formula, ky është katrori i njësisë matëse të të dhënave origjinale. Pa një shishe, siç thonë ata, nuk mund ta kuptosh.

(moduli 111)

Për ta kthyer variancën në realitet, pra për ta përdorur atë për qëllime më të zakonshme, prej tij nxirret rrënja katrore. Rezulton e ashtuquajtura devijimi standard (RMS). Ka emra "devijim standard" ose "sigma" (nga emri i shkronjës greke). Formula e devijimit standard është:

Për të marrë këtë tregues për mostrën, përdorni formulën:

Ashtu si me variancën, ekziston një opsion paksa i ndryshëm llogaritjeje. Por ndërsa mostra rritet, ndryshimi zhduket.

Devijimi standard, padyshim, karakterizon gjithashtu masën e shpërndarjes së të dhënave, por tani (ndryshe nga dispersioni) mund të krahasohet me të dhënat origjinale, pasi ato kanë të njëjtat njësi matëse (kjo është e qartë nga formula e llogaritjes). Por edhe ky tregues në formën e tij të pastër nuk është shumë informues, pasi përmban shumë llogaritje të ndërmjetme që janë konfuze (devijimi, katrori, shuma, mesatare, rrënjë). Sidoqoftë, tashmë është e mundur të punohet drejtpërdrejt me devijimin standard, sepse vetitë e këtij treguesi janë studiuar mirë dhe të njohura. Për shembull, ekziston kjo rregulli tre sigma, i cili thotë se të dhënat kanë 997 vlera nga 1000 brenda ±3 sigma të mesatares aritmetike. Devijimi standard, si masë e pasigurisë, është gjithashtu i përfshirë në shumë llogaritje statistikore. Me ndihmën e tij, përcaktohet shkalla e saktësisë së vlerësimeve dhe parashikimeve të ndryshme. Nëse ndryshimi është shumë i madh, atëherë devijimi standard do të jetë gjithashtu i madh, dhe për këtë arsye parashikimi do të jetë i pasaktë, i cili do të shprehet, për shembull, në intervale shumë të gjera besimi.

Koeficienti i variacionit

Devijimi standard jep një vlerësim absolut të masës së dispersionit. Prandaj, për të kuptuar se sa i madh është përhapja në raport me vetë vlerat (d.m.th., pavarësisht nga shkalla e tyre), kërkohet një tregues relativ. Ky tregues quhet koeficienti i variacionit dhe llogaritet duke përdorur formulën e mëposhtme:

Koeficienti i variacionit matet si përqindje (nëse shumëzohet me 100%). Duke përdorur këtë tregues, ju mund të krahasoni një sërë fenomenesh, pavarësisht nga shkalla e tyre dhe njësitë e matjes. Ky fakt është ai që e bën koeficientin e variacionit kaq popullor.

Në statistikë, pranohet se nëse vlera e koeficientit të variacionit është më e vogël se 33%, atëherë popullsia konsiderohet homogjene nëse është më shumë se 33%, atëherë ajo është heterogjene. Është e vështirë për mua të komentoj diçka këtu. Nuk e di kush e përcaktoi këtë dhe pse, por konsiderohet një aksiomë.

Ndjej se jam rrëmbyer nga teoria e thatë dhe kam nevojë të sjell diçka vizuale dhe figurative. Nga ana tjetër, të gjithë treguesit e variacionit përshkruajnë afërsisht të njëjtën gjë, vetëm se ato llogariten ndryshe. Prandaj, është e vështirë të tregosh një shumëllojshmëri shembujsh. Vetëm vlerat e treguesve mund të ndryshojnë, por jo thelbi i tyre. Pra, le të krahasojmë se si ndryshojnë vlerat e treguesve të ndryshëm të variacionit për të njëjtin grup të dhënash. Le të marrim shembullin e llogaritjes së devijimit mesatar linear (nga ). Këtu janë të dhënat burimore:

Dhe një orar për t'ju kujtuar.

Duke përdorur këto të dhëna, ne llogarisim tregues të ndryshëm të variacionit.

Vlera mesatare është mesatarja e zakonshme aritmetike.

Gama e variacionit është diferenca midis maksimumit dhe minimumit:

Devijimi mesatar linear llogaritet duke përdorur formulën:

Devijimi standard:

Le të përmbledhim llogaritjet në një tabelë.

Siç mund të shihet, mesatarja lineare dhe devijimi standard japin vlera të ngjashme për shkallën e ndryshimit të të dhënave. Varianca është sigma në katror, ​​kështu që gjithmonë do të jetë një numër relativisht i madh, i cili, në fakt, nuk do të thotë asgjë. Gama e variacionit është ndryshimi midis vlerave ekstreme dhe mund të flasë shumë.

Le të përmbledhim disa rezultate.

Variacioni i një treguesi pasqyron ndryshueshmërinë e një procesi ose fenomeni. Shkalla e saj mund të matet duke përdorur disa tregues.

1. Gama e variacionit - diferenca midis maksimumit dhe minimumit. Pasqyron gamën e vlerave të mundshme.
2. Devijimi mesatar linear - pasqyron mesataren e devijimeve absolute (module) të të gjitha vlerave të popullsisë së analizuar nga vlera mesatare e tyre.
3. Dispersion - katrori mesatar i devijimeve.
4. Devijimi standard është rrënja e dispersionit (katrori mesatar i devijimeve).
5. Koeficienti i variacionit është treguesi më universal, që pasqyron shkallën e shpërndarjes së vlerave, pavarësisht nga shkalla e tyre dhe njësitë matëse. Koeficienti i variacionit matet si përqindje dhe mund të përdoret për të krahasuar variacionin e proceseve dhe dukurive të ndryshme.

Kështu, në analizën statistikore ekziston një sistem treguesish që pasqyrojnë homogjenitetin e dukurive dhe stabilitetin e proceseve. Shpesh treguesit e variacionit nuk kanë kuptim të pavarur dhe përdoren për analiza të mëtejshme të të dhënave (llogaritja e intervaleve të besimit



Ju pëlqeu artikulli? Ndani me miqtë tuaj!