Si të përcaktohet besimi. Vlerësimet e pikës dhe intervalit të peshës specifike

Çdo mostër jep vetëm një ide të përafërt të popullatës së përgjithshme, dhe të gjitha karakteristikat statistikore të kampionit (mesatarja, mënyra, varianca...) janë një përafrim ose të themi një vlerësim i parametrave të përgjithshëm, të cilët në shumicën e rasteve nuk janë të mundshme të llogariten për shkak ndaj paarritshmërisë së popullatës së përgjithshme (Figura 20) .

Figura 20. Gabim në kampionim

Por ju mund të specifikoni intervalin në të cilin, me një shkallë të caktuar probabiliteti, qëndron vlera e vërtetë (e përgjithshme) e karakteristikës statistikore. Ky interval quhet d intervali i besimit (CI).

Pra, vlera mesatare e përgjithshme me një probabilitet prej 95% qëndron brenda

nga në, (20)

Ku t – vlera e tabelës së testit të Studentit për α =0,05 dhe f= n-1

Një CI 99% mund të gjendet gjithashtu, në këtë rast t përzgjedhur për α =0,01.

Cila është rëndësia praktike e një intervali besimi?

    Një interval i gjerë besimi tregon se mesatarja e mostrës nuk pasqyron me saktësi mesataren e popullsisë. Kjo është zakonisht për shkak të një madhësie të pamjaftueshme të mostrës, ose të heterogjenitetit të saj, d.m.th. dispersion i madh. Të dyja japin një gabim më të madh të mesatares dhe, në përputhje me rrethanat, një CI më të gjerë. Dhe kjo është baza për t'u kthyer në fazën e planifikimit të kërkimit.

    Kufijtë e sipërm dhe të poshtëm të CI ofrojnë një vlerësim nëse rezultatet do të jenë klinikisht të rëndësishme

Le të ndalemi në disa detaje në çështjen e rëndësisë statistikore dhe klinike të rezultateve të studimit të vetive të grupit. Le të kujtojmë se detyra e statistikave është të zbulojë të paktën disa ndryshime në popullatat e përgjithshme bazuar në të dhënat e mostrës. Sfida për mjekët është të zbulojnë dallimet (jo vetëm ndonjë dallim) që do të ndihmojë në diagnostikimin ose trajtimin. Dhe konkluzionet statistikore nuk janë gjithmonë baza për përfundimet klinike. Kështu, një rënie statistikisht domethënëse e hemoglobinës me 3 g/l nuk është shkak për shqetësim. Dhe, anasjelltas, nëse ndonjë problem në trupin e njeriut nuk është i përhapur në nivel të gjithë popullatës, kjo nuk është arsye për të mos u marrë me këtë problem.

Le të shohim këtë situatë shembull.

Studiuesit pyetën veten nëse djemtë që kanë vuajtur nga një lloj sëmundje infektive mbeten prapa bashkëmoshatarëve të tyre në rritje. Për këtë qëllim u krye një studim mostër ku morën pjesë 10 djem që kishin vuajtur nga kjo sëmundje. Rezultatet janë paraqitur në tabelën 23.

Tabela 23. Rezultatet e përpunimit statistikor

kufiri i poshtëm

kufiri i sipërm

Standardet (cm)

mesatare

Nga këto përllogaritje rezulton se gjatësia mesatare e kampionit të djemve 10-vjeçarë që kanë vuajtur nga ndonjë sëmundje infektive është afër normales (132.5 cm). Megjithatë, kufiri i poshtëm i intervalit të besimit (126,6 cm) tregon se ekziston një probabilitet 95% që gjatësia mesatare e vërtetë e këtyre fëmijëve të korrespondojë me konceptin e "gjatësisë së shkurtër", d.m.th. këta fëmijë janë të rrëgjuar.

Në këtë shembull, rezultatet e llogaritjeve të intervalit të besimit janë klinikisht të rëndësishme.

Intervali i besimit për pritjet matematikore - ky është një interval i llogaritur nga të dhënat që, me një probabilitet të njohur, përmban pritshmërinë matematikore të popullatës së përgjithshme. Një vlerësim natyror për pritshmërinë matematikore është mesatarja aritmetike e vlerave të saj të vëzhguara. Prandaj, gjatë gjithë mësimit do të përdorim termat “mesatare” dhe “vlera mesatare”. Në problemet e llogaritjes së një intervali besimi, një përgjigje që kërkohet më shpesh është diçka si "Intervali i besimit të numrit mesatar [vlera në një problem të caktuar] është nga [vlera më e vogël] në [vlera më e madhe]". Duke përdorur një interval besimi, ju mund të vlerësoni jo vetëm vlerat mesatare, por edhe peshën specifike të një karakteristike të veçantë të popullatës. Në mësim diskutohen vlerat mesatare, dispersioni, devijimi standard dhe gabimi, përmes të cilave do të arrijmë në përkufizime dhe formula të reja. Karakteristikat e kampionit dhe popullatës .

Vlerësimet e pikës dhe intervalit të mesatares

Nëse vlera mesatare e popullsisë vlerësohet me një numër (pikë), atëherë një mesatare specifike, e cila llogaritet nga një mostër e vëzhgimeve, merret si një vlerësim i vlerës mesatare të panjohur të popullsisë. Në këtë rast, vlera e mesatares së mostrës - një ndryshore e rastësishme - nuk përkon me vlerën mesatare të popullatës së përgjithshme. Prandaj, kur tregoni mesataren e mostrës, duhet të tregoni njëkohësisht gabimin e kampionimit. Masa e gabimit të kampionimit është gabimi standard, i cili shprehet në të njëjtat njësi me mesataren. Prandaj, shpesh përdoret shënimi i mëposhtëm: .

Nëse vlerësimi i mesatares duhet të shoqërohet me një probabilitet të caktuar, atëherë parametri i interesit në popullatë duhet të vlerësohet jo me një numër, por me një interval. Një interval besimi është një interval në të cilin, me një probabilitet të caktuar P gjendet vlera e treguesit të vlerësuar të popullsisë. Intervali i besimit në të cilin është e mundshme P = 1 - α gjendet ndryshorja e rastësishme, e llogaritur si më poshtë:

,

α = 1 - P, i cili mund të gjendet në shtojcën e pothuajse çdo libri mbi statistikat.

Në praktikë, mesatarja e popullsisë dhe varianca nuk dihen, kështu që varianca e popullatës zëvendësohet me variancën e mostrës, dhe mesatarja e popullatës me mesataren e mostrës. Kështu, intervali i besimit në shumicën e rasteve llogaritet si më poshtë:

.

Formula e intervalit të besimit mund të përdoret për të vlerësuar mesataren e popullsisë nëse

  • dihet devijimi standard i popullatës;
  • ose devijimi standard i popullatës është i panjohur, por madhësia e kampionit është më e madhe se 30.

Mesatarja e mostrës është një vlerësim i paanshëm i mesatares së popullsisë. Nga ana tjetër, varianca e mostrës nuk është një vlerësim i paanshëm i variancës së popullsisë. Për të marrë një vlerësim të paanshëm të variancës së popullsisë në formulën e variancës së mostrës, madhësia e kampionit n duhet të zëvendësohet nga n-1.

Shembulli 1. Informacioni u mblodh nga 100 kafene të zgjedhura rastësisht në një qytet të caktuar se numri mesatar i të punësuarve në to është 10.5 me një devijim standard prej 4.6. Përcaktoni intervalin 95% të besimit për numrin e punonjësve të kafenesë.

ku është vlera kritike e shpërndarjes normale standarde për nivelin e rëndësisë α = 0,05 .

Kështu, intervali i besimit 95% për numrin mesatar të punonjësve të kafeneve varionte nga 9.6 në 11.4.

Shembulli 2. Për një kampion të rastësishëm nga një popullsi prej 64 vëzhgimesh, u llogaritën vlerat totale të mëposhtme:

shuma e vlerave në vëzhgime,

shuma e devijimeve në katror të vlerave nga mesatarja .

Llogaritni intervalin 95% të besimit për pritshmërinë matematikore.

Le të llogarisim devijimin standard:

,

Le të llogarisim vlerën mesatare:

.

Ne i zëvendësojmë vlerat në shprehjen për intervalin e besimit:

ku është vlera kritike e shpërndarjes normale standarde për nivelin e rëndësisë α = 0,05 .

Ne marrim:

Kështu, intervali i besimit 95% për pritshmërinë matematikore të këtij kampioni varionte nga 7.484 në 11.266.

Shembulli 3. Për një mostër të rastësishme të popullsisë prej 100 vëzhgimesh, mesatarja e llogaritur është 15.2 dhe devijimi standard është 3.2. Llogaritni intervalin e besimit 95% për vlerën e pritur, pastaj intervalin 99% të besimit. Nëse fuqia e mostrës dhe variacioni i saj mbeten të pandryshuara dhe koeficienti i besimit rritet, a do të ngushtohet apo zgjerohet intervali i besimit?

Ne i zëvendësojmë këto vlera në shprehjen për intervalin e besimit:

ku është vlera kritike e shpërndarjes normale standarde për nivelin e rëndësisë α = 0,05 .

Ne marrim:

.

Kështu, intervali i besimit 95% për mesataren e këtij kampioni varionte nga 14.57 në 15.82.

Ne përsëri i zëvendësojmë këto vlera në shprehjen për intervalin e besimit:

ku është vlera kritike e shpërndarjes normale standarde për nivelin e rëndësisë α = 0,01 .

Ne marrim:

.

Kështu, intervali 99% i besueshmërisë për mesataren e kësaj kampioni varionte nga 14.37 në 16.02.

Siç e shohim, me rritjen e koeficientit të besimit, rritet edhe vlera kritike e shpërndarjes normale standarde, dhe, për rrjedhojë, pikat e fillimit dhe të përfundimit të intervalit janë të vendosura më larg nga mesatarja, dhe kështu rritet intervali i besimit për pritshmërinë matematikore. .

Vlerësimet e pikës dhe intervalit të peshës specifike

Pjesa e disa tipareve të mostrës mund të interpretohet si një vlerësim pikë i aksionit fq e njëjta karakteristikë në popullatën e përgjithshme. Nëse kjo vlerë duhet të shoqërohet me probabilitetin, atëherë duhet të llogaritet intervali i besueshmërisë së gravitetit specifik. fq karakteristike në popullatën me probabilitet P = 1 - α :

.

Shembulli 4. Në një qytet ka dy kandidatë A Dhe B konkurrojnë për kryetar bashkie. 200 banorë të qytetit u anketuan rastësisht, nga të cilët 46% u përgjigjën se do të votonin për kandidatin A, 26% - për kandidatin B dhe 28% nuk ​​e dinë se për kë do të votojnë. Përcaktoni intervalin 95% të besimit për përqindjen e banorëve të qytetit që mbështesin kandidatin A.

Le të ndërtojmë një interval besimi në MS EXCEL për të vlerësuar vlerën mesatare të shpërndarjes në rastin e një vlere të njohur dispersioni.

Sigurisht zgjedhja niveli i besimit plotësisht varet nga problemi që zgjidhet. Kështu, shkalla e besimit të një pasagjeri ajror në besueshmërinë e një avioni duhet të jetë pa dyshim më e lartë se shkalla e besimit të një blerësi në besueshmërinë e një llambë elektrike.

Formulimi i problemit

Le të supozojmë se nga popullsia duke u marrë mostër madhësia n. Supozohet se devijimi standard kjo shpërndarje është e njohur. Është e nevojshme bazuar në këtë mostrat vlerësoni të panjohurën mesatare e shpërndarjes(μ, ) dhe ndërto përkatësen e dyanshme intervali i besimit.

Vlerësimi me pikë

Siç dihet nga statistikat(le ta shënojmë X mesatar) është vlerësim i paanshëm i mesatares kjo popullsia dhe ka një shpërndarje N(μ;σ 2 /n).

Shënim: Çfarë duhet të bëni nëse keni nevojë për të ndërtuar intervali i besimit në rastin e një shpërndarjeje që nuk është normale? Në këtë rast, vjen në shpëtim, i cili thotë se me një madhësi mjaft të madhe mostrat n nga shpërndarja duke mos qenë normale, shpërndarja e mostrës së statistikave X mesatar do përafërsisht korrespondojnë shpërndarje normale me parametra N(μ;σ 2 /n).

Pra, vlerësim pikë mesatare vlerat e shpërndarjes ne kemi - këtë mesatare e mostrës, d.m.th. X mesatar. Tani le të fillojmë intervali i besimit.

Ndërtimi i një intervali besimi

Zakonisht, duke ditur shpërndarjen dhe parametrat e saj, ne mund të llogarisim probabilitetin që ndryshorja e rastësishme të marrë një vlerë nga intervali që specifikojmë. Tani le të bëjmë të kundërtën: gjeni intervalin në të cilin ndryshorja e rastësishme do të bjerë me një probabilitet të caktuar. Për shembull, nga pronat shpërndarje normale dihet se me një probabilitet prej 95%, një ndryshore e rastësishme shpërndahet mbi ligj normal, do të bjerë brenda intervalit prej afërsisht +/- 2 nga vlera mesatare(shih artikullin rreth). Ky interval do të shërbejë si një prototip për ne intervali i besimit.

Tani le të shohim nëse e dimë shpërndarjen , për të llogaritur këtë interval? Për t'iu përgjigjur pyetjes, duhet të tregojmë formën e shpërndarjes dhe parametrat e saj.

Ne e dimë formën e shpërndarjes - kjo është shpërndarje normale(Mos harroni se ne po flasim për shpërndarja e mostrave statistikat X mesatar).

Parametri μ është i panjohur për ne (ai thjesht duhet të vlerësohet duke përdorur intervali i besimit), por ne kemi një vlerësim të tij X mesatar, llogaritur në bazë të mostrat, të cilat mund të përdoren.

Parametri i dytë - devijimi standard i mesatares së mostrës do ta konsiderojmë të njohur, është e barabartë me σ/√n.

Sepse nuk e dimë μ, atëherë do të ndërtojmë intervalin +/- 2 devijimet standarde jo nga vlera mesatare, dhe nga vlerësimi i tij i njohur X mesatar. ato. gjatë llogaritjes intervali i besimit ne NUK do ta supozojmë këtë X mesatar bie brenda intervalit +/- 2 devijimet standarde nga μ me një probabilitet prej 95%, dhe do të supozojmë se intervali është +/- 2 devijimet standarde nga X mesatar me probabilitet 95% do të mbulojë μ - mesatarja e popullsisë së përgjithshme, nga e cila është marrë mostër. Këto dy pohime janë ekuivalente, por pohimi i dytë na lejon të ndërtojmë intervali i besimit.

Përveç kësaj, le të sqarojmë intervalin: një ndryshore e rastësishme e shpërndarë ligj normal, me një probabilitet 95% bie brenda intervalit +/- 1,960 devijimet standarde, jo +/- 2 devijimet standarde. Kjo mund të llogaritet duke përdorur formulën =NORM.ST.REV((1+0,95)/2), cm. shembull Intervali i fletës së skedarit.

Tani mund të formulojmë një pohim probabilistik që do të na shërbejë për të formuar intervali i besimit:
“Probabiliteti që popullsia mesatare ndodhet nga mesatare e mostrës brenda 1,960 " devijimet standarde të mesatares së mostrës", e barabartë me 95%”.

Vlera e probabilitetit të përmendur në deklaratë ka një emër të veçantë , e cila është e lidhur me niveli i rëndësisë α (alfa) me një shprehje të thjeshtë niveli i besimit =1 . Në rastin tonë niveli i rëndësisë α =1-0,95=0,05 .

Tani, bazuar në këtë deklaratë probabilistike, ne shkruajmë një shprehje për llogaritjen intervali i besimit:

ku Z α/2 standarde shpërndarje normale(kjo vlerë e ndryshores së rastësishme z, Çfarë P(z>=Z α/2 )=α/2).

Shënim: A/2-kuantili i sipërm përcakton gjerësinë intervali i besimit V devijimet standarde mesatare e mostrës. A/2-kuantili i sipërm standarde shpërndarje normale gjithmonë më i madh se 0, gjë që është shumë e përshtatshme.

Në rastin tonë, me α=0.05, α/2-kuantili i sipërm është e barabartë me 1.960. Për nivele të tjera të rëndësisë α (10%; 1%) α/2-kuantili i sipërm Z α/2 mund të llogaritet duke përdorur formulën =NORM.ST.REV(1-α/2) ose, nëse dihet niveli i besimit, =NORM.ST.OBR((1+niveli i besimit)/2).

Zakonisht gjatë ndërtimit intervalet e besimit për vlerësimin e mesatares përdorni vetëm α sipërme/2-kuantile dhe mos e përdorni α më të ulët/2-kuantile. Kjo është e mundur sepse standarde shpërndarje normale në mënyrë simetrike rreth boshtit x ( dendësia e shpërndarjes së tij simetrike rreth mesatare, d.m.th. 0). Prandaj, nuk ka nevojë të llogaritet a/2-kuantile më e ulët(thjesht quhet α /2-kuantile), sepse është e barabartë α sipërme/2-kuantile me një shenjë minus.

Le të kujtojmë se, pavarësisht formës së shpërndarjes së vlerës x, ndryshorja e rastësishme përkatëse X mesatar të shpërndara përafërsisht Mirë N(μ; σ 2 /n) (shih artikullin rreth). Prandaj, në përgjithësi, shprehja e mësipërme për intervali i besimitështë vetëm një përafrim. Nëse vlera x shpërndahet mbi ligj normal N(μ;σ 2 /n), pastaj shprehja për intervali i besimitështë e saktë.

Llogaritja e intervalit të besimit në MS EXCEL

Le ta zgjidhim problemin.
Koha e përgjigjes së një komponenti elektronik ndaj një sinjali hyrës është një karakteristikë e rëndësishme e pajisjes. Një inxhinier dëshiron të ndërtojë një interval besimi për kohën mesatare të përgjigjes në një nivel besimi prej 95%. Nga përvoja e mëparshme, inxhinieri e di se devijimi standard i kohës së përgjigjes është 8 ms. Dihet se për të vlerësuar kohën e përgjigjes, inxhinieri bëri 25 matje, vlera mesatare ishte 78 ms.

Zgjidhje: Një inxhinier dëshiron të dijë kohën e përgjigjes së një pajisjeje elektronike, por ai e kupton që koha e përgjigjes nuk është një vlerë fikse, por një ndryshore e rastësishme që ka shpërndarjen e vet. Pra, më e mira për të cilën ai mund të shpresojë është të përcaktojë parametrat dhe formën e kësaj shpërndarjeje.

Fatkeqësisht, nga kushtet e problemit nuk e dimë formën e shpërndarjes së kohës së përgjigjes (nuk duhet të jetë normale). , kjo shpërndarje është gjithashtu e panjohur. Vetëm ai dihet devijimi standardσ=8. Prandaj, ndërsa ne nuk mund të llogarisim probabilitetet dhe të ndërtojmë intervali i besimit.

Megjithatë, pavarësisht se ne nuk e dimë shpërndarjen koha përgjigje e veçantë, ne e dimë se sipas CPT, shpërndarja e mostrave koha mesatare e përgjigjesështë përafërsisht normale(do të supozojmë se kushtet CPT kryhen, sepse madhësia mostrat mjaft i madh (n=25)) .

Për më tepër, mesatare kjo shpërndarje është e barabartë me vlera mesatare shpërndarja e një përgjigjeje të vetme, d.m.th. μ. A devijimi standard e kësaj shpërndarjeje (σ/√n) mund të llogaritet duke përdorur formulën =8/ROOT(25) .

Gjithashtu dihet se inxhinieri ka marrë vlerësim pikë parametri μ i barabartë me 78 ms (X mesatar). Prandaj, tani mund të llogarisim probabilitetet, sepse ne e dimë formën e shpërndarjes ( normale) dhe parametrat e tij (X mesatar dhe σ/√n).

Inxhinieri dëshiron të dijë pritje matematikoreμ shpërndarjet e kohës së përgjigjes. Siç u tha më lart, kjo μ është e barabartë me pritshmëria matematikore e shpërndarjes së kampionit të kohës mesatare të përgjigjes. Nëse përdorim shpërndarje normale N(Х mesatar; σ/√n), atëherë μ e dëshiruar do të jetë në intervalin +/-2*σ/√n me një probabilitet prej afërsisht 95%.

Niveli i rëndësisë barazohet me 1-0,95=0,05.

Më në fund, le të gjejmë kufirin e majtë dhe të djathtë intervali i besimit.
Kufiri i majtë: =78-NORM.ST.REV(1-0.05/2)*8/ROOT(25) = 74,864
Kufiri i djathtë: =78+NORM.ST.INV(1-0.05/2)*8/ROOT(25)=81.136

Kufiri i majtë: =NORM.REV(0.05/2; 78; 8/ROOT(25))
Kufiri i djathtë: =NORM.REV(1-0.05/2; 78; 8/ROOT(25))

Përgjigju: intervali i besimitNiveli i besimit 95% dhe σ=8msec barazohet 78+/-3,136 ms.

skedar shembull në fletën Sigma i njohur, krijoi një formular për llogaritjen dhe ndërtimin e dyanshme intervali i besimit për arbitrare mostrat me σ të dhënë dhe niveli i rëndësisë.

Funksioni CONFIDENCE.NORM().

Nëse vlerat mostrat janë në rang B20:B79 , A niveli i rëndësisë e barabartë me 0,05; pastaj formula MS EXCEL:
=MESATARE(B20:B79)-KOFIDENCE.NORM(0.05;σ; COUNT(B20:B79))
do të kthejë kufirin e majtë intervali i besimit.

I njëjti kufi mund të llogaritet duke përdorur formulën:
=MESATARE(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/ROOT(COUNT(B20:B79))

Shënim: Funksioni CONFIDENCE.NORM() u shfaq në MS EXCEL 2010. Në versionet e mëparshme të MS EXCEL, u përdor funksioni TRUST().

Intervali i besimit– vlerat kufizuese të një sasie statistikore që, me një probabilitet të caktuar besimi γ, do të jetë në këtë interval kur kampiononi një vëllim më të madh. Shënuar si P(θ - ε. Në praktikë, probabiliteti i besimit γ zgjidhet nga vlerat mjaft afër unitetit: γ = 0,9, γ = 0,95, γ = 0,99.

Qëllimi i shërbimit. Duke përdorur këtë shërbim, mund të përcaktoni:

  • intervali i besimit për mesataren e përgjithshme, intervali i besimit për variancën;
  • intervali i besimit për devijimin standard, intervali i besimit për pjesën e përgjithshme;
Zgjidhja që rezulton ruhet në një skedar Word (shih shembullin). Më poshtë është një udhëzim video se si të plotësoni të dhënat fillestare.

Shembulli nr. 1. Në një fermë kolektive, nga një tufë totale prej 1000 delesh, 100 dele iu nënshtruan qethjes me kontroll selektiv. Si rezultat, u krijua një prerje mesatare e leshit prej 4.2 kg për dele. Përcaktoni me një probabilitet prej 0,99 gabimin mesatar katror të kampionit kur përcaktoni prerjen mesatare të leshit për dele dhe kufijtë brenda të cilëve përmbahet vlera e prerjes nëse varianca është 2,5. Mostra nuk është e përsëritur.
Shembulli nr. 2. Nga një grup produktesh të importuara në postën e Doganës Veriore të Moskës, 20 mostra të produktit "A" u morën me kampionim të përsëritur rastësor. Si rezultat i testit, u përcaktua përmbajtja mesatare e lagështisë së produktit "A" në mostër, e cila rezultoi të jetë e barabartë me 6% me një devijim standard prej 1%.
Përcaktoni me probabilitet 0,683 kufijtë e përmbajtjes mesatare të lagështisë së produktit në të gjithë grupin e produkteve të importuara.
Shembulli nr. 3. Një anketë me 36 studentë tregoi se numri mesatar i teksteve të lexuara prej tyre gjatë vitit akademik ishte i barabartë me 6. Duke supozuar se numri i teksteve të lexuara nga një student për semestër ka një ligj të shpërndarjes normale me një devijim standard të barabartë me 6, gjeni : A) me një besueshmëri prej 0,99 vlerësimi interval për pritshmërinë matematikore të kësaj ndryshoreje të rastësishme; B) me çfarë probabiliteti mund të themi se numri mesatar i teksteve të lexuara nga një student për semestër, i llogaritur nga ky kampion, do të devijojë nga pritshmëria matematikore në vlerë absolute jo më shumë se 2.

Klasifikimi i intervaleve të besimit

Sipas llojit të parametrit që vlerësohet:

Sipas llojit të mostrës:

  1. Intervali i besimit për një mostër të pafundme;
  2. Intervali i besimit për kampionin përfundimtar;
Mostra quhet rimostrim, nëse objekti i përzgjedhur i kthehet popullatës përpara se të zgjedhë atë të radhës. Mostra quhet jo e përsëritur, nëse objekti i përzgjedhur nuk i kthehet popullatës. Në praktikë, zakonisht kemi të bëjmë me mostra jo të përsëritura.

Llogaritja e gabimit mesatar të kampionimit për kampionim të rastësishëm

Mospërputhja midis vlerave të treguesve të marrë nga kampioni dhe parametrave përkatës të popullatës së përgjithshme quhet gabim përfaqësimi.
Emërtimet e parametrave kryesorë të popullatave të përgjithshme dhe të mostrës.
Formulat mesatare të gabimit të kampionimit
rizgjedhjepërsërit përzgjedhjen
për mesatarenpër ndarjepër mesatarenpër ndarje
Marrëdhënia midis kufirit të gabimit të kampionimit (Δ) është e garantuar me njëfarë probabiliteti Р(t), dhe gabimi mesatar i kampionimit ka formën: ose Δ = t·μ, ku t– koeficienti i besimit, i përcaktuar në varësi të nivelit të probabilitetit P(t) sipas tabelës së funksionit integral Laplace.

Formulat për llogaritjen e madhësisë së kampionit duke përdorur një metodë kampionimi thjesht rastësor

INTERVALET E BESIMIT PËR FREKUENCA DHE THYESAT

© 2008

Instituti Kombëtar i Shëndetit Publik, Oslo, Norvegji

Artikulli përshkruan dhe diskuton llogaritjen e intervaleve të besimit për frekuencat dhe proporcionet duke përdorur metodat Wald, Wilson, Clopper - Pearson, duke përdorur transformimin këndor dhe metodën Wald me korrigjim Agresti - Coull. Materiali i paraqitur ofron informacion të përgjithshëm në lidhje me metodat për llogaritjen e intervaleve të besimit për frekuencat dhe proporcionet dhe synon të zgjojë interesin e lexuesve të ditarit jo vetëm në përdorimin e intervaleve të besimit kur prezantojnë rezultatet e kërkimit të tyre, por edhe në leximin e literaturës së specializuar përpara fillimit të punës. në botimet e ardhshme.

Fjalë kyçe: intervali i besimit, frekuenca, proporcioni

Një nga publikimet e mëparshme përmendi shkurtimisht përshkrimin e të dhënave cilësore dhe raportoi se vlerësimi i intervalit të tyre është i preferueshëm sesa vlerësimi pikësor për të përshkruar shpeshtësinë e shfaqjes së karakteristikës që studiohet në popullatë. Në të vërtetë, meqenëse kërkimi kryhet duke përdorur të dhëna të mostrës, projeksioni i rezultateve në popullatë duhet të përmbajë një element të pasaktësive të kampionimit. Intervali i besimit është një masë e saktësisë së parametrit që vlerësohet. Është interesante që disa libra mbi statistikat bazë për mjekët e injorojnë plotësisht temën e intervaleve të besimit për frekuencat. Në këtë artikull do të shikojmë disa mënyra për të llogaritur intervalet e besueshmërisë për frekuencat, duke nënkuptuar karakteristika të tilla të mostrës si mospërsëritja dhe përfaqësimi, si dhe pavarësia e vëzhgimeve nga njëra-tjetra. Në këtë artikull, frekuenca nuk kuptohet si një numër absolut që tregon se sa herë ndodh një vlerë e caktuar në total, por si një vlerë relative që përcakton përqindjen e pjesëmarrësve në studim në të cilët shfaqet karakteristika e studiuar.

Në kërkimet biomjekësore, më së shpeshti përdoren intervalet e besimit 95%. Ky interval besimi është zona brenda së cilës proporcioni i vërtetë bie 95% të rasteve. Me fjalë të tjera, mund të themi me besueshmëri 95% se vlera e vërtetë e shpeshtësisë së shfaqjes së një tipari në popullatë do të jetë brenda intervalit të besimit 95%.

Shumica e manualeve të statistikave për studiuesit mjekësorë raportojnë se gabimi i frekuencës llogaritet duke përdorur formulën

ku p është frekuenca e paraqitjes së karakteristikës në mostër (vlera nga 0 në 1). Shumica e artikujve shkencorë vendas tregojnë shpeshtësinë e shfaqjes së një tipari në një mostër (p), si dhe gabimin e tij (s) në formën p ± s. Megjithatë, është më e përshtatshme të paraqitet një interval besimi 95% për shpeshtësinë e shfaqjes së një tipari në popullatë, i cili do të përfshijë vlerat nga

te.

Disa manuale rekomandojnë që për mostrat e vogla, të zëvendësohet vlera 1,96 me vlerën t për N – 1 shkallë lirie, ku N është numri i vëzhgimeve në mostër. Vlera t gjendet duke përdorur tabela për shpërndarjen t, të disponueshme pothuajse në të gjitha tekstet shkollore të statistikave. Përdorimi i shpërndarjes t për metodën Wald nuk ofron përparësi të dukshme në krahasim me metodat e tjera të diskutuara më poshtë, dhe për këtë arsye nuk rekomandohet nga disa autorë.

Metoda e paraqitur më sipër për llogaritjen e intervaleve të besueshmërisë për frekuencat ose përmasat është quajtur Wald për nder të Abraham Wald (1902-1950), pasi përdorimi i saj i gjerë filloi pas publikimit të Wald dhe Wolfowitz në 1939. Sidoqoftë, vetë metoda u propozua nga Pierre Simon Laplace (1749-1827) në 1812.

Metoda Wald është shumë e popullarizuar, por aplikimi i saj shoqërohet me probleme të rëndësishme. Metoda nuk rekomandohet për madhësi të vogla të mostrave, si dhe në rastet kur frekuenca e shfaqjes së një karakteristike tenton në 0 ose 1 (0% ose 100%) dhe është thjesht e pamundur për frekuencat 0 dhe 1. Përveç kësaj, përafrimi i shpërndarjes normale, i cili përdoret gjatë llogaritjes së gabimit, "nuk funksionon" në rastet kur n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Meqenëse ndryshorja e re shpërndahet normalisht, kufijtë e poshtëm dhe të sipërm të intervalit 95% të besimit për ndryshoren φ do të jenë φ-1,96 dhe φ+1,96 majtas">

Në vend të 1,96 për mostrat e vogla, rekomandohet të zëvendësohet vlera t me N – 1 gradë lirie. Kjo metodë nuk prodhon vlera negative dhe lejon vlerësime më të sakta të intervaleve të besimit për frekuencat sesa metoda Wald. Për më tepër, ajo përshkruhet në shumë libra referimi vendas mbi statistikat mjekësore, gjë që, megjithatë, nuk ka çuar në përdorimin e saj të gjerë në kërkimin mjekësor. Llogaritja e intervaleve të besimit duke përdorur transformimin këndor nuk rekomandohet për frekuencat që i afrohen 0 ose 1.

Këtu zakonisht përfundon përshkrimi i metodave për vlerësimin e intervaleve të besimit në shumicën e librave mbi bazat e statistikave për studiuesit mjekësorë, dhe ky problem është tipik jo vetëm për literaturën vendase, por edhe për literaturën e huaj. Të dyja metodat bazohen në teoremën e kufirit qendror, që nënkupton një mostër të madhe.

Duke marrë parasysh mangësitë e vlerësimit të intervaleve të besimit duke përdorur metodat e mësipërme, Clopper dhe Pearson propozuan në vitin 1934 një metodë për llogaritjen e të ashtuquajturit interval i saktë i besimit, duke pasur parasysh shpërndarjen binomiale të tiparit që studiohet. Kjo metodë është e disponueshme në shumë kalkulatorë në internet, por intervalet e besimit të marra në këtë mënyrë janë në shumicën e rasteve shumë të gjera. Në të njëjtën kohë, kjo metodë rekomandohet për përdorim në rastet kur është i nevojshëm një vlerësim konservativ. Shkalla e konservativitetit të metodës rritet me zvogëlimin e madhësisë së kampionit, veçanërisht kur N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Sipas shumë statisticienëve, vlerësimi më optimal i intervaleve të besimit për frekuencat kryhet nga metoda Wilson, e propozuar në vitin 1927, por praktikisht nuk përdoret në kërkimet biomjekësore vendase. Kjo metodë jo vetëm që lejon vlerësimin e intervaleve të besueshmërisë për frekuencat shumë të vogla dhe shumë të mëdha, por është gjithashtu e zbatueshme për një numër të vogël vëzhgimesh. Në përgjithësi, intervali i besimit sipas formulës së Wilson-it ka formën



ku merr vlerën 1.96 kur llogaritet intervali i besueshmërisë 95%, N është numri i vëzhgimeve dhe p është frekuenca e shfaqjes së karakteristikës në mostër. Kjo metodë është e disponueshme në kalkulatorët në internet, kështu që përdorimi i saj nuk është problematik. dhe mos e rekomandoni përdorimin e kësaj metode për n p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Përveç metodës Wilson, metoda Wald me korrigjim Agresti-Coll besohet gjithashtu se ofron një vlerësim optimal të intervalit të besimit për frekuencat. Korrigjimi Agresti-Coll është një zëvendësim në formulën Wald të frekuencës së shfaqjes së një karakteristike në një mostër (p) me p`, kur llogaritet se cili 2 i shtohet numëruesit dhe 4 i shtohet emëruesit, d.m.th. p` = (X + 2) / (N + 4), ku X është numri i pjesëmarrësve në studim që kanë karakteristikën që studiohet dhe N është madhësia e kampionit. Ky modifikim prodhon rezultate shumë të ngjashme me formulën e Wilson, përveç kur frekuenca e ngjarjeve i afrohet 0% ose 100% dhe mostra është e vogël. Përveç metodave të mësipërme për llogaritjen e intervaleve të besueshmërisë për frekuencat, korrigjimet e vazhdimësisë janë propozuar për të dyja metodat Wald dhe Wilson për mostrat e vogla, por studimet kanë treguar se përdorimi i tyre është i papërshtatshëm.

Le të shqyrtojmë zbatimin e metodave të mësipërme për llogaritjen e intervaleve të besimit duke përdorur dy shembuj. Në rastin e parë, ne studiojmë një kampion të madh prej 1000 pjesëmarrësish të përzgjedhur rastësisht në studim, nga të cilët 450 kanë tiparin në studim (ky mund të jetë një faktor rreziku, një rezultat ose ndonjë tipar tjetër), që përfaqëson një frekuencë prej 0.45 ose 45 %. Në rastin e dytë, studimi kryhet duke përdorur një kampion të vogël, të themi, vetëm 20 persona, dhe vetëm 1 pjesëmarrës në studim (5%) ka tiparin e studiuar. Intervalet e besimit duke përdorur metodën Wald, metodën Wald me korrigjim Agresti–Coll dhe metodën Wilson janë llogaritur duke përdorur një kalkulator në internet të zhvilluar nga Jeff Sauro (http://www. /wald. htm). Intervalet e besimit të korrigjuara nga Wilson u llogaritën duke përdorur kalkulatorin e ofruar nga Wassar Stats: Web Site for Statistical Computation (http://faculty.vassar.edu/lowry/prop1.html). Llogaritjet e transformimit Angular Fisher u kryen manualisht duke përdorur vlerën kritike t për 19 dhe 999 gradë lirie, respektivisht. Rezultatet e llogaritjes janë paraqitur në tabelë për të dy shembujt.

Intervalet e besimit llogariten në gjashtë mënyra të ndryshme për dy shembuj të përshkruar në tekst

Metoda e llogaritjes së intervalit të besimit

P=0.0500, ose 5%

95% CI për X=450, N=1000, P=0.4500, ose 45%

–0,0455–0,2541

Wald me korrigjim Agresti–Coll

<,0001–0,2541

Wilson me korrigjim të vazhdimësisë

Clopper-Pearson "metoda e saktë"

Transformimi këndor

<0,0001–0,1967

Siç mund të shihet nga tabela, për shembullin e parë, intervali i besueshmërisë i llogaritur duke përdorur metodën Wald "të pranuar përgjithësisht" hyn në rajonin negativ, gjë që nuk mund të jetë rasti për frekuencat. Fatkeqësisht, incidente të tilla nuk janë të rralla në letërsinë ruse. Mënyra tradicionale e paraqitjes së të dhënave për nga frekuenca dhe gabimi i tyre e maskon pjesërisht këtë problem. Për shembull, nëse frekuenca e shfaqjes së një tipari (në përqindje) paraqitet si 2.1 ± 1.4, atëherë kjo nuk është aq "fyese për syrin" sa 2.1% (95% CI: -0.7; 4.9), megjithëse dhe do të thotë e njejta gje. Metoda Wald me korrigjimin dhe llogaritjen Agresti-Coll duke përdorur transformimin këndor jep një kufi më të ulët që priret në zero. Metoda e korrigjuar nga vazhdimësia e Wilson dhe "metoda e saktë" prodhojnë intervale më të gjera besimi sesa metoda e Wilson. Për shembullin e dytë, të gjitha metodat japin afërsisht të njëjtat intervale besimi (dallimet shfaqen vetëm në të mijtët), gjë që nuk është befasuese, pasi frekuenca e shfaqjes së ngjarjes në këtë shembull nuk është shumë e ndryshme nga 50%, dhe madhësia e kampionit është mjaft i madh.

Për lexuesit e interesuar për këtë problem, ne mund të rekomandojmë veprat e R. G. Newcombe dhe Brown, Cai dhe Dasgupta, të cilat ofrojnë të mirat dhe të këqijat e përdorimit të 7 dhe 10 metodave të ndryshme për llogaritjen e intervaleve të besimit, respektivisht. Ndër manualet vendase, ne rekomandojmë librin dhe, i cili, përveç një përshkrimi të detajuar të teorisë, paraqet metodat e Wald dhe Wilson, si dhe një metodë për llogaritjen e intervaleve të besimit duke marrë parasysh shpërndarjen binomiale të frekuencës. Përveç kalkulatorëve online falas (http://www. /wald. htm dhe http://faculty. vassar. edu/lowry/prop1.html), intervalet e besimit për frekuencat (dhe jo vetëm!) mund të llogariten duke përdorur Programi i CIA-s ( Analiza e Intervaleve të Besimit), i cili mund të shkarkohet nga http://www. shkolla e mesme. soton. ac. uk/cia/ .

Artikulli tjetër do të shqyrtojë mënyrat e njëanshme për të krahasuar të dhënat cilësore.

Referencat

Banerji A. Statistikat mjekësore në gjuhë të qartë: një kurs hyrës / A. Banerjee. – M.: Mjekësi praktike, 2007. – 287 f. Statistikat mjekësore / . – M.: Agjencia e Informacionit Mjekësor, 2007. – 475 f. Glanz S. Statistikat mjekësore dhe biologjike / S. Glanz. – M.: Praktika, 1998. Llojet e të dhënave, testimi i shpërndarjes dhe statistikat përshkruese // Ekologjia njerëzore – 2008. – Nr. 1. – F. 52–58. Zhizhin K. S.. Statistikat mjekësore: tekst shkollor / . – Rostov n/d: Phoenix, 2007. – 160 f. Statistikat mjekësore të aplikuara / , . – Shën Petersburg. : Foliot, 2003. – 428 f. Lakin G. F. Biometrike / . – M.: Shkolla e lartë, 1990. – 350 f. Mjeku V. A. Statistikat matematikore në mjekësi / , . – M.: Financa dhe statistika, 2007. – 798 f. Statistikat matematikore në kërkimin klinik / , . – M.: GEOTAR-MED, 2001. – 256 f. Junkerov V. DHE. Përpunimi mjekësor dhe statistikor i të dhënave të kërkimit mjekësor / , . – Shën Petersburg. : VmedA, 2002. – 266 f. Agresti A. E përafërt është më e mirë se sa e saktë për vlerësimin interval të përmasave binomiale / A. Agresti, B. Coull // Statistician amerikan. – 1998. – N 52. – F. 119–126. Altman D. Statistikat me besim // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – Londër: BMJ Books, 2000. – 240 f. Brown L.D. Vlerësimi i intervalit për një proporcion binomial / L. D. Brown, T. T. Cai, A. Dasgupta // Shkenca statistikore. – 2001. – N 2. – F. 101–133. Clopper C.J. Përdorimi i kufijve të besimit ose fiducial i ilustruar në rastin e binomit / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – F. 404–413. Garcia-Perez M.A. Mbi intervalin e besimit për parametrin binomial / M. A. Garcia-Perez // Cilësia dhe sasia. – 2005. – N 39. – F. 467–481. Motulsky H. Biostatistika intuitive // ​​H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 f. Newcombe R. G. Intervalet e besimit të dyanshëm për proporcionin e vetëm: Krahasimi i shtatë metodave / R. G. Newcombe // Statistikat në mjekësi. – 1998. – N. 17. – F. 857–872. Sauro J. Vlerësimi i shkallës së përfundimit nga mostrat e vogla duke përdorur intervalet e besimit binomial: krahasime dhe rekomandime / J. Sauro, J. R. Lewis // Takimi vjetor i shoqërisë së faktorëve njerëzorë dhe ergonomisë. - Orlando, FL, 2005. Wald A. Kufijtë e besimit për funksionet e shpërndarjes së vazhdueshme // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – F. 105–118. Wilson E.B. Konkluzioni i mundshëm, ligji i trashëgimisë dhe përfundimi statistikor / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – F. 209–212.

INTERVALET E BESIMIT PËR PROPORIONET

A. M. Gribovski

Instituti Kombëtar i Shëndetit Publik, Oslo, Norvegji

Artikulli paraqet disa metoda për llogaritjet e intervaleve të besueshmërisë për proporcione binomiale, përkatësisht, metodat Wald, Wilson, arcsine, Agresti-Coull dhe ekzakte Clopper-Pearson. Punimi jep vetëm një hyrje të përgjithshme për problemin e vlerësimit të intervalit të besimit të një proporcioni binomial dhe qëllimi i tij nuk është vetëm të stimulojë lexuesit të përdorin intervalet e besimit kur paraqesin rezultatet e kërkimit të tyre empirik, por edhe t'i inkurajojë ata të konsultohen me libra statistikash. para analizimit të të dhënave të veta dhe përgatitjes së dorëshkrimeve.

Fjalë kyçe: intervali i besimit, proporcioni

Informacioni i kontaktit:

Këshilltar i Lartë, Instituti Kombëtar i Shëndetit Publik, Oslo, Norvegji



Ju pëlqeu artikulli? Ndani me miqtë tuaj!