Kaj imenujemo interval zaupanja. Točkovne in intervalne ocene specifične teže

INTERVALI ZAUPANJA ZA FREKVENCE IN FRAKCIJE

© 2008

Nacionalni inštitut za javno zdravje, Oslo, Norveška

Članek opisuje in obravnava izračun intervalov zaupanja za frekvence in proporce z uporabo metod Wald, Wilson, Clopper - Pearson, z uporabo kotne transformacije in Waldove metode z Agresti - Coullovo korekcijo. Predstavljeno gradivo ponuja splošne informacije o metodah za izračun intervalov zaupanja za frekvence in deleže in je namenjeno vzbuditi zanimanje bralcev revij ne le za uporabo intervalov zaupanja pri predstavitvi rezultatov lastnih raziskav, temveč tudi za branje strokovne literature pred začetkom dela o prihodnjih publikacijah.

Ključne besede: interval zaupanja, frekvenca, delež

Ena od prejšnjih publikacij je na kratko omenila opis kvalitativnih podatkov in poročala, da je njihova intervalna ocena boljša od točkovne ocene za opis pogostosti pojavljanja lastnosti, ki jo proučujemo v populaciji. Ker se raziskave izvajajo z uporabo vzorčnih podatkov, mora projekcija rezultatov na populacijo vsebovati element nenatančnosti vzorčenja. Interval zaupanja je merilo točnosti parametra, ki se ocenjuje. Zanimivo je, da nekatere knjige o osnovni statistiki za zdravnike popolnoma zanemarjajo temo intervalov zaupanja za frekvence. V tem članku si bomo ogledali več načinov za izračun intervalov zaupanja za frekvence, kar pomeni značilnosti vzorca, kot sta neponavljanje in reprezentativnost, pa tudi neodvisnost opazovanj drug od drugega. V tem članku frekvenca ni razumljena kot absolutno število, ki kaže, kolikokrat se posamezna vrednost pojavi v agregatu, ampak kot relativna vrednost, ki določa delež udeležencev študije, pri katerih se pojavlja proučevana značilnost.

V biomedicinskih raziskavah se najpogosteje uporabljajo 95-odstotni intervali zaupanja. Ta interval zaupanja je območje, znotraj katerega dejanski delež pade 95 % časa. Z drugimi besedami, lahko s 95-odstotno zanesljivostjo trdimo, da bo prava vrednost pogostosti pojavljanja lastnosti v populaciji znotraj 95-odstotnega intervala zaupanja.

Večina statističnih priročnikov za medicinske raziskovalce poroča, da se frekvenčna napaka izračuna po formuli

kjer je p pogostost pojavljanja lastnosti v vzorcu (vrednost od 0 do 1). Večina domačih znanstvenih člankov navaja pogostost pojavljanja lastnosti v vzorcu (p), pa tudi njene napake (e) v obliki p ± s. Primerneje pa je predstaviti 95% interval zaupanja za pogostost pojavljanja lastnosti v populaciji, ki bo vključeval vrednosti iz

prej.

Nekateri priročniki priporočajo, da se pri majhnih vzorcih vrednost 1,96 nadomesti z vrednostjo t za N – 1 prostostne stopinje, kjer je N število opazovanj v vzorcu. Vrednost t se najde iz tabel za t-porazdelitev, ki so na voljo v skoraj vseh statističnih učbenikih. Uporaba porazdelitve t za Waldovo metodo ne daje vidnih prednosti v primerjavi z drugimi spodaj obravnavanimi metodami, zato je nekateri avtorji ne priporočajo.

Zgoraj predstavljena metoda za izračun intervalov zaupanja za frekvence ali deleže se imenuje Wald v čast Abrahamu Waldu (1902–1950), saj se je njena široka uporaba začela po objavi Walda in Wolfowitza leta 1939. Vendar je samo metodo leta 1812 predlagal Pierre Simon Laplace (1749–1827).

Waldova metoda je zelo priljubljena, vendar je njena uporaba povezana s precejšnjimi težavami. Metoda ni priporočljiva za majhne velikosti vzorcev, kot tudi v primerih, ko se pogostost pojavljanja značilnosti nagiba k 0 ali 1 (0% ali 100%) in je preprosto nemogoča za frekvence 0 in 1. Poleg tega je aproksimacija normalne porazdelitve, ki se uporablja pri izračunu napake, “ne deluje” v primerih, ko je n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Ker je nova spremenljivka normalno porazdeljena, bosta spodnja in zgornja meja 95-odstotnega intervala zaupanja za spremenljivko φ φ-1,96 in φ+1,96levo">

Namesto 1,96 za majhne vzorce je priporočljivo, da vrednost t nadomestimo z N – 1 prostostnimi stopinjami. Ta metoda ne daje negativnih vrednosti in omogoča natančnejše ocene intervalov zaupanja za frekvence kot Waldova metoda. Poleg tega je opisan v številnih domačih referenčnih knjigah o medicinski statistiki, kar pa ni privedlo do njegove široke uporabe v medicinskih raziskavah. Izračun intervalov zaupanja z uporabo kotne transformacije ni priporočljiv za frekvence, ki se približujejo 0 ali 1.

Tukaj se običajno konča opis metod za ocenjevanje intervalov zaupanja v večini knjig o osnovah statistike za medicinske raziskovalce, ta problem pa je značilen ne samo za domačo, ampak tudi za tujo literaturo. Obe metodi temeljita na centralnem mejnem izreku, ki implicira velik vzorec.

Ob upoštevanju pomanjkljivosti ocenjevanja intervalov zaupanja z uporabo zgornjih metod sta Clopper in Pearson leta 1934 predlagala metodo za izračun tako imenovanega natančnega intervala zaupanja glede na binomsko porazdelitev preučevane lastnosti. Ta metoda je na voljo v številnih spletnih kalkulatorjih, vendar so tako dobljeni intervali zaupanja v večini primerov preširoki. Hkrati je ta metoda priporočljiva za uporabo v primerih, ko je potrebna konzervativna ocena. Stopnja konzervativnosti metode se povečuje, ko se velikost vzorca zmanjšuje, zlasti kadar N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

Po mnenju mnogih statistikov je najbolj optimalna ocena intervalov zaupanja za frekvence izvedena po Wilsonovi metodi, ki je bila predlagana že leta 1927, vendar se praktično ne uporablja v domačih biomedicinskih raziskavah. Ta metoda ne omogoča le ocene intervalov zaupanja za zelo majhne in zelo velike frekvence, ampak je uporabna tudi za majhno število opazovanj. Na splošno ima interval zaupanja po Wilsonovi formuli obliko



kjer zavzame vrednost 1,96 pri izračunu 95 % intervala zaupanja, N je število opazovanj, p pa je pogostost pojavljanja značilnosti v vzorcu. Ta metoda je na voljo v spletnih kalkulatorjih, zato njena uporaba ni problematična. in ne priporočamo uporabe te metode za n str< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Poleg Wilsonove metode naj bi tudi Waldova metoda s korekcijo Agresti–Coll zagotovila optimalno oceno intervala zaupanja za frekvence. Agresti-Collov popravek je v Waldovi formuli zamenjava pogostosti pojavljanja lastnosti v vzorcu (p) s p`, pri čemer se števcu prišteje 2, imenovalcu pa 4, tj. p` = (X + 2) / (N + 4), kjer je X število udeležencev študije, ki imajo proučevano lastnost, N pa velikost vzorca. Ta modifikacija daje rezultate, ki so zelo podobni Wilsonovi formuli, razen kadar se frekvenca dogodkov približa 0 % ali 100 % in je vzorec majhen. Poleg zgornjih metod za izračun intervalov zaupanja za frekvence so bili predlagani popravki kontinuitete tako za Waldovo kot Wilsonovo metodo za majhne vzorce, vendar so študije pokazale, da je njihova uporaba neprimerna.

Oglejmo si uporabo zgornjih metod za izračun intervalov zaupanja na dveh primerih. V prvem primeru proučujemo velik vzorec 1.000 naključno izbranih udeležencev študije, od katerih ima 450 preučevano lastnost (to je lahko dejavnik tveganja, izid ali katera koli druga lastnost), kar predstavlja frekvenco 0,45 ali 45 %. V drugem primeru se študija izvaja na majhnem vzorcu, recimo samo 20 ljudi, in samo 1 udeleženec študije (5%) ima proučevano lastnost. Intervali zaupanja z uporabo Waldove metode, Waldove metode s korekcijo Agresti–Coll in Wilsonove metode so bili izračunani s spletnim kalkulatorjem, ki ga je razvil Jeff Sauro (http://www. /wald. htm). Wilsonovi s kontinuiteto popravljeni intervali zaupanja so bili izračunani z uporabo kalkulatorja, ki ga je ponudil Wassar Stats: spletno mesto za statistične izračune (http://faculty.vassar.edu/lowry/prop1.html). Izračuni kotne Fisherjeve transformacije so bili izvedeni ročno z uporabo kritične vrednosti t za 19 oziroma 999 prostostnih stopinj. Rezultati izračuna so predstavljeni v tabeli za oba primera.

Intervali zaupanja izračunani na šest različnih načinov za dva primera, opisana v besedilu

Metoda izračuna intervala zaupanja

P = 0,0500 ali 5 %

95 % IZ za X=450, N=1000, P=0,4500 ali 45 %

–0,0455–0,2541

Wald z Agresti–Collovim popravkom

<,0001–0,2541

Wilson s popravkom kontinuitete

Clopper-Pearsonova "natančna metoda"

Kotna transformacija

<0,0001–0,1967

Kot je razvidno iz tabele, za prvi primer interval zaupanja, izračunan po »splošno sprejeti« metodi Wald, vstopi v negativno območje, kar ne more veljati za frekvence. Na žalost takšni dogodki v ruski literaturi niso redki. Tradicionalni način predstavitve podatkov glede na frekvenco in njihovo napako delno prikrije ta problem. Na primer, če je pogostost pojavljanja lastnosti (v odstotkih) predstavljena kot 2,1 ± 1,4, potem to ni tako »žaljivo za oko« kot 2,1 % (95 % IZ: –0,7; 4,9), čeprav in pomeni ista stvar. Waldova metoda z Agresti–Collovim popravkom in izračun z uporabo kotne transformacije daje spodnjo mejo, ki teži k ničli. Wilsonova metoda s korekcijo kontinuitete in "natančna metoda" dajeta širše intervale zaupanja kot Wilsonova metoda. Za drugi primer dajejo vse metode približno enake intervale zaupanja (razlike se pokažejo le v tisočinkah), kar ni presenetljivo, saj se pogostost pojavljanja dogodka v tem primeru ne razlikuje veliko od 50 %, velikost vzorca pa je precej velik.

Bralcem, ki se zanimajo za ta problem, lahko priporočimo dela R. G. Newcomba ter Browna, Caija in Dasgupta, ki podajajo prednosti in slabosti uporabe 7 oziroma 10 različnih metod za izračun intervalov zaupanja. Med domačimi priročniki priporočamo knjigo in, ki poleg podrobnega opisa teorije predstavlja metodi Walda in Wilsona ter metodo za izračun intervalov zaupanja ob upoštevanju binomske frekvenčne porazdelitve. Poleg brezplačnih spletnih kalkulatorjev (http://www. /wald. htm in http://faculty. vassar. edu/lowry/prop1.html) lahko intervale zaupanja za frekvence (in ne samo!) izračunate z uporabo Program CIA (Confidence Intervals Analysis), ki ga lahko prenesete s spletne strani http://www. medicinska šola. soton. ac. uk/cia/.

Naslednji članek bo obravnaval enovariantne načine primerjave kvalitativnih podatkov.

Bibliografija

Banerji A. Medicinska statistika v jasnem jeziku: uvodni tečaj / A. Banerjee. – M.: Praktična medicina, 2007. – 287 str. Medicinska statistika / . – M.: Medicinska informacijska agencija, 2007. – 475 str. Glanz S. Medicinska in biološka statistika / S. Glanz. – M.: Praktika, 1998. Tipi podatkov, testiranje distribucije in deskriptivna statistika // Človeška ekologija – 2008. – št. 1. – Str. 52–58. Žižin K. S.. Medicinska statistika: učbenik / . – Rostov n/d: Phoenix, 2007. – 160 str. Uporabna medicinska statistika / , . - St. Petersburg. : Foliot, 2003. – 428 str. Lakin G. F. Biometrija / . – M.: Višja šola, 1990. – 350 str. Medik V. A. Matematična statistika v medicini / , . – M.: Finance in statistika, 2007. – 798 str. Matematična statistika v kliničnih raziskavah / , . – M.: GEOTAR-MED, 2001. – 256 str. Junkerov V. IN. Medicinska in statistična obdelava podatkov medicinskih raziskav / , . - St. Petersburg. : VmedA, 2002. – 266 str. Agresti A. Približno je boljše od natančnega za intervalno oceno binomskih razmerij / A. Agresti, B. Coull // Ameriški statistik. – 1998. – N 52. – Str. 119–126. Altman D. Statistika z zaupanjem // D. Altman, D. Machin, T. Bryant, M. J. Gardner. – London: BMJ Books, 2000. – 240 str. Brown L.D. Intervalna ocena za binomski delež / L. D. Brown, T. T. Cai, A. Dasgupta // Statistična znanost. – 2001. – N 2. – Str. 101–133. Clopper C.J. Uporaba zaupanja ali fiducialnih meja, prikazanih na primeru binoma / C. J. Clopper, E. S. Pearson // Biometrika. – 1934. – N 26. – Str. 404–413. Garcia-Perez M. A. O intervalu zaupanja za binomski parameter / M. A. Garcia-Perez // Kakovost in količina. – 2005. – N 39. – Str. 467–481. Motulsky H. Intuitivna biostatistika // H. Motulsky. – Oxford: Oxford University Press, 1995. – 386 str. Newcombe R. G. Dvostranski intervali zaupanja za enojni delež: Primerjava sedmih metod / R. G. Newcombe // Statistika v medicini. – 1998. – N. 17. – Str. 857–872. Sauro J. Ocenjevanje stopenj zaključevanja iz majhnih vzorcev z uporabo binomskih intervalov zaupanja: primerjave in priporočila / J. Sauro, J. R. Lewis // Proceedings of the Human Factors and Ergonomics Society letno srečanje. – Orlando, FL, 2005. Wald A. Meje zaupanja za zvezne porazdelitvene funkcije // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. – 1939. – N 10. – Str. 105–118. Wilson E.B. Verjetno sklepanje, zakon o nasledstvu in statistično sklepanje / E. B. Wilson // Journal of American Statistical Association. – 1927. – N 22. – Str. 209–212.

INTERVALI ZAUPANJA ZA PROPORCIJE

A. M. Grjibovski

Nacionalni inštitut za javno zdravje, Oslo, Norveška

V članku je predstavljenih več metod za izračun intervalov zaupanja za binomska razmerja, in sicer Waldova, Wilsonova, arcsinusna, Agresti-Coullova in eksaktna Clopper-Pearsonova metoda. Prispevek daje le splošen uvod v problem ocenjevanja intervala zaupanja binomskega deleža, njegov cilj pa je ne le spodbuditi bralce k uporabi intervalov zaupanja pri predstavitvi rezultatov lastnih empiričnih raziskav, temveč jih spodbuditi k ogledu statističnih knjig. pred analizo lastnih podatkov in pripravo rokopisov.

Ključne besede: interval zaupanja, delež

Kontaktni podatki:

Višji svetovalec, Nacionalni inštitut za javno zdravje, Oslo, Norveška

Intervali zaupanja ( angleščina Intervali zaupanja) ena od vrst intervalnih ocen, ki se uporabljajo v statistiki in se izračunajo za dano raven pomembnosti. Omogočajo nam trditev, da je prava vrednost neznanega statističnega parametra populacije znotraj dobljenega razpona vrednosti z verjetnostjo, ki je podana z izbrano stopnjo statistične pomembnosti.

Normalna porazdelitev

Ko je znana varianca (σ 2) populacije podatkov, se lahko z-rezultat uporabi za izračun meja zaupanja (končne točke intervala zaupanja). V primerjavi z uporabo t-porazdelitve vam bo uporaba z-rezultata omogočila, da sestavite ne le ožji interval zaupanja, temveč tudi bolj zanesljive ocene pričakovane vrednosti in standardnega odklona (σ), saj z-rezultat temelji na normalna porazdelitev.

Formula

Za določitev mejnih točk intervala zaupanja, če je znan standardni odklon populacije podatkov, se uporabi naslednja formula

L = X - Z α/2 σ
√n

Primer

Predpostavimo, da je velikost vzorca 25 opazovanj, pričakovana vrednost vzorca 15 in standardna deviacija populacije 8. Za raven pomembnosti α=5 % je rezultat Z Z α/2 =1,96. V tem primeru bosta spodnja in zgornja meja intervala zaupanja

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Tako lahko rečemo, da bo matematično pričakovanje prebivalstva s 95% verjetnostjo padlo v razpon od 11,864 do 18,136.

Metode za zoženje intervala zaupanja

Predpostavimo, da je obseg preširok za namene naše raziskave. Obstajata dva načina za zmanjšanje obsega intervala zaupanja.

  1. Zmanjšajte raven statistične pomembnosti α.
  2. Povečajte velikost vzorca.

Z zmanjšanjem stopnje statistične pomembnosti na α=10 % dobimo Z-rezultat, ki je enak Z α/2 =1,64. V tem primeru bosta spodnja in zgornja meja intervala

L = 15 - 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

In sam interval zaupanja lahko zapišemo v obliki

V tem primeru lahko predpostavimo, da bo z 90-odstotno verjetnostjo matematično pričakovanje populacije padlo v razpon .

Če ne želimo zmanjšati stopnje statistične pomembnosti α, je edina alternativa povečanje velikosti vzorca. Če ga povečamo na 144 opazovanj, dobimo naslednje vrednosti meja zaupanja

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Sam interval zaupanja bo imel naslednjo obliko

Tako je zoženje intervala zaupanja brez zmanjšanja stopnje statistične pomembnosti mogoče le s povečanjem velikosti vzorca. Če povečanje velikosti vzorca ni mogoče, lahko zožitev intervala zaupanja dosežemo izključno z zmanjšanjem stopnje statistične pomembnosti.

Konstruiranje intervala zaupanja za porazdelitev, ki ni normalna

Če standardni odklon populacije ni znan ali se porazdelitev razlikuje od običajne, se za izgradnjo intervala zaupanja uporabi t-porazdelitev. Ta tehnika je bolj konzervativna, kar se odraža v širših intervalih zaupanja, v primerjavi s tehniko, ki temelji na Z-score.

Formula

Za izračun spodnje in zgornje meje intervala zaupanja na podlagi t-porazdelitve uporabite naslednje formule

L = X - t α σ
√n

Studentova porazdelitev ali t-porazdelitev je odvisna samo od enega parametra - števila prostostnih stopenj, ki je enako številu posameznih vrednosti atributa (številu opazovanj v vzorcu). Vrednost Studentovega t-testa za dano število prostostnih stopinj (n) in stopnjo statistične pomembnosti α najdete v referenčnih tabelah.

Primer

Predpostavimo, da je velikost vzorca 25 posameznih vrednosti, pričakovana vrednost vzorca 50, standardna deviacija vzorca pa 28. Potrebno je zgraditi interval zaupanja za stopnjo statistične pomembnosti α=5 %.

V našem primeru je število prostostnih stopinj 24 (25-1), zato je ustrezna tabelarna vrednost Studentovega t-testa za stopnjo statistične pomembnosti α=5 % 2,064. Zato bosta spodnja in zgornja meja intervala zaupanja

L = 50 - 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

In sam interval lahko zapišemo v obliki

Tako lahko rečemo, da bo s 95% verjetnostjo matematično pričakovanje populacije v območju .

Uporaba porazdelitve t vam omogoča, da zožite interval zaupanja z zmanjšanjem statistične pomembnosti ali s povečanjem velikosti vzorca.

Z zmanjšanjem statistične pomembnosti s 95 % na 90 % v pogojih našega primera dobimo ustrezno vrednost tabele Studentovega t-testa 1,711.

L = 50 - 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

V tem primeru lahko rečemo, da bo z 90% verjetnostjo matematično pričakovanje populacije v območju .

Če ne želimo zmanjšati statistične pomembnosti, potem je edina alternativa povečanje velikosti vzorca. Recimo, da gre za 64 posameznih opazovanj in ne za 25 kot v prvotnem stanju primera. Tabelarna vrednost Studentovega t-testa za 63 prostostnih stopinj (64-1) in stopnjo statistične pomembnosti α=5 % je 1,998.

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

To nam omogoča, da rečemo, da bo s 95-odstotno verjetnostjo matematično pričakovanje populacije v območju .

Veliki vzorci

Veliki vzorci so vzorci iz populacije podatkov, v kateri število posameznih opazovanj presega 100. Statistične študije so pokazale, da so večji vzorci ponavadi normalno porazdeljeni, tudi če porazdelitev populacije ni normalna. Poleg tega za take vzorce daje uporaba z-rezultata in t-porazdelitve približno enake rezultate pri konstruiranju intervalov zaupanja. Tako je za velike vzorce sprejemljivo uporabiti z-rezultat za normalno porazdelitev namesto t-porazdelitve.

Naj povzamemo

Intervali zaupanja.

Izračun intervala zaupanja temelji na povprečni napaki ustreznega parametra. Interval zaupanja prikazuje, v kakšnih mejah z verjetnostjo (1-a) je prava vrednost ocenjenega parametra. Tu je a stopnja pomembnosti, (1-a) se imenuje tudi verjetnost zaupanja.

V prvem poglavju smo pokazali, da je na primer za aritmetično sredino prava populacijska sredina v približno 95 % primerov znotraj 2 standardnih napak srednje vrednosti. Tako bodo meje 95-odstotnega intervala zaupanja za povprečje ločene od vzorčnega povprečja za dvojno povprečno napako povprečja, tj. povprečno napako povprečja pomnožimo z določenim koeficientom glede na stopnjo zaupanja. Za povprečje in razliko povprečij se vzame Studentov koeficient (kritična vrednost Studentovega testa), za delež in razliko deležev pa kritična vrednost kriterija z. Produkt koeficienta in povprečne napake lahko imenujemo največja napaka danega parametra, tj. največ, kar lahko dobimo pri ocenjevanju.

Interval zaupanja za aritmetična sredina : .

Tukaj je vzorčno povprečje;

Povprečna napaka aritmetične sredine;

s – standardni odklon vzorca;

n

f = n-1 (Študentov koeficient).

Interval zaupanja za razlike aritmetičnih sredin :

Tukaj je razlika med vzorčnimi sredstvi;

- povprečna napaka razlike med aritmetičnimi sredinami;

s 1, s 2 – standardni odkloni vzorca;

n1,n2

Kritična vrednost Studentovega testa za dano stopnjo pomembnosti a in število prostostnih stopinj f=n 1 +n 2-2 (Študentov koeficient).

Interval zaupanja za delnice :

.

Tukaj je d delež vzorca;

– napaka povprečnega ulomka;

n– velikost vzorca (velikost skupine);

Interval zaupanja za razlika deležev :

Tukaj je razlika v vzorčnih deležih;

– povprečna napaka razlike med aritmetičnimi sredinami;

n1,n2– količine vzorcev (število skupin);

Kritična vrednost kriterija z pri dani ravni pomembnosti a ( , , ).

Z izračunom intervalov zaupanja za razliko med indikatorji najprej neposredno vidimo možne vrednosti učinka in ne le njegove točkovne ocene. Drugič, sklepamo lahko o sprejemljivosti ali zavrnitvi ničelne hipoteze in tretjič, sklepamo lahko o moči testa.

Pri testiranju hipotez z uporabo intervalov zaupanja se morate držati naslednjega pravila:

Če 100(1-a) odstotni interval zaupanja razlike v povprečjih ne vsebuje nič, potem so razlike statistično značilne na ravni pomembnosti a; nasprotno, če ta interval vsebuje nič, potem razlike niso statistično pomembne.

Dejansko, če ta interval vsebuje nič, to pomeni, da je lahko kazalnik, ki ga primerjamo, večji ali manjši v eni od skupin v primerjavi z drugo, tj. opažene razlike so posledica naključja.

Moč testa je mogoče oceniti glede na lokacijo ničle v intervalu zaupanja. Če je nič blizu spodnje ali zgornje meje intervala, potem je možno, da bi z večjim številom primerjanih skupin razlike dosegle statistično pomembnost. Če je nič blizu sredine intervala, potem to pomeni, da sta povečanje in zmanjšanje indikatorja v eksperimentalni skupini enako verjetna in verjetno res ni razlik.

Primeri:

Za primerjavo kirurške umrljivosti pri uporabi dveh različnih vrst anestezije: s prvo vrsto anestezije je bilo operiranih 61 ljudi, 8 jih je umrlo, z drugo vrsto - 67 ljudi, 10 jih je umrlo.

d 1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

Razlika v letalnosti primerjanih metod bo v območju (-0,018 - 0,122; -0,018 + 0,122) ali (-0,14; 0,104) z verjetnostjo 100(1-a) = 95 %. Interval vsebuje ničlo, tj. hipoteze o enaki umrljivosti pri dveh različnih vrstah anestezije ni mogoče zavrniti.

Tako se stopnja umrljivosti lahko in bo zmanjšala na 14% in povečala na 10,4% z verjetnostjo 95%, tj. ničla je približno na sredini intervala, zato lahko trdimo, da se najverjetneje ti dve metodi res ne razlikujeta po smrtnosti.

V primeru, ki smo ga obravnavali prej, so povprečni čas stiskanja med testom tapkanja primerjali v štirih skupinah študentov, ki so se razlikovali v rezultatih izpitov. Izračunajmo intervale zaupanja za povprečni čas stiskanja za študente, ki so izpit opravili z ocenama 2 in 5 ter interval zaupanja za razliko med temi povprečji.

Studentove koeficiente dobimo s pomočjo Studentovih distribucijskih tabel (glej prilogo): za prvo skupino: = t(0,05;48) = 2,011; za drugo skupino: = t(0,05;61) = 2,000. Tako so intervali zaupanja za prvo skupino: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), za drugo skupino (156,55- 2000*1,88 ; 156,55+2000*1,88) = (152,8). ; 160,3). Torej, za tiste, ki so opravili izpit z 2, se povprečni čas stiskanja giblje od 157,8 ms do 166,6 ms z verjetnostjo 95%, za tiste, ki so opravili izpit s 5, pa od 152,8 ms do 160,3 ms z verjetnostjo 95%. .

Ničelno hipotezo lahko preizkusite tudi z uporabo intervalov zaupanja za povprečja in ne samo za razliko v povprečjih. Na primer, kot v našem primeru, če se intervali zaupanja za povprečja prekrivajo, ničelne hipoteze ni mogoče zavrniti. Za zavrnitev hipoteze na izbrani stopnji pomembnosti se ustrezni intervali zaupanja ne smejo prekrivati.

Poiščemo interval zaupanja za razliko v povprečnem času stiskanja v skupinah, ki so izpit opravile z oceno 2 in 5. Razlika povprečij: 162,19 – 156,55 = 5,64. Študentov koeficient: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Standardni odkloni skupine bodo enaki: ; . Izračunamo povprečno napako razlike med sredinama: . Interval zaupanja: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Torej bo razlika v povprečnem času stiskanja v skupinah, ki so opravile izpit z 2 in 5, v območju od -0,044 ms do 11,33 ms. Ta interval vključuje ničlo, tj. Povprečni čas stiskanja za tiste, ki so dobro opravili izpit, se lahko poveča ali zmanjša v primerjavi s tistimi, ki so izpit opravili nezadovoljivo, tj. ničelne hipoteze ni mogoče zavrniti. Vendar je ničla zelo blizu spodnje meje in veliko bolj verjetno je, da se bo čas stiskanja zmanjšal za tiste, ki so opravili dobro. Tako lahko sklepamo, da še vedno obstajajo razlike v povprečnem času stiskanja med tistimi, ki so opravili 2 in 5, le glede na spremembo povprečnega časa, razpon povprečnega časa in velikosti vzorcev jih nismo mogli zaznati.



Moč testa je verjetnost zavrnitve nepravilne ničelne hipoteze, tj. najti razlike tam, kjer dejansko obstajajo.

Moč testa je določena na podlagi stopnje pomembnosti, velikosti razlik med skupinami, širjenja vrednosti v skupinah in velikosti vzorcev.

Za Studentov t test in analizo variance se lahko uporabijo diagrami občutljivosti.

Moč kriterija lahko uporabimo za predhodno določitev potrebnega števila skupin.

Interval zaupanja kaže, v katerih mejah je z dano verjetnostjo prava vrednost ocenjenega parametra.

Z uporabo intervalov zaupanja lahko testirate statistične hipoteze in sklepate o občutljivosti kriterijev.

LITERATURA.

Glanz S. – Poglavje 6,7.

Rebrova O.Yu. – str.112-114, str.171-173, str.234-238.

Sidorenko E.V. – str.32-33.

Vprašanja za samotestiranje študentov.

1. Kakšna je moč merila?

2. V katerih primerih je potrebno ovrednotiti moč kriterijev?

3. Metode za izračun moči.

6. Kako preizkusiti statistično hipotezo z uporabo intervala zaupanja?

7. Kaj lahko rečemo o moči kriterija pri izračunu intervala zaupanja?

Naloge.

Pogosto mora cenilec analizirati trg nepremičnin tistega segmenta, v katerem se nahaja nepremičnina, ki se ocenjuje. Če je trg razvit, je lahko težko analizirati celoten nabor predstavljenih predmetov, zato se za analizo uporabi vzorec predmetov. Ta vzorec se ne izkaže vedno za homogenega, včasih ga je treba očistiti skrajnih točk - previsokih ali prenizkih tržnih ponudb. V ta namen se uporablja interval zaupanja. Namen te študije je izvesti primerjalno analizo dveh metod za izračun intervala zaupanja in izbrati optimalno možnost izračuna pri delu z različnimi vzorci v sistemu estimatica.pro.

Interval zaupanja je interval vrednosti atributov, izračunan na podlagi vzorca, ki z znano verjetnostjo vsebuje ocenjeni parameter splošne populacije.

Bistvo izračuna intervala zaupanja je v tem, da na podlagi vzorčnih podatkov zgradimo tak interval, da je mogoče z dano verjetnostjo trditi, da je vrednost ocenjenega parametra v tem intervalu. Z drugimi besedami, interval zaupanja vsebuje neznano vrednost ocenjene vrednosti z določeno verjetnostjo. Čim širši je interval, večja je netočnost.

Obstajajo različne metode za določanje intervala zaupanja. V tem članku si bomo ogledali 2 načina:

  • preko mediane in standardne deviacije;
  • preko kritične vrednosti t-statistike (Studentov koeficient).

Faze primerjalne analize različnih metod za izračun CI:

1. oblikovati vzorec podatkov;

2. obdelamo ga s statističnimi metodami: izračunamo povprečno vrednost, mediano, varianco itd.;

3. izračunajte interval zaupanja na dva načina;

4. analizirati očiščene vzorce in nastale intervale zaupanja.

Faza 1. Vzorčenje podatkov

Vzorec je bil oblikovan s sistemom estimatica.pro. Vzorec je vključeval 91 ponudb za prodajo 1-sobnih stanovanj v 3. cenovni coni s tipom postavitve "Hruščov".

Tabela 1. Začetni vzorec

Cena 1 m2, enota

Slika 1. Začetni vzorec



Faza 2. Obdelava začetnega vzorca

Obdelava vzorca s statističnimi metodami zahteva izračun naslednjih vrednosti:

1. Aritmetična sredina

2. Mediana - število, ki označuje vzorec: natanko polovica elementov vzorca je večja od mediane, druga polovica je manjša od mediane.

(za vzorec z lihim številom vrednosti)

3. Razpon - razlika med najvišjo in najmanjšo vrednostjo v vzorcu

4. Varianca – uporablja se za natančnejšo oceno variacije podatkov

5. Vzorčni standardni odklon (v nadaljnjem besedilu - SD) je najpogostejši pokazatelj razpršenosti prilagoditvenih vrednosti okoli aritmetične sredine.

6. Koeficient variacije - odraža stopnjo razpršenosti prilagoditvenih vrednosti

7. koeficient nihanja - odraža relativno nihanje ekstremnih vrednosti cen v vzorcu okoli povprečja

Tabela 2. Statistični kazalniki izvirnega vzorca

Koeficient variacije, ki označuje homogenost podatkov, je 12,29 %, vendar je koeficient nihanja previsok. Tako lahko rečemo, da izvirni vzorec ni homogen, zato preidimo na izračun intervala zaupanja.

Faza 3. Izračun intervala zaupanja

Metoda 1. Izračun z uporabo mediane in standardnega odklona.

Interval zaupanja se določi na naslednji način: minimalna vrednost - standardni odklon se odšteje od mediane; največja vrednost - standardni odklon se doda mediani.

Tako je interval zaupanja (47179 CU; 60689 CU)

riž. 2. Vrednosti, ki spadajo v interval zaupanja 1.



Metoda 2. Konstruiranje intervala zaupanja z uporabo kritične vrednosti t-statistike (Studentov koeficient)

S.V. Gribovsky v svoji knjigi "Matematične metode za ocenjevanje vrednosti nepremičnine" opisuje metodo za izračun intervala zaupanja s pomočjo Studentovega koeficienta. Pri izračunu po tej metodi mora cenilec sam nastaviti stopnjo pomembnosti ∝, ki določa verjetnost, s katero bo zgrajen interval zaupanja. Običajno se uporabljajo ravni pomembnosti 0,1; 0,05 in 0,01. Ustrezajo verjetnosti zaupanja 0,9; 0,95 in 0,99. S to metodo se predpostavlja, da so prave vrednosti matematičnega pričakovanja in variance praktično neznane (kar je skoraj vedno res pri reševanju praktičnih problemov ocenjevanja).

Formula intervala zaupanja:

n - velikost vzorca;

Kritična vrednost t-statistike (Studentove porazdelitve) s stopnjo pomembnosti ∝, število prostostnih stopinj n-1, ki se določi iz posebnih statističnih tabel ali z uporabo MS Excel (→»Statistical«→ STUDIST);

∝ - stopnja pomembnosti, vzemite ∝=0,01.

riž. 2. Vrednosti, ki spadajo v interval zaupanja 2.

Faza 4. Analiza različnih metod za izračun intervala zaupanja

Dve metodi izračuna intervala zaupanja - preko mediane in Studentovega koeficienta - sta privedli do različnih vrednosti intervalov. V skladu s tem smo dobili dva različno očiščena vzorca.

Tabela 3. Statistika za tri vzorce.

Kazalo

Začetni vzorec

1 možnost

Možnost 2

Povprečna vrednost

Razpršenost

Coef. variacije

Coef. nihanja

Število upokojenih predmetov, kos.

Na podlagi izvedenih izračunov lahko rečemo, da se vrednosti intervala zaupanja, pridobljene z različnimi metodami, sekajo, zato lahko po presoji ocenjevalca uporabite katero koli metodo izračuna.

Menimo pa, da je pri delu v sistemu estimatica.pro priporočljivo izbrati metodo za izračun intervala zaupanja glede na stopnjo razvitosti trga:

  • če je trg nerazvit, uporabite metodo izračuna z uporabo mediane in standardnega odklona, ​​saj je število upokojenih predmetov v tem primeru majhno;
  • če je trg razvit, uporabite izračun preko kritične vrednosti t-statistike (Studentov koeficient), saj je možno oblikovati velik začetni vzorec.

Pri pripravi članka so bili uporabljeni:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematične metode za ocenjevanje vrednosti nepremičnin. Moskva, 2014

2. Sistemski podatki estimatica.pro

Interval zaupanja prihaja k nam s področja statistike. To je določeno območje, ki služi za oceno neznanega parametra z visoko stopnjo zanesljivosti. To najlažje razložimo s primerom.

Recimo, da morate preučiti neko naključno spremenljivko, na primer hitrost odziva strežnika na zahtevo odjemalca. Vsakič, ko uporabnik vnese naslov določenega mesta, se strežnik odzove z različno hitrostjo. Tako je obravnavani odzivni čas naključen. Torej, interval zaupanja nam omogoča, da določimo meje tega parametra, nato pa lahko rečemo, da bo strežnik s 95% verjetnostjo v območju, ki smo ga izračunali.

Ali pa morate ugotoviti, koliko ljudi pozna blagovno znamko podjetja. Ko bo izračunan interval zaupanja, bo mogoče na primer trditi, da je s 95-odstotno verjetnostjo delež potrošnikov, ki se tega zavedajo, v razponu od 27 do 34 odstotkov.

S tem izrazom je tesno povezana vrednost verjetnosti zaupanja. Predstavlja verjetnost, da je želeni parameter vključen v interval zaupanja. Od te vrednosti je odvisno, kako velik bo naš želeni razpon. Večja ko je vrednost, ožji postane interval zaupanja in obratno. Običajno je nastavljen na 90 %, 95 % ali 99 %. Vrednost 95% je najbolj priljubljena.

Na ta indikator vpliva tudi razpršenost opazovanj, njegova definicija pa temelji na predpostavki, da preučevana karakteristika upošteva to izjavo, znano tudi kot Gaussov zakon. Po njegovem mnenju je normalna porazdelitev vseh verjetnosti zvezne naključne spremenljivke, ki jo lahko opišemo z gostoto verjetnosti. Če je predpostavka o normalni porazdelitvi napačna, je lahko ocena napačna.

Najprej ugotovimo, kako izračunati interval zaupanja za. Tu sta možna dva primera. Razpršenost (stopnja širjenja naključne spremenljivke) je lahko znana ali pa tudi ne. Če je znan, se naš interval zaupanja izračuna po naslednji formuli:

xsr - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - znak,

t - parameter iz Laplaceove porazdelitvene tabele,

σ je kvadratni koren variance.

Če je varianca neznana, jo lahko izračunamo, če poznamo vse vrednosti želene lastnosti. Za to se uporablja naslednja formula:

σ2 = х2ср - (хср)2, kjer je

х2ср - povprečna vrednost kvadratov proučevane značilnosti,

(хср)2 je kvadrat te karakteristike.

Formula, po kateri se izračuna interval zaupanja, se v tem primeru nekoliko spremeni:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n)), где

xsr - povprečje vzorca,

α - znak,

t je parameter, ki ga najdemo s pomočjo Studentove distribucijske tabele t = t(ɣ;n-1),

sqrt(n) - kvadratni koren skupne velikosti vzorca,

s je kvadratni koren variance.

Razmislite o tem primeru. Predpostavimo, da je bilo na podlagi rezultatov 7 meritev ugotovljeno, da je proučevana značilnost enaka 30, vzorčna varianca pa enaka 36. Z verjetnostjo 99 % je treba najti interval zaupanja, ki vsebuje resnično vrednost izmerjenega parametra.

Najprej ugotovimo, čemu je t enak: t = t (0,99; 7-1) = 3,71. Z uporabo zgornje formule dobimo:

xsr - t*s / (sqrt(n))<= α <= хср + t*s / (sqrt(n))

30 - 3,71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Interval zaupanja za varianco se izračuna tako v primeru znane sredine kot tudi takrat, ko ni podatkov o matematičnem pričakovanju in je znana samo vrednost točkovne nepristranske ocene variance. Tukaj ne bomo navedli formul za izračun, saj so precej zapletene in jih po želji vedno najdete na internetu.

Omenimo le, da je priročno določiti interval zaupanja z uporabo Excela ali omrežne storitve, ki se tako imenuje.



Vam je bil članek všeč? Delite s prijatelji!