Pasitikėjimo tikimybė ir pasitikėjimo intervalas. Pasitikėjimo intervalas

Įvertinimo tikslumas, patikimumo lygis (patikimumas)

Pasitikėjimo intervalas

Atimant mažą tūrį, reikia naudoti intervalų įverčius, nes taip išvengiama didelių klaidų, skirtingai nei taškiniai įverčiai.

Intervalas yra įvertis, kurį lemia du skaičiai – intervalo, apimančio vertinamą parametrą, galai. Intervaliniai įverčiai leidžia nustatyti įverčių tikslumą ir patikimumą.

Tegul statistinė charakteristika *, rasta iš imties duomenų, tarnauja kaip nežinomo parametro įvertinimas. Laikysime jį pastoviu skaičiumi (galbūt atsitiktiniu dydžiu). Akivaizdu, kad * kuo tiksliau nustatomas parametras β, tuo mažesnė skirtumo absoliuti reikšmė | - * |. Kitaip tariant, jei >0 ir | - * |< , то чем меньше, тем оценка точнее. Таким образом, положительное число характеризует точность оценки.

Tačiau statistiniai metodai neleidžia kategoriškai teigti, kad įvertis * tenkina nelygybę | - *|<, можно лишь говорить о вероятности, с которой это неравенство осуществляется.

Įvertinimo pagal * patikimumas (pasitikėjimo tikimybė) yra tikimybė, su kuria bus įgyvendinta nelygybė | - *|<. Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.

Tegul tikimybė, kad | - *|<, равна т.е.

Nelygybės pakeitimas | - *|< равносильным ему двойным неравенством -<| - *|<, или *- <<*+, имеем

P(*-< <*+)=.

Pasikliautinuoju intervalu (*-, *+) vadinamas pasikliautinuoju intervalu, kuris apima nežinomą parametrą tam tikru patikimumu.

Pasitikėjimo intervalai, skirti įvertinti normaliojo skirstinio matematinius lūkesčius, kai yra žinomas skirstinys.

Intervalo įvertinimas su normaliai paskirstytos kiekybinės charakteristikos X matematinio lūkesčio a patikimumu, pagrįstas imties vidurkiu x su žinomu standartiniu visumos nuokrypiu, yra pasikliautinasis intervalas.

x - t(/n^?)< a < х + t(/n^?),

čia t(/n^?)= – įverčio tikslumas, n – imties dydis, t – Laplaso funkcijos argumento Ф(t), kai Ф(t)=/2, reikšmė.

Iš lygybės t(/n^?)= galima padaryti tokias išvadas:

1. didėjant imties dydžiui n, skaičius mažėja, todėl įverčio tikslumas didėja;

2. įverčio = 2Ф(t) patikimumo padidėjimas lemia t padidėjimą (Ф(t) yra didėjanti funkcija), taigi ir padidėjimą; kitaip tariant, padidėjus klasikinio įvertinimo patikimumui, sumažėja jo tikslumas.

Pavyzdys. Atsitiktinis dydis X turi normalųjį pasiskirstymą, kurio standartinis nuokrypis yra =3. Raskite pasikliautinius intervalus nežinomai matematinei lūkesčiai a įvertinti remiantis imties vidurkiu x, jei imties dydis yra n = 36, o įverčio patikimumas yra = 0,95.

Sprendimas. Raskime t. Iš santykio 2Ф(t) = 0,95 gauname Ф(t) = 0,475. Iš lentelės randame t=1,96.

Raskime sąmatos tikslumą:

tikslumo pasikliautinojo intervalo matavimas

T(/n^?)= (1,96,3)/ /36 = 0,98.

Pasitikėjimo intervalas yra: (x - 0,98; x + 0,98). Pavyzdžiui, jei x = 4,1, tada pasikliautinasis intervalas turi šias pasikliovimo ribas:

x – 0,98 = 4,1 – 0,98 = 3,12; x + 0,98 = 4,1 + 0,98 = 5,08.

Taigi, nežinomo parametro a reikšmės, atitinkančios imties duomenis, tenkina nelygybę 3.12< а < 5,08. Подчеркнем, что было бы ошибочным написать Р (3,12 < а < 5,08) = 0,95. Действительно, так как а - постоянная величина, то либо она заключена в найденном интервале (тогда событие 3,12 < а < 5,08 достоверно и его вероятность равна единице), либо в нем не заключена (в этом случае событие 3,12 < а < 5,08 невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было указано, изменяются от выборки к выборке.

Paaiškinkime tam tikro patikimumo reikšmę. Patikimumas = 0,95 rodo, kad jei paimamas pakankamai daug mėginių, tai 95 % jų nustato pasikliautinuosius intervalus, kuriuose parametras iš tikrųjų yra; tik 5 % atvejų jis gali viršyti pasikliautinąjį intervalą.

Jei matematinį lūkestį reikia įvertinti iš anksto nustatytu tikslumu ir patikimumu, tai naudojant formulę randamas minimalus imties dydis, kuris užtikrins šį tikslumą.

Pasitikėjimo intervalai normalaus skirstinio su nežinomuoju matematiniams lūkesčiams įvertinti

Intervalo įvertis su normaliai paskirstytos kiekybinės charakteristikos X matematinio lūkesčio a patikimumu, remiantis imties vidurkiu x su nežinomu standartiniu visumos nuokrypiu, yra pasikliautinasis intervalas.

x - t()(s/n^?)< a < х + t()(s/n^?),

kur s yra „pataisytas“ imties standartinis nuokrypis, t() randamas iš lentelės duotam ir n.

Pavyzdys. Kiekybinė populiacijos charakteristika X pasiskirsto normaliai. Remiantis imties dydžiu n=16, buvo nustatytas imties vidurkis x = 20,2 ir „pataisytas“ standartinis nuokrypis s = 0,8. Įvertinkite nežinomą matematinį lūkestį naudodami pasikliautinąjį intervalą, kurio patikimumas yra 0,95.

Sprendimas. Raskime t(). Naudodami lentelę = 0,95 ir n=16 randame t()=2,13.

Raskime pasitikėjimo ribas:

x - t() (s/n^?) = 20,2 - 2,13 *. 0,8/16^? = 19,774

x + t()(s/n^?) = 20,2 + 2,13 * 0,8/16^? = 20,626

Taigi, kai patikimumas yra 0,95, nežinomas parametras a yra 19,774 pasikliautinajame intervale< а < 20,626

Išmatuoto dydžio tikrosios vertės įvertinimas

Tegul n nepriklausomi vienodo tikslumo matavimai tam tikram fizikiniam dydžiui, kurio tikroji reikšmė nežinoma.

Atskirų matavimų rezultatus laikysime atsitiktiniais dydžiais Хl, Х2,…Хn. Šie dydžiai yra nepriklausomi (matavimai nepriklausomi). Jie turi tą patį matematinį lūkestį a (tikroji išmatuoto dydžio reikšmė), tas pačias dispersijas ^2 (matavimai vienodai tikslūs) ir yra pasiskirstę normaliai (šią prielaidą patvirtina patirtis).

Taigi, visos prielaidos, padarytos nustatant pasikliautinuosius intervalus, yra įvykdytos, todėl galime laisvai naudoti formules. Kitaip tariant, tikrąją išmatuotos vertės vertę galima įvertinti iš atskirų matavimų rezultatų aritmetinio vidurkio naudojant pasikliautinuosius intervalus.

Pavyzdys. Remiantis devynių nepriklausomų vienodo tikslumo fizikinio dydžio matavimų duomenimis, nustatyta, kad atskirų matavimų rezultatų aritmetinis vidurkis yra x = 42,319, o „pataisytas“ standartinis nuokrypis s = 5,0. Tikrąją išmatuotos vertės vertę reikia įvertinti patikimumu = 0,95.

Sprendimas. Tikroji išmatuoto dydžio vertė yra lygi jo matematiniam lūkesčiui. Todėl uždavinys yra įvertinti matematinius lūkesčius (duotą nežinomą), naudojant pasikliautinąjį intervalą, apimantį a su nurodytu patikimumu = 0,95.

x - t()(s/n^?)< a < х + t()(s/n^?)

Naudodami lentelę, naudodami y = 0,95 ir l = 9, randame

Raskime sąmatos tikslumą:

t())(s/n^?) = 2,31 * 5/9^? = 3,85

Raskime pasitikėjimo ribas:

x - t() (s/n^?) = 42,319 - 3,85 = 38,469;

x + t() (s/n^?) = 42,319 +3,85 = 46,169.

Taigi, kai patikimumas yra 0,95, tikroji išmatuotos vertės vertė yra 38,469 pasikliautinajame intervale< а < 46,169.

Pasitikėjimo intervalai normalaus skirstinio standartiniam nuokrypiui įvertinti.

Tegul bendrosios populiacijos kiekybinė charakteristika X pasiskirsto normaliai. Reikia įvertinti nežinomą bendrąjį standartinį nuokrypį nuo „pataisytos“ imties standartinio nuokrypio s. Norėdami tai padaryti, naudosime intervalo įvertinimą.

Normalaus pasiskirstymo kiekybinės charakteristikos X standartinio nuokrypio o intervalo įvertinimas (su patikimumu), pagrįstas „pataisytu“ imties standartiniu nuokrypiu s yra pasikliautinasis intervalas

s (1–q)< < s (1 + q) (при q < 1),

0 < < s (1 + q) (при q > 1),

kur q randamas iš lentelės duotam n n.

1 pavyzdys. Bendrosios populiacijos kiekybinė charakteristika X pasiskirsto normaliai. Remiantis imties dydžiu n = 25, buvo rastas „pataisytas“ standartinis nuokrypis s = 0,8. Raskite pasikliautinąjį intervalą, apimantį bendrąjį standartinį nuokrypį, kurio patikimumas yra 0,95.

Sprendimas. Naudodami lentelę, kurios duomenys = 0,95 ir n = 25, randame q = 0,32.

Reikalingas pasikliautinasis intervalas s (1–q)< < s (1 + q) таков:

0,8(1-- 0,32) < < 0,8(1+0,32), или 0,544 < < 1,056.

2 pavyzdys. Bendrosios populiacijos kiekybinė charakteristika X pasiskirsto normaliai. Remiantis imties dydžiu n=10, rastas „pataisytas“ standartinis nuokrypis s = 0,16. Raskite pasikliautinąjį intervalą, apimantį bendrąjį standartinį nuokrypį, kurio patikimumas yra 0,999.

Sprendimas. Naudodami priedų lentelę, remiantis duomenimis = 0,999 ir n=10, randame 17 = 1,80 (q > 1). Reikalingas pasikliautinasis intervalas yra:

0 < < 0,16(1 + 1,80), или 0 < < 0,448.

Įvertinimas matavimo tikslumas

Klaidų teorijoje įprasta matavimo tikslumą (prietaiso tikslumą) apibūdinti naudojant atsitiktinių matavimo paklaidų standartinį nuokrypį. Vertinimui naudojamas „pataisytas“ standartinis nuokrypis s. Kadangi paprastai matavimo rezultatai yra vienas nuo kito nepriklausomi, turi tą patį matematinį lūkestį (tikrąją išmatuotos vertės vertę) ir tą pačią sklaidą (vienodo tikslumo matavimų atveju), ankstesnėje pastraipoje išdėstyta teorija taikytina vertinant matavimų tikslumas.

Pavyzdys. Remiantis 15 vienodo tikslumo matavimų, buvo rastas „pataisytas“ standartinis nuokrypis s = 0,12. Raskite matavimo tikslumą, kurio patikimumas yra 0,99.

Sprendimas. Matavimo tikslumas apibūdinamas atsitiktinių paklaidų standartiniu nuokrypiu, todėl problema kyla dėl pasikliautinojo intervalo s (1 - q) radimo.< < s (1 + q) , покрывающего с заданной надежностью 0,99

Naudodami priedų lentelę = 0,99 ir n = 15 randame q = 0,73.

Reikalingas pasikliautinasis intervalas

0,12(1-- 0,73) < < 0,12(1+0,73), или 0.03 < < 0,21.

Tikimybių įvertinimas (binominis skirstinys) pagal santykinį dažnį

Binominio skirstinio pagal santykinį dažnį w nežinomos tikimybės p intervalo įvertinimas (su patikimumu) yra pasikliautinasis intervalas (su apytiksliais galais p1 ir p2)

p1< p < p2,

čia n yra bendras bandymų skaičius; m – įvykio atvejų skaičius; w - santykinis dažnis, lygus santykiui m/n; t yra Laplaso funkcijos argumento reikšmė, kai Ф(t) = /2.

komentuoti. Didelės n reikšmės (šimtų eilės) gali būti laikomos apytiksliais pasikliautinojo intervalo ribomis

Dažnai vertintojui tenka analizuoti segmento, kuriame yra vertinamas turtas, nekilnojamojo turto rinką. Jei rinka yra išvystyta, gali būti sunku išanalizuoti visą pateiktų objektų rinkinį, todėl analizei naudojama objektų imtis. Šis pavyzdys ne visada būna vienalytis, kartais reikia išvalyti nuo kraštutinių taškų – per aukštų ar per žemų rinkos pasiūlymų. Šiuo tikslu jis naudojamas pasitikėjimo intervalas. Šio tyrimo tikslas – atlikti dviejų pasikliautinojo intervalo skaičiavimo metodų lyginamąją analizę ir parinkti optimalų skaičiavimo variantą dirbant su skirtingomis imtimis estimatica.pro sistemoje.

Pasitikėjimo intervalas yra atributų reikšmių intervalas, apskaičiuotas remiantis imtimi, kurioje su žinoma tikimybe yra apskaičiuotas bendrosios visumos parametras.

Skaičiuojant pasikliautinąjį intervalą, esmė yra sudaryti tokį intervalą remiantis imties duomenimis, kad būtų galima su nurodyta tikimybe teigti, kad įvertinto parametro reikšmė yra šiame intervale. Kitaip tariant, pasikliautinajame intervale yra nežinoma apskaičiuotos vertės reikšmė su tam tikra tikimybe. Kuo platesnis intervalas, tuo didesnis netikslumas.

Pasikliautinojo intervalo nustatymo metodai yra skirtingi. Šiame straipsnyje apžvelgsime 2 būdus:

  • per medianą ir standartinį nuokrypį;
  • per kritinę t statistikos reikšmę (Studento koeficientas).

Įvairių KI skaičiavimo metodų lyginamosios analizės etapai:

1. suformuoti duomenų pavyzdį;

2. apdorojame statistiniais metodais: apskaičiuojame vidutinę reikšmę, medianą, dispersiją ir kt.;

3. pasikliautinąjį intervalą apskaičiuokite dviem būdais;

4. išanalizuokite išvalytus mėginius ir gautus pasikliautinius intervalus.

1 etapas. Duomenų atranka

Imtis buvo suformuota naudojant estimatica.pro sistemą. Pavyzdyje buvo 91 pasiūlymas parduoti 1 kambario butus 3 kainų zonoje su „Chruščiovo“ tipo išplanavimu.

1 lentelė. Pradinis pavyzdys

Kaina 1 kv.m, vnt

1 pav. Pradinis pavyzdys



2 etapas. Pradinio mėginio apdorojimas

Norint apdoroti mėginį naudojant statistinius metodus, reikia apskaičiuoti šias vertes:

1. Aritmetinis vidurkis

2. Mediana – imtį apibūdinantis skaičius: lygiai pusė imties elementų yra didesni už medianą, kita pusė yra mažesnė už medianą

(pavyzdžiui su nelyginiu reikšmių skaičiumi)

3. Diapazonas – skirtumas tarp didžiausių ir mažiausių verčių imtyje

4. Sklaida – naudojama tiksliau įvertinti duomenų kitimą

5. Imties standartinis nuokrypis (toliau – SD) yra labiausiai paplitęs koregavimo verčių sklaidos apie aritmetinį vidurkį rodiklis.

6. Variacijos koeficientas – atspindi koregavimo reikšmių sklaidos laipsnį

7. svyravimų koeficientas – parodo santykinį ekstremalių kainų verčių svyravimą imtyje apie vidurkį

2 lentelė. Pradinės imties statistiniai rodikliai

Variacijos koeficientas, apibūdinantis duomenų homogeniškumą, yra 12,29%, tačiau svyravimo koeficientas yra per didelis. Taigi galime sakyti, kad pradinė imtis nėra vienalytė, todėl pereikime prie pasikliautinojo intervalo skaičiavimo.

3 etapas. Pasitikėjimo intervalo skaičiavimas

1 metodas. Skaičiavimas naudojant medianą ir standartinį nuokrypį.

Pasikliautinasis intervalas nustatomas taip: minimali reikšmė – standartinis nuokrypis atimamas iš medianos; maksimali reikšmė – prie medianos pridedamas standartinis nuokrypis.

Taigi pasikliautinasis intervalas (47179 CU; 60689 CU)

Ryžiai. 2. Vertės, patenkančios į 1 pasikliautinąjį intervalą.



2 metodas. Pasikliautinojo intervalo sudarymas naudojant kritinę t statistikos reikšmę (studento koeficientą)

S.V. Gribovsky savo knygoje „Matematiniai nuosavybės vertės įvertinimo metodai“ aprašo pasikliautinojo intervalo apskaičiavimo metodą pagal Studento koeficientą. Skaičiuodamas šiuo metodu, vertintojas pats turi nustatyti reikšmingumo lygį ∝, kuris nustato tikimybę, su kuria bus sudarytas pasikliautinasis intervalas. Paprastai naudojami 0,1 reikšmingumo lygiai; 0,05 ir 0,01. Jie atitinka 0,9 pasitikėjimo tikimybes; 0,95 ir 0,99. Taikant šį metodą, daroma prielaida, kad tikrosios matematinių lūkesčių ir dispersijos reikšmės yra praktiškai nežinomos (kas beveik visada teisinga sprendžiant praktines vertinimo problemas).

Pasitikėjimo intervalo formulė:

n - imties dydis;

Kritinė t statistikos reikšmė (Studentų skirstinys), kurios reikšmingumo lygis ∝, laisvės laipsnių skaičius n-1, kuris nustatomas iš specialių statistinių lentelių arba naudojant MS Excel (→"Statistinė"→ STUDISTAS);

∝ - reikšmingumo lygis, imkite ∝=0,01.

Ryžiai. 2. Vertės, patenkančios į 2 pasikliautinąjį intervalą.

4 etapas. Įvairių pasikliautinojo intervalo skaičiavimo metodų analizė

Du pasikliautinojo intervalo apskaičiavimo metodai - per medianą ir Stjudento koeficientą - lėmė skirtingas intervalų reikšmes. Atitinkamai, mes gavome du skirtingus išvalytus pavyzdžius.

3 lentelė. Trijų imčių statistika.

Rodiklis

Pradinis pavyzdys

1 variantas

2 variantas

Vidutinė vertė

Sklaida

Koef. variacijos

Koef. svyravimai

Išnaudotų objektų skaičius, vnt.

Remiantis atliktais skaičiavimais, galime teigti, kad skirtingais metodais gautos pasikliovimo intervalo reikšmės susikerta, todėl vertintojo nuožiūra galite naudoti bet kurį iš skaičiavimo metodų.

Tačiau manome, kad dirbant estimatica.pro sistemoje patartina pasirinkti pasikliautinojo intervalo skaičiavimo metodą, atsižvelgiant į rinkos išsivystymo laipsnį:

  • jei rinka neišsivysčiusi, naudokite skaičiavimo metodą taikant medianą ir standartinį nuokrypį, nes šiuo atveju nebenaudojamų objektų skaičius yra mažas;
  • jei rinka išvystyta, taikykite skaičiavimą per kritinę t statistikos reikšmę (Studento koeficientą), nes galima sudaryti didelę pradinę imtį.

Rengiant straipsnį buvo naudojami šie dalykai:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Matematiniai turto vertės vertinimo metodai. Maskva, 2014 m

2. Sistemos duomenys estimatica.pro

Pasitikėjimo intervalas. Pasitikėjimo tikimybė.

TIKIMUMU TEORIJOS TAIKYMAS STATISTIKAI.

Pagrindinės sąvokos.

Matematinė statistika – matematikos šaka, tirianti eksperimentinių duomenų, gautų stebint didžiulius atsitiktinius įvykius ir reiškinius, apdorojimo ir analizės metodus.

Objektų stebėjimai gali apimti visus tiriamos populiacijos narius be išimties ir gali būti apriboti tik tam tikros šios populiacijos narių dalies apklausomis. Pirmasis stebėjimas vadinamas nuolatiniu arba užbaigtu, antrasis dalinis arba atrankinis .

Natūralu, kad išsamiausią informaciją suteikia nuolatinis stebėjimas, tačiau ne visada jos griebiamasi. Pirma, nuolatinis stebėjimas yra labai daug darbo reikalaujantis, antra, dažnai praktiškai neįmanomas arba net nepraktiškas. Todėl daugeliu atvejų jie imasi atrankinių tyrimų.

Vadinama populiacija, iš kurios kai kurie jos nariai tam tikru būdu atrenkami bendram tyrimui bendros populiacijos , o vienaip ar kitaip parinkta bendrosios visumos dalis yra imties visuma arba mėginys .

Gyventojų skaičius teoriškai yra neribotas, tačiau praktiškai visada yra ribotas.

Imties dydis gali būti didelis arba mažas, bet negali būti mažesnis nei du.

Atranka į imtį gali būti atliekama atsitiktine tvarka (loterijos arba loterijos būdu). Arba planuojama, priklausomai nuo užduoties ir apklausos organizavimo. Tam, kad imtis būtų reprezentatyvi, reikia atkreipti dėmesį į charakteristikos kitimo diapazoną ir su ja derinti imties dydį.

2. Nežinomo skirstinio funkcijos nustatymas.

Taigi mes padarėme pasirinkimą. Stebimų verčių diapazoną padalinkime į intervalus , , …. tokio pat ilgio. Norėdami apskaičiuoti reikiamą intervalų skaičių, galite naudoti šias formules:

Kitas tegul m i - pastebėtų verčių skaičius, įtrauktas į i th intervalas. Dalijant m i bendram stebėjimų skaičiui n, gauname atitinkamą dažnį i- oi intervalas: , ir . Sukurkime tokią lentelę:

Intervalo numeris Intervalas m i
m 1
m 2
... ... ... ...
k m k

kuris vadinamas statistiškai artimas . Empirinis (arba statistiniai ) paskirstymo funkcija Atsitiktinis kintamasis yra įvykio dažnis, kai eksperimento rezultatas įgis mažesnę reikšmę nei x:

Praktiškai pakanka rasti statistinio pasiskirstymo funkcijos reikšmes F*(x) taškuose , kurios yra statistinių eilučių intervalų ribos:

(5.2)

Reikėtų pažymėti, kad ir . Nubraižydami taškus ir sujungę juos lygiąja kreive, gauname apytikslį empirinio skirstinio funkcijos grafiką (5.1 pav.). Naudodamiesi Bernulio didelių skaičių dėsniu, galime įrodyti, kad esant pakankamai dideliam testų skaičiui, kurių tikimybė yra artima vienetui, empirinė skirstinio funkcija skiriasi tiek, kiek norima, nuo mums nežinomo atsitiktinio dydžio skirstinio funkcijos.

Dažnai vietoj empirinio pasiskirstymo funkcijos braižymo atliekama taip. Intervalai brėžiami ant abscisių ašies, ,…. . Kiekviename intervale sudaromas stačiakampis, kurio plotas yra lygus dažniui, atitinkančiam šį intervalą. Aukštis h i šio stačiakampio yra lygus , Kur yra kiekvieno intervalo ilgis. Aišku, kad visų sukonstruotų stačiakampių plotų suma lygi vienetui.

Panagrinėkime funkciją, kuri yra pastovi intervale ir lygi . Šios funkcijos grafikas vadinamas histograma . Tai laiptuota linija (5.2 pav.). Naudojantis Bernulio didelių skaičių dėsniu, galima įrodyti, kad mažiems ir dideliems skaičiams su praktiniu tikrumu tiek mažai, kiek norisi, skiriasi nuo tolydinio atsitiktinio dydžio pasiskirstymo tankio.

Taigi praktikoje nustatomas atsitiktinio dydžio nežinomo skirstinio funkcijos tipas.

3. Nežinomų pasiskirstymo parametrų nustatymas.

Taigi, mes gavome histogramą, kuri suteikia aiškumo. Pateiktų rezultatų aiškumas leidžia daryti įvairias išvadas ir spręsti apie tiriamą objektą.

Tačiau dažniausiai jie tuo neapsiriboja, o eina toliau, analizuodami duomenis, kad patikrintų tam tikras prielaidas dėl galimų tiriamų procesų ar reiškinių mechanizmų.

Nors kiekvienos apklausos duomenys yra palyginti nedideli, tačiau norėtume, kad analizės rezultatai pakankamai apibūdintų visą faktinę ar įsivaizduojamą aibę (t. y. populiaciją).

Tam daromos tam tikros prielaidos, kaip rodikliai, apskaičiuoti remiantis eksperimentiniais duomenimis (imtis), yra susiję su bendrosios populiacijos parametrais.

Šios problemos sprendimas yra pagrindinė bet kokios eksperimentinių duomenų analizės dalis ir yra glaudžiai susijęs su daugelio aukščiau aptartų teorinių skirstinių naudojimu.

Plačiai paplitęs normalaus skirstinio naudojimas statistinėse išvadose turi ir empirinį, ir teorinį pagrindimą.

Pirma, praktika rodo, kad daugeliu atvejų normalusis skirstinys iš tiesų yra gana tikslus eksperimentinių duomenų atvaizdas.

Antra, teoriškai įrodyta, kad vidutinės histogramos intervalų reikšmės pasiskirsto pagal dėsnį, artimą normaliam.

Tačiau reikia aiškiai suprasti, kad normalusis skirstinys yra tik grynai matematinė priemonė ir visiškai nebūtina, kad tikrieji eksperimentiniai duomenys būtų tiksliai aprašyti normaliuoju skirstiniu. Nors daugeliu atvejų, atsižvelgiant į nedidelę klaidą, galime teigti, kad duomenys paskirstomi įprastai.

Nemažai rodiklių, tokių kaip vidurkis, dispersija ir kt., apibūdina imtį ir vadinami statistika. Tie patys rodikliai, bet susiję su visu populiacija, vadinami parametrais. Taigi galime teigti, kad statistika yra skirta parametrams įvertinti.

Bendrasis vidurkis yra reikšmių aritmetinis vidurkis bendras gyventojų skaičius:

Imties vidurkis yra aritmetinis mėginio tūrio vidurkis:

(5.4)

jei pasirinkimas yra lentelės pavidalu.

Imties vidurkis laikomas bendrojo vidurkio įvertinimu.

Bendroji dispersija yra populiacijos verčių kvadratinių nuokrypių aritmetinis vidurkis nuo jų vidutinės vertės:

Bendrasis standartinis nuokrypis yra kvadratinė šaknis iš bendrosios dispersijos: .

Imties dispersija yra imties verčių nuokrypio nuo jų vidurkio kvadratų aritmetinis vidurkis:

Imties standartinis nuokrypis apibrėžiamas kaip .

Siekiant geriau suderinti eksperimentinius rezultatus, įvedama empirinės (arba pataisytos) dispersijos sąvoka:

Norėdami įvertinti bendrą standartinį nuokrypį, naudokite pataisytą standartinį nuokrypį arba empirinį standartą:

(5.5)

Tuo atveju, kai visos imties reikšmės yra skirtingos, t.y. , , formulės ir paimkite formą:

(5.6)

Pasitikėjimo intervalas. Pasitikėjimo tikimybė.

Įvairi statistika, gauta atlikus skaičiavimus, yra atitinkamų populiacijos parametrų taškiniai įverčiai.

Jei iš bendrosios visumos ištrauksime tam tikrą skaičių pavyzdžių ir rasime mus dominančią statistiką kiekvienam iš jų, tada apskaičiuotos reikšmės atspindės atsitiktinius dydžius, kurie šiek tiek pasiskirsto aplink apskaičiuotą parametrą.

Tačiau, kaip taisyklė, dėl eksperimento tyrėjas turi vieną pavyzdį. Todėl labai svarbu gauti intervalo įvertį, t.y. tam tikras intervalas, kuriame, kaip galima manyti, yra tikroji parametro reikšmė.

Tikimybės, pripažintos pakankamomis patikimiems sprendimams apie populiacijos parametrus remiantis statistika, vadinamos pasitikėjimu.

Pavyzdžiui, apsvarstykite, kaip įvertinti parametrą .

1 ir 2 teoremos, nors jos yra bendro pobūdžio, t.y. suformuluotos remiantis gana plačiomis prielaidomis, jos neleidžia nustatyti, kiek įverčiai yra artimi apskaičiuotiems parametrams. Iš to, kad įverčiai yra nuoseklūs, išplaukia tik tai, kad didėjant imties dydžiui, reikšmė P(|θ * – θ | < δ), δ < 0, приближается к 1.

Kyla tokie klausimai.

1) Koks turėtų būti imties dydis? p, kad nurodytas tikslumas
|θ * – θ | = δ buvo garantuotas su anksčiau priimta tikimybe?

2) Koks įverčio tikslumas, jei žinomas imties dydis ir pateikta išvados be klaidų tikimybė?

3) Kokia tikimybė, kad atsižvelgiant į imties dydį bus užtikrintas nurodytas įvertinimo tikslumas?

Pateikiame keletą naujų apibrėžimų.

Apibrėžimas. Nelygybės išsipildymo tikimybė γ,|θ *– θ | < δ vadinamas įverčio θ pasikliovimo lygiu arba patikimumu.

Pereikime nuo nelygybės | θ *–θ | < δ к двойному неравенству. Известно, что . Поэтому доверительную вероятность можно записать в виде

Nes θ (apskaičiuotas parametras) yra pastovus skaičius ir θ * – atsitiktinė reikšmė, pasitikėjimo tikimybės sąvoką galima suformuluoti taip: pasitikėjimo tikimybė γ yra tikimybė, kad intervalas ( θ *– δ, θ *+ δ) apima apskaičiuotą parametrą.

Apibrėžimas. Atsitiktinis intervalas(θ *–δ , θ *+δ ), kuriame yra nežinomas įvertintas parametras su tikimybe γ, vadinamas pasikliautinuoju intervalu İ, atitinkantį pasikliovimo koeficientą γ,

İ= (θ*– δ, θ*+ δ ). (3)

Vertinimo patikimumas γ galima nurodyti iš anksto, tada, žinant tiriamo atsitiktinio dydžio pasiskirstymo dėsnį, galima rasti pasikliautinąjį intervalą İ . Atvirkštinė problema taip pat išsprendžiama, kai duota İ randamas atitinkamas sąmatos patikimumas.

Tegu pvz. γ = 0,95; tada skaičius r= 1 – y = 0,05 rodo, su kokia tikimybe išvada apie vertinimo patikimumą yra klaidinga. Skaičius р=1–γ paskambino reikšmingumo lygis. Reikšmingumo lygis nustatomas iš anksto, priklausomai nuo konkretaus atvejo. Paprastai r imamas lygus 0,05; 0,01; 0,001.

Išsiaiškinkime, kaip sudaryti normaliai paskirstytos charakteristikos matematinio lūkesčio pasikliautinąjį intervalą. Buvo parodyta, kad

Įvertinkime matematinį lūkestį naudodami imties vidurkį, atsižvelgdami į tai, kad jis taip pat turi normalųjį skirstinį*. Turime

(4)

o iš (12.9.2) formulės gauname

Atsižvelgdami į (13.5.12), gauname

(5)

Tegul tikimybė yra žinoma γ . Tada

Kad būtų patogiau naudoti Laplaso funkcijos lentelę, nustatome a

Intervalas

(7)

apima parametrą a = M(X) su tikimybe γ .

Daugeliu atvejų standartinis nuokrypis σ(X) tiriama charakteristika nežinoma. Todėl vietoj σ (X) su dideliu pavyzdžiu ( n> 30) taikyti pakoreguotą imties standartinį nuokrypį s, o tai savo ruožtu yra sąmata σ (X), pasikliautinasis intervalas atrodys taip

İ =

Pavyzdys. Kai tikimybė γ = 0,95, raskite pasikliautinąjį intervalą M(X) – miežių veislės „Moskovsky 121“ varpos ilgis. Paskirstymas nurodomas lentele, kurioje "vietoj keitimo intervalų (x i, X i+ 1) imami skaičiai, žr. Apsvarstykite, kad atsitiktinis dydis X priklauso normaliam pasiskirstymui.

Sprendimas. Mėginys yra didelis ( n= 50). Turime

Raskime sąmatos tikslumą

Apibrėžkime pasitikėjimo ribas:

Taigi, su patikimumu γ = 0,95 matematinis lūkestis yra pasikliautinajame intervale = (9,5; 10,3).

Taigi didelės imties atveju ( n> 30), kai pakoreguotas standartinis nuokrypis šiek tiek nukrypsta nuo populiacijos charakteristinės reikšmės standartinio nuokrypio, galima rasti pasikliautinąjį intervalą. Tačiau ne visada įmanoma padaryti didelį pavyzdį ir ne visada patartina. Iš (7) aišku, kad mažesnis p, kuo platesnis pasikliautinasis intervalas, t.y. priklauso nuo imties dydžio p.

Anglų statistikas Gossetas (slapyvardis Studentas) įrodė, kad esant normaliam charakteristikos pasiskirstymui X bendrojoje normalizavimo populiacijoje atsitiktinis kintamasis

(8)

priklauso tik nuo imties dydžio. Rasta atsitiktinio dydžio pasiskirstymo funkcija T ir tikimybė P(T < t γ), t γ– vertinimo tikslumas. Funkcija apibrėžiama lygybe

s (n, t γ) = P(|T| < t γ) = γ (9)

pavadintas Studento t skirstinys Su n– 1 laisvės laipsnis. Formulė (9) susieja atsitiktinį kintamąjį T, pasitikėjimo intervalas İ ir pasitikėjimo tikimybė γ . Žinodami du iš jų, galite rasti trečią. Atsižvelgdami į (8), turime

(10)

Nelygybę kairėje (13.7.10) pusėje pakeičiame ekvivalentine nelygybe . Kaip rezultatas, mes gauname

(11)

Kur t γ=t(γ ,n). Dėl funkcijos t γ buvo sudarytos lentelės (žr. 5 priedą). At n>30 t γ Ir t, Iš lentelės rastos Laplaso funkcijos praktiškai sutampa.

Pasitikėjimo intervalas standartiniam nuokrypiui įvertinti σx esant normaliam pasiskirstymui.

Teorema.Leiskite žinoti, kad atsitiktinis dydis turi normalųjį pasiskirstymą. Tada norint įvertinti šio dėsnio parametrą σ x, galioja lygybė

(12)

Kurγ – pasitikėjimo tikimybė, priklausanti nuo imties dydžio n ir įverčio β tikslumo.

Funkcija γ = Ψ (n, β ) buvo gerai ištirtas. Jis naudojamas nustatyti β = β (γ ,n). Už β = β (γ ,n) lentelės sudarytos pagal žinomus n(mėginio dydis) ir γ (pasitikėjimo tikimybė) nustatoma β .

Pavyzdys. Normalaus pasiskirstymo atsitiktinio dydžio parametrui įvertinti buvo paimta imtis (50 karvių per dieną primilžis) ir apskaičiuota. s= 1,5. Raskite pasikliautinąjį intervalą, apimantį tikimybę γ = 0,95.

Sprendimas. Pagal lentelę β (γ , p)n= 50 ir γ = 0,95 randame β = 0,21 (žr. 6 priedą).

Pagal nelygybę (13) randame pasikliautinojo intervalo ribas. Turime

1,5 – 0,21·1,5 = 1,185; 1,5 + 0,21 1,5 = 1,185;



Ar jums patiko straipsnis? Pasidalinkite su draugais!