Probabiliteti i besimit dhe intervali i besimit. Intervali i besimit

Saktësia e vlerësimit, niveli i besimit (besueshmëria)

Intervali i besimit

Gjatë kampionimit të një vëllimi të vogël, duhet të përdoren vlerësimet e intervalit sepse kjo shmang gabimet e mëdha, ndryshe nga vlerësimet pikë.

Intervali është një vlerësim që përcaktohet nga dy numra - skajet e intervalit që mbulojnë parametrin që vlerësohet. Vlerësimet e intervalit na lejojnë të përcaktojmë saktësinë dhe besueshmërinë e vlerësimeve.

Le të shërbejë karakteristika statistikore * e gjetur nga të dhënat e mostrës si një vlerësim i parametrit të panjohur. Ne do ta konsiderojmë atë një numër konstant (ndoshta një ndryshore e rastësishme). Është e qartë se * sa më saktë të përcaktohet parametri β, aq më e vogël është vlera absolute e diferencës | - * |. Me fjalë të tjera, nëse >0 dhe | - * |< , то чем меньше, тем оценка точнее. Таким образом, положительное число характеризует точность оценки.

Megjithatë, metodat statistikore nuk na lejojnë të deklarojmë kategorikisht se vlerësimi * plotëson pabarazinë | - *|<, можно лишь говорить о вероятности, с которой это неравенство осуществляется.

Besueshmëria (probabiliteti i besimit) i një vlerësimi me * është probabiliteti me të cilin realizohet pabarazia | - *|<. Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.

Le të jetë probabiliteti që | - *|<, равна т.е.

Zëvendësimi i pabarazisë | - *|< равносильным ему двойным неравенством -<| - *|<, или *- <<*+, имеем

P(*-< <*+)=.

Një interval besimi (*-, *+) quhet një interval besimi që mbulon një parametër të panjohur me një besueshmëri të caktuar.

Intervalet e besimit për vlerësimin e pritshmërisë matematikore të një shpërndarjeje normale duke pasur parasysh një shpërndarje të njohur.

Një vlerësim intervali me besueshmërinë e pritshmërisë matematikore a të një karakteristike sasiore X të shpërndarë normalisht bazuar në mesataren e mostrës x me një devijim standard të njohur të popullatës është një interval besimi

x - t(/n^?)< a < х + t(/n^?),

ku t(/n^?)= është saktësia e vlerësimit, n është madhësia e kampionit, t është vlera e argumentit të funksionit Laplace Ф(t), në të cilin Ф(t)=/2.

Nga barazia t(/n^?)=, mund të nxirren përfundimet e mëposhtme:

1. ndërsa madhësia e kampionit n rritet, numri zvogëlohet dhe, për rrjedhojë, rritet saktësia e vlerësimit;

2. një rritje në besueshmërinë e vlerësimit = 2Ф(t) çon në një rritje të t (Ф(t) është një funksion në rritje), dhe për rrjedhojë në një rritje; me fjalë të tjera, një rritje në besueshmërinë e një vlerësimi klasik sjell një ulje të saktësisë së tij.

Shembull. Ndryshorja e rastësishme X ka një shpërndarje normale me një devijim standard të njohur =3. Gjeni intervalet e besueshmërisë për vlerësimin e pritshmërisë së panjohur matematikore a duke përdorur mesataren e mostrës x, nëse madhësia e kampionit është n = 36 dhe besueshmëria e vlerësimit është dhënë = 0,95.

Zgjidhje. Le të gjejmë t. Nga relacioni 2Ф(t) = 0,95 fitojmë Ф(t) = 0,475. Nga tabela gjejmë t=1,96.

Le të gjejmë saktësinë e vlerësimit:

matja e intervalit të besueshmërisë së saktësisë

T(/n^?)= (1.96.3)/ /36 = 0.98.

Intervali i besimit është: (x - 0.98; x + 0.98). Për shembull, nëse x = 4.1, atëherë intervali i besimit ka kufijtë e mëposhtëm të besimit:

x - 0,98 = 4,1 - 0,98 = 3,12; x + 0,98 = 4,1 + 0,98 = 5,08.

Kështu, vlerat e parametrit të panjohur a, në përputhje me të dhënat e mostrës, plotësojnë pabarazinë 3.12< а < 5,08. Подчеркнем, что было бы ошибочным написать Р (3,12 < а < 5,08) = 0,95. Действительно, так как а - постоянная величина, то либо она заключена в найденном интервале (тогда событие 3,12 < а < 5,08 достоверно и его вероятность равна единице), либо в нем не заключена (в этом случае событие 3,12 < а < 5,08 невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было указано, изменяются от выборки к выборке.

Le të shpjegojmë kuptimin e një besueshmërie të dhënë. Besueshmëria = 0,95 tregon se nëse merret një numër mjaft i madh i mostrave, atëherë 95% e tyre përcaktojnë intervalet e besueshmërisë në të cilat në të vërtetë përmbahet parametri; vetëm në 5% të rasteve mund të shkojë përtej intervalit të besimit.

Nëse është e nevojshme të vlerësohet pritshmëria matematikore me një saktësi dhe besueshmëri të paracaktuar, atëherë madhësia minimale e mostrës që do të sigurojë këtë saktësi gjendet duke përdorur formulën

Intervalet e besimit për vlerësimin e pritshmërisë matematikore të një shpërndarjeje normale me një të panjohur

Një vlerësim intervali me besueshmërinë e pritshmërisë matematikore a të një karakteristike sasiore të shpërndarë normalisht X bazuar në mesataren e mostrës x me një devijim standard të panjohur të popullatës është një interval besimi.

x - t()(s/n^?)< a < х + t()(s/n^?),

ku s është devijimi standard i kampionit të “korrigjuar”, t() gjendet nga tabela për të dhënën dhe n.

Shembull. Karakteristika sasiore X e popullatës është e shpërndarë normalisht. Bazuar në madhësinë e kampionit prej n=16, u gjet mesatarja e mostrës x = 20.2 dhe devijimi standard i “korrigjuar” s = 0.8. Vlerësoni pritshmërinë e panjohur matematikore duke përdorur një interval besimi me një besueshmëri prej 0,95.

Zgjidhje. Le të gjejmë t(). Duke përdorur tabelën, me = 0,95 dhe n=16 gjejmë t()=2,13.

Le të gjejmë kufijtë e besimit:

x - t() (s/n^?) = 20,2 - 2,13 *. 0.8/16^? = 19.774

x + t()(s/n^?) = 20,2 + 2,13 * 0,8/16^? = 20.626

Pra, me një besueshmëri prej 0,95, parametri i panjohur a përmbahet në një interval besimi prej 19,774< а < 20,626

Vlerësimi i vlerës së vërtetë të sasisë së matur

Le të bëhen n matje të pavarura me saktësi të barabartë të një sasie fizike, vlera e vërtetë e së cilës nuk dihet.

Rezultatet e matjeve individuale do t'i konsiderojmë si variabla të rastësishëm Хl, Х2,...Хn. Këto sasi janë të pavarura (matjet janë të pavarura). Ata kanë të njëjtën pritshmëri matematikore a (vlera e vërtetë e sasisë së matur), të njëjtat varianca ^2 (matjet janë po aq të sakta) dhe shpërndahen normalisht (ky supozim konfirmohet nga përvoja).

Kështu, të gjitha supozimet që janë bërë në nxjerrjen e intervaleve të besimit janë përmbushur dhe, për rrjedhojë, ne jemi të lirë të përdorim formulat. Me fjalë të tjera, vlera e vërtetë e vlerës së matur mund të vlerësohet nga mesatarja aritmetike e rezultateve të matjeve individuale duke përdorur intervale besimi.

Shembull. Bazuar në të dhënat e nëntë matjeve të pavarura me saktësi të barabartë të një sasie fizike, mesatarja aritmetike e rezultateve të matjeve individuale rezultoi të ishte x = 42.319 dhe devijimi standard i "korrigjuar" s = 5.0. Kërkohet të vlerësohet vlera e vërtetë e vlerës së matur me besueshmëri = 0,95.

Zgjidhje. Vlera e vërtetë e sasisë së matur është e barabartë me pritshmërinë e saj matematikore. Prandaj, problemi zbret në vlerësimin e pritshmërisë matematikore (e dhënë një të panjohur) duke përdorur një interval besimi që mbulon a me një besueshmëri të caktuar = 0.95.

x - t()(s/n^?)< a < х + t()(s/n^?)

Duke përdorur tabelën, duke përdorur y = 0,95 dhe l = 9 gjejmë

Le të gjejmë saktësinë e vlerësimit:

t())(s/n^?) = 2,31 * 5/9^?=3,85

Le të gjejmë kufijtë e besimit:

x - t() (s/n^?) = 42,319 - 3,85 = 38,469;

x + t() (s/n^?) = 42,319 +3,85 = 46,169.

Pra, me një besueshmëri prej 0.95, vlera e vërtetë e vlerës së matur qëndron në intervalin e besimit prej 38.469< а < 46,169.

Intervalet e besimit për vlerësimin e devijimit standard të një shpërndarjeje normale.

Le të shpërndahet normalisht karakteristika sasiore X e popullsisë së përgjithshme. Kërkohet të vlerësohet devijimi standard i përgjithshëm i panjohur nga devijimi standard i mostrës "të korrigjuar". Për ta bërë këtë, ne do të përdorim vlerësimin e intervalit.

Një vlerësim interval (me besueshmëri) i devijimit standard o të një karakteristike sasiore të shpërndarë normalisht X bazuar në devijimin standard të mostrës "të korrigjuar" s është intervali i besueshmërisë

s (1 -- q)< < s (1 + q) (при q < 1),

0 < < s (1 + q) (при q > 1),

ku q gjendet nga tabela për n n e dhënë.

Shembulli 1. Karakteristika sasiore X e popullatës së përgjithshme shpërndahet normalisht. Bazuar në një madhësi kampioni prej n = 25, u gjet një devijim standard i "korrigjuar" prej s = 0.8. Gjeni një interval besimi që mbulon devijimin e përgjithshëm standard me një besueshmëri prej 0,95.

Zgjidhje. Duke përdorur tabelën me të dhëna = 0,95 dhe n = 25, gjejmë q = 0,32.

Intervali i kërkuar i besimit s (1 -- q)< < s (1 + q) таков:

0,8(1-- 0,32) < < 0,8(1+0,32), или 0,544 < < 1,056.

Shembulli 2. Karakteristika sasiore X e popullatës së përgjithshme shpërndahet normalisht. Bazuar në një madhësi kampioni prej n=10, u gjet një devijim standard i “korrigjuar” prej s = 0.16. Gjeni një interval besimi që mbulon devijimin e përgjithshëm standard me një besueshmëri prej 0,999.

Zgjidhje. Duke përdorur tabelën shtojcë, bazuar në të dhënat = 0,999 dhe n=10, gjejmë 17= 1,80 (q > 1). Intervali i kërkuar i besimit është:

0 < < 0,16(1 + 1,80), или 0 < < 0,448.

notë saktësia e matjes

Në teorinë e gabimit, është e zakonshme të karakterizohet saktësia e matjes (saktësia e instrumentit) duke përdorur devijimin standard të gabimeve të rastësishme të matjes. Për vlerësim, përdoret devijimi standard "i korrigjuar". Duke qenë se zakonisht rezultatet e matjes janë reciprokisht të pavarura, kanë të njëjtën pritshmëri matematikore (vlerën e vërtetë të vlerës së matur) dhe të njëjtën shpërndarje (në rastin e matjeve me saktësi të barabartë), teoria e përshkruar në paragrafin e mëparshëm është e zbatueshme për vlerësimin e saktësia e matjeve.

Shembull. Bazuar në 15 matje me saktësi të barabartë, u gjet një devijim standard i "korrigjuar" prej s = 0.12. Gjeni saktësinë e matjes me një besueshmëri prej 0,99.

Zgjidhje. Saktësia e matjes karakterizohet nga devijimi standard i gabimeve të rastësishme, kështu që problemi zbret në gjetjen e intervalit të besimit s (1 -- q)< < s (1 + q) , покрывающего с заданной надежностью 0,99

Duke përdorur tabelën shtojcë për = 0,99 dhe n = 15 gjejmë q = 0,73.

Intervali i kërkuar i besimit

0,12(1-- 0,73) < < 0,12(1+0,73), или 0.03 < < 0,21.

Vlerësimi i probabilitetit (shpërndarja binomiale) nga frekuenca relative

Një vlerësim interval (me besueshmëri) i probabilitetit të panjohur p të një shpërndarje binomiale me frekuencë relative w është intervali i besueshmërisë (me skajet e përafërta p1 dhe p2)

p1< p < p2,

ku n është numri total i testeve; m është numri i dukurive të ngjarjes; w - frekuencë relative e barabartë me raportin m/n; t është vlera e argumentit të funksionit Laplace, në të cilin Ф(t) = /2.

Komentoni. Për vlerat e mëdha të n (të rendit të qindrave) mund të merren si kufij të përafërt të intervalit të besimit

Shpesh vlerësuesi duhet të analizojë tregun e pasurive të paluajtshme të segmentit në të cilin ndodhet prona që vlerësohet. Nëse tregu është i zhvilluar, mund të jetë e vështirë të analizohet i gjithë grupi i objekteve të paraqitura, kështu që një mostër e objekteve përdoret për analizë. Ky mostër nuk rezulton gjithmonë homogjen, ndonjëherë është e nevojshme ta pastroni atë nga pikat ekstreme - ofertat shumë të larta ose shumë të ulëta të tregut; Për këtë qëllim përdoret intervali i besimit. Qëllimi i këtij studimi është të kryejë një analizë krahasuese të dy metodave për llogaritjen e intervalit të besueshmërisë dhe të zgjedhë opsionin optimal të llogaritjes kur punohet me mostra të ndryshme në sistemin estimatica.pro.

Intervali i besimit është një interval i vlerave të atributeve të llogaritura në bazë të një kampioni, i cili me një probabilitet të njohur përmban parametrin e vlerësuar të popullatës së përgjithshme.

Qëllimi i llogaritjes së një intervali besimi është të ndërtohet një interval i tillë bazuar në të dhënat e mostrës në mënyrë që të mund të thuhet me një probabilitet të caktuar që vlera e parametrit të vlerësuar është në këtë interval. Me fjalë të tjera, intervali i besimit përmban vlerën e panjohur të vlerës së vlerësuar me një probabilitet të caktuar. Sa më i gjerë të jetë intervali, aq më i lartë është pasaktësia.

Ekzistojnë metoda të ndryshme për përcaktimin e intervalit të besimit. Në këtë artikull do të shqyrtojmë 2 metoda:

  • përmes devijimit mesatar dhe standard;
  • nëpërmjet vlerës kritike të statistikave t (koeficienti i studentit).

Fazat e analizës krahasuese të metodave të ndryshme për llogaritjen e CI:

1. formojnë një mostër të dhënash;

2. e përpunojmë duke përdorur metoda statistikore: llogarisim vlerën mesatare, mesataren, variancën etj.;

3. Llogaritni intervalin e besimit në dy mënyra;

4. analizoni mostrat e pastruara dhe intervalet e besueshmërisë që rezultojnë.

Faza 1. Kampionimi i të dhënave

Mostra u formua duke përdorur sistemin estimatica.pro. Mostra përfshinte 91 oferta për shitjen e apartamenteve me 1 dhomë në zonën e 3-të të çmimeve me llojin e paraqitjes "Hrushovi".

Tabela 1. Mostra fillestare

Çmimi 1 m2, njësi

Fig.1. Mostra fillestare



Faza 2. Përpunimi i mostrës fillestare

Përpunimi i një kampioni duke përdorur metoda statistikore kërkon llogaritjen e vlerave të mëposhtme:

1. Mesatarja aritmetike

2. Mediana është një numër që karakterizon kampionin: saktësisht gjysma e elementeve të mostrës janë më të mëdha se mesatarja, gjysma tjetër janë më pak se mediana

(për një mostër me një numër tek vlerash)

3. Gama - diferenca midis vlerave maksimale dhe minimale në mostër

4. Varianca - përdoret për të vlerësuar më saktë variacionin e të dhënave

5. Devijimi standard i mostrës (në tekstin e mëtejmë - SD) është treguesi më i zakonshëm i shpërndarjes së vlerave të rregullimit rreth mesatares aritmetike.

6. Koeficienti i variacionit - pasqyron shkallën e shpërndarjes së vlerave të rregullimit

7. koeficienti i lëkundjes - pasqyron luhatjen relative të vlerave ekstreme të çmimeve në mostër rreth mesatares

Tabela 2. Treguesit statistikorë të kampionit origjinal

Koeficienti i variacionit, i cili karakterizon homogjenitetin e të dhënave, është 12.29%, por koeficienti i lëkundjes është shumë i lartë. Kështu, mund të themi se kampioni origjinal nuk është homogjen, kështu që le të kalojmë në llogaritjen e intervalit të besimit.

Faza 3. Llogaritja e intervalit të besimit

Metoda 1. Llogaritja duke përdorur devijimin mesatar dhe standard.

Intervali i besimit përcaktohet si më poshtë: vlera minimale - devijimi standard zbritet nga mesatarja; vlera maksimale - devijimi standard i shtohet mesatares.

Kështu, intervali i besimit (47179 CU; 60689 CU)

Oriz. 2. Vlerat që bien brenda intervalit të besimit 1.



Metoda 2. Ndërtimi i një intervali besimi duke përdorur vlerën kritike të statistikave t (koeficienti studentor)

S.V. Gribovsky në librin e tij "Metodat matematikore për vlerësimin e vlerës së pronës" përshkruan një metodë për llogaritjen e intervalit të besimit përmes koeficientit Student. Gjatë llogaritjes duke përdorur këtë metodë, vlerësuesi duhet të vendosë vetë nivelin e rëndësisë ∝, i cili përcakton probabilitetin me të cilin do të ndërtohet intervali i besimit. Në mënyrë tipike, përdoren nivelet e rëndësisë prej 0.1; 0.05 dhe 0.01. Ato korrespondojnë me probabilitetet e besimit prej 0,9; 0,95 dhe 0,99. Me këtë metodë, vlerat e vërteta të pritshmërisë dhe variancës matematikore supozohen të jenë praktikisht të panjohura (gjë që është pothuajse gjithmonë e vërtetë kur zgjidhen problemet praktike të vlerësimit).

Formula e intervalit të besimit:

n - madhësia e mostrës;

Vlera kritike e statistikave t (Shpërndarja studentore) me një nivel sinjifikance ∝, numri i shkallëve të lirisë n-1, i cili përcaktohet nga tabela të veçanta statistikore ose duke përdorur MS Excel (→"Statistikore"→ STUDIST);

∝ - niveli i rëndësisë, merr ∝=0.01.

Oriz. 2. Vlerat që bien brenda intervalit të besimit 2.

Faza 4. Analiza e metodave të ndryshme për llogaritjen e intervalit të besimit

Dy metoda të llogaritjes së intervalit të besimit - përmes mesatares dhe koeficientit të Studentit - çuan në vlera të ndryshme të intervaleve. Prandaj, morëm dy mostra të ndryshme të pastruara.

Tabela 3. Statistikat për tre mostra.

Treguesi

Mostra fillestare

1 opsion

Opsioni 2

Vlera mesatare

Dispersion

Koefi. variacionet

Koefi. lëkundjet

Numri i objekteve në pension, copë.

Bazuar në llogaritjet e kryera, mund të themi se vlerat e intervalit të besimit të marra nga metoda të ndryshme kryqëzohen, kështu që ju mund të përdorni ndonjë nga metodat e llogaritjes sipas gjykimit të vlerësuesit.

Sidoqoftë, ne besojmë se kur punoni në sistemin estimatica.pro, këshillohet të zgjidhni një metodë për llogaritjen e intervalit të besimit në varësi të shkallës së zhvillimit të tregut:

  • nëse tregu është i pazhvilluar, përdorni metodën e llogaritjes duke përdorur devijimin mesatar dhe standard, pasi numri i objekteve në pension në këtë rast është i vogël;
  • nëse tregu është i zhvilluar, aplikoni llogaritjen përmes vlerës kritike të statistikave t (koeficienti i studentit), pasi është e mundur të formohet një mostër e madhe fillestare.

Në përgatitjen e artikullit janë përdorur këto:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Metodat matematikore për vlerësimin e vlerës së pasurisë. Moskë, 2014

2. Të dhënat e sistemit estimatica.pro

Intervali i besimit. Probabiliteti i besimit.

ZBATIMI I TEORISË TË PROBABILITETIT NË STATISTIKË.

Konceptet bazë.

Statistikat matematikore janë një degë e matematikës që studion metodat për përpunimin dhe analizimin e të dhënave eksperimentale të marra si rezultat i vëzhgimeve të ngjarjeve dhe fenomeneve masive të rastësishme.

Vëzhgimet e bëra mbi objektet mund të mbulojnë të gjithë anëtarët e popullsisë në studim pa përjashtim dhe mund të kufizohen në anketat e vetëm një pjese të caktuar të anëtarëve të kësaj popullate. Vëzhgimi i parë quhet i vazhdueshëm ose i plotë, i dyti i pjesshëm ose selektive .

Natyrisht, informacioni më i plotë sigurohet nga vëzhgimi i vazhdueshëm, por jo gjithmonë përdoret. Së pari, vëzhgimi i vazhdueshëm është shumë i mundimshëm dhe së dyti, shpesh është praktikisht i pamundur apo edhe jopraktik. Prandaj, në shumicën dërrmuese të rasteve, ata përdorin kërkime selektive.

Një popullatë nga e cila disa nga anëtarët e saj janë zgjedhur në një farë mënyre për studim të përbashkët quhet popullata e përgjithshme , dhe një pjesë e popullsisë së përgjithshme e përzgjedhur në një mënyrë ose në një tjetër është një popullsi mostër ose mostër .

Vëllimi i popullsisë është teorikisht i pakufizuar, por në praktikë është gjithmonë i kufizuar.

Madhësia e mostrës mund të jetë e madhe ose e vogël, por nuk mund të jetë më pak se dy.

Përzgjedhja në kampion mund të bëhet në mënyrë të rastësishme (me short ose short). Ose e planifikuar, në varësi të detyrës dhe organizimit të sondazhit. Në mënyrë që kampioni të jetë përfaqësues, është e nevojshme t'i kushtohet vëmendje gamës së variacionit të karakteristikës dhe të koordinohet madhësia e kampionit me të.

2. Përcaktimi i funksionit të panjohur të shpërndarjes.

Kështu që ne bëmë një përzgjedhje. Le të ndajmë gamën e vlerave të vëzhguara në intervale, , …. të njëjtën gjatësi. Për të vlerësuar numrin e kërkuar të intervaleve, mund të përdorni formulat e mëposhtme:

Tjetra le m i - numri i vlerave të vëzhguara të përfshira në i th intervali. Duke e ndarë m i për numrin total të vëzhgimeve n, marrim frekuencën përkatëse i-oh intervali: , dhe . Le të krijojmë tabelën e mëposhtme:

Numri i intervalit Intervali m i
m 1
m 2
... ... ... ...
k m k

që quhet statistikisht afër . Empirike (ose statistikore ) funksioni i shpërndarjes një ndryshore e rastësishme është frekuenca e një ngjarjeje e tillë që sasia si rezultat i eksperimentit do të marrë një vlerë më të vogël se x:

Në praktikë, mjafton të gjesh vlerat e funksionit të shpërndarjes statistikore F*(x) në pika , cilët janë kufijtë e intervaleve të serisë statistikore:

(5.2)

Duhet të theksohet se në dhe në. Me vizatimin e pikave dhe duke i lidhur me një kurbë të lëmuar, marrim një grafik të përafërt të funksionit të shpërndarjes empirike (Fig. 5.1). Duke përdorur ligjin e Bernulit për numrat e mëdhenj, mund të vërtetojmë se me një numër mjaft të madh testesh me probabilitet afër unitetit, funksioni i shpërndarjes empirike ndryshon aq pak sa të dëshirohet nga funksioni i shpërndarjes së ndryshores së rastësishme të panjohur për ne.

Shpesh, në vend që të vizatohet funksioni i shpërndarjes empirike, bëhet sa vijon. Intervalet vizatohen në boshtin e abshisave, ,…. . Në çdo interval, ndërtohet një drejtkëndësh, zona e të cilit është e barabartë me frekuencën që korrespondon me këtë interval. Lartësia h i i këtij drejtkëndëshi është i barabartë me , ku është gjatësia e secilit prej intervaleve. Është e qartë se shuma e sipërfaqeve të të gjithë drejtkëndëshave të ndërtuar është e barabartë me një.

Le të shqyrtojmë një funksion që është konstant në interval dhe i barabartë me . Grafiku i këtij funksioni quhet histogrami . Është një vijë me shkallë (Fig. 5.2). Duke përdorur ligjin e Bernulit për numrat e mëdhenj, është e mundur të vërtetohet se për numrat e vegjël dhe të mëdhenj, me siguri praktike, aq pak sa dëshirohet ndryshon nga dendësia e shpërndarjes së një ndryshoreje të rastësishme të vazhdueshme.

Kështu, në praktikë, përcaktohet lloji i funksionit të shpërndarjes së panjohur të një ndryshoreje të rastësishme.

3. Përcaktimi i parametrave të panjohur të shpërndarjes.

Kështu, ne morëm një histogram që jep qartësi. Qartësia e rezultateve të paraqitura na lejon të nxjerrim përfundime dhe gjykime të ndryshme për objektin në studim.

Megjithatë, ata zakonisht nuk ndalen me kaq, por shkojnë më tej, duke analizuar të dhënat për të testuar supozime të caktuara në lidhje me mekanizmat e mundshëm të proceseve apo dukurive që studiohen.

Megjithëse të dhënat në çdo anketë janë relativisht të vogla, ne do të dëshironim që rezultatet e analizës të përshkruanin mjaftueshëm të gjithë grupin aktual ose të imagjinueshëm (d.m.th., popullsinë).

Për ta bërë këtë, bëhen disa supozime se si treguesit e llogaritur në bazë të të dhënave eksperimentale (mostra) lidhen me parametrat e popullatës së përgjithshme.

Zgjidhja e këtij problemi është një pjesë kryesore e çdo analize të të dhënave eksperimentale dhe është e lidhur ngushtë me përdorimin e një numri shpërndarjesh teorike të diskutuara më sipër.

Përdorimi i gjerë i shpërndarjes normale në konkluzionet statistikore ka justifikim empirik dhe teorik.

Së pari, praktika tregon se në shumë raste shpërndarja normale është me të vërtetë një paraqitje mjaft e saktë e të dhënave eksperimentale.

Së dyti, teorikisht është treguar se vlerat mesatare të intervaleve të histogramit shpërndahen sipas një ligji afër normales.

Sidoqoftë, duhet kuptuar qartë se shpërndarja normale është vetëm një mjet thjesht matematikor dhe nuk është aspak e nevojshme që të dhënat reale eksperimentale të përshkruhen me saktësi nga shpërndarja normale. Edhe pse në shumë raste, duke lejuar një gabim të vogël, mund të themi se të dhënat shpërndahen normalisht.

Një sërë treguesish, si mesatarja, varianca etj., karakterizojnë kampionin dhe quhen statistika. Të njëjtët tregues, por të lidhur me popullsinë në tërësi, quhen parametra. Kështu, mund të themi se statistikat shërbejnë për të vlerësuar parametrat.

Mesatarja e përgjithshme është mesatarja aritmetike e vlerave vëllimi i përgjithshëm i popullsisë:

Mesatarja e mostrës është mesatarja aritmetike e vëllimit të mostrës:

(5.4)

nëse përzgjedhja është në formë tabele.

Mesatarja e kampionit merret si një vlerësim i mesatares së përgjithshme.

Varianca e përgjithshme është mesatarja aritmetike e devijimeve në katror të vlerave të popullsisë nga vlera mesatare e tyre:

Devijimi standard i përgjithshëm është rrënja katrore e variancës së përgjithshme: .

Varianca e mostrës është mesatarja aritmetike e katrorëve të devijimit të vlerave të mostrës nga mesatarja e tyre:

Devijimi standard i mostrës është përcaktuar si .

Për të përputhur më mirë rezultatet eksperimentale, është prezantuar koncepti i variancës empirike (ose të korrigjuar):

Për të vlerësuar devijimin standard të përgjithshëm, përdorni devijimin standard të korrigjuar ose standardin empirik:

(5.5)

Në rastin kur të gjitha vlerat e mostrës janë të ndryshme, d.m.th. , , formulat për dhe marrin formën:

(5.6)

Intervali i besimit. Probabiliteti i besimit.

Statistikat e ndryshme të marra si rezultat i llogaritjeve janë vlerësime pikësore të parametrave përkatës të popullsisë.

Nëse nxjerrim një numër të caktuar mostrash nga popullata e përgjithshme dhe gjejmë statistikat me interes për ne për secilën prej tyre, atëherë vlerat e llogaritura do të përfaqësojnë variabla të rastësishme që kanë një farë përhapjeje rreth parametrit të vlerësuar.

Por, si rregull, si rezultat i eksperimentit, studiuesi ka në dispozicion një mostër. Prandaj, është me interes të konsiderueshëm të merret një vlerësim interval, d.m.th. një interval të caktuar brenda të cilit, siç mund të supozohet, qëndron vlera e vërtetë e parametrit.

Probabilitetet e njohura si të mjaftueshme për gjykime të sigurta për parametrat e popullatës bazuar në statistika quhen besim.

Për shembull, merrni parasysh se si të vlerësoni parametrin .

Teoremat 1 dhe 2, megjithëse janë të përgjithshme, d.m.th. janë të formuluara nën supozime mjaft të gjera, ato nuk bëjnë të mundur përcaktimin se sa afër janë vlerësimet me parametrat e vlerësuar. Nga fakti që -vlerësimet janë konsistente, rrjedh vetëm se me rritjen e madhësisë së mostrës, vlera P(|θ * – θ | < δ), δ < 0, приближается к 1.

Lindin pyetjet e mëposhtme.

1) Cila duhet të jetë madhësia e mostrës? p, në mënyrë që saktësia e specifikuar
|θ * – θ | = δ ishte e garantuar me një probabilitet të pranuar më parë?

2) Sa është saktësia e vlerësimit nëse dihet madhësia e kampionit dhe jepet probabiliteti i përfundimit pa gabime?

3) Sa është probabiliteti që, duke pasur parasysh madhësinë e kampionit, të sigurohet saktësia e specifikuar e vlerësimit?

Le të prezantojmë disa përkufizime të reja.

Përkufizimi. Probabiliteti γ për të përmbushur pabarazinë,|θ *– θ | < δ quhet niveli i besimit ose besueshmëria e vlerësimit θ.

Le të kalojmë nga pabarazia | θ *–θ | < δ к двойному неравенству. Известно, что . Поэтому доверительную вероятность можно записать в виде

Sepse θ (parametri i vlerësuar) është një numër konstant, dhe θ * – vlera e rastësishme, koncepti i probabilitetit të besimit mund të formulohet si më poshtë: probabiliteti i besimit γ është probabiliteti që intervali ( θ *– δ, θ *+ δ) mbulon parametrin e vlerësuar.

Përkufizimi. Interval i rastësishëm(θ *–δ , θ *+δ ), brenda të cilit parametri i panjohur i vlerësuar qëndron me probabilitetin γ quhet interval i besueshmërisë İ, që korrespondon me koeficientin e besimit γ,

İ= (θ*– δ, θ*+ δ ). (3)

Besueshmëria e vlerësimit γ mund të specifikohet paraprakisht, atëherë, duke ditur ligjin e shpërndarjes së ndryshores së rastësishme që studiohet, mund të gjendet intervali i besimit İ . Problemi i anasjelltë zgjidhet gjithashtu kur jepet një e dhënë İ gjendet besueshmëria përkatëse e vlerësimit.

Le, për shembull, γ = 0,95; pastaj numri r= 1 – y = 0,05 tregon probabilitetin me të cilin përfundimi për besueshmërinë e vlerësimit është i gabuar. Numri р=1–γ thirrur niveli i rëndësisë. Niveli i rëndësisë përcaktohet paraprakisht në varësi të rastit specifik. Zakonisht r merret e barabartë me 0,05; 0,01; 0.001.

Le të zbulojmë se si të ndërtojmë një interval besimi për pritshmërinë matematikore të një karakteristike të shpërndarë normalisht. Është treguar se

Le të vlerësojmë pritshmërinë matematikore duke përdorur mesataren e kampionit, duke marrë parasysh që ajo ka edhe një shpërndarje normale*. ne kemi

(4)

dhe nga formula (12.9.2) marrim

Duke marrë parasysh (13.5.12), marrim

(5)

Le të dihet probabiliteti γ . Pastaj

Për lehtësinë e përdorimit të tabelës së funksionit Laplace, vendosëm më pas a

Intervali

(7)

mbulon parametrin a = M(X) me probabilitet γ .

Në shumicën e rasteve devijimi standard σ(X) karakteristika që studiohet është e panjohur. Prandaj, në vend të σ (X) me një mostër të madhe ( n> 30) aplikoni devijimin standard të mostrës së korrigjuar s, që nga ana tjetër është një vlerësim σ (X), intervali i besimit do të duket si

İ =

Shembull. Me probabilitet γ = 0,95, gjeni intervalin e besimit për M(X) - gjatësia e veshit të varietetit të elbit "Moskovsky 121". Shpërndarja specifikohet nga një tabelë në të cilën "në vend të intervaleve të ndryshimit (x i, X i+ 1) janë marrë numra, shih Konsideroni se një ndryshore e rastësishme X i nënshtrohet shpërndarjes normale.

Zgjidhje. Mostra është e madhe ( n= 50). ne kemi

Le të gjejmë saktësinë e vlerësimit

Le të përcaktojmë kufijtë e besimit:

Kështu, me besueshmëri γ = 0,95 pritshmëria matematikore përmbahet në intervalin e besimit I= (9,5; 10,3).

Pra, në rastin e një kampioni të madh ( n> 30), kur devijimi standard i korrigjuar devijon pak nga devijimi standard i vlerës karakteristike në popullatë, mund të gjendet një interval besimi. Por nuk është gjithmonë e mundur të bëhet një mostër e madhe dhe nuk është gjithmonë e këshillueshme. Nga (7) është e qartë se sa më i vogël p, sa më i gjerë të jetë intervali i besimit, d.m.th. I varet nga madhësia e kampionit fq.

Statisticieni anglez Gosset (pseudonimi Student) vërtetoi se në rastin e një shpërndarjeje normale të një karakteristike X në popullatën e përgjithshme të normalizimit një variabël rastësor

(8)

varet vetëm nga madhësia e kampionit. U gjet funksioni i shpërndarjes së ndryshores së rastësishme T dhe probabilitetit P(T < t γ), t γ– saktësia e vlerësimit. Funksioni i përcaktuar nga barazia

s (n, t γ) = P(|T| < t γ) = γ (9)

emërtuar Shpërndarja e t nxënësve Me n– 1 shkallë lirie. Formula (9) lidh variablin e rastësishëm T, intervali i besimit İ dhe probabiliteti i besimit γ . Duke njohur dy prej tyre, ju mund të gjeni të tretën. Duke marrë parasysh (8), kemi

(10)

Ne zëvendësojmë pabarazinë në anën e majtë të (13.7.10) me pabarazinë ekuivalente . Si rezultat marrim

(11)

Ku t γ=t(γ ,n). Për funksionin t γ janë përpiluar tabelat (shih Shtojcën 5). Në n> 30 t γ Dhe t, Funksionet Laplace të gjetura nga tabela praktikisht përkojnë.

Intervali i besimit për vlerësimin e devijimit standard σx në rastin e shpërndarjes normale.

Teorema.Le të dihet se ndryshorja e rastësishme ka një shpërndarje normale. Më pas për të vlerësuar parametrin σ x të këtij ligji, vlen barazia

(12)

Kuγ – probabiliteti i besueshmërisë në varësi të madhësisë së kampionit n dhe saktësisë së vlerësimit β.

Funksioni γ = Ψ (n, β ) është studiuar mirë. Përdoret për të përcaktuar β = β (γ ,n). Për β = β (γ ,n) janë përpiluar tabelat sipas të njohurve n(madhësia e mostrës) dhe γ (probabiliteti i besimit) përcaktohet β .

Shembull. Për të vlerësuar parametrin e një variabli të rastësishëm të shpërndarë normalisht, u mor një mostër (rendimenti ditor i qumështit prej 50 lopë) dhe u llogarit s= 1.5. Gjeni mbulimin e intervalit të besimit me probabilitet γ = 0,95.

Zgjidhje. Sipas tabelës β (γ , p) Për n= 50 dhe γ = 0,95 gjejmë β = 0,21 (shih Shtojcën 6).

Në përputhje me pabarazinë (13), gjejmë kufijtë e intervalit të besimit. ne kemi

1,5 – 0,21·1,5 = 1,185; 1,5 + 0,21 1,5 = 1,185;



Ju pëlqeu artikulli? Ndani me miqtë tuaj!