Testi parametrik t i studentit vlerëson. Shpërndarja e testit t studentit për testimin e hipotezës për mesataren dhe llogaritjen e intervalit të besimit në MS Excel

Testimi i hipotezave statistikore na lejon të nxjerrim konkluzione të forta për karakteristikat e një popullate bazuar në të dhënat e mostrës. Ka hipoteza të ndryshme. Një prej tyre është hipoteza për mesataren (pritshmëria matematikore). Thelbi i tij është të nxirret një përfundim i saktë, bazuar vetëm në mostrën e disponueshme, se ku mund të vendoset ose jo mesatarja e përgjithshme (nuk do ta dimë kurrë të vërtetën e saktë, por mund ta ngushtojmë kërkimin).

Qasja e përgjithshme për testimin e hipotezave është përshkruar, kështu që le të kalojmë direkt në pikën. Së pari, le të supozojmë se kampioni është nxjerrë nga një popullatë normale e variablave të rastit X me mesataren e përgjithshme μ dhe variancë σ 2(E di, e di që kjo nuk ndodh, por mos më ndërprisni!). Mesatarja aritmetike e këtij kampioni është padyshim vetë një ndryshore e rastësishme. Nëse nxirrni shumë mostra të tilla dhe llogaritni mesataret e tyre, atëherë ata do të kenë gjithashtu një pritshmëri matematikore μ Dhe

Pastaj ndryshorja e rastësishme

Lind pyetja: a do të jetë mesatarja e përgjithshme me një probabilitet 95% brenda ±1,96? s x̅. Me fjalë të tjera, janë shpërndarjet e ndryshoreve të rastësishme

ekuivalente.

Kjo pyetje u parashtrua (dhe u zgjidh) për herë të parë nga një kimist që punonte në fabrikën e birrës Guinness në Dublin (Irlandë). Kimisti quhej William Seely Gossett dhe ai mori mostra birre për analiza kimike. Në një moment, me sa duket, William filloi të torturohej nga dyshime të paqarta për shpërndarjen e mesatareve. Doli të ishte pak më e lyer se sa duhet të ishte një shpërndarje normale.

Duke mbledhur bazën matematikore dhe duke llogaritur vlerat e funksionit të shpërndarjes që zbuloi, kimisti dublin William Gosset shkroi një shënim që u botua në numrin e marsit 1908 të revistës Biometrics (kryeredaktori - Karl Pearson). Sepse Guinness e ndaloi rreptësisht dhënien e sekreteve të birrës, i nënshkruar me pseudonimin Student.

Përkundër faktit se K. Pearson kishte shpikur tashmë shpërndarjen, ideja e përgjithshme e normalitetit ende dominonte. Askush nuk do të mendonte se shpërndarja e pikëve të mostrës mund të mos ishte normale. Prandaj, artikulli i W. Gosset mbeti praktikisht i pavërejtur dhe i harruar. Dhe vetëm Ronald Fisher e vlerësoi zbulimin e Gosset. Fischer përdori shpërndarjen e re në punën e tij dhe i dha emrin Shpërndarja e t nxënësve. Kriteri për testimin e hipotezave, në përputhje me rrethanat, u bë T-testi i studentit. Kështu ndodhi një "revolucion" në statistika, i cili hyri në epokën e analizës së të dhënave të mostrës. Ky ishte një ekskursion i shkurtër në histori.

Le të shohim se çfarë mund të shihte W. Gosset. Le të gjenerojmë 20 mijë mostra normale nga 6 vëzhgime me një mesatare ( ) 50 dhe devijimi standard ( σ ) 10. Më pas normalizojmë mjetin e mostrës duke përdorur variancë e përgjithshme:

Ne do të grupojmë 20 mijë mesataret që rezultojnë në intervale me gjatësi 0.1 dhe do të llogarisim frekuencat. Le të përshkruajmë në diagram shpërndarjen aktuale të frekuencës (Norm) dhe teorike (ENorm) të mesatareve të mostrës.

Pikat (frekuencat e vëzhguara) praktikisht përkojnë me vijën (frekuencat teorike). Kjo është e kuptueshme, sepse të dhënat janë marrë nga e njëjta popullatë e përgjithshme, dhe dallimet janë vetëm gabime kampionimi.

Le të bëjmë një eksperiment të ri. Ne normalizojmë mesataret duke përdorur varianca e mostrës.

Le t'i numërojmë përsëri frekuencat dhe t'i vizatojmë në diagram në formën e pikave, duke lënë një linjë standarde të shpërndarjes normale për krahasim. Le të shënojmë frekuencën empirike të mesatareve, të themi, me shkronjë t.

Mund të shihet se shpërndarjet këtë herë nuk përkojnë shumë. Mbylle, po, por jo njësoj. Bishtat janë bërë më "të rëndë".

Gosset-Student nuk kishte versionin e fundit të MS Excel, por ky është pikërisht efekti që ai vuri re. Pse ndodh kjo? Shpjegimi është se ndryshorja e rastësishme

varet jo vetëm nga gabimi i kampionimit (numëruesi), por edhe nga gabimi standard i mesatares (emëruesi), i cili është gjithashtu një ndryshore e rastësishme.

Le të shohim pak se çfarë shpërndarjeje duhet të ketë një ndryshore e tillë e rastësishme. Së pari, do t'ju duhet të mbani mend (ose të mësoni) diçka nga statistikat matematikore. Ekziston teorema e Fisherit, e cila thotë se në një kampion nga një shpërndarje normale:

1. e mesme dhe variancën e mostrës s 2 janë sasi të pavarura;

2. raporti i mostrës dhe variancës së popullsisë, shumëzuar me numrin e shkallëve të lirisë, ka një shpërndarje χ 2(chi-katror) me të njëjtin numër shkallësh lirie, d.m.th.

Ku k– numri i shkallëve të lirisë (në anglisht gradat e lirisë (d.f.))

Shumë rezultate të tjera në statistikat e modeleve normale bazohen në këtë ligj.

Le të kthehemi në shpërndarjen e mesatares. Ndani numëruesin dhe emëruesin e shprehjes

σ X̅. marrim

Numëruesi është një ndryshore standarde e rastësishme normale (ne shënojmë ξ (xi)). Le të shprehim emëruesin nga teorema e Fisherit.

Atëherë shprehja origjinale do të marrë formën

Kjo është ajo që është në formën e përgjithshme (Marrëdhënia studentore). Ju mund ta nxirrni funksionin e tij të shpërndarjes drejtpërdrejt, sepse shpërndarjet e të dy variablave të rastit në këtë shprehje janë të njohura. Le t'ua lëmë këtë kënaqësi matematikanëve.

Funksioni i shpërndarjes Student t ka një formulë mjaft të vështirë për t'u kuptuar, kështu që nuk ka kuptim ta analizojmë atë. Askush nuk e përdor gjithsesi, sepse... probabilitetet jepen në tabela të veçanta të shpërndarjeve Studentore (nganjëherë quhen tabela të koeficientëve të Studentit), ose përfshihen në formulat e PC-së.

Pra, të armatosur me këtë njohuri të re, ju mund të kuptoni përkufizimin zyrtar të shpërndarjes Studentore.
Një ndryshore e rastësishme subjekt i shpërndarjes Student me k shkallët e lirisë është raporti i variablave të rastësishëm të pavarur

Ku ξ shpërndahet sipas ligjit standard normal, dhe χ 2 k i bindet shpërndarjes χ 2 c k shkallët e lirisë.

Kështu, formula e testit të Studentit për mesataren aritmetike

Ekziston një rast i veçantë i marrëdhënies studentore

Nga formula dhe përkufizimi rezulton se shpërndarja e testit t Studentit varet vetëm nga numri i shkallëve të lirisë.

k> 30 t-test praktikisht nuk ndryshon nga shpërndarja normale standarde.

Ndryshe nga chi-square, testi t mund të jetë me një ose dy bisht. Zakonisht ata përdorin dy anë, duke supozuar se devijimi mund të ndodhë në të dy drejtimet nga mesatarja. Por nëse gjendja e problemit lejon devijimin vetëm në një drejtim, atëherë është e arsyeshme të përdoret një kriter i njëanshëm. Kjo e rrit pak fuqinë, sepse... në një nivel fiks rëndësie, vlera kritike i afrohet paksa zeros.

Kushtet për përdorimin e testit t Studentit

Pavarësisht nga fakti se zbulimi i Studentit në një kohë revolucionarizoi statistikat, testi t është ende mjaft i kufizuar në mundësitë e tij të aplikimit, sepse vetë vjen nga supozimi i një shpërndarjeje normale të të dhënave origjinale. Nëse të dhënat nuk janë normale (që zakonisht ndodh), atëherë testi t nuk do të ketë më një shpërndarje Student. Megjithatë, për shkak të veprimit të teoremës së kufirit qendror, mesatarja edhe për të dhënat jonormale shpejt fiton një shpërndarje në formë zile.

Konsideroni, për shembull, të dhëna që janë shumë të anuar djathtas, të tilla si një shpërndarje chi-square me 5 gradë lirie.

Tani le të krijojmë 20 mijë mostra dhe të vëzhgojmë se si ndryshon shpërndarja e mesatareve në varësi të vëllimit të tyre.

Dallimi është mjaft i dukshëm në mostrat e vogla deri në 15-20 vëzhgime. Por më pas ajo zhduket shpejt. Kështu, jonormaliteti i shpërndarjes, natyrisht, nuk është i mirë, por jo kritik.

Mbi të gjitha, testi t ka "frikë" nga vlerat e jashtme, d.m.th. devijime jonormale. Le të marrim 20 mijë mostra normale prej 15 vëzhgimesh secila dhe t'i shtojmë disa prej tyre nga një dallim të rastësishëm.

Fotografia rezulton e zymtë. Frekuencat aktuale të mesatareve janë shumë të ndryshme nga ato teorike. Përdorimi i shpërndarjes t në një situatë të tillë bëhet një ndërmarrje shumë e rrezikshme.

Pra, në mostra jo shumë të vogla (nga 15 vëzhgime), testi t është relativisht rezistent ndaj shpërndarjes jo normale të të dhënave origjinale. Por të dhënat e jashtme shtrembërojnë shumë shpërndarjen e testit t, i cili, nga ana tjetër, mund të çojë në gabime në përfundimin statistikor, kështu që vëzhgimet anormale duhet të eliminohen. Shpesh, të gjitha vlerat që bien brenda ± 2 devijimeve standarde nga mesatarja hiqen nga kampioni.

Një shembull i testimit të një hipoteze për pritjet matematikore duke përdorur testin t Student në MS Excel

Excel ka disa funksione që lidhen me shpërndarjen t. Le t'i shikojmë ato.

STUDENT.DIST – “klasike” e majtë e nxënësit-shpërndarja. Hyrja është vlera e kriterit t, numri i shkallëve të lirisë dhe një opsion (0 ose 1) që përcakton se çfarë duhet të llogaritet: dendësia ose vlera e funksionit. Në dalje marrim, përkatësisht, densitetin ose probabilitetin që ndryshorja e rastësishme të jetë më e vogël se kriteri t i specifikuar në argument.

STUDENT.DIST.2X – shpërndarje me dy drejtime. Argumenti është vlera absolute (moduli) i testit t dhe numri i shkallëve të lirisë. Si rezultat, marrim probabilitetin për të marrë të njëjtën vlerë ose edhe më të madhe të kriterit t, d.m.th. niveli aktual i rëndësisë (niveli p).

STUDENT.DIST.PH – t-shpërndarja në anën e djathtë. Pra, 1-STUDENT.DIST(2;5;1) = STUDENT.DIST.PH(2;5) = 0.05097. Nëse testi t është pozitiv, atëherë probabiliteti që rezulton është i nivelit p.

STUDENT.INR – përdoret për të llogaritur inversin me bisht të majtë të shpërndarjes t. Argumenti është probabiliteti dhe numri i shkallëve të lirisë. Në dalje marrim vlerën e kriterit t që korrespondon me këtë probabilitet. Numërimi i probabilitetit është në të majtë. Prandaj, bishti i majtë kërkon vetë nivelin e rëndësisë α , dhe për të drejtën 1 - α .

STUDENT.OBR.2X – vlera e anasjelltë për shpërndarjen Studenti me dy anë, d.m.th. vlera e t-testit (modulo). Niveli i rëndësisë i jepet gjithashtu hyrjes α . Vetëm këtë herë numërimi kryhet nga të dyja anët njëkohësisht, kështu që probabiliteti shpërndahet në dy bishta. Pra, STUDENT.ARV(1-0.025;5) = STUDENT.ARV.2X(0.05;5) = 2.57058

STUDENT.TESTI është një funksion për testimin e hipotezës për barazinë e pritjeve matematikore në dy mostra. Zëvendëson një sërë llogaritjesh, sepse Mjafton të specifikoni vetëm dy vargje me të dhëna dhe disa parametra të tjerë. Prodhimi është i nivelit p.

BESIMI.STUDENT – llogaritja e intervalit të besimit të mesatares duke marrë parasysh shpërndarjen t.

Le të shqyrtojmë këtë shembull trajnimi. Në ndërmarrje çimentoja paketohet në thasë 50 kg. Për shkak të rastësisë, disa devijime nga masa e pritur lejohen në një qese të vetme, por mesatarja e përgjithshme duhet të mbetet 50 kg. Departamenti i kontrollit të cilësisë peshoi rastësisht 9 çanta dhe mori rezultatet e mëposhtme: pesha mesatare ( ) ishte 50,3 kg, devijimi standard ( s) – 0,5 kg.

A është ky rezultat në përputhje me hipotezën zero se mesatarja e përgjithshme është 50 kg? Me fjalë të tjera, a është e mundur të arrihet një rezultat i tillë rastësisht nëse pajisja funksionon siç duhet dhe prodhon një mbushje mesatare prej 50 kg? Nëse hipoteza nuk refuzohet, atëherë diferenca që rezulton përshtatet në gamën e luhatjeve të rastësishme, por nëse hipoteza refuzohet, atëherë ka shumë të ngjarë që të ketë pasur një mosfunksionim në cilësimet e makinës që mbush çantat. Duhet të kontrollohet dhe konfigurohet.

Një kusht i shkurtër në shënimin e pranuar përgjithësisht duket kështu.

H0: μ = 50 kg

H1: μ ≠ 50 kg

Ka arsye për të supozuar se shpërndarja e mbushjeve të qeseve ndjek një shpërndarje normale (ose nuk ndryshon shumë nga ajo). Kjo do të thotë që për të testuar hipotezën për pritshmërinë matematikore, mund të përdorni testin Student t. Devijimet e rastësishme mund të ndodhin në çdo drejtim, që do të thotë se nevojitet një T-test i dyanshëm.

Së pari, ne do të përdorim mjetet paradiluvian: duke llogaritur manualisht kriterin t dhe duke e krahasuar atë me vlerën kritike të tabelës. T-testi i llogaritur:

Tani le të përcaktojmë nëse numri që rezulton e tejkalon nivelin kritik në nivelin e rëndësisë α = 0.05. Le të përdorim tabelën e shpërndarjes së studentit (të disponueshme në çdo libër statistikor).

Kolonat tregojnë probabilitetin e anës së djathtë të shpërndarjes, dhe rreshtat tregojnë numrin e shkallëve të lirisë. Ne jemi të interesuar për një T-test me dy bishta me një nivel rëndësie prej 0,05, i cili është i barabartë me vlerën t për gjysmën e nivelit të rëndësisë në të djathtë: 1 - 0,05/2 = 0,975. Numri i shkallëve të lirisë është madhësia e mostrës minus 1, d.m.th. 9 - 1 = 8. Në kryqëzim gjejmë vlerën e tabelës së testit t - 2.306. Nëse do të përdornim shpërndarjen normale standarde, atëherë pika kritike do të ishte 1.96, por këtu është më e madhe, sepse Shpërndarja-t në mostra të vogla ka një pamje më të rrafshuar.

Le të krahasojmë vlerën aktuale (1.8) dhe tabelën (2.306). Kriteri i llogaritur rezultoi të ishte më i vogël se ai i tabeluar. Rrjedhimisht, të dhënat e disponueshme nuk kundërshtojnë hipotezën H 0 se mesatarja e përgjithshme është 50 kg (por as nuk e vërtetojnë atë). Kjo është gjithçka që mund të mësojmë duke përdorur tabelat. Sigurisht, mund të përpiqeni të gjeni edhe nivelin p, por do të jetë i përafërt. Dhe, si rregull, është niveli p që përdoret për të testuar hipotezat. Prandaj, ne kalojmë në Excel.

Nuk ka asnjë funksion të gatshëm për llogaritjen e testit t në Excel. Por kjo nuk është e frikshme, sepse formula e Studentit t-test është mjaft e thjeshtë dhe mund të ndërtohet lehtësisht pikërisht në një qelizë Excel.

Ne morëm të njëjtën 1.8. Së pari, le të gjejmë vlerën kritike. Marrim alfa 0.05, kriteri është i dyanshëm. Ne kemi nevojë për funksionin e shpërndarjes t inverse për hipotezën e dyanshme STUDENT.OBR.2X.

Vlera që rezulton ndërpret rajonin kritik. T-testi i vëzhguar nuk bie në të, kështu që hipoteza nuk hidhet poshtë.

Megjithatë, kjo është e njëjta mënyrë për të testuar një hipotezë duke përdorur një vlerë tabele. Do të ishte më informative të llogaritet niveli p, d.m.th. probabiliteti i përftimit të devijimit të vërejtur apo edhe më të madh nga mesatarja prej 50 kg, nëse kjo hipotezë është e saktë. Do t'ju duhet funksioni i shpërndarjes Student për hipotezën e dyanshme STUDENT.DIST.2X.

Niveli P është 0.1096, që është më i madh se niveli i pranueshëm i rëndësisë prej 0.05 - ne nuk e hedhim poshtë hipotezën. Por tani mund të gjykojmë shkallën e provës. Niveli P doli të jetë mjaft afër nivelit kur hipoteza hidhet poshtë, dhe kjo çon në mendime të ndryshme. Për shembull, se kampioni ishte shumë i vogël për të zbuluar një devijim të rëndësishëm.

Pas ca kohësh, departamenti i kontrollit vendosi përsëri të kontrollonte se si po ruhej standardi i mbushjes së qeseve. Këtë herë, për një besueshmëri më të madhe, u zgjodhën jo 9, por 25 çanta. Është intuitivisht e qartë se përhapja e mesatares do të ulet, dhe, për rrjedhojë, shanset për të gjetur një dështim në sistem bëhen më të mëdha.

Le të themi se të njëjtat vlera të mesatares dhe devijimit standard për kampionin u morën si herën e parë (50.3 dhe 0.5, respektivisht). Le të llogarisim testin t.


Vlera kritike për 24 gradë lirie dhe α = 0.05 është 2.064. Fotografia më poshtë tregon se testi t bie brenda intervalit të refuzimit të hipotezës.

Mund të konkludojmë se me një probabilitet besimi prej më shumë se 95%, mesatarja e përgjithshme ndryshon nga 50 kg. Për të qenë më bindës, le të shohim nivelin p (rreshti i fundit në tabelë). Probabiliteti për të përftuar një mesatare me të njëjtin devijim ose edhe më të madh nga 50, nëse hipoteza është e saktë, është 0,0062, ose 0,62%, që është praktikisht e pamundur me një matje të vetme. Në përgjithësi, ne e hedhim poshtë hipotezën si të pamundur.

Llogaritja e një intervali të besimit duke përdorur shpërndarjen t të studentit

Një metodë tjetër statistikore është e lidhur ngushtë me testimin e hipotezave - llogaritja e intervaleve të besimit. Nëse intervali që rezulton përmban një vlerë që korrespondon me hipotezën zero, atëherë kjo është ekuivalente me faktin që hipoteza zero nuk refuzohet. Përndryshe, hipoteza refuzohet me nivelin përkatës të besimit. Në disa raste, analistët nuk i testojnë fare hipotezat në formën klasike, por vetëm llogaritin intervalet e besimit. Kjo qasje ju lejon të nxirrni informacione edhe më të dobishme.

Le të llogarisim intervalet e besueshmërisë për mesataren për 9 dhe 25 vëzhgime. Për ta bërë këtë, ne do të përdorim funksionin Excel CONFIDENT.STUDENT. Këtu, çuditërisht, gjithçka është mjaft e thjeshtë. Ju vetëm duhet të specifikoni nivelin e rëndësisë në argumentet e funksionit α , devijimi standard i mostrës dhe madhësia e kampionit. Në dalje marrim gjysmën e gjerësisë së intervalit të besimit, domethënë vlerën që duhet vendosur në të dy anët e mesatares. Pas kryerjes së llogaritjeve dhe vizatimit të një diagrami vizual, marrim sa vijon.

Siç mund ta shihni, me një kampion prej 9 vëzhgimesh, vlera 50 bie brenda intervalit të besimit (hipoteza nuk hidhet poshtë), dhe me 25 vëzhgime nuk bie brenda intervalit të besimit (hipoteza refuzohet). Për më tepër, në një eksperiment me 25 thasë, mund të thuhet se me një probabilitet prej 97.5% mesatarja e përgjithshme kalon 50.1 kg (kufiri i poshtëm i intervalit të besimit është 50.094 kg). Dhe ky është një informacion mjaft i vlefshëm.

Kështu, ne e zgjidhëm të njëjtin problem në tre mënyra:

1. Duke përdorur një qasje të lashtë, duke krahasuar vlerat e llogaritura dhe të tabeluara të testit t
2. Më moderne, duke llogaritur nivelin p, duke shtuar një shkallë besimi kur hedh poshtë hipotezën.
3. Akoma më informuese duke llogaritur intervalin e besimit dhe duke marrë vlerën minimale të mesatares së përgjithshme.

Është e rëndësishme të mbani mend se testi t i referohet metodave parametrike, sepse bazohet në një shpërndarje normale (ka dy parametra: mesatarja dhe varianca). Prandaj, për aplikimin e tij të suksesshëm, të paktën normaliteti i përafërt i të dhënave fillestare dhe mungesa e të dhënave të jashtme janë të rëndësishme.

Më në fund, unë sugjeroj të shikoni një video se si të kryeni llogaritjet në lidhje me testin Student t në Excel.

Gjatë gjithë shembullit, ne do të përdorim informacion fiktive në mënyrë që lexuesi të mund të bëjë vetë transformimet e nevojshme.

Pra, le të themi, gjatë hulumtimit, ne studiuam efektin e ilaçit A në përmbajtjen e substancës B (në mmol / g) në indin C dhe përqendrimin e substancës D në gjak (në mmol / l) te pacientët. ndahet sipas disa kritereve E në 3 grupe me vëllim të barabartë (n = 10). Rezultatet e një studimi të tillë fiktiv tregohen në tabelë:

Përmbajtja e substancës B, mmol/g

Substanca D, mmol/l

rritja e përqendrimit


Ne dëshirojmë t'ju paralajmërojmë se ne konsiderojmë mostrat e madhësisë 10 për lehtësinë e paraqitjes së të dhënave dhe llogaritjeve në praktikë, një madhësi e tillë e mostrës zakonisht nuk është e mjaftueshme për të formuar një përfundim statistikor.

Si shembull, merrni parasysh të dhënat në kolonën e parë të tabelës.

Statistika përshkruese

Mesatarja e mostrës

Mesatarja aritmetike, shpesh e quajtur thjesht "mesatarja", merret duke shtuar të gjitha vlerat dhe duke e pjesëtuar atë shumë me numrin e vlerave në grup. Kjo mund të tregohet duke përdorur një formulë algjebrike. Një grup prej n vëzhgimesh të një ndryshoreje x mund të përfaqësohet si x 1 , x 2 , x 3 , ..., x n

Formula për përcaktimin e mesatares aritmetike të vëzhgimeve (shqiptohet "X me një vijë"):

= (X 1 + X 2 + ... + X n) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Varianca e mostrës

Një mënyrë për të matur shpërndarjen e të dhënave është përcaktimi i shkallës në të cilën çdo vëzhgim devijon nga mesatarja aritmetike. Natyrisht, sa më i madh të jetë devijimi, aq më i madh është ndryshueshmëria, ndryshueshmëria e vëzhgimeve. Megjithatë, ne nuk mund të përdorim mesataren e këtyre devijimeve si masë e dispersionit, sepse devijimet pozitive kompensojnë devijimet negative (shuma e tyre është zero). Për të zgjidhur këtë problem, ne katrore çdo devijim dhe gjejmë mesataren e devijimeve në katror; kjo sasi quhet variacion, ose dispersion. Le të marrim n vëzhgime x 1, x 2, x 3, ..., x n, mesatare e cila është e barabartë me. Llogaritja e variancës kjo, zakonisht e referuar sis2,këto vëzhgime:

Varianca e mostrës së këtij treguesi është s 2 = 3.2.

Devijimi standard

Devijimi standard (katrori mesatar) është rrënja katrore pozitive e variancës. Duke përdorur n vëzhgime si shembull, duket kështu:

Mund të mendojmë për devijimin standard si një lloj devijimi mesatar të vëzhgimeve nga mesatarja. Ajo llogaritet në të njëjtat njësi (dimensione) si të dhënat origjinale.

s = sqrt (s 2) = sqrt (3,2) = 1,79.

Koeficienti i variacionit

Nëse e ndani devijimin standard me mesataren aritmetike dhe e shprehni rezultatin në përqindje, merrni koeficientin e variacionit.

CV = (1.79 / 13.1) * 100% = 13.7

Shembull i gabimit mesatar

1,79/sqrt(10) = 0,57;

Koeficienti t i studentit (t-test me një kampion)

Përdoret për të testuar hipotezën në lidhje me ndryshimin midis vlerës mesatare dhe disa vlerës së njohur m

Numri i shkallëve të lirisë llogaritet si f=n-1.

Në këtë rast, intervali i besimit për mesataren është midis kufijve 11.87 dhe 14.39.

Për nivelin 95% të besimit m=11.87 ose m=14.39, pra = |13.1-11.82| = |13.1-14.38| = 1,28

Prandaj, në këtë rast, për numrin e shkallëve të lirisë f = 10 - 1 = 9 dhe nivelin e besimit 95% t = 2,26.

Statistikat dhe tabelat bazë të dialogut

Në modul Statistikat dhe tabelat bazë le të zgjedhim Statistika përshkruese.

Do të hapet një kuti dialogu Statistika përshkruese.

Në fushë Variablat le të zgjedhim Grupi 1.

Shtypja Ne rregull, marrim tabela të rezultateve me statistika përshkruese të variablave të përzgjedhur.

Do të hapet një kuti dialogu T-test me një mostër.

Supozoni se dimë se përmbajtja mesatare e substancës B në indin C është 11.

Tabela e rezultateve me statistika përshkruese dhe T-test Student është si më poshtë:

Ne duhej të refuzonim hipotezën se përmbajtja mesatare e substancës B në indin C është 11.

Meqenëse vlera e llogaritur e kriterit është më e madhe se vlera e tabelës (2.26), hipoteza zero hidhet poshtë në nivelin e përzgjedhur të rëndësisë dhe diferencat midis mostrës dhe vlerës së njohur konsiderohen statistikisht të rëndësishme. Kështu, konkluzioni për ekzistencën e dallimeve të bëra duke përdorur testin t Student konfirmohet duke përdorur këtë metodë.

Një qasje ekuivalente për interpretimin e rezultateve të testit do të ishte supozimi se hipoteza zero është e vërtetë, ne mund të llogarisim se sa e madhe probabiliteti marr t- një kriter i barabartë ose më i madh se vlera reale që kemi llogaritur nga të dhënat e mostrës në dispozicion. Nëse ky probabilitet rezulton të jetë më i vogël se niveli i rëndësisë i pranuar më parë (për shembull, P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Supozoni se kemi të dhëna për marrjen ditore të energjisë nga ushqimi (kJ/ditë) për 11 gra (shembulli i marrë nga libri Altman D. G. (1981) Statistikat Praktike për Kërkime Mjekësore, Chapman & Hall, Londër):


Mesatarja për këto 11 vëzhgime është:


Pyetje: A është kjo mesatare e mostrës e ndryshme nga norma e vendosur prej 7725 kJ/ditë? Dallimi midis vlerës së kampionit tonë dhe këtij standardi është mjaft domethënës: 7725 - 6753.6 = 971.4. Por sa i madh është ky ndryshim statistikisht? Një mostër e vetme do të ndihmojë në përgjigjen e kësaj pyetjeje. t-test. Ashtu si opsionet e tjera t-test, një test t një kampioni kryhet në R duke përdorur funksionin t.test():


Pyetje: A janë këto mesatare statistikisht të ndryshme? Le të kontrollojmë hipotezën se nuk ka dallim duke përdorur t-test:

Por në raste të tilla, si mund ta vlerësojmë statistikisht praninë e një efekti nga një ndërhyrje? Në përgjithësi, testi i Studentit mund të përfaqësohet si

Një qasje ekuivalente për interpretimin e rezultateve të testit do të ishte supozimi se hipoteza zero është e vërtetë, ne mund të llogarisim se sa e madhe probabiliteti marr t- një kriter i barabartë ose më i madh se vlera reale që kemi llogaritur nga të dhënat e mostrës në dispozicion. Nëse ky probabilitet rezulton të jetë më i vogël se niveli i rëndësisë i pranuar më parë (për shembull, P< 0.05), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Supozoni se kemi të dhëna për marrjen ditore të energjisë nga ushqimi (kJ/ditë) për 11 gra (shembulli i marrë nga libri Altman D. G. (1981) Statistikat Praktike për Kërkime Mjekësore, Chapman & Hall, Londër):


Mesatarja për këto 11 vëzhgime është:


Pyetje: A është kjo mesatare e mostrës e ndryshme nga norma e vendosur prej 7725 kJ/ditë? Dallimi midis vlerës së kampionit tonë dhe këtij standardi është mjaft domethënës: 7725 - 6753.6 = 971.4. Por sa i madh është ky ndryshim statistikisht? Një mostër e vetme do të ndihmojë në përgjigjen e kësaj pyetjeje. t-test. Ashtu si opsionet e tjera t-test, një test t një kampioni kryhet në R duke përdorur funksionin t.test():


Pyetje: A janë këto mesatare statistikisht të ndryshme? Le të kontrollojmë hipotezën se nuk ka dallim duke përdorur t-test:

Por në raste të tilla, si mund ta vlerësojmë statistikisht praninë e një efekti nga një ndërhyrje? Në përgjithësi, testi i Studentit mund të përfaqësohet si

​Testi i Studentit në çift është një nga modifikimet e metodës Studenti, i përdorur për të përcaktuar rëndësinë statistikore të dallimeve në matjet e çiftuara (të përsëritura).

1. Historia e zhvillimit të testit t

u zhvillua t-testi William Gossett për të vlerësuar cilësinë e birrës në kompaninë Guinness. Për shkak të detyrimeve ndaj kompanisë në lidhje me moszbulimin e sekreteve tregtare, artikulli i Gosset u botua në vitin 1908 në revistën Biometrics me pseudonimin "Studenti".

2. Për çfarë përdoret T-testi i Studentit në çift?

Për krahasim përdoret testi i t-studentit i çiftëzuar dy mostra të varura (të çiftuara).. Të varura janë matjet e marra në të njëjtët pacientë, por në kohë të ndryshme, për shembull, presioni i gjakut në pacientët me hipertension para dhe pas duke marrë një ilaç antihipertensiv. Hipoteza zero thotë se nuk ka dallime midis mostrave që krahasohen, hipoteza alternative thotë se ka dallime të rëndësishme statistikisht.

3. Në cilat raste mund të përdorni T-testin në çift të Studentit?

Kushti kryesor është varësia e mostrës, domethënë, vlerat e krahasuara duhet të merren nga matjet e përsëritura të një parametri.

Ashtu si në rastin e krahasimeve të mostrave të pavarura, për të përdorur një t-test të çiftuar është e nevojshme që të dhënat origjinale të kenë shpërndarje normale. Nëse ky kusht nuk plotësohet, duhet të përdoren metoda për të krahasuar mesataret e mostrës statistika joparametrike, si p.sh Testi i shenjës G Dhe Wilcoxon T-test.

T-testi i çiftëzuar mund të përdoret vetëm kur krahasohet dy mostrat. Nëse keni nevojë të krahasoni tre ose më shumë duhen përdorur matje të përsëritura ANOVA njëkahëshe për masat e përsëritura.

4. Si të llogaritet testi i studentit në çift?

T-testi i Studentit në çift llogaritet duke përdorur formulën e mëposhtme:

Ku M d - mesatarja aritmetike e diferencave ndërmjet treguesve të matur para dhe pas, σ d - devijimi standard i dallimeve në tregues, n - numri i lëndëve të studiuara.

5. Si të interpretohet vlera e testit t Studentit?

Interpretimi i vlerës së testit t Student të çiftëzuar që rezulton nuk ndryshon nga vlerësimi i testit t për popullatat e palidhura. Para së gjithash, ju duhet të gjeni numrin e shkallëve të lirisë f sipas formulës së mëposhtme:

f = n - 1

Pas kësaj, ne përcaktojmë vlerën kritike të testit t Studentit për nivelin e kërkuar të rëndësisë (për shembull, p<0,05) и при данном числе степеней свободы f sipas tabelës ( Shikoni më poshtë).

Krahasojmë vlerat kritike dhe të llogaritura të kriterit:

  • Nëse vlera e llogaritur e testit t Studentit të çiftuar e barabartë ose më e madhe kritike, të gjetura nga tabela, arrijmë në përfundimin se diferencat midis vlerave të krahasuara janë statistikisht të rëndësishme.
  • Nëse vlera e t-testit të Studentit të çiftëzuar të llogaritur më pak tabelare, që do të thotë se diferencat midis vlerave të krahasuara nuk janë statistikisht të rëndësishme.

6. Shembull i llogaritjes së T-testit të Studentit

Për të vlerësuar efektivitetin e agjentit të ri hipoglikemik, u matën nivelet e glukozës në gjak në pacientët me diabet mellitus para dhe pas marrjes së ilaçit. Si rezultat, u morën të dhënat e mëposhtme:

Zgjidhja:

1. Llogaritni diferencën e çdo çifti vlerash ( d):

Pacienti N Niveli i glukozës në gjak, mmol/l Diferenca (d)
para marrjes së barit pas marrjes së barit
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. Gjeni mesataren aritmetike të diferencave duke përdorur formulën:

3. Gjeni devijimin standard të diferencave nga mesatarja duke përdorur formulën:

4. Llogaritni T-testin e Studentit në çift:

5. Le të krahasojmë vlerën e fituar të Studentit t-test 8.6 me vlerën e tabelës, e cila, me numrin e shkallëve të lirisë. f e barabartë me 10 - 1 = 9 dhe niveli i rëndësisë p=0.05 është 2.262. Duke qenë se vlera e fituar është më e madhe se vlera kritike, konkludojmë se ka dallime statistikisht të rëndësishme në nivelet e glukozës në gjak para dhe pas marrjes së barit të ri.



Ju pëlqeu artikulli? Ndani me miqtë tuaj!