Statistinio patikimumo samprata. Statistinio reikšmingumo sampratos ir statistinis kriterijus

Statistikos reikšmingumo lygis yra svarbus rodiklis, atspindintis pasitikėjimo gautų (numatytų) duomenų tikslumu ir tikrumu laipsnį. Sąvoka plačiai naudojama įvairiose srityse: nuo sociologinių tyrimų atlikimo iki statistinio mokslinių hipotezių tikrinimo.

Apibrėžimas

Statistinio reikšmingumo lygis (arba statistiškai reikšmingas rezultatas) parodo tirtų rodiklių atsitiktinio atsiradimo tikimybę. Bendras statistinis reiškinio reikšmingumas išreiškiamas p reikšmės koeficientu (p lygiu). Atliekant bet kokį eksperimentą ar stebėjimą, yra tikimybė, kad gauti duomenys buvo gauti dėl atrankos klaidų. Tai ypač pasakytina apie sociologiją.

Tai yra, statistiškai reikšminga reikšmė yra reikšmė, kurios atsitiktinio pasireiškimo tikimybė yra labai maža arba linkusi į kraštutinumą. Šiame kontekste kraštutinumu laikomas laipsnis, kuriuo statistika nukrypsta nuo nulinės hipotezės (hipotezė, kuri tikrinama, ar jos atitinka gautus imties duomenis). Mokslinėje praktikoje reikšmingumo lygis parenkamas prieš renkant duomenis ir, kaip taisyklė, jo koeficientas yra 0,05 (5%). Sistemoms, kuriose tikslios reikšmės yra labai svarbios, šis skaičius gali būti 0,01 (1%) arba mažesnis.

Fonas

Reikšmingumo lygio sąvoką 1925 m. įvedė britų statistikas ir genetikas Ronaldas Fisheris, kurdamas statistinių hipotezių tikrinimo techniką. Analizuojant bet kokį procesą, yra tam tikra tam tikrų reiškinių tikimybė. Sunkumai kyla dirbant su mažomis (arba neaiškiomis) tikimybės procentais, kurios patenka į „matavimo paklaidos“ sąvoką.

Dirbdami su statistiniais duomenimis, kurie nėra pakankamai konkretūs jiems patikrinti, mokslininkai susiduria su nulinės hipotezės problema, kuri „neleidžia“ veikti mažais kiekiais. Fisheris pasiūlė tokioms sistemoms nustatyti įvykių tikimybę esant 5% (0,05), kaip patogų atrankos pjūvį, leidžiantį atmesti nulinę hipotezę skaičiavimuose.

Fiksuotų koeficientų įvedimas

1933 m. mokslininkai Jerzy Neumannas ir Egonas Pearsonas savo darbuose rekomendavo iš anksto (prieš renkant duomenis) nustatyti tam tikrą reikšmingumo lygį. Šių taisyklių naudojimo pavyzdžiai aiškiai matomi per rinkimus. Tarkime, yra du kandidatai, kurių vienas yra labai populiarus, o kitas mažai žinomas. Akivaizdu, kad pirmasis kandidatas laimės rinkimus, o antrojo šansai linkę nuliui. Jie stengiasi – bet nėra lygūs: visada yra force majeure, sensacingos informacijos, netikėtų sprendimų, galinčių pakeisti prognozuojamus rinkimų rezultatus, galimybė.

Neymanas ir Pearsonas sutiko, kad Fišerio reikšmingumo lygis 0,05 (žymimas α) yra tinkamiausias. Tačiau pats Fischeris 1956 m. nepritarė šios vertės fiksavimui. Jis manė, kad α lygis turėtų būti nustatytas atsižvelgiant į konkrečias aplinkybes. Pavyzdžiui, dalelių fizikoje jis yra 0,01.

p lygio reikšmė

Terminą p vertė pirmą kartą panaudojo Brownlee 1960 m. P lygis (p vertė) yra rodiklis, kuris yra atvirkščiai susijęs su rezultatų tikrumu. Didžiausias p vertės koeficientas atitinka mažiausią patikimumo lygį atrinktų kintamųjų santykio atžvilgiu.

Ši vertė atspindi klaidų, susijusių su rezultatų interpretavimu, tikimybę. Tarkime, p lygis = 0,05 (1/20). Tai rodo penkių procentų tikimybę, kad ryšys tarp imtyje rastų kintamųjų yra tik atsitiktinė imties ypatybė. Tai yra, jei šios priklausomybės nėra, tada pakartotinai atliekant panašius eksperimentus, vidutiniškai kas dvidešimtame tyrime galima tikėtis tokios pat arba didesnės priklausomybės tarp kintamųjų. P lygis dažnai laikomas klaidų lygio „marža“.

Beje, p reikšmė gali neatspindėti tikrojo kintamųjų ryšio, o tik parodo tam tikrą vidutinę reikšmę prielaidų ribose. Visų pirma galutinė duomenų analizė taip pat priklausys nuo pasirinktų šio koeficiento verčių. Esant p lygiui = 0,05, bus gauti tam tikri rezultatai, o esant koeficientui, lygiam 0,01, bus skirtingi rezultatai.

Statistinių hipotezių tikrinimas

Statistinio reikšmingumo lygis ypač svarbus tikrinant hipotezes. Pavyzdžiui, skaičiuojant dvipusį testą, atmetimo sritis padalijama po lygiai abiejuose atrankos skirstinio galuose (nulinės koordinatės atžvilgiu) ir apskaičiuojama gautų duomenų teisingumas.

Tarkime, stebint tam tikrą procesą (reiškinį), paaiškėja, kad nauja statistinė informacija rodo nedidelius pokyčius, palyginti su ankstesnėmis reikšmėmis. Tuo pačiu metu rezultatų neatitikimai yra nedideli, nėra akivaizdūs, tačiau svarbūs tyrimui. Specialistas susiduria su dilema: ar tikrai pokyčiai vyksta, ar tai yra atrankos klaidos (matavimo netikslumas)?

Tokiu atveju jie naudoja arba atmeta nulinę hipotezę (viską priskiria klaidai arba sistemos pasikeitimą pripažįsta fait accompli). Problemos sprendimo procesas grindžiamas bendro statistinio reikšmingumo (p reikšmė) ir reikšmingumo lygio (α) santykiu. Jei p lygio< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Naudojamos vertės

Reikšmingumo lygis priklauso nuo analizuojamos medžiagos. Praktiškai naudojamos šios fiksuotos vertės:

  • α = 0,1 (arba 10%);
  • α = 0,05 (arba 5%);
  • α = 0,01 (arba 1%);
  • α = 0,001 (arba 0,1 %).

Kuo tikslesni skaičiavimai reikalingi, tuo mažesnis α koeficientas. Natūralu, kad statistinės prognozės fizikos, chemijos, farmacijos ir genetikos srityse reikalauja didesnio tikslumo nei politikos mokslų ir sociologijos srityse.

Reikšmingumo slenksčiai konkrečiose srityse

Didelio tikslumo srityse, tokiose kaip dalelių fizika ir gamyba, statistinis reikšmingumas dažnai išreiškiamas standartinio nuokrypio (žymimo sigmos koeficientu – σ) santykiu, palyginti su normaliu tikimybių pasiskirstymu (Gauso skirstiniu). σ yra statistinis rodiklis, nustatantis tam tikro dydžio reikšmių sklaidą, palyginti su matematiniais lūkesčiais. Naudojamas įvykių tikimybei nubraižyti.

Priklausomai nuo žinių srities, koeficientas σ labai skiriasi. Pavyzdžiui, prognozuojant Higso bozono egzistavimą, parametras σ yra lygus penkiems (σ = 5), o tai atitinka p reikšmę = 1/3,5 mln. Genomo tyrimuose reikšmingumo lygis gali būti 5 × 10 -. 8, kas nėra neįprasta šiose srityse.

Efektyvumas

Reikia atsižvelgti į tai, kad koeficientai α ir p reikšmė nėra tikslios charakteristikos. Kad ir koks būtų reikšmingumo lygis tiriamo reiškinio statistikoje, tai nėra besąlyginis pagrindas hipotezei priimti. Pavyzdžiui, kuo mažesnė α reikšmė, tuo didesnė tikimybė, kad hipotezė bus reikšminga. Tačiau yra klaidų rizika, dėl kurios sumažėja tyrimo statistinė galia (reikšmingumas).

Tyrėjai, kurie sutelkia dėmesį tik į statistiškai reikšmingus rezultatus, gali padaryti klaidingas išvadas. Tuo pačiu metu sunku dar kartą patikrinti jų darbą, nes jie taiko prielaidas (kurios iš tikrųjų yra α ir p reikšmės). Todėl visada rekomenduojama kartu su statistinio reikšmingumo skaičiavimu nustatyti ir kitą rodiklį – statistinio efekto dydį. Poveikio dydis yra kiekybinis poveikio stiprumo matas.

MOKAMA FUNKCIJA. Statistinio reikšmingumo funkcija pasiekiama tik tam tikruose planuose. Patikrinkite, ar jis yra.

Galite sužinoti, ar statistiškai reikšmingai skiriasi skirtingų respondentų grupių atsakymai į apklausos klausimus. Norėdami naudoti statistinio reikšmingumo funkciją SurveyMonkey, turite:

  • Įgalinkite statistinio reikšmingumo funkciją, kai įtraukite palyginimo taisyklę prie klausimo savo apklausoje. Pasirinkite respondentų grupes, kurias norite palyginti, kad surūšiuotumėte apklausos rezultatus į grupes vizualiniam palyginimui.
  • Išnagrinėkite apklausos klausimų duomenų lenteles, kad nustatytumėte statistiškai reikšmingus atsakymų, gautų iš skirtingų respondentų grupių, skirtumus.

Žiūrėti statistinį reikšmingumą

Atlikdami toliau nurodytus veiksmus, galite sukurti apklausą, kurioje būtų rodomas statistinis reikšmingumas.

1. Į savo apklausą įtraukite uždarojo tipo klausimus

Kad analizuojant rezultatus būtų rodomas statistinis reikšmingumas, bet kuriam apklausos klausimui reikės taikyti palyginimo taisyklę.

Galite taikyti palyginimo taisyklę ir apskaičiuoti atsakymų statistinį reikšmingumą, jei apklausoje naudojate vieną iš šių klausimų tipų:

Būtina įsitikinti, kad siūlomus atsakymų variantus galima suskirstyti į pilnas grupes. Atsakymų parinktys, kurias pasirenkate palyginimui kurdami palyginimo taisyklę, bus naudojamos duomenims suskirstyti į kryžminius skirtukus visoje apklausoje.

2. Surinkite atsakymus

Užpildę apklausą, sukurkite rinkėją, kuri ją išsiųs. Yra keletas būdų.

Turite gauti bent 30 atsakymų už kiekvieną atsakymo parinktį, kurią planuojate naudoti palyginimo taisyklėje, kad suaktyvintumėte ir peržiūrėtumėte statistinį reikšmingumą.

Apklausos pavyzdys

Norite sužinoti, ar vyrai yra daug labiau patenkinti jūsų gaminiais nei moterys.

  1. Pridėkite du klausimus su keliais atsakymų variantais į savo apklausą:
    Kokia tavo lytis? (vyras, moteris)
    Ar esate patenkinti ar nepatenkinti mūsų produktu? (patenkintas, nepatenkintas)
  2. Įsitikinkite, kad bent 30 respondentų lyties klausimu pasirinktų „vyrą“, IR mažiausiai 30 respondentų pasirinktų „moterį“ kaip savo lytį.
  3. Pridėkite palyginimo taisyklę prie klausimo "Kokia jūsų lytis?" ir pasirinkite abi atsakymų parinktis kaip savo grupes.
  4. Naudokite duomenų lentelę po klausimų lentele „Ar esate patenkinti ar nepatenkinti mūsų produktu? kad pamatytumėte, ar kurios nors atsakymo parinktys rodo statistiškai reikšmingą skirtumą

Koks yra statistiškai reikšmingas skirtumas?

Statistiškai reikšmingas skirtumas reiškia, kad atliekant statistinę analizę nustatyta, kad yra reikšmingų skirtumų tarp vienos respondentų grupės ir kitos grupės atsakymų. Statistinis reikšmingumas reiškia, kad gauti skaičiai gerokai skiriasi. Tokios žinios jums labai padės analizuojant duomenis. Tačiau jūs nustatote gautų rezultatų svarbą. Jūs nusprendžiate, kaip interpretuoti apklausos rezultatus ir kokių veiksmų pagal juos imtis.

Pavyzdžiui, sulaukiate daugiau skundų iš klientų nei iš vyrų. Kaip galime nustatyti, ar toks skirtumas yra tikras ir ar dėl jo reikia imtis veiksmų? Vienas puikus būdas patikrinti savo pastebėjimus – atlikti apklausą, kuri parodys, ar vyrai klientai yra žymiai labiau patenkinti jūsų produktu. Naudodami statistinę formulę, mūsų statistinio reikšmingumo funkcija suteiks jums galimybę nustatyti, ar jūsų produktas iš tikrųjų yra daug patrauklesnis vyrams nei moterims. Tai leis jums imtis veiksmų remiantis faktais, o ne spėlionėmis.

Statistiškai reikšmingas skirtumas

Jei jūsų rezultatai yra pažymėti duomenų lentelėje, tai reiškia, kad šios dvi respondentų grupės labai skiriasi viena nuo kitos. Sąvoka „reikšminga“ nereiškia, kad gauti skaičiai turi kokios nors ypatingos svarbos ar reikšmingumo, tik tai, kad tarp jų yra statistinis skirtumas.

Nėra statistiškai reikšmingo skirtumo

Jei jūsų rezultatai nėra paryškinti atitinkamoje duomenų lentelėje, tai reiškia, kad nors du lyginami skaičiai gali skirtis, statistinio skirtumo tarp jų nėra.

Atsakymai be statistiškai reikšmingų skirtumų rodo, kad tarp dviejų lyginamų elementų nėra reikšmingo skirtumo, atsižvelgiant į jūsų naudojamą imties dydį, tačiau tai nebūtinai reiškia, kad jie nėra reikšmingi. Galbūt padidinę imties dydį galėsite nustatyti statistiškai reikšmingą skirtumą.

Mėginio dydis

Jei imties dydis labai mažas, reikšmingi bus tik labai dideli skirtumai tarp dviejų grupių. Jei imties dydis labai didelis, tiek maži, tiek dideli skirtumai bus laikomi reikšmingais.

Tačiau jei du skaičiai statistiškai skiriasi, tai nereiškia, kad skirtumas tarp rezultatų jums turi kokią nors praktinę reikšmę. Turėsite patys nuspręsti, kurie skirtumai yra reikšmingi jūsų apklausai.

Statistinio reikšmingumo apskaičiavimas

Statistinį reikšmingumą apskaičiuojame naudodami standartinį 95 % pasikliovimo lygį. Jei atsakymo parinktis rodoma kaip statistiškai reikšminga, tai reiškia, kad vien dėl atsitiktinumo arba dėl atrankos klaidos yra mažesnė nei 5% tikimybė, kad skirtumas tarp dviejų grupių atsiras (dažnai rodomas kaip: p<0,05).

Norėdami apskaičiuoti statistiškai reikšmingus skirtumus tarp grupių, naudojame šias formules:

Parametras

Aprašymas

a1Pirmosios grupės dalyvių, kurie tam tikru būdu atsakė į klausimą, procentas, padaugintas iš šios grupės imties dydžio.
b1Dalyvių iš antrosios grupės, atsakiusių į klausimą tam tikru būdu, procentas, padaugintas iš šios grupės imties dydžio.
Sujungti imties proporcija (p)Dviejų akcijų iš abiejų grupių derinys.
Standartinė klaida (SE)Rodiklis, nurodantis, kiek jūsų dalis skiriasi nuo faktinės dalies. Mažesnė reikšmė reiškia, kad trupmena yra artima faktinei trupmenai, didesnė reikšmė reiškia, kad trupmena labai skiriasi nuo tikrosios trupmenos.
Bandymo statistika (t)Testo statistika. Standartinių nuokrypių, kuriais tam tikra vertė skiriasi nuo vidurkio, skaičius.
Statistinis reikšmingumasJei testo statistikos absoliuti reikšmė yra didesnė nei 1,96* standartiniai nuokrypiai nuo vidurkio, tai laikoma statistiškai reikšmingu skirtumu.

*1,96 yra vertė, naudojama 95 % pasikliovimo lygiui, nes 95 % diapazono, kurį apdoroja Stjudento t pasiskirstymo funkcija, yra 1,96 standartinio nuokrypio nuo vidurkio ribose.

Skaičiavimo pavyzdys

Tęsdami aukščiau pateiktą pavyzdį, išsiaiškinkime, ar vyrų, kurie teigia, kad yra patenkinti jūsų produktu, procentas yra žymiai didesnis nei moterų.

Tarkime, jūsų apklausoje dalyvavo 1 000 vyrų ir 1 000 moterų, o apklausos rezultatai parodė, kad 70 % vyrų ir 65 % moterų teigia, kad yra patenkinti jūsų produktu. Ar 70 % lygis yra žymiai didesnis nei 65 % lygis?

Pateiktose formulėse pakeiskite šiuos apklausos duomenis:

  • p1 (proc. vyrų, patenkintų produktu) = 0,7
  • p2 (produktu patenkintų moterų proc.) = 0,65
  • n1 (tyrusių vyrų skaičius) = 1000
  • n2 (apklaustų moterų skaičius) = 1000

Kadangi absoliuti testo statistikos reikšmė yra didesnė nei 1,96, tai reiškia, kad skirtumas tarp vyrų ir moterų yra reikšmingas. Palyginti su moterimis, vyrai yra labiau patenkinti jūsų produktu.

Slėpti statistinį reikšmingumą

Kaip paslėpti statistinį reikšmingumą visiems klausimams

  1. Spustelėkite rodyklę žemyn, esančią palyginimo taisyklės dešinėje kairėje šoninėje juostoje.
  2. Pasirinkite elementą Redaguoti taisyklę.
  3. Išjungti funkciją Rodyti statistinį reikšmingumą naudojant jungiklį.
  4. Spustelėkite mygtuką Taikyti.

Norėdami paslėpti vieno klausimo statistinį reikšmingumą, turite:

  1. Spustelėkite mygtuką Melodija virš šios problemos diagramos.
  2. Atidarykite skirtuką Ekrano parinktys.
  3. Atžymėkite laukelį šalia Statistinis reikšmingumas.
  4. Spustelėkite mygtuką Išsaugoti.

Rodymo parinktis įjungiama automatiškai, kai įjungtas statistinės reikšmės rodymas. Jei išvalysite šią rodymo parinktį, statistinio reikšmingumo rodymas taip pat bus išjungtas.

Pridėdami palyginimo taisyklę prie klausimo apklausoje, įjunkite statistinio reikšmingumo funkciją. Išnagrinėkite savo apklausos klausimų duomenų lenteles, kad nustatytumėte, ar yra statistiškai reikšmingų skirtingų respondentų grupių atsakymų skirtumų.

Kaip manote, kuo jūsų „antra pusė“ yra ypatinga ir prasminga? Ar tai susiję su jos asmenybe, ar su jūsų jausmais šiam žmogui? O gal su tuo paprastu faktu, kad hipotezė apie jūsų simpatijos atsitiktinumą, kaip rodo tyrimai, yra mažesnė nei 5% tikimybė? Jei laikytume paskutinį teiginį patikimu, sėkmingų pažinčių svetainių iš esmės nebūtų:

Kai atliekate padalintą testavimą ar bet kokią kitą savo svetainės analizę, klaidingai supratus „statistinę reikšmę“, rezultatai gali būti neteisingai interpretuojami ir dėl to gali būti atliekami neteisingi veiksmai konversijos optimizavimo procese. Tai pasakytina apie tūkstančius kitų statistinių testų, kasdien atliekamų kiekvienoje esamoje pramonės šakoje.

Norėdami suprasti, kas yra „statistinė reikšmė“, turite pasinerti į termino istoriją, sužinoti tikrąją jo reikšmę ir suprasti, kaip šis „naujas“ senas supratimas padės teisingai interpretuoti tyrimo rezultatus.

Šiek tiek istorijos

Nors žmonija statistiką naudojo įvairioms problemoms spręsti daugelį amžių, šiuolaikinis statistinės reikšmės supratimas, hipotezių tikrinimas, atsitiktinės atrankos ir net eksperimentų planavimas (DOE) pradėjo formuotis tik XX amžiaus pradžioje ir yra neatsiejamai susijęs su sero Ronaldo Fišerio (Sir Ronald Fisher, 1890–1962) vardas:

Ronaldas Fišeris buvo evoliucijos biologas ir statistikas, kuriam buvo ypatinga aistra tyrinėti evoliuciją ir natūralią atranką gyvūnų ir augalų karalystėse. Per savo puikią karjerą jis sukūrė ir išpopuliarino daug naudingų statistikos priemonių, kurias naudojame ir šiandien.

Fisheris naudojo savo sukurtus metodus, kad paaiškintų tokius biologijos procesus kaip dominavimas, mutacijos ir genetiniai nukrypimai. Tais pačiais įrankiais galime ir šiandien optimizuoti ir tobulinti žiniatinklio išteklių turinį. Tai, kad šiais analizės įrankiais galima dirbti su objektais, kurių kūrimo metu net nebuvo, atrodo gana stebina. Taip pat stebina tai, kad žmonės sudėtingus skaičiavimus atlikdavo be skaičiuotuvų ar kompiuterių.

Norėdamas apibūdinti statistinio eksperimento rezultatus kaip turinčius didelę tikimybę, kad jie yra teisingi, Fisheris pavartojo žodį „reikšmingumas“.

Be to, vieną įdomiausių Fisherio įvykių galima pavadinti „seksualaus sūnaus“ hipoteze. Remiantis šia teorija, moterys teikia pirmenybę seksualiai pasileidusiems vyrams (promiscuous), nes tai leis iš šių vyrų gimusiems sūnums turėti tokį patį polinkį ir susilaukti daugiau palikuonių (atkreipkite dėmesį, kad tai tik teorija).

Tačiau niekas, net ir puikūs mokslininkai, nėra apsaugotas nuo klaidų. Fišerio trūkumai specialistus kamuoja iki šiol. Tačiau atsiminkite Alberto Einšteino žodžius: „Kas niekada nepadarė klaidos, niekada nieko naujo nesukūrė“.

Prieš pereidami prie kito punkto, atminkite: statistinis reikšmingumas yra tada, kai testo rezultatų skirtumas yra toks didelis, kad skirtumo negalima paaiškinti atsitiktiniais veiksniais.

Kokia tavo hipotezė?

Norėdami suprasti, ką reiškia „statistinė reikšmė“, pirmiausia turite suprasti, kas yra „hipotezių tikrinimas“, nes šie du terminai yra glaudžiai susiję.
Hipotezė yra tik teorija. Sukūrę teoriją, turėsite nustatyti pakankamai įrodymų rinkimo ir faktinio tų įrodymų rinkimo procesą. Yra dviejų tipų hipotezės.

Obuoliai ar apelsinai – kas geriau?

Nulinė hipotezė

Paprastai čia daugelis žmonių patiria sunkumų. Reikėtų nepamiršti, kad nulinė hipotezė nėra kažkas, ką reikia įrodyti, pavyzdžiui, jūs įrodote, kad tam tikras pakeitimas svetainėje padidins konversijų skaičių, bet atvirkščiai. Nulinė hipotezė yra teorija, teigianti, kad jei svetainėje atliksite kokių nors pakeitimų, nieko neatsitiks. O mokslininko tikslas yra paneigti šią teoriją, o ne įrodyti.

Jei pažvelgtume į nusikaltimų išaiškinimo patirtį, kai tyrėjai taip pat kelia hipotezes, kas yra nusikaltėlis, nulinė hipotezė įgauna vadinamosios nekaltumo prezumpcijos formą – koncepciją, pagal kurią kaltinamasis laikomas nekaltu, kol jo kaltumas neįrodytas. teisme.

Jei nulinė hipotezė yra ta, kad du objektai yra vienodi savo savybėmis, o jūs bandote įrodyti, kad vienas iš jų yra geresnis (pavyzdžiui, A yra geresnis už B), turite atmesti nulinę hipotezę alternatyvos naudai. Pavyzdžiui, lyginate vieną ar kitą konversijų optimizavimo įrankį. Nulinės hipotezės atveju jie abu turi tokį patį poveikį (arba jokio poveikio) taikiniui. Kitu atveju vieno iš jų poveikis yra geresnis.

Jūsų alternatyvioje hipotezėje gali būti skaitinė reikšmė, pvz., B – A > 20%. Šiuo atveju nulinė hipotezė ir alternatyva gali būti tokios formos:

Kitas alternatyvios hipotezės pavadinimas yra tyrimo hipotezė, nes tyrėjui visada įdomu įrodyti šią konkrečią hipotezę.

Statistinis reikšmingumas ir p reikšmė

Dar kartą grįžkime prie Ronaldo Fisherio ir jo statistinio reikšmingumo sampratos.

Dabar, kai turite nulinę hipotezę ir alternatyvą, kaip galite įrodyti vieną ir paneigti kitą?

Kadangi statistika pagal savo pobūdį apima konkrečios populiacijos (imties) tyrimą, niekada negalite būti 100% tikras dėl gautų rezultatų. Geras pavyzdys: rinkimų rezultatai dažnai skiriasi nuo išankstinių apklausų ir net pasitraukimo grupių rezultatų.

Dr. Fisher norėjo sukurti skiriamąją liniją, kuri leistų jums žinoti, ar jūsų eksperimentas buvo sėkmingas, ar ne. Taip atsirado patikimumo indeksas. Patikimumas yra lygis, kurio mes galime pasakyti, ką laikome „svarbu“, o ko ne. Jei „p“, reikšmingumo indeksas, yra 0,05 arba mažesnis, tada rezultatai yra patikimi.

Nesijaudinkite, tai iš tikrųjų nėra taip painu, kaip atrodo.

Gauso tikimybių skirstinys. Išilgai kraštų yra mažiau tikėtinos kintamojo reikšmės, centre yra labiausiai tikėtinos. P balas (žaliai nuspalvintas plotas) yra tikimybė, kad pastebėtas rezultatas įvyks atsitiktinai.

Normalus tikimybių pasiskirstymas (Gauso skirstinys) yra visų galimų tam tikro kintamojo reikšmių atvaizdavimas grafike (paveikslėlyje aukščiau) ir jų dažniai. Jei teisingai atliksite tyrimą ir visus atsakymus pavaizduosite grafike, gausite būtent tokį pasiskirstymą. Pagal įprastą pasiskirstymą gausite didelį procentą panašių atsakymų, o likusios parinktys bus išdėstytos grafiko kraštuose (vadinamosiose „uodegose“). Šis vertybių pasiskirstymas dažnai randamas gamtoje, todėl jis vadinamas „normaliu“.

Naudodami lygtį, pagrįstą jūsų imties ir bandymo rezultatais, galite apskaičiuoti vadinamąją „bandymo statistiką“, kuri parodys, kiek skiriasi jūsų rezultatai. Tai taip pat parodys, kiek esate arti nulinės hipotezės teisingumo.

Kad lengviau susitvarkytumėte, naudokite internetinius skaičiuotuvus statistiniam reikšmingumui apskaičiuoti:

Vienas tokių skaičiuoklių pavyzdžių

Raidė "p" reiškia tikimybę, kad nulinė hipotezė yra teisinga. Jei skaičius mažas, tai parodys skirtumą tarp bandomųjų grupių, o nulinė hipotezė būtų, kad jos yra vienodos. Grafiškai atrodys, kad jūsų testo statistika bus arčiau vienos iš jūsų varpelio formos pasiskirstymo uodegų.

Daktaras Fišeris nusprendė nustatyti reikšmingumo slenkstį ties p ≤ 0,05. Tačiau šis teiginys yra prieštaringas, nes sukelia du sunkumus:

1. Pirma, tai, kad įrodėte nulinę hipotezę klaidingą, nereiškia, kad įrodėte alternatyvią hipotezę. Visa ši reikšmė tiesiog reiškia, kad jūs negalite įrodyti nei A, nei B.

2. Antra, jei p balas yra 0,049, tai reikš, kad nulinės hipotezės tikimybė bus 4,9%. Tai gali reikšti, kad jūsų bandymo rezultatai gali būti teisingi ir klaidingi tuo pačiu metu.

Galite naudoti arba nenaudoti p balą, bet tada turėsite apskaičiuoti nulinės hipotezės tikimybę kiekvienu konkrečiu atveju ir nuspręsti, ar ji pakankamai didelė, kad negalėtumėte atlikti planuotų ir išbandytų pakeitimų. .

Dažniausias scenarijus atliekant statistinį testą šiandien yra nustatyti p ≤ 0,05 reikšmingumo slenkstį prieš atliekant patį testą. Tik patikrindami rezultatus būtinai atidžiai pažiūrėkite į p reikšmę.

1 ir 2 klaidos

Praėjo tiek daug laiko, kad klaidos, kurios gali atsirasti naudojant statistinio reikšmingumo metriką, netgi buvo pavadintos savais pavadinimais.

1 tipo klaidos

Kaip minėta aukščiau, p reikšmė 0,05 reiškia, kad yra 5% tikimybė, kad nulinė hipotezė yra teisinga. Jei to nepadarysite, padarysite klaidą 1. Rezultatai rodo, kad jūsų naujoji svetainė padidino jūsų konversijų rodiklius, tačiau yra 5 % tikimybė, kad to nepadarė.

2 tipo klaidos

Ši klaida yra priešinga 1 klaidai: jūs priimate nulinę hipotezę, kai ji klaidinga. Pavyzdžiui, bandymų rezultatai rodo, kad svetainėje atlikti pakeitimai nepagerino, o pakeitimų buvo. Dėl to jūs praleidžiate galimybę pagerinti savo veiklą.

Ši klaida dažnai pasitaiko atliekant bandymus su nepakankamu imties dydžiu, todėl atminkite: kuo didesnė imtis, tuo patikimesnis rezultatas.

Išvada

Galbūt joks terminas nėra toks populiarus tarp tyrinėtojų, kaip statistinis reikšmingumas. Nustačius, kad testų rezultatai nėra statistiškai reikšmingi, pasekmės svyruoja nuo konversijų rodiklių padidėjimo iki įmonės žlugimo.

Kadangi rinkodaros specialistai naudoja šį terminą optimizuodami savo išteklius, turite žinoti, ką tai iš tikrųjų reiškia. Bandymo sąlygos gali skirtis, tačiau imties dydis ir sėkmės kriterijai visada yra svarbūs. Prisimink tai.

Statistinis reikšmingumas arba p-reikšmingumo lygis yra pagrindinis testo rezultatas

statistinė hipotezė. Techniniu požiūriu tai yra tikimybė gauti duotybę

pavyzdinio tyrimo rezultatas, su sąlyga, kad iš tikrųjų bendram

Apskritai nulinė statistinė hipotezė yra teisinga - tai yra, nėra ryšio. Kitaip tariant, tai

tikimybė, kad aptiktas ryšys yra atsitiktinis, o ne savybė

visuma. Tai yra statistinis reikšmingumas, p reikšmingumo lygis

kiekybinis ryšio patikimumo įvertinimas: kuo ši tikimybė mažesnė, tuo ryšys patikimesnis.

Tarkime, lyginant du imties vidurkius, gauta lygio reikšmė

statistinis reikšmingumas p=0,05. Tai reiškia, kad tikrinant statistinę hipotezę apie

vidurkių lygybė populiacijoje parodė, kad jei tai tiesa, tai tikimybė

Atsitiktinis aptiktų skirtumų atsiradimas yra ne didesnis kaip 5%. Kitaip tariant, jei

du mėginiai buvo pakartotinai paimti iš tos pačios populiacijos, tada 1 iš

20 atvejų būtų nustatytas toks pat arba didesnis skirtumas tarp šių mėginių vidurkių.

Tai yra, yra 5% tikimybė, kad nustatyti skirtumai atsirado dėl atsitiktinumo.

pobūdį ir nėra agregato savybė.

Kalbant apie mokslinę hipotezę, statistinio reikšmingumo lygis yra kiekybinis

nepasitikėjimo išvada apie ryšio egzistavimą laipsnio rodiklis, apskaičiuotas pagal rezultatus

atrankinis, empirinis šios hipotezės patikrinimas. Kuo mažesnė p lygio reikšmė, tuo didesnė

mokslinę hipotezę patvirtinančio tyrimo rezultato statistinis reikšmingumas.

Naudinga žinoti, kas turi įtakos reikšmingumo lygiui. Reikšmės lygis, visi kiti dalykai vienodi

sąlygos yra didesnės (p lygio reikšmė mažesnė), jei:

Ryšio dydis (skirtumas) yra didesnis;

Požymio (-ių) kintamumas yra mažesnis;

Imties dydis (-iai) yra didesnis.

Vienašalis Dvipusio reikšmingumo testai

Jeigu tyrimo tikslas – nustatyti dviejų bendrųjų parametrų skirtumus

agregatai, atitinkantys įvairias gamtines sąlygas (gyvenimo sąlygas,

tiriamųjų amžius ir pan.), tada dažnai nežinia, kuris iš šių parametrų bus didesnis, ir

Kuris mažesnis?

Pavyzdžiui, jei jus domina testo rezultatų kintamumas ir

eksperimentines grupes, tada, kaip taisyklė, nepasitiki dispersijų skirtumo ženklu arba

standartiniai rezultatų nuokrypiai, pagal kuriuos vertinamas kintamumas. Šiuo atveju

nulinė hipotezė yra ta, kad dispersijos yra lygios, o tyrimo tikslas yra

įrodyti priešingai, t.y. skirtumų tarp dispersijų buvimas. Tai leidžiama

skirtumas gali būti bet kokio ženklo. Tokios hipotezės vadinamos dvipusėmis.

Tačiau kartais iššūkis yra įrodyti parametro padidėjimą arba sumažėjimą;

pavyzdžiui, vidutinis rezultatas eksperimentinėje grupėje yra didesnis nei kontrolinės grupės. Tuo pačiu metu

Nebeleidžiama, kad skirtumas būtų kitokio ženklo. Tokios hipotezės vadinamos

Vienpusis.

Reikšmingumo testai, naudojami dvipusėms hipotezėms tikrinti, vadinami

Dvipusis, o vienpusis - vienpusis.

Kyla klausimas, kokį kriterijų reikėtų pasirinkti konkrečiu atveju. Atsakymas

Šis klausimas nepatenka į formalių statistinių metodų taikymo sritį ir yra visiškai

Priklauso nuo tyrimo tikslų. Jokiu būdu neturėtumėte pasirinkti vieno ar kito kriterijaus po to

Eksperimento atlikimas remiantis eksperimentinių duomenų analize

Leidžia daryti neteisingas išvadas. Jei prieš atliekant eksperimentą daroma prielaida, kad skirtumas

Palyginti parametrai gali būti teigiami arba neigiami, tada turėtumėte

Pagrindiniai bet kokio ryšio tarp kintamųjų bruožai.

Galima pastebėti dvi paprasčiausias ryšio tarp kintamųjų savybes: (a) ryšio dydį ir (b) ryšio patikimumą.

- Didumas . Priklausomybės dydį lengviau suprasti ir išmatuoti nei patikimumą. Pvz., Jei bet kurio mėginio vyro baltųjų kraujo kūnelių skaičius (WCC) buvo didesnis nei bet kurios moters, tuomet galima sakyti, kad ryšys tarp dviejų kintamųjų (lyties ir WCC) yra labai didelis. Kitaip tariant, galite numatyti vieno kintamojo reikšmes iš kito reikšmių.

- Patikimumas („tiesa“). Tarpusavio priklausomybės patikimumas yra mažiau intuityvi sąvoka nei priklausomybės dydis, tačiau ji yra nepaprastai svarbi. Ryšio patikimumas yra tiesiogiai susijęs su tam tikros imties, kurios pagrindu daromos išvados, reprezentatyvumu. Kitaip tariant, patikimumas reiškia, kokia tikimybė, kad ryšys bus atrastas iš naujo (kitaip tariant, patvirtintas) naudojant duomenis iš kitos imties, paimtos iš tos pačios populiacijos.

Reikia atsiminti, kad galutinis tikslas beveik niekada nėra tirti šios konkrečios vertybių imties; imtis yra įdomi tik tiek, kiek ji suteikia informacijos apie visą populiaciją. Jei tyrimas atitinka tam tikrus konkrečius kriterijus, tada rastų ryšių tarp imties kintamųjų patikimumą galima kiekybiškai įvertinti ir pateikti naudojant standartinį statistinį matą.

Priklausomybės dydis ir patikimumas yra dvi skirtingos priklausomybės tarp kintamųjų charakteristikos. Tačiau negalima teigti, kad jie yra visiškai nepriklausomi. Kuo didesnis ryšys (ryšis) tarp įprasto dydžio imties kintamųjų, tuo jis patikimesnis (žr. kitą skyrių).

Statistinis rezultato reikšmingumas (p lygis) yra įvertintas pasitikėjimo jo „tiesa“ (imties reprezentatyvumo prasme) matas. Techniškai kalbant, p lygis yra matas, kuris kinta mažėjančia tvarka atsižvelgiant į rezultato patikimumą. Aukštesnis p lygis atitinka mažesnį imtyje rastų kintamųjų ryšio pasitikėjimo lygį. Būtent, p lygis reiškia klaidos tikimybę, susijusią su stebimo rezultato pasiskirstymu visai populiacijai.

Pavyzdžiui, p lygis = 0,05(t. y. 1/20) rodo, kad yra 5 % tikimybė, kad imtyje rastų kintamųjų ryšys yra tik atsitiktinė imties ypatybė. Daugelyje tyrimų p-lygis 0,05 laikomas „priimtina paklaidos riba“.

Jokiu būdu negalima išvengti savivalės sprendžiant, koks reikšmingumo lygis iš tikrųjų turėtų būti laikomas „reikšmingu“. Tam tikro reikšmingumo lygio, kurį viršijus rezultatai atmetami kaip klaidingi, pasirinkimas yra gana savavališkas.



Praktikoje galutinis sprendimas dažniausiai priklauso nuo to, ar rezultatas buvo prognozuojamas a priori (t. y. prieš atliekant eksperimentą), ar aptiktas a posteriori dėl daugybės analizių ir palyginimų, atliktų su įvairiais duomenimis, taip pat nuo studijų krypties tradicija.

Paprastai daugelyje laukų p 0,05 rezultatas yra priimtina statistinio reikšmingumo riba, tačiau atminkite, kad šis lygis vis tiek apima gana didelę paklaidą (5 %).

Rezultatai, esantys reikšmingais p 0,01 lygyje, paprastai laikomi statistiškai reikšmingais, o rezultatai, esantys p 0,005 arba p 0,00 lygiu, paprastai laikomi statistiškai reikšmingais. 001 kaip labai reikšmingas. Tačiau reikia suprasti, kad toks reikšmingumo lygių klasifikavimas yra gana savavališkas ir tėra neformalus susitarimas, priimtas remiantis praktine patirtimi. tam tikroje studijų srityje.

Akivaizdu, kad kuo didesnis surinktų duomenų visumos analizių skaičius, tuo daugiau reikšmingų (pasirinktu lygmeniu) rezultatų bus atrasta visiškai atsitiktinai.

Kai kurie statistiniai metodai, kurie apima daug palyginimų ir todėl turi didelę galimybę pakartoti tokio tipo klaidas, atlieka specialų viso palyginimų skaičiaus koregavimą arba pataisymą. Tačiau daugelis statistinių metodų (ypač paprasti tiriamosios duomenų analizės metodai) nepasiūlo jokio būdo šiai problemai išspręsti.

Jei ryšys tarp kintamųjų yra „objektyviai“ silpnas, nėra kito būdo tokį ryšį patikrinti, kaip tik tirti didelę imtį. Net jei imtis yra visiškai reprezentatyvi, poveikis nebus statistiškai reikšmingas, jei imtis yra maža. Panašiai, jei ryšys „objektyviai“ yra labai stiprus, jis gali būti aptiktas labai reikšmingai net labai mažoje imtyje.

Kuo silpnesnis ryšys tarp kintamųjų, tuo didesnis imties dydis, reikalingas norint jį prasmingai aptikti.

Daug įvairių santykių matai tarp kintamųjų. Tam tikros priemonės pasirinkimas konkrečiame tyrime priklauso nuo kintamųjų skaičiaus, naudojamų matavimo skalių, ryšių pobūdžio ir kt.

Tačiau dauguma šių priemonių vadovaujasi bendruoju principu: jais bandoma įvertinti stebimą ryšį, lyginant jį su „maksimaliu įmanomu ryšiu“ tarp aptariamų kintamųjų. Kalbant techniškai, įprastas būdas atlikti tokius įvertinimus yra pažvelgti į tai, kaip kintamųjų reikšmės kinta, ir tada apskaičiuoti, kokią bendros svyravimų dalį galima paaiškinti „bendra“ („bendra“) svyravimais. du (ar daugiau) kintamųjų.

Reikšmė daugiausia priklauso nuo imties dydžio. Kaip jau buvo paaiškinta, labai didelėse imtyse net labai silpni kintamųjų ryšiai bus reikšmingi, o mažose imtyse net labai stiprūs ryšiai nėra patikimi.

Taigi, norint nustatyti statistinio reikšmingumo lygį, reikia funkcijos, kuri atspindėtų ryšį tarp kintamųjų ryšio „dydžio“ ir „reikšmingumo“ kiekvienam imties dydžiui.

Tokia funkcija tiksliai nurodytų „kaip tikimybė gauti tam tikros vertės (ar daugiau) priklausomybę tam tikro dydžio imtyje, darant prielaidą, kad populiacijoje tokios priklausomybės nėra“. Kitaip tariant, ši funkcija suteiktų reikšmingumo lygį
(p lygis), taigi ir tikimybė klaidingai atmesti prielaidą, kad populiacijoje šios priklausomybės nėra.

Tokia „alternatyvi“ hipotezė (kad populiacijoje nėra ryšio) paprastai vadinama nulinė hipotezė.

Būtų idealu, jei funkcija, apskaičiuojanti paklaidos tikimybę, būtų tiesinė ir skirtinguose imčių dydžiuose turėtų skirtingą nuolydį. Deja, ši funkcija yra daug sudėtingesnė ir ne visada lygiai tokia pati. Tačiau daugeliu atvejų jo forma yra žinoma ir gali būti naudojama reikšmingumo lygiams nustatyti tiriant tam tikro dydžio mėginius. Dauguma šių funkcijų yra susietos su paskirstymo klase, vadinama normalus .



Ar jums patiko straipsnis? Pasidalinkite su draugais!