Analizuojant variacijų serija paskirstymas puiki vertė turi kiek empirinis pasiskirstymasženklas atitinka normalus. Tam reikia lyginti tikrojo skirstinio dažnius su teoriniais, kurie būdingi normaliajam skirstiniui. Tai reiškia, kad remiantis faktiniais duomenimis reikia apskaičiuoti teorinius normaliojo pasiskirstymo kreivės dažnius, kurie yra normalizuotų nuokrypių funkcija.
Kitaip tariant, empirinio pasiskirstymo kreivė turi būti suderinta su normaliojo pasiskirstymo kreive.
Objektyvios atitikties charakteristikos teorinis Ir empirinis dažnius galima gauti naudojant specialius statistiniai rodikliai kurie vadinami sutikimo kriterijai.
Susitarimo kriterijus vadinamas kriterijumi, leidžiančiu nustatyti, ar neatitikimas yra empirinis Ir teorinis pasiskirstymai yra atsitiktiniai arba reikšmingi, t. y. ar stebėjimo duomenys sutampa su iškelta statistine hipoteze, ar nesutampa. Paskirstymas gyventojų, kurią jis turi dėl iškeltos hipotezės, vadinamas teoriniu.
Yra poreikis įdiegti kriterijus(taisyklė), kuri leistų spręsti, ar neatitikimas tarp empirinio ir teoriniai skirstiniai atsitiktinis arba reikšmingas. Jei paaiškėja, kad neatitikimas yra atsitiktinis, tada jie mano, kad stebėjimo duomenys (imtis) atitinka iškeltą hipotezę apie bendrosios populiacijos pasiskirstymo dėsnį, todėl hipotezė yra priimta; jei paaiškėtų, kad neatitikimas yra reikšmingas, tada stebėjimo duomenys nesutampa su hipoteze ir ji atmetama.
Paprastai empiriniai ir teoriniai dažniai skiriasi, nes:
- neatitikimas yra atsitiktinis ir dėl to ribotas kiekis stebėjimai;
- neatitikimas nėra atsitiktinis ir paaiškinamas tuo, kad statistinė hipotezė, kad populiacija pasiskirsto normaliai, yra klaidinga.
Taigi, sutikimo kriterijai leidžia atmesti arba patvirtinti hipotezės, iškeltos derinant eilutes apie pasiskirstymo pobūdį empirinėje eilutėje, teisingumą.
Empiriniai dažniai gautas kaip stebėjimo rezultatas. Teoriniai dažniai apskaičiuojamas pagal formules.
Už normalaus paskirstymo dėsnis juos galima rasti taip:
- Σƒ i - sukauptų (kaupiamųjų) empirinių dažnių suma
- h - skirtumas tarp dviejų gretimų variantų
- σ – imties standartinis nuokrypis
- t–normalizuotas (standartizuotas) nuokrypis
- φ(t) – normalaus skirstinio tikimybės tankio funkcija (randama atitinkamai t reikšmei)
Yra keletas tinkamumo testų, iš kurių dažniausiai naudojami: chi kvadrato testas (Pearson), Kolmogorovo testas, Romanovskio testas.
Pirsono tinkamumo testas χ 2– vienas iš pagrindinių, kurį galima pavaizduoti kaip teorinių (f T) ir empirinių (f) dažnių skirtumų kvadratų santykio su teoriniais dažniais sumą:
- k yra grupių, į kurias padalintas empirinis skirstinys, skaičius,
- f i – pastebėtas bruožo dažnis i-oje grupėje,
- f T – teorinis dažnis.
χ 2 skirstiniui buvo sudarytos lentelės, kuriose nurodoma kritinė χ 2 tinkamumo kriterijaus reikšmė pasirinktam reikšmingumo lygiui α ir laisvės laipsniams df (arba ν).
Reikšmingumo lygis α – tai tikimybė klaidingai atmesti pasiūlytą hipotezę, t.y. tikimybė, kad teisinga hipotezė bus atmesta. R - statistinis reikšmingumas
įvaikinimas teisinga hipotezė. Statistikoje dažniausiai naudojami trys reikšmingumo lygiai:
α=0,10, tada P=0,90 (10 atvejų iš 100)
α=0,05, tada P=0,95 (5 atvejais iš 100)
α=0,01, tada P=0,99 (1 atveju iš 100) teisinga hipotezė gali būti atmesta
Laisvės laipsnių skaičius df apibrėžiamas kaip pasiskirstymo serijos grupių skaičius atėmus jungčių skaičių: df = k –z. Jungčių skaičius suprantamas kaip empirinės eilutės rodiklių skaičius, naudojamas skaičiuojant teorinius dažnius, t.y. empirinius ir teorinius dažnius jungiantys rodikliai.Pavyzdžiui, sulygiavus su varpo kreive, yra trys ryšiai.Todėl suderinus pagalvarpo kreivėlaisvės laipsnių skaičius apibrėžiamas kaip df =k–3.Norint įvertinti reikšmingumą, apskaičiuota reikšmė lyginama su lentele χ 2 stalai
Visiškai sutapus teoriniams ir empiriniams skirstiniams χ 2 =0, kitu atveju χ 2 > 0. Jei χ 2 calc > χ 2 tab , tada tam tikram reikšmingumo lygiui ir laisvės laipsnių skaičiui atmetame hipotezę apie neatitikimų nereikšmingumą (atsitiktinumą). Jei χ 2 apskaičiuojamas< χ 2 табл то priimame hipotezę ir su tikimybe P = (1-α) galima teigti, kad neatitikimas tarp teorinės ir empiriniai dažniai netyčia. Todėl yra pagrindo teigti, kad empirinis skirstinys paklūsta normalusis pasiskirstymas. Pirsono tinkamumo testas naudojamas, jei populiacijos dydis yra pakankamai didelis (N>50), o kiekvienos grupės dažnis turi būti bent 5.
Remiantis didžiausio neatitikimo tarp sukauptų empirinių ir teorinių dažnių nustatymu:
kur D ir d yra atitinkamai didžiausias skirtumas tarp sukauptų dažnių ir sukauptų empirinių ir teorinių skirstinių dažnių.
Naudojant Kolmogorovo statistikos pasiskirstymo lentelę, nustatoma tikimybė, kuri gali svyruoti nuo 0 iki 1. Kai P(λ) = 1, yra visiškas dažnių sutapimas, P(λ) = 0 - visiškas neatitikimas. Jei tikimybės reikšmė P yra reikšminga rastosios reikšmės λ atžvilgiu, tai galime daryti prielaidą, kad teorinio ir empirinio skirstinių neatitikimai yra nereikšmingi, tai yra atsitiktiniai.
Pagrindinė Kolmogorovo kriterijaus naudojimo sąlyga yra ta didelis skaičius pastebėjimai.
Kolmogorovo tinkamumo testas
Panagrinėkime, kaip taikomas Kolmogorovo kriterijus (λ), kada tikrinant normaliojo pasiskirstymo hipotezę bendros populiacijos.Faktinio pasiskirstymo suderinimas su varpo kreive susideda iš kelių žingsnių:
- Palyginkite faktinius ir teorinius dažnius.
- Remiantis faktiniais duomenimis, nustatomi normalaus pasiskirstymo kreivės, kuri yra normalizuoto nuokrypio funkcija, teoriniai dažniai.
- Jie tikrina, kiek charakteristikos pasiskirstymas atitinka normalųjį.
UžIVlentelės stulpeliai:
Programoje MS Excel normalizuotas nuokrypis (t) apskaičiuojamas naudojant NORMALIZAVIMO funkciją. Būtina pasirinkti laisvų langelių diapazoną pagal parinkčių skaičių (eilutės skaičiuoklė). Nepašalindami pasirinkimo, iškvieskite funkciją NORMALIZE. Pasirodžiusiame dialogo lange nurodykite šiuos langelius, kuriuose yra atitinkamai stebimos reikšmės (X i), vidurkis (X) ir standartinis nuokrypis Ϭ. Operacija turi būti baigta vienu metu paspausdami Ctrl+Shift+Enter
UžVlentelės stulpeliai:
Normaliojo skirstinio φ(t) tikimybės tankio funkcija randama iš vietinės Laplaso funkcijos reikšmių lentelės atitinkamai normalizuoto nuokrypio vertei (t)
UžVIlentelės stulpeliai:
Kolmogorovo tinkamumo testas (λ) nustatoma dalijant modulįmaksimalus skirtumastarp empirinių ir teorinių kaupiamųjų dažnių pagal stebėjimų skaičiaus kvadratinę šaknį:
Naudodami specialią tikimybių lentelę susitarimo kriterijui λ nustatome, kad reikšmė λ = 0,59 atitinka tikimybę 0,88 (λ
Empirinių ir teorinių dažnių pasiskirstymas, teorinio pasiskirstymo tikimybių tankis
Taikant tinkamumo testus, siekiant patikrinti, ar stebimas (empirinis) skirstinys atitinka teorinį, reikia atskirti paprastų ir sudėtingų hipotezių tikrinimą.
Vieno imties Kolmogorovo-Smirnovo normalumo testas pagrįstas maksimalus skirtumas tarp kumuliacinių empirinis pasiskirstymas imtis ir tariamas (teorinis) kaupiamasis skirstinys. Jei Kolmogorovo-Smirnovo D statistika yra reikšminga, tai hipotezę, kad atitinkamas skirstinys yra normalus, reikia atmesti.
Taip pat žr
Atsitiktinumo tikrinimo ir išskirtinių stebėjimų vertinimo kriterijai Literatūra Įvadas Praktikoje statistinė analizė eksperimentiniais duomenimis, pagrindinis interesas yra ne pats tam tikros statistikos skaičiavimas, o atsakymai į tokio tipo klausimus. Atitinkamai buvo sukurta daug kriterijų, kad būtų galima patikrinti pateiktą informaciją statistines hipotezes. Visi statistinių hipotezių tikrinimo kriterijai skirstomi į du didelės grupės: parametrinis ir neparametrinis.
Pasidalinkite savo darbais socialiniuose tinkluose
Jei šis darbas jums netinka, puslapio apačioje yra panašių darbų sąrašas. Taip pat galite naudoti paieškos mygtuką
Sutikimo kriterijų naudojimas
Įvadas
Literatūra
Įvadas
Eksperimentinių duomenų statistinės analizės praktikoje pagrindinis interesas yra ne pats tam tikros statistikos skaičiavimas, o atsakymai į tokio tipo klausimus. Ar gyventojų vidurkis tikrai lygus tam tikram skaičiui? Ar koreliacijos koeficientas labai skiriasi nuo nulio? Ar dviejų imčių dispersijos yra lygios? Ir tokių klausimų gali kilti daug, priklausomai nuo konkrečios tyrimo problemos. Atitinkamai buvo sukurta daug kriterijų siūlomoms statistinėms hipotezėms patikrinti. Mes apsvarstysime keletą dažniausiai pasitaikančių. Tai daugiausia bus susiję su vidurkiais, dispersijomis, koreliacijos koeficientais ir gausos pasiskirstymu.
Visi statistinių hipotezių tikrinimo kriterijai skirstomi į dvi dideles grupes: parametrinius ir neparametrinius. Parametriniai testai grindžiami prielaida, kad imties duomenys yra paimti iš žinomo skirstinio populiacijos, o pagrindinė užduotis yra įvertinti šio skirstinio parametrus. Neparametriniai testai nereikalauja jokių prielaidų apie pasiskirstymo pobūdį, išskyrus prielaidą, kad jis yra tęstinis.
Pirmiausia pažiūrėkime parametriniai kriterijai. Bandymų seka apims nulinės hipotezės ir alternatyvios hipotezės formulavimą, darytinų prielaidų formulavimą, teste naudotos imties statistikos nustatymą ir tikrinamos statistikos imties pasiskirstymo formavimą, kritinių pasirinkto kriterijaus sričių nustatymas ir imties statistikos pasikliautinojo intervalo sudarymas.
1 Priemonių tinkamumo kriterijai
Tegul tikrinama hipotezė yra populiacijos parametras. Tokio patikrinimo poreikis gali iškilti, pavyzdžiui, toliau nurodytoje situacijoje. Tarkime, kad, remiantis išsamiais tyrimais, buvo nustatytas iškastinio moliusko kiauto skersmuo nuosėdose iš kokios nors fiksuotos vietos. Taip pat disponuojame tam tikru kiekiu kitoje vietoje rastų kriauklių ir darome prielaidą, kad konkreti vieta neturi įtakos kiauto skersmeniui, t.y. kad visos kažkada naujoje vietoje gyvenusių moliuskų populiacijos gaubto skersmens vidutinė vertė yra lygi žinomai vertei, gautai anksčiau tiriant šios rūšies moliuskus pirmoje buveinėje.
Jei šis žinoma vertė yra lygus, tada nulinė hipotezė ir alternatyvioji hipotezė rašomos taip: Tarkime, kad nagrinėjamos populiacijos kintamasis x turi normalusis pasiskirstymas, o populiacijos dispersijos dydis nežinomas.
Hipotezę patikrinsime naudodami statistiką:
, (1)
kur yra imties standartinis nuokrypis.
Buvo parodyta, kad jei tiesa, tai t išraiškoje (1) turi Stjudento t skirstinį su n-1 laisvės laipsniais. Jei reikšmingumo lygį (tikimybę atmesti teisingą hipotezę) pasirinksime lygų, tai pagal tai, kas buvo aptarta ankstesnis skyrius, galite apibrėžti kritines vertes, kad patikrintumėte =0.
IN šiuo atveju, kadangi Stjudento skirstinys yra simetriškas, tada (1-) dalis ploto po šio skirstinio kreive su n-1 laisvės laipsniais bus tarp taškų ir, kurie yra lygūs vienas kitam absoliuti vertė. Todėl visos vertės yra mažesnės nei neigiamos ir didesnės nei teigiamos t pasiskirstymui su duotas numeris pasirinkto reikšmingumo lygio laisvės laipsniai sudarys kritinę sritį. Jei imties t reikšmė patenka į šį regioną, priimama alternatyvi hipotezė.
Pasitikėjimo intervalas for yra sudarytas pagal anksčiau aprašytą metodą ir nustatomas pagal šią išraišką
(2)
Taigi, mūsų atveju praneškite, kad iškastinio moliusko apvalkalo skersmuo yra 18,2 mm. Turėjome 50 naujai rastų kriauklių pavyzdį, kurių mm, a = 2,18 mm. Patikrinkime: =18.2 prieš Mes turime
Jei reikšmingumo lygis pasirinktas =0,05, tada kritinė vertė. Iš to išplaukia, kad jį galima atmesti naudai esant reikšmingumo lygiui =0,05. Taigi mūsų hipotetiniam pavyzdžiui galima teigti (žinoma, su tam tikra tikimybe), kad iškastinių moliuskų kiauto skersmuo tam tikro tipo priklauso nuo vietos, kurioje jie gyveno.
Dėl to, kad t skirstinys yra simetriškas, tik teigiamas vertes t šio skirstinio pasirinktais reikšmingumo lygiais ir laisvės laipsnių skaičiumi. Be to, atsižvelgiama ne tik į ploto dalį po pasiskirstymo kreive dešinėje nuo t vertės, bet ir į kairę nuo -t reikšmės tuo pačiu metu. Taip yra dėl to, kad dažniausiai tikrindami hipotezes domimės pačių nukrypimų reikšmingumu, nepriklausomai nuo to, ar šie nukrypimai yra didesni ar mažesni, t.y. mes tikriname prieš, o ne prieš: >a arba: Dabar grįžkime prie mūsų pavyzdžio. 100(1-) % pasikliautinasis intervalas yra 18,92,01
Dabar panagrinėkime atvejį, kai reikia palyginti dviejų bendrųjų populiacijų vidurkius. Tikrinama hipotezė atrodo taip: : =0, : 0. Taip pat daroma prielaida, kad ji turi normalųjį skirstinį su vidurkiu ir dispersija, ir - normalųjį skirstinį su vidurkiu ir tuo pačiu dispersija. Be to, darome prielaidą, kad imtys, iš kurių apskaičiuojamos bendrosios populiacijos, yra išgautos nepriklausomai viena nuo kitos ir turi atitinkamai tūrį, o Iš imčių nepriklausomumo išplaukia, kad paėmus didesnį jų skaičių ir apskaičiuojant vidurkį kiekvienos poros vertes, tada šių vidurkių porų rinkinys bus visiškai nekoreliuojamas. Nulinės hipotezės tikrinimas atliekamas naudojant statistiką (3)
kur ir yra atitinkamai pirmosios ir antrosios imčių dispersijos įverčiai. Nesunku pastebėti, kad (3) yra (1) apibendrinimas. Buvo parodyta, kad statistika (3) turi Stjudento t skirstinį su laisvės laipsniais. Jei ir yra lygūs, t.y. = = formulė (3) yra supaprastinta ir turi formą (4)
Pažiūrėkime į pavyzdį. Išmatavus tos pačios augalų populiacijos stiebo lapus per du sezonus, gaukime tokius rezultatus: Tarkime, kad Stjudento t-testo naudojimo sąlygos, t.y. populiacijų, iš kurių imami mėginiai, normalumas, nežinomos, bet vienodos šių populiacijų dispersijos egzistavimas ir imčių nepriklausomumas. Įvertinkime reikšmingumo lygmeniu =0,01. Turime Lentelės reikšmė t = 2,58. Todėl hipotezę apie augalų populiacijos stiebo lapų ilgio vidutinių verčių lygybę per du sezonus reikia atmesti pasirinktu reikšmingumo lygiu. Dėmesio! Nulinė hipotezė matematinėje statistikoje yra hipotezė, kad tarp lyginamų rodiklių nėra reikšmingų skirtumų, nepaisant to, ar kalbame apie vidurkius, dispersijas ar kitą statistiką. Ir visais šiais atvejais, jei empirinė (apskaičiuota pagal formulę) kriterijaus reikšmė yra didesnė už teorinę (atrinkta iš lentelių), jis atmetamas. Jei empirinė vertė yra mažesnė už pateiktą lentelėje, ji priimama. Norėdami sukurti šių dviejų populiacijų vidurkių skirtumo pasikliautinąjį intervalą, atkreipkime dėmesį į tai, kad Stjudento testas, kaip matyti iš (3) formulės, įvertina skirtumo tarp vidurkių santykinį reikšmingumą. iki standartinės šio skirtumo paklaidos. Naudojant anksčiau aptartus ryšius ir padarytas prielaidas, nesunku patikrinti, ar vardiklis (3) reiškia būtent šią standartinę klaidą. Tiesą sakant, mes tai žinome apskritai Jei x ir y yra nepriklausomi, tai taip pat Paėmę imties vertes ir vietoj x ir y, ir prisiminę prielaidą, kad abiejų populiacijų dispersija yra tokia pati, gauname (5)
Dispersijos įvertinimą galima gauti iš toliau pateikto ryšio (6)
(Padalijame iš, nes iš mėginių apskaičiuojami du dydžiai, todėl laisvės laipsnių skaičius turi būti sumažintas dviem.) Jei dabar pakeisime (6) į (5) ir paimsime kvadratinę šaknį, gausime vardiklį išraiškoje (3). Po šio nukrypimo grįžkime prie pasikliautinojo intervalo sudarymo per -. Turime Pateiksime keletą pastabų, susijusių su prielaidomis, naudotomis konstruojant t-testą. Visų pirma buvo parodyta, kad normalumo prielaidos pažeidimai nežymiai įtakoja testo reikšmingumo ir galios lygį 30. Abiejų populiacijų, iš kurių imami mėginiai, dispersijų homogeniškumo prielaidos pažeidimai yra taip pat nereikšmingas, bet tik tuo atveju, kai imties dydžiai yra vienodi. Jei abiejų populiacijų dispersijos skiriasi viena nuo kitos, tai pirmojo ir antrojo tipų klaidų tikimybė gerokai skirsis nuo tikėtinų. Šiuo atveju patikrinimui turėtų būti naudojamas kriterijus (7)
su laisvės laipsnių skaičiumi . (8)
Paprastai tai yra trupmeninis skaičius, todėl naudojant t pasiskirstymo lenteles reikia paimti artimiausių sveikųjų skaičių lentelės reikšmes ir interpoliuoti, kad rastumėte t, atitinkantį gavo vieną. Pažiūrėkime į pavyzdį. Tiriant du ežerinės varlės porūšius, buvo apskaičiuotas kūno ilgio ir blauzdikaulio ilgio santykis. Buvo paimti du mėginiai, kurių tūris = 49 ir = 27. Mus dominančių santykių vidurkiai ir dispersijos pasirodė lygūs, atitinkamai =2,34; =2,08; =0,21; =0,35. Jei dabar patikrinsime hipotezę naudodami (2) formulę, gausime tai Esant =0,05 reikšmingumo lygiui, turime atmesti nulinę hipotezę (lentelės reikšmė t = 1,995) ir daryti prielaidą, kad pasirinktame reikšmingumo lygyje yra statistiškai reikšmingų skirtumų tarp dviejų varlių porūšių išmatuotų parametrų vidutinių verčių. . Naudodami (6) ir (7) formules turime Šiuo atveju, esant tam pačiam reikšmingumo lygiui =0,05, lentelės reikšmė yra t=2,015 ir priimama nulinė hipotezė. Šis pavyzdys aiškiai parodo, kad nepaisant sąlygų, priimtų nustatant konkretų kriterijų, rezultatai gali būti tiesiogiai priešingi tiems, kurie iš tikrųjų atsiranda. Žinoma, šiuo atveju, turint skirtingo dydžio imtis nesant iš anksto nustatyto fakto, kad išmatuoto rodiklio dispersijos abiejose populiacijose yra statistiškai vienodos, reikėjo naudoti (7) ir (8) formules, kurios parodė, kad statistiškai reikšmingų skirtumų nėra. Todėl norėčiau dar kartą pakartoti, kad tikrinant, ar laikomasi visų prielaidų, padarytų nustatant konkretų kriterijų, yra būtina sąlyga norint jį teisingai naudoti. Nuolatinis reikalavimas abiejose pirmiau minėtose t-testo modifikacijose buvo reikalavimas, kad mėginiai būtų nepriklausomi vienas nuo kito. Tačiau praktikoje dažnai pasitaiko situacijų, kai šio reikalavimo neįmanoma įvykdyti dėl objektyvių priežasčių. Pavyzdžiui, kai kurie rodikliai matuojami tam pačiam gyvūnui ar teritorijos plotui prieš ir po išorinio veiksnio veikimo ir pan. Ir tokiais atvejais mums gali būti įdomu patikrinti hipotezę. Mes ir toliau manysime, kad abu pavyzdžiai yra paimti iš normalių populiacijų, kurių dispersija yra tokia pati. Šiuo atveju galime pasinaudoti tuo, kad skirtumai tarp normaliai pasiskirstytų dydžių taip pat turi normalųjį skirstinį, todėl Stjudento t testą galime naudoti (1) pavidalu. Taigi bus patikrinta hipotezė, kad n skirtumų yra normaliai paskirstytos populiacijos, kurios vidurkis lygus nuliui, imtis. Žymėdami i-ąjį skirtumą, turime , (9) Pažiūrėkime į pavyzdį. Turime duomenų apie atskiros nervinės ląstelės impulsų skaičių per tam tikrą laiko tarpą prieš () ir po () dirgiklio veikimo: Taigi, turėdami galvoje, kad (9) turi t pasiskirstymą, ir pasirinkę reikšmingumo lygį =0,01, iš atitinkamos lentelės priede nustatome, kad kritinė t reikšmė n-1 = 10-1 = 9 laipsniai laisvės lygis yra 3,25. Teorinės ir empirinės t statistikos palyginimas rodo, kad nulinė hipotezė, jog nėra statistiškai reikšmingų skirtumų tarp šaudymo dažnių prieš ir po stimulo, turėtų būti atmesta. Galima daryti išvadą, kad naudojamas dirgiklis statistiškai reikšmingai keičia impulsų dažnį. Eksperimentiniuose tyrimuose, kaip minėta aukščiau, priklausomi mėginiai atsiranda gana dažnai. Tačiau šis faktas kartais ignoruojamas ir t-testas naudojamas neteisingai formoje (3). To netinkamumą galima pamatyti įvertinus standartines nekoreliuotų ir koreliuojančių vidurkių skirtumo paklaidas. Pirmuoju atveju O antrajame Standartinė skirtumo d paklaida yra Atsižvelgiant į tai, vardiklis (9) turės formą Dabar atkreipkime dėmesį į tai, kad (4) ir (9) išraiškų skaitikliai sutampa: todėl t reikšmės skirtumas juose priklauso nuo vardklių. Taigi, jei (3) formulė naudojama problemai su priklausomomis imtimis ir mėginiai turi teigiamą koreliaciją, tada gautos t reikšmės bus mažesnės nei turėtų būti naudojant formulę (9), ir gali susidaryti situacija. kur ta nulinė hipotezė bus priimta, kai ji klaidinga. Priešinga situacija gali susidaryti, kai tarp imčių yra neigiama koreliacija, t.y. šiuo atveju skirtumai bus pripažinti reikšmingais, kurie iš tikrųjų nėra. Dar kartą grįžkime prie pavyzdžio su impulsiniu aktyvumu ir pagal (3) formulę apskaičiuokime pateiktų duomenų t reikšmę, nekreipdami dėmesio į tai, kad imtys yra susijusios. Turime: Laisvės laipsnių skaičiui, lygiam 18, o reikšmingumo lygiui = 0,01, lentelės reikšmė yra t = 2,88 ir iš pirmo žvilgsnio atrodo, kad nieko neįvyko, net naudojant formulę, kuri yra netinkama duotomis sąlygomis. Ir šiuo atveju apskaičiuota t reikšmė lemia nulinės hipotezės atmetimą, t.y. prie tos pačios išvados, kuri buvo padaryta naudojant (9) formulę, teisinga šioje situacijoje. Tačiau iš naujo suformatuokime esamus duomenis ir pateikime juos tokia forma (2): Tai yra tos pačios vertės ir jas galima gauti atliekant vieną iš eksperimentų. Kadangi visos vertės abiejuose pavyzdžiuose išsaugomos, naudojant Stjudento t testą formulėje (3), gaunama anksčiau gauta vertė = 3,32 ir daroma ta pati išvada, kuri jau buvo padaryta. Dabar apskaičiuokime t reikšmę pagal formulę (9), kuri turėtų būti naudojama šiuo atveju. Turime: Kritinė t reikšmė pasirinktam reikšmingumo lygiui ir devyniems laisvės laipsniams yra 3,25. Vadinasi, mes neturime jokios priežasties atmesti nulinę hipotezę, mes ją priimame, ir paaiškėja, kad ši išvada yra tiesiogiai priešinga tai, kuri buvo padaryta naudojant (3) formulę. Naudodamiesi šiuo pavyzdžiu, dar kartą įsitikinome, kaip svarbu griežtai laikytis visų reikalavimų, kuriais remiantis buvo nustatytas konkretus kriterijus, siekiant gauti teisingas išvadas analizuojant eksperimentinius duomenis. Svarstomos Studento testo modifikacijos skirtos hipotezėms dėl dviejų imčių vidurkio patikrinti. Tačiau atsiranda situacijų, kai reikia daryti išvadas dėl k vidurkių lygybės vienu metu. Šiuo atveju taip pat sukurta tam tikra statistinė procedūra, kuri bus aptarta vėliau, aptariant su dispersine analize susijusius klausimus. 2 dispersijų tinkamumo testai Statistinių hipotezių, susijusių su populiacijos dispersijomis, tikrinimas atliekamas ta pačia seka kaip ir vidurkiams. Trumpai prisiminkime šią seką. 1. Suformuluota nulinė hipotezė (apie statistiškai reikšmingų skirtumų tarp palyginamų dispersijų nebuvimą). 2. Daromos tam tikros prielaidos dėl statistikos atrankinio pasiskirstymo, pagal kurią planuojama įvertinti hipotezėje įtrauktą parametrą. 3. Parenkamas hipotezės tikrinimo reikšmingumo lygis. 4. Apskaičiuojama mus dominančios statistikos vertė ir priimamas sprendimas dėl nulinės hipotezės teisingumo. Dabar pradėkime nuo hipotezės, kad populiacijos dispersija =a, t.y. prieš. Jei darome prielaidą, kad kintamasis x turi normalųjį pasiskirstymą ir kad n dydžio imtis yra paimta atsitiktinai iš populiacijos, tada nulinei hipotezei patikrinti naudojama statistika. (10)
Prisimindami dispersijos skaičiavimo formulę, perrašome (10) taip: . (11)
Iš šios išraiškos aišku, kad skaitiklis yra normaliai paskirstytų verčių nuokrypių nuo jų vidurkio kvadratų suma. Kiekvienas iš šių nukrypimų taip pat paprastai pasiskirsto. Todėl pagal mums žinomą pasiskirstymą normaliai paskirstytų statistikos (10) ir (11) reikšmių kvadratų sumos turi -skirstymą su n-1 laisvės laipsniais. Analogiškai naudojant t skirstinį, tikrinant pasirinktą reikšmingumo lygį, iš skirstymo lentelės nustatomi kritiniai taškai, atitinkantys nulinės hipotezės priėmimo tikimybes ir. Pasikliautinasis intervalas at pasirinktas yra sudarytas taip: . (12)
Pažiūrėkime į pavyzdį. Tarkime, remiantis išsamiais eksperimentiniais tyrimais, kad vienos augalų rūšies alkaloidų kiekio dispersija iš tam tikro ploto yra lygi 4,37 sutartiniams vienetams. Specialistas turi n = 28 tokių augalų pavyzdį, tikriausiai iš tos pačios vietovės. Analizė parodė, kad šiai imčiai = 5,01 ir turime įsitikinti, kad šios ir anksčiau žinomos dispersijos yra statistiškai neatskiriamos, kai reikšmingumo lygis = 0,1. Pagal (10) formulę turime Gautą vertę reikia palyginti su kritinėmis vertėmis /2=0,05 ir 1--/2=0,95. Iš priedų lentelės su 27 laisvės laipsniais turime atitinkamai 40,1 ir 16,2, o tai reiškia, kad nulinę hipotezę galima priimti. Atitinkamas pasikliautinasis intervalas yra 3,37<<8,35.
Priešingai nei tikrinant hipotezes dėl imties vidurkių, taikant Stjudento testą, kai pirmojo ir antrojo tipo paklaidos reikšmingai nepasikeitė, kai buvo pažeista normaliojo populiacijų pasiskirstymo prielaida, hipotezės apie dispersijas, kai nebuvo normalumo sąlygų. susitiko, klaidos labai pasikeitė. Aukščiau nagrinėta problema, susijusi su dispersijos lygybe tam tikrai fiksuotai reikšmei, yra mažai įdomi, nes situacijos, kai yra žinoma populiacijos dispersija, yra gana retos. Daug didesnį susidomėjimą kelia atvejis, kai reikia patikrinti, ar dviejų populiacijų dispersijos yra lygios, t.y. hipotezės tikrinimas prieš alternatyvą. Daroma prielaida, kad dydžio ir imtys yra atsitiktinai paimtos iš bendrųjų populiacijų su dispersijomis ir. Nulinei hipotezei patikrinti naudojamas Fišerio dispersijos koeficiento testas (13)
Kadangi normaliai paskirstytų atsitiktinių dydžių nuokrypių kvadratų sumos nuo jų vidurkių turi pasiskirstymą, ir (13) skaitiklis ir vardiklis yra paskirstytos reikšmės, atitinkamai padalytos iš ir, todėl jų santykis turi F skirstinį su -1 ir -1 laisvės laipsnis. Visuotinai priimta – ir taip sudaromos F pasiskirstymo lentelės – kad (13) skaitikliu imamas didžiausias iš dispersijų, todėl nustatomas tik vienas kritinis taškas, atitinkantis pasirinktą reikšmingumo lygį. Turime du paprastųjų ir ovalių tvenkinių sraigių populiacijų tūrio =11 ir =28 pavyzdžius, kurių aukščio ir pločio santykis yra =0,59 ir =0,38. Būtina patikrinti hipotezę apie šių rodiklių dispersijų lygumą tiriamoms populiacijoms esant =0,05 reikšmingumo lygiui. Turime Literatūroje kartais galima rasti teiginį, kad prieš hipotezės apie vidurkių lygybę tikrinimą Stjudento testu reikia patikrinti hipotezę apie dispersijų lygybę. Tai neteisinga rekomendacija. Be to, tai gali sukelti klaidų, kurių nesilaikant galima išvengti. Iš tiesų, dispersijų lygybės hipotezės tikrinimo naudojant Fišerio testą rezultatai labai priklauso nuo prielaidos, kad imtys yra paimtos iš normaliojo pasiskirstymo populiacijų. Tuo pačiu metu Stjudento testas yra nejautrus normalumo pažeidimams, o jei įmanoma gauti vienodo dydžio imtį, tada dispersijų lygybės prielaida taip pat nėra reikšminga. Esant nelygiam n, tikrinimui turi būti naudojamos (7) ir (8) formulės. Tikrinant hipotezes apie dispersijų lygybę, kai kurios ypatybės išryškėja atliekant skaičiavimus, susijusius su priklausomomis imtimis. Šiuo atveju, norint patikrinti hipotezę prieš alternatyvą, naudojama statistika (14)
Jei nulinė hipotezė teisinga, tai statistika (14) turi Stjudento t skirstinį su n-2 laisvės laipsniais. Išmatavus 35 dangos mėginių blizgesį, gauta =134,5 dispersija. Po dviejų savaičių pakartotiniai matavimai parodė = 199,1. Šiuo atveju koreliacijos koeficientas tarp suporuotų matavimų buvo lygus =0,876. Jei nepaisysime fakto, kad imtys yra priklausomos, ir hipotezei patikrinti naudosime Fišerio testą, gausime F=1,48. Jei pasirinksite =0,05 reikšmingumo lygį, tada nulinė hipotezė bus priimta, nes kritinė F skirstinio reikšmė =35-1=34 ir =35-1=34 laisvės laipsniams yra 1,79. Tuo pačiu, jei naudosime šiam atvejui tinkamą formulę (14), gausime t = 2,35, o 33 laisvės laipsnių ir pasirinkto reikšmingumo lygio = 0,05 kritinė t reikšmė yra lygi 2,03. Todėl nulinė hipotezė dėl dviejų imčių vienodų dispersijų turėtų būti atmesta. Taigi iš šio pavyzdžio matyti, kad, kaip ir tikrinant vidurkių lygybės hipotezę, naudojant kriterijų, kuris neatsižvelgia į eksperimentinių duomenų specifiką, atsiranda klaida. Rekomenduojamoje literatūroje galima rasti Bartlett testą, kuriuo tikrinamos hipotezės apie k dispersijų vienalaikę lygybę. Be to, kad šio kriterijaus statistikos skaičiavimas yra gana sudėtingas, pagrindinis šio kriterijaus trūkumas yra tai, kad jis yra neįprastai jautrus nukrypimams nuo normaliojo populiacijų, iš kurių imami mėginiai, pasiskirstymo prielaidos. Taigi, naudodami jį, niekada negalite būti tikri, kad nulinė hipotezė iš tikrųjų atmetama dėl to, kad dispersijos statistiškai reikšmingai skiriasi, o ne dėl to, kad imtys nėra normaliai paskirstytos. Todėl iškilus kelių dispersijų palyginimo problemai, reikia ieškoti problemos formuluotės, kurioje būtų galima panaudoti Fišerio kriterijų ar jo modifikacijas. 3 Susitarimo dėl akcijų kriterijai Gana dažnai reikia analizuoti populiacijas, kuriose objektus galima priskirti vienai iš dviejų kategorijų. Pavyzdžiui, pagal lytį tam tikroje populiacijoje, pagal tam tikro mikroelemento buvimą dirvožemyje, pagal tamsią ar šviesią kiaušinių spalvą kai kuriose paukščių rūšyse ir pan. Elementų, turinčių tam tikrą kokybę, proporciją žymime P, kur P reiškia objektų, kurių kokybė mus domina, ir visų objektų santykį.
Kur