Pearsono tinkamumo statistinis testas jūsų žodžiais. Susitarimo kriterijus

Analizuojant variacijų serija paskirstymas puiki vertė turi kiek empirinis pasiskirstymasženklas atitinka normalus. Tam reikia lyginti tikrojo skirstinio dažnius su teoriniais, kurie būdingi normaliajam skirstiniui. Tai reiškia, kad remiantis faktiniais duomenimis reikia apskaičiuoti teorinius normaliojo pasiskirstymo kreivės dažnius, kurie yra normalizuotų nuokrypių funkcija.

Kitaip tariant, empirinio pasiskirstymo kreivė turi būti suderinta su normaliojo pasiskirstymo kreive.

Objektyvios atitikties charakteristikos teorinis Ir empirinis dažnius galima gauti naudojant specialius statistiniai rodikliai kurie vadinami sutikimo kriterijai.

Susitarimo kriterijus vadinamas kriterijumi, leidžiančiu nustatyti, ar neatitikimas yra empirinis Ir teorinis pasiskirstymai yra atsitiktiniai arba reikšmingi, t. y. ar stebėjimo duomenys sutampa su iškelta statistine hipoteze, ar nesutampa. Paskirstymas gyventojų, kurią jis turi dėl iškeltos hipotezės, vadinamas teoriniu.

Yra poreikis įdiegti kriterijus(taisyklė), kuri leistų spręsti, ar neatitikimas tarp empirinio ir teoriniai skirstiniai atsitiktinis arba reikšmingas. Jei paaiškėja, kad neatitikimas yra atsitiktinis, tada jie mano, kad stebėjimo duomenys (imtis) atitinka iškeltą hipotezę apie bendrosios populiacijos pasiskirstymo dėsnį, todėl hipotezė yra priimta; jei paaiškėtų, kad neatitikimas yra reikšmingas, tada stebėjimo duomenys nesutampa su hipoteze ir ji atmetama.

Paprastai empiriniai ir teoriniai dažniai skiriasi, nes:

  • neatitikimas yra atsitiktinis ir dėl to ribotas kiekis stebėjimai;
  • neatitikimas nėra atsitiktinis ir paaiškinamas tuo, kad statistinė hipotezė, kad populiacija pasiskirsto normaliai, yra klaidinga.

Taigi, sutikimo kriterijai leidžia atmesti arba patvirtinti hipotezės, iškeltos derinant eilutes apie pasiskirstymo pobūdį empirinėje eilutėje, teisingumą.

Empiriniai dažniai gautas kaip stebėjimo rezultatas. Teoriniai dažniai apskaičiuojamas pagal formules.

normalaus paskirstymo dėsnis juos galima rasti taip:

  • Σƒ i - sukauptų (kaupiamųjų) empirinių dažnių suma
  • h - skirtumas tarp dviejų gretimų variantų
  • σ – imties standartinis nuokrypis
  • t–normalizuotas (standartizuotas) nuokrypis
  • φ(t) – normalaus skirstinio tikimybės tankio funkcija (randama atitinkamai t reikšmei)

Yra keletas tinkamumo testų, iš kurių dažniausiai naudojami: chi kvadrato testas (Pearson), Kolmogorovo testas, Romanovskio testas.

Pirsono tinkamumo testas χ 2– vienas iš pagrindinių, kurį galima pavaizduoti kaip teorinių (f T) ir empirinių (f) dažnių skirtumų kvadratų santykio su teoriniais dažniais sumą:

  • k yra grupių, į kurias padalintas empirinis skirstinys, skaičius,
  • f i – pastebėtas bruožo dažnis i-oje grupėje,
  • f T – teorinis dažnis.

χ 2 skirstiniui buvo sudarytos lentelės, kuriose nurodoma kritinė χ 2 tinkamumo kriterijaus reikšmė pasirinktam reikšmingumo lygiui α ir laisvės laipsniams df (arba ν).
Reikšmingumo lygis α – tai tikimybė klaidingai atmesti pasiūlytą hipotezę, t.y. tikimybė, kad teisinga hipotezė bus atmesta. R - statistinis reikšmingumas įvaikinimas teisinga hipotezė. Statistikoje dažniausiai naudojami trys reikšmingumo lygiai:

α=0,10, tada P=0,90 (10 atvejų iš 100)

α=0,05, tada P=0,95 (5 atvejais iš 100)

α=0,01, tada P=0,99 (1 atveju iš 100) teisinga hipotezė gali būti atmesta

Laisvės laipsnių skaičius df apibrėžiamas kaip pasiskirstymo serijos grupių skaičius atėmus jungčių skaičių: df = k –z. Jungčių skaičius suprantamas kaip empirinės eilutės rodiklių skaičius, naudojamas skaičiuojant teorinius dažnius, t.y. empirinius ir teorinius dažnius jungiantys rodikliai.Pavyzdžiui, sulygiavus su varpo kreive, yra trys ryšiai.Todėl suderinus pagalvarpo kreivėlaisvės laipsnių skaičius apibrėžiamas kaip df =k–3.Norint įvertinti reikšmingumą, apskaičiuota reikšmė lyginama su lentele χ 2 stalai

Visiškai sutapus teoriniams ir empiriniams skirstiniams χ 2 =0, kitu atveju χ 2 > 0. Jei χ 2 calc > χ 2 tab , tada tam tikram reikšmingumo lygiui ir laisvės laipsnių skaičiui atmetame hipotezę apie neatitikimų nereikšmingumą (atsitiktinumą). Jei χ 2 apskaičiuojamas< χ 2 табл то priimame hipotezę ir su tikimybe P = (1-α) galima teigti, kad neatitikimas tarp teorinės ir empiriniai dažniai netyčia. Todėl yra pagrindo teigti, kad empirinis skirstinys paklūsta normalusis pasiskirstymas. Pirsono tinkamumo testas naudojamas, jei populiacijos dydis yra pakankamai didelis (N>50), o kiekvienos grupės dažnis turi būti bent 5.

Remiantis didžiausio neatitikimo tarp sukauptų empirinių ir teorinių dažnių nustatymu:

kur D ir d yra atitinkamai didžiausias skirtumas tarp sukauptų dažnių ir sukauptų empirinių ir teorinių skirstinių dažnių.
Naudojant Kolmogorovo statistikos pasiskirstymo lentelę, nustatoma tikimybė, kuri gali svyruoti nuo 0 iki 1. Kai P(λ) = 1, yra visiškas dažnių sutapimas, P(λ) = 0 - visiškas neatitikimas. Jei tikimybės reikšmė P yra reikšminga rastosios reikšmės λ atžvilgiu, tai galime daryti prielaidą, kad teorinio ir empirinio skirstinių neatitikimai yra nereikšmingi, tai yra atsitiktiniai.
Pagrindinė Kolmogorovo kriterijaus naudojimo sąlyga yra ta didelis skaičius pastebėjimai.

Kolmogorovo tinkamumo testas

Panagrinėkime, kaip taikomas Kolmogorovo kriterijus (λ), kada tikrinant normaliojo pasiskirstymo hipotezę bendros populiacijos.Faktinio pasiskirstymo suderinimas su varpo kreive susideda iš kelių žingsnių:

  1. Palyginkite faktinius ir teorinius dažnius.
  2. Remiantis faktiniais duomenimis, nustatomi normalaus pasiskirstymo kreivės, kuri yra normalizuoto nuokrypio funkcija, teoriniai dažniai.
  3. Jie tikrina, kiek charakteristikos pasiskirstymas atitinka normalųjį.

IVlentelės stulpeliai:

Programoje MS Excel normalizuotas nuokrypis (t) apskaičiuojamas naudojant NORMALIZAVIMO funkciją. Būtina pasirinkti laisvų langelių diapazoną pagal parinkčių skaičių (eilutės skaičiuoklė). Nepašalindami pasirinkimo, iškvieskite funkciją NORMALIZE. Pasirodžiusiame dialogo lange nurodykite šiuos langelius, kuriuose yra atitinkamai stebimos reikšmės (X i), vidurkis (X) ir standartinis nuokrypis Ϭ. Operacija turi būti baigta vienu metu paspausdami Ctrl+Shift+Enter

Vlentelės stulpeliai:

Normaliojo skirstinio φ(t) tikimybės tankio funkcija randama iš vietinės Laplaso funkcijos reikšmių lentelės atitinkamai normalizuoto nuokrypio vertei (t)

VIlentelės stulpeliai:

Kolmogorovo tinkamumo testas (λ) nustatoma dalijant modulįmaksimalus skirtumastarp empirinių ir teorinių kaupiamųjų dažnių pagal stebėjimų skaičiaus kvadratinę šaknį:

Naudodami specialią tikimybių lentelę susitarimo kriterijui λ nustatome, kad reikšmė λ = 0,59 atitinka tikimybę 0,88 (λ

Empirinių ir teorinių dažnių pasiskirstymas, teorinio pasiskirstymo tikimybių tankis

Taikant tinkamumo testus, siekiant patikrinti, ar stebimas (empirinis) skirstinys atitinka teorinį, reikia atskirti paprastų ir sudėtingų hipotezių tikrinimą.

Vieno imties Kolmogorovo-Smirnovo normalumo testas pagrįstas maksimalus skirtumas tarp kumuliacinių empirinis pasiskirstymas imtis ir tariamas (teorinis) kaupiamasis skirstinys. Jei Kolmogorovo-Smirnovo D statistika yra reikšminga, tai hipotezę, kad atitinkamas skirstinys yra normalus, reikia atmesti.

Taip pat žr

Atsitiktinumo tikrinimo ir išskirtinių stebėjimų vertinimo kriterijai Literatūra Įvadas Praktikoje statistinė analizė eksperimentiniais duomenimis, pagrindinis interesas yra ne pats tam tikros statistikos skaičiavimas, o atsakymai į tokio tipo klausimus. Atitinkamai buvo sukurta daug kriterijų, kad būtų galima patikrinti pateiktą informaciją statistines hipotezes. Visi statistinių hipotezių tikrinimo kriterijai skirstomi į du didelės grupės: parametrinis ir neparametrinis.


Pasidalinkite savo darbais socialiniuose tinkluose

Jei šis darbas jums netinka, puslapio apačioje yra panašių darbų sąrašas. Taip pat galite naudoti paieškos mygtuką


Testas

Sutikimo kriterijų naudojimas

Įvadas

Literatūra

Įvadas

Eksperimentinių duomenų statistinės analizės praktikoje pagrindinis interesas yra ne pats tam tikros statistikos skaičiavimas, o atsakymai į tokio tipo klausimus. Ar gyventojų vidurkis tikrai lygus tam tikram skaičiui? Ar koreliacijos koeficientas labai skiriasi nuo nulio? Ar dviejų imčių dispersijos yra lygios? Ir tokių klausimų gali kilti daug, priklausomai nuo konkrečios tyrimo problemos. Atitinkamai buvo sukurta daug kriterijų siūlomoms statistinėms hipotezėms patikrinti. Mes apsvarstysime keletą dažniausiai pasitaikančių. Tai daugiausia bus susiję su vidurkiais, dispersijomis, koreliacijos koeficientais ir gausos pasiskirstymu.

Visi statistinių hipotezių tikrinimo kriterijai skirstomi į dvi dideles grupes: parametrinius ir neparametrinius. Parametriniai testai grindžiami prielaida, kad imties duomenys yra paimti iš žinomo skirstinio populiacijos, o pagrindinė užduotis yra įvertinti šio skirstinio parametrus. Neparametriniai testai nereikalauja jokių prielaidų apie pasiskirstymo pobūdį, išskyrus prielaidą, kad jis yra tęstinis.

Pirmiausia pažiūrėkime parametriniai kriterijai. Bandymų seka apims nulinės hipotezės ir alternatyvios hipotezės formulavimą, darytinų prielaidų formulavimą, teste naudotos imties statistikos nustatymą ir tikrinamos statistikos imties pasiskirstymo formavimą, kritinių pasirinkto kriterijaus sričių nustatymas ir imties statistikos pasikliautinojo intervalo sudarymas.

1 Priemonių tinkamumo kriterijai

Tegul tikrinama hipotezė yra populiacijos parametras. Tokio patikrinimo poreikis gali iškilti, pavyzdžiui, toliau nurodytoje situacijoje. Tarkime, kad, remiantis išsamiais tyrimais, buvo nustatytas iškastinio moliusko kiauto skersmuo nuosėdose iš kokios nors fiksuotos vietos. Taip pat disponuojame tam tikru kiekiu kitoje vietoje rastų kriauklių ir darome prielaidą, kad konkreti vieta neturi įtakos kiauto skersmeniui, t.y. kad visos kažkada naujoje vietoje gyvenusių moliuskų populiacijos gaubto skersmens vidutinė vertė yra lygi žinomai vertei, gautai anksčiau tiriant šios rūšies moliuskus pirmoje buveinėje.

Jei šis žinoma vertė yra lygus, tada nulinė hipotezė ir alternatyvioji hipotezė rašomos taip: Tarkime, kad nagrinėjamos populiacijos kintamasis x turi normalusis pasiskirstymas, o populiacijos dispersijos dydis nežinomas.

Hipotezę patikrinsime naudodami statistiką:

, (1)
kur yra imties standartinis nuokrypis.

Buvo parodyta, kad jei tiesa, tai t išraiškoje (1) turi Stjudento t skirstinį su n-1 laisvės laipsniais. Jei reikšmingumo lygį (tikimybę atmesti teisingą hipotezę) pasirinksime lygų, tai pagal tai, kas buvo aptarta ankstesnis skyrius, galite apibrėžti kritines vertes, kad patikrintumėte =0.

IN šiuo atveju, kadangi Stjudento skirstinys yra simetriškas, tada (1-) dalis ploto po šio skirstinio kreive su n-1 laisvės laipsniais bus tarp taškų ir, kurie yra lygūs vienas kitam absoliuti vertė. Todėl visos vertės yra mažesnės nei neigiamos ir didesnės nei teigiamos t pasiskirstymui su duotas numeris pasirinkto reikšmingumo lygio laisvės laipsniai sudarys kritinę sritį. Jei imties t reikšmė patenka į šį regioną, priimama alternatyvi hipotezė.

Pasitikėjimo intervalas for yra sudarytas pagal anksčiau aprašytą metodą ir nustatomas pagal šią išraišką

(2)

Taigi, mūsų atveju praneškite, kad iškastinio moliusko apvalkalo skersmuo yra 18,2 mm. Turėjome 50 naujai rastų kriauklių pavyzdį, kurių mm, a = 2,18 mm. Patikrinkime: =18.2 prieš Mes turime

Jei reikšmingumo lygis pasirinktas =0,05, tada kritinė vertė. Iš to išplaukia, kad jį galima atmesti naudai esant reikšmingumo lygiui =0,05. Taigi mūsų hipotetiniam pavyzdžiui galima teigti (žinoma, su tam tikra tikimybe), kad iškastinių moliuskų kiauto skersmuo tam tikro tipo priklauso nuo vietos, kurioje jie gyveno.

Dėl to, kad t skirstinys yra simetriškas, tik teigiamas vertes t šio skirstinio pasirinktais reikšmingumo lygiais ir laisvės laipsnių skaičiumi. Be to, atsižvelgiama ne tik į ploto dalį po pasiskirstymo kreive dešinėje nuo t vertės, bet ir į kairę nuo -t reikšmės tuo pačiu metu. Taip yra dėl to, kad dažniausiai tikrindami hipotezes domimės pačių nukrypimų reikšmingumu, nepriklausomai nuo to, ar šie nukrypimai yra didesni ar mažesni, t.y. mes tikriname prieš, o ne prieš: >a arba:

Dabar grįžkime prie mūsų pavyzdžio. 100(1-) % pasikliautinasis intervalas yra

18,92,01

Dabar panagrinėkime atvejį, kai reikia palyginti dviejų bendrųjų populiacijų vidurkius. Tikrinama hipotezė atrodo taip: : =0, : 0. Taip pat daroma prielaida, kad ji turi normalųjį skirstinį su vidurkiu ir dispersija, ir - normalųjį skirstinį su vidurkiu ir tuo pačiu dispersija. Be to, darome prielaidą, kad imtys, iš kurių apskaičiuojamos bendrosios populiacijos, yra išgautos nepriklausomai viena nuo kitos ir turi atitinkamai tūrį, o Iš imčių nepriklausomumo išplaukia, kad paėmus didesnį jų skaičių ir apskaičiuojant vidurkį kiekvienos poros vertes, tada šių vidurkių porų rinkinys bus visiškai nekoreliuojamas.

Nulinės hipotezės tikrinimas atliekamas naudojant statistiką

(3)

kur ir yra atitinkamai pirmosios ir antrosios imčių dispersijos įverčiai. Nesunku pastebėti, kad (3) yra (1) apibendrinimas.

Buvo parodyta, kad statistika (3) turi Stjudento t skirstinį su laisvės laipsniais. Jei ir yra lygūs, t.y. = = formulė (3) yra supaprastinta ir turi formą

(4)

Pažiūrėkime į pavyzdį. Išmatavus tos pačios augalų populiacijos stiebo lapus per du sezonus, gaukime tokius rezultatus: Tarkime, kad Stjudento t-testo naudojimo sąlygos, t.y. populiacijų, iš kurių imami mėginiai, normalumas, nežinomos, bet vienodos šių populiacijų dispersijos egzistavimas ir imčių nepriklausomumas. Įvertinkime reikšmingumo lygmeniu =0,01. Turime

Lentelės reikšmė t = 2,58. Todėl hipotezę apie augalų populiacijos stiebo lapų ilgio vidutinių verčių lygybę per du sezonus reikia atmesti pasirinktu reikšmingumo lygiu.

Dėmesio! Nulinė hipotezė matematinėje statistikoje yra hipotezė, kad tarp lyginamų rodiklių nėra reikšmingų skirtumų, nepaisant to, ar kalbame apie vidurkius, dispersijas ar kitą statistiką. Ir visais šiais atvejais, jei empirinė (apskaičiuota pagal formulę) kriterijaus reikšmė yra didesnė už teorinę (atrinkta iš lentelių), jis atmetamas. Jei empirinė vertė yra mažesnė už pateiktą lentelėje, ji priimama.

Norėdami sukurti šių dviejų populiacijų vidurkių skirtumo pasikliautinąjį intervalą, atkreipkime dėmesį į tai, kad Stjudento testas, kaip matyti iš (3) formulės, įvertina skirtumo tarp vidurkių santykinį reikšmingumą. iki standartinės šio skirtumo paklaidos. Naudojant anksčiau aptartus ryšius ir padarytas prielaidas, nesunku patikrinti, ar vardiklis (3) reiškia būtent šią standartinę klaidą. Tiesą sakant, mes tai žinome apskritai

Jei x ir y yra nepriklausomi, tai taip pat

Paėmę imties vertes ir vietoj x ir y, ir prisiminę prielaidą, kad abiejų populiacijų dispersija yra tokia pati, gauname

(5)

Dispersijos įvertinimą galima gauti iš toliau pateikto ryšio

(6)

(Padalijame iš, nes iš mėginių apskaičiuojami du dydžiai, todėl laisvės laipsnių skaičius turi būti sumažintas dviem.)

Jei dabar pakeisime (6) į (5) ir paimsime kvadratinę šaknį, gausime vardiklį išraiškoje (3).

Po šio nukrypimo grįžkime prie pasikliautinojo intervalo sudarymo per -.

Turime

Pateiksime keletą pastabų, susijusių su prielaidomis, naudotomis konstruojant t-testą. Visų pirma buvo parodyta, kad normalumo prielaidos pažeidimai nežymiai įtakoja testo reikšmingumo ir galios lygį 30. Abiejų populiacijų, iš kurių imami mėginiai, dispersijų homogeniškumo prielaidos pažeidimai yra taip pat nereikšmingas, bet tik tuo atveju, kai imties dydžiai yra vienodi. Jei abiejų populiacijų dispersijos skiriasi viena nuo kitos, tai pirmojo ir antrojo tipų klaidų tikimybė gerokai skirsis nuo tikėtinų.

Šiuo atveju patikrinimui turėtų būti naudojamas kriterijus

(7)

su laisvės laipsnių skaičiumi

. (8)

Paprastai tai yra trupmeninis skaičius, todėl naudojant t pasiskirstymo lenteles reikia paimti artimiausių sveikųjų skaičių lentelės reikšmes ir interpoliuoti, kad rastumėte t, atitinkantį gavo vieną.

Pažiūrėkime į pavyzdį. Tiriant du ežerinės varlės porūšius, buvo apskaičiuotas kūno ilgio ir blauzdikaulio ilgio santykis. Buvo paimti du mėginiai, kurių tūris = 49 ir ​​= 27. Mus dominančių santykių vidurkiai ir dispersijos pasirodė lygūs, atitinkamai =2,34; =2,08; =0,21; =0,35. Jei dabar patikrinsime hipotezę naudodami (2) formulę, gausime tai

Esant =0,05 reikšmingumo lygiui, turime atmesti nulinę hipotezę (lentelės reikšmė t = 1,995) ir daryti prielaidą, kad pasirinktame reikšmingumo lygyje yra statistiškai reikšmingų skirtumų tarp dviejų varlių porūšių išmatuotų parametrų vidutinių verčių. .

Naudodami (6) ir (7) formules turime

Šiuo atveju, esant tam pačiam reikšmingumo lygiui =0,05, lentelės reikšmė yra t=2,015 ir priimama nulinė hipotezė.

Šis pavyzdys aiškiai parodo, kad nepaisant sąlygų, priimtų nustatant konkretų kriterijų, rezultatai gali būti tiesiogiai priešingi tiems, kurie iš tikrųjų atsiranda. Žinoma, šiuo atveju, turint skirtingo dydžio imtis nesant iš anksto nustatyto fakto, kad išmatuoto rodiklio dispersijos abiejose populiacijose yra statistiškai vienodos, reikėjo naudoti (7) ir (8) formules, kurios parodė, kad statistiškai reikšmingų skirtumų nėra.

Todėl norėčiau dar kartą pakartoti, kad tikrinant, ar laikomasi visų prielaidų, padarytų nustatant konkretų kriterijų, yra būtina sąlyga norint jį teisingai naudoti.

Nuolatinis reikalavimas abiejose pirmiau minėtose t-testo modifikacijose buvo reikalavimas, kad mėginiai būtų nepriklausomi vienas nuo kito. Tačiau praktikoje dažnai pasitaiko situacijų, kai šio reikalavimo neįmanoma įvykdyti dėl objektyvių priežasčių. Pavyzdžiui, kai kurie rodikliai matuojami tam pačiam gyvūnui ar teritorijos plotui prieš ir po išorinio veiksnio veikimo ir pan. Ir tokiais atvejais mums gali būti įdomu patikrinti hipotezę. Mes ir toliau manysime, kad abu pavyzdžiai yra paimti iš normalių populiacijų, kurių dispersija yra tokia pati.

Šiuo atveju galime pasinaudoti tuo, kad skirtumai tarp normaliai pasiskirstytų dydžių taip pat turi normalųjį skirstinį, todėl Stjudento t testą galime naudoti (1) pavidalu. Taigi bus patikrinta hipotezė, kad n skirtumų yra normaliai paskirstytos populiacijos, kurios vidurkis lygus nuliui, imtis.

Žymėdami i-ąjį skirtumą, turime

, (9)
Kur

Pažiūrėkime į pavyzdį. Turime duomenų apie atskiros nervinės ląstelės impulsų skaičių per tam tikrą laiko tarpą prieš () ir po () dirgiklio veikimo:

Taigi, turėdami galvoje, kad (9) turi t pasiskirstymą, ir pasirinkę reikšmingumo lygį =0,01, iš atitinkamos lentelės priede nustatome, kad kritinė t reikšmė n-1 = 10-1 = 9 laipsniai laisvės lygis yra 3,25. Teorinės ir empirinės t statistikos palyginimas rodo, kad nulinė hipotezė, jog nėra statistiškai reikšmingų skirtumų tarp šaudymo dažnių prieš ir po stimulo, turėtų būti atmesta. Galima daryti išvadą, kad naudojamas dirgiklis statistiškai reikšmingai keičia impulsų dažnį.

Eksperimentiniuose tyrimuose, kaip minėta aukščiau, priklausomi mėginiai atsiranda gana dažnai. Tačiau šis faktas kartais ignoruojamas ir t-testas naudojamas neteisingai formoje (3).

To netinkamumą galima pamatyti įvertinus standartines nekoreliuotų ir koreliuojančių vidurkių skirtumo paklaidas. Pirmuoju atveju

O antrajame

Standartinė skirtumo d paklaida yra

Atsižvelgiant į tai, vardiklis (9) turės formą

Dabar atkreipkime dėmesį į tai, kad (4) ir (9) išraiškų skaitikliai sutampa:

todėl t reikšmės skirtumas juose priklauso nuo vardklių.

Taigi, jei (3) formulė naudojama problemai su priklausomomis imtimis ir mėginiai turi teigiamą koreliaciją, tada gautos t reikšmės bus mažesnės nei turėtų būti naudojant formulę (9), ir gali susidaryti situacija. kur ta nulinė hipotezė bus priimta, kai ji klaidinga. Priešinga situacija gali susidaryti, kai tarp imčių yra neigiama koreliacija, t.y. šiuo atveju skirtumai bus pripažinti reikšmingais, kurie iš tikrųjų nėra.

Dar kartą grįžkime prie pavyzdžio su impulsiniu aktyvumu ir pagal (3) formulę apskaičiuokime pateiktų duomenų t reikšmę, nekreipdami dėmesio į tai, kad imtys yra susijusios. Turime: Laisvės laipsnių skaičiui, lygiam 18, o reikšmingumo lygiui = 0,01, lentelės reikšmė yra t = 2,88 ir iš pirmo žvilgsnio atrodo, kad nieko neįvyko, net naudojant formulę, kuri yra netinkama duotomis sąlygomis. Ir šiuo atveju apskaičiuota t reikšmė lemia nulinės hipotezės atmetimą, t.y. prie tos pačios išvados, kuri buvo padaryta naudojant (9) formulę, teisinga šioje situacijoje.

Tačiau iš naujo suformatuokime esamus duomenis ir pateikime juos tokia forma (2):

Tai yra tos pačios vertės ir jas galima gauti atliekant vieną iš eksperimentų. Kadangi visos vertės abiejuose pavyzdžiuose išsaugomos, naudojant Stjudento t testą formulėje (3), gaunama anksčiau gauta vertė = 3,32 ir daroma ta pati išvada, kuri jau buvo padaryta.

Dabar apskaičiuokime t reikšmę pagal formulę (9), kuri turėtų būti naudojama šiuo atveju. Turime: Kritinė t reikšmė pasirinktam reikšmingumo lygiui ir devyniems laisvės laipsniams yra 3,25. Vadinasi, mes neturime jokios priežasties atmesti nulinę hipotezę, mes ją priimame, ir paaiškėja, kad ši išvada yra tiesiogiai priešinga tai, kuri buvo padaryta naudojant (3) formulę.

Naudodamiesi šiuo pavyzdžiu, dar kartą įsitikinome, kaip svarbu griežtai laikytis visų reikalavimų, kuriais remiantis buvo nustatytas konkretus kriterijus, siekiant gauti teisingas išvadas analizuojant eksperimentinius duomenis.

Svarstomos Studento testo modifikacijos skirtos hipotezėms dėl dviejų imčių vidurkio patikrinti. Tačiau atsiranda situacijų, kai reikia daryti išvadas dėl k vidurkių lygybės vienu metu. Šiuo atveju taip pat sukurta tam tikra statistinė procedūra, kuri bus aptarta vėliau, aptariant su dispersine analize susijusius klausimus.

2 dispersijų tinkamumo testai

Statistinių hipotezių, susijusių su populiacijos dispersijomis, tikrinimas atliekamas ta pačia seka kaip ir vidurkiams. Trumpai prisiminkime šią seką.

1. Suformuluota nulinė hipotezė (apie statistiškai reikšmingų skirtumų tarp palyginamų dispersijų nebuvimą).

2. Daromos tam tikros prielaidos dėl statistikos atrankinio pasiskirstymo, pagal kurią planuojama įvertinti hipotezėje įtrauktą parametrą.

3. Parenkamas hipotezės tikrinimo reikšmingumo lygis.

4. Apskaičiuojama mus dominančios statistikos vertė ir priimamas sprendimas dėl nulinės hipotezės teisingumo.

Dabar pradėkime nuo hipotezės, kad populiacijos dispersija =a, t.y. prieš. Jei darome prielaidą, kad kintamasis x turi normalųjį pasiskirstymą ir kad n dydžio imtis yra paimta atsitiktinai iš populiacijos, tada nulinei hipotezei patikrinti naudojama statistika.

(10)

Prisimindami dispersijos skaičiavimo formulę, perrašome (10) taip:

. (11)

Iš šios išraiškos aišku, kad skaitiklis yra normaliai paskirstytų verčių nuokrypių nuo jų vidurkio kvadratų suma. Kiekvienas iš šių nukrypimų taip pat paprastai pasiskirsto. Todėl pagal mums žinomą pasiskirstymą normaliai paskirstytų statistikos (10) ir (11) reikšmių kvadratų sumos turi -skirstymą su n-1 laisvės laipsniais.

Analogiškai naudojant t skirstinį, tikrinant pasirinktą reikšmingumo lygį, iš skirstymo lentelės nustatomi kritiniai taškai, atitinkantys nulinės hipotezės priėmimo tikimybes ir. Pasikliautinasis intervalas at pasirinktas yra sudarytas taip:

. (12)

Pažiūrėkime į pavyzdį. Tarkime, remiantis išsamiais eksperimentiniais tyrimais, kad vienos augalų rūšies alkaloidų kiekio dispersija iš tam tikro ploto yra lygi 4,37 sutartiniams vienetams. Specialistas turi n = 28 tokių augalų pavyzdį, tikriausiai iš tos pačios vietovės. Analizė parodė, kad šiai imčiai = 5,01 ir turime įsitikinti, kad šios ir anksčiau žinomos dispersijos yra statistiškai neatskiriamos, kai reikšmingumo lygis = 0,1.

Pagal (10) formulę turime

Gautą vertę reikia palyginti su kritinėmis vertėmis /2=0,05 ir 1--/2=0,95. Iš priedų lentelės su 27 laisvės laipsniais turime atitinkamai 40,1 ir 16,2, o tai reiškia, kad nulinę hipotezę galima priimti. Atitinkamas pasikliautinasis intervalas yra 3,37<<8,35.

Priešingai nei tikrinant hipotezes dėl imties vidurkių, taikant Stjudento testą, kai pirmojo ir antrojo tipo paklaidos reikšmingai nepasikeitė, kai buvo pažeista normaliojo populiacijų pasiskirstymo prielaida, hipotezės apie dispersijas, kai nebuvo normalumo sąlygų. susitiko, klaidos labai pasikeitė.

Aukščiau nagrinėta problema, susijusi su dispersijos lygybe tam tikrai fiksuotai reikšmei, yra mažai įdomi, nes situacijos, kai yra žinoma populiacijos dispersija, yra gana retos. Daug didesnį susidomėjimą kelia atvejis, kai reikia patikrinti, ar dviejų populiacijų dispersijos yra lygios, t.y. hipotezės tikrinimas prieš alternatyvą. Daroma prielaida, kad dydžio ir imtys yra atsitiktinai paimtos iš bendrųjų populiacijų su dispersijomis ir.

Nulinei hipotezei patikrinti naudojamas Fišerio dispersijos koeficiento testas

(13)

Kadangi normaliai paskirstytų atsitiktinių dydžių nuokrypių kvadratų sumos nuo jų vidurkių turi pasiskirstymą, ir (13) skaitiklis ir vardiklis yra paskirstytos reikšmės, atitinkamai padalytos iš ir, todėl jų santykis turi F skirstinį su -1 ir -1 laisvės laipsnis.

Visuotinai priimta – ir taip sudaromos F pasiskirstymo lentelės – kad (13) skaitikliu imamas didžiausias iš dispersijų, todėl nustatomas tik vienas kritinis taškas, atitinkantis pasirinktą reikšmingumo lygį.

Turime du paprastųjų ir ovalių tvenkinių sraigių populiacijų tūrio =11 ir =28 pavyzdžius, kurių aukščio ir pločio santykis yra =0,59 ir =0,38. Būtina patikrinti hipotezę apie šių rodiklių dispersijų lygumą tiriamoms populiacijoms esant =0,05 reikšmingumo lygiui. Turime

Literatūroje kartais galima rasti teiginį, kad prieš hipotezės apie vidurkių lygybę tikrinimą Stjudento testu reikia patikrinti hipotezę apie dispersijų lygybę. Tai neteisinga rekomendacija. Be to, tai gali sukelti klaidų, kurių nesilaikant galima išvengti.

Iš tiesų, dispersijų lygybės hipotezės tikrinimo naudojant Fišerio testą rezultatai labai priklauso nuo prielaidos, kad imtys yra paimtos iš normaliojo pasiskirstymo populiacijų. Tuo pačiu metu Stjudento testas yra nejautrus normalumo pažeidimams, o jei įmanoma gauti vienodo dydžio imtį, tada dispersijų lygybės prielaida taip pat nėra reikšminga. Esant nelygiam n, tikrinimui turi būti naudojamos (7) ir (8) formulės.

Tikrinant hipotezes apie dispersijų lygybę, kai kurios ypatybės išryškėja atliekant skaičiavimus, susijusius su priklausomomis imtimis. Šiuo atveju, norint patikrinti hipotezę prieš alternatyvą, naudojama statistika

(14)

Jei nulinė hipotezė teisinga, tai statistika (14) turi Stjudento t skirstinį su n-2 laisvės laipsniais.

Išmatavus 35 dangos mėginių blizgesį, gauta =134,5 dispersija. Po dviejų savaičių pakartotiniai matavimai parodė = 199,1. Šiuo atveju koreliacijos koeficientas tarp suporuotų matavimų buvo lygus =0,876. Jei nepaisysime fakto, kad imtys yra priklausomos, ir hipotezei patikrinti naudosime Fišerio testą, gausime F=1,48. Jei pasirinksite =0,05 reikšmingumo lygį, tada nulinė hipotezė bus priimta, nes kritinė F skirstinio reikšmė =35-1=34 ir =35-1=34 laisvės laipsniams yra 1,79.

Tuo pačiu, jei naudosime šiam atvejui tinkamą formulę (14), gausime t = 2,35, o 33 laisvės laipsnių ir pasirinkto reikšmingumo lygio = 0,05 kritinė t reikšmė yra lygi 2,03. Todėl nulinė hipotezė dėl dviejų imčių vienodų dispersijų turėtų būti atmesta. Taigi iš šio pavyzdžio matyti, kad, kaip ir tikrinant vidurkių lygybės hipotezę, naudojant kriterijų, kuris neatsižvelgia į eksperimentinių duomenų specifiką, atsiranda klaida.

Rekomenduojamoje literatūroje galima rasti Bartlett testą, kuriuo tikrinamos hipotezės apie k dispersijų vienalaikę lygybę. Be to, kad šio kriterijaus statistikos skaičiavimas yra gana sudėtingas, pagrindinis šio kriterijaus trūkumas yra tai, kad jis yra neįprastai jautrus nukrypimams nuo normaliojo populiacijų, iš kurių imami mėginiai, pasiskirstymo prielaidos. Taigi, naudodami jį, niekada negalite būti tikri, kad nulinė hipotezė iš tikrųjų atmetama dėl to, kad dispersijos statistiškai reikšmingai skiriasi, o ne dėl to, kad imtys nėra normaliai paskirstytos. Todėl iškilus kelių dispersijų palyginimo problemai, reikia ieškoti problemos formuluotės, kurioje būtų galima panaudoti Fišerio kriterijų ar jo modifikacijas.

3 Susitarimo dėl akcijų kriterijai

Gana dažnai reikia analizuoti populiacijas, kuriose objektus galima priskirti vienai iš dviejų kategorijų. Pavyzdžiui, pagal lytį tam tikroje populiacijoje, pagal tam tikro mikroelemento buvimą dirvožemyje, pagal tamsią ar šviesią kiaušinių spalvą kai kuriose paukščių rūšyse ir pan.

Elementų, turinčių tam tikrą kokybę, proporciją žymime P, kur P reiškia objektų, kurių kokybė mus domina, ir visų objektų santykį.

Patikrinkime hipotezę, kad tam tikroje pakankamai didelėje populiacijoje dalis P yra lygi kokiam nors skaičiui a (0

Dichotominiams (turintiems dvi gradacijas) kintamiesiems, kaip ir mūsų atveju, P vaidina tą patį vaidmenį kaip kiekybiškai išmatuotų kintamųjų populiacijos vidurkis. Kita vertus, anksčiau buvo teigiama, kad trupmenos P standartinė paklaida gali būti pavaizduota kaip

Tada, jei hipotezė teisinga, tada statistika

, (19)
kur p yra imties P reikšmė, turi vienetinį normalųjį pasiskirstymą. Reikėtų iš karto pastebėti, kad toks apytikslis skaičiavimas galioja, jei mažesnė iš sandaugų np arba (1-p)n yra didesnė nei 5.

Tegu iš literatūros žinoma, kad ežerinių varlių populiacijoje individų su išilgine juostele nugaroje dalis yra 62% arba 0,62. Turėjome 125 (n) asmenų pavyzdį, iš kurių 93 (f) turi išilginę juostelę nugaroje. Reikia išsiaiškinti, ar mus dominančią savybę turinčių individų dalis populiacijoje, iš kurios buvo paimta imtis, atitinka žinomus duomenis. Turime: p=f/n=93/125=0,744, a=0,62, n(1-p)=125(1–0,744)=32>5 ir

Todėl, kai reikšmingumo lygis = 0,05 ir = 0,01, nulinė hipotezė turėtų būti atmesta, nes kritinė reikšmė = 0,05 yra 1,96, o = 0,01 - 2,58.

Jei yra dvi didelės populiacijos, kuriose objektų, turinčių mus dominančią savybę, proporcijos yra atitinkamai ir, tada hipotezės patikrinimas: = prieš alternatyvą: domina. Tyrimui atsitiktinai ir nepriklausomai ekstrahuojami du mėginiai su tūriais ir. Remiantis šiais pavyzdžiais, apskaičiuojama ir nustatoma statistika.

(20)

kur ir yra objektų, turinčių šią charakteristiką, skaičius atitinkamai pirmajame ir antrajame pavyzdžiuose.

Iš (20) formulės galima suprasti, kad ją išvedant buvo naudojamas tas pats principas, su kuriuo susidūrėme anksčiau. Būtent, norint patikrinti statistines hipotezes, nustatomas standartinių nuokrypių, sudarančių skirtumą tarp mus dominančių rodiklių, skaičius mėginius vienu metu. Jei pažymėsime jį, tada išraiška antrajame vardiklio (20) skliaustelyje reiškia (1-) ir tampa akivaizdu, kad išraiška (20) yra lygiavertė nulinės hipotezės tikrinimo formulei:

Nes.

Kita vertus, tai standartinė klaida. Taigi (20) gali būti parašytas kaip

. (21)

Vienintelis skirtumas tarp šios statistikos ir statistikos, naudojamos tikrinant hipotezes apie vidurkius, yra tas, kad z turi vienetinį normalųjį skirstinį, o ne t pasiskirstymą.

Tegul žmonių grupės (=82) tyrimas rodo, kad žmonių, kurių elektroencefalogramoje yra -ritmas, dalis yra 0,84 arba 84%. Ištyrus žmonių grupę kitoje vietovėje (=51), ši proporcija yra 0,78. Jei reikšmingumo lygis yra =0,05, būtina patikrinti, ar asmenų, turinčių smegenų alfa aktyvumą, proporcijos bendrose populiacijose, iš kurių buvo paimti mėginiai, yra vienodos.

Visų pirma, įsitikinkime, kad turimi eksperimentiniai duomenys leidžia naudoti statistiką (20). Turime:

ir kadangi z turi normalųjį skirstinį, kurio kritinis taškas ties =0,05 yra 1,96, tada priimama nulinė hipotezė.

Nagrinėjamas kriterijus galioja, jei imtys, kurioms buvo lyginamos mus dominančią charakteristiką turinčių objektų proporcijos, yra nepriklausomos. Jei šis reikalavimas neįvykdytas, pavyzdžiui, kai populiacija nagrinėjama nuosekliais laiko intervalais, tai tas pats objektas gali turėti arba neturėti šios charakteristikos šiais intervalais.

Objekto, turinčio kokį nors mus dominantį požymį, buvimą pažymėkime 1, o jo nebuvimą – 0. Tada pereikime prie 3 lentelės, kur (a+c) yra objektų skaičius pirmoje imtyje, turinčių tam tikrą požymį. , (a+c) – objektų, turinčių šią charakteristiką, skaičius antroje imtyje, o n – bendras ištirtų objektų skaičius. Akivaizdu, kad tai jau gerai žinoma keturių laukų lentelė, kurios santykis vertinamas naudojant koeficientą

Tokiam stalui ir mažam (<10) значений в каждой клетке Р.Фишером было найдено точное распределение для, которое позволяет проверять гипотезу: =. Это распределение имеет довольно сложный вид, и его критические точки приводятся в специальных таблицах. В реальных ситуациях, как правило, значения в каждой клетке больше 10, и было показано, что в этих случаях для проверки нулевой гипотезы можно использовать статистику

(22)
kuri, jei nulinė hipotezė teisinga, turi chi kvadrato skirstinį su vienu laisvės laipsniu.

Pažiūrėkime į pavyzdį. Skirtingu metų laiku skiepų nuo maliarijos efektyvumas patikrinamas per dvejus metus. Tikrinama hipotezė, kad skiepų efektyvumas nepriklauso nuo metų laiko, kada jie skiepijami. Turime

=0,05 lentelės reikšmė yra 3,84, o =0,01 - 6,64. Todėl esant bet kuriam iš šių reikšmingumo lygių, nulinę hipotezę reikia atmesti, o šiame hipotetiniame pavyzdyje (kad ir kaip būtų susiję su realybe) galima daryti išvadą, kad statymai, atlikti antrąjį metų pusmetį, yra žymiai efektyvesni.

Natūralus keturių laukų lentelės sujungimo koeficiento apibendrinimas, kaip minėta anksčiau, yra Chuprovo tarpusavio konjugacijos koeficientas. Tikslus šio koeficiento pasiskirstymas nežinomas, todėl hipotezės pagrįstumas sprendžiamas lyginant apskaičiuotą reikšmę ir pasirinktą reikšmingumo lygį su šio skirstinio kritiniais taškais. Laisvės laipsnių skaičius nustatomas pagal išraišką (r-1) (c-1), kur r ir c yra kiekvienos charakteristikos gradacijų skaičius.

Prisiminkime skaičiavimo formules

Pateikiami duomenys, gauti tiriant regėjimo diapazoną dešinėje ir kairėje akyje žmonėms, neturintiems regėjimo anomalijų. Paprastai šis diapazonas yra suskirstytas į keturias kategorijas, todėl mus domina kairiosios ir dešinės akių regėjimo diapazono ryšio patikimumas. Pirmiausia suraskime visus dvigubos sumos terminus. Norėdami tai padaryti, kiekvienos lentelėje pateiktos reikšmės kvadratas yra padalintas iš eilutės ir stulpelio, kuriam priklauso pasirinktas skaičius, sumos. Turime

Naudodami šią reikšmę gauname =3303,6 ir T=0,714.

4 Gyventojų pasiskirstymo palyginimo kriterijai

Klasikiniuose žirnių auginimo eksperimentuose, žymėjusiuose genetikos pradžią, G. Mendelis stebėjo skirtingų rūšių sėklų, gautų sukryžminus augalus su apvaliomis geltonomis ir raukšlėtomis žaliomis sėklomis, dažnius.

Šiuo ir panašiais atvejais įdomu patikrinti nulinę hipotezę apie bendrųjų populiacijų, iš kurių imami pavyzdžiai, pasiskirstymo funkcijų lygybę, t.y. Teoriniai skaičiavimai parodė, kad tokiai problemai išspręsti galima pasitelkti statistiką

= (23)

Šios statistikos naudojimo kriterijų pasiūlė K. Pearsonas ir jis yra jo vardu. Pearsono testas naudojamas sugrupuotiems duomenims, neatsižvelgiant į tai, ar jie turi nuolatinį ar diskretišką pasiskirstymą. (23) k yra grupavimo intervalų skaičius, empiriniai skaičiai ir laukiami arba teoriniai skaičiai (=n). Jei nulinė hipotezė yra teisinga, statistika (23) turi pasiskirstymą su k-1 laisvės laipsniais.

Lentelėje pateiktiems duomenims

Kritiniai skirstinio taškai su 3 laisvės laipsniais =0,05 ir =0,01 yra lygūs atitinkamai 7,81 ir 11,3. Todėl priimama nulinė hipotezė ir daroma išvada, kad palikuonių segregacija gana gerai atitinka teorinius modelius.

Pažvelkime į kitą pavyzdį. Jūrų kiaulyčių kolonijoje per metus, pradedant nuo sausio mėn., buvo gauti šie patinų gimimų skaičiai: 65, 64, 65, 41, 72, 80, 88, 114, 80, 129, 112, 99. Kan. manome, kad gauti duomenys atitinka vienodą pasiskirstymą, t.y. pasiskirstymas, kuriame per atskirus mėnesius gimusių patinų skaičius yra vidutiniškai vienodas? Jei priimsime šią hipotezę, tikėtinas vidutinis gimusių vyrų skaičius bus lygus. Tada

Kritinė skirstinio su 11 laisvės laipsnių ir = 0,01 reikšmė yra 24,7, todėl pasirinktame reikšmingumo lygyje nulinė hipotezė atmetama. Tolesnė eksperimentinių duomenų analizė rodo, kad jūrų kiaulyčių patinų gimimo tikimybė antrąjį metų pusmetį didėja.

Tuo atveju, kai daroma prielaida, kad teorinis skirstinys yra vienodas, skaičiuojant teorinius skaičius nekyla problemų. Kitų paskirstymų atveju skaičiavimai tampa sudėtingesni. Pažiūrėkime į pavyzdžius, kaip skaičiuojami teoriniai skaičiai normaliajam ir Puasono skirstiniams, kurie tyrimų praktikoje yra gana dažni.

Pradėkime nuo normaliojo skirstinio teorinių skaičių nustatymo. Idėja yra paversti mūsų empirinį pasiskirstymą į pasiskirstymą su nuliniu vidurkiu ir vieneto dispersija. Natūralu, kad šiuo atveju klasių intervalų ribos bus išreiškiamos standartinio nuokrypio vienetais, o tada, prisiminus, kad plotas po kreivės atkarpa, ribojamas kiekvieno intervalo viršutinės ir apatinės reikšmės, yra lygus tikimybei. patekimo į tam tikrą intervalą, šią tikimybę padauginę iš bendro skaičiaus atrankos, gausime norimą teorinį skaičių.

Tarkime, kad turime empirinį ąžuolo lapų ilgio pasiskirstymą ir turime patikrinti, ar galima laikyti, kad su =0,05 reikšmingumo lygiu šis pasiskirstymas reikšmingai nesiskiria nuo normalaus.

Paaiškinkime, kaip buvo apskaičiuotos lentelėje pateiktos vertės. Pirmiausia, naudojant standartinį sugrupuotų duomenų metodą, buvo apskaičiuotas vidurkis ir standartinis nuokrypis, kuris pasirodė lygus =10,3 ir =2,67. Naudojant šias reikšmes, buvo rastos intervalų ribos standartinio nuokrypio vienetais, t.y. buvo rastos standartizuotos reikšmės Pavyzdžiui, intervalo (46) riboms turime: (4-10,3)/2,67=-2,36; (6-10,3)/2,67=-1,61. Tada kiekvienam intervalui buvo skaičiuojama tikimybė patekti į jį. Pavyzdžiui, intervalui (-0,110,64) iš normaliojo pasiskirstymo lentelės matome, kad taško (-0,11) kairėje yra 0,444 normalaus skirstinio vieneto ploto, o kairėje taškas (0,64) yra 0,739 šio ploto. Taigi tikimybė patekti į šį intervalą yra 0,739-0,444=0,295. Likę skaičiavimai yra akivaizdūs. Reikėtų paaiškinti skirtumą tarp n ir.... Tai atsiranda dėl to, kad teorinis normalusis skirstinys praktiniais tikslais gali būti laikomas sutelktu į intervalą. Eksperimente nėra verčių, kurios nukryptų daugiau nei nuo vidurkio. Todėl plotas po empirine pasiskirstymo kreive nėra lygus vienetui, dėl kurio atsiranda klaida. Tačiau ši klaida galutinių rezultatų reikšmingai nekeičia.

Lyginant empirinius ir teorinius skirstinius, -skirstinio laisvės laipsnių skaičius randamas iš santykio f=m-1-l, kur m yra klasių intervalų skaičius, o l yra nepriklausomų pasiskirstymo parametrų skaičius, įvertintas iš mėginys. Normaliam skirstiniui l=2, nes priklauso nuo dviejų parametrų: ir.

Laisvės laipsnių skaičius taip pat sumažėja 1, nes bet kokiam skirstiniui yra sąlyga, kad =1, taigi, nepriklausomai nustatytų tikimybių skaičius yra lygus k-1, o ne k.

Pateiktame pavyzdyje f = 8-2-1 = 5, o kritinė vertė, esant =0,05, pasiskirstymui su 5 laisvės laipsniais yra 11,07. Todėl priimta nulinė hipotezė.

Panagrinėkime empirinio pasiskirstymo ir Puasono pasiskirstymo palyginimo techniką naudodami klasikinį dragūnų mirčių skaičiaus Prūsijos armijoje nuo arklio kanopos per mėnesį pavyzdį. Duomenys datuojami XIX a., o mirusiųjų skaičius – 0, 1, 2 ir kt. apibūdinti šiuos liūdnus, bet, laimei, palyginti retus įvykius Prūsijos kavalerijoje per beveik 20 stebėjimo metų.

Kaip žinoma, Puasono skirstinys turi tokią formą:

kur paskirstymo parametras yra lygus vidurkiui,

K =0,1,2,...,n.

Kadangi skirstinys yra diskretus, mus dominančios tikimybės randamos tiesiai iš formulės.

Pavyzdžiui, parodykime, kaip nustatomas teorinis skaičius k=3. Įprastu būdu nustatome, kad šio skirstinio vidurkis yra 0,652. Atsižvelgdami į šią vertę, randame

Iš čia

Jei pasirenkama =0,05, tada -skirstinio su dviem laisvės laipsniais kritinė reikšmė yra 5,99, todėl sutinkama su hipoteze, kad empirinis pasiskirstymas pasirinktu reikšmingumo lygiu nesiskiria nuo Puasono. Laisvės laipsnių skaičius šiuo atveju yra du, nes Puasono skirstinys priklauso nuo vieno parametro, todėl santykyje f = m-1-l iš imties įvertintų parametrų skaičius yra l = 1, ir f = 4-1-1 = 2.

Kartais praktiškai paaiškėja, kad svarbu žinoti, ar du skirstiniai skiriasi vienas nuo kito, net jei sunku nuspręsti, kuris teorinis skirstinys gali juos apytiksliai. Tai ypač svarbu tais atvejais, kai, pavyzdžiui, jų vidurkiai ir/ar dispersijos statistiškai reikšmingai nesiskiria viena nuo kitos. Radus reikšmingų pasiskirstymo modelių skirtumų, tyrėjas gali numatyti galimus veiksnius, lemiančius šiuos skirtumus.

Šiuo atveju galima naudoti statistiką (23), o vieno skirstinio reikšmės naudojamos kaip empiriniai dydžiai, o kito – kaip teorinės. Natūralu, kad šiuo atveju padalijimas į klasių intervalus turėtų būti vienodas abiem skirstiniams. Tai reiškia, kad visiems duomenims iš abiejų imčių parenkamos minimalios ir didžiausios reikšmės, neatsižvelgiant į tai, kuriai imčiai jos priklauso, o tada pagal pasirinktą klasių intervalų skaičių nustatomas jų plotis ir objektų skaičius. patekimas į atskirus intervalus skaičiuojamas kiekvienai imčiai atskirai .

Tokiu atveju gali pasirodyti, kad kai kuriose klasėse nėra arba į jas patenka tik kelios (35) reikšmės. Naudojant Pearsono kriterijų, gaunami patenkinami rezultatai, jei į kiekvieną intervalą patenka bent 35 reikšmės. Todėl, jei šis reikalavimas neįvykdytas, gretimi intervalai turi būti sujungti. Žinoma, tai daroma abiem platinimams.

Ir pabaigai dar viena pastaba dėl apskaičiuotos vertės ir kritinių jai taškų palyginimo pasirinktame reikšmingumo lygyje. Jau žinome, kad jei >, tada nulinė hipotezė atmetama. Tačiau vertės, artimos kritiniam taškui 1- dešinėje, turėtų kelti mums įtarimų, nes toks per geras empirinio ir teorinio skirstinių sutapimas arba du empiriniai skirstiniai (juk šiuo atveju skaičiai labai nežymiai skirsis nuo vieni kitus) atsitiktinių pasiskirstymų atveju mažai tikėtina. Šiuo atveju galimi du alternatyvūs paaiškinimai: arba mes susiduriame su įstatymu, o tada gautas rezultatas nestebina, arba eksperimentiniai duomenys kažkodėl „suderinami“ vienas su kitu, todėl reikia juos iš naujo patikrinti. .

Beje, pavyzdyje su žirneliais turime būtent pirmąjį atvejį, t.y. skirtingo lygumo ir spalvos sėklų atsiradimas palikuoniuose yra nulemtas įstatymų, todėl nenuostabu, kad apskaičiuota vertė pasirodė tokia maža.

Dabar grįžkime prie statistinės hipotezės apie dviejų empirinių skirstinių tapatumo patikrinimo. Pateikiami duomenys apie anemoninių žiedų, paimtų iš skirtingų buveinių, žiedlapių skaičiaus pasiskirstymą.

Iš lentelės duomenų aišku, kad pirmieji du ir paskutiniai du intervalai turi būti sujungti, nes į juos patenkančių reikšmių skaičiaus nepakanka, kad būtų galima teisingai naudoti Pearsono kriterijų. Iš šio pavyzdžio taip pat aišku, kad jei būtų išanalizuotas tik pasiskirstymas iš buveinės A, tada nebūtų jokio klasės intervalo, kuriame būtų 4 žiedlapiai. Tai atsirado dėl to, kad vienu metu nagrinėjami du skirstiniai, o antrajame skirstinyje yra tokia klasė.

Taigi, patikrinkime hipotezę, kad šie du skirstiniai nesiskiria vienas nuo kito. Turime

Kai laisvės laipsnių skaičius yra 4, o reikšmingumo lygis net lygus 0,001, nulinė hipotezė atmetama.

Norėdami palyginti du imčių skirstinius, taip pat galite naudoti neparametrinį kriterijų, kurį pasiūlė N. V. Smirnovas, remiantis anksčiau A. N. Kolmogorovo pateikta statistika. (Todėl šis testas kartais vadinamas Kolmogorovo-Smirnovo testu.) Šis testas pagrįstas sukauptų dažnių eilučių palyginimu. Šio kriterijaus statistika randama kaip

maks., (24)
kur ir yra sukauptų dažnių pasiskirstymo kreivės.

Kritiniai statistikos taškai (24) randami iš santykio

, (25)
kur ir yra pirmojo ir antrojo mėginių tūriai.

Kritinės reikšmės =0,1;=0,05; ir =0,01 yra atitinkamai lygūs 1,22; 1,36; 1.63. Iliustruojame Smirnovo kriterijaus naudojimą sugrupuotais duomenimis, atspindinčiais to paties amžiaus moksleivių iš dviejų skirtingų regionų augimą.

Didžiausias skirtumas tarp sukauptų dažnių kreivių yra 0,124. Jei pasirinksime reikšmingumo lygį =0,05, tai iš (25) formulės turime

0,098.

Taigi didžiausias empirinis skirtumas yra didesnis nei teoriškai tikėtasis, todėl, esant priimtam reikšmingumo lygiui, nulinė hipotezė apie dviejų nagrinėjamų skirstinių tapatumą atmetama.

Smirnovo testas taip pat gali būti naudojamas nesugrupuotiems duomenims, vienintelis reikalavimas yra tai, kad duomenys turi būti paimti iš nuolatinio pasiskirstymo. Taip pat pageidautina, kad kiekviename mėginyje reikšmių skaičius būtų bent 40–50.

Nulinei hipotezei patikrinti, pagal kurią dvi nepriklausomos n ir m dydžių imtys atitinka tas pačias pasiskirstymo funkcijas, F. Wilcoxon pasiūlė neparametrinį kriterijų, kuris buvo pagrįstas G. Mann ir F. Whitney darbuose. Todėl literatūroje šis kriterijus vadinamas arba Wilcoxon kriterijumi, arba Mann-Whitney kriterijumi. Šį kriterijų patartina taikyti, kai imties dydžiai yra maži, o kitų kriterijų naudojimas yra netinkamas.

Toliau pateikti skaičiavimai iliustruoja kriterijų sudarymo metodą, pagal kurį naudojama statistika, susijusi ne su pačiomis imties reikšmėmis, o su jų eilėmis.

Turime du n ir m dydžių pavyzdžius. Sukurkime iš jų bendrą variacijų eilutę ir palyginkime kiekvieną iš šių reikšmių su jos rangu (), t.y. eilės numeris, kurį jis užima reitinguotoje serijoje. Jei nulinė hipotezė teisinga, tai bet koks rangų pasiskirstymas yra vienodai tikėtinas, o bendras galimų rangų kombinacijų skaičius duotoms n ir m yra lygus N=n+m elementų kombinacijų skaičiui m.

Wilcoxon testas pagrįstas statistika

. (26)

Formaliai, norint patikrinti nulinę hipotezę, reikia suskaičiuoti visas galimas rangų kombinacijas, kurių W statistika įgyja reikšmes, lygias arba mažesnes už gautas konkrečioje eilėje, ir rasti šio skaičiaus santykį su visu galimų abiejų imčių rangų kombinacijų skaičius. Palyginę gautą reikšmę su pasirinktu reikšmingumo lygiu, galėsite priimti arba atmesti nulinę hipotezę. Šio metodo loginis pagrindas yra tas, kad jei vienas skirstinys yra šališkas kito atžvilgiu, tai pasireikš tuo, kad mažos eilės daugiausia turėtų atitikti vieną imtį, o didelės - kitą. Atsižvelgiant į tai, atitinkamos rangų sumos turėtų būti mažos arba didelės, priklausomai nuo to, kuri alternatyva atsiranda.

Būtina patikrinti hipotezę apie pasiskirstymo funkcijų, charakterizuojančių abu matavimo metodus, tapatumą, kai reikšmingumo lygis yra =0,05.

Šiame pavyzdyje n = 3, m = 2, N = 2+3 = 5, o eilių suma, atitinkanti matavimus taikant B metodą, yra 1+3 = 4.

Užrašykime visus =10 galimų rangų skirstinių ir jų sumas:

Reitingai: 1,2 1,3 1,4 1,5 2,3 2,4 2,5 3,4 3,5 4,5

Sumos: 3 4 5 6 5 6 7 7 8 9

Rangų kombinacijų skaičiaus, kurių suma neviršija B metodui gautos reikšmės 4, santykis su visu galimų rangų kombinacijų skaičiumi yra 2/10=0,2>0,05, todėl šiam pavyzdžiui nulinė hipotezė yra priimtas.

Esant mažoms n ir m reikšmėms, nulinę hipotezę galima patikrinti tiesiogiai skaičiuojant atitinkamų rangų sumų derinių skaičių. Tačiau didelėms imtims tai tampa praktiškai neįmanoma, todėl buvo gautas aproksimacija W statistikai, kuri, kaip paaiškėjo, asimptotiškai linksta į normalųjį pasiskirstymą su atitinkamais parametrais. Mes apskaičiuosime šiuos parametrus, kad parodytume rangais pagrįstų statistinių testų sintezės metodą. Tai darydami naudosime 37 skyriuje pateiktus rezultatus.

Tegu W yra rangų suma, atitinkanti vieną iš imčių, pavyzdžiui, tą, kurios tūris yra m. Leisti būti šių gretų aritmetiniu vidurkiu. Matematinis vertės lūkestis yra

kadangi pagal nulinę hipotezę m dydžio imties elementų eilės reiškia imtį iš baigtinės populiacijos 1, 2,...,N (N=n+m). Yra žinoma, kad

Štai kodėl.

Skaičiuodami dispersiją, pasinaudojame tuo, kad bendros reitinguotos serijos gretų kvadratų suma, sudaryta iš abiejų imčių reikšmių, yra lygi

Atsižvelgdami į anksčiau gautus ryšius bendrųjų populiacijų ir imčių dispersijoms įvertinti, turime

Iš to išplaukia

Įrodyta, kad statistika

(27)

dideliems n ir m jis turi asimptotiškai vienetinį normalųjį pasiskirstymą.

Pažiūrėkime į pavyzdį. Tegul gaunami dviejų amžiaus grupių kraujo serumo filtrato poliarografinio aktyvumo duomenys. Būtina patikrinti hipotezę su reikšmingumo lygiu =0,05, kad mėginiai paimti iš bendrųjų populiacijų, turinčių vienodas pasiskirstymo funkcijas. Pirmosios imties rangų suma yra 30, antrosios - 90. Rangų sumų skaičiavimo teisingumo patikrinimas yra sąlygos įvykdymas. Mūsų atveju 30+90=(7+8)(7+8+1):

:2=120. Pagal (27) formulę, naudodami antrosios imties rangų sumą, turime

Jei naudosime pirmosios imties rangų sumą, gausime reikšmę = -3,01. Kadangi apskaičiuota statistika turi vienetinį normalųjį skirstinį, natūralu, kad tiek pirmuoju, tiek antruoju atveju nulinė hipotezė atmetama, nes 5% reikšmingumo lygio kritinė reikšmė yra modulo 1,96.

Naudojant Wilcoxon testą, kyla tam tikrų sunkumų, kai abiejuose mėginiuose randamos tos pačios vertės, nes naudojant aukščiau pateiktą formulę, testo galia sumažėja, kartais labai.

Kad tokiais atvejais klaidų būtų iki minimumo, patartina vadovautis tokia nykščio taisykle. Pirmą kartą susidūrus su identiškomis skirtingiems pavyzdžiams priklausančiomis reikšmėmis, kurią iš jų variacijų serijoje pateikti pirmą, nustatoma atsitiktinai, pavyzdžiui, metant monetą. Jei tokių verčių yra kelios, atsitiktinai nustačius pirmąją, likusios vienodos vertės iš abiejų mėginių keičiamos. Tais atvejais, kai randamos kitos vienodos vertės, atlikite tai. Jei pirmoje lygių reikšmių grupėje pirmoji vertė buvo atsitiktinai parinkta iš vieno konkretaus pavyzdžio, tada kitoje lygių reikšmių grupėje pirmiausia pasirenkama vertė iš kitos imties ir pan.

5. Atsitiktinumo tikrinimo ir pašalinių stebėjimų vertinimo kriterijai

Gana dažnai duomenys renkami nuosekliai laike ar erdvėje. Pavyzdžiui, atliekant psichofiziologinius eksperimentus, kurie gali trukti kelias valandas, kelias dešimtis ar šimtus kartų, matuojamas latentinis (latentinis periodas) reakcijos į pateiktą regos dirgiklį arba geografiniuose tyrimuose, kai vietose, esančiose. tam tikrose vietose, pavyzdžiui, palei miškų pakraštį, skaičiuojamas tam tikros rūšies augalų skaičius ir kt. Kita vertus, skaičiuojant įvairią statistiką, daroma prielaida, kad pirminiai duomenys yra nepriklausomi ir vienodai paskirstyti. Todėl verta patikrinti šią prielaidą.

Pirma, apsvarstykite kriterijų, kaip patikrinti identiškai normaliai paskirstytų verčių nepriklausomumo nulinę hipotezę. Taigi šis kriterijus yra parametrinis. Jis pagrįstas nuoseklių skirtumų vidutinių kvadratų apskaičiavimu

. (28)

Jei įvesime naują statistiką, tada, kaip žinoma iš teorijos, jei nulinė hipotezė yra teisinga, statistika

(29)
n>10 pasiskirsto asimptotiškai pagal standartinį normalųjį pasiskirstymą.

Pažiūrėkime į pavyzdį. Pateikiamas tiriamojo reakcijos laikas () viename iš psichofiziologinių eksperimentų.

Turime: iš kur

Kadangi =0,05 kritinė reikšmė yra 1,96, nulinė hipotezė apie gautų eilučių nepriklausomumą priimama su pasirinktu reikšmingumo lygiu.

Kitas klausimas, kuris dažnai kyla analizuojant eksperimentinius duomenis, yra tai, ką daryti su kai kuriais stebėjimais, kurie smarkiai skiriasi nuo daugelio stebėjimų. Tokie išskirtiniai pastebėjimai gali atsirasti dėl metodinių klaidų, skaičiavimo klaidų ir pan. Visais atvejais, kai eksperimentatorius žino, kad stebėjime įsivėlė klaida, jis privalo neįtraukti šios reikšmės, nepaisant jos dydžio. Kitais atvejais kyla tik įtarimas dėl klaidos, o tuomet reikia pasitelkti atitinkamus kriterijus, kad būtų priimtas konkretus sprendimas, t.y. neįtraukti arba palikti pašalinius pastebėjimus.

Apskritai klausimas keliamas taip: ar stebėjimai atliekami su ta pačia populiacija, ar kai kurios dalys ar atskiros vertybės priklauso kitai populiacijai?

Žinoma, vienintelis patikimas būdas atmesti atskirus stebėjimus yra atidžiai ištirti sąlygas, kuriomis šie stebėjimai buvo gauti. Jei dėl kokių nors priežasčių sąlygos skyrėsi nuo standartinių, stebėjimai turėtų būti neįtraukti į tolesnę analizę. Tačiau tam tikrais atvejais esami kriterijai, nors ir netobuli, gali būti labai naudingi.

Čia be įrodymų pateiksime keletą ryšių, kuriais galima patikrinti hipotezę, kad stebėjimai atliekami atsitiktinai toje pačioje populiacijoje. Turime

(30)

(31)

(32)

kur yra įtariamas „išskirtinis“ stebėjimas. Jei visos serijos reikšmės yra reitinguojamos, ryškiausias stebėjimas joje užims n-ąją vietą.

Statistikos (30) paskirstymo funkcija pateikiama lentelėse. Pateikti šio skirstinio kritiniai taškai kai kuriems n.

Kritinės statistikos vertės (31), priklausančios nuo n, yra

4,0; 6

4,5; 100

5,0; n > 1000.

(31) formulė daro prielaidą, kad ir yra apskaičiuojama neatsižvelgiant į įtariamą stebėjimą.

Su statistika (32) padėtis yra sudėtingesnė. Parodyta, kad jei jie pasiskirstę tolygiai, tada matematinis lūkestis ir dispersija turi tokią formą:

Kritinę sritį sudaro mažos reikšmės, atitinkančios dideles reikšmes. Jei norite patikrinti, ar yra mažiausios reikšmės „išskirtinis“, pirmiausia pakeiskite duomenis taip, kad jie pasiskirstytų tolygiai per intervalą, tada pridėkite šias vienodas reikšmes į 1 ir patikrinkite naudodami formulę ( 32).

Apsvarstykite galimybę naudoti aukščiau pateiktus kriterijus šioms reitinguotoms stebėjimų serijoms: 3,4,5,5,6,7,8,9,9,10,11,17. Turite nuspręsti, ar didžiausia vertė 17 turėtų būti atmesta.

Turime: Pagal formulę (30) =(17-11)/3,81=1,57, o nulinė hipotezė turėtų būti priimta esant =0,01. Pagal formulę (31) = (17-7,0)/2,61 = 3,83, taip pat turėtų būti priimta nulinė hipotezė. Norėdami naudoti trečiąjį kriterijų, randame =5,53, tada

w statistika paprastai pasiskirsto su nuliniu vidurkiu ir vieneto dispersija, todėl priimama nulinė hipotezė, kai =0,05.

Statistikos naudojimo sunkumas (32) yra poreikis turėti a priori informaciją apie imties reikšmių pasiskirstymo dėsnį, o tada analitiškai transformuoti šį skirstinį į vienodą pasiskirstymą per intervalą.

Literatūra

1. Eliseeva I.I. Bendroji statistikos teorija: vadovėlis universitetams / I.I. Eliseeva, M.M. Juzbaševas; redagavo I.I. Elizieva. M.: Finansai ir statistika, 2009. 656 p.

2. Efimova M.R. Bendrosios statistikos teorijos seminaras: vadovėlis universitetams / M.R. Efimova ir kt. M.: Finansai ir statistika, 2007. 368 p.

3. Melkumovas Y.S. Socialinė-ekonominė statistika: edukacinis ir metodinis vadovas. M.: IMPE-PUBLISH, 2007. 200 p.

4. Bendroji statistikos teorija: Statistinė metodika tiriant komercinę veiklą: vadovėlis universitetams / O.E. Bašina ir kiti; redagavo O.E. Bašina, A.A. Spirina. - M.: Finansai ir statistika, 2008. 440 p.

5. Salinas V.N. Statistikos teorijos kursas, skirtas finansų ir ekonomikos profilių specialistams rengti: vadovėlis / V.N. Salinas, E. Yu. Churilova. M.: Finansai ir statistika, 2007. 480 p.

6. Socialinė-ekonominė statistika: seminaras: vadovėlis / V.N. Salin ir kt.; redagavo V.N. Salina, E.P. Špakovskaja. M.: Finansai ir statistika, 2009. 192 p.

7. Statistika: vadovėlis / A.V. Bagat ir kt.; redagavo V.M. Simchers. M.: Finansai ir statistika, 2007. 368 p.

8. Statistika: vadovėlis / I.I. Eliseeva ir kiti; redagavo I.I. Elizieva. M.: Aukštasis mokslas, 2008. - 566 p.

9. Statistikos teorija: vadovėlis universitetams / R.A. Šmoilova ir kiti; redagavo R.A. Šmoilova. - M.: Finansai ir statistika, 2007. 656 p.

10. Shmoilova R.A. Statistikos teorijos seminaras: vadovėlis universitetams / R.A. Šmoilova ir kiti; redagavo R.A. Šmoilova. - M.: Finansai ir statistika, 2007. 416 p.

PUSLAPIS \* SUJUNGTI 1

Kiti panašūs darbai, kurie gali jus sudominti.vshm>

17926. Pramoninės robotikos kompaktiškumo kriterijų analizė 1,77 MB
Programinės įrangos sprendimai roboto kompaktiškumui įvertinti. Miniatiūriniai robotai gali prasiskverbti ir judėti per siauras angas, todėl jais galima atlikti įvairias užduotis uždarose erdvėse, pavyzdžiui, mažo skersmens, kelių milimetrų dydžio vamzdžiuose. Beveik visose pramonės šakose vienas iš prioritetų yra pavarų ir mechanizmų miniatiūrizavimo klausimai; jie yra itin svarbūs mažai išteklių reikalaujantiems technologiniams procesams...
1884. KVS efektyvaus personalo valdymo kriterijų kūrimas UAB „Kazan-Orgsintez“. 204,77 KB
Pagrindiniai teoriniai personalo valdymo sistemos aspektai. Personalas kaip valdymo objektas. KVS personalo valdymo sistemų tyrimo metodai. Personalo valdymo efektyvumo gerinimo būdai.
16316. ir ši teorija išsprendžia šią dilemą; b norint išspręsti šią dilemą, būtina egzistuoti šios teorijos kriterijai. 12,12 KB
Autorius teigia, kad pagrindinė makroekonominės politikos dilemos fiksuoto valiutos kurso sąlygomis priežastis yra ne Tinbergeno taisyklės pažeidimas, kuris iš tikrųjų yra pasekmė, o ne priežastis, o būtinų ekonominių prielaidų fiksuoti valiutą nebuvimas. kursą, pateiktą optimalių valiutų zonų teorijoje. Šios dilemos priežastimi dažniausiai laikomas Tinbergeno taisyklės, pagal kurią, siekdama tam tikro skaičiaus ekonominių tikslų, pažeidimas, valstybė turi turėti...
18273. Kazachstano Respublikos prezidento teisinio statuso analizė visuotinai pripažintų teisinės valstybės ir valdžių padalijimo principo kriterijų požiūriu 73,64 KB
Prezidentės požiūrio esmė buvo ta, kad šalis vystytųsi natūraliai, evoliuciškai. Prezidento valdymas – numatytas valstybės Konstitucijoje, tai tam tikro regiono administracinio subjekto savivaldos institucijų veiklos nutraukimas ir pastarojo valdymo įgyvendinimas per valstybės vadovo – prezidento paskirtus įgaliotus asmenis. ir jam atskaitingi asmenys; Konstitucijoje numatytas valstybės vadovo – prezidento – suteikimas nepaprastųjų galių pasauliniu mastu...
5713. Naudojant DotNetNuke 1,87 MB
Šiame kursiniame darbe mes tyrinėsime DotNetNuke. DotNetNuke (sutrumpintas pavadinimas DNN) yra svetainės turinio valdymo sistema (Web Content Management System, sutrumpintai WCMS), kuri perėmė visus geriausius pasiekimus interneto projektų kūrimo technologijų srityje.
7073. SĄSAJŲ NAUDOJIMAS 56,59 KB
Žodžio sąsaja yra polisemantinis žodis ir skirtinguose kontekstuose jis turi skirtingas reikšmes. Yra programinės arba aparatinės įrangos sąsajos sąvoka, tačiau daugeliu atvejų žodis sąsaja yra siejamas su tam tikru ryšiu tarp objektų ar procesų.
6471. Registro struktūra ir naudojimas 193,04 KB
Registrų struktūra ir naudojimas Registrai skirti saugoti ir konvertuoti kelių bitų dvejetainius skaičius. Registrai sudaromi kaip sutvarkyta šlepečių seka. Mikroprocesoriuose registrai yra pagrindinė priemonė greitai įsiminti ir saugoti skaitmeninę informaciją. Elementai, iš kurių sukurti registrai, yra D RS JK šlepetės su dinaminiu impulsų išjungimu arba statiniu valdymu.
6472. Skaitiklių struktūra ir naudojimas 318,58 KB
Asinchroninių skaitiklių klasifikacija ir konstravimo principas Skaitiklis – tai įrenginys, kurio išėjimuose formuojamas dvejetainis kodas, išreiškiantis skaitiklio įėjime gaunamų impulsų skaičių. Galimų skaitiklio būsenų skaičius vadinamas jo moduliu arba skaičiavimo koeficientu ir nurodomas. Pagrindinės skaitiklių laiko charakteristikos: maksimalus skaičiavimo impulsų atvykimo dažnis; perėjimo iš vienos būsenos į kitą laikas; Yra pačios skaitinės mikroschemos ir grandinės, sukurtos remiantis vienu ar daugiau...
7066. MENIU NAUDOJIMAS PROGRAMOJĖJE 240,2 KB
Programos meniu Programos meniu turi atitikti pagrindinius programos veikimo režimus, todėl su meniu elementų ir atskirų elementų komandomis turi būti elgiamasi ypač atsargiai. Norėdami geriau suprasti meniu naudojimo programose technologiją, spręsdami šią mokymo programą apsvarstykite veiksmų seką. Visi veiksmai turi būti atlikti naudojant meniu.
7067. DIALOGŲ MENIU NAUDOJIMAS 73,13 KB
Tęsdami programos su meniu ir įrankių juosta kūrimą, turime parašyti kodą pranešimų tvarkytojams komandoms sukurti 6*6 matricą ir išvesti (spausdinti) matricą į mūsų programos kliento sritį. Matricos kūrimas turi būti baigtas ekrane pateikiant pranešimą, nurodantį sėkmingą tvarkyklės užbaigimą, pavyzdžiui, „Matrica sukurta“.

Statistinės hipotezės. Sutikimo kriterijai.

Null(pagrindinis) iškviesti hipotezę, pateiktą apie nežinomo skirstinio formą arba apie žinomų skirstinių parametrus. Konkuruojantis (alternatyva) vadinama hipoteze, kuri prieštarauja nulinei hipotezei.

Pavyzdžiui, jei nulinė hipotezė yra ta, kad atsitiktinis kintamasis X yra pasiskirstęs pagal dėsnį, tada konkuruojanti hipotezė gali būti, kad atsitiktinis kintamasis X platinami pagal kitą įstatymą.

Statistinis kriterijus(arba tiesiog kriterijus) vadinamas atsitiktiniu dydžiu KAM, kuri padeda patikrinti nulinę hipotezę.

Pasirinkus tam tikrą kriterijų, pavyzdžiui, kriterijų , visų galimų jo reikšmių rinkinys yra padalintas į du atskirus poaibius: viename iš jų yra kriterijų reikšmės, kurioms esant nulinė hipotezė atmetama, o kitame – kuriai esant ji. yra priimtas.

Kritinė sritis yra kriterijų reikšmių rinkinys, kuriam esant nulinė hipotezė atmetama. Hipotezių priėmimo sritis Iškvieskite kriterijų verčių rinkinį, pagal kurį hipotezė priimta. Kritiniai taškai Jie vadina taškus, skiriančius kritinę sritį nuo regiono, kuriame priimta nulinė hipotezė.

Mūsų pavyzdyje, kai reikšmė yra , iš imties apskaičiuota reikšmė atitinka hipotezės priėmimo sritį: atsitiktinis dydis paskirstomas pagal įstatymą. Jei apskaičiuota reikšmė yra , tai ji patenka į kritinę sritį, tai yra, hipotezė apie atsitiktinio dydžio pasiskirstymą pagal dėsnį atmetama.

Pasiskirstymo atveju kritinė sritis nustatoma pagal nelygybę, sritis, kurioje priimta nulinė hipotezė, – pagal nelygybę.

2.6.3. Susitarimo kriterijus Pearsonas.

Vienas iš gyvūnų mokslo ir veterinarinės genetikos uždavinių yra naujų veislių ir rūšių išveisimas, turintis reikiamas savybes. Pavyzdžiui, imuniteto didinimas, atsparumas ligoms ar kailio spalvos keitimas.

Praktikoje, analizuojant rezultatus, labai dažnai paaiškėja, kad realūs rezultatai daugiau ar mažiau atitinka kokį nors teorinį pasiskirstymo dėsnį. Reikia įvertinti faktinių (empirinių) ir teorinių (hipotetinių) duomenų atitikimo laipsnį. Norėdami tai padaryti, iškelkite nulinę hipotezę: gauta populiacija paskirstoma pagal „A“ dėsnį. Hipotezė apie numatomą pasiskirstymo dėsnį tikrinama naudojant specialiai parinktą atsitiktinį dydį – tinkamumo kriterijų.

Susitarimo kriterijus vadinamas hipotezės apie tariamą nežinomo skirstinio dėsnį tikrinimo kriterijumi.

Yra keli susitarimo kriterijai: Pearsonas, Kolmogorovas, Smirnovas ir kt. Dažniausiai naudojamas Pearsono tinkamumo testas.

Panagrinėkime Pirsono kriterijaus taikymą pasitelkdami hipotezės apie normalųjį populiacijos pasiskirstymą patikrinimo pavyzdį. Tuo tikslu palyginsime empirinius ir teorinius (skaičiuojamus normaliojo skirstinio tęsinyje) dažnius.

Paprastai teoriniai ir empiriniai dažniai skiriasi. Pavyzdžiui:

Empiriniai dažniai 7 15 41 93 113 84 25 13 5

Teoriniai dažniai 5 13 36 89 114 91 29 14 6

Panagrinėkime du atvejus:

Neatitikimas tarp teorinių ir empirinių dažnių yra atsitiktinis (nereikšmingas), t.y. galima pateikti pasiūlymą dėl empirinių dažnių pasiskirstymo pagal įprastą dėsnį;

Neatitikimas tarp teorinių ir empirinių dažnių nėra atsitiktinis (reikšmingas), t.y. teoriniai dažniai buvo apskaičiuoti remiantis neteisinga normalaus populiacijos pasiskirstymo hipoteze.

Naudodami Pearsono tinkamumo testą galite nustatyti, ar teorinių ir empirinių dažnių neatitikimas yra atsitiktinis, ar ne, t.y. su nurodyta pasikliovimo tikimybe nustatykite, ar populiacija pasiskirsto pagal įprastą dėsnį, ar ne.

Taigi, empirinis skirstinys gaunamas iš n dydžio imties:

Variantai......

Empiriniai dažniai……

Tarkime, kad teoriniai dažniai apskaičiuojami remiantis normaliojo skirstinio prielaida. Reikšmingumo lygmenyje būtina patikrinti nulinę hipotezę: populiacija yra normaliai pasiskirstyta.

Nulinės hipotezės tikrinimo kriteriju imsime atsitiktinį kintamąjį

(*)

Šis dydis yra atsitiktinis, nes skirtinguose eksperimentuose jis įgauna skirtingas, anksčiau nežinomas reikšmes. Akivaizdu, kad kuo mažiau skiriasi empirinis ir teorinis dažnis, tuo mažesnė kriterijaus reikšmė, todėl tam tikru mastu jis apibūdina empirinio ir teorinio skirstinių artumą.

Įrodyta, kad kai atsitiktinio dydžio (*) pasiskirstymo dėsnis, nepriklausomai nuo to, kuriam skirstymo dėsniui priklauso bendroji visuma, yra linkęs į laisvės laipsnius turintį skirstymo dėsnį. Todėl atsitiktinis dydis (*) žymimas , o pats kriterijus vadinamas „chi kvadrato“ tinkamumo testu.

Iš stebėjimo duomenų apskaičiuotą kriterijaus reikšmę pažymėkime . Lentelėje pateiktos kriterijaus kriterijaus reikšmės tam tikram reikšmingumo lygiui ir laisvės laipsnių skaičiui žymimos . Šiuo atveju laisvės laipsnių skaičius nustatomas iš lygybės , kur yra imties arba klasių grupių (dalinių intervalų) skaičius; - laukiamo skirstinio parametrų skaičius. Normalus skirstinys turi du parametrus – matematinį lūkestį ir standartinį nuokrypį. Todėl iš lygybės randamas normalaus skirstinio laisvės laipsnių skaičius

Jei apskaičiuota reikšmė ir lentelės reikšmė tenkina nelygybę , priimta nulinė hipotezė apie normalų populiacijos pasiskirstymą. Jeigu , nulinė hipotezė atmetama, o alternatyvi hipotezė priimama (populiacija normaliai nepasiskirsto).

komentuoti. Naudojant Pearsono tinkamumo testą, imties dydis turi būti bent 30. Kiekvienoje grupėje turi būti bent 5 parinktys. Jei grupėse yra mažiau nei 5 dažniai, jie sujungiami su kaimyninėmis grupėmis.

Apskritai chi kvadrato skirstinio laisvės laipsnių skaičius apibrėžiamas kaip bendras reikšmių, iš kurių apskaičiuojami atitinkami rodikliai, skaičius, atėmus šias reikšmes jungiančių sąlygų skaičių, t. sumažinti jų skirtumo galimybę. Paprasčiausiais atvejais, skaičiuojant, laisvės laipsnių skaičius bus lygus klasių skaičiui, sumažintam vienu. Taigi, pavyzdžiui, suskaidant dihibridą, gaunamos 4 klasės, tačiau tik pirmoji klasė yra nesusijusi, kitos jau yra susijusios su ankstesnėmis. Todėl dihibridiniam skaidymui laisvės laipsnių skaičius yra .



1 pavyzdys. Nustatyti faktinio grupių pasiskirstymo pagal tuberkulioze sergančių karvių skaičių atitikties teoriškai tikėtinam laipsniui, kuris buvo apskaičiuotas atsižvelgiant į normalųjį pasiskirstymą. Šaltiniai duomenys apibendrinti lentelėje:

Sprendimas.

Remdamiesi reikšmingumo lygiu ir laisvės laipsnių skaičiumi iš skirstinio kritinių taškų lentelės (žr. 4 priedą), randame reikšmę . Kadangi , galime daryti išvadą, kad skirtumas tarp teorinių ir faktinių dažnių yra atsitiktinis. Taigi faktinis grupių pasiskirstymas pagal tuberkulioze sergančių karvių skaičių atitinka teoriškai numatomą.

2 pavyzdys. Teorinis individų pasiskirstymas pagal fenotipą, gautas antroje kartoje dihibridiniu triušių kryžminimo būdu pagal Mendelio dėsnį, yra 9: 3: 3: 1. Reikia apskaičiuoti triušių empirinio pasiskirstymo atitiktį kryžminant juodaodžius individus su normaliu plauku. su pūkuotais gyvūnais – albinosais. Kryžminant antroje kartoje, buvo gauta 120 palikuonių, iš jų 45 juodi trumpaplaukiai, 30 juodi pūkuoti triušiai, 25 balti trumpaplaukiai, 20 balti pūkuoti triušiai.

Sprendimas. Teoriškai numatoma palikuonių segregacija turėtų atitikti keturių fenotipų santykį (9: 3: 3: 1). Apskaičiuokime teorinius dažnius (įvarčių skaičių) kiekvienai klasei:

9+3+3+1=16, vadinasi, galime tikėtis, kad bus juodų trumpaplaukių ; juodas pūkas - ; balta trumpaplaukė - ; balta pūkinė - .

Empirinis (faktinis) fenotipų pasiskirstymas buvo toks: 45; 30; 25; 20.

Visus šiuos duomenis apibendrinkime šioje lentelėje:

Naudodami Pearsono tinkamumo testą, apskaičiuojame vertę:

Dihibridinio kryžminimo laisvės laipsnių skaičius. Dėl reikšmingumo lygio rasti vertę . Kadangi , galime daryti išvadą, kad skirtumas tarp teorinių ir faktinių dažnių nėra atsitiktinis. Vadinasi, gauta triušių grupė fenotipų pasiskirstymu nukrypsta nuo Mendelio dėsnio dihibridinio kryžminimo metu ir atspindi tam tikrų faktorių, keičiančių fenotipinės segregacijos tipą antroje mišrūnų kartoje, įtaką.

Pirsono chi kvadrato tinkamumo testas taip pat gali būti naudojamas dviejų vienalyčių empirinių skirstinių palyginimui tarpusavyje, t.y. tie, kurie turi tas pačias klasių ribas. Nulinė hipotezė yra hipotezė, kad dvi nežinomos pasiskirstymo funkcijos yra lygios. Chi kvadrato testas tokiais atvejais nustatomas pagal formulę

(**)

kur ir yra lyginamų skirstinių tūriai; ir - atitinkamų klasių dažniai.

Apsvarstykite dviejų empirinių skirstinių palyginimą naudodami šį pavyzdį.

3 pavyzdys. Gegutės kiaušinių ilgis buvo matuojamas dviejose teritorinėse zonose. Pirmoje zonoje buvo ištirtas 76 kiaušinių () mėginys, antrojoje – 54 (). Buvo gauti šie rezultatai:

Ilgis (mm)
Dažniai
Dažniai - - -

Reikšmingumo lygmenyje turime patikrinti nulinę hipotezę, kad abu kiaušinių mėginiai priklauso tai pačiai gegutės populiacijai.

Hipotezei apie empirinio skirstinio atitikimą teoriniam pasiskirstymo dėsniui patikrinti naudojami specialūs statistiniai rodikliai - tinkamumo kriterijai (arba atitikties kriterijai). Tai apima Pearsono, Kolmogorovo, Romanovskio, Jastremskio ir kt. kriterijus. Dauguma susitarimo kriterijų yra pagrįsti empirinių dažnių nuokrypių nuo teorinių naudojimu.

Akivaizdu, kad kuo šie nuokrypiai mažesni, tuo geriau teorinis skirstinys atitinka empirinį (arba jį apibūdina). Sutikimo kriterijai

- tai kriterijai hipotezėms apie empirinio skirstinio atitikimą teoriniam tikimybių skirstiniui tikrinti. Tokie kriterijai skirstomi į dvi klases: bendruosius ir specialiuosius. Bendrieji tinkamumo testai taikomi pačiai bendriausiai hipotezės formuluotei, ty hipotezei, kad pastebėti rezultatai sutampa su bet kokiu a priori numanomu tikimybių skirstiniu. Specialūs tinkamumo testai apima specialias nulines hipotezes, kurios sutinka su tam tikra tikimybių pasiskirstymo forma.

Susitarimo kriterijai, remiantis nustatytu paskirstymo įstatymu, leidžia nustatyti, kada teorinių ir empirinių dažnių neatitikimai laikytini nereikšmingais (atsitiktiniai), o kada – reikšmingais (neatsitiktiniais). Iš to išplaukia, kad susitarimo kriterijai leidžia atmesti arba patvirtinti hipotezės, iškeltos derinant eilutes apie pasiskirstymo pobūdį empirinėje eilutėje teisingumą, teisingumą ir atsakyti, ar galima priimti tam tikrą empirinį pasiskirstymą. modelis, išreikštas kažkokiu teoriniu skirstymo dėsniu. Pearsono tinkamumo testas

c 2 (chi kvadratas) yra vienas iš pagrindinių susitarimo kriterijų. Anglų matematiko Karlo Pearsono (1857-1936) pasiūlymas empirinių ir teorinių skirstinių dažnių neatitikimų atsitiktinumui (reikšmiškumui) įvertinti:

C 2 kriterijaus taikymo teorinių ir empirinių skirstinių nuoseklumui įvertinti schema yra tokia:

1. Nustatomas apskaičiuotas neatitikimo matas.

2. Nustatomas laisvės laipsnių skaičius.

3. Pagal laisvės laipsnių skaičių n, naudojant specialią lentelę, nustatomas.

Reikšmingumo lygis yra tikimybė klaidingai atmesti iškeltą hipotezę, t.y. tikimybė, kad teisinga hipotezė bus atmesta. Statistiniuose tyrimuose, atsižvelgiant į sprendžiamų problemų svarbą ir atsakomybę, naudojami šie trys reikšmingumo lygiai:

1) a = 0,1, tada R = 0,9;

2) a = 0,05, tada R = 0,95;

3) a = 0,01, tada R = 0,99.

Naudojant susitarimo kriterijų c 2, turi būti įvykdytos šios sąlygos:

1. Tiriamos populiacijos apimtis turi būti pakankamai didelė ( N≥ 50), o dažnis arba grupės dydis turi būti ne mažesnis kaip 5. Jei ši sąlyga pažeidžiama, pirmiausia reikia derinti mažus dažnius (mažiau nei 5).

2. Empirinis skirstinys turi susidėti iš duomenų, gautų atsitiktinės atrankos būdu, t.y. jie turi būti nepriklausomi.

Pearsono tinkamumo kriterijaus trūkumas yra dalies pradinės informacijos, susijusios su poreikiu sugrupuoti stebėjimo rezultatus į intervalus ir sujungti atskirus intervalus su nedideliu stebėjimų skaičiumi, praradimas. Atsižvelgiant į tai, paskirstymo atitikties patikrą pagal kriterijų rekomenduojama papildyti 2 kitais kriterijais. Tai ypač būtina, kai imties dydis yra palyginti mažas ( n ≈ 100).

Statistikoje Kolmogorovo tinkamumo testas(taip pat žinomas kaip Kolmogorovo-Smirnovo tinkamumo testas) naudojamas nustatyti, ar du empiriniai skirstiniai paklūsta tam pačiam dėsniui, arba nustatyti, ar gautas skirstinys paklūsta numanomam modeliui. Kolmogorovo kriterijus pagrįstas didžiausio neatitikimo tarp sukauptų dažnių arba empirinių ar teorinių skirstinių dažnių nustatymu. Kolmogorovo kriterijus apskaičiuojamas naudojant šias formules:

Kur D Ir d- atitinkamai didžiausias skirtumas tarp sukauptų dažnių ( ff¢) ir tarp sukauptų dažnių ( pp¢) empirinės ir teorinės skirstinių eilės; N- suvestinių vienetų skaičius.

Apskaičiavus λ reikšmę, specialia lentele nustatoma tikimybė, su kuria galima teigti, kad empirinių dažnių nuokrypiai nuo teorinių yra atsitiktiniai. Jei ženklo reikšmės yra iki 0,3, tai reiškia, kad yra visiškas dažnių sutapimas. Su dideliu stebėjimų skaičiumi Kolmogorovo testas gali aptikti bet kokį nukrypimą nuo hipotezės. Tai reiškia, kad bet koks skirtumas tarp imties pasiskirstymo ir teorinio bus aptiktas jo pagalba, jei bus pakankamai daug stebėjimų. Praktinė šios savybės reikšmė nėra reikšminga, nes daugeliu atvejų sunku tikėtis, kad pastoviomis sąlygomis bus gautas didelis stebėjimų skaičius, teorinė pasiskirstymo dėsnio, kuriam turėtų paklusti pavyzdys, visada yra apytikslė, ir statistinių testų tikslumas neturėtų viršyti pasirinkto modelio tikslumo.

Romanovskio tinkamumo testas remiasi Pirsono kriterijaus vartojimu, t.y. jau rastos c 2 reikšmės ir laisvės laipsnių skaičius:

čia n yra kitimo laisvės laipsnių skaičius.

Romanovskio kriterijus yra patogus, jei nėra lentelių. Jeigu< 3, то расхождения распределений случайны, если же >3, tada jie nėra atsitiktiniai ir teorinis skirstinys negali būti tiriamo empirinio skirstinio modelis.

B. S. Yastremsky susitarimo kriterijumi naudojo ne laisvės laipsnių skaičių, o grupių skaičių ( k), speciali q reikšmė, priklausanti nuo grupių skaičiaus, ir chi kvadrato reikšmė. Yastremskio tinkamumo testas turi tą pačią reikšmę kaip ir Romanovskio kriterijus ir išreiškiamas formule

kur c 2 yra Pirsono tinkamumo kriterijus; - grupių skaičius; q - koeficientas, mažesniam nei 20 grupių skaičiui, lygus 0,6.

Jeigu L faktas > 3, teorinių ir empirinių skirstinių neatitikimai nėra atsitiktiniai, t.y. empirinis skirstinys neatitinka normaliojo skirstinio reikalavimų. Jeigu L faktas< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.

51 apibrėžimas. Kriterijai, leidžiantys spręsti, ar vertybės atitinka X 1 , X 2 ,…, x n atsitiktinis kintamasis X su hipoteze dėl jo pasiskirstymo funkcijos yra vadinami sutikimo kriterijai.

Idėja naudoti sutikimo kriterijus

Tegul remiantis šia statistine medžiaga patikrinama hipotezė N, susidedantis iš to, kad SV X paklūsta tam tikram platinimo įstatymui. Šis dėsnis gali būti nurodytas kaip paskirstymo funkcija F(x), arba pasiskirstymo tankio forma f(x), arba kaip tikimybių rinkinį p i. Kadangi iš visų šių formų pasiskirstymo funkcija F(x) yra bendriausias (egzistuoja ir DSV, ir NSV) ir nustato bet kurią kitą, mes suformuluosime hipotezę N, nes susideda iš to, kad kiekis X turi paskirstymo funkciją F(x).

Priimti arba atmesti hipotezę N, apsvarstykite tam tikrą kiekį U, apibūdinantis teorinių ir statistinių skirstinių divergencijos (nukrypimo) laipsnį. DidumasU galima pasirinkti įvairiais būdais: 1) teorinių tikimybių kvadratinių nuokrypių suma p i nuo atitinkamų dažnių, 2) tų pačių kvadratų su kai kuriais koeficientais (svoriais) suma, 3) didžiausias statistinio (empirinio) pasiskirstymo funkcijos nuokrypis nuo teorinės. F(x).

Tegul vertė U pasirinktas vienaip ar kitaip. Akivaizdu, kad tai yra atsitiktinis kintamasis. Paskirstymo dėsnis U priklauso nuo atsitiktinio dydžio pasiskirstymo dėsnio X, su kuriais buvo atlikti eksperimentai, ir apie eksperimentų skaičių n. Jei hipotezė N yra tiesa, tada kiekio pasiskirstymo dėsnis U nustatomas pagal kiekio pasiskirstymo dėsnį X(funkcija F(x)) ir numerį n.

Tarkime, kad šis skirstymo dėsnis yra žinomas. Dėl šios serijos eksperimentų buvo nustatyta, kad pasirinktas neatitikimo matas Uįgavo tam tikrą prasmę u. Klausimas: ar tai galima paaiškinti atsitiktinėmis priežastimis ar šis neatitikimas taip pat yra yra didelis ir rodo reikšmingą skirtumą tarp teorinio ir statistinio (empirinio) pasiskirstymo, taigi ir hipotezės netinkamumą. N? Norėdami atsakyti į šį klausimą, manykime, kad hipotezė N yra teisinga, ir pagal šią prielaidą apskaičiuojame tikimybę, kad dėl atsitiktinių priežasčių, susijusių su nepakankamu eksperimentinės medžiagos kiekiu, neatitikimo matas U bus ne mažesnė už eksperimentiškai stebėtą vertę u, tai yra, apskaičiuojame įvykio tikimybę: .

Jei ši tikimybė maža, tada hipotezė N turėtų būti atmestas kaip mažai tikėtinas, tačiau jei ši tikimybė yra reikšminga, darome išvadą, kad eksperimentiniai duomenys neprieštarauja hipotezei N.

Kyla klausimas: kaip pasirinkti neatitikimo (nukrypimo) matą? U? Pasirodo, taikant kai kuriuos jo pasirinkimo būdus, kiekio pasiskirstymo dėsnis U pasižymi labai paprastomis savybėmis ir pakankamai dideliu n praktiškai nepriklauso nuo funkcijos F(x). Būtent šie neatitikimo matai matematinėje statistikoje naudojami kaip susitarimo kriterijai.

Apibrėžimas 51/. Sutapimo kriterijus yra hipotezės apie tariamą nežinomo skirstinio dėsnį tikrinimo kriterijus.

Jei norite gauti kiekybinius duomenis, kurių pasiskirstymas artimas normaliam, naudokite parametrinis metodai, pagrįsti tokiais rodikliais kaip matematiniai lūkesčiai ir standartinis nuokrypis. Visų pirma, siekiant nustatyti dviejų imčių vidurkių skirtumo patikimumą, naudojamas Stjudento metodas (kriterijus), o norint įvertinti trijų ar daugiau pavyzdžių skirtumus, atliekamas testas. F, arba dispersijos analizė. Jei kalbame apie nekiekybinius duomenis arba mėginiai yra per maži, kad galėtume įsitikinti, kad populiacijos, iš kurių jie paimti, yra normaliai pasiskirstę, naudokite neparametrinis metodai – kriterijus χ 2(chi kvadratas) arba Pearson kokybiniams duomenims ir ženklų, rangų, Mann-Whitney, Wilcoxon ir kt. testai eilės duomenims.

Be to, statistinio metodo pasirinkimas priklauso nuo to, ar imtys, kurių vidurkiai lyginami, yra nepriklausomas(t. y., pavyzdžiui, paimta iš dviejų skirtingų dalykų grupių) arba priklausomas(t. y. atspindi tos pačios tiriamųjų grupės rezultatus prieš ir po ekspozicijos arba po dviejų skirtingų ekspozicijų).

p. 1. Pirsono testas (- chi kvadratas)

Tegul jis gaminamas n nepriklausomi eksperimentai, kurių kiekviename atsitiktinis dydis X įgavo tam tikrą reikšmę, tai yra, buvo pateikta atsitiktinio dydžio stebėjimų imtis X(bendra populiacija) apimtis n. Panagrinėkime užduotį patikrinti teorinių ir empirinių pasiskirstymo funkcijų artumą diskrečiam skirstiniui, tai yra, reikia patikrinti, ar eksperimentiniai duomenys atitinka hipotezę. N 0, nurodant, kad atsitiktinis kintamasis X turi platinimo įstatymą F(x) reikšmingumo lygiu α . Pavadinkime šį dėsnį „teoriniu“.

Gaudami hipotezės tikrinimo tinkamumo kriterijų, nustatykite matą D duotosios imties empirinės skirstinio funkcijos nuokrypiai nuo įvertintos (teorinės) skirstinio funkcijos F(x).

Dažniausiai naudojama priemonė yra ta, kurią pristatė Pearsonas. Apsvarstykime šią priemonę. Padalinkime atsitiktinių dydžių reikšmių aibę Xįjungta r rinkiniai – grupės S 1 , S 2 ,…, Sr, be bendrų taškų. Praktiškai toks skaidinys atliekamas naudojant ( r- 1) skaičiai c 1 < c 2 < … < c r-1. Tokiu atveju kiekvieno intervalo pabaiga neįtraukiama į atitinkamą rinkinį, o kairysis įtraukiamas.

S 1 S 2 S 3 …. Sr -1 Sr

c 1 c 2 c 3 c r -1

Leiskite p i, , - tikimybė, kad SV X priklauso rinkiniui S i(akivaizdu). Leiskite n i, , - reikšmių (variantų) skaičius iš aibei priklausančių stebimų dalykų S i(empiriniai dažniai). Tada santykinis SV dažnis X daugelyje S i adresu n pastebėjimai. Akivaizdu, kad,.

Dėl aukščiau pateikto padalijimo p i yra prieaugis F(x) filmavimo aikštelėje S i, o prieaugis yra tame pačiame rinkinyje. Eksperimentų rezultatus apibendrinkime lentelėje sugrupuotos statistinės eilutės forma.

Grupės ribos Santykinis dažnis
S 1:x 1 – x 2
S 2: x 2 – x 3
Sr: x rx r +1

Žinodami teorinį pasiskirstymo dėsnį, galite rasti teorines tikimybes, kad atsitiktinis dydis patenka į kiekvieną grupę: r 1 , r 2 , …, p r. Tikrindami teorinio ir empirinio (statistinio) skirstinių nuoseklumą, vadovausimės teorinių tikimybių neatitikimais p i ir stebimus dažnius.

Dėl saiko D empirinės pasiskirstymo funkcijos neatitikimai (nukrypimai) nuo teorinės paimami teorinių tikimybių kvadratinių nuokrypių suma p i iš atitinkamų dažnių, paimtų su tam tikrais "svoriais" c i: .

Šansai c iįvedami, nes bendru atveju skirtingoms grupėms priklausantys nuokrypiai negali būti laikomi vienodais reikšmingumu: absoliučia verte vienodas nuokrypis gali būti mažai reikšmingas, jei pati tikimybė p i yra didelis ir labai pastebimas, jei jis mažas. Todėl natūraliai „svoriai“ c i imti atvirkščiai proporcingą tikimybei. Kaip pasirinkti šį koeficientą?

K. Pearsonas parodė, kad jei įdėsime , tai dideliems n kiekio pasiskirstymo dėsnis U turi labai paprastas savybes: ji praktiškai nepriklauso nuo skirstinio funkcijos F(x) ir eksperimentų skaičių n, bet priklauso tik nuo grupių skaičiaus r, būtent šis dėsnis didėjant n artėja prie vadinamojo chi kvadrato skirstinio .

Jei jums reikia papildomos medžiagos šia tema arba neradote to, ko ieškojote, rekomenduojame pasinaudoti paieška mūsų darbų duomenų bazėje:

Ką darysime su gauta medžiaga:

Jei ši medžiaga jums buvo naudinga, galite ją išsaugoti savo puslapyje socialiniuose tinkluose:



Ar jums patiko straipsnis? Pasidalinkite su draugais!