Parametriniai duomenų analizės metodai. Parametrinis ir neparametrinis įvertinimo metodai

IN šiuolaikiniai tyrimai Pedagoginėse problemose plačiai taikomi matematinių duomenų apdorojimo metodai. Kiekybinių duomenų apdorojimo metodai apima statistinius tyrimo rezultatus apibendrinančius metodus, tam tikrus jų tarpusavio ryšius nustatančius ir iškeltos hipotezės patikimumo patikrinimą.

Matematinis tyrimų rezultatų apdorojimas užtikrina jų įrodymą ir reprezentatyvumą. Kartu su kokybės rodikliais kiekybinis apdorojimas duomenys žymiai padidina tyrimo objektyvumą. Statistinis apdorojimas rezultatų, atskirų reiškinių tyrimo fiksavimas leidžia daryti apibendrinimus ir išvadas apie visą tiriamų reiškinių rinkinį. Svarbi savybė statistinių metodų naudojimas pedagoginiai tyrimai yra tai, kad tai leidžia naudoti kiekybinį tyrimą net tada, kai neįmanoma nustatyti pačių tiriamų objektų savybių. Pavyzdžiui, neįmanoma tiesiogiai išmatuoti išsivystymo lygio moralines savybes mokiniams, konkretaus mokymo metodo efektyvumo laipsnį ir pan. Tačiau fiksuojant atitinkamus įvykius, veiksmus, apraiškas galima gauti tam tikrus kokybės charakteristikas visus šiuos požymius, nustato galimus jų pasireiškimo modelius ir patvirtina išsakytų hipotezių teisingumą.

Statistikoje hipotezių tikrinimas atliekamas taikant statinio skirtumų vertinimo kriterijus. Statistinis kriterijus yra lemiama taisyklė, užtikrinant patikimą elgesį, t.y. priimti tikrą hipotezę ir su didele tikimybe atmesti klaidingą (G.V. Suchodolskis). Statistiniai kriterijai taip pat nurodo skaičiavimo metodą tam tikras skaičius ir pats skaičius.

Pedagogikoje naudojami statistiniai kriterijai skirstomi į parametrinius ir neparametrinius. Parametriniai kriterijai apima kriterijus, kurie į skaičiavimo formulę įtraukia skirstinio parametrus, t.y. vidurkis ir dispersija (Student, Fisher, Chi kvadrato testai). Neparametriniai kriterijai apima tuos, kurie yra pagrįsti veikimu su dažniais arba rangais ir į pasiskirstymo parametrų skaičiavimo formulę neįtraukiami pasiskirstymo parametrai (ženklų testai, Kolmogorov-Smirnov, Wilcoxon, Mann-Whitney). Abi kriterijų grupės turi savo privalumų ir trūkumų. Lyginamosios charakteristikos Parametrinių ir neparametrinių bandymų galimybės ir apribojimai pateikti šioje lentelėje.



Parametriniai kriterijai Neparametriniai testai
Leidžia tiesiogiai įvertinti dviejų imčių vidurkių skirtumus (studento t testas) Jie leidžia įvertinti tik vidutines tendencijas (pavyzdžiui, atsakyti į klausimą, ar A pavyzdyje dažniau pasitaiko didesnės požymio reikšmės, o B pavyzdyje – mažesnės) kriterijai Q,U ir tt)
Leidžia tiesiogiai įvertinti dispersijų skirtumus (Fišerio testas) Leidžia įvertinti tik bruožo kintamumo intervalų skirtumus
Leidžia nustatyti bruožo pokyčių tendencijas pereinant nuo būklės prie būklės (vienamatė dispersijos analizė), bet tik esant normaliam požymio pasiskirstymui Leidžia nustatyti charakteristikos pokyčių tendencijas, kai pereinate nuo sąlygos prie bet kokio charakteristikos pasiskirstymo (tendencijos L ir S kriterijai)
Leidžia įvertinti dviejų ar daugiau veiksnių sąveiką jų įtakoje požymio pokyčiams (dviejų faktorių dispersijos analizė) Ši funkcija nepasiekiama
Eksperimentiniai duomenys turi atitikti dvi, o kartais ir tris sąlygas: a) charakteristikos reikšmės matuojamos intervalų skalėje; b) charakteristikos pasiskirstymas normalus; c) dispersinėje analizėje turi būti tenkinamas komplekso ląstelių dispersijų lygybės reikalavimas Eksperimentiniai duomenys gali neatitikti nė vienos iš sąlygų: a) atributų reikšmės gali būti pateikiamos bet kokia skale, pradedant nuo vardų skalės; b) charakteristikos skirstinys gali būti bet koks ir jo sutapimas su kokiu nors teoriniu skirstymo dėsniu nėra būtinas ir jo nereikia tikrinti; c) nėra dispersijų lygybės reikalavimo
Vykdant nurodytomis sąlygomis parametriniai testai yra galingesni nei neparametriniai testai Jei nurodytos sąlygos netenkinamos, neparametriniai kriterijai yra patikimesni, nes jie mažiau jautrūs „užsikimšimui“
Matematiniai skaičiavimai gana sudėtinga Matematiniai skaičiavimai dažniausiai yra paprasti ir užima mažai laiko

Parametriniai metodai

Mokinio t testas

Norėdami palyginti imties vidutines vertes, priklausančias dviem duomenų rinkiniams, ir nuspręsti, ar vidutinės vertės statistiškai reikšmingai skiriasi viena nuo kitos atliekant psichologinius ir pedagoginius eksperimentus, jie dažnai naudoja t-Studento kriterijus, kurio skaičiuojamoji vertė nustatoma pagal formulę:

,

kur yra vienos duomenų imties kintamojo vidutinė imties vertė; – vidutinė imties vertė, pagrįsta kitu duomenų pavyzdžiu; m 1 Ir m 2 - integruoti dviejų mėginių dalinių verčių nuokrypių nuo atitinkamų vidutinių verčių rodikliai.

Jeigu t apskaičiavimas yra didesnis arba lygus lentelei, tada jie daro išvadą, kad palygintos dviejų imčių vidutinės vertės iš tiesų statistiškai reikšmingai skiriasi priimtinos paklaidos tikimybe.

Šis metodas naudojamas, kai reikia nustatyti, ar eksperimentas pavyko, ar nepavyko, ar jis turėjo, ar neturėjo įtakos kokybės lygiui, kurį ketinta pakeisti.

Jeigu tįvertinta mažiau t lentele, tada šiuo atveju nėra jokios įtikinamos priežasties, kad eksperimentas buvo sėkmingas, net jei pačios vidutinės vertės eksperimento pradžioje ir pabaigoje yra absoliučios vertės yra skirtingi.

Kriterijusφ* - Kampinė Fišerio transformacija

Šis metodas aprašytas daugelyje vadovų (Plokhinsky N.A., 1970; Gubler E.V., 1978; Ivanter E.V., Korosov A.V., 1992 ir kt.) Šis aprašymas pagrįstas metodo versija, kurią sukūrė ir nurodė E.V. Gubleris.

Fišerio testas skirtas palyginti du mėginius pagal tyrėją dominančio poveikio pasireiškimo dažnį. Kriterijus įvertina dviejų imčių, kuriose užfiksuotas tyrėją dominantis poveikis, procentų skirtumų patikimumą.

Kampinės Fišerio transformacijos esmė yra konvertuoti procentus į kiekius centrinis kampas, kuris matuojamas radianais. Daugiau procentinė dalis atitiks didesnis kampasφ, o mažesnė dalis - mažesnis kampas, tačiau ryšiai čia nėra tiesiniai:

φ = 2 arcsin(),

kur yra procentas, išreikštas vieneto dalimis.

Didėjant kampų φ 1 ir φ 2 neatitikimui ir didėjant imčių skaičiui, kriterijaus reikšmė didėja. Kaip didesnę vertęφ*, tuo didesnė tikimybė, kad skirtumai yra reikšmingi.

Visi parametriniai statistiniai metodai veikia su intervalų skale, skirtingai nei neparametriniai. parametriniai metodai, daugiausia orientuota į pirmąsias dvi skales. Paaiškinkime šių metodų skirtumus.

Dauguma statistinių metodų daro prielaidą, kad stebėjimai buvo pateikti mes kalbame apie, yra išreikštos intervalų skalėje ir yra atsitiktinio dydžio realizacija, kurios skirstinys priklauso tam tikrai parametrinei skirstinių šeimai. Pavyzdžiui, atsitiktinis kintamasis turi normalųjį, Puasono ar kitą skirstinį. Tai yra, mes darome prielaidą, kad skirstinio forma yra žinoma, pavyzdžiui, galime manyti, kad normalus N (μ, δ ) modelį, bet su nežinomais parametrais μ Ir δ . Hipotezių vertinimo ir tikrinimo metodai leidžia daryti išvadas apie nežinomi parametrai, o bet kokių išvadų vertė tam tikru mastu turėtų priklausyti nuo pradinės prielaidos apie parametrinę šeimą, tai yra apie skirstinio formą, adekvatumo. Tačiau yra atsitiktiniai dydžiai, kurios nepaklūsta vienai iš įprastų platinimo formų. Todėl jiems negali būti taikomos tos pačios taisyklės. matematiniai metodai, kurios skirtos parametriniams skirstiniams. Todėl tokioms charakteristikoms buvo sukurtos specialios. matematiniai modeliai, kurie vadinami neparametriniais arba be paskirstymo.

Taigi galima išskirti dvi statistinių metodų grupes: parametrinius ir neparametrinius.

Parametrinių metodų pranašumas yra tas, kad jiems yra gerai išvystytas matematinis aparatas. Tačiau norint naudoti šiuos metodus, be kita ko, reikalingas didelis imties dydis. Kiekybinėms charakteristikoms nustatyti naudojami parametriniai metodai.

Vardiniams ir ranginiams kintamiesiems analizuoti naudojami tik neparametriniai metodai, kuriems nereikia išankstinių prielaidų dėl pirminio skirstinio tipo. Tai yra jų orumas. Tačiau yra ir trūkumas – sumažėja vadinamųjų. galia (jautrumas objektų skirtumams). Paaiškinkime tai.

Prisiminkime, kad prieš pradėdamas analizuoti eksperimento rezultatus tyrėjas iškelia dvi viena kitą paneigiančias hipotezes. Vienas iš jų yra statistinė hipotezė kurią tyrėjas dažniausiai tikisi atmesti (vadinamoji nulinė hipotezė H 0: pavyzdžiui, tirtos veislės derlingumu nesiskiria). Alternatyvi hipotezė ( H 1) iš tikrųjų atmeta nulinę hipotezę. Alternatyvioje hipotezėje dažniausiai pateikiamos tyrėjo padarytos prielaidos (yra skirtumų).

Analizės metu yra dviejų tipų statistinės klaidos. I tipo klaida (klaida α – tipas): nulinė hipotezė, kuri iš tikrųjų yra teisinga, atmetama. Antrojo tipo klaida (klaida β – tipas): priimame nulinę hipotezę, kuri iš tikrųjų yra klaidinga.

Statistinio kriterijaus (metodo) galia arba jautrumas – tai tikimybė, kad jį pritaikius jis bus priimtas teisingas sprendimas (H 1) pagal tikrai klaidingą nulinę hipotezę. Testo galia priklauso nuo imties dydžio, reikšmingumo lygio, nulinių ir alternatyvių hipotezių krypties, eksperimentinių duomenų, instrumentų patikimumo ir paties statistinio metodo. At vienodos sąlygos parametriniai metodai yra galingesni už neparametrinius. Tačiau neparametrinių metodų galia didėja didėjant imties dydžiui.

Kiekvienas skalės tipas turi savo statistinę techniką. Vardinėms skalėms dažnai naudojamas χ 2 (chi kvadrato) testas. eilinėms svarstyklėms – reitingų statistika. Intervalinėms skalėms – visas statistinių kriterijų arsenalas.

Neparametrinių kriterijų skaičiavimo algoritmai ir pavyzdžiai.

Vienas veiksnys, ribojantis statistinių testų, pagrįstų normalumo prielaida, naudojimą, yra imties dydis. Kol imtis yra pakankamai didelė (pavyzdžiui, 100 ar daugiau stebėjimų), atrankos pasiskirstymas gali būti laikomas normaliu, net jei nėra tikras, kad kintamojo pasiskirstymas gyventojų yra normalu. Tačiau jei imtis maža, parametriniai testai turėtų būti naudojami tik tuo atveju, jei yra pasitikėjimo, kad kintamasis iš tikrųjų turi normalusis pasiskirstymas. Tačiau net ir tokių kintamųjų atveju nėra galimybės patikrinti šios prielaidos mažoje imtyje ( statistinius kriterijus normalumo testai pradeda efektyviai veikti mėginyje, kuriame yra bent 51 stebėjimas).

Neparametriniai metodai yra tinkamiausi, kai imties dydžiai yra maži, o duomenys pateikiami eilinėje arba vardinėje skalėje. Jei empirinių duomenų yra gana daug (pavyzdžiui, n>100), tai dažnai nėra prasmės ir netgi atrodo neteisinga. neparametrinė statistika. Jei imties dydis yra labai mažas (pavyzdžiui, n = 10 ar mažiau), tada tų neparametrinių testų p reikšmingumo lygiai normali aproksimacija, galima laikyti tik apytiksliais įverčiais.



Normalumo prielaida pagrįstų kriterijų naudojimą, be to, riboja tiriamų charakteristikų priklausymas tam tikrai matavimo skalei. Tokie statistiniais metodais, pvz., Stjudento t testas (priklausomiems ir nepriklausomiems pavyzdžiams), tiesinė koreliacija Pearsonas, taip pat regresijos, klasterių ir faktorių analizė daro prielaidą, kad pirminiai duomenys yra tęstiniai (tiriamų kintamųjų reikšmės priskiriamos intervalo arba santykio skalei). Tačiau yra atvejų, kai duomenys tiesiog reitinguojami (matuojami eilės skalėje), o ne matuojami tiksliai. Tada atrodo tikslinga naudoti tokius statistinius kriterijus, kaip, pavyzdžiui, Wilcoxon T testas, G-sign testas, Mann-Whitney U testas, Wald-Wolfowitz Z testas, Spearman rangų koreliacija ir tt. Jų pačių statistiniai metodai bus naudingi. dirbti su nominaliais duomenimis, pavyzdžiui, koreliacija kokybiniai ženklai, CI kvadrato testas, Kochrano Q testas ir kt. Vieno ar kito kriterijaus pasirinkimas siejamas su hipoteze, kurią tyrėjas iškelia mokslinio tyrimo metu, o vėliau bando ją įrodyti empiriniu lygmeniu.

Taigi kiekvienam parametriniam kriterijui yra bent viena neparametrinė alternatyva. Apskritai šios procedūros priskiriamos vienai iš šių kategorijų: (1) kintamųjų priklausomybės laipsnio įvertinimas; 2) nepriklausomų mėginių skirtumų testai; (3) priklausomų mėginių skirtumų testai.

Įvertinti priklausomybę (tarpusavio ryšį), arba jungties glaudumo (tankio, stiprumo) laipsnį, apskaičiuojamas Pirsono koreliacijos koeficientas (r). Griežtai kalbant, jo naudojimas taip pat turi apribojimų, susijusių, pavyzdžiui, su skalės, kurioje matuojami duomenys, tipu ir ryšio netiesiškumu. Todėl kaip alternatyva naudojami neparametriniai arba vadinamieji rango koreliacijos koeficientai (pavyzdžiui, koeficientas rango koreliacija Spearman (ρ), Kendall tau (τ), Gama statistika) naudojami eiliniams (reitinguotiems) duomenims. Jei yra daugiau nei du kintamieji, naudokite atitikimo Kendall koeficientą. Jis naudojamas, pavyzdžiui, vertinant nepriklausomų ekspertų nuomonių nuoseklumą (pavyzdžiui, balai, skirti tam pačiam dalykui, konkurso dalyviui).

Jei duomenys matuojami vardine skale, natūralu juos pateikti nenumatytų atvejų lentelėse, kuriose naudojamas Pirsono chi kvadrato testas su įvairiomis variacijomis ir tikslumo patikslinimais.

Nepriklausomų grupių skirtumai. Jei yra du pavyzdžiai (pavyzdžiui, berniukai ir mergaitės), kuriuos reikia palyginti pagal tam tikrą vidutinę vertę, pvz. kūrybinis mąstymas, tada nepriklausomiems mėginiams galite naudoti t testą. Neparametrinės šio testo alternatyvos yra Wald-Wolfowitz paleidimo testas, Mann-Whitney U testas ir Kolmogorovo-Smirnovo dviejų mėginių testas. Reikia atsiminti, kad dviejų imčių Kolmogorovo-Smirnovo testas yra jautrus ne tik dviejų skirstinių padėties skirtumams, bet ir skirstinio formai. Tiesą sakant, jis jautrus bet kokiam nukrypimui nuo homogeniškumo hipotezės, tačiau nenurodo, su kokiu nukrypimu tyrėjas susiduria.

Priklausomų grupių skirtumai. Jei reikia palyginti du tai pačiai imčiai priklausančius kintamuosius, pavyzdžiui, tų pačių tiriamųjų agresyvumo rodiklius prieš ir po pataisos darbai, tada dažniausiai naudojamas priklausomų imčių t testas. Alternatyvūs neparametriniai testai yra ženklų testas ir Wilcoxon suderintų porų testas. Wilcoxon testas daro prielaidą, kad galima reitinguoti skirtumus tarp palyginamų stebėjimų. Jei to padaryti negalima, naudokite ženklo kriterijų, kuris atsižvelgia tik į skirtumų tarp lyginamų kiekių požymius.

Jei nagrinėjami kintamieji yra kategoriški (nominalūs), McNemar Chi kvadratas yra tinkamas. Jei yra du kategoriniai kintamieji, tai priklausomybės laipsniui įvertinti naudojama standartinė statistika ir atitinkami nenumatytų atvejų lentelių kriterijai: Chi kvadratas, Phi kvadratas, Fišerio tikslus testas.

Žemiau esančioje lentelėje pateikiami parametriniai testai ir jų neparametrinės alternatyvos, atsižvelgiant į šias kategorijas: 1) įvertinant priklausomybės tarp kintamųjų laipsnį; 2) atskyrimo kriterijai.

4.1 lentelė. Parametriniai ir neparametriniai bandymai

Parametriniai kriterijai Neparametriniai testai
priklausomybės (santykių) įvertinimas
Pearsono koreliacijos koeficientas (r) rango koreliacijos koeficientai (Spearman rango koreliacijos koeficientas ρ), Kendall tau statistika (τ), gama (gama));
Pirsono Chi kvadratas (vardiniams duomenims)
nepriklausomų grupių skirtumai Wald-Wolfowitz atlieka testą, Mann-Whitney U testą, Kolmogorovo-Smirnovo dviejų mėginių testą
priklausomų grupių skirtumai
Studento t testas priklausomiems imtims Ženklų G testas (Sign Test), Wilcoxon porinių palyginimų T testas (Wilcoxon matched pair testas);

McNemar Chi kvadratas, Chi kvadratas, Phi kvadratas, Fišerio tikslus (vardiniams duomenims) Jei iš tos pačios imties atsižvelgiama į daugiau nei du kintamuosius (pavyzdžiui, išankstinis koregavimas, koregavimas po koregavimo-1 ir koregavimas po koregavimo-2), paprastai naudojama pakartotinė ANOVA, kurią galima laikyti apibendrinimu. priklausomų mėginių t testas, leidžiantis padidinti analizės jautrumą. Anglų santrumpa dispersijos analizė - ANOVA (Analysis of Variation). Dispersijos analizė leidžia vienu metu valdyti ne tik bazinis lygis

Rasti

Parametrinio vertinimo metodai Parametrinių metodų naudojimas reikalauja a priori žinių teorinė teisė tiriamos reikšmės pasiskirstymas arba jos nustatymas remiantis empiriniais duomenimis, todėl būtina patikrinti ED ir pasirinkto teorinio dėsnio nuoseklumą. Parametrinis įvertinimas iš cenzūruotų pavyzdžių yra pagrįstas tradiciniais metodais (matematinė statistika didžiausia tikimybė , momentai, kvantiliai), metodai tiesiniai įverčiai

ir nemažai kitų. Kelių cenzūruotų pavyzdžių apdorojimas didžiausios tikimybės metodas leidžiama su:

6 < N<10, 10 < = N<20, 20 < = N<50, 50 < = N<100, šias sąlygas /N> = 0,5; šias sąlygas/ N> = 0,3; šias sąlygas/ N> = 0,2; šias sąlygas/ N>= 0,1.

r

Kai šių apribojimų nesilaikoma, galima apskaičiuoti tik apatinę pasiskirstymo parametrų pasikliovimo ribą. Įverčiai, gauti naudojant didžiausios tikimybės metodą, esant santykinai laisviems apribojimams, yra asimptotiškai veiksmingi, nešališki ir asimptotiškai normaliai pasiskirstę. Jei nuolatinis kintamasis su tankio funkcija(f, t x ) cenzūruojamas taškuose A Ir(b<Ir a

Tikimybės funkcija esant N pastebėjimai

.

Jei kintamasis fiksuotuose taškuose cenzūruojamas dvigubai b A Ir, kad jų nebūtų laikomasi k 1 mažiausias ir k 2 didžiausi imties elementai, tada tikimybės funkcija

Kur k 1 ir k 2 yra atsitiktiniai dydžiai.

Kai cenzūruojama su pastoviomis reikšmėmis k =šias sąlygas 1 ir k 2=šias sąlygas 2 tikimybės funkcija yra lygi

kur v1 = fšias sąlygas 1+1, v2 = fN-r 2

Išspręsti įvairių cenzūros schemų tikimybių lygtį yra gana sudėtinga užduotis. Tokius sprendimus galima gauti aiškiai tik vieno parametro paskirstymo dėsniams. Žinomos lygtys, leidžiančios rasti tipiškų patikimumo rodiklių pasiskirstymo dėsnių parametrus kairiosios cenzūros imtims.

Eksponentinis pasiskirstymas. Įvairių stebėjimo planų pasiskirstymo parametro l taškiniai įverčiai:

kur Ф( X) – normalaus pasiskirstymo funkcija, Įverčiai, gauti naudojant didžiausios tikimybės metodą, esant santykinai laisviems apribojimams, yra asimptotiškai veiksmingi, nešališki ir asimptotiškai normaliai pasiskirstę. Jei nuolatinis kintamasis su tankio funkcija(f) – normalaus pasiskirstymo tankio funkcija.

Lygčių sistema (8.7) leidžia priimti tik skaitinį sprendimą. Tokiu būdu sprendžiant lygtis, matematinio lūkesčio ir standartinio nuokrypio įverčiai, apskaičiuoti pagal jungtinę imtį, dažniausiai laikomi pradiniais nežinomų parametrų aproksimais.

Lognormalus pasiskirstymas. Parametrų įverčiai apskaičiuojami naudojant normaliojo pasiskirstymo dėsnio formules, kurių veikimo laiko reikšmės pakeičiamos natūraliais logaritmais.

RWeibull paskirstymas. Parametrų d ir b įverčiai planui [ NUz] apskaičiuojami remiantis lygčių sistema

Kur tm = tšias sąlygas planui [ NUr], tm = T planui [ RIEŠUTAS].

Lygčių sistemos (8.8) – (8.9) neturi analitinio sprendimo ir reikalauja naudoti skaitinius metodus: pirmiausia randama pirmosios lygties šaknis (parametro b įvertis), tada tiesioginiu pakeitimu parametro d įvertis. Dviejų parametrų Weibull paskirstymui: didelis (b>4) arba mažas (b<0,5) значения параметра свидетельствуют о том, что ЭД не подчиняются этому закону или отношение šias sąlygas/N mažai. Tokiais atvejais reikėtų taikyti neparametrinius vertinimo metodus arba pereiti prie trijų parametrų Weibull paskirstymo dėsnio.

Sunkumai naudojant didžiausios tikimybės metodą lemia kitų metodų kūrimą. Momentų metodas paprastai lemia paprastas skaičiavimo procedūras, leidžia gauti asimptotiškai efektyvius, nešališkus ir normaliai paskirstytus įverčius, tačiau reikalauja atsižvelgti į cenzūros tipą ir yra taikomas santykinai dideliam imties dydžiui (mažiausiai 30). Kvantilinio metodo naudojimas paskirstymo dėsnių parametrams įvertinti yra mažiau svarbus cenzūros tipui. Didelis įverčių tikslumas pasiekiamas optimaliai parenkant kvantilius, nors toks pasirinkimas ne visada įmanomas.

Linijinis įvertinimo metodas naudojamas esant mažam imties dydžiui, jis užtikrina aukštą efektyvumą, nuoseklumą ir nešališkus pasiskirstymo parametrų įverčius. Šis metodas pagrįstas užsakymų statistikos tiesinės funkcijos (sutvarkytų imties elementų) radimu, kuri būtų nešališkas norimo parametro įvertinimas. Programa yra susijusi su poreikiu naudoti specialius paskirstymo tipus, o tai sukelia tam tikrų nepatogumų ir apsunkina skaičiavimų automatizavimą.

Pradėdamas statistinį savo tyrimo apdorojimą, psichologas pagal jo medžiagos ypatybes turi nuspręsti, kurie metodai jam labiau tinka – parametriniai ar neparametriniai. Skirtumą tarp jų lengva suprasti.

Jau kalbėjome apie šeštokų variklio greičio matavimą.

Kaip apdoroti šiuos duomenis?

Būtina užrašyti visus atliktus matavimus – šiuo atveju tai bus kiekvieno tiriamojo nustatytas taškų skaičius – tada pagal jo rezultatus apskaičiuoti kiekvieno tiriamojo aritmetinį vidurkį. Po to sutvarkykite visus duomenis jų seka, pavyzdžiui, pradedant nuo mažiausio iki didžiausio. Siekiant palengvinti šių duomenų matomumą, jie dažniausiai sujungiami į grupes; šiuo atveju galite sujungti 5-9 matavimus grupėje. Apskritai, naudojant tokį derinį, pageidautina, kad jei bendras atvejų skaičius neviršytų šimto, bendras grupių skaičius būtų apie dvylika.

Toliau turite nustatyti, kiek kartų eksperimentuose buvo susidurta su kiekvienai grupei atitinkančiomis skaitinėmis reikšmėmis. Tai padarę kiekvienai grupei užrašykite jos dydį. Tokioje lentelėje gauti duomenys vadinami skaičių arba dažnių skirstiniu. Šį skirstinį rekomenduojama pateikti diagramos, vaizduojančios pasiskirstymo daugiakampį, arba pasiskirstymo histogramos pavidalu. Šio daugiakampio kontūrai padės išspręsti statistinio apdorojimo metodų problemą.

Dažnai šie kontūrai primena varpo kontūrus, kurių aukščiausias taškas yra daugiakampio centre, o simetriškos šakos tęsiasi bet kuria kryptimi. Šis kontūras atitinka normalaus pasiskirstymo kreivę. Šią sąvoką į matematinę statistiką įvedė K. F. Gaussas (1777-1855), todėl kreivė dar vadinama Gauso kreivė. Jis taip pat pateikė matematinį šios kreivės aprašymą. Gauso kreivės (arba varpelio kreivės) nubrėžimas teoriškai reikalauja begalinio skaičiaus atvejų. Praktikoje tenka pasitenkinti tyrimo metu sukaupta faktine medžiaga. Jei tyrėjo turimi duomenys, atidžiai ištyrus arba perkėlus juos į diagramą, tik nežymiai skiriasi nuo normalaus pasiskirstymo kreivės, tai suteikia tyrėjui teisę statistiniame apdorojime naudoti parametrinius metodus, kurių atskaitos taškai yra pagrįsti. ant normalios Gauso pasiskirstymo kreivės.

Normalus skirstinys vadinamas parametriniu, nes Gauso kreivei sudaryti ir analizuoti pakanka turėti tik du parametrus: vidutinę reikšmę, kuri turi atitikti statmeno aukštį, atkurtą kreivės centre, ir vadinamąjį vidurkį. kvadratas arba standartinis vertės nuokrypis, apibūdinantis reikšmių sklaidą apie vidutinę vertę; Abiejų dydžių apskaičiavimo metodai bus aptarti toliau.

Parametriniai metodai turi daug privalumų tyrėjui, tačiau reikia nepamiršti, kad jų naudojimas pateisinamas tik tada, kai apdoroti duomenys rodo tik nežymiai besiskiriantį nuo Gauso skirstinio.

Jei parametrinių pritaikyti neįmanoma, reikėtų kreiptis neparametriniai metodai. Šie metodai buvo sėkmingai sukurti per pastaruosius 3–4 dešimtmečius, o jų vystymąsi pirmiausia lėmė daugelio mokslų, ypač psichologijos, poreikiai. Jie parodė savo aukštą efektyvumą. Tačiau jie nereikalauja sudėtingo skaičiavimo darbo.

Šiuolaikinis psichologijos tyrinėtojas turi remtis tuo, kad „...yra daug duomenų, kurių arba iš viso negalima išanalizuoti naudojant varpo kreivę, arba jie neatitinka pagrindinių prielaidų, būtinų jai naudotis“.

Gyventojų skaičius Ir mėginys. Psichologui nuolat tenka susidurti su šiomis dviem sąvokomis.



Ar jums patiko straipsnis? Pasidalinkite su draugais!