Merske lestvice v statistiki. Merska lestvica v sociologiji

Obstajajo 4 glavne vrste merilnih lestvic.

Nominativna lestvica je lestvica, ki razvršča po imenu: toplo(lat.) - ime, naziv. Ime se ne meri kvantitativno; omogoča le razlikovanje enega predmeta od drugega ali enega subjekta od drugega. Imenska lestvica je način razvrščanja predmetov ali subjektov in njihove razdelitve v klasifikacijske celice.

Najenostavnejši primer nominativne lestvice je dihotomna lestvica, sestavljena iz samo dveh celic, na primer: "ima brate in sestre - edini otrok v družini"; »tujec – rojak«; "glasoval za" - glasoval "proti" itd.

Lastnost, ki se meri na dihotomni lestvici imen, se imenuje alternativa. Zavzame lahko samo dve vrednosti. Ob tem raziskovalca pogosto zanima katera izmed njih, nato pa reče, da se je lastnost »pojavila«, če je dobila pomen, ki ga zanima, in da se lastnost »ni pojavila«, če je dobila nasprotno. pomen. Na primer: "Znak levičarstva se je pojavil pri 8 od 20 subjektov." Načeloma lahko nominativno lestvico sestavljajo celice "last se je pojavila - lastnost se ni pojavila."

Bolj zapletena različica nominativne lestvice je razvrstitev treh ali več celic, na primer: "ekstrapunitivne - intrapunitivne - nekaznovane reakcije" ali "izbira kandidature A - kandidatura B - kandidatura C - kandidatura D" ali "najstarejši - srednji - najmlajši - edini otrok V družina" itd.

Ko vse predmete, reakcije ali vse subjekte razvrstimo v klasifikacijske celice, dobimo možnost prehoda od imen k številkam, pri čemer štejemo število opazovanj v vsaki celici.

Kot je bilo že navedeno, je opazovanje ena zabeležena reakcija, ena narejena izbira, eno izvedeno dejanje ali rezultat enega subjekta.

Recimo, da ugotovimo, da je kandidata A izbralo 7 subjektov, kandidata B 11, kandidata C 28, A kandidat G - samo 1. Sedaj lahko operiramo s temi številkami, ki predstavljajo pogostost pojavljanja različnih imen, to je pogostost sprejemanja znaka »izbire« za vsakega od 4 možnih pomenov. Nato lahko dobljeno frekvenčno porazdelitev primerjamo z enakomerno ali kakšno drugo porazdelitvijo.

Tako nam nominativna lestvica omogoča štetje pogostosti pojavljanja različnih »imen« ali pomenov lastnosti in nato delo s temi frekvencami z uporabo matematičnih metod.

Merska enota, s katero operiramo, je število opazovanj (subjektov, reakcij, volitev itd.) oziroma frekvenca. Natančneje, merska enota je eno opazovanje. Takšne podatke je mogoče obdelati z metodo χ 2 , binomski test m in Kotna Fisherjeva transformacija φ*.

Vrstna lestvica (rang)- To je lestvica, ki razvršča po principu »več - manj«. Če v poimenovalni lestvici ni bilo pomembno, v kakšnem vrstnem redu razporedimo klasifikacijske celice, potem v ordinalni lestvici tvorijo zaporedje od celice z najmanjšo vrednostjo do celice z največjo vrednostjo (ali obratno). Zdaj je bolj primerno celice imenovati razredi, saj se v zvezi z razredi uporabljajo definicije "nizkega", "srednjega" in "visokega" razreda ali 1., 2., 3. razreda itd.

Redna lestvica mora imeti vsaj tri razrede, na primer "pozitivna reakcija - nevtralna reakcija - negativna reakcija" ali "primeren za prosto delovno mesto - primeren s pridržki - neprimeren" itd.

Pri ordinalni lestvici ne poznamo prave razdalje med razredi, ampak le to, da tvorijo zaporedje. Na primer, razreda »primeren za prosto delovno mesto« in »primeren s pridržkom« sta lahko dejansko bližje drug drugemu kot razred kvalificiran s pridržkom« razredu »neprimeren«.

Od razredov k številkam lahko preidemo, če se dogovorimo, da najnižji razred dobi rang 1, srednji razred dobi rang 2, najvišji razred pa dobi rang 3, ali obratno. Več razredov na lestvici, več. Imamo zmožnosti matematične obdelave pridobljenih podatkov in testiranja statističnih hipotez.

Na primer, lahko ovrednotimo razlike med dvema vzorcema preiskovancev na podlagi razširjenosti višjih ali nižjih rangov v njih ali pa lahko izračunamo korelacijski koeficient ranga med dvema spremenljivkama, merjenima na ordinalni lestvici, recimo med ocenami menedžerjeve strokovne kompetence, ki so mu jo podelili različni strokovnjaki.

Vse psihološke metode, ki uporabljajo rangiranje, temeljijo na uporabi vrstne lestvice. Če se od subjekta zahteva, da razvrsti 18 vrednot glede na stopnjo njihovega pomena zanj, da razvrsti seznam osebnih lastnosti socialnega delavca ali 10 kandidatov za to delovno mesto glede na stopnjo njihove poklicne primernosti, potem v vseh v teh primerih subjekt izvede tako imenovano prisilno rangiranje, pri katerem število rangov ustreza številu teh rangiranih subjektov ali objektov (vrednosti, kakovosti itd.).

Ne glede na to, ali vsaki kakovosti ali subjektu dodelimo enega od 3-4 rangov ali izvedemo postopek prisilnega rangiranja, v obeh primerih dobimo niz vrednosti, merjenih na ordinalni lestvici. Res je, če imamo samo 3 možne razrede in s tem 3 range, hkrati pa recimo 20 rangiranih predmetov, potem bodo nekateri od njih neizogibno prejeli enake range. Vse raznolikosti življenja ni mogoče strniti v 3 stopnje, zato lahko ljudje, ki se med seboj zelo razlikujejo, spadajo v isti razred. Po drugi strani pa lahko vsiljeno rangiranje, torej oblikovanje zaporedja številnih subjektov, razlike med ljudmi umetno poveča. Poleg tega se lahko podatki, pridobljeni v različnih skupinah, izkažejo za neprimerljive, saj se lahko skupine na začetku razlikujejo po stopnji razvoja proučevane kakovosti in subjekt, ki je v eni skupini prejel najvišjo oceno, bi prejel le povprečno oceno v drugem itd.

Izhod iz situacije je mogoče najti z določitvijo dokaj delnega klasifikacijskega sistema, na primer z 10 razredi ali stopnjami značilnosti. V bistvu velika večina psiholoških metod, ki uporabljajo strokovno oceno, temelji na merjenju istega »merila« 10, 20 ali celo 100 gradacij različnih subjektov v različnih vzorcih.

Torej je merska enota v vrstni lestvici razdalja 1 razreda ali 1 ranga, medtem ko je razdalja med razredi in rangi lahko različna (nam ni znana). Vsi kriteriji in metode, opisani v tej knjigi, veljajo za podatke, pridobljene na ordinalni lestvici.

Intervalna lestvica je lestvica, ki razvršča po načelu »več za določeno število enot - manj za določeno število enot«. Vsaka od možnih vrednosti atributa se nahaja na enaki razdalji od druge.

Lahko domnevamo, da če merimo čas za rešitev problema v sekundah, potem je to očitno intervalna lestvica. Vendar v resnici ni tako, saj psihološko razlika 20 sekund med subjektoma A in B morda sploh ni enaka razliki 20 sekund med subjektoma B in D, če je subjekt A rešil problem v 2 sekundah, B - v 22, C - za 222 in G - za 242.

Podobno je lahko vsaka sekunda po preteku ene in pol minute pri eksperimentu z merjenjem mišično-voljnega napora na dinamometru s premikajočim se kazalcem po »ceni« enaka 10 ali celo več sekundam v prvi polovici - minuta poskusa. »V letu mine ena sekunda«, tako se je nekoč izrazil neki testiranec.

Poskusi merjenja psihičnih pojavov v fizikalnih enotah - volja v sekundah, sposobnosti v centimetrih, občutek lastne nezadostnosti v milimetrih itd., so seveda razumljivi, saj gre navsezadnje za meritve v enotah "objektivnega" obstoječi čas in prostor. Nobeden izkušen raziskovalec pa se ne slepi z idejo, da meri na psihološki intervalni lestvici. Te razsežnosti še vedno sodijo na lestvico reda, če nam je to všeč ali ne.

Z določeno stopnjo gotovosti lahko trdimo le, da je subjekt A rešil problem hitreje kot B, B hitreje kot C in C hitreje kot D.

Podobno se izkaže, da so vrednosti, ki jih subjekti pridobijo v točkah s katero koli nestandardizirano metodo, izmerjene samo na vrstni lestvici. Dejansko se lahko samo lestvice v standardnih odklonskih enotah in percentilnih lestvicah štejejo za enako intervalne in to le pod pogojem, da je bila porazdelitev vrednosti v standardizacijskem vzorcu normalna.

Načelo gradnje večine intervalnih lestvic temelji na dobro znanem pravilu "treh sigma": približno 97,7-97,8% vseh vrednosti značilnosti z normalno porazdelitvijo spada v območje M ± 3δ. Možno je sestaviti lestvico v enotah frakcij standardnega odklona, ​​ki bo pokrila celoten možen razpon sprememb značilnosti, če pustimo skrajno levi in ​​skrajni desni interval odprt (več o tem bomo povedali kasneje).

R.B. Cattell je na primer predlagal stensko lestvico "standardnih deset". Za izhodišče se vzame aritmetična sredina v "surovih" točkah. Desno in levo so izmerjeni intervali, enaki 1/2 standardne deviacije. Na sl. Slika 2 prikazuje diagram za izračun standardnih rezultatov in pretvorbo "surovih" rezultatov v stene na lestvici N 16-faktorskega osebnostnega vprašalnika R. B. Cattella.

riž. 2. Shema za izračun standardnih rezultatov (stens) za faktor N 16-faktorskega osebnostnega vprašalnika R. B. Cattella; spodaj so intervali v enotah 1/2 standardne deviacije

Desno od povprečja bodo intervali enaki 6., 7., 8., 9. in 10. steni, pri čemer bo zadnji od teh intervalov odprt. Levo od srednje vrednosti bodo intervali enaki 5, 4, 3, 2 in 1 steni, skrajni interval pa je tudi odprt. Zdaj se povzpnemo do osi neobdelanih točk in označimo meje intervalov v enotah neobdelanih točk. Ker je M=10,2; δ=2,4, desno postavimo 1/2δ tj. 1,2 "surove" točke. Tako bo meja intervala: (10,2 + 1,2) = 11,4 "surovih" točk. Torej se bodo meje intervala, ki ustreza 6 stenam, razširile od 10,2 do 11,4 točke. V bistvu vanj spada samo ena "surova" vrednost - 11 točk. Levo od povprečja postavimo 1/2δ in dobimo mejo intervala: 10,2-1,2=9. Tako se meje intervala, ki ustreza 9 stenam, raztezajo od 9 do 10,2. Dve "surovi" vrednosti že spadata v ta interval - 9 in 10. Če je subjekt prejel 9 "surovih" točk, mu je zdaj dodeljenih 5 sten; če je prejel 11 "surovih" točk - 6 sten itd.

Vidimo, da bo v stenski lestvici včasih enako število sten dodeljeno za različno število "surovih" točk. Na primer, za 16, 17, 18, 19 in 20 točk bo podeljenih 10 sten, za 14 in 15 pa 9 sten itd.

Načeloma je stensko lestvico mogoče sestaviti iz katerih koli podatkov, izmerjenih vsaj na ordinalni lestvici, z velikostjo vzorca n>200 in normalno porazdelitvijo značilnosti 2.

Drug način za sestavo lestvice enakih intervalov je združevanje intervalov po načelu enakosti akumuliranih frekvenc. Pri normalni porazdelitvi značilnosti je večina vseh opazovanj združenih v bližini povprečne vrednosti, zato so v tem območju povprečne vrednosti intervali manjši, ožji in ko se odmikajo od središča porazdelitve, se povečajo (glej sliko 3). Zato je takšna percentilna lestvica enak interval le glede na akumulirano frekvenco.

riž. 3. Percentilna lestvica; Na vrhu za primerjavo so intervali navedeni v enotah standardnega odklona

Konstruiranje enakih intervalnih lestvic iz podatkov lestvice naročila spominja na trik z vrvno lestvijo, ki ga omenja S. Stevens. Najprej se povzpnemo po lestvi, ki ni na nič pritrjena in pridemo do lestve, ki je pritrjena. Vendar, kako smo prišli tja? Določeno psihološko spremenljivko smo izmerili na vrstni lestvici, izračunali povprečja in standardne odklone ter na koncu dobili intervalno lestvico. Kot je opozoril Stevens, "je mogoče dati določeno pragmatično utemeljitev za takšno nezakonito uporabo statistike; v mnogih primerih vodi do plodnih rezultatov."

Mnogi raziskovalci ne preverjajo stopnje ujemanja med empirično porazdelitvijo, ki so jo pridobili, in normalno porazdelitvijo, še manj pa pretvorijo dobljene vrednosti v enote frakcij standardnega odklona ali percentile, raje uporabljajo "surove" podatke. »Neobdelani« podatki pogosto ustvarijo poševno distribucijo, distribucijo z robom ali dvema točkama. Na sl. Slika 4 prikazuje porazdelitev kazalnika mišičnega voljnega napora na vzorcu 102 oseb. Porazdelitev lahko štejemo za normalno z zadovoljivo natančnostjo (χ 2 = 12,7 z v = 9, M = 89,75, δ = 25,1).

riž. 4 Histogram in gladka krivulja porazdelitve mišičnega voljnega napora (n=102)

Na sl. Na sliki 5 je prikazana porazdelitev kazalnika samospoštovanja po lestvici metode J. Menester - R. Corzini »Stopnja uspeha, ki bi jo moral zdaj doseči« (n = 356). Porazdelitev se bistveno razlikuje od normalne

(χ 2 = 58,8, z v = 7; str<0,01; М=80,64; δ=16,86).

riž. 5 . Histogram in gladka porazdelitvena krivulja pričakovane uspešnosti (n=356).

Takšne »nenormalne« porazdelitve srečamo zelo pogosto, morda pogosteje kot klasične normalne. In tu ne gre za nekakšno napako, ampak za posebnost psiholoških znakov. Po nekaterih metodah od 10 do 20% subjektov prejme oceno "nič" - na primer v njihovih zgodbah ni niti ene verbalne formulacije, ki bi odražala motiv "upanje na uspeh" ali "strah pred neuspehom" (Heckhausen). metoda). Normalno je, da subjekt prejme oceno »nič«, vendar porazdelitev takih ocen ne more biti normalna, ne glede na to, koliko povečamo velikost vzorca.

Lestvica odnosov

Lestvica odnosov se imenuje tudi lestvica enakih odnosov. Značilnost te lestvice je prisotnost trdno fiksne ničle, kar pomeni popolno odsotnost kakršne koli lastnosti ali atributa. Lestvica razmerja je najbolj informativna lestvica, ki omogoča kakršne koli matematične operacije in uporabo različnih statističnih metod.

Razmerna lestvica je v bistvu zelo blizu intervalni lestvici, saj če striktno določite izhodišče, se vsaka intervalna lestvica spremeni v razmerno.

Na razmerni lestvici se izvajajo natančne in ultranatančne meritve v vedah, kot so fizika, kemija, mikrobiologija itd. Meritve na razmerni lestvici se izvajajo tudi v vedah, ki so blizu psihologiji, kot so psihofizika, psihofiziologija, psihogenetika.

Očitno je treba vse meritve opraviti na določenem materialu. In tukaj bi se morali ustaviti pri osnovnih definicijah, povezanih s konceptom Vzorec.

Prebivalstvo- to je celoten niz predmetov, v zvezi s katerimi je oblikovana raziskovalna hipoteza.

Vzorec je številčno omejena skupina objektov (v psihologiji - subjekti, anketiranci), posebej izbranih iz splošne populacije za preučevanje njegovih lastnosti. V skladu s tem se preučevanje lastnosti populacije z uporabo vzorca imenuje vzorčna raziskava. Skoraj vse psihološke študije so selektivne in njihovi zaključki veljajo za splošno populacijo.

Reprezentativnost vzorca- z drugimi besedami, njegova reprezentativnost je zmožnost vzorca, da povsem v celoti predstavlja preučevane pojave glede na njihovo variabilnost v splošni populaciji.

Stratificirano vzorčenje, ali selekcija na podlagi lastnosti splošne populacije (razdelitev vzorca na »stratume«. Vključuje predhodno določitev tistih kvalitet, ki lahko vplivajo na variabilnost proučevane lastnosti (to je lahko spol, stopnja dohodka ali izobrazba, itd.).

Statistična pomembnost Statistična pomembnost ali statistična pomembnost rezultatov študije se določi z uporabo statističnih metod sklepanja, ki nalagajo določene zahteve glede velikosti ali velikosti vzorca.

Teoretična validacija v sociološkem raziskovanju: Metodologija in metode

Zahvaljujoč Stanleyju Stevensonu v naši raziskovalni praksi uporabljamo več vrst tehtnic. Nekateri kritizirajo to tipologijo, vendar se očitno nihče ni domislil česa boljšega.

0 Kliknite, če je bilo uporabno =ъ

Ne glede na kompleksnost vprašanj v vprašalniku ali testnih tehnik, o katerih razmišljate, jih lahko vse razdelimo v tri vrste glede na to, kateri merilni lestvici pripadajo. V tem primeru ne govorimo o posebnih metodah za izdelavo merilnih instrumentov (na primer Guttmannova lestvica ali Thurstonova lestvica), temveč o klasifikaciji merilnih lestvic, ki jo je leta 1946 predlagal Stanley Stevens. Poznavanje te klasifikacije je ključno z vidika uporabe kvantitativnega pristopa, saj uporaba nekaterih metod matematične statistike med drugim temelji na merskih lestvicah, v katerih se prikazujejo spremenljivke, ki zanimajo raziskovalca.

Več o pojmu "spremenljivka"
»Spremenljivka« je pogosto uporabljen koncept v znanstvenih raziskavah (ne samo v družbenih in vedenjskih vedah) in še posebej, ko govorimo o kvantitativnem pristopu in uporabi statističnih metod. Pravzaprav je spremenljivka vsaka lastnost predmetov, ki se preučujejo, ki se spreminja od enega opazovanja do drugega. V tem primeru se opazovanja nanašajo na objekte preučevanja (ljudje, organizacije, države ali karkoli drugega – odvisno od same študije).
Če se neka lastnost ne spremeni od enega opazovanja do drugega, potem ne zagotavlja nobenih dragocenih informacij v matematičnem smislu (večina metod bo preprosto neuporabnih).
Tako so v okviru kvantitativnega pristopa predmeti, ki se preučujejo, predstavljeni kot niz spremenljivk, ki so zanimive in predmet študija. Ni težko uganiti, da se spremenljivke primarno delijo glede na lestvice, v katerih so prikazane. Tako lahko ločimo na primer nominalne, ordinalne in metrične spremenljivke. Hkrati lahko ordinalne delimo na strnjene in zvezne ordinalne. Zvezne ordinalne spremenljivke imajo veliko številskih vrednosti in izgledajo (vsaj na prvi pogled) kot metrične. Strnjene ordinalne spremenljivke imajo le nekaj kategorij ali številskih vrednosti (ne več kot pet ali šest). Lahko jih pridobimo z zbiranjem podatkov v strnjeni obliki ali s strnitvijo zvezne ordinalne ali metrične lestvice.
Druga pomembna delitev spremenljivk je delitev na odvisne in neodvisne. Pogosto se v procesu analize postavljajo hipoteze o vplivu nekaterih spremenljivk na druge. V takih primerih se vplivne spremenljivke imenujejo neodvisne, vplivne spremenljivke pa odvisne. Na primer, če govorimo o razmerju med spolom študenta in uspehom pri študiju, bo spol neodvisna spremenljivka, uspeh pri študiju pa odvisna spremenljivka.

Po Stevensonovi klasifikaciji lahko v najbolj splošni obliki ločimo tri vrste lestvic:
- Nazivna,
- redni,
- metrika.

Nazivna lestvica vključuje razred spremenljivk, katerih vrednosti je mogoče razdeliti v skupine, vendar jih ni mogoče rangirati. Primeri ustreznih spremenljivk so spol, narodnost, vera itd. Oglejmo si podrobneje takšno spremenljivko, kot je narodnost. V tem primeru lahko anketirance razdelimo v različne skupine glede na to, za katero narodnost se smatramo. Hkrati je na podlagi teh informacij nemogoče razvrstiti anketirance glede na kvantitativno izraženost parametra, ki nas zanima, saj nacionalnost ni merljiva lastnost v tradicionalnem pomenu besede.
Vrstni red lestvica vključuje razred spremenljivk, katerih vrednosti ni mogoče samo razdeliti v skupine, ampak tudi razvrstiti glede na resnost lastnosti, ki se meri. Klasičen primer ordinalne lestvice je Bogardusova lestvica, zasnovana za merjenje nacionalne razdalje. Spodaj je različica, prilagojena prebivalcem Ukrajine (N. Panina, E. Golovakha):

Naloga vprašalnika
Za vsako spodaj navedeno narodnost izberite enega od položajev, ki vam je osebno najbližji, na katerega bi dovolili predstavnike te narodnosti.
Lestvica odziva
1) kot člani moje družine;
2) kot tesni prijatelji;
3) kot sosedje;
4) kot sodelavci pri delu;
5) kot rezidenti Ukrajine;
6) kot obiskovalci Ukrajine;
7) ga sploh ne bi spustil v Ukrajino.

Ta lestvica vam omogoča razvrščanje anketirancev glede na njihov odnos do določene narodnosti. Vendar daje le približne informacije, ki ne omogočajo natančne ocene razlik med stopnjami lestvice. Tako lahko na primer trdimo, da bo respondent, ki je Jude pripravljen sprejeti kot člane svoje družine, z njimi ravnal bolje kot tisti, ki jih je pripravljen sprejeti le kot sosede. Hkrati pa ne moremo reči "za koliko?" ali "kdaj?" saj ima prvi anketiranec boljši odnos do predstavnikov judovske narodnosti kot drugi. Z drugimi besedami, nimamo argumentov, ki bi podpirali enakost intervalov med postavkami lestvice.
metrika lestvica vključuje razred spremenljivk, katerih vrednosti lahko bodisi razdelimo v skupine in razvrstimo ali pa njihovo vrednost določimo v natančnih izrazih (tistih "za koliko?" in "ob katerem času?"). Tipični primeri relevantnih spremenljivk so starost, plača, število otrok itd. Vsakega od njih je mogoče čim bolj natančno izmeriti: starost v letih, plača v grivnah, število otrok v ... kosih;)
Seveda, če je spremenljivko potencialno mogoče izraziti v metrični lestvici, potem lahko isto spremenljivko izrazimo v ordinalni lestvici.

Starost je na primer lahko izražena v starostnih skupinah (mladost, srednja leta, starost), ki dajejo le približen podatek o anketirancu, kljub možnosti rangiranja.
Pripadnost metrični lestvici odpira možnost uporabe poljubnih statističnih metod. Pripadnost ordinalni ali nazivni lestvici pa omejuje izbiro matematičnih orodij (pri ordinalni lestvici v manjši meri, pri nominalni lestvici pa v večji meri). Podana je klasifikacija statističnih metod.
Da bodo razlike med nominalno, ordinalno in metrično lestvico še bolj očitne, bom navedel dodaten primer, ki je posvečen ratingu profesionalnih boksarjev težke kategorije po boxrec.com (podatki aktualni na dan 31.01.2012). Hkrati si bomo ogledali podatke o prvih desetih boksarjev po treh spremenljivkah: etnična pripadnost boksarja, njegovo mesto na lestvici in število rating točk, ki jih je imel 31. januarja 2012.

A) Etnična pripadnost ( nazivna lestvica). Trije boksarji (brata Kličko in Dimitrenko) so Ukrajinci, en (Povetkin) je Rus, eden (Adamek) je Poljak, dva (Chambers in Thompson) sta Američana, en (Fury) je Britanec, eden (Helenius) je Finec, eden ( Pulev) - bolgarščina. Tako nam je spremenljivka »nacionalnost« pomagala vse boksarje razdeliti v 7 skupin, glede na njihovo etnično pripadnost. S temi podatki oseba, ki je daleč od boksa, ne bo mogla reči ničesar o uspehu naštetih boksarjev, čeprav bo prejela podatke o etnični pripadnosti 10 najboljših težkih kategorij (še naprej se bomo obrnili na hipotetičnega strokovnjaka):
Ukrajinci - 30%;
Američani - 20%;
Rusi, Poljaki, Britanci, Finci in Bolgari - po 10%.
B) Mesto na lestvici ( ordinalna lestvica) daje približne podatke o uspehu boksarja. Situacija je naslednja:
1. Vladimir Kličko
2. Vitalij Kličko
3. Aleksander Povetkin
4. Tomaž Adamek
5. Eddie Chambers
6. Tyson Fury
7. Robert Helenij
8. Tony Thompson
9. Aleksander Dimitrenko
10. Kubrat Pulev
Zdaj naš nepoučeni analitik pozna zaporedje desetih najboljših boksarjev težke kategorije. In čeprav so številke od 1 do 10 že prisotne, še vedno ne more izvajati nobenih matematičnih operacij razen primerjave. Na primer, ne more reči, da je Vladimir Kličko za 4 enote boljši od Eddieja Chambersa. Izraz "5 minus 1" v tem primeru nima smisla. Za ta dva boksarja lahko reče le, da je Vladimir Kličko boljši boksar od Eddieja Chambersa (pa tudi vseh ostalih iz prve deseterice). Razlog za nemogoče izvajanje matematičnih operacij je v tem, da med točkami od 1 do 10 ni enakosti intervalov. Kolikšni so dejanski intervali med točkami, lahko vidimo zahvaljujoč zadnji spremenljivki.
B) Število ocenjevalnih točk ( metrična lestvica). Ta indikator

stran 1

Uporaba določenih statističnih metod je odvisna od tega, kateri statistični lestvici pripada pridobljeni material. S. Stevens je predlagal razlikovanje med štirimi statističnimi lestvicami:

1. lestvica imen (ali nominalna);

2. naročilna lestvica;

3. intervalna lestvica;

4. lestvica odnosov.

Ob poznavanju tipičnih značilnosti posamezne lestvice ni težko ugotoviti, v katero od njih je treba uvrstiti gradivo, ki je predmet statistične obdelave.

Imenska lestvica. Ta lestvica vključuje materiale, pri katerih se proučevani predmeti med seboj razlikujejo po kakovosti.

Pri obdelavi takšnih materialov teh predmetov ni treba razporejati v kakršnem koli vrstnem redu glede na njihove značilnosti. Načeloma lahko objekte razporedimo v poljubnem vrstnem redu.

Tukaj je primer: proučuje se sestava mednarodne znanstvene konference. Med udeleženci so Francozi, Angleži, Danci, Nemci in Rusi. Ali je vrstni red, po katerem so razporejeni udeleženci, pomemben pri preučevanju sestave konference? Lahko jih uredite po abecedi, to je priročno, vendar je jasno, da v tej ureditvi ni temeljnega pomena. Pri prevajanju teh materialov v drug jezik (in torej v drugo abecedo) bo ta vrstni red moten. Nacionalne skupine lahko razporedite glede na število udeležencev. Toda če primerjamo to gradivo z gradivom druge konference, ugotovimo, da je malo verjetno, da bo ta vrstni red enak. Predmeti, dodeljeni lestvici poimenovanja, so lahko postavljeni v poljubnem vrstnem redu, odvisno od namena študije.

Pri statistični obdelavi tovrstnega gradiva je treba upoštevati število enot, s katerimi je posamezen predmet predstavljen. Obstajajo zelo učinkovite statistične metode, ki vam omogočajo, da iz teh numeričnih podatkov pridete do znanstveno pomembnih zaključkov (na primer metoda hi-kvadrat).

Lestvica naročila.Če v lestvici poimenovanja vrstni red predmetov, ki se preučujejo, praktično ne igra nobene vloge, potem v lestvici vrstnega reda - to je jasno iz njenega imena - je vsa pozornost preusmerjena na to zaporedje.

Ta lestvica v statistiki vključuje takšne raziskovalne materiale, v katerih se obravnavajo predmeti, ki pripadajo enemu ali več razredom, vendar se med seboj razlikujejo - "več-manj", "višje-nižje" - itd.

Značilnosti vrstne lestvice najlažje prikažemo tako, da pogledamo objavljene rezultate katerega koli športnega tekmovanja. Ti rezultati zaporedno navajajo udeležence, ki so zasedli prvo, drugo, tretje in naslednje mesto po vrstnem redu. Toda v teh informacijah o rezultatih tekmovanj so podatki o dejanskih dosežkih športnikov pogosto odsotni ali zbledijo v ozadje, v ospredje pa so postavljena njihova vrstna mesta.

Recimo, da je šahist D. zasedel prvo mesto na tekmovanju. Kakšni so njegovi dosežki? Izkazalo se je, da je dosegel 12 točk. Drugo mesto je zasedel šahist E. Njegov dosežek je 10 točk. Tretje mesto je zasedel J. z osmimi točkami, četrto 3. s šestimi točkami itd. V poročilih o tekmovanju razlika v dosežkih pri uvrstitvi šahistov zbledi v ozadje, njihova vrstna mesta pa ostajajo na prvem mestu. Dejstvo, da se pripisuje glavni pomen vrstnemu mestu, ima svoj pomen. Dejansko je v našem primeru Z. dosegel šest, D. pa 12 točk. To so njihovi absolutni dosežki – igre, ki so jih zmagali. Če bi poskušali to razliko v dosežkih razlagati zgolj aritmetično, bi morali priznati, da Z igra dvakrat slabše od D. A s tem se ne moremo strinjati. Okoliščine tekmovanja niso vedno preproste, tako kot ni vedno preprost način, kako jih je ta ali oni udeleženec izvedel. Zato se omejujeta pri aritmetičnem absolutiziranju, kar ugotavljata: šahist 3. zaostaja za prvouvrščenim D. za tri vrstna mesta.

Socialno-psihološki vzroki in dejavniki neprilagojenosti pri mladostnikih
Deviantnega vedenja mladostnikov ne moremo imenovati le psihološki problem. Konceptualiziran je kot kompleksen družbeni problem. Glavne razloge za deviantno vedenje ljudi nasploh in še posebej mladostnikov pojasnjujejo različne...

Zavest in nezavednost v človekovi osebnosti
Zavest ni edina raven, na kateri so predstavljeni duševni procesi, lastnosti in stanja človeka; ni vse, kar človek zaznava in nadzoruje, dejansko realiziran. Človek poleg zavesti...

Praktična priporočila za optimizacijo izobraževalnih dejavnosti v razredih različnih profilov.
Na podlagi analize literature in analize dobljenih rezultatov smo razvili naslednja priporočila, ki bodo dijakom pomagala ustvariti ugodne pogoje za razvoj, samouresničevanje, osebno rast in posledično...

Eden najpogostejših problemov, s katerimi se srečujemo pri oblikovanju in instrumentaciji ankete, je, kako kompleksnemu odnosu ali vedenju dodeliti eno samo reprezentativno vrednost ali oceno. Kot primer razmislite, kako bi lahko izmerili pristranskost javnosti do študentov. Takšna pristranskost se lahko kaže v različnih oblikah, odvisno od tega, na katere lastnosti učencev je usmerjena pozornost posameznega posameznika (anketiranca). Tako nekateri študente ocenjujejo po oblačilih, drugi po obnašanju, tretji po obnašanju v vsakdanjem življenju, po socialno-ekonomskem statusu in celo po stopnji osebne higiene. Drugi so si morda ustvarili stereotipno mnenje na podlagi le enega ali dveh srečanj (prijetnih ali ne) z določenimi študenti; in nekateri morda sploh ne razlikujejo študenta od drugih ljudi. Elementi presoje se lahko zelo razlikujejo po vsebini, osredotočenosti in stopnji vrednotenja, vendar vsak od njih predstavlja, vsaj potencialno, komponento širšega koncepta »pristranskosti«.

Če je treba upoštevati vse te točke, potem moramo izbrati instrument, ki bo sposoben prepoznati in izmeriti čim več teh sestavnih elementov konceptov in bo hkrati dovolj natančen, da nam bo omogočil smiselno določiti stopnjo manifestacije splošnega koncepta v enem samem opazovanju. Z drugimi besedami, potrebujemo orodje, ki bi zajelo in prikazalo pojem, kot je pojem »pristranskost«, v vseh podrobnostih, poleg tega pa bi nam pokazalo, koliko (kakšen delež) tega pojma vsebuje posamezen primer oz. odgovor anketiranca. Eno takih sredstev se imenuje skaliranje.

Skaliranje je postopek združevanja številnih sorazmerno ozkih kazalnikov (na primer postavk ankete, ki se nanašajo na posamezne značilnosti študentov, ki so jih opazili anketiranci) v eno samo skupno mero, ki odraža širši temeljni koncept (v našem primeru predsodek). , katerega del je vsaka posamezna lastnost. Tako bi lahko izmerili odnos anketiranca do različnih tipov vedenja študentov (na primer, koliko alkohola pijejo ali kako hrupne so njihove zabave) ali obnašanja študentov (kako bahavi, arogantni ali brezobzirni so drugi ljudje). vendar nobenega od teh znakov ne moremo sprejeti ločeno kot popoln odraz tako širokega pojma, kot je predsodek. Namesto tega bi morali vse te mere nekako združiti, da bi lahko sklepali o splošnejšem zornem kotu, ki ga vsak od njih na nek način dopolnjuje in odraža. Poleg tega moramo to težavo rešiti na tak način, da lahko primerjamo količino pristranskosti (ali kateri koli koncept, ki ga merimo), ki jo vsebuje odgovor enega anketiranca, s količino, ki jo vsebuje odgovor drugega anketiranca, in na koncu presodimo, kdo od anketiranih bolj predsodkov.

Poenoteno merilo, ki odraža določen osnovni koncept, se imenuje lestvica. Posebna vrednost stopnje manifestacije v vsakem danem primeru osnovnega koncepta se imenuje ocena lestvice. Skaliranje ali konstrukcija lestvice je postopek, s katerim raziskovalec sestavi lestvico in posameznim primerom dodeli ocene na tej lestvici.

Skaliranje je metoda modeliranja realnih procesov z uporabo lestvic.

Skaliranje je metoda dodeljevanja številskih vrednosti posameznim atributom sistema.

Skaliranje vam omogoča, da opis kompleksnega procesa razdelite na opis parametrov na ločenih lestvicah. Kot rezultat, ko se na primer uporabi za ekonomske probleme, lahko dobite predstavo o področju zanimanja potrošnika in raziščete pomen posamezne lestvice zanj.

Lestvica (latinsko scala - lestev) - primerjava rezultatov merjenja količine in točk na številski premici.

Lestvica je niz oznak, razmerja med katerimi odražajo razmerja med predmeti empiričnega sistema. Lestvica lahko imenujemo rezultate merjenja, pridobljene v študiji, pa tudi merilno orodje (tj. Sistem vprašanj, vprašalnik, test).

1.2 Vrste lestvic in vrste skaliranja

Lestvice delimo po vrsti, glede na razmerja, ki jih odražajo. Poleg tega vsaka lestvica ustreza matematičnim transformacijam, sprejemljivim za to lestvico. Vrste lestvic so hierarhično razvrščene glede na kompleksnost. V psihometriji, ekonometriji in uporabni statistiki je sprejeta naslednja klasifikacija lestvic, ki jo je leta 1946 predlagal Stanley Smith Stevens:

– lestvica imen (nominalna) – najenostavnejša izmed lestvic. Številke se uporabljajo za razlikovanje predmetov. Prikaže tiste odnose, prek katerih so predmeti združeni v ločene razrede, ki se ne prekrivajo. Številka razreda ne odraža njegove kvantitativne vsebine. Primer tovrstne lestvice je razvrščanje subjektov na moške in ženske, številčenje igralcev v športnih ekipah ipd. V imenski lestvici se merijo telefonske številke, potni listi, črtne kode blaga, individualne davčne številke;

– ordinalna lestvica – prikaz vrstnih razmerij. Predmeti na tej lestvici so razvrščeni. Za to lestvico je monotona transformacija sprejemljiva. Takšna lestvica je surova, ker ne upošteva razlik med subjekti lestvice. Primer takšne lestvice: ocene akademske uspešnosti (nezadovoljivo, zadovoljivo, dobro, odlično), Mohsova lestvica;

– intervalno merilo – poleg razmerij, ki so navedena pri imenskih in vrstnih merilih, prikazuje razmerje razdalje (razlike) med objekti. Razlike na vseh točkah te lestvice so enake. Zanj je sprejemljiva linearna transformacija. To vam omogoča, da rezultate testov zmanjšate na običajne lestvice in tako primerjate kazalnike. Primer: Celzijeva lestvica.

– razmerna lestvica – za razliko od intervalne lestvice lahko odraža, koliko je en kazalnik večji od drugega. Lestvica razmerja ima ničelno točko, ki označuje odsotnost kakovosti, ki jo merimo. Ta lestvica omogoča transformacijo podobnosti (množenje s konstanto). Določanje ničelne točke je težka naloga za psihološke raziskave in nalaga omejitve pri uporabi te lestvice. S takimi tehtnicami je mogoče izmeriti maso, dolžino, moč in vrednost (ceno). Primer: Kelvinova lestvica (temperature merjene od absolutne ničle, pri čemer je merska enota izbrana po dogovoru strokovnjakov - stopinja Celzija).

Diferenčna lestvica – izhodišče je poljubno, merska enota je določena. Sprejemljive transformacije so premiki. Primer: merjenje časa.

Absolutna lestvica - vsebuje dodatno lastnost - naravno in nedvoumno prisotnost merske enote. Ta lestvica ima eno ničelno točko. Primer: število ljudi v občinstvu.

Vprašanje vrste tehtnice je neposredno povezano s problemom ustreznosti metod matematične obdelave merilnih rezultatov. Na splošno so ustrezne statistike tiste, ki so invariantne glede na dopustne transformacije uporabljene merske lestvice.


riž. 1. Razvrstitev metod skaliranja

Metode skaliranja, ki se uporabljajo v sociološkem raziskovanju, lahko razdelimo na primerjalne in neprimerjalne.

Primerjalne lestvice vključujejo neposredno primerjavo predmetov. Na primer, anketirance vprašajo, ali imajo raje kokakolo ali pepsi. Podatki iz primerjalnih lestvic se štejejo za relativne in imajo lastnosti le ordinalnih in rang vrednosti. Zato se primerjalno skaliranje imenuje tudi nemetrično. Kot je prikazano na sl. 1, primerjalne lestvice vključujejo primerjavo po parih, ordinalno razvrščanje, lestvice s konstantno vsoto, Q-razvrščanje in druge operacije.

Primerjalne lestvice so ena od dveh metod lestvice, ki vključujeta neposredno primerjavo zadevnih predmetov.

Glavna prednost primerjalnega skaliranja je sposobnost prepoznavanja subtilnih razlik med obravnavanimi predmeti. Pri primerjavi dveh predmetov morajo anketiranci izbrati med njima. Poleg tega anketiranci opravijo nalogo na podlagi danih rezultatov preference. Zaradi tega so primerjalne lestvice enostavne za razumevanje in uporabo. Druga prednost teh lestvic je sorazmerno manjše število uporabljenih teoretičnih predpostavk, pa tudi izločitev vpliva halo efekta ali učinka prehoda, ko močna naklonjenost enemu izdelku izkrivlja primerjalno oceno drugih. Glavna pomanjkljivost primerjalnih lestvic je njihova ordinalna narava in omejitev analize na določeno število obravnavanih predmetov. Na primer, treba je izvesti novo študijo za primerjavo RC Cole s Coca-Colo in Pepsi. Te pomanjkljivosti so v veliki meri odpravljene z uporabo neprimerjalnih metod skaliranja.

Pri uporabi neprimerjalnih lestvic, imenovanih tudi monadične ali metrične lestvice, je vsak predmet v prvotni obravnavani populaciji ocenjen neodvisno od drugih. Šteje se, da so pridobljeni podatki izmerjeni na intervalni ali relativni lestvici.

Neprimerjalne lestvice so ena od dveh metod lestvice, ki vključujeta samoocenjevanje vsakega predmeta.

Anketirance lahko na primer prosimo, naj ocenijo Sokeja na lestvici preferenc od 1 do 6 (1 = sploh mi ni všeč, 6 = zelo všeč). Pepsi in RC Cola imata enake cene. Iz sl. 1 kaže, da so lahko neprimerjalne ocenjevalne lestvice zvezne ali podrobne. Podrobnejše ocenjevalne lestvice pa so razdeljene na lestvice: Likert, pomenski diferencial in Stapel. V marketinških raziskavah se največkrat uporablja neprimerjalno skaliranje. Ta razdelek obravnava tehnike primerjalnega skaliranja.

1.3 Glavni problemi pri konstruiranju lestvic

Glede na zgoraj navedeno se lahko zdi, da je skaliranje dokaj preprost in neposreden postopek, ko je naloga raziskovalca preprosto identificirati več komponent glavnega koncepta, ugotoviti, kateri indikator se lahko uporabi za merjenje vsakega od njih, nato pa te indikatorje združiti v skupna ocena »... z izrekom nekaj čarobnih besed ali statističnih urokov in - ena-dva! - Je narejeno". Žal je ta navidezna preprostost varljiva, saj lahko pri izbiri in razlagi sestavnih delov lestvice naletimo na številne pasti, ki zahtevajo posebno pozornost. Prvič, obstajajo težave, povezane s konceptoma veljavnosti in zanesljivosti.

Veljavnost je lastnost, ki jo določa odgovor na vprašanje: "Ali res merimo to, kar želimo izmeriti?" V našem trenutnem kontekstu lahko to vprašanje nekoliko transformiramo takole: »Ali obstaja kakršen koli razlog za domnevo, da je vsaka od posameznih komponent lestvice (vsako od specifičnih vprašanj) res neposredno povezana z glavnim konceptom in da so vse komponente skupaj popolnoma zajeti ta koncept?« Z drugimi besedami, zastaviti si moramo vprašanje: »Ali je sploh smiselno kombinirati več delnih kazalnikov med seboj in – ker smo to že storili – ali je sploh smiselno to vrsto kazalnikov označevati z oznako osnovni koncept, ki smo ga izbrali?" Če se torej spet obrnemo na primer študentov, je treba ugotoviti, prvič, ali je mnenje osebe o vedenju študentov neposredno povezano z njegovim mnenjem o slogu oblačenja študentov ali o manirah študentov, in drugič, ali vsa ta mnenja skupaj resnično odražajo stopnjo predsodkov določene osebe do študentov.

Kar zadeva zanesljivost, jo določa odgovor na vprašanje: "Ne glede na to, kaj točno merimo, ali to počnemo dosledno?" Ko se uporabi za skaliranje, se ta težava prevede v skrb, da so različni kazalniki, ki sestavljajo lestvico, povezani med seboj na dosleden in smiseln način. Tukaj nas res ne zanima, ali nam določen niz vprašanj ali mer omogoča razlikovanje jabolk od pomaranč, temveč ali nam ta niz omogoča dosledno razvrščanje jabolk, ki smo jih že identificirali, po velikosti, barvi itd. po nekem standardu. Če je tako, bo združevanje različnih meril o jabolkih povedalo več kot katera koli posamezna mera. Toda če so naši standardi (barva, velikost itd.) nedosledni ali dvoumni, se lahko ugotovitve, ki temeljijo na njih, izkažejo za napačne. 1

Morda bo še en primer pomagal razjasniti te točke. Oglejmo si določeno lestvico, ki je zasnovana tako, da vsak anketiranec izrazi svoje strinjanje ali nestrinjanje z naslednjimi trditvami:

1. Kubanci so slabi in jim ni mogoče zaupati.

2. Francozi so slabi in jim ne gre zaupati

3. Japonci so slabi in jim ne gre zaupati.

4. Kitajci so slabi in jim ni mogoče zaupati.

Predstavljajmo si, da imamo lestvico za merjenje ksenofobije, torej strahu in nezaupanja do tujcev. Verjetno velja, da več trditev, s katerimi se respondent strinja, višjo stopnjo ksenofobije mu lahko pripišemo. Toda ali bo temu tako? Oseba, ki verjame, da so samo Kubanci slabi in da jim ni mogoče zaupati, to trdi bolj iz antikomunizma kot iz ksenofobije. Oseba, ki meni, da so samo Japonci in Kitajci slabi in da jim ni mogoče zaupati, to trdi bolj iz rasizma kot iz ksenofobije. In tudi anketiranec, ki meni, da so vse štiri skupine slabe in da jim ni mogoče zaupati, kot se ob natančnejšem pregledu izkaže, ne trpi za ksenofobijo, temveč za občutek, da vsi ljudje oziroma vse vlade (tudi države, v kateri živi) ) so slabi in jim ne gre verjeti. In ker torej ne moremo z gotovostjo reči, da ta lestvica meri ksenofobijo v svojem bistvu, potem je ta lestvica neveljavna. In ali ji sploh lahko zaupamo? Ali je premišljeno zasnovan tako, da sploh meri stopnjo ksenofobije? Strah in nezaupanje do Kitajcev sta na primer lahko indikator vsaj dveh zelo različnih značilnosti, ene ideološke in druge rasno motivirane, dva anketiranca pa lahko podata enak odgovor iz zelo različnih razlogov. In ali bo občutek ksenofobije enak za antikomunista in rasista? Najverjetneje ne. Tako bo mehanska povezava teh specifičnih točk za namen njihove primerjave v najboljšem primeru nesmiselna vaja, v najslabšem primeru pa vir napačnih sklepov. 1

Težav te vrste ni vedno enostavno premagati, zato morate pri skaliranju ravnati zelo previdno in vse izračunati vnaprej. Vendar zmožnost predstavitve kompleksnega odnosa ali vedenja kot ene same številke ali rezultata, ki je nesporna prednost skaliranja, služi kot spodbuda za uporabo te tehnike v najrazličnejših primerih.

2. VLOGA TEHTNIC V PROCESU ANALIZE PODATKOV

Merilna lestvica je algoritem za dodeljevanje številke predmetu, ki odraža prisotnost ali stopnjo izraženosti določene lastnosti. Obstajajo štiri glavne vrste merilnih lestvic: lestvica imen, lestvica vrstnega reda, lestvica intervalov in lestvica razmerij. Lestvice imen in vrstnega reda omogočajo, da se predmet razvrsti v enega od več razredov, ki se ne prekrivajo, in se imenujejo "kvalitativni". Intervalne in razmerne lestvice merijo "količino" ali stopnjo izraženosti neke lastnosti predmeta in se imenujejo "kvantitativne". Imenovalna lestvica (imenska lestvica) omogoča razvrstitev predmeta v enega od več razredov, med katerimi ni vzpostavljeno vrstno razmerje, tj. razredi, v zvezi s katerimi se ne uporabljajo primerjave, kot so "več - manj", "bolje - slabše" itd. Na nominalnih lestvicah se merijo takšni sociološki kazalci, kot so spol, narodnost ali rasa, barva oči, temperament itd. Pri razvoju nominalne lestvice se sestavi popoln seznam razredov, ki je oštevilčen v naključnem vrstnem redu. V tem primeru številke, ki predstavljajo številke razreda, igrajo vlogo simbolov ali "oznak"; zanje ni mogoče uporabiti nobenih aritmetičnih operacij. Z drugimi besedami, na nominalni lestvici je definiran samo odnos identitete: predmeti, dodeljeni enemu razredu, veljajo za enake, objekti, dodeljeni različnim razredom, pa niso enaki. Poseben primer nominalne lestvice je dihotomna lestvica, ki beleži prisotnost ali odsotnost določene lastnosti v predmetu. Prisotnost kakovosti je običajno označena s številko "1", njena odsotnost pa s številko "0". Vrstna lestvica je namenjena dodelitvi predmeta enemu od disjunktnih razredov, razvrščenih po nekem kriteriju. Na vrstni lestvici je poleg relacije identitete definirana relacija vrstnega reda (»več je manj«). Tako lahko o objektih, razvrščenih v različne razrede, rečemo, da je pri enem od njih merjena lastnost izražena močneje kot pri drugem, vendar ni mogoče ugotoviti, koliko močneje. Tipični primeri vrstne lestvice so izobrazba, vrsta naselja, družbeni status, vojaški čini itd. Pri izdelavi vrstne lestvice so razredi oštevilčeni v naraščajočem ali padajočem vrstnem redu ustrezne značilnosti. Aritmetične operacije nad številkami razreda se ne izvajajo. Poseben primer vrstne lestvice je rang lestvica, ki se uporablja v primerih, ko nekega atributa ni mogoče izmeriti, lahko pa objekte razvrstimo po ustreznem kriteriju, ali ko je vrstni red objektov pomembnejši od točnega rezultata merjenja – npr. na primer sedeži, zasedeni na športnih tekmovanjih. Lestvice rangov se uporabljajo tudi pri preučevanju preferenc, vrednotnih usmeritev, motivov, stališč itd. V tem primeru se respondenta prosi, da predlagani seznam predmetov, pojmov ali sodb uredi po določenem kriteriju. Drug poseben primer vrstne lestvice je ocenjevalna lestvica, s pomočjo katere se na podlagi določenega števila točk ocenijo lastnosti predmeta ali odnos anketiranca do nečesa. Na primer, akademska uspešnost se ocenjuje na 5-stopenjski lestvici. Ocenjevalne lestvice se pogosto obravnavajo kot izjema od vrstnih lestvic, ker predpostavljajo, da je med točkami na lestvici približno enaka razdalja. Na primer, predpostavlja se, da "odličen" študent pozna predmet toliko bolje kot "dober" študent, kot ga "dober" študent pozna bolje kot "C" študent. Ta lastnost omogoča, da se ocenjevalne lestvice v mnogih primerih obravnavajo kot kvaziintervalne in se ustrezno uporabljajo, na primer za izračun GPA ali za določitev povprečne uspešnosti v razredu. Intervalne in razmerne lestvice so S.I. V dobesednem pomenu besede. Zanje je značilna prisotnost merske enote, ki omogoča določitev, koliko je en predmet večji ali manjši od drugega glede na merilo, ki se preučuje. Razlika med tema dvema vrstama lestvic je v tem, da ima razmerna lestvica »objektivno« ničlo, neodvisno od poljubnosti opazovalca, kar praviloma ustreza popolni odsotnosti merjene kakovosti v objektu. Na intervalni lestvici je ničla postavljena poljubno oziroma v skladu z neko tradicijo in dogovorom. Tako se starost meri na razmerni lestvici, kronologija pa na intervalni lestvici, čeprav obe lestvici uporabljata isto mersko enoto - leto. Na intervalni lestvici je poleg odnosov istovetnosti in reda opredeljena relacija razlike: za kateri koli par predmetov je mogoče določiti, za koliko (merskih enot) je en objekt večji ali manjši od drugega. Intervalne lestvice se pogosto uporabljajo v psiholoških testih in psihometriji, semantičnih diferencialnih tehnikah in drugih metodah sekundarnih meritev. Lestvice odnosa merijo kazalnike, kot so višina, starost, dohodek, delovne izkušnje, število pokajenih cigaret itd. Za take spremenljivke niso definirane samo relacije istovetnosti, reda in razlike, temveč tudi relacija relacij, ki omogoča ugotavljanje, kolikokrat je en objekt večji ali manjši od drugega.

Merjenje je preslikava empiričnega sistema v numerični sistem, ki ohranja vrstni red odnosov med predmeti. Klasični koncept merjenja razlikuje dva načina dodeljevanja spremenljivih vrednosti predmetom. Prva metoda se imenuje ocenjevanje. Preslikava lastnosti predmeta na merilo se tukaj izvaja v konvencionalnih enotah. Na primer, z različnimi stopnjami natančnosti je mogoče določiti mesto osebe na lestvici "konservativnosti". Raziskovalcu ni na voljo nobene enote konzervativnosti; gradacije se lahko poljubno spreminjajo.

Sama meritev zahteva opredelitev enote – etalona lestvice. V tem primeru je mogoče meriti samo prostorske in časovne značilnosti ter števila – aditivne količine. Vendar pa je širši pogled na merjenje kot pripisovanje pomenov predmetom v skladu z danim sistemom odnosov na različnih ravneh pridobil sprejem v družbenih in vedenjskih vedah.

Spremenljivka ni isto kot dejanski atribut ali lastnost. To je neke vrste ravnilo - skupek norm in operacij, ki so potrebne in zadostne za kvalifikacijo dogodka, lastnosti, razmerja, skratka vsega, kar se običajno razume kot dejstva. Za ravnilo ni zelo pomembno, ali so njegove delitve nanesene na leseno, plastično ali kovinsko ploščo. Veliko bolj pomembna je gradacija lestvice, pa tudi uporabnikova sposobnost pravilnega merjenja. Podobna situacija je pri merjenju vedenja, le da ima "ravnilo" v tem primeru obliko vprašalnika (ali obrazca za opazovanje), "aplikacija" le-teh na predmet pa ni nič drugega kot operativna definicija.

Kot merilni instrument spremenljivko konstruira raziskovalec z vzpostavitvijo kontinuuma vrednosti (stopenj). Minimalni minimorum kontinuuma je, kot že vemo, dihotomija: »da« in »ne«, plus in minus, potrditev in zanikanje. Pravzaprav imamo skoraj vedno opravka s trihotomijami, saj vsaka spremenljivka vključuje stopnjevanje »brez odgovora« (ali »brez podatkov«).

Tako spremenljivka vsebuje tri komponente: 1) ne vedno jasno oblikovan koncept atributa, ki se meri, na primer "volilne preference", "družinska stabilnost", "izobrazba" itd.; 2) lestvica - niz vrednosti, ki določajo merila za razvrščanje predmetov; 3) operativna definicija - niz navodil, ki urejajo postopek identifikacije predmeta v skladu z uveljavljeno lestvico vrednosti.

Osnovni nivo merjenja je nominalni. Ta raven ustreza lestvici poimenovanja, ki je sestavljena iz značilnih vrednosti, ki niso razvrščene po naraščajočih ali padajočih stopnjah. Tipični primeri imenske lestvice: narodnost, poklic, politično prepričanje. Vrednosti lestvice poimenovanja so sestavljene v skladu z logičnimi pravili klasifikacije. Prvo od teh je pravilo neprotislovja. Navaja: "Predmet je mogoče dodeliti enemu in samo enemu razredu, kot je določeno z vrednostjo spremenljivke." Z drugimi besedami, raziskovalec je dolžan stvari imenovati s pravimi pravili in se izogibati dialektiki, v kateri se objekt hkrati izkaže za oboje. To ni tako enostavno narediti, kot se zdi - imenovati stvar s pravim imenom. Včasih se zdi, da so reakcionarji liberalci, neumni ljudje se zdijo pametni, ženske se zdijo kot moški. Toda tudi v najtežjih situacijah je analitik dolžan objektu dati nedvoumno kvalifikacijo. Tukaj je veliko dovoljeno. Edina stvar, ki je prepovedana, je klasificirati predmet kot bel in črn hkrati.

Posledica tega pravila je stoodstotna vsota frekvenc vseh gradacij spremenljivke. Če vsota frekvenc preseže mejo sto odstotkov, to pomeni, da so vsaj nekatere enote sodile v dva razreda hkrati in so bile štete večkrat. To se zgodi, ko vprašalnik zahteva izbrano lestvico, kjer lahko izberete eno, drugo in tretje. Na primer, vpraša se: "Kaj imaš najraje?" z možnostmi odgovora: maca, šiš kebab, liberalno demokratične svoboščine ... Tukaj lahko izberete vse nasvete vprašalnika, pri čemer ne boste dobili 100-odstotnega seštevka, če vsaj eden od anketirancev sodi v razred oboževalcev matzo in liberalno demokratične svoboščine. Razlog za izkrivljanje je v tem, da podane pozicije ne predstavljajo spremenljivke, nasprotno, vsaka od njih je "okrnjena" različica spremenljivke. Polna različica zahteva odgovore "Da", "Ne" in "Ne morem reči". Pravilno sestavljena spremenljivka predstavlja enodimenzionalni kontinuum. Za razliko od večdelnih dimenzij ne zahteva združevanja. Od tod drugo pravilo - pravilo enotne podlage za razvrščanje. Ne morete deliti ljudi na pametne in rdečelaske, ker se včasih rdečelasi izkažejo za pametne. V enem vprašanju ne morete mešati dveh različnih spremenljivk. Nemogoče je ne upoštevati spremembe pomena spremenljivke, ko jo premaknemo v drug kontekst. Na primer, vprašanje o odnosu do intelektualcev v Moskvi in ​​Chicagu se bo izkazalo za dve različni vprašanji, saj je v ruski tradiciji intelektualcu običajno pripisati vlogo nosilca moralnih načel, medtem ko prebivalec Chicago ne bo takoj uganil, koga pomeni "intelektualec".

Tretje pravilo je pravilo popolnosti. V proučevani populaciji ne sme biti niti enega predmeta, ki ga ni mogoče identificirati z danimi vrednostmi. Z drugimi besedami, predmet mora biti porazdeljen na kontinuum spremenljivke in dobiti svoje mesto v enem od razredov. Če se to ne zgodi, se postopek merjenja "zamrzne" - preprosto ni ničesar ali nikogar, na katerega bi lahko uporabili ravnilo. Upoštevajte, da položaj »Brez podatkov« rešuje problem popolnosti, ko lestvica ne pokriva celotnega obsega vrednosti. Na primer, anketirančeva zavrnitev poročanja o svoji starosti ne pomeni, da je starostna lestvica nepomembna za postavko. Primerov lestvic, ki nimajo nikakršne povezave z objektom, z drugimi besedami, zanj niso relevantne, je veliko. Sociologi pogosto poskušajo izmeriti mnenja, stališča in druge osebne značilnosti, ob predpostavki, da ima vsak lastnost, ki jo proučujemo. Na primer, vprašanje: »Kakšen je vaš odnos do Burbulisa?«, ki so ga leta 1992 zastavili nekateri centri za raziskovanje javnega mnenja, je temeljilo na prepričanju, da je lastnost »Odnos do Burbulisa« prisotna pri vseh, ki so bili vključeni v vzorec. Sama možnost, da oseba do Burbulisa ni imela niti pozitivnega niti negativnega odnosa, je bila izključena. Zdi se, da položaj "ne morem reči" vključuje tovrstne anketirance, vendar to ne vključuje le tistih, ki nimajo mnenja, ampak tudi tiste, ki nimajo samega atributa.

Pri sociološkem merjenju se pogosto pojavi vrsta umetno ustvarjene pojavne spremenljivke – spremenljivke, ki jih ustvari sam postopek. Ljudje, ki pred intervjujem niso imeli nikakršnega odnosa do preučevane lastnosti, ta odnos zgradijo v procesu medosebne komunikacije z anketarjem in odgovarjajo »pozitivno«, »negativno« ali največkrat »nevtralno«. Razlogi za pojavne spremenljivke so najbolj povezani z vplivom anketarja.

G. A. Pogosyan prikazuje tipične okoliščine, v katerih spremenljivke ne opisujejo toliko neodvisnega govornega vedenja anketiranca, temveč bolj situacijo zbiranja podatkov. Pogosyan je zlasti pokazal, da poziv k odgovoru bistveno spremeni porazdelitev frekvence.

Iz tabele je razvidno, da »namig« bistveno poveča število ljudi, ki menijo, da imajo dobri strokovnjaki največ možnosti za napredovanje, in skoraj toliko zmanjša število tistih, ki izkazujejo pokornost. Ob predpostavki, da odprta vprašanja zagotavljajo več možnosti za neodvisno izražanje mnenja, poziv vodi do artefakta: 62 % jih je izbralo ustrezno različico odgovora, namesto da bi izrazilo svoje mnenje.

Pri oblikovanju spremenljivk si sociolog prizadeva zagotoviti, da te ustrezajo dejanskemu vedenju objekta. Hkrati jih je dolžan organizirati na logičen način, zanemarja pa dejstvo, da je »življenje« pogosto nelogično in dvoumno. Tu se pojavi dilema: ali opisati življenje v vsej njegovi nedoslednosti ali zgraditi diagrame. V prvem primeru je bolje, da se sociolog odloči za pisateljsko kariero; v drugem primeru je treba poskušati zagotoviti, da logična shema ustreza resničnosti.

Zahteve po korespondenci ena na ena in enotni podlagi vsebujejo določeno nasilje nad »človeško« realnostjo. V življenju se "da" pogosto spremeni v "ne", "demokrati" se imenujejo komunisti, a plus se izkaže za minus. Najbolje je delati z nominali, za katere se domneva, da so najbolj skladni z jezikom družbene interakcije in vedenja. Nominalne meritve v socioloških in družbeno-ekonomskih raziskavah veljajo za temeljne za razumevanje same narave družbene realnosti. S.V. Česnokov utemelji ta sklep na predpostavki, da so nominalne spremenljivke končni rezultat postopkov empirične verifikacije teoretičnih konceptov, kadar koli so predmet raziskave v takšni ali drugačni meri ljudje, njihova zavest in vedenje. "To je posledica dejstva," piše S.V. Česnokova, »da tako sociolog-raziskovalec kot ljudje, ki so izrazili dobro voljo za stik s sociologom, v vlogi respondentov izražajo svoje reakcije, oblikujejo in opisujejo družbeno v podobah in pojmih, katerih znaki so besede, ne številke«8 . To pomeni predpostavko omejenih možnosti za numerično analizo podatkov. Humanitarna razsežnost S.V. Chesnokov imenuje vsako poimenovanje, deterministična analiza pa je vzpostavitev naslednjega "če a, potem b", kjer sta a in b imeni.

Brez dvoma so nominalne spremenljivke, ki beležijo specifične vrednosti, temelj sociološkega besednjaka. Vendar ta njihova značilnost ni toliko zakoreninjena v "živem jeziku" družbene komunikacije, temveč v enakovrednosti spremenljivih vrednosti protokolarnim izjavam o zapisovanju dejstev. Tovrstni nominalni »protokoli«, ne glede na njihovo vsebino, ležijo v temelju vsakega znanstvenega opisa. Lestvice (kontinuumi) same po sebi so načini organiziranja nominalnih vrednosti v idealiziranih metrikah, vendar mora biti v vsakem primeru izpolnjena zahteva ujemanja ena proti ena med enoto in vrednostjo spremenljivke.

Zahteve za nazivne mere (identifikacije) morajo biti izpolnjene tudi za lestvice višje stopnje: urejene, intervalne in metrične.

Urejena lestvica se od nominalne razlikuje po tem, da so njene stopnje razporejene v določenem vrstnem redu glede na naraščajočo ali padajočo intenzivnost lastnosti.

Urejeni razred vključuje ocenjevalne lestvice, stališča in preference. V sociologiji se uporabljata dve vrsti urejenih lestvic: rangi (ocene) in točke. Uvrstitve se določijo tako, da se objektu dodeli mesto tako, da je število mest natančno enako številu predmetov. Učence lahko na primer porazdelite po stopnji pripravljenosti in vsakemu dodelite mesto, začenši od prvega do zadnjega. Z drugimi besedami, rangiramo jih, saj vemo, da morata biti ne glede na stopnjo znanja v skupini prvi in ​​zadnji. Podoben sistem spodbujanja proizvodnje, ki temelji na ideji nagrajevanja prvega na račun drugega, je bil uporabljen v šestdesetih letih prejšnjega stoletja. V.M. Yakusheva, ki je eksperimentiral v enem od oblikovalskih birojev, je eksperiment postal znan kot "Pulsar". Ker bo v vsakem primeru nekdo zadnji, je skupina postavljena v pogoje tekmovanja in boja za obstanek.

Ocena kot vrsta družbene ocene je norma določene vrste kulture, ki temelji na prednosti individualnega interesa pred kolektivnimi interesi. Življenjski in poklicni uspeh je tukaj konceptualiziran kot zmaga nad drugimi. V tovrstni igri velja, da je neumno in celo nemoralno pustiti sošolcu goljufati na testu – navsezadnje to pomeni, da z njim izgubiš na tekmovanju. Sčasoma so pognani konji ustreljeni, kajne? Vse to se ne dogaja samo v študiju, ampak tudi v poslu, družini, komunikaciji in veri. Teorija racionalne izbire temelji prav na ideji optimizacije posameznikovega vedenja z omejenimi viri.

Točkovne lestvice ne delujejo s kraji, temveč s šolskimi vrednotami. Te vrednosti so neodvisne druga od druge. V nekem smislu ima točkovna lestvica egalitarni izvor. Vsi študenti, vključno s prvim in zadnjim, lahko dobijo C in so srečni po teoriji relativne deprivacije. Vendar pa je zanesljivost tovrstne lestvice zelo vprašljiva, zlasti v primerih, ko se za oznake uporabljajo številke. Razdalja od 4 do 5 ni enaka kot razdalja od 2 do 3. Vsak učitelj ima svoje želje glede tega, kam na kontinuumu postavi učence. Eden da 2 in 3, drugi 4 in 5. Kako ju primerjati? Tu ni velikih težav, saj je mogoče posamezne vrednosti normalizirati glede na povprečno oceno ali standardno odstopanje rezultatov za vsakega učitelja.

Urejene ocenjevalne lestvice vključujejo logično uravnoteženje položajev glede na nevtralno sredino. Ta zahteva odraža splošnejše pravilo za konstruiranje lestvic: za vsako kategorijo lestvice mora biti značilna enaka verjetnost "zadeta" predmeta, ob upoštevanju naključne porazdelitve. Z drugimi besedami, število stopenj desno od sredine mora biti enako številu stopenj levo. Pogosto se vrednost "Ne morem reči" uporablja kot "središče" lestvice. To ustvarja očitno dvoumnost pri interpretaciji podatkov. »Ne morem reči« pomeni, da respondent ne more izbrati nobenega od predlaganih položajev; če pa je »Ne morem reči« v središču uravnotežene lestvice, to pomeni »Težko imam karkoli raje«.

Kadar vrednosti urejene ocenjevalne lestvice nimajo jasno opredeljenih meja, postane lestvica pol urejena. Pravzaprav se pol urejene lestvice najpogosteje uporabljajo v socioloških in psiholoških raziskavah.

Intervalne lestvice temeljijo na postopkih, ki zagotavljajo enake ali približno enake razdalje med gradacijami spremenljivke. V tem primeru se ne primerjajo vrednosti spremenljivk, temveč razdalje med vrednostmi. Z drugimi besedami, kateri koli dve meritvi danega empiričnega sistema, izvedeni na intervalni lestvici, se pretvorita druga v drugo z uporabo linearne funkcije.

Če je na nominalni lestvici zaporedje predmetov določeno brez večjih težav, intervalna lestvica vključuje reševanje problema primerjave razdalj med predmeti. Ta lastnost linearnih transformacij, značilnih za intervalne lestvice, je prikazana z numeričnim primerom: 5 - 2 / 2 - 1 = 24 - 15 / 15 - 12 = 3. Razmerje razlik med vrednostmi lestvice je v tem konstantno Ovitek." Če je eden od objektov intervalne lestvice prikazan na nič, lahko govorimo o razmerni lestvici - posebnem primeru intervalne lestvice. V tem primeru je začetek odštevanja12 fiksen.

Intervalno lestvico lahko zgradite z uporabo parnih primerjav ali z uporabo sodnih postopkov, kot je to storil L. Thurstone. Najprej se ustvari niz ustreznih sodb, ki opisujejo atribut, ki se meri, na primer odnos, odnos ali oceno. Nato so strokovnjaki pozvani, da razvrstijo sodbe v kategorije od največje intenzivnosti lastnosti do najmanjše. Predpostavlja se, da je porazdelitev sodniških ocen okoli vrednosti lestvice predmet običajnega zakona. Izbrane so tiste presoje, ki so prejele in soglašale z ocenami sodnikov. To je metoda konstruiranja »intervalov, ki se zdijo enaki«. Najbolj znane metode za konstruiranje intervalnih lestvic so razvili L. Thurstone, R. Likert in L. Guttman. Vendar se v sodobni sociologiji redko uporabljajo.

Metrične ali absolutne tehtnice izpolnjujejo vse zahteve za tehtnice nižjih razredov; imajo ne le referenčno oznako nič, ampak tudi mersko enoto za čas, razdaljo ali število enot. Tukaj so dovoljene vse transformacije s števili.

Pripisovanje pomena predmetom se pojavlja v treh oblikah: besedni, grafični in numerični. Verbalna interpretacija spremenljivk je najpogostejša pri množičnih raziskavah. Elementi lestvice so tukaj sodbe, ki kažejo mnenja, vrednote in stanja. Poseben problem je, kako ustrezni so ti dokazi. Nekaj ​​je jasno: same sodbe niso nič drugega kot dokaz realnosti, ki stoji za njimi. Zato ima verbalna interpretacija lestvice vlogo nekakšne sonde v jeziku vsakdanjega življenja. Njegova temeljna razlika od vsakdanjega govora je v jasni konceptualni strukturi, prilagojeni različnim govornim situacijam in kontekstom. Tudi odprto vprašanje, ki je na videz maksimalno osredotočeno na respondentov besednjak, deluje le, če obstaja nedvoumno konceptualno kodiranje.

Verbalno interpretirani položaji na lestvici se zaznavajo precej jasno, če jih je malo. Toda že pri izbiri med petimi stopnjami se začnejo težave. Na primer, kategoriji "zadovoljen" in "prej zadovoljen kot nezadovoljen" se razlikujeta s precejšnjo stopnjo konvencije. Pri sedemstopenjski lestvici so možnosti verbalne interpretacije izčrpane. Pri tem je prednostna grafična zasnova lestvice, ki ustvarja možnost standardnega odčitavanja. Grafična interpretacija lestvice se uporablja v tako imenovanih medkulturnih študijah, kjer besedišče inštrumenta zahteva prevod v jezik respondenta. Vizualizacija spremenljivke v sliki naj bi ustvarila univerzalni »vzorec« lestvice. Kretnje se na podoben način uporabljajo v mednarodni komunikaciji. Primer orodja, izdelanega v grafičnem ključu, so slike tematskega apercepcijskega testa. Tehtnice so pogosto upodobljene kot ravnila in piktogrami. Harvey Cantril je razvil »lestev sreče«: na risbi lestvice mora anketiranec označiti svoj trenutni položaj glede na najboljšo (zgornji del lestvice) in najslabšo (spodnji del lestvice) kombinacijo okoliščin, nato pa navesti smer njegovega predvidenega gibanja po »lestvici sreče«. L. Thurstone je v eni od zgodnjih različic lestvice stališč predlagal enajsttočkovni kontinuum, izdelan v obliki termometra.

Numerično interpretacijo včasih napačno istovetimo z besedno interpretacijo. Uporaba števil kot številskih imen ne pomeni uvedbe metrike. Na primer, za namene kodiranja so lahko moški označeni kot 1, ženske pa kot 2. V tem primeru so uporabljene oznake, ne pa številke. Številke vključujejo izvajanje operacij aditivnosti in aritmetičnih operacij. Razpon numeričnih lestvic je omejen na intervalne in metrične ravni merjenja, kjer so določene enote intenzivnosti lastnosti.


Vrste statističnih lestvic: nominalna lestvica, ordinalna lestvica, intervalna lestvica, razmerna lestvica.

Nazivna lestvica uporablja se za beleženje najnižje ravni meritve, ki predpostavlja obstoj minimalnih predpogojev za meritev. Pri merjenju na tej ravni se praktično ne uporabljajo številke. Pri tem je pomembno ugotoviti podobnost ali različnost predmetov po neki značilnosti, tj. v tem primeru imamo opravka s kvalitativnimi podatki. Poglejmo si primere.

Razporeditev učencev po razredih, po spolu, po kraju bivanja, po vrsti športa, s katerim se ukvarjajo, po številu otrok v družini so primeri nominalnih vrednosti lestvice. V tem primeru je možno študente razporediti po dveh ali več značilnostih (dvodimenzionalni ali večdimenzionalni podatki).

S štetjem lahko ugotovite pogostost posamezne kategorije (število fantov in deklet v šoli; število učencev, ki živijo v posameznem okrožju; število učencev v posameznem razredu; število učencev, ki se ukvarjajo z določenim športom; število podjetij, ki se ukvarjajo s proizvodnjo avtobusov itd. .d.). V tem primeru je mogoče določiti največkrat pojavljajočo se vrednost (razred, v katerem se izobražuje največje število učencev; vrsta športa, ki je med učenci najbolj priljubljena; vrsta avtomobila, ki ga proizvaja največje število podjetij). Kategorije podatkov na nominalni lestvici so praviloma označene ustno.

Vrstni red, oz rang, lestvica označuje le zaporedje nosilcev lastnosti oziroma smer stopnje izraženosti lastnosti.

Na primer, učence je mogoče razvrstiti glede na število testnih postavk, ki jih pravilno opravijo. Učenci A, B, C, D, E naj pravilno rešijo 21, 16, 12, 9 oziroma 3 naloge. Grafično je to mogoče prikazati takole

Ta ordinalna lestvica ima vrednosti od 1 do 5, učenci pa so na njej razvrščeni glede na število pravilno opravljenih nalog: A - prva, D - peta. Slika prikazuje, da so intervali, ki ločujejo mesta v vrsti, različno veliki. Iz tega razloga seštevanje, odštevanje, množenje in deljenje vrstnih vrednosti ni praktično.

Vklopljeno intervalna lestvica enaki intervali odražajo enako mero vrednosti izmerjene karakteristike. Na primer, 1 cm med 3 in 4 centimetri na lestvici za merjenje dolžine ima enak pomen kot 1 cm med 82 in 83 centimetri. Z drugimi besedami, na intervalni lestvici so razdalje med sosednjimi razdelki enake. Na intervalni lestvici je vprašanje "za koliko?" precej smiselno. Toda pri uporabi intervalne lestvice ni mogoče vedno oblikovati vprašanja "kolikokrat?". Dejstvo je, da so na intervalni lestvici referenčna točka (nič lestvice), merska enota in referenčna smer nastavljeni poljubno. Primer intervalne lestvice je temperaturna lestvica Celzija. Razlika med temperaturami zraka +30 in +20 °C je tako velika kot med -10 in -20 °C. Ne moremo pa trditi, da je pri temperaturi zraka +30 °C enkrat in pol toplejši kot pri temperaturi +20 °C. Tudi če je temperatura zraka 0 °C, ni mogoče reči, da toplote sploh ni: navsezadnje je izhodišče izbrano poljubno.

Lestvice na večini fizičnih instrumentov (ampermeter, voltmeter itd.) so intervalne. Lestvica IQ je intervalna lestvica.

Intervalna lestvica je metrična in se lahko uporablja za seštevanje in odštevanje. Ima pomembne prednosti pred nominalno in ordinalno lestvico.

Lestvica odnosov, oz proporcijska lestvica, omogoča vzpostavitev razmerij med vrednostmi izmerjene značilnosti zaradi dejstva, da vrednost lestvice "0" ustreza vrednosti, za katero je izmerjena značilnost odsotna. Z drugimi besedami, izvor na teh lestvicah je izbran neprostovoljno. Primeri razmerij so mere za dolžino (m, cm itd.) in maso (kg, g itd.). Objekt, dolg 100 cm, je dvakrat daljši od predmeta, dolgega 50 cm. Včasih je treba podatke transformirati. Potreba po tem se pojavi zlasti takrat, ko v podatkovni seriji en ali več podatkov znatno presega ostale. Če so podatki očitno izkrivljeni, zamenjajte vsako vrednost danega niza podatkov z logaritmom te vrednosti, da poenostavite statistično analizo.Logaritem pretvori "poševne" (asimetrične) podatke v bolj simetrične, ko se lestvica "raztegne" blizu ničle, se majhne vrednosti, združene skupaj, porazdelijo vzdolž lestvice. Istočasno logaritem združuje velike vrednosti na desnem koncu lestvice. Najpogosteje uporabljeni so decimalni in naravni logaritmi. Enake razdalje prilogaritemsko lestvico na izvirni lestvici ustreza enakemu odstotku povečanja in ne enakemu povečanju vrednosti.

^ Preverjanje normalne porazdelitve.

Številne metode, s katerimi se obdelujejo spremenljivke intervalne lestvice, temeljijo na hipotezi, da njihove vrednosti sledijo normalni porazdelitvi. Pri tej porazdelitvi je večina vrednosti združenih okoli določene povprečne vrednosti, na obeh straneh katere se pogostost opazovanj enakomerno zmanjšuje.

Kot primer razmislite o normalni starostni porazdelitvi, ki je sestavljena iz podatkov iz študij hipertenzije (datoteka hyper.sav) z uporabo ukazov menija Grafi Histogramm... (Histogram) (glejte sliko 5.1).

Diagram prikazuje krivuljo normalne porazdelitve (Gaussov zvon). Dejanska porazdelitev v večji ali manjši meri odstopa od te idealne krivulje. Vzorci, ki strogo upoštevajo normalno porazdelitev, se v praksi praviloma ne pojavljajo. Zato je skoraj vedno treba ugotoviti, ali se realna porazdelitev lahko šteje za normalno in kako pomembno se dana porazdelitev razlikuje od normalne.

Pred uporabo katere koli metode, ki predvideva obstoj normalne porazdelitve, je treba najprej preveriti prisotnost slednje. Klasičen primer statističnega testa, ki predpostavlja normalno porazdelitev, je Studentov t test, ki primerja dva neodvisna vzorca. Če podatki ne sledijo normalni porazdelitvi, je treba uporabiti ustrezen neparametrični test, v primeru dveh neodvisnih vzorcev - Mannov in Whitneyjev U test.

Če se vizualna primerjava dejanskega histograma z zvonasto krivuljo zdi nezadostna, lahko uporabite Kolmogorov-Smirnov test, ki ga najdete v meniju Analyze v naboru neparametričnih testov (glejte razdelek 14.5).

riž. 5.1: Starostna porazdelitev

V našem primeru starostne porazdelitve Kolmogorov-Smirnov test ne kaže bistvenega odstopanja od normalne porazdelitve.

^ Odvisnost in neodvisnost vzorcev.

Dva vzorca sta odvisna drug od drugega, če lahko vsako vrednost enega vzorca na naraven in nedvoumen način pripišemo točno eni vrednosti drugega vzorca. Na enak način se določi odvisnost več vzorcev.

Najpogosteje se odvisni vzorci pojavijo, ko se meritve izvajajo na več točkah v času. Odvisni vzorci tvorijo vrednosti parametrov proučevanega procesa, ki ustrezajo različnim časovnim točkam.

V SPSS bodo odvisni (tudi povezani, seznanjeni) vzorci predstavljeni z različnimi spremenljivkami, ki se med seboj primerjajo v ustreznem testu na istem nizu opazovanj.

Če pravilna in nedvoumna korespondenca med vzorci ni mogoča, so ti vzorci neodvisni. V SPSS neodvisni vzorci vsebujejo različna opažanja (na primer različnih anketirancev), ki se običajno razlikujejo po skupinski spremenljivki, povezani z nominalno lestvico.

^ Pregled pogostih testov za preverjanje hipotez o srednji vrednosti.

V najpogostejši situaciji, ko je treba različne vzorce primerjati med seboj na podlagi njihovih srednjih vrednosti ali median, ob upoštevanju pogojev, opisanih v razdelku 5.1, se običajno uporabi eden od naslednjih osmih testov.

^ Spremenljivke, povezane z intervalno lestvico in podvržene normalni porazdelitvi

^ Spremenljivke, ki so na ordinalni lestvici, ali spremenljivke, ki so na intervalni lestvici, vendar niso normalno porazdeljene

^ Verjetnost napake.

V analitični statistiki so se razvile metode za izračun tako imenovanih testnih (kontrolnih) vrednosti, ki se izračunajo po določenih formulah na podlagi podatkov, ki jih vsebujejo vzorci, ali iz njih pridobljenih značilnosti. Te testne vrednosti ustrezajo določenim teoretičnim porazdelitvam (t-porazdelitev, F-porazdelitev, porazdelitev X2 itd.), ki omogočajo izračun tako imenovane verjetnosti napake. Ta verjetnost je enaka odstotku napake, ki jo lahko naredimo z zavrnitvijo ničelne hipoteze in sprejetjem alternative.

Verjetnost je v matematiki definirana kot vrednost v razponu od 0 do 1. V praktični statistiki je pogosto izražena tudi kot odstotek. Običajno je verjetnost označena s črko p:

0
Verjetnost napake, pri kateri je sprejemljivo zavrniti ničelno hipotezo in sprejeti alternativno hipotezo, je odvisna od vsakega posameznega primera. V veliki meri je ta verjetnost odvisna od narave situacije, ki se proučuje. Čim večja je zahtevana verjetnost, s katero se je treba izogniti napačni odločitvi, tem ožje so izbrane meje verjetnosti napake, pri katerih se ničelna hipoteza zavrne, tako imenovani interval zaupanja verjetnosti.

Obstaja splošno sprejeta terminologija, ki se nanaša na verjetnostne intervale zaupanja. Trditve z verjetnostjo napake str


^ Verjetnost napake

Pomembnost

Imenovanje

p > 0,05

Ni pomembno

ns

R

Pomemben

*

R

Zelo pomembno

**

R

Največji pomen

***

^ Interval zaupanja verjetnosti.

Interval zaupanja - izraz, ki se uporablja vmatematična statistika z intervalno (v nasprotju s točkovno) oceno statističnih parametrov, kar je prednostno pri majhni velikosti vzorca. Interval zaupanja je tisti, ki pokriva neznan parameter z dano zanesljivostjo.

Interval zaupanja parametra θ porazdelitev naključne spremenljivke X s stopnjo zaupanja 100 p %[opomba 1] , ki ga ustvari vzorec ( x 1 ,…,x n), se imenuje interval z mejami ( x 1 ,…,x n) in ( x 1 ,…,x n), ki so realizacije naključnih spremenljivk L(X 1 ,…,X n) in U(X 1 ,…,X n), tako da

Mejne točke intervala zaupanja se imenujejo meje zaupanja.

Na intuiciji temelječa razlaga intervala zaupanja bi bila: če str velik (recimo 0,95 ali 0,99), potem interval zaupanja skoraj zagotovo vsebuje pravo vrednost θ .

^ Deskriptivna (opisna analiza).

Pri tej vrsti analize gre za opisno predstavitev posameznih spremenljivk. To vključuje ustvarjanje frekvenčne tabele, izračun statističnih značilnosti ali grafično predstavitev. Frekvenčne tabele so izdelane za spremenljivke, povezane z nominalno lestvico, in za ordinalne spremenljivke, ki nimajo preveč kategorij; o tem glej 6., 12. in 24. poglavje.

Za spremenljivke, povezane z nominalno lestvico, ni mogoče izračunati pomembnih statističnih značilnosti. Najpogosteje se za ordinalne spremenljivke in spremenljivke, ki so povezane z intervalno lestvico, vendar niso podvržene normalni porazdelitvi, izračunajo mediane in oba kvartila (glej poglavje 6.2); Če je število kategorij majhno, lahko uporabite možnost za koncentrirane podatke (glejte razdelek 6.3).

Za spremenljivke na intervalni lestvici in ob normalni porazdelitvi se najpogosteje izračunajo povprečje in standardni odklon ali standardna napaka (glejte poglavje 6.2). Vendar je treba izbrati samo eno od teh dveh značilnosti razpršenosti. Za spremenljivke na vseh statističnih lestvicah je mogoče sestaviti široko paleto grafov, ki prikazujejo frekvence, povprečja ali druge značilnosti.

^ Analitična statistika.

Skoraj vsaka statistična analiza poleg povsem deskriptivnih operacij vključuje določene analitične metode (teste pomembnosti), katerih uporaba na koncu določi verjetnost napake p (glej razdelek 5.3).

Za ugotavljanje, ali se dva ali več različnih vzorcev razlikujeta v svojih povprečjih ali medianah, se uporablja velika baterija testov. Pri tem se upošteva razlika med neodvisnimi vzorci (različna opazovanja) in odvisnimi vzorci (različne spremenljivke; glejte razdelek 5.1.3). Glede na število vzorcev (dva ali več), ali so vzorci odvisni ali ne, ali spremenljivke pripadajo intervalni ali ordinalni lestvici ali ali so podvržene normalni porazdelitvi, se uporabljajo specializirani testi (glej poglavje 5.2) .

Zelo pogosta situacija se zgodi, ko se primerjajo različne skupine opazovanj ali vrednosti spremenljivk, povezanih z nominalno lestvico. V tem primeru se izdelajo kontingenčne tabele (glej poglavje 11). Druga skupina testov zadeva preučevanje odnosov med dvema spremenljivkama, to je ugotavljanje korelacij in rekonstrukcijo regresij (glej 15. poglavje, razdelek 16.1).

Poleg teh dokaj preprostih statističnih metod obstajajo tudi bolj zapletene metode multivariatne analize, ki običajno uporabljajo več spremenljivk hkrati. Na primer, če želite zmanjšati veliko število spremenljivk na manjše število "svežnjev spremenljivk", imenovanih faktorji, se izvede faktorska analiza (poglavje 19). Če je naš cilj nasproten - združiti podana opazovanja in iz njih oblikovati grozde, potem uporabimo klastersko analizo (20. poglavje).

V določeni skupini multivariatnih testov ločimo odvisno spremenljivko, imenovano tudi tarča, in več neodvisnih spremenljivk (vplivne ali napovedne spremenljivke).


^ Odvisna spremenljivka

Neodvisne spremenljivke

Večdimenzionalna metoda

Dihotomna

Kaj

Binarna logistična regresija (oddelek 16.4); diskriminantna analiza (18. poglavje)

Dihotomna



Logit-log linearni modeli

Z nominalno lestvico

Z nazivno ali ordinalno lestvico

Multinomska logistična regresija (razdelek 16.5)

Z ordinalno lestvico

Z nazivno ali ordinalno lestvico

Ordinalna regresija (razdelek 16.6)

Z intervalno lestvico

Z nazivno ali ordinalno lestvico

Analiza variance (razdelek 17.1)

Z intervalno lestvico

Kaj

Analiza kovariance (oddelek 17.2); multipla regresijska analiza (oddelek 16.2)

Multinomska logistična regresija in ordinalna regresija lahko uporabljata tudi kovariate intervalne lestvice.

Neodvisne spremenljivke, povezane z nominalno lestvico v binarni logistični regresiji, diskriminantni analizi in multivariatni regresijski analizi, morajo biti dihotomne ali razčlenjene na niz dihotomnih spremenljivk (glejte razdelek 16.2). Logit-log linearni modeli niso obravnavani v tej knjigi, temveč v drugem zvezku, ki je posvečen metodam raziskovanja trga in javnega mnenja.



Vam je bil članek všeč? Delite s prijatelji!