Zaslonski obrazci za prikaz statističnih informacij. Predavanja o statistiki

Statistični graf je risba, v kateri so statistični agregati, označeni z določenimi kazalniki, opisani z uporabo običajnih geometrijskih podob ali znakov. V statističnih grafih se najpogosteje uporablja sistem pravokotnih koordinat, obstajajo pa tudi grafi, zgrajeni po principu polarne koordinate(krožni grafi).

Razvrstitev vrst grafov:

a) način gradnje grafične podobe;

b) geometrijske znake, ki prikazujejo statistične kazalnike in razmerja;

c) problemi rešeni z uporabo grafičnih podob.

Statistični grafi glede na obliko grafične podobe:

1. Linearni: statistične krivulje.

2. Planarno: stolpec, trak, kvadrat, okrogel, sektor, kodrast, pika, ozadje.

3. Volumetrične: porazdelitvene površine.

Statistični grafi po načinu gradnje in slikovnih nalogah:

1. Diagrami: primerjalni diagrami, dinamični diagrami, strukturni diagrami (najpogostejša metoda grafičnih podob. To so grafi kvantitativnih razmerij).

2. Statistične karte: kartogrami, kartodiagrami (grafi kvantitativne porazdelitve po površini. Po svojem glavnem namenu so tesno povezani z diagrami in so specifični le v tem smislu, da predstavljajo običajne slike statističnih podatkov na konturni geografski karti, tj. prikazujejo prostorsko porazdelitev ali prostorsko porazdelitev statistike)

10/ Absolutni kazalniki

Absolutni kazalniki odražajo fizične razsežnosti procesov in pojavov, ki jih preučuje statistika, in sicer njihovo maso, površino, prostornino, obseg in časovne značilnosti. Vedno so poimenovane številke. Izraženo v naravno, stroškovno ali delovno merske enote.

Naravne enote – tone, kilometri, litri, sodi, kosi.

Običajne naravne enote se uporabljajo, kadar ima izdelek več sort in je skupno prostornino mogoče določiti le na podlagi potrošniške lastnosti, ki je skupna vsem sortam. Pretvorba v konvencionalne enote se izvaja na podlagi posebnih koeficientov, izračunanih kot razmerje med potrošniškimi lastnostmi posameznih sort izdelkov in referenčno vrednostjo.

Stroškovne merske enote zagotavljajo denarno oceno družbenoekonomskih pojavov (vrednost BDP). Merske enote dela vam omogočajo, da upoštevate skupne stroške dela v podjetju in delovno intenzivnost posameznih operacij tehnološkega procesa (osebni dnevi, osebne ure).

Posamezni absolutni kazalci prejel neposredno v postopku statistično opazovanje kot rezultat kvantitativne lastnosti, ki nas zanima.

Zbirni volumetrični absolutni kazalci pridobljene s povzemanjem in združevanjem posameznih vrednosti.

11/ Relativni indikatorji

Relativni kazalnik je rezultat deljenja enega absolutnega kazalnika z drugim in izraža razmerje med kvantitativnimi značilnostmi družbenoekonomskih pojavov.

Brez relativnih kazalnikov je nemogoče izmeriti intenzivnost razvoja proučevanega pojava skozi čas, oceniti stopnjo razvoja enega pojava glede na druge pojave, ki so z njim povezani, ter opraviti prostorske in teritorialne primerjave.

Pri izračunu relativnega kazalnika se imenuje absolutni kazalnik, ki ga najdemo v števcu nastalega razmerja trenutno ali primerjano, in indikator v imenovalcu se imenuje osnova primerjave ali osnova.

Relativni kazalniki so lahko izraženi v koeficientih, odstotkih, ppm, prodecimalnih ali poimenovanih vrednostih. Odstotki se uporabljajo v primerih, ko primerjani absolutni kazalnik presega osnovno za največ 2-3 krat. Če je superiornost večja, se uporabi koeficient.

Razlikujejo se: vrste relativnih indikatorjev.

    Indikator relativne dinamike (RDI) je razmerje med stopnjo proučevanega procesa ali pojava za določeno časovno obdobje in stopnjo istega pojava v preteklosti. OPD se meri v odstotkih ali izraža kot koeficient.

    Ta vrednost prikazuje, kolikokrat je trenutna raven višja od osnovne ravni oziroma kolikšen delež osnove je. Če je OPD izražen kot večkratnik, predstavlja faktor rasti.

    Ko ta koeficient pomnožimo s 100, dobimo stopnjo rasti.

    Relativni planski kazalnik (PPI) je razmerje med načrtovano stopnjo kazalnika in že doseženim kazalnikom v preteklosti.

    Indeks relativne strukture (RSI) je razmerje strukturnih delov preučevanega predmeta in se določi razmerje indikatorja, ki označuje del populacije do kazalnika, ki označuje celotno populacijo. OPS je izražen v enotah ali odstotkih.

    Indeks relativne koordinacije (RCI) – razmerje različne dele ki pripadajo istemu objektu.

    Indikator relativne primerjave (RCI) – razmerje podobnih absolutni indikatorji, ki označuje različne predmete.

    Indeks relativne intenzivnosti (RII) označuje stopnjo porazdelitve procesa ali pojava, ki se preučuje, v njegovem lastnem okolju in je določen z razmerjem med indikatorjem, ki označuje pojav, in indikatorjem, ki označuje okolje porazdelitve tega pojava. OPI se meri v odstotkih, ppm, prodecimil. Ta indikator izračunano, ko absolutna vrednost se izkaže za nezadostnega za oblikovanje utemeljenih sklepov o obsegu pojava. Vrsta OPII so indikatorji raven gospodarski razvoj

, ki označuje proizvodnjo BDP na prebivalca, trgovinski promet na prebivalca itd. Kazalniki stopnje gospodarskega razvoja so poimenovane vrednosti in se merijo v rubljih na prebivalca itd.

Za vizualno in kompaktno predstavitev statističnih informacij se uporabljajo statistične tabele in grafi (vključno z grafikoni, kartogrami in diagrami kart).

Rezultati povzetka in združevanja materialov statističnega opazovanja so običajno predstavljeni v obliki tabel.

Tabela je najbolj racionalna, nazorna in kompaktna oblika podajanja statističnega gradiva. Statistična tabela je tabela, ki vsebuje povzetek numerična značilnost

proučevano populacijo po eni ali več bistvenih značilnostih, ki jih povezuje logika ekonomske analize.

Glavni elementi statistične tabele, prikazane na sl. 5.1, sestavite njegovo postavitev:

riž. 5.1. Statistična tabela

Pri izdelavi tabele se numerične informacije nahajajo na presečišču vrstic in grafov. Tako je navzven tabela zbirka stolpcev in vrstic, ki jo tvorijo

Statistična tabela vsebuje tri vrste naslovov: splošni, zgornji in stranski. Splošna glava odraža vsebino celotne tabele, nahaja se nad njeno postavitvijo v sredini in je zunanja glava. Zgornji naslovi (predikatni naslovi) označujejo vsebino stolpcev, stranski naslovi (predmetni naslovi) pa označujejo vsebino vrstic. So notranje glave.

Okostje tabele, napolnjeno z naslovi, tvori njeno postavitev. Če na presečišče grafov in črt zapišete številke, dobite popolno statistično tabelo. Digitalno gradivo je lahko predstavljeno v absolutnih, relativnih (indeksi cen živil) in povprečnih vrednostih. Po potrebi lahko tabele spremlja opomba, ki se uporablja za razlago naslovov, metodologijo za izračun nekaterih kazalnikov, vire informacij itd.

Po logični vsebini je tabela »statistični stavek«, katerega glavna elementa sta subjekt in predikat.

Predmet statistične tabele vsebuje seznam kazalnikov, označenih s številkami. To so lahko en ali več agregatov, posamezne enote agregatov (podjetja, združenja) po vrstnem redu njihovega seznama ali združene po nekaterih značilnostih (posamezne teritorialne enote, časovna obdobja v kronološke tabele itd.). Običajno je predmet tabele podan na levi strani, v imenih vrstic.

Predikat statistične tabele je sestavljen iz sistema indikatorjev, ki označujejo predmet študije, to je predmet tabele. Predikat tvori zgornje naslove in sestavlja vsebino grafa z logiko zaporedna ureditev indikatorji od leve proti desni.

Postavitev subjekta in predikata je lahko obrnjena, odvisno od izbire raziskovalca. Glede na strukturo predmeta in združevanje enot v njem ločimo preproste in zapletene statistične tabele, slednje pa delimo na skupinske in kombinirane.

V preprosti tabeli subjekt poda preprost seznam vseh predmetov ali teritorialnih enot prebivalstva. Enostavne tabele so lahko monografske in seznamske. Monografije ne označujejo celotnega nabora enot proučevanega obsega, temveč le eno skupino iz njega, opredeljeno po določenem, vnaprej oblikovanem kriteriju. Enostavne seznamske tabele so torej tabele, katerih tema vsebuje seznam enot populacije, ki se proučuje.

Predmet preproste tabele se lahko oblikuje po naslednjih načelih: specifično, teritorialno (prebivalstvo v državah CIS); začasni itd. Enostavne tabele ne omogočajo prepoznavanja socialno-ekonomskih vrst preučevanih pojavov, njihove strukture, pa tudi odnosov in soodvisnosti med značilnostmi, ki jih označujejo. Te težave so bolj celovito rešene z uporabo kompleksne tabele: skupinsko in predvsem kombinacijsko.

Skupinske tabele so statistične tabele, katerih predmet vsebuje grupiranje populacijskih enot glede na eno kvantitativno ali atributno značilnost. Predikat v skupinskih tabelah je sestavljen iz indikatorjev, potrebnih za karakterizacijo predmeta.

Najenostavnejši tip skupinskih tabel so serije porazdelitve atributov in variacij. Skupinska tabela je lahko bolj zapletena, če predikat ne vsebuje le števila enot v vsaki skupini, temveč tudi številne druge pomembne kazalnike, ki kvantitativno in kvalitativno označujejo skupine predmeta. Takšne tabele se pogosto uporabljajo za primerjavo splošnih kazalnikov po skupinah, kar omogoča izdelavo določenih praktičnih zaključkov. Skupinske tabele omogočajo prepoznavanje in karakterizacijo družbeno-ekonomskih tipov pojavov in njihove strukture glede na samo eno značilnost.

Kombinacijske tabele so statistične tabele, katerih vsebina vsebuje združevanje populacijskih enot hkrati po dveh ali več značilnostih: vsaka skupina, zgrajena po eni značilnosti, je razdeljena na podskupine po kateri drugi značilnosti itd.

Kombinacijske tabele omogočajo karakterizacijo tipičnih skupin, identificiranih z več značilnostmi in odnosom med slednjimi. Zaporedje delitve populacijskih enot v homogene skupine glede na značilnosti je določeno bodisi s pomembnostjo ene od njih v njihovi kombinaciji bodisi z vrstnim redom, v katerem se preučujejo.

Kompleksen razvoj predikata vključuje razdelitev lastnosti, ki ga tvori, v podskupine. Rezultat tega je popolnejši in podrobne značilnosti predmet. V tem primeru je lahko vsaka skupina podjetij ali vsako od njih posebej označena z drugačno kombinacijo lastnosti, ki tvorijo predikat.

Molčanov Sergej

Statistika ve vse,« sta Ilf in Petrov zatrdila v znamenitem romanu »Dvanajst stolov« in nadaljevala: »Znano je, koliko hrane letno poje povprečen državljan republike ... Znano je, koliko lovcev, balerin ... ... stroji, kolesa so po deželi, spomeniki, svetilniki in šivalni stroji ... Koliko življenja, polnega žara, strasti in misli, gleda na nas iz statističnih tabel!..« Zakaj so potrebne te tabele, kako sestaviti. in jih obdelati, kakšne zaključke je mogoče na podlagi njih narediti - Na ta vprašanja odgovarja statistika (iz italijanskega stato - stanje, latinsko status - stanje). množični pojavi v življenju.

Cilji dela: Oblikovati razumevanje statističnega raziskovanja, obdelave podatkov in interpretacije rezultatov.

Prenos:

Predogled:

»Statistika ve vse,« sta Ilf in Petrov zatrdila v svojem znamenitem romanu »Dvanajst stolov« in nadaljevala: »Znano je, koliko hrane poje povprečen državljan republike na leto ... Znano je, koliko lovcev, balerin. .. stroji, kolesa, spomeniki, svetilniki in šivalni stroji ... Koliko življenja, polnega žara, strasti in misli, gleda na nas iz statističnih tabel!..« Zakaj so te tabele potrebne, kako jih sestaviti in obdelati, kakšne sklepe je mogoče narediti na podlagi njih - na ta vprašanja odgovarja statistika (iz ital. stato - stanje, latinsko status - stanje).

Statistika je veda, ki proučuje, obdeluje in analizira kvantitativne podatke o najrazličnejših množičnih pojavih v življenju.

Cilji:

Razviti razumevanje statističnih raziskav, obdelave podatkov in interpretacije rezultatov.

Zbiranje statističnih podatkov, obdelava in analiza rezultatov z vidika, da je matematična izobrazba nujen element razvoja.

Delovni cilji:

Ustvarite vizualno sliko matematična vzgoja v razredu.

Oblikovati predstavo o možnostih opisovanja in obdelave podatkov z uporabo različnih statističnih značilnosti.

Upravljanje in napovedovanje nadaljnji razvoj matematična vzgoja..

Hipoteza. Statistika nam omogoča, da prepoznamo težave pri matematičnem izobraževanju v našem razredu.

Ustreznost: Povečanje motivacije pri učenju matematične vede, povezava s specifičnimi življenjskimi situacijami. Sposobnost zbiranja, obdelave in analize statističnih podatkov pri vnosu raziskovalno delo.

načrt:

I. Uvod:

Zgodovina razvoja statistike.

Statistične značilnosti.

II. Raziskovalno delo:

vprašalnik.

Tabela vseh podatkov.

Diagrami in zaključki (razponi, modusi, frekvence, frekvenčni poligoni, aritmetična sredina).

Splošni zaključek:

Zgodovina statistike.

Statistika ima dolgo zgodovino. Že v antično obdobje V zgodovini človeštva so gospodarske in vojaške potrebe zahtevale dostopnost podatkov o prebivalstvu, njegovi sestavi in ​​premoženjskem stanju. Za namen obdavčitve so bili organizirani popisi prebivalstva in opravljene zemljiške evidence.

Prva publikacija o statistiki je Knjiga števil v Svetem pismu v Stari zavezi, ki govori o popisu vojaškega osebja, ki je bil izveden pod vodstvom Mojzesa in Arona.

Prvič najdemo izraz "statistika" v leposlovju - v Shakespearjevem "Hamletu" (1602, 5. dejanje, 2. prizor). Pomen te besede pri Shakespearju je vedeti, dvorjani.

Sprva je statistika pomenila opise gospodarskih in politična država države ali njenega dela. Na primer, definicija sega v leto 1792: "statistika, ki opisuje stanje države v sedanjem času ali na neki znani točki v preteklosti." Trenutno se dejavnosti državnih statističnih služb dobro ujemajo s to definicijo.

Vendar se je postopoma izraz "statistika" začel uporabljati širše. Po Napoleonu Bonapartu je "statistika proračun stvari." Po formulaciji iz leta 1833 je "namen statistike predstaviti dejstva v najbolj jedrnati obliki."

Naj podamo še dve izjavi.

Statistika je sestavljena iz opazovanja pojavov, ki jih je mogoče podrediti ali izraziti s številkami (1895).

Statistika je številčna predstavitev dejstev s katerega koli področja študija v njihovih medsebojnih razmerjih.

Sčasoma je zbiranje podatkov o množičnih družbenih pojavih postalo redno.

Z sredi 19 V. Zahvaljujoč prizadevanjem velikega belgijskega matematika, astronoma in statistika Adolpha Queteleta (1796-1874) so ​​bila razvita pravila za popise prebivalstva in ugotovljena je bila pravilnost njihovega izvajanja v razvitih državah. Za usklajevanje razvoja statistike so na pobudo A. Queteleta potekali mednarodni statistični kongresi, leta 1885 pa je bil ustanovljen Mednarodni statistični inštitut, ki obstaja še danes.

Postajanje državne statistike v Rusiji lahko datiramo v konec 12. - začetek 13. stoletja, čeprav so bili prvi popisi zemlje in prebivalstva z vse bolj zapletenim programom izvedeni že l. Kijevska Rusija(IX - XII stoletja). Reforme Petra I. (1672-1725), ki so zajele vsa glavna področja javno življenje: gospodarstvo države, administracija, vojska, kultura in življenje prebivalstva, pa tudi vojne so povzročile potrebo po popolnem in natančnem obračunu materialnih virov in prebivalstva. V tem obdobju je najvišji vladni organ - senat - preko sistema kolegijev vodil ne le gospodarstvo države, ampak je služil tudi kot središče za opravljanje najpomembnejših statističnih del, zbiranje anketnega gradiva, poročil iz podrejenih panog in ustanov. kolegijem, pa tudi lokalni upravi.

Petrova reforma davčnega sistema je povezana s pojavom nove enote, postala je moška "duša", ki je zahtevala cenzus po številu prebivalcev populacije - revizije. Prva revizija je bila razglašena 26. novembra 1718, revizijo je opravila vojska.

V začetku 13. stol. V Rusiji se je rodila tudi sedanja registracija prebivalstva. Tako je bil leta 1702 izdan dekret o oddaji tedenskih izkazov o rojstvih in smrtih župnikov patriarhalnemu duhovnemu redu. V prvi polovici 13. stol. Popisi delavcev v tovarnah in manufakturah so že bili izvedeni.

Prva polovica 19. stoletja je povezana z novo stopnjo v razvoju domače statistike. Septembra 1802 je bilo v skladu z najvišjim manifestom cesarja Aleksandra I uvedeno pisno poročanje ministrstev. Tako se je začela operativna in strukturna zasnova državne statistike v Rusiji. To leto velja za leto rojstva ruske državne statistike.

Leta 1811 je bilo prvič ustanovljeno uradno središče državne statistike - Statistična podružnica Ministrstva za notranje zadeve; tu so sprejemali deželna poročila. Prvi vodja statističnega oddelka je bil K.F. Hermann.

Ruski znanstveniki so veliko prispevali k razvoju statistične znanosti. Zelo pomembno je na primer delo D.P. Zhuravsky "O virih in uporabi statističnih informacij", objavljen leta 1846. Ko je statistiko opredelil kot "štetje po kategorijah", je Zhuravsky opozoril, da je statistika potrebna za "preučevanje vsega, kar je povezano s človekom." Zhuravsky je opredelil najpomembnejše dele socialne statistike:

statistika prebivalstva - potreba po izračunu po razredih in poklicih;

proučevanje ljudskega življenja, stanovanja, prehrane;

statistika gledališč, klubov, plemiških srečanj, javne zabave;

statistika institucij za zaščito lastninskih pravic;

statistika revščine, revščine, sirote;

statistika samomorov, ki navaja sredstva, razloge, položaje, starost in druge značilnosti oseb, ki so si vzele življenje.

V vseh stavkih D.P. Zhuravsky je zasledoval idejo čim bolj natančne in popolne opredelitve razlikovanja ljudi glede na njihove življenjske razmere in bogastvo.

Posebno mesto v zgodovini Ruska statistika spada v zemeljsko statistiko. Pri zemstvih, organih lokalna vlada, od sredine 70. let 19. stoletja so nastajali posebni statistični uradi. Zemški statistiki so zbrali in razvili ogromno statističnega gradiva, ki je bilo uporabljeno za globoko gospodarsko in družbene raziskave poreformna Rusija. Za delo zemeljske statistike ni značilno samo zbiranje in razvoj statističnih podatkov, temveč tudi razvoj statistične metodologije.

Ugledni zemeljski statistiki so bili V.I. Orlov, P.P. Chervinsky, F.A. Ščerbina, A.P. Šlikevič.

V devetdesetih letih so bili ustanovljeni tovarniški inšpektorati, ki so vodili tekoče statistike, razvijali podatke o statistiki dela, vključno s sestavo delovne sile, nesrečami, stavkami itd.

Začela se je razvijati industrijska statistika. Pod vodstvom V.E. Varzara v letih 1900, 1908 in 1912. Izvedeni so bili prvi industrijski popisi.

Za začetno fazo sovjetske statistike (1917-1930) je značilna izjemna intenzivnost: izvaja se veliko število posebej organizirana, statistična

popisov in anket, plodno delujejo različne raziskovalne skupine, gradi se prva bilanca nacionalno gospodarstvo.

Nadaljnji razvoj sovjetske statistike je oviral nastanek upravno-birokratskega sistema v tridesetih letih prejšnjega stoletja. množične represije, vključno z najboljšimi ekonomisti in statistiki (N.D. Kondratiev, A.V. Chayanov, V.G. Groman, O.A. Kvitnin in mnogi drugi).

V tem času se oblikuje statistika industrije in razvija se sistem volumetričnih kazalnikov, ki skriva negativne trende v razvoju nacionalnega gospodarstva. Aktivno se razvijajo tudi kvalitativni statistični kazalci (indeksi produktivnosti dela, stroškov itd.). Statistika je podrejena reševanju operativnih problemov in ocenjevanju izvajanja planov v škodo svojih analitičnih funkcij.

Med Velikim domovinska vojna Sovjetska statistika se je soočila z nalogami operativnega obračunavanja dela, materialnih virov, gibanja proizvodne sile držav v vzhodne regije.

Po vojni sta se vloga in pomen statistike povečala: razširilo se je bilančno delo, poglobila se je teorija indeksne metode in razširila praksa njene uporabe, razširili so se ekonomski in matematični modeli in metode, razvoj uporabna statistika.
Beseda "statistika" je pogosto povezana z besedo "matematika", kar prestraši študente, ki ta pojem povezujejo z kompleksne formule, ki zahteva visoki ravni abstrakcija.

Vendar, kot pravi McConnell, je statistika predvsem način razmišljanja in za njeno uporabo morate imeti le malo zdrav razum in poznajo osnove matematike. V našem vsakdanje življenje Mi, ne da bi se tega sploh zavedali, nenehno preučujemo statistiko. Ali želimo načrtovati proračun, izračunati porabo bencina avtomobila, oceniti napor, ki bo potreben za obvladovanje določene smeri, ob upoštevanju do sedaj prejetih ocen, predvideti verjetnost dobrega in slabo vreme po meteorološkem poročilu ali nasploh oceniti, kako bo ta ali oni dogodek vplival na našo osebno ali skupno prihodnost - nenehno moramo izbirati, razvrščati in organizirati informacije, jih povezovati z drugimi podatki, da lahko sklepamo, da naredimo prave odločitev.

Vse te vrste dejavnosti se malo razlikujejo od tistih operacij, ki so osnova znanstveno raziskovanje in je sestavljen iz sintetiziranja podatkov, pridobljenih o različnih skupinah objektov v določenem poskusu, njihove primerjave, da bi ugotovili razlike med njimi, njihove primerjave, da bi identificirali indikatorje, ki se spreminjajo v isto smer, in končno, pri napovedovanju določenih dejstva na podlagi zaključkov, do katerih vodijo rezultati. Prav to je namen statistike v znanosti nasploh, še posebej v humanistiki. Glede slednjega ni nič povsem gotovega in brez statistike bi bili zaključki v večini primerov zgolj intuitivni in ne bi predstavljali trdne podlage za interpretacijo podatkov, pridobljenih v drugih študijah.

Da bi cenili ogromne koristi, ki jih lahko prinese statistika, bomo poskušali slediti napredku dešifriranja in obdelave podatkov, pridobljenih v poskusu. Tako bomo na podlagi konkretnih rezultatov in vprašanj, ki jih zastavljajo raziskovalcu, lahko razumeli različne tehnike in preproste načine njihove uporabe. Preden pa začnemo s tem delom, bo koristno, da razmislimo o najbolj splošni oris tri glavne dele statistike.

1. Opisna statistika, kot že ime pove, omogoča opisovanje, povzemanje in reprodukcijo v obliki tabel ali grafov

2. Namen induktivne statistike je preveriti, ali je mogoče rezultate, pridobljene iz danega vzorca, razširiti na celotno populacijo, iz katere je bil vzorec vzet. Z drugimi besedami, pravila tega dela statistike omogočajo ugotoviti, v kolikšni meri je mogoče posplošiti na večje število predmetov, enega ali drugega vzorca, odkritega med preučevanjem omejene skupine le-teh med kakršnim koli opazovanjem ali poskusom. Tako so s pomočjo induktivne statistike narejeni nekateri sklepi in posplošitve na podlagi podatkov, pridobljenih s preučevanjem vzorca.

3. Končno, merjenje korelacije vam pove, kako povezani sta dve spremenljivki, da lahko naredite napovedi. možne vrednosti enega od njih, če poznamo drugega.

Obstajata dve vrsti statističnih metod ali testov, ki vam omogočata posploševanje ali izračun stopnje korelacije. Prva vrsta je najbolj razširjena parametrične metode, ki uporabljajo parametre, kot je povprečje ali varianca podatkov. Druga vrsta so neparametrične metode, ki zagotavljajo neprecenljivo storitev, kadar ima raziskovalec opravka z zelo majhnimi vzorci ali s kvalitativnimi podatki; te metode so zelo preproste v smislu izračunov in uporabe. Ko se bomo seznanili z različnimi načini opisovanja podatkov in prešli na statistično analizo, si bomo ogledali oba.

  1. Način je število v nizu, ki se najpogosteje pojavi v tem nizu. Lahko se reče, da dano številko najbolj "moden" v tej seriji.
  2. Povprečje aritmetične seriještevila je količnik deljenja vsote teh števil z njihovim številom. Aritmetična sredina je pomembna značilnost številnih števil, včasih pa je koristno upoštevati tudi druga povprečja
  3. Eno statistično merilo razlike ali razpršenosti podatkov je obseg.

Razpon je razlika med največjo in najmanjšo vrednostjo serije podatkov.

Mediana niza, sestavljenega iz lihega števila števil, je število v tem nizu, ki bo na sredini, če je ta niz urejen. Mediana niza, ki ga sestavlja sodo število števil, je aritmetična sredina dveh števil na sredini tega niza.

Več jih je priročen način iskanje aritmetične sredine, pa tudi druge statistične značilnosti - sestavljanje frekvenčne tabele.

Vrste in metode statističnega opazovanja.

Statistična opazovanja se razlikujejo glede na vrsto in vire informacij.

Vrste statističnega opazovanja.

Sistematsko opazovanje - sprotno: opazovanje se izvaja na podlagi primarnih dokumentov, ki vsebujejo podatke, potrebne za zadostno polne lastnosti pojav, ki ga proučujemo.

Statistično opazovanje - periodično. Primer je popis prebivalstva.

Opazovanje občasno - enkratno.

Vrste statističnih opazovanj so lahko kontinuirane ali nekontinuirane.

Neprekinjeno opazovanje je tisto, ki upošteva vse brez enote v proučevani populaciji.

Nekontinuirano opazovanje je usmerjeno v upoštevanje določenega dokaj množičnega deleža enot opazovanja.

V statistični praksi se uporabljajo različne vrste nekontinuiranega opazovanja:

selektivno;

metoda glavnega niza;

vprašalnik;

monografski.

Kakovost nekontinuiranega opazovanja je slabša od rezultatov kontinuiranega opazovanja.

Da bi dobili reprezentativno značilnost celotne statistične populacije za del njenih enot, na podlagi vzorčnega opazovanja znanstvena načela oblikovanje vzorčne populacije. Naključnost izbire populacijskih enot zagotavlja nepristranskost rezultatov vzorčenja.

Metode statističnega opazovanja.

Glede na vire zbranih informacij ločimo opazovanja:

neposredno,

dokumentarec

raziskava.

Neposredno opazovanje se izvaja s štetjem, merjenjem vrednosti znakov, odčitavanjem instrumentov s strani posebnih oseb, ki izvajajo opazovanja, z drugimi besedami, zapisovalci.

Dokumentarno opazovanje je opazovanje, pri katerem se na podlagi ustreznih dokumentov zapiše odgovor na vprašanja v obrazcu za opazovanje.

Anketa je opazovanje, pri katerem se odgovori na vprašanja v obrazcu za opazovanje zapišejo iz besed anketiranca.

Zbiranje in združevanje statističnih podatkov.

Za preučevanje različnih družbenih in družbeno-ekonomskih pojavov, pa tudi nekaterih procesov, ki se dogajajo v naravi, se izvajajo posebne statistične študije. Vse sorte statistične raziskave se začne s ciljnim zbiranjem informacij o pojavu ali procesu, ki ga proučujemo. To stopnjo imenujemo stopnja statističnega opazovanja.

Za posplošitev sistematizacije podatkov, pridobljenih med statističnim opazovanjem, so razdeljeni v skupine glede na nekatere značilnosti, rezultati združevanja pa so povzeti v tabelah.

Vizualna predstavitev statističnih informacij.

Za vizualno predstavitev podatkov, pridobljenih kot rezultat statističnih raziskav, se pogosto uporabljajo. različne načine njihove slike.

Eden od dobro znanih načinov za vizualno predstavitev serije podatkov je ustvarjanje paličnega grafikona.

Stolpčni grafikoni se uporabljajo, ko želijo ponazoriti dinamiko sprememb podatkov skozi čas ali porazdelitev podatkov, dobljenih kot rezultat

Za vizualni prikaz razmerja med deli preučevane populacije je priročno uporabiti tortne grafikone.

Za izdelavo tortnega grafikona je krog razdeljen na sektorje, središčni koti ki so sorazmerne z relativnimi frekvencami, določenimi za vsako skupino podatkov.

Dinamika sprememb statističnih podatkov skozi čas je pogosto prikazana s poligonom. Če želite zgraditi mnogokotnik, označite koordinatna ravnina točke, katerih abscise so trenutki v času, ordinate pa ustrezni statistični podatki. Če te točke zaporedoma povežemo z odseki, dobimo lomljeno črto, ki jo imenujemo poligon.

Ena glavnih nalog statistike je prav ustrezna obdelava informacij. Seveda ima statistika še veliko drugih nalog: pridobivanje in shranjevanje informacij, razvijanje različnih napovedi, ocenjevanje njihove zanesljivosti itd. Nobenega od teh ciljev ni mogoče doseči brez obdelave podatkov. Zato je treba najprej uporabiti statistične metode obdelave informacij.

V našem razredu smo se odločili ugotoviti, kakšna je raven znanja na temo “Reševanje sistemov linearnih enačb z dvema spremenljivkama”, za katero smo sestavili poseben test šestih nalog.

V abecednem seznamu učencev je bilo ob vsakem imenu zapisano število pravilno rešenih nalog. Rezultat je naslednji niz številk:

F.I.

Število nalog

Agafonova L

Bašarov a

Guseletov D

Darmajeva K

Konevin V

Korotkov V

Krivolapova M

Misjurkejev A

Misjurkejev V

Minejeva D

Mihajlov A

Molčanova O

Molčanov S

Naumov S

Popov z

Postnikova M

Rekhovskaya Yu

Satajeva N

Terentjeva T

Ushakova L

Čagdurova N

TOLSTIHIN S

Razuvajev A

Angelski m

Na podlagi te serije je težko potegniti dokončne zaključke o tem, kako je bilo delo opravljeno. Za lažjo analizo informacij, podobnih primerihštevilčni podatki so razvrščeni v naraščajočem vrstnem redu. Na podlagi razvrstitve bo serija dobila naslednjo obliko:

2; 2;

3; 3; 3; 3;

4; 4; 4; 4; 4; 4

5; 5; 5;5;5;5

6; 6; 6; 6;

Vidimo, da je niz razdeljen na 6 skupin. Vsaka skupina predstavlja določen rezultat eksperimenta: en problem je rešen, dva problema sta rešeni itd.

V našem vzorcu je frekvenca pojavljanja dogodka »sedmošolec je rešil eno nalogo« 1. Relativna frekvenca tega dogodka je enaka razmerju njegove frekvence glede na velikost vzorca, to je 1:23 ali 4,3 %. . Za dogodek »devetošolec je rešil vse naloge« je frekvenca 4, relativna frekvenca pa 4:23— ali 17,4 % itd.

Zaradi lažjega zaznavanja so rezultati predstavljeni tabelarično in grafično.

………

Ko sestavite tabelo, je koristno preveriti sami: s seštevanjem vseh frekvenc bi morali dobiti velikost vzorca, to je številko 50, s seštevanjem vseh relativnih frekvenc pa 100%.

Za grafični prikaz Na podlagi te tabele bomo sestavili frekvenčni diagram.

S pomočjo rangirnih nizov, tabel in grafičnih ponazoritev smo že dobili začetne informacije o vzorcih podatkovnih nizov, ki nas zanimajo. Toda poznate statistične značilnosti niza podatkov, ki vam omogočajo boljšo statistično analizo.

Zanimivo je na primer vedeti najbolj značilen rezultat predlaganega dela. Z uporabo podatkov, predstavljenih v tabeli, je zlahka videti, da je najpogostejši rezultat "tri težave rešene." Kot veste, v jeziku statistike to pomeni, da je število 4 modus tega številskega niza.

Koristno je tudi najti aritmetično sredino te serije:

(1+2*2+3*4+4*6+5*6+6*4+:23=4,2 Torej lahko rečemo, da devetošolec v povprečju reši štiri naloge. (B v tem primeru aritmetična sredina podatkovne serije je sovpadala z njenim načinom, vendar se to seveda ne zgodi vedno.)

Faze statističnega raziskovanja

Faze statistične raziskave vključujejo:

Statistično opazovanje je množično znanstveno organizirano zbiranje primarnih informacij o posameznih enotah preučevanega pojava.

Združevanje in povzetek gradiva - posplošitev podatkov opazovanj za pridobitev absolutnih vrednosti (računovodskih in ocenjevalnih kazalnikov) pojava.

Obdelava statističnih podatkov in analiza rezultatov za pridobitev utemeljenih zaključkov o stanju proučevanega pojava in vzorcih njegovega razvoja.

Vse stopnje statističnega raziskovanja so med seboj tesno povezane in enako pomembne. Pomanjkljivosti in napake, ki se pojavijo na vsaki stopnji, vplivajo na celotno študijo kot celoto. zato pravilno uporabo posebne metode statistične znanosti na vsaki stopnji vam omogočajo pridobitev zanesljivih informacij kot rezultat statističnih raziskav. Metode statističnih raziskav:

Statistično opazovanje;

Povzetek in združevanje podatkov;

Izračun splošnih kazalnikov (absolutne, relativne in povprečne vrednosti);

Statistične porazdelitve (variacijske serije);

Metoda vzorčenja;

Korelacijska in regresijska analiza;

serija Dynamics;

Indeksi.

Sodobna matematična statistika je opredeljena kot veda o odločanju v pogojih negotovosti. Ločimo lahko dve glavni nalogi matematična statistika:

Navedite metode za zbiranje in združevanje statističnih informacij, pridobljenih kot rezultat opazovanj ali kot rezultat poskusov.

Torej je naloga matematične statistike ustvariti metode za zbiranje in obdelavo statističnih podatkov za pridobivanje znanstvenih in praktičnih zaključkov.

M Faze raziskovalnega dela:

I. Zbiranje podatkov.

Vključuje:

Študij naloge pri roki.

Opredelitev smiselne koncepte.

Izbor informacijskih virov.

Zbiranje informacij.

II. Združevanje podatkov.

Vključuje:

Razdelitev podatkov v skupine glede na značilnosti.

Izdelava podatkovne tabele.

III. Analiza podatkov.

Vključuje:

Iskanje statističnih značilnosti.

Posplošitev dobljenih rezultatov.

IV. Poročilo.

V 7.»a« in »b« razredu smo izvedli raziskavo o nujnosti učenja matematike.

Zbiranje podatkov: Učence smo prosili, da izpolnijo vprašalnik. /Priloga 1/

Združevanje podatkov: na podlagi anketnih podatkov je bila sestavljena tabela. /priloga 2/

Analiza podatkov: rezultate podane v tabeli smo predstavili v obliki diagramov. /priloga 3/

……

Obdelane podatke je mogoče uporabiti:

Za delo razredniki z družino.

Za praktična uporaba pri pouku matematike...

Za vodje šol.

Literatura:

Ekonomska statistika. »Učbenik«, razširjena 2. izdaja. Priporočilo ministrstva za generalne in poklicno izobraževanje RF. Moskva. INFRA-M. 2006 Avtorji: Yu N. Ivanov; S. E. Kazarinova in drugi Uredil Yu. Ivanov, doktor ekonomskih znanosti.

B.S.E. Računalniška izdaja 2006

Republika Komi v Rusiji. Goskomstat Rusije. Goskomstat R.K. 2007

Syktyvkar v številkah. Goskomstat R.K. 2007

Tipična ocena (način): 4Položaj 2. Prosti čas študentov

(Kaj otroci najpogosteje počnejo v prostem času od pouka)

Tabela sociološke ankete

Razredi

angleščina

Računalniške igre

Branje knjig

Gledanje televizije

Judo (sekcija)

Odbojka (sekcija)

hodi po ulici

Število študentov

https://accounts.google.com


Podnapisi diapozitivov:

izvedel: Sergey Molchanov 7"B" Nadzornik: Telesheva L.A. - učiteljica matematike, Mestna izobraževalna ustanova "Srednja šola Barguzinskaya" Statistične značilnosti in raziskave

Statistika ve vse “Stato” - stanje “Status” - stanje Statistika je veda, ki preučuje, obdeluje in analizira kvantitativne podatke o najrazličnejših množičnih pojavih v življenju.

Razviti razumevanje statističnih raziskav, obdelave podatkov in interpretacije rezultatov. Zbiranje statističnih informacij, obdelava in analiza rezultatov z matematičnega vidika izobraževanje je potrebno element razvoja. namen študije:

Ustvarite vizualno sliko matematične vzgoje v učilnici. Oblikovati predstavo o možnostih opisovanja in obdelave podatkov z uporabo različnih statističnih značilnosti. Upravljanje in napovedovanje nadaljnjega razvoja matematičnega izobraževanja.

Statistika nam omogoča, da prepoznamo težave pri matematičnem izobraževanju v našem razredu. Hipoteza

: Povečanje motivacije pri poučevanju matematike; povezava s specifičnimi življenjskimi situacijami: sposobnost zbiranja, obdelave in analize statističnih podatkov pri raziskovalnem delu. Ustreznost

Načrt: Zgodovina statistike. Statistične značilnosti. Raziskava na temo: "Potreba po predmetih v matematičnem ciklu." Raziskava na temo: "Najljubša prostočasna dejavnost."

Prva publikacija o statistiki je "Knjiga številk" v Svetem pismu v Stari zavezi, ki govori o popisu vojaškega osebja, ki je bil izveden pod vodstvom Mojzesa in Arona.

Prvič najdemo izraz "statistika" v leposlovju - v Shakespearjevem "Hamletu" (1602, 5. dejanje, 2. prizor). Pomen te besede pri Shakespearju je vedeti, dvorjani.

Statistika je predvsem način razmišljanja, za njeno uporabo pa potrebujete le nekaj zdrave pameti in poznavanje osnov matematike. McConnell

Odseki statistike deskriptivna induktivna korelacija

Osnovne statistične značilnosti Povprečje Aritmetična moda Mediana obsega

Aritmetična sredina niza števil je količnik deljenja vsote teh števil z njihovim številom. Način je običajno številka v nizu, ki se najpogosteje pojavi v tem nizu.

Razpon je razlika med največjo in najmanjšo vrednostjo serije podatkov. Mediana niza, sestavljenega iz lihega števila števil, je število tega niza, ki bo v sredini, če je ta niz urejen.

Vrste statističnega opazovanja Sistematično Statistično (periodično) Enkratno Kontinuirano Kontinuirano

št. F.I. Število pravilno opravljenih nalog 1 Agafonova Lyuda 3 2 Basharov Anlrey 6 3 Guseletov Dima 4 4 Darmaeva Ksenia 4 5 Konevin Vitaly 6 6 Korotkov Volodya 2 7 Krivolapova Masha 5 8 Misyurkeev Alyosha 3 9 Misyurkeev Volodya 3 10 Mineeva Dasha 5 11 Mikhailov A 5 12 Molčan ova Olja 5 13 Molčanov S 6 14 Naumov P 6 15 Popov S 4 16 Postnikova M 4 17 Rehovskaja Julija 3 18 Satajeva Nastja 5 19 Terentjeva Tanja 5 20 Ušakova Lena 5 21 Čagdurova Nataša 4 22 Tolstihin Andrej 1 23 Razuvajev Aljoša 2 24 An Gelsky Misha 4 Rezultat testa na temo "Reševanje sistemov linearnih enačb z dvema spremenljivkama"

Razmislite o vrsti števil 3 6 4 4 6 2 5 3 3 5 5 5 6 6 4 4 3 5 5 5 4 1 2 4

Kot rezultat razvrščanja bo serija imela obliko: 1; 2; 2; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4 5; 5; 5;5;5;5 6; 6; 6; 6;

Relativna frekvenca dogodka Način 4 Mediana 4 Razpon od 1 do 6 Aritmetična sredina (1+2*2+3*4+4*6+5*4+6*4):23=4,3

I. Zbiranje podatkov: Študija obravnavane naloge. Opredelitev pomembnih pojmov. Izbor informacijskih virov. Zbiranje informacij. Analiza podatkov: rezultate podane v tabeli smo predstavili v obliki diagramov. II. Združevanje podatkov. Razdelitev podatkov v skupine glede na značilnosti. Izdelava podatkovne tabele. III. Analiza podatkov. Iskanje statističnih značilnosti. Posplošitev dobljenih rezultatov. IV. Poročilo.

Potreba po študiju matematične raziskave št. 1

Kateri šolski predmet imaš najraje? _________________- Katerega šolskega predmeta je enostavno učiti? ______________________ Kateri predmet je najtežje študirati? __________________ Koliko ur na dan porabite za kuhanje? domača naloga?________________________________________________________________ Ali imaš rad matematiko?__________________________ Ali potrebuješ matematiko v prihodnosti? ____________________________ Potrebujete pomoč pri domači nalogi pri matematičnih predmetih?________________________________________________ Kako ocenjujete svoje znanje matematike? Imam oznako ___________________... Vem na _______________________..... Lahko na...__________________________ Kaj je po vašem mnenju razlog za neuspehe ali neuspehe, če se zgodijo? rezultati pri predmetih matematičnega ciklusa?_______________________________________ ____________________________________________________________

Vprašanje 1 Kateri šolski predmet ti je najbolj všeč?

Vprašanje 2 Kateri šolski predmet je najtežje študirati?

Vprašanje 3 Koliko časa porabite za domačo nalogo iz matematike?

Vprašanje 4 Ali uživate v študiju matematike?

Potrebujete matematiko v svojem bodočem poklicu? Da -100%

Potrebujete pomoč pri domači nalogi iz matematike?

Kdo vam pomaga ugotoviti? težka tema pri matematiki? Mama -45% Učitelj-35% Učbenik -20% Oče-15% Babica10% Sestra-10% Prijatelji-5% Nihče-5%

Kako ocenjujete svoje znanje matematike?

Ali želiš biti pri matematiki še boljši?

Študija motivacije za izobraževalne dejavnosti št. 3

Vrsta dejavnosti Dnevno Večkrat na teden V nedeljo 1 Berem časopise in revije 2 Berem leposlovje 5 Hodim na zabave v prostem času 6 Gledam filmske oddaje 7 Igram igre športne igre 8 Telovadba socialno delo 9 Hodim na lov in ribolov

11 Ukvarjam se z ljubiteljsko umetniško dejavnostjo 12 Hodim na pohodništvo 13 Ukvarjam se z radijsko dejavnostjo 14 Ukvarjam se s šivanjem in ročnimi deli 15 Učim se igrati na glasbilo 16 Poslušam glasbo, delam zapiske 17 Zanima me zbirateljstvo 18 Zanima me ples, hodim v diskoteke 19 Rad nekaj naredim z lastnimi rokami 20 Igram se z živalmi

21 V prostem času pomagam staršem 22 Čas preživljam nenamensko 23 V prostem času delam 24 (Če se v prostem času ukvarjate s čim drugim, dodajte sem!)

Dnevno

Večkrat na teden

V nedeljo

Sklep: Tako učenci našega razreda najpogosteje vsak dan poslušajo glasbo, pomagajo staršem, gledajo televizijo; večkrat na teden - ukvarjajo se s športom in delajo nekaj z rokami; v nedeljo – branje in igranje na računalniku, gledanje televizije

Zaključek: In tako ste se na primeru mojega raziskovalnega dela prepričali, da imajo statistične značilnosti in raziskave pomembno vlogo v našem življenju in se uporabljajo ne samo v matematiki, ampak tudi v drugih vejah znanosti.

Hvala za vašo pozornost

Statistike morajo biti predstavljene tako, da jih je mogoče uporabiti. Obstajajo 3 glavne oblike predstavitve statističnih podatkov:

    besedilo – vključitev podatkov v besedilo;

    tabelarno – prikaz podatkov v tabelah;

    grafični – prikaz podatkov v obliki grafov.

Besedilna oblika se uporablja, kadar je digitalnih podatkov malo.

Najpogosteje se uporablja tabelarična oblika, saj je več učinkoviti obliki predstavitev statističnih podatkov. Za razliko od matematičnih tabel, ki začetni pogoji vam omogočajo, da dobite enega ali drugega rezultata, statistične tabele povedo jezik številk o preučevanih predmetih.

Statistična tabela je sistem vrstic in stolpcev, v katerem so v določenem zaporedju in povezavi predstavljene statistične informacije o družbenoekonomskih pojavih.

Tabela 2. Zunanja trgovina Ruske federacije v letih 2000–2006, milijarde dolarjev.

Indikator

Zunanjetrgovinski promet

Trgovinska bilanca

vključno z:

s tujino

trgovinska bilanca

Na primer, v tabeli. 2 predstavlja informacije o zunanji trgovini Rusije, ki bi jih bilo neučinkovito izraziti v besedilni obliki.

Razlikovati predmet in predikat statistična tabela. Subjekt označuje predmet, ki ga označujemo - bodisi enote populacije, bodisi skupine enot ali celotno populacijo. Predikat daje značilnosti osebka, običajno v številčni obliki. Obvezno naslov tabela, ki označuje, kateri kategoriji in kateremu času pripadajo podatki tabele.

Glede na naravo predmeta se statistične tabele delijo na preprosto,skupina in kombinacijski. V predmetu preproste tabele predmet študija ni razdeljen na skupine, temveč je podan seznam vseh enot populacije ali pa je navedena populacija kot celota (na primer tabela 11). V predmetu skupinske tabele je predmet študija razdeljen na skupine glede na eno značilnost, predikat pa označuje število enot v skupinah (absolutno ali odstotno) in zbirne kazalnike za skupine (na primer tabela 4) . V predmetu kombinirane tabele je populacija razdeljena v skupine ne glede na eno, ampak glede na več značilnosti (na primer tabela 2).

Pri izdelavi tabel morate upoštevati naslednje splošna pravila.

    Predmet tabele se nahaja v levem (redkeje - zgornjem) delu, predikat - v desnem (manj pogosto - spodnjem).

    Naslovi stolpcev vsebujejo imena indikatorjev in njihove merske enote.

    Vrstica povzetka dopolnjuje tabelo in se nahaja na koncu, včasih pa je prva: v tem primeru je vnos "vključno" v drugi vrstici, naslednje vrstice pa vsebujejo komponente vrstice povzetka.

    Numerični podatki so zapisani z enako stopnjo natančnosti znotraj vsakega stolpca, pri čemer so števke števil postavljene pod števke, celo število pa je ločeno z decimalno vejico.

    V tabeli ne sme biti praznih celic: če je podatek nič, se postavi znak "–" (pomišljaj); če podatek ni znan, se vpiše "ni podatka" ali se postavi znak "…" (elipsa). Če vrednost indikatorja ni nič, ampak prva pomembna številka se pojavi za sprejeto stopnjo natančnosti, potem se naredi zapis 0,0 (če je bila, recimo, sprejeta stopnja natančnosti 0,1).

Včasih so statistične tabele dopolnjene z grafi, kadar je cilj poudariti nekatere značilnosti podatkov in jih primerjati. Grafična oblika je najučinkovitejša oblika predstavitve podatkov z vidika njihovega zaznavanja. S pomočjo grafov se doseže vizualizacija značilnosti strukture, dinamike, medsebojnih povezav pojavov in njihova primerjava.

Statistični grafi- to so običajne slike številčne količine in njihove povezave s črtami, geometrijskimi oblikami, risbami ali geografskimi zemljevidi. Grafična oblika olajša obravnavo statističnih podatkov, jih naredi vizualne, ekspresivne in vidne. Vendar imajo grafi določene omejitve: prvič, graf ne more vsebovati toliko podatkov kot tabela; Poleg tega graf vedno prikazuje zaokrožene podatke - ne natančne, ampak približne. Tako se graf uporablja samo za prikaz celotne situacije in ne podrobnosti. Zadnja pomanjkljivost je težavnost risanja. To je mogoče premagati z osebnim računalnikom (na primer "Čarovnik za diagrame" iz paketa Microsoft Pisarna Excel).

Glede na način izdelave grafike jih delimo na diagrami,kartogrami in diagrami zemljevidov.

Najpogostejši način za grafično predstavitev podatkov so diagrami, ki so na voljo v naslednjih vrstah: linearni, radialni, pikčasti, ravninski, volumetrični in figurasti. Vrsta diagramov je odvisna od vrste podatkov, ki se predstavljajo, in naloge konstrukcije. V vsakem primeru mora biti graf opremljen z naslovom - nad ali pod poljem grafa. Naslov označuje, kateri indikator je prikazan, za katero ozemlje in za kateri čas.

Linearni grafi se uporabljajo za prikaz kvantitativnih spremenljivk: značilnosti variacij njihovih vrednosti, dinamike, odnosov med spremenljivkami. Variacija podatkov se analizira z uporabo razdelilni poligon,kumulira(krivulja »manj kot«) in ogives(krivulja »več kot«). Porazdelitveni poligon je obravnavan v temi 4 (npr. slika 5.). Za konstruiranje kumulatov so vrednosti spremenljive karakteristike narisane vzdolž osi abscise in akumulirane vsote frekvenc ali frekvenc (od f 1 do ∑ f). Za sestavo ogiva se zbrane vsote frekvenc postavijo na ordinatno os v obratnem vrstnem redu (od ∑ f do f 1 ). Kumulirajte in ogujte po tabeli. 4. prikazano na sl. 1.

riž. 1. Kumulacije in ogiva razdelitve blaga po carinski vrednosti

Uporaba črtnih grafov pri analizi dinamike je obravnavana v temi 5 (npr. slika 13), njihova uporaba za analizo odnosov pa je obravnavana v temi 6 (npr. slika 21). Tema 6 zajema tudi uporabo razpršenih grafov (npr. slika 20).

Črtne grafe delimo na enodimenzionalno, ki se uporablja za predstavitev podatkov o eni sami spremenljivki, in dvodimenzionalni– na dveh spremenljivkah. Primer enodimenzionalnega linearnega grafa je porazdelitveni poligon, dvodimenzionalnega pa regresijska črta (na primer slika 21).

Včasih se z velikimi spremembami indikatorja zatečejo k logaritemski lestvici. Na primer, če se vrednosti indikatorja razlikujejo od 1 do 1000, lahko to povzroči težave pri izdelavi grafa. V takih primerih preidemo na logaritme vrednosti indikatorjev, ki se ne bodo tako zelo razlikovali: lg 1 = 0,lg 1000 = 3.

Med planaren Glede na pogostost uporabe se razlikujejo palični grafikoni (histogrami), v katerih je indikator predstavljen v obliki stolpca, katerega višina ustreza vrednosti indikatorja (npr. slika 4).

Sorazmernost površine določene geometrijske figure z vrednostjo indikatorja je podlaga za druge vrste ravninskih diagramov: trikotne,kvadrat,pravokotne. Uporabite lahko tudi primerjavo površin kroga - v tem primeru je naveden polmer kroga.

Tračni grafikon prikazuje indikatorje v obliki vodoravno podolgovatih pravokotnikov, sicer pa se ne razlikuje od paličnega grafikona.

Od ravninskih diagramov se pogosto uporablja tortni grafikon, ki se uporablja za ponazoritev strukture proučevane populacije. Celoten niz je vzet kot 100%, skupna površina kroga mu ustreza, območja sektorjev ustrezajo delom niza. Izdelajmo sektorski diagram strukture zunanje trgovine Ruske federacije v letu 2006 glede na podatke v tabeli. 2 (glej sliko 2). Pri uporabi računalniških programov so tortni grafikoni izdelani v tridimenzionalni obliki, to je ne v dveh, ampak v treh ravninah (glej sliko 3).

riž. 2. Preprost tortni diagram Sl. 3. 3D tortni grafikon

Figurirani (slikovni) diagrami povečajo jasnost slike, saj vključujejo risbo upodobljenega indikatorja, katere velikost ustreza velikosti indikatorja.

Pri izdelavi grafa je vse enako pomembno - pravilna izbira grafične podobe, razmerja in skladnost s pravili za oblikovanje grafov. Ta vprašanja so podrobneje obravnavana v in.

Kartogrami in zemljevidni diagrami se uporabljajo za prikaz geografskih značilnosti pojavov, ki jih proučujemo. Prikazujejo lokacijo proučevanega pojava, njegovo intenzivnost na določenem ozemlju - v republiki, regiji, gospodarski oz. upravni okraj itd. Izdelava kartogramov in kartografskih diagramov je na primer obravnavana v strokovni literaturi.

§1. Koncepti statistike, statistična pravilnost in celovitost..... 2

§2. Znaki enot statistične populacije, njihova razvrstitev...... 2

§1. Pojem statističnega opazovanja, njegova priprava.................................. 4

§2. Vrste statističnih opazovanj.................................................. ................... ..5

§3. Napake pri opazovanju................................................. ........ ................... 6

§4. Povzetek in združevanje..................................................... ......... ................. 6

§5. Vrsta statistične skupine............................................... 6

§6. Statistične tabele..................................................... ......... ............ 7

§7. Statistični grafi..................................................... ... ............ 8

§1. Dejansko in teoretična porazdelitev............................ 21

§2. Normalna porazdelitvena krivulja ............................................. .... 21

§3. Preizkušanje hipoteze o normalni porazdelitvi..................................... 21

§4. Kriteriji dogovora: Pearson, Romanovski, Kolmogorov........... 21

§5. Praktični pomen modeliranje distribucijske serije..... 22

§1. Koncept opazovanje vzorca. Razlogi za njegovo uporabo...... 23

§3. Napake pri vzorčenju................................................. .................... 24

§4. Naloge selektivnega opazovanja.................................................. ...... 25

§5. Razširitev podatkov vzorčnega opazovanja na splošna populacija... 26

§6. Majhen vzorec ................................................ ... ................ 26

§1. Koncept korelacije in KRA.................................. 27

§2. Pogoji uporabe in omejitve KRA ................................. 27

§3. Regresija najmanjših kvadratov po parih... 28

§4. Uporaba seznanjene linearne regresijske enačbe 29

§6. Večkratna korelacija........................................... 32


Tema 1.: Uvod v statistiko.

  1. koncepti statistike, statistične pravilnosti in totalnosti.
  2. značilnosti enot statistične populacije, njihova klasifikacija.
  3. predmet in metoda statistike.

§ 1. Koncepti statistike, statistična pravilnost in totalnost.

Beseda statistika izhaja iz latinščine " stanje” v prevodu - stanje, stanje.

Izraz statistika je nastal v 2. polovici 18. stoletja. V povezavi s poznavanjem držav, preučevanjem njihovih značilnosti. V ta čas sega tudi začetek poučevanja statistike na univerzi. Glede na vejo statističnega raziskovanja ločimo: statistiko prebivalstva, industrije, kmetijstva itd. - uporabljena statistika.

Splošna teorija statistike je skupek metod in tehnik za zbiranje, obdelavo, predstavitev in analizo numeričnih podatkov. Izraz statistika se danes uporablja v treh pomenih:

  1. kot sinonim za besedo "podatki"
  2. veja vrednot, ki združuje načela in metode dela z numeričnimi podatki, ki označujejo množične pojave (pričakovana življenjska doba moških je nižja od žensk)
  3. industrija praktične dejavnosti namenjeni obdelavi in ​​analizi numeričnih podatkov.

Statistika nam omogoča ugotavljanje in merjenje vzorca razvoja družbenoekonomskih procesov in pojavov ter razmerja med njimi v določenih razmerah prostora in časa.

Pravilnost se nanaša na ponovljivost, zaporedje in vrstni red sprememb v pojavih.

Statistična pravilnost je vzorec, v katerem je nujnost v vsakem posameznem pojavu neločljivo povezana z naključjem in se šele v množici pojavov kaže kot zakonitost. Koncept statistične pravilnosti je v nasprotju s konceptom dinamične pravilnosti, ki se kaže v vsakem pojavu. (primer: S krog =pr 2 kot > r > S krog). Predmet statistične raziskave je statistični agregat - niz enot, ki imajo maso, homogenost, določeno s celovitostjo in prisotnostjo variacije. Vsak posamezen element se imenuje statistična populacijska enota (ESS).

§2. Znaki enot statistične populacije, njihova klasifikacija.

ECC imajo določene lastnosti, imenovane lastnosti. Statistika proučuje pojave skozi njihove značilnosti; bolj ko je populacija homogena skupne značilnosti imajo svoje enote in čim manj se vrednosti teh lastnosti razlikujejo.

Opisni atribut je atribut, ki ga je mogoče izraziti le verbalno.

  1. Kvantitativna značilnost je lastnost, ki jo lahko izrazimo številčno.
  2. Neposredni atribut je lastnost, ki je neposredno lastna značilnemu predmetu.
  3. Posredna značilnost so lastnosti ne samega označenega predmeta, ampak predmeta, ki je z njim povezan ali vanj vključen.
  4. Primarna značilnost je absolutna vrednost, ki jo je mogoče izmeriti.
  5. sekundarna značilnost je rezultat primerjave primarnih karakteristik; meri se neposredno.
  6. naravni znak - merjeno v kosih, kg, tonah, litrih itd.
  7. atribut dela - merjen v delovnih dneh, delovnih urah.
  8. kazalnik stroškov - merjeno v rubljih, $, €, ₤.
  9. brezdimenzijska karakteristika - merjenje v frakcijah, %
  10. alternativni atribut je atribut, ki zavzame samo eno vrednost izmed več možnih.
  11. diskretni atribut – sprejme samo celoštevilsko vrednost, brez vmesne vrednosti.
  12. zvezni atribut – atribut, ki ima poljubne vrednosti v določenem obsegu.
  13. faktorska značilnost je značilnost, pod vplivom katere se spremeni druga lastnost.
  14. efektivno znamenje - znamenje, ki se spremeni pod znamenje drugega
  15. trenutna karakteristika – značilnost, izmerjena v določenem trenutku.
  16. intervalni znak – znak za določen časovni interval.

Ista značilnost se lahko hkrati razvrsti v različne klasifikacije.

§3. Predmet in metoda statistike.

Predmet statističnega raziskovanja so statistični agregati - množica različno kakovostnih objektov.

Posebnosti predmeta statistike določajo posebnosti metode, vključujejo:

  1. zbiranje podatkov (statistično opazovanje, objava)
  2. posploševanje podatkov (povzetek, združevanje)
  3. predstavitev podatkov (tabele in grafi)
  4. analiza in interpretacija numeričnih podatkov (izračun povprečij, analiza variacije, KRA, časovne vrste, indeksi)

tema 2: Organizacija statističnega opazovanja.

Povzetek in združevanje podatkov.

§1. Pojem statističnega opazovanja, njegova priprava.

§2. Vrste statističnega opazovanja.

§3 Napake pri opazovanju.

§4 Povzetek in združevanje

§5 Vrste statističnih skupin.

§6 Statistične tabele.

§7 Statistični grafi.

§1. Pojem statističnega opazovanja, njegova priprava.

Vsaka statistična študija se začne z zbiranjem podatkov.

Viri informacij:

  1. različne publikacije (časopisi, revije itd.)
  2. Glavni vir objavljenih statističnih informacij so publikacije državnih statističnih organov ("RF v 2001" založba GOSKOMSTAT).
  3. izvajanje statističnega opazovanja, tj. znanstveno organizirano zbiranje podatkov.

Statistično opazovanje je množično, načrtno, znanstveno organizirano opazovanje pojavov družbenih in gospodarsko življenje, ki je sestavljen iz registracije značilnosti vsake enote populacije, ki se proučuje.

Postopek opazovanja:

  1. Priprava na opazovanje
  2. Izvajanje množičnega zbiranja podatkov
  3. Priprava podatkov za obdelavo
  4. Razvoj predlogov za izboljšanje statističnega opazovanja.

Priprava na opazovanje:

  1. Določitev namena in predmeta opazovanja
  2. Določitev sestave lastnosti, ki jih je treba registrirati
  3. Izdelava dokumentov za zbiranje podatkov
  4. Izbira poročevalske enote in enote, glede katere se bo izvajalo opazovanje.
  5. Treba je določiti načine in načine pridobivanja podatkov.

Rešiti je treba organizacijske težave:

  1. treba je določiti sestavo služb, ki izvajajo raziskavo
  2. poučiti osebje
  3. pripraviti koledarski načrt delo
  4. kopijo dokumentov za zbiranje podatkov

Predmet opazovanja so družbenoekonomski pojavi in ​​procesi.

Za registracijo je treba jasno določiti značilnosti.

Program opazovanja – seznam znakov, ki jih je treba zabeležiti med postopkom opazovanja.

Zahteve programa opazovanja:

  1. Program mora vsebovati bistvene lastnosti, ki neposredno označujejo preučevani pojav; program ne sme vključevati lastnosti, ki imajo sekundarne pojave ali značilnosti, katerih vrednosti bodo očitno nezanesljive ali bodo popolnoma odsotne.
  2. Vprašanja programa opazovanja morajo biti natančna in nedvoumna ter lahko razumljiva, da se izognete težavam pri pridobivanju odgovorov.
  3. Določiti je treba zaporedje vprašanj.
  4. Program opazovanja mora vključevati vprašanja neposredne narave za vodenje in razjasnitev zbranih podatkov.
  5. Da bi zagotovili enotnost prejetih informacij, je program sestavljen v obliki dokumenta, imenovanega statistični obrazec.

Statistični obrazec je dokument enega vzorca, ki vsebuje program in rezultate opazovanja.

Obstajajo individualni obrazci (odgovori na vprašanja za eno enoto opazovanja) in odpisni obrazci (podatki za več enot statistične populacije).

Obrazec in navodila za izpolnjevanje so pripomočki za statistično opazovanje.

Izbira časa opazovanja vključuje reševanje dveh vprašanj: določitev kritičnega datuma ali intervala in določitev obdobja opazovanja.

Kritični datum je določen dan v letu, ura v dnevu, od katere je treba zabeležiti znake za vsako enoto proučevane populacije.

Obdobje opazovanja – čas, v katerem se izpolnjujejo statistični obrazci, tj. čas, potreben za zbiranje podatkov.

Upoštevati je treba, da lahko premik obdobja opazovanja od kritičnega datuma ali intervala povzroči zmanjšanje zanesljivosti pridobljenih informacij.

§2. Vrste statističnega opazovanja.

IN domače statistike Uporabljajo se tri oblike statističnih opazovanj.

  1. statistično poročanje podjetij, organizacij, ustanov.
  2. posebej organizirano statistično opazovanje (popis ipd.)
  3. register – oblika stalnega statističnega spremljanja dolgotrajnih procesov

Statistično opazovanje je razvrščeno:

Po času opazovanja:

  • tekoči nadzor – izvaja se stalna registracija znakov (matični urad, kriminal itd.).
  • periodično opazovanje - izvaja se v določenih intervalih (življenjski standard v mestu Čeljabinsk, stroški potrošniške košarice, popis prebivalstva).
  • Enkratno – enkratno opazovanje za določen namen.

Po zajetju populacijskih enot:

  • Stalni nadzor – podatke je treba pridobiti na vseh ESN
  • Ni popolna ugotovitev:
    • Metoda glavnega niza - pregledane so najpomembnejše enote populacije, ki se preučuje (preučite strojno inženirsko podjetje v regiji Čeljabinsk).
    • Opazovanje vzorcev – naključna izbira ESN, ki jih je treba opazovati.
    • Monografski nadzor – kjer se opazuje en ESA, ki se pogosto uporablja za načrtovanje programa množičnega nadzora.

Po načinu zbiranja podatkov:

  • Neposredno opazovanje - matičarji sami z neposrednim merjenjem in tehtanjem ugotovijo subjekt, ki ga je treba registrirati (otrok, mlajši od 1 leta v ambulanti).
  • Dokumentarna opazka – uporabljajo se različni dokumenti (sestava izjave)

Anketa - potrebne informacije pridobljeno iz besed anketiranca.

  • Ekspedicijska anketa - izvajajo jo posebej usposobljeni delavci, ki na podlagi ankete ustreznih oseb pridobijo potrebne podatke in odgovore sami zabeležijo v obrazec. Anketa odprave je lahko neposredna (iz oči v oči) ali posredna (telefonska anketa).
  • Dopisna anketa - informacije zagotavlja osebje prostovoljnih dopisnikov, ta metoda zahteva majhne finančne stroške, vendar ne zagotavlja natančna vrednost stalno opazovanje.
  • Samoprijava - obrazce anketiranci izpolnijo sami, registratorji pa jim samo izročijo vprašalnike in jim razložijo, kako jih izpolniti.

§3. Napake pri opazovanju

Glavna zahteva, ki se uporablja za statistično opazovanje, je točnost.

Natančnost je stopnja, do katere kateri koli indikator značilnosti ustreza dejanski vrednosti, določeni iz materialov statističnega opazovanja.

Neskladje med izračunanim in prava vrednost imenovana napaka opazovanja, glede na vzroke nastanka pa jih ločimo: napake registracije in napake reprezentativnosti. Napake pri registraciji delimo na naključne in sistematične.

Naključne napake - rezultat delovanja naključnih dejavnikov (vrstice, stolpci so pomešani)

Sistematične napake vedno precenjujejo ali podcenjujejo indikator. (starost)

Napake reprezentativnosti so značilne za nepopolno opazovanje in nastanejo kot posledica netočne reprodukcije vzorca celotne izvorne populacije.

Po prejemu statističnih obrazcev morate:

  1. preveriti popolnost zbranih podatkov.
  2. izvajajo aritmetično kontrolo na podlagi komunikacije razna znamenja med sabo.
  3. izvajati logično kontrolo na podlagi poznavanja logičnih povezav med značilnostmi.

§4. Povzetek in združevanje

Na podlagi zbranih podatkov je nemogoče narediti izračune in sklepati, najprej jih je treba strniti in zbrati v eno samo tabelo. Povzetek in združevanje služita tem namenom.

Povzetek je kompleks zaporednih operacij za povzemanje določenih posameznih dejstev, ki tvorijo nabor in identificirajo tipične značilnosti in vzorce, ki so neločljivo povezani s pojavom, ki se preučuje kot celota.

Preprosta vodka - izračun skupnih seštevkov za celoto.

Kompleksni povzetek je niz operacij za združevanje posameznih opazovanj, izračun rezultatov za vsako skupino in za celoten objekt kot celoto ter predstavitev rezultatov v obliki statističnih tabel.

Glede na obliko obdelave gradiva je lahko povzetek decentraliziran, centraliziran - tak povzetek se izvede med enkratnim statističnim opazovanjem.

Združevanje je delitev številnih enot proučevane populacije v skupine glede na določene značilnosti.

§5. Vrste statističnih skupin

Skupine lahko razvrstimo po strukturi in vsebini.

Analitično združevanje označuje razmerje med značilnostmi, od katerih je ena faktorska, druga pa efektivna.

izobraževanje

Nedokončano visokošolsko izobraževanje

§6. Statistične tabele

Rezultati seštevanja in združevanja morajo biti predstavljeni tako, da jih je mogoče uporabiti.

Podatke lahko predstavite na 3 načine:

  1. podatki so lahko vključeni v besedilo.
  2. predstavitev v tabelah.
  3. grafična metoda

Statistična tabela je sistem vrstic in stolpcev, v katerem so v določenem zaporedju predstavljene statistične informacije o družbenoekonomskih pojavih.

Razlikuje se med subjektom in predikatom tabele.

Subjekt je predmet, za katerega so značilne številke, običajno je subjekt podan na levi strani tabele.

Predikat je sistem indikatorjev, s katerimi je predmet označen.

Statistična tabela vsebuje 3 vrste naslovov: splošno, stransko

Splošni naslov mora odražati vsebino celotne tabele in se nahaja nad tabelo v sredini.

Pravilo za sestavljanje tabel.

  1. Vse tri vrste naslovov so obvezne brez besednih okrajšav; v naslov je mogoče vključiti splošne merske enote.
  2. tabela ne sme vsebovati dodatnih črt;
  3. Skupna črta je obvezna. Lahko je na začetku ali na koncu dokumenta. Če na začetku dokumenta, če na koncu, potem SKUPAJ:
  1. digitalni podatki znotraj enega stolpca so zabeleženi z enako stopnjo natančnosti. Kategorije so zapisane strogo pod kategorijami, cel del ločeno z vejico.
  2. v tabeli ne sme biti praznih celic; če ni podatkov, napišite "Brez informacij" ali "…", če je podatek nič, potem "-". Če vrednost ni nič, vendar se prva pomembna cifra pojavi za podano natančnostjo 0,01®0,0 – če je sprejeta natančnost do desetin.
  3. če je v tabeli veliko stolpcev, so označeni predmetni stolpci z velikimi tiskanimi črkami, grafi predikata pa so števila.
  4. če tabela temelji na izposojenih podatkih, je pod tabelo naveden vir podatkov, po potrebi lahko tabelo opremimo z opombami.

§7. Statistični grafi

Statistične tabele lahko dopolnimo z grafi.

Statistični grafi so običajne slike številskih vrednosti in njihovih razmerij z uporabo črt, geometrijske oblike, risbe.

Prednosti grafične podobe

  1. jasno, opazno, izrazito.
  2. takoj so vidne meje spreminjanja kazalnika, primerjalna stopnja spreminjanja in variabilnost

Slabosti grafičnih podob

  1. Vključuje manj podatkov kot v tabeli.
  2. graf prikazuje zaokrožene podatke, splošno stanje, vendar ne podrobnosti.

Statistični grafi

Diagrami

Kodrasti

Tema 3: Statistični indikatorji.

§1. Bistvo in pomen statističnega kazalca, njegove lastnosti.

§2. Klasifikacija statističnih indikatorjev.

§3. Vrste relativnih indikatorjev. Načela gradnje.

§4. Sistemi statističnih kazalnikov.

Statistični znak je lastnost ESS; obstaja objektivno glede na to, ali se preučuje kot znanost ali ne.

Statistični indikator je posplošujoča značilnost katere koli lastnosti populacije.

Struktura statističnega kazalnika (njegovi atributi):

  • Povprečne vrednosti
  • Indikatorji variacije
  • Znaki indikatorji povezave
  • Indikatorji strukture in narave distribucije
  • Indikatorji dinamike
  • Indikatorji nihanja
  • Indikatorji točnosti in zanesljivosti vzorčnih ocen
  • Kazalniki točnosti in zanesljivosti napovedi

Po videzu: skupno število enot ali skupna lastnost predmeta. To je vsota primarnih značilnosti, izmerjenih v kosih, kg, m, $ itd.

Relativni indikator– dobljeno s primerjavo absolutnih ali relativnih kazalcev v prostoru, času ali s primerjavo kazalcev različne lastnosti predmet, ki se preučuje.

Relativni kazalnik 1. reda dobimo s primerjavo 2 absolutnih kazalcev. Relativni kazalnik 2. reda dobimo s primerjavo relativnih kazalcev 1. reda itd.

Relativni kazalniki 3. reda in višji so zelo redki.

Neposredni indikatorji so indikatorji, katerih vrednost narašča z naraščanjem pojava, ki ga preučujemo.

Inverzni kazalniki so kazalniki, katerih vrednost pada z naraščanjem proučevanega pojava.

... strukture

... zvočniki

… odnosi

... intenzivnost

...odnos do standarda

... primerjave

Indikatorji strukture dobimo tako, da del povežemo s celoto.

Indikatorji relativne dinamike

ü Kazalniki dinamike (stopnje rasti, prirastki)

ü Indeksi

Indikatorji odnosov označite razmerja med značilnostmi:

ü korelacijski koeficient

ü Analitični indeksi

Indikatorji intenzivnosti označiti odnos dveh predmetov glede na različne značilnosti.

ü Intenzivnost dela - čas, porabljen za proizvodnjo ene enote proizvoda

ü Proizvodnja – količina proizvedenih izdelkov na časovno enoto

UČINK = 1/intenzivnost dela

Kazalniki odnosa do standarda– razmerje med dejanskimi vrednostmi atributa indikatorja in normativnimi, načrtovanimi, optimalnimi.

Primerjalni kazalniki – primerjava različne predmete glede na eno znamenje.

Splošna načela za konstruiranje statističnih kazalcev:

  1. statistični kazalniki so objektivno povezani.
  2. Primerjani kazalniki se lahko razlikujejo samo po enem atributu, indikatorja ni mogoče primerjati po dveh ali več atributih.
  3. treba je poznati in upoštevati meje kazalnika.

Za vsako značilnost predmeta je potreben sistem statističnih indikatorjev.

  1. kognitivna funkcija – na podlagi analize podatkov
  2. propaganda
  3. stimulativno funkcijo

Tema 4: Povprečja

§1. koncept povprečne vrednosti

§2. vrste povprečij

§3. aritmetična sredina in njene lastnosti

§4. harmonična sredina, geometrična sredina, kvadratna sredina.

§5. multivariatno povprečje

Najpogostejša oblika statistike je povprečje.

Najpomembnejša lastnost povprečja je, da odraža tisto, kar je skupno posamezni enoti proučevane populacije, čeprav lahko vrednost značilnosti posameznih enot populacije niha v eno ali drugo smer.

Tipičnost povprečja je neposredno povezana s homogenostjo proučevane populacije. V primeru, da gre za nehomogeno populacijo, jo je potrebno razdeliti na kvalitativno homogene skupine in za vsako od homogenih skupin izračunati povprečje.

Povprečje je mogoče določiti z začetnim povprečnim razmerjem (ARR) in njegovo logično formulo.

Strukturna povprečja

Moda – Mo

Mediana – jaz

V dinamičnih serijah se izračunata aritmetična sredina in kronološka sredina.

Aritmetična sredina Povprečna vrednost značilnosti se imenuje, ko se izračun celotnega obsega značilnosti ne spremeni.

Primer: teža.

Sre aritmetično praštevilo

x i– individualna vrednost atributa

n – skupno število proučevana populacija

Sre aritmetično ponderirano

Lastnosti prim. aritmetika.

Vsota odstopanj posameznih vrednosti lastnosti od njene povprečne vrednosti je nič

Če vsako posamezno vrednost lastnosti pomnožimo ali delimo z istim stalnim številom, se povprečje poveča ali zmanjša za enako količino.

če se vsaki posamezni vrednosti atributa doda enako konstantno število, se bo povprečna vrednost ustrezno spremenila v isto število.

Dokaz

če uteži f tehtanega povprečja pomnožimo ali delimo z istim številom, se povprečje ne spremeni.

vsota kvadratov odstopanj značilnosti je manjša od vsote katerega koli drugega števila.

Druge vrste medija

Pogled na sredino

Preprosto povprečje

Uteženo povprečje

harmonično

geometrijski

Kvadratični

Zelo težko je opredeliti skupino na podlagi ene značilnosti in malo informacij ostane v spominu.

Multivariatno povprečje – povprečna vrednost za več značilnosti E.S.S.

Iz odnosov vrednosti atributov za E.S. na povprečne vrednosti teh lastnosti.

Multivariatno pomeni za i enote

x ij– vrednost atributa j za i enoto

Povprečna vrednost lastnosti j

k – število lastnosti

j – številka značilnosti in število njene populacije

Tema 5: Analiza variacij

§1. Variacije znakov in vzroki zanje

§2. Distribucijska serija

§3. Strukturne značilnosti variacijske serije.

§4. Indikatorji jakosti variacije.

§5. Indikatorji intenzivnosti variacije

§6. vrste disperzije. Pravilo dodajanja variance.

Sprememba vrednosti značilnosti v agregatu je razlika v njenih vrednostih med različnimi enotami danega agregata v istem obdobju ali časovni točki.

Razlog za variacijo: različni pogoji Ob obstoju ESS je variacija tista, ki ustvarja potrebo po vedi, kot je statistika.

Izvajanje analiza variacije se začne z izgradnjo variacijske serije - urejene porazdelitve populacijskih enot glede na naraščajoče ali padajoče značilnosti in štetje ustreznih frekvenc.

Distribucijska serija

ü uvrščen

ü diskretna

ü interval

Razvrščene serije variacij– seznam posameznih enot. agregatov v naraščajočem padajočem vrstnem redu razvrščene značilnosti

Serije diskretnih variacij – tabela, sestavljena iz 2 vrstic - vrednosti polimera različnih lastnosti in število enot z dano značilno vrednostjo.

Niz intervalnih variacij je sestavljen v naslednjih primerih:

  1. znak sprejema diskretne vrednosti, vendar je njihovo število preveliko
  2. atribut sprejema vse vrednosti v določenem obsegu

Pri izdelavi serije intervalnih variacij je treba izbrati optimalno število skupin, najpogostejša metoda z uporabo Sturgessove formule

k – število intervalov

n – obseg populacije

Pri računanju skoraj vedno dobiš delne vrednosti, zaokroži na najbližje celo število.

Dolžina intervala – l

Vrste intervalov

spodnja meja naslednjega intervala ponavlja zgornjo mejo naslednjega intervala

odprt interval, interval z eno obrobo

Pri izračunu z nizom intervalnih variacij se sredina intervala vzame kot xi.

N ME =60 mediana = 1

Kumulira – porazdelitev manj kot

Ogiva – distribucija več kot

Mediana je vrednost značilnosti, ki celotno populacijo deli na dva enaka dela.

Za niz diskretnih variacij izračun mediane: če je n-sodo, potem je No. Me mediana enote

Niz intervalnih variacij:

k – število intervalov

x 0 – spodnja meja medianega intervala

l– dolžina medianega intervala

Vsota frekvenc

Skupna frekvenca intervala pred mediano.

Srednja intervalna frekvenca

Srednji interval– prvi interval, katerega akumulirana frekvenca presega polovico skupne vsote frekvenc.

Grafično je mediana določena s kumulacijo.

  1. Kvartili so vrednost značilnosti, ki razdeli populacijo na 4 enake dele.

1. kvartil

3. kvartil

2. kvartil – mediana.

x Q 1 x Q 3 – spodnja meja intervala, ki vsebuje 1. in 3. kvartil.

l – dolžina intervala

in - akumulirane frekvence intervalov prejšnjih intervalov, ki vsebujejo 1. in 3. kvartil.

Frekvence kvartilnih intervalov.

Za karakterizacijo serije variacij se uporablja naslednje:

Decili - razdeli populacijo na 10 enakih delov, Percitili - razdeli populacijo na 100 enakih delov.

  1. Moda je pogosto pojavljajoča značilnost lastnosti. Za serijo diskretnih variacij – najvišjo frekvenco. Za serijo intervalnih variacij se način izračuna po naslednji formuli:

Spodnja meja modalnega intervala

l– dolžina modalnega intervala

fMo – modalna intervalna frekvenca

f Mo +1 – frekvenca intervala, ki sledi modalu

Modalni interval je interval z najvišjo frekvenco. Grafično je način najden v histogramu.

  1. Razpon variacije
  2. Povprečno linearno odstopanje

Tehtano

  1. Razpršenost:

Tehtano

  1. Standardni odklon

Lastnost disperzije.

  1. zmanjšanje vseh vrednosti značilnosti za enako količino ne spremeni količine disperzije.
  2. Zmanjšanje vseh vrednosti lastnosti za faktor k zmanjša količino variance v do 2 krat in standardni odklon v Za enkrat
  3. če izračunate povprečni kvadrat odstopanj od katerekoli vrednosti A, ki se razlikuje od aritmetične sredine, potem bo vedno večji od povprečnega kvadrata odstopanj, izračunanih od aritmetične sredine. Tako je povprečje vedno manjše od izračunanega iz katere koli druge vrednosti, tj. ima lastnost minimalnosti. Standardni odklon = 1,25 – s porazdelitvami, ki so blizu normalnim.

Pri normalnih porazdelitvenih pogojih obstaja naslednje razmerje med in številom opazovanj, 68,3 % opazovanj je v mejah.

95,4 % opazovanj je v mejah

99,7 % opazovanj je v mejah

Za primerjavo variacije lastnosti v različnih populacijah ali za primerjavo variacije različna znamenja uporabljen v enem kompletu relativni indikatorji, kot osnova služi aritmetična sredina.

  1. Relativni razpon variacije.
  2. Relativno linearno odstopanje
  3. Koeficient variacije

Ti kazalniki ne zagotavljajo samo primerjalne ocene, temveč tvorijo tudi homogenost populacije. Populacija se šteje za homogeno, če koeficient variacije ne presega 33 %.

Poleg preučevanja variacije lastnosti v populaciji kot celoti je pogosto treba slediti kvantitativnim spremembam lastnosti, vendar v skupinah, na katere je populacija razdeljena, in med njimi. To se doseže z izračunom različnih vrst.

Vrste disperzije:

  1. Skupna varianca
  2. Medskupinska varianca
  3. Varianca znotraj skupine (preostanek)

1. meri variacijo lastnosti v celoti pod vplivom vseh dejavnikov, ki to variacijo določajo

primer: uživanje jogurta: vzorec 100 oseb

Socialni status

x i – posamezna vrednost atributa

Povprečna vrednost značilnosti za celotno populacijo

Pogostost tega znaka.

  1. 2. označuje variacijo lastnosti pod vplivom lastnosti dejavnika, ki je osnova skupine.

Skupinsko povprečje

Skupno povprečje skupine

Pogostost po skupinah

  1. 3. označuje variacijo lastnosti pod vplivom dejavnikov, ki niso vključeni v skupino

x iji vrednost značilnosti v j skupini

Povprečna vrednost značilnosti v j skupina

f ij – frekvencai-ta funkcija vj skupina

Obstaja pravilo, ki povezuje 3 vrste variance, imenujemo ga pravilo dodajanja variance.

Preostalo odstopanje po j skupina

Vsota frekvenc po j skupina

n– skupna vsota frekvenc

Glavna naloga analize variacijskih nizov je ugotoviti vzorce porazdelitve frekvenc.

Porazdelitvena krivulja je grafični prikaz v obliki neprekinjene črte sprememb frekvenc v variacijski seriji pri funkcionalno povezani spremembi vrednosti značilnosti.

Porazdelitveno krivuljo lahko sestavimo z uporabo poligona in histograma. Priporočljivo je zmanjšati empirično porazdelitev na teoretično, na enega od dobro raziskanih tipov.

Normalna porazdelitvena krivulja.

Obstajajo naslednje vrste porazdelitvenih krivulj:

  1. enojno oglišče
  2. veliko vozlišč

Za homogene populacije so značilne krivulje z enim vozliščem; krivulja z več vozlišči kaže na heterogenost populacije in potrebo po ponovnem združevanju.

Ugotavljanje splošno porazdelitev vključuje oceno njene homogenosti ter izračun asimetrije in kurtoze. Za simetrične porazdelitve

Za primerjalno študijo asimetrije različnih porazdelitev se izračuna koeficient asimetrije As.

Centralni moment tretjega reda; - RMS kubičen;

Če, potem je asimetrija pomembna

Če As<0, то As – левосторонняя, если As>0, potem je As desnosučen.

Če, potem je As nepomemben. Za simetrično in zmerno asimetrično se izračuna kazalnik kurtoze: če je E k >0, je porazdelitev vrha, če je E k<0, то распределение плосковершинное.

Variacija alternativne lastnosti se kvantitativno kaže na naslednji način.

0 – enote, ki nimajo te lastnosti;

1 – enote s to lastnostjo;

r– delež enot, ki imajo to lastnost;

q– delež enot, ki te lastnosti nimajo;

Potem p+q=1.

Alternativni znak ima 2 vrednosti 0 in 1 z utežmi str in q.

Neposredni znaki– to so znaki, katerih velikost narašča z naraščanjem proučevanega pojava.

Povratni znaki - znaki, katerih velikost se zmanjšuje s povečanjem proučevanega pojava.

Izhod (neposreden)

Intenzivnost dela (obratno)

Največja varianca deleža je 0,25.

Tema 6: Modeliranje porazdelitvenih nizov.

§1. Dejanska in teoretična porazdelitev

§2. Normalna porazdelitvena krivulja.

§3. Preizkušanje hipoteze o normalni porazdelitvi.

§4. Kriteriji primernosti: Pearson, Romanovski, Kolmogorov.

§5. Praktični pomen modeliranja porazdelitvenih nizov.

§1. Dejanska in teoretična porazdelitev

Eden najpomembnejših ciljev preučevanja porazdelitvenih nizov je ugotoviti vzorec porazdelitve in določiti njegovo naravo. Vzorci porazdelitve se najbolj jasno pokažejo le z velikim številom opazovanj.

Dejansko porazdelitev lahko grafično prikažemo s porazdelitveno krivuljo – grafično prikazano kot neprekinjeno črto sprememb frekvenc v nizu variacij različice, ki je funkcionalno povezana s spremembo.

Teoretično krivuljo porazdelitve razumemo kot krivuljo dane vrste porazdelitve v splošni obliki, ki izključuje vpliv dejavnikov, ki so naključni glede na vzorec.

Teoretično porazdelitev lahko izrazimo z analitično formulo, imenovano analitična formula. Najpogostejše je normalno širjenje.

§2. Normalna porazdelitvena krivulja.

Zakon normalne porazdelitve:

y – ordinata normalne porazdelitve

t – normirano odstopanje.

; e=2,7218; x i – možnosti variacijskega obsega; - povprečno;

Lastnosti:

Normalna porazdelitvena funkcija je enakomerna, tj. f(t)=f(-t), . Funkcija normalne porazdelitve je popolnoma določena s standardnim odklonom.

§3. Preizkušanje hipoteze o normalni porazdelitvi.

Razlog za pogosto sklicevanje na zakon porazdelitve je v tem, da odvisnost nastane kot posledica delovanja številnih naključnih vzrokov, od katerih nobeden ni prevladujoč. Če je bil Mo=Me izračunan v nizu variacij, lahko to kaže na bližino normalne porazdelitve. Najbolj natančno preverjanje skladnosti z običajnim zakonom se izvaja s posebnimi merili.

§4. Merila primernosti: Pearson, Romanovski, Kolmogorov.

Pearsonov kriterij.

Teoretična frekvenca

Empirična frekvenca

Metodologija za izračun teoretičnih frekvenc.

  1. Aritmetična sredina je določena z nizom intervalnih variacij, t pa se izračuna za vsak interval.
  2. Poiščemo vrednost gostote verjetnosti za normaliziran porazdelitveni zakon. STRAN 49
  3. Iskanje teoretične frekvence.

l – dolžina intervala

- vsota empiričnih frekvenc

- gostota verjetnosti

zaokrožite vrednost na cela števila

  1. Izračun Pearsonovega koeficienta
  2. vrednost tabele

d.f. – število intervalov – 3

d.f. – število prostostnih stopinj.

  1. če >, potem porazdelitev ni normalna, tj. hipoteza o normalni porazdelitvi je preklicana. če< , то распределение является нормальным.

kriterij Romanovskega.

Izračuna se Pearsonov test;

Število stopinj.

Če C<3, то распределение близко к нормальному.

Kolmogorov kriterij

, D – največja vrednost med zbranimi empiričnimi in teoretičnimi frekvencami. Nujen pogoj za uporabo Kolmogorova: Število opazovanj je večje od 100. Uporaba posebne verjetnostne tabele, s katero lahko trdimo, da je ta porazdelitev normalna.

§5. Praktični pomen modeliranja porazdelitvenih nizov.

  1. sposobnost uporabe zakonov normalne porazdelitve na empirično porazdelitev.
  2. možnost uporabe pravila 3 sigma.
  3. Sposobnost izogibanja dodatnim zamudnim in dragim izračunom, saj na podlagi študije populacije vemo, da je porazdelitev normalna.

Tema 7: Selektivno opazovanje.

§1. Koncept selektivnega opazovanja. Razlogi za njegovo uporabo.

§2. Vrste selektivnega opazovanja.

§3. Napake pri selektivnem opazovanju.

§4. Naloge opazovanja vzorca

§5. Razširitev podatkov vzorčnega opazovanja na splošno populacijo.

§6. Majhen vzorec.

§1. Koncept selektivnega opazovanja. Razlogi za njegovo uporabo.

Selektivno opazovanje - nekontinuirano opazovanje, pri katerem so na določen način izbrane enote proučevane populacije podvržene statističnemu pregledu.

Namen (naloga) vzorčnega opazovanja: okarakterizirati celotno populacijo enot za del, ki se raziskuje, ob upoštevanju vseh pravil in načel statističnega opazovanja.

Razlogi za uporabo vzorčnega opazovanja:

  1. prihranek materiala, stroškov dela in časa;
  2. možnost natančnejšega in podrobnejšega preučevanja posameznih enot statistične populacije in njihovih skupin.
  3. Nekatere posebne probleme je mogoče rešiti samo s selektivnim opazovanjem.
  4. kompetentno in dobro organizirano selektivno opazovanje daje zelo natančne rezultate.

Splošna populacija je skupek enot, iz katerih poteka selekcija.

Vzorčna populacija – niz enot, izbranih za raziskovanje. V statistiki je običajno razlikovati med parametri splošne populacije in vzorčne populacije.

Vrste vzorčnega opazovanja

Po načinu izbire:

Ponavljajo se

Enota, vključena v vzorec, se po zapisu opaženih lastnosti vrne splošni populaciji za sodelovanje v nadaljnjem selekcijskem postopku.

Velikost generalne populacije ostaja nespremenjena, kar določa stalno vključenost katerekoli enote v vzorec.

Neponovljivo

Enota, vključena v vzorec, se ne vrne populaciji, iz katere poteka izbor.

Po načinu izbire:

Pravilno naključno sestoji v razmerju do enot iz splošne populacije naključno ali naključno brez elementov doslednosti. Pred izvedbo takega vzorca pa se morate prepričati, da imajo vse enote v populaciji enake možnosti za vključitev v vzorec, tj. v celotnem seznamu enot statistične populacije ni izpuščenih ali neupoštevanih posameznih enot. Prav tako je treba jasno določiti meje populacije. Tehnično se izbira izvede z žrebom ali uporabo tabele naključnih števil.

Mehansko vzorčenje (vsakih 5 na seznamu) se uporablja v primerih, ko je populacija na nek način urejena, tj. obstaja določeno zaporedje v razdelitvi enot. Pri mehanskem vzorčenju se ugotavlja delež selekcije, ki se ugotavlja z razmerjem med generalno in vzorčno populacijo.

Nevarnost napake pri mehanskem vzorčenju lahko nastane zaradi: naključnega sovpadanja izbranega intervala in cikličnih vzorcev v razporeditvi enot v generalni populaciji.

Zonski vzorec se uporablja, ko lahko vse enote splošne populacije razdelimo v skupine (regije, države) po nekem kriteriju.

Kombinirano vzorčenje.

Izbira enot je možna:

  1. ali sorazmerno z velikostjo skupine
  2. ali sorazmerno z znotrajskupinsko diferenciacijo lastnosti
  3. , kjer je n obseg vzorčne populacije, N obseg generalne populacije, n i velikost vzorca i- skupine, N i glasnost i vzorcev.
  4. - ta metoda je natančnejša, vendar je med vzorčenjem zelo težko vnaprej določiti odstopanje. (pred manifestacijo opazovanja).

Serijski izbor.

Uporablja se, ko so ECC združeni v majhne skupine (serije), na primer embalaža s končnimi izdelki, študentske skupine. Bistvo serijskega vzorčenja je v tem, da se serije izberejo povsem naključno ali mehansko, nato pa se znotraj izbrane serije izvede kontinuirano raziskovanje.

Kombinirani izbor.

To je kombinacija zgoraj obravnavanih izbirnih metod, pogosteje se uporablja kombinacija tipične in serijske serije, tj. izbor serij iz več tipičnih skupin.

Izbor je lahko tudi večstopenjski in enostopenjski, večstavčni in enostavni.

Večstopenjska izbira: Iz splošne populacije se najprej izločijo velike skupine, nato manjše in tako naprej, dokler niso izbrane tiste enote, ki so predmet anketiranja.

Večfrazna izbira: vključuje vzdrževanje iste selekcijske enote na vseh stopnjah njenega izvajanja. Hkrati so izbirne enote, izbrane na vsaki naslednji stopnji, predmet preverjanja, katerega program se razširi (Primer: študenti celotnega inštituta, nato študenti nekaterih fakultet).

§3. Napake pri selektivnem opazovanju.

Sistematično

Napake reprezentativnosti nastanejo le pri selektivnem opazovanju. Nastanejo zaradi dejstva, da vzorčna populacija ne more natančno reproducirati splošne populacije. Ne moremo se jim izogniti, vendar so zlahka predvidljivi in ​​po potrebi zmanjšani.

Vzorčna napaka je razlika med vrednostjo parametra v populaciji in njegovo vrednostjo, izračunano iz rezultatov vzorčnega opazovanja. Dх=-m+, Dх – največja napaka v vzorcu, m – generalna havarija; - povprečje vzorca.

Največja vzorčna napaka je naključna vrednost. Dela Čebiševa so posvečena preučevanju vzorcev naključnih vzorčnih napak. Čebiševljev izrek dokazuje, da Dx ne presega: - povprečne napake vzorčenja. Koeficient t-zaupanja kaže verjetnost dane napake. Strani 42-43.

V primeru, ko je treba iz znanega F(t) določiti t, vzamemo najbližji veliki F(t) in iz njega določimo t.

Mejna napaka

P – delež.

Če je bila izbira izvedena na način, ki se ne ponavlja, se dodajo formule za največjo napako

Popravek zaradi neponavljanja.

Za vsako vrsto vzorčnega opazovanja se predstavljena napaka izračuna drugače:

  1. dejansko naključno in mehanično opazovanje;
  2. Območni nadzor
  3. Serijsko vzorčenje

r – število serij v vzorcu;

R – število serij v populaciji;

Razpršitev razmerja med skupinami.

§4. Naloge opazovanja vzorca

Uporablja se za naslednja opravila:

  1. n - ? za določitev velikosti vzorca na podlagi znanih F(t), Dx.
  2. določitev vzorca Dx iz znanega F(t), n
  3. določitev F(t) iz znanih Dx in n

1 naloga n - ? Najprej je n določen s ponavljajočo se izbirno formulo za neponavljajočo se izbiro:

Metode za določanje variance:

  1. vzeto je iz prejšnjih podobnih študij.
  2. Standardni odklon za normalno porazdelitev je » 1/6 obsega variacije.
  3. če je porazdelitev očitno asimetrična, je standardna deviacija » 1/5 obsega variacije
  4. Za delež se uporabi največja možna disperzija p(1-p)=0,25
  5. pri n³100, potem s 2 =S 2 – vzorčna varianca

30 funtov n£100, potem s 2 = S 2 (n/n-1), s 2 – splošna varianca

n<30, то S 2 (малая, т.к. дисперсия выборочная) и все расчеты ведутся по S 2

Pri izračunu n ne smete loviti velike vrednosti t in majhnih mejnih napak, ker to vodi do povečanja n in s tem do povečanja stroškov. Naslednji zakon je podoben.

§5. Razširitev podatkov vzorčnega opazovanja na splošno populacijo.

Končni cilj vsake VN je opredelitev splošne populacije.

Vrednosti, izračunane iz rezultatov VN, veljajo za splošno populacijo ob upoštevanju meje njihove največje napake.

Predpostavimo, da je poraba jogurta na mesec ena oseba.

250–20 milijonov £250+20; 230 milijonov funtov 270 funtov

In samo 1000 ljudi

230.000 milijonov £270.000

48%-5%£p£48%+5%

§6. Majhen vzorec.

V praksi statističnega raziskovanja v sodobnih razmerah imamo vedno več opravka z majhnimi vzorci.

Majhen vzorec – opazovani vzorec, katerega število enot ne presega 30, n £ 30/

Teorijo majhnega vzorca je razvil angleški statistik Gosset, ki je leta 1908 pisal pod psevdonimom študent.

Dokazal je, da ima ocena odstopanja med srednjimi vrednostmi majhnega in generalnega vzorca poseben porazdelitveni zakon. Pri izračunu na majhnem vzorcu se vrednost s 2 ne izračuna. t st za možne meje napak uporabite študentov kriterij. Strani 44-45. - verjetnost obratnega dogodka.

Število prostostnih stopinj

majhna napaka meje vzorca

mejna napaka ulomka

Tema 8: Korelacijska in regresijska analiza in modeliranje.

§1. Koncept korelacije in KRA.

§2. Pogoji uporabe in omejitve KRA.

§3. Parna regresija na podlagi metode najmanjših kvadratov.

§4. Uporaba enačbe parne linearne regresije.

§5. Indikatorji tesnosti in moči povezave.

§6. Večkratna korelacija.

§1. Koncept korelacije in KRA.

Funkcionalna povezava y=5x

Korelacija

Med različnimi pojavi in ​​njihovimi značilnostmi obstajata dve vrsti povezav: funkcionalna in statistična.

Povezava se imenuje funkcionalna, kadar se s spremembo vrednosti ene od spremenljivk druga spremeni na strogo določen način, to je, da vrednost ene spremenljivke ustreza eni ali več natančno določenim vrednostim druge spremenljivke. Funkcionalna povezava je možna le v primeru, ko je spremenljivka y odvisna od spremenljivke x in ni odvisna od drugih dejavnikov, v realnem življenju pa je to nemogoče.

Statistično razmerje obstaja, ko lahko s spremembo vrednosti ene od spremenljivk druga v določenih mejah prevzame poljubno vrednost, vendar se njene statistične značilnosti spreminjajo po določenem zakonu.

Najpomembnejši posebni primer statistične komunikacije je korelacija. V korelacijskem razmerju različne vrednosti ene spremenljivke ustrezajo različnim povprečnim vrednostim druge spremenljivke, tj. s spremembo vrednosti karakteristike x se seveda spremeni povprečna vrednost karakteristike y.

Besedo korelacija je uvedel angleški biolog in statistik Francis Gal (korelacija).

Korelacija se lahko pojavi na različne načine:

  • vzročna odvisnost variacije rezultantne značilnosti od variacije faktorske značilnosti.
  • Pojavi se lahko povezava med dvema posledicama enega vzroka (požari, število gasilcev, velikost požara)
  • Razmerje znakov, od katerih je vsak vzrok in posledica hkrati (produktivnost dela in plače)

V statistiki je običajno razlikovati med naslednjimi vrstami odvisnosti:

  1. parna korelacija je povezava med dvema karakteristikama, rezultatom in dejavnikom, ali med dvema dejavnikoma.
  2. delna korelacija je odvisnost med rezultanto in eno faktorsko značilnostjo s fiksno vrednostjo druge faktorske značilnosti.
  3. večkratna korelacija – odvisnost efektivne značilnosti od dveh ali več dejavnikov, vključenih v študijo.

Namen korelacijske analize je kvantificirati tesnost razmerja med značilnostmi. Konec 19. stoletja sta Galton in Pearson proučevala razmerje med višino očeta in otrok.

Regresija preučuje obliko razmerja. Naloga regresijske analize je ugotoviti analitični izraz razmerja.

Korelacijsko-regresijska analiza kot splošni koncept vključuje spremembo tesnosti povezave in vzpostavitev analitičnega izraza povezave.

§2. Pogoji uporabe in omejitve KRA.

  1. dostopnost množičnih podatkov, saj korelacija je statistična
  2. nujna je kakovostna homogenost populacije.
  3. podrejenost porazdelitve populacije po rezultantnih in faktorskih karakteristikah normalnemu zakonu porazdelitve, ki je povezan z uporabo metode najmanjših kvadratov.

§3. Parna regresija na podlagi metode najmanjših kvadratov.

Regresijska analiza je sestavljena iz določanja analitičnega izraza razmerja. Glede na obliko ločijo linearno regresijo, ki jo izražamo z enačbo premice, in nelinearno regresijo oz.

Glede na smer komuniciranja jih ločimo na neposredne, tj. Ko se funkcija x poveča, se funkcija y poveča.

vzvratno

Obratno, tj. Ko x narašča, se y zmanjšuje.

  1. grafična metoda je izris empiričnih podatkov na korelacijskem polju, natančnejša ocena pa je narejena z metodo najmanjših kvadratov.

X – dejanski znak

U - efektivni znak

Razlika med dejansko vrednostjo in kvadratno vrednostjo, izračunano iz sklopitvene enačbe, mora biti čim manjša.

Z najmanjšimi kvadrati je min vsota kvadratov odstopanj empiričnih vrednosti y od teoretičnih, dobljenih z izbrano regresijsko enačbo.

Za linearno odvisnost

Þ a,b

za parabolo

Za hiperbolo

parametre a,b,c zapišemo v enačbo, nato dobljeno enačbo nadomestimo z empirično vrednostjo x i in poiščite teoretično vrednost y i . Potem primerjamo y i teoretično in y i empirično. Vsota kvadratov razlike med njima naj bo minimalna. Izberemo vrsto odvisnosti, v kateri je ta odvisnost izpolnjena.

V parni linearni regresijski enačbi:

b – koeficient parne linearne regresije, meri moč povezave, tj. označuje povprečno odstopanje y od njegove povprečne vrednosti na sprejeto mersko enoto.

b=20, ko se x spremeni za 1 lastnost, y odstopa od svoje povprečne vrednosti v povprečju za 20 za populacijo.

Pozitiven predznak regresijskega koeficienta označuje neposredno povezavo med značilnostmi, znak »-« pa obratno povezavo med značilnostmi.

§4. Uporaba enačbe parne linearne regresije.

Glavna uporaba je napovedovanje z uporabo regresijske enačbe. Omejitev pri napovedovanju so pogoji stabilnosti drugih dejavnikov in procesnih pogojev. Če se okolje potekajočega procesa v njem močno spremeni, se ta regresijska enačba ne bo zgodila.

Točkovno napoved dobimo tako, da pričakovano vrednost faktorja nadomestimo v regresijsko enačbo. Verjetnost, da se bo takšna napoved natančno uresničila, je izjemno majhna.

Če točkovno napoved spremlja vrednost povprečne napake napovedi, se taka napoved imenuje intervalna.

Povprečna napaka napovedi je sestavljena iz dveh vrst napak:

  1. napake tipa 1 – napaka regresijske črte
  2. Napaka tipa 2 – napaka, povezana z napako variacije.

Povprečna napaka napovedi.

Napaka v položaju regresijske črte v populaciji

n - velikost vzorca

x k – napačna vrednost faktorja

RMS odstopanje rezultantne karakteristike od regresijske črte v populaciji

Korelacijska analiza vključuje oceno moči povezave. Indikatorji:

  1. linearni korelacijski koeficient - označuje bližino in smer razmerja med dvema karakteristikama v primeru linearne povezave med njima

pri =-1 je povezava funkcionalna povratna povezava, pri =1 je povezava funkcionalna neposredna, pri =0 povezave ni.

Velja samo za linearne odnose; uporablja se za oceno odnosov med kvantitativnimi značilnostmi. Izračunano samo na podlagi posameznih vrednosti.

Korelacijsko razmerje:

Empirično: obe vrsti variance se izračunata na podlagi atributa uspešnosti.

Teoretično:

Disperzija vrednosti dobljene karakteristike, izračunana z uporabo regresijske enačbe

Disperzija empirične vrednosti rezultantnega atributa

  • visoka stopnja natančnosti
  • primeren za oceno tesnosti razmerja med opisno in kvantitativno lastnostjo, kvantitativna pa mora biti učinkovita
  • primeren za vse vrste povezav

Spearmanov korelacijski koeficient

Čini – zaporedne številke enot populacije v rangirani seriji. Obe značilnosti morata biti razvrščeni v istem vrstnem redu od najmanjše do največje ali obratno. Če range populacijskih enot označimo s p x in p y, bo korelacijski koeficient rangov imel naslednjo obliko:

Prednosti koeficienta korelacijske serije:

  1. Možno je tudi rangiranje po opisnih značilnostih, ki jih ni mogoče številčno izraziti, zato je izračun Spearmanovega koeficienta možen za naslednje pare lastnosti: količina - količina; opisno – kvantitativno; Opisno – Opisno. (izobrazba je opisna lastnost)
  2. prikazuje smer povezave

Slabosti Spearmanovega koeficienta.

  1. enake razlike v rangih lahko ustrezajo popolnoma različnim razlikam v vrednosti značilnosti (v primeru kvantitativnih značilnosti). Primer: proizvodnja električne energije v državi na leto

ZDA 2400 kW/h 1

RF 800 kW/h 2

Kanada 600 kW/h 3

Če je med vrednostmi Spearman več enakih, se oblikujejo povezani rangi, tj. iste povprečne številke

V tem primeru se Spearmanov koeficient izračuna na naslednji način:

j –število veznikov po vrsti za karakteristiko x

A j –število enakih rangov v j povezavah v x

k –števila veznikov po predznaku

Bk –število enakih rangov v vau sveženj po

  1. 4. Kendallov rang korelacijski koeficient

Najvišji znesek uvrstitve

S – dejanska vsota rangov

Daje strožjo oceno kot Spearmanov koeficient.

Za izračun so vse enote razvrščene po atributu x po atributu pri za vsak rang se izračuna število naslednjih rangov, ki presega njihovo dano vsoto, kar je označeno s P, in število naslednjih rangov pod to oznako z Q.

P+Q= 1/2 n(n-1)

  1. Fechnerjev rang korelacijski koeficient.

Fechnerjevo razmerje – merilo tesnosti povezave v obliki razmerja razlike v številu parov ujemajočih se in neujemajočih se znakov do vsote teh števil.

  1. izračun povprečij v x in y
  2. posamezne vrednosti x i y i se primerjajo s povprečnimi vrednostmi z obvezno navedbo znaka "+" ali "-". Če znaki sovpadajo v x in y, jih pripišemo številki "C", če ne, pa "H".
  3. Preštejemo število ujemajočih se in neujemajočih se parov.

Z nalogo merjenja povezave se sooča statistika v zvezi z opisnimi značilnostmi, pomemben poseben primer takšne naloge, merjenje povezave med dvema alternativnima karakteristikama, od katerih je ena vzrok in druga posledica.

Tesnost povezave med dvema alternativnima karakteristikama se lahko meri z uporabo dveh koeficientov:

  1. asociacijski koeficient
  2. pogojni faktor

Kontingentni koeficient ima pomanjkljivost: ko je ena od dveh heterogenih kombinacij A ali Ba enaka nič, se koeficient spremeni v ena. Tesnost zveze ocenjuje zelo prostodušno in jo precenjuje.

Pearsonov koeficient

Če za vsako od medsebojno povezanih značilnosti ni dveh, ampak več možnih vrednosti, se izračunajo naslednji koeficienti:

  1. Pearsonov koeficient
  2. Chuprov koeficient za opisno karakteristiko

Pearsonov koeficient se izračuna s pomočjo kvadratnih matrik

Pod normalno

do 1 in do 2 – številka skupine po značilnostih 1 oziroma 2. Pomanjkljivost Pearsonovega koeficienta je, da ne doseže 1 niti s povečanjem števila skupin.

Chuprov koeficient (1874 –1926)

Chuprov koeficient strožje ocenjuje tesnost povezave.

§6. Večkratna korelacija.

Preučevanje razmerja med rezultanto in dvema ali več faktorskimi značilnostmi se imenuje multipla regresija. Pri preučevanju odvisnosti z metodami večkratne regresije sta postavljeni dve nalogi.

  1. določitev analitičnega izraza povezave med efektivno karakteristiko y in dejanskimi karakteristikami x 1, x 2, x 3, ... x k, t.j. poiščite funkcijo y=f(x 1, x 2, ...x k)
  2. Ocenjevanje tesnosti razmerja med rezultanto in vsako od faktorskih karakteristik.

Korelacijsko-regresijski model (CRM) je regresijska enačba, ki vključuje glavne dejavnike, ki vplivajo na variacijo nastale značilnosti.

Izdelava modela večkratne regresije vključuje naslednje korake:

  1. izbiro oblike komunikacije
  2. izbira faktorskih karakteristik
  3. Zagotavljanje, da je populacija dovolj velika za izdelavo veljavnih ocen.

I. celoten niz povezav med spremenljivkami, ki se pojavljajo v praksi, je precej v celoti opisan s funkcijami 5 vrst:

  1. linearno:
  2. moč:
  3. demonstrativno:
  4. parabola:
  5. hiperbola:

čeprav je v praksi CRA prisotnih vseh 5 funkcij, se najpogosteje uporablja linearna odvisnost, kot najenostavnejša in najlažja za interpretacijo enačbe linearne odvisnosti: , k - veliko faktorjev, vključenih v enačbo, b j

0 – ker >0,7 zato jim posvečamo posebno pozornost

EKO. Lestvica gostote povezave:

Če je povezava 0 – 0,3 – šibka povezava

0,3 – 0,5 – opazno

0,3 – 0,5 – tesno

0,7 – 0,9 – visoko

več kot 0,9 – zelo visoko

potem primerjamo dve značilnosti (dohodek in spol)<0,7, то включаем в уравнение множественной регрессии.

Izbor faktorjev za vključitev v enačbo multiple regresije:

  1. Med dejanskim in dejanskim znakom mora obstajati vzročno-posledična povezava.
  2. efektivni in dejanski znaki morajo biti tesno povezani drug z drugim, sicer pride do pojava multikolinearnost (>06) , tj. Faktorske značilnosti, vključene v enačbo, ne vplivajo samo na rezultanto, ampak druga na drugo, kar vodi do napačne interpretacije numeričnih podatkov.

Metode za izbiro faktorjev za vključitev v enačbo multiple regresije:

1. strokovna metoda – temelji na intuitivni logični analizi, ki jo izvajajo visoko usposobljeni strokovnjaki.

2. uporaba matrik parnih korelacijskih koeficientov poteka vzporedno s prvo metodo, matrika je simetrična glede na diagonalo enote.

3. regresijska analiza po korakih - zaporedna vključitev faktorskih značilnosti v regresijsko enačbo in testiranje pomembnosti se izvaja na podlagi vrednosti dveh indikatorjev na vsakem koraku. Indikator korelacije in regresije.

Rezultat korelacije: izračuna spremembo teoretične korelacije razmerja ali spremembo povprečne rezidualne variance. Indikator regresije – sprememba koeficienta pogojno čiste regresije.

Skupaj

31

32

22

85



Vam je bil članek všeč? Delite s prijatelji!