Kovarianca in korelacijski koeficient. Korelacijski moment, zvezne naključne spremenljivke, linearna odvisnost

4 strani (Wordova datoteka)

Poglej vse strani


Fragment besedila dela

Kje

za diskretne naključne spremenljivke Xi Y in

, y)dxdy

za zvezne naključne spremenljivke,

Korelacijski moment služi za karakterizacijo odnosa med naključnimi spremenljivkami. Zlasti za neodvisni naključni spremenljivki X in Y je korelacijski moment Cxy enak nič.

Po definiciji ima korelacijski moment dimenzijo, ki je enaka zmnožku dimenzij količin X in Y. To pomeni, da je velikost korelacijskega momenta odvisna od merskih enot naključnih spremenljivk. Na primer, če je pri merjenju vrednosti X in Y v centimetrih rezultat C.« 2 cm2, potem pri merjenju X in Y v milimetrih dobimo Cxy = 200 mm2. Ta odvisnost korelacijskega momenta od merskih enot otežuje primerjavo različnih sistemov naključnih spremenljivk. Za odpravo te pomanjkljivosti je uvedena brezdimenzijska značilnost razmerja med količinama X in Y, imenovana korelacijski koeficient:

Če sta naključni spremenljivki X in Y neodvisni, potem je r", = O. Če sta naključni spremenljivki X in Y povezani z natančno linearno odvisnostjo Y = ax + b, potem je rxy = l za a>O in b. = - za a z O. Na splošno velja dvojna neenakost -1 S rxyS

Lastnost neodvisnosti dveh naključnih spremenljivk X in Y v splošnem primeru ni enakovredna njuni nekoreliranosti (tj. enakost rn. = 0). Vendar pa to velja za normalno porazdeljene komponente dvodimenzionalne naključne spremenljivke.

Porazdelitveni zakon sistema dveh diskretnih naključnih spremenljivk (X, A je podan v naslednji tabeli

) zakoni porazdelitve naključnih spremenljivk X in Y;

2) pogojni zakon porazdelitve naključne spremenljivke X, če je Y = 1;

3) matematična pričakovanja IH), Ts U) in središče disperzije;

4) disperzije D(X) in DUE;

5) korelacijski moment Cdu in korelacijski koeficient b.

1. Če dodamo verjetnosti vzdolž vrstic, dobimo verjetnosti možnih vrednosti naključne spremenljivke X: = 0,4, p(l) = 0,2, p(4) = 0,4. Posledično ima zakon porazdelitve vrednosti X naslednjo obliko

Preverite: 0,4 + 1.

Če seštejemo verjetnosti po stolpcih, dobimo verjetnosti možnih vrednosti naključne spremenljivke Y: = 0,1, p(l) = 0,3, AZ) = 0,6. Zapišimo zakon porazdelitve količine Y

Preverite: (),l + 0,3 + 0,6 =

2.
Poiščimo pogojne verjetnosti za naključno spremenljivko X, če je Y = Y-2 = 1: p(-l f 1) = -P12

Ker ima porazdelitev (X 1 Y = 1) naslednjo tabelo

H. Na podlagi definicije izračunamo matematična pričakovanja:

5. Izdelajmo tabelo sistema centrifugiranih naključnih spremenljivk

x, Y, kjer je Y = Y-t = Y -1,9

Izračunajmo korelacijski moment:

(-3,9) 0-2,4 (-0,9)

Sistem dveh zveznih naključnih spremenljivk (X, Y) ima enakomerno porazdelitev v območju D = “x, y) - S x S 3, O S y S x + l).

) gostota porazdelitve;

2) verjetnost Ch X, Y) od udarca v območje

3) gostoti A(x) in Ku) porazdelitve naključnih spremenljivk X in Y ter pogojne gostote in y(ylx);

4) funkcije in F20) porazdelitve naključnih spremenljivk X in Y;

5) matematična pričakovanja M(X) in središče disperzije;

6) disperzija in TsU);

7) korelacijski moment Sl. in korelacijski koeficient

1. Po pogoju ima funkcija gostote obliko a, če je -lSxS3 in 0SySx+l, O, če je (x, y) E D

Za iskanje parametra a uporabimo relacijo f(x, y)dy.dy = , kjer je integracijska domena D prikazana na sl. 7.

Območje D je omejeno na levi in ​​desni s črtami x = -1 in x = 3, spodaj in zgoraj pa s črtami O in Y2(x) = x + 1. Če preidemo na ponovljeni integral, imamo:

3

fady= gaur X +1 D = fa(x + l)dx =

8a. Ker je 8a = 1, potem funkcija z- in GOSTOTA 8

izgleda kot

-, če

Oh, če (x,y) E).

2. Upodabljajmo območje G, ki je krog s polmerom 2 s središčem v točki (2, O) (glej sliko 8). Ker je funkcija Ax, y) zunaj enaka nič

3. Poiščimo gostoto A(x) in mulj:

Zato

torej

Za O S y S 4 dobimo podobno

DRŽAVNI ODBOR ZA ZNANOST IN TEHNOLOGIJO REPUBLIKE AZERBAJDŽAN

CENTER ZA RAZISKOVANJE IN USPOSABLJANJE BAKU

DISPLOMIRANI ŠTUDENT ODDELKA ZA OTROŠKO KIRURGIJO

AMU poimenovana po N. NARIMANOVU

MUKHTAROVA EMIL GASAN ogl

KORELACIJSKI TRENUTKI. KORELACIJSKI KOEFICIENT

UVOD

Teorija verjetnosti je matematična veda, ki preučuje vzorce v naključnih pojavih.

Kaj pomenijo naključni pojavi?

Pri znanstvenem preučevanju fizikalnih in tehničnih problemov se pogosto srečujemo s pojavi posebne vrste, ki jih običajno imenujemo naključni. Naključni pojav- gre za pojav, ki se ob večkratnem ponavljanju iste izkušnje odvija nekoliko drugače.

Navedimo primer naključnega pojava.

Isto telo večkrat stehtamo na analizni tehtnici: rezultati ponovnega tehtanja se med seboj nekoliko razlikujejo. Te razlike so posledica vpliva različnih manjših dejavnikov, ki spremljajo postopek tehtanja, kot so naključne vibracije opreme, napake pri odčitavanju instrumenta itd.

Očitno je, da v naravi ni niti enega fizikalnega pojava, v katerem ne bi bili v takšni ali drugačni meri prisotni elementi naključnosti. Ne glede na to, kako natančno in podrobno so eksperimentalni pogoji določeni, je nemogoče zagotoviti, da bodo rezultati ob ponovnem poskusu popolnoma in natančno sovpadali.

Nesreče neizogibno spremljajo vsak naravni pojav. Vendar pa lahko v številnih praktičnih problemih te naključne elemente zanemarimo, pri čemer upoštevamo njegov poenostavljen diagram namesto resničnega pojava, tj. model in ob predpostavki, da se v danih eksperimentalnih pogojih pojav odvija na zelo določen način. Hkrati pa so iz nešteto dejavnikov, ki vplivajo na ta pojav, izločeni najpomembnejši, temeljni in odločilni. Vpliv drugih, manjših dejavnikov preprosto zanemarjamo. Pri proučevanju vzorcev v okviru določene teorije so glavni dejavniki, ki vplivajo na določen pojav, vključeni v koncepte oziroma definicije, s katerimi obravnavana teorija operira.

Kot vsaka znanost, ki razvija splošno teorijo katerega koli niza pojavov, vsebuje tudi teorija verjetnosti številne osnovne koncepte, na katerih temelji. Vseh osnovnih pojmov seveda ni mogoče strogo definirati, saj definirati pojem pomeni reducirati ga na druge, bolj znane. Ta proces mora biti končen in se mora končati s primarnimi koncepti, ki so samo razloženi.

Eden prvih konceptov v teoriji verjetnosti je koncept dogodka.

Spodaj dogodek vsako dejstvo, ki se lahko pojavi ali ne pojavi kot posledica izkušenj, je razumljeno.

Navedimo primere dogodkov.

A - rojstvo fantka ali deklice;

B - izbira ene ali druge odprtine v šahovski igri;

C - pripadnost enemu ali drugemu znaku zodiaka.

Ob upoštevanju zgornjih dogodkov vidimo, da ima vsak od njih določeno stopnjo možnosti: nekateri večjo, drugi manjšo. Da bi dogodke kvantitativno primerjali med seboj po stopnji njihove možnosti, je seveda treba vsakemu dogodku pripisati določeno število, ki je tem večje, čim bolj je dogodek možen. To število imenujemo verjetnost dogodka. Tako je verjetnost dogodka numerična značilnost stopnje objektivne možnosti dogodka.

Za enoto verjetnosti se vzame verjetnost zanesljivega dogodka, ki je enaka 1, razpon sprememb verjetnosti katerega koli dogodka pa je število od 0 do 1.

Verjetnost običajno označujemo s črko P.

Poglejmo primer večnega problema Shakespearovega Hamleta "biti ali ne biti?" Kako lahko določite verjetnost dogodka?

Povsem očitno je, da je oseba, predmet in vsak drug pojav lahko v enem od dveh in nič več stanj: prisotnosti (»biti«) in odsotnosti (»ne biti«). To pomeni, da sta možna dva dogodka, zgodi pa se lahko le eden. To pomeni, da je verjetnost na primer obstoja 1/2.

Poleg koncepta dogodka in verjetnosti je eden glavnih konceptov teorije verjetnosti koncept naključne spremenljivke.

Naključna spremenljivka je količina, ki lahko zaradi poskusa zavzame eno ali drugo vrednost, pri čemer se vnaprej ne ve, katero.

Naključne spremenljivke, ki imajo samo vrednosti, ki so ločene druga od druge in jih je mogoče navesti vnaprej, imenujemo zvezne ali diskretne naključne spremenljivke.

Na primer:

1. Število preživelih in umrlih bolnikov.

2. Skupno število otrok od pacientov, sprejetih v bolnišnico čez noč.

Imenujejo se naključne spremenljivke, katerih možne vrednosti nenehno zapolnjujejo določen interval zvezne naključne spremenljivke.

Na primer napaka tehtanja na analitični tehtnici.

Upoštevajte, da sodobna teorija verjetnosti primarno operira z naključnimi spremenljivkami in ne z dogodki, na katerih je v glavnem temeljila »klasična« teorija verjetnosti.

KORELACIJSKI TRENUTKI. KORELACIJSKI KOEFICIENT.

Korelacijski momenti, korelacijski koeficient - to so numerične značilnosti, ki so tesno povezane z zgoraj predstavljenim konceptom naključne spremenljivke, natančneje s sistemom naključnih spremenljivk. Zato je za uvedbo in opredelitev njihovega pomena in vloge potrebno razložiti pojem sistema naključnih spremenljivk in nekatere lastnosti, ki so njim lastne.

Imenujemo dve ali več naključnih spremenljivk, ki opisujejo nek pojav sistem ali kompleks naključnih spremenljivk.

Sistem več naključnih spremenljivk X, Y, Z, …, W običajno označimo z (X, Y, Z, …, W).

Na primer, točka na ravnini ni opisana z eno koordinato, ampak z dvema, v prostoru pa celo s tremi.

Lastnosti sistema več naključnih spremenljivk niso omejene le na lastnosti posameznih naključnih spremenljivk, vključenih v sistem, ampak vključujejo tudi medsebojne povezave (odvisnosti) med naključnimi spremenljivkami. Zato je treba pri preučevanju sistema naključnih spremenljivk paziti na naravo in stopnjo odvisnosti. Ta odvisnost je lahko bolj ali manj izrazita, bolj ali manj tesna. In v drugih primerih se naključne spremenljivke izkažejo za praktično neodvisne.

Pokliče se naključna spremenljivka Y neodvisen od naključne spremenljivke X, če zakon porazdelitve naključne spremenljivke Y ni odvisen od vrednosti, ki jo je prevzel X.

Opozoriti je treba, da sta odvisnost in neodvisnost naključnih spremenljivk vedno medsebojni pojav: če Y ni odvisen od X, potem tudi vrednost X ni odvisna od Y. Ob upoštevanju tega lahko podamo naslednjo definicijo neodvisnosti naključnih spremenljivk.

Naključni spremenljivki X in Y se imenujeta neodvisni, če distribucijski zakon vsake od njiju ni odvisen od vrednosti druge. V nasprotnem primeru se imenujeta količini X in Y odvisen.

Zakon porazdelitve Naključna spremenljivka je vsaka relacija, ki vzpostavlja povezavo med možnimi vrednostmi naključne spremenljivke in njihovimi ustreznimi verjetnostmi.

Koncept "odvisnosti" naključnih spremenljivk, ki se uporablja v teoriji verjetnosti, je nekoliko drugačen od običajnega koncepta "odvisnosti" spremenljivk, ki se uporablja v matematiki. Tako matematik z "odvisnostjo" pomeni samo eno vrsto odvisnosti - popolno, togo, tako imenovano funkcionalno odvisnost. Dve količini X in Y se imenujeta funkcionalno odvisni, če lahko, če poznate vrednost ene od njih, natančno določite vrednost druge.

V teoriji verjetnosti obstaja nekoliko drugačna vrsta odvisnosti - verjetnostna odvisnost. Če je vrednost Y povezana z vrednostjo X z verjetnostno odvisnostjo, potem, če poznate vrednost X, ni mogoče natančno navesti vrednosti Y, vendar lahko navedete njegov porazdelitveni zakon, odvisno od vrednosti, ki jo ima vrednost X sprejeti.

Verjetnostno razmerje je lahko bolj ali manj tesno; Z večanjem tesnosti verjetnostne odvisnosti se vse bolj približuje funkcionalni. Tako lahko funkcionalno odvisnost obravnavamo kot skrajni, omejevalni primer najbližje verjetnostne odvisnosti. Drug skrajni primer je popolna neodvisnost naključnih spremenljivk. Med tema dvema skrajnima primeroma ležijo vse stopnje verjetnostne odvisnosti – od najmočnejše do najšibkejše.

V praksi pogosto srečamo verjetnostno odvisnost med naključnimi spremenljivkami. Če sta naključni spremenljivki X in Y v verjetnostnem razmerju, to ne pomeni, da se s spremembo vrednosti X povsem določeno spremeni vrednost Y; to samo pomeni, da se s spremembo vrednosti X vrednost Y

se prav tako spreminja (povečuje ali zmanjšuje, ko X narašča). Ta trend je opazen le na splošno in v vsakem posameznem primeru so možna odstopanja od njega.

Primeri verjetnostne odvisnosti.

Naključno izberimo enega bolnika s peritonitisom. naključna spremenljivka T je čas od začetka bolezni, naključna spremenljivka O je stopnja homeostatskih motenj. Med temi vrednostmi obstaja jasna povezava, saj je vrednost T eden najpomembnejših razlogov za določanje vrednosti O.

Hkrati obstaja šibkejša verjetnostna povezava med naključno spremenljivko T in naključno spremenljivko M, ki odraža umrljivost pri določeni patologiji, saj naključna spremenljivka, čeprav vpliva na naključno spremenljivko O, ni glavna determinanta.

Poleg tega, če upoštevamo vrednost T in vrednost B (starost kirurga), potem sta ti vrednosti praktično neodvisni.

Doslej smo razpravljali o lastnostih sistemov naključnih spremenljivk in podajali le verbalno razlago. Vendar pa obstajajo numerične značilnosti, s pomočjo katerih se preučujejo lastnosti posameznih naključnih spremenljivk in sistema naključnih spremenljivk.

Za karakterizacijo korelacije med količinami se uporabljata korekcijski moment in korelacijski koeficient.

Definicija 2. Trenutek korelacijeµ xy naključnih spremenljivk X in Y je matematično pričakovanje produkta odstopanj teh spremenljivk

Za izračun korelacijskega momenta diskretnih količin se uporablja izraz

(3.12)

in za neprekinjene – izraz

(3.13)

Opomba Korelacijski moment µ xy lahko prepišemo v obliki

(3.14)

Z uporabo lastnosti matematičnega pričakovanja (glej §§ 2.2; 2.6) imamo dejansko

Izrek. Korelacijski moment dveh neodvisnih naključnih spremenljivk X in Y je enak nič.

Dokaz. Glede na pripombo

in ker sta X in Y neodvisni naključni spremenljivki, potem (glej §§ 2.2; 2.6)

in zato je µ xy =0.

Iz definicije korelacijskega momenta sledi, da ima dimenzijo, ki je enaka zmnožku dimenzij količin X in Y, tj. njegova vrednost je odvisna od merskih enot naključnih spremenljivk. Zato ima lahko za isti dve količini velikost korelacijskega momenta različne vrednosti, odvisno od enot, v katerih so bile količine izmerjene. Da bi odpravili to pomanjkljivost, smo se dogovorili, da za mero odnosa (odvisnosti) dveh naključnih spremenljivk X in Y vzamemo brezdimenzijsko količino.

Kje σ x =σ(X), σ y =σ(Y), klical korelacijski koeficient.

Primer 1. Naj bo dvodimenzionalna diskretna naključna spremenljivka (X,Y) določena z distribucijskim zakonom:

in zato,

S seštevanjem verjetnosti v stolpcih najdemo verjetnosti možnih vrednosti Y:

Zato distribucijski zakon Y:

Y
str 1\3 1\2 1\6

in zato,

torej

Tako je korelacijski koeficient

Izrek. Absolutna vrednost korelacijskega momenta dveh naključnih spremenljivk ne presega produkta njunih standardnih odklonov:

Dokaz. Predstavitev naključne spremenljivke Kje Poiščimo njegovo varianco. Imamo

(vsaka varianca je nenegativna). Od tod

Z vnosom naključne spremenljivke , podobno bomo našli

Kot rezultat imamo

Definicija 2. Naključne spremenljivke X in Y imenujemo nekorelirana, če je = 0, in korelirana, če

Primer 1. Neodvisne naključne spremenljivke X in Y so nekorelirani, saj je zaradi relacije (3.12) = 0.

Primer 2. Naj naključne spremenljivke X in Y so povezani z linearno odvisnostjo. Poiščemo korelacijski koeficient. Imamo:

Tako je korelacijski koeficient naključnih spremenljivk, povezanih z linearno odvisnostjo, enak ±1 (natančneje =1, če A>0 in =-1 če A<0).

Opozorimo na nekatere lastnosti korelacijskega koeficienta.

Iz primera 1 sledi:

1) Če sta X in Y neodvisni naključni spremenljivki, potem je korelacijski koeficient enak nič.

Upoštevajte, da je obratna izjava na splošno napačna. (Za dokaz si oglejte delo.)

2) Absolutna vrednost korelacijskega koeficienta ne presega enote:

Dejansko delimo obe strani neenakosti (3.16) s produktom , pridemo do želene neenakosti.

3) Kot je razvidno iz formule (3.15), ob upoštevanju formule (3.14), korelacijski koeficient označuje relativno velikost odstopanja matematičnega pričakovanja produkta od produkta matematičnih pričakovanj M(X) M(Y) količine X in Y. Ker se to odstopanje pojavi samo pri odvisnih količinah, lahko rečemo, da Korelacijski koeficient označuje tesnost razmerja med X in Y.

3. Linearna korelacija. Ta vrsta korelacije je precej pogosta.

Definicija. Korelacijska odvisnost med naključnimi spremenljivkami X in Y klical linearna korelacija,če sta obe regresijski funkciji in linearni. V tem primeru sta obe regresijski črti ravni; se imenujejo neposredne regresije.

Izpeljimo enačbe neposredne regresije Y na X, tiste. poiščimo koeficient linearne funkcije

Označimo M(X) = a, M(Y)= b, M[(X - a) 2 ]= , M[(Y –b 2)]= . Z uporabo lastnosti MO (§§ 2.2; 2.6) najdemo:

M(Y) = M= M(AX + B) = AM(X) + B,

tiste. b = Aa + B, kje B=b-Aa.

M(XY)= M[Xg(X)\= M(AX 2 + BX) = AM(X 2) + BM(X)= AM(X 2) + (b- Aa)a,

ali glede na lastnost 1 disperzije (§§ 2.3; 2.6),

Dobljeni koeficient se imenuje regresijski koeficient Y na X in je označen z:

Torej enačba regresije naprej Y na X izgleda kot

Podobno lahko dobite enačbo neposredne regresije X na Y

Za opis sistema dveh naključnih spremenljivk se poleg matematičnih pričakovanj in varianc komponent uporabljajo še druge karakteristike, ki vključujejo korelacijski trenutek in korelacijski koeficient(na kratko omenjeno na koncu T.8.str.8.6) .

Trenutek korelacije(oz kovarianca, oz trenutek povezave) dve naključni spremenljivki X in Y imenovan m.o. zmnožek odstopanj teh količin (glej klavzulo 8.6 enakosti (5):

Posledica 1. Za korelacijski moment r.v. X in Y veljajo tudi naslednje enakosti:

,

kjer je ustrezna centralizirana r.v. X in Y (glej klavzulo 8.6.).

V tem primeru: če
je dvodimenzionalni d.s.v., potem se kovarianca izračuna po formuli

(8)
;

če
je dvodimenzionalni n.s.v., potem se kovarianca izračuna po formuli

(9)

Formuli (8) in (9) sta bili pridobljeni na podlagi formul (6) v klavzuli 12.1. Obstaja formula za izračun

(10)

ki izhaja iz definicije (9) in temelji na lastnostih MO,

Posledično lahko formuli (36) in (37) prepišemo v obliki

(11)
;

Korelacijski moment služi za karakterizacijo razmerja med količinami X in Y.

Kot bo prikazano spodaj, je korelacijski moment enak nič, če X in Y so neodvisen;

Torej, če korelacijski moment ni enak nič, potemXinYso odvisne naključne spremenljivke.

Izrek 12.1.Korelacijski moment dveh neodvisnih naključnih spremenljivkXinYje enaka nič, tj. za samostojno r.v.XinY,

Dokaz. Ker X in Y neodvisne naključne spremenljivke, nato pa njihova odstopanja

in

T tudi neodvisen. Uporaba lastnosti matematičnega pričakovanja (matematično pričakovanje zmnožka neodvisnih r.v.s je enako zmnožku matematičnega pričakovanja faktorjev
,
, Zato

Komentiraj. Iz tega izreka sledi, da če
nato s.v. X in Y odvisni in v takih primerih r.v. X in Y klical korelirano. Vendar pa iz dejstva, da
ne sledi osamosvojitvi r.v. X in Y.

V tem primeru (
s.v. X in Y klical nepovezano, Iz osamosvojitve torej sledi nepovezano; obratna izjava je na splošno napačna (glej spodnji primer 2.)

Razmislimo o glavnih lastnostih korelacijskega momenta.

Ckovariančne lastnosti:

1. Kovarianca je simetrična, tj.
.

To izhaja neposredno iz formule (38).

2. Obstajajo enakosti: tj. disperzija r.v. je njegova kovarianca s seboj.

Te enakosti izhajajo neposredno iz definicije disperzije oziroma enakosti (38) za

3. Veljajo naslednje enakosti:

Te enakosti izhajajo iz definicije variance in kovariance r.v.
in , lastnosti 2.

Po definiciji disperzije (ob upoštevanju centralnosti r.v.
) imamo

Zdaj na podlagi (33) ter lastnosti 2 in 3 dobimo prvo (z znakom plus) lastnost 3.

Podobno je drugi del lastnosti 3 izpeljan iz enakosti

4. Pustiti
konstantna števila,
potem veljajo enakosti:

Običajno se te lastnosti imenujejo lastnosti homogenosti prvega reda in periodičnosti argumentov.

Dokažimo prvo enakost, pri čemer bomo uporabili lastnosti m.o.
.

Izrek 12.2.Absolutna vrednostkorelacijski moment dveh poljubnih naključnih spremenljivkXinYne presega geometrične sredine njihovih varianc: tj.

Dokaz. Upoštevajte, da je za neodvisno r.v. neenakost velja (glej izrek 12.1.). Torej, naj r.v. X in Y odvisen. Oglejmo si standardni r.v.
in
in izračunajte disperzijo r.v.
ob upoštevanju lastnosti 3 imamo: na eni strani
Na drugi strani

Zato ob upoštevanju dejstva, da
in - normaliziran (standardiziran) r.v., potem zanje m.o. je enaka nič, varianca pa je enaka 1, torej z uporabo lastnosti m.o.
dobimo

in torej na podlagi dejstva, da
dobimo

Iz tega sledi, da je t.j.

=

Trditev je dokazana.

Iz definicije in lastnosti kovariance sledi, da označuje tako stopnjo odvisnosti r.v. kot njihovo razpršenost okoli točke
Dimenzija kovariance je enaka produktu dimenzij naključnih spremenljivk X in Y. Z drugimi besedami, velikost korelacijskega momenta je odvisna od merskih enot naključnih spremenljivk. Iz tega razloga za isti dve količini X in Y, velikost korelacijskega momenta bo imela različne vrednosti, odvisno od enot, v katerih so bile vrednosti izmerjene.

Naj npr. X in Y so bile izmerjene v centimetrih in
; če se meri X in Y v milimetrih, torej
Ta značilnost korelacijskega momenta je pomanjkljivost te numerične značilnosti, saj postane primerjava korelacijskih momentov različnih sistemov naključnih spremenljivk težavna.

Da bi odpravili to pomanjkljivost, je uvedena nova numerična karakteristika - " korelacijski koeficient».

Korelacijski koeficient
naključne spremenljivke
in se imenuje razmerje med korelacijskim momentom in produktom standardnih odstopanj teh količin:

(13)
.

Od razsežnosti
enak zmnožku dimenzij količin
in ,
ima dimenzijo velikosti
σ l ima dimenzijo velikosti , To
je samo številka (tj. " brezdimenzijska količina"). Tako vrednost korelacijskega koeficienta ni odvisna od izbire merskih enot r.v., to je prednost korelacijski koeficient pred korelacijskim trenutkom.

V T.8. klavzulo 8.3 smo predstavili koncept normalizirana s.v.
, formula (18), izrek pa je dokazan, da
in
(Glej tudi izrek 8.2.). Tukaj dokazujemo naslednjo trditev.

Izrek 12.3. Za kateri koli dve naključni spremenljivki
in enakost je res
.Z drugimi besedami, korelacijski koeficient
katera koli dva z
.V.XinYenak korelacijskemu momentu njihovega ustreznega normaliziranega s.v.
in .

Dokaz. Z definicijo normaliziranih naključnih spremenljivk
in

in
.

Ob upoštevanju lastnosti matematičnega pričakovanja: in enakosti (40) dobimo

Trditev je dokazana.

Oglejmo si nekatere lastnosti korelacijskega koeficienta, ki se pogosto pojavljajo.

Lastnosti korelacijskega koeficienta:

1. Korelacijski koeficient v absolutni vrednosti ne presega 1, tj.

Ta lastnost izhaja neposredno iz formule (41) – definicije korelacijskega koeficienta in izreka 13.5. (glej enakost (40)).

2. Če naključne spremenljivke
in sta neodvisni, je trenutni korelacijski koeficient enak nič, tj.
.

Ta lastnost je neposredna posledica enakosti (40) in izreka 13.4.

Formulirajmo naslednjo lastnost kot ločen izrek.

Izrek 12.4.

Če je r.v.
in so med seboj povezani z linearno funkcionalno odvisnostjo, tj.
to

pri čemer

in nasprotno, če
,
to s.v.
in so med seboj povezani z linearno funkcionalno odvisnostjo, tj. obstajajo konstante
in
tako, da velja enakost

Dokaz. Pustiti
Potem Na podlagi lastnosti 4 kovariance imamo

in ker, , torej

torej
. Dobi se enakost v eno smer. Naj naprej
, Potem

upoštevati je treba dva primera: 1)
in 2)
Torej, razmislimo o prvem primeru. Potem po definiciji
in torej iz enakosti
, Kje
. V našem primeru
, torej iz enakosti (glej dokaz izreka 13.5.)

=
,

to razumemo
, Pomeni
je konstantna. Ker
in od takrat
res,

.

torej


.

Podobno je prikazano, da za
poteka (preverite sami!)

,
.

Nekaj ​​zaključkov:

1. Če
in neodvisniki.v., tedaj

2. Če je r.v.
in so torej med seboj linearno povezani
.

3. V drugih primerih
:

V tem primeru pravijo, da je r.v.
in med seboj povezani pozitivna korelacija,če
v primerih
negativna korelacija. Bližje
enemu, razlog več za domnevo, da je r.v.
in so povezani z linearnim razmerjem.

Upoštevajte, da so korelacijski momenti in disperzije sistema r.v. običajno dano korelacijsko matriko:

.

Očitno je, da determinanta korelacijske matrike izpolnjuje:

Kot smo že omenili, če sta dve naključni spremenljivki odvisni, sta lahko podobni korelirano, torej nepovezano. Z drugimi besedami, korelacijski moment dveh odvisnih količin je lahko ni enako nič, ampak morda enako nič.

Primer 1. Porazdelitveni zakon diskretnega r.v. je podan s tabelo


Poiščite korelacijski koeficient

rešitev. Iskanje zakonitosti porazdelitve komponent
in :


Zdaj pa izračunajmo m.o. komponente:

Te vrednosti je mogoče najti na podlagi distribucijske tabele r.v.

prav tako
poiščite sami.

Izračunajmo variance komponent in uporabimo računsko formulo:

Ustvarimo distribucijski zakon
, in potem najdemo
:

Pri sestavljanju tabele distribucijskega zakona morate izvesti naslednje korake:

1) pustite le različne pomene vseh možnih izdelkov
.

2) za določitev verjetnosti dane vrednosti
, moram

seštejte vse ustrezne verjetnosti, ki se nahajajo na presečišču glavne tabele in dajejo prednost pojavu dane vrednosti.

V našem primeru je r.v. ima le tri različne vrednosti
. Tukaj je prva vrednost (
) ustreza izdelku
iz druge vrstice in
iz prvega stolpca, zato je na njihovem presečišču verjetnostno število
podobno

ki se dobi iz vsote verjetnosti, ki se nahajajo na presečiščih prve vrstice oziroma prvega stolpca (0,15; 0,40; 0,05) in ene vrednosti
, ki je na presečišču druge vrstice in drugega stolpca, in končno,
, ki je na presečišču druge vrstice in tretjega stolpca.

Iz naše tabele najdemo:

Korelacijski moment najdemo s formulo (38):

Poiščite korelacijski koeficient z uporabo formule (41)

Torej negativna korelacija.

telovadba. Zakon porazdelitve diskretne r.v. podan s tabelo


Poiščite korelacijski koeficient

Poglejmo primer, kjer sta dva odvisne naključne spremenljivke je lahko nepovezano.

Primer 2. Dvodimenzionalna naključna spremenljivka
)
podana s funkcijo gostote

Dokažimo to
in odvisen , Ampak nepovezano naključne spremenljivke.

rešitev. Uporabimo predhodno izračunane porazdelitvene gostote komponent
in :

Od takrat
in odvisne količine. Dokazati nepovezano
in , dovolj je že, da se prepričate, da

Poiščimo korelacijski moment z uporabo formule:

Ker je diferencialna funkcija
simetrično glede na os ojoj, To
podobno
, zaradi simetrije
glede na os OX. Zato jemljemo stalni faktor

Notranji integral je enak nič (integrand je lih, limite integracije so simetrične glede na izvor), torej
, tj. odvisne naključne spremenljivke
in med seboj niso povezani.

Torej iz korelacije dveh naključnih spremenljivk sledi njuna odvisnost, iz nekorelacije pa še vedno ni mogoče sklepati, da sta ti spremenljivki neodvisni.

Vendar pa je za normalno porazdeljeno r.v. tak sklep je razen tiste. od nepovezano normalno porazdeljena s.v. jih izliva neodvisnost.

Naslednji odstavek je posvečen temu vprašanju.

Korelacijski momenti, korelacijski koeficient so numerične značilnosti, ki so tesno povezane z zgoraj predstavljenim konceptom naključne spremenljivke ali natančneje s sistemom naključnih spremenljivk. Zato je za uvedbo in opredelitev njihovega pomena in vloge potrebno razložiti pojem sistema naključnih spremenljivk in nekatere lastnosti, ki so njim lastne.

Dve ali več naključnih spremenljivk, ki opisujejo določen pojav, imenujemo sistem ali kompleks naključnih spremenljivk.

Sistem več naključnih spremenljivk X, Y, Z, …, W običajno označimo z (X, Y, Z, …, W).

Na primer, točka na ravnini ni opisana z eno koordinato, ampak z dvema, v prostoru pa celo s tremi.

Lastnosti sistema več naključnih spremenljivk niso omejene le na lastnosti posameznih naključnih spremenljivk, vključenih v sistem, ampak vključujejo tudi medsebojne povezave (odvisnosti) med naključnimi spremenljivkami. Zato je treba pri preučevanju sistema naključnih spremenljivk paziti na naravo in stopnjo odvisnosti. Ta odvisnost je lahko bolj ali manj izrazita, bolj ali manj tesna. In v drugih primerih se naključne spremenljivke izkažejo za praktično neodvisne.

Za naključno spremenljivko Y pravimo, da je neodvisna od naključne spremenljivke X, če porazdelitveni zakon naključne spremenljivke Y ni odvisen od vrednosti X.

Opozoriti je treba, da sta odvisnost in neodvisnost naključnih spremenljivk vedno medsebojni pojav: če Y ni odvisen od X, potem tudi vrednost X ni odvisna od Y. Ob upoštevanju tega lahko podamo naslednjo definicijo neodvisnosti naključnih spremenljivk.

Naključni spremenljivki X in Y se imenujeta neodvisni, če distribucijski zakon vsake od njiju ni odvisen od vrednosti druge. V nasprotnem primeru se količini X in Y reče odvisni.

Zakon porazdelitve naključne spremenljivke je vsako razmerje, ki vzpostavlja povezavo med možnimi vrednostmi naključne spremenljivke in pripadajočimi verjetnostmi.

Koncept "odvisnosti" naključnih spremenljivk, ki se uporablja v teoriji verjetnosti, je nekoliko drugačen od običajnega koncepta "odvisnosti" spremenljivk, ki se uporablja v matematiki. Tako matematik z "odvisnostjo" pomeni samo eno vrsto odvisnosti - popolno, togo, tako imenovano funkcionalno odvisnost. Dve količini X in Y se imenujeta funkcionalno odvisni, če lahko, če poznate vrednost ene od njih, natančno določite vrednost druge.

V teoriji verjetnosti srečamo nekoliko drugačno vrsto odvisnosti – verjetnostno odvisnost. Če je vrednost Y povezana z vrednostjo X z verjetnostno odvisnostjo, potem, če poznate vrednost X, ni mogoče natančno navesti vrednosti Y, vendar lahko navedete njegov porazdelitveni zakon, odvisno od vrednosti, ki jo ima vrednost X sprejeti.

Verjetnostno razmerje je lahko bolj ali manj tesno; Z večanjem tesnosti verjetnostne odvisnosti se vse bolj približuje funkcionalni. Tako lahko funkcionalno odvisnost obravnavamo kot skrajni, omejevalni primer najbližje verjetnostne odvisnosti. Drug skrajni primer je popolna neodvisnost naključnih spremenljivk. Med tema dvema skrajnima primeroma ležijo vse stopnje verjetnostne odvisnosti – od najmočnejše do najšibkejše.

V praksi pogosto srečamo verjetnostno odvisnost med naključnimi spremenljivkami. Če sta naključni spremenljivki X in Y v verjetnostnem razmerju, to ne pomeni, da se s spremembo vrednosti X povsem določeno spremeni vrednost Y; to samo pomeni, da se s spremembo vrednosti X vrednost Y

se prav tako spreminja (povečuje ali zmanjšuje, ko X narašča). Ta trend je opazen le na splošno in v vsakem posameznem primeru so možna odstopanja od njega.

Primeri verjetnostne odvisnosti.

Naključno izberimo enega bolnika s peritonitisom. naključna spremenljivka T je čas od začetka bolezni, naključna spremenljivka O je stopnja homeostatskih motenj. Med temi vrednostmi obstaja jasna povezava, saj je vrednost T eden najpomembnejših razlogov za določanje vrednosti O.

Hkrati obstaja šibkejša verjetnostna povezava med naključno spremenljivko T in naključno spremenljivko M, ki odraža umrljivost pri določeni patologiji, saj naključna spremenljivka, čeprav vpliva na naključno spremenljivko O, ni glavna determinanta.

Poleg tega, če upoštevamo vrednost T in vrednost B (starost kirurga), potem sta ti vrednosti praktično neodvisni.

Doslej smo razpravljali o lastnostih sistemov naključnih spremenljivk in podajali le verbalno razlago. Vendar pa obstajajo numerične značilnosti, s pomočjo katerih se preučujejo lastnosti posameznih naključnih spremenljivk in sistema naključnih spremenljivk.

Ena najpomembnejših značilnosti naključne spremenljivke normalne porazdelitve je njeno matematično pričakovanje.

Razmislite o diskretni naključni spremenljivki X z možnimi vrednostmi X 1, X2, ... , Xn z verjetnostmi p1, p2, ... , рn. z neko številko moramo označiti položaj vrednosti naključne spremenljivke na osi abscise, pri čemer upoštevamo dejstvo, da imajo te vrednosti različne pomene. V ta namen običajno uporabljajo tako imenovano »uteženo povprečje« vrednosti Xi in vsako vrednost Xi pri povprečenju jo je treba upoštevati z »težo«, sorazmerno z verjetnostjo te vrednosti. Če torej “uteženo povprečje” označimo z M[X] oz mx, dobimo

ali glede na to,

Matematično pričakovanje naključne spremenljivke je vsota zmnožkov vseh možnih vrednosti naključne spremenljivke in verjetnosti teh vrednosti.

Za večjo jasnost razmislimo o eni mehanski interpretaciji predstavljenega pojma. Naj se točke z abscisami x 1 nahajajo na abscisni osi, x2, …, xn, v katerih so koncentrirane mase oz p1, p2, … , рn, in. Potem matematično pričakovanje ni nič drugega kot abscisa težišča danega sistema materialnih točk.

Formula (1) za matematično pričakovanje ustreza primeru diskretne naključne spremenljivke. Za zvezno vrednost X matematično pričakovanje seveda ni izraženo kot vsota, ampak kot integral:

kjer je gostota porazdelitve vrednosti X.

Formulo (2) dobimo iz formule (1), če v njej zamenjamo posamezne vrednosti Xi stalno spreminjajoči se parameter X, ustrezne verjetnosti pi verjetnostni element f(x)dx, končna vsota - integral.

V mehanski interpretaciji matematično pričakovanje zvezne naključne spremenljivke ohrani enak pomen - absciso težišča v primeru, ko je porazdelitev mase po abscisi zvezna z gostoto f(x).

Opozoriti je treba, da matematično pričakovanje ne obstaja za vse naključne spremenljivke, kar pa po mnenju nekaterih znanstvenikov za prakso ni pomembneje.

Poleg matematičnega pričakovanja so pomembne tudi druge numerične naključne spremenljivke - momenti.

Koncept momenta se v mehaniki pogosto uporablja za opis porazdelitve mas (statistični momenti, vztrajnostni momenti itd.). Popolnoma enake tehnike se uporabljajo v teoriji verjetnosti za opis osnovnih lastnosti porazdelitve naključne spremenljivke. Najpogosteje se v praksi uporabljata dve vrsti trenutkov: začetni in osrednji.

Začetni trenutek st. reda diskontinuirane naključne spremenljivke X je vsota oblike

Očitno ta definicija sovpada z definicijo začetnega momenta reda s v mehaniki, če je na osi abscise v točkah x 1, ..., xn masa koncentrirana p1, …, рn.

Za zvezno naključno spremenljivko X se začetni moment s-tega reda imenuje integral

To je očitno

tiste. začetni trenutek s-tega reda naključne spremenljivke X ni nič drugega kot matematično pričakovanje s-te stopnje te naključne spremenljivke.

Preden definiramo osrednji trenutek, uvedemo koncept "centrirane naključne spremenljivke".

Naj obstaja naključna spremenljivka X z matematičnim pričakovanjem m x . Centrirana naključna spremenljivka, ki ustreza vrednosti X, je odstopanje naključne spremenljivke X od njenega matematičnega pričakovanja

Preprosto je videti, da je matematično pričakovanje centrirane naključne spremenljivke enako nič.

Centriranje naključne spremenljivke je enakovredno premikanju izhodišča koordinat na točko, katere abscisa je enaka matematičnemu pričakovanju.

Osrednji moment reda s naključne spremenljivke X je matematično pričakovanje s-te stopnje ustrezne centrirane naključne spremenljivke:

Za diskontinuirano naključno spremenljivko je s-ti osrednji moment izražen z vsoto

in za neprekinjeno - z integralom

Izjemno pomemben je drugi središčni moment, ki se imenuje disperzija in ga označujemo z D[X]. Za varianco, ki jo imamo

Razpršenost naključne spremenljivke je značilnost razpršenosti, razpršenosti vrednosti naključne spremenljivke okoli njenega matematičnega pričakovanja. Sama beseda "disperzija" pomeni "razpršitev".

Mehanska razlaga disperzije ni nič drugega kot vztrajnostni moment dane porazdelitve mase glede na težišče.

V praksi se pogosto uporablja tudi količina

imenovan standardni odklon (sicer znan kot "standard") naključne spremenljivke X.

Zdaj pa preidimo na obravnavo značilnosti sistemov naključnih spremenljivk.

Začetni trenutek reda k,s sistema (X, Y) je matematično pričakovanje produkta X k in Y s,

xk,s=M.

Osrednji moment reda k,s sistema (X, Y) je matematično pričakovanje produkta k-te in s-te potence ustreznih centriranih količin:

Za diskontinuirane naključne spremenljivke

kjer je p ij verjetnost, da bo sistem (X, Y) prevzel vrednosti ( xi, yj), vsota pa se upošteva po vseh možnih vrednostih naključnih spremenljivk X,Y.

Za zvezne naključne spremenljivke

kjer je f(x,y) gostota porazdelitve sistema.

Poleg števil k in s, ki označujeta vrstni red trenutka glede na posamezne količine, se upošteva tudi skupni vrstni red momenta k + s, ki je enak vsoti eksponentov X in Y skupni vrstni red, trenutki so razvrščeni v prvi, drugi itd. V praksi se običajno uporabljata le prvi in ​​drugi trenutek.

Prvi začetni trenutki predstavljajo matematična pričakovanja vrednosti X in Y, vključenih v sistem

y1.0=mx y0.1=moj.

Množica matematičnih pričakovanj m x , moj je značilnost položaja sistema. Geometrično so to koordinate razpolovišča na ravnini, okoli katere je raztresena točka (X, Y).

Tudi drugi osrednji momenti sistemov igrajo pomembno vlogo v praksi. Dva od njih predstavljata varianci vrednosti X in Y

ki označuje sipanje naključne točke v smeri osi Ox in Oy.

Drugi premaknjeni osrednji moment ima posebno vlogo:

imenovan korelacijski moment (sicer - "trenutek povezave") naključnih spremenljivk X in Y.

Korelacijski moment je značilnost sistema naključnih spremenljivk, ki opisuje poleg disperzije vrednosti X in Y tudi povezavo med njima. Da bi to preverili, upoštevamo, da je korelacijski moment neodvisnih naključnih spremenljivk enak nič.

Upoštevajte, da korelacijski moment ne označuje le odvisnosti količin, temveč tudi njihovo disperzijo. Zato se za karakterizacijo razmerja med količinami (X; Y) v čisti obliki premaknemo od trenutka K xy do značilnosti

Kje yx, yy- standardna odstopanja vrednosti X in Y. Ta značilnost se imenuje korelacijski koeficient vrednosti X in Y.

Iz formule (3) je razvidno, da je za neodvisne naključne spremenljivke korelacijski koeficient enak nič, saj za take spremenljivke kxy=0.

Naključne spremenljivke, za katere rxy=0, se imenujejo nekorelirane (nepovezane).

Upoštevajte pa, da nekorelirana narava naključnih spremenljivk ne pomeni njihove neodvisnosti.

Korelacijski koeficient ne označuje nobene odvisnosti, temveč le tako imenovano linearno odvisnost. Linearna verjetnostna odvisnost naključnih spremenljivk je, da ko ena naključna spremenljivka narašča, se druga nagiba k povečanju (ali zmanjšanju) po linearnem zakonu. Tako korelacijski koeficient označuje stopnjo tesnosti linearne povezave med naključnimi spremenljivkami.

Obstaja več metod za določanje korelacijskega koeficienta. Vendar bomo podali primer z uporabo Pearsonovega korelacijskega koeficienta mešanega momenta, kjer

s podatkovno tabelo (v našem primeru relativna vsebnost T-limfocitov v % in raven IgG v g/l):

Če nadomestimo dobljene vrednosti v formulo (4), dobimo

To pomeni, da je korelacijski koeficient dinamike T-limfocitov in imunoglobulina G pri otrocih s peritonitisom 0,9933, kar kaže na visoko povezavo med temi indikatorji.



Vam je bil članek všeč? Delite s prijatelji!