Корреляцийн хүснэгт ашиглан шулуун шугамын тэгшитгэлийн жишээ. Шугаман регрессийн үндэс

ЛАБОРАТОРИЙН АЖИЛ №4

Түүврийн корреляцийн коэффициентийг тооцоолох, эмпирик болон онолын регрессийн шугамыг байгуулах

Ажлын зорилго : шугаман хамааралтай танилцах; корреляцийн коэффициентийг тооцоолох, түүвэрлэх, онолын регрессийн шугамын тэгшитгэлийг эмхэтгэх чадварыг хөгжүүлэх.

Ажлын агуулга : Туршилтын өгөгдөл дээр үндэслэн түүврийн корреляцийн коэффициентийг тооцоолох, түүнд итгэх итгэлийн интервалыг найдвартайгаар байгуулах, олж авсан үр дүнгийн утгын тайлбар өгөх, эмпирик болон онолын регрессийн шугамыг байгуулах дээр
дээрх угтвар үгийн аргын дагуу.

Корреляцийн арга

Математик статистикийн корреляцийн аргыг ашиглан үзэгдлүүдийн хоорондын хамаарлыг тодорхойлдог. Энэ харилцааг судлах онцлог нь гадны хүчин зүйлийн нөлөөллийг тусгаарлах боломжгүй юм. Тиймээс гадны хүчин зүйлсийн харилцан үйлчлэлийн нарийн төвөгтэй тохиолдолд гадны хүчин зүйлс өөрчлөгдөөгүй, өөрөөр хэлбэл туршилтын нөхцөл хангалттай байсан бол шинж чанаруудын хоорондын хамаарал ямар байхыг тодорхойлохын тулд корреляцийн аргыг ашигладаг. .

Корреляцийн онол нь хоёр асуудлыг авч үздэг.

1) шалгасан шинж чанаруудын хоорондын хамаарлын параметрийг тодорхойлох;

2) энэ холболтын ойр байдлыг тодорхойлох. Онцлог шинж чанаруудын хоорондын харилцааны мөн чанарын тухай
Тэгээд координатын систем дэх цэгүүдийн байршлаар (корреляцийн талбар) шүүгдэж болно. Хэрэв эдгээр цэгүүд шулуун шугамын ойролцоо байрладаг бол нөхцөлт дундажийн хооронд байна гэж үзнэ Тэгээд
шугаман хамаарал байдаг. Тэгшитгэл
дээр
.

Тэгшитгэл
регрессийн шугамын тэгшитгэл гэж нэрлэдэг
дээр . Хэрэв регрессийн шугам хоёулаа шулуун байвал шугаман хамаарал байна.

Регрессийн шугамын тэгшитгэл

Тэгээд
корреляцийн хүснэгтэд өгөгдсөн түүвэр өгөгдөлд үндэслэн эмхэтгэсэн.

- холбогдох шинж чанаруудын дундаж утгууд;

- регрессийн коэффициентүүд дээр
Тэгээд
дээр - томьёо ашиглан тооцоолно

Хаана
- бүтээгдэхүүний дундаж үнэ цэнэ
дээр ;

Тэгээд
- шинж чанарын зөрүү
Тэгээд .

Шулуун шугамын корреляцийн хувьд шинж чанаруудын хоорондын хамаарал нь түүврийн корреляцийн коэффициентээр тодорхойлогддог , энэ нь "-1" -ээс "+1" хүртэлх утгыг авна.

Хэрэв корреляцийн коэффициентийн утга сөрөг байвал энэ нь судалж буй шинж чанаруудын хоорондох урвуу шугаман хамаарлыг илтгэнэ; хэрэв эерэг байвал - шулуун шугаман холболтын тухай. Хэрэв корреляцийн коэффициент 0 бол шинж чанаруудын хооронд шугаман хамаарал байхгүй болно.

Түүврийн корреляцийн коэффициентийг дараахь томъёогоор тооцоолно.

r in
(1)

Хаана - бүтээгдэхүүний дундаж үнэ цэнэ
дээр

Тэгээд - холбогдох шинж чанаруудын дундаж утгууд;

Тэгээд - шинж чанарын стандарт хазайлтыг олно
мөн тэмдгийн хувьд .

АЖЛЫГ ГҮЙЦЭТГЭХ АРГА

Машины арын тэнхлэгийн тосолгооны тосны температурын статистик мэдээллийг өгсөн болно. орчны температураас хамаарна
.

1. ДЭЭЖИЙН КОРРЕЛЯЦИЙН КОЕФФИЦИЕНТИЙН ТООЦОО

Бид эдгээр нөхцлүүдийг корреляцийн хүснэгтэд нэгтгэн дүгнэх болно

Хүснэгт 1.

n y(y шинж чанарын давтамж)

n x (х шинж чанарын давтамж)

Түүврийн тоон шинж чанарыг олцгооё

1.1. X ба Y шинж чанаруудын дундаж утгыг олъё

,

1.2. Түүврийн зөрүүг олцгооё

1513-1281,64=231,36

1.3. Стандарт хазайлтын жишээ

,

,

1.4. Жишээ корреляцийн момент

1/50(40 + 120+720+480+200+800+900+4200+1120+2160+4500+5280+4400+1320+1560) – 497,62=

1/50(27800) – 497,62 = 556 – 497,62 = 58,38

1.5. Түүврийн корреляцийн коэффициент


0,77

2. Үүнийг хийхийн тулд корреляцийн коэффициентийн ач холбогдлыг шалгая, статистикийг шалгая;

=
≈ 8,3

Бид олох болно
Оюутны хуваарилалтын хүснэгтээс (Хавсралт) технологид хамгийн их хэрэглэгддэг ач холбогдлын түвшний дагуу
Тэгээд
Ю– эрх чөлөөний зэрэглэлийн тоо K= n – 2 = 50 – 2 = 48,
2,02

Учир нь
= 8.3 > 2.02, тэгвэл олсон корреляцийн коэффициент тэгээс мэдэгдэхүйц ялгаатай байна. Энэ нь X ба Y хувьсагч нь хэлбэрийн шугаман регрессийн хамаарлаар хамааралтай гэсэн үг юм

Тиймээс корреляцийн коэффициент нь хойд тэнхлэгийн тосолгооны тосны температур ба орчны агаарын температурын хооронд байгаа нягт шугаман хамаарлыг харуулдаг.

3. Эмпирик шугаман регрессийн тэгшитгэл зохиохЮдээрXТэгээдXдээрЮ.

3.1. Х дээрх Y-ийн эмпирик шугаман регрессийн тэгшитгэл.

,

3.2. Х-ийн эмпирик шугаман регрессийн тэгшитгэл onЮ.

,

=35.8+2.34(y-13.9)

4. ЭМПИРИК РЕГРЕССИЙН ШУГАМ БАЙГУУЛАХЮАСААЛТТАЙX.

Эмпирик регрессийн шугамыг бий болгохын тулд 2-р хүснэгтийг зуръя.

Хүснэгт 2

- шинж чанарын утгын нөхцөлт дундаж гэж заасан тодорхой утгыг авдаг, өөрөөр хэлбэл.

;

;

;

Хос тоо авч байна
цэгүүдийн координатын хувьд тэдгээрийг координатын системд байгуулж, шулуун шугамын хэрчмүүдтэй холбоно. Үүссэн эвдэрсэн шугам нь эмпирик регрессийн шугам болно.

Х дээр Ү-ийн онолын шулуун шугамын регрессийн тэгшитгэл нь:

;
, Хаана - шинж чанарын жишээ дундаж ;

- шинж чанарын жишээ дундаж .

;
;
;
;
.

X дээрх Y-ийн шууд регрессийн тэгшитгэлийг дараах байдлаар бичнэ.

эсвэл эцэст нь

Хоёр регрессийн шугамыг хоёуланг нь байгуулъя (Зураг 1)

Цагаан будаа. 1. Эмпирик ба онолын регрессийн шугамууд

цагт
;

5. Шинжилгээний үр дүнд бид утга учиртай тайлбар хийнэ.

Тээврийн хэрэгслийн хойд тэнхлэгийн тосолгооны материалын температур ба орчны агаарын температурын хооронд шууд шугаман хамаарал байдаг ( r В=0.77). Үүнийг 0.95 магадлалаар хэлж болно.

Тэгшитгэл
машины хойд тэнхлэгийн тосолгооны тосны температур нь орчны температураас дунджаар хэрхэн хамаардаг болохыг тодорхойлдог.

Шугаман регрессийн коэффициент (
) хэрэв орчны температур дунджаар 1 градусаар нэмэгдвэл машины хойд тэнхлэгийн тосолгооны тосны температур дунджаар 0.25 градусаар нэмэгдэнэ гэж үздэг.

Тэгшитгэл
тээврийн хэрэгслийн хойд тэнхлэгийн тосолгооны тосны температур нь орчны температураас хэрхэн хамаардаг болохыг тодорхойлдог. Машины хойд тэнхлэгийн тосолгооны тосны температурыг дунджаар 1 градусаар нэмэгдүүлэх шаардлагатай бол орчны агаарын температурыг дунджаар 2.34 градусаар нэмэгдүүлэх шаардлагатай.
)

ГАНЦААРЧИЛСАН ДААЛГАВАР

1. Х-ийн хуваарилалт - үндсэн хөрөнгийн өртөг (сая рубль) ба Y - нэг ажилчинд ногдох сарын дундаж бүтээгдэхүүн.

2. Цилиндр хэлбэрийн дэнлүүний 200 тулгуурын уртыг X (см-ээр), Y жингээр (кг-аар) хуваарилалтыг дараах хүснэгтэд үзүүлэв.

3. 100 пүүсийн үйлдвэрлэлийн X (мөнгөний нэгжээр) болон өдөр тутмын Y бүтээгдэхүүнээр (тонноор) хуваарилалтыг дараах хүснэгтэд үзүүлэв.

Олон тооны туршилтын үед ижил X утга нь nx удаа, ижил утгатай Y нь ny удаа, ижил хос тоо (x; y) nxy удаа тохиолдож болно.

ихэвчлэн дээжийн хэмжээ.

Тиймээс ажиглалтын өгөгдлийг бүлэглэсэн, өөрөөр хэлбэл, nx, ny, nxy тооцоолсон. Бүлэглэсэн бүх өгөгдлийг хүснэгт хэлбэрээр бүртгэдэг бөгөөд үүнийг корреляцийн хүснэгт гэж нэрлэдэг.

Хэрэв X дээрх Y ба Х дээрх Y регрессийн шугам хоёулаа шулуун байвал хамаарал нь шугаман байна.

X дээрх Y шулуун регрессийн шугамын жишээ тэгшитгэл нь дараах хэлбэртэй байна.

Хамгийн бага квадратын аргаар тодорхойлогддог pyx ба B параметрүүд нь дараах хэлбэртэй байна.

энд yx бол нөхцөлт дундаж; XВ ба Ув нь X ба Y шинж чанарын түүврийн дундаж; -x ба -y нь түүврийн стандарт хазайлт; gV нь түүврийн корреляцийн коэффициент юм.

X-ийн Y дээр шулуун шугамын регрессийн жишээ тэгшитгэл нь дараах хэлбэртэй байна.

X ба Y шинж чанаруудын талаархи ажиглалтын өгөгдлийг ижил зайтай сонголт бүхий корреляцийн хүснэгт хэлбэрээр өгсөн гэж бид таамаглаж байна.

Дараа нь бид нөхцөлт сонголтууд руу шилжинэ.

Энд C1 нь хамгийн их давтамжтай X шинж чанарын хувилбар юм; C 2 - хамгийн өндөр давтамжтай Y шинж тэмдгийн хувилбар; h1 - алхам (хоёр зэргэлдээх сонголтуудын ялгаа X); h2 - алхам (хоёр зэргэлдээх сонголтуудын ялгаа Y).

Дараа нь түүврийн корреляцийн коэффициент

u, v, su, sv хэмжигдэхүүнийг бүтээгдэхүүний аргаар эсвэл шууд томъёог ашиглан олж болно

Эдгээр хэмжигдэхүүнүүдийг мэдсэнээр бид регрессийн тэгшитгэлд багтсан параметрүүдийг томъёог ашиглан олох болно

6-Р БҮЛЭГ ДАХЬ ЖИШИГ ШАЛГАЛТЫН АЖИЛ. 12.1. Санамсаргүй үйл явдлууд

12.1. Санамсаргүй үйл явдлууд

12.1.1. Хайрцагт 6 ижил хос хар бээлий, 4 ижил хос шаргал бээлий байна. Санамсаргүй байдлаар татсан хоёр бээлий хос болох магадлалыг ол.

А үйл явдлыг авч үзье - санамсаргүй байдлаар зурсан хоёр бээлий хосыг үүсгэдэг; болон таамаглалууд: B1 - хос хар бээлий гаргаж авсан, В2 - шаргал хос бээлий гаргаж авсан, B3 - гаргаж авсан бээлий нь хос үүсгэдэггүй.

Үржүүлэх теоремоор B1 таамаглалын магадлал нь эхний бээлий нь хар, хоёр дахь бээлий нь хар байх магадлалын үржвэртэй тэнцүү байна.

Үүний нэгэн адил Bi таамаглалын магадлал нь:

B1, B2, B3 таамаглалууд нь үйл явдлын бүрэн бүлгийг бүрдүүлдэг тул B3 таамаглалын магадлал дараах байдалтай тэнцүү байна.

Нийт магадлалын томъёоны дагуу бид дараах байдалтай байна.

Энд Pb (A) нь хосыг хоёр хар бээлий үүсгэх магадлал ба Pb1 (A) = 1; pB1 (A) нь хоёр шаргал бээлий нь хос үүсгэх магадлал бөгөөд Pb2 (A) = 1; эцэст нь РВз(А) - өөр өөр өнгийн бээлийтэй хосыг үүсгэх магадлал.

Тиймээс санамсаргүй байдлаар татсан хоёр бээлий хос үүсгэх магадлал нь тэнцүү байна

12.1.2. Урд нь 3 цагаан, 5 хар бөмбөлөгтэй. 3 бөмбөгийг нэг нэгээр нь санамсаргүй байдлаар зурж, олборлох бүрийн дараа тэдгээрийг саванд буцаана. Татсан бөмбөгнүүдийн дунд дараахь байх магадлалыг ол.

a) яг хоёр цагаан бөмбөг, б) дор хаяж хоёр цагаан бөмбөг.

Шийдэл. Бидэнд буцах схем байдаг, өөрөөр хэлбэл бөмбөгний найрлага өөрчлөгдөхгүй байх бүрт:

a) гурван бөмбөг зурахад хоёр нь цагаан, нэг нь хар өнгөтэй байх ёстой. Энэ тохиолдолд хар нь эхний, хоёр, гурав дахь байж болно. Магадлалыг нэмэх ба үржүүлэх теоремуудыг хамтад нь ашигласнаар бид дараах байдалтай байна.

б) дор хаяж хоёр цагаан бөмбөг гаргавал хоёр эсвэл гурван цагаан бөмбөг байх ёстой гэсэн үг:

12.1.3. Уг саванд 6 цагаан, 5 хар бөмбөлөг байдаг. Гурван бөмбөгийг саванд буцааж өгөхгүйгээр дараалан санамсаргүй байдлаар зурдаг. Гурав дахь бөмбөг цагаан өнгөтэй байх магадлалыг ол.

Шийдэл. Гурав дахь бөмбөг нь цагаан байх ёстой бол эхний хоёр бөмбөг нь цагаан, цагаан, хар, хар ба цагаан, хар байж болно, өөрөөр хэлбэл, дөрвөн бүлэг бус байж болно.

хамтарсан арга хэмжээ. Тэдэнд магадлалын үржүүлэх теоремыг ашигласнаар бид дараахь зүйлийг олж авна.

P = P1(5 . P2(5 . P3(5 + (P1(5 . P2ch. P3(5 + P14 . P2(5 . P3(5) + P1ch. P2ch. P3(5 =)

A A 4 A A 5 A A 5 A A A 6=540 = A

P. 10. 9 + I. 10. 9 + I. 10. 9 + I. 10. 9 = 990 = IT

Регресс гэж юу вэ?

Хоёр тасралтгүй хувьсагчийг авч үзье x=(x 1 , x 2 , .., x n), y=(y 1 , y 2 , ..., y n).

Хоёр хэмжээст тархалтын график дээр цэгүүдийг байрлуулж, бидэнд байгаа гэж хэлье шугаман хамаарал, хэрэв өгөгдлийг шулуун шугамаар ойролцоолсон бол.

Хэрэв бид үүнд итгэдэг бол y-аас хамаарна x, өөрчлөлтүүд y-ийн өөрчлөлтөөс болж үүсдэг x, бид регрессийн шугамыг тодорхойлж болно (регресс yдээр x), эдгээр хоёр хувьсагчийн хоорондох шугаман хамаарлыг хамгийн сайн тодорхойлдог.

Регресс гэдэг үгийн статистик хэрэглээ нь Сэр Фрэнсис Гальтон (1889)-ийн тайлбарласан дундаж утга руу регресс гэж нэрлэгддэг үзэгдлээс үүдэлтэй.

Хэдийгээр өндөр аавууд өндөр хүүтэй байдаг ч хөвгүүдийн дундаж өндөр нь өндөр аавынхаас намхан байдгийг тэрээр харуулсан. Хөвгүүдийн дундаж өндөр нь хүн амын дундах бүх эцгийн дундаж өндөр рүү "буцаж", "учирсан". Тиймээс дунджаар өндөр аавууд намхан (гэхдээ нэлээд өндөр) хүүтэй, намхан аавууд өндөр (гэхдээ нэлээд намхан) хүүтэй байдаг.

Регрессийн шугам

Энгийн (хосоор) шугаман регрессийн шугамыг тооцоолох математикийн тэгшитгэл:

xбие даасан хувьсагч эсвэл урьдчилан таамаглагч гэж нэрлэдэг.

Ю- хамааралтай хувьсагч эсвэл хариултын хувьсагч. Энэ бол бидний хүлээж буй үнэ цэнэ юм y(дунджаар) хэрэв бид үнэ цэнийг мэддэг бол x, өөрөөр хэлбэл нь "урьдчилан таамагласан үнэ цэнэ" y»

  • а- үнэлгээний шугамын чөлөөт гишүүн (уулзвар); энэ бол утга учир юм Ю, Хэзээ x=0(Зураг 1).
  • б- тооцоолсон шугамын налуу буюу налуу; энэ нь хэмжээг илэрхийлнэ Юнэмэгдүүлбэл дунджаар нэмэгдэнэ xнэг нэгжийн хувьд.
  • аТэгээд бТооцоолсон шугамын регрессийн коэффициент гэж нэрлэдэг боловч энэ нэр томъёог зөвхөн ашигладаг б.

Хос шугаман регресс нь нэгээс олон бие даасан хувьсагчийг багтаах боломжтой; энэ тохиолдолд гэж нэрлэдэг олон регресс.

Зураг 1. a огтлолцол ба налуу b-ийг харуулсан шугаман регрессийн шугам (х нэг нэгжээр нэмэгдэхэд Y хэмжээ нэмэгдэнэ)

Хамгийн бага квадратын арга

Бид ажиглалтын түүврийг ашиглан регрессийн шинжилгээ хийдэг аТэгээд б- популяци дахь шугаман регрессийн шугамыг тодорхойлдог α ба β гэсэн үнэн (ерөнхий) параметрүүдийн түүврийн тооцоо.

Коэффициентийг тодорхойлох хамгийн энгийн арга аТэгээд ббайна хамгийн бага квадратын арга(MNC).

Тохиромжийг үлдэгдэл (шугамаас цэг бүрийн босоо зай, жишээ нь үлдэгдэл = ажиглагдсан) харах замаар үнэлдэг. y- урьдчилан таамагласан y, будаа. 2).

Үлдэгдэл квадратуудын нийлбэр хамгийн бага байхаар хамгийн сайн тохирох шугамыг сонгосон.

Цагаан будаа. 2. Цэг бүрийн хувьд үлдэгдэл дүрслэгдсэн (босоо тасархай шугам) шугаман регрессийн шугам.

Шугаман регрессийн таамаглал

Тиймээс, ажиглагдсан утга бүрийн хувьд үлдэгдэл нь зөрүүтэй тэнцүү бөгөөд үлдэгдэл бүр нь эерэг эсвэл сөрөг байж болно.

Та шугаман регрессийн цаана байгаа дараах таамаглалуудыг шалгахын тулд үлдэгдлийг ашиглаж болно.

  • Үлдэгдэл нь ихэвчлэн тэг дунджаар тархсан;

Хэрэв шугаман байдал, хэвийн байдал ба/эсвэл тогтмол дисперсийн таамаглал эргэлзээтэй байвал бид эдгээр таамаглалыг хангасан шинэ регрессийн шугамыг хувиргаж эсвэл тооцоолж болно (жишээлбэл, логарифмын хувиргалт ашиглах гэх мэт).

Аномаль утгууд (хачирхалтай) ба нөлөөллийн цэгүүд

"Нөлөөтэй" ажиглалт нь орхигдуулсан тохиолдолд нэг буюу хэд хэдэн загварын параметрийн тооцоог өөрчилдөг (өөрөөр хэлбэл налуу эсвэл огтлолцол).

Хэт хэтийн үзүүлэлт (өгөгдлийн багц дахь ихэнх утгуудтай нийцэхгүй байгаа ажиглалт) нь "нөлөөтэй" ажиглалт байж болох бөгөөд хоёр хувьсах тархалтын график эсвэл үлдэгдэл графикийг шалгах замаар хялбархан илрүүлж болно.

Гадны болон "нөлөөлөх" ажиглалтын (цэг) аль алинд нь загваруудыг оруулаагүй, оруулалгүйгээр ашигладаг бөгөөд тооцооллын өөрчлөлтөд (регрессийн коэффициент) анхаарлаа хандуулдаг.

Шинжилгээ хийхдээ та үл тоомсорлох нь олж авсан үр дүнд нөлөөлж болзошгүй тул хэт давсан үзүүлэлт эсвэл нөлөөллийн цэгүүдийг автоматаар хаяж болохгүй. Эдгээр гажуудлын шалтгааныг үргэлж судалж, дүн шинжилгээ хий.

Шугаман регрессийн таамаглал

Шугаман регрессийг байгуулахдаа регрессийн шугамын ерөнхий налуу β тэгтэй тэнцүү гэсэн тэг таамаглалыг шалгана.

Хэрэв шугамын налуу нь тэг байвал ба хоёрын хооронд шугаман хамаарал байхгүй: өөрчлөлт нь нөлөөлөхгүй

Жинхэнэ налуу нь тэг гэсэн тэг таамаглалыг шалгахын тулд та дараах алгоритмыг ашиглаж болно.

Коэффициентийн стандарт алдаа нь эрх чөлөөний зэрэгтэй тархалтад хамаарах харьцаатай тэнцүү туршилтын статистикийг тооцоол.


,

- үлдэгдлийн тархалтыг тооцоолох.

Ихэвчлэн ач холбогдлын түвшинд хүрсэн тохиолдолд тэг таамаглалыг үгүйсгэдэг.


Хоёр талт туршилтын магадлалыг өгдөг эрх чөлөөний зэрэгтэй хуваарилалтын хувь хаана байна

Энэ нь 95% магадлалтай ерөнхий налууг агуулсан интервал юм.

Том түүврийн хувьд бид ойролцоогоор 1.96 утгатай байж болно (өөрөөр хэлбэл туршилтын статистик нь хэвийн тархсан байх болно)

Шугаман регрессийн чанарыг үнэлэх: тодорхойлох коэффициент R 2

Шугаман харилцаанаас болоод бид энэ нь өөрчлөгдөнө гэж найдаж байна , мөн үүнийг регрессээс үүдэлтэй эсвэл тайлбарласан өөрчлөлт гэж нэрлэнэ. Үлдэгдэл өөрчлөлт нь аль болох бага байх ёстой.

Хэрэв энэ нь үнэн бол ихэнх өөрчлөлтийг регрессээр тайлбарлах бөгөөд цэгүүд нь регрессийн шугамд ойрхон байх болно, өөрөөр хэлбэл. мөр нь өгөгдөлд сайн тохирч байна.

Регрессээр тайлбарлагдах нийт дисперсийн эзлэх хувийг нэрлэнэ тодорхойлох коэффициент, ихэвчлэн хувиар илэрхийлж, тэмдэглэнэ R 2(хосолсон шугаман регрессийн хувьд энэ нь хэмжигдэхүүн юм r 2, корреляцийн коэффициентийн квадрат) нь регрессийн тэгшитгэлийн чанарыг субъектив байдлаар үнэлэх боломжийг олгодог.

Энэ ялгаа нь регрессээр тайлбарлах боломжгүй дисперсийн хувийг илэрхийлнэ.

Регрессийн шугамын тохирох байдлыг тодорхойлохын тулд бид субьектив дүгнэлтэд найдах ёстой.

Урьдчилан таамаглахад регрессийн шугамыг ашиглах

Та регрессийн шугамыг ашиглан ажиглалтын хязгаарын төгсгөлд байгаа утгын утгыг таамаглах боломжтой (эдгээр хязгаараас хэтрүүлэн бүү гарга).

Бид тухайн утгыг регрессийн шугамын тэгшитгэлд залгах замаар тодорхой утгатай ажиглалтын дундажийг таамагладаг.

Тиймээс, хэрэв бид урьдчилан таамаглах юм бол энэ таамагласан утга болон түүний стандарт алдааг ашиглан жинхэнэ популяцийн дундаж утгын итгэлцлийн интервалыг тооцоол.

Өөр өөр утгуудын хувьд энэ процедурыг давтах нь энэ шугамын итгэлийн хязгаарыг бий болгох боломжийг танд олгоно. Энэ нь жишээлбэл 95% итгэлийн түвшинд үнэн шугамыг агуулсан хамтлаг эсвэл хэсэг юм.

Энгийн регрессийн төлөвлөгөө

Энгийн регрессийн загвар нь нэг тасралтгүй таамаглагчийг агуулна. Хэрэв 7, 4, 9 гэх мэт таамаглагч P утгатай 3 ажиглалт байгаа бөгөөд дизайн нь эхний дарааллын P эффектийг агуулж байвал дизайны матриц X болно.

X1-ийн P-г ашиглан регрессийн тэгшитгэл нь байна

Y = b0 + b1 P

Хэрэв энгийн регрессийн загвар нь квадрат эффект гэх мэт P дээр илүү өндөр эрэмбийн нөлөөг агуулж байвал дизайны матриц дахь X1 баганын утгууд хоёр дахь зэрэгт нэмэгдэнэ.

тэгшитгэл нь хэлбэрийг авна

Y = b0 + b1 P2

Сигма-хязгаарлагдмал болон хэт параметртэй кодлох аргууд нь энгийн регрессийн загварууд болон зөвхөн тасралтгүй таамаглагчдыг агуулсан бусад загварт хамаарахгүй (учир нь ангилсан таамаглагч байдаггүй). Сонгосон кодчилолын аргаас үл хамааран тасралтгүй хувьсагчдын утгыг зохих ёсоор нэмэгдүүлж, X хувьсагчийн утга болгон ашигладаг. Энэ тохиолдолд дахин кодчилол хийхгүй. Нэмж дурдахад, регрессийн төлөвлөгөөг тайлбарлахдаа дизайны X матрицыг авч үзэхгүй байж, зөвхөн регрессийн тэгшитгэлтэй ажиллах боломжтой.

Жишээ нь: Энгийн регрессийн шинжилгээ

Энэ жишээнд хүснэгтэд үзүүлсэн өгөгдлийг ашигласан болно:

Цагаан будаа. 3. Анхны өгөгдлийн хүснэгт.

Санамсаргүй байдлаар сонгогдсон 30 мужийн 1960 ба 1970 оны хүн амын тооллогыг харьцуулан цуглуулсан мэдээлэл. Нутгийн нэрсийг ажиглалтын нэрээр танилцуулсан. Хувьсагч бүрийн талаарх мэдээллийг доор харуулав.

Цагаан будаа. 4. Хувьсах үзүүлэлтүүдийн хүснэгт.

Судалгааны асуудал

Энэ жишээний хувьд ядуурлын түвшин болон ядуурлын шугамаас доогуур байгаа гэр бүлийн хувь хэмжээг урьдчилан таамаглах зэрэг хоорондын хамааралд дүн шинжилгээ хийх болно. Тиймээс бид 3 (Pt_Poor) хувьсагчийг хамааралтай хувьсагч гэж үзнэ.

Бид таамаглал дэвшүүлж болно: хүн амын тоо, ядуурлын шугамаас доогуур байгаа гэр бүлийн эзлэх хувь нь хоорондоо холбоотой байдаг. Ядуурал нь гадагш чиглэсэн шилжилт хөдөлгөөнд хүргэдэг гэж үзэх нь үндэслэлтэй юм шиг санагддаг, тиймээс ядуурлын шугамаас доогуур хүмүүсийн хувь болон хүн амын өөрчлөлтийн хооронд сөрөг хамаарал байх болно. Тиймээс бид 1 (Pop_Chng) хувьсагчийг урьдчилан таамаглах хувьсагч гэж үзэх болно.

Үр дүнг харах

Регрессийн коэффициентүүд

Цагаан будаа. 5. Pop_Chng дээрх Pt_Poor-ийн регрессийн коэффициентүүд.

Pop_Chng мөр ба Парам баганын огтлолцол дээр.<.05 . Обратите внимание на не стандартизованный коэффициент, который также является коэффициентом корреляции Пирсона для простых регрессионных планов, равен -.65, который означает, что для каждого уменьшения стандартного отклонения численности населения происходит увеличение стандартного отклонения уровня бедности на.65.

Pop_Chng дээрх Pt_Poor-ийн регрессийн стандарт бус коэффициент нь -0.40374. Энэ нь хүн амын нэг нэгж буурах тутамд ядуурлын түвшин .40374 болж нэмэгддэг гэсэн үг. Энэхүү стандарт бус коэффициентийн дээд ба доод (анхдагч) 95%-ийн итгэлийн хязгаарт тэгийг оруулаагүй тул регрессийн коэффициент нь p түвшинд чухал ач холбогдолтой.

Өгөгдөлд хэт их хэтийн үзүүлэлтүүд байгаа тохиолдолд корреляцийн коэффициентүүд мэдэгдэхүйц хэт үнэлэгдсэн эсвэл дутуу үнэлэгдэж болно. Pt_Poor хамааралтай хувьсагчийг дүүрэг тус бүрээр нь судалж үзье. Үүний тулд Pt_Poor хувьсагчийн гистограммыг байгуулъя.

Цагаан будаа. 6. Pt_Poor хувьсагчийн гистограмм.

Таны харж байгаагаар энэ хувьсагчийн тархалт нь ердийн тархалтаас эрс ялгаатай байна. Гэсэн хэдий ч хоёр мужид (баруун хоёр багана) ядуурлын шугамаас доогуур байгаа гэр бүлүүдийн хувь хэвийн тархалтаас доогуур байгаа хэдий ч тэд "хамгийн хүрээнд" байгаа бололтой.

Цагаан будаа. 7. Pt_Poor хувьсагчийн гистограмм.

Энэ дүгнэлт нь зарим талаараа субъектив юм. Үндсэн дүрэм бол ажиглалт (эсвэл ажиглалт) нь интервалд (стандарт хазайлтаас ± 3 дахин их) багтахгүй бол хэт давсан үзүүлэлтүүдийг харгалзан үзэх ёстой. Энэ тохиолдолд хүн амын гишүүдийн хоорондын хамааралд томоохон нөлөө үзүүлэхгүй байхын тулд хэт давтагдах болон үл хамаарах шинжилгээг давтан хийх нь зүйтэй.

Тархалтын график

Хэрэв таамаглалуудын аль нэг нь өгөгдсөн хувьсагчдын хоорондын хамаарлын талаархи априори бол түүнийг харгалзах тархалтын график дээр турших нь зүйтэй.

Цагаан будаа. 8. Тархалтын диаграм.

Тархалтын график нь хоёр хувьсагчийн хооронд тодорхой сөрөг хамаарлыг (-.65) харуулж байна. Энэ нь мөн регрессийн шугамын 95% итгэх интервалыг харуулж байна, өөрөөр хэлбэл регрессийн шугам нь хоёр тасархай муруйны хооронд байх магадлал 95% байна.

Ач холбогдолын шалгуур

Цагаан будаа. 9. Ач холбогдолын шалгуурыг агуулсан хүснэгт.

Pop_Chng регрессийн коэффициентийн тест нь Pop_Chng нь Pt_Poor, p -тэй хүчтэй холбоотой болохыг баталж байна.<.001 .

Доод шугам

Энэ жишээ нь энгийн регрессийн загварыг хэрхэн шинжлэхийг харуулсан. Стандарт бус болон стандартчилагдсан регрессийн коэффициентүүдийн тайлбарыг мөн танилцуулав. Хамаарах хувьсагчийн хариуны тархалтыг судлахын ач холбогдлын талаар ярилцаж, урьдчилан таамаглагч болон хамааралтай хувьсагчийн хоорондын хамаарлын чиглэл, хүчийг тодорхойлох аргачлалыг үзүүлэв.

Арга зүйн маягтын нүүр хуудас

Бүгд Найрамдах Казахстан Улсын Боловсрол, шинжлэх ухааны яам

«

UMC-ийн дарга _______________ « ___"___________20__

БАТАЛСАН:

OPiMOUP-ийн дарга _________________ « ___"___________20__

Их сургуулийн сургалт, арга зүйн зөвлөлөөр баталсан

« ___"___________20 __ Протоколын дугаар____

Сэдвийг судлахдаа "Магадлалын онол ба математикийн статистикийн мэдээлэл”, статистикийн мэдээллийг танилцуулах, боловсруулах аргуудад онцгой анхаарал хандуулах хэрэгтэй. Онолын болон сонгомол шинж чанарууд. Таамаглалыг шалгах ерөнхий схем. 1 ба 2-р төрлийн алдаа. Цэг ба интервалын тооцоо. Тооцооллын статистик шинж чанарууд. Хоёр санамсаргүй хэмжигдэхүүний хамаарлын шинжилгээ.

Сэдэв. Хамгийн бага квадратын арга.

h1, h2 - алхамууд, өөрөөр хэлбэл хоёр хөршийн сонголтуудын ялгаа.

Энэ тохиолдолд түүврийн корреляцийн коэффициент

,

Түүнчлэн, энэ нэр томъёо нь 1-р хүснэгтийг ашиглан тооцоолоход тохиромжтой.

Томьёог ашиглан утгыг олж болно

Урвуу шилжилтийн хувьд илэрхийллийг ашиглана

ЖишээКорреляцийн хүснэгтэд үндэслэн X дээрх Y-ийн шугаман регрессийн түүврийн тэгшитгэлийг ол.

Шийдэл.Тооцооллыг хялбарчлахын тулд томъёог ашиглан тооцоолсон нөхцөлт сонголтууд руу шилжье.

,

болон нөхцөлт сонголттой хувирсан корреляцийн хүснэгтийг үүсгэнэ

Дараа нь бид дүүргэсэн нүдний баруун дээд буланд, зүүн доод буланд тооцоолсон утгуудыг оруулах шинэ хүснэгт зохиож, дараа нь утгуудыг авахын тулд эгнээний дээд утгуудыг нэгтгэнэ. ​Vj ба Ui-ийн багануудын доод утгуудыг бичиж, утгуудыг тооцоолно.

vjVj

Хоёр санамсаргүй хэмжигдэхүүн нь функциональ хамаарлаар эсвэл статистик хамааралтай эсвэл бие даасан байж болно. Хоёр хэмжигдэхүүний аль аль нь эсвэл аль нэг нь санамсаргүй хүчин зүйлийн нөлөөнд автдаг тул функциональ хатуу хамаарал нь ховор тохиолддог. Түүнээс гадна, эдгээр хүчин зүйлсийн дунд хоёуланд нь нийтлэг зүйл байж болно, жишээлбэл. санамсаргүй хэмжигдэхүүнд хоёуланд нь нөлөөлж байна. Эдгээр тохиолдолд статистикийн хамаарал үүсдэг.

Статистикхэмжигдэхүүнүүдийн аль нэг нь өөрчлөгдөхөд нөгөөгийнх нь тархалт өөрчлөгддөг хамаарал юм. Ялангуяа нэг хэмжигдэхүүн өөрчлөгдөхөд нөгөөгийнхөө дундаж утгыг өөрчлөхөд хүргэдэг. Энэ тохиолдолд статистикийн хамаарал гэж нэрлэдэг хамаарал.Жишээлбэл, бордооны хэмжээ ба ургацын хоорондын хамаарал, оруулсан хөрөнгө, ашиг.

X=x утгад харгалзах санамсаргүй хэмжигдэхүүний Y-ийн ажиглагдсан утгуудын арифметик дундажийг гэнэ. нөхцөлт дундаж xбөгөөд энэ нь математикийн хүлээлтийн цэгийн тооцоо юм . Нөхцөлт дундаж y-ийг ижил төстэй байдлаар тодорхойлно.

Нөхцөлт математикийн хүлээлт M(Y|x)-ийн функц юм x,тиймээс түүний үнэлгээ, i.e. нөхцөлт дундаж x,мөн x-ийн функц:

x = f*(x).

Энэ тэгшитгэл гэж нэрлэдэг X дээрх Y-ийн регрессийн тэгшитгэлийн жишээ. Чиг үүрэг f*(x)дуудсан түүвэр регресс, түүний график нь байна X дээрх Y-ийн регрессийн шугамын жишээ.Үүний нэгэн адил, Eq.

Ю = φ * (y),

функц φ * (y)мөн түүний хуваарь гэж нэрлэдэг түүврийн регрессийн тэгшитгэл, түүврийн регресс ба Y дээр X-ийн түүврийн регрессийн шугам.

Функцийн параметрүүдийг олох f*(x)Тэгээд φ * (y), хэрэв тэдгээрийн төрөл нь мэдэгдэж байгаа бол X ба Y хэмжигдэхүүний хоорондын хамаарлын ойролцоо байдлыг үнэлэх нь асуудал юм корреляцийн шинжилгээ.Регрессийн шинжилгээний даалгавар нь регрессийн функц β i болон үлдэгдэл дисперс σ ost 2-ын параметрүүдийг тооцоолох явдал юм.

Үлдэгдэл дисперс гэдэг нь X-ийн үйлдлээр тайлбарлах боломжгүй дисперсийн Y-ийн хэсэг юм. σ үлдэгдэл 2 нь регрессийн функцийн сонголтын үнэн зөв, шинжилгээнд орсон шинж чанаруудын бүрэн байдлыг үнэлэхэд үйлчилдэг. Хамаарлын төрлийг g(x) корреляцийн талбар болон үйл явцын шинж чанарт үндэслэн сонгоно.



Шугаман регрессийн коэффициент β-ийн тооцоо нь X r yx дээрх Y-ийн регрессийн түүврийн коэффициент. Параметрийн утга r yxба параметр бшулуун шугамын регрессийн тэгшитгэл

Y = r yx x + b

xOy хавтгай дээрх ажиглалтын өгөгдлөөр бүтээгдсэн (x 1 ,y 1), (x 2,y 2),…,(x n ,y n) цэгүүд шулуунтай аль болох ойрхон байхаар сонгосон. регрессийн шугам. Энэ нь y i-ээс Y(x i) функцийн квадрат хазайлтын нийлбэр хамгийн бага байх шаардлагатай тэнцэнэ. Энэ бол МҮК-ийн мөн чанар юм.

X дээрх Y-ийн шулуун регрессийн шугамын жишээ тэгшитгэлийг дараах байдлаар бичиж болно.

x -= r in s y /s x (x –) ) ,

Энд s x ба s y нь X ба Y-ийн стандарт хазайлт ба

r-д =

бүлэглэсэн өгөгдлөөр тооцсон түүврийн корреляцийн коэффициент. Энд n xy нь хос (x,y) хувилбарын давтамж юм. Үүний нэгэн адил, Y дээрх X шулуун регрессийн шугамын түүврийн тэгшитгэлийг ол.

Y – = r in s x /s y (y –)

Түүвэрт олдсон Y ба X хоорондын хамаарлын математик загвар нь статистик мэдээлэлтэй тохирч байгаа эсэхийг тодорхойлохын тулд регрессийн коэффициентүүдийн ач холбогдол, регрессийн тэгшитгэлийн ач холбогдлыг үнэлэх хэрэгтэй.

Регрессийн коэффициентийн ач холбогдлыг шалгах нь регрессийн коэффициент тэгээс ялгаатай гэсэн үндэслэлтэй дүгнэлтийг батлахад тооцооллын хэмжээ хангалттай эсэхийг тодорхойлох явдал юм. H 0 таамаглал дэвшүүлсэн: регрессийн коэффициент нь тэгтэй тэнцүү β =0. H0 таамаглалыг Оюутны хуулийн дагуу тараасан статистик мэдээллийг ашиглан шалгадаг

t = │b / s b │

Хаана бнь регрессийн коэффициентийн тооцоо бөгөөд s b– түүний стандарт хазайлтын тооцоо, өөрөөр хэлбэл тооцооллын стандарт алдаа. Хэрэв │t │≥ t cr (α, k) бол регрессийн коэффициент тэгтэй тэнцүү гэсэн тэг таамаглалыг үгүйсгэж, коэффициентийг чухал гэж үзнэ. │t │ цагт< t кр нет оснований отвергать нулевую гипотезу.



Танд нийтлэл таалагдсан уу? Найзуудтайгаа хуваалцаарай!