Олон тооны r. Майкрософт програм хангамжийн багц нь эконометрик шинжилгээний үр дүнтэй хэрэгсэл юм


  1. Баригдсан загварын чанарыг үнэлэх. Нэг хүчин зүйлийн загвартай харьцуулахад загварын чанар сайжирсан уу? Уян хатан байдлын коэффициент, - ба -коэффицент ашиглан үр дүнд чухал хүчин зүйлсийн нөлөөллийг үнэлнэ.
Сонгосон олон загварын (6) чанарыг үнэлэхийн тулд энэ асуудлын 1.4-т заасны дагуу бид тодорхойлох коэффициентийг ашиглана. Р- квадрат, дундаж харьцангуй ойролцоо алдаа ба Ф- Фишерийн шалгуур.

Тодорхойлох коэффициент Р-квадратыг “Регресс”-ийн үр дүнгээс авна (загварын “Регрессийн статистик” хүснэгт (6)).

Үүний үр дүнд орон сууцны үнийн өөрчлөлт (өөрчлөлт). ЮЭнэ тэгшитгэлийн дагуу 76.77% -ийг тухайн бүс нутгийн хотын өөрчлөлтөөр тайлбарлав. X 1 , орон сууцны өрөөний тоо X 2 болон амьдрах орон зай X 4 .

Бид анхны өгөгдлийг ашигладаг Ю биболон Регрессийн хэрэглүүрийн олсон үлдэгдэл (загвар (6)-ын "Үлдэгдэлийн гаралт" хүснэгт). Харьцангуй алдааг тооцоод дундаж утгыг олъё
.

Үлдсэнийг нь эргүүлэн татах


Ажиглалт

Таамагласан Y

Үлдэгдэл

Rel. алдаа

1

45,95089273

-7,95089273

20,92340192

2

86,10296493

-23,90296493

38,42920407

3

94,84442678

30,15557322

24,12445858

4

84,17648426

-23,07648426

37,76838667

5

40,2537216

26,7462784

39,91981851

6

68,70572376

24,29427624

26,12287768

7

143,7464899

-25,7464899

21,81905923

8

106,0907598

25,90924022

19,62821228

9

135,357993

-42,85799303

46,33296544

10

114,4792566

-9,47925665

9,027863476

11

41,48765602

0,512343975

1,219866607

12

103,2329236

21,76707636

17,41366109

13

130,3567798

39,64322022

23,3195413

14

35,41901876

2,580981242

6,7920559

15

155,4129693

-24,91296925

19,0903979

16

84,32108188

0,678918123

0,798727204

17

98,0552279

-0,055227902

0,056355002

18

144,2104618

-16,21046182

12,66442329

19

122,8677535

-37,86775351

44,55029825

20

100,0221225

59,97787748

37,48617343

21

53,27196558

6,728034423

11,21339071

22

35,06605378

5,933946225

14,47303957

23

114,4792566

-24,47925665

27,19917406

24

113,1343153

-30,13431529

36,30640396

25

40,43190991

4,568090093

10,15131132

26

39,34427892

-0,344278918

0,882766457

27

144,4794501

-57,57945009

66,25943623

28

56,4827667

-16,4827667

41,20691675

29

95,38240332

-15,38240332

19,22800415

30

228,6988826

-1,698882564

0,748406416

31

222,8067278

12,19327221

5,188626473

32

38,81483144

1,185168555

2,962921389

33

48,36325811

18,63674189

27,81603267

34

126,6080021

-3,608002113

2,933335051

35

84,85052935

15,14947065

15,14947065

36

116,7991162

-11,79911625

11,23725357

37

84,17648426

-13,87648426

19,73895342

38

113,9412801

-31,94128011

38,95278062

39

215,494184

64,50581599

23,03779142

40

141,7795953

58,22040472

29,11020236

Дундаж

101,2375

22,51770962

Харьцангуй алдааны баганыг ашиглан бид дундаж утгыг олно =22.51% (дундаж функцийг ашиглан).

Харьцуулснаар 22.51%>7% байна. Тиймээс загварын нарийвчлал хангалтгүй байна.

Ашиглах замаар Ф - Фишерийн шалгуур Загварын ач холбогдлыг бүхэлд нь шалгаж үзье. Үүнийг хийхийн тулд бид "Регресс" хэрэглүүрийг ашигласан үр дүнгээс бичих болно (загвар (6) -д зориулсан "варианцийн шинжилгээ" хүснэгт) Ф= 39,6702.

FRIST функцийг ашиглан бид утгыг олно Ф кр =3.252 ач холбогдлын түвшний хувьд α = 5%, болон эрх чөлөөний зэрэглэлийн тоо к 1 = 2 , к 2 = 37 .

Ф> Ф кр, тиймээс (6) загварын тэгшитгэл нь чухал, түүнийг ашиглах нь зүйтэй, хамааралтай хувьсагч ЮЗагвар (6)-д багтсан хүчин зүйлийн хувьсагчдаар нэлээд сайн тодорхойлсон. X 1 , X 2. Тэгээд X 4 .

Нэмэлт ашиглана т -Оюутны шалгалт Загварын хувийн коэффициентүүдийн ач холбогдлыг шалгацгаая.

т–“Регресс” хэрэглүүрийн үр дүнд регрессийн тэгшитгэлийн коэффициентүүдийн статистикийг өгсөн болно. Сонгосон загварт дараах утгыг авсан (6):


Магадлал

Стандарт алдаа

t-статистик

P-утга

Доод 95%

Шилдэг 95%

Доод 95.0%

Шилдэг 95.0%

Y уулзвар

-5,643572321

12,07285417

-0,46745966

0,642988

-30,1285

18,84131

-30,1285

18,84131

X4

2,591405557

0,461440597

5,61590284

2.27E-06

1,655561

3,52725

1,655561

3,52725

X1

6,85963077

9,185748512

0,74676884

0,460053

-11,7699

25,48919

-11,7699

25,48919

X2

-1,985156991

7,795346067

-0,25465925

0,800435

-17,7949

13,82454

-17,7949

13,82454

Чухал үнэ цэнэ т крач холбогдлын түвшингээр олсон α=5%болон эрх чөлөөний зэрэглэлийн тоо к=40–2–1=37 . т кр =2.026 (STUDAR функц).

Үнэгүй боломжийн хувьд α =–5.643 статистикийг тодорхойлсон
, т крТиймээс чөлөөт коэффициент нь ач холбогдолгүй бөгөөд загвараас хасч болно.

Регрессийн коэффициентийн хувьд β 1 =6.859 статистикийг тодорхойлсон
, β 1 ач холбогдолгүй, энэ болон бүс нутгийн хотын хүчин зүйлийг загвараас хасч болно.

Регрессийн коэффициентийн хувьд β 2 =-1,985 статистикийг тодорхойлсон
, т кр, тиймээс регрессийн коэффициент β 2 ач холбогдолгүй, энэ болон орон сууцны өрөөний тооны хүчин зүйлийг загвараас хасч болно.

Регрессийн коэффициентийн хувьд β 4 =2.591 статистикийг тодорхойлсон
, >t cr тул регрессийн коэффициент β 4 Энэ нь чухал ач холбогдолтой бөгөөд энэ нь орон сууцны талбайн хүчин зүйлийг загварт хадгалах боломжтой.

Загварын коэффициентүүдийн ач холбогдлын талаархи дүгнэлтийг ач холбогдлын түвшинд хийдэг α=5%. P-утгийн баганыг харахад бид чөлөөт коэффициент байгааг тэмдэглэж байна α 0.64 = 64% -ийн түвшинд чухал ач холбогдолтой гэж үзэж болно; регрессийн коэффициент β 1 – 0.46 = 46% түвшинд; регрессийн коэффициент β 2 - 0.8 = 80% -ийн түвшинд; болон регрессийн коэффициент β 4 – 2.27E-06= 2.26691790951854E-06 = 0.0000002% түвшинд байна.

Тэгшитгэлд шинэ хүчин зүйлийн хувьсагчийг нэмэхэд детерминацийн коэффициент автоматаар нэмэгддэг Р 2 Загварын чанар үргэлж сайжрахгүй ч гэсэн дундаж ойролцоо алдаа багасдаг. Тиймээс загвар (3) ба сонгосон олон загварын (6) чанарыг харьцуулахын тулд бид нормчлогдсон детерминацын коэффициентийг ашигладаг.

Тиймээс регрессийн тэгшитгэлд "бүс нутгийн хот" гэсэн хүчин зүйлийг нэмэхэд X 1 ба "орон сууцны өрөөний тоо" гэсэн хүчин зүйл X 2 Загварын чанар муудсан нь хүчин зүйлийг арилгахыг дэмжиж байна X 1 ба Xзагвараас 2.

Цаашид тооцооллыг хийцгээе.

Дундаж уян хатан байдлын коэффициентүүд шугаман загварын хувьд томъёогоор тодорхойлно
.

AVERAGE функцийг ашиглан бид дараахь зүйлийг олно Ю, зөвхөн хүчин зүйлийн өсөлттэй X 4 нэг стандарт хазайлтаар - 0.914-ээр нэмэгддэг С Ю

Дельта коэффициентүүд томъёогоор тодорхойлогддог
.

Excel програмын "Өгөгдлийн шинжилгээ" багцын "Корреляци" хэрэглүүрийг ашиглан хос корреляцийн коэффициентийг олцгооё.


Ю

X1

X2

X4

Ю

1

X1

-0,01126

1

X2

0,751061

-0,0341

1

X4

0,874012

-0,0798

0,868524

1

Тодорхойлолтын коэффициентийг өмнө нь тодорхойлсон бөгөөд 0.7677-тэй тэнцүү байна.

Дельта коэффициентийг тооцоолъё:

;

Δ 1-ээс хойш 1 Тэгээд X 2 муу сонгогдсон бөгөөд тэдгээрийг загвараас хасах шаардлагатай. Энэ нь үүссэн шугаман гурван хүчин зүйлийн загварын тэгшитгэлийн дагуу үүссэн хүчин зүйлийн өөрчлөлтийг хэлнэ гэсэн үг юм. Ю(орон сууцны үнэ) 104%-ийг хүчин зүйлийн нөлөөгөөр тайлбарлаж байна X 4 (орон сууцны амьдрах талбай), хүчин зүйлээс 4% -иар нөлөөлсөн X 2 (өрөөний тоо), хүчин зүйлээс 0.0859%-иар нөлөөлсөн X 1 (бүс нутгийн хот).

ОХУ-ын Боловсрол, шинжлэх ухааны яам

Дээд мэргэжлийн боловсролын холбооны улсын автономит боловсролын байгууллага

Алс Дорнодын холбооны их сургууль

Эдийн засаг, удирдлагын сургууль

Бизнесийн мэдээлэл зүй, эдийн засаг-математикийн аргын тэнхим

ЛАБОРАТОРИЙН АЖИЛ

"Симулятор загварчлал" чиглэлээр

080801.65 "Хэрэглээний мэдээлэл зүй (эдийн засагт)" мэргэжил

РЕГРЕССИЙН ШИНЖИЛГЭЭ

Рудакова

Ульяна Анатольевна

Владивосток

ТАЙЛАН

Даалгавар: 23 үл хөдлөх хөрөнгийн талаархи өгөгдөл (борлуулалтын үнэ, амьдрах орон зай) дээр үндэслэн регрессийн шинжилгээний процедурыг авч үзэх.

"Регресс" үйлдлийн горим нь шугаман регрессийн тэгшитгэлийн параметрүүдийг тооцоолох, судалж буй процесст тохирох эсэхийг шалгахад ашиглагддаг.

MS Excel дээр регрессийн шинжилгээний асуудлыг шийдэхийн тулд цэснээс сонгоно уу Үйлчилгээбаг Өгөгдлийн шинжилгээболон шинжилгээний хэрэгсэл" Регресс".

Гарч ирэх харилцах цонхонд дараах параметрүүдийг тохируулна уу.

1. Оролтын интервал Y- энэ нь үүссэн шинж чанарын өгөгдлийн хүрээ юм. Энэ нь нэг баганаас бүрдэх ёстой.

2. Оролтын интервал Xхүчин зүйлсийн утгыг агуулсан нүднүүдийн хүрээ (бие даасан хувьсагч). Оролтын мужуудын (баганын) тоо 16-аас ихгүй байх ёстой.

.Checkbox Шошго, мужын эхний мөрөнд гарчиг байгаа бол тохируулна.

5. Тогтмол тэг.Хэрэв регрессийн шугам нь эх (болон 0=0).

6. Гаралтын интервал/ Шинэ ажлын хуудас/ Шинэ ажлын дэвтэр -гаралтын мужын зүүн дээд нүдний хаягийг зааж өгнө.

.Шалгалтын нүднүүд бүлэгт Үлдэгдэлгаралтын мужид харгалзах багана эсвэл график оруулах шаардлагатай бол тохируулна.

.Хэрэв та ажиглагдсан Y утгуудын автоматаар үүсгэгдсэн хувь интервалаас хамаарлын тархалтын графикийг харуулахыг хүсвэл "Хэвийн магадлалын график" нүдийг идэвхжүүлэх шаардлагатай.

Гаралтын муж дахь OK товчийг дарсны дараа бид тайлан авна.

Өгөгдлийн шинжилгээний багц хэрэгслийг ашиглан бид эх өгөгдлийн регрессийн шинжилгээг хийнэ.

Регрессийн шинжилгээний хэрэгсэл нь хамгийн бага квадратын аргыг ашиглан регрессийн тэгшитгэлийн параметрүүдийг тохируулахад ашиглагддаг. Регрессийг нэг буюу хэд хэдэн бие даасан хувьсагчийн утгуудын нэг хамааралтай хувьсагчид үзүүлэх нөлөөг шинжлэхэд ашигладаг.

РЕГРЕССИЙН СТАТИСТИКИЙН ХҮСНЭГТ

Хэмжээ олон тооны Рнь детерминацын коэффициентийн үндэс (R-квадрат). Үүнийг корреляцийн индекс буюу олон корреляцийн коэффициент гэж бас нэрлэдэг. Бие даасан хувьсагч (X1, X2) ба хамааралтай хувьсагчийн (Y) хамаарлын зэргийг илэрхийлж, детерминацийн коэффициентийн квадрат язгууртай тэнцүү байна. Манай тохиолдолд 0.7-той тэнцүү байгаа нь хувьсагчдын хооронд мэдэгдэхүйц хамаарал байгааг харуулж байна.

Хэмжээ R-квадрат (тодорхойлох коэффициент), мөн тодорхой байдлын хэмжүүр гэж нэрлэдэг нь үр дүнд бий болсон регрессийн шугамын чанарыг тодорхойлдог. Энэ чанар нь эх өгөгдөл болон регрессийн загвар (тооцоолсон өгөгдөл) хоорондын уялдаа холбоогоор илэрхийлэгддэг. Тодорхой байдлын хэмжүүр нь үргэлж интервал дотор байдаг.

Манай тохиолдолд R квадрат утга нь 0.48, i.e. бараг 50%, энэ нь регрессийн шугамын анхны өгөгдөлтэй таарахгүй байгааг харуулж байна олсон утга R-квадрат = 48%<75%, то, следовательно, также можно сделать вывод о невозможности прогнозирования с помощью найденной регрессионной зависимости. Таким образом, модель объясняет всего 48% вариации цены, что говорит о недостаточности выбранных факторов, либо о недостаточном объеме выборки.

Нормчилсан R квадратнь ижил тодорхойлох коэффициент боловч түүврийн хэмжээнд тохируулсан.

Ердийн R-квадрат=1-(1-R-квадрат)*((n-1)/(n-k)),

регрессийн шинжилгээ шугаман тэгшитгэл

энд n нь ажиглалтын тоо; k - параметрийн тоо. Шинэ регрессор (хүчин зүйл) нэмэх үед хэвийн болгосон R квадратыг ашиглах нь зүйтэй, учир нь нэмэгдэх тусам R квадратын утга нэмэгдэх боловч энэ нь загвар сайжирсаныг илтгэхгүй. Манай тохиолдолд үр дүнгийн утга нь 0.43 (R-квадратаас ердөө 0.05-аар ялгаатай) тул R-squared коэффициентийн өндөр итгэлийн тухай ярьж болно.

Стандарт алдааажиглалтын үр дүнгийн ойролцоо (ойролцоо) чанарыг харуулж байна. Манай тохиолдолд алдаа нь 5.1 байна. Хувиар тооцоолъё: 5.1/(57.4-40.1)=0.294 ≈ 29% (Стандарт алдаатай үед загварыг илүү сайн гэж үзнэ.<30%)

Ажиглалт- ажиглагдсан утгуудын тоог зааж өгсөн (23).

ХӨРСӨНГӨНИЙ ДЭЛГЭРҮҮЛЭЛИЙН ШИНЖИЛГЭЭ

Регрессийн тэгшитгэлийг олж авахын тулд -статистикийг тодорхойлно - регрессийн тэгшитгэлийн нарийвчлалын шинж чанарыг тодорхойлдог бөгөөд энэ нь регрессийн тэгшитгэлээр тайлбарлагдаж буй хамааралтай хувьсагчийн дисперсийн хэсгийг тайлбарлаагүй (үлдэгдэл) хэсэгт харьцуулсан харьцаа юм. зөрүүгээс.

df баганад- k эрх чөлөөний зэрэглэлийн тоо өгөгдсөн.

Үлдсэн хэсэгт энэ нь n-(m+1)-тэй тэнцүү утга юм, i.e. эхний цэгүүдийн тоо (23) -ийг хасах коэффициентийн тоо (2) ба чөлөөт гишүүн (1) -ийг хасна.

SS баганад- үүссэн шинж чанарын дундаж утгын квадрат хазайлтын нийлбэр. Үүнд:

Регрессийн тэгшитгэлийг ашиглан тооцоолсон онолын утгуудын үр дүнгийн шинж чанарын дундаж утгаас квадрат хазайлтын регрессийн нийлбэр.

Анхны утгуудын онолын утгаас хазайлтын үлдэгдэл нийлбэр.

Үр дүнгийн шинж чанараас анхны утгуудын квадрат хазайлтын нийт нийлбэр.

Квадрат хазайлтын регрессийн нийлбэр их байх тусам (эсвэл үлдэгдэл нийлбэр бага байх тусам регрессийн тэгшитгэл нь анхны цэгүүдийн үүлэнд ойртох тусам сайн болно. Манай тохиолдолд үлдэгдэл нь ойролцоогоор 50% байна. Иймээс регрессийн тэгшитгэл нь анхны цэгүүдийн үүлтэй маш муу ойролцоо байна.

MS баганад- объектив бус түүврийн хэлбэлзэл, регресс ба үлдэгдэл.

F баганадРегрессийн тэгшитгэлийн ач холбогдлыг шалгахын тулд шалгуур үзүүлэлтийн статистикийн утгыг тооцоолсон.

Регрессийн тэгшитгэлийн ач холбогдлын статистик туршилтыг хийхийн тулд хувьсагчдын хооронд хамаарал байхгүй гэсэн тэг таамаглал дэвшүүлж (хувьсагчийн бүх коэффициентүүд 0-тэй тэнцүү) ач холбогдлын түвшинг сонгоно.

Ач холбогдолын түвшин нь туршилтын үр дүнд зөв тэг таамаглалыг үгүйсгэх I төрлийн алдаа гаргах зөвшөөрөгдөх магадлал юм. Энэ тохиолдолд I төрлийн алдаа гаргана гэдэг нь түүвэрт популяци дахь хувьсагчдын хооронд хамаарал байгааг хүлээн зөвшөөрөхийг хэлнэ. Ихэвчлэн ач холбогдлын түвшинг 5% гэж үздэг. Хүснэгтийн утга = 3.5 (эрх чөлөөний зэрэглэлийн тоо 2 ба 20 байна) олж авсан утгыг = 9.4-тэй харьцуулж үзвэл регрессийн тэгшитгэл чухал (F>Fcr) гэж хэлж болно.

Ач холбогдол баганад Fшалгуур үзүүлэлтийн статистикийн олж авсан утгын магадлалыг тооцоолно. Манай тохиолдолд энэ утга = 0.00123 буюу 0.05-аас бага тул регрессийн тэгшитгэл (хамаарал) нь 95% -ийн магадлалаар чухал гэж хэлж болно.

Дээр дурдсан хоёр тулгуур нь бүхэлдээ загварын найдвартай байдлыг харуулж байна.

Дараахь хүснэгтэд регрессүүдийн коэффициентүүд болон тэдгээрийн тооцооллыг агуулсан болно.

Y-таслах шугам нь ямар ч регрессортой холбоогүй бөгөөд энэ нь чөлөөт коэффициент юм.

Баганад магадлалрегрессийн тэгшитгэлийн коэффициентүүдийн утгыг тэмдэглэв. Тиймээс тэгшитгэлийг олж авав:

Ү=25.6+0.009X1+0.346X2

Регрессийн тэгшитгэл нь анхны цэгүүдийн үүлний төвөөр дамжин өнгөрөх ёстой: 13.02≤M(b)≤38.26

Дараа нь баганын утгыг хосоор нь харьцуулна уу Коэффициент ба стандарт алдаа.Манай тохиолдолд коэффициентийн бүх үнэмлэхүй утга нь стандарт алдаанаас давж байгааг харж болно. Энэ нь регрессүүдийн ач холбогдлыг илэрхийлж болох ч энэ нь бүдүүлэг дүн шинжилгээ юм. t-статистикийн багана нь коэффициентүүдийн ач холбогдлын талаар илүү нарийн тооцооллыг өгдөг.

t-статистикийн баганадтомъёог ашиглан тооцоолсон t-туршилтын утгыг агуулна.

t=(Коэффицент)/(Стандарт алдаа)


n-(k+1)=23-(2+1)=20

Оюутны хүснэгтийг ашиглан бид ttable = 2.086 утгыг олно. Харьцуулж байна

t хүснэгттэй хамт регрессорын коэффициент X2 нь ач холбогдолгүй болохыг олж мэднэ.

Багана p-утгаашигласан тестийн статистикийн эгзэгтэй утга (Оюутны t статистик) түүврээс тооцоолсон утгаас давах магадлалыг илэрхийлнэ. Энэ тохиолдолд бид харьцуулна p-утгуудсонгосон ач холбогдлын түвшинтэй (0.05). Зөвхөн регрессорын коэффициент X2=0.08>0.05 нь ач холбогдолгүй гэж үзэж болно.

Доод 95% ба дээд 95% багана нь 95% итгэлтэйгээр итгэлийн интервалын хязгаарыг өгдөг. Коэффициент бүр өөрийн гэсэн хязгаартай: Коэффицентttable*Стандарт алдаа

Итгэлийн интервалыг зөвхөн статистикийн ач холбогдолтой утгуудын хувьд байгуулна.

ҮЛДЭГДСИЙГ ТАТАЖ АВАХ ХҮСНЭГТ

Үлдэгдэл нь регрессийн шугамаас (урьдчилан таамагласан утга) нэг цэгийн (ажиглалтын) хазайлт юм.

Хэвийн таамаглал үлдэгдэлУрьдчилан таамагласан болон ажиглагдсан утгуудын ялгааны тархалт хэвийн байна гэж үздэг. Түгээлтийн мөн чанарыг нүдээр тодорхойлохын тулд функцийг идэвхжүүлнэ үү балансын график.

Үлдэгдэл графикууд нь анхны Y утгууд болон хувьсагчийн X1 ба X2 бүрэлдэхүүн хэсгийн утга тус бүрийн регрессийн функцээс тооцоолсон ялгааг харуулдаг. Энэ нь ашиглаж буй суурилуулсан шугамыг хүлээн зөвшөөрөх эсэхийг тодорхойлоход хэрэглэгддэг.

Регрессийн шугамыг дүрслэн харуулахын тулд тохирох графикийг ашиглаж болно.

Стандарт үлдэгдэл нь стандарт хазайлтыг тооцоолохын тулд нормчлогдсон үлдэгдэл юм.

Шалтгааныг урьдчилан таамаглах аргын мөн чанар нь үр дүн ба хүчин зүйлийн хувьсагчдын хооронд математик холболтыг бий болгох явдал юм.

Шалтгааныг урьдчилан таамаглах аргыг ашиглах зайлшгүй нөхцөл бол их хэмжээний мэдээллийн бэлэн байдал юм. Хэрэв хувьсагчдын хоорондын хамаарлыг математикийн хувьд зөв тайлбарлаж чадвал учир шалтгааны таамаглалын нарийвчлал нэлээд өндөр байх болно.
Шалтгааныг урьдчилан таамаглах аргууд нь:


  • олон хувьсах регрессийн загварууд,

  • симуляцийн загварчлал.
Шалтгааныг таамаглах хамгийн түгээмэл аргууд бол олон хувьсагчтай регрессийн загварууд юм .

1.4.1 Олон хувьсагчийн регрессийн загварууд

Олон хувьсагчийн регрессийн загвар нь хэд хэдэн бие даасан хувьсагчтай тэгшитгэл юм.

Олон хувьсах регрессийн загварыг бий болгохын тулд янз бүрийн функцуудыг ашиглаж болно: шугаман болон чадлын хамаарал;

Шугаман загварт параметрүүд(b 1, b 2, ... b n) нь бусад бүх бие даасан хувьсагчид тэгтэй тэнцүү бол урьдчилан таамагласан утгад бие даасан хувьсагч бүрийн нөлөөлөл гэж тайлбарлана.

IN эрчим хүчний загварпараметрүүд нь уян хатан байдлын коэффициент юм. Тэд харгалзах хүчин зүйл 1% -иар өөрчлөгдөхөд үр дүн (y) дунджаар хэдэн хувиар өөрчлөгдөхийг харуулж байгаа бол бусад хүчин зүйлсийн үйлдэл өөрчлөгдөөгүй хэвээр байна. Олон регрессийн тэгшитгэлийн параметрүүдийг тооцоолохын тулд үүнийг бас ашигладаг хамгийн бага квадратын арга.

Регрессийн загварыг бий болгоход өгөгдлийн чанар шийдвэрлэх үүрэг гүйцэтгэдэг. Мэдээлэл цуглуулах нь урьдчилан таамаглах үндэс суурийг бүрдүүлдэг тул мэдээлэл цуглуулахдаа дагаж мөрдөх хэд хэдэн шаардлага, дүрэм журам байдаг.


  1. Нэгдүгээрт, өгөгдөл байх ёстой ажиглагдах боломжтой, өөрөөр хэлбэл тооцооны бус хэмжилтийн үр дүнд олж авсан.

  1. Хоёрдугаарт, өгөгдлийн массиваас энэ нь зайлшгүй шаардлагатай давхардсан болон маш их ялгаатай өгөгдлийг оруулахгүй. Дахин давтагдахгүй өгөгдөл, олон тооны нэгэн төрлийн байх тусам тэгшитгэл илүү сайн болно.Хүчтэй ялгаатай утгууд гэж бид ерөнхий цувралд тохирохгүй ажиглалтыг хэлнэ. Тухайлбал, ажилчдын цалингийн мэдээлэл дөрөв, таван оронтой тоогоор (7,000, 10,000, 15,000) байгаа боловч зургаан оронтой нэг тоо (250,000) олдсон байна. Энэ бол алдаа гэдэг нь ойлгомжтой.

  1. Гурав дахь дүрэм (шаардлага) нь нэлээд их хэмжээний өгөгдөл. Сайн тэгшитгэлийг бий болгоход хэр их мэдээлэл шаардагдах талаар статистикчид өөр өөр үзэл бодолтой байдаг. Зарим хүмүүсийн үзэж байгаагаар өгөгдөл шаардлагатай байна 4-6 дахин иххүчин зүйлийн тоо. Бусад нь үүнийг баталж байна дор хаяж 10 дахин иххүчин зүйлүүдийн тоо, дараа нь бүрэн хүчин төгөлдөр үйлчилж буй олон тооны хууль нь харилцааны байгалийн шинж чанараас санамсаргүй хазайлтыг үр дүнтэй дарах боломжийг олгодог.

Олон хувьсагчтай регрессийн загварыг бий болгохMSExcel
Excel хүснэгтэд зөвхөн бүтээх боломжтой шугаманолон хувьсагчтай регрессийн загвар.
, (1.19)
Үүнийг хийхийн тулд та тухайн зүйлийг сонгох хэрэгтэй "Өгөгдлийн шинжилгээ"дараа нь гарч ирэх цонхонд - хэрэгсэл "регресс"


Зураг 1.45 – “Регресс” хэрэглүүрийн харилцах цонх
Гарч ирэх цонхонд та хэд хэдэн талбарыг бөглөх хэрэгтэй, үүнд:


  • Оролтын интервал Ю - Үүссэн хувьсагчийн утгыг агуулсан нэг баганаас авсан өгөгдлийн хүрээ.

  • Оролтын интервал X хүчин зүйлийн хувьсагчдын утгыг агуулсан өгөгдлийн хүрээ юм.

Хэрэв оролтын интервалын эхний мөр эсвэл эхний баганад толгой байгаа бол та хайрцгийг шалгах хэрэгтэй "шошго" .

Өгөгдмөл ашигласан найдвартай байдлын түвшин 95%.Хэрэв та өөр түвшин тогтоохыг хүсвэл хайрцгийг чагтлаад хажуугийн талбарт хүссэн найдвартай байдлын түвшинг оруулна уу.

Checkbox "Тогтмол-тэг"Хэрэв та огтлолтгүй регрессийн тэгшитгэл авахыг хүсвэл зөвхөн шалгах хэрэгтэй А, ингэснээр регрессийн шугам эхийг дайран өнгөрнө.
Тооцооллын үр дүнгийн гаралтыг 3 аргаар зохион байгуулж болно.


  • В Энэ ажлын хуудасны нүдний хүрээ (энэ талбарт "Гаралтын хүрээ"тооцооллын үр дүнг харуулах мужын зүүн дээд нүдийг тодорхойлох);

  • дээр шинэ ажлын хуудас (хажуу талд байгаа талбарт та энэ хуудасны хүссэн нэрийг оруулж болно);

  • В шинэ ажлын дэвтэр .

Шалгалтын нүдийг тохируулах "Үлдсэн"Тэгээд "Стандартчилсан баланс"гаралтын мужид оруулахыг тушаадаг.
Бие даасан хувьсагч бүрийн үлдэгдлийг зурахын тулд нүдийг сонго "Үлдэгдлийн хүснэгт."Үлдэгдэлөөрөөр хэлбэл урьдчилан таамаглах алдаа гэж нэрлэдэг. Тэдгээр нь бодит болон таамагласан Y утгуудын хоорондох зөрүү гэж тодорхойлогддог.
Үлдэгдэл талбайн тайлбар
Үлдэгдэл графикуудад ямар ч загвар байх ёсгүй. Хэрэв хэв маягийг олж мэдэх юм бол энэ нь загварт бидэнд үл мэдэгдэх зарим нэг хүчин зүйл агуулаагүй гэсэн үг юм, гэхдээ энэ талаар ямар ч мэдээлэл байхгүй байгалийн хүчин зүйл юм.

Хайрцагыг шалгахдаа "Сонголтын хуваарь"Онолын регрессийн шугам нь ажиглагдсантай хэр нийцэж байгааг харуулсан цуврал графикууд гарч ирнэ. бодит өгөгдөл.

Сонгох графикуудын тайлбар
Excel-д тохирох график дээрх улаан цэгүүд нь онолын утгыг илэрхийлдэг Ю, цэнхэр цэгүүд - анхны өгөгдөл. Хэрэв улаан цэгүүд цэнхэр цэгүүдтэй сайн давхцаж байвал энэ нь амжилттай регрессийн тэгшитгэлийг нүдээр харуулж байна.
Олон хувьсагчийн регрессийн загварт суурилсан урьдчилан таамаглах зайлшгүй үе шат бол регрессийн тэгшитгэлийн статистик ач холбогдлыг үнэлэх явдал юм. бий болгосон регрессийн тэгшитгэлийг урьдчилан таамаглах зорилгоор ашиглахад тохиромжтой байдал. Энэ асуудлыг шийдэхийн тулд MS Excel-д хэд хэдэн коэффициентийг тооцдог. Тухайлбал:


  1. Олон корреляцийн коэффициент

Үүссэн ба хоорондын холболтын ойр байдал, чиглэлийг тодорхойлдог хэд хэдэнхүчин зүйлийн хувьсагч. Хоёр хүчин зүйлийн хамаарлын үед олон корреляцийн коэффициентийг дараах томъёогоор тооцоолно.
, (1.20)


  1. Олон тооны тодорхойлох коэффициент ( Р 2 ).

R 2 нь загварт багтсан хүчин зүйлсээр тайлбарлагдсан y-ийн бодит утгатай харьцуулахад онолын утгын хэлбэлзлийн хувь хэмжээ юм. Үлдсэн онолын үнэ цэнэ нь загварт хамааралгүй бусад хүчин зүйлээс хамаарна. R 2 нь 0-ээс 1 хүртэлх утгыг авч болно. Хэрэв , загварын чанар өндөр байна. Энэ үзүүлэлт нь хэд хэдэн загварыг харьцуулж, хамгийн сайныг нь сонгоход онцгой ач холбогдолтой юм.


  1. Нормчилсан детерминацийн коэффициент Р 2

R2 үзүүлэлт нь цөөн тооны ажиглалтын ачаар детерминацийн коэффициентийн их утгыг олж авах боломжтой байдаг сул талтай. Хэвийн болгосон Энэ тохиолдолоос хамаагүй том өөр өгөгдлийн багцад ямар үнэ цэнийг авч болох талаар мэдээлэл өгнө.

Нормативыг дараахь томъёогоор тооцоолно.

, (1.21)

нормчлогдсон олон тооны детерминацийн коэффициент хаана байна,

Олон тооны детерминацийн коэффициент,

Дүүргэгчийн эзэлхүүн,

Хүчин зүйлийн хувьсагчийн тоо.


  1. Регрессийн стандарт алдаа таамаглалын алдааны ойролцоо хэмжээг заана. Үнэлгээ хийгдэж буй загварын чанарыг хэмжих үндсэн хэмжигдэхүүн болгон ашигладаг. Томъёог ашиглан тооцоолсон:
, (1.22)

үлдэгдлийн квадратуудын нийлбэр хаана байна,

Үлдэгдэл чөлөөтэй байх зэрэглэлийн тоо.
Өөрөөр хэлбэл, регрессийн стандарт алдаа нь эрх чөлөөний зэрэгт ногдох квадрат алдааг харуулдаг.


ҮР ДҮНГИЙН ДҮГНЭЛТ

Регрессийн статистик

Олон тооны Р

0.973101

R-дөрвөлжин

0.946926

Нормчилсан R квадрат

0.940682

Стандарт алдаа

0.59867

Ажиглалт

20

Вариацын шинжилгээ

df

SS

MS

Ф

Ач холбогдол Ф

Регресс

2

108.7071

54.35355

151.6535

1.45E-11

Үлдэгдэл

17

6.092905

0.358406

Нийт

19

114.8

Магадлал

Стандарт алдаа

t-статистик

P-утга

Доод 95%

Шилдэг 95%

Доод 95.0%

Шилдэг 95.0%

Y уулзвар

1.835307

0.471065

3.89608

0.001162

0.841445

2.829169

0.841445

2.829169

x1

0.945948

0.212576

4.449917

0.000351

0.49745

1.394446

0.49745

1.394446

x2

0.085618

0.060483

1.415561

0.174964

-0.04199

0.213227

-0.04199

0.213227

Вариацын шинжилгээний арга нь хувьсагчийн квадрат хазайлтын нийт нийлбэрийг задлахаас бүрдэнэ. цагтдундаж утгаас хоёр хэсэгт хуваагдана:


  1. регресс (эсвэл хүчин зүйл) -ээр тайлбарласан;

  2. үлдэгдэл.
, (1.2 3)
Урьдчилан таамаглахад регрессийн загварын тохиромжтой байдал нь шинж чанарын нийт өөрчлөлтийн хэдэн хувийг эзлэхээс хамаарна. yрегрессээр тайлбарласан өөрчлөлтийг тооцдог. Мэдээжийн хэрэг, хэрэв регрессийн тайлбарласан квадрат хазайлтын нийлбэр нь үлдэгдэлээс их байвал регрессийн тэгшитгэлийн статистик ач холбогдлын талаар дүгнэлт гаргана. Энэ нь детерминацийн коэффициент нь нэгдмэл байдалд ойртож байгаатай тэнцүү юм.
"Зөрчлийн шинжилгээ" хүснэгт дэх тэмдэглэгээ:
Хүснэгтийн хоёр дахь багана гэж нэрлэгддэг ба эрх чөлөөний зэрэглэлийн тоог илэрхийлнэ. Нийт дисперсийн хувьд эрх чөлөөний зэрэглэлийн тоо нь: , хүчин зүйлийн дисперсийн хувьд (эсвэл регрессээр тайлбарласан дисперс), үлдэгдэл дисперсийн хувьд.

энд n нь ажиглалтын тоо,

m – загварын хүчин зүйлийн хувьсагчийн тоо.
Хүснэгтийн гурав дахь баганыг . Энэ нь квадрат хазайлтын нийлбэрийг илэрхийлнэ. Квадрат хазайлтын нийт нийлбэрийг дараах томъёогоор тодорхойлно.

, (1.24)
Квадратуудын хүчин зүйлийн нийлбэр:

, (1.26)
Дөрөв дэх баганыг квадрат хазайлтын дундаж утга гэж нэрлэдэг. Томъёогоор тодорхойлно:

Фишерийн F тестийг ашиглан регрессийн тэгшитгэлийг тодорхойлох коэффициентийн статистикийн ач холбогдлыг тодорхойлно. Үүнийг хийхийн тулд үр дүн болон хүчин зүйлийн хувьсагчдын хооронд тэг таамаглал дэвшүүлсэн. холболт байхгүй. Энэ нь олон шугаман регрессийн тэгшитгэлийн бүх параметр ба корреляцийн коэффициент нь тэгтэй тэнцүү байх тохиолдолд л боломжтой юм.

Энэхүү таамаглалыг шалгахын тулд Фишерийн F тестийн бодит утгыг тооцоолж, хүснэгтийн нэгтэй харьцуулах шаардлагатай. F-шалгуурын бодит утгыг дараах томъёогоор тооцоолно.

, (1.28)

Тусгай статистик хүснэгтээс сонгосон:


  • өгөгдсөн ач холбогдлын түвшин () ба

  • эрх чөлөөний зэрэглэлийн тоо.

MS Excel-д F-шалгуурын хүснэгтэн утгыг функцийг ашиглан тодорхойлж болно: =DFIST(магадлал, эрх чөлөөний зэрэг1, эрх чөлөөний зэрэг2)

Жишээ нь: =FDISC(0.05;df1;df2)
Ач холбогдолын түвшин 1-ийг регрессийн загварын параметрүүдийг тооцсонтой ижил байхаар сонгосон. Анхдагч нь 95%.

Хэрэв , дараа нь дэвшүүлсэн таамаглалыг үгүйсгэж, регрессийн тэгшитгэлийн статистик ач холбогдлыг хүлээн зөвшөөрнө. Онцгой чухал урьдчилсан мэдээний хувьд F-шалгуурын хүснэгтийн утгыг 4 дахин нэмэгдүүлэхийг зөвлөж байна, өөрөөр хэлбэл нөхцөлийг шалгана.
=151.65; = 3.59
Тооцоолсон утга нь хүснэгтийн утгаас ихээхэн давсан байна. Энэ нь детерминацийн коэффициент нь тэгээс эрс ялгаатай тул регрессийн хамаарал байхгүй гэсэн таамаглалыг үгүйсгэх ёстой гэсэн үг юм.
Одоо регрессийн коэффициентүүдийн ач холбогдлыг үндэслэн тооцоолъё т-Оюутны t-тест.Энэ нь хүчин зүйлийн хувьсагчийн аль нь (x) үр дүнд бий болсон хувьсагч (y) дээр хамгийн их нөлөө үзүүлэхийг тодорхойлох боломжийг олгодог.

Стандарт алдааг ихэвчлэн гэж тэмдэглэдэг. Доод тэмдэг нь энэ алдааг тооцоолох регрессийн тэгшитгэлийн параметрийг заана

Томъёог ашиглан тооцоолсон:

, (1.29)

үүссэн хувьсагчийн стандарт хазайлт хаана байна,

шинж чанарын RMS,

Олон тэгшитгэлийн детерминацийн коэффициент

регресс,

хүчин зүйлийн хамаарлыг тодорхойлох коэффициент

тэгшитгэлийн бусад бүх хүчин зүйлүүд.

Квадратуудын үлдэгдэл нийлбэрийн эрх чөлөөний градусын тоо

хазайлт.
MS Excel-д стандарт алдааг автоматаар тооцдог (3-р хүснэгтийн 3-р баганад байрладаг).
Бодит үнэ цэнэт-Оюутны t-тест MS Excel-д энэ нь 3-р хүснэгтийн 4-р баганад байрладаг бөгөөд үүнийг дууддаг t-статистик.
(4-р багана) = (2-р багана) / (3-р багана)

t-статистик = Коэффицент/Стандарт алдаа
Хүснэгтийн утгат-Оюутны t-тестхүлээн зөвшөөрөгдсөн ач холбогдлын түвшин (ихэвчлэн 0.05; 0.01) болон эрх чөлөөний зэрэглэлийн тооноос хамаарна.

энд n нь хүн амын нэгжийн тоо,

m нь тэгшитгэлийн хүчин зүйлсийн тоо юм.
MS Excel дээр Оюутны t тестийн хүснэгтийн утгыг дараах функцийг ашиглан тодорхойлж болно.

STUDRIST(магадлал; эрх чөлөөний зэрэглэлийн тоо)
Жишээ нь: =STUDISCOVER(0.05,7)
Хэрэв бол регрессийн тэгшитгэлийн коэффициент нь статистикийн ач холбогдолтой (найдвартай) бөгөөд загварт оруулж, таамаглахад ашиглах боломжтой гэж дүгнэсэн.

1.4.2 Монте Карлогийн загварчлалын арга

Загварчлалын аргыг Газар дундын тэнгисийн эрэгт, Франц, Италийн хилийн ойролцоо байрладаг дэлхийн хамгийн жижиг улсуудын нэг болох Монакогийн гүнжид байрладаг Монте Карло хотын нэрээр нэрлэсэн.

Монте-Карлогийн симуляцийн арга нь тогтоосон хязгаарлалтын дагуу санамсаргүй утгыг үүсгэх явдал юм. Загварчлалын загварчлалыг хийж эхлэхдээ юуны өмнө хүчин зүйлийн хувьсагчдын хоорондын хамаарал, түүнчлэн тэдгээрийн үр дүнд үзүүлэх нөлөөллийн зэрэг, шинж чанарыг тусгасан таамагласан үзүүлэлтийн эдийн засаг-математик загварыг (EMM) боловсруулах шаардлагатай. . Орчин үеийн зах зээлийн нөхцөлд эдийн засгийн харилцааны субъектэд янз бүрийн шинж чанар, чиглэлийн олон хүчин зүйл нэгэн зэрэг нөлөөлж, тэдгээрийн нөлөөллийн зэрэг нь детерминистик биш байдаг тул EMM хувьсагчдыг стохастик ба детерминист гэсэн хоёр бүлэгт хуваах шаардлагатай юм шиг санагддаг;

Дараа нь та стохастик хувьсагч бүрийн магадлалын тархалтын төрлүүд болон харгалзах оролтын параметрүүдийг тодорхойлж, MS Excel санамсаргүй тоо үүсгэгч эсвэл бусад програм хангамжийг ашиглан стохастик хувьсагчдын утгыг дуурайх хэрэгтэй.

Нэмэлтийг идэвхжүүлсний дараа "санамсаргүй тоо үүсгэх" хэрэгслийг MS Excel 2007 хэрэглэгчид ашиглах боломжтой. Шинжилгээний багц. Нэмэлтийг идэвхжүүлэх журмыг дээр дурдсан болно (10-р хуудас, 1.5-1.8-р зургийг үз). Цэс дээр симуляци хийх ӨГӨГДӨЛта зүйлийг сонгох хэрэгтэй "Өгөгдлийн шинжилгээ", гарч ирэх харилцах цонхноос жагсаалтаас хэрэглүүрийг сонгоно уу "Санамсаргүй тоо үүсгэх"болон OK дарна уу.

Зураг 1.46 - Өгөгдлийн шинжилгээний цэсийн интерфейс
Гарч ирэх харилцах цонхонд та стохастик хувьсагч бүрийн магадлалын тархалтын төрлийг сонгож, тохирох оролтын параметрүүдийг тохируулах ёстой.

Зураг 1.47 - Санамсаргүй тоо үүсгэгч харилцах цонх
Энэ үе шат нь хамгийн хэцүү үеүүдийн нэг тул үүнийг гүйцэтгэхдээ мэргэжилтнүүдийн мэдлэг, туршлагыг ашиглах шаардлагатай. Магадлалын тархалтын төрлийг сонгохМөн бэлэн байгаа статистик мэдээлэлд үндэслэн хийж болно. Практикт магадлалын тархалтын хамгийн түгээмэл хэлбэрүүд нь хэвийн, гурвалжин, жигд байдаг.

Хэвийн тархалт (эсвэл Мойвр-Гаусс-Лаплас хууль)Урьдчилан таамагласан параметрийн хувилбарууд дундаж утга руу чиглэдэг гэж үздэг. Дунджаас эрс ялгаатай, өөрөөр хэлбэл тархалтын "сүүл" -д байрлах хувьсагчийн утгууд нь магадлал багатай байдаг.

Гурвалжин тархалтнь хэвийн тархалтын дериватив бөгөөд дундаж утгад ойртох тусам шугаман өсөлттэй тархалтыг тооцдог.

Нэг төрлийн хуваарилалтХувьсагчийн үзүүлэлтийн бүх утгыг хэрэгжүүлэх магадлал ижил байх тохиолдолд хэрэглэнэ.

Хувьсагч чухал үед болон хуваарилалтын хуулийг сонгох боломжгүйталаас нь харж болно салангид хуваарилалт.Дээр дурдсан магадлалын тархалтын төрлүүд нь Хүснэгт 1.11-д үзүүлсэн оролтын параметрүүдийг тодорхойлохыг шаарддаг.
Хүснэгт 1.11 - Магадлалын тархалтын үндсэн төрлүүдийн оролтын параметрүүд


Магадлалын төрөл

хуваарилалт


Оролтын параметрүүд

1 Хэвийн тархалт

  • дундаж;

  • стандарт хазайлт;

2 Гурвалжин тархалт

  • дундаж;


3 Нэг төрлийн хуваарилалт

  • боломжит утгын хүрээний хязгаар;

4 Дискрет тархалт

  • тодорхой хувьсах утгууд;

  • эдгээр магадлалын утгуудтай тохирч байна.

Хэд хэдэн туршилтын үр дүнд стохастик хувьсагчдын утгын тархалтыг олж авах бөгөөд үүний үндсэн дээр урьдчилан таамагласан үзүүлэлтийн утгыг тооцоолох шаардлагатай.

Дараагийн шаардлагатай алхам бол симуляцийн загварчлалын үр дүнд эдийн засаг, статистикийн дүн шинжилгээ хийх бөгөөд үүнд дараахь статистик үзүүлэлтүүдийг тооцоолохыг зөвлөж байна.


  • дундаж;

  • стандарт хазайлт;

  • тархалт;

  • хамгийн бага ба хамгийн их утга;

  • дүүжин хүрээ;

  • тэгш бус байдлын коэффициент;

  • илүүдэл.
Дээрх үзүүлэлтүүдийг хэвийн тархалтын таамаглалыг шалгахад ашиглаж болно. Хэрэв таамаглал батлагдсан бол "гурван сигма" дүрмийг ашиглан интервалын таамаглалыг гаргаж болно. Гурван сигма дүрэм нь санамсаргүй хэмжигдэхүүн гэж заасан байдаг Xпараметрүүдтэй хэвийн тархалтын хуульд захирагддаг бөгөөд дараа нь түүний утгууд нь интервалд агуулагдах нь бараг тодорхой болно, өөрөөр хэлбэл, . Тодорхой байдлыг нэмэгдүүлэх, тайлбарыг хялбарчлахын тулд гистограммыг бүтээхийг зөвлөж байна.


Зураг 1.48 - Урьдчилан таамагласан үзүүлэлтийн утгуудын гистограмм

Эдгээр үе шатуудыг хэрэгжүүлснээр урьдчилан таамагласан үзүүлэлтийн (интервалын урьдчилсан мэдээ) утгын магадлалын үнэлгээг авах боломжтой болно.

Нарийн төвөгтэй үзэгдлийг судлахдаа санамсаргүй хоёроос илүү хүчин зүйлийг харгалзан үзэх шаардлагатай. Эдгээр хүчин зүйлсийн хоорондын хамаарлын мөн чанарын тухай зөв ойлголтыг зөвхөн авч үзэж буй бүх санамсаргүй хүчин зүйлсийг нэг дор судалж байж олж авах боломжтой. Гурав ба түүнээс дээш санамсаргүй хүчин зүйлийн хамтарсан судалгаа нь судлаачид судалж буй үзэгдлүүдийн хоорондын учир шалтгааны хамаарлын талаар бага эсвэл бага үндэслэлтэй таамаглал дэвшүүлэх боломжийг олгоно. Олон тооны харилцааны энгийн хэлбэр нь гурван шинж чанарын шугаман хамаарал юм. Санамсаргүй хүчин зүйлсийг дараах байдлаар тэмдэглэв X 1 , X 2 ба X 3. Хосолсон корреляцийн коэффициентүүд X 1 ба X 2 гэж тэмдэглэнэ r 12, хооронд тус тус X 1 ба X 3 - r 12, хооронд X 2 ба X 3 - r 23. Гурван шинж чанарын хоорондох шугаман хамаарлын ойролцоо байдлын хэмжүүрийн хувьд олон корреляцийн коэффициентийг ашигладаг. Р 1-23, Р 2-13, Р 3 ּ 12 ба хэсэгчилсэн корреляцийн коэффициентийг тэмдэглэв r 12.3 , r 13.2 , r 23.1 .

Гурван хүчин зүйлийн олон корреляцийн коэффициент R 1.23 нь хүчин зүйлүүдийн аль нэг (цэгээс өмнөх индекс) болон бусад хоёр хүчин зүйлийн хослол (цэгээс хойшхи индексүүд) хоорондын шугаман хамаарлын ойролцоо байдлын үзүүлэлт юм.

R коэффициентийн утга нь үргэлж 0-ээс 1-ийн хооронд байна. R нэг рүү ойртох тусам гурван шинж чанарын шугаман хамаарлын зэрэг нэмэгддэг.

Олон корреляцийн коэффициентийн хооронд, жишээ нь. Р 2 ּ 13 , мөн хоёр хос корреляцийн коэффициент r 12 ба r 23-т хамаарал бий: хосолсон коэффициент бүр үнэмлэхүй утгаас хэтэрч болохгүй Р 2ּ 13.

Хос корреляцийн коэффициент r 12, r 13 ба r 23-ийн мэдэгдэж буй утгууд бүхий олон корреляцийн коэффициентийг тооцоолох томъёо нь дараах хэлбэртэй байна.

Квадрат олон корреляцийн коэффициент Р 2 гэж нэрлэдэг олон талт детерминацийн коэффициент.Энэ нь судалж буй хүчин зүйлсийн нөлөөгөөр хамааралтай хувьсагчийн хэлбэлзлийн эзлэх хувийг харуулдаг.

Олон корреляцийн ач холбогдлыг дараах байдлаар үнэлдэг Ф- шалгуур:

n -дээжийн хэмжээ; к -хүчин зүйлийн тоо. Манай тохиолдолд к = 3.

популяцийн олон корреляцийн коэффициентийг тэгтэй тэнцүүлэх тухай тэг таамаглал ( h o:r=0) бол хүлээн зөвшөөрнө ее<f t, хэрэв татгалзсан бол
е f ³ еТ.

онолын үнэ цэнэ е- шалгуур үзүүлэлтийг тодорхойлсон v 1 = к- 1 ба v 2 = n - кэрх чөлөөний зэрэг ба хүлээн зөвшөөрөгдсөн ач холбогдлын түвшин a (Хавсралт 1).

Олон корреляцийн коэффициентийг тооцоолох жишээ. Хүчин зүйлийн хоорондын хамаарлыг судлахдаа хос корреляцийн коэффициентийг авсан ( n =15): r 12 ==0.6; g 13 = 0.3; r 23 = - 0,2.

Онцлогийн хамаарлыг олж мэдэх шаардлагатай Xтэмдгээс 2 X 1 ба X 3, өөрөөр хэлбэл олон корреляцийн коэффициентийг тооцоолох:

Хүснэгтийн утга Ф-n 1 = 2 ба n 2 = 15 – 3 = a = 0.05 чөлөөт байдлын 12 зэрэгтэй шалгуур үзүүлэлтүүд Ф 0.05 = 3.89 ба a = 0.01 байна Ф 0,01 = 6,93.

Тиймээс тэмдгүүдийн хоорондын хамаарал Р 2.13 = 0.74 нь чухал ач холбогдолтой
1% -ийн ач холбогдлын түвшин Ф f > Ф 0,01 .

Олон талт детерминацийн коэффициентээр шүүж байна Р 2 = (0.74) 2 = 0.55, шинж чанарын өөрчлөлт X 2 нь 55% нь судалж буй хүчин зүйлсийн нөлөөлөлтэй холбоотой бөгөөд өөрчлөлтийн 45% (1-R 2) нь эдгээр хувьсагчдын нөлөөгөөр тайлбарлах боломжгүй юм.

Хэсэгчилсэн шугаман хамаарал

Хэсэгчилсэн корреляцийн коэффициентгэдэг нь хоёр шинж чанарын нэгдлийн зэрэглэлийг хэмждэг үзүүлэлт юм.

Математик статистик нь тусгай туршилт хийхгүйгээр, харин хос корреляцийн коэффициентийг ашиглан гурав дахь тогтмол утгатай хоёр шинж чанарын хоорондын хамаарлыг тогтоох боломжийг олгодог. r 12 , r 13 , r 23 .

Хэсэгчилсэн корреляцийн коэффициентийг дараахь томъёогоор тооцоолно.

Цэгийн өмнөх тоо нь ямар шинж чанарыг судалж байгааг, цэгийн дараах тоо нь ямар шинж чанарыг хассан (арилгасан) болохыг заана. Хэсэгчилсэн корреляцийн алдаа ба ач холбогдлын шалгуурыг хос корреляцитай ижил томъёогоор тодорхойлно.

.

Онолын үнэ цэнэ т-шалгуур үзүүлэлтийг тодорхойлсон v = n– Эрх чөлөөний 2 зэрэг ба хүлээн зөвшөөрөгдсөн ач холбогдлын түвшин a (Хавсралт 1).

Популяци дахь хэсэгчилсэн корреляцийн коэффициент тэгтэй тэнцүү гэсэн тэг таамаглал ( Х о: r= 0) байвал хүлээн зөвшөөрнө те< т t, хэрэв татгалзсан бол
т f ³ тТ.

Хэсэгчилсэн коэффициентүүд нь -1 ба +1 хоорондох утгыг авч болно. Хувийн тодорхойлох коэффициентХэсэгчилсэн корреляцийн коэффициентийг квадрат болгох замаар олно:

Д 12.3 = r 2 12ּ3 ;г 13.2 = r 2 13ּ2 ;г 23ּ1 = r 2 23ּ1.

Үр дүнтэй шинж чанарт хувь хүний ​​хүчин зүйлсийн хэсэгчилсэн нөлөөллийн түвшинг тодорхойлохын зэрэгцээ энэ хамаарлыг гажуудуулж буй бусад шинж чанаруудтай холбоог арилгах (арилгах) нь ихэвчлэн сонирхолтой байдаг. Заримдаа хасагдсан шинж чанарын тогтмол утгын хувьд бусад шинж чанаруудын хувьсах байдалд түүний статистик нөлөөллийг анзаарах боломжгүй байдаг. Хэсэгчилсэн корреляцийн коэффициентийг тооцоолох аргыг ойлгохын тулд жишээг авч үзье. Гурван сонголт байна X, ЮТэгээд З. Түүврийн хэмжээний хувьд n= 180 хос корреляцийн коэффициентийг тодорхойлно

r xy = 0,799; r xz = 0,57; r yz = 0,507.

Хэсэгчилсэн корреляцийн коэффициентийг тодорхойлъё.

Параметр хоорондын хэсэгчилсэн корреляцийн коэффициент XТэгээд Ю З (r xyּz = 0.720) нь эдгээр шинж чанаруудын хоорондын хамаарлын зөвхөн өчүүхэн хэсэг нь ерөнхий хамаарлыг харуулж байна ( r xy= 0.799) нь гурав дахь шинж чанарын нөлөөллөөс үүдэлтэй ( З). Параметр хоорондын хэсэгчилсэн корреляцийн коэффициентийн талаар ижил төстэй дүгнэлт хийх ёстой Xба параметр Зтогтмол параметрийн утгатай Ю (r X zּу = 0.318 ба r xz= 0.57). Харин эсрэгээр, параметрүүдийн хоорондын хэсэгчилсэн корреляцийн коэффициент ЮТэгээд Зтогтмол параметрийн утгатай X r yz ּ x= 0.105 нь нийт корреляцийн коэффициент r y-аас мэдэгдэхүйц ялгаатай байна z = 0.507. Эндээс харахад ижил параметрийн утгатай объектуудыг сонгох нь тодорхой байна X, дараа нь тэмдгүүдийн хоорондын хамаарал ЮТэгээд ЗЭнэ харилцааны нэлээд хэсэг нь параметрийн өөрчлөлтөөс шалтгаалж байгаа тул тэд маш сул байх болно X.

Зарим тохиолдолд хэсэгчилсэн корреляцийн коэффициент нь хосын шинж тэмдгийн эсрэг байж болно.

Жишээлбэл, шинж чанаруудын хоорондын хамаарлыг судлахдаа X, YТэгээд З- хосолсон корреляцийн коэффициентийг олж авсан (нь n = 100): r xy = 0.6; r X z= 0,9;
r y z = 0,4.

Гурав дахь шинж чанарын нөлөөллийг хассан хэсэгчилсэн корреляцийн коэффициентүүд:

Жишээ нь хос коэффициент ба хэсэгчилсэн корреляцийн коэффициентийн утгууд нь тэмдгээр ялгаатай болохыг харуулж байна.

Хэсэгчилсэн корреляцийн арга нь хоёр дахь эрэмбийн хэсэгчилсэн корреляцийн коэффициентийг тооцоолох боломжтой болгодог. Энэ коэффициент нь гурав, дөрөв дэх тогтмол утгатай эхний болон хоёр дахь шинж чанаруудын хоорондын хамаарлыг илэрхийлдэг. Хоёрдахь эрэмбийн хэсэгчилсэн коэффициентийг тодорхойлохдоо дараах томъёог ашиглан нэгдүгээр эрэмбийн хэсэгчилсэн коэффициентүүд дээр үндэслэнэ.

Хаана r 12 . 4 , r 13 ּ4, r 23 ּ4 - хос корреляцийн коэффициентийг ашиглан утгыг хэсэгчилсэн коэффициентийн томъёогоор тодорхойлдог хэсэгчилсэн коэффициентүүд r 12 , r 13 , r 14 , r 23 , r 24 , r 34 .

Бидний учир шалтгааны загвар зөвхөн агуулагдаж байгаа нөхцөл байдалд бидний тодорхойлсон асуулт бүрд хариулт олохыг хичээцгээе. бие даасан хоёр хувьсагч.

Олон корреляци R ба детерминацын коэффициент R2

Хараат хувьсагчтай бүх бие даасан хувьсагчдын нийлбэр хамаарлыг тооцоолохын тулд ашиглана олон корреляцийн коэффициент R. Олон корреляцийн коэффициент хоорондын ялгаа Р хоёр хувьсах корреляцийн коэффициентээс Г Энэ нь зөвхөн эерэг байж болно. Хоёр бие даасан хувьсагчийн хувьд үүнийг дараах байдлаар тооцоолж болно.

Олон корреляцийн коэффициентийг (9.1) тэгшитгэлийг бүрдүүлдэг хэсэгчилсэн регрессийн коэффициентийг тооцоолох замаар тодорхойлж болно. Хоёр хувьсагчийн хувьд энэ тэгшитгэл дараах хэлбэрийг авах нь ойлгомжтой.

(9.2)

Хэрэв бидний бие даасан хувьсагчдыг стандарт хэвийн тархалтын нэгж эсвэл Z-тархалт болгон хувиргавал тэгшитгэл (9.2) нь тодорхой болно.

(9.3)

Тэгшитгэлд (9.3) β коэффициент нь регрессийн коэффициентийн стандартчилагдсан утгыг илэрхийлнэ. IN.

Стандартчилагдсан регрессийн коэффициентийг дараахь томъёогоор тооцоолж болно.

Одоо олон корреляцийн коэффициентийг тооцоолох томъёо дараах байдалтай байна.

Корреляцийн коэффициентийг тооцоолох өөр нэг арга Р нь хоёр хувьсах корреляцийн коэффициентийн тооцоо юм r хамааралтай хувьсагчийн утгууд болон шугаман регрессийн тэгшитгэл (9.2) дээр үндэслэн тооцсон харгалзах утгуудын хооронд. Өөрөөр хэлбэл үнэ цэнэ Р дараах байдлаар үнэлж болно.

Энэ коэффициентийн хамт бид энгийн регрессийн нэгэн адил утгыг тооцоолж болно Р 2, үүнийг мөн ихэвчлэн гэж тэмдэглэдэг тодорхойлох коэффициент. Хоёр хувьсагчийн хоорондын хамаарлыг үнэлэх нөхцөл байдлын нэгэн адил детерминацийн коэффициент Р 2 хамааралтай хувьсагчийн дисперсийн хэдэн хувийг харуулж байна Ю , өөрөөр хэлбэл , бүх бие даасан хувьсагчийн тархалттай холбоотой болж хувирна – . Өөрөөр хэлбэл, тодорхойлох коэффициентийг дараах байдлаар үнэлж болно.

Бид мөн хамааралтай хувьсагчийн үлдэгдэл хэлбэлзлийн хувийг аль ч бие даасан хувьсагчидтай холбоогүй 1 -ийг тооцоолж болно. Р 2. Энэ утгын квадрат язгуур, i.e. хэмжигдэхүүнийг хоёр хувьсах корреляцийн нэгэн адил гэж нэрлэдэг холдуулах коэффициент.

Корреляцийн хэсэг

Тодорхойлох коэффициент Р Шалтгаан үүсгэгч загварт багтсан бүх бие даасан хувьсагчдын дисперс хамааралтай хувьсагчийн дисперсийн хэдэн хувьтай холбоотой болохыг Зураг 2-т үзүүлэв. Энэ коэффициент том байх тусам бидний дэвшүүлсэн учир шалтгааны загвар илүү чухал болно. Хэрэв энэ коэффициент нь тийм ч том биш бол бидний судалж буй хувьсагчдын хамаарлын нийт дисперсэд оруулсан хувь нэмэр ч ач холбогдолгүй болж хувирна. Гэвч бодит байдал дээр зөвхөн бүх хувьсагчийн нийт хувь нэмрийг тооцохоос гадна бидний авч үзэж буй бие даасан хувьсагч бүрийн хувь хүний ​​хувь нэмрийг тооцох шаардлагатай байдаг. Ийм хувь нэмэр гэж тодорхойлж болно корреляцийн хэсэг.

Бидний мэдэж байгаагаар хоёр хувьсагчийн корреляцийн хувьд бие даасан хувьсагчийн дисперстэй холбоотой хамааралтай хувьсагчийн дисперсийн хувийг дараах байдлаар тэмдэглэж болно. r 2. Гэсэн хэдий ч хэд хэдэн бие даасан хувьсагчийн нөлөөг судлах тохиолдолд энэхүү дисперсийн нэг хэсэг нь бидний хяналт болгон ашигладаг бие даасан хувьсагчийн дисперсээс нэгэн зэрэг шалтгаалдаг. Эдгээр харилцааг Зураг дээр тодорхой харуулав. 9.1.

Цагаан будаа. 9.1. хамаарлын хэлбэлзлийн харьцаа (Ю ) ба хоёр бие даасан (X 1ТэгээдX 2) хоёр бие даасан хувьсагчтай корреляцийн шинжилгээнд хувьсагч

Зурагт үзүүлсэн шиг. 9.1, бүх ялгаа Ю , манай хоёр бие даасан хувьсагчтай холбоотой, шошготой гурван хэсгээс бүрдэнэ а, б Тэгээд -тай. Эд анги А Тэгээд б зөрүү Ю бие даасан хоёр хувьсагчийн дисперсүүдэд тус тусад нь хамаарах - X 1 ба X 2. Үүний зэрэгцээ c хэсгийн дисперс нь Y хамааралтай хувьсагчийн дисперс болон манай хоёр хувьсагчийн дисперсийг нэгэн зэрэг холбодог. X. Тиймээс хувьсагчийн хамаарлыг үнэлэхийн тулд X 1 хувьсагчтай Y, Энэ нь хувьсагчийн нөлөөнөөс шалтгаалахгүй X Хувьсагч бүрт 2 Ю , тоо хэмжээнээс шаардлагатай R" 2 квадрат корреляцийн утгыг хасна Ю -тай X 2:

(9.6)

Үүнтэй адилаар бид Y хамаарлын хэсгийг тооцоолж болно X 2, энэ нь түүний хамааралтай холбоотой биш юм X 1.

(9.7)

Хэмжээ sr (9.6) ба (9.7) тэгшитгэлүүд нь бидний хайж байгаа нэг юм корреляцийн хэсэг.

Хэсгийн хамаарлыг ердийн хоёр хувьсагчийн хамаарлаар тодорхойлж болно:

Өөр нэг байдлаар, хэсэгчилсэн хамаарлыг хагас хэсэгчилсэн хамаарал гэж нэрлэдэг. Энэ нэр нь корреляцийг тооцоолохдоо хоёр дахь бие даасан хувьсагчийн нөлөөг эхний бие даасан хувьсагчийн утгуудаас хасдаг боловч хамааралтай хувьсагчийн хувьд арилдаггүй гэсэн үг юм. Үр нөлөө X 1 нь утгуудыг ашиглан тохируулсан зүйл юм X 2, тиймээс корреляцийн коэффициентийг хооронд нь тооцохгүй Ю Тэгээд X 1 ба хооронд Ю ба , мөн утгууд дээр үндэслэн утгыг тооцдог X 2 энгийн шугаман регрессийн бүлэгт авч үзсэний дагуу (7.4.2-р хэсгийг үзнэ үү). Тиймээс дараахь хамаарал хүчинтэй байна.

Бие даасан хувьсагч өөрөө болон хамааралтай хувьсагчийн аль алинд нь бусад бие даасан хувьсагчийн нөлөө байхгүй үед нэг бие даасан хувьсагчтай хамаарлыг үнэлэхийн тулд регрессийн шинжилгээнд хэсэгчилсэн корреляцийн ойлголтыг ашигладаг.

Хэсэгчилсэн хамаарал

Хувийн, эсвэл хэсэгчлэн, хамаарал Математикийн статистикт өгөгдсөн бие даасан хувьсагчийн дисперстэй холбоотой хамааралтай хувьсагчийн дисперсийн харьцаагаар энэ хамааралтай хувьсагчийн бүх дисперсийн харьцаагаар тодорхойлогддог бөгөөд бусад хувьсагчийн дисперстэй холбоотой хэсгийг тооцохгүй. бие даасан хувьсагчид. Албан ёсоор хоёр бие даасан хувьсагчийн хувьд үүнийг дараах байдлаар илэрхийлж болно.

Хэсэгчилсэн хамаарал нь өөрсдийгөө үнэлдэг pr Хоёр хувьсах корреляцийн утгууд дээр үндэслэн олж болно:

Ийнхүү хэсэгчилсэн хамаарлыг хамааралтай ба бие даасан хувьсагчийн тохируулсан утгуудын хоорондох ердийн хоёр хувьсах хамаарал гэж тодорхойлж болно. Залруулга нь өөрөө хяналтын хувьсагчийн үүрэг гүйцэтгэдэг бие даасан хувьсагчийн утгын дагуу хийгддэг. Өөрөөр хэлбэл, хамааралтай хувьсагчийн хоорондын хэсэгчилсэн хамаарал Ю болон бие даасан хувьсагч X Би хоёр дахь бие даасан хувьсагчийн утгууд дээр үндэслэн таамаглаж буй утгууд ба утгуудын хоорондын ердийн хамаарал гэж тодорхойлж болно. X 2.



Танд нийтлэл таалагдсан уу? Найзуудтайгаа хуваалцаарай!