Олон корреляцийн коэффициент ямар утгыг авч болох вэ? Олон шугаман хамаарал

7.1. Шугаман регрессийн шинжилгээхамгийн бага квадратын аргыг ашиглан ажиглалтын багцад график оруулахаас бүрдэнэ. Регрессийн шинжилгээ нь тодорхой санамсаргүй хэмжигдэхүүн хоорондын функциональ хамаарлыг тогтоох боломжийг олгодог Юболон зарим нөлөө Юүнэт зүйлс X. Энэ хамаарлыг регрессийн тэгшитгэл гэж нэрлэдэг. энгийн ( у=м*х+б) ба олон тооны ( y=m 1 *x 1 +m 2 *x 2 +... + m k *x k +b) шугаман ба шугаман бус төрлийн регресс.
Хэмжигдэхүүний хоорондын холболтын түвшинг үнэлэхийн тулд үүнийг ашигладаг Pearson R олон корреляцийн коэффициент(корреляцийн харьцаа), 0-ээс 1 хүртэлх утгыг авч болно. РХэмжигдэхүүнүүдийн хооронд хамаарал байхгүй бол =0, ба РХэмжигдэхүүнүүдийн хооронд функциональ холбоо байгаа бол =1. Ихэнх тохиолдолд R нь 0-ээс 1 хүртэлх завсрын утгыг авдаг. Утга R 2дуудсан тодорхойлох коэффициент.
Регрессийн хамаарлыг бий болгох ажил бол коэффициентүүдийн векторыг олох явдал юм Молон шугаман регрессийн загвар, үүнд коэффициент Рхамгийн их утгыг авдаг.
Ач холбогдлыг үнэлэхийн тулд Рхамаарна Фишерийн F тест, томъёогоор тооцоолно:

Хаана n- туршилтын тоо; к– загварын коэффициентүүдийн тоо. Хэрэв Фөгөгдлийн зарим чухал утгыг давсан nТэгээд кболон хүлээн зөвшөөрөгдсөн итгэлийн магадлал, дараа нь үнэ цэнэ Рач холбогдолтой гэж үздэг.

7.2. Хэрэгсэл Регресс-аас Шинжилгээний багцДараах өгөгдлийг тооцоолох боломжийг танд олгоно.

· шугаман регрессийн функцийн коэффициентүүд- хамгийн бага квадратын арга; регрессийн функцийн төрлийг эх өгөгдлийн бүтцээр тодорхойлно;

· детерминацийн коэффициент ба холбогдох хэмжигдэхүүнүүд(хүснэгт Регрессийн статистик);

· регрессийн ач холбогдлыг шалгах дисперсийн хүснэгт ба шалгуур үзүүлэлтийн статистик(хүснэгт Вариацын шинжилгээ);

· регрессийн коэффициент тус бүрийн стандарт хазайлт ба түүний бусад статистик үзүүлэлтүүд нь энэ коэффициентийн ач холбогдлыг шалгаж, түүнд итгэх интервалыг бий болгох боломжийг олгодог;

· регрессийн функцийн утга ба үлдэгдэл- хувьсагчийн анхны утгуудын хоорондох ялгаа Юба регрессийн функцийн тооцоолсон утгууд (хүснэгт Үлдэгдэл гаргах);

· Өсөх дарааллаар эрэмблэгдсэн Y хувьсагчийн утгуудтай тохирох магадлал(хүснэгт Магадлалын гаралт).

7.3. Сонгох хэрэгсэл рүү залгана уу Өгөгдөл > Өгөгдлийн шинжилгээ > Регресс.

7.4. Талбайд Оролтын интервал Y Y хамааралтай хувьсагчийн утгуудыг агуулсан мужын хаягийг оруулна уу. Муж нь нэг баганаас бүрдэх ёстой.
Талбайд Оролтын интервал X X хувьсагчийн утгуудыг агуулсан мужын хаягийг оруулна уу. Муж нь нэг буюу хэд хэдэн баганаас бүрдэх ёстой, гэхдээ 16-аас илүүгүй багана. Хэрэв талбарт заасан бол Оролтын интервал YТэгээд Оролтын интервал Xмужууд баганын толгойг агуулдаг бол сонголтын нүдийг шалгах хэрэгтэй Шошго– эдгээр гарчиг нь хэрэглүүрийн үүсгэсэн гаралтын хүснэгтэд ашиглагдана Регресс.
Сонголтыг шалгах нүд Тогтмол - тэгрегрессийн тэгшитгэл тогтмол байвал тогтоох хэрэгтэй бтэгтэй тэнцүү албадан байна.
Сонголт Найдвартай байдлын түвшинөгөгдмөлөөр ашиглагддаг 0.95-аас өөр итгэлийн түвшинтэй регрессийн коэффициентүүдийн итгэлийн интервалыг байгуулах шаардлагатай үед тохируулна. Сонголтын нүдийг шалгасны дараа Найдвартай байдлын түвшинИтгэлийн түвшний шинэ утгыг оруулах оролтын талбар гарч ирнэ.
Бүс нутагт ҮлдэгдэлДөрвөн сонголт байна: Үлдэгдэл, Стандартчилагдсан үлдэгдэл, Балансын графикТэгээд Сонгон шалгаруулалтын хуваарь. Хэрэв тэдгээрийн ядаж нэгийг суулгасан бол хүснэгт нь гаралтын үр дүнд харагдах болно Үлдэгдэл гаргах, энэ нь регрессийн функцийн утгууд ба үлдэгдэл - Y хувьсагчийн анхны утга ба регрессийн функцийн тооцоолсон утгуудын хоорондох ялгааг харуулах болно. Бүс нутагт Хэвийн магадлалНэг сонголт байна -; түүний суурилуулалт нь гаралтын үр дүнд хүснэгт үүсгэдэг Магадлалын гаралтхаргалзах графикийг бүтээхэд хүргэдэг.


7.5. Зургийн дагуу параметрүүдийг тохируулна уу. Y утга нь эхний хувьсагч (нэр бүхий нүдийг оруулаад), X утга нь бусад хоёр хувьсагч (нэртэй нүдийг оруулаад) эсэхийг шалгаарай. дарна уу БОЛЖ БАЙНА УУ.

7.6. Хүснэгтэнд Регрессийн статистикДараахь мэдээллийг хүргэж байна.

Олон тооны Р– дараагийн мөрөнд өгөгдсөн R 2 детерминацийн коэффициентийн үндэс. Энэ үзүүлэлтийн өөр нэр нь корреляцийн индекс буюу олон корреляцийн коэффициент юм.

R-дөрвөлжин– тодорхойлох коэффициент R 2 ; харьцаагаар тооцно квадратуудын регрессийн нийлбэр(C12 нүд) хүртэл квадратуудын нийт нийлбэр(C14 нүд).

Нормчилсан R квадраттомъёогоор тооцоолно

Энд n нь Y хувьсагчийн утгуудын тоо, k нь X хувьсагчийн оролтын интервал дахь баганын тоо юм.

Стандарт алдаа– үлдэгдэл дисперсийн үндэс (D13 нүд).

Ажиглалт– Y хувьсагчийн утгын тоо.

7.7. IN Тархалтын хүснэгтбаганад SSквадратуудын нийлбэрийг баганад өгсөн болно df- эрх чөлөөний зэрэглэлийн тоо. баганад MS- тархалт. Шугаманд Регрессбаганад еРегрессийн ач холбогдлыг шалгахын тулд шалгуур үзүүлэлтийн статистикийн утгыг тооцоолсон. Энэ утгыг регрессийн дисперсийн үлдэгдэл дисперсийн харьцаагаар тооцно (D12 ба D13 нүд). Баганад Ач холбогдол Фшалгуур үзүүлэлтийн статистикийн олж авсан утгын магадлалыг тооцоолно. Хэрэв энэ магадлал жишээ нь 0.05-аас бага (өгөгдсөн ач холбогдлын түвшин) бол регрессийн ач холбогдолгүй байдлын тухай таамаглал (өөрөөр хэлбэл регрессийн функцийн бүх коэффициентүүд тэгтэй тэнцүү гэсэн таамаглал) няцаагдаж, регресс нь ач холбогдолтой гэж үздэг. Энэ жишээнд регресс нь тийм ч чухал биш юм.

7.8. Дараах хүснэгтэд баганад Магадлал, регрессийн функцийн коэффициентүүдийн тооцоолсон утгуудыг мөрөнд бичнэ Y уулзварчөлөөт хугацааны үнэ цэнийг бичнэ б. Баганад Стандарт алдааКоэффициентуудын стандарт хазайлтыг тооцоолсон.
Баганад t-статистикКоэффициентийн утгыг тэдгээрийн стандарт хазайлттай харьцуулсан харьцааг тэмдэглэв. Эдгээр нь регрессийн коэффициентийн ач холбогдлын талаархи таамаглалыг шалгах шалгуур үзүүлэлтүүдийн статистикийн утгууд юм.
Баганад P-утгашалгуур үзүүлэлтийн статистикийн утгуудад тохирох ач холбогдлын түвшинг тооцоолно. Тооцоолсон ач холбогдлын түвшин нь заасан ач холбогдлын түвшингээс бага байвал (жишээлбэл, 0.05). дараа нь коэффициент тэгээс мэдэгдэхүйц ялгаатай гэсэн таамаглалыг хүлээн зөвшөөрсөн; өөрөөр хэлбэл коэффициент тэгээс ялимгүй ялгаатай гэсэн таамаглалыг хүлээн зөвшөөрнө. Энэ жишээнд зөвхөн коэффициент бтэгээс мэдэгдэхүйц ялгаатай, бусад нь - ач холбогдолгүй.
Баганад Доод 95%Тэгээд Шилдэг 95% 0.95 итгэлийн түвшинтэй итгэлийн интервалын хил хязгаарыг өгсөн. Эдгээр хил хязгаарыг томъёогоор тооцоолно
Доод 95% = Коэффициент - Стандарт алдаа * t α;
Дээд 95% = Коэффицент + Стандарт алдаа * t α.
Энд t α- захиалгын тоо хэмжээ α (n-k-1) эрх чөлөөний зэрэгтэй оюутны t тархалт. Энэ тохиолдолд α = 0.95. Багана дахь итгэлийн интервалын хил хязгаарыг ижил аргаар тооцоолно Доод 90.0%Тэгээд Шилдэг 90.0%.

7.9. Хүснэгтийг анхаарч үзээрэй Үлдэгдэл гаргахгаралтын үр дүнгээс. Энэ хүснэгт нь тухайн хэсэгт ядаж нэг сонголтыг тохируулсан үед л гаралтын үр дүнд харагдана Үлдэгдэлхарилцах цонх Регресс.

Баганад Ажиглалтхувьсагчийн утгуудын серийн дугаарыг өгсөн болно Ю.
Баганад Таамагласан Y y i = f(x i) регрессийн функцийн утгуудыг хувьсагчийн эдгээр утгуудад тооцдог. X, энэ нь серийн дугаартай тохирч байна би баганад Ажиглалт.
Баганад Үлдэгдэлялгаа (үлдэгдэл) ε i =Y-y i , багана агуулсан байна Стандарт үлдэгдэл– ε i / s ε харьцаагаар тооцсон нормчлогдсон үлдэгдэл. Энд s ε нь үлдэгдлийн стандарт хазайлт юм. s ε утгын квадратыг томъёогоор тооцоолно

үлдэгдлийн дундаж нь хаана байна. Утгыг дисперсийн хүснэгтээс авсан хоёр утгын харьцаагаар тооцоолж болно: квадрат үлдэгдэл (C13 нүд) ба эгнээний чөлөөт байдлын зэрэг. Нийт(B14 нүд).

7.10. Хүснэгтийн утгуудаар Үлдэгдэл гаргахХоёр төрлийн график бүтээгдсэн: үлдэгдэл графикуудТэгээд сонгон шалгаруулах хуваарь(хэрэв тухайн хэсэгт тохирох сонголтуудыг тохируулсан бол Үлдэгдэлхарилцах цонх Регресс). Тэдгээрийг хувьсах бүрэлдэхүүн хэсэг бүрт зориулж бүтээсэн болно Xтус тусад нь.

Асаалттай балансын графикуудүлдэгдэл харагдана, өөрөөр хэлбэл. анхны утгуудын хоорондох ялгаа Юхувьсагчийн бүрэлдэхүүн хэсгийн утга тус бүрээр регрессийн функцээр тооцоолно X.

Асаалттай сонгон шалгаруулах хуваарьХувьсагчийн бүрэлдэхүүн хэсэг бүрийн анхны Y утгууд болон тооцоолсон регрессийн функцийн утгуудыг харуулна X.

7.11. Гаралтын үр дүнгийн сүүлчийн хүснэгт нь хүснэгт юм Магадлалын гаралт. Энэ нь харилцах цонхонд гарч ирнэ Регресстохируулгыг суулгасан Ердийн магадлалын график.
Баганын утгууд Хувьдараах байдлаар тооцно. Алхамыг тооцсон h = (1/n)*100%, эхний утга нь h/2, сүүлийнх нь тэнцүү байна 100 цаг/2. Хоёрдахь утгаас эхлэн дараагийн утга бүр нь өмнөхтэй тэнцүү байх бөгөөд үүнд нэг алхам нэмэгдэнэ h.
Баганад Юхувьсагчийн утгуудыг өгсөн болно Ю, өсөх дарааллаар эрэмбэлсэн. Энэ хүснэгтийн өгөгдөлд үндэслэн хэвийн тархалтын график. Энэ нь хувьсагчдын хоорондын хамаарлын шугаман байдлын түвшинг нүдээр үнэлэх боломжийг танд олгоно XТэгээд Ю.


8. Д дисперсийн шинжилгээ

8.1. Шинжилгээний багцгурван төрлийн дисперсийн шинжилгээ хийх боломжийг олгодог. Тодорхой хэрэгслийг сонгохдоо судалж буй өгөгдлийн багц дахь хүчин зүйлсийн тоо болон дээжийн тоогоор тодорхойлогддог.
нэг популяцид хамаарах хоёр ба түүнээс дээш түүврийн дундаж нь ойролцоо гэсэн таамаглалыг шалгахад ашигладаг.
Давталт бүхий хоёр талын ANOVAнь бүлэг өгөгдөл бүрийн хувьд нэгээс олон түүврийг багтаасан нэг хувьсах шинжилгээний илүү төвөгтэй хувилбар юм.
Давталтгүйгээр хоёр талын ANOVAнэг бүлэгт нэгээс илүү түүврийг оруулаагүй дисперсийн хоёр талын шинжилгээ юм. Энэ нь хоёр ба түүнээс дээш түүврийн дундаж нь ижил байна гэсэн таамаглалыг шалгахад хэрэглэгддэг (түүврүүд нь нэг популяцид хамаарна).

8.2. Нэг талын ANOVA

8.2.1. Шинжилгээнд зориулж өгөгдлийг бэлдье. Шинэ хуудас үүсгэж, түүнд багануудыг хуулна A B C D. Эхний хоёр мөрийг хас. Бэлтгэсэн өгөгдлийг явуулахад ашиглаж болно Нэг талын дисперсийн шинжилгээ.

8.2.2. Сонгох хэрэгсэл рүү залгана уу Өгөгдөл > Өгөгдлийн шинжилгээ > Нэг талын ANOVA.Зургийн дагуу бөглөнө үү. дарна уу БОЛЖ БАЙНА УУ.

8.2.3. Хүснэгтийг анхаарч үзээрэй Үр дүн: Шалгах- давталтын тоо; нийлбэр- шалгуур үзүүлэлтийн утгуудын нийлбэр мөр, Тархалт- индикаторын хэсэгчилсэн хэлбэлзэл.

8.2.4. Хүснэгт Вариацын шинжилгээ: эхний багана Өөрчлөлтийн эх үүсвэртархалтын нэрийг агуулсан, SS- квадрат хазайлтын нийлбэр, df- эрх чөлөөний зэрэг, MS- дундаж квадрат, F-туршилтбодит F тархалт. P-утга– тэгшитгэлээр олшруулсан дисперс нь үлдэгдлийн дисперстэй тэнцүү байх магадлал. Хүчин зүйлс ба үр дүнгийн хоорондын хамаарлыг олж авсан тоон тодорхойлолтыг санамсаргүй гэж үзэх магадлалыг тогтооно. F - чухалнь онолын F утга бөгөөд дараа нь бодит F-тэй харьцуулагдана.

8.2.5. Хэрэв тэгш бус байдал байвал бүх түүврийн математикийн хүлээлтийн тэгш байдлын талаархи тэг таамаглалыг хүлээн авна. F-туршилт < F - чухал. энэ таамаглалыг үгүйсгэх ёстой. Энэ тохиолдолд дээжийн дундаж утгууд ихээхэн ялгаатай байна.

Регрессийн шинжилгээ нь нэг буюу хэд хэдэн бие даасан хувьсагчаас тодорхой параметрийн хамаарлыг харуулах боломжийг олгодог статистик судалгааны арга юм. Компьютерийн өмнөх эрин үед, ялангуяа их хэмжээний өгөгдөлтэй байх үед үүнийг ашиглах нь нэлээд хэцүү байсан. Өнөөдөр Excel дээр регрессийг хэрхэн бүтээх талаар сурснаар та статистикийн нарийн төвөгтэй асуудлыг хэдхэн минутын дотор шийдэж чадна. Эдийн засгийн салбараас тодорхой жишээг доор харуулав.

Регрессийн төрлүүд

Энэ ойлголт өөрөө 1886 онд математикт нэвтэрсэн. Регресс тохиолддог:

  • шугаман;
  • параболик;
  • тайвшруулах;
  • экспоненциал;
  • гиперболик;
  • харуулах;
  • логарифм.

Жишээ 1

Аж үйлдвэрийн 6 аж ахуйн нэгжийн дундаж цалингаас ажлаасаа гарсан багийн гишүүдийн хамаарлыг тодорхойлох асуудлыг авч үзье.

Даалгавар. Зургаан аж ахуйн нэгжийн сарын дундаж цалин, сайн дураараа ажлаасаа халагдсан ажилчдын тоонд дүн шинжилгээ хийсэн. Бид хүснэгт хэлбэрээр:

Гарсан хүмүүсийн тоо

Цалин

30,000 рубль

35,000 рубль

40,000 рубль

45,000 рубль

50,000 рубль

55,000 рубль

60,000 рубль

6 аж ахуйн нэгжийн ажлаас халагдсан ажилчдын тоо дундаж цалингаас хамаарах эсэхийг тодорхойлох даалгаврын хувьд регрессийн загвар нь Y = a 0 + a 1 x 1 +...+a k x k, x i нь тэгшитгэлийн хэлбэртэй байна. хувьсагчдад нөлөөлөх, a i нь регрессийн коэффициентууд, k нь хүчин зүйлийн тоо юм.

Энэ асуудлын хувьд Y нь ажилчдыг халах үзүүлэлт бөгөөд нөлөөлөх хүчин зүйл нь цалин бөгөөд үүнийг бид X гэж тэмдэглэдэг.

Excel хүснэгтийн процессорын чадварыг ашиглах

Excel-д регрессийн шинжилгээ хийхээс өмнө одоо байгаа хүснэгтийн өгөгдөлд суулгасан функцуудыг ашиглах ёстой. Гэсэн хэдий ч эдгээр зорилгоор маш хэрэгтэй "Анализын багц" нэмэлтийг ашиглах нь дээр. Үүнийг идэвхжүүлэхийн тулд танд хэрэгтэй:

  • "Файл" табаас "Сонголтууд" хэсэгт очно уу;
  • нээгдэх цонхноос "Нэмэлтүүд" гэсэн мөрийг сонгоно уу;
  • "Менежмент" мөрийн баруун талд байрлах "Явах" товчийг дарна уу;
  • "Шинжилгээний багц" гэсэн нэрний хажууд байгаа нүдийг сонгоод "Ok" дээр дарж үйлдлээ баталгаажуулна уу.

Хэрэв бүх зүйл зөв хийгдсэн бол Excel-ийн ажлын хуудасны дээд талд байрлах "Өгөгдөл" табын баруун талд шаардлагатай товчлуур гарч ирнэ.

Excel дээр

Одоо бид эконометрикийн тооцоо хийхэд шаардлагатай бүх виртуал хэрэгсэлтэй болсон тул бид асуудлаа шийдэж эхлэх боломжтой. Үүний тулд:

  • "Өгөгдлийн шинжилгээ" товчийг дарна уу;
  • нээгдэх цонхонд "Регресс" товчийг дарна уу;
  • гарч ирэх таб дээр Y (ажлаас халагдсан ажилчдын тоо) ба X (тэдний цалин) утгын хүрээг оруулна уу;
  • Бид "Ok" товчийг дарж үйлдлээ баталгаажуулна.

Үүний үр дүнд програм нь регрессийн шинжилгээний өгөгдөл бүхий шинэ хүснэгтийг автоматаар дүүргэх болно. Анхаар! Excel нь энэ зорилгоор хүссэн байршлыг гараар тохируулах боломжийг танд олгоно. Жишээлбэл, энэ нь Y ба X утгууд байрладаг ижил хуудас эсвэл ийм өгөгдлийг хадгалахад зориулагдсан шинэ ажлын ном байж болно.

R квадратын регрессийн үр дүнгийн шинжилгээ

Excel дээр авч үзэж буй жишээн дэх өгөгдлийг боловсруулах явцад олж авсан өгөгдөл нь дараах хэлбэртэй байна.

Юуны өмнө та R квадрат утгыг анхаарч үзэх хэрэгтэй. Энэ нь детерминацийн коэффициентийг илэрхийлнэ. Энэ жишээнд R квадрат = 0.755 (75.5%), өөрөөр хэлбэл, загварын тооцоолсон параметрүүд нь авч үзэж буй параметрүүдийн хоорондын хамаарлыг 75.5% -иар тайлбарлаж байна. Тодорхойлох коэффициентийн утга өндөр байх тусам сонгосон загвар нь тодорхой даалгаварт илүү тохиромжтой байдаг. R квадрат утга 0.8-аас дээш байвал бодит нөхцөл байдлыг зөв дүрсэлсэн гэж үздэг. Хэрэв R квадрат бол<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Боломжийн шинжилгээ

64.1428 тоо нь бидний авч үзэж буй загварт байгаа бүх xi хувьсагчийг тэг болговол Y-ийн утга ямар байхыг харуулдаг. Өөрөөр хэлбэл, шинжилж буй параметрийн утгад тодорхой загварт заагаагүй бусад хүчин зүйлс нөлөөлдөг гэж үзэж болно.

B18 нүдэнд байрлах дараагийн коэффициент -0.16285 нь Х хувьсагчийн Y-д үзүүлэх нөлөөллийн жинг харуулж байна. Энэ нь авч үзэж буй загвар доторх ажилчдын сарын дундаж цалин нь -0.16285 жинтэй ажлаасаа халагдсан хүмүүсийн тоонд нөлөөлдөг гэсэн үг, өөрөөр хэлбэл. түүний нөлөөллийн түвшин огт бага байна. "-" тэмдэг нь коэффициент сөрөг байгааг илтгэнэ. Аж ахуйн нэгжийн цалин өндөр байх тусам хөдөлмөрийн гэрээг цуцлах эсвэл ажлаасаа гарах хүсэлтэй хүмүүс цөөн байдаг гэдгийг хүн бүр мэддэг тул энэ нь ойлгомжтой юм.

Олон регресс

Энэ нэр томъёо нь хэлбэрийн хэд хэдэн бие даасан хувьсагчтай харилцааны тэгшитгэлийг хэлнэ.

y=f(x 1 +x 2 +…x m) + ε, энд y нь үр дүнгийн шинж чанар (хамааралтай хувьсагч), x 1, x 2,...x m нь хүчин зүйлийн шинж чанар (бие даасан хувьсагч) юм.

Параметрийн тооцоо

Олон тооны регрессийн (MR) хувьд хамгийн бага квадратын аргыг (OLS) ашиглан гүйцэтгэдэг. Y = a + b 1 x 1 +…+b m x m + ε хэлбэрийн шугаман тэгшитгэлийн хувьд бид хэвийн тэгшитгэлийн системийг байгуулна (доороос харна уу)

Аргын зарчмыг ойлгохын тулд хоёр хүчин зүйлийн тохиолдлыг авч үзье. Дараа нь бид томъёогоор тайлбарласан нөхцөл байдалтай байна

Эндээс бид дараахь зүйлийг авна.

Энд σ нь индекст тусгагдсан харгалзах шинж чанарын дисперс юм.

OLS нь стандартчилсан масштабаар MR тэгшитгэлд хамаарна. Энэ тохиолдолд бид тэгшитгэлийг авна.

t y, t x 1, ... t xm нь стандартчилагдсан хувьсагчид бөгөөд дундаж утгууд нь 0-тэй тэнцүү байна; β i нь стандартчилагдсан регрессийн коэффициентууд бөгөөд стандарт хазайлт нь 1 байна.

Энэ тохиолдолд бүх β i-г хэвийн, төвлөрсөн гэж тодорхойлсон тул тэдгээрийг бие биетэйгээ харьцуулах нь зөв бөгөөд хүлээн зөвшөөрөгдөх боломжтой гэдгийг анхаарна уу. Нэмж дурдахад хамгийн бага βi утгатай хүчин зүйлсийг хаях замаар хүчин зүйлсийг ялгах нь заншилтай байдаг.

Шугаман регрессийн тэгшитгэлийг ашиглах бодлого

Өнгөрсөн 8 сарын хугацаанд тодорхой N бүтээгдэхүүний үнийн динамикийн хүснэгт бидэнд байна гэж бодъё. Үүний багцыг 1850 рубль / тонн үнээр худалдаж авах нь зүйтэй эсэх талаар шийдвэр гаргах шаардлагатай байна.

сарын дугаар

сарын нэр

бүтээгдэхүүний үнэ Н

тонн тутамд 1750 рубль

тонн тутамд 1755 рубль

тонн тутамд 1767 рубль

тонн тутамд 1760 рубль

тонн тутамд 1770 рубль

тонн тутамд 1790 рубль

тонн тутамд 1810 рубль

тонн тутамд 1840 рубль

Excel хүснэгтийн процессор дээрх энэ асуудлыг шийдэхийн тулд дээр дурдсан жишээнээс аль хэдийн мэдэгдэж байгаа "Өгөгдлийн шинжилгээ" хэрэгслийг ашиглах хэрэгтэй. Дараа нь "Регресс" хэсгийг сонгоод параметрүүдийг тохируулна уу. "Оролтын интервал Y" талбарт хамааралтай хувьсагчийн утгын хүрээ (энэ тохиолдолд жилийн тодорхой сар дахь барааны үнэ), "Оролтын интервал X" хэсэгт оруулах ёстой гэдгийг санах нь зүйтэй. - бие даасан хувьсагчийн хувьд (сарын тоо). "Ok" дээр дарж үйлдлийг баталгаажуулна уу. Шинэ хуудсан дээр (хэрэв заасан бол) бид регрессийн өгөгдлийг авдаг.

Тэдгээрийг ашиглан бид y=ax+b хэлбэрийн шугаман тэгшитгэлийг байгуулдаг бөгөөд a ба b параметрүүд нь сарын дугаар бүхий шугамын коэффициентүүд ба "Y- огтлолцол" гэсэн хуудаснаас авсан коэффициентүүд ба шугамууд юм. регрессийн шинжилгээний үр дүн. Тиймээс 3-р даалгаврын шугаман регрессийн тэгшитгэлийг (LR) дараах байдлаар бичнэ.

Бүтээгдэхүүний үнэ N = 11.714* сарын дугаар + 1727.54.

эсвэл алгебрийн тэмдэглэгээгээр

у = 11.714 x + 1727.54

Үр дүнгийн шинжилгээ

Үүссэн шугаман регрессийн тэгшитгэл хангалттай эсэхийг шийдэхийн тулд олон корреляцийн коэффициент (MCC) болон тодорхойлох, мөн Фишерийн тест, Студент t тестийг ашиглана. Регрессийн үр дүн бүхий Excel хүснэгтэд тэдгээрийг олон R, R-squared, F-statistic болон t-statistic гэж нэрлэдэг.

KMC R нь бие даасан болон хамааралтай хувьсагчдын хоорондох магадлалын хамаарлын ойролцоо байдлыг үнэлэх боломжийг олгодог. Түүний өндөр үнэ цэнэ нь "Сарын тоо" ба "1 тонн тутамд рубль дэх бүтээгдэхүүний N үнэ" гэсэн хувьсагчдын хооронд нэлээд хүчтэй холболт байгааг харуулж байна. Гэсэн хэдий ч энэ харилцааны мөн чанар тодорхойгүй хэвээр байна.

Тодорхойлох коэффициентийн квадрат R2 (RI) нь нийт тархалтын эзлэх хувийн тоон шинж чанар бөгөөд туршилтын өгөгдлийн аль хэсгийн тархалтыг харуулдаг, өөрөөр хэлбэл. хамааралтай хувьсагчийн утгууд нь шугаман регрессийн тэгшитгэлтэй тохирч байна. Харж байгаа асуудлын хувьд энэ утга нь 84.8% -тай тэнцүү байна, өөрөөр хэлбэл статистик мэдээллийг SD-ээр өндөр нарийвчлалтайгаар дүрсэлсэн болно.

F-статистикийг Фишерийн тест гэж нэрлэдэг бөгөөд шугаман харилцааны ач холбогдлыг үнэлэх, түүний оршин тогтнох таамаглалыг үгүйсгэх эсвэл батлахад ашигладаг.

(Оюутны тест) нь шугаман харилцааны үл мэдэгдэх эсвэл чөлөөт хугацааны хувьд коэффициентийн ач холбогдлыг үнэлэхэд тусалдаг. Хэрэв t-тестийн утга > tcr бол шугаман тэгшитгэлийн чөлөөт гишүүний ач холбогдол багатай гэсэн таамаглал няцаагдана.

Чөлөөт хугацааны талаар авч үзэж буй асуудалд Excel хэрэглүүрийг ашиглан t = 169.20903, p = 2.89E-12, өөрөөр хэлбэл, чөлөөт нэр томъёоны ач холбогдолгүй байдлын талаархи зөв таамаглалыг үгүйсгэх магадлал тэгтэй байна. . Үл мэдэгдэх коэффициентийн хувьд t=5.79405, ба p=0.001158. Өөрөөр хэлбэл үл мэдэгдэхийн хувьд коэффициентийн ач холбогдол багатай гэсэн зөв таамаглалыг үгүйсгэх магадлал 0.12% байна.

Иймээс үүссэн шугаман регрессийн тэгшитгэл нь хангалттай гэж үзэж болно.

Нэг багц хувьцааг худалдаж авах боломжийн асуудал

Excel-ийн олон регрессийг ижил өгөгдлийн шинжилгээний хэрэгслийг ашиглан гүйцэтгэдэг. Тодорхой хэрэглээний асуудлыг авч үзье.

MMM ХК-ийн 20 хувийг худалдаж авах нь зүйтэй эсэхийг NNN компанийн удирдлага шийдэх ёстой. Багцын үнэ (SP) 70 сая ам.доллар. NNN-ийн мэргэжилтнүүд ижил төстэй гүйлгээний талаархи мэдээллийг цуглуулсан. Хувьцааны багцын үнэ цэнийг сая ам.доллараар илэрхийлсэн параметрийн дагуу дараахь байдлаар үнэлэхээр шийдсэн.

  • өглөг (VK);
  • жилийн эргэлтийн хэмжээ (VO);
  • дансны авлага (VD);
  • үндсэн хөрөнгийн өртөг (COF).

Түүнчлэн аж ахуйн нэгжийн цалингийн өрийн (V3 P) мянган ам.доллараар хэмжигдэх параметрийг ашигладаг.

Excel хүснэгтийн процессор ашиглан шийдэл

Юуны өмнө та эх өгөгдлийн хүснэгтийг үүсгэх хэрэгтэй. Энэ нь дараах байдалтай харагдаж байна.

  • "Өгөгдлийн шинжилгээ" цонхыг дуудах;
  • "Регресс" хэсгийг сонгоно уу;
  • "Оролтын интервал Y" талбарт G баганаас хамааралтай хувьсагчдын утгын мужийг оруулна уу;
  • "Оролтын интервал X" цонхны баруун талд байгаа улаан сумтай дүрс дээр товшоод хуудасны B, C, D, F баганаас авсан бүх утгын мужийг тодруулна уу.

"Шинэ ажлын хуудас" гэсэн зүйлийг тэмдэглээд "Ok" дээр дарна уу.

Өгөгдсөн асуудлын регрессийн шинжилгээг авах.

Үр дүн, дүгнэлтийг судлах

Бид Excel-ийн хүснэгтэн дээр дурдсан бөөрөнхий өгөгдлөөс регрессийн тэгшитгэлийг "цуглуулдаг".

SP = 0.103 * SOF + 0.541 * VO - 0.031 * VK + 0.405 * VD + 0.691 * VZP - 265.844.

Илүү танил болсон математик хэлбэрээр үүнийг дараах байдлаар бичиж болно.

y = 0.103*x1 + 0.541*x2 - 0.031*x3 +0.405*x4 +0.691*x5 - 265.844

MMM ХК-ийн өгөгдлийг хүснэгтэд үзүүлэв.

Тэдгээрийг регрессийн тэгшитгэлд орлуулж үзвэл 64.72 сая ам.доллар болно. Энэ нь "МММ" ХК-ийн 70 сая ам.долларын ханш нэлээд хөөрөгдөж байгаа учраас худалдаж авах боломжгүй гэсэн үг.

Таны харж байгаагаар Excel хүснэгтийн процессор ба регрессийн тэгшитгэлийг ашигласнаар маш тодорхой гүйлгээ хийх боломжийн талаар мэдээлэлтэй шийдвэр гаргах боломжтой болсон.

Одоо та регресс гэж юу болохыг мэдэж байна. Дээр дурдсан Excel-ийн жишээнүүд нь эконометрикийн чиглэлээр практик асуудлыг шийдвэрлэхэд тусална.

Excel-ийн шинжилгээний багцыг (Регресс) ашиглах үед шугаман регрессийн бүтэц, түүний параметрүүдийн үнэлгээ, ач холбогдлыг илүү хурдан гүйцэтгэх боломжтой. Ерөнхий тохиолдолд олж авсан үр дүнгийн тайлбарыг авч үзье ( ктайлбарлагч хувьсагч) жишээ 3.6-д заасны дагуу.

Хүснэгтэнд регрессийн статистикдараах утгуудыг өгсөн:

Олон Р – олон корреляцийн коэффициент;

Р- дөрвөлжин– тодорхойлох коэффициент Р 2 ;

Хэвийн болгосон Р - дөрвөлжин- тохируулсан Р 2 эрх чөлөөний зэрэглэлийн тоогоор тохируулсан;

Стандарт алдаа– регрессийн стандарт алдаа С;

Ажиглалт -ажиглалтын тоо n.

Хүснэгтэнд Вариацын шинжилгээөгөгдсөн:

1. Багана df - эрх чөлөөний зэрэгтэй тэнцүү тоо

мөрний хувьд Регресс df = к;

мөрний хувьд Үлдэгдэлdf = nк – 1;

мөрний хувьд Нийтdf = n– 1.

2. Багана SS -тэнцүү квадрат хазайлтын нийлбэр

мөрний хувьд Регресс ;

мөрний хувьд Үлдэгдэл ;

мөрний хувьд Нийт .

3. Багана MSтомъёогоор тодорхойлогддог хэлбэлзэл MS = SS/df:

мөрний хувьд Регресс- хүчин зүйлийн тархалт;

мөрний хувьд Үлдэгдэл- үлдэгдэл хэлбэлзэл.

4. Багана Ф - тооцоолсон утга Ф-томьёог ашиглан тооцоолсон шалгуур

Ф = MS(регресс)/ MS(үлдэгдэл).

5. Багана Ач холбогдол Ф – тооцоолсонтой харгалзах ач холбогдлын түвшний утга Ф- статистик .

Ач холбогдол Ф= FDIST( F-статистик, df(регресс), df(үлдэгдэл)).

Хэрэв ач холбогдолтой бол Ф < стандартного уровня значимости, то Р 2 нь статистик ач холбогдолтой.

Магадлал Стандарт алдаа t-статистик P-утга Доод 95% Шилдэг 95%
Ю 65,92 11,74 5,61 0,00080 38,16 93,68
X 0,107 0,014 7,32 0,00016 0,0728 0,142

Энэ хүснэгтэд харуулав:

1. Магадлал- коэффициентийн утга а, б.

2. Стандарт алдаа– регрессийн коэффициентүүдийн стандарт алдаа С а, Sb.



3. т-статистик- тооцоолсон утгууд т - томъёогоор тооцоолсон шалгуурууд:

t-статистик = Коэффицент/Стандарт алдаа.

4.Р- үнэ цэнэ (ач холбогдол т) тооцоолсонтой харгалзах ач холбогдлын түвшний утга юм т-статистик.

Р-утга = СУРАГЧ(т- статистик, df(үлдэгдэл)).

Хэрэв Р-утга< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5. Доод 95% ба дээд 95%– онолын шугаман регрессийн тэгшитгэлийн коэффициентүүдийн 95%-ийн итгэлийн интервалын доод ба дээд хязгаар.

Үлдсэнийг нь эргүүлэн татах
Ажиглалт Таамагласан y Үлдэгдэл e
72,70 -29,70
82,91 -20,91
94,53 -4,53
105,72 5,27
117,56 12,44
129,70 19,29
144,22 20,77
166,49 24,50
268,13 -27,13

Хүснэгтэнд Үлдсэнийг нь эргүүлэн татахзаасан:

баганад Ажиглалт- ажиглалтын дугаар;

баганад Урьдчилан хэлсэн y - хамааралтай хувьсагчийн тооцоолсон утгууд;

баганад Үлдэгдэл д - хамааралтай хувьсагчийн ажиглагдсан болон тооцоолсон утгуудын зөрүү.

Жишээ 3.6.Хүнсний зардлын талаархи өгөгдөл (ердийн нэгж) байдаг yмөн нэг хүнд ногдох орлого xесөн бүлгийн гэр бүлд:

x
y

Excel шинжилгээний багцын үр дүнг (регресс) ашиглан бид хүнсний зардлын нэг хүнд ногдох орлогоос хамаарлыг шинжлэх болно.

Регрессийн шинжилгээний үр дүнг ихэвчлэн дараах хэлбэрээр бичдэг.

регрессийн коэффициентүүдийн стандарт алдааг хаалтанд тэмдэглэсэн байна.

Регрессийн коэффициентүүд А = 65,92 болон б= 0.107. хоорондын харилцааны чиглэл yТэгээд xрегрессийн коэффициентийн тэмдгийг тодорхойлно б= 0.107, өөрөөр хэлбэл. холболт нь шууд бөгөөд эерэг байдаг. Коэффицент б= 0.107 нь нэг хүнд ногдох орлого 1-ээр нэмэгддэг болохыг харуулж байна. нэгж хүнсний зардал 0.107 ердийн нэгжээр нэмэгддэг. нэгж

Үүссэн загварын коэффициентүүдийн ач холбогдлыг үнэлж үзье. Коэффицентийн ач холбогдол ( а, б)-аар шалгана т-туршилт:

P-утга ( а) = 0,00080 < 0,01 < 0,05

P-утга ( б) = 0,00016 < 0,01 < 0,05,

Тиймээс коэффициентүүд ( а, б) 1%-ийн түвшинд чухал ач холбогдолтой, 5%-ийн ач холбогдлын түвшинд бүр ч илүү. Тиймээс регрессийн коэффициентүүд нь чухал бөгөөд загвар нь анхны өгөгдөлд хангалттай юм.

Регрессийн үнэлгээний үр дүн нь регрессийн коэффициентүүдийн олж авсан утгуудтай төдийгүй тэдгээрийн тодорхой багцтай (итгэлийн интервал) нийцдэг. 95% магадлалтайгаар коэффициентүүдийн итгэлцлийн интервал нь (38.16 – 93.68) байна. аба (0.0728 – 0.142) хувьд б.

Загварын чанарыг детерминацийн коэффициентээр үнэлдэг Р 2 .

Хэмжээ Р 2 = 0.884 гэдэг нь нэг хүнд ногдох орлогын хүчин зүйл нь хүнсний зардлын өөрчлөлтийн 88.4% -ийг тайлбарлаж чадна гэсэн үг юм.

Ач холбогдол Р 2-ыг шалгана F-тест: ач холбогдол Ф = 0,00016 < 0,01 < 0,05, следовательно, Р 2 нь 1% -ийн түвшинд чухал ач холбогдолтой бөгөөд 5% -ийн ач холбогдлын түвшинд бүр илүү чухал юм.

Хос шугаман регрессийн хувьд корреляцийн коэффициентийг дараах байдлаар тодорхойлж болно . Корреляцийн коэффициентийн олж авсан утга нь хүнсний зардал ба нэг хүнд ногдох орлогын хоорондын хамаарал маш ойрхон байгааг харуулж байна.

Нарийн төвөгтэй үзэгдлийг судлахдаа хоёроос илүү санамсаргүй хүчин зүйлийг харгалзан үзэх шаардлагатай. Эдгээр хүчин зүйлсийн хоорондын хамаарлын мөн чанарын тухай зөв ойлголтыг зөвхөн авч үзэж буй бүх санамсаргүй хүчин зүйлсийг нэг дор судалж байж олж авах боломжтой. Гурав ба түүнээс дээш санамсаргүй хүчин зүйлийн хамтарсан судалгаа нь судлаачид судалж буй үзэгдлүүдийн хоорондын учир шалтгааны хамаарлын талаар бага эсвэл бага үндэслэлтэй таамаглал дэвшүүлэх боломжийг олгоно. Олон харилцааны энгийн хэлбэр нь гурван шинж чанарын шугаман хамаарал юм. Санамсаргүй хүчин зүйлсийг дараах байдлаар тэмдэглэв X 1 , X 2 ба X 3. Хосолсон корреляцийн коэффициентүүд X 1 ба X 2 гэж тэмдэглэнэ r 12, хооронд тус тус X 1 ба X 3 - r 12, хооронд X 2 ба X 3 - r 23. Гурван шинж чанарын хоорондох шугаман хамаарлын ойролцоо байдлын хэмжүүрийн хувьд олон корреляцийн коэффициентийг ашигладаг. Р 1-23, Р 2-13, Р 3 ּ 12 ба хэсэгчилсэн корреляцийн коэффициентийг тэмдэглэв r 12.3 , r 13.2 , r 23.1 .

Гурван хүчин зүйлийн олон корреляцийн коэффициент R 1.23 нь хүчин зүйлүүдийн аль нэг (цэгээс өмнөх индекс) болон бусад хоёр хүчин зүйлийн хослол (цэгээс хойшхи индексүүд) хоорондын шугаман хамаарлын ойролцоо байдлын үзүүлэлт юм.

R коэффициентийн утга нь үргэлж 0-ээс 1-ийн хооронд байна. R нэг рүү ойртох тусам гурван шинж чанарын шугаман хамаарлын зэрэг нэмэгддэг.

Олон корреляцийн коэффициентийн хооронд, жишээ нь. Р 2 ּ 13 , мөн хоёр хос корреляцийн коэффициент r 12 ба r 23-т хамаарал бий: хосолсон коэффициент тус бүр үнэмлэхүй утгаас хэтэрч болохгүй Р 2ּ 13.

Хос корреляцийн коэффициент r 12, r 13 ба r 23-ийн мэдэгдэж буй утгууд бүхий олон корреляцийн коэффициентийг тооцоолох томъёо нь дараах хэлбэртэй байна.

Квадрат олон корреляцийн коэффициент Р 2 гэж нэрлэдэг олон талт детерминацийн коэффициент.Энэ нь судалж буй хүчин зүйлсийн нөлөөгөөр хамааралтай хувьсагчийн хэлбэлзлийн эзлэх хувийг харуулдаг.

Олон корреляцийн ач холбогдлыг дараах байдлаар үнэлдэг Ф- шалгуур:

n -дээжийн хэмжээ; к -хүчин зүйлийн тоо. Манай тохиолдолд к = 3.

популяцийн олон корреляцийн коэффициентийг тэгтэй тэнцүүлэх тухай тэг таамаглал ( h o:r=0) бол хүлээн зөвшөөрнө ее<f t, хэрэв татгалзсан бол
е f ³ еТ.

онолын үнэ цэнэ е- шалгуур үзүүлэлтийг тодорхойлсон v 1 = к- 1 ба v 2 = n - кэрх чөлөөний зэрэг ба хүлээн зөвшөөрөгдсөн ач холбогдлын түвшин a (Хавсралт 1).

Олон корреляцийн коэффициентийг тооцоолох жишээ. Хүчин зүйлийн хоорондын хамаарлыг судлахдаа хос корреляцийн коэффициентийг авсан ( n =15): r 12 ==0.6; g 13 = 0.3; r 23 = - 0,2.

Онцлогийн хамаарлыг олж мэдэх шаардлагатай Xтэмдгээс 2 X 1 ба X 3, өөрөөр хэлбэл олон корреляцийн коэффициентийг тооцоолох:

Хүснэгтийн утга Ф-n 1 = 2 ба n 2 = 15 – 3 = a = 0.05 чөлөөт байдлын 12 зэрэгтэй шалгуур үзүүлэлтүүд Ф 0.05 = 3.89 ба a = 0.01 байна Ф 0,01 = 6,93.

Тиймээс тэмдгүүдийн хоорондын хамаарал Р 2.13 = 0.74 нь чухал ач холбогдолтой
1% -ийн ач холбогдлын түвшин Ф f > Ф 0,01 .

Олон талт детерминацийн коэффициентээр шүүж байна Р 2 = (0.74) 2 = 0.55, шинж чанарын өөрчлөлт X 2 нь 55% нь судалж буй хүчин зүйлсийн нөлөөлөлтэй холбоотой бөгөөд өөрчлөлтийн 45% (1-R 2) нь эдгээр хувьсагчдын нөлөөгөөр тайлбарлах боломжгүй юм.

Хэсэгчилсэн шугаман хамаарал

Хэсэгчилсэн корреляцийн коэффициентгэдэг нь хоёр шинж чанарын нэгдлийн зэрэглэлийг хэмждэг үзүүлэлт юм.

Математик статистик нь тусгай туршилт хийхгүйгээр, харин хос корреляцийн коэффициентийг ашиглан гурав дахь тогтмол утгатай хоёр шинж чанарын хоорондын хамаарлыг тогтоох боломжийг олгодог. r 12 , r 13 , r 23 .

Хэсэгчилсэн корреляцийн коэффициентийг дараахь томъёогоор тооцоолно.

Цэгийн өмнөх тоо нь ямар шинж чанарыг судалж байгааг, цэгийн дараах тоо нь ямар шинж чанарыг хассан (арилгасан) болохыг заана. Хэсэгчилсэн корреляцийн алдаа ба ач холбогдлын шалгуурыг хос корреляцийнхтай ижил томъёогоор тодорхойлно.

.

Онолын үнэ цэнэ т-шалгуур үзүүлэлтийг тодорхойлсон v = n– Эрх чөлөөний 2 зэрэг ба хүлээн зөвшөөрөгдсөн ач холбогдлын түвшин a (Хавсралт 1).

Популяци дахь хэсэгчилсэн корреляцийн коэффициент тэгтэй тэнцүү гэсэн тэг таамаглал ( Х о: r= 0) байвал хүлээн зөвшөөрнө те< т t, хэрэв татгалзсан бол
т f ³ тТ.

Хэсэгчилсэн коэффициентүүд нь -1 ба +1 хоорондох утгыг авч болно. Хувийн тодорхойлох коэффициентүүдХэсэгчилсэн корреляцийн коэффициентийг квадрат болгох замаар олно:

Д 12.3 = r 2 12ּ3 ;г 13.2 = r 2 13ּ2 ;г 23ּ1 = r 2 23ּ1.

Үр дүнтэй шинж чанарт хувь хүний ​​хүчин зүйлсийн хэсэгчилсэн нөлөөллийн түвшинг тодорхойлохын зэрэгцээ энэ хамаарлыг гажуудуулж буй бусад шинж чанаруудтай холбоог арилгах (арилгах) нь ихэвчлэн сонирхолтой байдаг. Заримдаа арилгасан шинж чанарын тогтмол утгатай бол бусад шинж чанаруудын хувьсах байдалд статистик нөлөөллийг анзаарах боломжгүй байдаг. Хэсэгчилсэн корреляцийн коэффициентийг тооцоолох аргыг ойлгохын тулд жишээг авч үзье. Гурван сонголт байна X, ЮТэгээд З. Түүврийн хэмжээний хувьд n= 180 хос корреляцийн коэффициентийг тодорхойлно

r xy = 0,799; r xz = 0,57; r yz = 0,507.

Хэсэгчилсэн корреляцийн коэффициентийг тодорхойлъё.

Параметр хоорондын хэсэгчилсэн корреляцийн коэффициент XТэгээд Ю З (r xyּz = 0.720) нь эдгээр шинж чанаруудын хоорондын хамаарлын зөвхөн өчүүхэн хэсэг нь ерөнхий хамаарлыг харуулж байна ( r xy= 0.799) нь гурав дахь шинж чанарын нөлөөллөөс үүдэлтэй ( З). Параметр хоорондын хэсэгчилсэн корреляцийн коэффициентийн талаар ижил төстэй дүгнэлт хийх ёстой Xба параметр Зтогтмол параметрийн утгатай Ю (r X zּу = 0.318 ба r xz= 0.57). Харин эсрэгээр, параметрүүдийн хоорондын хэсэгчилсэн корреляцийн коэффициент ЮТэгээд Зтогтмол параметрийн утгатай X r yz ּ x= 0.105 нь нийт корреляцийн коэффициент r y-аас мэдэгдэхүйц ялгаатай байна z = 0.507. Үүнээс харахад хэрэв та ижил параметрийн утгатай объектуудыг сонговол тодорхой байна X, дараа нь тэмдгүүдийн хоорондын хамаарал ЮТэгээд ЗЭнэ харилцааны нэлээд хэсэг нь параметрийн өөрчлөлтөөс шалтгаалж байгаа тул тэд маш сул байх болно X.

Зарим тохиолдолд хэсэгчилсэн корреляцийн коэффициент нь хосын шинж тэмдгийн эсрэг байж болно.

Жишээлбэл, шинж чанаруудын хоорондын хамаарлыг судлахдаа X, YТэгээд З- хосолсон корреляцийн коэффициентийг олж авсан (нь n = 100): r xy = 0.6; r X z= 0,9;
r y z = 0,4.

Гурав дахь шинж чанарын нөлөөллийг хассан хэсэгчилсэн корреляцийн коэффициентүүд:

Жишээ нь хос коэффициент ба хэсэгчилсэн корреляцийн коэффициентийн утгууд нь тэмдгээр ялгаатай болохыг харуулж байна.

Хэсэгчилсэн корреляцийн арга нь хоёр дахь эрэмбийн хэсэгчилсэн корреляцийн коэффициентийг тооцоолох боломжтой болгодог. Энэ коэффициент нь гурав, дөрөв дэх тогтмол утгатай эхний болон хоёр дахь шинж чанаруудын хоорондын хамаарлыг илэрхийлдэг. Хоёрдахь эрэмбийн хэсэгчилсэн коэффициентийг тодорхойлохдоо дараах томъёог ашиглан нэгдүгээр эрэмбийн хэсэгчилсэн коэффициент дээр үндэслэнэ.

Хаана r 12 . 4 , r 13 ּ4, r 23 ּ4 - хос корреляцийн коэффициентийг ашиглан утгыг хэсэгчилсэн коэффициентийн томъёогоор тодорхойлдог хэсэгчилсэн коэффициентүүд r 12 , r 13 , r 14 , r 23 , r 24 , r 34 .

Гурван хувьсагчийн олон корреляцийн коэффициент нь шинж чанаруудын аль нэг (зураасны өмнөх индекс үсэг) болон бусад хоёр шинж чанарын хослол (зураасны дараах индексийн үсэг) хоорондын шугаман хамаарлын ойролцоо байдлын үзүүлэлт юм.

; (12.7)

(12.8)

Эдгээр томьёо нь хос корреляцийн коэффициентийн мэдэгдэж буй утгууд бүхий олон корреляцийн коэффициентийг тооцоолоход хялбар болгодог. r xy, r xz болон r yz.

Коэффицент Рсөрөг биш бөгөөд үргэлж 0-ээс 1 хүртэл хэлбэлздэг. Таныг ойртох тусам РНэгд, гурван шинж чанарын хоорондох шугаман холболтын зэрэг нэмэгддэг. Олон корреляцийн коэффициентийн хооронд, жишээ нь. Р у-хз, ба хоёр хос корреляцийн коэффициент r yxТэгээд r yzдараах хамаарал байна: хосолсон коэффициент бүр үнэмлэхүй утгаас хэтэрч болохгүй Р у-хз.

Квадрат олон корреляцийн коэффициент R 2олон детерминацийн коэффициент гэж нэрлэдэг. Энэ нь судалж буй хүчин зүйлсийн нөлөөгөөр хамааралтай хувьсагчийн хэлбэлзлийн эзлэх хувийг харуулдаг.

Олон корреляцийн ач холбогдлыг дараах байдлаар үнэлдэг
Ф- шалгуур:

, (12.9)

n- дээжийн хэмжээ,

к- тэмдгийн тоо; манай тохиолдолд к = 3.

Онолын үнэ цэнэ Ф– шалгуурыг өргөдлийн хүснэгтээс авсан болно ν 1 = k-1 ба ν 2 = n–kэрх чөлөөний зэрэг ба хүлээн зөвшөөрөгдсөн ач холбогдлын түвшин. Популяци дахь олон корреляцийн коэффициент тэгтэй тэнцүү гэсэн тэг таамаглал ( H0: R= 0) бол хүлээн зөвшөөрнө F баримт.< F табл . бөгөөд хэрэв татгалзсан бол F баримт. ≥ F хүснэгт.

Ажлын төгсгөл -

Энэ сэдэв нь дараах хэсэгт хамаарна.

Математикийн статистик

Боловсролын байгууллага.. Гомелийн Улсын Их Сургууль.. Фрэнсис Скарина Ю М Жученкогийн нэрэмжит..

Хэрэв танд энэ сэдвээр нэмэлт материал хэрэгтэй бол эсвэл хайж байсан зүйлээ олоогүй бол манай ажлын мэдээллийн санд байгаа хайлтыг ашиглахыг зөвлөж байна.

Хүлээн авсан материалыг бид юу хийх вэ:

Хэрэв энэ материал танд хэрэгтэй байсан бол та үүнийг нийгмийн сүлжээн дэх хуудсандаа хадгалах боломжтой.

Энэ хэсгийн бүх сэдвүүд:

Заавар
1-31 01 01 “Биологи” мэргэжлээр суралцаж буй их дээд сургуулийн оюутнуудад зориулсан Гомель 2010 он.

Математик статистикийн сэдэв, арга
Математик статистикийн сэдэв нь биологи, эдийн засаг, технологи болон бусад салбар дахь масс үзэгдлийн шинж чанарыг судлах явдал юм. Эдгээр үзэгдлүүд нь олон янз байдал (хувилбарууд) -аас шалтгаалан ихэвчлэн нарийн төвөгтэй байдлаар илэрдэг.

Санамсаргүй үйл явдлын тухай ойлголт
Массын үзэгдлийг судлах аргын үндсэн бүрэлдэхүүн хэсэг болох статистикийн индукц буюу статистик дүгнэлт нь өөрийн гэсэн онцлог шинж чанартай байдаг. Статистикийн дүгнэлтийг тоон үзүүлэлтээр хийдэг

Санамсаргүй тохиолдлын магадлал
Аливаа хангалттай том цуврал туршилтуудын хувьд үйл явдлын давтамж нь энэ шинж чанараас бага зэрэг ялгаатай шинж чанартай санамсаргүй үйл явдлын тоон шинж чанарыг нэрлэдэг.

Магадлалыг тооцоолох
Ихэнхдээ магадлалыг нэгэн зэрэг нэмэх, үржүүлэх шаардлагатай байдаг. Жишээлбэл, 2 шоо зэрэг шидэхэд 5 оноо авах магадлалыг тодорхойлох хэрэгтэй. Шаардлагатай хэмжээ байх магадлалтай

Санамсаргүй хэмжигдэхүүний тухай ойлголт
Магадлалын тухай ойлголтыг тодорхойлж, түүний үндсэн шинж чанаруудыг тодруулсны дараа магадлалын онолын хамгийн чухал ойлголтуудын нэг болох санамсаргүй хэмжигдэхүүний тухай ойлголтыг авч үзье.

Үүний үр дүнд гэж үзье
Дискрет санамсаргүй хэмжигдэхүүн

Санамсаргүй хэмжигдэхүүн нь түүний боломжит утгуудын багц нь хязгаарлагдмал эсвэл наад зах нь тоолох боломжтой бол салангид хэмжигдэхүүн юм. X санамсаргүй хэмжигдэхүүн x1 утгыг авч чадна гэж бодъё
Тасралтгүй санамсаргүй хэмжигдэхүүнүүд

Өмнөх дэд хэсэгт авч үзсэн дискрет санамсаргүй хэмжигдэхүүнүүдээс ялгаатай нь тасралтгүй санамсаргүй хэмжигдэхүүний боломжит утгуудын багц нь зөвхөн хязгаарлагдмал биш, бас хамаарахгүй.
Хүлээлт ба зөрүү

Энэ тархалтын хамгийн чухал шинж чанарыг илэрхийлдэг нэг эсвэл хоёр тоон үзүүлэлтийг ашиглан санамсаргүй хэмжигдэхүүний тархалтыг тодорхойлох шаардлагатай байдаг. Иймд
Хормууд

Математикийн статистикт санамсаргүй хэмжигдэхүүний тархалтын моментууд маш чухал байдаг. Математикийн хүлээлтэд санамсаргүй хэмжигдэхүүний том утгыг хангалттай тооцдоггүй.
Бином тархалт ба магадлалын хэмжилт

Энэ сэдвээр бид дискрет санамсаргүй хэмжигдэхүүний тархалтын үндсэн төрлүүдийг авч үзэх болно. Нэг туршилтын явцад санамсаргүй тохиолдлын А үйл явдал тохиолдох магадлал тэнцүү гэж үзье.
Тэгш өнцөгт (нэг жигд) хуваарилалт

Тэгш өнцөгт (нэг жигд) тархалт нь тасралтгүй тархалтын хамгийн энгийн хэлбэр юм. Хэрэв санамсаргүй хэмжигдэхүүн X нь (a, b) интервалд ямар ч бодит утгыг авч чадвал a ба b нь бодит байна
Ердийн тархалт нь математик статистикийн үндсэн үүрэг гүйцэтгэдэг. Энэ нь санамсаргүй байдлаар тохиолддоггүй: объектив бодит байдал дээр янз бүрийн шинж тэмдгүүд ихэвчлэн тохиолддог.

Логнормаль тархалт
X = lnY санамсаргүй хэмжигдэхүүн нь μ ба & параметртэй ижил хэвийн тархалттай бол санамсаргүй хэмжигдэхүүн Y нь μ ба σ параметртэй логнормаль тархалттай байна.

Дундаж утгууд
Бүх бүлгийн шинж чанаруудаас шинж чанарын дундаж утгаар хэмжигдэх дундаж түвшин нь онолын болон практикийн хамгийн чухал ач холбогдолтой юм.

Онцлогийн дундаж утга нь маш гүн гүнзгий ойлголт юм.
Дундажуудын ерөнхий шинж чанарууд

Дундаж утгыг зөв ашиглахын тулд эдгээр үзүүлэлтүүдийн шинж чанарыг мэдэх шаардлагатай: дундаж байршил, хийсвэр байдал, нийт үйл ажиллагааны нэгдмэл байдал.
Тоон утгын дагуу

Арифметик дундаж
Дундаж утгын ерөнхий шинж чанарыг агуулсан арифметик дундаж нь өөрийн гэсэн шинж чанартай байдаг бөгөөд үүнийг дараах томъёогоор илэрхийлж болно.

Дундаж зэрэглэл (параметрийн бус дундаж)
Тоон хэмжилтийн аргууд хараахан олдоогүй байгаа шинж чанаруудын дундаж зэрэглэлийг тодорхойлно. Эдгээр шинж тэмдгүүдийн илрэлийн зэргээс хамааран объектуудыг эрэмбэлж болно, жишээлбэл.

Жинлэсэн арифметик дундаж
Ихэвчлэн арифметик дундажийг тооцоолохын тулд шинж чанарын бүх утгыг нэмж, үр дүнгийн нийлбэрийг сонголтуудын тоонд хуваадаг. Энэ тохиолдолд нийлбэрт орсон утга бүр нь үүнийг бүрэн хэмжээгээр нэмэгдүүлдэг

Дундаж дөрвөлжин
Дундаж квадратыг томъёогоор тооцоолно: , (6.5) Энэ нь нийлбэрийн квадрат язгууртай тэнцүү байна.

Медиан
Медиан нь бүхэл бүтэн бүлгийг хоёр тэнцүү хэсэгт хуваадаг шинж чанарын утга юм: нэг хэсэг нь голчоос бага шинж чанартай, нөгөө хэсэг нь илүү их утгатай байна.

Жишээлбэл, хэрэв танд байгаа бол
Геометрийн дундаж

N өгөгдөлтэй бүлгийн геометрийн дундажийг авахын тулд та бүх хувилбаруудыг үржүүлж, үр дүнгээс n-р үндсийг гаргаж авах хэрэгтэй.
Гармоник дундаж

Гармоник дундажийг томъёогоор тооцоолно. (6.14) Таван хувилбарт: 1, 4, 5, 5 Лхагва гараг
Стандарт хазайлт нь арифметик дундажтай ижил хэмжлийн нэгжээр илэрхийлэгдсэн нэрлэсэн утга юм.

Тиймээс өөр өөр нэгжээр илэрхийлэгдсэн өөр өөр шинж чанаруудыг харьцуулах
Хязгаарлалт ба хамрах хүрээ

Олон янз байдлын зэргийг хурдан бөгөөд ойролцоо үнэлэхийн тулд хамгийн энгийн үзүүлэлтүүдийг ихэвчлэн ашигладаг: lim = (min ¸ max) - хязгаар, өөрөөр хэлбэл шинж чанарын хамгийн бага ба хамгийн том утгууд, p =
Хэвийн хазайлт

Дүрмээр бол шинж чанарын хөгжлийн түвшинг хэмжих замаар тодорхойлж, тодорхой нэрлэсэн тоогоор илэрхийлнэ: 3 кг жин, 15 см урт, зөгий далавч дээрх 20 дэгээ, сүүнд 4% өөх тос, 15 кг хайчлах
Нийт бүлгийн дундаж ба сигма

Заримдаа хэд хэдэн тархалтаас бүрдэх хураангуй тархалтын дундаж ба сигма-г тодорхойлох шаардлагатай байдаг. Энэ тохиолдолд тархалт нь өөрөө мэдэгддэггүй, харин зөвхөн дундаж болон сигма нь мэдэгддэг.
Тархалтын муруйн хазайлт (хатуу) ба эгц байдал (куртоз).

Том түүврийн хувьд (n > 100) өөр хоёр статистикийг тооцдог.
Муруйн хазайлтыг тэгш бус байдал гэж нэрлэдэг.

Вариацын цуврал
Судалгаанд хамрагдсан бүлгүүдийн тоо нэмэгдэх тусам жижиг бүлгүүдэд санамсаргүй хэлбэрээр нуугдаж байсан олон янз байдлын хэв маяг улам бүр тодорхой болж байна.

Гистограмм ба вариацын муруй
Гистограмм нь диаграм хэлбэрээр үзүүлсэн вариацын цуврал бөгөөд янз бүрийн давтамжийн утгыг баарны өөр өөр өндрөөр төлөөлдөг. Өгөгдлийн тархалтын гистограмыг p-д үзүүлэв

Түгээлтийн ялгааны найдвартай байдал
Статистикийн таамаглал нь ажиглагдсан түүврийн өгөгдлийн суурь болох магадлалын тархалтын талаарх тодорхой таамаглал юм.

Статистик таамаглалыг шалгах нь хүлээн зөвшөөрөх үйл явц юм
Хазайлт ба хөшигний шалгуур

Ургамал, амьтан, бичил биетний зарим шинж чанарууд нь объектуудыг бүлэгт нэгтгэхдээ ердийнхөөс эрс ялгаатай тархалтыг өгдөг.
Ямар нэгэн тохиолдолд

Популяци ба дээж
Түүврийн үзүүлэлтүүдийг ашиглан ерөнхий параметрүүдийг тооцоолох нь өөрийн гэсэн шинж чанартай байдаг.

Хэсэг нь хэзээ ч бүхэл бүтэн шинж чанарыг бүрэн илэрхийлж чадахгүй, тиймээс нийт хүн амын шинж чанарууд
Итгэлийн хил хязгаар

Ерөнхий параметрүүдийн боломжит утгыг олохын тулд түүврийн үзүүлэлтүүдийг ашиглахын тулд төлөөллийн алдааны хэмжээг тодорхойлох шаардлагатай. Энэ процессыг o гэж нэрлэдэг
Үнэлгээний ерөнхий журам

Ерөнхий параметрийг үнэлэхэд шаардлагатай гурван хэмжигдэхүүн - түүврийн үзүүлэлт (), найдвартай байдлын шалгуур
Арифметик дундажийг тооцоолох

Дундаж утгыг тооцоолох нь судалж буй объектын ангиллын ерөнхий дундаж утгыг тогтооход чиглэгддэг. Энэ зорилгоор шаардагдах төлөөллийн алдааг дараахь томъёогоор тодорхойлно.
Дундаж зөрүүг тооцоолох

Зарим судалгаанд хоёр хэмжилтийн зөрүүг үндсэн өгөгдөл болгон авдаг. Энэ нь түүвэрт байгаа хувь хүн бүрийг өөр өөр насны, эсвэл хоёр төлөвт судлах тохиолдолд тохиолдож болно.
Дундаж зөрүүний найдваргүй, найдвартай тооцоо

Ерөнхий параметрийн тодорхой тооцоог гаргаж чадахгүй (тэгээс их, бага, эсвэл тэгтэй тэнцүү) түүвэр судалгааны ийм үр дүнг найдваргүй гэж нэрлэдэг.
Ерөнхий дундаж хоорондын ялгааг тооцоолох

Биологийн судалгаанд хоёр хэмжигдэхүүний ялгаа онцгой чухал байдаг. Өөр өөр популяци, арьсны өнгө, үүлдэр, сорт, удам угсаа, гэр бүл, туршилт, хяналтын бүлгүүдийн хооронд харьцуулалт хийдэг (gr арга
Ялгаатай найдвартай байдлын шалгуур

Найдвартай ялгааг олж авах нь судлаачдын хувьд ихээхэн ач холбогдолтой тул олж авсан үр дүн нь найдвартай, бодитой эсэхийг тодорхойлох аргуудыг эзэмших шаардлагатай байна.
Чанарын шинж чанарыг судлахад төлөөлөх чадвар

Чанарын шинж чанарууд нь ихэвчлэн илрэлийн зэрэгтэй байж чаддаггүй: тэдгээр нь хувь хүн бүрт байдаг эсвэл байдаггүй, жишээлбэл, хүйс, санал асуулга, зарим шинж чанар, хэв гажилт, гажиг гэх мэт.
Хувьцааны зөрүүний найдвартай байдал

Түүврийн харьцааны зөрүүний найдвартай байдлыг дундаж утгын зөрүүтэй ижил аргаар тодорхойлно: (10.34)
Корреляцийн коэффициент

Олон тооны судалгаанууд нь тэдгээрийн харилцан хамаарлын олон шинж чанарыг судлахыг шаарддаг. Хэрэв та хоёр шинж чанартай холбоотой ийм судалгаа хийвэл нэг шинж чанарын хувьсах чадвар тийм биш гэдгийг анзаарах болно
Корреляцийн коэффициентийн алдаа

Түүврийн корреляцийн коэффициентийн найдвартай байдал
Түүврийн корреляцийн коэффициентийн шалгуурыг дараах томъёогоор тодорхойлно: (11.9) Үүнд:

Корреляцийн коэффициентийн итгэлийн хязгаар
Корреляцийн коэффициентийн ерөнхий утгын итгэлийн хязгаарыг дараах томъёогоор ерөнхийд нь олно.

Хоёр корреляцийн коэффициентийн зөрүүний найдвартай байдал
Корреляцийн коэффициентүүдийн зөрүүний найдвартай байдлыг ердийн томъёоны дагуу дундаж утгын зөрүүний найдвартай байдлын нэгэн адил тодорхойлно.

Шулуун регрессийн тэгшитгэл
Шулуун шугамын хамаарал нь холболтын энэ хэлбэрийн хувьд эхний шинж чанарын ижил өөрчлөлт бүр нь бүрэн тодорхой бөгөөд бусад шинж чанарын дундаж өөрчлөлттэй тохирч байгаагаараа ялгаатай.

Шугаман регрессийн тэгшитгэлийн элементүүдийн алдаа
Энгийн шугаман регрессийн тэгшитгэлд: y = a + bx, төлөөллийн гурван алдаа үүснэ.

1 Регрессийн коэффициентийн алдаа:
Хэсэгчилсэн корреляцийн коэффициент

Хэсэгчилсэн корреляцийн коэффициент нь гурав дахь тогтмол утгатай хоёр шинж чанарыг нэгтгэх зэргийг хэмждэг үзүүлэлт юм.
Математик статистик нь харилцан хамаарлыг тогтоох боломжийг олгодог

Шугаман олон регрессийн тэгшитгэл
Гурван хувьсагчийн хоорондох шулуун шугамын хамаарлын математикийн тэгшитгэлийг олон шугаман регрессийн хавтгай тэгшитгэл гэнэ. Энэ нь дараахь ерөнхий хэлбэртэй байна.

Корреляцийн хамаарал
Хэрэв судалж буй үзэгдлүүдийн хоорондын хамаарал нь графикаас тогтооход хялбар шугаман байдлаас ихээхэн хазайсан бол корреляцийн коэффициент нь холболтын хэмжүүр болгон тохиромжгүй болно. Тэр байхгүй байгааг онцолж чадна

Корреляцийн харилцааны шинж чанарууд
Корреляцийн харьцаа нь ямар ч хэлбэрийн корреляцийн түвшинг хэмждэг.

Үүнээс гадна корреляцийн хамаарал нь статистикийн хувьд ихээхэн сонирхол татдаг бусад олон шинж чанартай байдаг
Корреляцийн харилцааны төлөөллийн алдаа

Корреляцийн харилцааны төлөөллийн алдааны нарийн томъёог хараахан боловсруулаагүй байна. Ихэвчлэн сурах бичигт өгөгдсөн томъёо нь үргэлж үл тоомсорлож болохгүй сул талуудтай байдаг. Энэ томъёо нь заадаггүй
Корреляцийн шугаман байдлын шалгуур

Муруй шугаман хамаарлыг шулуун шугамтай ойролцоох түвшинг тодорхойлохын тулд F шалгуурыг ашиглан дараах томъёогоор тооцоолно.
Статистикийн нөлөөлөл нь судалгаанд зохион байгуулагдсан хүчин зүйлийн олон янз байдлын (түүний зэрэглэл) үр дүнд бий болсон шинж чанарын олон янз байдлын тусгал юм.

Нео хүчин зүйлийн нөлөөллийг үнэлэх
Хүчин зүйлийн нөлөөлөл

Хүчин зүйлийн нөлөөлөл гэдэг нь судалж буй хүчин зүйлсийн энгийн буюу хосолсон статистик нөлөөлөл юм.
Нэг хүчин зүйлийн цогцолборуудад нэг хүчин зүйлийн энгийн нөлөөллийг тодорхой зохион байгуулалтад судалдаг

Нэг хүчин зүйлийн дисперсийн цогцолбор
Дисперсийн шинжилгээг английн эрдэмтэн Р.А.Фишер хөгжүүлж, хөдөө аж ахуй, биологийн судалгааны практикт нэвтрүүлж, дундаж квадратуудын харьцааны тархалтын хуулийг нээсэн.

Олон хүчин зүйлийн дисперсийн цогцолбор
Вариацын шинжилгээний математик загварын талаар тодорхой ойлголттой байх нь шаардлагатай тооцооллын үйлдлүүдийг ойлгоход тустай, ялангуяа олон хувьсагчтай туршилтын өгөгдлийг боловсруулах үед

Өөрчлөлтүүд
Туршилтын материалыг боловсруулахад дисперсийн шинжилгээг зөв ашиглах нь хувилбарууд (дээж) дээрх дисперсийн нэг төрлийн, хэвийн эсвэл хэвийн тархалттай ойролцоо байх нөхцлийг бүрдүүлдэг.

Нөлөөллийн хүч чадлын үзүүлэлтүүд
Тэдний үр дүнд үндэслэн нөлөөллийн хүчийг тодорхойлох нь биологи, хөдөө аж ахуй, анагаах ухаанд нөлөөллийн хамгийн үр дүнтэй арга хэрэгслийг сонгох, физик, химийн бодисын тунг сонгох шаардлагатай байдаг.

Нөлөөллийн хүч чадлын үндсэн үзүүлэлтийг төлөөлөх алдаа
Нөлөөллийн хүч чадлын гол үзүүлэлт болох алдааны нарийн томъёо хараахан олдоогүй байна.

Нэг хүчин зүйлийн цогцолборуудад төлөөллийн алдаа нь зөвхөн нэг хүчин зүйлийн үзүүлэлтээр тодорхойлогддог
Нөлөөллийн үзүүлэлтүүдийн хязгаарын утгууд

Нөлөөллийн хүч чадлын гол үзүүлэлт нь нийт нэр томъёоны нийлбэрээс нэг нэр томъёоны эзлэх хувьтай тэнцүү байна. Үүнээс гадна энэ үзүүлэлт нь корреляцийн харьцааны квадраттай тэнцүү байна. Эдгээр хоёр шалтгааны улмаас эрчим хүчний үзүүлэлт
Нөлөөллийн найдвартай байдал

Түүврийн судалгаагаар олж авсан нөлөөллийн хүч чадлын гол үзүүлэлт нь юуны түрүүнд судалж буй объектын бүлэгт бодитоор илэрсэн нөлөөллийн түвшинг тодорхойлдог.
Ялгаварлах шинжилгээ

Дискриминант шинжилгээ нь олон талт статистик шинжилгээний аргуудын нэг юм. Ялгаварлан гадуурхах шинжилгээний зорилго нь янз бүрийн шинж чанаруудыг (онцлогууд, хосууд) хэмжихэд үндэслэдэг.
Хэд хэдэн таамаглал биелсэн тохиолдолд ялгаварлан гадуурхах шинжилгээ "ажиллах" болно.

Ажиглаж болох хэмжигдэхүүн буюу объектын хэмжигдэхүйц шинж чанар нь хэвийн тархалттай гэсэн таамаглал. Энэ
Дискриминант анализын алгоритм

Ялгаварлан гадуурхах асуудлын шийдэл (ялгаварлан гадуурхах шинжилгээ) нь бүх түүврийн орон зайг (харгалзаж буй бүх олон хэмжээст санамсаргүй хэмжигдэхүүнүүдийн бодит байдлын багц) тодорхой тоонд хуваахаас бүрдэнэ.
Кластер шинжилгээ

Кластер шинжилгээ нь ангиллыг хийхэд ашигладаг янз бүрийн процедурыг нэгтгэдэг. Эдгээр процедурыг хэрэглэсний үр дүнд объектуудын анхны багц нь кластер эсвэл бүлэгт хуваагддаг
Кластер шинжилгээний аргууд

Практикт бөөгнөрөл кластерын аргыг ихэвчлэн хэрэгжүүлдэг.
Ихэвчлэн ангилал эхлэхээс өмнө өгөгдлийг стандартчилдаг (дунджийг хасч, квадрат язгуурт хуваадаг)



Кластер шинжилгээний алгоритм Кластер шинжилгээ гэдэг нь объектын хоорондох зайн ойлголтыг тодорхойлж, дараа нь тэдгээрээс бүлгүүдийг тодорхойлох үндсэн дээр олон хэмжээст ажиглалт эсвэл объектыг ангилах аргуудын багц юм.