Как построить поле корреляции. Смотреть страницы где упоминается термин поле корреляции

Системное решение проблем Лапыгин Юрий Николаевич

7.3. Поле корреляции

7.3. Поле корреляции

Логика – смирительная рубашка фантазии.

Хельмар Нар

Для установления связей между двумя переменными обычно строят графики.

Если обе переменные изменяются синхронно, это может означать, что между ними существуют связи и они влияют друг на друга. Примером может служить динамика роста доли заработной платы в структуре себестоимости продукции и динамика производительности труда. Наблюдения показывают, что при росте первой переменной растет и вторая.

Хотя следует иметь в виду, что даже если и имеется некоторая степень синхронности изменения переменных, то это еще не означает безусловного наличия между ними причинно-следственной связи (возможно, есть третья переменная, которая вызывает такой эффект).

Примеры корреляционных полей приведены на рис. 7.2.

Описание построения графика представлено ниже.

1. Выбирают для анализа две переменные: одну независимую, другую – зависимую.

2. Для каждого значения независимой переменной измеряют соответствующее значение зависимой. Эти два значения образуют пару данных, которые наносят точкой на график. Обычно следует брать не менее 30 точек, но для построения осмысленного графика число точек должно быть не менее 100.

3. Значение независимой переменной, характеризующей ожидаемую причину, откладывают по оси х , а значение зависимой, характеризующей проблему, – по оси у .

4. Полученные пары данных наносят точками на график и анализируют полученный результат. Если корреляция на схеме не проявляется, то можно попробовать построить график в логарифмическом масштабе.

Из книги Маркетинговые войны автора Райс Эл

Из книги Рекламный текст. Методика составления и оформления автора Бердышев Сергей Николаевич

5.2. Ономастическое поле А.В. Суперанская, Н.В. Подольская и другие лингвисты склонны выделять следующие классы называемых объектов и соответствующие им ономастические разряды, значимые для нейминга и коммерции в целом: наименования документов и законов – документонимы,

Из книги Этим надо воспользоваться автора Словцова Ирина

Один в поле не воин? Несколько лет я работала в районной прессе и писала о проблемах местного самоуправления. Должна сказать, что чиновничий аппарат настолько структурирован, выстроен по иерархической схеме, пронизывает все сферы нашей жизни, что одному человеку (даже

Из книги Моя жизнь в рекламе автора Хопкинс Клод

Из книги iПрезентация. Уроки убеждения от лидера Apple Стива Джобса автора Галло Кармин

«Поле искривления реальности» Скалли был свидетелем того, что вице-президент Apple Бад Триббл однажды описал как «поле искривления реальности» - способность убедить любого практически в чем угодно. Многие люди не могут противостоять этому магнетическому притяжению и

Из книги Выставочный менеджмент: стратегии управления и маркетинговые коммуникации автора Филоненко Игорь

9. Паблик рилейшнз на выставочном поле 9.1. Цели, задачи, инструменты общественных связей на выставочном поле В широком смысле паблик рилейшнз (далее - PR) определяют как «планируемые и осуществляемые усилия, направленные на установление и поддержание доброжелательных

Из книги Вдохновляющий менеджер автора Лири-Джойс Джудит

«Поле чудес» Мне лично кажется, что это отличная перспектива: о лучшем и мечтать не приходится. Собственно, именно поэтому я и написала эту книгу. Вы смотрели фильм «Поле чудес» («Field of Dreams»)? Там герой Кевина Костнера решает построить на своей кукурузной плантации

Из книги Рекламное агентство: с чего начать, как преуспеть автора Голованов Василий Анатольевич

«В поле!» В данной главе мы рассмотрим все основные вопросы, касающиеся основного этапа работы по проведению переговоров и заключению договоров на те услуги, которые вы собираетесь продавать.Все предприниматели в 80 % случаев легкодоступны для переговоров – знаю из

Из книги Apple. Феномен веры автора Васильев Юрий Николаевич

Поле измененной реальности Один из главных разработчиков первого Мака Энди Херцвильд сказал о Стиве Джобсе следующее: «Поле искажения реальности было поразительной смесью харизматического ораторского стиля, упрямства и желания вывернуть любой факт так, чтобы он

Из книги Этикет. Полный свод правил светского и делового общения. Как вести себя в привычных и нестандартных ситуациях автора Белоусова Татьяна

Из книги Что не убило компанию LEGO, а сделало ее сильнее. Кирпичик за кирпичиком автора Брин Билл

Из книги Три круга лидерства автора Сударкин Александр

Один в поле не воин. Подключаем к работе HR-специалиста Какое-то время назад, в середине 2000-х, на форумах менеджеров по персоналу активно обсуждалась тема «HR как стратегический партнер руководителя». Споры сменялись временными консенсусами, приглашенные выступить

Из книги Запуск! Быстрый старт для вашего бизнеса автора Уокер Джефф

Из книги Большая книга директора магазина 2.0. Новые технологии автора Крок Гульфира

Из книги Обнимите своих клиентов. Практика выдающегося обслуживания автора Митчелл Джек

Из книги Методические указания по организации работы епархиальной пресс-службы автора Е Жуковская Е

Корреляционный анализ

1.3 Корреляционные поля и цель их построения

Корреляция изучается на основании экспериментальных данных, представляющих собой измеренные значения (x i , y i) двух признаков. Если экспериментальных данных немного, то двумерное эмпирическое распределение представляется в виде двойного ряда значений x i и y i . При этом корреляционную зависимость между признаками можно описывать разными способами. Соответствие между аргументом и функцией может быть задано таблицей, формулой, графиком и т. д.

Корреляционный анализ, как и другие статистические методы, основан на использовании вероятностных моделей, описывающих поведение исследуемых признаков в некоторой генеральной совокупности, из которой получены экспериментальные значения x i и y i . Когда исследуется корреляция между количественными признаками, значения которых можно точно измерить в единицах метрических шкал (метры, секунды, килограммы и т.д.), то очень часто принимается модель двумерной нормально распределенной генеральной совокупности. Такая модель отображает зависимость между переменными величинами x i и y i графически в виде геометрического места точек в системе прямоугольных координат. Эту графическую зависимость называются также диаграммой рассеивания или корреляционным полем.
Данная модель двумерного нормального распределения (корреляционное поле) позволяет дать наглядную графическую интерпретацию коэффициента корреляции, т.к. распределение в совокупности зависит от пяти параметров: м x , м y - средние значения (математические ожидания); у x ,у y - стандартные отклонения случайных величин Х и Y и р - коэффициент корреляции, который является мерой связи между случайными величинами Х и Y.
Если р = 0, то значения, x i , y i , полученные из двумерной нормальной совокупности, располагаются на графике в координатах х, у в пределах области, ограниченной окружностью (рисунок 5, а). В этом случае между случайными величинами Х и Y отсутствует корреляция и они называются некоррелированными. Для двумерного нормального распределения некоррелированность означает одновременно и независимость случайных величин Х и Y.

Рисунок 5 - Графическая интерпретация взаимосвязи между показателями

Если р = 1 или р = -1, то между случайными величинами Х и Y существует линейная функциональная зависимость (Y = c + dX). В этом случае говорят о полной корреляции. При р = 1 значения x i , y i определяют точки, лежащие на прямой линии, имеющей положительный наклон (с увеличением x i значения y i также увеличиваются), при р = -1 прямая имеет отрицательный наклон (рисунок 5, б). В промежуточных случаях (-1 < p < 1) точки, соответствующие значениям xi , y i , попадают в область, ограниченную некоторым эллипсом (рисунок 5, в, г), причем при p > 0 имеет место положительная корреляция (с увеличением x i значения y i имеют тенденцию к возрастанию), при p < 0 корреляция отрицательная. Чем ближе р к, тем уже эллипс и тем теснее экспериментальные значения группируются около прямой линии. Здесь же следует обратить внимание на то, что линия, вдоль которой группируются точки, может быть не только прямой, а иметь любую другую форму: парабола, гипербола и т. д. В этих случаях мы рассматривали бы так называемую, нелинейную (или криволинейную) корреляцию (риунок 5, д).

Таким образом, визуальный анализ корреляционного поля помогает выявить не только наличия статистической зависимости (линейную или нелинейную) между исследуемыми признаками, но и ее тесноту и форму. Это имеет существенное значение для следующего шага в анализе ѕ выбора и вычисления соответствующего коэффициента корреляции.

Корреляционную зависимость между признаками можно описывать разными способами. В частности, любая форма связи может быть выражена уравнением общего вида Y = f(X), где признак Y - зависимая переменная, или функция от независимой переменной X, называемой аргументом. Соответствие между аргументом и функцией может быть задано таблицей, формулой, графиком и т. д.

Динамическое программирование

В сельском хозяйстве непрерывно протекают разнообразные экономические процессы, в результате которых складываются определенные производственные результаты, формируются экономические явления...

Целью курсовой работы является: развитие умения разрабатывать имитационные модели организационных и технических объектов, а также получения практических навыков работы в среде GPSS World...

Имитационное моделирование работы билетной кассы железнодорожного вокзала

Исследование функционирования работы билетной кассы на железнодорожном вокзале и анализ влияния времени обслуживания в каждой кассе на очереди и количество обслуженных гражданских и военных пассажиров...

Исследование свойств случайных величин, планирование эксперимента и анализ данных

Корреляционное поле используется для выявления и демонстрации зависимостей между двумя связанными наборами данных и для подтверждения предполагаемых зависимостей между ними...

Корреляционно-регрессионный анализ однофакторной стохастической связи

Метод последовательных сравнений

Программно реализовать интерактивный метод последовательных...

Моделирование систем массового обслуживания

Развитие современного общества характеризуется повышением технического уровня, усложнением организационной структуры производства, углублением общественного разделения труда...

Обработка результатов полного факторного плана для получения математической модели результатов полного факторного плана

Основными целями и задачами планирования эксперимента являются: 1) Планирование эксперимента с целью математического описания объекта. Целью данного эксперимента является получение математической модели методом регрессионного анализа...

Определение рационального маршрута следования коммивояжера

Целью данной работы является определение рационального маршрута следования коммивояжера и выбора экономически целесообразного способа поездки. Задача - выбрать такой вид транспорта для объезда коммивояжером населенных пунктов...

Оценка инвестиционных проектов

Необходимо разработать имитационную модель финансово-экономической деятельности фирмы по реализации этого проекта, выбрать схему финансирования и оценить показатели экономической эффективности проекта...

Построение структурной схемы устройства станка 3Б722

Выбор объекта морфологического исследования. Приобретение практических навыков структурного анализа. 2. Общие сведения Шлифование - это процесс обработки заготовок абразивными материалами...

Разработка модели предприятия тепличного хозяйства, используя методологии проектирования IDEF0, DFD и IDEF3

Целями данной курсовой работы были: применение методов предпроектного обследования предприятия; анализ полученных материалов для последующего моделирования; разработка модели процесса в стандарте IDEF0; описание документооборота и...

Трендовые и корреляционные модели

Функциональное моделирование

Создаваемая IDEF0-модель имеет конкретное назначение, называемое целью модели. Цель моделирования можно понять из следующего формального определения модели : M есть модель системы S...

Эконометрические модели рентабельности собственного капитала (на примере СПК "Слава")

Так как в данной курсовой работе рассматривается рентабельность собственного капитала, то возьмем ее за результативный показатель. Одним из факторов, оказывающих влияние, является рентабельность продаж, %...

Корреляция изучается на основании экспериментальных данных, представляющих собой измеренные значения (xi, yi) двух признаков. Если экспериментальных данных немного, то двумерное эмпирическое распределение представляется в виде двойного ряда значений xi и yi. При этом корреляционную зависимость между признаками можно описывать разными способами. Соответствие между аргументом и функцией может быть задано таблицей, формулой, графиком и т. д.

Корреляционный анализ, как и другие статистические методы, основан на использовании вероятностных моделей, описывающих поведение исследуемых признаков в некоторой генеральной совокупности, из которой получены экспериментальные значения xi и yi. Когда исследуется корреляция между количественными признаками, значения которых можно точно измерить в единицах метрических шкал (метры, секунды, килограммы и т.д.), то очень часто принимается модель двумерной нормально распределенной генеральной совокупности. Такая модель отображает зависимость между переменными величинами xi и yi графически в виде геометрического места точек в системе прямоугольных координат. Эту графическую зависимость называются также диаграммой рассеивания или корреляционным полем.

Данная модель двумерного нормального распределения (корреляционное поле) позволяет дать наглядную графическую интерпретацию коэффициента корреляции, т.к. распределение в совокупности зависит от пяти параметров: μx, μy – средние значения (математические ожидания); σx,σy – стандартные отклонения случайных величин Х и Y и р – коэффициент корреляции, который является мерой связи между случайными величинами Х и Y.

Если р = 0, то значения, xi, yi, полученные из двумерной нормальной совокупности, располагаются на графике в координатах х, у в пределах области, ограниченной окружностью (рисунок 5, а). В этом случае между случайными величинами Х и Y отсутствует корреляция и они называются некоррелированными. Для двумерного нормального распределения некоррелированность означает одновременно и независимость случайных величин Х и Y.

Если р = 1 или р = -1, то между случайными величинами Х и Y существует линейная функциональная зависимость (Y = c + dX). В этом случае говорят о полной корреляции. При р = 1 значения xi, yi определяют точки, лежащие на прямой линии, имеющей положительный наклон (с увеличением xi значения yi также увеличиваются), при р = -1 прямая имеет отрицательный наклон (рисунок 5, б). В промежуточных случаях (-1 < p < 1) точки, соответствующие значениям xi, yi, попадают в область, ограниченную некоторым эллипсом (рисунок 5, в, г), причем при p > 0 имеет место положительная корреляция (с увеличением xi значения yi имеют тенденцию к возрастанию), при p < 0 корреляция отрицательная. Чем ближе р к, тем уже эллипс и тем теснее экспериментальные значения группируются около прямой линии. Здесь же следует обратить внимание на то, что линия, вдоль которой группируются точки, может быть не только прямой, а иметь любую другую форму: парабола, гипербола и т. д. В этих случаях мы рассматривали бы так называемую, нелинейную (или криволинейную) корреляцию.



Таким образом, визуальный анализ корреляционного поля помогает выявить не только наличия статистической зависимости (линейную или нелинейную) между исследуемыми признаками, но и ее тесноту и форму. Это имеет существенное значение для следующего шага в анализе ѕ выбора и вычисления соответствующего коэффициента корреляции.

Корреляционную зависимость между признаками можно описывать разными способами. В частности, любая форма связи может быть выражена уравнением общего вида Y = f(X), где признак Y – зависимая переменная, или функция от независимой переменной X, называемой аргументом. Соответствие между аргументом и функцией может быть задано таблицей, формулой, графиком и т. д.

1. Тема работы.

2. Краткие теоретические сведения.

3. Порядок выполнения работы.

4. Исходные данные для разработки математической модели.

5. Результаты разработки математической модели.

6. Результаты исследования модели. Построение прогноза.

7. Выводы.

В задачах 2-4 можно использовать ППП Excel для расчетов характеристик модели.

Работа № 1.

Построение моделей парной регрессии. Проверка остатков на гетероскедастичность.

По 15 предприятиям, выпускающим один и тот же вид продукции известны значения двух признаков:

х - выпуск продукции, тыс. ед.;

у - затраты на производство, млн. руб.

x y
5,3 18,4
15,1 22,0
24,2 32,3
7,1 16,4
11,0 22,2
8,5 21,7
14,5 23,6
10,2 18,5
18,6 26,1
19,7 30,2
21,3 28,6
22,1 34,0
4,1 14,2
12,0 22,1
18,3 28,2

Требуется:

1. Построить поле корреляции и сформулировать гипотезу о форме связи .

2. Построить модели:

Линейной парной регрессии.

Полулогарифмической парной регрессии.

2.3 Степенной парной регрессии.
Для этого:


2. Оценить тесноту связи с помощью коэффициента (индекса)
корреляции.

3. Оценить качество модели с помощью коэффициента (индекса)
детерминации и средней ошибки аппроксимации
.

4. Дать с помощью среднего коэффициента эластичности
сравнительную оценку силы связи фактора с результатом
.

5. С помощью F -критерия Фишера оценить статистическую надежность результатов регрессионного моделирования .

По значениям характеристик, рассчитанных в пунктах 2-5 выбрать лучшее уравнение регрессии.

Используя метод Гольфрельда-Квандта проверить остатки на гетероскедастичность.

Строим поле корреляции.

Анализируя расположение точек поля корреляции, предполагаем, что связь между признаками х и у может быть линейной, т.е. у=а+bх , или нелинейной вида: у=а+blnх, у = ах b .

Основываясь на теории изучаемой взаимосвязи, предполагаем получить зависимость у от х вида у=а+bх, т. к. затраты на производство y можно условно разделить на два вида: постоянные, не зависящие от объема производства - a , такие как арендная плата, содержание администрации и т.д.; и переменные, изменяющиеся пропорционально выпуску продукции bх, такие как расход материала, электроэнергии и т.д.


2.1. Модель линейной парной регрессии .

2.1.1. Рассчитаем параметры a и b линейной регрессии у=а+bх .

Строим расчетную таблицу 1.

Таблица 1

Параметры a и b уравнения

Y x = a + bx


Разделив на n b :

Уравнение регрессии:

=11,591+0,871x

С увеличением выпуска продукции на 1 тыс. руб. затраты на производство увеличиваются на 0,871 млн. руб. в среднем, постоянные затраты равны 11,591 млн. руб.

2.1.2. Тесноту связи оценим с помощью линейного коэффициента парной корреляции.

Предварительно определим средние квадратические отклонения признаков.

Средние квадратические отклонения:

Коэффициент корреляции:

Между признаками X и Y наблюдается очень тесная линейная корреляционная связь.

2.1.3. Оценим качество построенной модели.

т. е. данная модель объясняет 90,5% общей дисперсии у , на долю необъясненной дисперсии приходится 9,5%.

Следовательно, качество модели высокое.

А i .

Предварительно из уравнения регрессии определим теоретические значения для каждого значения фактора.

Ошибка аппроксимации А i , i =1…15:

Средняя ошибка аппроксимации:

2.1.4. Определим средний коэффициент эластичности:

Он показывает, что с увеличением выпуска продукции на 1% затраты на производство увеличиваются в среднем на 0,515%.

2.1.5. Оценим статистическую значимость полученного уравнения.
Проверим гипотезу H 0 , что выявленная зависимость у от х носит случайный характер, т. е. полученное уравнение статистически незначимо. Примем α=0,05. Найдем табличное (критическое) значение F- критерия Фишера:

Найдем фактическое значение F - критерия Фишера:

следовательно, гипотеза H 0 H 1 x и y неслучайна.

Построим полученное уравнение.

2.2. Модель полулогарифмической парной регрессии .

2.2.1. Рассчитаем параметры а и b в регрессии:

у x =а +blnх .

Линеаризуем данное уравнение, обозначив:

y=a + bz .

Параметры a и b уравнения

= a + bz

определяются методом наименьших квадратов:


Рассчитываем таблицу 2.

Таблица 2

Разделив на n и решая методом Крамера, получаем формулу для определения b :

Уравнение регрессии:

= -1,136 + 9,902z

2.2.2. Оценим тесноту связи между признаками у и х .

Т. к. уравнение у = а + bln x линейно относительно параметров а и b и его линеаризация не была связана с преобразованием зависимой переменной _у , то теснота связи между переменными у и х , оцениваемая с помощью индекса парной корреляции R xy , также может быть определена с помощью линейного коэффициента парной корреляции r yz

среднее квадратическое отклонение z :

Значение индекса корреляции близко к 1, следовательно, между переменными у и х наблюдается очень тесная корреляционная связь вида = a + bz.

2.2.3. Оценим качество построенной модели.

Определим коэффициент детерминации:

т. е. данная модель объясняет 83,8% общей вариации результата у , на долю необъясненной вариации приходится 16,2%. Следовательно, качество модели высокое.

Найдем величину средней ошибки аппроксимации А i .

Предварительно из уравнения регрессии определим теоретические значения для каждого значения фактора. Ошибка аппроксимации А i , :

, i =1…15.

Средняя ошибка аппроксимации:

.

Ошибка небольшая, качество модели высокое.

2.2.4.Определим средний коэффициент эластичности:

Он показывает, что с увеличением выпуска продукции на 1% затраты на производство увеличиваются в среднем на 0,414%.

2.2.5. Оценим статистическую значимость полученного уравнения.
Проверим гипотезу H 0 , что выявленная зависимость у от х носит случайный характер, т.е. полученное уравнение статистически незначимо. Примем α=0,05.

Найдем табличное (критическое) значение F -критерия Фишера:

Найдем фактическое значение F -критерия Фишера:

следовательно, гипотеза H 0 отвергается, принимается альтернативная гипотеза H 1 : с вероятностью 1-α=0,95 полученное уравнение статистически значимо, связь между переменными x и y неслучайна.

Построим уравнение регрессии на поле корреляции

2.3. Модель степенной парной регрессии.

2.3.1. Рассчитаем параметры а и b степенной регрессии:

Расчету параметров предшествует процедура линеаризации данного уравнения:

и замена переменных:

Y=lny, X=lnx, A=lna

Параметры уравнения:

определяются методом наименьших квадратов:


Рассчитываем таблицу 3.

Определяем b :

Уравнение регрессии:

Построим уравнение регрессии на поле корреляции:

2.3.2. Оценим тесноту связи между признаками у и х с помощью индекса парной корреляции R yx .

Предварительно рассчитаем теоретическое значение для каждого значения фактора x, и , тогда:

Значение индекса корреляции R xy близко к 1, следовательно, между переменными у и х наблюдается очень тесная корреляционная связь вида:

2.3.3. Оценим качество построенной модели.

Определим индекс детерминации:

R 2 =0,936 2 =0,878,

т. е. данная модель объясняет 87,6% общей вариации результата у, а на долю необъясненной вариации приходится 12,4%.

Качество модели высокое.

Найдем величину средней ошибки аппроксимации.

Ошибка аппроксимации А i , i =1…15:

Средняя ошибка аппроксимации:

Ошибка небольшая, качество модели высокое.

2.3.4. Определим средний коэффициент эластичности:

Он показывает, что с увеличением выпуска продукции на 1% затраты на производство увеличиваются в среднем на 0,438%.

2.3.5.Оценим статистическую значимость полученного уравнения.

Проверим гипотезу H 0 , что выявленная зависимость у от х носит случайный характер, т. е. полученное уравнение статистически незначимо. Примем α=0,05.

табличное (критическое) значение F -критерия Фишера:

фактическое значение F -критерия Фишера:

следовательно, гипотеза H 0 отвергается, принимается альтернативная гипотеза H 1 : с вероятностью 1-α=0,95 полученное уравнение статистически значимо, связь между переменными x и y неслучайна.

Таблица 3

3. Выбор лучшего уравнения.

Составим таблицу полученных результатов исследования.

Таблица 4

Анализируем таблицу и делаем выводы.

ú Все три уравнения оказались статистически значимыми и надежными, имеют близкий к 1 коэффициент (индекс) корреляции, высокий (близкий к 1) коэффициент (индекс) детерминации и ошибку аппроксимации в допустимых пределах.

ú При этом характеристики линейной модели указывают, что она несколько лучше полулогарифмической и степенной описывает связь между признаками x и у.

ú Поэтому в качестве уравнения регрессии выбираем линейную модель.



Понравилась статья? Поделитесь с друзьями!