Расчет автокорреляционной функции. Автокорреляционная функция

Понятие автокорреляционных функций сигналов . Автокорреляционная функция (АКФ, CF - correlation function) сигнала s(t), конечного по энергии, является количественной интегральной характеристикой формы сигнала, выявления в сигнале характера и параметров взаимной временной связи отсчетов, что всегда имеет место для периодических сигналов, а также интервала и степени зависимости значений отсчетов в текущие моменты времени от предыстории текущего момента. АКФ определяется интегралом от произведения двух копий сигнала s(t), сдвинутых относительно друг друга на время :

B s () =s(t) s(t+) dt = ás(t), s(t+)ñ = ||s(t)|| ||s(t+)|| cos (). (6.1.1)

Как следует из этого выражения, АКФ является скалярным произведением сигнала и его копии в функциональной зависимости от переменной величины значения сдвига . Соответственно, АКФ имеет физическую размерность энергии, а при  = 0 значение АКФ непосредственно равно энергии сигнала и является максимально возможным (косинус угла взаимодействия сигнала с самим собой равен 1):

B s (0) =s(t) 2 dt = E s .

АКФ относится к четным функциям, в чем нетрудно убедиться заменой переменной t = t- в выражении (6.1.1):

B s () = s(t-) s(t) dt = B s (-).

Максимум АКФ, равный энергии сигнала при =0, всегда положителен, а модуль АКФ при любом значении временного сдвига не превосходит энергии сигнала. Последнее прямо вытекает из свойств скалярного произведения (как и неравенство Коши-Буняковского):

ás(t), s(t+)ñ = ||s(t)||||s(t+||cos (),

cos () = 1 при  = 0, ás(t), s(t+)ñ = ||s(t)||||s(t)|| = E s ,

cos () < 1 при   0, ás(t), s(t+)ñ = ||s(t)||||s(t+)||cos () < E s .

В качестве примера на рис. 6.1.1 приведены два сигнала – прямоугольный импульс и радиоимпульс одинаковой длительности Т, и соответствующие данным сигналам формы их АКФ. Амплитуда колебаний радиоимпульса установлена равной
амплитуды прямоугольного импульса, при этом энергии сигналов также будут одинаковыми, что подтверждается равными значениями центральных максимумов АКФ. При конечной длительности импульсов длительности АКФ также конечны, и равны удвоенным значениям длительности импульсов (при сдвиге копии конечного импульса на интервал его длительности как влево, так и вправо, произведение импульса со своей копией становится равным нулю). Частота колебаний АКФ радиоимпульса равна частоте колебаний заполнения радиоимпульса (боковые минимумы и максимумы АКФ возникают каждый раз при последовательных сдвигах копии радиоимпульса на половину периода колебаний его заполнения).

С учетом четности, графическое представление АКФ обычно производится только для положительных значений . На практике сигналы обычно задаются на интервале положительных значений аргументов от 0-Т. Знак + в выражении (6.1.1) означает, что при увеличении значений  копия сигнала s(t+) сдвигается влево по оси t и уходит за 0. Для цифровых сигналов это требует соответствующего продления данных в область отрицательных значений аргумента. А так как при вычислениях интервал задания  обычно много меньше интервала задания сигнала, то более практичным является сдвиг копии сигнала влево по оси аргументов, т.е. применение в выражении (6.1.1) функции s(t-) вместо s(t+).

B s () = s(t) s(t-) dt. (6.1.1")

Для финитных сигналов по мере увеличения значения величины сдвига  временное перекрытие сигнала с его копией уменьшается, а, соответственно, косинус угла взаимодействия и скалярное произведение в целом стремятся к нулю:

= 0.

АКФ, вычисленная по центрированному значению сигнала s(t), представляет собой автоковариационную функцию сигнала:

C s () = dt, (6.1.2)

где  s – среднее значение сигнала. Ковариационные функции связаны с корреляционным функциями достаточно простым соотношением:

C s () = B s () -  s 2 .

АКФ сигналов, ограниченных во времени. На практике обычно исследуются и анализируются сигналы, заданные на определенном интервале. Для сравнения АКФ сигналов, заданных на различных временных интервалах, практическое применение находит модификация АКФ с нормировкой на длину интервала. Так, например, при задании сигнала на интервале :

B s () =
s(t) s(t+) dt. (6.1.3)

АКФ может быть вычислена и для слабозатухающих сигналов с бесконечной энергией, как среднее значение скалярного произведения сигнала и его копии при устремлении интервала задания сигнала к бесконечности:

B s () 
. (6.1.4)

АКФ по данным выражениям имеет физическую размерность мощности, и равна средней взаимной мощности сигнала и его копии в функциональной зависимости от сдвига копии.

АКФ периодических сигналов. Энергия периодических сигналов бесконечна, поэтому АКФ периодических сигналов вычисляется по одному периоду Т, с усреднением скалярного произведения сигнала и его сдвинутой копии в пределах периода:

B s () = (1/Т)s(t) s(t-) dt. (6.1.5)

Математически более строгое выражение:

B s () 
.

При =0 значение нормированной на период АКФ равно средней мощности сигналов в пределах периода. При этом АКФ периодических сигналов является периодической функцией с тем же периодом Т. Так, для сигнала s(t) = A cos( 0 t+ 0) при T=2/ 0 имеем:

B s () =
A cos( 0 t+ 0) A cos( 0 (t-)+ 0) = (A 2 /2) cos( 0 ). (6.1.6)

Полученный результат не зависит от начальной фазы гармонического сигнала, что характерно для любых периодических сигналов и является одним из свойств АКФ. С помощью функций автокорреляции можно проверять наличие периодических свойств в любых произвольных сигналах. Пример автокорреляционной функции периодического сигнала приведен на рис. 6.1.2.

Функции автоковариации (ФАК) вычисляются аналогично, по центрированным значениям сигнала. Замечательной особенностью этих функций являются их простые соотношения с дисперсией  s 2 сигналов (квадратом стандарта - среднего квадратического отклонения значений сигнала от среднего значения). Как известно, значение дисперсии равно средней мощности сигналов, откуда следует:

|C s ()| ≤  s 2 , C s (0) =  s 2  ||s(t)|| 2 . (6.1.7)

Значения ФАК, нормированные на значение дисперсии, представляют собой функцию автокорреляционных коэффициентов:

 s () = C s ()/C s (0) = C s ()/ s 2  cos ). (6.1.8)

Иногда эту функцию называют "истинной" автокорреляционной функцией. В силу нормировки ее значения не зависят от единиц (масштаба) представления значений сигнала s(t) и характеризуют степень линейной связи между значениями сигнала в зависимости от величины сдвига  между отсчетами сигнала. Значения  s ()  cos () могут изменяться от 1 (полная прямая корреляция отсчетов) до -1 (обратная корреляция).

На рис. 6.1.3 приведен пример сигналов s(k) и s1(k) = s(k)+шум с соответствующими этим сигналам коэффициентами ФАК -  s и  s1 . Как видно на графиках, ФАК уверенно выявила наличие периодических колебаний в сигналах. Шум в сигнале s1(k) понизил амплитуду периодических колебаний без изменения периода. Это подтверждает график кривой C s / s 1 , т.е. ФАК сигнала s(k) с нормировкой (для сопоставления) на значение дисперсии сигнала s1(k), где наглядно можно видеть, что шумовые импульсы при полной статистической независимости своих отсчетов вызвали увеличение значения С s1 (0) по отношению к значению C s (0) и несколько "размыли" функцию коэффициентов автоковариации. Это вызвано тем, что значение  s () шумовых сигналов стремится к 1 при   0 и флюктуирует относительно нуля при  ≠ 0, при этом амплитуды флюктуаций статистически независимы и зависят от количества выборок сигнала (стремятся к нулю при увеличении количества отсчетов).

АКФ дискретных сигналов. При интервале дискретизации данных t = const вычисление АКФ выполняется по интервалам  = t и обычно записывается, как дискретная функция номеров n сдвига отсчетов n:

B s (nt) = ts k s k-n . (6.1.9)

Дискретные сигналы обычно задаются в виде числовых массивов определенной длины с нумерацией отсчетов к = 0,1,…К при t=1, а вычисление дискретной АКФ в единицах энергии выполняется в одностороннем варианте с учетом длины массивов. Если используется весь массив сигнала и число отсчетов АКФ равно числу отсчетов массива, то вычисление выполняется по формуле:

B s (n) =
s k s k-n . (6.1.10)

Множитель K/(K-n) в данной функции является поправочным коэффициентом на постепенное уменьшение числа перемножаемых и суммируемых значений по мере увеличения сдвига n. Без этой поправки для нецентрированных сигналов в значениях АКФ появляется тренд суммирования средних значений. При измерениях в единицах мощности сигнала множитель К/(K-n) заменяется на множитель 1/(K-n).

Формула (6.1.10) применяется довольно редко, в основном для детерминированных сигналов с небольшим числом отсчетов. Для случайных и зашумленных сигналов уменьшение знаменателя (K-n) и числа перемножаемых отсчетов по мере увеличения сдвига приводит к нарастанию статистических флюктуаций вычисления АКФ. Большую достоверность в этих условиях обеспечивает вычисление АКФ в единицах мощности сигнала по формуле:

B s (n) = s k s k-n , s k-n = 0 при k-n < 0, (6.1.11)

т.е. с нормированием на постоянный множитель 1/K и с продлением сигнала нулевыми значениями (в левую сторону при сдвигах k-n или в правую сторону при использовании сдвигов k+n). Эта оценка является смещенной и имеет несколько меньшую дисперсию, чем по формуле (6.1.10). Разницу между нормировками по формулам (6.1.10) и (6.1.11) можно наглядно видеть на рис. 6.1.4.

Формулу (6.1.11) можно рассматривать, как усреднение суммы произведений, т.е. как оценку математического ожидания:

B s (n) = M{s k s k - n } 
. (6.1.12)

Практически, дискретная АКФ имеет такие же свойства, как и непрерывная АКФ. Она также является четной, а ее значение при n = 0 равно энергии или мощности дискретного сигнала в зависимости от нормировки.

АКФ зашумленных сигналов . Зашумленный сигнал записывается в виде суммы v(k) = s(k)+q(k). В общем случае, шум не обязательно должен иметь нулевое среднее значение, и нормированная по мощности автокорреляционная функция цифрового сигнала, содержащая N – отсчетов, записывается в следующем виде:

B v (n) = (1/N) s(k)+q(k), s(k-n)+q(k-n) =

= (1/N) [s(k), s(k-n) + s(k), q(k-n) + q(k), s(k-n) + q(k), q(k-n)] =

B s (n) + M{s k q k-n } + M{q k s k-n } + M{q k q k-n }.

B v (n) = B s (n) +
+
+
. (6.1.13)

При статистической независимости полезного сигнала s(k) и шума q(k) с учетом разложения математического ожидания

M{s k q k-n } = M{s k } M{q k-n } =

может использоваться следующая формула:

B v (n) = B s (n) + 2+ . (6.1.13")

Пример зашумленного сигнала и его АКФ в сопоставлении с незашумленным сигналом приведен на рис. 6.1.5.

Из формул (6.1.13) следует, что АКФ зашумленного сигнала состоит из АКФ сигнальной компоненты полезного сигнала с наложенной затухающей до значения 2+шумовой функцией. При больших значениях K, когда→ 0, имеет местоB v (n)  B s (n). Это дает возможность не только выделять по АКФ периодические сигналы, практически полностью скрытые в шуме (мощность шумов много больше мощности сигнала), но и с высокой точностью определять их период и форму в пределах периода, а для одночастотных гармонических сигналов – и их амплитуду с использованием выражения (6.1.6).

Таблица 6.1.

Сигнал Баркера

АКФ сигнала

1, 1, 1, -1, -1, 1, -1

7, 0, -1, 0, -1, 0, -1

1,1,1,-1,-1,-1,1,-1,-1,1,-1

11,0,-1,0,-1,0,-1,0,-1,0,-1

1,1,1,1,1,-1,-1,1,1-1,1,-1,1

13,0,1,0,1,0,1,0,1,0,1,0,1

Кодовые сигналы являются разновидностью дискретных сигналов. На определенном интервале кодового слова Мt они могут иметь только два амплитудных значения: 0 и 1 или 1 и –1. При выделении кодов на существенном уровне шумов форма АКФ кодового слова имеет особое значение. С этой позиции наилучшими считаются такие коды, значения боковых лепестков АКФ которых минимальны по всей длине интервала кодового слова при максимальном значении центрального пика. К числу таких кодов относится код Баркера, приведенный в таблице 6.1. Как видно из таблицы, амплитуда центрального пика кода численно равна значению М, при этом амплитуда боковых осцилляций при n  0 не превышает 1.

Задача корреляционного анализа возникла из радиолокации, когда нужно было сравнить одинаковые сигналы, смещённые во времени.

Для количественного определения степени отличия сигнала и его смещённой во времени копии
принято вводить автокорреляционную функцию (АКФ) сигнала равную скалярному произведению сигнала и его сдвинутой копии.

(4.1)

Свойства АКФ

1) При
автокорреляционная функция становится равной энергии сигнала:

(4.2)

2) АКФ – функция чётная

(4.3)

3) Важное свойство автокорреляционной функции состоит в следующем: при любом значении временного сдвига модуль АКФ не превосходит энергии сигнала:

4) Обычно, АКФ представляется симметричной линей с центральным максимумом, который всегда положителен. При этом в зависимости от вида сигнала автокорреляционная функция может иметь как монотонно убывающей, так и колеблющийся характер.

Существует тесная связь между АКФ и энергетическим спектром сигнала.

В соответствии с формулой (4.1) АКФ есть скалярное произведение
. Здесь символомобозначена смещённая во времени копия сигнала
.

Обратившись к теореме Планшереля – можно записать равенство:

(4.4) Таким образом, приходим к результату

(4.5)

Квадрат модуля спектральной плотности представляет собой энергетический спектр сигнала. Итак энергетический спектр и автокорреляционная функция связаны парой преобразований Фурье.

Ясно, что имеется и обратное соотношение

(4.6)

Эти результаты принципиально важны по двум причинам: во-первых, оказывается возможным оценивать корреляционные свойства сигналов, исходя из распределения их энергии по спектру. Во-вторых, формулы (4.5), (4.6) указывают путь экспериментального определения энергетического спектра. Часто удобнее вначале получить АКФ, а затем, используя преобразование Фурье, найти энергетический спектр сигнала. Такой приём получил распространение при исследовании свойств сигналов с помощью быстродействующих ЭВМ в реальном масштабе времени.

Часто вводят удобный числовой параметр – интервал корреляции , представляющий собой оценку ширины основного лепестка АКФ.

9.. Взаимокорреляционная функция и ее свойства. Связь взаимокорреляционной функции и взаимного энергетического спектра.

Взаимокорреляционная функция двух сигналов

Взаимокорреляционной функцией (ВКФ) двух вещественных сигналов и называется скалярное произведение вида:

(4.8)

ВКФ служит мерой «устойчивости» ортогонального состояния при сдвигах сигналов во времени.

При прохождении этих сигналов через различные устройства возможно, что сигнал будет сдвинут относительно сигнала на некоторое время .

Свойства ВКФ.

1) В отличие от АКФ одиночного сигнала, ВКФ, описывающая свойства системы двух независимых сигналов, не является чётной функцией аргумента :

(4.9)

2) Если рассматриваемые сигналы имеют конечные энергии, то их ВКФ ограничена.

3) При
значения ВКФ вовсе не обязаны достигать максимума.

Примером ВКФ может служить взаимокорреляционная функция прямоугольного и треугольного видеоимпульсов.

На основании теоремы Планшереля

получаем

(4.11)

Таким образом, взаимокорреляционная функция и взаимный энергетический спектр связаны между собой парой преобразований Фурье.

Автокорреляционная функция. Коррелограмма.

При наличии во временном ряду тенденции и циклических изменений значения последующего уровня ряда зависят от предыдущих. Зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда.

Количественно ее можно измерить с помощью индекса корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.

Пусть задан временный ряд: у ,у,…у и пусть имеет место линейная корреляция между y t и y t -1 .

Определим коэффициент корреляции между рядами у t и у t -1 .

Для этого воспользуемся следующей формулой:

Пологая x j = у t -1 , y j = у t -1 , получим

(5.1)

Аналогично определяются коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции 2-го порядка характеризует тесноту связи между уровнями у и у и определяется по формуле:

(5.2)

Порядок уровня ряда автокорреляции называют лагом.

Для формулы (5.1) лаг равен единице, для (5.3) –двум.

Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называют автокорреляционной функцией временного ряда (АКФ).

График зависимости ее значений от величины лага называется коррелограмой.

АКФ и коррелограмма позволяют определить лаг, при котором автокорреляция наиболее высокая, а, следовательно, и лаг, при котором связь между текущим и предыдущим уровнями ряда наиболее тесная, т.е. с их помощью можно выявить структуру ряда.

Коэффициент автокорреляции и АКФ целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты и циклической компоненты:

­ если наиболее высоким оказался коэффициент автокорреляции 1-го порядка, то исследуемый ряд содержит только тенденцию;

­ если наиболее высоким оказался коэффициент автокорреляции к-го порядка, то ряд содержит циклические колебания с периодичностью в к-моментов времени;

­ если, ни один из коэффициентов не является значимым, то можно сделать одно из двух предположений, относительно структуры этого ряда: либо ряд не содержит тенденции и циклических изменений и имеет структуру, сходную со структурой ряда, изображенного на рис.5.1в, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ.

49. Обобщенная модель регрессии. Обобщенный метод наименьших квадратов. Теорема Айткена

При построении модели, например, линейного вида

У = а + b 1 * x 1 + b 2 * x 2 +… + b p * x p + ε (59.1)

случайная величина  представляет собой ненаблюдаемую величину. Для разных спецификаций модели разности между теоретическими и фактическими значениями могут меняться. В задачу регрессионного анализа входит не только построение самой модели, но и исследование случайных отклонений  i т.е. остаточных величин. После построения уравнения регрессии проводится проверка наличия у оценок  i некоторых свойств. Эти свойства оценок, полученных МНК, имеют очень важное практическое значение в использовании результатов регрессии и корреляции.

Коэффициенты регрессии b­ i , найденные на основе системы нормальных уравнений и представляющие собой выборочные оценки характеристики силы связи, должны обладать свойством несмещености. Несмещенность оценки означает, что математическое ожидание остатков равно нулю.

Это означает, что найденный параметр регрессии b­ i , можно рассматривать как среднее значение возможных значений коэффициентов регрессии с несмещенными оценками остатков.

Для практических целей важны не только несмещенность, но и эффективность оценок. Оценки считаются эффективными,если они характеризуются наименьшей дисперсией.

Для того, чтобы доверительные интервалы параметров регрессии были реальными, необходимо, чтобы оценки были состоятельными. Состоятельность оценок характеризует увеличение их точности с увеличением объема выборки.

Исследования остатков  i предполагают проверку наличия следующих пяти предпосылок МНК:

­ случайный характер остатков;

­ нулевая средняя величина остатков, не зависящая от х i ;

­ гомоскедастичность–дисперсия каждого отклонения  i одинакова для всех значений х;

­ отсутствие автокорреляции остатков. Значения остатков  i распределены независимо друг от друга;

­ остатки подчиняются нормальному распределению.

Если распределение случайных остатков  i не соответствует некоторым предпосылкам МНК, то следует корректировать модель.

Прежде всего, проверяется случайный характер остатков  i .

Если на графике получена горизонтальная полоса распределения остатков, то остатки представляют собой случайные величины и МНК оправдан, теоретические значения у x хорошо аппроксимируют фактические значения у.

Возможны следующие случаи: если  i . зависит от у x то:

­ остатки  i . не случайны

­ остатки  i . не имеют постоянной дисперсии

­ остатки  i . носят систематический характер

В этих случаях необходимо либо применить другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки  i не будут случайными величинами.

Вторая предпосылка означает равенство нулю средней величины остатков:

. (59.2)

В соответствии с третьей предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора х j остатки  i имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность.

50. Доступный обобщенный метод наименьших квадратов

Метод наименьших квадратов. Некоторые более общие типы регрессионных моделей рассмотрены в разделе Основные типы нелинейных моделей. После выбора модели возникает вопрос: каким образом можно оценить эти модели? Если вы знакомы с методами линейной регрессии (описанными в разделе Множественная регрессия) или дисперсионного анализа (описанными в разделе Дисперсионный анализ), то вы знаете, что все эти методы используют оценивание по методу наименьших квадратов. Основной смысл этого метода заключается в минимизации суммы квадратов отклонений наблюдаемых значений зависимой переменной от значений, предсказанных моделью. (Термин наименьшие квадраты впервые был использован в работе Лежандра - Legendre, 1805.)
Метод взвешенных наименьших квадратов. Третьим по распространенности методом, в дополнение к методу наименьших квадратов и использованию для оценивания суммы модулей отклонений (см. выше), является метод взвешенных наименьших квадратов. Обычный метод наименьших квадратов предполагает, что разброс остатков одинаковый при всех значениях независимых переменных. Иными словами, предполагается, что дисперсия ошибки при всех измерениях одинакова. Часто, это предположение не является реалистичным. В частности, отклонения от него встречаются в бизнесе, экономике, приложениях в биологии (отметим, что оценки параметров по методу взвешенных наименьших квадратов могут быть также получены с помощью модуля Множественная регрессия).



Например, вы хотите изучить связь между проектной стоимостью постройки здания и суммой реально потраченных средств. Это может оказаться полезным для получения оценки ожидаемых перерасходов. В этом случае разумно предположить, что абсолютная величина перерасходов (выраженная в долларах) пропорциональна стоимости проекта. Поэтому, для подбора линейной регрессионной модели следует использовать метод взвешенных наименьших квадратов. Функция потерь может быть, например, такой (см. книгу Neter, Wasserman, and Kutner, 1985, стр.168):

Потери = (наблюд.-предск.) 2 * (1/x 2)

В этом уравнении первая часть функции потерь означает стандартную функцию потерь для метода наименьших квадратов (наблюдаемые минус предсказанные в квадрате; т.е., квадрат остатков), а вторая равна “весу” этой потери в каждом конкретном случае - единица деленная на квадрат независимой переменной (x) для каждого наблюдения. В ситуации реального оценивания, программа просуммирует значения функции потерь по всем наблюдениям (например, конструкторским проектам), как описано выше и подберет параметры, минимизирующие сумму. Возвращаясь к рассмотренному примеру, чем больше проект (x), тем меньше для нас значит одна и та же ошибка в предсказании его стоимости. Этот метод дает более устойчивые оценки для параметров регрессии (более подробно, см. Neter, Wasserman, and Kutner. 1985).

51. Тест Чоу

Формальный статистический тест для оценки модели тенденции временного ряда при наличии структурных изменений был предложен Грегори Чоу*. Применение этого теста предполагает расчет параметров уравнений трендов. Введем систему обозначений, приведенную в табл.

Таблица 3 –Условные обозначения для алгоритма теста Чоу

Предположим, гипотеза Н0 утверждает структурную стабильность тенденции изучаемого временного ряда. Остаточную сумму квадратов по кусочно-линейной модели (C кл ост) можно найти как сумму С 1 ост и C 2 ост

C кл ост = С 1 ост + C 2 ост (62.1)

Соответствующее ей число степеней свободы составит:

(n 1 - k 1) + (n 2 – k 2) = n – k 1 - k 2 (62.2)

Тогда сокращение остаточной дисперсии при переходе единого уравнения тренда к кусочно-линейной модели определить следующим образом:

DС ост = C 3 ост - С кл ост (62.3)

Число степеней свободы, соответствующее DС с учетом соотношения (23) составит:

n – k 3 - (n – n 1 – k 2) = k 1 + k 2 - k 3 (62.4)

Затем, в соответствии с Г. Чоу методикой Г. Чоу находится фактическое значение F-критерия по следующим дисперсиям на одну степень свободы вариации:

(62.5)

Найденное значение F факт сравнивают с табличным, (таблица распределения Фишера для уровня значимости α ‚ а и числа степеней свободы (k 1 + k 2 – k 3) и (n - k 1 - k 2)

Если F факт > F табл ‚ то гипотеза о структурной стабильности тенденции отклоняется, а влияние структурных измен на динамику изучаемого показателя признают значимым. В этом случае моделирование тенденции временного ряда следует произвести с помощью кусочно-линейной модели. Если

F факт < F табл то нулевая гипотеза структурной стабильности тенденции не отвергается. Ее моделирование следует осуществлять с помощью единого для всей совокупности уравнения тренда.

Особенности применения теста Чоу.

1. Если число параметров во всех уравнениях из таблицы 3 (1), (2), (3) одинаково и равно k, то формула (56) упрощается:

(62.6)

2. Тест Чоу позволяет сделать вывод о наличии или отсутствии структурной стабильности в изучаемом временном ряде. Если F факт < F табл, то это означает, что уравнения (1) и (2) описывают одну и ту же тенденцию, а различия численных оценок их пара метров а 1 и а 2 , а также b 1 и b 2 соответственно статистически не значимы. Если же F факт > F табл то гипотеза о структурной стабильности отклоняется, что означает статистическую значимость различий в оценках параметров уравнений (1) и (2).

З. Применение теста Чоу предполагает соблюдение предпосылок о нормальном распределении остатков в уравнениях (1) и (2) и независимость их распределений.

Если гипотеза о структурной стабильности тенденции ряда у, отклоняется, дальнейший анализ может заключаться в, исследовании вопроса о причинах этих структурных различий и более де 1 изучении характера изменения тенденции. В принятых обозначениях эти причины обусловливают различия в оценках параметров уравнений (1) и (2).

Возможны следующие сочетания изменений числейных оценок параметров этих уравнений:

Изменение численной оценки свободного члена уравнения Тренда а 2 по сравнению с а 1 при условии, что различия b 1 и b 2 статистически незначимы. Геометрически это означает, что прямые (1) (2) параллельны. Происходит скачкообразное изменение уровня ряда у t , в момент времени t ‚ и неизменном среднем абсолютном приросте за период;

Изменение численной оценки параметра b 2 по сравнению с b 1 при условии, что различия между а 1 и а 2 статистически незначимы. Геометрически это означает, что прямые (1) и (2) пересекают ось координат в одной точке. Изменение тенденции происходит посредством изменение среднего абсолютного прироста временного ряда, начиная с момента времени t ‚ при неизменном начальном уровне ряда в момент времени t =0

Изменение численных оценок параметров а 1 и а 2 , а так же b 1 и b 2 . На графике это отображается изменением начального уровня и счреднего за период абсолютного прироста

Периодическая зависимость представляет собой общий тип компонент временного ряда. Можно легко видеть, что каждое наблюдение очень похоже на соседнее; дополнительно, имеется повторяющаяся периодическая составляющая, это означает, что каждое наблюдение также похоже на наблюдение, имевшееся в том же самое время период назад. В общем, периодическая зависимость может быть формально определена как корреляционная зависимость порядка k между каждым i-м элементом ряда и (i-k)-м элементом. Ее можно измерить с помощью автокорреляции (т.е. корреляции между самими членами ряда); k обычно называют лагом (иногда используют эквивалентные термины: сдвиг, запаздывание). Если ошибка измерения не слишком большая, то периодичность можно определить визуально, рассматривая поведение членов ряда через каждые k временных единиц .

Периодические составляющие временного ряда могут быть найдены с помощью коррелограммы. Коррелограмма (автокоррелограмма) показывает численно и графически автокорреляционную функцию (AКФ), иными словами коэффициенты автокорреляции для последовательности лагов из определенного диапазона. На коррелограмме обычно отмечается диапазон в размере двух стандартных ошибок на каждом лаге, однако обычно величина автокорреляции более интересна, чем ее надежность, потому что интерес в основном представляют очень сильные автокорреляции .

При изучении коррелограмм следует помнить, что автокорреляции последовательных лагов формально зависимы между собой. Рассмотрим следующий пример. Если первый член ряда тесно связан со вторым, а второй с третьим, то первый элемент должен также каким-то образом зависеть от третьего и т.д. Это приводит к тому, что периодическая зависимость может существенно измениться после удаления автокорреляций первого порядка, (т.е. после взятия разности с лагом 1).

Цель работы:

1. Дать основные теоретические сведения

2. Дать примеры расчета АКФ

Глава 1. Теоретические сведения

Коэффициент автокорреляции и его оценка

Для полной характеристики случайного процесса недостаточно его математического ожидания и дисперсии. Еще в 1927 г. Е.Е.Слуцкий ввел для зависимых наблюдений понятие «связанного ряда»: вероятность возникновения на определенном месте тех или иных конкретных значений зависит от того, какие значения случайная величина уже получила раньше или будет получать позже. Иными словами, существует поле рассеяния пар значений x(t), x(t+k) временного ряда, где k - постоянный интервал или задержка, характеризующее взаимозависимость последующих реализаций процесса от предыдущих. Теснота этой взаимосвязи оценивается коэффициентами автоковариации –

g (k) = E[(x(t) - m)(x(t + k) - m)] –

и автокорреляции

r (k) = E[(x(t) - m)(x(t + k) - m)] / D ,

где m и D - математическое ожидание и дисперсия случайного процесса. Для расчета автоковариации и автокорреляции реальных процессов необходима информация о совместном распределении вероятностей уровней ряда p(x(t 1),x(t 2)). Однако для стационарных процессов, находящихся в определенном статистическом равновесии, это распределение вероятностей одинаково для всех времен t 1 , t 2 , разделенных одним и тем же интервалом. Поскольку дисперсия стационарного процесса в любой момент времени (как в t, так и в t + k) равна D = g (0), то автокорреляция с задержкой k может быть выражена как

r (k) = g (k) /g (0),

откуда вытекает, что r (0) = 1. В тех же условиях стационарности коэффициент корреляции r (k) между двумя значениями временного ряда зависит лишь от величины временного интервала k и не зависит от самих моментов наблюдений t.

В статистике имеется несколько выборочных оценок теоретических значений автокорреляции r (k) процесса по конечному временному ряду из n наблюдений. Наиболее популярной оценкой является нециклический коэффициент автокорреляции с задержкой k (Андерсон, 1976; Вайну, 1977):

Наиболее важным из различных коэффициентов автокорреляции является первый - r 1 , измеряющий тесноту связи между уровнями x(1), x(2) ,..., x(n -1) и x(2), x(3), ..., x(n).

Распределение коэффициентов автокорреляции неизвестно, позтому для оценки их достоверности иногда используют непараметрическую теорию Андерсона (1976), предложившего статистику

t = r 1 (n -1) 0.5 ,

которая при достаточно большой выборке распределена нормально, имеет нулевую среднюю и дисперсию, равную единице (Тинтнер, 1965).

Автокорреляционные функции

Последовательность коэффициентов корреляции r k , где k = 1, 2, ..., n, как функция интервала k между наблюдениями называется автокорреляционной функцией (АКФ).

Вид выборочной автокорреляционной функции тесно связан со структурой ряда.

· Автокорреляционная функция r k для «белого шума», при k >0, также образует стационарный временной ряд со средним значением 0.

· Для стационарного ряда АКФ быстро убывает с ростом k. При наличии отчетливого тренда автокорреляционная функция приобретает характерный вид очень медленно спадающей кривой .

· В случае выраженной сезонности в графике АКФ также присутствуют выбросы для запаздываний, кратных периоду сезонности, но эти выбросы могут быть завуалированы присутствием тренда или большой дисперсией случайной компоненты.

Рассмотрим примеры автокорреляционной функции:

· на рис. 1 представлен график АКФ, характеризующегося умеренным трендом и неясно выраженной сезонностью;

· рис. 2 демонстрирует АКФ ряда, характеризующегося феноменальной сезонной детерминантой;

· практически незатухающий график АКФ ряда (рис. 3) свидетельствует о наличии отчетливого тренда.




В общем случае можно предполагать, что в рядах, состоящих из отклонений от тренда, автокорреляции нет. Например, на рис. 4 представлен график АКФ для остатков, полученных от сглаживания ряда, очень напоминающий процесс «белого шума». Однако нередки случаи, когда остатки (случайная компонента h) могут оказаться автокоррелированными, например, по следующим причинам :

· в детерминированных или стохастических моделях динамики не учтен существенный фактор

· в модели не учтено несколько несущественных факторов, взаимное влияние которых оказывается существенным вследствие совпадения фаз и направлений их изменения;

· выбран неправильный тип модели (нарушен принцип контринтуитивности);

· случайная компонента имеет специфическую структуру.


Критерий Дарбина-Уотсона

Критерий Дарбина-Уотсона (Durbin, 1969) представляет собой распространенную статистику, предназначенную для тестирования наличия автокорреляции остатков первого порядка после сглаживания ряда или в регрессионных моделях.

Численное значение коэффициента равно

d = [(e(2)-e(1)) 2 + ... + (e(n)-e(n -1)) 2 ]/,

где e(t) - остатки.

Возможные значения критерия находятся в интервале от 0 до 4, причем табулированы его табличные пороговые значения для разных уровней значимости (Лизер, 1971).

Значение d близко к величине 2*(1 - r 1), где r - выборочный коэффициент автокорреляции для остатков. Соответственно, идеальное значение статистики - 2 (автокорреляция отсутствует). Меньшие значения соответствуют положительной автокорреляции остатков, большие – отрицательной .

Например, после сглаживания ряда ряд остатков имеет критерий d = 1.912. Аналогичная статистика после сглаживания ряда - d = 1.638 - свидетельствует о некоторой автокоррелированности остатков.

Глава 2. Примеры практических расчетов с помощью макроса Excel «Автокорреляционная функция»

Все данные взяты с сайта http://e3.prime-tass.ru/macro/

Пример 1. ВВП РФ

Приведем данные о ВВП РФ

Год квартал ВВП первая разность
2001 I 1900,9
II 2105,0 204,1
III 2487,9 382,9
IV 2449,8 -38,1
2002 I 2259,5 -190,3
II 2525,7 266,2
III 3009,2 483,5
IV 3023,1 13,9
2003 I 2850,7 -172,4
II 3107,8 257,1
III 3629,8 522,0
IV 3655,0 25,2
2004 I 3516,8 -138,2
II 3969,8 453,0
III 4615,2 645,4
IV 4946,4 331,2
2005 I 4479,2 -467,2
II 5172,9 693,7
III 5871,7 698,8
IV 6096,2 224,5
2006 I 5661,8 -434,4
II 6325,8 664,0
III 7248,1 922,3
IV 7545,4 297,3
2007 I 6566,2 -979,2
II 7647,5 1081,3
Как уже отмечалось ранее, частная автокорреляционная функция была введена с целью определения порядка авторегрессионного процесса. Дело в том, что в процессе скользящего среднего порядок модели достаточно просто определить, так как после него автокорреляционная функция резко стремится к нулю. Однако...
(Эконометрика)
  • Важное значение в анализе временных рядов имеют стационарные временные ряды, вероятностные свойства которых не изменяются во времени. Стационарные временные ряды применяются, в частности, при описании случайных составляющих анализируемых рядов. Временной ряд yt(t= 1,2,..., п) называется...
    (ЭКОНОМЕТРИКА)
  • Для упрощения анализа положим, что база ЛЧМ-сигнала достаточно велика, и поэтому его энергетический спектр равномерен и расположен лишь в полосе (со0 - со д/2, со0 + сод/2) вокруг несущей частоты со0. Тогда согласно выражению (2.61) АКФ ЛЧМ-сигнала равна Рис. 2.44. График нормированной АКФ ...
    (ТЕОРИЯ ЭЛЕКТРОСВЯЗИ)
  • Выявление структуры временного ряда. Автокорреляционная функция
    При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от значений предыдущих уровней. Степень тесноты связи между последовательностями наблюдений временного ряда (сдвинутых относительно друг друга на L единиц, или, как говорят, с лагом...
    (ЭКОНОМЕТРИКА)
  • Базовые модели временных рядов и автокорреляционный анализ
    1. Простейшим случаем аддитивной модели временного ряда является модель случайных изменений : Модель предполагает, что значения изучаемого показателя изменяются относительно постоянного среднего значения ц (нет восходящего или нисходящего тренда) с постоянной дисперсией и не зависят друг от друга....
    (ОСНОВЫ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ)
  • Автокорреляционная функция (АКФ) ЛЧМ-сигнала.
    Для упрощения анализа положим, что база ЛЧМ-сигнала достаточно велика, и поэтому его энергетический спектр равномерен и расположен лишь в полосе (со0 - сод/2, со0 + сол/2) вокруг несущей частоты со0. Тогда согласно выражению (2.61) АКФ ЛЧМ-сигнала равна График нормированной АКФ ЛЧМ-импульса R(т)...
    (ОБЩАЯ ТЕОРИЯ СВЯЗИ)
  • Стационарные временные ряды и их характеристики. Автокорреляционная функция
    Важное значение в анализе временных рядов имеют стационар- н ы е Понятие стационарного временного ряда тесно связано с понятием порождающего его стационарного случайного процесса (параграф 7.2). временные ряды, вероятностные свойства которых не изменяются во времени. Стационарные временные ряды применяются,...
    (ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА)


  • Понравилась статья? Поделитесь с друзьями!