Методы сглаживания и выравнивания динамических рядов. Сглаженный ряд

Сглаживание временного ряда

Сглаживание временного ряда, т.е. замена фактических уровней расчетными значениями, имеющими меньшую колеблемость, чем исходные данные, является простым методом выявления тенденции развития. Соответствующее преобразование называется фильтрованием.

Сглаживание временных рядов проводиться в следующих случаях:

· При графическом изображении временного ряда тренд прослеживается недостаточно отчетливо. Поэтому ряд сглаживают, на график наносят сглаженные значения, и, как правило, тенденция проявляется более четко;

· Применяются методы анализа и прогнозирования, требующие в качестве предварительного условия сглаживания временного ряда;

· При устранении аномальных наблюдений;

· При непосредственном прогнозировании экономических показателей и прогнозировании изменение тренда - «точек поворота».

Существующие методы сглаживания делят на две группы:

1) Аналитические методы. Для сглаживания используется кривая, проведенная относительно фактических значений ряда так, чтобы она отображала тенденцию, присущую ряда, и одновременно освобождала его от мелких незначительных колебаний. Такие кривые называют еще кривыми роста, применяются они главным образом для прогнозирования экономических показателей;

2) Методы механического сглаживания. Сглаживается каждый отдельный уровень ряда с использованием фактических значений соседних с ним уровней. Для сглаживания временных рядов часто используются методы простой и взвешенной скользящей средней, экспоненциального сглаживания.

Метод простой скользящей средней включает в себя следующие этапы:

1. Определяется количество наблюдений, входящих в интервал сглаживания. При этом используют правило: если необходимо сгладить мелкие, беспорядочные колебания, то интервал сглаживания берут по возможности большим и, наоборот, интервал сглаживания уменьшают, когда нужно сохранить более мелкие волны и освободиться от периодически повторяющихся колебаний, возникающих, например, из-за автокорреляций уровней.

2. Вычисляется среднее значение наблюдений, образующих интервал сглаживания, которое одновременно является сглаживающим значением уровня, находящегося в центре интервала сглаживания, при условии, что m - нечетное число, по формуле

где m - количество наблюдений, входящих в интервал сглаживания; p - количество наблюдений, стоящих по разные стороны от сглаживаемого.

При нечетном m значение параметра p вычисляют следующим образом:

Первым сглаженным будет наблюдение t, где t = p+1.

3. Интервал сглаживания сдвигается на один член вправо, и по формуле (1) находится сглаженное значение для (t+1) - го наблюдения. Затем снова производят сдвиг и т.д.

Процедура продолжается до тех пор, пока в интервал сглаживания не войдет последнее наблюдение временного ряда.

Метод простой скользящей средней можно использовать, если графическое изображение ряда напоминает прямую линию.

В этом случае не искажается динамика развития исследуемого процесса. Однако когда тренд выравниваемого ряда имеет изгибы и к тому же желательно сохранить мелкие волны, использовать для сглаживания ряда метод простой скользящей средней нецелесообразно, поскольку при этом:

· выравниваются и выпуклые, и вогнутые линии;

· происходит сдвиг волны вдоль ряда;

· изменяется знак волны, т.е. на кривой, соединяющей сглаженные точки, вместо выпуклого участка образуется вогнутый и наоборот. Последнее имеет место в случае, когда интервал сглаживания в полтора раза превышает длину волны.

Таким образом, если развитие процесса носит нелинейный характер, то применение метода простой скользящей средней может привести к значительным искажениям исследуемого процесса.

В таких случаях более надежным является использование других методов сглаживания, например метод взвешенной скользящей средней.

Метод взвешенной скользящей средней отличается от предыдущего тем, что сглаживание внутри интервала производиться не по прямой, а по кривой более высокого порядка. Это обусловлено тем, что суммирование членов ряда, входящих в интервал сглаживания, производиться с определенными весами, рассчитанными по методу наименьших квадратов.

Если сглаживание производиться с помощью полинома (многочлена) второго и третьего порядка, то веса берутся следующие

(-3; 12; 17; 12; - 3) для m=5;

(-2; 3; 6; 7; 3; - 2) для m=7.

Особенности весов:

1) симметричны относительно центрального члена;

2) сумма весов с учетом общего множителя равна единице.

Недостаток метода: первые и последние p наблюдений ряда остаются несглаженными.

Расчет показателей динамики экономических процессов

Расчет показателей динамики экономических процессов - заключительный этап предварительного анализа данных.

Для характеристики динамики изменения экономических показателей часто используется понятие автокорреляции, которая характеризует не только взаимозависимость уровней одного и того же ряда, относящихся к разным моментам наблюдений, но и степень устойчивости развития процесса во времени, величину оптимального периода прогнозирования и т.п.

Степень тесноты статистической связи между уровнями временного ряда, сдвинутыми на ф единиц времени, определяется величиной коэффициента корреляции r(ф). Так как r(ф) измеряет тесноту связи между уровнями одного и того же временного ряда, его принято называть коэффициентом автокорреляции. При этом ф - длину временного смещения - называют обычно лагом.

Коэффициент автокорреляции вычисляют по формуле

При большой протяженности исследуемого ряда расчет коэффициентов автокорреляции можно упростить. Для этого находят отклонения не от средних коррелируемых рядов, а от общей средней всего ряда. В этом случае

Порядок коэффициентов автокорреляции определяется временным лагом: первого порядка (при ф = 1), второго порядка (при ф = 2) и т.д.

Последовательность коэффициентов автокорреляции уровней первого, второго и последующих порядков называют автокорреляционной функцией. Значения которой, могут колебаться от -1 до +1, но из стационарности следует, что r(ф) = - r(ф). График автокорреляционной функции называется коррелограммой.

Анализ автокорреляционной функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, т.е. при помощи анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда.

Если наиболее высоким оказался коэффициент автокорреляции 1 ого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка ф, то ряд содержит циклические колебания с периодичностью в ф моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, то можно сделать одно из двух предположений относительно структуры этого ряда: либо ряд не содержит тенденции и сезонных колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты f(t) и сезонной компоненты S(t).

Механическое сглаживание по скользящим средним

Методы сглаживания временных рядов

Очень часто уровни экономических рядов динамики колеблются. При этом тенденция развития экономического явления во времени скрыта случайными отклонениями значений ряда в ту или иную сторону. С целью более чёткого выявления тенденции развития исследуемого процесса производят сглаживание (выравнивание) временных рядов экономических показателей. Суть различных методов сглаживания сводится к замене фактических уровней временного ряда расчётными значениями, которые подвержены колебаниям в меньшей степени. Это способствует чёткому проявлению тенденции.

Методы сглаживания временных рядов делятся на две основные группы :

1) аналитическое выравнивание с использованием кривой, проведённой между конкретными уровнями ряда так, чтобы она отображала тенденцию, присущую ряду, и одновременно освобождала его от незначительных колебаний;

2) механическое выравнивание отдельных уровней временного ряда с использованием фактических значений соседних уровней.

Суть методов аналитического сглаживания основана на том математическом правиле, что через любые n точек, лежащих на плоскости, можно провести полином минимум (n – 1) степени так, что он будет проходить через все обозначенные точки.

Суть методов механического сглаживания заключается в том, что берётся несколько уровней ряда динамики, образующих интервал сглаживания. Для них подбирается полином, степень которого должна быть меньше числа уровней, входящих в интервал сглаживания. С помощью полинома определяются сглаженные значения уровней ряда в середине интервала сглаживания. Далее интервал сглаживания сдвигается на одно наблюдение вперёд, вычисляется следующее сглаженное значение и т.д.

Механическое сглаживание по скользящим средним

Самым простым методом механического сглаживания является сглаживание по простой скользящей средней . Метод называется так потому, что в его основе лежит вычисление простого среднего значения нескольких уровней ряда. Простое среднее скользит вдоль ряда динамики с шагом равным периоду наблюдений.

Сначала для временного ряда y t определяется интервал сглаживания m , причём m < n . Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нужно сохранить более мелкие колебания. Чем шире интервал сглаживания, тем в большей степени взаимопогашаются колебания, и тенденция развития носит более плавный характер. Чем сильнее колебания, тем шире должен быть интервал сглаживания. При одинаковых условиях рекомендуется использовать интервал сглаживания нечётной длины. Для первых m уровней временного ряда вычисляется их средняя арифметическая; это будет сглаженное значение уровня ряда, находящегося в середине интервала сглаживания.

Для вычисления сглаженных значений используется формула:

где m = 2·p + 1 – интервал сглаживания временного ряда нечётной длины. В результате такой процедуры получаются (n – m + 1)

Процедуру сглаживания можно применять и для интервала сглаживания чётной длины. Особенно это актуально для анализа и прогнозирования явлений, имеющих сезонные колебания. При сглаживании сезонных процессов интервал сглаживания обязательно должен быть равен длине сезонной волны. В противном случае произойдёт искажение компонент временного ряда, в особенности, компоненты v t . В случае, когда используется интервал сглаживания чётной длины, т.е. m = 2·p , применяется формула:

(4.2).

В результате данной процедуры получаются (n – m) сглаженных значений уровней ряда.

В любом случае первые и последние p значений ряда не сглаживаются . Потерянные сглаженные значения уровней временного ряда находятся с помощью использования показателя среднего абсолютного прироста, найденного для первого и последнего интервалов сглаживания. Для восстановления потерянных наблюдений в начале временного ряда значение величины среднего абсолютного прироста, найденное для первого интервала сглаживания, вычитается из первого сглаженного значения. Получается сглаженное значение уровня ряда для y p y 1 . Для восстановления потерянных наблюдений в конце временного ряда значение величины среднего абсолютного прироста, найденное для последнего интервала сглаживания, прибавляется к последнему сглаженному значению. Получается сглаженное значение уровня ряда для y n – p + 1 . Далее алгоритм повторяется до получения сглаженного значения y n .

Ещё один недостаток метода простой скользящей средней заключается в том, что он может использоваться лишь для рядов, имеющих линейную тенденцию. Если для процесса характерно нелинейное развитие и необходимо сохранить изгибы тенденции, то применение простой скользящей средней нецелесообразно, т.к. это может привести к существенным искажениям. В таких случаях используется метод взвешенной скользящей средней.

Метод взвешенной скользящей средней отличается от метода простой скользящей средней тем, что уровни, входящие в интервал сглаживания, суммируются с разными весами. Это связано с тем, что аппроксимация исходного ряда в пределах интервала сглаживания осуществляется с использованием полинома не первой степени, как в методе простой скользящей средней, а степени, начиная со второй. Используется формула средней арифметической взвешенной.

16.02.15 Виктор Гаврилов

38133 0

Временным рядом называется последовательность значений, изменяемых во времени. О некоторых простых, но эффективных подходах к работе с подобными последовательностями я попробую рассказать в данной статье. Примеров таких данных можно встретить очень много – котировки валют, объемы продаж, обращения клиентов, данные в различных прикладных науках (социология, метеорология, геология, наблюдения в физике) и многое другое.

Ряды являются распространенной и важной формой описания данных, так как позволяют наблюдать всю историю изменения интересующего нас значения. Это даёт нам возможность судить о «типичном» поведении величины и об отклонениях от такого поведения.

Передо мной встала задача выбрать набор данных, на котором можно было бы наглядно продемонстрировать особенности временных рядов. Я решил воспользоваться статистикой пассажиропотока на международных авиалиниях, поскольку этот набор данных весьма нагляден и стал своего рода стандартным (http://robjhyndman.com/tsdldata/data/airpass.dat , источник Time Series Data Library, R. J. Hyndman). Ряд описывает количество пассажиров международных авиалиний в месяц (в тысячах) за период с 1949 по 1960 года.

Поскольку у меня всегда под рукой , в которой есть интересный инструмент « » для работы с рядами, я воспользуюсь именно им. Перед импортом данных в файл нужно добавить столбец с датой, чтобы была привязка значений ко времени, и столбец с именем ряда для каждого наблюдения. Ниже видно, как выглядит мой исходный файл, который я импортировал в Prognoz Platform с помощью мастера импорта непосредственно из инструмента анализа временных рядов.

Первое, что мы обычно делаем с временным рядом, это отображаем его на графике. Prognoz Platform позволяет построить график, просто «перетащив» ряд в рабочую книгу.

Временной ряд на графике

Символ ‘M’ в конце имени ряда означает, что ряд имеет месячную динамику (интервал между наблюдениями равен одному месяцу).

Уже из графика мы видим, что ряд демонстрирует две особенности:

  • тренд – на нашем графике это долгосрочный рост наблюдаемых значений. Видно, что тренд практически линейный.
  • сезонность – на графике это периодические колебания величины. В следующей статье на тему временных рядов мы узнаем, как можно вычислить период.

Наш ряд достаточно «аккуратный», однако часто встречаются ряды, которые помимо двух описанных выше характеристик демонстрируют ещё одну – наличие «шума», т.е. случайных вариаций в той или иной форме. Пример такого ряда можно увидеть на графике ниже. Это синусоидальный сигнал, смешанный со случайной величиной.

При анализе рядов нас интересует выявление их структуры и оценка всех основных компонентов – тренда, сезонности, шума и других особенностей, а также возможность строить прогнозы изменения величины в будущих периодах.

При работе с рядами наличие шума часто затрудняет анализ структуры ряда. Чтобы исключить его влияние и лучше увидеть структуру ряда, можно использовать методы сглаживания рядов.

Самый простой метод сглаживания рядов – скользящее среднее. Идея заключается в том, что для любого нечётного количества точек последовательности ряда заменять центральную точку на среднее арифметическое остальных точек:

где x i – исходный ряд, s i – сглаженный ряд.

Ниже можно увидеть результат применения данного алгоритма к двум нашим рядам. Prognoz Platform по умолчанию предлагает использовать сглаживание с размером окна в 5 точек (k в нашей формуле выше будет равно 2). Обратите внимание, что сглаженный сигнал уже не так подвержен влиянию шума, однако вместе с шумом, естественно, пропадает и часть полезной информации о динамике ряда. Также видно, что у сглаженного ряда отсутствуют первые (и также последние) k точек. Это связано с тем, что сглаживание выполняется для центральной точки окна (в нашем случае для третьей точки), после чего окно сдвигается на одну точку, и вычисления повторяются. Для второго, случайного ряда, я использовал сглаживание с окном равным 30, чтобы лучше выявить структуру ряда, так как ряд «высокочастотный», точек очень много.

Метод скользящего среднего имеет определённые недостатки:

  • Скользящее среднее неэффективно в вычислении. Для каждой точки среднее необходимо перевычислять по новой. Мы не можем переиспользовать результат, вычисленный для предыдущей точки.
  • Скользящее среднее нельзя продлить на первые и последние точки ряда. Это может вызвать проблему, если нас интересуют именно эти точки.
  • Скользящее среднее не определено за пределами ряда, и как следствие, не может использоваться для прогнозирования.

Экспоненциальное сглаживание

Более продвинутый метод сглаживания, который также можно использовать для прогнозирования – экспоненциальное сглаживание, также иногда называемое методом Хольта-Уинтерса (Holt-Winters) в честь имён его создателей.

Существует насколько вариантов данного метода:

  • одинарное сглаживание для рядов, у которых нет тренда и сезонности;
  • двойное сглаживание для рядов, у которых есть тренд, но нет сезонности;
  • тройное сглаживание для рядов, у которых есть и тренд, и сезонность.

Метод экспоненциального сглаживания вычисляет значения сглаженного ряда путём обновления значений, рассчитанных на предыдущем шаге, используя информацию с текущего шага. Информация с предыдущего и текущего шагов берётся с разными весами, которыми можно управлять.

В простейшем варианте одинарного сглаживания соотношение такое:

Параметр α определяет соотношение между несглаженным значением на текущем шаге и сглаженным значением с предыдущего шага. При α =1 мы будем брать только точки исходного ряда, т.е. никакого сглаживания не будет. При α =0 ряд мы будем брать только сглаженные значения с предыдущих шагов, т.е. ряд превратится в константу.

Чтобы понять, почему сглаживание называется экспоненциальным, нам нужно раскрыть соотношение рекурсивно:

Из соотношения видно, что все предыдущие значения ряда вносят вклад в текущее сглаженное значение, однако их вклад угасает экспоненциально за счёт роста степени параметра α .

Однако, если в данных есть тренд, простое сглаживание будет «отставать» от него (либо придётся брать значения α близкими к 1, но тогда сглаживание будет недостаточным). Нужно использовать двойное экспоненциальное сглаживание.

Двойное сглаживание использует уже два уравнения – одно уравнение оценивает тренд как разницу между текущим и предыдущим сглаженным значениями, потом сглаживает тренд простым сглаживанием. Второе уравнение выполняет сглаживание как в случае простого варианта, но во втором слагаемом используется сумма предыдущего сглаженного значения и тренда.

Тройное сглаживание включает ещё один компонент – сезонность, и использует ещё одно уравнение. При этом различаются два варианта сезонного компонента – аддитивный и мультипликативный. В первом случае амплитуда сезонного компонента постоянна и со временем не зависит от базовой амплитуды ряда. Во втором случае амплитуда меняется вместе с изменением базовой амплитуды ряда. Это как раз наш случай, как видно из графика. С ростом ряда амплитуда сезонных колебаний увеличивается.

Так как наш первый ряд имеет и тренд, и сезонность, я решил подобрать параметры тройного сглаживания для него. В Prognoz Platform это довольно просто сделать, потому что при обновлении значения параметра платформа сразу же перерисовывает график сглаженного ряда, и визуально можно сразу увидеть, насколько хорошо он описывает наш исходный ряд. Я остановился на следующих значениях:

Как я вычислил период, мы рассмотрим в следующей статье о временных рядах.

Обычно в качестве первых приближений можно рассматривать значения между 0,2 и 0,4. Prognoz Platform также использует модель с дополнительным параметром ɸ , который дэмпфирует тренд так, что он приближается к константе в будущем. Для ɸ я взял значение 1, что соответствует обычной модели.

Также я сделал прогноз значений ряда данным методом на последние 2 года. На рисунке ниже я пометил точку начала прогноза, проведя через неё черту. Как видно, исходный ряд и сглаженный весьма неплохо совпадают, в том числе и на периоде прогнозирования – неплохо для такого простого метода!

Prognoz Platform также позволяет автоматически подобрать оптимальные значения параметров, используя систематический поиск в пространстве значений параметров и минимизируя сумму квадратов отклонений сглаженного ряда от исходного.

Описанные методы весьма просты, их легко применять, и они являются хорошей отправной точкой для анализа структуры и прогнозирования временных рядов.

Еще больше о временных рядах читайте в следующей статье.

Министерство образования Российской Федерации

Всероссийский заочный финансово – экономический институт

Ярославский филиал

Кафедра статистики

Курсовая работа

по дисциплине:

«Статистика»

задание № 19

Студент: Курашова Анастасия Юрьевна

Специальность «Финансы и кредит»

3 курс, периферия

Руководитель: Сергеев В.П.

Ярославль, 2002 г.

1. Введение……………………………………………………………3 стр.

2. Теоретическая часть…………………………………………… …4 стр.

2.1 Основные понятия о рядах динамики…………………………...4 стр.

2.2 Методы сглаживания и выравнивания динамических рядов……………………………………………………………….6 стр.

2.2.1 Методы «механического сглаживания»………………………6 стр.

2.2.2 Методы «аналитического» выравнивания…………………. 8 стр.

3. Расчетная часть……………………………………………… ……11 стр.

4. Аналитическая часть……………………………………………. .16 стр.

5. Заключение ………………………………………………………. 25 стр.

6. Список литературы……………………………………………… 26 стр.

7. Приложения………………………………………………………. 27 стр.


Введение

Полная и достоверная статистическая информация является тем необходимым основанием, на котором базируется процесс управления экономикой. Вся информация, имеющая народнохозяйственную значимость, в конечном счете, обрабатывается и анализируется с помощью статистики.

Именно статистические данные позволяют определить объемы валового внутреннего продукта и национального дохода, выявить основные тенденции развития отраслей экономики, оценить уровень инфляции, проанализировать состояние финансовых и товарных рынков, исследовать уровень жизни населения и другие социально-экономические явления и процессы.

Овладение статистической методологией - одно из условий познания конъюнктуры рынка, изучения тенденций и прогнозирования, принятия оптимальных решений на всех уровнях деятельности.

Сложной, трудоемкой и ответственной является заключительная, аналитическая стадия исследования. На этой стадии рассчитываются средние показатели и показатели распределения, анализируется структура совокупности, исследуется динамика и взаимосвязь между изучаемыми явлениями и процессами.

На всех стадиях исследования статистика использует различные методы. Методы статистики - это особые приемы и способы изучения массовых общественных явлений.

I. Теоретическая часть.

1.1 Основные понятия о рядах динамики.

Ряды динамики – статистические данные, отображающие развитие во времени изучаемого явления. Их также называют динамическими рядами, временными рядами.

В каждом ряду динамики имеется два основных элемента:

1) показатель времени t ;

2) соответствующие им уровни развития изучаемого явления y;

В качестве показаний времени в рядах динамики выступают либо определенные даты (моменты), либо отдельные периоды (годы, кварталы, месяцы, сутки).

Уровни рядов динамики отображают количественную оценку (меру) развития во времени изучаемого явления. Они могут выражаться абсолютными, относительными или средними величинами.

Ряды динамики различаются по следующим признакам:

1) По времени. В зависимости от характера изучаемого явления уровни рядов динамики могут относиться или к определенным датам (моментам) времени, или к отдельным периодам. В соответствии с этим ряды динамики подразделяются на моментные и интервальные.

Моментные ряды динамики отображают состояние изучаемых явлений на определенные даты (моменты) времени. Примером моментного ряда динамики является следующая информация о списочной численности работников магазина в 1991 году (таб. 1):

Таблица 1

Списочная численность работников магазина в 1991 году

Особенностью моментного ряда динамики является то, что в его уровни могут входить одни и те же единицы изучаемой совокупности. Хотя и в моментном ряду есть интервалы – промежутки между соседними в ряду датами, -- величина того или иного конкретного уровня не зависит от продолжительности периода между двумя датами. Так, основная часть персонала магазина, составляющая списочную численность на 1.01.1991 , продолжающая работать в течение данного года, отображена в уровнях последующих периодов. Поэтому при суммировании уровней моментного ряда может возникнуть повторный счет.

Посредством моментных рядов динамики в торговле изучаются товарные запасы, состояние кадров, количество оборудования и других показателей, отображающих состояние изучаемых явлений на отдельные даты (моменты) времени.

Интервальные ряды динамики отражают итоги развития (функционирования) изучаемых явлений за отдельные периоды (интервалы) времени.

Примером интервального ряда могут служить данные о розничном товарообороте магазина в 1987 – 1991 гг. (таб. 2):

Таблица 2

Объем розничного товарооборота магазина в 1987 - 1991 гг.

Объем розничного товарооборота, тыс. р.

885.7 932.6 980.1 1028.7 1088.4

Каждый уровень интервального ряда уже представляет собой сумму уровней за более короткие промежутки времени. При этом единица совокупности, входящая в состав одного уровня, не входит в состав других уровней.

Особенностью интервального ряда динамики является то, что каждый его уровень складывается из данных за более короткие интервалы (субпериоды) времени. Например, суммируя товарооборот за первые три месяца года, получают его объем за I квартал, а суммируя товарооборот за четыре квартала, получают его величину за год, и т. д. При прочих равных условиях уровень интервального ряда тем больше, чем больше длина интервала, к которому этот уровень относится.

Свойство суммирования уровней за последовательные интервалы времени позволяет получить ряды динамики более укрупненных периодов.

Посредством интервальных рядов динамики в торговле изучают изменения во времени поступления и реализации товаров, суммы издержек обращения и других показателей, отображающих итоги функционирования изучаемого явления за отдельные периоды.

Структура ряда динамики:

Всякий ряд динамики теоретически может быть представлен в виде составляющих:

1) тренд – основная тенденция развития динамического ряда (к увеличению или снижению его уровней) ;

2) циклические (периодические колебания, в том числе сезонные);

случайные колебания.

1. 2. Методы сглаживания и выравнивания динамических рядов.

Исключение случайных колебаний значений уровней ряда осуществляется с помощью нахождения «усредненных» значений. Способы устранения случайных факторов делятся на две больше группы:

1. Способы «механического» сглаживания колебаний путем усреднения значений ряда относительно других, расположенных рядом, уровней ряда.

2. Способы «аналитического» выравнивания, т. е. определения сначала функционального выражения тенденции ряда, а затем новых, расчетных значений ряда.

1.2. 1 Методы «механического» сглаживания.

Сюда относятся:

а. Метод усреднения по двум половинам ряда, когда ряд делится на две части. Затем, рассчитываются два значения средних уровней ряда, по которым графически определяется тенденция ряда. Очевидно, что такой тренд не достаточно полно отражает основную закономерность развития явления.

б. Метод укрупнения интервалов, при котором производится увеличение протяженности временных промежутков, и рассчитываются новые значения уровней ряда.

в. Метод скользящей средней. Данный метод применяется для характеристики тенденции развития исследуемой статистической совокупности и основан на расчете средних уровней ряда за определенный период. Последовательность определения скользящей средней:

Устанавливается интервал сглаживания или число входящих в него уровней. Если при расчете средней учитываются три уровня, скользящая средняя называется трехчленной, пять уровней – пятичленной и т.д. Если сглаживаются мелкие, беспорядочные колебания уровней в ряду динамики, то интервал (число скользящей средней) увеличивают. Если волны следует сохранить, число членов уменьшают.

Исчисляют первый средний уровень по арифметической простой:

y1 = Sy1/m, где

y1 – I-ый уровень ряда;

m – членность скользящей средней.

Первый уровень отбрасывают, а в исчисление средней включают уровень, следующий за последним уровнем, участвующем в первом расчете. Процесс продолжается до тех пор, пока в расчет y будет включен последний уровень исследуемого ряда динамики y n .

По ряду динамики, построенному из средних уровней, выявляют общую тенденцию развития явления.

Отрицательной стороной использования метода скользящей средней является образование сдвигов в колебаниях уровней ряда, обусловленных «скольжением» интервалов укрупнения. Сглаживание с помощью скользящей средней может привести к появлению «обратных» колебаний, когда выпуклая «волна» заменяется на вогнутую.

В последнее время стала рассчитываться адаптивная скользящая средняя. Ее отличие состоит в том, что среднее значение признака, рассчитываемое также как описано выше, относится не к середине ряда, а к последнему промежутку времени в интервале укрупнения. Причем предполагается, что адаптивная средняя зависит от предыдущего уровня в меньшей степени, чем от текущего. То есть., чем больше промежутков времени между уровнем ряда и средним значением, тем меньшее влияние оказывает значение этого уровня ряда на величину средней.

г. Метод экспоненциальной средней. Экспоненциальная средняя – это адаптивная скользящая средняя, рассчитанная с применением весов, зависящих от степени «удаленности» отдельных уровней ряда от среднего значения. Величина веса убывает по мере удаления уровня по хронологической прямой от среднего значения в соответствии с экспоненциальной функцией, поэтому такая средняя называется экспоненциальной. На практике применяется многократное экспоненциальное сглаживания ряда динамики, которое используется для прогнозирования развития явления.

Вывод: способы, включенные в первую группу, ввиду применяемых методик расчета предоставляют исследователю очень упрощенное, неточное, представление о тенденции в ряду динамики. Однако корректное применение этих способов требует от исследователя глубины знаний о динамике различных социально - экономических явлений.

Перейдем к вопросу о сглаживании временных рядов экономических показателей. Очень часто уровни рядов динамики колеблются, при этом тенденция развития экономического явления во времени скрыта случайными отклонениями уровней в ту или иную сторону. С целью четко выявить тенденцию развития исследуемого процесса, в том числе для дальнейшего применения методов прогнозирования на основе трендовых моделей, производят сглаживание (выравнивание) временных рядов. Таким образом, сглаживание можно рассматривать как устранение случайной составляющей t из модели временного ряда.

Самым простым методом механического сглаживания является метод простой скользящей средней. Сначала для временного ряда y 1 , y 2 , y 3 ,…, y n определяется интервал сглаживания т (т < п). Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нужно сохранить более мелкие колебания. При прочих равных условиях интервал сглаживания рекомендуется брать нечетным. Для первых т уровней временного ряда вычисляется их средняя арифметическая; это будет сглаженное значение уровня ряда, находящегося в середине интервала сглаживания. Затем интервал сглаживания сдвигается на один уровень вправо, повторяется вычисление средней арифметической и т.д.

Для вычисления сглаженных уровней ряда применяется формула

при нечетном m ;

для четных т формула усложняется.

В результате такой процедуры получаются п - т + 1 сглаженных значений уровней ряда; при этом первые р и последние р уровней ряда теряются (не сглаживаются).

Особенность метода экспоненциального сглаживания заключается в том, что в процедуре нахождения сглаживания i -го уровня используются значения только предшествующих уровней ряда (i -1, i -2,…), взятые с определенным весом, причем вес наблюдения уменьшается по мере удаления его от момента времени, для которого определяется сглаженное значение уровня ряда.

Если для исходного временного ряда y 1 , y 2 , y 3 ,…, y n соответствующие сглаженные значения уровней обозначить через S t , t = 1,2, …, п, то экспоненциальное сглаживание осуществляется по формуле

здесь S 0 – величина, характеризующая начальные условия.

В практических задачах обработки экономических временных рядов рекомендуется выбирать величину параметра сглаживания в интервале от 0,1 до 0,3.

Пример 4.4. Вернемся к примеру 1, в котором рассматриваются квартальные объемы продаж компании «Lewplan». Мы уже выяснили, что этим данным отвечает аддитивная модель, т.е. фактически объемы продаж можно выразить следующим образом:

Y = U + V + E.

Для того чтобы элиминировать влияние сезонной компоненты, воспользуемся методом скользящей средней. Просуммировав первые четыре значения, получим общий объем продаж в 1998 г. Если поделить эту сумму на четыре, можно найти средний балл продаж в каждом квартале 1998 г., т.е.

(239 + 201 +182 + 297)/4 = 229,75;
(201+182+297+324)/4 и т. д.

Полученное значение уже не содержит сезонной компоненты, поскольку представляет собой среднюю величину за год. У нас появилась оценка значения тренда для середины года, т.е. для точки, лежащей в середине между кварталами II и III. Если последовательно передвигаться вперед с интервалом в три месяца, можно рассчитать средние квартальные значения на промежутке апрель – март 1998 (251), июль – июнь 1998 (270,25) и т.д. Данная процедура позволяет генерировать скользящие средние по четырем точкам для исходного множества данных. Получаемое таким образом множество скользящих средних представляет наилучшую оценку искомого тренда.

Теперь полученные значения тренда можно использовать для нахождения оценок сезонной компоненты. Мы рассчитываем:

Y U = V + E .

К сожалению, оценки значений тренда, полученные в результате расчета средних по четырем точкам, относятся к нескольким иным моментам времени, чем фактические данные. Первая оценка, равная 229,75, представляет собой точку, совпадающую с серединой 1998 г., т.е. лежит в центре промежутка фактических значений объемов продаж во II и III кварталах. Вторая оценка, равная 251, лежит между фактическими значениями в III и IV кварталах. Нам же требуются десезонализированные средние значения, соответствующие тем же интервалам времени, что и фактические значения за квартал. Положение десезонализированных средних во времени сдвигается путем дальнейшего расчета средних для каждой пары значений. Найдем среднюю из первой оценок, центрируя их на июль – сентябрь 1998 г., т.е.

(229,75 + 251)/2 = 240,4.

Это и есть десезонализированная средняя за июль – сентябрь 1999 г. Эту десезонализированную величину, которая называется центрированной скользящей средней , можно непосредственно сравнивать с фактическим значением за июль – сентябрь 1998 г., равным 182. Отметим, что это означает отсутствие оценок тренда за первые два или последние два квартала временного ряда. Результаты этих расчетов приведены в табл.4.5.

Для каждого квартала мы имеем оценки сезонной компоненты, которые включают в себя ошибку или остаток. Прежде чем мы сможем использовать сезонную компоненту, нужно пройти два следующих этапа. Найдем средние значения сезонных оценок для каждого сезона года. Эта процедура позволит уменьшить некоторые значения ошибок. Наконец, скорректируем средние значения, увеличивая или уменьшая их на одно и тоже число таким образом, чтобы общая их сумма была равна нулю. Это необходимо, чтобы усреднить значения сезонной компоненты в целом за год.

Таблица 4.5. Оценка сезонной компоненты

Объем продаж Y , тыс. шт.

за четыре

квартала

Скользящая

средняя за четыре

квартала

Центрированная скользящая средняя U

сезонной компоненты

Y - U = V + E

Январь-март 1998

Апрель-июнь

Июль-сентябрь

Октябрь-декабрь

Январь-март 1999

Апрель-июнь

Июль-сентябрь

Октябрь-декабрь

Январь-март 2000

Апрель-июнь

Июль-сентябрь

Октябрь-декабрь

Январь-март 2001

Таблица 4.6. Расчет средних значений сезонной компоненты

Рассчитываемые

компоненты

Номер квартала

Среднее значение

Оценка сезонной

компоненты

Сумма = -0,2

Скорректированная

сезонная компонента 1

Корректирующий фактор рассчитывается следующим образом: сумма оценок сезонных компонент делится на 4. В последнем столбце табл. 4.5 эти оценки записаны под соответствующими квартальными значениями. Сама процедура приведена в табл. 4.6.

Значение сезонной компоненты еще раз подтверждает наши выводы, сделанные в примере 4.1 на основе анализа диаграммы. Объемы продаж за два зимних квартала превышают среднее трендовое значение приблизительно на 40 тыс. шт., а объемы продаж за два летних периода ниже средних на 21 и 62 тыс.шт. соответственно.

Аналогичная процедура применима при определении сезонной вариации за любой промежуток времени. Если, например, в качестве сезона выступают дни недели, для элиминирования влияния ежедневной сезонной компоненты также рассчитывают скользящую среднюю, но уже не по четырем, а по семи точкам. Эта скользящая средняя представляет собой значение тренда в середине недели, т.е. в четверг; таким образом, необходимость в процедуре центрирования отпадает.



Понравилась статья? Поделитесь с друзьями!