Разработка прогноза с помощью метода скользящей средней. Пример решения задачи

Одной из задач анализа рядов динамики, является установление закономерностей изменения уровней изучаемого показателя во времени.

В некоторых случаях эта закономерность развития объекта вполне ясно отображается уровнями динамического ряда. Однако часто приходится встречаться с такими рядами динамики, когда уровни ряда претерпевают самые различные изменения. В подобных случаях для определения основной тенденции развития, достаточно устойчивой на протяжении данного периода, используют особые приёмы обработки рядов динамики.

Уровни ряда динамики формируются под совокупным влиянием множества длительных и кратковременных факторов, в том числе различных, случайных обстоятельств. В то же время выявление основной тенденции изменения уровня ряда предполагает её количественное выражение, которое свободно от случайных воздействий. Существуют различные методы выявления тенденции развития динамики. Одним из приёмов выявления основной тенденции является метод укрупнения интервалов. Этот способ основан на укрупнении периодов времени, к которым относятся уровни ряда. Например, ряд ежесуточного выпуска продукции заменяется рядом месячного выпуска продукции и т.д.

Другой метод - метод подвижной (скользящей) средней. Суть метода состоит в замене исходных уровней средними арифметическими за определённые периоды. При этом сначала для временного ряда определяется интервал сглаживания . Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нежно сохранить более мелкие колебания. При прочих равных условиях интервал сглаживания рекомендуется брать нечетным. Процесс сглаживания, для первых уровней динамического ряда вычисляется их средняя арифметическая; это будет сглаженное значение уровня ряда, находящегося в средине интервала сглаживания. Затем интервал сглаживания сдвигается на один уровень вправо, повторяется вычисление средней арифметической и т. д. Для вычисления сглаженных уровней временного ряда применяется формула:

(5.6)

В результате такой процедуры получаются сглаженных значений уровней ряда; при этом первые уровней и последние уровней ряда теряются (не сглаживаются).

К этому методу сглаживания (выравнивания) примыкает экспоненциальное сглаживание. Особенность данного метода заключается в том, что в процедуре нахождения сглаженного уровня используются значения только предшествующих уровней ряда, взятые с определенным весом. Если для исходного динамического ряда соответствующие сглаженные значения уровней обозначить через , , то экспоненциальное сглаживание осуществляется по формуле:


где параметр сглаживания; называется коэффициентом дисконтирования.

Используя приведенное выше рекуррентное соотношение (5.7) для всех уровней ряда, начиная с первого и кончая моментом времени , можно получить, что экспоненциальная средняя, т. е. сглаженное данным методом значение уровня ряда, является взвешенной средней всех предшествующих уровней:

, (5.8)

где величина, характеризующая начальные условия.

В практических задачах обработки экономических времен­ных рядов рекомендуется (необоснованно) выбирать величину параметра сглаживания в интервале от 0,1 до 0,3. Других точ­ных рекомендаций для выбора оптимальной величины пара­метра пока нет. В отдельных случаях Р. Браун предлагает определять величину исходя из длины сглаживаемого ряда:

Что касается начального параметра So, то в конкретных задачах его берут или равным значению первого уровня ряда , или равным средней арифметической нескольких первых членов ряда, например, членов :

Указанный выше порядок выбора величины So обеспе­чивает хорошее согласование сглаженного и исходного ря­дов для первых уровней. Если при подходе к правому концу временного ряда сглаженные этим методом значения при выбранном параметре начинают значительно отличаться от соответствующих значений исходного ряда, необходимо перейти на другой параметр сглаживания. Заметим, что при этом методе сглаживания не теряются ни начальные, ни ко­нечные уровни сглаживаемого временного ряда.

16.02.15 Виктор Гаврилов

38133 0

Временным рядом называется последовательность значений, изменяемых во времени. О некоторых простых, но эффективных подходах к работе с подобными последовательностями я попробую рассказать в данной статье. Примеров таких данных можно встретить очень много – котировки валют, объемы продаж, обращения клиентов, данные в различных прикладных науках (социология, метеорология, геология, наблюдения в физике) и многое другое.

Ряды являются распространенной и важной формой описания данных, так как позволяют наблюдать всю историю изменения интересующего нас значения. Это даёт нам возможность судить о «типичном» поведении величины и об отклонениях от такого поведения.

Передо мной встала задача выбрать набор данных, на котором можно было бы наглядно продемонстрировать особенности временных рядов. Я решил воспользоваться статистикой пассажиропотока на международных авиалиниях, поскольку этот набор данных весьма нагляден и стал своего рода стандартным (http://robjhyndman.com/tsdldata/data/airpass.dat , источник Time Series Data Library, R. J. Hyndman). Ряд описывает количество пассажиров международных авиалиний в месяц (в тысячах) за период с 1949 по 1960 года.

Поскольку у меня всегда под рукой , в которой есть интересный инструмент « » для работы с рядами, я воспользуюсь именно им. Перед импортом данных в файл нужно добавить столбец с датой, чтобы была привязка значений ко времени, и столбец с именем ряда для каждого наблюдения. Ниже видно, как выглядит мой исходный файл, который я импортировал в Prognoz Platform с помощью мастера импорта непосредственно из инструмента анализа временных рядов.

Первое, что мы обычно делаем с временным рядом, это отображаем его на графике. Prognoz Platform позволяет построить график, просто «перетащив» ряд в рабочую книгу.

Временной ряд на графике

Символ ‘M’ в конце имени ряда означает, что ряд имеет месячную динамику (интервал между наблюдениями равен одному месяцу).

Уже из графика мы видим, что ряд демонстрирует две особенности:

  • тренд – на нашем графике это долгосрочный рост наблюдаемых значений. Видно, что тренд практически линейный.
  • сезонность – на графике это периодические колебания величины. В следующей статье на тему временных рядов мы узнаем, как можно вычислить период.

Наш ряд достаточно «аккуратный», однако часто встречаются ряды, которые помимо двух описанных выше характеристик демонстрируют ещё одну – наличие «шума», т.е. случайных вариаций в той или иной форме. Пример такого ряда можно увидеть на графике ниже. Это синусоидальный сигнал, смешанный со случайной величиной.

При анализе рядов нас интересует выявление их структуры и оценка всех основных компонентов – тренда, сезонности, шума и других особенностей, а также возможность строить прогнозы изменения величины в будущих периодах.

При работе с рядами наличие шума часто затрудняет анализ структуры ряда. Чтобы исключить его влияние и лучше увидеть структуру ряда, можно использовать методы сглаживания рядов.

Самый простой метод сглаживания рядов – скользящее среднее. Идея заключается в том, что для любого нечётного количества точек последовательности ряда заменять центральную точку на среднее арифметическое остальных точек:

где x i – исходный ряд, s i – сглаженный ряд.

Ниже можно увидеть результат применения данного алгоритма к двум нашим рядам. Prognoz Platform по умолчанию предлагает использовать сглаживание с размером окна в 5 точек (k в нашей формуле выше будет равно 2). Обратите внимание, что сглаженный сигнал уже не так подвержен влиянию шума, однако вместе с шумом, естественно, пропадает и часть полезной информации о динамике ряда. Также видно, что у сглаженного ряда отсутствуют первые (и также последние) k точек. Это связано с тем, что сглаживание выполняется для центральной точки окна (в нашем случае для третьей точки), после чего окно сдвигается на одну точку, и вычисления повторяются. Для второго, случайного ряда, я использовал сглаживание с окном равным 30, чтобы лучше выявить структуру ряда, так как ряд «высокочастотный», точек очень много.

Метод скользящего среднего имеет определённые недостатки:

  • Скользящее среднее неэффективно в вычислении. Для каждой точки среднее необходимо перевычислять по новой. Мы не можем переиспользовать результат, вычисленный для предыдущей точки.
  • Скользящее среднее нельзя продлить на первые и последние точки ряда. Это может вызвать проблему, если нас интересуют именно эти точки.
  • Скользящее среднее не определено за пределами ряда, и как следствие, не может использоваться для прогнозирования.

Экспоненциальное сглаживание

Более продвинутый метод сглаживания, который также можно использовать для прогнозирования – экспоненциальное сглаживание, также иногда называемое методом Хольта-Уинтерса (Holt-Winters) в честь имён его создателей.

Существует насколько вариантов данного метода:

  • одинарное сглаживание для рядов, у которых нет тренда и сезонности;
  • двойное сглаживание для рядов, у которых есть тренд, но нет сезонности;
  • тройное сглаживание для рядов, у которых есть и тренд, и сезонность.

Метод экспоненциального сглаживания вычисляет значения сглаженного ряда путём обновления значений, рассчитанных на предыдущем шаге, используя информацию с текущего шага. Информация с предыдущего и текущего шагов берётся с разными весами, которыми можно управлять.

В простейшем варианте одинарного сглаживания соотношение такое:

Параметр α определяет соотношение между несглаженным значением на текущем шаге и сглаженным значением с предыдущего шага. При α =1 мы будем брать только точки исходного ряда, т.е. никакого сглаживания не будет. При α =0 ряд мы будем брать только сглаженные значения с предыдущих шагов, т.е. ряд превратится в константу.

Чтобы понять, почему сглаживание называется экспоненциальным, нам нужно раскрыть соотношение рекурсивно:

Из соотношения видно, что все предыдущие значения ряда вносят вклад в текущее сглаженное значение, однако их вклад угасает экспоненциально за счёт роста степени параметра α .

Однако, если в данных есть тренд, простое сглаживание будет «отставать» от него (либо придётся брать значения α близкими к 1, но тогда сглаживание будет недостаточным). Нужно использовать двойное экспоненциальное сглаживание.

Двойное сглаживание использует уже два уравнения – одно уравнение оценивает тренд как разницу между текущим и предыдущим сглаженным значениями, потом сглаживает тренд простым сглаживанием. Второе уравнение выполняет сглаживание как в случае простого варианта, но во втором слагаемом используется сумма предыдущего сглаженного значения и тренда.

Тройное сглаживание включает ещё один компонент – сезонность, и использует ещё одно уравнение. При этом различаются два варианта сезонного компонента – аддитивный и мультипликативный. В первом случае амплитуда сезонного компонента постоянна и со временем не зависит от базовой амплитуды ряда. Во втором случае амплитуда меняется вместе с изменением базовой амплитуды ряда. Это как раз наш случай, как видно из графика. С ростом ряда амплитуда сезонных колебаний увеличивается.

Так как наш первый ряд имеет и тренд, и сезонность, я решил подобрать параметры тройного сглаживания для него. В Prognoz Platform это довольно просто сделать, потому что при обновлении значения параметра платформа сразу же перерисовывает график сглаженного ряда, и визуально можно сразу увидеть, насколько хорошо он описывает наш исходный ряд. Я остановился на следующих значениях:

Как я вычислил период, мы рассмотрим в следующей статье о временных рядах.

Обычно в качестве первых приближений можно рассматривать значения между 0,2 и 0,4. Prognoz Platform также использует модель с дополнительным параметром ɸ , который дэмпфирует тренд так, что он приближается к константе в будущем. Для ɸ я взял значение 1, что соответствует обычной модели.

Также я сделал прогноз значений ряда данным методом на последние 2 года. На рисунке ниже я пометил точку начала прогноза, проведя через неё черту. Как видно, исходный ряд и сглаженный весьма неплохо совпадают, в том числе и на периоде прогнозирования – неплохо для такого простого метода!

Prognoz Platform также позволяет автоматически подобрать оптимальные значения параметров, используя систематический поиск в пространстве значений параметров и минимизируя сумму квадратов отклонений сглаженного ряда от исходного.

Описанные методы весьма просты, их легко применять, и они являются хорошей отправной точкой для анализа структуры и прогнозирования временных рядов.

Еще больше о временных рядах читайте в следующей статье.

Перейдем к вопросу о сглаживании временных рядов экономических показателей. Очень часто уровни рядов динамики колеблются, при этом тенденция развития экономического явления во времени скрыта случайными отклонениями уровней в ту или иную сторону. С целью четко выявить тенденцию развития исследуемого процесса, в том числе для дальнейшего применения методов прогнозирования на основе трендовых моделей, производят сглаживание (выравнивание) временных рядов. Таким образом, сглаживание можно рассматривать как устранение случайной составляющей t из модели временного ряда.

Самым простым методом механического сглаживания является метод простой скользящей средней. Сначала для временного ряда y 1 , y 2 , y 3 ,…, y n определяется интервал сглаживания т (т < п). Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нужно сохранить более мелкие колебания. При прочих равных условиях интервал сглаживания рекомендуется брать нечетным. Для первых т уровней временного ряда вычисляется их средняя арифметическая; это будет сглаженное значение уровня ряда, находящегося в середине интервала сглаживания. Затем интервал сглаживания сдвигается на один уровень вправо, повторяется вычисление средней арифметической и т.д.

Для вычисления сглаженных уровней ряда применяется формула

при нечетном m ;

для четных т формула усложняется.

В результате такой процедуры получаются п - т + 1 сглаженных значений уровней ряда; при этом первые р и последние р уровней ряда теряются (не сглаживаются).

Особенность метода экспоненциального сглаживания заключается в том, что в процедуре нахождения сглаживания i -го уровня используются значения только предшествующих уровней ряда (i -1, i -2,…), взятые с определенным весом, причем вес наблюдения уменьшается по мере удаления его от момента времени, для которого определяется сглаженное значение уровня ряда.

Если для исходного временного ряда y 1 , y 2 , y 3 ,…, y n соответствующие сглаженные значения уровней обозначить через S t , t = 1,2, …, п, то экспоненциальное сглаживание осуществляется по формуле

здесь S 0 – величина, характеризующая начальные условия.

В практических задачах обработки экономических временных рядов рекомендуется выбирать величину параметра сглаживания в интервале от 0,1 до 0,3.

Пример 4.4. Вернемся к примеру 1, в котором рассматриваются квартальные объемы продаж компании «Lewplan». Мы уже выяснили, что этим данным отвечает аддитивная модель, т.е. фактически объемы продаж можно выразить следующим образом:

Y = U + V + E.

Для того чтобы элиминировать влияние сезонной компоненты, воспользуемся методом скользящей средней. Просуммировав первые четыре значения, получим общий объем продаж в 1998 г. Если поделить эту сумму на четыре, можно найти средний балл продаж в каждом квартале 1998 г., т.е.

(239 + 201 +182 + 297)/4 = 229,75;
(201+182+297+324)/4 и т. д.

Полученное значение уже не содержит сезонной компоненты, поскольку представляет собой среднюю величину за год. У нас появилась оценка значения тренда для середины года, т.е. для точки, лежащей в середине между кварталами II и III. Если последовательно передвигаться вперед с интервалом в три месяца, можно рассчитать средние квартальные значения на промежутке апрель – март 1998 (251), июль – июнь 1998 (270,25) и т.д. Данная процедура позволяет генерировать скользящие средние по четырем точкам для исходного множества данных. Получаемое таким образом множество скользящих средних представляет наилучшую оценку искомого тренда.

Теперь полученные значения тренда можно использовать для нахождения оценок сезонной компоненты. Мы рассчитываем:

Y U = V + E .

К сожалению, оценки значений тренда, полученные в результате расчета средних по четырем точкам, относятся к нескольким иным моментам времени, чем фактические данные. Первая оценка, равная 229,75, представляет собой точку, совпадающую с серединой 1998 г., т.е. лежит в центре промежутка фактических значений объемов продаж во II и III кварталах. Вторая оценка, равная 251, лежит между фактическими значениями в III и IV кварталах. Нам же требуются десезонализированные средние значения, соответствующие тем же интервалам времени, что и фактические значения за квартал. Положение десезонализированных средних во времени сдвигается путем дальнейшего расчета средних для каждой пары значений. Найдем среднюю из первой оценок, центрируя их на июль – сентябрь 1998 г., т.е.

(229,75 + 251)/2 = 240,4.

Это и есть десезонализированная средняя за июль – сентябрь 1999 г. Эту десезонализированную величину, которая называется центрированной скользящей средней , можно непосредственно сравнивать с фактическим значением за июль – сентябрь 1998 г., равным 182. Отметим, что это означает отсутствие оценок тренда за первые два или последние два квартала временного ряда. Результаты этих расчетов приведены в табл.4.5.

Для каждого квартала мы имеем оценки сезонной компоненты, которые включают в себя ошибку или остаток. Прежде чем мы сможем использовать сезонную компоненту, нужно пройти два следующих этапа. Найдем средние значения сезонных оценок для каждого сезона года. Эта процедура позволит уменьшить некоторые значения ошибок. Наконец, скорректируем средние значения, увеличивая или уменьшая их на одно и тоже число таким образом, чтобы общая их сумма была равна нулю. Это необходимо, чтобы усреднить значения сезонной компоненты в целом за год.

Таблица 4.5. Оценка сезонной компоненты

Объем продаж Y , тыс. шт.

за четыре

квартала

Скользящая

средняя за четыре

квартала

Центрированная скользящая средняя U

сезонной компоненты

Y - U = V + E

Январь-март 1998

Апрель-июнь

Июль-сентябрь

Октябрь-декабрь

Январь-март 1999

Апрель-июнь

Июль-сентябрь

Октябрь-декабрь

Январь-март 2000

Апрель-июнь

Июль-сентябрь

Октябрь-декабрь

Январь-март 2001

Таблица 4.6. Расчет средних значений сезонной компоненты

Рассчитываемые

компоненты

Номер квартала

Среднее значение

Оценка сезонной

компоненты

Сумма = -0,2

Скорректированная

сезонная компонента 1

Корректирующий фактор рассчитывается следующим образом: сумма оценок сезонных компонент делится на 4. В последнем столбце табл. 4.5 эти оценки записаны под соответствующими квартальными значениями. Сама процедура приведена в табл. 4.6.

Значение сезонной компоненты еще раз подтверждает наши выводы, сделанные в примере 4.1 на основе анализа диаграммы. Объемы продаж за два зимних квартала превышают среднее трендовое значение приблизительно на 40 тыс. шт., а объемы продаж за два летних периода ниже средних на 21 и 62 тыс.шт. соответственно.

Аналогичная процедура применима при определении сезонной вариации за любой промежуток времени. Если, например, в качестве сезона выступают дни недели, для элиминирования влияния ежедневной сезонной компоненты также рассчитывают скользящую среднюю, но уже не по четырем, а по семи точкам. Эта скользящая средняя представляет собой значение тренда в середине недели, т.е. в четверг; таким образом, необходимость в процедуре центрирования отпадает.

Основной тенденцией развития (трендом) называется плавное и устойчивое изменение уровня явления во времени, свободное от случайных колебаний.

Задача состоит в том, чтобы выявить общую тенденцию в изменении уровней ряде, освобожденную от действия различных случайных факторов. С этой целью ряды динамики подвергаются обработке методами укрупнения интервалов, сглаживания временных рядов.

Методы сглаживания можно условно разделить на два класса: аналитический и алгоритмический.

Аналитический подход основан на допущении, что исследователь может задать общий вид функции, описывающей регулярную, неслучайную составляющую. Например, на основе визуального и содержательного экономического анализа динамики временного ряда предполагается, что трендовая составляющая может быть описана с помощью показательной функции .

Тогда на следующем этапе будет проведена статистическая оценка неизвестных коэффициентов модели, а затем определены сглаженные значения уровней временного рада путем подстановки соответствующего значения временного параметра «t» в полученное уравнение.

В алгоритмическом подходе отказываются от ограничительного допущения, свойственного аналитическому. Процедура этого класса не предполагает описания динамики неслучайной составляющей с помощью единой функции, они предоставляют исследователю лишь алгоритм расчета неслучайной составляющей в любой заданный момент времени «t» . Методы сглаживания временных радов с помощью скользящих средних относится к такому подходу. Одним из наиболее простых методов изучения основной тенденции в рядах динамики является укрупнение интервалов. Он основан на укрупнении периодов времени, к которым относятся уровни ряда динамики (одновременно уменьшается количество интервалов). Например, рад ежесуточного выпуска продукции заменяется рядом месячного выпуска продукции и т.д. Средняя, исчисленная по укрупненным интервалам, позволяет выявлять направление и характер (ускорение или замедление роста) основной тенденции развития.

Суть различных приемов сглаживания временных рядов сводится к замене фактических уровней временного ряда расчетными, которые в меньшей степени подвержены колебаниям. Выявление основной тенденции путем сглаживания временного ряда может осуществляться также методом скользящей (подвижной) средней.

Алгоритм сглаживания по простой скользящей средней может быть представлен в виде следующей последовательности шагов.

1. Определяют длину интервала сглаживания S, включающего в себя 1 последовательных уровней ряда (1 > n). При этом надо иметьв виду, что чем шире интервал сглаживания, тем в большей степени поглощаются колебания, и тенденция развития носит более плавный, сглаженный характер. Чем сильнее колебания, тем шире должен быть интервал сглаживания.

2. Разбивают весь период наблюдения на участки, при этом интервал сглаживания «скользит» по ряду с шагом, равным I.

3. Рассчитывают средние арифметические из уровней рада, образующих каждый участок.

4. Заменяют фактические значения ряда, стоящие в центре каждого участка, на соответствующие средние значения.

При этом удобно брать длину интервала сглаживания 1 в виде нечетного числа I = 2р + 1, так как в этом случае полученные значения скользящей средней приходятся на средний член интервала. Параметр р =(m-1)/2 ; где m – продолжительность периода сглаживания (5,7,9, 11,13).

Наблюдения, которые берутся для расчета среднего значения называются активным участком сглаживания.

При нечетном значении 1 =2р + 1 скользящая средняя может быть определена по формуле:

где - значение скользящей средней в момент t;

Фактическое значение i-ro уровня; 2р+1 - длина интервала сглаживания.

При построении взвешенной скользящей средней на каждом активном участке значение центрального уровня заменяется на расчетное, определяемое по формуле средней арифметической взвешенной:

где - весовые коэффициенты.

Простая скользящая средняя учитывает все уровни ряда, входящие в активный участок сглаживания, с равными весами () , а взвешенная средняя приписывает каждому уровню вес, зависящий от удаления данного уровня до уровня, стоящего в середине активного участка. Это вызвано тем, что при простой скользящей средней выравнивание на каждом активном участке проводится по прямой (полиному первого порядка), а при сглаживании по взвешенной скользящей средней используют полиномы более высоких порядков. Поэтому метод простой скользящей средней может рассматриваться как частный случай метода взвешенной скользящей средней. Весовые коэффициенты определяются с помощью метода наименьших квадратов, причем нет необходимости каждый раз вычислять их заново при уровнях ряда, входящих в активный участок сглаживания, так как они будут одинаковыми для каждого активного участка. В ниже приведенной таблице представлены весовые коэффициенты в зависимости от длины интервала сглаживания.

Таблица 1.8.2.Весовыекоэффициенты для взвешенной скользящей средней

Так как веса симметричны относительно центрального уровня, то в таблице использована символическая запись: приведены веса для половины уровней активного участка; выделен вес, относящийся к уровню, стоящему в центре участка сглаживания. Для оставшихся уровней веса не приводятся, так как они могут быть симметрично отражены.

Отметим важные свойства коэффициентов:

1. они симметричны относительно центрального уровня;

2. сумма весов с учетом общего множителя, вынесенного за
скобки, равна единице;

3. наличие как положительных, так и отрицательных весов
позволяет сглаженной кривой сохранять различные изгибы
кривого тренда.

Названные приемы сглаживания динамических радов (укрупнение интервалов и метод скользящей средней) дают возможность определить лишь общую тенденцию развития явления, более или менее освобожденную от случайных и волнообразных колебаний. Однако получить обобщенную статистическую модель тренда посредством этих методов нельзя.

Для того чтобы дать количественную модель, выражающую основную тенденцию изменения уровней динамического ряди во времени, используется аналитическое выравнивание ряда динамики.

Восстановление краевых значений

При использовании скользящей средней с длиной активного участка

1=2р+1 первые и последние «р» уровней ряда сгладить нельзя, их значения теряются. Очевидно, что потеря значений последних точек - существенный недостаток, так как для исследователя «свежие» данные обладают наибольшей информационной ценностью.

Рассмотрим один из приемов, позволяющих восстановить потерянные значения временного ряда при использовании простой скользящей средней. Для этого необходимо:

Вычислить средний абсолютный прирост на последнем
активном участке;

Получить «р» сглаженных значений в конце временного ряда
путем последовательного прибавления среднего абсолютного
прироста к последнему сглаженному значению.

Аналогичную процедуру можно реализовать для оценивания первых уровней временного ряда.

Рассмотрим еще один из возможных способов восстановления краевых значений. Для определения «р» первых и «р» последних потерянных уровней анализируемого временного ряда можно использовать расчетные значения, полученные с помощью аппроксимирующих полиномов той же степени, что и для остальных членов ряда. Причем неизвестные коэффициенты полиномов определяются соответственно по 1=2р+1 первым и последним уровням временного ряда.

Углубленный анализ временных рядов требует использования более сложных методик математической статистики. При наличии в динамических рядах значительной случайной ошибки (шума) применяют один из двух простых приемов - сглаживание или выравнивание путем укрупнения интервалови вычисления групповых средних. Этот метод позволяет повысить наглядность ряда, если большинство «шумовых» составляющих находятся внутри интервалов. Однако, если «шум» не согласуется с периодичностью, распределение уровней показателей становится грубым, что ограничивает возможности детального анализа изменения явления во времени.

Более точные характеристики получаются, если используют скользящие средние - широко применяемый способ для сглаживания показателей среднего ряда. Он основан на переходе от начальных значений ряда к средним в определенном интервале времени. В этом случае интервал времени при вычислении каждого последующего показателя как бы скользит по временному ряду.

Применение скользящего среднего полезно при неопределенных тенденциях динамического ряда или при сильном воздействии на показатели циклически повторяющихся выбросов (резко выделяющиеся варианты или интервенция).

Чем больше интервал сглаживания, тем более плавный вид имеет диаграмма скользящих средних. При выборе величины интервала сглаживания необходимо исходить из величины динамического ряда и содержательного смысла отражаемой динамики. Большая величина динамического ряда с большим числом исходных точек позволяет использовать более крупные временные интервалы сглаживания (5, 7, 10 и т.д.). Если процедура скользящего среднего используется для сглаживания не сезонного ряда, то чаще всего величину интервала сглаживания принимают равной 3 или 5. https://tvoipolet.ru/iz-moskvi-v-nyu-jork/ - отличная возможность выбрать авиакомпанию на перелет из Москвы в Нью-Йорк

Приведем пример вычисления скользящего среднего числа хозяйств с высокой урожайностью (более 30 ц/га) (табл. 10.3).

Таблица 10.3 Сглаживание динамического ряда укрупнением интервалов искользящим средним

Учетный год

Число хозяйств с высокой урожайностью

Суммы за три года

Скользящие за три года

Скользящие средние

90,0

89,7

1984

88,7

87,3

87,3

87,0

86,7

83,0

83,0

82,3

82,3

82,6

82,7

82,7

Примеры вычисления скользящего среднего:

1982 г.(84 + 94 + 92) / 3 = 90,0;

1983 г. (94 + 92 + 83) / 3 = 89,7;

1984 г.(92 + 83 + 91) / 3 = 88,7;

1985 г.(83 + 91 + 88) / 3 = 87,3.

Составляется график. На оси абсцисс указываются годы, на оси ординат - число хозяйств с высокой урожайностью. Указываются координаты числа хозяйств на графике и соединяют полученные точки ломаной линией. Затем указываются координаты скользящей средней по годам на графике и соединяются точки плавной полужирной линией.

Более сложным и результативным методом является сглаживание (выравнивание) рядов динамики с помощью различных функций аппроксимации. Они позволяют формировать плавный уровень общей тенденции и основную ось динамики.

Наиболее эффективным методом сглаживания с помощью математических функций является простое экспоненциальное сглаживание. Этим методом учитываются все предшествующие наблюдения ряда по формуле:

S t = α∙X t + (1 - α ) ∙S t - 1 ,

где S t - каждое новое сглаживание в момент времени t ; S t - 1 - сглаженное значение в предыдущий момент времени t -1; X t - фактическое значение ряда в момент времени t ; α - параметр сглаживания.

Если α = 1, то предыдущие наблюдения полностью игнорируются; при величине α = 0 игнорируются текущие наблюдения; значения α между 0 и 1 дают промежуточные результаты. Изменяя значения этого параметраможно подобрать наиболее приемлемый вариант выравнивания. Выбор оптимального значения α осуществляется путем анализа полученных графических изображений исходной и выравненной кривых, либо на основе учета суммы квадратов ошибок (погрешностей) вычисленных точек. Практическое использование этого метода следует проводить с использованием ЭВМ в программе MS Excel . Математическое выражение закономерности динамики данных можно получить с помощью функции экспоненциального сглаживания.



Понравилась статья? Поделитесь с друзьями!