ISSN 1991-3087
Рейтинг@Mail.ru Rambler's Top100
Яндекс.Метрика

НА ГЛАВНУЮ

Прогнозирование потребления воды крупным мегаполисом.

 

Невеселая Евгения Борисовна,

аспирант кафедры Бизнес-аналитики Московского Государственного Университета – Высшей Школы Экономики.

 

Метод прогнозирования.

 

Один из важнейших инструментов исследования, который математика предлагает исследователю есть статистические модели, с помощью которых возможно описать явления, не поддающиеся описанию в чисто детерминистских терминах. Типичными примерами такого рода моделей являются, так называемые, временные ряды. Временным рядом называют последовательность упорядоченных во времени числовых показателей, характеризующих уровень состояния и изменения изучаемого явления [1].

Посредством статистических моделей временных рядов решается достаточно большое количество задач: прогнозирование, нахождение скрытых периодичностей в данных, анализ зависимостей, оценка рисков при принятии решений и др.

 В настоящее время актуально решение задачи прогнозирования потребления энергоресурсов в рамках создания Автоматизированной системы коммерческого учета производства и распределения энергоресурсов (АСКУЭ). АСКУЭ - система, позволяющая контролировать весь процесс оборота энергоресурсов, сближая противоречивые интересы поставщиков и потребителей энергоресурсов.

 Предлагаемый метод анализа временных рядов рекомендуется к использованию для решения задач прогнозирования уровней сложного временного ряда, имеющего тренд-циклическую компоненту и случайную составляющую [1,2].  В частности, предлагаемый метод может быть использован для решения задач прогнозирования потребления разнотипных энергоресурсов (электроэнергия, вода и.т.д).

Суть метода заключается в использовании определенного количества из общего числа анализируемых данных временного ряда  («окно» данных) для краткосрочного прогноза динамики величины, характеризуемой данными «окна». Сдвигая «окно» анализируемых данных на определенный интервал, получаем новое «окно» данных для прогноза. Таким образом, метод является параметрическим; основные параметры: ширина окна  M и длина прогноза Δt.

Предлагаемый метод предполагает решение двух подзадач:

1.                  Задачу декомпозиции временного ряда [2]. Иными словами временной ряд  может быть представлен в виде: , где – хорошо прогнозируемая компонента, например,  может быть линейным трендом, а – плохо прогнозируемая компонента, которая содержит много случайностей. Причем успех прогнозирования во многом зависит от степени декомпозиции ряда.

2.                  Задачу прогнозирования уровней ряда на определенную перспективу [1].

 

Алгоритм метода прогнозирования.

 

0.                  Находим функцию , наилучшим образом аппроксимирующую имеющиеся опытные значения временного ряда, принимаемые анализируемой случайной величиной X для всех моментов времени t. Найденный вид функции  будем использовать для прогнозирования исследуемой случайной величины по данным «окна» на определенный интервал Δt  (длина прогноза).

1.                  Задаем:

-  Ширину окна M - интервал времени (день, месяц, год и.т.п.) ΔT (, где ,  – первый и последний моменты времени в «окне» данных соответственно, определяющие его ширину), для которого известны значения, принимаемые случайной величиной X, соответствует значению ширины «окна»;

-  Длину прогноза Δt ().

2.                  Находим параметры функции , аппроксимирующей данные «окна» выбранной ширины.

3.                   Прогнозируем значения анализируемой случайной величины на определенный интервал времени Δt,  иcпользуя известную функцию .

4.                  Сдвигаем «окно» данных вправо на величину интервала времени Δt,  для которого сделан прогноз с использованием данных предыдущего «окна». Ширина «окна» не меняется и по-прежнему равна M.

5.                  Повторяем пункты 2, 3 процедуры прогнозирования для нового «окна» данных.

И т.д.

 

Прогнозирование потребления холодной воды в г. Москве по данным за 2001 – 2005 гг.

 

Исходные данные и предварительная постановка задачи.

Исходные данные для решения задачи представляют собой временной ряд значений уровня потребления воды  г. Москвой в период от 1 января 2001 года до 21 ноября 2005 года и временной ряд значений температуры наружного воздуха в г. Москве за аналогичный период.

Необходимо спрогнозировать потребление воды на 2005 год и проверить точность прогноза относительно имеющихся опытных данных.

Анализ исходных данных.

Визуализируем исходные временные ряды расхода воды и изменения температуры воздуха.

 

 

Предварительный анализ временного ряда, характеризующего потребление воды, проведенный по графическому представлению ряда, позволил сделать следующие очевидные выводы:

1.                  В потреблении холодной воды в городе Москве наблюдается тенденция к  уменьшению.

Уменьшение расхода воды в Москве связано, главным образом, со следующими фактами:

-                    Уменьшение количества крупных промышленных потребителей в городе в период с 2001 по 2005 гг. (часть промышленных предприятий прекратили свое функционирование, часть предприятий выведена за черту города (расширены загородные филиалы, московские филиалы закрыты).

-                    Уменьшение потерь в водопроводных сетях за счет проведения капитального ремонта сетей крупных промышленных потребителей города и потребителей жилищно-коммунального комплекса, что связано с постановкой расхода воды на коммерческую основу.

2.                  Потребление воды в Москве носит сезонный характер. Очевиден период изменения уровня расхода воды – 1 год.

3.                  Потребление холодной воды в городе Москве сильно зависит от времени года, что означает, что уровни температурного временного ряда определяют уровни временного ряда расхода воды.

4.                  В потреблении холодной воды в Москве наблюдаются резкие отклонения от общей тенденции, характерные для одних и тех же дней от года к году.

Решение задачи декомпозиции ряда и выбор аппроксимирующей функции.

Решим задачу декомпозиции ряда. Согласно проведенному предварительному анализу данных потребления воды в г. Москве можно предположить, что исследуемый временной ряд может быть представлен в виде суммы линейного тренда, и сезонной компоненты, причем период сезонной компоненты равен году.

Проверим наше предположение и аппроксимируем исходный временной ряд функцией вида:

, .

где t – номер дня исследуемого временного периода.

Оценим параметры модели методом наименьших квадратов [1] и получим функцию аппроксимации исследуемых данных.

 

 

Согласно вышеприведенному графику, аппроксимация ряда удовлетворительна и может быть использована для дальнейшего решения задачи прогнозирования на основе тренда и сезонной составляющей.

Решение задачи прогноза.

Приступим к прогнозированию. Будем действовать, согласно алгоритму выбранной методики:

10. Задаем ширину «окна» данных, равную 4-м годам (с 1 января 2001 года по 31 декабря 2004 года), т.е. M=1461, .

20. Функция, аппроксимирующая данные окна имеет вид: .

30. Прогнозируем уровень расхода воды на январь 2005 года, т.е. .

11. Сдвигаем «окно» данных на месяц вперед относительно января 2001 года и получаем новое «окно» данных, шириной 4 года (с 1 февраля 2001 года по 31 января 2005 годакно данных, шириной 4 года ()яц вперед относительно января 2001 года и получаем новое "огнозирования.ющийся опытных данных.личи), т.е. M=1461, .

Далее повторяем процедуру прогнозирования, согласно пунктам 2,3 алгоритма.

И т.д.

Результаты итераций приведены ниже:

N ит.

Ширина окна

Параметры функции, аппроксимирующей данные «окна»

Интервал прогноза

1

M=1461,

a= 5212,54, b=-0,29, c=47,99, d=303,79

2

M=1461,

a= 5212,54, b=-0,29, c=47,99, d=303,79

3

M=1461,

a=5251,77, b=-0,34, c=45,95, d=308,56

4

M=1461,

a=5246,7, b=-0,33, c=50,14, d=308,72

5

M=1461,

a=5215,89, b=-0,29, c=54,09, d=302,39

6

M=1461,

a=5213,33, b=-0,29, c=55,44, d=299,86

7

M=1461,

a=5226,74, b=-0,30, c=57,45, d=297,92

8

M=1461,

a=5247,73, b=-0,32, c=60,58, d=298,16

9

M=1461,

a=5268,6, b=-0,34, c=61,66, d=295,54

10

M=1461,

a=5247,61, b=-0,32, c=61,46, d=297,90

11

M=1461,

a=5221,12, b=-0,30, c=66,33, d=299,72

12*

M=1461,

a=5215,38, b=-0,29, c=69,37, d=297,40

* - для прогноза потребления воды на декабрь 2005 года воспользуемся данными скользящего окна, шириной 4 года с 1 декабря 2001 года с 30 ноября 2005 года, где отсутствие опытных данных с 22 ноября 2005 года по 30 ноября 2005 года заменим прогнозными значениями, найденными на предыдущей итерации.

 

Следует заметить, что значения коэффициентов модели зависят от положения  «окна» данных. Ниже приведены диапазоны изменения коэффициентов модели:

Диапазон изменения коэффициентов модели

 

Построим график прогноза потребления воды в городе Москве с 1 января 2005 года по 31 декабря 2005 года и сравним с имеющимися опытными данными:

 

 

Мат. ожидание [3] ошибки, т

Стандартное отклонение [3] ошибки, т

0,301

200,396

 

Значение математического ожидания данных ошибок прогноза, отличное от нуля, говорит о наличии периодичности, не учтенной в аппроксимирующей функции.

Определение скрытой периодичности.

Очевидна сезонность в потреблении воды в Москве, периодичность изменения уровня воды – 1год. Определим наличие скрытых (не очевидных) периодичностей в потреблении воды, построив периодограмму [2].

 

 

Таким образом, помимо очевидной периодичности в потреблении воды в Москве, выявлено наличие скрытой периодичности. Т.е. помимо периодичности изменения уровня расхода воды от года к году, можно говорить и о внутригодовой периодичности потребления воды (6 мес).

Определение наличия зависимости от температуры.

Зависимость изменения уровня расхода воды от температуры наружного воздуха очевидна: зимой потребляется воды больше, чем летом; с увеличением температуры наружного воздуха уровень расхода воды падает.

О степени линейной зависимости уровня потребления воды и температуры наружного воздуха можно судить по значению коэффициента корреляции [1] между обозначенными величинами. Указанный коэффициент равен

-0,66, что говорит о наличии достаточно тесной корреляционной связи между величинами и определяющем влиянии уровня температуры наружного воздуха на уровень расхода воды.

Анализ отклонений от общей тенденции.

Очевидно, что для ряда дней в году характерно отклонение от общей тенденции в потреблении воды. Особо явным является отклонение от общей тенденции потребления воды в первые десять дней года – период новогодних и рождественских праздников.  Таким образом, логично предположить, что подобное отклонение будет иметь место и для других праздничных дней в году. Еще одним типичным видом дней, в которые возможны отклонения от общей тенденции потребления воды, являются выходные дни. В результате вышесказанного решение задачи прогноза для дней года, выделенных в особую группу «не типичных дней», следует проводить, учитывая особые условия, вызвавшие резкое повышение (первые десять дней года: люди не работают, в большинстве своем находятся дома, тем самым потребляя количество воды больше обычного) или понижения уровня расхода воды (в майские праздники большинство людей уезжают на дачи, тем самым способствуя меньшему расходу воды в эти дни).

 

Выводы.

 

 Полученные предварительные результаты применения метода «скользящего окна» для решения задач потребления холодной воды, как впрочем, и других энергоресурсов, позволяет сформировать следующие рекомендации:

1. Для повышения точности прогноза необходимо распространить метод на прогнозирование по взаимосвязанным рядам [1]. Для прогнозирования потребления воды целесообразно привлечь данные о температуре окружающей среды и потребленной электроэнергии подразделениями, участвующими в подаче воды в город.

2. Перспективным следует считать переход к аналитико-имитационному подходу к прогнозированию. При таком подходе коэффициенты a, b, c, d в  модели временного ряда следует рассматривать как случайные величины. Их закон распределения определяется экспериментальным путем. В данной работе приведены только их диапазоны изменений.

3. Перспективным следует также считать выполнение процедуры прогноза на конкретный тип дня (рабочий, выходной, праздничный и.т.п.). Для этой цели из общего временного ряда необходимо составлять временной ряд, характеризующий именно этот тип дня.

 

Литература.

 

1.                  В.Н. Афанасьев, М.М. Юзбашев. Анализ временных рядов и прогнозирование. – М.: Финансы и статистика, 2001.- 267 с.

2.                  В.П. Боровиков, Г.И. Ивченко. Прогнозирование в системe Statistica в среде Windows. – М.: Финансы и статистика, 2006.- 368 стр..

3.                  Статистика. Учебник.  Под ред. Проф. И.И. Елисеевой. – М.: ООО «ВИТРЭМ», 2002. – 448 с.

 

Поступила в редакцию 17.04.2008 г.

2006-2019 © Журнал научных публикаций аспирантов и докторантов.
Все материалы, размещенные на данном сайте, охраняются авторским правом. При использовании материалов сайта активная ссылка на первоисточник обязательна.