f_husainov


f_husainov

Ф.И. Хусаинов


Previous Entry Share Next Entry
Кое-что о прогнозировании
f_husainov
     В дисциплине "Основы транспортного бизнеса", которую я читаю в РОАТ МИИТ есть раздел, посвящённый методам прогнозирования грузовых перевозок. Точнее - сначала объёмов погрузки (т.е. того количества тонн, которое экономика может предъявить к перевозке в заданный период), а потом уже и других показателей. И вот, как раз, в следующую субботу будем говорить о прогнозировании в макромасштабе - в масштабе РЖД.
     Для начала приведу тут два графика - динамики ВВП и промышленного производства за 2007-2015 гг. в процентах прироста (снижения) к предыдущему году.


Источник: Росстат

Рис.1


Источник: Росстат

Рис.2

     А как мы знаем из прошлых постов, динамика погрузки грузов по сети РЖД обычно довольно сильно коррелирует с динамикой как ВВП, так и промышленного производства (см. Рис.3).



Источник: [здесь]

Рис.3

Из рис. 3 не совсем понятно, динамика какого из показателей - ВВП или промышленного производства - ближе к динамике погрузки грузов, но интуитивно мы понимаем, что это должно быть промышленное производство.
И интуиция нас не обманывает: если мы построим зависимость в виде диаграмм рассеяния с - как положено - линией аппроксимации (не забывайте, что тут двойное "п") и уравнением регрессии, то выглядеть это будет примерно так:


Рис.4


Рис.5

     По оси абсцисс у нас, как положено, независимая переменная, а по оси ординат - зависимая (погрузка, точнее её изменение в %).
Показатель "R-квадрат" во втором случае - выше. Он равен 0,8782. Этот показатель, - если формулировать немного вульгарно - означает, что в нашем примере динамика погрузки грузов по сети РЖД на 87,8 % обусловлена (или, выражаясь проще - детерминирована) динамикой промышленного производства, а на остальные 12,2 % - другими факторами.
     Мы можем сделать небольшую проверку. Предположим, мы не знаем, какова погрузка в 2015 г, и строим график с 2007 по 2014 год; уравнение регрессии для периода с 2007 по 2014 будет иметь вид y=1,1843*х-21,059 с "R-квадрат", равным 0,92. Затем мы делаем предположение, что промышленное производство в 2015 г. составит 96,6 %; подставив данные, получим, что уравнение даёт нам показатель погрузки для 2015 г. 93,34 %. Теперь, сравнивая с фактической погрузкой (99 %), мы можем найти относительную погрешность:
93,34 / 99 = 94,28 т.е.наш прогноз оказался меньше факта на 5,62 % (можно посчитать наоборот, взяв за базу не факт, а прогноз, тогда получим 99 / 93,34 = 1,0606 т.е. фактические данные превысили наш прогноз на 6,06 %). Учитывая, что "R-квадрат" намекал нам на то, что он гарантирует, что погрешность не превысит 8 %, мы уложились в эту величину.
     Таким образом, прогнозирование макро-объектов (РЖД в целом) позволяет даже при таком формальном, чудовищно упрощённом подходе прогнозировать с ошибкой прогноза не выше 6 %. Но вот можно ли с такой же точностью такими же формальными математическими методами прогнозировать не погрузку в целом, а например, погрузку по каждой номенклатуре груза? Или погрузку не за год, а за каждый месяц? Или не по сети РЖД, а по отдельным дорогам ?
      Ответы на эти вопросы несколько более сложны и, возможно, я к ним ещё вернусь в этом блоге.

?

Log in

No account? Create an account