f_husainov (f_husainov) wrote,
f_husainov
f_husainov

Categories:

Кое-что о прогнозировании

     В дисциплине "Основы транспортного бизнеса", которую я читаю в РОАТ МИИТ есть раздел, посвящённый методам прогнозирования грузовых перевозок. Точнее - сначала объёмов погрузки (т.е. того количества тонн, которое экономика может предъявить к перевозке в заданный период), а потом уже и других показателей. И вот, как раз, в следующую субботу будем говорить о прогнозировании в макромасштабе - в масштабе РЖД.
     Для начала приведу тут два графика - динамики ВВП и промышленного производства за 2007-2015 гг. в процентах прироста (снижения) к предыдущему году.


Источник: Росстат

Рис.1


Источник: Росстат

Рис.2

     А как мы знаем из прошлых постов, динамика погрузки грузов по сети РЖД обычно довольно сильно коррелирует с динамикой как ВВП, так и промышленного производства (см. Рис.3).



Источник: [здесь]

Рис.3

Из рис. 3 не совсем понятно, динамика какого из показателей - ВВП или промышленного производства - ближе к динамике погрузки грузов, но интуитивно мы понимаем, что это должно быть промышленное производство.
И интуиция нас не обманывает: если мы построим зависимость в виде диаграмм рассеяния с - как положено - линией аппроксимации (не забывайте, что тут двойное "п") и уравнением регрессии, то выглядеть это будет примерно так:


Рис.4


Рис.5

     По оси абсцисс у нас, как положено, независимая переменная, а по оси ординат - зависимая (погрузка, точнее её изменение в %).
Показатель "R-квадрат" во втором случае - выше. Он равен 0,8782. Этот показатель, - если формулировать немного вульгарно - означает, что в нашем примере динамика погрузки грузов по сети РЖД на 87,8 % обусловлена (или, выражаясь проще - детерминирована) динамикой промышленного производства, а на остальные 12,2 % - другими факторами.
     Мы можем сделать небольшую проверку. Предположим, мы не знаем, какова погрузка в 2015 г, и строим график с 2007 по 2014 год; уравнение регрессии для периода с 2007 по 2014 будет иметь вид y=1,1843*х-21,059 с "R-квадрат", равным 0,92. Затем мы делаем предположение, что промышленное производство в 2015 г. составит 96,6 %; подставив данные, получим, что уравнение даёт нам показатель погрузки для 2015 г. 93,34 %. Теперь, сравнивая с фактической погрузкой (99 %), мы можем найти относительную погрешность:
93,34 / 99 = 94,28 т.е.наш прогноз оказался меньше факта на 5,62 % (можно посчитать наоборот, взяв за базу не факт, а прогноз, тогда получим 99 / 93,34 = 1,0606 т.е. фактические данные превысили наш прогноз на 6,06 %). Учитывая, что "R-квадрат" намекал нам на то, что он гарантирует, что погрешность не превысит 8 %, мы уложились в эту величину.
     Таким образом, прогнозирование макро-объектов (РЖД в целом) позволяет даже при таком формальном, чудовищно упрощённом подходе прогнозировать с ошибкой прогноза не выше 6 %. Но вот можно ли с такой же точностью такими же формальными математическими методами прогнозировать не погрузку в целом, а например, погрузку по каждой номенклатуре груза? Или погрузку не за год, а за каждый месяц? Или не по сети РЖД, а по отдельным дорогам ?
      Ответы на эти вопросы несколько более сложны и, возможно, я к ним ещё вернусь в этом блоге.
Tags: Заметки, Занимательная статистика, Преподавание, Экономическая статистика
Subscribe

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments