Для начала приведу тут два графика - динамики ВВП и промышленного производства за 2007-2015 гг. в процентах прироста (снижения) к предыдущему году.

Источник: Росстат
Рис.1

Источник: Росстат
Рис.2
А как мы знаем из прошлых постов, динамика погрузки грузов по сети РЖД обычно довольно сильно коррелирует с динамикой как ВВП, так и промышленного производства (см. Рис.3).

Источник: [здесь]
Рис.3
Из рис. 3 не совсем понятно, динамика какого из показателей - ВВП или промышленного производства - ближе к динамике погрузки грузов, но интуитивно мы понимаем, что это должно быть промышленное производство.
И интуиция нас не обманывает: если мы построим зависимость в виде диаграмм рассеяния с - как положено - линией аппроксимации (не забывайте, что тут двойное "п") и уравнением регрессии, то выглядеть это будет примерно так:

Рис.4

Рис.5
По оси абсцисс у нас, как положено, независимая переменная, а по оси ординат - зависимая (погрузка, точнее её изменение в %).
Показатель "R-квадрат" во втором случае - выше. Он равен 0,8782. Этот показатель, - если формулировать немного вульгарно - означает, что в нашем примере динамика погрузки грузов по сети РЖД на 87,8 % обусловлена (или, выражаясь проще - детерминирована) динамикой промышленного производства, а на остальные 12,2 % - другими факторами.
Мы можем сделать небольшую проверку. Предположим, мы не знаем, какова погрузка в 2015 г, и строим график с 2007 по 2014 год; уравнение регрессии для периода с 2007 по 2014 будет иметь вид y=1,1843*х-21,059 с "R-квадрат", равным 0,92. Затем мы делаем предположение, что промышленное производство в 2015 г. составит 96,6 %; подставив данные, получим, что уравнение даёт нам показатель погрузки для 2015 г. 93,34 %. Теперь, сравнивая с фактической погрузкой (99 %), мы можем найти относительную погрешность:
93,34 / 99 = 94,28 т.е.наш прогноз оказался меньше факта на 5,62 % (можно посчитать наоборот, взяв за базу не факт, а прогноз, тогда получим 99 / 93,34 = 1,0606 т.е. фактические данные превысили наш прогноз на 6,06 %). Учитывая, что "R-квадрат" намекал нам на то, что он гарантирует, что погрешность не превысит 8 %, мы уложились в эту величину.
Таким образом, прогнозирование макро-объектов (РЖД в целом) позволяет даже при таком формальном, чудовищно упрощённом подходе прогнозировать с ошибкой прогноза не выше 6 %. Но вот можно ли с такой же точностью такими же формальными математическими методами прогнозировать не погрузку в целом, а например, погрузку по каждой номенклатуре груза? Или погрузку не за год, а за каждый месяц? Или не по сети РЖД, а по отдельным дорогам ?
Ответы на эти вопросы несколько более сложны и, возможно, я к ним ещё вернусь в этом блоге.