К.э.н. Снитюк О.И., к.э.н. Бережная Л.В.
Черкасский государственный технологический университет, Украина
Технология препроцессинга ретроспективной информации как необходимое условие эффективного прогнозирования экономических процессов
Динамика современных экономических процессов указывает на необходимость привлечения новых технологий для их исследования, анализа и прогнозирования.
Успешное решение экономических задач идентификации, прогнозирования и диагностики невозможно без предварительной формализации и подготовки данных. Чаще всего в распоряжении экономиста-аналитика имеется информация не та, которая необходима для решения поставленной задачи, а та, которая доступна в данный момент времени. Препроцессингу априорной информации посвящены многие монографии и статьи, но в них рассматриваются отдельные проблемы, а пошаговой технологии препроцессинга данных не существует.
Таким образом, возникает необходимость в построении технологии подготовки ретроспективной информации для прогнозирования экономических процессов, которая улучшает качество прогноза, особенно в условиях кризисных явлений. Остановимся на основных моментах, которые необходимо учитывать при таком построении:
- существует потребность в разработке технологий прогнозирования в быстро меняющихся, часто критичных условиях;
- поскольку прогнозирование осуществляется на основании идентифицированных зависимостей результирующих характеристик от входных факторов, то необходимо в качестве таких зависимостей использовать гибридные функции, позволяющие выполнять прогноз для экономической системы, функционирующей в изменяющихся условиях;
- необходимым условием построения гибридных функций является кластеризация экономических процессов, поскольку задача идентификации может быть адекватно решенной только для однородных процессов;
- необходимо рационально стремиться к уменьшению количества учитываемых факторов и к увеличению их информативности.
Приведем основные причины препроцессинга исходных данных для построения гибридных функций:
- разные шкалы измерения экономических показателей;
- наличие линейной и нелинейной зависимости между входными факторами;
- низкая энтропия значений входных факторов, то есть их малая информативность;
- большое количество незначимых факторов.
Рассмотрим основные этапы подготовки данных для прогнозирования экономических процессов.
- 1-й шаг. Нормализация и стандартизация исходных данных [1], с помощью которой данные становятся безразмерными величинами и могут быть замкнуты в единичный гиперкуб. Если входящие значения будут неравномерно распределены и сосредоточены в небольших гиперсферах, то такие данные будут малоинформативными и прогнозирование на их основе будет не точным (рис. 1). Наибольшую информативность (в смысле получения более точного прогноза) имеют данные с равномерным распределением, так как они имеют наибольшую энтропию (рис. 2).
- 2-й шаг. Тестирование мультиколлинеарности по критерию Фаррара-Глобера [2]. С его помощью выявляем линейно зависимые факторы и некоторые из них в дальнейшем не рассматриваем. Наличие линейной зависимости между входящими факторами ухудшает качество экономико-математической модели, а это влечет снижение качества прогноза.
- 3-й шаг. Определение значимых факторов. Теоретический метод обоснования их выбора на сегодняшний день не известен, поэтому применяются эвристические процедуры. По нашему мнению, одной из таких процедур является технология box-counting [3]. В ее основе лежит понятие кросс-энтропии. Вычисляя кросс-энтропии входящих факторов с результирующей характеристикой по соответствующим формулам и сравнивая их, оставляем те факторы, у которых кросс-энтропия имеет большее значение. Таким образом, в результате выполнения технологии box-counting определяются факторы, значения которых вносят больше определенности в прогнозирование значений результирующей характеристики.
- 4-й шаг. Перед применением методов идентификации необходимо выполнить еще один шаг, позволяющий существенно повысить точность получаемой зависимости и дальнейшего прогнозирования с ее помощью. Для этого выполняется выравнивание исходных данных, применяя метод «выбеливания входов»[3]. В результате его реализации исходные факторы становятся декоррелируемыми, имеющими нулевое математическое ожидание и единичное среднеквадратическое отклонение.
Для прогнозирования экономических процессов используют различные компьютерные программы. Это позволяет уменьшить сложность и трудоемкость вычислительных операций, автоматизировать большую часть операций при построении прогноза, а также уменьшает вероятность ошибок, связанных с вводом данных и построением моделей. Такие приложения могут быть как локальными (для использования на одном компьютере), так и интернет-приложениями (доступными в виде веб-сайта, например). В качестве локальных приложений следует выделить такие программы, как: R, SPSS, SAS, Statistica, Forecast Pro, Forecast Expert и другие. Следует отметить, что технология box-counting и метод «выбеливания входов» требуют написания соответствующих модулей, поскольку в указанных программах отсутствуют.
Предложенные выше шаги составляют технологию, реализация которой с использованием соответствующего программного обеспечения позволит значительно улучшить качество прогнозирования и получить более точные результаты. Заметим, что такой подход не является единственным. Заслуживает внимания и технология, базирующаяся на нейронных сетях [4], однако и в ее основе лежат вышеизложенные подходы.
Литература
1. Лбов Г.С. Методы обработки разнотипных экспериментальных данных. – Новосибирск: Наука, 1981. – 160 с.
2. Лукьяненко И.Г., Красникова Л.И. – Эконометрия. – Киев: Знание, 1998. – 494 с.
3. Снитюк В.Є. Прогнозування. Моделі. Методи. Алгоритми: Навчальний посібник. – К.: «Маклаут», 2008. – 364 с.
4. Осовский С. Нейронные сети для обработки информации. – М.: Финансы и статистика, 2002. – 344.