Международный экономический форум 2012

Иванова И.А.

Корреляционно-регрессионный анализ факторов экономического развития регионов Российской Федерации

Экономический рост – одна из центральных экономических проблем, стоящих перед всеми странами. Экономический рост занимает центральное место в воспроизводственном процессе. Это связано с тем, что, во-первых, экономический рост определяет уровень экономического развития страны, степень удовлетворения потребностей и уровень жизни; во-вторых, экономический рост определяет место страны среди других стран мира, ее конкурентоспособность, возможности влияние на мировое экономическое и политическое развитие; в-третьих, экономический рост определяет перспективы развития страны во всем их многообразии.

Из вышесказанного можно сделать вывод, что проблемы экономического роста являются важными как для экономики страны в целом, так и для каждого человека, проживающего в этой стране.

В широком смысле слова категория «уровень экономического развития региона» представляет собой синтез разных качественных и количественных характеристик: ВРП, отраслевая структура экономики, инвестиционная актив­ность, на которые непосредственно влияют политическая и социальная стабильность в стране. Поэтому наиболее обоснованно, на наш взгляд, является применение методов многомерного статистического анализа к решению задачи классификации регионов по уровню экономического развития. Данный подход позволяет оценить территориальную дифференциацию уровней экономическо­го развития регионов, потенциальные и реальные возможности рассматривае­мых территорий, и на основе этого осуществлять принятие адекватных управ­ленческих решений по регулированию их развития. В соответствии с международной методологией расчетов ре­зультатом экономической деятельности региона в денежном выра­жении является показатель валового регионального продукта (ВРП). ВРП создается в результате производства внутри региона и характе­ризует потенциально возможный объем предложения товаров и услуг. Данные о производственной деятельности регионов используются для регулирования экономики и в целях оценки места конкрет­ного региона в экономической системе Российской Федерации, что обуслав­ливает значимость показателя ВРП. В силу этого в качестве обобщающего показателя уровня экономическо­го развития региона (Y) в рамках регионального анализа выбран показатель ва­лового регионального продукта на душу населения (руб.). В ходе абстрактно-логического анализа категории уровня экономического развития региона на основе данных, представленных в официальных статистических изданиях были отобраны факторы, по нашему мнению, влияющие на формирование раз­личий в уровне экономического развития регионов РФ: Х1 – среднегодовая численность занятых в экономике (тыс.чел.); Х2 – помесячные среднедушевые денежные доходы (р.); Х3 – помесячные среднедушевые денежные расходы (р.); Х4 – стоимость основных фондов в экономике (млн. р.); Х5 – объем промышленной продукции (млн. р.); Х6 – объем продукции сельского хозяйства (млн. р.); Х7 - ввод в действие общей площади жилых домов (тыс.кв.м.);Х8 – оборот розничной торговли (млн.руб.); Х9 - инвестиции в основной капитал (млн.р.).

Методы статистического анализа обеспечивают получение довольно достоверных сведений о вариации уровня развития по совокупности однотип­ных регионов, где основные социально-экономические характеристики в значи­тельной мере соответствуют установленным статистическим зависимостям ме­жду ними. В той же части регионов, где имеются значительные различия между ними, характеристики не будут соответствовать реальному положению. Поэто­му желательно, чтобы данные субъекты Федерации не участвовали в анализе. Таким образом, исследуемая совокупность должна обладать свойством одно­родности.

Из всех исследуемых регионов резко выделяются по своим значениям: Чукотский авт.окр., Сахалинская обл., Тюменская обл., г. Москва и Московская обл., а также респ. Ингушетия и Чеченская респ., которые должны быть исключены из анализа как аномальные наблюдения. После исключения аномальных явлений корректным является проведе­ние кластерного анализа. Он является одним из методов, позволяющих группи­ровать регионы в однородные совокупности, используя широкий круг показа­телей. Кластерный анализ не исключает применения других методов группиро­вок в процессе типологии регионов, но является наиболее мощным инструмен­том для проведения многомерных исследований. Целью исследования в нашем случае является выявление однородных совокупностей регионов, сходных с Республикой Мордовия по уровню экономического развития. В результате реализации агломеративного кластерного анализа были построены дендрограммы разбиения регионов РФ на кластеры по принципам «дальнего соседа», «средней связи» и метода Уорда (рисунки 1-3).

Рисунок 1 – Дендрограмма разбиения регионов по методу «дальнего соседа»

Рисунок 2 – Дендрограмма разбиения регионов

Рисунок 3 – Дендрограмма разбиения регионов по методу Уорда

При рассмотрении полученных дендрограмм можно предположить, что разбиение объектов наблюдения на три кластера следует признать наилучшим. Разбиение на большее число кластеров затруднит интерпретацию результатов; в то же время, при сокращении числа выделяемых кластеров, полученные выводы не будут в полной мере отражать реальную ситуацию.

При разбиении объектов наблюдения на три кластера с помощью метода k-cредних, регионы РФ распределились определенным образом (Таблица 1).

Второй кластер состоит из 24 регионов. По большей части это регионы Северо-Западного и Сибирского федеральных округов. Данный кластер по всем показателям находится на втором месте, поэтому в рамках 9 классификационных признаков регионы этого кластера можно от­нести к группе со средним уровнем экономического развития.

Таблица 1 – Разбиение регионов по кластерам

1 кластер

2 кластер

3 кластер

г. Санкт-Петербург

Белгородская область

Брянская область

Краснодарский край

Воронежская область

Владимирская область

Ростовская область

Липецкая область

Ивановская область

Республика Башкортостан

Тверская область

Калужская область

Республика Татарстан

Ярославская область

Костромская область

Пермский край

Республика Коми

Курская область

Нижегородская область

Архангельская область

Орловская область

Самарская область

Вологодская область

Рязанская область

Свердловская область

Ленинградская область

Смоленская область

Челябинская область

Мурманская область

Тамбовская область

Красноярский край

Республика Дагестан

Тульская область

Иркутская область

Ставропольский край

Республика Карелия

Волгоградская область

Калининградская область

1 кластер

2 кластер

3 кластер

Удмуртская Республика

Новгородская область

Оренбургская область

Псковская область

Саратовская область

Республика Адыгея

Алтайский край

Кабардино-Балкарская Республика

Кемеровская область

Республика Калмыкия

Новосибирская область

Карачаево-Черкесская Республика

Омская область

Республика Северная Осетия – Алания

Томская область

Астраханская область

Республика Саха (Якутия)

Республика Марий Эл

Приморский край

Республика Мордовия

Хабаровский край

Чувашская Республика

Кировская область

Пензенская область

Ульяновская область

Курганская область

Республика Алтай

Республика Бурятия

Республика Тыва

Республика Хакасия

Забайкальский край

Камчатский край

Амурская область

Магаданская область

Еврейская автономная область

Третий кластер - самый многочисленный и включает 37 регионов. Это регионы преимущественно Центрального, Приволжского и Южного федеральных округов. Здесь небольшие среднедушевые денежные доходы и, как следствие, низкий уровень расходов, поэтому оборот розничной торговли в этих регионах существенно ниже, чем в регионах 1-го и 2-го кластеров (в 6,6 раза и в 2,5 раза соответствен­но). Для этих регионов характерны также низкие объемы инвестиций в основ­ной капитал, неразвитость промышленности. Поэтому объем валового регионального продукта в регионах этого кластера отличается от аналогичного показателя для регионов первого и второго кластеров (ниже в 1,6 и 1,5 раза соответственно). Таким образом, в третий кластер вошли регионы, ха­рактеризующиеся низким уровнем экономического развития.

Для выделенных кластеров рассчитаны средние значения показателей, которые представлены в таблице 2.

Таблица 2 - Средняя оценка показателей, влияющих на уровень экономического развития регионов РФ (данные не нормированы)

Признак

кластер 1

Кластер 2

кластер 3

Y

208520

190059,4

125493,7

Х1

1755

834,6

390,5

Х2

16283

14231,1

12082,5

Х3

11836

9567,2

7749,9

Х4

1709945

802976,3

312961,1

Х5

473827

143157,6

53161,5

Х6

67430

39050,7

17112,5

Х7

1649

654,0

294,9

Х8

398135

147103,8

59996,7

Х9

199044

93607,0

31059,3

Итак, применение методов кластерного анализа позволило уже в на­чальной стадии исследования классифицировать регионы по типу экономического развития и оценить однородность исследуемой совокупности. Для проведения сравнительного анализа уровня экономического развития регионов необходимо продолжить исследование другими методами с использованием накопленных результатов.

Республика Мордовия вошла в состав третьего кластера. С помощью корреляционно-регрессионного анализа выявим факторы, в наибольшей степе­ни оказывающие влияние на уровень экономического развития республики и других регионов, вошедших в третий кластер.

Реализовав алгоритм корреляционного анализа в ППП «Statistica», получили матрицу парных коэффициентов корреляции (таблица 3).

Анализ матрицы парных коэффициентов корреляции (таблица 3) показал наличие мультиколлинеарности, то есть тесной зависимости между факторными признаками, включенными в модель. Определение наличия мультиколлинеарности между признаками является превышение парным коэффициентом корреляции величины 0,8. Дальнейший анализ следует проводить при исключении одного из таких факторов. При рассмотрении матрицы парных коэффициентов корреляции можно сделать вывод о наличии мультиколлинеарности между факторными признаками Х1 (среднегодовая численность занятых в экономике) и Х4 (стоимость основных фондов в экономике),  так как парный коэффициент корреляции равен  0,85; Х1 (среднегодовая численность занятых в экономике) и Х8 (оборот розничной торговли), так как парный коэффициент корреляции равен 0,94; Х2 (помесячные среднедушевые денежные доходы) и Х3 (помесячные среднедушевые денежные расходы), так как парный коэффициент корреляции равен 0,85; Х4 (стоимость основных фондов в экономике) и Х8 (оборот розничной торговли), так как парный коэффициент корреляции равен 0,86.

Таблица 3 – Матрица парных коэффициентов корреляций

Y

X1

X2

X3

X4

X5

X6

X7

X8

X9

Y

1,00

-0,02

0,90

0,81

0,18

0,21

-0,20

0,01

0,06

0,28

X1

-0,02

1,00

-0,14

0,19

0,85

0,74

0,70

0,78

0,94

0,69

X2

0,90

-0,14

1,00

0,85

0,03

0,00

-0,27

-0,17

-0,02

0,09

X3

0,81

0,19

0,85

1,00

0,33

0,27

0,03

0,18

0,37

0,35

X4

0,18

0,85

0,03

0,33

1,00

0,53

0,60

0,70

0,86

0,70

X5

0,21

0,74

0,00

0,27

0,53

1,00

0,46

0,68

0,72

0,55

X6

-0,20

0,70

-0,27

0,03

0,60

0,46

1,00

0,70

0,68

0,55

X7

0,01

0,78

-0,17

0,18

0,70

0,68

0,70

1,00

0,78

0,59

X8

0,06

0,94

-0,02

0,37

0,86

0,72

0,68

0,78

1,00

0,71

X9

0,28

0,69

0,09

0,35

0,70

0,55

0,55

0,59

0,71

1,00

На основании матрицы парных коэффициентов корреляции обнаружено наличие высокой  связи между объемом ВРП на душу населения (Y)  и помесячными среднедушевыми денежными доходами (Х2). Заметная связь отмечена между объемом ВРП на душу населения (Y)   и помесячными среднедушевыми денежными расходами (Х3). Слабая связь отмечена между объемом ВРП на душу населения (Y)  и стоимостью основных фондов в экономике (Х4); между объемом ВРП на душу населения (Y) и объемом промышленной продукции на душу населения (Х5); между объемом ВРП на душу населения (Y)   и инвестициями в основной капитал (Х9). Обратная слабая связь отмечена между объемом ВРП на душу населения (Y)  и объемом продукции сельского хозяйства на душу населения (Х6). Наблюдается  очень слабая связь между объемом ВРП на душу населения (Y) и вводом в действие общей площади жилых домов (Х7) и  оборотом розничной торговли (Х8), а также присутствуем обратная очень слабая связь между объемом ВРП (Y) и  среднегодовой численности занятых в экономике (Х1).

В результате  из исследования были исключены факторные признаки Х1, Х3, Х8, т.к. они связаны с результативным показателем У (ВРП на душу населения) не так сильно, как Х2 и Х4.

Методом пошаговой регрессии, реализованной в ППП «Statistica»,  из шести независимых переменных отбираем наиболее значимые для адекватного описания (таблица 4, таблица 5).

Таблица 4 – Результаты регрессионного анализа (значимость коэффициентов уравнения регрессии)

БЕТА

Стд.Ош. БЕТА

B

Стд.Ош. B

t(32)

p-уров.

Tкр

Св.член

-13849,6

12742,38

-1,0868

0,2852

1,6939

X2

0,8345

0,0682

10,8

0,89

12,2318

0,0000

X5

0,1725

0,0775

0,1

0,07

2,2260

0,0331

X6

-0,1666

0,0830

-0,7

0,35

-2,0068

0,0532

X9

0,2006

0,0852

0,4

0,17

2,3543

0,0248

По данным таблицы видно, что для итогового уравнения регрессии, в котором все коэффициенты признаются статистически значимыми, так как все расчетные значения критерия Стьюдента по модулю больше табличной величины при уровне значимости 10%, следует выбрать факторные признаки Х2 (помесячные среднедушевые денежные доходы),  Х5 (объем промышленной продукции на душу населения), Х6 (объем продукции сельского хозяйства на душу населения), Х9 (инвестиции в основной капитал).

Итоговое уравнение регрессии имеет вид:

                                (1)

Значимость полученного  уравнения регрессии можно определить по таблице 5.

Таблица 5 – Результаты регрессионного анализа (значимость уравнения регрессии)

Значение

Множест. R

0,93

Множест. R2

0,87

Скорр. R2

0,86

F(4,32)

55,19

P

0,00

Стд. Ош. Оценки

15553,94

Исходя из данных таблицы, можно сделать вывод о том, что при 10 % уровне значимости, уравнение регрессии можно признать статистически значимым, т.к. расчетное значение критерия Фишера больше критического значения данного критерия: F (4,32) = 55,19 > F крит. = 2,129.

Это говорит о том, что  такую модель можно использовать в практических целях.

Множественный коэффициент корреляции, равный 0,93,  говорит об  очень высокой взаимо­связи между результативным признаком Y и включенными в уравнение регрес­сии факторами.

Множественный коэффициент детерминации показывает, что 87% вариации уровня экономического развития региона обусловлено вариацией факторных призна­ков, включенных в уравнение регрессии. Уровень остаточной вариации, объясняемой воздействием случайных и неучтенных в модели факторов, составляет 13%.

На рисунке 4 представленное наглядное изображение соответствия предсказанных и наблюдаемых значений.

Рисунок 4 – График предсказанных и наблюдаемых значений по полученной регрессионной модели

Коэффициенты уравнения множественной регрессии показывают абсолютный размер влияния факторов на уровень результативного показателя и характеризуют степень влияния каждого фактора на анализируемый показатель при фиксированном (среднем) уровне других факторов, входящих в модель.

По значениям коэффициентов в уравнении регрессии (1) можно говорить о том, что при увеличении помесячных среднедушевых денежных доходов (Х2) на 1 р.,  объем ВРП на душу населения увеличится на 10,8 р.;  увеличение объема промышленной продукции (Х5) на 1 млн.р., приведет к повышению объема ВРП на душу населения на 0,1 р.; увеличение объема продукции сельского хозяйства на 1 млн. р. приведет к снижению объема ВРП на душу населения на  0,7 р., увеличение инвестиций в основной капитал на 1 млн.р. приведет к увеличению ВРП на душу населения на 0,4 р..

Однако с помощью коэффициентов регрессии нельзя сопоставить факторы по степени их влияния на зависимую переменную из-за различия единиц измерения и разной степени колеблемости. Поэтому для устранения таких различий при экономической интерпретации применяется целая система показателей: коэффициент эластичности (Эj), бета-коэффициент или коэффициенты регрессии в стандартизированном масштабе (bj).

Коэффициент эластичности показывает, на сколько процентов в среднем изменится значение результативного признака при изменении факторного признака на 1% и рассчитывается по следующей формуле:

                                                ,                                            (2)

где     - среднее значение факторного признака;

        - среднее значение результативного признака;

        aj- коэффициент регрессии при соответствующем факторном признаке.

В данном случае, при увеличении помесячных среднедушевых денежных доходов (Х2) на 1 % его средней величины,  объем ВРП на душу населения увеличится в среднем на  1,04 %.;  при увеличении объема промышленной продукции (Х5) на 1 % его средней величины, объем ВРП на душу населения увеличится в среднем на 0,06 %.; увеличение объема продукции сельского хозяйства на 1 % его средней величины приведет к снижению объема ВРП на душу населения в среднем на  0,1 %; увеличение инвестиций в основной капитал на 1 % его средней величины приведет к увеличению ВРП на душу населения в среднем на 0,1 %.

На рисунке 5 представлен нормальный вероятностный график остатков.

Рисунок 5 – Нормальный вероятностный график остатков по полученной регрессионной модели

Данный график наглядно демонстрирует распределение остатков, что  позволяет сделать вывод о распределении остатков  по нормальному закону.

Таким образом, модель для описания изменения уровня экономического развития республики Мордовия (а также регионов, вошедших в состав третьего кластера) подобрана правильно. Она может быть использована для проведения дальнейших исследований.

На основе проведения корреляционно-регрессионного анализа для кла­стера, в состав которого вошла Республика Мордовия выяснили, что, увеличивая среднедушевые денежные доходы населения, увеличивая объемы промышленной продукции  и увеличивая инвестиции в основной капитал, можно добиться реального роста в экономике.