Отчет о результатах выполнения компьютерной лабораторной работы

Автоматизированный корреляционно-регрессионный анализ взаимосвязи статистических данных в среде MS Excel

ВНИМАНИЕ! Работа на этой странице представлена для Вашего ознакомления в текстовом (сокращенном) виде. Для того, чтобы получить полностью оформленную работу в формате Word, со всеми сносками, таблицами, рисунками (вместо pic), графиками, приложениями, списком литературы и т.д., необходимо скачать работу.

1. Постановка задачи
Корреляционно-регрессионный анализ взаимосвязи признаков является составной частью проводимого статистического исследования и частично использует результаты Лабораторной работы № 1.
В Лабораторной работе № 2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные Лабораторной работы № 1 после исключения из них аномальных значений.
Таблица 1 Номер варианта
Исходные данные 33
Номер предприятия Среднегодовая стоимость основных производственных фондов, млн.руб. Выпуск продукции, млн. руб.
1 1880,00 1802,50
2 2212,50 1977,50
3 2282,50 2205,00
4 2405,00 2450,00
5 1565,00 1225,00
6 2527,50 2100,00
7 2597,50 2835,00
8 1950,00 1925,00
9 2387,50 2257,50
10 2755,00 2817,50
11 3017,50 2975,00
13 2300,00 2345,00
14 2527,50 2555,00
15 2895,00 3097,50
16 3315,00 3325,00
17 2475,00 2240,00
18 2737,50 2660,00
19 2177,50 1662,50
20 2772,50 2275,00
21 3087,50 3062,50
22 2125,00 1732,50
23 1687,50 1627,50
24 2825,00 2607,50
25 2527,50 2275,00
26 2352,50 2152,50
27 1827,50 1400,00
28 2457,50 2187,50
29 2842,50 2397,50
30 2702,50 2275,00
32 1985,00 2030,00

В процессе статистического исследования необходимо решить ряд задач.
1. Установить наличие стохастической связи между факторным признаком Х и результативным признаком Y:
а) графическим методом;
б) методом сопоставления параллельных рядов.
2. Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.
3. Оценить тесноту связи признаков Х и Y на основе:
а) эмпирического корреляционного отношения η;
б) линейного коэффициента корреляции r.
Сравнить значения η и r и сделать вывод о возможности линейной связи между признаками Х и Y.
4. Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализа, и рассчитать доверительные интервалы коэффициентов уравнения линейной регрессии.
Построить теоретическую кривую регрессии.
Дать экономическую интерпретацию коэффициента регрессии.
Рассчитать коэффициент эластичности и дать его экономическую интерпретацию.
5. Найти наиболее адекватное уравнение регрессии с помощью средств инструмента Мастер диаграмм.
II. Рабочий файл с результативными таблицами и графиками.

Таблица 2.1 Номер варианта Приложение 1
Исходные данные 24
Номер предприятия Среднегодовая стоимость основных производственных фондов, млн.руб. Выпуск продукции, млн. руб.
5 1565 1225
23 1687,5 1627,5
27 1827,5 1400
1 1880 1802,5
8 1950 1925
32 1985 2030
22 2125 1732,5
19 2177,5 1662,5
2 2212,5 1977,5
3 2282,5 2205
13 2300 2345
26 2352,5 2152,5
9 2387,5 2257,5
4 2405 2450
28 2457,5 2187,5
17 2475 2240
6 2527,5 2100
14 2527,5 2555
25 2527,5 2275
7 2597,5 2835
30 2702,5 2275
18 2737,5 2660
10 2755 2817,5
20 2772,5 2275
24 2825 2607,5
29 2842,5 2397,5
15 2895 3097,5
11 2842,50 2397,50
21 2702,50 2275,00
16 1985,00 2030,00

Таблица 2.2
Зависимость выпуска продукции от среднегодовой стоимости основных фондов
Номер группы Группы предприятий по стоимости основеных фондов Число предприятий Выпуск продукции
Всего В среднем
на одно
предприятие
1 1565-1915 3 6055,00 2018,33
2 1915-2265 6 11532,50 1922,08
3 2265-2615 11 23397,50 2127,05
4 2615-2965 7 18130,00 2590,00
5 2965-3315 3 6702,50 2234,17
Итого 30 65817,50 2193,92

Таблица 2.3
Показатели внутригрупповой вариации
Номер группы Группы предприятий по стоимости основеных фондов Число предприятий Внутригрупповая дисперсия
1 1565-1915 3 48157,81
2 1915-2265 6 33015,45
3 2265-2615 11 44041,81
4 2615-2965 7 78575,00
5 2965-3315 3 23343,06
Итого 30 227133,13

Таблица 2.4
Показатели дисперсии и эмпирического корреляционного отношения
Общая дисперсия Средняя из внутригрупповых дисперсия Межгрупповая дисперсия Эмпирическое корреляционное отношение
168692,3681 48236,00833 120456,3597 0,845020315

Таблица 2.5
Линейный коэффициент корреляции признаков
Столбец1 Столбец2
Столбец1 1
Столбец2 0,91318826 1

Выходные таблицы

ВЫВОД ИТОГОВ

Регрессионная статистика
Множественный R 0,852702598
R-квадрат 0,727101721
Нормированный R-квадрат 0,717355354
Стандартная ошибка 222,0903697
Наблюдения 30

Дисперсионный анализ
df SS MS F Значимость F
Регрессия 1 3679695,336 3679695,336 74,60233283 2,19995E-09
Остаток 28 1381075,705 49324,13233
Итого 29 5060771,042

Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение -86,97742646 267,1708558 -0,325549829 0,747185355 -634,2521083 460,2972554 -634,2521083 460,2972554
Переменная X 1 0,959568403 0,111096336 8,637264198 2,19995E-09 0,731997878 1,187138927 0,731997878 1,187138927

ВЫВОД ОСТАТКА

Наблюдение Предсказанное Y Остатки
1 1414,747124 -189,7471237
2 1532,294253 95,20574697
3 1666,633829 -266,6338294
4 1717,011171 85,48882946
5 1784,180959 140,8190413
6 1817,765853 212,2341472
7 1952,105429 -219,6054292
8 2002,48277 -339,9827703
9 2036,067664 -58,56766443
10 2103,237453 101,7625474
11 2120,0299 224,9701003
12 2170,407241 -17,9072408
13 2203,992135 53,50786511
14 2220,784582 229,2154181
15 2271,161923 -83,66192308
16 2287,95437 -47,95437013
17 2338,331711 -238,3317113
18 2338,331711 216,6682887
19 2338,331711 -63,33171127
20 2405,501499 429,4985005
21 2506,256182 -231,2561817
22 2539,841076 120,1589242
23 2556,633523 260,8664771
24 2573,42597 -298,4259699
25 2623,803311 -16,30331106
26 2640,595758 -243,0957581
27 2690,973099 406,5269008
28 2640,595758 -243,0957581
29 2506,256182 -231,2561817
30 1817,765853 212,2341472

Диаграмма 1

Диаграмма 2

Диаграмма 3

Задача 1. Установление наличия стохастической связи между факторным признаком Х и результативным признаком Y:
а) графическим методом.
Вывод: На основе анализа диаграммы рассеяния из Лабораторной работы №1, полученной после удаления аномальных значений, можно сделать вывод, что имеет место стохастическая связь. Предположительный вид связи: линейная прямая.
б) методом сопоставления параллельных рядов.
Вывод: Табл.2.1, полученная путем ранжирования предприятий по возрастанию значения факторного признака Х, показывает, что с увеличением значений факторного признака увеличиваются значения результативного признака, за исключением некоторых отклонений, что позволяет сделать вывод о наличии между факторным и результативным признаками стохастической связи. Предположительно это связь имеет линейный прямой вид.
Задача 2. Установление наличия корреляционной связи между признаками Х и Y методом аналитической группировки.
Вывод: Результаты выполнения аналитической группировки предприятий по факторному признаку Среднегодовая стоимость основных производственных фондов даны в табл. 2.2 Рабочего файла, которая показывает, что с увеличением среднегодовой стоимости основных производственных фондов среднегодовой выпуск продукции также возрастает. Следовательно, между исследуемыми признаками существует прямая корреляционная зависимость. Теснота этой связи может быть измерена как эмпирическим корреляционным отношением, так и на основе линейного коэффициента корреляции признаков.
Задача 3.Оценка тесноты связи признаков Х и Y:
а) на основе эмпирического корреляционного отношения
Для анализа тесноты связи между факторным и результативным признаками, рассчитывается показатель η - эмпирическое корреляционное отношение, задаваемое формулой

Для вычисления η необходимо знать общую дисперсию и межгрупповую дисперсию результативного признака Y - Выпуск продукции.
Результаты выполненных расчетов представляются табл. 2.4 Рабочего файла.
Вывод: Величина η=0,902765617является близкой к единице, что свидетельствует об очень тесной связи между признаками, близкой к функциональной зависимости.
б) на основе линейного коэффициента корреляции признаков
В предположении, что связь между факторным и результативным признаком имеется, для определения тесноты связи на основе линейного коэффициента корреляции r был использован инструмент Корреляция надстройки Пакет анализа.
Результатом работы инструмента Корреляции является табл. 2.5 Рабочего файла.
Вывод: Значение коэффициента корреляции r=0,91318826лежит в интервале от 0,9 до 0,99, что в соответствии со шкалой Чэддока, говорит о весьма тесной связи между среднегодовой стоимостью основных производственных фондов и выпуском продукции.
Так как значение коэффициента корреляции r положительное, то связь между признаками прямая.
Посредством показателя η измеряется теснота связи любой формы, а с помощью коэффициента корреляции r – только прямолинейная, следовательно, значения η и r совпадают только при наличии прямолинейной связи. В теории статистики установлено, что если , то гипотезу о прямолинейной связи можно считать подтвержденной.
Вывод: В нашей работе гипотезу о прямолинейной связи между изучаемыми признаками можно считать подтвержденной, поскольку , т.е. 0,02< 0,1 Задача 4. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа. Построение регрессионной модели заключается в определении аналитического выражения связи между факторным признаком X и результативным признаком Y. Инструмент Регрессия производит расчет параметров а0 и а1 уравнения однофакторной линейной регрессии и проверка его адекватности исследуемым фактическим данным. В результате работы инструмента Регрессия были получены результативные таблицы 2.6 – 2.9 Рабочего файла. Вывод: Однофакторная линейная регрессионная модель связи факторного и результативного признаков имеет вид . Коэффициент а1 > 0, следовательно, связь между рассматриваемыми признаками, как и ожидалось, прямая.
Доверительные интервал коэффициентов уравнения регрессии представим в нижеследующей таблице
Коэффициенты Границы доверительных интервалов
С надежностью Р=0,68 С надежностью Р=0,95
Нижние Верхние Нижние Верхние
а0 -1349,890979 -328,2041009 -1866,108645 188,0135645
а1 0,995748668 1,182961694 0,901157387 1,277552975

С увеличением надежности границы доверительных интервалов расширяются.
Экономическая интерпретация коэффициента регрессии а1: из нашего уравнения регрессии следует, что при увеличении среднегодовой стоимости основных производственных фондов на 1 тыс. руб. выпуск продукции увеличивается на 1,089 тыс. руб.
Коэффициент эластичности = (5380/5021,68)*1,089=1,17.
Экономическая интерпретация коэффициента эластичности Э: С повышением стоимости основных производственных фондов на 1% следует ожидать увеличение выпуска продукции на 1,17%.
Задача 5. Нахождение наиболее адекватного уравнения регрессии с помощью средств инструмента Мастер диаграмм. Построение для этого уравнения теоретической линии регрессии.
Возможности инструмента Мастер диаграмм позволяют быстро производить построение и анализ адекватности регрессионных моделей, базирующихся на использовании различных видов зависимости между признаками X и Y.
Построение моделей осуществляется непосредственно на диаграмме рассеяния.
На диаграмме рассеяния отображается линия и уравнение регрессии, а также коэффициент детерминации R2.
В лабораторной работе уравнения регрессии и их графики были построены для 5-ти видов зависимости между признаками и даны на диаграмме 2 Рабочего файла.
Уравнения регрессии и соответствующие им коэффициент детерминации R2 даны в следующей таблице:
Регрессионные модели связи
Вид уравнения Коэффициент
детерминации R2
Линейное 0,1796
Полином 2-го порядка 0,3932
Полином 3-го порядка 0,8118
Степенное 0,8414
Экспоненциальное 0,1941

Выбор наиболее адекватного уравнения регрессии определяется максимальным значением коэффициента детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным
Вывод: Максимальное значение коэффициента детерминации R2 =0,8381
Вид искомого уравнения регрессии – y = 3E-07x3 - 0,0017x2 + 5,053x – 3248,7. Это уравнение регрессии и его график приведены на отдельной диаграмме рассеяния Диаграмма 3 Рабочего файла.
Вместе с тем, так как значения коэффициентов R2 кубического и линейного уравнения расходятся очень незначительно (на величину 0,8381-0,8339=0,0042),а для показателей тесноты связи имеет место неравенство , то в качестве адекватного уравнения регрессии может быть принято линейное уравнение , совпадающее с найденным с помощью инструмента Регрессия надстройки Пакет анализа.


Скачиваний: 3
Просмотров: 4
Скачать реферат Заказать реферат