Отчет о результатах выполнения компьютерной лабораторной работы

Корреляционно-регрессионный анализ взаимосвязи признаков является составной частью проводимого статистического исследования и частично использует результаты Лабораторной работы № 1.

ВНИМАНИЕ! Работа на этой странице представлена для Вашего ознакомления в текстовом (сокращенном) виде. Для того, чтобы получить полностью оформленную работу в формате Word, со всеми сносками, таблицами, рисунками (вместо pic), графиками, приложениями, списком литературы и т.д., необходимо скачать работу.

1. Постановка задачи
Корреляционно-регрессионный анализ взаимосвязи признаков является составной частью проводимого статистического исследования и частично использует результаты Лабораторной работы № 1.
В Лабораторной работе № 2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные Лабораторной работы № 1 после исключения из них аномальных значений.
Таблица 1 Номер варианта
Исходные данные 22
Номер предприятия Среднегодовая стоимость основных производственных фондов, млн.руб. Выпуск продукции, млн. руб.
1 1286,00 1236,00
2 1514,00 1356,00
3 1562,00 1512,00
4 1646,00 1680,00
5 1070,00 840,00
6 1730,00 1440,00
7 1778,00 1944,00
8 1334,00 1320,00
9 1634,00 1548,00
10 1886,00 1932,00
11 2066,00 2040,00
13 1574,00 1608,00
14 1730,00 1752,00
15 1982,00 2124,00
16 2270,00 2280,00
17 1694,00 1536,00
18 1874,00 1824,00
19 1490,00 1140,00
20 1898,00 1560,00
21 2114,00 2100,00
22 1454,00 1188,00
23 1154,00 1116,00
24 1934,00 1788,00
25 1730,00 1560,00
26 1610,00 1476,00
27 1250,00 960,00
28 1682,00 1500,00
29 1946,00 1644,00
30 1850,00 1560,00
32 1358,00 1392,00

В процессе статистического исследования необходимо решить ряд задач.
1. Установить наличие стохастической связи между факторным признаком Х и результативным признаком Y:
а) графическим методом;
б) методом сопоставления параллельных рядов.
2. Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.
3. Оценить тесноту связи признаков Х и Y на основе:
а) эмпирического корреляционного отношения η;
б) линейного коэффициента корреляции r.
Сравнить значения η и r и сделать вывод о возможности линейной связи между признаками Х и Y.
4. Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализа, и рассчитать доверительные интервалы коэффициентов уравнения линейной регрессии.
Построить теоретическую кривую регрессии.
Дать экономическую интерпретацию коэффициента регрессии.
Рассчитать коэффициент эластичности и дать его экономическую интерпретацию.
5. Найти наиболее адекватное уравнение регрессии с помощью средств инструмента Мастер диаграмм.
II. Рабочий файл с результативными таблицами и графиками.

Таблица 2.1 Номер варианта Приложение 1
Исходные данные 24
Номер предприятия Среднегодовая стоимость основных производственных фондов, млн.руб. Выпуск продукции, млн. руб.
5 1070 840
23 1154 1116
27 1250 960
1 1286 1236
8 1334 1320
32 1358 1392
22 1454 1188
19 1490 1140
2 1514 1356
3 1562 1512
13 1574 1608
26 1610 1476
9 1634 1548
4 1646 1680
28 1682 1500
17 1694 1536
6 1730 1440
14 1730 1752
25 1730 1560
7 1778 1944
31 1850 1560
18 1874 1824
10 1886 1932
20 1898 1560
24 1934 1788
29 1946 1644
15 1982 2124
12 2066 2040
21 2114 2100
16 2270 2280

Таблица 2.2
Зависимость выпуска продукции от среднегодовой стоимости основных фондов
Номер группы Группы предприятий по стоимости основеных фондов Число предприятий Выпуск продукции
Всего В среднем
на одно
предприятие
1 1070-1310 4 4152,00 1038,00
2 1310-1550 5 7908,00 1581,60
3 1550-1790 11 16044,00 1458,55
4 1790-2030 7 12432,00 1776,00
5 2030-2270 3 6420,00 2140,00
Итого 30 46956,00 1565,20

Таблица 2.3
Показатели внутригрупповой вариации
Номер группы Группы предприятий по стоимости основеных фондов Число предприятий Внутригрупповая дисперсия
1 1070-1310 4 22644,00
2 1310-1550 5 15524,00
3 1550-1790 11 20708,64
4 1790-2030 7 36946,29
5 2030-2270 3 10400,00
Итого 30 106222,93

Таблица 2.4
Показатели дисперсии и эмпирического корреляционного отношения
Общая дисперсия Средняя из внутригрупповых дисперсия Межгрупповая дисперсия Эмпирическое корреляционное отношение
115888,16 22860,50133 93027,65867 0,895955648

Таблица 2.5
Линейный коэффициент корреляции признаков
Столбец1 Столбец2
Столбец1 1
Столбец2 0,91318826 1

Выходные таблицы

ВЫВОД ИТОГОВ

Регрессионная статистика
Множественный R 0,91318826
R-квадрат 0,833912798
Нормированный R-квадрат 0,827981112
Стандартная ошибка 143,6048903
Наблюдения 30

Дисперсионный анализ
df SS MS F Значимость F
Регрессия 1 2899218,593 2899218,593 140,5861384 1,97601E-12
Остаток 28 577426,2066 20622,36452
Итого 29 3476644,8

Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение -254,0231522 155,6555756 -1,631956653 0,113886395 -572,8691406 64,82283627 -572,8691406 64,82283627
Переменная X 1 1,089355181 0,09187519 11,85690257 1,97601E-12 0,901157387 1,277552975 0,901157387 1,277552975

ВЫВОД ОСТАТКА

Наблюдение Предсказанное Y Остатки
1 911,5868914 -71,58689143
2 1003,092727 112,9072734
3 1107,670824 -147,670824
4 1146,887611 89,11238948
5 1199,176659 120,8233408
6 1225,321184 166,6788165
7 1329,899281 -141,8992809
8 1369,116067 -229,1160674
9 1395,260592 -39,26059177
10 1447,54964 64,45035954
11 1460,621903 147,3780974
12 1499,838689 -23,83868914
13 1525,983213 22,01678651
14 1539,055476 140,9445243
15 1578,272262 -78,27226217
16 1591,344524 -55,34452434
17 1630,561311 -190,5613109
18 1630,561311 121,4386891
19 1630,561311 -70,56131086
20 1682,85036 261,1496405
21 1761,283933 -201,2839326
22 1787,428457 36,57154309
23 1800,500719 131,4992809
24 1813,572981 -253,5729813
25 1852,789768 -64,78976777
26 1865,86203 -221,8620299
27 1905,078816 218,9211835
28 1996,584652 43,41534834
29 2048,8737 51,12629966
30 2218,813109 61,18689143

Диаграмма 1

Диаграмма 2

Диаграмма 3

Задача 1. Установление наличия стохастической связи между факторным признаком Х и результативным признаком Y:
а) графическим методом.
Вывод: На основе анализа диаграммы рассеяния из Лабораторной работы №1, полученной после удаления аномальных значений, можно сделать вывод, что имеет место стохастическая связь. Предположительный вид связи: линейная прямая.
б) методом сопоставления параллельных рядов.
Вывод: Табл.2.1, полученная путем ранжирования предприятий по возрастанию значения факторного признака Х, показывает, что с увеличением значений факторного признака увеличиваются значения результативного признака, за исключением некоторых отклонений, что позволяет сделать вывод о наличии между факторным и результативным признаками стохастической связи. Предположительно это связь имеет линейный прямой вид.
Задача 2. Установление наличия корреляционной связи между признаками Х и Y методом аналитической группировки.
Вывод: Результаты выполнения аналитической группировки предприятий по факторному признаку Среднегодовая стоимость основных производственных фондов даны в табл. 2.2 Рабочего файла, которая показывает, что с увеличением среднегодовой стоимости основных производственных фондов среднегодовой выпуск продукции также возрастает. Следовательно, между исследуемыми признаками существует прямая корреляционная зависимость. Теснота этой связи может быть измерена как эмпирическим корреляционным отношением, так и на основе линейного коэффициента корреляции признаков.
Задача 3.Оценка тесноты связи признаков Х и Y:
а) на основе эмпирического корреляционного отношения
Для анализа тесноты связи между факторным и результативным признаками, рассчитывается показатель η - эмпирическое корреляционное отношение, задаваемое формулой

Для вычисления η необходимо знать общую дисперсию и межгрупповую дисперсию результативного признака Y - Выпуск продукции.
Результаты выполненных расчетов представляются табл. 2.4 Рабочего файла.
Вывод: Величина η=0,902765617является близкой к единице, что свидетельствует об очень тесной связи между признаками, близкой к функциональной зависимости.
б) на основе линейного коэффициента корреляции признаков
В предположении, что связь между факторным и результативным признаком имеется, для определения тесноты связи на основе линейного коэффициента корреляции r был использован инструмент Корреляция надстройки Пакет анализа.
Результатом работы инструмента Корреляции является табл. 2.5 Рабочего файла.
Вывод: Значение коэффициента корреляции r=0,91318826лежит в интервале от 0,9 до 0,99, что в соответствии со шкалой Чэддока, говорит о весьма тесной связи между среднегодовой стоимостью основных производственных фондов и выпуском продукции.
Так как значение коэффициента корреляции r положительное, то связь между признаками прямая.
Посредством показателя η измеряется теснота связи любой формы, а с помощью коэффициента корреляции r – только прямолинейная, следовательно, значения η и r совпадают только при наличии прямолинейной связи. В теории статистики установлено, что если , то гипотезу о прямолинейной связи можно считать подтвержденной.
Вывод: В нашей работе гипотезу о прямолинейной связи между изучаемыми признаками можно считать подтвержденной, поскольку , т.е. 0,02< 0,1 Задача 4. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа. Построение регрессионной модели заключается в определении аналитического выражения связи между факторным признаком X и результативным признаком Y. Инструмент Регрессия производит расчет параметров а0 и а1 уравнения однофакторной линейной регрессии и проверка его адекватности исследуемым фактическим данным. В результате работы инструмента Регрессия были получены результативные таблицы 2.6 – 2.9 Рабочего файла. Вывод: Однофакторная линейная регрессионная модель связи факторного и результативного признаков имеет вид . Коэффициент а1 > 0, следовательно, связь между рассматриваемыми признаками, как и ожидалось, прямая.
Доверительные интервал коэффициентов уравнения регрессии представим в нижеследующей таблице
Коэффициенты Границы доверительных интервалов
С надежностью Р=0,68 С надежностью Р=0,95
Нижние Верхние Нижние Верхние
а0 -1349,890979 -328,2041009 -1866,108645 188,0135645
а1 0,995748668 1,182961694 0,901157387 1,277552975

С увеличением надежности границы доверительных интервалов расширяются.
Экономическая интерпретация коэффициента регрессии а1: из нашего уравнения регрессии следует, что при увеличении среднегодовой стоимости основных производственных фондов на 1 тыс. руб. выпуск продукции увеличивается на 1,089 тыс. руб.
Коэффициент эластичности = (5380/5021,68)*1,089=1,17.
Экономическая интерпретация коэффициента эластичности Э: С повышением стоимости основных производственных фондов на 1% следует ожидать увеличение выпуска продукции на 1,17%.
Задача 5. Нахождение наиболее адекватного уравнения регрессии с помощью средств инструмента Мастер диаграмм. Построение для этого уравнения теоретической линии регрессии.
Возможности инструмента Мастер диаграмм позволяют быстро производить построение и анализ адекватности регрессионных моделей, базирующихся на использовании различных видов зависимости между признаками X и Y.
Построение моделей осуществляется непосредственно на диаграмме рассеяния.
На диаграмме рассеяния отображается линия и уравнение регрессии, а также коэффициент детерминации R2.
В лабораторной работе уравнения регрессии и их графики были построены для 5-ти видов зависимости между признаками и даны на диаграмме 2 Рабочего файла.
Уравнения регрессии и соответствующие им коэффициент детерминации R2 даны в следующей таблице:
Регрессионные модели связи
Вид уравнения Уравнение регрессии Коэффициент
детерминации R2
Линейное 0,1796
Полином 2-го порядка 0,3932
Полином 3-го порядка 0,8118
Степенное 0,8414
Экспоненциальное 0,1941

Выбор наиболее адекватного уравнения регрессии определяется максимальным значением коэффициента детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным
Вывод: Максимальное значение коэффициента детерминации R2 =0,8381
Вид искомого уравнения регрессии – y = 5E-08x3 - 0,0008x2 + 5,053x - 7207,7. Это уравнение регрессии и его график приведены на отдельной диаграмме рассеяния Диаграмма 3 Рабочего файла.
Вместе с тем, так как значения коэффициентов R2 кубического и линейного уравнения расходятся очень незначительно (на величину 0,8381-0,8339=0,0042),а для показателей тесноты связи имеет место неравенство , то в качестве адекватного уравнения регрессии может быть принято линейное уравнение , совпадающее с найденным с помощью инструмента Регрессия надстройки Пакет анализа.


Скачиваний: 5
Просмотров: 3
Скачать реферат Заказать реферат