Статистический анализ

Автоматизированный априорный анализ статистической совокупности
в среде MS Excel

ВНИМАНИЕ! Работа на этой странице представлена для Вашего ознакомления в текстовом (сокращенном) виде. Для того, чтобы получить полностью оформленную работу в формате Word, со всеми сносками, таблицами, рисунками (вместо pic), графиками, приложениями, списком литературы и т.д., необходимо скачать работу.

1. Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
Таблица 1
Исходные данные
Номер предприятия Среднегодовая стоимость основных производственных фондов, млн.руб. Выпуск продукции, млн. руб.
1 1718,00 1648,00
2 2022,00 1808,00
3 2086,00 2016,00
4 2198,00 2240,00
5 1430,00 1120,00
6 2310,00 1920,00
7 2374,00 2592,00
8 1782,00 1760,00
9 2182,00 2064,00
10 2518,00 2576,00
11 2758,00 2720,00
13 2102,00 2144,00
14 2310,00 2336,00
15 2646,00 2832,00
16 3030,00 3040,00
17 2262,00 2048,00
18 2502,00 2432,00
19 1990,00 1520,00
20 2534,00 2080,00
21 2822,00 2800,00
22 1942,00 1584,00
23 1542,00 1488,00
24 2582,00 2384,00
25 2310,00 2080,00
26 2150,00 1968,00
27 1670,00 1280,00
28 2246,00 2000,00
29 2598,00 2192,00
30 2470,00 2080,00
32 1814,00 1856,00

В процессе исследования совокупности необходимо решить ряд статистических задач для выборочной и генеральной совокупностей.

Статистический анализ выборочной совокупности
1. Выявить наличие среди исходных данных резко выделяющихся значений признаков («выбросов» данных) с целью исключения из выборки аномальных единиц наблюдения.
2. Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую ( ), моду (Мо), медиану (Ме), размах вариации (R), дисперсию( ), средние отклонения – линейное ( ) и квадратическое (σn), коэффициент вариации (Vσ), структурный коэффициент асимметрии К.Пирсона (Asп).
3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) устойчивость индивидуальных значений признаков;
г) количество попаданий индивидуальных значений признаков в диапазоны ( ), ( ), ( ).
4. Дать сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа:
а) вариации признаков;
б) количественной однородности единиц;
в) надежности (типичности) средних значений признаков;
г) симметричности распределений в центральной части ряда.
5. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения. Рассчитать моду Мо полученного интервального ряда и сравнить ее с показателем Мо несгруппированного ряда данных.

Статистический анализ генеральной совокупности
1. Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение и ожидаемый размах вариации признаков RN. Сопоставить значения этих показателей для генеральной и выборочной дисперсий.
2. Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954, P=0,997 и границы, в которых будут находиться средние значения признака генеральной совокупности при заданных уровнях надежности.
3. Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению.

Статистический анализ выборочной совокупности
1. Количество аномальных единиц наблюдения – 2, согласно табл.2:
предприятие №31 со среднегодовой стоимостью производственных фондов – 3030 млн.руб. и выпуском продукции – 800млн.руб, и предприятие №12 со среднегодовой стоимостью производственных фондов –950 млн.руб. и выпуском продукции – 2400млн.руб
2. Рассчитанные выборочные показатели представлены в таблицах 3 5. Сформируем на основе этих таблиц единую таблицу значений выборочных совокупностей:
Таблица 8
Описательные статистики выборочной совокупности
По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." По столбцу "Выпуск продукции, млн.руб"
Средняя арифметическая 2230 Средняя арифметическая 2086,933333
Мода 2310 Мода 2080
Медиана 2254 Медиана 2072
Размах вариации 1600 Размах вариации 1920
Дисперсия 144776,5333 Дисперсия 206023,3956
Среднее линейное отклонение 306,1333333 Среднее линейное отклонение 349,6533333
Среднее квадратическое отклонение 380,495116 Среднее квадратическое отклонение 453,8980013
Коэффициент вариации 17,06256126 Коэффициент вариации 21.74952089
Структурный коэффициент асимметрии К.Пирсона -0.21025237 Структурный коэффициент асимметрии К.Пирсона 0.015275091

3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценим:

а) степень колеблемости значений признаков в совокупности;
Для этого необходимо оценить коэффициентом вариации V
Принята следующая оценочная шкала колеблемости признака:
0%60% - колеблемость значительная.
Вывод: В данной задаче:
V1=17,06%<40% - колеблемость незначительная; V2=21,75%<40% - колеблемость незначительная. б) степень однородности совокупности по изучаемым признакам. Для нормальных и близких к нормальному распределений показатель V служит индикатором однородности совокупности: принято считать, что при выполнимости неравенства V 33% (7) совокупность является количественно однородной по данному признаку. Вывод: Изучаемая совокупность является качественно однородной по обоим признакам, так как для них выполняется условие V 33% (для первого признака V =17,0626, для второго V =21,7495) в) устойчивость индивидуальных значений признаков; Устойчивость индивидуальных значений признаков оценим на основе сопоставления средних отклонений – квадратического и линейного . В условиях распределений, близких к нормальному, между показателями и имеет место равенство: поэтому отношение показателей и может служить индикатором устойчивости данных. По первому признаку: / =306,1333333/380,495116=0,804565737 По второму признаку: / =349,6533333/453,8980013=0,770334595 Вывод: Поскольку индикатор устойчивости данных для признака «среднегодовая стоимость производственных фондов» больше 0,8, то делаем вывод, что значение данного признака неустойчивы, в них имеются «аномальные» выбросы. Поэтому, несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдений, некоторые аномалии в первичных данных продолжают сохраняться. По второму признаку делаем вывод об устойчивости значений признака. г) количество попаданий индивидуальных значений признаков в диапазоны ( ), ( ), ( ). Сформируем следующую таблицу: Таблица 9 Распределение значений признака по диапазонам рассеяния признака относительно Границы диапазонов Количество значений xi, находящихся в каждой зане 1 признак 2 признак 1 признак 2 признак ( ) 1849,50 2610,50 1633,04 2540,83 20 19 ( ) 1469,01 2990,99 1179,14 2994,73 28 28 ( ) 1088,51 3371,49 725,24 3448,63 30 30 Сопоставление полученных процентных соотношений рассеяния значений признаков по диапазонам с ожидаемым по правилу «трех сигм» показывает, что в первый диапазон попадает меньше значений. Соответственно по первому признаку – 66,7%, по второму – еще меньше 63,3% против ожидаемых 68,3%. Во второй диапазон по обоим признакам попадает по 93,3% значений, что также меньше вероятностной оценки - 95,4%. В третьем диапазоне появляются все значения по обоим признакам (ожидаемое – 99,7%). Вывод: распределение данных по диапазонам близко к нормальному. 4. Дадим сравнительную характеристику распределений единиц совокупности по двум изучаемым признакам на основе анализа: а) Вариации признаков. Сравнение показателей вариации для двух изучаемых признаков показывает, что по второму признаку (выпуск продукции) величины всех показателей вариации выше:  размах вариации 1920 против 1600 млн. руб.;  дисперсия 206023,40 против 144776,53;  среднее линейное отклонение 349,65 против 306,13 млн.руб.;  среднее квадратическое отклонение 453,90 против 380,50 млн.руб.;  коэффициент вариации 21,75% против 17,06%. Вывод: степень колеблемости значений второго признака выше. б) Количественной однородности единиц. Величина коэффициента вариации по второму признаку хотя и больше, но она не превышает 33%, следовательно, в обеих совокупностях единицы количественно однородны. в) Надежности (типичности) средних значений признаков. Количественная однородность единиц первой совокупности означает, что индивидуальные значения среднегодовой стоимости основных фондов мало отличаются друг от друга и средняя арифметическая величина =2230 млн. руб. является надежной характеристикой данной совокупности. Точно также и средняя величина выпуска продукции =2086,933333 млн. руб. является типичной для своих индивидуальных значений. г) Симметричности распределений в центральной части ряда. Для этого сравним величины структурного коэффициента асимметрии К.Пирсона (Asп) между собой и с оценочной шкалой асимметричности (13) |As| 0,25 - асимметрия незначительная; 0,25<|As| 0,5 - асимметрия заметная (умеренная); (13) |As|>0,5 - асимметрия существенная.

Вывод: По первому признаку Asп=-0,21. Следовательно, имеет место незначительная левосторонняя асимметрия (Asп <0 и по модулю не превышает 0,25). По второму признаку Asп=0,015 (Asп>0 и по модулю не превышает 0,25). Следовательно, асимметрия правосторонняя, но ничтожно малая. Распределение можно считать симметричным.
Кроме того, для первого признака справедливо неравенство:
, 2230<2254<2310 Это также указывает на левостороннюю асимметрию, т.е. вершина кривой распределения немного сдвинута вправо, а левая ветвь кривой оказывается длиннее правой. Для второго признака все три характеристики центра распределения очень близки между собой, поэтому можно записать: , 2086,93 2072 2080. Это подтверждает вывод о симметричности распределения. 5. Анализ полученного интервального вариационного яда и формы гистограммы показывает, что эмпирическое распределение имеет сходство (хотя и не строгое) с нормальным распределением. Проявляется оно в том, что крайние значения признака (близкие к Xmax и Xmin) встречаются много реже, чем серединные, гистограмма имеет одновершинную форму, она приблизительно симметрична, так как ее «хвосты» не очень длинны (за пределами интервала лежат по 6,7% вариантов), а в диапазоне располагается основная масса единиц – 66,7%. Таким образом, характер (тип) распределения единиц совокупности по признаку «среднегодовая стоимость основных производственных фондов» можно считать близким к нормальному (наблюдается незначительная левосторонняя асимметрия, что установлено в задании 4г.) Для получения интервального ряда значение моды рассчитаем по формуле: Модальный интервал 2070-2390, следовательно xMo=2070, величина модального интервала h=2390-2070=320, частота модального интервала fMo=11, частота предмодального интервала fMo-1=5, частота послемодального интервала fMo+1=7. Таким образом, после расчета, Mo=2262 млн.руб. Показатель моды, рассчитанный для интервального ряда данных (2262 млн.руб.) не совпадает с аналогичным показателем для несгруппированных данных (2310 млн.руб.). Это объясняется разной методикой расчета. По несгруппированным данным модой является наиболее часто встречающийся вариант. Им оказалось значение признака 2310, которое встретилось в совокупности три раза, другие значения присутствовали в единственном числе. По сгруппированным данным величина моды зависит от нижней границы, размера и частоты модального интервала, а также от предмодальной и послемодальной частот. Статистический анализ генеральной совокупности 1. На основании таблицы 3 сформируем таблицу 10 для генеральных показателей совокупности: Таблица 10 Описательные статистики генеральной совокупности По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." По столбцу "Выпуск продукции, млн.руб" Дисперсия ( ) 149768,8276 213127,6506 Среднее квадратическое отклонение ( ) 386,9997772 461,6575035 Ожидаемый размах вариации признака ( ) 2321,9986632 2769,945021 Коэффициент эксцесса ( ) -0.344943844 -0.205332365 Коэффициент асимметрии ( ) -0.152503649 0.042954448 Степень расхождения между устанавливается по формуле (16): . Поправочный коэффициент n/(n-1)=30/(30-1)=30/29=1.034482758. Его значение близко к единице, следовательно, степень расхождения между и незначительная. Степень расхождения между и еще меньше и составляет 1,017095255. Определим прогнозное значение размаха вариации признака в генеральной совокупности: Степень расхождения между и по первому признаку =145,1249164/100 = 1,451249164; по второму признаку = 173,1215638/120=1,442679698. Вывод: Прогнозное значение по первому признаку превосходит в 1,45 раза, по второму – в 1,44 раза, т.е. степень расхождения между и следует считать существенной. 2. Для изучаемых признаков рассчитать: а) Средние ошибки выборки (параметр Стандартная ошибка) рассчитаны и приведены в табл. 3. «Описательные статистики» б) Оценки предельных ошибок выборки имеются в табл.3,4а, 4б. На основе этих оценок и формулы (15) определим ожидаемые границы для генеральных средних, результаты представим в таблице 11. Таблица 11 Предельные ошибки выборки и ожидаемые границы для генеральной совокупности Доверительная вероятность p Коэффициент доверия t Предельные ошибки выборки Ожидаемые границы для генеральных средних Для первого признака Для второго признака Для первого признака Для второго признака 0,683 1 71,94249778 85,82122233 2158,06 2301,94 2001,11 2172,75 0,954 2 147,3048272 175,7220102 2082,70 2377,30 1911,21 2262,66 0,997 3 228,8837253 273,0386306 2001,12 2458,88 1813,89 2359,97 Ожидаемые границы для генеральных средних вычисляются как среднее по признаку ± предельные ошибки выборки для каждой доверительной вероятности 3. Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок сделать вывод о степени близости распределения единиц генеральной совокупности к нормальному распределению. Поскольку распределение единиц выборочной совокупности по каждому признаку близко к нормальному, выборка является репрезентативной (значение показателей и расходятся незначительно) и при этом коэффициент асимметрии по обоим признакам меньше 0,25 (табл.3). Т.е. есть основание полагать, что распределение единиц генеральной совокупности близко к нормальному распределению. Коэффициент эксцесса вычисляется только для симметричных или близких к ним распределений. В нашем случае для обоих признаков он <0, следовательно вершина кривой эмпирического распределения лежит несколько ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от Xmax до Xmin. Экономическое содержание задач статистического исследования 1. Типичны ли образующие выборку предприятия по значениям изучаемых экономических показателей? В результате визуального анализа диаграмму рассеяния значений показателей, были выделены 2 предприятия с резко выделяющимися характеристиками (см. табл.2): №31 с максимальной стоимостью основных производственных фондов (3030 млн. руб.) и минимальным выпуском продукции (800 млн. руб.) и №12 - с минимальной стоимостью основных производственных фондов (950 млн. руб.) и достаточно высоким выпуском продукции (2400 млн. руб.). Остальные, образующие выборку предприятия, типичны по значениям изучаемых экономических показателей. 2. Типичный уровень для предприятий среднегодовой стоимости основных фондов – 2230млн. руб., а типичный уровень выпуска продукции – 2086,933333 млн.руб. Наиболее характерные для предприятий значения показателей представлены в таблице: Границы диапазонов Количество значений xi, находящихся в каждой зане 1 признак 2 признак 1 признак 2 признак ( ) 1849,50 2610,50 1633,04 2540,83 20 19 В 1 признак входят 20 предприятий (№№2,3,4,6,7,9,10,13, 14,17,18,19,20,22,24,25,26,28,29,30), во 2 признаке 19 предприятий (№№1,2,3,4,6,8,9,13,14,17,18,20,24,25,26,28,29,30,32) 3. Насколько сильны различия в экономических характеристиках предприятий выборочной совокупности? Можно ли утверждать, что выборка сформирована из предприятий с достаточно близкими значениями по каждому из показателей? Предприятия достаточно однородны по обоим изучаемым экономическим характеристикам, т.к. коэффициент вариации не превышает 33%. При этом по первому признаку выборка сформирована из предприятий с более близкими значениями (Vσ=17,06%), чем по выпуску продукции (Vσ=21,75%). Максимальное расхождение в значениях показателей: • по первому признаку – 1600 млн.руб. • по второму признаку – 1920 млн.руб. 4. Какова структура предприятий выборочной совокупности по среднегодовой стоимости основных фондов? Каков удельный вес предприятий с наибольшими, наименьшими и типичными значениями данного показатели? Какие именно это предприятия? Структура предприятий выборочной совокупности по среднегодовой стоимости основных фондов представлена в таблицы 7. Удельный вес предприятий с типичными значениями рассматриваемого показателя – 36,7%. Модальный интервал – 2070-2390 млн.руб. В него вошли 11 предприятий (№№3,4,6,7,9,13,14,17,25,26,28). В группу с наименьшей стоимостью основных фондов 1430-1750 млн.руб. входят 4 предприятия (13,3%) (№№1,5,23,27). В группу с наибольшей стоимостью основных фондов 2710-3030 млн.руб. входят 3 предприятия (10%) (№№11,16,21). На основе анализа можно сделать вывод о том, что большинство предприятий сосредоточены в модальном интервале, то есть в интервале с наиболее типичными значениями изучаемого показателя. 5. Носит ли распределение предприятий по группам закономерный характер и какие предприятия (с более высокой или более низкой стоимостью основных фондов) преобладают в совокупности? Гистограмма ряда распределения по среднегодовой стоимости основных фондов представлена на рисунке 1. По гистограмме визуально можно установить, что распределение предприятий по группам носит закономерный характер. Судя по величине показателя асимметрии = -0,21025237, имеет место незначительная левосторонняя асимметрия ( <0 и по абсолютной величине не превышает 0,25). Это означает, что в совокупности чаще встречаются предприятия с более низкой стоимостью основных фондов. Действительно, в 1-ой группе на одно предприятие больше, чем в 5-ой. 6. Каковы ожидаемые средние величины среднегодовой стоимости основных фондов и выпуска продукции на предприятиях корпорации в целом? Какое максимальное расхождение в значениях показателя можно ожидать? Доверительная вероятность Ожидаемые границы для генеральных средних По столбцу "Среднегодовая стоимость основных производственных фондов, млн.руб." По столбцу "Выпуск продукции, млн.руб" 0,683 2158,06 2301,94 2001,11 2172,75 0,954 2082,70 2377,30 1911,21 2262,66 0,997 2001,12 2458,88 1813,89 2359,97 Максимальное расхождение в значениях первого показателя можно ожидать в размере 2321,9986632 млн.руб., второго – 2769,945021 млн.руб.


Скачиваний: 3
Просмотров: 12
Скачать реферат Заказать реферат