Вариант 01 (1) (МУ-2012г) |
450,00 ₽
Просмотров: 612
|
Тип работы: | Контрольная |
Название предмета: | Статистическая обработка данных |
Тема/вариант: | Вариант 01 (1) (МУ-2012г) |
Объем работы: | 13 |
ВУЗ: | СибАГС |
Дата выполнения: | 2014-10-22 |
Размер файла, тип файла: | 471.5 Kb, DOC |
Прикрепленные файлы: |
Контрольное задание для студентов и слушателей заочной формы обучения (197 Kb)
Год издания: 2012г |
Вариант 1
В таблице приведены сведения о заработной плате служащих одной фирмы
Заработная плата, руб. |
Число служащих |
Заработная плата, руб. |
Число служащих |
Менее 600 |
1 |
1600- 1800 |
14 |
600 - 800 |
3 |
1800-2000 |
12 |
800- 1000 |
6 |
2000 - 2200 |
10 |
1000- 1200 |
11 |
2200 - 2400 |
6 |
1200-1400 |
15 |
2400 и выше |
2 |
1400-1600 |
20 |
|
|
1. Построить по этим данным гистограмму.
2. Найти эмпирическую функцию распределения и построить ее график.
3. Вычислить среднее арифметическое выборки, выборочную дисперсию, выборочное среднее квадратичное отклонение, коэффициент вариации, размах вариации, начальные и центральные моменты до третьего порядка включительно, величину асимметрии и эксцесс, ошибки асимметрии и эксцесса.
4. Используя критерий - Пирсона по данным таблицы при уровне значимости =0,05, проверить гипотезу о том, что случайная величина X распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
5. Для исследования зависимости объема производства (Y) от основных фондов (X) получены статистические данные по 52 предприятиям за год
|
|
||||||||
12,5 |
17,5 |
22,5 |
27,5 |
32,5 |
37,5 |
42,5 |
47,5 |
52,5 |
|
200-210 |
1 |
|
|
|
|
|
|
|
|
210-220 |
|
2 |
|
|
|
|
|
|
|
220-230 |
|
1 |
2 |
|
|
|
|
|
|
230-+240 |
|
|
3 |
3 |
1 |
|
|
|
|
240-250 |
|
|
|
8 |
9 |
|
|
|
|
250-260 |
|
|
|
1 |
7 |
5 |
|
|
|
260-270 |
|
|
|
|
|
2 |
|
|
|
270-280 |
|
|
|
|
|
1 |
3 |
|
|
280-290 |
|
|
|
|
|
|
|
2 |
|
290-300 |
|
|
|
|
|
|
|
|
1 |
а) Вычислить групповые средние и , построить корреляционные поля;
б) предполагая, что между х и у существует линейная корреляционная зависимость
· найти уравнения прямых регрессии и построить их графики на корреляционных полях;
· вычислить коэффициенты корреляции и детерминации, сделать выводы о тесноте и направлении связи;
· вычислить среднюю абсолютную процентную ошибку; для коэффициента корреляции генеральной совокупности; определить доверительный интервал, соответствующий доверительной вероятности = 0,05.
Решение:
1. Построим гистограмму распределения
2. Построим функцию распределения, заменив интервалы их средними значениями:
Построим график функции распределения
3. Найдем показатели распределения. Для этого заменим интервалы их центрами. При этом величины первого и последнего открытых интервалов примем равными величинам второго и предпоследнего интервалов соответственно (для обоих интервалов 200). Промежуточные расчеты выполним в таблице:
Заработная плата, руб. |
Число служащих
|
|
|
|
Менее 600 |
1 |
500 |
500 |
1123600 |
600 - 800 |
3 |
700 |
2100 |
2218800 |
800- 1000 |
6 |
900 |
5400 |
2613600 |
1000- 1200 |
11 |
1100 |
12100 |
2327600 |
1200-1400 |
15 |
1300 |
19500 |
1014000 |
1400-1600 |
20 |
1500 |
30000 |
72000 |
1600- 1800 |
14 |
1700 |
23800 |
274400 |
1800-2000 |
12 |
1900 |
22800 |
1387200 |
2000 - 2200 |
10 |
2100 |
21000 |
2916000 |
2200 - 2400 |
6 |
2300 |
13800 |
3285600 |
2400 и выше |
2 |
2500 |
5000 |
1767200 |
Итого |
100 |
|
156000 |
19000000 |
Рассчитаем:
а) выборочное среднее:
руб.
б) дисперсию
в) среднее квадратичное отклонение
г) коэффициент вариации
д) размах вариации
R=xmax-xmin=2500-500=2000 руб.
Для вычисления начальных моментов воспользуемся формулой:
Промежуточные расчеты выполним в таблице:
xi |
ni |
|
|
|
500 |
1 |
500 |
250000 |
1,25E+08 |
700 |
3 |
2100 |
1470000 |
1,03E+09 |
900 |
6 |
5400 |
4860000 |
4,37E+09 |
1100 |
11 |
12100 |
1,3E+07 |
1,46E+10 |
1300 |
15 |
19500 |
2,5E+07 |
3,3E+10 |
1500 |
20 |
30000 |
4,5E+07 |
6,75E+10 |
1700 |
14 |
23800 |
4E+07 |
6,88E+10 |
1900 |
12 |
22800 |
4,3E+07 |
8,23E+10 |
2100 |
10 |
21000 |
4,4E+07 |
9,26E+10 |
2300 |
6 |
13800 |
3,2E+07 |
7,3E+10 |
2500 |
2 |
5000 |
1,3E+07 |
3,13E+10 |
Итого |
100 |
156000 |
2,6E+08 |
4,69E+11 |
Тогда
=156000/100=1560
=2,6×108/100=2,6×106
=4,69×1011/100=4,69×109
Для вычисления центральных моментов воспользуемся формулой:
Т.к. нужно вычислить эксцесс, то центральные моменты рассчитаем до 4-го порядка включительно. Промежуточные расчеты выполним в таблице:
xi |
ni |
|
|
|
|
500 |
1 |
-1060 |
1123600 |
-1,2E+09 |
1,262E+12 |
700 |
3 |
-2580 |
2218800 |
-1,9E+09 |
1,641E+12 |
900 |
6 |
-3960 |
2613600 |
-1,7E+09 |
1,138E+12 |
1100 |
11 |
-5060 |
2327600 |
-1,1E+09 |
4,925E+11 |
1300 |
15 |
-3900 |
1014000 |
-2,6E+08 |
6,855E+10 |
1500 |
20 |
-1200 |
72000 |
-4320000 |
259200000 |
1700 |
14 |
1960 |
274400 |
38416000 |
5,378E+09 |
1900 |
12 |
4080 |
1387200 |
4,72E+08 |
1,604E+11 |
2100 |
10 |
5400 |
2916000 |
1,57E+09 |
8,503E+11 |
2300 |
6 |
4440 |
3285600 |
2,43E+09 |
1,799E+12 |
2500 |
2 |
1880 |
1767200 |
1,66E+09 |
1,561E+12 |
Итого |
100 |
0 |
1,9E+07 |
14400000 |
8,98E+12 |
Тогда
=0
=1,9×107/100=190000
=14400000/100=144000
=8,98×1010/100=8,98×1010
Рассчитаем коэффициенты асимметрии и эксцесса по формулам:
,
Стандартные ошибки асимметрии и эксцесса составят
4. Проверим гипотезу о соответствии выборочных данных нормальному распределению с помощью критерия c2. Определим границы интервалов по формуле , для чего составим таблицу:
i |
Границы интервалов |
Границы интервалов |
||
ci |
ci+1 |
zi |
zi+1 |
|
1 |
400 |
600 |
-¥ |
-2,202 |
2 |
600 |
800 |
-2,202 |
-1,744 |
3 |
800 |
1000 |
-1,744 |
-1,285 |
4 |
1000 |
1200 |
-1,285 |
-0,826 |
5 |
1200 |
1400 |
-0,826 |
-0,367 |
6 |
1400 |
1600 |
-0,367 |
0,092 |
7 |
1600 |
1800 |
0,092 |
0,551 |
8 |
1800 |
2000 |
0,551 |
1,009 |
9 |
2000 |
2200 |
1,009 |
1,468 |
10 |
2200 |
2400 |
1,468 |
1,927 |
11 |
2400 |
2600 |
1,927 |
+¥ |
Найдем теоретические вероятности pi и теоретические частоты . Результаты расчетов запишем в таблицу
i |
Границы интервалов |
Ф(zi) |
Ф(zi+1) |
pi=Ф(zi+1)- Ф(zi) |
|
|
zi |
zi+1 |
|||||
1 |
-¥ |
-2,202 |
-0,500 |
-0,486 |
0,014 |
1,4 |
2 |
-2,202 |
-1,744 |
-0,486 |
-0,459 |
0,027 |
2,7 |
3 |
-1,744 |
-1,285 |
-0,459 |
-0,401 |
0,059 |
5,9 |
4 |
-1,285 |
-0,826 |
-0,401 |
-0,296 |
0,105 |
10,5 |
5 |
-0,826 |
-0,367 |
-0,296 |
-0,143 |
0,152 |
15,2 |
6 |
-0,367 |
0,092 |
-0,143 |
0,037 |
0,180 |
18,0 |
7 |
0,092 |
0,551 |
0,037 |
0,209 |
0,172 |
17,2 |
8 |
0,551 |
1,009 |
0,209 |
0,344 |
0,135 |
13,5 |
9 |
1,009 |
1,468 |
0,344 |
0,429 |
0,085 |
8,5 |
10 |
1,468 |
1,927 |
0,429 |
0,473 |
0,044 |
4,4 |
11 |
1,927 |
+¥ |
0,473 |
0,5 |
0,027 |
2,7 |
Вычислим наблюдаемое значение критерия Пирсона . Для этого составим таблицу, предварительно объединив малочисленные частоты в одну группу:
i |
ni |
|
|
|
|
1 |
4 |
4,06 |
-0,06 |
0,00 |
0,00 |
2 |
6 |
5,88 |
0,12 |
0,01 |
0,00 |
3 |
11 |
10,50 |
0,50 |
0,25 |
0,02 |
4 |
15 |
15,24 |
-0,24 |
0,06 |
0,00 |
5 |
20 |
17,98 |
2,02 |
4,09 |
0,23 |
6 |
14 |
17,25 |
-3,25 |
10,55 |
0,61 |
7 |
12 |
13,46 |
-1,46 |
2,12 |
0,16 |
8 |
10 |
8,54 |
1,46 |
2,14 |
0,25 |
9 |
8 |
7,10 |
0,90 |
0,81 |
0,11 |
|
|
|
|
Итого |
1,39 |
=1,39
По уровню значимости =0,05 и количеству степеней свободы k=n-3=9-3=6 находим по таблице критических точек: =12,59.
Т.к. <, то по критерию не оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности.
Построим на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
5. Для расчета заменим интервалы объема производства их средними значениями.
Рассчитываем групповые средние
а)
x=12,5:
x=17,5:
Аналогично находим остальные групповые средние. Результаты расчетов записываем в таблицу:
x |
|
12,5 |
205,00 |
17,5 |
218,33 |
22,5 |
231,00 |
27,5 |
243,33 |
32,5 |
248,53 |
37,5 |
260,00 |
42,5 |
275,00 |
47,5 |
285,00 |
52,5 |
295,00 |
Построим корреляционное поле
б)
y=205:
y=215:
y=225:
Аналогично находим остальные групповые средние. Результаты расчетов записываем в таблицу:
y |
|
205 |
12,50 |
215 |
17,50 |
225 |
20,83 |
235 |
26,07 |
245 |
30,15 |
255 |
34,04 |
265 |
37,50 |
275 |
41,25 |
285 |
47,50 |
295 |
52,50 |
Построим корреляционное поле
Для проведения расчетов заполним две вспомогательные таблицы
x |
nx |
x×nx |
x2×nx |
|
|
12,5 |
1 |
12,5 |
156,25 |
205,00 |
2562,5 |
17,5 |
3 |
52,5 |
918,75 |
218,33 |
11462,5 |
22,5 |
5 |
112,5 |
2531,25 |
231,00 |
25987,5 |
27,5 |
12 |
330 |
9075 |
243,33 |
80300 |
32,5 |
17 |
552,5 |
17956,25 |
248,53 |
137312,5 |
37,5 |
8 |
300 |
11250 |
260,00 |
78000 |
42,5 |
3 |
127,5 |
5418,75 |
275,00 |
35062,5 |
47,5 |
2 |
95 |
4512,5 |
285,00 |
27075 |
52,5 |
1 |
52,5 |
2756,25 |
295,00 |
15487,5 |
S |
52 |
1635 |
54575 |
|
413250 |
y |
ny |
y×ny |
y2×ny |
|
|
205 |
1 |
205 |
42025 |
12,50 |
2562,5 |
215 |
2 |
430 |
92450 |
17,50 |
7525 |
225 |
3 |
675 |
151875 |
20,83 |
14062,5 |
235 |
7 |
1645 |
386575 |
26,07 |
42887,5 |
245 |
17 |
4165 |
1020425 |
30,15 |
125562,5 |
255 |
13 |
3315 |
845325 |
34,04 |
112837,5 |
265 |
2 |
530 |
140450 |
37,50 |
19875 |
275 |
4 |
1100 |
302500 |
41,25 |
45375 |
285 |
2 |
570 |
162450 |
47,50 |
27075 |
295 |
1 |
295 |
87025 |
52,50 |
15487,5 |
S |
52 |
12930 |
3231100 |
|
413250 |
Найдем параметры, необходимые для расчета коэффициента корреляции и построения уравнений регрессии.
Тогда коэффициент корреляции будет равен
Значение r получилось больше нуля, поэтому связь прямая, т.е. с ростом основных фондов x растет объем производства y.
Значение >0,9, поэтому линейная связь очень высокая.
Составляем уравнения регрессии:
а) Y по X:
б) X по Y:
Построим уравнения регрессии на поле корреляции:
Рассчитаем коэффициент детерминации. В случае парной регрессии он равен квадрату коэффициента корреляции:
R2=r2=0,9422=0,8874,
т.е. регрессия объясняет 88,74% вариации переменных.
Построим доверительный интервал для коэффициента корреляции:
При уровне значимости a=0,05 находим, что ta=1,96.
=1,756-1,96×0,143=1,476; =0,9
=1,756+1,96×0,143=2,036; =0,966
Тогда доверительный интервал для коэффициента корреляции будет
Сообщить другу