Автор работы: Пользователь скрыл имя, 17 Января 2013 в 16:01, лабораторная работа
Цель работы : освоении метода линейных компонент.
В качестве примера рассмотрим объёмы производства (тыс. ед.) 5 видов деталей некоторой фабрикой за последние 20 лет. Проведём анализ полученных данных с помощью метода главных компонент.
Цель работы : освоении метода линейных компонент.
Ход работы
В качестве примера рассмотрим объёмы производства (тыс. ед.) 5 видов деталей некоторой фабрикой за последние 20 лет.
Таблица 1. Исходные данные
Вид №1 |
Вид №2 |
Вид №3 |
Вид №4 |
Вид №5 |
6207,678 |
7433,886 |
12900,73 |
12415,36 |
11342,42 |
5850,034 |
7280,61 |
13973,66 |
11853,34 |
12415,36 |
6284,316 |
8225,812 |
14969,96 |
12619,72 |
12159,9 |
5415,752 |
7893,714 |
12517,54 |
12134,35 |
13156,19 |
5952,218 |
8046,99 |
11878,89 |
12134,35 |
11623,43 |
6360,954 |
8251,358 |
11572,34 |
12440,9 |
11751,16 |
6974,058 |
7561,616 |
13794,84 |
12619,72 |
12057,71 |
6616,414 |
7868,168 |
12977,37 |
11955,53 |
13181,74 |
5160,292 |
7459,432 |
14229,12 |
12977,37 |
12696,36 |
5671,212 |
7970,352 |
13105,1 |
12210,99 |
11342,42 |
6667,506 |
7893,714 |
11827,8 |
12645,27 |
12977,37 |
6207,678 |
7561,616 |
14024,75 |
13897,02 |
11674,52 |
6590,868 |
7893,714 |
13283,92 |
13028,46 |
12543,09 |
6718,598 |
7995,898 |
14305,76 |
12313,17 |
14101,39 |
7536,07 |
6667,506 |
14842,23 |
12773 |
12773 |
5722,304 |
7127,334 |
12747,45 |
12210,99 |
12696,36 |
5543,482 |
7765,984 |
12083,26 |
11853,34 |
12006,62 |
7025,15 |
7484,978 |
12951,82 |
12134,35 |
12670,82 |
5645,666 |
8430,18 |
14382,4 |
12440,9 |
13794,84 |
6641,96 |
7919,26 |
11010,33 |
12568,63 |
12185,44 |
Проведём анализ полученных данных с помощью метода главных компонент.
Математические ожидания значений показателей
|
6239,611 |
7736,606 | |
Mx= |
13168,96 |
12461,34 | |
12457,51 |
Стандартные ошибки
600,0755 | |
408,9148 | |
Sх= |
1102,949 |
464,1197 | |
736,951 |
Матрица нормированных значений будет определяться по формуле
-1,35394 |
-18,904 |
-6,20768 |
-2,52905 |
-38,6511 | ||
-16,5794 |
-28,4838 |
18,64858 |
-33,4653 |
-1,45612 | ||
1,890404 |
30,55302 |
41,71662 |
8,711186 |
-10,3206 | ||
-35,0747 |
9,809664 |
-15,0977 |
-18,0099 |
24,21761 | ||
-12,2365 |
-19,3894 |
-29,8888 |
-18,0099 |
-28,9181 | ||
5,160292 |
32,16241 |
-36,9906 |
-1,12402 |
-24,4731 | ||
31,2683 |
-10,9337 |
14,48458 |
8,711186 |
-13,8459 | ||
16,04289 |
8,225812 |
-4,445 |
-27,8451 |
25,11172 | ||
-45,9573 |
-17,3202 |
24,54971 |
28,40715 |
8,276904 | ||
Z= |
-24,1921 |
14,61231 |
-1,48167 |
-13,7693 |
-38,6511 | |
18,2143 |
9,809664 |
-31,0639 |
10,11622 |
18,00993 | ||
-1,35394 |
-10,9337 |
19,8237 |
79,01378 |
-27,1299 | ||
14,94441 |
9,809664 |
2,656784 |
31,21721 |
2,963336 | ||
20,38571 |
16,19616 |
26,33793 |
-8,14917 |
56,99313 | ||
55,17936 |
-66,7772 |
38,75328 |
17,16691 |
10,93369 | ||
-22,0207 |
-38,0635 |
-9,75857 |
-13,7693 |
8,276904 | ||
-29,6334 |
1,839312 |
-25,1373 |
-33,4653 |
-15,6342 | ||
33,43971 |
-15,7108 |
-5,03256 |
-18,0099 |
7,382794 | ||
-25,2905 |
43,32602 |
28,1006 |
-1,12402 |
46,36599 | ||
17,11582 |
11,41906 |
-49,9935 |
5,901126 |
-9,42647 |
Матрица парных коэффициентов корреляции R
25,546 |
-6,43759 |
2,196956 |
4,751556 |
2,605692 | |
-6,43759 |
25,546 |
-6,46314 |
-2,50351 |
2,222502 | |
R= |
2,196956 |
-6,46314 |
25,546 |
8,021444 |
7,868168 |
4,751556 |
-2,50351 |
8,021444 |
25,546 |
3,653078 | |
2,605692 |
2,222502 |
7,868168 |
-3,65308 |
25,546 |
Матрица собственных чисел R
|
9,911848 |
0 |
0 |
0 |
0 |
0 |
41,28234 |
0 |
0 |
0 | |
Λ= |
0 |
0 |
24,70298 |
0 |
0 |
0 |
0 |
0 |
21,30536 |
0 | |
0 |
0 |
0 |
0 |
30,52747 |
Матрица факторных нагрузок (весовых коэффициентов) ,
где V – матрица собственных векторов R.
4,496096 |
14,33131 |
-14,4079 |
14,40794 |
-3,44871 | |
5,696758 |
-15,1232 |
10,78041 |
14,56122 |
7,91926 | |
A= |
9,349836 |
18,92959 |
8,915554 |
-6,82078 |
8,992192 |
-7,10179 |
14,94441 |
14,76559 |
8,225812 |
-9,65639 | |
-7,91926 |
6,233224 |
-3,14216 |
3,269888 |
23,04249 |
|
15,3276 |
-3,14216 |
-6,28432 |
-18,9807 |
-34,9469 |
18,77631 |
0,89411 |
-15,8641 |
-49,7892 |
9,477566 | |
59,80319 |
10,19285 |
33,79736 |
10,62714 |
9,477566 | |
-30,9873 |
-25,546 |
5,441298 |
-15,4042 |
26,05692 | |
13,3861 |
-35,9432 |
-2,24805 |
3,19325 |
-18,4953 | |
6,309862 |
-31,0384 |
0,133248 |
33,13316 |
-21,2543 | |
26,41456 |
22,55712 |
-10,7804 |
10,26949 |
-15,3276 | |
7,714892 |
-5,74785 |
-27,2065 |
10,98478 |
26,77221 | |
-34,6148 |
13,18174 |
44,01576 |
-38,5234 |
5,185838 | |
F= |
36,73515 |
-22,7359 |
16,63045 |
-17,1158 |
-18,6997 |
-37,0162 |
-5,13475 |
-13,7693 |
35,63667 |
1,737128 | |
-23,0936 |
37,09279 |
53,87651 |
11,59788 |
-42,3553 | |
-9,75857 |
14,56122 |
14,81668 |
28,45824 |
-6,00331 | |
3,755262 |
18,87849 |
-7,48498 |
21,99511 |
55,256 | |
2,196956 |
69,25521 |
-38,4723 |
-12,492 |
-9,37538 | |
-37,8592 |
1,91595 |
-16,5794 |
-41,8443 |
0,332098 | |
3,06552 |
-36,9651 |
-8,99219 |
-26,0314 |
-4,7771 | |
8,379088 |
9,681934 |
-39,8773 |
7,638254 |
1,91595 | |
3,729716 |
-5,16029 |
37,19498 |
10,19285 |
57,73396 | |
-29,5056 |
-20,4368 |
-18,2909 |
36,22423 |
-22,6848 |
Главные компоненты.Т.е. нормированные значения исходных признаков можно выразить через главные компоненты как
T |
T |
|
||||||
z1 |
f1 |
4,496096 |
5,696758 |
9,349836 |
-7,10179 |
-7,91926 | ||
z2 |
f2 |
1,430576 |
-15,1232 |
18,92959 |
14,94441 |
6,233224 | ||
z3 |
= |
f3 |
= |
-14,4079 |
10,78041 |
8,915554 |
14,76559 |
-3,14216 |
z4 |
f6 |
14,40794 |
14,56122 |
-6,82078 |
8,225812 |
3,269888 | ||
z5 |
f5 |
-3,44871 |
7,91926 |
8,992192 |
-9,65639 |
23,04249 |
откуда
|
T |
|||||||
f1 |
z1 |
|
11,59788 |
8,864462 |
-14,8933 |
17,2691 |
-2,8867 | |
f2 |
z2 |
14,68895 |
-9,34984 |
11,13806 |
17,47346 |
6,64196 | ||
f3 |
= |
z3 |
= |
24,08988 |
11,72561 |
9,19656 |
-8,17472 |
6,616414 |
f6 |
z4 |
-18,2909 |
9,247652 |
15,27651 |
9,860756 |
-8,09808 | ||
f5 |
z5 |
-20,4113 |
3,857446 |
-3,26989 |
3,908538 |
19,28723 |
Из матрицы собственных
чисел видно, что наибольший вклад
в дисперсию исходных признаков
вносят 2-я, 5-я, и 3-я компоненты (их
суммарный вклад составляет 75.6%).
Поэтому дальнейший анализ можно
проводить, используя только эти 3 параметра.
Остальные компоненты, вносящие наименьший
вклад в дисперсию будем
T |
|
|||||
|
z1 |
8,864462 |
-14,8933 |
-2,8867 | ||
f2 |
z2 |
-9,34984 |
11,13806 |
6,64196 | ||
f3 |
= |
z3 |
= |
11,72561 |
9,19656 |
7,53607 |
f5 |
z4 |
9,247652 |
15,27651 |
-8,09808 | ||
z5 |
3,857446 |
-3,26989 |
19,28723 |
Полученные значения главных компонент не имеют экономического смысла, но геометрически их можно трактовать как координаты 20 точек в пространстве R5 в системе координат, полученной поворотом на некоторый угол относительно другой системы, в которой по нормированным значениям и были построены эти точки.
Так как главные компоненты не коррелированы друг с другом, то их значения можно использовать в регрессионном анализе. Допустим, мы хотим исследовать зависимость некоторого признака Y (например, прибыли предприятия) от объёмов производства тортов. Поскольку объёмы производства каждого вида взаимосвязаны, то регрессионный анализ, проведённый по исходным данным, может привести к неадекватным результатам. Поэтому, лучше построить модель признака Y по главным компонентам (не обязательно по всем, в нашем случае можно взять только компоненты 1, 3, 4 и 5). Полученное соотношение Y=F(f) можно преобразовать в соотношение Y=F1(z), а затем в Y=F2(x). Полученная таким способом модель будет более точно описывать зависимость признаков, поскольку при её построении будут использованы некоррелированные друг с другом данные.
В нашем случае в качестве параметра Y возьмём объём спроса на торты в данном регионе за последние 20 лет.
Таблица №2. Выпуск деталей за последние 20 лет в данном регионе
Объём выпуска (тыс. шт) |
3045,083 |
3068,075 |
3103,839 |
3070,629 |
3055,302 |
3065,52 |
3062,965 |
3080,848 |
3062,965 |
3065,52 |
3060,411 |
3052,747 |
3075,738 |
3116,612 |
3034,865 |
3024,646 |
3047,638 |
3052,747 |
3137,049 |
3039,974 |
Полученная модель примет вид
Y=3066,159- |
0,332098f2+ |
11,24024 f3+ |
19,951f5 |
Через переменные z модель запишется как
Y=3066,159- |
8,915554z1+ |
10,2184z2+ |
9,7841z3+ |
27,6918z4+ |
13,56497z5 |