Метод линейных компонент

Автор работы: Пользователь скрыл имя, 17 Января 2013 в 16:01, лабораторная работа

Описание

Цель работы : освоении метода линейных компонент.
В качестве примера рассмотрим объёмы производства (тыс. ед.) 5 видов деталей некоторой фабрикой за последние 20 лет. Проведём анализ полученных данных с помощью метода главных компонент.

Работа состоит из  1 файл

Цель работы.docx

— 68.03 Кб (Скачать документ)

Цель работы : освоении метода линейных компонент.

Ход работы

В качестве примера рассмотрим объёмы производства (тыс. ед.) 5 видов деталей  некоторой фабрикой за последние 20 лет.

Таблица 1. Исходные данные

Вид №1

Вид №2

Вид №3

Вид №4

Вид №5

6207,678

7433,886

12900,73

12415,36

11342,42

5850,034

7280,61

13973,66

11853,34

12415,36

6284,316

8225,812

14969,96

12619,72

12159,9

5415,752

7893,714

12517,54

12134,35

13156,19

5952,218

8046,99

11878,89

12134,35

11623,43

6360,954

8251,358

11572,34

12440,9

11751,16

6974,058

7561,616

13794,84

12619,72

12057,71

6616,414

7868,168

12977,37

11955,53

13181,74

5160,292

7459,432

14229,12

12977,37

12696,36

5671,212

7970,352

13105,1

12210,99

11342,42

6667,506

7893,714

11827,8

12645,27

12977,37

6207,678

7561,616

14024,75

13897,02

11674,52

6590,868

7893,714

13283,92

13028,46

12543,09

6718,598

7995,898

14305,76

12313,17

14101,39

7536,07

6667,506

14842,23

12773

12773

5722,304

7127,334

12747,45

12210,99

12696,36

5543,482

7765,984

12083,26

11853,34

12006,62

7025,15

7484,978

12951,82

12134,35

12670,82

5645,666

8430,18

14382,4

12440,9

13794,84

6641,96

7919,26

11010,33

12568,63

12185,44


 

Проведём анализ полученных данных с помощью метода главных  компонент.

Математические  ожидания значений показателей

6239,611

 

7736,606

Mx=

13168,96

 

12461,34

 

12457,51


Стандартные ошибки


 

600,0755

 

408,9148

Sх=

1102,949

 

464,1197

 

736,951


Матрица нормированных значений будет определяться по формуле


   

-1,35394

-18,904

-6,20768

-2,52905

-38,6511

   

-16,5794

-28,4838

18,64858

-33,4653

-1,45612

   

1,890404

30,55302

41,71662

8,711186

-10,3206

   

-35,0747

9,809664

-15,0977

-18,0099

24,21761

   

-12,2365

-19,3894

-29,8888

-18,0099

-28,9181

   

5,160292

32,16241

-36,9906

-1,12402

-24,4731

   

31,2683

-10,9337

14,48458

8,711186

-13,8459

   

16,04289

8,225812

-4,445

-27,8451

25,11172

   

-45,9573

-17,3202

24,54971

28,40715

8,276904

Z=

 

-24,1921

14,61231

-1,48167

-13,7693

-38,6511

   

18,2143

9,809664

-31,0639

10,11622

18,00993

   

-1,35394

-10,9337

19,8237

79,01378

-27,1299

   

14,94441

9,809664

2,656784

31,21721

2,963336

   

20,38571

16,19616

26,33793

-8,14917

56,99313

   

55,17936

-66,7772

38,75328

17,16691

10,93369

   

-22,0207

-38,0635

-9,75857

-13,7693

8,276904

   

-29,6334

1,839312

-25,1373

-33,4653

-15,6342

   

33,43971

-15,7108

-5,03256

-18,0099

7,382794

   

-25,2905

43,32602

28,1006

-1,12402

46,36599

   

17,11582

11,41906

-49,9935

5,901126

-9,42647


 

Матрица парных коэффициентов корреляции R


 

25,546

-6,43759

2,196956

4,751556

2,605692

 

-6,43759

25,546

-6,46314

-2,50351

2,222502

R=

2,196956

-6,46314

25,546

8,021444

7,868168

 

4,751556

-2,50351

8,021444

25,546

3,653078

 

2,605692

2,222502

7,868168

-3,65308

25,546


 

 

Матрица собственных чисел  R

 

9,911848

              0

0

0

0

 

0

41,28234

0

0

0

Λ=

0

0

24,70298

0

0

 

0

0

0

21,30536

0

 

0

0

0

0

30,52747


Матрица факторных  нагрузок (весовых коэффициентов) ,

где V – матрица собственных векторов R.

 


 

4,496096

14,33131

-14,4079

14,40794

-3,44871

 

5,696758

-15,1232

10,78041

14,56122

7,91926

A=

9,349836

18,92959

8,915554

-6,82078

8,992192

 

-7,10179

14,94441

14,76559

8,225812

-9,65639

 

-7,91926

6,233224

-3,14216

3,269888

23,04249


 

15,3276

-3,14216

-6,28432

-18,9807

-34,9469

 

18,77631

0,89411

-15,8641

-49,7892

9,477566

 

59,80319

10,19285

33,79736

10,62714

9,477566

 

-30,9873

-25,546

5,441298

-15,4042

26,05692

 

13,3861

-35,9432

-2,24805

3,19325

-18,4953

 

6,309862

-31,0384

0,133248

33,13316

-21,2543

 

26,41456

22,55712

-10,7804

10,26949

-15,3276

 

7,714892

-5,74785

-27,2065

10,98478

26,77221

 

-34,6148

13,18174

44,01576

-38,5234

5,185838

F=

36,73515

-22,7359

16,63045

-17,1158

-18,6997

 

-37,0162

-5,13475

-13,7693

35,63667

1,737128

 

-23,0936

37,09279

53,87651

11,59788

-42,3553

 

-9,75857

14,56122

14,81668

28,45824

-6,00331

 

3,755262

18,87849

-7,48498

21,99511

55,256

 

2,196956

69,25521

-38,4723

-12,492

-9,37538

 

-37,8592

1,91595

-16,5794

-41,8443

0,332098

 

3,06552

-36,9651

-8,99219

-26,0314

-4,7771

 

8,379088

9,681934

-39,8773

7,638254

1,91595

 

3,729716

-5,16029

37,19498

10,19285

57,73396

 

-29,5056

-20,4368

-18,2909

36,22423

-22,6848


 

Главные компоненты.Т.е. нормированные значения исходных признаков можно выразить через главные компоненты  как

T

T

 

       

z1

 

f1

 

4,496096

5,696758

9,349836

-7,10179

-7,91926

z2

 

f2

 

1,430576

-15,1232

18,92959

14,94441

6,233224

z3

=

f3

=

-14,4079

10,78041

8,915554

14,76559

-3,14216

z4

 

f6

 

14,40794

14,56122

-6,82078

8,225812

3,269888

z5

 

f5

 

-3,44871

7,91926

8,992192

-9,65639

23,04249


 

 

откуда

T

T

           

f1

 

z1

11,59788

8,864462

-14,8933

17,2691

-2,8867

f2

 

z2

 

14,68895

-9,34984

11,13806

17,47346

6,64196

f3

=

z3

=

24,08988

11,72561

9,19656

-8,17472

6,616414

f6

 

z4

 

-18,2909

9,247652

15,27651

9,860756

-8,09808

f5

 

z5

 

-20,4113

3,857446

-3,26989

3,908538

19,28723


 

Из матрицы собственных  чисел видно, что наибольший вклад  в дисперсию исходных признаков  вносят 2-я, 5-я,  и 3-я компоненты (их суммарный вклад  составляет 75.6%). Поэтому дальнейший анализ можно  проводить, используя только эти 3 параметра. Остальные компоненты, вносящие наименьший вклад в дисперсию будем считать  равными нулю. Т. е. мы предполагаем, что

 

   

T

     

T

z1

 

8,864462

-14,8933

-2,8867

f2

 

z2

 

-9,34984

11,13806

6,64196

f3

=

z3

=

11,72561

9,19656

7,53607

f5

 

z4

 

9,247652

15,27651

-8,09808

   

z5

 

3,857446

-3,26989

19,28723


 

 

Полученные значения главных  компонент не имеют экономического смысла, но геометрически их можно  трактовать как координаты 20 точек  в пространстве R5 в системе координат, полученной поворотом на некоторый угол относительно другой  системы,  в которой по нормированным значениям и были построены эти точки.

Так как главные компоненты не коррелированы друг с другом, то их значения можно использовать в регрессионном анализе. Допустим, мы хотим исследовать зависимость  некоторого признака Y (например, прибыли предприятия) от объёмов производства тортов. Поскольку объёмы производства каждого вида взаимосвязаны, то регрессионный анализ, проведённый по исходным данным, может привести к неадекватным результатам. Поэтому, лучше построить модель признака Y по главным компонентам (не обязательно по всем, в нашем случае можно взять только компоненты 1, 3, 4 и 5). Полученное соотношение Y=F(f) можно преобразовать в соотношение Y=F1(z), а затем в Y=F2(x). Полученная таким способом модель будет более точно описывать зависимость признаков, поскольку при её построении будут использованы некоррелированные друг с другом данные.

В нашем случае в качестве параметра Y возьмём объём спроса на торты в данном регионе за последние 20 лет.

 

 

            Таблица №2. Выпуск деталей за  последние 20 лет в данном регионе

Объём выпуска (тыс. шт)

3045,083

3068,075

3103,839

3070,629

3055,302

3065,52

3062,965

3080,848

3062,965

3065,52

3060,411

3052,747

3075,738

3116,612

3034,865

3024,646

3047,638

3052,747

3137,049

3039,974


 

Полученная модель примет вид

Y=3066,159-

0,332098f2+

11,24024 f3+

19,951f5


Через переменные z модель запишется как

Y=3066,159-

8,915554z1+

10,2184z2+

9,7841z3+

27,6918z4+

13,56497z5

           

Информация о работе Метод линейных компонент