Системный анализ

Автор работы: Пользователь скрыл имя, 18 Февраля 2013 в 13:02, курсовая работа

Описание

Практическое выполнение курсовой работы предполагает решение типовых инженерных задач обработки данных с использованием методов матричной алгебры, решения систем линейных алгебраических уравнений численного интегрирования. Навыки, приобретаемые в процессе выполнения курсовой работы, являются основой для использования вычислительных методов прикладной математики и техники программирования в процессе изучения всех последующих дисциплин при выполнении курсовых и дипломных проектов.

Содержание

Введение 3
1. Теоретическая часть 5
1.1. Общие сведения о методе скользящей средней. 5
1.2. Общие сведения о корреляционном анализе и коэффициенте линейной парной корреляции. 7
1.3. Общие сведения о регрессионном анализе и методе наименьших квадратов. 10
2. Практическая часть 17
2.1. Построение графиков изменения значений показателей по данным варианта. 17
2.2. Обработка динамических рядов методом скользящей средней и построение графиков. 18
2.3. Расчет значения коэффициента линейной парной корреляции по заданным значениям рядов. 20
2.4. Аппроксимация рядов методом наименьших квадратов с применением степенной, линейной, параболической, кубической, логарифмической, показательной и экспоненциальной моделей. 23
2.4.1. Степенная модель. 27
2.4.2. Линейная модель. 29
2.4.3. Параболическая модель. 31
2.4.4. Кубическая модель. 33
2.4.5. Гипербалическая модель. 35
2.4.6. Логарифмическая модель. 37
2.4.7. Показательная модель. 39
2.4.8. Экспоненциальная модель. 41
2.5. Оценка полученных моделей аппроксимации и выбор наилучшей модели. 43
Заключение 46
Список используемой литературы……………………………………………………...47

Работа состоит из  1 файл

курсовая по системному анализу(редактируемое).docx

— 304.59 Кб (Скачать документ)

Метод наименьших квадратов является одним из наиболее распространенных и наиболее разработанных вследствие своей простоты и эффективности методов оценки параметров линейных эконометрических моделей. Вместе с тем, при его применении следует соблюдать определенную осторожность, поскольку построенные с его использованием модели могут не удовлетворять целому ряду требований к качеству их параметров и, вследствие этого, недостаточно “хорошо” отображать закономерности развития процесса .

Рассмотрим процедуру оценки параметров линейной эконометрической модели с  помощью метода наименьших квадратов  более подробно. Такая модель в  общем виде может быть представлена уравнением (1.2):

yt = a0 + a1 х1t +...+ an хnt + εt .

Исходными данными при оценке параметров a0 , a1 ,..., an является вектор значений зависимой переменной y = (y1 , y2 , ... , yT )' и матрица значений независимых переменных

в которой первый столбец, состоящий  из единиц, соответствует коэффициенту модели .

Название свое метод наименьших квадратов получил, исходя из основного  принципа, которому должны удовлетворять  полученные на его основе оценки параметров: сумма квадратов ошибки модели должна быть минимальной.

Регрессионный анализ — это статистический метод исследования зависимости  случайной величины у от переменных (аргументов) хj (j = 1, 2,..., k), рассматриваемых в регрессионном анализе как неслучайные величины независимо от истинного закона распределения xj.

Обычно предполагается, что случайная  величина у имеет нормальный закон распределения с условным математическим ожиданием  = φ(x1, ..., хk), являющимся функцией от аргументов хj и с постоянной, не зависящей от аргументов дисперсией σ2.

Для проведения регрессионного анализа  из (k + 1)-мерной генеральной совокупности (у, x1, х2, ..., хj, ..., хk) берется выборка объемом n, и каждое i-е наблюдение (объект) характеризуется значениями переменных (уi, xi1, хi2, ..., хij, ..., xik), где хij — значение j-й переменной для i-го наблюдения (i = 1, 2,..., n), уi — значение результативного признака для i-го наблюдения.

Наиболее часто используемая множественная  линейная модель регрессионного анализа  имеет вид 

 

                     (6) 

 

где βj — параметры регрессионной модели;

εj — случайные ошибки наблюдения, не зависимые друг от друга, имеют нулевую среднюю и дисперсию σ2.

Отметим, что модель (6) справедлива для всех i = 1,2, ..., n, линейна относительно неизвестных параметров β0, β1,…, βj, …, βk и аргументов.

Как следует из (6), коэффициент регрессии Bj показывает, на какую величину в среднем изменится результативный признак у, если переменную хj увеличить на единицу измерения, т.е. является нормативным коэффициентом.

В матричной форме регрессионная  модель имеет вид

                    (7)

где Y — случайный вектор-столбец размерности п х 1 наблюдаемых значений результативного признака (у1, у2,.... уn); Х— матрица размерности п х (k + 1) наблюдаемых значений аргументов, элемент матрицы х,, рассматривается как неслучайная величина (i = 1, 2, ..., n; j=0,1, ..., k; x0i, = 1); β — вектор-столбец размерности (k + 1) х 1 неизвестных, подлежащих оценке параметров модели (коэффициентов регрессии); ε — случайный вектор-столбец размерности п х 1 ошибок наблюдений (остатков). Компоненты вектора εi не зависимы друг от друга, имеют нормальный закон распределения с нулевым математическим ожиданием (Mεi = 0) и неизвестной постоянной σ2 (Dεi = σ2).

На практике рекомендуется, чтобы  значение п превышало k не менее чем в три раза.

В модели (7) 

 

 

 

В первом столбце матрицы Х указываются единицы при наличии свободного члена в модели (6). Здесь предполагается, что существует переменная x0, которая во всех наблюдениях принимает значения, равные единице.

Основная задача регрессионного анализа  заключается в нахождении по выборке  объемом п оценки неизвестных коэффициентов регрессии β0, β1, …, βk модели (6) или вектора β в (7).

Так как в регрессионном анализе хj рассматриваются как неслучайные величины, a Mεi = 0, то согласно (6) уравнение регрессии имеет вид

                  (8)

для всех i = 1, 2, ..., п, или в матричной форме:

      

                             (9)

где — вектор-столбец с элементами  1..., i,..., n.

Для оценки вектора-столбца β наиболее часто используют метод наименьших квадратов, согласно которому в качестве оценки принимают вектор-столбец b, который минимизирует сумму квадратов отклонений наблюдаемых значений уi от модельных значений i, т.е. квадратичную форму:

где символом «Т» обозначена транспонированная  матрица.

Наблюдаемые и модельные значения результативного признака у показаны на рис. 1.

Рис. 1. Наблюдаемые и модельные значения результативного признака у

Дифференцируя, с учетом (9) и (8), квадратичную форму Q по β0, β1, …, βk и приравнивая частные производные к нулю, получим систему нормальных уравнений

решая которую получим вектор-столбец оценок b, где b = (b0, b1, ..., bk)T. Согласно методу наименьших квадратов, вектор-столбец оценок коэффициентов регрессии, получается по формуле

                     (11)

ХT — транспонированная матрица X;

TХ)-1 — матрица, обратная матрице ХTХ.

Зная вектор-столбец b оценок коэффициентов регрессии, найдем оценку  уравнения регрессии

                      (12)

или в  матричном виде:

Оценка ковариационной матрицы  вектора коэффициентов регрессии b определяется выражением   

                       (13)

где

                       (14)

Учитывая, что на главной диагонали  ковариационной матрицы находятся  дисперсии коэффициентов регрессии, имеем  

             (15)

Значимость уравнения регрессии, т.е. гипотеза Н0: β = 0 (β0,= β1 = βk = 0), проверяется по F-критерию, наблюдаемое значение которого определяется по формуле

                       (16)

По таблице F-распределения для заданных α, v 1 = k + l,v2 = n – k - l находят Fкр.

Гипотеза H0 отклоняется с вероятностью α, если Fнабл > Fкр. Из этого следует, что уравнение является значимым, т.е. хотя бы один из коэффициентов регрессии отличен от нуля.

Для проверки значимости отдельных  коэффициентов регрессии, т.е. гипотезы Н0: βj = 0, где j = 1, 2, ..., k, используют t-критерий и вычисляют tнабл(bj) = bj / bj. По таблице t-распределения для заданного α и v = п - k - 1 находят tкр.

Гипотеза H0 отвергается с вероятностью α, если tнабл > tкр. Из этого следует, что соответствующий коэффициент регрессии βj значим, т.е. βj ≠ 0. В противном случае коэффициент регрессии незначим и соответствующая переменная в модель не включается. Тогда реализуется алгоритм пошагового регрессионного анализа, состоящий в том, что исключается одна из незначительных переменных, которой соответствует минимальное по абсолютной величине значение tнабл. После этого вновь проводят регрессионный анализ с числом факторов, уменьшенным на единицу. Алгоритм заканчивается получением уравнения регрессии со значимыми коэффициентами.

Существуют и другие алгоритмы  пошагового регрессионного анализа, например с последовательным включением факторов.

Наряду с точечными оценками bj генеральных коэффициентов регрессии βj регрессионный анализ позволяет получать и интервальные оценки последних с доверительной вероятностью γ.

Интервальная оценка с доверительной  вероятностью γ для параметра  βj имеет вид

             (17)

где tα находят по таблице t-распределения при вероятности α = 1 - γ и числе степеней свободы v = п - k - 1.

Интервальная оценка для уравнения  регрессии   в точке, определяемой вектором-столбцом начальных условий X0 = (1, x , x ,,..., x )T записывается в виде

            (18)

Интервал предсказания n+1 с доверительной вероятностью у определяется как

                (19)

где tα определяется по таблице t-распределения при α = 1 - γ и числе степеней свободы v = п - k - 1.

По мере удаления вектора начальных  условий х0 от вектора средних  ширина доверительного интервала при заданном значении γ будет увеличиваться (рис. 2), где = (1, ).

Рис. 2. Точечная

 и интервальная
 оценки уравнения регрессии

2. Практическая часть

2.1. Построение графиков  изменения значений показателей  по данным варианта

 

Сформируем таблицу исходных данных 

 

Xi

Yi

0

20

28

1

21

21

2

22

41

3

23

27

4

24

35

5

24

46

6

25

56

7

27

52

8

27

59

9

27

63

10

32

72

11

32

76

12

32

88

13

33

87

14

34

82

15

34

100

16

35

95

17

36

108

18

39

106

19

39

113


Построим график по исходным данным

2.2. Обработка динамических  рядов методом скользящей средней и построение графиков

 

Рассчитаем сглаживание  в данной таблице по первому показателю

 

Xi

Расчет скользящих средних

Сглаженный показатель

0

21

21

21

1

23

(21+23+20):3

21,33333333

2

20

(23+20+24):3

22,33333333

3

24

(20+24+22):3

22

4

22

(24+22+24):3

23,33333333

5

24

(22+24+24):3

24,33333333

6

27

(24+27+25):3

25,33333333

7

25

(27+25+27):3

26,33333333

8

27

(25+27+27):3

26,33333333

9

27

(27+27+32):3

28,66666667

10

32

(27+32+32):3

30,33333333

11

32

(32+32+34):3

32,66666667

12

34

(32+34+33):3

33

13

33

(34+33+32):3

33

14

32

(33+32+35):3

33,33333333

15

35

(32+35+34):3

33,66666667

16

34

(35+34+39):3

36

17

39

(34+39+36):3

36,33333333

18

36

(39+36+39):3

38

19

39

39

39

Информация о работе Системный анализ