Автор работы: Пользователь скрыл имя, 29 Октября 2011 в 18:36, контрольная работа
По данным, взятым из соответствующей таблицы, выполнить следующие действия:
1. Построить поле корреляции и сформулировать гипотезу о форме связи.
2. Рассчитать параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.
3. Оценить тесноту связи с помощью показателей корреляции и детерминации.
4. Дать с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
5. Оценить с помощью средней ошибки аппроксимации качество уравнений.
6. Оценить с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выбрать лучшее уравнение регрессии и дать его обоснование.
7. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости б=0,05.
8. Оценить полученные результаты, выводы оформить в аналитической записке.
Оценим с помощью средней ошибки аппроксимации качество уравнений.
Оценим с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования.
Если то уравнение значимо
Fкр( ) = Fкр(0,05; 1; 10 ) = 4,75
Выводы: показатели детерминации почти для всех моделей являются значимыми. В линейной модели наибольшая зависимость между объясняющими и зависимой переменными, так как R2 ближе всех остальных к единице (99,23%).
Наибольшую силу связи фактора x с результатом y показывает коэффициент эластичности для обратной модели.
Наименьшая ошибка аппроксимации является ошибка для степенной модели, следовательно, уравнение гиперболической модели имеет наилучшее качество.
По данным, взятым из соответствующей таблицы, выполнить следующие действия:
Номер крупнейшей компании США | Чистый доход, млрд. долл. США, у | Оборот капитала, млрд. долл. США, х1 | Использованный капитал, млрд. долл. США., х2 |
1 | 6,6 | 6,9 | 83,6 |
2 | 3,0 | 18,0 | 6,5 |
3 | 6,5 | 107,9 | 50,4 |
4 | 3,3 | 16,7 | 15,4 |
5 | 0,1 | 79,6 | 29,6 |
6 | 3,6 | 16,2 | 13,3 |
7 | 1,5 | 5,9 | 5,9 |
8 | 5,5 | 53,1 | 27,1 |
9 | 2,4 | 18,8 | 11,2 |
10 | 3,0 | 35,3 | 16,4 |
11 | 4,2 | 71,9 | 32,5 |
12 | 2,7 | 93,6 | 25,4 |
13 | 1,6 | 10,0 | 6,4 |
14 | 2,4 | 31,5 | 12,5 |
15 | 3,3 | 36,7 | 14,3 |
Решение
Система трех линейных уравнений с тремя неизвестными b0, b1, b2:
∑yi = nb0 + b1∑x1i + b2∑x2i
∑x1iyi = b0∑x1i + b1∑x1i2 + b2∑x1ix2i
∑x2iyi
= b0∑x2i + b1∑x1ix2i
+ b2∑x2i2
Y | X1 | X2 | X12 | X22 | X1Y | X2Y | X1X2 | Y2 |
6,6 | 6,9 | 83,6 | 47,61 | 6988,96 | 45,54 | 551,76 | 576,84 | 43,56 |
3 | 18 | 6,5 | 324 | 42,25 | 54 | 19,5 | 117 | 9 |
6,5 | 107,9 | 50,4 | 11642,41 | 2540,16 | 701,35 | 327,6 | 5438,16 | 42,25 |
3,3 | 16,7 | 15,4 | 278,89 | 237,16 | 55,11 | 50,82 | 257,18 | 10,89 |
0,1 | 79,6 | 29,6 | 6336,16 | 876,16 | 7,96 | 2,96 | 2356,16 | 0,01 |
3,6 | 16,2 | 13,3 | 262,44 | 176,89 | 58,32 | 47,88 | 215,46 | 12,96 |
1,5 | 5,9 | 5,9 | 34,81 | 34,81 | 8,85 | 8,85 | 34,81 | 2,25 |
5,5 | 53,1 | 27,1 | 2819,61 | 734,41 | 292,05 | 149,05 | 1439,01 | 30,25 |
2,4 | 18,8 | 11,2 | 353,44 | 125,44 | 45,12 | 26,88 | 210,56 | 5,76 |
3 | 35,3 | 16,4 | 1246,09 | 268,96 | 105,9 | 49,2 | 578,92 | 9 |
4,2 | 71,9 | 32,5 | 5169,61 | 1056,25 | 301,98 | 136,5 | 2336,75 | 17,64 |
2,7 | 93,6 | 25,4 | 8760,96 | 645,16 | 252,72 | 68,58 | 2377,44 | 7,29 |
1,6 | 10 | 6,4 | 100 | 40,96 | 16 | 10,24 | 64 | 2,56 |
2,4 | 31,5 | 12,5 | 992,25 | 156,25 | 75,6 | 30 | 393,75 | 5,76 |
3,3 | 36,7 | 14,3 | 1346,89 | 204,49 | 121,11 | 47,19 | 524,81 | 10,89 |
49,7 | 602,1 | 350,5 | 39715,17 | 14128,31 | 2141,61 | 1527,01 | 16920,85 | 210,07 |
3,31 | 40,14 | 23,37 | 2647,68 | 941,89 | 142,77 | 101,8 | 1128,06 | 14 |
Для наших данных система уравнений имеет вид:
49,7 = 15b0 + 602,1b1 + 350,5b2
2141,61 = 602,1b0 + 39715,17b1 + 16920,85b2
1527,01 = 350,5b0 + 16920,85b1 + 14128,31b2
Решая систему методом Крамера, находим:
b0 = 1,93
b1 = -0,002
b2 = 0,0626
Уравнение регрессии:
Y = 1,93 – 0,002X1 + 0,0626X2
Сравнительная оценка влияния анализируемых факторов на результативный признак производится средним коэффициентом эластичности, показывающим на сколько процентов среднем по совокупности изменится результат y от своей средней величины при измени фактора xi на 1% от своего среднего значения:
Частный коэффициент эластичности E1 < 1. Следовательно, его влияние на результативный признак Y незначительно.
Частный коэффициент эластичности E2 < 1. Следовательно, его влияние на результативный признак Y незначительно.
Стандартизированные коэффициенты регрессии (β-коэффициенты) определяются из следующей системы уравнений:
ryx1 = β1 + β2rx2x1
ryx2 = β1rx2x1 + β2
Связь
коэффициентов множественной
Параметр α определяется следующим образом:
Теснота связи результативного признака с факторными определятся величиной коэффициента линейной множественной корреляции и детерминации, который могут быть исчислены на основе матрицы парных коэффициентов корреляции:
Более объективную оценку качества построенной модели дает скорректированный индекс множественной детерминации, учитывающий поправку на число степеней свободы:
где n- число наблюдений,
m – число факторов.
Рассчитаем парные коэффициенты корреляции.
Для y и x1 средние значения:
Дисперсия:
Среднеквадратическое отклонение:
Коэффициент корреляции:
Проверка гипотезы H0 о статистической значимости уравнения регрессии и показателя тесноты связи (R2 = 0) производится по F-критерию Фишера сравнением Fфакт с Fтабл.
Проверка
значимости модели регрессии проводится
с использованием F-критерия Фишера,
расчетное значение которого находится
как отношение дисперсии
Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.
где m – число факторов в модели.
Проведем оценку статистической значимости парной линейной регрессии.
Выдвигаем нулевую гипотезу о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости α.
Определим фактическое значение F-критерия:
где m=2 для множественной регрессии с двумя факторами.
Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 2 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2-1. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу. В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
Табличное значение критерия со степенями свободы k1=2 и k2=12, Fкр = 3,89
Поскольку фактическое значение F < Fкр, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
Рассчитаем прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимального значения.
Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:
(bj - tкрит Sbj; bj + tкрит Sbj)
(1,93 – 2,179 * 0,64; 1,93 + 2,179 * 0.64)
(0,53;3,34)
С вероятностью 95% можно утверждать, что значение данного параметра b0 будут лежать в найденном интервале.
(-0.002 – 2,179 * 0,0116; -0,002 + 2,179 * 0,0116)
(-0,0273;0,0232)
С вероятностью 95% можно утверждать, что значение данного параметра b1 будут лежать в найденном интервале.
(0,0626 – 2,179 * 0,0187; 0,0626 + 2,179 * 0,0187)
(0,0217;0.1)
С
вероятностью 95% можно утверждать, что
значение данного параметра b2 будут
лежать в найденном интервале.
По данным, взятым из соответствующей таблицы, выполнить следующие действия: