Автор работы: Пользователь скрыл имя, 06 Декабря 2010 в 11:53, шпаргалка
Ответы на 8 вопросов по экономическому моделированию.
где
- множественный коэффициент детерминации всего комплекса р факторов с результатом y;
- тот же показатель
Коэффициенты частной корреляции более высоких порядков можно определить через коэффициенты частной корреляции более низких порядков по рекуррентной формуле
Парные и частные коэффициенты корреляции попадают в диапазон: -1≤rxy≤1
Если rxy —›1 или rxy —›-1, существует тесная связь;
если 0≤rxy≤1, то связь прямая (увеличение или уменьшение одного признака сопровождается аналогичным изменением другого признака);
если -1≤rxy≤0, то связь обратная (увеличение или уменьшение одного признака сопровождается противоположным по направлению изменением другого признака);
если rxy —›0, то связь между x и y отсутствует.
Если
исследуется связь между
Множественный коэффициент
3.Определение доверительных интервалов прогноза по линейному уравнению регрессии.
Одной
из центральных задач
Предсказание среднего значения. Пусть построено уравнение парной регрессии yteor(xi) = b0 + b1×xi, на основе которого необходимо предсказать условное математическое ожидание М(YïХ = хp) переменной yteor(xp) при X = хp. В данном случае значение yteor(xp) = b0 + b1×xp является оценкой (приближением) М(YïХ = хp).
Чтобы
построить доверительный
yteor(xp) = b0 + b1×xp = ådi yi +(å ci yi)×xp = å(di +ci×xp)yi.
Следовательно, yteor(xp) является линейной комбинацией нормальных случайных величин и, значит, сама имеет нормальное распределение.
Myteor(xp) = M(b0 + b1×xp) = M(b0)+ M(b1)×xp = b0 + b1×xp ,
Dyteor(xp) = D(b0 + b1×xp) = D(b0)+ D(b1) +2×cov(b0 ,b1)×xp, (8.12)
(здесь используются
формулы: D(X+Y) = D(Х)+D(У)+ 2×соv(Х, Y); D(сХ) = с2×D(Х);
cov(Х, b×Y)
= b×соv(Х,
Y)).
cov(b0 ,b1) = M[(b0 – M(b0)×(b1 – M(b1))] =
= M[(b0
- b0)×(b1
– b1)]
= M[(
= -
= -
Следовательно, = . (8.13)
Так как
,
Поскольку
Подставив вместо s2 её несмещенную оценку получим выборочную исправленную дисперсию D(yteor(xp)) рассматриваемой случайной величины. Тогда случайная величина (8.14)
имеет
распределение Стьюдента с
имеем:
(8.15)
После алгебраических преобразований получим:
Таким образом,
доверительный интервал для гипотезы
H0: M(YïX=xp) = b0 + b0*хр имеет
вид:
В доверительном интервале с надёжностью 1–a находятся значения зависимого фактора, лежащие на линии регрессии
4. Определение параметров парной линейной регрессии по методу наименьших квадратов.
Задача линейного регрессионного анализа состоит в том, чтобы по конкретной выборке (xi, yi), i = l, 2, ... , n найти оценки a* и b* неизвестных параметров b0 и b1 так, чтобы построенная линия регрессии являлась бы наилучшей среди всех других прямых. Другими словами, построенная прямая yтеор(xi) = a* + b*∙xi должна быть “ближайшей” к точкам наблюдений по их совокупности. Мерами качества найденных оценок могут служить определенные композиции отклонений ei, i = 1, 2, ... , n.
Существует несколько методов нахождения коэффициентов a* и b* эмпирического уравнения регрессии. Самым распространенным и теоретически обоснованным является метод наименьших квадратов (МНК).
При использовании данного метода минимизируется следующая функция (рисунок - изображение отклонений, сумма квадратов которых минимизируется):
(1)
Функция y является квадратичной функцией двух параметров a и b (y = y(a , b)), поскольку (xi, yi), i = 1, 2, ... , n - известные данные наблюдений. Так как функция y непрерывна, выпукла и ограничена снизу (y > 0), то она имеет минимум.
Необходимым условием существования минимума функции двух переменных является равенство нулю ее частных производных по неизвестным параметрам a и b:
- система нормальных уравнений.
После удаления 2 и (-1) (они не равны нулю) и приведения подобных получим:
Выразим a* в первом уравнении через b*
или , (*)
или по-другому, , где , .
Подставив выражение (*) во второе уравнение системы, получим:
Тогда
Таким образом, (**) или .
Теперь благодаря выражениям (*) и (**) имеем выборочное уравнение линейной регрессии:
yтеор(xi) = a* + b*×xi , т.е. yi = a* + b*×xi+ei, где хi и yi - значения наблюдаемых величин х и у; ei - оценки теоретического случайного отклонения ei.
Таким образом, по МНК оценки параметров a* и b* определяются по формулам (*), (**).
5.Оценка значимости коэффициентов парной линейной регрессии и экономической модели в целом.
Представим формулы определения коэффициентов b0 и b1 в виде линейных функций относительно значений Y:
.
Отсюда
,
так как .
Введя обозначение
,
имеем:
. (8.1)
Аналогично:
.
Обозначив
,
имеем:
. (8.2)
Так как предполагается, что дисперсия Y постоянна и не зависит от значений X, то сi и di можно рассматривать как некоторые постоянные. Следовательно,
, (8.3)
и,
Таким образом,
D(b0)=
Из соотношений (8.3), (8.4) очевидны следующие выводы.
• Дисперсии b0 и b1 прямо пропорциональны дисперсии случайного отклонения s2 зависимой переменной Y. Следовательно, чем больше фактор случайности по переменной Y, тем менее точными будут оценки.
• Чем больше число n наблюдений, тем меньше дисперсии оценок. Это вполне логично, так как чем большим числом данных мы располагаем, тем вероятнее получение более точных оценок.
• Чем больше дисперсия (разброс значений ) объясняющей переменной X, тем меньше дисперсия оценок коэффициентов. Другими словами, чем шире область изменений объясняющей переменной, тем точнее будут оценки (тем меньше доля случайности в их определении).
В силу того, что случайные отклонения ei по выборке определены быть не могут, при анализе надежности оценок коэффициентов регрессии они заменяются отклонениями ei = yi – b0 – b1×xi значений yi переменной Y от оцененной линии регрессии. Дисперсия случайных отклонений D(ei) = s2 заменяется ее несмещенной оценкой
Тогда