Автор работы: Пользователь скрыл имя, 16 Марта 2012 в 07:53, доклад
Probit-модели могут быть использованы для определения вероятностей сложных событий, выражаемых в виде комбинаций некоторых наборов простых событий, каждое из которых имеет два альтернативных варианта, например, переезд на новое место жительства и аренда (покупка) жилья и т. п. В этом случае данные вероятности могут быть определены как вероятности выбора в рамках многомерных альтернативных вариантов.
Двумерные и многомерные probit-модели.
Построение исследование модели.
Содержание:
Двумерные и многомерные probit-модели.
Построение исследование модели.
Probit-модели могут быть использованы для определения вероятностей сложных событий, выражаемых в виде комбинаций некоторых наборов простых событий, каждое из которых имеет два альтернативных варианта, например, переезд на новое место жительства и аренда (покупка) жилья и т. п. В этом случае данные вероятности могут быть определены как вероятности выбора в рамках многомерных альтернативных вариантов.
Для каждого индивидуума t (t=1,2,...,Т) модель, определяющая вероятности двух событий, может быть представлена в виде следующей системы:
y1t*=1x1t +1t, если y1t=1, то y1*0, если y1=0, то y1*0;
y2t*=2x2 t +2t, если y2t=1, то y2*0, если y2=0, то y2*0. (1)
Латентные переменные y1t * и y2t * модели (1) могут интерпретироваться в терминах выгоды, получаемой в зависимости от принятого решения соответственно в первом и во втором случаях; х1t и х2t – векторы значений независимых факторов, соответствующих сделанному выбору; 1t и 2t – ошибки соответственно первого и второго уравнений; – коэффициент ковариации ошибок 1 и 2.
Закон совместного распределения ошибок модели 1 и 2 в общем случае характеризуется следующими параметрами:
M[1]=M[2]=0;
D[1]=D[2]=1[*] ;
Cov[1, 2]=,
Согласно модели (1) возможны следующие комбинации решений:
y1=y1=1;
Наблюдаемые комбинации образуют массив зависимых переменных модели (1). В системе (1) допускается, что события являются зависимыми между собой, что означает существование ненулевой ковариационной связи между ошибками 1 и 2. Например, возможность приобретения жилья на новом месте может способствовать принятию решения о переезде или, наоборот, переезд обусловливает необходимость аренды жилья.
Для определения функции закона распределения введем следующие обозначения: q1t=2y1t–1 и q2t=2y2t–1. Тогда qjt=1, если уjt=1, и qjt=–1, если уjt=0, для j=1,2. Введем также в рассмотрение следующие переменные:
zjt=jxjt и wjt= qjtzjt, j=1,2
и
t*=q1t q2t.
Вероятность того, что зависимые переменные Y1 и Y2 системы (1) для конкретного индивидуума принимают соответственно значения y1t и y2t, при, например, нормальном виде закона их совместного распределения рассчитывается как
P(Y1=y1t, Y2=y2t)=2(w1t, w2t, t*),
где 2(.) – функция нормального закона совместного распределения случайных переменных Y1 и Y2, имеющая следующий вид:
2(w1t, w2t, t*)=
где u1 и u2 – переменные интегрирования и плотность этого распределения имеет следующий вид:
Данные представляют собой выборку из значения показателей производственно-хозяйственной деятельности 18 предприятий России.
N | значительны ли потери от брака (более 1%) | удельный вес покупных изделий | рентабельно ли предприятие | фондовооруженность труда |
1 | 0 | 0,4 | 1 | 6,4 |
2 | 1 | 0,26 | 1 | 7,8 |
3 | 0 | 0,4 | 1 | 9,76 |
4 | 0 | 0,5 | 1 | 7,9 |
5 | 0 | 0,4 | 0 | 5,35 |
6 | 1 | 0,19 | 1 | 9,9 |
7 | 1 | 0,25 | 0 | 4,5 |
8 | 0 | 0,44 | 0 | 4,88 |
9 | 1 | 0,17 | 0 | 3,46 |
10 | 0 | 0,39 | 0 | 3,6 |
11 | 0 | 0,33 | 1 | 3,56 |
12 | 1 | 0,25 | 0 | 5,65 |
13 | 0 | 0,32 | 0 | 4,28 |
14 | 1 | 0,02 | 1 | 8,85 |
15 | 1 | 0,06 | 1 | 8,52 |
16 | 1 | 0,15 | 1 | 7,19 |
17 | 1 | 0,2 | 0 | 4,82 |
18 | 1 | 0,02 | 1 | 5,46 |
Построим следующие модели:
1) зависимость потерь от брака от удельного веса покупных изделий:
Model: Probit regression N of 0's:8 1's:10 (Spreadsheet14)
Dep. var: Var1 Loss: Max likelihood
Final loss: ,011147571 Chi?(1)=24,708 p=,00000
| Const.B0 | Var2 |
Estimate | 26,65459 | -90,6291 |
Y1t=normal(26,65459-90,6291X1t
2) зависимость рентабельности предприятия от фондовооруженности труда:
Model: Probit regression N of 0's:8 1's:10 (Spreadsheet14)
Dep. var: Var3 Loss: Max likelihood
Final loss: 6,567937744 Chi?(1)=11,595 p=,00066
| Const.B0 | Var4 |
Estimate | -3,92154 | 0,709050 |
Y2t= normal(-3,92154+0,709050X2t,0,
3) рассчитаем вероятность P(Y1=0 Y2=1)
q1 18=-1
q2 18=1.
Тогда
z1 18= -1,8
z2 18= 3,822
w1 18= -1,8
w 2 18=3,822
и
1*=0,09
Тогда
Р= ,688707
4) спрогнозируем значения для следующего наблюдения зная, что:
N | значительны ли потери от брака (более 1%) | удельный вес покупных изделий | рентабельно ли предприятие | фондовооруженность труда |
19 | 1 | 0,06 | 1 | 7,8 |
Y2 19=normal(26,65459-90,6291X1t,
Y2 19= normal(-3,92154+0,709050X2t,0,
Таким образом, мы видим, что, несмотря на наличие потерь от брака предприятие является рентабельным.
Также рассчитаем, какова была вероятность получить этот результат:
q1 19=1
q2 19=1.
Тогда
z1 19=5,4
z2 19=5,46
w1 19= 5,4
w 2 19=5,46
и
1*=0,09
Тогда
Р=,642671
[*] Допущение равенства дисперсий – не слишком сильное. Если дисперсия ошибки принимает вместо 1 значение 2, то это равносильно умножению всех коэффициентов на . Знак произведения x при этом не изменится. Соответственно не изменится и соотношение между латентной переменной y* и наблюдаемой переменной y.