Автор работы: Пользователь скрыл имя, 26 Апреля 2011 в 23:15, доклад
Для решения многих практических задач необходимо знать комплекс условий, благодаря которому результат совокупного воздействия большого количества случайных факторов почти не зависит от случая. Данные условия описаны в нескольких теоремах, носящих общее название закона больших чисел, где случайная величина к равна 1 или 0 в зависимости от того, будет ли результатом k-го испытания успех или неудача. Таким образом, Sn является суммой n взаимно независимых случайных величин, каждая из которых принимает значения 1 и 0 с вероятностями р и q.
Министерство
образования и
науки Республики
Казахстан
Карагандинский
университет «Болашак»
Кафедра
информационных систем
На тему: «Закон больших
чисел»
Караганда 2010г
Одинаково
распределенные случайные
величины
Для решения многих практических задач необходимо знать комплекс условий, благодаря которому результат совокупного воздействия большого количества случайных факторов почти не зависит от случая. Данные условия описаны в нескольких теоремах, носящих общее название закона больших чисел, где случайная величина к равна 1 или 0 в зависимости от того, будет ли результатом k-го испытания успех или неудача. Таким образом, Sn является суммой n взаимно независимых случайных величин, каждая из которых принимает значения 1 и 0 с вероятностями р и q.
Простейшая форма закона больших чисел - теорема Бернулли, утверждающая, что если вероятность события одинакова во всех испытаниях, то с увеличением числа испытаний частота события стремится к вероятности события и перестает быть случайной.
Теорема Пуассона утверждает, что частота события в серии независимых испытаний стремится к среднему арифметическому его вероятностей и перестает быть случайной.
Предельные теоремы теории вероятностей, теоремы Муавра-Лапласа объясняют природу устойчивости частоты появлений события. Природа эта состоит в том, что предельным распределением числа появлений события при неограниченном возрастании числа испытаний (если вероятность события во всех испытаниях одинакова) является нормальное распределение.
Центральная предельная теорема объясняет широкое распространение нормального закона распределения. Теорема утверждает, что всегда, когда случайная величина образуется в результате сложения большого числа независимых случайных величин с конечными дисперсиями, закон распределения этой случайной величины оказывается практически нормальным законом.
Теорема Ляпунова объясняет широкое распространение нормального закона распределения и поясняет механизм его образования. Теорема позволяет утверждать, что всегда, когда случайная величина образуется в результате сложения большого числа независимых случайных величин, дисперсии которых малы по сравнению с дисперсией суммы, закон распределения этой случайной величины оказывается практически нормальным законом. А поскольку случайные величины всегда порождаются бесконечным количеством причин и чаще всего ни одна из них не имеет дисперсии, сравнимой с дисперсией самой случайной величины, то большинство встречающихся в практике случайных величин подчинено нормальному закону распределения.
В основе качественных и количественных утверждений закона больших чисел лежит неравенство Чебышева. Оно определяет верхнюю границу вероятности того, что отклонение значения случайной величины от ее математического ожидания больше некоторого заданного числа. Замечательно, что неравенство Чебышева дает оценку вероятности события для случайной величины, распределение которой неизвестно, известны лишь ее математическое ожидание и дисперсия.
Неравенство Чебышева.
Если случайная величина x
имеет дисперсию, то для любого x
> 0 справедливо неравенство
где
Mx
и Dx
- математическое ожидание и дисперсия
случайной величины x .
Теорема Бернулли.
Пусть x n - число успехов в n испытаниях Бернулли и p - вероятность успеха в отдельном испытании. Тогда при любом s > 0 справедливо
Теорема Ляпунова.
Пусть s 1, s 2, …, s n, …– неограниченная последовательность независимых случайных величин с математическими ожиданиями m1, m2, …, mn, … и дисперсиями s 12, s 22, …, s n2… . Обозначим , , , .
Тогда = Ф(b) - Ф(a) для любых действительных чисел a и b , где Ф(x) - функция распределения нормального закона.
Пусть дана дискретная случайная величина . Рассмотрим зависимость числа успехов Sn от числа испытаний n. При каждом испытании Sn возрастает на 1 или на 0. Это утверждение можно записать в виде:
Sn = 1+…+ n. (1.1)
Закон больших чисел.
Пусть {
к}—последовательность взаимно независимых
случайных величин с одинаковыми распределениями.
Если математическое ожидание
= М(
к) существует, то для любого
> 0 при n
(1.2)
Иначе говоря, вероятность того, что среднее Sn/n отличается от математического ожидания меньше, чем на произвольно заданное , стремится к единице.
Центральная предельная теорема.
Пусть
{
к}—последовательность взаимно независимых
случайных величин с одинаковыми распределениями.
Предположим, что
и
существуют. Пусть Sn =
1+…+
n, Тогда для любых фиксированных
Ф (
) — Ф (
) (1.3)
Здесь Ф (х) — нормальная функция распределенияю. Эту теорему сформулировал и доказал Линлберг. Ляпунов и другие авторы доказывали ее раньше, при более ограничительных условиях. Необходимо представить себе, что сформулированная выше теорема является только весьма частным случаем гораздо более общей теоремы, которая в свою очередь тесно связана со многими другими предельными теоремами. Отметим, что (1.3) намного сильнее, чем (1.2), так как (1.3) дает оценку для вероятности того, что разность больше, чем . С другой стороны, закон больших чисел (1.2) верен, даже если случайные величины k не имеют конечной дисперсии, так что он применим к более общему случаю, чем центральная предельная теорема (1.3). Проиллюстрируем последние две теоремы примерами.
Примеры.
а) Рассмотрим последовательность независимых
бросаний симметричной кости. Пусть
k — число очков, выпавших при k-м бросании.
Тогда
M( k)=(1+2+3+4+5+6)/6=3.5,
a
D(
k)=(12+22+32+42+52+62)/6-(3.5)
является средним числом очков, выпавших в результате n бросаний.
Закон больших чисел утверждает: правдоподобно, что при больших п это среднее окажется близким к 3,5. Центральная предельная теорема устанавливает вероятность того, что |Sn — 3,5n | < (35n/12)1/2 близка к Ф( ) — Ф(- ). При n = 1000 и а=1 мы находим, что вероятность неравенства 3450 < Sn < 3550 равна примерно 0,68. Выбрав для а значение а0 = 0,6744, удовлетворяющее соотношению Ф( 0)— Ф(— 0)=1/2, мы получим, что для Sn шансы находиться внутри или вне интервала 3500 36 примерно одинаковы.
б) Выборка. Предположим, что в генеральной совокупности,
состоящей из N семей, Nk семей имеют ровно по k детей
(k
= 0, 1 ...;
Nk = N). Если семья выбрана наугад, то
число детей в ней является случайной
величиной, которая принимает значение
с вероятностью p
=N
/N. При выборе с возвращением можно
рассматривать выборку объема n как совокупность
n независимых случайных величин или «наблюдений»
1, ...,
n, которые имеют все одно и то же распределение;
Sn/n является средним значением выборки.
Закон больших чисел утверждает, что для
достаточно большой случайной выборки
ее среднее значение будет, вероятно, близким
к
, т. е, к среднему значению генеральной
совокупности. Центральная предельная
теорема позволяет оценить вероятную
величину расхождения между этими средними
значениями и определить объем выборки,
необходимый для надежной оценки. На практике
и
и
обычно неизвестны; однако в большинстве
случаев удается легко получить предварительную
оценку для
и всегда можно заключить
в надежные границы. Если мы желаем,
чтобы с вероятностью 0,99 или большей среднее
значение выборки Sn/n отличалось
от неизвестного среднего значения генеральной
совокупности менее, чем на 1/10, то объем
выборки должен быть взят таким, чтобы
Корень х уравнения Ф(х) — Ф(— х) = 0,99 равен х = 2,57 ..., и, следовательно, n должно быть таким, что 2,57 или n > 660 . Осторожная предварительная оценка дает возможность найти необходимый объем выборки.
в) Распределение Пуассона.
Предположим, что случайные величины k имеют распределение Пуассона {p(k; )}. Тогда Sn имеет распределение Пуассона с математическим ожиданием и дисперсией, равными n .
Написав вместо n , мы заключаем, что при n
Суммирование производится по всем k от 0 до . Ф-ла (1.5) имеет место и тогда, когда произвольным образом.
Доказательство закона больших чисел
Проведем
это доказательство в два этапа.
Сначала предположим, что
существует, и заметим, что в этом случае
D(S„)
по теореме о дисперсии суммы. Согласно
неравенству Чебышева, при любом t > 0
При t > n левая часть меньше, чем , а последняя величина стремится к нулю. Это завершает первую часть доказательства.
Отбросим теперь ограничительное условие существования D( ). Этот случай сводится к предшествующему методом усечения.
Определим
два новых набора случайных величин,
зависящих от
, следующим образом:
Uk= , Vk=0, если (2.2)
Uk=0,
Vk=
, если
Здесь
k=1,… , п и
фиксировано. Тогда
при всех k.
Пусть
{f(
j)} — распределение вероятностей случайных
величин
(одинаковое для всех
j). Мы предположили, что
= M(
) существует, так что сумма
конечна.
Тогда существует и
где суммирование производится по всем тем j, при которых . Отметим, что хотя и зависит от п, но оно одинаково для
U1,
U2, ..., Un. Кроме того,
при
, и, следовательно, для произвольного
> 0 и всех достаточно больших n
Далее,
из (2.5) и (2,4) следует, что
Uk взаимно независимы, и с их суммой U1+U2+…+Un можно поступить точно так же, как и с Xk в случае конечной дисперсии, применив неравенство Чебышева, мы получим аналогично (2.1)