Курс лекций по теории вероятностей

Раздел 1. Классическая вероятностная схема


                     1.1 Основные формулы комбинаторики


    В данном разделе мы займемся подсчетом числа «шансов». О  числе  шансов
говорят,  когда  возможно  несколько   различных   результатов   какого-либо
действия (извлечение карты из  колоды,  подбрасывание  кубика  или  монетки,
двух кубиков и т.д.). Число шансов — это число таких возможных  результатов,
или, иначе говоря, число способов проделать это действие.

    Теорема о перемножении шансов


    Теорема 1. Пусть имеется, k групп элементов, причем i-я группа содержит
ni элементов, 1<=i<=k. Выберем из каждой группы по  одному  элементу.  Тогда
общее число N способов, которыми можно произвести такой выбор, равняется

    [pic]

    Замечание 1. В теореме 1 считается, что даже если все  элементы  в  i-й
группе неразличимы, выбрать один из них можно ni способами.

    Замечание 2. Результат выбора, описанного в  теореме  1,  представим  в
виде набора (а1, а 2,…, а  k)  в  котором  аi  —  выбранный  из  i-й  группы
элемент. Тогда общее  число  различных  наборов  (а1,  а  2,…,  а  k)  также
равняется

    [pic]

    Доказательство теоремы 1.



    Занумеруем элементы i -ой группы числами от 1 до ni. Элемент из  первой
группы можно выбрать n1 способами. Если мы выбрали элемент j, 1<=i<= n1,  то
выбрать элемент из второй группы мы можем  n2  способами.  Получаем,  что  с
первым элементом j возможно составить n2 пар (j, l), где 1<=l<= n2.

    Но столько же пар можно составить и с  любым  другим  элементом  первой
группы. Тогда всего пар, в которых первый элемент выбран из  первой  группы,
а второй — из второй, существует ровно [pic]

    Иначе говоря, есть [pic] способов выбрать по одному элементу из  первых
двух групп. Возьмем одну такую пару (j, l). Заметим, что элемент из  третьей
группы можно выбрать n3 способами,  то  есть  возможно  составить  ровно  n3
троек (j, l, m), добавляя к  данной  паре  (j,  l)  любой  из  n3  элементов
третьей группы.

    Но столько же троек можно составить и с  любой  другой  парой  (j,  l).
Тогда всего троек, в которых первый элемент выбран из первой группы,  второй
— из второй, а третий — из третьей, существует ровно [pic].

    Продолжая  рассуждения,  методом  математической   индукции   заключаем
справедливость утверждения теоремы.

    Урны и шарики


    Есть урна,  (то  есть  ящик),  содержащая  n  занумерованных  объектов,
которые мы без ограничения общности будем считать шариками. Мы  выбираем  из
этой урны k шариков. Нас интересует, сколькими  способами  можно  выбрать  k
шариков из n, или сколько различных результатов (то есть наборов,  состоящих
из k шариков) получится.

    На этот вопрос нельзя дать однозначный ответ, пока мы не определимся

     . с тем, как организован выбор (скажем, можно ли шарики  возвращать  в
       урну), и

     . с тем, что понимается под различными результатами выбора.

    Рассмотрим следующие возможные схемы выбора:

    1. Выбор с возвращением: каждый выбранный шарик возвращается в урну, то
есть каждый из k шариков выбирается из полной  урны.  В  полученном  наборе,
состоящем из k номеров шариков,  могут  встречаться  одни  и  те  же  номера
(выборка с повторениями).

    2. Выбор без возвращения: выбранные шарики в урну не возвращаются, и  в
полученном наборе не могут встречаться одни и  те  же  номера  (выборка  без
повторений).

    И в том, и в другом случае  результатом  выбора  является  набор  из  k
номеров   шариков.   Удобно   считать,   что   шарики   всегда    выбираются
последовательно, по одному (с возвращением или без).

    Условимся, какие результаты мы будем считать различными.

    Есть ровно две возможности.

    1. Выбор  с  учетом  порядка:  два  набора  номеров  шариков  считаются
различными, если они отличаются составом  или  порядком  номеров.  Так,  при
выборе трех шариков из урны, содержащей 5 шариков, наборы  (1,2,5),  (2,5,1)
(4,4,5) различны, если производится выбор с учетом порядка.

    2. Выбор без  учета  порядка:  два  набора  номеров  шариков  считаются
различными,  если  они  отличаются  составом.  Наборы,   отличающиеся   лишь
порядком следования номеров, считаются  одинаковыми.  Так,  в  примере  выше
первые два набора (1,2,5), (2,5,1) есть один и тот же  результат  выбора,  а
набор (4,4,5) — другой результат выбора.

    Подсчитаем теперь, сколько же возможно различных результатов при каждой
из четырех схем (выбор с возвращением и без, и  в  каждом  из  этих  случаев
учитываем ли мы порядок или нет).

    Урновая схема: выбор без возвращения, с учетом порядка


    Теорема 2. Общее количество выборок в схеме выбора k элементов из n без
возвращения и с учетом порядка определяется формулой

    и называется числом размещений из n элементов по k элементов.

    Доказательство. Первый шарик можно выбрать n способами. При  каждом  из
этих способов второй шарик можно выбрать n-1 способом, и т.д. Последний  k-й
шарик можно выбрать (n-k+1) способом. По теореме  1,  общее  число  способов
выбора равно

    [pic]

    что и требовалось доказать.

    Следствие 1. Число возможных перестановок множества из n элементов есть
n!

    Доказательство очевидно, если заметить, что перестановка  есть  не  что
иное, как результат выбора  без  возвращения  и  с  учетом  порядка  всех  n
элементов из n. Так что общее число перестановок равно

    Урновая схема: выбор без возвращения и без учета порядка


    Теорема 3. Общее количество выборок в схеме выбора k элементов из n без
возвращения и без учета порядка определяется формулой

    и называется числом сочетаний из n элементов по k элементов.

    Доказательство. Заметим, что, согласно следствию 1, из  каждой  выборки
данного состава (состоящей из k  элементов)  можно  образовать  k!  выборок,
отличающихся друг от друга только порядком элементов.

    То есть число выборок, различающихся еще и порядком, в k!  раз  больше,
чем число  выборок,  различающихся  только  составом.  Поделив  [pic]на  k!,
получим утверждение теоремы.

    Урновая схема: выбор с возвращением и с учетом порядка


    Теорема 4. Общее количество выборок в схеме выбора k элементов из  n  с
возвращением и с учетом порядка определяется формулой

    Доказательство. Первый шарик можно выбрать n способами. При  каждом  из
этих способов второй шарик можно выбрать также n способами, и так k раз.

    Урновая схема: выбор с возвращением и без учета порядка


    Рассмотрим урну с двумя шариками и перечислим  результаты  выбора  двух
шариков из этой урны при выборе с возвращением:


|С учетом       |Без учета    |
|порядка        |порядка      |
|(1, 1)         |(1, 1)       |
|(2, 2)         |(2, 2)       |
|(1, 2)         |             |
|(2, 1)         |(1, 2)       |


    Заметим, что  в  схеме  «без  учета  порядка»  получилось  3  различных
результата в отличие от  четырех  в  схеме  «с  учетом  порядка».  (число  4
возникает и согласно теореме 4); и что никаким  делением  на  «число  каких-
нибудь перестановок» число 3 из 4 получить не удастся.

    Теорема 5. Общее количество выборок в схеме выбора k элементов из  n  с
возвращением и без учета порядка определяется формулой

    Доказательство. Рассмотрим подробно, чем отличаются друг от  друга  два
разных результата такой схемы выбора. Нам не важен порядок номеров, то  есть
мы учитываем только, сколько  раз  в  нашем  наборе  из  k  номеров  шариков
появился шарик номер 1, шарик номер 2, … , шарик номер n. То есть  результат
выбора можно представить набором чисел k1, k2, …kn, в  котором  ki  —  число
появлений шарика номер i в выборке,  и  k1+  k2+  …+kn.=  k.  При  этом  два
результата эксперимента различны, если соответствующие  им  наборы  k1,  k2,
…,kn не совпадают.

    Представим себе другой эксперимент, имеющий точно такие  же  результаты
(и, следовательно, их столько же). Есть n ящиков, в  которых  размещается  k
шариков. Нас интересует только количество шариков в каждом ящике.  То  есть,
результатом эксперимента снова является набор чисел k1, k2, …kn , в  котором
ki — число шариков в ящике с номером i, и k1+ k2+ … +kn.= k.  Числа  ki  по-
прежнему принимают натуральные значения или равны 0.

    А теперь изобразим результат такого размещения в виде схемы, в  которой
вертикальные  линии  обозначают  перегородки  между  ящиками,  а  кружки   —
находящиеся в ящиках шарики:

    Мы видим результат размещения 9 шариков по 7  ящикам.  Здесь  1-й  ящик
содержит 3 шарика, 2-й и 6-й ящики пусты, 3-й ящик содержит 1 шарик, и в  4-
м и 5-м ящиках есть по 2 шарика. Переложим один шарик из  первого  ящика  во
второй и изобразим таким же образом еще один результат размещения:



    И еще один:

    Видим, что все размещения можно получить, меняя между  собой  шарики  и
перегородки,  или  расставляя  k  шариков  на  n-1+k  месте.   Число   n-1+k
получается так: у n ящиков есть ровно n+1 перегородка, считая  крайние,  или
n-1 перегородка, если не считать крайние, которые двигать нельзя. И  есть  k
шариков. Перебрав все возможные способы расставить k шариков на  этих  n-1+k
местах (и ставя на  оставшиеся  места  перегородки),  переберем  все  нужные
размещения.

    Но способов расставить k шариков на n-1+k местах  ровно  [pic]—  это  в
точности число способов выбрать из n-1+k номеров мест k  номеров  мест  (без
учета порядка  и  без  возвращения),  на  которые  нужно  поместить  шарики.
Заметим,  что  равенство  [pic]  верно  как  по   определению   биномиальных
коэффициентов или свойствам треугольника Паскаля, так и  в  силу  того,  что
можно вместо выбора k мест для шариков выбирать n-1  место  для  перегородок
ящиков, заполняя шариками оставшиеся места.

            1.2 Основные понятия элементарной теории вероятностей


    Предмет теории вероятностей. Статистическая устойчивость.


    Теория вероятностей изучает  закономерности,  возникающие  в  случайных
экспериментах  (явлениях).   Случайным   называют   эксперимент,   результат
которого нельзя предсказать заранее.  Невозможность  предсказать  заранее  —
основное, что отличает случайное явление от детерминированного.

    Не все случайные явления (эксперименты) можно изучать  методами  теории
вероятностей, а лишь те, которые могут быть воспроизведены в одних и тех  же
условиях  и  обладают  (непонятно   как   проверяемым   заранее)   свойством
«статистической  устойчивости  :  «если  А  —  некоторое  событие,   могущее
произойти или не произойти в результате эксперимента, то доля  n(A)/n  числа
экспериментов,  в  которых  данное  событие   произошло,   имеет   тенденцию
стабилизироваться с ростом  общего  числа  экспериментов  n,  приближаясь  к
некоторому  числу  P(A).  Это  число  служит   объективной   характеристикой
«степени возможности» событию А произойти.

    В  дальнейшем  мы  будем  говорить  лишь  о  случайных   экспериментах,
обладающих  данными  свойствами,  а  свойство  статистической   устойчивости
докажем в утверждении, известном как закон больших чисел Я.Бернулли.

    Пространство элементарных исходов. Операции над событиями


    Определение  1.  Пространством   элементарных   исходов   ?   («омега»)
называется  множество,   содержащее   все   возможные   результаты   данного
случайного эксперимента, из которых в эксперименте  происходит  ровно  один.
Элементы  этого  множества  называют  элементарными  исходами  и  обозначают
буквой ? («омега») с индексами или без.

    Определение 2. Событиями мы будем называть  подмножества  множества  ?.
Говорят, что в результате эксперимента произошло  событие  А  (  ?,  если  в
эксперименте произошел один из элементарных исходов,  входящих  в  множество
А.

    Замечание 3. Вообще говоря, можно назвать событиями не обязательно  все
подмножества  множества  ?,  а   лишь   множества   из   некоторого   набора
подмножеств. О смысле такого ограничения мы поговорим позднее.

    Пример 1. Один раз подбрасывается одна игральная кость  (кубик).  Самый
разумный  способ  задать  пространство  элементарных  исходов  таков:  ?   =
{1,2,3,4,5,6},  элементарные  исходы  здесь  соответствуют  числу   выпавших
очков.

    Примеры событий: A = {1,2} — выпало одно или два очка; A  =  {1,3,5}  —
выпало нечетное число очков.

    Пример 2. Два раза подбрасывается одна игральная  кость  (кубик).  Или,
что, то же самое, один  раз  подбрасываются  две  игральные  кости.  Как  мы
увидим  в  дальнейшем,  здесь  самый  разумный  способ  задать  пространство
элементарных исходов — считать результатом эксперимента  упорядоченную  пару
чисел (i, j), в которой 1( i, j ( 6и i - число очков выпавших первый раз,  j
– число очков, выпавших второй раз. ? = {(i, j), где 1( i, j ( 6}

    Примеры событий:

    A  =  {(1,1),  (1,2),  (1,3),  (1,4),  (1,5),  (1,6)}  —   при   первом
подбрасывании выпало одно очко;

    A = {(1,1),(2,2), (3,3), (4,4), (5,5), (6,6)} — при двух подбрасываниях
выпало одинаковое число очков.

    Пример  3.  На  поверхность   стола   бросается   монета.   Результатом
эксперимента  можно  считать  координату  центра  монеты  (а  если  нам   не
безразличен угол поворота монеты, то можно добавить и величину этого  угла).
Пространство элементарных исходов — множество точек стола (во втором  случае
— множество пар {x, ?} , где x — координата точки стола и ? ([0,  2?]—  угол
поворота). Число элементарных исходов такого эксперимента несчетно.

    Пример 4. Монета подбрасывается до  тех  пор,  пока  не  выпадет  вверх
гербом.  Пространство  элементарных  исходов  состоит  из  бесконечного,  но
счетного числа исходов:

    ? = {г, рг, ррг, рррг, ррррг,  рррррг,  …}  ,  где  р  и  г  обозначают
выпадение решки и герба при одном подбрасывании, соответственно.

    Пример  5.  Приведем   пример   неправильно   выбранного   пространства
элементарных событий. Пусть при бросания игральной кости Ч =  {четное  число
очков}, Т = {число очков, кратное трем}. Тогда ? = {Ч, Т, 1,  5}  составляет
все исходы эксперимента, однако исходы Ч и Т могут наступать одновременно.

    Определение 3.

    1. Достоверным называется событие,  которое  обязательно  происходит  в
результате эксперимента, то есть единственное событие,  включающее  все  без
исключения элементарные исходы — событие ?.

    2.  Невозможным  называется  событие  которое  не  может  произойти   в
результате  эксперимента,  то  есть  событие,  не   содержащее   ни   одного
элементарного исхода («пустое множество» (). Заметим, что всегда ( ( ?.

    Определение 4. Пусть А и В — события.

    1. Объединением А U В событий А и В  называется  событие,  состоящее  в
том, что произошло либо А , либо В, либо оба события одновременно. На  языке
теории множеств А U В есть множество, содержащее  как  элементарные  исходы,
входящие в А, так и элементарные исходы, входящие в В.

    2. Пересечением А ? В событий А и В  называется  событие,  состоящее  в
том, что произошли оба события А и В  одновременно.  То  есть  А  ?  В  есть
множество, содержащее элементарные исходы, входящие одновременно в А и в В.

    3. Дополнением А \ В события А до В  называется  событие,  состоящее  в
том, что произошло событие А , но не  произошло  В.  То  есть  А  \  В  есть
множество, содержащее элементарные исходы, входящие в А, но  не  входящие  в
В.

    4. Противоположным (или дополнительным) к событию А называется  событие
[pic],  состоящее  в  том,  что  событие  А  в  результате  эксперимента  не
произошло. Иначе  говоря,  [pic]  есть  множество,  содержащее  элементарные
исходы, не входящие в А.

    Определение 5.

    1. События А и В называются несовместными, если А ? В = (.

    2. События А1, А2 , … Аn называются  попарно  несовместными,  если  для
любых i ? j, 1 ( i,j ( n, события Аiи Аj несовместны.

    3. Говорят, что событие А влечет событие В, и пишут А ( В, если всегда,
как только происходит событие А, происходит и событие  В.  На  языке  теории
множеств  это  означает,  что  любой  элементарный  исход,  входящий  в   А,
одновременно входит и в событие В.

    Вероятность на дискретном пространстве элементарных исходов


    Предположим, что мы имеем дело с дискретным пространством  элементарных
исходов, то есть пространством, состоящим из конечного  или  счетного  числа
элементов:

    ? = {?1, ?2 , … ?n , … }.

    Определение  6.  Поставим  каждому  элементарному  исходу  ?i  (  ?   в
соответствие число p(?i ) ( [0,1] так, что

    Назовем число p(?i) вероятностью элементарного исхода ?i . Вероятностью
события А ( ? называется число

    равное сумме вероятностей элементарных исходов, входящих в множество А.

    Замечание   4.   Позднее,   познакомившись   с   аксиоматикой    теории
вероятностей, мы зададим вероятности событий  непосредственно,  а  не  через
вероятности элементарных исходов.  Тем  более,  что  сложением  вероятностей
элементарных исходов можно получить лишь вероятность события, состоящего  не
более чем  из  счетного  числа  элементарных  исходов  (иначе  само  понятие
суммирования не определено).  Но  на  дискретном  пространстве  элементарных
исходов определить вероятности событий так, как это  сделано  в  определении
6, всегда возможно.

    Перечислим очевидные в  случае  дискретного  пространства  элементарных
исходов свойства  вероятности,  которые  мы  скоро  докажем  сразу  в  общем
случае.

    1. 0 ( Р(А) ( 1;

    2. Р(?) = 1;

    3. Р(() = 0;

    4. Р(?) = 1 - Р(О);

    5. если А и В несовместны, то Р(А U В) = Р(А) + Р(В);

    6. в общем же случае Р(А U В) = Р(А) + Р(В) - Р(А ? В);

    7. если А ( В, то Р(А) ( Р(В).

    Классическое определение вероятности


    Предположим, что мы имеем дело с  пространством  элементарных  исходов,
состоящим из конечного числа N элементов: ? = {?1, ?2, …  ?N}.  Более  того,
предположим, что из каких-либо соображений  мы  можем  считать  элементарные
исходы равновозможными. Тогда вероятность любого из них  принимается  равной
1/ N.

    Эти соображения чаще всего не имеют отношения к математической модели и
основаны  на  какой-либо  симметрии  в  эксперименте  (симметричная  монета,
хорошо перемешанная колода карт, правильная кость). Либо  мы  можем  заранее
считать исходы эксперимента равновозможными, но тогда рано  или  поздно  все
равно возникнет вопрос о соответствии такой математической модели  реальному
эксперименту.

    Если событие  А  =  {[pic]}  состоит  из  k  элементарных  исходов,  то
вероятность этого события равняется

    [pic]

    отношению k / N:

    где символом |А| обозначено число элементов конечного множества А.

    Определение 7.

    Говорят,  что  эксперимент  удовлетворяет   классическому   определению
вероятности  (или  классической  вероятностной  схеме),  если   пространство
элементарных исходов состоит из  конечного  числа  |А|  =  N  равновозможных
исходов.

    В этом случае вероятность любого события А вычисляется по формуле

называемой классическим определением вероятности. Эта формула читается  так:
«вероятность события А равна  отношению  числа  исходов,  благоприятствующих
событию А, к общему числу исходов».

    Замечание 5. Полезно помнить классическую формулировку Якоба  Бернулли:
«Вероятность есть степень достоверности и отличается от  нее  как  часть  от
целого». (Ars Conjectandi, 1713 г.)

    Замечание 6. Мы видим теперь, что подсчет  вероятности  в  классической
схеме  сводится  к   подсчету   числа   «шансов»   (элементарных   исходов),
благоприятствующих какому-либо событию, и общего числа шансов. Как  правило,
это делается с помощью формул комбинаторики.

    Рассмотрим описанные в параграфе 1.1 урновые схемы. Напомним, что  речь
идет об извлечении k шариков из урны, содержащей n  шариков.  При  этом  три
схемы: с возвращением и  с  учетом  порядка,  без  возвращения  и  с  учетом
порядка,  а  также  без  возвращения  и  без  учета  порядка   удовлетворяют
классическому определению вероятности.

    Общее число элементарных исходов в этих схемах подсчитано в теоремах 4,
2, 3 и равно, соответственно,[pic]

    Четвертая же схема — схема выбора с возвращением и без учета порядка  —
имеет заведомо неравновозможные исходы.

    Пример 6. Рассмотрим, скажем, выбор двух шариков из двух или, что то же
самое,  дважды  подбросим  монету.  Если  учитывать  порядок,   то   исходов
получится 4, и все они равновозможны, то есть имеют вероятность по 1/4:

    (герб, герб), (решка, решка), (решка, герб), (герб, решка).

    Если порядок не учитывать, то следует  объявить  два  последних  исхода
одним и тем же  результатом  эксперимента,  и  получить  три  исхода  вместо
четырех: выпало два герба, либо две решки, либо один герб и одна решка.

    При этом первые  два  исхода  имеют  вероятность  1/4,  а  последний  —
вероятность 1/4+1/4=1/2.

    Гипергеометрическое распределение


    Пример 7.

    Из урны, в которой  n1  белых  и  n  -n1  чёрных  шаров,  наудачу,  без
возвращения вынимают k шаров, k<n. Термин «наудачу» означает, что  появление
любого набора из k шаров равно возможно. Найти вероятность того,  что  будет
выбрано ровно k1 белых и k - k1 чёрных шаров.

    Заметим, что при k1 > n1 или k - k1 > n - n1 искомая вероятность  равна
0, так как соответствующее событие невозможно. Пусть k1 < n1 и k - k1 < n  -
n1. Результатом эксперимента является набор из k шаров. При  этом  можно  не
учитывать или учитывать порядок следования шаров.

    1. Выбор без учета порядка. Общее число элементарных исходов есть число
k –элементных подмножеств множества, состоящего  из  n  элементов,  то  есть
[pic] (по теореме 3).

    Обозначим  через  A  событие,  вероятность  которого  требуется  найти.
Событию A благоприятствует появление любого  набора,  содержащего  k1  белых
шаров и k - k1 черных.

    Число благоприятных исходов равно произведению  (по  теореме  1)  числа
способов выбрать k1 белых шаров из n1  и  числа  способов  выбрать  k  -  k1
черных шаров из n - n1:

    [pic]

    Вероятность события A равна:

    2. Выбор с учетом порядка. Общее число элементарных исходов есть  число
способов разместить n элементов на k местах[pic] (по теореме 2).

    При подсчете  числа  благоприятных  исходов  нужно  учесть,  как  число
способов выбрать нужное число шаров, так и число  способов  расположить  эти
шары среди k. Можно, скажем, посчитать число способов выбрать k1 мест  среди
k (равное [pic]), затем число способов  разместить  на  этих  k1  местах  n1
белых шаров (равное [pic] — не забывайте про учет порядка!), и  затем  число
способов разместить на оставшихся k - k1 местах n - n1 черных шаров  (равное
[pic]). Перемножив эти числа, получим:

    В рассмотренной задаче мы сопоставили каждому набору из k1 белых  и  k-
k1черных шаров вероятность получить этот набор при выборе k шаров  из  урны,
содержащей n1белых и n-n1черных шаров:

    Определение 8. Соответствие или следующий набор вероятностей

    Называется гипергеометрическим распределением.

                    Раздел 2. Геометрическая вероятность


                              2.1 Что это такое


    Рассмотрим какую-нибудь область ? в Rm ,(на  прямой,  на  плоскости,  в
пространстве).  Предположим,  что   «мера»   ?   (длина,   площадь,   объем,
соответственно) конечна. Пусть случайный эксперимент состоит в том,  что  мы
наудачу бросаем в эту область точку а. Термин «наудачу» здесь означает,  что
вероятность попадания точки в любую часть А ( ?  не  зависит  от  формы  или
расположения А внутри ?, а зависит лишь от «меры» области.

    Определение  9.  Эксперимент  удовлетворяет  условиям  «геометрического
определения  вероятности»,  если  его  исходы   можно   изобразить   точками
некоторой области ? в Rm так, что вероятность попадания точки в любую А (  ?
не зависит от формы или расположения А внутри ?,  а  зависит  лишь  от  меры
области А (и, следовательно, пропорциональна этой мере):

    «Мерой» мы пока будем называть длину, площадь, объем и т.д.

    Если  для   точки,   брошенной   в   область   ?,   выполнены   условия
геометрического определения вероятности, то говорят,  что  точка  равномерно
распределена в области ?.

    Пример 8. Точка наудачу бросается на отрезок [0,1].  Вероятность  точке
попасть в точку {0,5} равна нулю, так  как  мера  множества,  состоящего  из
одной точки («длина точки»), есть 0. Вместе с тем попадание  в  точку  {0,5}
не  является  невозможным  событием  —  это  один  из  элементарных  исходов
эксперимента.

                            2.2 Задача о встрече


    Пример 9. Два лица Х и У условились встретиться  в  определенном  месте
между двумя и тремя часами дня. Пришедший первым ждет другого в  течении  10
минут, после чего уходит. Чему равна  вероятность  встречи  этих  лиц,  если
каждый из  них  может  прийти  в  любое  время  в  течение  указанного  часа
независимо от другого?

    Будем считать интервал с 14 до 15 часов дня  отрезком  [0,1]  длиной  1
час. Пусть ? («кси») и ? («эта») — моменты прихода  Х  и  У  (точки  отрезка
[0,1]).Все возможные результаты эксперимента — множество точек  квадрата  со
стороной 1:

    ? = {( ? , ?): 0 ( ? (1 0 ( ? (1 }=[0,1]x[0,1]

    Можно считать, что эксперимент сводится  к  бросанию  точки  наудачу  в
квадрат. При этом благоприятными исходами являются точки множества A = {(  ?
, ?): |? - ?| ( 1/6 } (10 минут = 1/6 часа). То есть попадание  в  множество
A наудачу брошенной в квадрат точки означает, что Х и У встретятся.

    Тогда вероятность встреч и равна

                             2.3 Задача Бюффона


    Пример 10. На плоскости начерчены параллельные прямые, находящиеся друг
от друга на расстоянии 2a. На плоскость наудачу брошена игла длины 2l <  2a.
Какова вероятность того, что игла пересечет одну из прямых?

    Поймем, что означает здесь «наудачу брошена игла». Возможные  положения
иглы (отрезка) на плоскости полностью определяются положением середины  иглы
и углом поворота иглы относительно какого-либо направления. Причем  две  эти
переменные (положение центра и угол поворота) меняются  независимо  друг  от
друга. Обозначим через х([0, a] расстояние от  середины  иглы  до  ближайшей
прямой, а ? ( [0, ?] —

    угол между каким-то направлением прямых и  иглой.  Множество  возможных
положений иглы целиком определяется выбором наудачу точки из  прямоугольника
? = [0,?]  x  [0,a].  Игла  пересекает  ближайшую  прямую,  если  координаты
выбранной наудачу точки удовлетворяют неравенству: х (. l sin ?

    Площадь области А ( ?, точки которой удовлетворяют такому  неравенству,
равна

    И так как ?(?) = a?, то искомая вероятность равна

                            2.4 Парадокс Бертрана


    Пример 11 ( Josef Bertrand, “Calcul des Probabilites", 1888).

    В круге единичного радиуса наудачу выбирается хорда. Какова вероятность
того, что ее длина  будет  больше,  чем  длина  стороны  вписанного  в  круг
правильного треугольника?



    Есть по крайней мере три способа «выбрать наудачу хорду  в  круге».  1.
Зафиксируем одну точку (конец хорды) на  окружности  и  выберем  наудачу  на
окружности другую  точку  (второй  конец  хорды).  Здесь  ?  =  [0,  2?],  а
благоприятными являются положения второй точки  на  интервале  [2?/3,  4?/3]
(хорды,  помеченные  на  рисунке  красным  цветом).   Вероятность   получить
«длинную» хорду равна 1/3.



    2. Существует ровно одна  хорда,  для  которой  данная  точка  в  круге
является  серединой  (кроме  того  случая,  когда  брошенная  наудачу  точка
попадет в центр круга. Но поскольку вероятность этого  события  равна  нулю,
то учет или неучет такого события не влияет на итоговую вероятность).  Можно
поэтому выбирать наудачу хорду, бросая  наудачу  точку  (середину  хорды)  в
круг. Здесь ? —  круг  радиуса  1,  ?(?)  =  ?,  а  благоприятными  являются
положения середины хорды внутри вписанного  в  треугольник  круга  (радиусом
1/2).Вероятность получить «длинную» хорду равна отношению  площадей  кругов,
то есть 1/4.



    3.   Наконец,   можно   ограничиться   рассмотрением    только    хорд,
перпендикулярных  какому-либо  диаметру  (остальные  могут   быть   получены
поворотом). То есть эксперимент  может  состоять  в  выборе  середины  хорды
наудачу на диаметре  круга  —  отрезке  длиной  2.  Благоприятными  являются
положения середины хорды  на  отрезке  длиной  1.  Искомая  вероятность  для
такого эксперимента равна 1/2.



    В чем причина разницы в ответах на, казалось бы, один и тот же  вопрос?
На самом деле формулировка задач  и  не  корректна  с  математической  точки
зрения. «Выбор наудачу  хорды  в  круге»  может  быть  по-разному  описан  с
помощью геометрического определения вероятности (что мы и сделали). То  есть
этот «эксперимент» можно по-разному описать с помощью выбора  наудачу  точки
в некоторой области.

    Слово «эксперимент» взято  в  кавычки  не  напрасно:  сказав  «в  круге
наудачу выбирается хорда»,  мы  еще  не  описали  физического  эксперимента.
Действительно, каждому из  трех  предложенных  способов  выбора  хорд  можно
сопоставить конкретный физический эксперимент (всякий раз другой).

    Так что парадокс исчезает сразу, как только получен  ответ  на  вопрос:
что значит «в круге наудачу выбирается хорда»?

    Заканчивая обсуждение понятия геометрической вероятности, сделаем очень
важное для дальнейшего замечание.

    Замечание  7.  Если  даже  эксперимент  удовлетворяет   геометрическому
определению вероятности, далеко не для  всех  множеств  А  (  ?  вероятность
может быть вычислена как отношение меры А к мере ?. Причиной этого  является
существование так называемых «неизмеримых» множеств, то есть множеств,  мера
которых не существует.

    А если не для всех подмножеств ? мы можем  определить  их  вероятности,
следует сузить  класс  множеств,  называемых  «событиями»,  оставив  в  этом
классе только те множества, для которых мы можем определить вероятность.

    В  следующей  главе  мы  займемся   построением   (вслед   за   Андреем
Николаевичем Колмогоровым) аксиоматики теории вероятностей:  познакомимся  с
понятиями ?-алгебры (или поля) событий, вероятностной  меры,  вероятностного
пространства.

                  Раздел 3. Аксиоматика теории вероятностей


                           3.1 ? -алгебра событий


    Пусть ?  —  пространство  элементарных  исходов  некоторого  случайного
эксперимента (то есть, вообще говоря, множество  произвольной  природы).  Мы
собираемся  определить  набор  подмножеств  ?,  которые   будут   называться
событиями, и затем задать вероятность как функцию,  определенную  только  на
множестве событий.

    То есть событиями мы будем называть не любые  подмножества  ?,  а  лишь
подмножества из некоторого «множества подмножеств» ?.  При  этом  необходимо
позаботиться,  чтобы  это  множество  ?  подмножеств   ?   было   «замкнуто»
относительно введенных в параграфе  1.2  операций  над  событиями,  то  есть
чтобы объединение, пересечение, дополнение событий  (то  есть  элементов  ?)
снова давало событие (то есть элемент ? ).

    Определение 10. Множество ?, состоящее из подмножеств множества ?,  (не
обязательно всех!) называется  ?  -  алгеброй  событий,  или  ?  –  алгеброй
подмножеств ?, если выполнены следующие условия:

    (A1) ? ( ? (? -алгебра событий содержит достоверное событие);

    (A2) если [pic], то [pic] (вместе с любым событием ? -алгебра  содержит
противоположное событие);

    (A3) если А1, А2… ( ?, то

    [pic]

    (вместе с  любым  конечным  или  счетным  набором  событий  ?  -алгебра
содержит их объединение).

    Условия (A1)–(A3) часто называют «аксиомами ? - алгебры».

    Проверим, что этого набора аксиом достаточно для замкнутости  множества
? относительно других операций над событиями.

    Вместо первой аксиомы достаточно предположить, что  ?  не  пусто,  т.е.
содержит хоть один элемент.

    Свойство 1. ( ( ? (? -алгебра событий содержит невозможное событие).

    Доказательство. По (A1), ? ( ?, но ( = ?/ ? = ¬ ? ( ? в силу (A2).

    Свойство  2.  При  выполнении  (A1),(A2)  свойство  (A3)   эквивалентно
свойству (A4)

    (A4) если А1, А2… ( ?, то

    [pic]

    (вместе с  любым  конечным  или  счетным  набором  событий  ?  -алгебра
содержит их пересечение).

    Доказательство. Докажем, что при выполнении (A1),(A2) из  (A3)  следует
(A4).

    Если А1, А2… ( ?, то при всех i = 1, 2,…  по  свойству  (A2)  выполнено
[pic]

    Тогда из (A3) следует, что

    [pic]

    и, по (A2), дополнение к этому множеству также принадлежит ?, то есть

    [pic]



    Но, в силу формул двойственности,

    [pic]

    Доказательство в обратную сторону выглядит совершенно аналогично.

    Свойство 3. Если А, В( ? , то А\ В( ?

    Пример 12. Пусть ? = {1, 2, 3,  4,  5,  6}—  пространство  элементарных
исходов  (например,  при  бросании  игрального  кубика).  Следующие   наборы
подмножеств ? являются ? -алгебрами (доказать!):

    1. ? = { ? , (} ={ {1, 2, 3, 4, 5, 6},( }— тривиальная ? -алгебра.

    2. ? = { ? , (,{1},¬{1}} ={ {1, 2, 3, 4, 5, 6},(,{1},{2, 3, 4, 5, 6} }.

    3. ? = { ? , A,¬A} ={  {1,  2,  3,  4,  5,  6},(,  A,¬A  }.,  где  A  —
произвольное подмножество ? (в предыдущем примере A ={1} ).

    Итак,  мы  определили  специальный  класс  ?  подмножеств  пространства
элементарных исходов ?, названный ?  -алгеброй  событий,  причем  применение
счетного  числа  любых  операций  (таких,  как   объединение,   пересечение,
дополнение) к множествам из ? снова дает  множество  из  ?  (не  выводит  за
рамки этого класса). Множества А( ? мы и назвали «событиями».

    Определим теперь понятие «вероятности»  как  функции,  определенной  на
множестве событий  (то  есть  функции,  которая  каждому  событию  ставит  в
соответствие число). А чтобы читателю сразу  стало  понятно,  о  чем  пойдет
речь, добавим: вероятность мы определим  как  неотрицательную  нормированную
меру, заданную на ? -алгебре ? подмножеств ?.

                   3.2 Вероятность как нормированная мера


    Определение 11.

    Пусть ? — некоторое множество и ? — ? -алгебра его подмножеств. Функция
?: ? > R U {?} называется мерой на (?, ?), если она удовлетворяет условиям:

    (M1) Для любого множества А ( ? его мера неотрицательна: ?(А)? 0.

    (M2) Для любого счетного набора попарно непересекающихся  множеств  А1,
А2… ( ? мера их объединения равна сумме их мер:

     («счетная аддитивность» или «?  -аддитивность»).  Иначе  говоря,  мера
есть неотрицательная, счетно-аддитивная функция множеств.

    Определение 12.

    Пусть ? — некоторое множество и ? — ? -алгебра его подмножеств. Мера ?:
?  >  R  называется  нормированной,  если  ?(?)   =   1.   Другое   название
нормированной меры — «вероятность» или «вероятностная мера».

    То же самое еще раз и подробно:

    Определение 13.

    Пусть ? — пространство элементарных  исходов  и  ?  —  ?  -алгебра  его
подмножеств (событий). Вероятностью  или  вероятностной  мерой  на  (?,  ?),
называется функция P ? > R, обладающая свойствами:

    (P1) Для любого события А ( ? выполняется неравенство P(А)? 0;

    (P2) Для любого счетного набора попарно несовместных событий А1, А2…  (
? имеет место равенство



    (P3) Вероятность достоверного события равна единице: P(?) = 1.

    Свойства (P1)–(P3) часто называют «аксиомами вероятности».

    Определение 14.

    Тройка (?, ?,Р), в которой ? — пространство элементарных исходов, ? — ?
-алгебра  его  подмножеств  и  P  —  вероятностная  мера  на  ?,  называется
вероятностным пространством.

    Выпишем свойства вероятности:

    0. [pic]

    1. Для любого конечного набора попарно несовместимых событий А1, А2…  (
       ? имеет место равенство

    [pic]

    2. [pic]

    3. Если [pic], то [pic]

    4. Если [pic], то [pic]

    5. [pic]

    6. [pic]

    7. [pic]

    8. [pic]

    9. [pic](2)



                Раздел 4. Условная вероятность, независимость


                          4.1 Условная вероятность


    Пример 13. Кубик подбрасывается один раз. Известно,  что  выпало  более
трех очков. Какова при  этом  вероятность  того,  что  выпало  четное  число
очков?

    В данном случае  пространство  элементарных  исходов  состоит  из  трех
равновозможных элементарных исходов: ? = {4, 5, 6}, и событию  A  =  {выпало
четное число очков} благоприятствуют 2 из них: A = {4, 6}.  Поэтому  P(A)  =
2/3.

    Посмотрим на этот вопрос с точки зрения  первоначального  эксперимента.
Пространство элементарных исходов при одном подбрасывании кубика состоит  из
шести точек: ? = {1, 2, 3, 4, 5, 6} .  Слова  «известно,  что  выпало  более
трех очков» означают, что в эксперименте произошло событие B = {4,  5,  6},.
Слова «какова при этом вероятность того, что  выпало  четное  число  очков?»
означают, что нас интересует, в  какой  доле  случаев  при  осуществлении  B
происходит и А. Вероятность события  А,  вычисленную  в  предположении,  что
нечто о результате эксперимента  уже  известно  (событие  B  произошло),  мы
будем обозначать через P(A/B)

    Мы хотим вычислить отношение числа исходов, благоприятствующих А внутри
B (то  есть  благоприятствующих  одновременно  A  и  B),  к  числу  исходов,
благоприятствующих B.

    Определение 15. Условной  вероятностью  события  А,  при  условии,  что
произошло событие В, называется число

    Будем считать, что условная вероятность  определена  только  в  случае,
когда P(В) > 0.

    Следующее свойство называется "теоремой умножения":

    Теорема 6. P(A?B)  =  P(B)P(A\B)  =  P(A)P(B\A),  если  соответствующие
условные вероятности определены (то есть если P(В) > 0, P(A) > 0).

    Теорема умножения для большего числа событий:

    Теорема 7. P(A1 ? A2 ?…? An) =  P(A1)  P(A2\A1)  P(A3  \A1  ?A2)…  P(An
\A1?…?An-1)если соответствующие условные вероятности определены.

                              4.2 Независимость


    Определение 16. События A и B называются независимыми,  если  P(A?B)  =
P(A)P(B)

    Пример 14.

    1. Точка с координатами ?, ? бросается наудачу в квадрат со стороной 1.
Доказать, что для любых х, у  (R  события  A  =  {  ?  <x}  и  B=  {  ?  <y}
независимы.

    2. Точка  с  координатами  ?,  ?  бросается  наудачу  в  треугольник  с
вершинами (1,0), (0,0) и (0,1). Доказать, что события A = { ? <1/2} и  B=  {
? <1/2} зависимы.



    1. Рассмотрим х, у ( [0,1]). Видим, что P(A) = x, P(B) = y, P(A?B) =  x
y, так что A = { ? <1/2} и B= { ? <1/2} независимы.

    2. На рисунке видим, что P(A) = 3/4, P(B) = 3/4 P(A?B) = 1/2ч?  (3/4)2,
так что события A = { ? <1/2} и B= { ? <1/2}  зависимы.

    Замечание 8. Если события A и B несовместны, то они независимы, если  и
только если P(A) = 0 или P(B) = 0

    Следствие 2. Если P(B) > 0, то события А и В независимы P(А\В) =Р(А)

    Если P(А) > 0, то события А и В независимы P(В\А) =Р(В)

    Лемма 1. Если события А и В независимы, то независимы и события [pic].

    Определение  17.  События   А1,   А2…Аn   называются   независимыми   в
совокупности, если для любого набора

    1 ? i1, i2…ik ? n

           [pic])                                  (3)

    Замечание 9. Если события А1, А2…Аn независимы в совокупности,  то  они
попарно независимы, то есть любые два события Аi, Аj независимы.  Достаточно
в равенстве (3) взять k  =2.  Обратное,  как  показывает  следующий  пример,
неверно.

    Пример 15 (Пример С. Н. Бернштейна).

    Рассмотрим   правильный   тетраэдр,   3   грани   которого    окрашены,
соответственно, в красный, синий, зеленый цвета, а четвертая грань  содержит
все три цвета. Событие A, (B, C)  означает,  что  выпала  грань,  содержащая
красный (синий, зеленый) цвета.

    Вероятность каждого из этих событий равна 1/2, так как каждый цвет есть
на двух гранях из четырех. Вероятность пересечения любых двух из  них  равна
1/4, так как только одна грань содержит два цвета. А так как 1/4 = 1/2  1/2,
то все события попарно независимы.

    Но вероятность пересечения всех трех тоже равна 1/4, а не 1/8, то  есть
события не являются независимыми в совокупности.

    Заметьте, что равенство (6) выполнено для k = 2, но не выполнено для  k
= 3.

                       4.3 Формула полной вероятности


    Пример 16. Есть 3 завода, производящих одну и ту же продукцию. При этом
1-й завод  производит  25%,  2-й  завод  —  35%  и  3-й  завод  —  40%  всей
производимой продукции. Брак составляет 5% от продукции 1-го завода,  3%  от
продукции 2-го и 4% от продукции 3-го завода. Вся  продукция  смешивается  и
поступает в продажу. Найти а) вероятность  купить  бракованное  изделие;  б)
условную вероятность того, что купленное изделие  изготовлено  1-м  заводом,
если это изделие бракованное.

    Первая  вероятность  равна  доле  бракованных  изделий  в  объеме  всей
продукции, то есть

    0,05*0,25 + 0,03*0,35 + 0,04*0,4.

    Вторая вероятность равна доле брака 1-го завода среди всего  брака,  то
есть

    Определение 18. Набор попарно несовместных событий Н1, Н2…  таких,  что
P(Аi) > 0 для всех i и

    [pic]

    называется полной группой событий или разбиение пространства ?

    События Н1, Н2 …, образующие  полную  группу  событий,  часто  называют
гипотезами. При подходящем выборе гипотез для произвольного события А  могут
быть  сравнительно  просто  вычислены  P(А/  Нi)  (вероятность   событию   А
произойти при  выполнении  «гипотезы»  Нi)  и  собственно  P(Нi)(вероятность
выполнения «гипотезы» Нi).

    Теорема 8 (Формула полной вероятности).

    Пусть Н1, Н2 — полная группа событий. Тогда вероятность любого  события
A может быть вычислена по формуле:

                             4.4 Формула Байеса


    Теорема 9 (Формула Байеса).

    Пусть Н1,  Н2  …—  полная  группа  событий  и  A  —  некоторое  событие
положительной вероятности. Тогда условная вероятность того, что имело  место
событие Нk, если в результате  эксперимента  наблюдалось  событие  A,  может
быть вычислена по формуле:



    Пример 17. Вернемся к примеру 15. Изделие выбирается  наудачу  из  всей
произведенной продукции. Рассмотрим три гипотезы: Нi = {изделие  изготовлено
i-м заводом }, i = 1, 2, 3. Вероятности этих событий  даны:  P(Н1)  =  0,25,
P(Н2) = 0,35, P(Н3) = 0,4 . Пусть A  =  {изделие  оказалось  бракованным  }.
Даны также условные вероятности P(A\Н1) = 0,05, P(A\Н2) =  0,03,  P(A\Н3)  =
0,04

    Пример 18. Два стрелка подбрасывают монетку  и  выбирают,  кто  из  них
стреляет по мишени (одной  пулей).  Первый  стрелок  попадает  по  мишени  с
вероятностью 1, второй стрелок — с вероятностью 0,00001. Можно  сделать  два
предположения об эксперименте:

    Н1 = {стреляет 1-й стрелок}

    Н2 = { стреляет 2-й стрелок } .

    Априорные (a’priori —«до опыта») вероятности  этих  гипотез  одинаковы:
P(Н1) = P(Н1) = 1/2.

    Рассмотрим событие A = {пуля попала в мишень}. Известно, что

    P(A\Н1) = 1, P(A\Н2) = 0,00001

    Поэтому вероятность пуле попасть в мишень P(A) =  1/2*1 +  1/2*0,00001.
.  Предположим,  что  событие  A   произошло.  Какова  теперь  апостериорная
(a’posteriori — «после опыта») вероятность каждой из гипотез  Нi?  Очевидно,
что первая из этих гипотез много вероятнее второй (а именно, в 100000  раз).
Действительно,

                          Раздел 5. Схема Бернулли


               5.1 Распределение числа успехов в n испытаниях


    Определение   19.   Схемой   Бернулли   называется   последовательность
независимых испытаний, в каждом  из  которых  возможны  лишь  два  исхода  —
«успех» и «неудача»,  при  этом  «успех»  в  одном  испытании  происходит  с
вероятность р ( [0,1], «неудача» — с вероятностью q = 1 - p.

    Теорема 10 (Формула Бернулли).

    Обозначим через vn число успехов в n испытаниях схемы  Бернулли.  Тогда
для любого k = 0, 1, …n



    Доказательство. Событие A ={ vn = k} означает, что в n испытаниях схемы
Бернулли произошло ровно k успехов. Рассмотрим  один  из  благоприятствующих
событию A  элементарных исходов:



    Здесь  буквами  «у»  и  «н»  обозначены,  соответственно,  успешный   и
неудачный результаты испытаний. Поскольку испытания независимы,  вероятность
такого  элементарного  исхода  (первые  k  испытаний  завершились   успехом,
остальные неудачей) равна pk(1 - p)n-k.

    Другие благоприятствующие событию A элементарные исходы  отличаются  от
рассмотренного  выше  лишь  расположением  k  успехов  на  n  местах.   Есть
ровно[pic] способов расположить k успехов на n  местах.  Поэтому  событие  A
состоит из [pic] элементарных исходов, вероятность каждого из которых  равна
pk(1 - p)n-k.

    Определение 20. Набор чисел

    называется биноминальным распределением  вероятностей   и  обозначается
Вnp или B(n,p).

    Теорема 11 Пусть m1, m2 целые числа, 0 ( m1 ( m (   m2  (  n  Обозначим
через Рn(m1,m2) вероятность того, что событие А наступило не менее m1  и  не
более m2 раз в n испытаниях. Тогда

    [pic]

                    5.2 Наиболее вероятное число успехов


    По формуле Бернулли, событие «произошло 0 успехов в n испытаниях» имеет
вероятность qn , 1 успех — вероятность n p qn и т.д. Какое же число  успехов
наиболее вероятно? Иначе говоря, при каком k достигается максимум P(vn=k)?

    Чтобы выяснить это, сравним отношение P(vn=k)и P(vn=k-1)с единицей.



    Видим, что

    (a) Р(vn = k) > Р(vn = k-1) при np + p – k > 0, то есть при k < np + p;

    (b) Р(vn = k) < Р(vn = k-1 )при np + p – k < 0, то есть при k > np + p;

    (c) Р(vn = k) = Р(vn = k-1 при np + p – k = 0, что возможно  лишь  если
np + p — целое число.

    Рассмотрим два случая: np + p –целое число и  np + p – дробное число. В
первом случае пусть k0 = np  +  p.  Из  полученных  выше  неравенств,  сразу
следует, что



    Во втором случае пусть k0 = [np + p] (целая часть числа np + p, то есть
наибольшее целое число, не превосходящее np + p).  Из  неравенств  (a),  (b)
следует, что



    Действительно, неравенство Р(vn = k0) > Р(vn = k0+1), например, следует
из (b), примененного для

    k = k0+1 > np + p.

    Видим, что в зависимости от того, является число 1 > np + p  целым  или
нет, имеется либо два равновероятных «наиболее вероятных» числа  успехов  k0
= np + p и k0 –1 > np + p - 1,либо одно «наиболее вероятное»  число  успехов
k0 = [np + p].

    Сформулируем уже доказанное утверждение в виде теоремы.

    Теорема 12. В n испытаниях  схемы  Бернулли  с  вероятностью  успеха  p
наиболее вероятным числом успехов является

    a) единственное число k0 = [np + p], если число np + p не целое;

    б) два числа k0 = np + p и k0 -1= np + p -1, если число np + p целое.

    Пример 19. Если p = q = 1/2, то при четном числе испытаний n число np +
p = n/2 + 1 /2— не целое, так что наиболее вероятным  является  единственное
число успехов [n/2 + 1 /2] = n/2.  Что  совершенно  понятно,  так  как  есть
нечетное число возможностей — получить 0, 1, …n успехов, причем  вероятности
получить k и n-k успехов одинаковы.

    При нечетном же числе испытаний n число np + p = n/2 + 1 /2   —  целое,
так что наиболее вероятными (и  одинаково  вероятными)  являются  два  числа
успехов n/2 + 1 /2 и n/2 - 1 /2.

                    5.3 Номер первого успешного испытания


    Рассмотрим схему Бернулли с вероятностью успеха p  в  одном  испытании.
Испытания проводятся до  появления  первого  успеха.  Введем  величину  ?  ,
равную номеру первого успешного испытания.

    Теорема 13. Вероятность того, что первый успех произойдет в испытании с
номером k, равна

    P(? = k) = p qk-1.

    Доказательство. Действительно,



    Определение  21.  Набор  чисел  {p  qk-1  }  называется  геометрическим
распределением вероятностей и обозначается Gp или G(p).

    Геометрическое   распределение   вероятностей    обладает    интересным
свойством, которое можно назвать свойством «нестарения».  Пусть  величина  ?
обозначает,  скажем,  время  безотказной  работы  (измеряемое  целым  числом
часов) некоторого устройства. Предположим, что для  величины  ?  вероятность
принять любое свое значение k в точности равна pqk-1. Справедливо  следующее
утверждение.

    Теорема 14. Пусть P(?  = k) = p qk-1. Тогда для произвольных n, k ( 0

    P(?  > n+k\ ?  > n) = P(?  > k)

    Данному равенству можно придать следующее звучание: если известно,  что
устройство проработало без отказов n часов, то вероятность ему работать  еще
не менее k часов точно такая же, как  вероятность  проработать  не  менее  k
часов для нового устройства.

    Можно прочесть эту формулу и так:  вероятность  работающему  устройству
проработать еще сколько-то часов  не  зависит  от  того  момента,  когда  мы
начали отсчет времени, или от того, сколько уже работает устройство.

    Доказательство. По определению условной вероятности,

                            (4)



    Последнее равенство следует из того, что  событие  {?   >  n+k}  влечет
событие {?  > n}, так что пересечение этих событий есть {?  >  n+k}.  Найдем
для произвольного m ( 0 вероятность P(?  > m).



    Можно также заметить, что событие  {?   >  m}  означает,  что  в  схеме
Бернулли первые m испытаний завершились «неудачами»,  а  это  событие  имеет
вероятность как раз qm.

    Возвращаясь к (4), получим



       5.4 Приближение гипергеометрического распределения биномиальным


    Рассмотрим урну, содержащую N шаров, из которых  K  шаров  —  белые,  а
оставшиеся N-K шаров — черные. Из урны наудачу (без возвращения)  выбираются
n шаров. Вероятность  PN,K(n, k) того, что будет выбрано ровно k белых и  n-
k   черных   шаров,   находится    по    формуле    (см.    определение    8
гипергеометрического распределения вероятностей):

    Если число шаров в урне очень велико, то извлечение одного, двух,  трех
шаров почти не меняет пропорцию  белых  и  черных  шаров  в  урне,  так  что
вероятности PN,K(n, k) не  очень  отличаются  от  вероятностей  в  процедуре
выбора с возвращением

    P(получить ровно k белых шаров при выборе n шаров с возвращением) =



    Сформулируем нашу первую предельную теорему.

    Теорема 15. Если N > ? и K > ? так, что K/N > p ( (0, 1)  то для  любых
фиксированных n, 0<=k<=n

              5.5 Независимые испытания с несколькими исходами


    Рассмотрим следующий пример, когда из двух очень  похожих  вопросов  на
один можно  ответить,  пользуясь  формулой  Бернулли,  а  для  другого  этой
формулы оказывается недостаточно:

    Пример 20. Игральная кость подбрасывается  15  раз.  Найти  вероятности
следующих событий:

    а) выпадет ровно 10 шестерок;  б)  выпадет  ровно  10  шестерок  и  три
единицы.

    а)  есть  15  испытаний  схемы  Бернулли  с  вероятностью  успеха   1/6
(выпадение шестерки). Вероятность десяти успехов в 15 испытаниях равна

     [pic]

    б) здесь каждое  испытание  имеет  три,  а  не  два  исхода:  выпадение
шестерки, выпадение единицы,  выпадение  остальных  граней.  Воспользоваться
формулой для числа успехов в схеме Бернулли не удается — перед нами  уже  не
схема Бернулли.

    Осталось изобрести формулу для подсчета вероятности  каждому  исходу  в
нескольких независимых испытаниях выпасть нужное число  раз,  если  в  одном
испытании возможно не два, а более исходов.

    Пусть в одном испытании возможны m исходов. Обозначим их цифрами 1,  2,
…m. Пусть исход i в одном испытании случается с вероятностью рi, 1 ? i  ?  m
и

    [pic]

    Обозначим через Р(n1,n2,…,nm) вероятность того, что в n = n1+ n2+  …+nm
независимых испытаний исход 1 появился n1, раз, исход 2 – n2 раз,…

    Теорема 16. Для любого n и любых целых n1 ? 0… nm ? 0  таких,  что  n1+
n2+ …+nm = n, верна формула:

    [pic]

    Доказательство. Рассмотрим один элементарный исход,  благоприятствующий
выпадению n1 единиц, n2 двоек, … , nm  раз m-ок:

    [pic]

    Это результат n экспериментов, когда  все  нужные  исходы  появились  в
некотором  заранее  заданном  порядке.  Вероятность  такого   результата   n
независимых испытаний равна

    [pic]

    Все остальные благоприятные исходы отличаются лишь расположением  чисел
1, 2, …m на n местах. Число таких исходов равно  числу  способов  расставить
на n местах n1 единиц, n2 двоек, , … , nm  раз чисел m, то есть

    [pic]

    Теперь мы можем вернуться к примеру 20(б) и  выписать  ответ:  так  как
вероятности выпадения шестерки и единицы равны 1/6, а  вероятность  третьего
исхода (выпали любые другие грани) равна 4/6,  то  вероятность  получить  10
шестерок, 3 единицы и еще 2 других очка равна

    [pic]

                   5.6 Теорема Пуассона для схемы Бернулли


    Предположим, нам нужна вероятность получить не менее десяти  успехов  в
1000 испытаний схемы  Бернулли  с  вероятностью  успеха  0.003.  Вероятность
этого события равна любому из следующих выражений:

    [pic]

    и вычисление даже одного слагаемого в каждом из этих  выражений  весьма
проблематично.

    Сформулируем теорему о приближенном вычислении вероятности  какого-либо
числа  успехов  в  большом  числе  испытаний  схемы  Бернулли  с   маленькой
вероятностью успеха. Термин «большое число» должен означать n > ?. Если  при
этом p = pn> 0,то,  очевидно,  вероятность  получить  любое  конечное  число
успехов при растущем числе испытаний  стремится  к  нулю.  Необходимо  чтобы
вероятность успеха p = pn> 0 одновременно с ростом числа  испытаний.  Но  от
испытания к испытанию вероятность успеха меняться не может (см.  определение
схемы Бернулли).

    Поэтому рассмотрим «схему серий»: есть

    одно испытание ?   с вероятностью успеха p1

    два испытания ? , ?     с вероятностью успеха p2

    …

    n испытаний ? , … , ?   с вероятностью успеха pn

    …

    Вероятность успеха меняется не внутри одной серии испытаний, а от серии
к серии, когда меняется общее число  испытаний.  Обозначим  через  vn  число
успехов в n-той серии испытаний.

    Теорема 17 (Теорема Пуассона).

    Пусть n > ? , pn> 0 так, что n pn> ? >  0.  Тогда  для  любого  k  ?  0
вероятность получить k успехов в n испытаниях схемы Бернулли с  вероятностью
успеха pn стремится к величине

    [pic]
(5)

    [pic]для n > ? , pn> 0 так, что n pn> ?

    Определение 22. Пусть ? > 0— некоторая постоянная.  Набор  чисел  [pic]
называется распределением Пуассона с параметром ?.

    Пользуясь теоремой 17, можно приближенно посчитать вероятность получить
не менее десяти успехов в  1000  испытаний  схемы  Бернулли  с  вероятностью
успеха 0.003, с вычисления которой мы начали. Поскольку n =  1000  «велико»,
а pn = 0.003 «мало», то, взяв ? = n pn = 3  ,  можно  написать  приближенное
равенство

    [pic](6)

    Осталось решить, а достаточно ли n=103 «велико», а pn =  0.003  «мало»,
чтобы заменить точную вероятность P(vn = k) на приближенное значение

    [pic]

    Для  этого  нужно   уметь   оценивать   разницу   между   этими   двумя
вероятностями.

    Теорема 18 (Теорема Пуассона с оценкой погрешности).

    Пусть A ( {0, 1, …, n}  — произвольное множество целых  неотрицательных
чисел, vn — число успехов в  n  испытаниях  схемы  Бернулли  с  вероятностью
успеха p, ? = n p. Тогда

    [pic]

    Таким образом, теорема 18 предоставляет нам возможность  самим  решать,
достаточно ли n «велико», а p «мало»,  руководствуясь  полученной  величиной
погрешности.

    Какова же погрешность в формуле (6)?

    [pic]



    Погрешность не более 0,009 (при вероятности  около  0,001).  Во  всяком
случае, можно утверждать, что  искомая  вероятность  никак  не  больше,  чем
0,01=0,001+0,009.

    Рассмотрим еще одну формулу приближенного вычисления  pn  (m)  когда  n
велико. В отличии от предыдущего результата число успехов m  в  этом  случае
тоже растет с ростом n, а вероятность успеха постоянна.

    Локальная теорема Муавра – Лапласа

    Пусть   [pic].Предположим,   что    [pic]и    величины    [pic]являются
ограниченными. Тогда

    [pic]

    В частности, если [pic], то

    [pic]

    Доказательство:

    В силу ограниченности величин  [pic]  разность  [pic]вместе  с  n  и  m
Воспользуемся формулой Стирлинга

    [pic]

    [pic]

    В силу определения [pic]

    [pic]



               Раздел 6. Случайные величины и их распределения


                           6.1 Случайные величины


    Мы уже видели, что для очень многих экспериментов нет никаких  различий
в подсчете вероятностей  событий,  тогда  как  элементарные  исходы  в  этих
экспериментах  очень  различаются.  Но  нас  и  должны  интересовать  именно
вероятности событий,  а  не  структура  пространства  элементарных  исходов.
Поэтому пора во всех  таких  «похожих»  экспериментах  вместо  самых  разных
элементарных  исходов  использовать,  например,  числа.   То   есть   ввести
соответствие (иначе говоря,  отображение)  между  элементарными  исходами  и
вещественными числами (с ними удобно работать).

    Пусть имеется случайный эксперимент и задано вероятностное пространство
(?, ?,Р).

    Определение 23. Функция ?: ? >R называется  случайной  величиной,  если
для любого х ( R множество { ? < x} = {?: ?(?) < x}  является  событием,  то
есть принадлежит ?-алгебре событий ?.

    Замечание 10. Можно смело считать,  что  любое  множество  элементарных
исходов  есть   событие,   и,   следовательно,   случайная   величина   есть
произвольная функция из ? в R. Никаких неприятностей на практике это  обычно
не влечет.

    Определение 24.  Будем  говорить,  что  функция  ?:  ?  >R  является  ?
-измеримой, если {?: ?(?) < x} принадлежит ? для любого х ( R.

    Итак, случайная  величина  есть  ?  -  измеримая  функция,  ставящая  в
соответствие каждому элементарному исходу ? ( ? число ?(?) ( R.

    Пример 21. Подбрасываем 1 раз кубик. Пусть ? = {1, 2, 3, 4, 5, 6}  ,  и
две функции из ? в заданы так: ?(?)= ? , ?(?)= ?2.

    Если ? есть множество всех подмножеств ?, то ? и ? являются  случайными
величинами, поскольку любое множество элементарных исходов принадлежит ?,  в
том числе и  {?:  ?(?)  <  x}   или  {?:  ?  (?)  <  x}   .  Можно  записать
соответствие  между  значениями  случайных  величин  ?  и  ?   вероятностями
принимать эти значения в  виде  «таблицы  распределения  вероятностей»  или,
коротко, «таблицы распределения»:



|?  |1  |2  |3  |4  |5  |6  |
|Р  |1/6|1/6|1/6|1/6|1/6|1/6|


|?  |1  |4  |9  |16 |25 |36 |
|Р  |1/6|1/6|1/6|1/6|1/6|1/6|


    Здесь 1/6 = Р(?=1)=…= Р(?=6) = Р(? =1)= …= Р(? =36)

    Пусть ? -алгебра событий ? состоит всего из четырех множеств:

    ? = { ? ,(, {1,3,5},{2,4,6} }

    то есть событием является, кроме достоверного и  невозможного  событий,
выпадение четного (соответственно, нечетного)  числа  очков.  Убедимся,  что
при такой «бедной» ? -алгебре ни ?, ни ? не являются случайными  величинами,
так как эти функции не ? - измеримы. Возьмем (например) x  =  3,967.  Видим,
что

    {? ( ?: ?(?) < 3,967}= {1, 2, 3}( ? и {? ( ?: ? (?) < 3,967}= {1}( ?

    Теперь  попробуем  понять,  зачем  нужна  ?  -  измеримость  и   почему
требуется, чтобы {?: ?(?) < x} являлось событием.

    Если задана случайная величина ?,  нам  может  потребоваться  вычислить
вероятности типа

    P(? = 5) =  P{?: ?(?) = 5},

    P (? ( [-3,7]),

    P(? ( 3,2),

    P(? > 0)

    (и вообще самые разные вероятности попадания в различные  множества  на
прямой).  Это  возможно  только   если   множества,   стоящие   под   знаком
вероятности, являются событиями (напомню, что вероятность есть функция из  ?
- алгебры событий в [0,1]).

    Но если потребовать, чтобы Ax = {?: ?(?) < x} было событием  при  любом
x, то мы из свойств ? - алгебры сразу получим, что

    и [pic]— событие, и [pic]— событие,

    и [pic]— событие,

    и     {?:     ?(?)     =     x}=     Bx     \     Ax     —     событие,
      (7)

    и т.д., и т.п. (операции пересечения, объединения,  дополнения  событий
не выводят из класса событий).

    Можно потребовать в определении 23 чего-нибудь другого. Например, чтобы
событием было попадание в любой интервал: (?: ?(?) ( [a, b]) для любых  a  <
b.

    Или чтобы {?: ?(?) (  x}  было  событием  для  любого  x.  Любое  такое
определение эквивалентно исходному.

    Опишем   различные   типы   распределений   случайных   величин.    Под
распределением случайной величины мы будем понимать соответствие

           «значение  случайной  величины  ?  вероятность   принимать   это
      значение»,

    либо (чаще)

           «множество на прямой ? вероятность случайной величине попасть  в
      это множество».

                        6.2 Дискретные распределения


    Определение 25. Говорят, что  случайная  величина  ?  имеет  дискретное
распределение, если существует конечный или счетный набор чисел {a1, a2,  …}
такой, что:

    а) pi = P{ ? = ai} > 0 для всех i;

    б)[pic].

    То есть случайная величина ? имеет дискретное распределение,  если  она
принимает не более чем счетное число значений.

    Определение  26.   Если   случайная   величина   ?   имеет   дискретное
распределение, назовем таблицей распределения соответствие ai ? pi,  которое
чаще всего рисуют так:



|?  |а1 |а2 |а3 |…  |
|Р  |р1 |р2 |р3 |…  |


                    6.3 Примеры дискретных распределений


    Вырожденное распределение.


    Говорят, что случайная величина ?  имеет  вырожденное  распределение  с
параметром а, и пишут ? ( Ia если ?  принимает  единственное  значение  а  с
вероятностью 1, то есть P(? = a) = 1. Таблица распределения ? имеет вид

|?  |а  |
|Р  |1  |


    Распределение Бернулли.


    Говорят, что  случайная  величина  ?  имеет  распределение  Бернулли  с
параметром р,  и  пишут  ?  (  Вр,  если  ?  принимает  значения  1  и  0  с
вероятностями р и 1 -  р,  соответственно.  Случайная  величина  ?  с  таким
распределением равна числу  успехов  в  одном  испытании  схемы  Бернулли  с
вероятностью успеха (0 успехов или 1 успех). Таблица распределения  ?  имеет
вид

|?  |0    |1             |
|Р  |(1-p)|р             |


    Биномиальное распределение.


    Говорят, что случайная величина ? имеет  биномиальное  распределение  с
параметрами n и p, где 0 ( p (, n  и  пишут  ?  (  Вn,р,  если  ?  принимает
значения 0, 1, …,n с вероятностями P(?  = k) = Cnk pk (1-p)n-k  .  Случайная
величина ? с таким распределением имеет смысл числа успехов в  n  испытаниях
схемы Бернулли с вероятностью успеха р .

    Таблица распределения ? имеет вид



|?  |0    |1         |…   |k             |…    |n            |
|Р  |(1-p)|n         |…   |Cnk pk        |…    |Pn           |
|   |n    |p(1-p)n-1 |    |(1-p)n-k      |     |             |


    Геометрическое распределение.


    Говорят, что случайная величина ? имеет геометрическое распределение  с
параметром р, где 0 ( p (, n, и пишут ? ( Gр, если ? принимает  значения  1,
2, 3, …с вероятностями P(? = k) = p (1-p)k-1. Случайная величина ?  с  таким
распределением имеет  смысл  номера  первого  успешного  испытания  в  схеме
Бернулли с вероятностью успеха р .

    Таблица распределения ? имеет вид



|?  |1      |2           |…           |k         |…    |
|Р  |p      |Р (1 – р)   |…           |p (1-p)k-1|…    |


    Распределение Пуассона.


    Говорят, что  случайная  величина  ?  имеет  распределение  Пуассона  с
параметром ?, где ? > 0 , и ? ( П ?, если ? принимает значения 0, 1, 2  …  с
вероятностями

    [pic]

    Таблица распределения ? имеет вид



|?  |1      |2           |…           |k         |…    |
|Р  |е- ?   |? е- ?      |…           |(?k /k!)е-|…    |
|   |       |            |            |?         |     |


    Гипергеометрическое распределение.


    Говорят,   что   случайная   величина   ?   имеет   гипергеометрическое
распределение с параметрами n, N и K, K ( N,   n ( N если ? принимает  целые
значения от max (0, N - K – n ) до min (K ,n ) с вероятностями

    [pic]

    . Случайная величина ? с таким распределением имеет смысл  числа  белых
шаров среди n шаров выбранных наудачу и без возвращения из урны,  содержащей
К белых шаров и N-K не белых.

    Заметьте, что со всеми этими распределениями мы уже хорошо знакомы.

    Но распределения случайных величин далеко не исчерпываются  дискретными
распределениями. Так, например, если  точка  бросается  наудачу  на  отрезок
[0,1], то можно задать случайную величину, равную координате этой точки.  Но
число значений этой случайной величины несчетно, так  что  ее  распределение
дискретным не является. Да и вероятность  этой  случайной  величине  принять
каждое из своих возможных значений (попасть в точку) равна нулю. Так что  не
только таблица распределения не  существует,  но  и  соответствие  «значение
величины ( вероятность  его  принять»  ничего  не  говорит  о  распределении
случайной величины.

    Какими же характеристиками еще можно описать распределение?

                       Раздел 7. Функция распределения


    Заметим, что на том же отрезке [0, 1] вероятности попадания в множества
положительной меры  совсем  не  нулевые.  И  термин  «наудачу»  мы  когда-то
описывали как раз в  терминах  вероятностей  попадания  в  множество.  Может
быть, разумно описать распределение случайной  величины,  задав  для  любого
множества,  вероятность   принять   значения   из   этого   множества?   Это
действительно полное описание  распределения,  но  уж  очень  трудно  с  ней
работать — слишком много множеств на прямой.

    Нельзя ли  обойтись  заданием  вероятностей  попадания  в  какой-нибудь
меньший набор  множеств  на  прямой?  Оказывается,  что  можно  ограничиться
только вероятностями попадания в интервалы  (-(,  х)  для  всех  х  (  R,  с
помощью которых можно будет определить и вероятность попасть в любое  другое
множество.

    Замечание  11.  Можно  с  таким   же   успехом   ограничиться   набором
вероятностей попадания в интервалы (-(, х], или в (х ,(), или в [х ,(),  или
в (х1 ,x2). Впрочем, последних уже слишком много.

    Определение 27.Функцией распределения  случайной величины ?  называется
функция F?(x) : R ( [0, 1], при каждом x ( R равная  F?(x)  =  P(?  <  x)  =
P{?: ?(?) < x}

    Пример 22. Случайная величина ?  имеет  вырожденное  распределение  Ic.
Тогда

    [pic]



    Пример 23. Случайная величина ? имеет распределение Бернулли Вр. Тогда

    [pic]



    Пример 24. Будем говорить, что случайная величина ?  имеет  равномерное
распределение на отрезке [a, b] и писать ? ( Ua,b (“  uniform”),  если  ?  —
координата точки, брошенной наудачу на отрезок [a, b]  числовой прямой.  Это
распределение можно задать и с помощью функции распределения:

    [pic]



                     7.1 Свойства функции распределения


    Теорема 19.

    Функция распределения F?(x)  обладает следующими свойствами:

    F1) Функция распределения F?(x)  не убывает: если х1 <  x2  то  F?(x1)<
F?(x2);

    F2) Существуют пределы

    [pic]      и       [pic]

    F3) Функция распределения F?(x)  непрерывна слева:

    [pic]



    Теорема 20.  Если  функция  F:  R  (  [0,  1]  удовлетворяет  свойствам
(F1)–(F3), то F есть функция распределения некоторой случайной  величины  ?,
то есть найдется вероятностное пространство (?, ?, Р) и  случайная  величина
? на этом пространстве, что F(х) = F?(x).

    Прочие полезные свойства функций распределения


    F4) В любой точке х0 разница F?(х0+0) - F?(х0) равна P(? = х0):

    Следствие 3. Если функция распределения F?(x) непрерывна в точке х0, то


                            P(? = х0) = 0


    F5) Для любой случайной величины ? имеет место равенство P(а ( ? < b) =
F?(a) - F?(b).

    Если же функция распределения  F?(x)  непрерывна  (для  любого  x,  или
только в точках a и b), то

           P(а ( ? < b) = P(а < ? < b) = P(а ( ? ( b) = P(а <  ?  (   b)  =
      F?(a) - F?(b)



    Функция распределения дискретного распределения


    Мы уже видели, как выглядят функции распределения некоторых  дискретных
распределений. Из свойств (F4), (F5) следует

    Свойство 4. Случайная величина ? имеет дискретное распределение тогда и
только тогда, когда функция распределения  F?  —  ступенчатая  функция.  При
этом возможные значения ? — точки ai скачков F?, и

    pi = P(? = ai ) = F? (ai + 0) - F? (ai )— величины скачков.

    В  следующей  главе   мы   рассмотрим   случайные   величины,   функции
распределения которых не удовлетворяют свойству 4 хотя бы  потому,  что  они
вовсе  не  имеют  разрывов.   Более   того,   мы   выделим   класс   функций
распределения, которые «восстанавливаются по своей  производной»  с  помощью
интегрирования (так называемые абсолютно непрерывные функции).

                Раздел 8. Абсолютно непрерывные распределения


    Определение  28.Случайная  величина  ?   имеет   называемые   абсолютно
непрерывное распределение, если  существует  неотрицательная  функция  f?(x)
такая, что для любого х ( R функция распределения F?(x) представима в виде

    [pic]

    При этом функция f?(x) называется  плотностью  распределения  случайной
величины ?.

    Теорема 21.Плотность распределения обладает свойствами:

    (f1) f?(x)( 0  для любого x;

    (f2) [pic]

    Эти два свойства полностью характеризуют класс плотностей:

    Лемма 2. Если функция f обладает свойствами (f1) и (f2), то  существует
вероятностное пространство и случайная величина ? на  нем,  для  которой   f
является плотностью распределения.

    Доказательство. Пусть ? есть область, заключенная между осью абсцисс  и
графиком функции f (« подграфик» функции  f). Площадь области ? равна  1  по
свойству (f2). И пусть случайная величина ?  есть  абсцисса  точки,  наудачу
брошенной в эту область.

    Тогда (вспомнить геометрическую вероятность) для любого х ( R

    [pic]

    то есть f является плотностью распределения случайной величины ?

    Свойства плотностей


    (f3)  Если   случайная   величина   ?   имеет   абсолютно   непрерывное
распределение, то ее функция распределения всюду непрерывна.

    Следствие 4. Если случайная  величина  ?  имеет  абсолютно  непрерывное
распределение, то P(? = х) = 0 для любого х ( R.

    (f4)  Если   случайная   величина   ?   имеет   абсолютно   непрерывное
распределение, то ее функция распределения дифференцируема почти всюду, и

    [pic]

    для почти всех х.

    Замечание 12.  Термин  для  «почти  всех»  означает  «для  всех,  кроме
(возможно) х из некоторого множества нулевой меры  (длины)».  Заметьте,  что
стоящую под  интегралом  функцию  можно  изменить  в  одной  точке  (или  на
множестве нулевой длины), и интеграл (« площадь  подграфика»)  от  этого  не
изменится.

    (f5)  Если   случайная   величина   ?   имеет   абсолютно   непрерывное
распределение, то

    [pic]

    Доказательство. Действительно,

    [pic]

    Остальные равенства вытекают из следствия 5.

               8.1 Примеры абсолютно непрерывных распределений


    Равномерное.

    Это распределение нам уже знакомо. Говорят,  что  ?  имеет  равномерное
распределение на отрезке [a, b], и пишут ? ( Ua,b если

    [pic]

    Заметьте, что в точках a и b функция распределения недифференцируема, и
плотность можно задать как угодно.

    Показательное.

     Говорят, что ? имеет показательное распределение с параметром ?, ? > 0
 и ? ( Е?, если

    [pic]

    Показательное распределение является единственным абсолютно непрерывным
распределением, для которого выполнено свойство  «не  старения»  (и  в  этом
смысле  оно  является  непрерывным  аналогом   дискретного   геометрического
распределения).

    Теорема 21. Свойство «Не старения». Пусть ? ( Е?. Тогда для любых х,  у
> 0

    [pic]

    Нормальное.

    Говорят, что ? имеет нормальное распределение с параметрами а  и  ?2  ,
где а (  R,  ?  >  0,  и  пишут  ?  (   если  ?  имеет  следующую  плотность
распределения:

    [pic]для любого x ( R

    Убедимся, что f?(x)действительно является плотностью распределения. Так
как f?(x) > 0  для  всех  x  (  R,  то  свойство  (f1)  выполнено.  Проверим
выполнение (f2). Используем табличный интеграл (интеграл Пуассона)

    [pic]

    Нормальное  (иначе  называемое  гауссовским  по  имени   Карла   Гаусса
распределение  играет  исключительно  важную  роль  в  теории  вероятностей,
поэтому мы очень подробно изучим все свойства этого распределения.

                   8.2 Свойства нормального распределения


    Нормальное распределение задается, как мы видим,  с  помощью  плотности
распределения. Связано это с  тем,  что  нельзя  выписать  первообразную  от
функции[pic] иначе как  в  виде  интеграла,  поэтому  функцию  распределения
этого закона можно записать лишь в таком виде:

    [pic]

    Мы часто  будем  использовать  обозначение  для  функции  распределения
нормального распределения с параметрами а и ?2.



    Стандартное нормальное распределение


    Нормальное распределение при [pic] а = 0 и ?= 1 называется  стандартным
нормальным распределением. Плотность стандартного нормального  распределения
имеет вид

    [pic]для любого x ( R

     а функция распределения

    [pic]

    табулирована (то есть ее значения вычислены при многих х) почти во всех
математических справочниках. Установим связь между

    [pic]

    Свойство 5. Для любого x ( R справедливо соотношение

    [pic]

    То же самое на языке случайных величин можно сформулировать так:

    Следствие 5. Если [pic] то

    Следствие 6. Если [pic] то

    [pic]

    Как   мы   видим,   вычисление   любых   вероятностей   для   нормально
распределенной   случайной   величины   сводится   к   вычислению    функции
распределения Ф0,1. Ее свойства

    Свойство 6. Ф0,1(0) = 0,5

    Свойство 7. Ф0,1(-х) = 1 - Ф0,1(х)

    Свойство 8. Если ? ( N0,1, то

    [pic]

    Свойство 9 (« Правило трех сигм»).

    Если [pic]то[pic]

    Смысла в запоминании числа 0.0027 нет  никакого,  а  вот  помнить,  что
почти вся масса нормального распределения сосредоточена в границах [a -  3?,
a - 3?] всегда полезно.

    Смысла в запоминании числа 0.0027 нет  никакого,  а  вот  помнить,  что
почти вся масса нормального распределения сосредоточена  в  границах  [a-3?,
a+3?], всегда полезно.

               Раздел 9. Случайные вектора и их распределения


    Определение  29.  Если  случайные  величины  [pic]  заданы   на   одном
вероятностном пространстве, то вектор ([pic]) мы  будем  называть  случайным
вектором.

    Определение  30.  Функция  [pic]  называется   функцией   распределения
случайного вектора ([pic]) или функцией совместного распределения  случайных
величин [pic].

               9.1 Свойства функции совместного распределения


    Для простоты обозначений  все  дальнейшие  рассуждения  и  формулировки
приводятся в случае n = 2 для случайного вектора ([pic])

    F0) [pic]

    F1) [pic] не убывает по каждой координате вектора (x1 x2).

    F2) Для любого i = 1, 2, существуют

    [pic]

    [pic]

    При этом

    [pic]

    F3) Функция [pic]  по каждой  координате  вектора  (x1  x2)  непрерывна
слева.

    Только теперь этих свойств оказывается недостаточно для описания класса
функций совместного распределения. Иначе  говоря,  выполнение  этих  свойств
для некоторой функции F: R2 (  R  вовсе  не  гарантирует,  что  эта  функция
является функцией распределения некоторого случайного вектора.

    Пример 25. Функция

    [pic][pic]

    a) удовлетворяет всем свойствам (F0)-(F3);

    б) не является функцией распределения никакого вектора (?1,  ?2.)  хотя
бы потому, что, найдись такой вектор, найдется и  прямоугольник  [a1  b1]  x
[a2 b2], вероятность попасть в который (вычисленная с помощью этой  «функции
распределения») отрицательна:

    P(a1 ( ?1< b1 , a2 ( ?2<b2 ) < 0!

    Как же связана вероятность вектору попасть в прямоугольник  с  функцией
распределения этого вектора?

    Упражнение. Доказать, что

    P(a1 ( ?1< b1 , a2 ( ?2<b2 )= F ?1 ?2 (b1, b2) - F ?1 ?2 (a1, b2)  -  F
?1 ?2 (b1, a2) + F ?1 ?2 (a1, a2)       (8)

    Оказывается, если потребовать дополнительно от  функции  F,  чтобы  для
всякого [a1 b1] x [a2 b2] вероятность  P(a1  (  ?1<  b1]  ,  [a2  (  ?2<b2],
связанная с  функцией  F  равенством  (8),  была  неотрицательна,  то  любая
функция,  обладающая  этим  свойством  и  свойствами  (F0)-(F3),  уже  будет
функцией распределения некоторого случайного вектора.



                     9.2 Типы многомерных распределений


    Ограничимся  рассмотрением  только  двух  случаев,   когда   совместное
распределение координат случайного вектора (?1, ?2.)  либо  дискретно,  либо
абсолютно непрерывно.

    Дискретное совместное распределение


    Определение  31.  Говорят,  что  случайные  величины  ?1,   ?2.   имеют
дискретное,  совместное распределение, если существует конечный или  счетный
набор { ai, bi } такой, что

    [pic]

    Таблицу,  на  пересечении  i-й  строки  и  j-го  столбца  которой  (или
наоборот) стоит число

    P(?1= ai ,?2= bj) называют таблицей совместного распределения случайных
величин ?1,. ?2

    Замечание 13. Напомню, что таблицы распределения  каждой  из  случайных
величин  ?1,  ?2  в   отдельности   (таблицы   частных,   или   маргинальных
распределений) восстанавливаются  по  таблице  совместного  распределения  с
помощью очевидных формул:

    [pic]

    Если эти формулы вам не представляются очевидными, необходимо вернуться
к разделу 4 и перечитать  определение  18  полной  группы  событий,  обратив
также внимание на доказательство теоремы 8 (формулы полной вероятности).

    Абсолютно непрерывное совместное распределение


    Определение  32.  Говорят,  что  с.в.  ?1,  ?2   (заданные   на   одном
вероятностном   пространстве)   имеют   абсолютно   непрерывное   совместное
распределение, если существует функция [pic]  такая,  что  для  любой  точки
(x1, x2) ( R2

    [pic]

    Если  такая  функция  [pic]  существует,  она   называется   плотностью
совместного распределения случайных величин ?1, ?2.

    Замечание 14. Для всего дальнейшего более чем достаточно считать, что

    [pic]

    равняется объему под графиком функции f над областью  интегрирования  —
прямоугольником [a1,b1] x [a2,b2].

    Плотность совместного распределения обладает  свойствами,  аналогичными
свойствам плотности распределения одной случайной величины:

    (f1) [pic]для любых x1, x2 ( R;

    (f2) [pic].

    Более  того,  любая  функция,  обладающая  этими  свойствами,  является
плотностью некоторого совместного распределения.

    Если совместное  распределение  абсолютно  непрерывно,  то  по  функции
совместного распределения его  плотность  находится  как  смешанная  частная
производная:

    (f3) [pic].

    Из свойства (F2) функции совместного распределения  вытекает  следующее
утверждение. Для n > 2  это  утверждение,  как  и  свойство  (F2),  выглядит
существенно иначе!

    Теорема  22.  Если  случайные  величины  ?1,   ?2     имеют   абсолютно
непрерывное совместное распределение с плотностью f (x1, x2), то ?1, и ?2  в
отдельности также имеют абсолютно непрерывное распределение с плотностями:

    [pic]

                     9.3 Независимость случайных величин


    Определение 33. Случайные величины ?1, ?2, … , ?n независимы, если  для
любого набора множеств В1 ( R, … Вn ( R  имеет место равенство:

    [pic]

    Это определение можно сформулировать в терминах функций распределения:

    Определение 34. Случайные величины ?1, ?2, … , ?n независимы, если  для
любых х1, х2, … , хn имеет место равенство:

    [pic]

    Определение 35.  Случайные  величины  ?1,  ?2,  …  ,  ?n  с  дискретным
распределением независимы, если для  любых  а1,  а2,  …  ,  аn  имеет  место
равенство:

    [pic]

    Для случайных величин с абсолютно непрерывным совместным распределением
определение независимости можно сформулировать так:

    Определение  36.  Случайные  величины  ?1,  ?2,  …  ,  ?n  с  абсолютно
непрерывным   совместным   распределением   независимы,    если    плотность
совместного распределения равна произведению плотностей случайных ?1, ?2,  …
, ?n, то есть для любых х1, х2, … , хn имеет место равенство:

    [pic]

                 Раздел 10. Преобразования случайных величин


                10.1 Преобразование одной случайной величины


    Мы  будем  рассматривать  только  преобразования  случайных  величин  с
абсолютно  непрерывными  распределениями.  Пусть  с.  в.  ?  имеет   функцию
распределения F?(x) и плотность  распределения  f?(x).  Построим  с  помощью
функции g: R (  R  случайную  величину  ?=  g(?).  Требуется  найти  функцию
распределения и, если существует, плотность распределения ?.

    Замечание  15.  Плотность  распределения  случайной  величины  ?=  g(?)
существует далеко не при любых функциях g.  Так,  если  функция  g  кусочно-
постоянна, то с.  в.  ?  имеет  дискретное  распределение,  и  плотность  ее
распределения не существует.

    Плотность  распределения  g(?)  заведомо  существует,  если,  например,
функция g(?) монотонна («строго монотонна»). Вспомним, что  означает  «найти
плотность распределения ?, если она существует».

    По определению, если мы представим (для любого х) функцию распределения
?  в  виде  [pic]  где  подинтегральная  функция  h(y)  неотрицательна,   то
плотность  распределения   с.в.   ?    существует   и   в   точности   равна
подинтегральной функции f?(x) = h(x) .


    Так что доказывать существование плотности распределения и находить  ее
мы будем одновременно, находя нужное интегральное представление для  функции
распределения.

    Теорема 23. Пусть ?  имеет  функцию  распределения  F?(x)  и  плотность
распределения f?(x) , и  постоянная  a  отлична  от  нуля.  Тогда  случайная
величина ? = a ?  + b имеет плотность распределения

    [pic]

    Для  произвольной  монотонной  функции  g  (то  есть   либо   монотонно
возрастающей  функции,  либо   монотонно   убывающей   функции   справедливо
аналогичное теореме 23 утверждение).

    Теорема 24. Пусть ?  имеет  функцию  распределения  F?(x)  и  плотность
распределения f?(x), и функция g: R ( R монотонна. Тогда случайная  величина
?= g(?) имеет плотность распределения

    [pic]

    Здесь g -1— функция, обратная к g, и

    [pic]— производная функции g -1.

    Следствие 7. Если ? ( N0,1, то ? = ??+а ( [pic]

    Следствие 8. Если ? ( [pic], то ? = (? –а)/ ? ( N0,1.

    Следствие 9. Если ? ( Е?, то ? = ??( Е1

                   10.2 Функции от двух случайных величин


    Пусть ?1 ?2 — случайные величины с плотностью совместного распределения
[pic], и задана функция g  :  R2  (  R.  Требуется  найти  функцию  (а  если
существует, то и плотность) распределения случайной  величины  ?  =  g(?1  ,
?2).



    Пользуясь тем, что вероятность случайному  вектору  попасть  в  область
можно вычислить как объем под графиком плотности распределения  вектора  над
этой областью, сформулируем утверждение.

    Теорема 25. Пусть х( R, и область Dx ( R2  состоит из точек  (x1  x2  )
таких, что g (x1 x2 ) < x. Тогда случайная величина ? = g(?1  ,  ?2).  имеет
функцию распределения

    [pic]

    Всюду далее в этой главе предполагается, что случайные величины ?1 и ?2
независимы, то есть [pic]

    Следствие 10 (Формула свертки). Если с. в. ?1 и ?2 независимы  и  имеют
абсолютно непрерывное распределение с плотностями  f ?1 (x1) и f  ?2  (x2).,
то плотность распределения суммы ?1 + ?2 равна  «свертке»  плотностей  f  ?1
(x1) и f ?2 (x2)

    [pic]                               (9)

    Следствие 10 не только  предлагает  формулу  для  вычисления  плотности
распределения  суммы,  но  и  утверждает   (заметьте!),   что   сумма   двух
независимых  случайных  величин  с  абсолютно  непрерывными  распределениями
также имеет абсолютно непрерывное распределение.

    Если даже одна из двух независимых случайных величин имеет  дискретное,
а вторая – абсолютно непрерывное  распределение,  то  их  сумма  тоже  имеет
абсолютно непрерывное распределение, как показывает следующее упражнение.

    Упражнение. Пусть с. в. ? имеет таблицу распределения P(?  = аi) =  pi,
с. в. ? имеет плотность распределения  f?(x),  и  эти  величины  независимы.
Доказать, что ? +? имеет плотность распределения

    [pic][pic]

                 10.3 Примеры использования формулы свертки


    Пример 26. Пусть независимые случайные величины ? и ? имеют стандартное
нормальное  распределение.  Докажем,   что   их   сумма   имеет   нормальное
распределение с параметрами 0 и 2.

    Доказательство. По формуле свертки, плотность суммы равна

    [pic]

    Выделим полный квадрат по u в показателе экспоненты:

    [pic]

    Тогда

    [pic]

    Последнее равенство верно  поскольку  под  интегралом  стоит  плотность
нормального распределения с параметрами 0 и [pic], так что интеграл по  всей
прямой равен 1. Итак,  мы  получили,  что  плотность  суммы  есть  плотность
нормального распределения с параметрами 0 и 2.

    Если сумма двух независимых случайных  величин  из  одного  и  того  же
распределения   (возможно,   с   разными   параметрами)   имеет   такое   же
распределение,  говорят,  что  это  распределение   устойчиво   относительно
суммирования.

    В  следующих  утверждениях,  перечислены  практически  все   устойчивые
распределения.

    Лемма 3. Пусть случайные величины ? ( П? и ?( П? независимы. Тогда ?+ ?
( П?+?

    Лемма 4. Пусть случайные величины ? ( Bn,p и ? ( Bm,p независимы. Тогда
?+ ? ( Bm+n,p

    Лемма 5. Пусть случайные величины [pic] и [pic] независимы. Тогда [pic]



    Показательное распределение не устойчиво по  суммированию,  однако  его
можно считать частным случаем гамма-распределения, которое уже  в  некотором
смысле устойчиво относительно суммирования.

    Определение 37. Случайная величина ? имеет гамма-распределение  Г?,?  с
параметрами ? > 0, ? > 0, если она имеет плотность распределения

    [pic]

    где постоянная c вычисляется из условия

    [pic]



    Заметим, что показательное распределение  Е?  есть  гамма-распределение
Г?,1.

    Лемма 6.  Пусть  независимые  случайные  величины  ?1,  …  ,  ?n  имеют
показательное распределение Е? = Г?,1 Тогда ?1 +…+?n ( Г?,n

                                 «Случайных величин без  мат.  ожидания  не
                               бывает, так как, если у нас  есть  случайная
                               величина мы всегда в праве от нее что-нибудь
                               ожидать.»

                                 Из студенческой контрольной работы.

            Раздел 11. Числовые характеристики случайных величин


               11.1 Математическое ожидание случайной величины


    Определение 38. Математическим ожиданием E? (средним значением,  первым
моментом) случайной  величины  ?  с  дискретным  распределением,  задаваемым
таблицей P(?  = аi) = pi, называется число

    [pic] если указанный ряд абсолютно сходится.

    Если же

    [pic], то говорят, что математическое ожидание не существует.

    Определение 39. Математическим ожиданием E?   случайной  величины  ?  с
абсолютно  непрерывным  распределением  с  плотностью  распределения  f?(x),
называется число

    [pic] если указанный интеграл абсолютно сходится.

    Если же

    [pic], то говорят, что математическое ожидание не существует.

    Математическое ожидание имеет простой физический смысл: если на  прямой
разместить единичную массу, поместив в точку аi массу  pi  (для  дискретного
распределения),  или  «размазав»  ее  с  плотностью  f?(x)  (для   абсолютно
непрерывного распределения), то точка E? есть  координата  «центра  тяжести»
прямой.

    Пример 26. Пусть случайная величина ? равна числу очков, выпадающих при
одном подбрасывании кубика. Тогда

    [pic]



    [pic][pic]

    в среднем при подбрасывании кубика выпадает 3.5 очка

    Пример 27. Пусть случайная величина ?  —  координата  точки,  брошенной
наудачу на отрезок [a,b]. Тогда

    [pic][pic]

    центр тяжести  равномерного  распределения  на  отрезке  есть  середина
отрезка.

                   11.2 Свойства математического ожидания


    Во всех свойствах предполагается,  что  рассматриваемые  математические
ожидания существуют.

    E0. Математическое ожидание случайной величины есть ЧИСЛО!

    E1. Для произвольной функции функция g : R ( R

    [pic]



    Доказательство. Мы докажем это свойство (как и  почти  все  дальнейшие)
только для дискретного распределения. Пусть g(?) принимает значения с1 с2  …
с вероятностями

    [pic]

    Тогда

    [pic]

    E2 Математическое ожидание const равно этой const Eс = с.

    E3. const можно вынести за знак математического ожидания: E(с  ?)  =  с
E?.

    Доказательство. Следует из свойства E1 при g(?) = с ? .

    E4. Математическое ожидание суммы любых случайных величин ? и  ?  равно
сумме их математических ожиданий.

    E (? + ? ) = E (? )+ E (?)

    Доказательство. Для величин с дискретным распределением: пусть xk и  yn
— значения ? и ?, соответственно.

    [pic]

    E5.Если ? ( 0 п.н. (« почти наверное», т.е. с вероятностью 1: P(? ( 0 )
= 1), то E ? ( 0;

    Если ? ( 0  п.н., и при этом E? = 0, то ? = 0  п.н., то есть P(? = 0) =
1.

    Следствие 11.

    Если ? ( ? п.н., то E ? ( E? .

    Если ? ( ? п.н., и при этом E? =  E?, то ? = ? п.н.

    E6. Математическое ожидание произведения независимых случайных  величин
равно произведению их математических ожиданий.: если ? и ? независимы, то

    E(??) = E?  E?.

    Доказательство.

    [pic]

    Замечание 16. Обратное утверждение к свойству E6 неверно: из  равенства
E(??) = E?  E?. Не следует независимость величин ? и ?.

    Пример 28. Пусть ? ( U0,2?, ? = cos ?, ? = sin  ?—  заведомо  зависимые
случайные  величины.  Но  математическое  ожидание  их  произведения   равно
произведению их математических ожиданий: по свойству E1

    [pic]

                  11.3 Моменты старших порядков. Дисперсия


    Определение 40. Если [pic], то число

    [pic] называется моментом порядка k (k -м моментом) случайной  величины
?;

    [pic]  называется  абсолютным  моментом  порядка  k  (абсолютным  k  -м
моментом) случайной величины ?;

    [pic] называется центральным  моментом  порядка  k  (центральным  k  -м
моментом) случайной величины ?;

    [pic] называется абсолютным центральным моментом порядка k  (абсолютным
центральным k -м моментом) случайной величины ?.

    Число D? =  E(?  –  E?)2  (центральный  момент  порядка  2)  называется
дисперсией случайной величины ?

    Пример 29. Пусть, скажем, случайная величина ? принимает значение  0  с
вероятностью 1-10-5 , и значение 100 с  вероятностью  10-5.  Посмотрим,  как
моменты разных порядков реагируют  на  большие,  но  маловероятные  значения
случайной величины.

    [pic]

    Пример 30. Дисперсия D? = E(? – E?)2 есть  «среднее  значение  квадрата
отклонения случайной величины ? от своего среднего». Посмотрим, за  что  эта
величина отвечает.

    Пусть случайная величина ? принимает значения +-1 с вероятностью 1/2, а
случайная величина ? — значения ю +-10 с вероятностью 1/2. Тогда E? =  E?  =
0 поэтому D ? =  E  ?2  =  1,  D?  =  E?2  =  100.  Говорят,  что  дисперсия
характеризует  степень  разброса  значений  случайной  величины  вокруг   ее
математического ожидания.

    Если говорить о распределении случайной величины, как  о  распределении
единичной массы по невесомому стержню, то дисперсия есть в  точности  момент
инерции этого стержня, закрепленного в центре тяжести.

    Определение  40.  Если  дисперсия  величины   ?   конечна,   то   число
[pic]называют среднеквадратичным отклонением случайной величины ?.

    Следует хорошо понимать, что из существования моментов больших порядков
следует существование моментов меньших  порядков.  В  частности,  конечность
второго  момента  (или  дисперсии)  влечет   существование   математического
ожидания.

                           11.4 Свойства дисперсии


    Все   свойства   дисперсии   следуют   из    соответствующих    свойств
математического ожидания.

    D1. [pic]

    Действительно,

    [pic]

    D2. [pic]

    D3.

    [pic]если и только если ?= const.п.н.

    Доказательство. Дисперсия есть  всего-навсего  математическое  ожидание
п.н. неотрицательной с.в.:

    D? = E(? – E?)2, и неотрицательность дисперсии следует из свойства  E5.
По тому же свойству, D? = 0 если и только если E(? – E?)2 = 0 п.н., то  есть
? = ? п.н.

    D4. Дисперсия не меняется от сдвига с.в. на постоянную:

    [pic]

    D5. Если ? и ? независимы, то

    [pic]

    Действительно,

    [pic]

    так как математическое ожидание  произведения  независимых  с.в.  равно
произведению их математических ожиданий.

    D6. Минимум среднеквадратического отклонения случайной  величины  ?  от
точек вещественной прямой есть среднеквадратическое отклонение ?  от  своего
математического ожидания:

    [pic]

    Наименьший момент инерции стержня с  распределенной  на  нем  единичной
массой получится, если точка вращения – центр тяжести стержня,  а  не  любая
другая точка.

    Доказательство.

    [pic]причем равенство достигается только для а = E?.

     11.5 Математические ожидания и дисперсии стандартных распределений


    Пример 31. Распределение Бернулли Вр,

    [pic]

    Пример 32. Биномиальное распределение Вn,p

    Воспользуемся  свойством   устойчивости   биномиального   распределения
относительно суммирования  —  леммой  5.  Возьмем  n  независимых  случайных
величин ?1 ?2 … ?n, имеющих распределение Бернулли В,p = В1,p.

    Тогда их сумма Sn = ?1 + ?2 +… + ?n имеет распределение Вn,p

    [pic]

    так как все ?i одинаково  распределены  и  их  математическое  ожидание
равно pi;

    [pic]

    поскольку ?i независимы и дисперсия каждой равна pq.

    Пример 33. Геометрическое распределение Gp

    При p ( (0,1)

    [pic]

    Равенство  (*)  появилось  из-за   нежелания   дифференцировать   сумму
геометрической прогрессии, которая начинается не с 0 а с  q.  Заметьте,  что
производная у добавленных слагаемых равна 0, так  что  производные  от  этих
двух сумм равны

    [pic]

    Поэтому

    Пример 34. Распределение Пуассона П?

    [pic][pic]

    Показать, что

    [pic], следовательно [pic]

    Пример 35. Равномерное распределение Ua,b

    [pic][pic]

    [pic]

    Пример 36. Стандартное нормальное распределение N0,1

    [pic]

    поскольку  под  интегралом  стоит  нечетная  функция,  и  сам  интеграл
абсолютно сходится (за счет быстро убывающей [pic]



    [pic]

    Последнее равенство следует из того, что

    а интеграл по всей прямой от плотности любого  распределения  равен  1.
Поэтому



    Пример 37. Нормальное распределение [pic]

    Мы знаем, что если

    [pic][pic]

    Поэтому

    [pic]

    Пример 38. Показательное (экспоненциальное) распределение Е?

    Найдем для произвольного k ( N момент порядка k.

    [pic]

    В последнем равенстве мы воспользовались гамма-функцией Эйлера:

    [pic] Соответственно,

    [pic]

    Пример 39. Стандартное распределение Коши С0,1

    Распределение  Коши.  Говорят,  что  ?  имеет  распределение   Коши   с
параметрами ?, ?2, где ? ( R, ? > 0, если

    [pic] для всех х ( R

    Распределение Коши имеет, например, абсцисса  точки  пересечения  луча,
посланного из точки (?, ?) под наудачу выбранным углом,

    [pic] с осью ОХ.

    Математическое ожидание для распределения Коши не существует, поскольку

    [pic]

    расходится (подинтегральная функция ведет  себя  на  бесконечности  как
1/х).

    Пример 40. Распределение Парето

    Распределение Парето. Говорят,  что  ?  имеет  распределение  Парето  с
параметрами х0, s, где х0 > 0,  s > 0, если

    [pic]

    У распределения  Парето  существуют  только  моменты  порядка  u  <  s,
поскольку

    [pic]

    сходится  при  u  <  s,  то  есть  когда  подинтегральная  функция   на
бесконечности бесконечно мала по сравнению с 1/х.

                                 «Случайных величин без  мат.  ожидания  не
                               бывает, так как, если у нас  есть  случайная
                               величина мы всегда в праве от нее что-нибудь
                               ожидать.»

                                 Из студенческой контрольной работы.

            Раздел 11. Числовые характеристики случайных величин


               11.1 Математическое ожидание случайной величины


    Определение 38. Математическим ожиданием E? (средним значением,  первым
моментом) случайной  величины  ?  с  дискретным  распределением,  задаваемым
таблицей P(?  = аi) = pi, называется число

    [pic] если указанный ряд абсолютно сходится.

    Если же

    [pic], то говорят, что математическое ожидание не существует.

    Определение 39. Математическим ожиданием E?   случайной  величины  ?  с
абсолютно  непрерывным  распределением  с  плотностью  распределения  f?(x),
называется число

    [pic] если указанный интеграл абсолютно сходится.

    Если же

    [pic], то говорят, что математическое ожидание не существует.

    Математическое ожидание имеет простой физический смысл: если на  прямой
разместить единичную массу, поместив в точку аi массу  pi  (для  дискретного
распределения),  или  «размазав»  ее  с  плотностью  f?(x)  (для   абсолютно
непрерывного распределения), то точка E? есть  координата  «центра  тяжести»
прямой.

    Пример 26. Пусть случайная величина ? равна числу очков, выпадающих при
одном подбрасывании кубика. Тогда

    [pic]



    [pic][pic]

    в среднем при подбрасывании кубика выпадает 3.5 очка

    Пример 27. Пусть случайная величина ?  —  координата  точки,  брошенной
наудачу на отрезок [a,b]. Тогда

    [pic][pic]

    центр тяжести  равномерного  распределения  на  отрезке  есть  середина
отрезка.

                   11.2 Свойства математического ожидания


    Во всех свойствах предполагается,  что  рассматриваемые  математические
ожидания существуют.

    E0. Математическое ожидание случайной величины есть ЧИСЛО!

    E1. Для произвольной функции функция g : R ( R

    [pic]



    Доказательство. Мы докажем это свойство (как и  почти  все  дальнейшие)
только для дискретного распределения. Пусть g(?) принимает значения с1 с2  …
с вероятностями

    [pic]

    Тогда

    [pic]

    E2 Математическое ожидание const равно этой const Eс = с.

    E3. const можно вынести за знак математического ожидания: E(с  ?)  =  с
E?.

    Доказательство. Следует из свойства E1 при g(?) = с ? .

    E4. Математическое ожидание суммы любых случайных величин ? и  ?  равно
сумме их математических ожиданий.

    E (? + ? ) = E (? )+ E (?)

    Доказательство. Для величин с дискретным распределением: пусть xk и  yn
— значения ? и ?, соответственно.

    [pic]

    E5.Если ? ( 0 п.н. (« почти наверное», т.е. с вероятностью 1: P(? ( 0 )
= 1), то E ? ( 0;

    Если ? ( 0  п.н., и при этом E? = 0, то ? = 0  п.н., то есть P(? = 0) =
1.

    Следствие 11.

    Если ? ( ? п.н., то E ? ( E? .

    Если ? ( ? п.н., и при этом E? =  E?, то ? = ? п.н.

    E6. Математическое ожидание произведения независимых случайных  величин
равно произведению их математических ожиданий.: если ? и ? независимы, то

    E(??) = E?  E?.

    Доказательство.

    [pic]

    Замечание 16. Обратное утверждение к свойству E6 неверно: из  равенства
E(??) = E?  E?. Не следует независимость величин ? и ?.

    Пример 28. Пусть ? ( U0,2?, ? = cos ?, ? = sin  ?—  заведомо  зависимые
случайные  величины.  Но  математическое  ожидание  их  произведения   равно
произведению их математических ожиданий: по свойству E1

    [pic]

                  11.3 Моменты старших порядков. Дисперсия


    Определение 40. Если [pic], то число

    [pic] называется моментом порядка k (k -м моментом) случайной  величины
?;

    [pic]  называется  абсолютным  моментом  порядка  k  (абсолютным  k  -м
моментом) случайной величины ?;

    [pic] называется центральным  моментом  порядка  k  (центральным  k  -м
моментом) случайной величины ?;

    [pic] называется абсолютным центральным моментом порядка k  (абсолютным
центральным k -м моментом) случайной величины ?.

    Число D? =  E(?  –  E?)2  (центральный  момент  порядка  2)  называется
дисперсией случайной величины ?

    Пример 29. Пусть, скажем, случайная величина ? принимает значение  0  с
вероятностью 1-10-5 , и значение 100 с  вероятностью  10-5.  Посмотрим,  как
моменты разных порядков реагируют  на  большие,  но  маловероятные  значения
случайной величины.

    [pic]

    Пример 30. Дисперсия D? = E(? – E?)2 есть  «среднее  значение  квадрата
отклонения случайной величины ? от своего среднего». Посмотрим, за  что  эта
величина отвечает.

    Пусть случайная величина ? принимает значения +-1 с вероятностью 1/2, а
случайная величина ? — значения ю +-10 с вероятностью 1/2. Тогда E? =  E?  =
0 поэтому D ? =  E  ?2  =  1,  D?  =  E?2  =  100.  Говорят,  что  дисперсия
характеризует  степень  разброса  значений  случайной  величины  вокруг   ее
математического ожидания.

    Если говорить о распределении случайной величины, как  о  распределении
единичной массы по невесомому стержню, то дисперсия есть в  точности  момент
инерции этого стержня, закрепленного в центре тяжести.

    Определение  40.  Если  дисперсия  величины   ?   конечна,   то   число
[pic]называют среднеквадратичным отклонением случайной величины ?.

    Следует хорошо понимать, что из существования моментов больших порядков
следует существование моментов меньших  порядков.  В  частности,  конечность
второго  момента  (или  дисперсии)  влечет   существование   математического
ожидания.

                           11.4 Свойства дисперсии


    Все   свойства   дисперсии   следуют   из    соответствующих    свойств
математического ожидания.

    D1. [pic]

    Действительно,

    [pic]

    D2. [pic]

    D3.

    [pic]если и только если ?= const.п.н.

    Доказательство. Дисперсия есть  всего-навсего  математическое  ожидание
п.н. неотрицательной с.в.:

    D? = E(? – E?)2, и неотрицательность дисперсии следует из свойства  E5.
По тому же свойству, D? = 0 если и только если E(? – E?)2 = 0 п.н., то  есть
? = ? п.н.

    D4. Дисперсия не меняется от сдвига с.в. на постоянную:

    [pic]

    D5. Если ? и ? независимы, то

    [pic]

    Действительно,

    [pic]

    так как математическое ожидание  произведения  независимых  с.в.  равно
произведению их математических ожиданий.

    D6. Минимум среднеквадратического отклонения случайной  величины  ?  от
точек вещественной прямой есть среднеквадратическое отклонение ?  от  своего
математического ожидания:

    [pic]

    Наименьший момент инерции стержня с  распределенной  на  нем  единичной
массой получится, если точка вращения – центр тяжести стержня,  а  не  любая
другая точка.

    Доказательство.

    [pic]причем равенство достигается только для а = E?.

     11.5 Математические ожидания и дисперсии стандартных распределений


    Пример 31. Распределение Бернулли Вр,

    [pic]

    Пример 32. Биномиальное распределение Вn,p

    Воспользуемся  свойством   устойчивости   биномиального   распределения
относительно суммирования  —  леммой  5.  Возьмем  n  независимых  случайных
величин ?1 ?2 … ?n, имеющих распределение Бернулли В,p = В1,p.

    Тогда их сумма Sn = ?1 + ?2 +… + ?n имеет распределение Вn,p

    [pic]

    так как все ?i одинаково  распределены  и  их  математическое  ожидание
равно pi;

    [pic]

    поскольку ?i независимы и дисперсия каждой равна pq.

    Пример 33. Геометрическое распределение Gp

    При p ( (0,1)

    [pic]

    Равенство  (*)  появилось  из-за   нежелания   дифференцировать   сумму
геометрической прогрессии, которая начинается не с 0 а с  q.  Заметьте,  что
производная у добавленных слагаемых равна 0, так  что  производные  от  этих
двух сумм равны

    [pic]

    Поэтому

    Пример 34. Распределение Пуассона П?

    [pic][pic]

    Показать, что

    [pic], следовательно [pic]

    Пример 35. Равномерное распределение Ua,b

    [pic][pic]

    [pic]

    Пример 36. Стандартное нормальное распределение N0,1

    [pic]

    поскольку  под  интегралом  стоит  нечетная  функция,  и  сам  интеграл
абсолютно сходится (за счет быстро убывающей [pic]



    [pic]

    Последнее равенство следует из того, что

    а интеграл по всей прямой от плотности любого  распределения  равен  1.
Поэтому



    Пример 37. Нормальное распределение [pic]

    Мы знаем, что если

    [pic][pic]

    Поэтому

    [pic]

    Пример 38. Показательное (экспоненциальное) распределение Е?

    Найдем для произвольного k ( N момент порядка k.

    [pic]

    В последнем равенстве мы воспользовались гамма-функцией Эйлера:

    [pic] Соответственно,

    [pic]

    Пример 39. Стандартное распределение Коши С0,1

    Распределение  Коши.  Говорят,  что  ?  имеет  распределение   Коши   с
параметрами ?, ?2, где ? ( R, ? > 0, если

    [pic] для всех х ( R

    Распределение Коши имеет, например, абсцисса  точки  пересечения  луча,
посланного из точки (?, ?) под наудачу выбранным углом,

    [pic] с осью ОХ.

    Математическое ожидание для распределения Коши не существует, поскольку

    [pic]

    расходится (подинтегральная функция ведет  себя  на  бесконечности  как
1/х).

    Пример 40. Распределение Парето

    Распределение Парето. Говорят,  что  ?  имеет  распределение  Парето  с
параметрами х0, s, где х0 > 0,  s > 0, если

    [pic]

    У распределения  Парето  существуют  только  моменты  порядка  u  <  s,
поскольку

    [pic]

    сходится  при  u  <  s,  то  есть  когда  подинтегральная  функция   на
бесконечности бесконечно мала по сравнению с 1/х.

      Раздел 12. Числовые характеристики зависимости случайных величин


           12.1 Чем отличается дисперсия суммы от суммы дисперсий?


    Мы знаем, что для независимых  с.  в.  с  конечными  вторыми  моментами
дисперсия их суммы равна сумме их дисперсий. Чему равна  дисперсия  суммы  в
общем случае?

    [pic](10)

    Величина E(??) - E? E? равняется нулю, если случайные величины  ?  и  ?
независимы (свойство E6 математического  ожидания).  С  другой  стороны,  из
равенства ее нулю вовсе не следует независимость, как показывает пример  30.
Оказывается, что  эту  величину  часто  используют  как  «индикатор  наличия
зависимости» пары с. в.

    Определение  41.  Ковариацией  cov(?,  ?)  случайных  величин  ?  и   ?
называется число

    [pic]

    Свойство 10.

    [pic]

    Свойство 11.

    a) [pic];

    b) [pic].

    Свойство 12. Дисперсия суммы нескольких случайных  величин  вычисляется
по любой из следующих формул:

    [pic]

    Обсудим   достоинства   и   недостатки   ковариации,   как    величины,
характеризующей зависимость двух с. в.

    1. Если ковариация cov(?, ?)  отлична  от  нуля,  то  величины  ?  и  ?
зависимы!

    2. С гарантией о  наличии  зависимости  мы  можем  судить,  если  знаем
совместное распределение пары ? и ?, и можем проверить, равна ли  (например)
плотность совместного распределения произведению плотностей.

    Но найти совместное распределение часто бывает сложнее,  чем  посчитать
математическое  ожидание  произведения  ?  и  ?.   Если   нам   повезет,   и
математическое ожидание произведения ? и ? не будет  равняться  произведению
их мат. ожиданий, мы скажем, что ? и ? зависимы  не  находя  их  совместного
распределения!

    Пример 41. Покажем, что с помощью ковариации можно судить о зависимости
даже когда для вычисления совместного распределения недостаточно данных.

    Пусть ? и ? — независимые случайные величины, и дисперсия ? отлична  от
нуля. Докажем, что ? и ?+ ? зависимы.

    [pic]              (11)

    Поэтому

    [pic]

    Следовательно, ? и ?+ ? зависимы.

    3. Жаль, что величина cov(?, ?)  не является «безразмерной»: если  ?  –
объем газа в сосуде, а ?  – давление этого газа, то ковариация измеряется  в
кубометрах х Паскали :).

    Иначе говоря, при умножении одной из величин ?, ? на какое-нибудь число
ковариация  тоже  умножается  на  это  число.  Но  умножение  на  число   не
сказывается  на  «степени  зависимости»  величин  (они   от   этого   «более
зависимыми» не становятся), так что большое значение ковариации не  означает
более сильной зависимости.

    Нужно как-то нормировать  ковариацию,  получив  из  нее  «безразмерную»
величину, абсолютное значение которой

    а) не менялось бы при умножении или сдвиге случайных величин на число;

    б) свидетельствовало бы о «силе зависимости» с. в.

    Говря о «силе» зависимости между с.в., мы имеем в виду следующее. Самая
сильная  зависимость  –  функциональная,  а  из  функциональных  –  линейная
зависимость, когда ?= а? + b п.н. Бывают гораздо более  слабые  зависимости.
Так, если по  последовательности  независимых  случайных  величин  ?1  ?2  …
построить ? = ?1 +…?24 + ?25 ?  =  ?25  +?26  +  …+?90  ,  то  эти  величины
зависимы,  но  очень  “слабо  зависимы”:   через   одно-единственное   общее
слагаемое ?25 .

    Итак, следующая величина  есть  всего  лишь  ковариация,  нормированная
нужным образом.

                         12.2 Коэффициент корреляции


    Определение 43. Коэффициентом корреляции ?(?, ?)  случайных величин  ?,
?, дисперсии которых существуют и отличны от нуля, называется число

    [pic]

    Пример 42. Рассмотрим продолжение примера 41, но пусть ? и ?  будут  не
только независимыми, но и одинаково распределенными  случайными  величинами,
и их дисперсия отлична от нуля. Найдем коэффициент корреляции величин ? и  ?
+ ?. Согласно формуле (10),

    [pic]

    Поэтому

    [pic]

    Определение 44. Случайные величины ? и ?  называют  некоррелированными,
если cov(?, ?) =  0   (или  если  ?(?,  ?)  =  0,  —  в  том  случае,  когда
коэффициент корреляции существует).

    Замечание 17. Если одна из величин ? и ? — постоянная, то эти  величины
независимы, и cov (?, ?) = 0. Естественно в этом случае тоже  полагать,  что
?  и  ?  «некоррелированы»,  хотя  коэффициент   корреляции   не   определен
(дисперсия постоянной равна 0).

                    12.3 Свойства коэффициента корреляции


    Всюду  далее  специально  не  оговаривается,  но  предполагается,   что
коэффициент корреляции существует.

    Теорема 26.

    Коэффициент корреляции обладает следующими свойствами.

    1. Если с. в. ? и ? независимы, то ?(?, ?) = cov(?, ?) =  0.

    2. (?(?, ?)((. 1

    3. (?(?, ?)(= 1, если и только если с.  в.  ?  и  ?  с  вероятностью  1
линейно связаны, т.е. существуют числа а ( 0 и b такие, что P(? = a?+  b)  =
1.

    Определение 45. Пусть D конечна и отлична от нуля. Определим  случайную
величину

    [pic]

    Преобразование [pic] называется стандартизацией случайной величины ?, а
сама с. в. [pic] называется стандартизованной , или (слэнг!)  центрированной
и нормированной  версией с. в. ?.

    Свойство 13. Стандартизованная с. в. [pic]имеет нулевое  математическое
ожидание и единичную дисперсию.

    Доказательство. Воспользуемся  свойствами  математического  ожидания  и
дисперсии:

    [pic]

    Полезно знать следующие часто употребляемые термины.

    Определение 46. Говорят, что величины ? и ? отрицательно коррелированы,
если ?(?, ?) < 0; говорят, что величины ? и  ?  положительно  коррелированы,
если ?(?, ?) > 0.

    Смысл знака коэффициента корреляции особенно ясен в случае (?(?, ?)  (=
1. Тогда знак ? равен знаку a в равенстве ? = a?+ b п.н. То есть ?(?,  ?)  =
1 означает, что чем больше ?, тем  больше  и  ?.  Напротив,  ?(?,  ?)  =  -1
означает, что чем больше ?, тем меньше ?. Похожим образом  можно  трактовать
знак коэффициента корреляции и в случае, когда (?(?,  ?)  (<  1,  помня  при
этом, что зависимость величин ? и ? теперь  уже  не  линейная  и,  возможно,
даже не функциональная.

    Так, величины ? и ? + ? в примерах 41 и 42 положительно  коррелированы,
но их зависимость не функциональная.

    Пример 43.



    Если с. в. ? и ? есть координаты точки, брошенной наудачу в треугольник
с вершинами  (2,0),  (0,0)  и  (0,1),  то  коэффициент  корреляции  ?(?,  ?)
отрицателен. Это можно объяснить «на пальцах» так: Чем больше ?, тем  меньше
у  ?  возможностей  быть  большой)  Предлагаю  убедиться  в  этом,  проверив
справедливость следующих высказываний.

    Во-первых,



    [pic]

    Во-вторых,

    Совместное  распределение  координат   точки,   брошенной   наудачу   в
произвольную (измеримую) область D на плоскости имеет  постоянную  плотность
во всех точках области D. Это  связано  с  понятием  «наудачу»:  вероятность
попасть в любую область A( D, с одной стороны зависит только от площади А  и
не зависит от формы и положения А  внутри  D,  равняясь  с  другой  стороны,
интегралу по области А  от  плотности  совместного  распределения  координат
точки.  Эти  два  качества  возможно  совместить,  только   если   плотность
совместного распределения постоянна внутри D. Более  того,  эта  постоянная,
как легко видеть, есть просто [pic] (хотя бы потому, что интеграл от нее  по
всей области D должен ровняться вероятности попасть в D, или единице).

    Распределение точки, брошенной  наудачу  в  область  (все  равно  где),
называют равномерным распределением.

    Итак, плотность равномерного распределения в  произвольной  области  на
плоскости —  постоянная,  равная  (1/  площадь  области)  для  точек  внутри
области  и  нулю  —  вне.  Поэтому  (а  также  потому,  что  площадь   этого
треугольника равна 1)

    [pic]

    То есть ковариация (а с  ней  и  коэффициент  корреляции)  отрицательна
(посчитать cov(?, ?)).

    Пример 44.

    Найти коэффициент корреляции между числом выпадений  единицы  и  числом
выпадений шестерки при n подбрасываниях симметричного кубика.

    Решение. Обозначим для i = 1,  2,  3,  4,  5,  6   через  ?i  случайную
величину, равную числу выпадений грани  с  i  очками  при  n  подбрасываниях
кубика. Посчитаем cov(?1, ?6).

    Каждая из случайных  величин  ?i  имеет  биномиальное  распределение  с
параметрами n и 1/6, поэтому

    [pic].

    Заметим, что сумма ?1 + … + ?n этих величин равна n. В  силу  симметрии
кубика,  все  математические  ожидания  [pic]одинаковы,  но,  скорее  всего,
отличаются от

    [pic]

    Посчитаем



     С одной стороны, это равно



    с другой стороны,



    Отсюда



    Следовательно, искомый коэффициент корреляции равен



    Интересно, что полученный коэффициент корреляции не зависит от n.

                                 ...   Откуда,   наконец,    вытекает    то
                               удивительное, по-видимому,  следствие,  что,
                               если  бы  наблюдения  над  всеми   событиями
                               продолжать всю вечность, причем вероятность,
                               наконец, перешла бы в полную  достоверность,
                               то  было  бы  замечено,  что  в   мире   все
                               управляется точными отношениями и постоянным
                               законом изменений, так что даже в  вещах,  в
                               высшей степени случайных, мы принуждены были
                               бы признать как бы  некоторую  необходимость
                               и, скажу я, рок.

                                   Я к о б Б е р н у л л и, Ars conjectandi
                               (1713)

     Раздел 13. Куда и как сходятся последовательности случайных величин


             13.1 Сходимость «почти наверное» и «по вероятности»


    Напомню, что случайная величина есть (измеримая) функция из  некоторого
абстрактного    множества    ?    в    множество    действительных    чисел.
Последовательность случайных величин  есть,  тем  самым,  последовательность
функций (определенных на одном и том же  пространстве  элементарных  исходов
?). И если мы  хотим  говорить  о  сходимости  последовательности  случайных
величин  {?n  }(n=1  ,  не  будем  забывать,  что  мы  имеем   дело   не   с
последовательностью  чисел,  а  с  последовательностью  функций.  Существуют
разные  виды  сходимости  последовательности  функций.  Всякий  раз   давать
определение какой-либо сходимости мы будем, опираясь на сходимость  числовых
последовательностей, как на уже известное основное понятие.

    В  частности,  при  каждом  новом  ?  (  ?  мы  имеем  новую   числовую
последовательность {?n (? )}(n=1 .  Поэтому,  во-первых,  можно  говорить  о
знакомой  из   математического   анализа   (почти)   поточечной   сходимости
последовательностей функций: о сходимости «почти всюду»,  которую  в  теории
вероятностей называют сходимостью «почти наверное».

    Определение 46. Говорят, что последовательность с. в.  {?n  }  сходится
почти наверное к с. в. ? при n ( ( , и пишут: ?n ( ? п. н., если  P{  ?:  ?n
(? ) ( ? при n ( (} = 1.

    Иначе говоря, если ?n (? ) ( ? при n  (  (  для  всех  ?  (  ?,  кроме,
возможно, ? ( A, где множество (событие) A имеет нулевую вероятность.

    Заметим сразу: чтобы говорить о сходимости «почти наверное»,  требуется
(по крайней мере, по определению) знать, как устроены отображения ? ( ?n  (?
).  В  задачах  же  теории  вероятностей,  как  правило,  известны  не  сами
случайные величины, а лишь  их  распределения.  Известно,  то  есть,  какова
вероятность тех элементарных исходов  ?,  для  которых  ?n  (?  )  принимает
значения в заданном множестве. Можем ли мы,  обладая  только  информацией  о
распределениях,  говорить   о   какой-либо   сходимости   последовательности
случайных величин {?n } к с. в. ??

    Можно,  например,   потребовать,   чтобы   вероятность   («доля»)   тех
элементарных исходов ?, для которых ?n (? ) не  попадает  в  «?-окрестность»
числа  ?  (?  ),  уменьшалась  до  нуля  с  ростом  n.  Такая  сходимость  в
функциональном  анализе  называется  сходимостью  «по  мере»,  а  в   теории
вероятностей — сходимостью «по вероятности».

    Определение 47. Говорят, что последовательность с. в. { ?n  }  сходятся
по вероятности к с. в.  ? при n ( (, и пишут:

    [pic]

    если для любого ? > 0

    [pic]

    Пример 45. Рассмотрим последовательность с. в. ?1 , ?2,  …,  в  которой
все величины имеют  разные  распределения:  с.  в.  ?n,  n  >  0,  принимает
значения  и   0   и   n7   с   вероятностями   [pic].   Докажем,   что   эта
последовательность сходится по  вероятности  к  случайной  величине,  равной
нулю п. н. (к нулю, проще говоря).

    Действительно, зафиксируем произвольное ? > 0. Для  всех  n  начиная  с
некоторого n0 такого, что n07 > ? верно равенство (*) ниже

    [pic]

    Итак, случайные величины ?n с ростом n могут принимать  все  большие  и
большие значения, но со все меньшей и меньшей вероятностью.

    Замечание 18. Сходимость по вероятности не  обязательно  сопровождается
сходимостью  математических  ожиданий  или  моментов  других  порядков:   из
[pic]не следует, что [pic]

    Действительно, в примере 45 имеет место сходимость [pic],  но  неверно,
что [pic]

    Если вместо значения n7 взять, скажем, n (с той же вероятностью 1/  n),
получим

    [pic]

    А если ?n принимает значения 0 и [pic] с теми же вероятностями, что и в
примере 45, то [pic], но уже вторые моменты сходиться ко второму  моменту  ?
не будут:

    [pic]

    Сходимость по вероятности обладает обычными для сходимостей свойствами.
Например, такими.

    Свойство 13. Если [pic], то

    1. [pic];

    2. [pic].

    Свойство 14.

    Если [pic], и g – непрерывная функция, то [pic]

    Если [pic], и g – непрерывна в точке с, то [pic]

    Чтобы  доказывать  сходимость  по  вероятности,  можно   просто   уметь
вычислять [pic] при больших n. Но для этого нужно  знать  распределение  ?n,
что не всегда возможно. Скажем, ?n может быть суммой  нескольких  других  с.
в.,  распределения  которых  не  устойчивы  по  суммированию,  и   вычислить
распределение их суммы по формуле свертки  или  как-то  еще  бывает  слишком
сложно.

    Если бы мы имели неравенства, позволяющие  оценить  [pic]  сверху  чем-
либо, что мы умеем устремлять к нулю и что проще вычисляется, то  сходимость
по вероятности мы получили бы по лемме о  двух  милиционерах:  [pic].  Итак,
неравенства П. Л. Чебышёва.

                          13.2 Неравенства Чебышёва


    Все неравенства в этом параграфе  принято  относить  к  одному  классу,
называемому «неравенствами Чебышёва». Следующее неравенство  часто  называют
собственно неравенством Чебышёва, хотя в такой форме оно появилось  впервые,
видимо, в работах А. А. Маркова  (например,  Исчисление  вероятностей,  1913
г.).

    Теорема 27 (Неравенство Маркова).

    Если [pic], то для любого положительного x

    [pic]

    Доказательство.  Введем  новую  случайную   величину   ?x,   называемую
«срезкой» с. в. (?( на уровне x:

    [pic]

    Для неё и,

    1.[pic]

    2. [pic]

    Нам потребуется следующее понятие.

    Определение 48.  Пусть  A  —  некоторое  событие.  Назовем  индикатором
события  A  случайную  величину  I(A),  равную  единице,  если   событие   A
произошло, и нулю, если A не произошло.

    По определению, I(A) имеет распределение Бернулли   с  параметром  p  =
P(I(A) = 1) = P(A), и ее математическое ожидание равно вероятности успеха  p
= P(A).

    Случайную величину ?х можно представить в виде

    [pic]

    Тогда

    [pic]         (11)

    Вспомним, что [pic], и оценим [pic]снизу согласно (11):

    [pic]

    Итак, [pic], что и требовалось доказать.

    Следующее  неравенство  мы  будем  называть  «обобщенным   неравенством
Чебышёва».

    Следствие 12. Пусть функция g монотонно возрастает и неотрицательна  на
[0,(]. Если [pic], то для любого положительного х

    [pic]

    В 1853 г. И. Бьенеме (I. Bienayme) и в 1866 г., независимо от него,  П.
Л. Чебышёв прямыми методами доказали следующее неравенство

    Следствие 13 (Неравенство Чебышёва-Бьенеме). Если [pic], то

    [pic]

    В качестве  следствия  получим  так  называемое  «правило  трех  сигм»,
которое  формулируют,  например,   так:   вероятность   случайной   величине
отличаться от своего математического ожидания более, чем  на  три  корня  из
дисперсии,  мала.  Разумеется,  для  каждого  распределения  величина   этой
вероятности своя: для нормального распределения, например,  эта  вероятность
равна 0,0027 — см. свойство 9. Мы получим верную для  всех  распределений  с
конечной дисперсией оценку сверху  для  «вероятности  с.  в.  отличаться  от
своего математического ожидания более, чем на три корня из дисперсии».

    Следствие 14. Если [pic], то [pic]

                          13.3 Законы больших чисел


    Определение 49. Говорят, что последовательность с. в. [pic]с  конечными
первыми моментами удовлетворяет закону больших чисел (ЗБЧ), если

    [pic]                              (12)

    Законами больших чисел принято называть утверждения  об  условиях,  при
которых последовательность с. в. «удовлетворяет закону больших чисел».

    Выясним сначала, что означает и когда выполнен ЗБЧ  для  независимых  и
одинаково распределенных с.в.

    Заметим, что если  с.  в.  одинакого  распределены,  то  математические
ожидания у них одинаковы  (и  равны,  например,[pic]),  поэтому  (12)  можно
записать в виде

    [pic]

    Итак, законы больших чисел.

    Теорема 28 (ЗБЧ в форме Чебышёва).

    Для любой последовательности  независимых  и  одинаково  распределенных
случайных величин с конечным вторым моментом [pic] имеет место сходимость:

    [pic]

    ЗБЧ утверждает, что среднее  арифметическое  большого  числа  случайных
слагаемых «стабилизируется» с ростом этого числа. Как бы  сильно  каждая  с.
в.  не  отклонялась  от  своего  среднего  значения,  при  суммировании  эти
отклонения «взаимно гасятся», так что среднее арифметическое приближается  к
постоянной величине.

    В дальнейшем мы увидим, что требование конечности второго момента  (или
дисперсии)  связано  исключительно  со  способом   доказательства,   и   что
утверждение остается верным  если  требовать  существования  только  первого
момента.

    Доказательство. Обозначим через [pic]  сумму  первых  n  с.  в.,  а  их
среднее арифметическое через  [pic]. Тогда

    [pic]

    Пусть ? > 0. Воспользуемся неравенством Чебышёва (следствие 13):

    [pic]  (13)

    при [pic], поскольку [pic], по условию, конечна.

    Следствие 15.  Последовательность  с.  в.  [pic]  с  конечными  вторыми
моментами удовлетворяет ЗБЧ, то есть

    [pic]

    при выполнении любого из следующих условий:

    а) если [pic], то есть [pic] при [pic];

    б) если [pic]независимы и [pic], то есть

    [pic]

    в) если [pic]  независимы,  одинаково  распределены  и  имеют  конечную
дисперсию (ЗБЧ Чебышёва).

    Теорема 29 (ЗБЧ в форме Хинчина).

    Для любой последовательности  независимых  и  одинаково  распределенных
случайных величин с конечным первым моментом [pic] имеет место сходимость:

    [pic]

    Более того,  в  условиях  теоремы  29  имеет  место  сходимость  «почти
наверное». Получим в качестве следствия из ЗБЧ Чебышёва закон больших  чисел
Я. Бернулли (1713). В отличие от  доказанного  через  полтора  столетия  ЗБЧ
Чебышёва, описывающего предельное поведение среднего арифметического  с.  в.
с произвольными распределениями,  ЗБЧ  Бернулли  —  утверждение  только  для
схемы Бернулли.

    Теорема 30 (ЗБЧ Бернулли).

    Пусть А — событие, которое может произойти в  любом  из  n  независимых
испытаний  с  одной  и  той  же  вероятностью  P(А).  Пусть  vn(А)  —  число
осуществлений события А в n испытаниях. Тогда

    [pic]

    При этом для любого ? > 0

    [pic]

            13.4 Примеры использования ЗБЧ и неравенства Чебышёва


    Пример 46.

    Монета подбрасывается 10 000 раз. Оценить вероятность того, что частота
выпадения герба отличается от вероятности более чем на одну сотую.

    Требуется оценить [pic], где [pic]—число выпадений  герба,  а  [pic]  —
независимые с. в., имеющие распределение Бернулли с параметром  1/2,  равные
«числу гербов, выпавших при i-м подбрасывании» (то есть единице, если  выпал
герб и нулю иначе, или индикатору того, что выпал  герб).  Поскольку  [pic],
искомая оценка сверху выглядит так:

    [pic]

    Иначе говоря, неравенство Чебышёва позволяет заключить, что, в среднем,
не более чем в четверти случаев при 10  000  подбрасываниях  монеты  частота
выпадения герба будет отличаться от 1/2 более чем на одну сотую. Мы  увидим,
насколько это грубая оценка, когда  познакомимся  с  центральной  предельной
теоремой.

    Пример 47.

    Пусть [pic] — последовательность случайных величин,  дисперсии  которых
ограничены одной и той же постоянной С, а ковариации любых  с.  в.  [pic]  и
[pic] ([pic]), не являющихся соседними  в  последовательности,  равны  нулю.
Удовлетворяет ли эта последовательность ЗБЧ?

    Воспользуемся неравенством (13) и свойством 12:

    [pic]

    Но  для i < j, по условию, [pic], если [pic].  Следовательно,  в  сумме
[pic] равны нулю все слагаемые кроме, может  быть,  [pic]  (их  ровно  n  -1
штука).

    Оценим каждое из них, используя одно из свойств коэффициента корреляции


    [pic](по условию задачи)

    [pic][pic]

    при [pic], т.е. последовательность [pic] удовлетворяет ЗБЧ.

                                      ... Из этой первой  лекции  по  теории
                                   вероятностей    я    запомнил     только
                                   полузнакомый   термин    «математическое
                                   ожидание».  Незнакомец  употреблял  этот
                                   термин  неоднократно,  и  каждый  раз  я
                                   представлял  себе   большое   помещение,
                                   вроде зала ожидания, с кафельным  полом,
                                   где сидят люди с портфелями  и  бюварами
                                   и,  подбрасывая  время  от   времени   к
                                   потолку    монетки     и     бутерброды,
                                   сосредоточенно чего-то ожидают.  До  сих
                                   пор я часто вижу  это  во  сне.  Но  тут
                                   незнакомец оглушил меня звонким термином
                                   «предельная теорема Муавра — Лапласа»  и
                                   сказал, что все это к делу не относится.

                                      Аркадий и Борис Стругацкие, Стажеры

               Раздел 14. ЦПТ (центральная предельная теорема)


                   14.1 Как быстро [pic] сходится к [pic]?


    Пусть, как в законе больших чисел в форме Чебышёва,  [pic]  —  сумма  n
независимых  и  одинаково  распределенных  величин  с  конечной  дисперсией.
Тогда, в силу ЗБЧ,  [pic]  с  ростом  n.  Или,  после  приведения  к  общему
знаменателю,

    [pic]

    Если при делении на n мы получили в пределе нуль (в  смысле  некоторой,
все равно какой, сходимости), резонно задать себе вопрос: а  не  слишком  ли
на «много» мы  поделили?  Нельзя  ли  поделить  на  что-нибудь,  растущее  к
бесконечности медленнее, чем n, чтобы получить  в  пределе  не  нуль  (и  не
бесконечность, само собой)?

    Можно  поставить  этот  вопрос  по-другому.   Вот   последовательность,
стремящаяся (как-то) к нулю. Можно ли ее  домножить  на  что-либо  растущее,
чтобы «погасить» это стремление  к  нулю?  Получив,  тем  самым,  что-нибудь
конечное и отличное от нуля в пределе?

    Оказывается, что уже [pic], или, что, то же самое, [pic], не сходится к
нулю. Распределение этой, зависящей от n, случайной величины становится  все
более  похоже  на  нормальное  распределение!  Можно  считать,   что   такая
последовательность  сходится  к  случайной  величине,   имеющей   нормальное
распределение, но сходится не по вероятности, а только в  смысле  сходимости
распределений, или «слабой сходимости».

                           14.2 Слабая сходимость


    Пусть  задана   последовательность   с.   в.[pic],   задано   некоторое
распределение [pic]с функцией распределения [pic] и [pic]—  произвольная  с.
в., имеющая распределение [pic].

    Определение  50.  Говорят,  что  последовательность  с.  в.  [pic]  при
[pic]сходится слабо или по распределению к с. в.  [pic],  или  говорят,  что
последовательность с. в. слабо сходится к распределению [pic], или  говорят,
что распределения  с.в.  [pic]  слабо  сходится  к  распределению  [pic],  и
пишут:, [pic] или [pic], или [pic], если для любого х  такого,  что  функция
распределения [pic] непрерывна в точке х, имеет  место  сходимость  [pic]при
[pic].

    Иначе говоря, слабая сходимость —  это  поточечная  сходимость  функций
распределения   во   всех   точках    непрерывности    предельной    функции
распределения.

    Свойство 15. Если [pic], и функция  распределения  [pic]  непрерывна  в
точках a и b, то [pic] Наоборот, если во всех точках  a  и  b  непрерывности
функции распределения [pic] имеет  место,  например,  сходимость  [pic],  то
[pic].

    Следующее важное свойство уточняет отношения между сходимостями.

    Свойство 16.

    1. Если [pic], то [pic].

    2. Если [pic] = const, то [pic].

    Доказательство.Докажем,  что  слабая  сходимость  к  постоянной  влечет
сходимость по вероятности.

    Пусть

    [pic]

    при любом x, являющемся точкой непрерывности предельной функции  [pic],
то есть при всех [pic].

    Возьмем произвольное [pic] и докажем, что[pic]. Раскроем модуль:

    [pic]

    (сужаем событие под знаком вероятности)

    [pic]поскольку  в   точках   [pic]   функция   [pic]   непрерывна,   и,
следовательно, имеет место сходимость последовательности [pic]к[pic]

    Осталось заметить, что [pic] не бывает больше 1, так  что  по  лемме  о
двух милиционерах [pic].

    Следующее свойство приводит пример операций, которые можно применять  к
слабо   сходящимся   последовательностям   —   скажем,   домножать   их   на
последовательности, сходящиеся по вероятности к постоянным величинам.

    Свойство 17.

    1. Если [pic] const и [pic], то [pic].

    2. Если [pic] const и [pic], то [pic].

    Несколько содержательных примеров слабой  сходимости  мы  рассмотрим  в
следующей главе. Но основной источник слабо  сходящихся  последовательностей
и необычайно мощное и универсальное средство  для  асимптотического  анализа
распределения сумм независимых и одинаково распределенных случайных  величин
предоставляет нам ЦЕНТРАЛЬНАЯ ПРЕДЕЛЬНАЯ ТЕОРЕМА

                     14.3 Центральная предельная теорема


    Мы будем называть следующее утверждение «ЦПТ А. М. Ляпунова» (1901), но
сформулируем   теорему   Ляпунова   только   в   частном   случае   —    для
последовательности  независимых   и   одинаково   распределенных   случайных
величин.

    Теорема 31 (ЦПТ).

    Пусть [pic] — независимые и одинаково распределенные случайные величины
с конечной и ненулевой дисперсией: [pic]. Обозначим через [pic]сумму  первых
n случайных величин. Тогда последовательность с. в. [pic] слабо  сходится  к
стандартному нормальному распределению.

    Пользуясь определением и свойствами слабой сходимости, и  заметив,  что
функция распределения [pic]любого нормального закона непрерывна всюду на  R,
утверждение ЦПТ можно сформулировать любым из следующих способов:

    Следствие 18. Пусть [pic]  —  независимые  и  одинаково  распределенные
случайные величины с конечной и ненулевой дисперсией. Следующие  утверждения
эквивалентны друг другу и равносильны утверждению ЦПТ.

    Для любых вещественных x < y при [pic] имеет место сходимость

    [pic]

    Для любых вещественных x < y при [pic] имеет место сходимость

    [pic]

     Для любых вещественных x < y при [pic]  имеет место сходимость

    [pic]

    Если  [pic]  —   произвольная   с.   в.   со   стандартным   нормальным
распределением, то

    [pic]

    Замечание 19. Еще раз напомним, что функция распределения  стандартного
нормального закона ищется либо по  соответствующей  таблице  в  справочнике,
либо с помощью какого-либо  программного  обеспечения,  но  никак  не  путем
нахождения первообразной.

                  14.4 Предельная теорема Муавра — Лапласа


    Получим в качестве следствия из ЦПТ предельную теорему Муавра — Лапласа
(P. S. Laplace, 1812; A. de Moivre, 1730). Подобно ЗБЧ Бернулли,  предельная
теорема Муавра – Лапласа — утверждение только схемы Бернулли.

    Теорема 32 (Предельная теорема Муавра — Лапласа).

    Пусть А — событие, которое может произойти в  любом  из  n  независимых
испытаний с одной и той же вероятностью  p  =  P(A).  Пусть  [pic]  —  число
осуществлений события А в n  испытаниях.  Тогда  [pic].  Иначе  говоря,  для
любых вещественных x < y при [pic] имеет место сходимость

    [pic]

                       14.5 Примеры использования ЦПТ


    Пример 48.

    Монета подбрасывается 10 000 раз. Оценить вероятность того, что частота
выпадения герба отличается от вероятности более чем на одну сотую.

    Требуется найти

    [pic], где [pic]—число выпадений герба, а [pic] —  независимые  с.  в.,
имеющие одно и то же распределение Бернулли с параметром 1/2.  Домножим  обе
части неравенства под знаком вероятности на [pic] и  поделим  на  корень  из
дисперсии [pic]одного слагаемого.

    [pic]

    [pic]

    Согласно   ЦПТ   или   предельной    теореме    Муавра    —    Лапласа,
последовательность

    [pic]

    слабо сходится к  стандартному  нормальному  распределению.  Рассмотрим
произвольную с. в. [pic], имеющую распределение [pic].

    [pic]

    Равенство [pic] следует из свойства 10.

    Замечание  20.   Центральной   предельной   теоремой   пользуются   для
приближенного вычисления вероятностей, связанных с  суммами  большого  числа
независимых и  одинаково  распределенных  величин.  При  этом  распределение
центрированной и нормированной  суммы  заменяют  на  стандартное  нормальное
распределение.

    Следующий результат позволяет оценить погрешность приближения в ЦПТ.

    Теорема 33 (Неравенство Берри – Эссеена).

    В условиях ЦПТ для любого х ( R (то есть равномерно по х)

    [pic]

    Замечание 21. Про постоянную С известно, что:

    а) в общем случае С не превышает 0,7655 (И. С. Шиганов),

    б) погрешность приближения наиболее велика, если слагаемые [pic]  имеют
распределение Бернулли, и С  в  этом  случае  не  меньше,  чем  [pic](C.  G.
Esseen, Б. А. Рогозин),

    в) как показывают расчеты, можно смело брать в качестве С число  0,4  —
даже для слагаемых с распределением Бернулли, особенно при малых n, когда  и
это значение постоянной оказывается слишком грубой оценкой.

    Подробный обзор можно найти в  монографии  В.М.Золотарева  «Современная
теория суммирования независимых случайных величин», стр. 264– 291.

    Продолжение примера 48. Проверьте, что для с. в. [pic] с распределением
Бернулли

    [pic]

    Поэтому разница между левой и правой частями приближенного равенства  в
примере 48 при [pic]и [pic] не превышает величины

    [pic]

    так что искомая вероятность [pic]не больше, чем  0,0456+0,004.  Уместно
сравнить этот ответ с оценкой, полученной с помощью ЗБЧ в примере 48.

    Пример 49.

    Пусть [pic] — независимые и одинаково распределенные случайные величины
с конечной и ненулевой дисперсией, [pic]сумму первых  n  случайных  величин.
При каких с имеет или не имеет место сходимость

    [pic]

    Согласно ЗБЧ, последовательность  [pic]  сходится  по  вероятности  (а,
следовательно,  и  слабо)  к  [pic].   Слабая   сходимость   означает,   что
последовательность   функций   распределения   [pic]сходится    к    функции
распределения [pic], если [pic] непрерывна в точке с (и ничего не  означает,
если [pic] разрывна в точке с). Но

    [pic]

    есть функция распределения вырожденного закона  и  непрерывна  в  любой
точке с, кроме [pic]. Итак, первый вывод: сходимость [pic] имеет  место  для
любого с, кроме, возможно, [pic]. Убедимся, что для [pic]  такой  сходимости
быть не может. Пусть [pic]. Согласно ЦПТ,

    [pic]

    Аналогично, кстати, ведет себя и вероятность [pic]. Она тоже  стремится
к 1/2, а не к [pic]


-----------------------

    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]



    [pic]