Точечные оценки математического ожидания. Точечные оценки дисперсии

Пусть имеется случайная величина X, и ее параметры математическое ожидание а и дисперсия неизвестны. Над величиной X произведеноn независимых опытов, давших результаты x 1, x 2, x n .

Не уменьшая общности рассуждений, будем считать эти значения случайной величины различными. Будем рассматривать значения x 1, x 2, x n как независимые, одинаково распределенные случайные величины X 1, X 2, X n .

Простейший метод статистического оценивания - метод подстановки и аналогии - состоит в том, что в качестве оценки той или иной числовой характеристики (среднего, дисперсии и др.) генеральной совокупности берут соответствующую характеристику распределения выборки - выборочную характеристику.

По методу подстановки в качестве оценки математического ожидания а надо взять математическое ожидание распределения выборки - выборочное среднее. Таким образом, получаем

Чтобы проверить несмещенность и состоятельность выборочного среднего как оценки а , рассмотрим эту статистику как функцию выбранного вектора (X 1, X 2, X n). Приняв во внимание, что каждая из величин X 1, X 2, X n имеет тот же закон распределения, что и величина X, заключаем, что и числовые характеристики этих величин и величины X одинаковые: M(X i ) = M(X) = a , D(X i ) = D(X) = , i = 1, 2, n, причем X i - независимые в совокупности случайные величины.

Следовательно,

Отсюда по определению получаем, что - несмещенная оценка а , и так как D()®0 при n®¥, то в силу теоремы предыдущего параграфа является состоятельной оценкой математического ожидания а генеральной совокупности.

Эффективность или неэффективность оценки зависит от вида закона распределения случайной величины X. Можно доказать, что если величина X распределена по нормальному закону, то оценка является эффективной. Для других законов распределения это может быть не так.

Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия

Так как , где - генеральная дисперсия. Действительно,

Оценка s -- 2 для генеральной дисперсии является также и состоятельной, но не является эффективной. Однако в случае нормального распределения она является «асимптотически эффективной», то есть при увеличении n отношение ее дисперсии к минимально возможной неограниченно приближается к единице.

Итак, если дана выборка из распределения F(x ) случайной величины X с неизвестным математическим ожиданием а и дисперсией , то для вычисления значений этих параметров мы имеем право пользоваться следующими приближенными формулами:

a ,

Здесь x- i - - варианта выборки, n- i - - частота варианты x i , - - объем выборки.
Для вычисления исправленной выборочной дисперсии более удобна формула

Для упрощения расчета целесообразно перейти к условным вариантам (в качестве с выгодно брать первоначальную варианту, расположенную в середине интервального вариационного ряда). Тогда

, .

Интервальное оценивание

Выше мы рассмотрели вопрос об оценке неизвестного параметра а одним числом. Такие оценки мы назвали точечными. Они имеют тот недостаток, что при малом объеме выборки могут значительно отличаться от оцениваемых параметров. Поэтому, чтобы получить представление о близости между параметром и его оценкой, в математической статистике вводятся, так называемые, интервальные оценки.

Пусть во выборке для параметра q найдена точечная оценка q * . Обычно исследователи заранее задаются некоторой достаточно большой вероятностью g (например, 0,95; 0,99 или 0,999) такой, что событие с вероятностью g можно считать практически достоверным, и ставят вопрос об отыскании такого значения e > 0, для которого

Видоизменив это равенство, получим:

и будем в этом случае говорить, что интервал ]q * - e; q * + e[ покрывает оцениваемый параметр q с вероятностью g.

Интервал ]q * -e; q * +e [ называется доверительным интервалом .

Вероятность g называется надежностью (доверительной вероятностью) интервальной оценки.

Концы доверительного интервала, т.е. точки q * -e и q * +e называются доверительными границами .

Число e называется точностью оценки .

В качестве примера задачи об определении доверительных границ, рассмотрим вопрос об оценке математического ожидания случайной величины Х, имеющей нормальный закон распределения с параметрами а и s, т.е. Х = N(a , s). Математическое ожидание в этом случае равно а . По наблюдениям Х 1 , Х 2 , Х n вычислим среднее и оценку дисперсии s 2 .

Оказывается, что по данным выборки можно построить случайную величину

которая имеет распределение Стьюдента (или t-распределение) с n = n -1 степенями свободы.

Воспользуемся таблицей П.1.3 и найдем для заданных вероятности g и числа n число t g такое, при котором вероятность

P(|t(n)| < t g) = g,

Сделав очевидные преобразования получим,

Порядок применения F-критерия следующий:

1. Принимается предположение о нормальности распределения генеральных совокупностей. При заданном уровне значимости a формулируется нулевая гипотеза Н 0: s х 2 = s y 2 о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе Н 1: s х 2 > s y 2 .

2. Получают две независимые выборки из совокупностей Х и Y объемом n x и n y соответственно.

3. Рассчитывают значения исправленных выборочных дисперсий s х 2 и s y 2 (методы расчета рассмотрены в §13.4). Большую из дисперсий (s х 2 или s y 2) обозначают s 1 2 , меньшую - s 2 2 .

4. Вычисляется значение F-критерия по формуле F набл = s 1 2 / s 2 2 .

5. По таблице критических точек распределения Фишера - Снедекора, по заданному уровню значимости a и числом степеней свободы n 1 = n 1 - 1, n 2 = n 2 - 1 (n 1 - число степеней свободы большей исправленной дисперсии), находится критическая точка F кр (a, n 1 , n 2).

Отметим, что в таблице П.1.7 приведены критические значения одностороннего F-критерия. Поэтому, если применяется двусторонний критерий (Н 1: s х 2 ¹ s y 2), то правостороннюю критическую точку F кр (a/2, n 1 , n 2) ищут по уровню значимости a/2 (вдвое меньше заданного) и числам степеней свободы n 1 и n 2 (n 1 - число степеней свободы большей дисперсии). Левостороннюю критическую точку можно и не отыскивать.

6. Делается вывод: если вычисленное значение F-критерия больше или равно критическому (F набл ³ F кр), то дисперсии различаются значимо на заданном уровне значимости. В противном случае (F набл < F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Задача 15.1 . Расход сырья на единицу продукции по старой технологии составил:

По новой технологии:

Предположив, что соответствующие генеральные совокупности X и Y имеют нормальные распределения, проверить, что по вариативности расход сырья по новой и старой технологиям не отличаются, если принять уровень значимости a = 0,1.

Решение . Действуем в порядке, указанном выше.

1. Будем судить о вариативности расхода сырья по новой и старой технологиям по величинам дисперсий. Таким образом, нулевая гипотеза имеет вид Н 0: s х 2 = s y 2 . В качестве конкурирующей примем гипотезу Н 1: s х 2 ¹ s y 2 , поскольку заранее не уверены в том, что какая-либо из генеральных дисперсий больше другой.

2-3. Найдем выборочные дисперсии. Для упрощения вычислений перейдем к условным вариантам:

u i = x i - 307, v i = y i - 304.

Все вычисления оформим в виде следующих таблиц:

u i	m i	m i u i	m i u i 2	m i (u i +1) 2	v i	n i	n i v i	n i v i 2	n i (v i +1) 2
-3		-3			-1		-2


å	-
					å	-

Контроль: å m i u i 2 + 2å m i u i + m i = Контроль: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Найдем исправленные выборочные дисперсии:

4. Сравним дисперсии. Найдем отношение большей исправленной дисперсии к меньшей:

5. По условию конкурирующая гипотеза имеет вид s х 2 ¹ s y 2 , поэтому критическая область двусторонняя и при отыскании критической точки следует брать уровни значимости, вдвое меньше заданного.

По таблице П.1.7 по уровню значимости a/2 = 0,1/2 = 0,05 и числам степеней свободы n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8 находим критическую точку F кр (0,05; 12; 8) = 3,28.

6. Так как F набл. < F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Выше при проверке гипотез предполагалось нормальность распределения исследуемых случайных величин. Однако специальные исследования показали, что предложенные алгоритмы весьма устойчивы (особенно при больших объемах выборок) по отношению к отклонению от нормального распределения.

Математическое ожидание - это распределение вероятностей случайной величины

Математическое ожидание, определение, математическое ожидание дискретной и непрерывной случайных величин, выборочное, условное матожидание, расчет, свойства, задачи, оценка матожидания, дисперсия, функция распределения, формулы, примеры расчета

Развернуть содержание

Свернуть содержание

Математическое ожидание - это, определение

Одно из важнейших понятий в математической статистике и теории вероятностей, характеризующее распределение значений или вероятностей случайной величины. Обычно выражается как средневзвешенное значение всех возможных параметров случайной величины. Широко применяется при проведении технического анализа, исследовании числовых рядов, изучении непрерывных и продолжительных процессов. Имеет важное значение при оценке рисков, прогнозировании ценовых показателей при торговле на финансовых рынках, используется при разработке стратегий и методов игровой тактики в теории азартных игр.

Математическое ожидание - это среднее значение случайной величины, распределение вероятностей случайной величины рассматривается в теории вероятностей.

Математическое ожидание – это мера среднего значения случайной величины в теории вероятности. Математическое ожидание случайной величины x обозначается M(x) .

Математическое ожидание – это

Математическое ожидание – это в теории вероятности средневзвешенная величина всех возможных значений, которые может принимать эта случайная величина.

Математическое ожидание – это сумма произведений всех возможных значений случайной величины на вероятности этих значений.

Математическое ожидание – это средняя выгода от того или иного решения при условии, что подобное решение может быть рассмотрено в рамках теории больших чисел и длительной дистанции.

Математическое ожидание – это в теории азартных игр сумма выигрыша, которую может заработать или проиграть игрок, в среднем, по каждой ставке. На языке азартных игроков это иногда называется «преимуществом игрока» (если оно положительно для игрока) или «преимуществом казино» (если оно отрицательно для игрока).

Математическое ожидание – это процент прибыли на выигрыш, умноженный на среднюю прибыль, минус вероятность убытка, умноженная на средний убыток.

Математическое ожидание случайной величины в математической теории

Одной из важных числовых характеристик случайной величины является математическое ожидание. Введем понятие системы случайных величин. Рассмотрим совокупность случайных величин, которые являются результатами одного и того же случайного эксперимента. Если - одно из возможных значений системы, то событию соответствует определенная вероятность удовлетворяющая аксиомам Колмогорова. Функция, определенная при любых возможных значениях случайных величин, называется совместным законом распределения. Эта функция позволяет вычислять вероятности любых событий из. В частности, совместный закон распределения случайных величин и, которые принимают значения из множества и, задается вероятностями.

Термин «математическое ожидание» введён Пьером Симоном маркизом де Лапласом (1795) и произошёл от понятия «ожидаемого значения выигрыша», впервые появившегося в 17 веке в теории азартных игр в трудах Блеза Паскаля и Христиана Гюйгенса. Однако первое полное теоретическое осмысление и оценка этого понятия даны Пафнутием Львовичем Чебышёвым (середина 19 века).

Закон распределения случайных числовых величин (функция распределения и ряд распределения или плотность вероятности) полностью описывают поведение случайной величины. Но в ряде задач достаточно знать некоторые числовые характеристики исследуемой величины (например, ее среднее значение и возможное отклонение от него), чтобы ответить на поставленный вопрос. Основными числовыми характеристиками случайных величин являются математическое ожидание, дисперсия, мода и медиана.

Математическим ожиданием дискретной случайной величины называется сумма произведений ее возможных значений на соответствующие им вероятности. Иногда математическое ожидание называют взвешенным средним, так как оно приближенно равно среднему арифметическому наблюдаемых значений случайной величины при большом числе опытов. Из определения математического ожидания следует, что его значение не меньше наименьшего возможного значения случайной величины и не больше наибольшего. Математическое ожидание случайной величины есть неслучайная (постоянная) величина.

Математическое ожидание имеет простой физический смысл: если на прямой разместить единичную массу, поместив в некоторые точки некоторую массу (для дискретного распределения), или «размазав» её с определенной плотностью (для абсолютно непрерывного распределения), то точка, соответствующая математическому ожиданию, будет координатой «центра тяжести» прямой.

Среднее значение случайной величины есть некоторое число, являющееся как бы её «представителем» и заменяющее её при грубо ориентировочных расчетах. Когда мы говорим: «среднее время работы лампы равно 100 часам» или «средняя точка попадания смещена относительно цели на 2 м вправо», мы этим указываем определенную числовую характеристику случайной величины, описывающую её местоположение на числовой оси, т.е. «характеристику положения».

Из характеристик положения в теории вероятностей важнейшую роль играет математическое ожидание случайной величины, которое иногда называют просто средним значением случайной величины.

Рассмотрим случайную величину Х , имеющую возможные значения х1, х2, …, хn с вероятностями p1, p2, …, pn . Нам требуется охарактеризовать каким-то числом положение значений случайной величины на оси абсцисс с учетом того, что эти значения имеют различные вероятности. Для этой цели естественно воспользоваться так называемым «средним взвешенным» из значений xi , причем каждое значение xi при осреднении должно учитываться с «весом», пропорциональным вероятности этого значения. Таким образом, мы вычислим среднее случайной величины X , которое мы обозначим M |X| :

Это среднее взвешенное значение и называется математическим ожиданием случайной величины. Таким образом, мы ввели в рассмотрении одно из важнейших понятий теории вероятностей – понятие математического ожидания. Математическим ожиданием случайной величины называется сумма произведений всех возможных значений случайной величины на вероятности этих значений.

Х связано своеобразной зависимостью со средним арифметическим наблюденных значений случайной величины при большом числе опытов. Эта зависимость того же типа, как зависимость между частотой и вероятностью, а именно: при большом числе опытов среднее арифметическое наблюденных значений случайной величины приближается (сходится по вероятности) к ее математическому ожиданию. Из наличия связи между частотой и вероятностью можно вывести как следствие наличие подобной же связи между средним арифметическим и математическим ожидание. Действительно, рассмотрим случайную величину Х , характеризуемую рядом распределения:

Пусть производится N независимых опытов, в каждом из которых величина X принимает определенное значение. Предположим, что значение x1 появилось m1 раз, значение x2 появилось m2 раз, вообще значение xi появилось mi раз. Вычислим среднее арифметическое наблюденных значений величины Х, которое, в отличие от математического ожидания М|X| мы обозначим M*|X|:

При увеличении числа опытов N частоты pi будут приближаться (сходиться по вероятности) к соответствующим вероятностям. Следовательно, и среднее арифметическое наблюденных значений случайной величины M|X| при увеличении числа опытов будет приближаться (сходится по вероятности) к её математическому ожиданию. Сформулированная выше связь между средним арифметическим и математическим ожиданием составляет содержание одной из форм закона больших чисел.

Мы уже знаем, что все формы закона больших чисел констатируют факт устойчивости некоторых средних при большом числе опытов. Здесь речь идет об устойчивости среднего арифметического из ряда наблюдений одной и той же величины. При небольшом числе опытов среднее арифметическое их результатов случайно; при достаточном увеличении числа опытов оно становится «почти не случайным» и, стабилизируясь, приближается к постоянной величине – математическому ожиданию.

Свойство устойчивости средних при большом числе опытов легко проверить экспериментально. Например, взвешивая какое-либо тело в лаборатории на точных весах, мы в результате взвешивания получаем каждый раз новое значение; чтобы уменьшить ошибку наблюдения, мы взвешиваем тело несколько раз и пользуемся средним арифметическим полученных значений. Легко убедиться, что при дальнейшем увеличении числа опытов (взвешиваний) среднее арифметическое реагирует на это увеличение все меньше и меньше и при достаточно большом числе опытов практически перестает меняться.

Следует заметить, что важнейшая характеристика положения случайной величины – математическое ожидание – существует не для всех случайных величин. Можно составить примеры таких случайных величин, для которых математического ожидания не существует, так как соответствующая сумма или интеграл расходятся. Однако для практики такие случаи существенного интереса не представляют. Обычно случайные величины, с которыми мы имеем дело, имеют ограниченную область возможных значений и, безусловно, обладают математическим ожиданием.

Кроме важнейшей из характеристик положения случайной величины – математического ожидания, - на практике иногда применяются и другие характеристики положения, в частности, мода и медиана случайной величины.

Модой случайной величины называется её наиболее вероятное значение. Термин «наиболее вероятное значение», строго говоря, применим только к прерывным величинам; для непрерывной величины модой является то значение, в котором плотность вероятности максимальна. На рисунках показана мода соответственно для прерывной и непрерывной случайных величин.

Если многоугольник распределения (кривая распределения) имеет более одного максимума, распределение называется «полимодальным».

Иногда встречаются распределения, обладающие посередине не максимумом, а минимумом. Такие распределения называют «антимодальными».

В общем случае мода и математическое ожидание случайной величины не совпадают. В частном случае, когда распределение является симметричным и модальным (т.е. имеет моду) и существует математическое ожидание, то оно совпадает с модой и центром симметрии распределения.

Часто применяется еще одна характеристика положения – так называемая медиана случайной величины. Этой характеристикой пользуются обычно только для непрерывных случайных величин, хотя формально можно её определить и для прерывной величины. Геометрически медиана – это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам.

В случае симметричного модального распределения медиана совпадает с математическим ожиданием и модой.

Математическое ожидание представляет собой среднее значение, случайной величины - числовая характеристика распределения вероятностей случайной величины. Самым общим образом математическое ожидание случайной величины Х(w) определяется как интеграл Лебега по отношению к вероятностной мере Р в исходном вероятностном пространстве:

Математическое ожидание может быть вычислено и как интеграл Лебега от х по распределению вероятностей рх величины X :

Естественным образом можно определить понятие случайной величины с бесконечным математическим ожиданием. Типичным примером служат времена возвращения в некоторых случайных блужданиях.

С помощью математического ожидания определяются многие числовые и функциональные характеристики распределения (как математическое ожидание соответствующих функций от случайной величины), например, производящая функция, характеристическая функция, моменты любого порядка, в частности дисперсия, ковариация.

Математическое ожидание есть характеристика расположения значений случайной величины (среднее значение ее распределения). В этом качестве математическое ожиддание служит некоторым "типичным" параметром распределения и его роль аналогична роли статического момента - координаты центра тяжести распределения массы - в механике. От прочих характеристик расположения, с помощью которых распределение описывается в общих чертах,- медиан, мод, математическое ожидание отличается тем большим значением, которое оно и соответствующая ему характеристика рассеяния - дисперсия - имеют в предельных теоремах теории вероятностей. С наибольшей полнотой смысл математического ожидания раскрывается законом больших чисел (неравенство Чебышева) и усиленным законом больших чисел.

Математическое ожидание дискретной случайной величины

Пусть есть некоторая случайная величина, которая может принять одно из нескольких числовых значений (допустим, количество очков при броске кости может быть 1, 2, 3, 4, 5 или 6). Часто на практике для такой величины возникает вопрос: а какое значение она принимает "в среднем" при большом количестве тестов? Каков будет наш средний доход (или убыток) от каждой из рискованных операций?

Скажем, есть какая-то лотерея. Мы хотим понять, выгодно или нет в ней поучаствовать (или даже участвовать неоднократно, регулярно). Допустим, выигрышный каждый четвёртый билет, приз составит 300 руб., а цена любого билета - 100 руб. При бесконечно большом количестве участий получается вот что. В трёх четвертях случаев мы проиграем, каждые три проигрыша обойдутся в 300 руб. В каждом четвёртом случае мы выиграем 200 руб. (приз минус стоимость), то есть за четыре участия мы в среднем теряем 100 руб., за одно - в среднем 25 руб. Итого в среднем темпы нашего разорения составят 25 руб./билет.

Кидаем игральную кость. Если она не жульническая (без смещения центра тяжести и т.д.), то сколько мы в среднем будем иметь очков за раз? Поскольку каждый вариант равновероятен, берём тупо среднее арифметическое и получаем 3,5. Поскольку это СРЕДНЕЕ, то незачем возмущаться, что 3,5 очков никакой конкретный бросок не даст - ну нет у этого куба грани с таким числом!

Теперь обобщим наши примеры:

Обратимся к только что приведённой картинке. Слева табличка распределения случайной величины. Величина X может принимать одно из n возможных значений (приведены в верхней строке). Никаких других значений не может быть. Под каждым возможным значением снизу подписана его вероятность. Справа приведена формула, где M(X) и называется математическим ожиданием. Смысл этой величины в том, что при большом количестве испытаний (при большой выборке) среднее значение будет стремиться к этому самому математическому ожиданию.

Вернёмся опять к тому же самому игральному кубу. Математическое ожидание количества очков при броске равно 3,5 (посчитайте сами по формуле, если не верите). Скажем, вы кинули его пару раз. Выпали 4 и 6. В среднем получилось 5, то есть далеко от 3,5. Кинули ещё разок, выпало 3, то есть в среднем (4 + 6 + 3)/3 = 4,3333... Как-то далеко от математического ожидания. А теперь проведите сумасшедший эксперимент - киньте куб 1000 раз! И если в среднем и не будет ровно 3,5, то будет близко к тому.

Посчитаем математическое ожидание для выше описанной лотереи. Табличка будет выглядеть вот так:

Тогда математическое ожидание составит, как мы установили выше.:

Другое дело, что так же "на пальцах", без формулы, было бы трудновато, если бы имелось больше вариантов. Ну скажем, имелось бы 75% проигрышных билетов, 20% выигрышных билетов и 5% особо выигрышных.

Теперь некоторые свойства математического ожидания.

Доказать это просто:

Постоянный множитель допускается выносить за знак математического ожидания, то есть:

Это является частным случаем свойства линейности математического ожидания.

Другое следствие линейности математического ожидания:

то есть математическое ожидание суммы случайных величин равно сумме математических ожиданий случайных величин.

Пусть X, Y - независимые случайные величины , тогда:

Это тоже несложно доказать) Произведение XY само представляет собой случайную величину, при этом если исходные величины могли принимать n и m значений соответственно, то XY может принимать nm значений. Вероятность каждого из значений вычисляется исходя из того, что вероятности независимых событий перемножаются. В итоге получаем вот что:

Математическое ожидание непрерывной случайной величины

У непрерывных случайных величин есть такая характеристика, как плотность распределения (плотность вероятности). Она, по сути характеризует ситуацию, что некоторые значения из множества действительных чисел случайная величина принимает чаще, некоторые - реже. Например, рассмотрим вот какой график:

Здесь X - собственно случайная величина, f(x) - плотность распределения. Судя по данному графику, при опытах значение X часто будет числом, близким к нулю. Шансы же превысить 3 или оказаться меньше -3 скорее чисто теоретические.

Пусть, например, есть равномерное распределение:

Это вполне соответствует интуитивному пониманию. Скажем, если мы получаем при равномерном распределении много случайных действительных чисел, каждое из отрезка |0; 1| , то среднее арифметическое должно быть около 0,5.

Свойства математического ожидания - линейность и т.д., применимые для дискретных случайных величин, применимы и здесь.

Взаимосвязь математического ожидания с другими статистическими показателями

В статистическом анализе наряду с математическим ожиданием существует система взаимозависимых показателей, отражающих однородность явлений и устойчивость процессов. Часто показатели вариации не имеют самостоятельного смысла и используются для дальнейшего анализа данных. Исключением является коэффициент вариации, который характеризует однородность данных, что является ценной статистической характеристикой.

Степень изменчивости или устойчивости процессов в статистической науке может измеряться с помощью нескольких показателей.

Наиболее важным показателем, характеризующим изменчивость случайной величины, является Дисперсия , которая самым тесным и непосредственным образом связана с математическим ожиданием. Этот параметр активно используется в других видах статистического анализа (проверка гипотез, анализ причинно-следственных связей и др.). Как и среднее линейное отклонение, дисперсия также отражает меру разброса данных вокруг средней величины.

Язык знаков полезно перевести на язык слов. Получится, что дисперсия - это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Разгадка магического слова «дисперсия» заключается всего в трех словах.

Однако в чистом виде, как, например, средняя арифметическая, или индекс, дисперсия не используется. Это скорее вспомогательный и промежуточный показатель, который используется для других видов статистического анализа. У нее даже единицы измерения нормальной нет. Судя по формуле, это квадрат единицы измерения исходных данных.

Пусть мы измеряем случайную величину N раз, например, десять раз измеряем скорость ветра и хотим найти среднее значение. Как связано среднее значение с функцией распределения?

Или будем кидать игральный кубик большое количество раз. Количество очков, которое выпадет на кубике при каждом броске, является случайной величиной и может принимать любые натуральные значения от 1 до 6. Среднее арифметическое выпавших очков, подсчитанных за все броски кубика, тоже является случайной величиной, однако при больших N оно стремится ко вполне конкретному числу – математическому ожиданию Mx . В данном случае Mx = 3,5.

Каким образом получилась эта величина? Пусть в N испытаниях n1 раз выпало 1 очко, n2 раз – 2 очка и так далее. Тогда количество исходов, в которых выпало одно очко:

Аналогично для исходов, когда выпало 2, 3, 4, 5 и 6 очков.

Предположим теперь, что мы знаем закон распределения случайной величины x, то есть знаем, что случайная величина x может принимать значения x1, x2, ..., xk с вероятностями p1, p2, ..., pk.

Математическое ожидание Mx случайной величины x равно:

Математическое ожидание не всегда является разумной оценкой какой-нибудь случайной величины. Так, для оценки средней заработной платы разумнее использовать понятие медианы, то есть такой величины, что количество людей, получающих меньшую, чем медиана, зарплату и большую, совпадают.

Вероятность р1 того, что случайная величина х окажется меньшей х1/2, и вероятность р2 того, что случайная величина x окажется большей х1/2, одинаковы и равны 1/2. Медиана определяется однозначно не для всех распределений.

Стандартным или Среднеквадратическим отклонением в статистике называется степень отклонения данных наблюдений или множеств от СРЕДНЕГО значения. Обозначается буквами s или s. Небольшое стандартное отклонение указывает на то, что данные группируются вокруг среднего значения, а значительное - что начальные данные располагаются далеко от него. Стандартное отклонение равно квадратному корню величины, называемой дисперсией. Она есть среднее число суммы возведенных в квадрат разностей начальных данных, отклоняющихся от среднего значения. Среднеквадратическим отклонением случайной величины называется корень квадратный из дисперсии:

Пример. В условиях испытаний при стрельбе по мишени вычислить дисперсию и среднеквадратическое отклонение случайной величины:

Вариация - колеблемость, изменяемость величины признака у единиц совокупности. Отдельные числовые значения признака, встречающиеся в изу¬чаемой совокупности, называют вариантами значений. Недостаточность средней величины для полной характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Коэффициент вариации вычисляют по формуле:

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности. Этот показатель дает самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Зависимость от крайних значений признака придает размаху вариации неустойчивый, случайный характер.

Среднее линейное отклонение представляет собой среднее арифметическое из абсолютных (по модулю) отклонений всех значений анализируемой совокупности от их средней величины:

Математическое ожидание в теории азартных игр

Математическое ожидание – это среднее количество денег, которое игрок в азартные игры может выиграть или проиграть на данной ставке. Это очень существенное понятие для игрока, потому что оно является основополагающим для оценки большинства игровых ситуаций. Математическое ожидание – это также оптимальный инструмент для анализа основных карточных раскладов и игровых ситуаций.

Допустим, вы играете с другом в монетку, каждый раз делая ставку поровну по $1 независимо оттого, что выпадет. Решка – вы выиграли, орел – проиграли. Шансы на то, что выпадет решка один к одному, и вы делаете ставку $1 к $1. Таким образом, математическое ожидание у вас равно нулю, т.к. с точки зрения математики вы не можете знать будете вы вести или проигрывать после двух бросков или после 200.

Ваш часовой выигрыш равен нулю. Часовой выигрыш – это то количество денег, которое вы ожидаете выиграть за час. Вы можете кидать монету 500 раз в течение часа, но вы не выиграете и не проиграете, т.к. ваши шансы ни положительны, ни отрицательны. Если смотреть, с точки зрения серьезного игрока такая система ставок неплоха. Но это попросту потеря времени.

Но предположим, кто-то хочет поставить $2 против вашего $1 в эту же игру. Тогда вы сразу же обладаете положительным матожиданием в 50 центов с каждой ставки. Почему 50 центов? В среднем одну ставку вы выигрываете, вторую проигрываете. Поставите первый доллар – и потеряете $1, ставите второй – выиграете $2. Вы два раза сделали ставку по $1 и идете впереди на $1. Таким образом, каждая из ваших однодолларовых ставок дала вам 50 центов.

Если за один час монета выпадет 500 раз, ваш часовой выигрыш составит уже $250, т.к. в среднем вы потеряли по одному доллару 250 раз и выиграли по два доллара 250 раз. $500 минус $250 равно $250, что и составляет суммарный выигрыш. Обратите внимание, что матожидание, являющиеся суммой, которую в среднем вы выиграли на одной ставке, равняется 50 центам. Вы выиграли $250, делая ставку по доллару 500 раз, что равняется 50 центам со ставки.

Математическое ожидание не имеет ничего общего с кратковременным результатом. Ваш оппонент, который решил ставить против вас $2 мог обыграть вас на первых десяти бросках подряд, но вы, обладая преимуществом ставок 2 к 1 при прочих равных, в любых обстоятельствах зарабатываете 50 центов с каждой ставки в $1. Нет разницы, выигрываете вы либо проигрываете одну ставку или несколько ставок, но только при условии, что у вас хватит наличности, чтобы спокойно компенсировать затраты. Если вы будете продолжать ставить так же, то за длительный период времени ваш выигрыш подойдет к сумме матожиданий в отдельных бросках.

Каждый раз, делая ставку с лучшим исходом (ставка, которая может оказаться выгодной на длинной дистанции), когда шансы в вашу пользу, вы обязательно что-то выигрываете на ней, и не важно теряете ли вы ее или нет в данной раздаче. И напротив, если вы сделали ставку с худшим исходом (ставка, которая невыгодна на длинной дистанции), когда шансы не в вашу пользу, вы что-то теряете независимо от того, выиграли вы или проиграли в данной раздаче.

Вы делаете ставку с лучшим исходом, если матожидание у вас положительно, а оно является положительным, если шансы на вашей стороне. Делая ставку с худшим исходом, у вас отрицательное матожидание, которое бывает, когда шансы против вас. Серьезные игроки делают ставки только с лучшим исходом, при худшем – они пасуют. Что означает шансы в вашу пользу? Вы можете в итоге выиграть больше, чем приносят реальные шансы. Реальные шансы на то, что выпадет решка 1 к 1, но у вас выходит 2 к 1 за счет соотношения ставок. В данном случае шансы в вашу пользу. Вы точно получаете лучший исход с положительным ожиданием в 50 центов за одну ставку.

Вот более сложный пример математического ожидания. Приятель пишет цифры от одного до пяти и делает ставку $5 против вашего $1 на то, что вы не определите загаданную цифру. Соглашаться ли вам на такое пари? Какое здесь матожидание?

В среднем четыре раза вы ошибетесь. Исходя из этого, шансы против того, что вы отгадаете цифру, составят 4 к 1. Шансы за то, что при одной попытке вы лишитесь доллара. Тем не менее, вы выигрываете 5 к 1, при возможности проиграть 4 к 1. Поэтому шансы в вашу пользу, вы можете принимать пари и надеяться на лучший исход. Если вы сделаете такую ставку пять раз, в среднем вы проиграете четыре раза по $1 и один раз выиграете $5. Исходя из этого, за все пять попыток вы заработаете $1 с положительным математическим ожиданием в 20 центов за одну ставку.

Игрок, который собирается выиграть больше, чем ставит, как в примере выше, – ловит шансы. И напротив, он губит шансы, когда предполагает выиграть меньше, чем ставит. Игрок, делающий ставку может иметь либо положительное, либо отрицательное матожидание, которое зависит от того, ловит он или губит шансы.

Если вы поставите $50 для того, чтобы выиграть $10 при вероятности выигрыша 4 к 1, то вы получите отрицательное матожидание $2, т.к. в среднем вы выиграете четыре раза по $10 и один раз проиграете $50, из чего видно, что потеря за одну ставку составит $10. Но вот если вы поставите $30 для того, чтобы выиграть $ 10, при тех же шансах выигрыша 4 к 1, то в данном случае вы имеете положительное ожидание $2, т.к. вы вновь выигрываете четыре раза по $10 и один раз проигрываете $30, что составит прибыль в $10. Данные примеры показывают, что первая ставка плохая, а вторая – хорошая.

Математическое ожидание является центром любой игровой ситуации. Когда букмекер призывает футбольных болельщиков ставить $11, чтобы выиграть $10, то он имеет положительное матожидание с каждых $10 в размере 50 центов. Если казино выплачивает равные деньги с пасовой линии в крепсе, то положительное ожидание казино составит приблизительно $1.40 с каждых $100, т.к. эта игра построена так, что каждый, кто поставил на эту линию, в среднем проигрывает 50.7% и выигрывает 49.3% общего времени. Бесспорно, именно это вроде бы минимальное положительное матожидание и приносит колоссальные прибыли владельцам казино по всему миру. Как заметил хозяин казино Vegas World Боб Ступак, «одна тысячная процента отрицательной вероятности на достаточно длинной дистанции разорит богатейшего человека в мире».

Математическое ожидание при игре в Покер

Игра в Покер является наиболее показательным и наглядным примером с точки зрения использования теории и свойств математического ожидания.

Математическое ожидание (англ. Expected Value) в Покере – средняя выгода от того или иного решения при условии, что подобное решение может быть рассмотрено в рамках теории больших чисел и длительной дистанции. Успешная игра в покер заключается в том, чтобы всегда принимать ходы только с положительным математическим ожиданием.

Математический смысл математического ожидания при игре в покер заключается в том, что мы часто сталкиваемся со случайными величинами при принятии решения (мы не знаем, какие именно карты на руках у оппонента, какие карты придут на последующих кругах торговли). Мы должны рассматривать каждое из решений с точки зрения теории больших чисел, которая гласит, что при достаточно большой выборке среднее значение случайной величины будет стремиться к её математическому ожиданию.

Среди частных формул для вычисления математического ожидания, в покере наиболее применима следующая:

При игре в покер математическое ожидание можно рассчитывать как для ставок, так и для коллов. В первом случае во внимание следует принимать фолд-эквити, во втором - собственные шансы банка. При оценке математического ожидания того или иного хода следует помнить, что фолд всегда имеет нулевое матожидание. Таким образом, сброс карт будет всегда более выгодным решением, чем любой отрицательный ход.

Ожидание говорит вам о том, что вы можете ожидать (прибыль или убыток) на каждый рискуемый вами доллар. Казино зарабатывают деньги, поскольку математическое ожидание от всех игры, которые практикуются в них, в пользу казино. При достаточно длинной серии игры можно ожидать, что клиент потеряет свои деньги, поскольку «вероятность» в пользу казино. Однако профессиональные игроки в казино ограничивают свои игры короткими промежутками времени, тем самым увеличивая вероятность в свою пользу. То же самое касается и инвестирования. Если ваше ожидание является положительным, вы можете заработать больше денег, совершая много сделок в короткий период времени. Ожидание это ваш процент прибыли на выигрыш, умноженный на среднюю прибыль, минус ваша вероятность убытка, умноженная на средний убыток.

Покер также можно рассмотреть с точки зрения математического ожидания. Вы можете предположить, что определенный ход выгоден, но в некоторых случаях он может оказаться далеко не лучшим, потому что выгоднее другой ход. Допустим, вы собрали фулл-хаус в пятикарточном покере с обменом. Ваш соперник делает ставку. Вы знаете, что если повысите ставку, он ответит. Поэтому повышение выглядит лучшей тактикой. Но если вы все же поднимите ставку, оставшиеся двое игроков, точно сбросят карты. Но если вы уравняете ставку, то будете полностью уверены, что двое других игроков после вас поступят также. При повышении ставки вы получаете одну единицу, а просто уравнивая – две. Таким образом, уравнивание дает вам более высокое положительное математическое ожидание, и будет являться наилучшей тактикой.

Математическое ожидание также может дать понятие о том, какая в покере тактика менее выгодна, а какая – более. К примеру, играя на определенной руке, вы полагаете, что ваши потери в среднем составят 75 центов, включая анте, то такую руку следует играть, т.к. это лучше, чем сброситься, когда анте равно $1.

Другой важной причиной для понимания сути математического ожидания является то, что оно дает вам чувство спокойствия независимо от того, выиграли вы ставку или нет: если вы сделали хорошую ставку или вовремя спасовали, вы будете знать, что вы заработали или сберегли определенное количество денег, которое игрок слабее не смог уберечь. Гораздо сложнее сбросить карты, если вы расстроены тем, что соперник на обмене собрал более сильную комбинацию. При всем при этом, деньги, которые вы сберегли, не играя, вместо того, чтобы ставить, прибавляются к вашему выигрышу за ночь или за месяц.

Просто помните, что если поменять ваши руки, ваш соперник ответил бы вам, и как вы увидите в статье «фундаментальная теорема покера» это лишь одно из ваших преимуществ. Вы должны радоваться, когда это случится. Вам даже можно научиться получать удовольствие от проигранной раздачи, потому что вы знаете, что другие игроки на вашем месте проиграли бы гораздо больше.

Как говорилось в примере с игрой в монетку в начале, часовой коэффициент прибыли взаимосвязан с математическим ожиданием, и данное понятие особенно важно для профессиональных игроков. Когда вы собираетесь играть в покер, вы должны мысленно прикинуть, сколько вы сможете выиграть за час игры. В большинстве случаев вам необходимо будет основываться на вашей интуиции и опыте, но вы также можете пользоваться и некоторыми математическими выкладками. К примеру, вы играете в лоуболл с обменом, и наблюдаете, что три участника делают ставки по $10, а затем меняют две карты, что является очень плохой тактикой, вы можете посчитать для себя, что каждый раз, когда они ставят $10, они теряют около $2. Каждый из них делает это восемь раз в час, а значит, все трое теряют в час примерно $48. Вы один из оставшихся четырех игроков, которые приблизительно равны, соответственно эти четыре игрока (и вы среди них) должны разделить $48, и прибыль каждого составит $12 в час. Ваш часовой коэффициент в этом случае попросту равен вашей доли от суммы денег, проигранной тремя плохими игроками за час.

За большой промежуток времени суммарный выигрыш игрока составляет сумму его математических ожиданий в отдельных раздачах. Чем больше вы играете с положительным ожиданием, тем больше выигрываете, и наоборот, чем больше раздач с отрицательным ожиданием вы сыграете, тем больше вы проиграете. Вследствие этого, следует отдавать предпочтение игре, которая сможет максимально увеличить ваше положительное ожидание или сведет на нет отрицательное, чтобы вы смогли поднять до максимума ваш часовой выигрыш.

Положительное математическое ожидание в игровой стратегии

Если вы знаете, как считать карты, у вас может быть преимущество перед казино, если они не заметят этого и не выкинут вас вон. Казино обожают пьяных игроков и не переносят считающих карты. Преимущество позволит вам со временем выиграть большее число раз, чем проиграть. Хорошее управление капиталом при использовании расчетов математического ожидания может помочь извлечь больше прибыли из вашего преимущества и сократить потери. Без преимущества вам лучше отдать деньги на благотворительность. В игре на бирже преимущество дает система игры, создающая большую прибыль, чем потери, разница цен и комиссионные. Никакое управление капиталом не спасет плохую игровую систему.

Положительное ожидание определяется значением, превышающим ноль. Чем больше это число, тем сильнее статис¬тическое ожидание. Если значение меньше нуля, то математическое ожидание также будет отрицательным. Чем больше модуль отрица¬тельного значения, тем хуже ситуация. Если результат равен нулю, то ожидание является безубыточным. Вы можете выиграть только тогда, когда у вас положительное математическое ожидание, разумная система игры. Игра по интуиции приводит к катастрофе.

Математическое ожидание и биржевая торговля

Математическое ожидание – достаточно широко востребованный и популярный статистический показатель при осуществлении биржевых торгов на финансовых рынках. В первую очередь данный параметр используют для анализа успешности торговли. Не сложно догадаться, что чем больше данное значение, тем больше оснований считать изучаемую торговлю успешной. Конечно, анализ работы трейдера не может производиться только лишь с помощью данного параметра. Тем не менее, вычисляемое значение в совокупности с другими способами оценки качества работы, может существенно повысить точность анализа.

Математическое ожидание часто вычисляется в сервисах мониторингов торговых счетов, что позволяет быстро оценивать работу, совершаемую на депозите. В качестве исключений можно привести стратегии, в которых используется “пересиживание” убыточных сделок. Трейдеру может некоторое время сопутствовать удача, а потому, в его работе может не оказаться убытков вообще. В таком случае, ориентироваться только по матожиданию не получится, ведь не будут учтены риски, используемые в работе.

В торговле на рынке математическое ожидание чаще всего применяют при прогнозировании доходности какой-либо торговой стратегии или при прогнозировании доходов трейдера на основе статистических данных его предыдущих торгов.

В отношении управления капиталом очень важно понимать, что при совершении сделок с отрицательным ожиданием нет схемы управления деньгами, которая может однозначно принести высокую прибыль. Если вы продолжаете играть на бирже в этих условиях, то независимо от способа управления деньгами вы потеряете весь ваш счет, каким бы большим он ни был в начале.

Эта аксиома верна не только для игры или сделок с отрицательным ожиданием, она истинна также для игры с равными шансами. Поэтому единственный случай, когда у вас есть шанс получить выгоду в долгосрочной перспективе, - это заключение сделок с положительным математическим ожиданием.

Различие между отрицательным ожиданием и положительным ожиданием - это различие между жизнью и смертью. Не имеет значения, насколько положительное или насколько отрицательное ожидание; важно только то, положительное оно или отрицательное. Поэтому до рассмотрения вопросов управления капиталом вы должны найти игру с положительным ожиданием.

Если у вас такой игры нет, тогда никакое управление деньгами в мире не спасет вас. С другой стороны, если у вас есть положительное ожидание, то можно, посредством правильного управления деньгами, превратить его в функцию экспоненциального роста. Не имеет значения, насколько мало это положительное ожидание! Другими словами, не имеет значения, насколько прибыльна торговая система на основе одного контракта. Если у вас есть система, которая выигрывает 10 долларов на контракт в одной сделке (после вычета комиссионных и проскальзывания), можно использовать методы управления капиталом таким образом, чтобы сделать ее более прибыльной, чем систему, которая показывает среднюю прибыль 1000 долларов за сделку (после вычета комиссионных и проскальзывания).

Имеет значение не то, насколько прибыльна система была, а то, насколько определенно можно сказать, что система покажет, по крайней мере, минимальную прибыль в будущем. Поэтому наиболее важное приготовление, которое может сделать трейдер, - это убедиться в том, что система покажет положительное математическое ожидание в будущем.

Для того чтобы иметь положительное математическое ожидание в будущем, очень важно не ограничивать степени свободы вашей системы. Это достигается не только упразднением или уменьшением количества параметров, подлежащих оптимизации, но также и путем сокращения как можно большего количества правил системы. Каждый параметр, который вы добавляете, каждое правило, которое вы вносите, каждое мельчайшее изменение, которое вы делаете в системе, сокращает число степеней свободы. В идеале, вам нужно построить достаточно примитивную и простую систему, которая постоянно будет приносить небольшую прибыль почти на любом рынке. И снова важно, чтобы вы поняли, - не имеет значения, насколько прибыльна система, пока она прибыльна. Деньги, которые вы заработаете в торговле, будут заработаны посредством эффективного управления деньгами.

Торговая система - это просто средство, которое дает вам положительное математическое ожидание, чтобы можно было использовать управление деньгами. Системы, которые работают (показывают, по крайней мере, минимальную прибыль) только на одном или нескольких рынках или имеют различные правила или параметры для различных рынков, вероятнее всего, не будут работать в режиме реального времени достаточно долго. Проблема большинства технически ориентированных трейдеров состоит в том, что они тратят слишком много времени и усилий на оптимизацию различных правил и значений параметров торговой системы. Это дает совершенно противоположные результаты. Вместо того, чтобы тратить силы и компьютерное время на увеличение прибылей торговой системы, направьте энергию на увеличение уровня надежности получения минимальной прибыли.

Зная, что управление капиталом - это всего лишь числовая игра, которая требует использования положительных ожиданий, трейдер может прекратить поиски "священного Грааля" биржевой торговли. Вместо этого он может заняться проверкой своего торгового метода, выяснить, насколько этот метод логически обоснован, дает ли он поло¬жительные ожидания. Правильные методы управления капиталом, применяемые по отношению к любым, даже весьма посредственным методам ведения торговли, сами сделают всю остальную работу.

Любому трейдеру для успеха в своей работе необходимо решить три самые важные задачи: . Добиться, чтобы число удачных сделок превышало неизбежные ошибки и просчеты; Настроить свою систему торговли так, чтобы возможность заработка была как можно чаще; Достичь стабильности положительного результата своих операций.

И здесь нам, работающим трейдерам, неплохую помощь может оказать математическое ожидание. Данный термин в теории вероятности является одним из ключевых. С его помощью можно дать усредненную оценку некоторому случайному значению. Математическое ожидание случайной величины подобно центру тяжести, если представить себе все возможные вероятности точками с различной массой.

Применительно к торговой стратегии для оценки ее эффективности чаще всего используют математическое ожидание прибыли (либо убытка). Этот параметр определяют, как сумму произведений заданных уровней прибыли и потерь и вероятности их появления. К примеру, разработанная стратегия торговли предполагает, что 37% всех операций принесут прибыль, а оставшаяся часть – 63% - будет убыточной. При этом, средний доход от удачной сделки составит 7 долларов, а средний проигрыш будет равен 1,4 доллара. Рассчитаем математическое ожидание торговли по такой системе:

Что означает данное число? Оно говорит о том, что, следуя правилам данной системы, в среднем мы будет получать 1,708 доллара от каждой закрытой сделки. Поскольку полученная оценка эффективности больше нуля, то такую систему вполне можно использовать для реальной работы. Если же в результате расчета математическое ожидание получится отрицательным, то это уже говорит о среднем убытке и такая торговля приведет к разорению.

Размер прибыли на одну сделку может быть выражен также и относительной величиной в виде %. Например:

– процент дохода на 1 сделку - 5%;

– процент успешных торговых операций - 62%;

– процент убытка в расчете на 1 сделку - 3%;

– процент неудачных сделок - 38%;

То есть, средняя сделка принесет 1,96%.

Можно разработать систему, которая несмотря на преобладание убыточных сделок будет давать положительный результат, поскольку ее МО>0.

Впрочем, одного ожидания мало. Сложно заработать, если система дает очень мало торговых сигналов. В этом случае ее доходность будет сопоставима с банковским процентом. Пусть каждая операция дает в среднем всего лишь 0,5 доллара, но что если система предполагает 1000 операций в год? Это будет очень серьезная сумма за сравнительно малое время. Из этого логически вытекает, что еще одним отличительным признаком хорошей торговой системы можно считать короткий срок удержания позиций.

Источники и ссылки

dic.academic.ru – академический интернет-словарь

mathematics.ru – образовательный сайт по математике

nsu.ru – образовательный веб-сайт Новосибирского государственного университета

webmath.ru – образовательный портал для студентов, абитуриентов и школьников.

exponenta.ru образовательный математический сайт

ru.tradimo.com – бесплатная онлайн школа трейдинга

crypto.hut2.ru – многопрофильный информационный ресурс

poker-wiki.ru – свободная энциклопедия покера

sernam.ru – Научная библиотека избранных естественно-научных изданий

reshim.su – интернет сайт РЕШИМ задачи контрольные курсовые

unfx.ru – Forex на UNFX: обучение, торговые сигналы, доверительное управление

slovopedia.com – Большой Энциклопедический словарь Словопедия

pokermansion.3dn.ru – Ваш гид в мире покера

statanaliz.info – информационный блог «Статистический анализ данных»

форекс-трейдер.рф – портал Форекс-Трейдер

megafx.ru – актуальная аналитика Форекс

fx-by.com – всё для трейдера

Распределение случайной величины (распределение генеральной совокупности) характеризуется обычно рядом числовых характеристик:

для нормального распределения N(a, σ) - это математическое ожидание a и среднее квадратическое отклонение σ ;
для равномерного распределения R(a,b) - это границы интервала , в котором наблюдаются значения этой случайной величины.

Такие числовые характеристики, как правило, неизвестные, называются параметрами генеральной совокупности . Оценка параметра - соответствующая числовая характеристика, рассчитанная по выборке. Оценки параметров генеральной совокупности делятся на два класса: точечные и интервальные .

Когда оценка определяется одним числом, она называется точечной оценкой . Точечная оценка, как функция от выборки, является случайной величиной и меняется от выборки к выборке при повторном эксперименте.
К точечным оценкам предъявляют требования, которым они должны удовлетворять, чтобы хоть в каком-то смысле быть «доброкачественными». Это несмещённость , эффективность и состоятельность .

Интервальные оценки определяются двумя числами – концами интервала, который накрывает оцениваемый параметр. В отличие от точечных оценок, которые не дают представления о том, как далеко от них может находиться оцениваемый параметр, интервальные оценки позволяют установить точность и надёжность оценок.

В качестве точечных оценок математического ожидания, дисперсии и среднего квадратического отклонения используют выборочные характеристики соответственно выборочное среднее, выборочная дисперсия и выборочное среднее квадратическое отклонение.

Свойство несмещенности оценки .
Желательным требованием к оценке является отсутствие систематической ошибки, т.е. при многократном использовании вместо параметра θ его оценки среднее значение ошибки приближения равно нулю - это свойство несмещенности оценки .

Определение . Оценка называется несмещенной , если ее математическое ожидание равно истинному значению оцениваемого параметра:

Выборочное среднее арифметическое является несмещенной оценкой математического ожидания, а выборочная дисперсия - смещенная оценка генеральной дисперсии D . Несмещенной оценкой генеральной дисперсии является оценка

Свойство состоятельности оценки .
Второе требование к оценке - ее состоятельность - означает улучшение оценки с увеличением объема выборки.

Определение . Оценка называется состоятельной , если она сходится по вероятности к оцениваемому параметру θ при n→∞.

Сходимость по вероятности означает, что при большом объеме выборки вероятность больших отклонений оценки от истинного значения мала.

Свойство эффективной оценки .
Третье требование позволяет выбрать лучшую оценку из нескольких оценок одного и того же параметра.

Определение . Несмещенная оценка является эффективной , если она имеет наименьшую среди всех несмещенных оценок дисперсию.

Это означает, что эффективная оценка обладает минимальным рассеиванием относительно истинного значения параметра. Заметим, что эффективная оценка существует не всегда, но из двух оценок обычно можно выбрать более эффективную, т.е. с меньшей дисперсией. Например, для неизвестного параметра a нормальной генеральной совокупности N(a,σ) в качестве несмещенной оценки можно взять и выборочное среднее арифметическое, и выборочную медиану. Но дисперсия выборочной медианы примерно в 1.6 раза больше, чем дисперсия среднего арифметического. Поэтому более эффективной оценкой является выборочное среднее арифметическое.

Пример №1 . Найдите несмещенную оценку дисперсии измерений некоторой случайной величины одним прибором (без систематических ошибок), результаты измерения которой (в мм): 13,15,17.
Решение. Таблица для расчета показателей.

x	\|x - x ср \|	(x - x ср) 2
13	2	4
15	0	0
17	2	4
45	4	8

Простая средняя арифметическая (несмещенная оценка математического ожидания)

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего - смещенная оценка).

Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).

Пример №2 . Найдите несмещенную оценку математического ожидания измерений некоторой случайной величины одним прибором (без систематических ошибок), результаты измерения которой (в мм): 4,5,8,9,11.
Решение. m = (4+5+8+9+11)/5 = 7.4

Пример №3 . Найдите исправленную дисперсию S 2 для выборки объема n=10, если выборочная диспресия равна D = 180.
Решение. S 2 = n*D/(n-1) = 10*180/(10-1) = 200

ЦЕЛЬ ЛЕКЦИИ: ввести понятие оценки неизвестного параметра распределения и дать классификацию таких оценок; получить точечные и интервальные оценки математического ожидания и дисперсии.

На практике в большинстве случаев закон распределения случайной величины неизвестен, и по результатам наблюдений
необходимо оценить числовые характеристики (например, математическое ожидание, дисперсию или другие моменты) или неизвестный параметр, который определяет закон распределения (плотность распределения)
изучаемой случайной величины. Так, для показательного распределения или распределения Пуассона достаточно оценить один параметр, а для нормального распределения подлежат оценке уже два параметра – математическое ожидание и дисперсия.

Виды оценок

Случайная величина
имеет плотность вероятности
, где– неизвестный параметр распределения. В результате эксперимента получены значения этой случайной величины:
. Произвести оценку по существу означает, что выборочным значениям случайной величины необходимо поставить в соответствие некоторое значение параметра, т. е. создать некоторую функцию результатов наблюдений
, значение которой принимается за оценкупараметра. Индексуказывает на количество проведенных опытов.

Любая функция, зависящая от результатов наблюдений, называется статистикой . Так как результаты наблюдений являются случайными величинами, то и статистика тоже будет случайной величиной. Следовательно, оценку
неизвестного параметраследует рассматривать как случайную величину, а ее значение, вычисленное по экспериментальным данным объемом, – как одно из возможных значений этой случайной величины.

Оценки параметров распределений (числовых характеристик случайной величины) подразделяются на точечные и интервальные. Точечная оценка параметраопределяется одним числом, и ее точность характеризуется дисперсией оценки.Интервальной оценкой называют оценку, которая определяется двумя числами,и– концами интервала, накрывающего оцениваемый параметрс заданной доверительной вероятностью.

Классификация точечных оценок

Чтобы точечная оценка неизвестного параметра
была наилучшей с точки зрения точности, необходимо, чтобы она была состоятельной, несмещенной и эффективной.

Состоятельной называется оценка
параметра, если она сходится по вероятности к оцениваемому параметру, т. е.

. (8.8)

На основании неравенства Чебышева можно показать, что достаточным условием выполнения соотношения (8.8) является равенство

Состоятельность является асимптотической характеристикой оценки при
.

Несмещенной называется оценка
(оценка без систематической ошибки), математическое ожидание которой равно оцениваемому параметру, т. е.

. (8.9)

Если равенство (8.9) не выполняется, то оценка называется смещенной. Разность
называется смещением или систематической ошибкой оценки. Если же равенство (8.9) выполняется лишь при
, то соответствующая оценка называется асимптотически несмещенной.

Необходимо отметить, что если состоятельность – практически обязательное условие всех используемых на практике оценок (несостоятельные оценки используются крайне редко), то свойство несмещенности является лишь желательным. Многие часто применяемые оценки свойством несмещенности не обладают.

В общем случае точность оценки некоторого параметра , полученная на основании опытных данных
, характеризуется средним квадратом ошибки

который можно привести к виду

где –дисперсия,
– квадрат смещения оценки.

Если оценка несмещенная, то

При конечных оценки могут различаться средним квадратом ошибки. Естественно, что, чем меньше эта ошибка, тем теснее группируются значения оценки около оцениваемого параметра. Поэтому всегда желательно, чтобы ошибка оценки была по возможности наименьшей, т. е. выполнялось условие

. (8.10)

Оценку , удовлетворяющую условию (8.10), называют оценкой с минимальным квадратом ошибки.

Эффективной называется оценка
, для которой средний квадрат ошибки не больше среднего квадрата ошибки любой другой оценки, т. е.

где – любая другая оценка параметра.

Известно, что дисперсия любой несмещенной оценки одного параметра удовлетворяет неравенству Крамера – Рао

где
– условная плотность распределения вероятностей полученных значений случайной величины при истинном значении параметра.

Таким образом, несмещенная оценка
, для которой неравенство Крамера – Рао обращается в равенство, будет эффективной, т. е. такая оценка имеет минимальную дисперсию.

Точечные оценки математического ожидания и дисперсии

Если рассматривается случайная величина
, имеющая математическое ожиданиеи дисперсию, то оба эти параметра считаются неизвестными. Поэтому над случайной величиной
производитсянезависимых опытов, которые дают результаты:
. Необходимо найти состоятельные и несмещенные оценки неизвестных параметров и.

В качестве оценок иобычно выбираются соответственно статистическое (выборочное) среднее значение и статистическая (выборочная) дисперсия:

; (8.11)

. (8.12)

Оценка математического ожидания (8.11) является состоятельной согласно закону больших чисел (теорема Чебышева):

Математическое ожидание случайной величины

Следовательно, оценка является несмещенной.

Дисперсия оценки математического ожидания:

Если случайная величина
распределена по нормальному закону, то оценкаявляется также и эффективной.

Математическое ожидание оценки дисперсии

В то же время

Так как
, а
, то получаем

. (8.13)

Таким образом,
– смещенная оценка, хотя является состоятельной и эффективной.

Из формулы (8.13) следует, что для получения несмещенной оценки
следует видоизменить выборочную дисперсию (8.12) следующим образом:

которая считается "лучшей" по сравнению с оценкой (8.12), хотя при больших эти оценки практически равны друг другу.

Методы получения оценок параметров распределения

Часто на практике на основании анализа физического механизма, порождающего случайную величину
, можно сделать вывод о законе распределения этой случайной величины. Однако параметры этого распределения неизвестны, и их необходимо оценить по результатам эксперимента, обычно представленных в виде конечной выборки
. Для решения такой задачи чаще всего применяются два метода: метод моментов и метод максимального правдоподобия.

Метод моментов . Метод состоит в приравнивании теоретических моментов соответствующим эмпирическим моментам того же порядка.

Эмпирические начальные моменты -го порядка определяются формулами:

а соответствующие им теоретические начальные моменты -го порядка – формулами:

для дискретных случайных величин,

для непрерывных случайных величин,

где – оцениваемый параметр распределения.

Для получения оценок параметров распределения, содержащего два неизвестных параметра и, составляется система из двух уравнений

где и– теоретический и эмпирический центральные моменты второго порядка.

Решением системы уравнений являются оценки инеизвестных параметров распределенияи.

Приравняв теоретический эмпирический начальные моменты первого порядка, получаем, что оценкой математического ожидания случайной величины
, имеющей произвольное распределение, будет выборочное среднее, т. е.
. Затем, приравняв теоретический и эмпирический центральные моменты второго порядка, получим, что оценка дисперсии случайной величины
, имеющей произвольное распределение, определяется формулой

Подобным образом можно найти оценки теоретических моментов любого порядка.

Метод моментов отличается простотой и не требует сложных вычислений, но полученные этим методом оценки часто являются неэффективными.

Метод максимального правдоподобия . Метод максимального правдоподобия точечной оценки неизвестных параметров распределения сводится к отысканию максимума функции одного или нескольких оцениваемых параметров.

Пусть
– непрерывная случайная величина, которая в результатеиспытаний приняла значения
. Для получения оценки неизвестного параметранеобходимо найти такое значение, при котором вероятность реализации полученной выборки была бы максимальной. Так как
представляют собой взаимно независимые величины с одинаковой плотностью вероятности
, тофункцией правдоподобия называют функцию аргумента :

Оценкой максимального правдоподобия параметра называется такое значение, при котором функция правдоподобия достигает максимума, т. е. является решением уравнения

которое явно зависит от результатов испытаний
.

Поскольку функции
и
достигают максимума при одних и тех же значениях
, то часто для упрощения расчетов используют логарифмическую функцию правдоподобия и ищут корень соответствующего уравнения

которое называется уравнением правдоподобия .

Если необходимо оценить несколько параметров
распределения
, то функция правдоподобия будет зависеть от этих параметров. Для нахождения оценок
параметров распределения необходимо решить системууравнений правдоподобия

Метод максимального правдоподобия дает состоятельные и асимптотически эффективные оценки. Однако получаемые методом максимального правдоподобия оценки бывают смещенными, и, кроме того, для нахождения оценок часто приходится решать достаточно сложные системы уравнений.

Интервальные оценки параметров

Точность точечных оценок характеризуется их дисперсией. При этом отсутствуют сведения о том, насколько близки полученные оценки истинным значениям параметров. В ряде задач требуется не только найти для параметра подходящее численное значение, но и оценить его точность и надежность. Необходимо узнать, к каким ошибкам может привести замена параметраего точечной оценкойи с какой степенью уверенности следует ожидать, что эти ошибки не выйдут за известные пределы.

Такие задачи особенно актуальны при малом числе опытов , когда точечная оценкав значительной степени случайна и приближенная заменанаможет привести к значительным ошибкам.

Более полный и надежный способ оценивания параметров распределений заключается в определении не единственного точечного значения, а интервала, который с заданной вероятностью накрывает истинное значение оцениваемого параметра.

Пусть по результатам опытов получена несмещенная оценка
параметра. Необходимо оценить возможную ошибку. Выбирается некоторая достаточно большая вероятность
(например), такая, что событие с этой вероятностью можно считать практически достоверным событием, и находится такое значение, для которого

. (8.15)

В этом случае диапазон практически возможных значений ошибки, возникающей при замене на, будет
, а большие по абсолютной величине ошибки будут появляться лишь с малой вероятностью.

Выражение (8.15) означает, что с вероятностью
неизвестное значение параметрапопадет в интервал

. (8.16)

Вероятность
называетсядоверительной вероятностью , а интервал, накрывающий с вероятностьюистинное значение параметра, называетсядоверительным интервалом . Заметим, что неправильно говорить, что значение параметра лежит внутри доверительного интервала с вероятностью. Используемая формулировка (накрывает) означает, что хотя оцениваемый параметр и неизвестен, но он имеет постоянное значение и, следовательно, не имеет разброса, поскольку это не случайная величина.

Важнейшими числовыми характеристиками случайной величины Х являются её математическое ожидание m x =M и дисперсия σ 2 x =D[x] = M[(X – m x) 2 ] = M – . Число m x является средним значением случайной величины, около которого разбросаны значения величин Х , мерой этого разброса являются дисперсия D[x] и среднеквадратическое отклонение:

s x = (1.11)

Мы будем в дальнейшем рассмотривать важную задачу для исследования наблюдаемой случайной величины. Пусть имеется некоторая выборка (будем обозначать её S ) случайной величины Х . Требуется по имеющейся выборке оценить неизвестные значения m x и .

Теория оценок различных параметров занимает в математической статистике значительное место. Поэтому рассмотрим сначала общую задачу. Пусть требуется оценить некоторый параметр a по выборке S . Каждая такая оценка a* является некоторой функцией a*=a*(S) от значений выборки. Значения выборки случайны, поэтому и сама оценка a* является случайной величиной. Можно построить множество различных оценок (то есть функций) a* , но при этом желательно иметь «хорошую» или даже «наилучшую», в некотором смысле, оценку. К оценкам обычно предъявляются следующие три естественных требования.

1. Несмещённость. Математическое ожидание оценки a* должно равняться точному значению параметра: M = a . Другими словами, оценка a* не должна иметь систематической ошибки.

2. Состоятельность. При бесконечном увеличении объёма выборки, оценка a* должна сходиться к точному значению, то есть при увеличении числа наблюдений ошибка оценки стремится к нулю.

3. Эффективность. Оценка a* называется эффективной, если она не смещена и имеет минимально возможную дисперсию ошибки. В этом случае минимален разброс оценки a* относительно точного значения и оценка в определённом смысле является «самой точной».

К сожалению, не всегда удаётся построить оценку, удовлетворяющую всем трём требованиям одновременно.

Для оценки математического ожидания чаще всего применяется оценка.

= , (1.12)

то есть среднее арифметическое по выборке. Если случайная величина X имеет конечные m x и s x , то оценка (1.12) не смещена и состоятельна. Эта оценка эффективна, например, если X имеет нормальное распределение (рис.п.1.4, приложение 1). Для других распределений она может оказаться неэффективной. Например, в случае равномерного распределения (рис.п.1.1, приложение 1) несмещённой, состоятельной оценкой будет

(1.13)

В то же время оценка (1.13) для нормального распределения не будет ни состоятельной, ни эффективной, и будет даже ухудшаться с ростом объёма выборки.

Таким образом, для каждого типа распределения случайной величины Х следовало бы использовать свою оценку математического ожидания. Однако в нашей ситуации тип распределения может быть известен лишь предположительно. Поэтому будем использовать оценку (1.12), которая достаточно проста и имеет наиболее важные свойства несмещённости и состоятельности.

Для оценки математического ожидания по группированной выборке используется следующая формула:

= , (1.14)

которую можно получить из предыдущей, если считать все m i значений выборки, попавших в i –й интервал, равными представителю z i этого интервала. Эта оценка, естественно, грубее, но требует значительно меньшего объёма вычислений, особенно при большом объёме выборки.

Для оценки дисперсии чаще всего используется оценка:

= , (1.15)

Эта оценка не смещена и состоятельна для любой случайной величины Х , имеющей конечные моменты до четвёртого порядка включительно.

В случае группированной выборки используется оценка:

= (1.16)

Оценки (1.14) и (1.16), как правило, смещены и несостоятельны, так как их математические ожидания и пределы, к которым они сходятся, отличны от m x и в силу замены всех значений выборки, попавших в i –й интервал, на представителя интервала z i .

Отметим, что при больших n, коэффициент n /(n – 1) в выражениях (1.15) и (1.16) близок к единице, поэтому его можно опустить.

Интервальные оценки.

Пусть точное значение некоторого параметра равно a и найдена его оценка a*(S) по выборке S . Оценке a* соответствует точка на числовой оси (рис.1.5), поэтому такая оценка называется точечной . Все оценки, рассмотренные в предыдущем параграфе, точечные. Практически всегда, в силу случайности

a* ¹ a , и мы можем надеяться только на то, что точка a* находится где–то вблизи a . Но насколько близко? Любая другая точечная оценка будет иметь тот же недостаток – отсутствие меры надёжности результата.

Рис.1.5. Точечная оценка параметра.

Более определённым в этом отношении являются интервальные оценки . Интервальные оценка представляет собой интервал I b = (a , b) , в котором точное значение оцениваемого параметра находится с заданной вероятностью b . Интервал I b называется доверительным интервалом , а вероятность b называется доверительной вероятностью и может рассматриваться как надёжность оценки .

Доверительный интервал состоится по имеющейся выборке S , он случаен в том смысле, что случайны его границы a(S) и b(S) , которые мы будем вычислять по (случайной) выборке. Поэтому b есть вероятность того, что случайный интервал I b накроет неслучайную точку a . На рис. 1.6. интервал I b накрыл точку a , а I b * - нет. Поэтому не совсем правильно говорить, что a « попадает» в интервал.

Если доверительная вероятность b велика (например, b = 0,999 ), то практически всегда точное значение a находится в построенном интервале.

Рис.1.6. Доверительные интервалы параметра a для различных выборок.

Рассмотрим метод построения доверительного интервала для математического ожидания случайной величины Х, основанный на центральной предельной теореме .

Пусть случайная величина Х имеет неизвестное математическое ожидание m x и известную дисперсию . Тогда, в силу центральной предельной теоремы, среднее арифметическое:

= , (1.17)

результатов n независимых испытаний величины Х является случайной величиной, распределение которой при больших n , близко к нормальному распределению со средним m x и среднеквадратическим отклонением . Поэтому случайная величина

(1.18)

имеет распределение вероятностей, которое можно считать стандартным нормальным с плотностью распределения j(t) , график которой изображён на рис.1.7 (а также на рис.п.1.4, приложение 1).

Рис.1.7. Плотность распределения вероятностей случайной величины t .

Пусть задана доверительная вероятность b и t b - число, удовлетворяющее уравнению

b = Ф 0 (t b) – Ф 0 (-t b) = 2 Ф 0 (t b), (1.19)

где - функция Лапласа . Тогда вероятность попадания в интервал (-t b , t b) будет равна заштрихованной на рис.1.7. площади, и, в силу выражения (1.19), равна b . Следовательно

b = P(-t b < < t b) = P( – t b < m x < + t b ) =

= P( – t b < m x < + t b ) . (1.20)

Таким образом, в качестве доверительного интервала можно взять интервал

I b = ( – t b ; + t b ) , (1.21)

так как выражение (1.20) означает, что неизвестное точное значение m x находится в I b с заданной доверительной вероятностью b . Для построения I b нужно по заданному b найтиt b из уравнения (1.19). Приведём несколько значений t b , необходимых в дальнейшем :

t 0,9 = 1,645; t 0,95 = 1,96; t 0,99 = 2,58; t 0,999 = 3,3.

При выводе выражения (1.21) предполагалось, что известно точное значение среднеквадратического отклонения s х . Однако оно известно далеко не всегда. Воспользуемся поэтому его оценкой (1.15) и получим:

I b = ( – t b ; + t b ) . (1.22)

Соответственно, оценки и , полученные по группированной выборке, дают следующую формулу для доверительного интервала:

I b = ( – t b ; + t b ) . (1.23)