Здравствуйте! 4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1. Сегодня вижу, что я вне курса! Почему так произошло? |
Описание данных
5.5. Средние и законы больших чисел
Законы больших чисел состоят в том, что эмпирические средние сходятся к теоретическим. В классическом варианте: выборочное среднее арифметическое при определенных условиях сходится по вероятности при росте числа слагаемых к математическому ожиданию. На основе законов больших чисел обычно доказывают состоятельность различных статистических оценок. В целом эта тематика занимает заметное место в теории вероятностей и математической статистике.
Однако математический аппарат при этом основан на свойствах сумм случайных величин (векторов, элементов линейных пространств). Следовательно, он не пригоден для изучения вероятностных и статистических проблем, связанных со случайными объектами нечисловой природы. Это такие объекты, как бинарные отношения, нечеткие множества, вообще элементы пространств без векторной структуры. Объекты нечисловой природы все чаще встречаются в прикладных исследованиях. Много конкретных примеров приведено выше в настоящей лекции. Поэтому представляется полезным получение законов больших чисел в пространствах нечисловой природы. Необходимо решить следующие задачи:
- определить понятие эмпирического среднего;
- определить понятие теоретического среднего;
- ввести понятие сходимости эмпирических средних к теоретическому;
- доказать при тех или иных комплексах условий сходимость эмпирических средних к теоретическому;
- получить метод обоснования состоятельности различных статистических оценок, обобщив это доказательство;
- описать способы применения полученных результатов при решении конкретных задач.
Ввиду принципиальной важности рассматриваемых результатов приводим доказательство закона больших чисел, а также результаты компьютерного анализа множества эмпирических средних.
Определения средних величин. Пусть - пространство произвольной природы,
- его элементы. Чтобы ввести эмпирическое среднее для
будем использовать действительнозначную (т.е. с числовыми значениями) функцию
двух переменных со значениями в
. В стандартных математических обозначениях:
. Величина
интерпретируется как показатель различия между
и
: чем
больше, тем
и
сильнее различаются. В качестве
можно использовать расстояние в
, квадрат расстояния и т.п.
Определение 1. Средней величиной для совокупности (относительно меры различия
), обозначаемой любым из трех способов:
![x_{cp}=E_n(f)=E_n(x_1, x_2, x_3,...,x_n;f),](/sites/default/files/tex_cache/9b61fe2c1ecf0963073a4bfd6b3be4b4.png)
![]() |
( 1) |
Это определение согласуется с классическим: если , то
- выборочное среднее арифметическое. Если же
, то при
имеем
, при
эмпирическое среднее является отрезком
. Здесь через
обозначен
-ый член вариационного ряда, построенного по
, т.е.
-я порядковая статистика. Таким образом, при
решение задачи (1) дает естественное определение выборочной медианы.
Правда, несколько отличающееся от определения, предлагаемого в курсе "Общей теории статистики", в котором при
медианой называют полусумму двух центральных членов вариационного ряда
. Иногда
называют левой медианой, а
- правой [
[
1.15
]
].
Решением задачи (1) является множество , которое может быть пустым, состоять из одного или многих элементов. Выше приведен пример, когда решением является отрезок. Если
, а среднее арифметическое выборки равно
, то
пусто.
При моделировании реальных ситуаций часто можно принять, что состоит из конечного числа элементов. Тогда множество
непусто - минимум на конечном множестве всегда достигается.
Понятия случайного элемента со значениями в
, его распределения, независимости случайных элементов используем согласно предыдущему пункту настоящей лекции, т.е. каноническому справочнику Ю.В. Прохорова и Ю.А. Розанова [
[
2.16
]
]. Будем считать, что функция
измерима относительно
-алгебры, участвующей в определении случайного элемента
. Тогда
при фиксированном y является действительнозначной случайной величиной. Предположим, что она имеет математическое ожидание.
Определение 2. Теоретическим средним (другими словами, математическим ожиданием) случайного элемента
относительно меры различия
называется решение оптимизационной задачи
![]() |
( 2) |
Это определение, как и для эмпирических средних, согласуется с классическим. Если , то
- обычное математическое ожидание. При этом
- дисперсия случайной величины
. Если же
, то
, где
, где
- функция распределения случайной величины
. Если график
имеет плоский участок на уровне
, то медиана - теоретическое среднее в смысле определения 2 - является отрезком. В классическом случае обычно говорят, что каждый элемент отрезка
является одним из возможных значений медианы.
Поскольку наличие указанного плоского участка - исключительный случай, то обычно решением задачи (2) является множество из одного элемента
- классическая медиана распределения случайной величины
.
Теоретическое среднее можно определить лишь тогда, когда
существует при всех
. Оно может быть пустым множеством, например, если
. И то, и другое исключается, если
конечно. Однако и для конечных
теоретическое среднее может состоять не из одного, а из многих элементов. Отметим, однако, что в множестве всех распределений вероятностей на
подмножество тех распределений, для которых
состоит более чем из одного элемента, имеет коразмерность 1, поэтому основной является ситуация, когда множество
содержит единственный элемент [
[
1.15
]
].
Существование средних величин. Под существованием средних величин будем понимать непустоту множеств решений соответствующих оптимизационных задач.
Если состоит из конечного числа элементов, то минимум в задачах (1) и (2) берется по конечному множеству. А потому, как уже отмечалось, эмпирические и теоретические средние существуют.
Ввиду важности обсуждаемой темы приведем доказательства. Для строгого математического изложения нам понадобятся термины из раздела математики под названием "общая топология". Топологические термины и результаты будем использовать в соответствии с классической монографией [ [ 4.11 ] ]. Так, топологическое пространство называется бикомпактным в том и только в том случае, когда из каждого его открытого покрытия можно выбрать конечное подпокрытие [ [ 4.11 ] , с.183].
Теорема 1. Пусть - бикомпактное пространство, функция
непрерывна на
(в топологии произведения). Тогда эмпирическое и теоретическое средние существуют.
Доказательство. Функция от y непрерывна, сумма непрерывных функций непрерывна, непрерывная функция на бикомпакте достигает своего минимума, откуда и следует заключение теоремы относительно эмпирического среднего.
Перейдем к теоретическому среднему. По теореме Тихонова [
[
4.11
]
, с.194] из бикомпактности вытекает бикомпактность
. Для каждой точки
из
рассмотрим
- окрестность в
в смысле показателя различия
, т.е. множество
U(x,y)=\{(x',y'):|f(x,y)-f(x',y')|<\varepsilon/2\}.
Поскольку непрерывна, то множества
открыты в рассматриваемой топологии в
. По теореме Уоллеса [
[
4.11
]
, с.193] существуют открытые (в
) множества
и
, содержащие
и
соответственно и такие, что их декартово произведение
целиком содержится внутри
.
Рассмотрим покрытие открытыми множествами
. Из бикомпактности
вытекает существование конечного подпокрытия
. Для каждого
из
рассмотрим все декартовы произведения
, куда входит точка
при каком-либо
. Таких декартовых произведений и их первых множителей
конечное число. Возьмем пересечение таких первых множителей
и обозначим его
. Это пересечение открыто, как пересечение конечного числа открытых множеств, и содержит точку
. Из покрытия бикомпактного пространства
открытыми множествами
выберем открытое подпокрытие
.
Покажем, что если и
принадлежат одному и тому же
при некотором
, то
![]() |
( 3) |
Пусть при некотором
. Пусть
, - совокупность всех тех исходных декартовых произведений из системы
, куда входят точки
при различных
. Покажем, что их объединение содержит также точки
и
при всех
. Действительно, если
входит в
, то y входит в
, а
и
вместе с
входят в
, поскольку
и
входят в
. Таким образом,
и
принадлежат
, а потому согласно определению
![|f(x'_1,y)-f(x_i,y_i)|<\varepsilon/2, |f((x'_2,y))-f(x_i,y_i)|<\varepsilon/2,](/sites/default/files/tex_cache/fcf65e334579a4e92921a3bdfb6b5066.png)
Поскольку - бикомпактное пространство, то функция
ограничена на
, а потому существует математическое ожидание
для любого случайного элемента
, удовлетворяющего приведенным выше условиям согласования топологии, связанной с
, и измеримости, связанной с
. Если
и
принадлежат одному открытому множеству
, то
![|Mf(x_1,y)-Mf(x_2,y)|<\varepsilon,](/sites/default/files/tex_cache/6071045c3f934b3071da6c010396f194.png)
![]() |
( 4) |
![X](/sites/default/files/tex_cache/02129bb861061d1a052c592e2dc6b383.png)
![z](/sites/default/files/tex_cache/fbade9e36a3f36d3d676c1b808451dd7.png)
![g(z) = \inf\{g(y),y\in X\}](/sites/default/files/tex_cache/0643e8a68c6f50e173037f498d0a93d5.png)
В ряде интересных для приложений ситуаций не является бикомпактным пространством. Например, если
. В этих случаях приходится наложить на показатель различия
некоторые ограничения, например, так, как это сделано в теореме 2.
Теорема 2. Пусть - топологическое пространство, непрерывная (в топологии произведения) функция
неотрицательна, симметрична (т.е.
для любых
и
из
), существует число
такое, что при всех
из
![]() |
( 5) |
Пусть в существует точка
такая, что при любом положительном
множество
является бикомпактным. Пусть для случайного элемента
, согласованного с топологией в рассмотренном выше смысле, существует
.
Тогда существуют (т.е. непусты) математическое ожидание и эмпирические средние
.
Замечание. Условие (5) - некоторое обобщение неравенства треугольника. Например, если - метрика в
, а
при некотором натуральном
, то для
выполнено соотношение (5) с
.
Доказательство. Рассмотрим функцию , определенную формулой (4). Имеем
![]() |
( 6) |
Поскольку по условию теоремы существует, а потому конечно, то из оценки (6) следует существование и конечность
при всех
из
. Докажем непрерывность этой функции.
Рассмотрим шар (в смысле меры различия ) радиуса
с центром в
:
![K(R)=\{x:f(x,x_0)\le R\},R>0.](/sites/default/files/tex_cache/cb33e4034680944ec6a2bba95e2293a6.png)
В соответствии с условием теоремы как подпространство топологического пространства
является бикомпактным. Рассмотрим произвольную точку
из
. Справедливо разложение
![f(x(\omega),y)=f(x(\omega),y)\chi(x(\omega)\in K(R))+f(x(\omega),y)\chi(x(\omega)\notin K(R)),](/sites/default/files/tex_cache/2e8a481c4b229f5492678e46199a701c.png)
![\chi(C)](/sites/default/files/tex_cache/860808c14bf2a8eadd280844ae81e771.png)
![C](/sites/default/files/tex_cache/0d61f8370cad1d412f80b84d143e1257.png)
![]() |
( 7) |
Рассмотрим второе слагаемое в (7). В силу (5)
![]() |
( 8) |
Возьмем математическое ожидание от обеих частей (8):
![]() |
( 9) |
В правой части (9) оба слагаемых стремятся к 0 при безграничном возрастании : первое - в силу того, что
![g(x_0)=Mf(x(\omega),x_0)=\int\limits_0^{+\infty}tdP(f(x(\omega),x_0)\le t)<\infty,](/sites/default/files/tex_cache/19070fe856dcfbe73912c08febc13f6f.png)
![x(\omega)](/sites/default/files/tex_cache/10553b9fa812fc03bd270932a3f2f4cd.png)
![X](/sites/default/files/tex_cache/02129bb861061d1a052c592e2dc6b383.png)
![X\backslash\bigcup_{R>0}K(R)=\varnothing.](/sites/default/files/tex_cache/6d551158aecf66c8f93cfd130196165c.png)
Пусть - такая окрестность
(т.е. открытое множество, содержащее
), для которой
![\sup\{f(y,x),y\in U(x)\}<+\infty.](/sites/default/files/tex_cache/b64c5e2814e3b8d3740cffaa5c6b2a0f.png)
Имеем
![]() |
( 10) |
В силу (9) и (10) при безграничном возрастании
![]() |
( 11) |
![y\in U(x)](/sites/default/files/tex_cache/17bab82c21764ebbc213f866ce4a6c87.png)
![R(0)](/sites/default/files/tex_cache/3665b71a0cd0452dc44e337fc35ff23c.png)
![\varepsilon>0](/sites/default/files/tex_cache/c275666ed6a881fe9e0aafb9273418f7.png)
![R>R(0)](/sites/default/files/tex_cache/249ce5e08f3c304fbeaddbe5ca086630.png)
![y\in U(x)\subseteq K(R(0))](/sites/default/files/tex_cache/a4bece09ced860f0fe93ba4ce76571d4.png)
![R>R(0)](/sites/default/files/tex_cache/249ce5e08f3c304fbeaddbe5ca086630.png)
![]() |
( 12) |
Нас интересует поведение выражения в правой части формулы (12) при . Рассмотрим
- сужение функции
на замыкание декартова произведения множеств
, и случайный элемент
. Тогда
![Mf(x(\omega),y)\chi(x(\omega)\in K(R))=Mf_1(x_1(\omega),y)](/sites/default/files/tex_cache/62e1354320b6c71b94a26fa0bc89fe4a.png)
![y\in U(x)](/sites/default/files/tex_cache/17bab82c21764ebbc213f866ce4a6c87.png)
![g_1(y)=Mf_1(x_1(\omega),y)](/sites/default/files/tex_cache/7c4424ff1bda46bb29594aada7bb0407.png)
![U_1(x)](/sites/default/files/tex_cache/a212be3dd85749158203ac30f359ba6e.png)
![]() |
( 13) |
![y\in U_1(x)](/sites/default/files/tex_cache/f306718f09ec9b48e77c29c19ce077b7.png)
![y\in U(x)\bigcap U_1(x)](/sites/default/files/tex_cache/6b27cecdf143edb4121f47bc4ca19607.png)
![|g(y)-g(x)|<3\varepsilon,](/sites/default/files/tex_cache/c284e1a8090d1f52827bb23b850b0795.png)
![g(x)](/sites/default/files/tex_cache/e84fec1e074026d6fa8e3155482c35c3.png)
Докажем существование математического ожидания . Пусть
таково, что
![]() |
( 14) |
Пусть - некоторая константа, значение которой будет выбрано позже. Рассмотрим точку
из множества
- дополнения
, т.е. из внешности шара радиуса
с центром в
. Пусть
. Тогда имеем
![f(x_0,x)\leD\{f(x_0,x(\omega))+f(x(\omega),x)\},](/sites/default/files/tex_cache/06bac7b58c28bebbeef81b6fb2821bb0.png)
![]() |
( 15) |
Выбирая достаточно большим, получим с учетом условия (14), что при
справедливо неравенство
![]() |
( 16) |
Можно выбрать так, чтобы правая часть (16) превосходила
.
Сказанное означает, что достаточно искать внутри бикомпактного множества
. Из непрерывности функции
вытекает, что ее минимум достигается на указанном бикомпактном множестве, а потому - и на всем
. Существование (непустота) теоретического среднего
доказана.
Докажем существование эмпирического среднего . Есть искушение проводить его дословно так же, как и доказательство существования математического ожидания
, лишь с заменой 1/2 в формуле (16) на частоту попадания элементов выборки
в шар
. Эта частота, очевидно, стремится к вероятности попадания случайного элемента
в
, большей 1/2 в соответствии с (14). Однако это рассуждение показывает лишь, что вероятность непустоты
стремится к 1 при безграничном росте объема выборки. Точнее, оно показывает, что
![\lim_{n\rightarrow\infty}P\{E_n(f)\ne\varnothing\wedgeE_n(f)\subseteq K(HR(0))\}=1.](/sites/default/files/tex_cache/942c978eb49a5109846dde6d9a13a8d3.png)
Поэтому пойдем другим путем, не опирающимся к тому же на вероятностную модель выборки. Положим
![]() |
( 17) |
Если входит в дополнение шара
, то аналогично (15) имеем
![]() |
( 18) |
При достаточно большом из (17) и (18) следует, что
![\sum_{i=1}^n f(x_i,x_0)\le nR(1)<\sum_{i=1}^n f(x_i,x),x\in\{K(HR(1))\}^C.](/sites/default/files/tex_cache/3b97ab683e67badfbc8430124a746517.png)
Следовательно, достаточно искать на
. Заключение теоремы 2 следует из того, что на бикомпактном пространстве
минимизируется непрерывная функция.
Теорема 2 полностью доказана.