Здравствуйте! 4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1. Сегодня вижу, что я вне курса! Почему так произошло? |
Оценивание
6.3. Асимптотика решений экстремальных статистических задач
Если проанализировать приведенные выше (см. 5.5) постановки и результаты, касающиеся эмпирических и теоретических средних и законов больших чисел, то становится очевидной возможность их обобщения. Так, доказательства теорем практически не меняются, если считать, что функция определена на декартовом произведении бикомпактных пространств
и
, а не на
. Тогда можно считать, что элементы выборки лежат в
, а
- пространство параметров, подлежащих оценке.
Обобщения законов больших чисел. Пусть, например, выборка взята из распределения с плотностью
, где
- неизвестный параметр. Если положить
![f(x,y)=-\ln p(x,y),](/sites/default/files/tex_cache/97e19e1122e6d208d6efd41da063ce49.png)
![f_n(\omega,y)=\frac{1}{n}\sum_{k=1}^n f(x_k(\omega),y)\rightarrow\min](/sites/default/files/tex_cache/19289f801f177ecd76df7e5461420043.png)
![\sum_{k=1}^n\ln p(x_k(\omega),y)\rightarrow\max.](/sites/default/files/tex_cache/9aa3a36346534b58fad929d4f25c0ec7.png)
Соответственно законы больших чисел переходят в утверждения о состоятельности этих оценок в случае пространств и
общего вида. При такой интерпретации функция
уже не является расстоянием или показателем различия. Однако для доказательства сходимости оценок к соответствующим значениям параметров это и не требуется. Достаточно непрерывности этой функции на декартовом произведении бикомпактных пространств
и
.
В случае функции общего вида можно говорить об определении в пространствах произвольной природы оценок минимального контраста и их состоятельности. При этом при каждом конкретном значении параметра
справедливо предельное соотношение
![f_n(\omega,y)=\frac{1}{n}\sum_{k=1}^n f(x_k(\omega),y)\rightarrow
Mf(x_1(\omega),y)=g(y),](/sites/default/files/tex_cache/ab29e9e960006bf574b59c65b1d04572.png)
![f](/sites/default/files/tex_cache/8fa14cdd754f91cc6554c9e71929cce7.png)
![Arg\min\left\{\frac{1}{n}\sum_{k=1}^n f(x_k(\omega),y)\right\}\rightarrow
Arg\min\{Mf(x_1(\omega),y)\}.](/sites/default/files/tex_cache/7fde22e20072d043e8eff5a08c99595a.png)
Частными случаями оценок минимального контраста являются устойчивые (робастные) оценки Тьюки-Хубера (см. ниже), а также оценки параметров в задачах аппроксимации (параметрической регрессии) в пространствах произвольной природы.
Можно пойти и дальше в обобщении законов больших чисел. Пусть известно, что при каждом конкретном y при безграничном росте n имеет быть сходимость по вероятности
![f_n(\omega,y)\rightarrow f(y),](/sites/default/files/tex_cache/1bdadd74fd334d6ce8ee22e29216d8bc.png)
![f_n(\omega, y)](/sites/default/files/tex_cache/a2e900609acd6cd5cda66412b2b71b07.png)
![Y](/sites/default/files/tex_cache/57cec4137b614c87cb4e24a3d003a3e0.png)
![f(y)](/sites/default/files/tex_cache/a2f04f05381d50c6b30a094fdae98b25.png)
![Y](/sites/default/files/tex_cache/57cec4137b614c87cb4e24a3d003a3e0.png)
![Arg\min\{f_n(\omega,y),y\in X\}\rightarrow Arg\min\{f(y),y\in X\}?](/sites/default/files/tex_cache/e554ea5924e3be7ad32f00ad8aaf0098.png)
Другими словами, когда из поточечной сходимости функций вытекает сходимость точек минимума?
Причем под n здесь можно понимать натуральное число. А можно рассматривать сходимость по направленному множеству (см. 4.3), или же, что практически то же самое - "сходимость по фильтру" в смысле Картана и Бурбаки [ [ 4.11 ] , с.118]. В частности, можно описывать ситуацию вектором, координаты которого - объемы нескольких выборок, и все они безгранично растут. В классической математической статистике такие постановки рассматривать не любят.
Поскольку, как уже отмечалось, основные задачи прикладной статистики можно представить в виде оптимизационных, то ответ на поставленный вопрос о сходимости точек минимума дает возможность единообразного подхода к изучению асимптотики решений разнообразных экстремальных статистических задач. Одна из возможных формулировок, основанная на бикомпактности пространств и
и нацеленная на изучение оценок минимального контраста, дана и обоснована выше. Другой подход развит в работе [
[
1.17
]
]. Он основан на использовании понятий асимптотической равномерной разбиваемости и координатной асимптотической равномерной разбиваемости пространств. С помощью указанных подходов удается стандартным образом обосновывать состоятельность оценок характеристик и параметров в основных задачах прикладной статистики.
Рассматриваемую тематику можно развивать дальше, в частности, рассматривать аналоги законов больших чисел в случае пространств, не являющихся бикомпактными, а также изучать скорость сходимости к
.
Приведем примеры применения результатов о предельном поведении точек минимума.
Задача аппроксимации зависимости (параметрической регрессии). Пусть и
- некоторые пространства. Пусть имеются статистические данные -
пар
, где
. Задано параметрическое пространство
произвольной природы и семейство функций
. Требуется подобрать параметр
так, чтобы
наилучшим образом приближали
. Пусть
- последовательность показателей различия в
. При сделанных предположениях параметр
естественно оценивать путем решения экстремальной задачи:
![]() |
( 1) |
Часто, но не всегда, все совпадают. В классической постановке, когда
, функции
различны при неравноточных наблюдениях, например, когда число опытов меняется от одной точки
проведения опытов к другой.
Если , то получаем общую постановку метода наименьших квадратов (см. подробности в
"Многомерный статистический анализ"
):
![\theta_n=Arg\min_{\theta\in\Theta}\sum_{k=1}^n(g(x_k,\theta)-y_k)^2.](/sites/default/files/tex_cache/1bf3b002efc990f33958ebc5879497c9.png)
В рамках детерминированного анализа данных остается единственный теоретический вопрос - о существовании . Если все участвующие в формулировке задачи (1) функции непрерывны, а минимум берется по бикомпакту, то
существует. Есть и иные условия существования
[
[
1.17
]
,
[
3.4
]
,
[
2.15
]
].
При появлении нового наблюдения в соответствии с методологией восстановления зависимости рекомендуется выбирать оценку соответствующего
по правилу
![y*=g(x,\theta_n).](/sites/default/files/tex_cache/e880911238d924e627e0983640d9a9c3.png)
Обосновать такую рекомендацию в рамках детерминированного анализа данных невозможно. Это можно сделать только в вероятностной теории, равно как и изучить асимптотическое поведение , доказать состоятельность этой оценки.
Как и в классическом случае, вероятностную теорию целесообразно строить для трех различных постановок.
- Переменная
- детерминированная (например, время), переменная
- случайная, ее распределение зависит от
;
- Совокупность
, - выборка из распределения случайного элемента со значениями в
;
- Имеется детерминированный набор пар
, результат наблюдения
является случайным элементом, распределение которого зависит от
. Это - постановка конфлюэнтного анализа.
Во всех трех случаях
![f_n(\omega,\theta)=\sum_{k=1}^n f_k(g(x_k,\theta),y_k),](/sites/default/files/tex_cache/60772bd2da338f4d78f3fd42039e6481.png)
![f(\theta)](/sites/default/files/tex_cache/8819683a72852fa92e5b0312071d4eb0.png)
Проще всего выглядит в случае второй постановки при
.
В случае первой постановки
![f(\theta)=\lim_{n\rightarrow\infty}\sum_{k=1}^n Mf_k(g(x_k,\theta),y_k(\omega))](/sites/default/files/tex_cache/8fc1ec0fb904a1a4f9b953b5dfe89bbf.png)
![f(\theta)=\lim_{n\rightarrow\infty}\sum_{k=1}^n Mf_k(g(x_k,(\omega),\theta),y_k(\omega)).](/sites/default/files/tex_cache/fc517b35638b7c0f4c6f14f91bcc6e86.png)
Во всех трех случаях на основе общих результатов о поведении решений экстремальных статистических задач можно изучить [ [ 1.17 ] , [ 3.4 ] , [ 2.15 ] ] асимптотику оценок ?n. При выполнении соответствующих внутриматематических условий регулярности оценки оказываются состоятельными, т.е. удается восстановить зависимость.