Здравствуйте! 4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1. Сегодня вижу, что я вне курса! Почему так произошло? |
Оценивание
В прикладной статистике - иные приоритеты. На первом месте - ОШ-оценки, все остальные НАН-оценки, в том числе ОМП, рассматриваются в качестве дополнительных возможностей.
Пример 1. Найдем ОШ-оценки для гамма-распределения с плотностью
![]() |
( 8) |
Плотность вероятности в формуле (8) определяется тремя параметрами , где
. При этом
является параметром формы,
- параметром масштаба и
- параметром сдвига. Здесь
- одна из используемых в математике специальных функций, так называемая "гамма-функция", по которой названо и распределение, задаваемое формулой (8),
![\Gamma(a)=\int_0^{+\infty}x^{a-1}e^{-x}dx.](/sites/default/files/tex_cache/5bbc53ae56b6a23f36eaefd99d891166.png)
Как следует из явного вида плотности (8), логарифмическая функция правдоподобия имеет вид [ , с.98]:
![L=\sum_{i=1}^n\ln f(x_i;a,b,c)=-n\ln\Gamma(a)-na\ln b+
(a-1)\sum_{i=1}^n\ln(x_i-c)-\frac{1}{b}\sum_{i=1}^n x_i+\frac{nc}{b},](/sites/default/files/tex_cache/6db92b8ebf47ab0700991de0ddca087c.png)
![\begin{gathered}
\frac{\partial L}{\partial a}=-n\Psi(a)+\sum_{i=1}^n
\ln\left(\frac{x_i-c}{b}\right)=0, \\
\frac{\partial L}{\partial b}=-\frac{na}{b}+\frac{1}{b^2}
\sum_{i=1}^n(x_i-c)=0, \\
\frac{\partial L}{\partial c}=-(a-1)
\sum_{i=1}^n\frac{1}{x_i-c}+\frac{n}{b}=0,
\end{gathered}](/sites/default/files/tex_cache/c4abe1f54302a565090b9bde2b70025f.png)
![\Psi(a)=\frac{d}{da}\ln\Gamma(a).](/sites/default/files/tex_cache/c7f1df5e496b42ef42c2f8dc433d65f0.png)
![20](/sites/default/files/tex_cache/98f13708210194c475687be6106a3b84.png)
В качестве начальных оценок будем использовать оценки метода моментов (см. 6.1):
![a*=4\frac{s^6}{m_3^2}, b*=\frac12\frac{m_3}{s^2},c*=\overline{x}-a*b*](/sites/default/files/tex_cache/4c433733f187a00ba454cb93e58603ff.png)
![s^2](/sites/default/files/tex_cache/e25a9ed7a5b522d46c98a8813634ab5d.png)
![m^3](/sites/default/files/tex_cache/51dabb7d4495ca035767a4c60cb7ce56.png)
Матрица информации Фишера согласно [ , с.98] при
имеет вид
![]() |
( 9) |
Вектор-столбец частных производных логарифма плотности вероятности
![s_(x;\theta)=s(x;a,b,c)=(s(1),s(2),s(3))'](/sites/default/files/tex_cache/f98c918caf414973abcf025f132958a1.png)
![\begin{gathered}
s(1)=-\Psi(a)+\ln\left(\frac{x-c}{b}\right), \\
s(2)=-\frac{a}{b}+\frac{x-c}{b^2}, \\
s(3)=-\frac{a-1}{x-c}+\frac{1}{b}.
\end{gathered}](/sites/default/files/tex_cache/2e5fba1c97cea4c86a1128f5783d8333.png)
Таким образом, для получения необходимо вычислить две суммы
![\sum_{i=1}^n\ln\left(\frac{x_i-x}{b}\right),\;\sum_{i=1}^n\frac{1}{x_i-c}](/sites/default/files/tex_cache/f941cc167f244be919ca64158c02dae9.png)
Одношаговые оценки для параметров гамма-распределения вычисляют по формуле
![(a_n, b_n, c_n)=(a*,b*,c*)+I^{-1}(a*,b*,c*)s_n(a*,b*,c*),](/sites/default/files/tex_cache/fda35afcb2eef8c5ce21f3a32883a52e.png)
![I^{-1}](/sites/default/files/tex_cache/4c813a75dd8b9f43b0c4334238fe103f.png)
![I](/sites/default/files/tex_cache/dd7536794b63bf90eccfd37f9b147d7f.png)
![I^{-1}](/sites/default/files/tex_cache/4c813a75dd8b9f43b0c4334238fe103f.png)
![6](/sites/default/files/tex_cache/1679091c5a880faf6fb5e6087eb1b2dc.png)
![s_n(a*, b*, c*)](/sites/default/files/tex_cache/bec0d562190de4cf3fe0f7aa9d2d0274.png)
![s_n^{(2)}(a*, b*, c*)\equiv0](/sites/default/files/tex_cache/42c905509def9729f3abf6786f1f400b.png)
При распределение вектора оценок
приближается трехмерным нормальным распределением с математическим ожиданием, равным вектору истинных значений параметров
, и ковариационной матрицей
. На этом приближении основаны правила расчета доверительных границ для параметров гамма-распределения [6]. Дисперсии оценок неизвестны, но зато имеются известные статистику зависимости этих дисперсий от параметров гамма-распределения. Эти зависимости непрерывные. Они стоят на главной диагонали ковариационной матрицы
). Поэтому можно вместо неизвестных параметров подставить в них оценки этих параметров и на основе принципа наследования сходимости (см.
"Теоретическая база прикладной статистики"
выше) получить состоятельные оценки дисперсий. Затем на основе оценок дисперсий обычным образом строятся доверительные интервалы для параметров гамма-распределения.
В табл.6.4 приведены результаты реализации описанной выше схемы расчетов - точечные и интервальные (при односторонней доверительной вероятности 0,95) оценки параметров гамма-распределения для данных, содержащихся в табл.6.2 предыдущего п. 6.1.
Параметр | Одношаговая оценка | Верхняя доверительная граница | Нижняя доверительная граница |
---|---|---|---|
Формы | 7,32 | 16,41 | -1,77 |
Масштаба | 8,77 | 15,24 | 2,30 |
Сдвига | - 11,46 | 23,28 | - 46,20 |
Приведенные в табл.6.4 данные получены на основе асимптотических формул. Из-за конечности объема выборки необходимо внести некоторые коррективы. Поскольку параметр формы всегда положителен, , то нижняя доверительная граница для этого параметра должна быть неотрицательна, т.е. следует положить
. Поскольку плотность гамма-распределения положительна только правее параметра
, то, очевидно,
, верхняя доверительная граница для параметра сдвига должна быть заменена на
.
Может ли параметр сдвига быть отрицательным в данной прикладной задаче? Отрицательность параметра сдвига означает, что с положительной вероятностью рассматриваемая случайная величина отрицательна, т.е. наработка резца до предельного состояния отрицательна. Ясно, что такого быть не может, хотя для специалиста по математической статистике отрицательность параметра сдвига вполне приемлема. Однако специалист по прикладной статистике должен признать неотрицательность параметра с при обработке данных, составляющих рассматриваемую выборку. Следовательно, нижнюю доверительную границу для параметра сдвига необходимо заменить на .
Как следует из проведенных выше рассуждений и выкладок (см. также [ , с.98-100]), отношение дисперсий оценок метода моментов и ОШ-оценок имеет вид
![\frac{Da_n}{Da*}=\frac{\left\{(a-1)^3+\frac15(a-1)\right\}}{a(a+1)(a+5)}](/sites/default/files/tex_cache/6aeabbf809b224be99d1bc5094c6209a.png)
![a](/sites/default/files/tex_cache/0cc175b9c0f1b6a831c399e269772661.png)
![a > 39,1](/sites/default/files/tex_cache/463addf5e34fb3b563f8f71667d87d5d.png)
![a = 20](/sites/default/files/tex_cache/11dbfdc5072b31927bcfd1ea626f2143.png)
![a](/sites/default/files/tex_cache/0cc175b9c0f1b6a831c399e269772661.png)
Хотя дисперсии оценок метода моментов, как правило, больше, чем дисперсии НАН-оценок, таких, как ОШО и ОМП, метод моментов играет большую роль в прикладной статистике. Во-первых, обычно их расчет проще (в частности, требует меньшего числа компьютерных операций), чем оценок других типов. К тому же оценки находятся с помощью выборочных моментов, которые, как правило, вычисляются на этапе описания статистических данных. Во-вторых, они служат основой для вычисления оценок других типов, например, ОШО. Для запуска итерационных методов нахождения ОМП также нужны начальные значения, и ими обычно являются оценки метода моментов. В-третьих, при учете погрешностей результатов наблюдений оценки метода моментов могут оказаться точнее ОМП и асимптотически эквивалентных им ОШО (см. "Статистика интервальных данных" настоящего курса).
Методы оценивания параметров гамма-распределения и примеры расчетов для всех семи постановок, перечисленных в табл.6.1 п.6.1, приведены в [
[
6.6
]
]. Большинство из них основано на асимптотических (при ) теоретических результатах прикладной статистики. Методом статистических испытаний (Монте-Карло) показано, что уже при
используемые приближения удовлетворительны. Другими словами, асимптотической нормальностью оценок и другими важными для проведенных выше рассуждений предельными результатами можно пользоваться уже при
.
Алгоритмическое и программное обеспечение ОШ-оценок для распределения Вейбулла-Гнеденко и гамма-распределения рассмотрено в монографии [ [ 6.21 ] ]. История вопроса освещена в статье [ [ 2.14 ] ].