Здравствуйте! 4 июня я записалась на курс Прикладная статистика. Заплатила за получение сертификата. Изучала лекции, прошла Тест 1. Сегодня вижу, что я вне курса! Почему так произошло? |
Статистика интервальных данных
12.3. Интервальные данные в задачах проверки гипотез
С позиций статистики интервальных данных целесообразно изучить все практически используемые процедуры прикладной математической статистики, установить соответствующие нотны и рациональные объемы выборок. Это позволит устранить разрыв между математическими схемами прикладной статистики и реальностью влияния погрешностей наблюдений на свойства статистических процедур. Статистика интервальных данных - часть теории устойчивых статистических процедур, развитой в монографии [ [ 1.15 ] ]. Часть, более адекватная реальной статистической практике, чем некоторые другие постановки, например, с засорением нормального распределения большими выбросами.
Рассмотрим подходы статистики интервальных данных в задачах проверки статистических гипотез. Пусть принятие решения основано на сравнении рассчитанного по выборке значения статистики критерия с граничным значением
: если
, то гипотеза отвергается, если же
, то принимается. С учетом погрешностей измерений выборочное значение статистики критерия может принимать любое значение в интервале
. Это означает, что "истинное" значение порога, соответствующее реально используемому критерию, находится между
и
, а потому уровень значимости описанного правила (критерия) лежит между
и
, где
.
Пример 1. Пусть - выборка из нормального распределения с математическим ожиданием
и единичной дисперсией. Необходимо проверить гипотезу
при альтернативе
Как известно из любого учебного курса математической статистики, следует использовать статистику и порог C=\Phi(1-\alpha/2), где
- уровень значимости,
- функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. В частности,
при
.
При ограничениях (1) на абсолютную погрешность . Например, если
, а
, то
. Это означает, что истинное значение порога лежит между 0,96 и 2,96, а истинный уровень значимости - между 0,003 и 0,34. Можно сделать и другой вывод: нулевую гипотезу
допустимо отклонить на уровне значимости 0,05 лишь тогда, когда
.
Если же при
, то
и
, в то время как
. Таким образом, даже в случае
гипотеза
может быть отвергнута только из-за погрешностей измерений результатов наблюдений.
Вернемся к общему случаю проверки гипотез. С учетом погрешностей измерений граничное значение в статистике интервальных данных целесообразно заменить на
. Такая замена дает гарантию, что вероятность отклонения нулевой гипотезы
, когда она верна, не более
. При проверке гипотез аналогом статистической погрешности, рассмотренной выше в задачах оценивания, является
. Суммарная погрешность имеет вид
. Исходя из принципа уравнивания погрешностей [
[
1.15
]
], целесообразно определять рациональный объем выборки из условия
![C_{\alpha}=N_f(y)](/sites/default/files/tex_cache/692e8bd084d2f1e8e264491ccf56ddac.png)
Если , где
при справедливости
имеет асимптотически нормальное распределение с математическим ожиданием 0 и дисперсией
то
![]() |
( 47) |
![n](/sites/default/files/tex_cache/7b8b965ad4bca0e41ab51de7b31363a1.png)
![u(1-\alpha/2)](/sites/default/files/tex_cache/fe961863443401e6ca339bba1b7e1f8d.png)
![1-\alpha/2](/sites/default/files/tex_cache/21574e63086e26b8dd212986eb44ac85.png)
![n_{rat}=\frac{3,84}{\Delta^2}=384](/sites/default/files/tex_cache/a214e3326c9efff8f889de3a8ef5b7c4.png)
Пример 2. Рассмотрим статистику одновыборочного критерия Стьюдента
![t=\sqrt{n}\frac{\overline(y)}{s(y)}=\frac{\sqrt{n}}{v},](/sites/default/files/tex_cache/52d012c7e86306df86156e5b5854b316.png)
![v](/sites/default/files/tex_cache/9e3669d19b675bd57058fd4664205d2a.png)
![t](/sites/default/files/tex_cache/e358efa489f58062f10dd7316b65649e.png)
![N_t(y)=\frac{\sqrt{n}}{v^2}N_v(y),](/sites/default/files/tex_cache/9efac8cc1a4467829411148675257f1f.png)
![N_v(y)](/sites/default/files/tex_cache/9d04bcf90f49059222121f6d9cac91b5.png)
![t](/sites/default/files/tex_cache/e358efa489f58062f10dd7316b65649e.png)
![n_{rat}=\frac{v^4u^2(1-\alpha/2)}{N_v^2(y)}.](/sites/default/files/tex_cache/af1112c37e941803f11af62241f210d7.png)
Пример 3. Рассмотрим двухвыборочный критерий Смирнова, предназначенный для проверки однородности (совпадения) функций распределения двух независимых выборок [ [ 12.44 ] ]. Статистика этого критерия имеет вид
![D_{mn}=\sup_x|F_m(x)-G_n(x)|,](/sites/default/files/tex_cache/b20a056e17f07fdd3cd44cc3ed331c64.png)
![F_m(x)](/sites/default/files/tex_cache/c5224d7ee3bf232eabb66fb81947ba2e.png)
![m](/sites/default/files/tex_cache/6f8f57715090da2632453988d9a1501b.png)
![F(x)](/sites/default/files/tex_cache/d76f2c4d6bdf142af5106c3f36e9e970.png)
![G_n(x)](/sites/default/files/tex_cache/41b9eab37fc45387ba3f46d5d46b8a02.png)
![n](/sites/default/files/tex_cache/7b8b965ad4bca0e41ab51de7b31363a1.png)
![G(x)](/sites/default/files/tex_cache/5d09697085e8b2d48446837da84789a3.png)
![H_0:F(x)\equiv G(x)](/sites/default/files/tex_cache/7ae44ef0294df91889ce20b40810cd59.png)
![H_1:F(x)\ne G(x)](/sites/default/files/tex_cache/ef5572140d965e98722b8413f0d38fb2.png)
![x](/sites/default/files/tex_cache/9dd4e461268c8034f5c8564e155c67a6.png)
![D(\alpha,m,n)](/sites/default/files/tex_cache/ef443ae6e0bab69daf70a2d674bbc1f5.png)
![\alpha](/sites/default/files/tex_cache/7b7f9dbfea05c83784f8b85149852f08.png)
![m](/sites/default/files/tex_cache/6f8f57715090da2632453988d9a1501b.png)
![n](/sites/default/files/tex_cache/7b8b965ad4bca0e41ab51de7b31363a1.png)
![D(\alpha,m,n)](/sites/default/files/tex_cache/ef443ae6e0bab69daf70a2d674bbc1f5.png)
При ограничениях (1) на абсолютные погрешности и справедливости нулевой гипотезы нотна имеет вид (при больших объемах выборок)
![N_D=\sup_x|F(x+\Delta)-F(x-\Delta)|.](/sites/default/files/tex_cache/23f48f4aea590cc89b6d3596cf77b946.png)
Если при
, то
. С помощью условия
при уровне значимости
и достаточно больших объемах выборок (т.е. используя асимптотическое выражение для порога согласно [
[
2.1
]
]) получаем, что выборки имеет смысл увеличивать, если
![\frac{mn}{m+n}\le\frac{0,46}{\Delta^2}.](/sites/default/files/tex_cache/d8c4fc590bf462e44f7c3bf9d75d3725.png)
Правая часть этой формулы при равна 46. Если
, то последнее неравенство переходит в
.
Теоретические результаты в области статистических методов входят в практику через алгоритмы расчетов, воплощенные в программные средства (пакеты программ, диалоговые системы). Ввод данных в современной статистической программной системе должен содержать запросы о погрешностях результатов измерений. На основе ответов на эти запросы вычисляются нотны рассматриваемых статистик, а затем - доверительные интервалы при оценивании, разброс уровней значимости при проверке гипотез, рациональные объемы выборок. Необходимо использовать систему алгоритмов и программ статистики интервальных данных, "параллельную" подобным системам для классической математической статистики.