Инструменты Gnumeric для статистиков
5.7 Гистограмма
Инструмент "Гистограмма" ("Статистика/Описательные статистики/Частотная таблица/Гистограмма...") вычисляет количество значений в выборке, попадающих в заданный интервал значений. Границы интервалов (отрезки, cutoffs) могут быть заданы заранее или вычислены исходя их максимального и минимального значений и желаемого количества интервалов (рис. 5.19).
В качестве тестовых значений сформируем выборку из 39 нормально распределённых случайных величин со средним значением 5 и стандартным отклонением 2.
(На вкладке "Ввод" обычным образом задаётся диапазон ячеек с исходными данными, поэтому эту вкладку диалога настройки гистограммы не обсуждаем).
На вкладке "Двоичные" определяется способ учёта значений, на границах отрезков (рис. 5.20). Если какое-то значение точно (с учётом "машинного нуля") попадает на границу интервала (отрезка), то для границы, отмеченной квадратной скобкой ("[ " или " ]"), оно учитывается в этом интервале (отрезке), а для границы, отмеченной круглой скобкой – в соседнем (предыдущем или следующем).
На вкладке "Графики и параметры" нужно определить вид диаграммы, которая будет сформирована и формат вывода результатов. Достаточно разумно заказать вывод гистограммы и представления результатов в процентах, как показано на рис. 5.21.
Наконец, на вкладке "Вывод", как обычно в Gnumeric, определяется лист и диапазон ячеек на листе, в который будут выводиться результаты (рис. 5.22).
После нажатия на кнопку "ОК" строится гистограмма и вычисляются частоты попадания значений выборки в заданные отрезки. Однако позиция графика гистограммы и диапазона ячеек с результатами совпадают, поэтому график нужно отодвинуть, чтобы увидеть числа (см. рис. 5.23).
График гистограммы можно теперь настраивать обычным образом, изменяя размер, форматы вывода по осям, цвет для серии данных и т. д.
5.8 Выборка
С помощью диалога "Выборка" можно выбрать несколько серий данных из некоторого вектора данных. Для примера в качестве исходного вектора рассмотрим столбец чисел от 0 до 25 (назовем столбец словом "Данные"). В диалоге "Выборка" ("Статистика/Выборка...") на вкладке "Ввод", как обычно, определяется диапазон ячеек, содержащих исходные данные, на вкладке "Вывод" – расположение результатов.
Вкладка "Параметры" (рис. 5.24) заслуживает отдельного обсуждения.
Есть возможность задать периодическую выборку и случайную. Пример параметров для периодической выборки показан на рис. 5.24. Параметр "Смещение" определяет начальную позицию в векторе исходных данных. Для вектора, имеющего имя, его можно оставить равным 0, если на вкладке "Ввод" установлен режим "Метки" (всё становится понятным, если провести несколько экспериментов). Результат такой выборки показан на рис. 5.25.
Видно, что при периодической выборке размер периода задаёт интервал между выбираемыми значениями (в данном примере выбирается каждое 5-е значение, начиная с номера 0), и в различных сериях (испытаниях) значения повторяются.
Пример параметров случайной выборки показан на рис. 5.26, а результат – на рис. 5.27.
Видно, что для случайной выборки количество точек определяется параметром "Размер выборки" и в различных сериях (испытаниях) значения не повторяются.
Инструмент "Выборка" может быть использован для превращения вектора данных в матрицу, а также для "прореживания" больших наборов исходных данных.