Серкебаева Л.Т.
Анализ статистической совокупности средствами Microsoft Excel
Костанайский государственный университет имени А.Байтурсынова, Республика Казахстан
-->Анализ статистической совокупности средствами Microsoft Excel.
Обобщающие статистические показатели совокупности исчисляются на основе анализа вариационных рядов распределения, временных рядов. Однако пакет Microsoft Excel позволяет рассчитать многие из этих показателей непосредственно по первичным данным наблюдения, используя имеющиеся инструменты надстройки «Анализ данных», а также статистические функции инструмента «Мастер функций».
Надстройка «Анализ данных» вызывается командой «Анализ данных» меню «Данные» и содержит в своем составе такие инструменты анализа статистической совокупности, как однофакторный дисперсионный анализ, двухфакторный дисперсионный анализ с повторениями, двухфакторный дисперсионный анализ без повторений, корреляция, ковариация, описательная статистика, экспоненциальное сглаживание, двухвыборочный F-тест для дисперсии, скользящее среднее, генерация случайных числе, ранг и персентиль, анализ Фурье, гистограмма, регрессия, выборка, парный двухвыборочный t-тест для средних, двухвыборочный t-тест с одинаковыми дисперсиями, двухвыборочный t-тест с различными дисперсиями, двухвыборочный z-тест для средних. Окно надстройки «Анализ данных» представлено на рисунке 1.
Рисунок 1 – Окно надстройки «Анализ данных»
Рассмотрим для примера порядок работы с инструментом «Описательная статистика».
Цель описательной статистики – получение сводных (обобщающих) показателей, характеризующих исходную совокупность данных как генеральную (а не как выборку из некоторой другой совокупности большего объема).
Для численной оценки обобщающих показателей совокупности используются так называемые описательные статистики, представляющие собой однозначные функции на множестве наблюдаемых данных, определяющие значения оцениваемых обобщающих показателей совокупности.
Описательные статистики рассчитываются по несгруппированным данным и реализуют точные функциональные зависимости значений показателей от исходных данных (в отличие от приближенных статистических оценок, выводимых с заданным уровнем надежности).
Показатели, вычисляемые с помощью описательных статистик, можно разбить на 3 группы – показатели положения вариантов значений признака, вариации признака и особенностей формы его распределения.
Диалоговое окно инструмента «Описательная статистика» вызывается соответствующей командой надстройки «Анализ данных» меню «Данные» и имеет вид, отображенный на рисунке 2.
Диалоговое окно инструмента «Описательная статистика» содержит следующие параметры:
1. Поле Входной интервал – вводится ссылка на диапазон ячеек, содержащих значения анализируемого признака. В качестве входного интервала может быть указан диапазон, который содержит ряды значений сразу нескольких анализируемых признаков. В таком случае показатели Описательной статистики будут рассчитаны для каждого ряда и представлены в единой таблице в виде отдельных столбцов.
2.Переключатель Группирование: по столбцам/строкам – устанавливается в положение по столбцам или по строкам в зависимости от того, в каком направлении располагаются анализируемые данные во входном диапазоне – вертикальном (по столбцам) или горизонтальном (по строкам).
3.Флажок Метки в первой строке – устанавливается в активное состояние, если первая строка во входном диапазоне содержит заголовки. Если заголовки отсутствуют, поле не активизируется. В этом случае будут автоматически созданы стандартные названия для данных выходного диапазона.
4. Поле Выходной интервал – вводится ссылка на ячейку заголовка первого столбца выходной результативной таблицы. Размер выходного диапазона ячеек определяется автоматически. В случае возможного наложения выходного диапазона на другие данные на экране появится соответствующее сообщение.
5. Переключатели Новый рабочий лист и Новая рабочая книга – устанавливаются в активное положение при необходимости открытия соответственно нового листа или новой книги.
6. Флажок Итоговая статистика – устанавливается в активное состояние, если для данных входного диапазона необходимо произвести расчет основных показателей.
7. Флажок Уровень надежности – устанавливается в активное состояние, если в результативную таблицу необходимо включить строку для оценки предельной ошибки выборки с заданной доверительной вероятностью.
8. Флажки К-тый наименьший и K-тый наибольший – активизируются, если в результативную таблицу необходимо включить строку соответственно для k-го наименьшего (начиная с минимума xmin ) и k-го наибольшего (начиная с максимума xmax ) значений элементов в выборке. В этом случае в поле, расположенном напротив каждого флажка, вводится число k. При k = 1 выходные строки будут содержать соответственно xmin и xmax.
Показатели могут рассчитываться сразу для нескольких рядов данных в соответствии с заданным входным диапазоном ячеек.
Литература:
1. Козлов, А. Ю. Статистические функции MS Excel в экономико-статистических расчетах : учеб. пособие для вузов / А. Ю. Козлов, В. С. Мхитарян, В. Ф. Шишов ; под ред. проф. В. С. Мхитаряна. – М.:ЮНИТИ-ДАНА, 2003.
2. Макарова, Н. В. Статистика в Excel : учеб. пособие / Н. В. Макарова, В. Я. Трофимец. – М.: Финансы и статистика, 2002.