Шайтова Н.Ж.
Ошибки статистики и меры по обеспечению надежности статистической информации
Актюбинский политехнический колледж
-->Всякое статистическое наблюдение ставит задачу получения таких данных, которые по возможности более точно отображали бы действительность, состояние изучаемых единиц совокупности. Под точностью статистической информации понимается уровень (степень) соответствия зафиксированной при статистическом наблюдении величины изучаемого признака действительному его значению.
Собранные в процессе статистического наблюдения данные по отдельным единицам изучаемой совокупности на последующих стадиях статистического исследования должны быть сведены (обобщены) и обработаны, чтобы получить объективный и точный ответ на все вопросы, поставленные целью исследования. Качество и правильность результатов любого статистического исследования, которые можно получить на основе обобщения, обработки и анализа статистических данных, зависят от качества и достоверности исходного материала – статистических данных.
Отклонения или разности между зафиксированными при статистическом наблюдении величинами изучаемого признака и действительными (истинными) величинами его называют ошибками наблюдения. В зависимости от источников и причины возникновения неточностей, допускаемых в процессе статистического наблюдения, обычно выделяют ошибки регистрации и ошибки репрезентативности (представительности). Ошибки регистрации возникают вследствие неправильного установления фактов в процессе наблюдения или неправильной их записи. Они имеют место как при сплошном, так и несплошном наблюдении. Ошибки регистрации подразделяются на случайные и систематические.
Случайные ошибки – это ошибки, допущенные при заполнении бланков (цифра записана не в ту графу или допущена описка в записи), оговорка в ответах, нечеткость в вопросе и соответственно в ответе и т.д.
Систематические ошибки могут быть преднамеренными и непреднамеренными. Преднамеренные ошибки (сознательные) получаются в результате того, что при знании действительного состояния (величины) признака сознательно сообщаются неправильные данные. Непреднамеренными называются ошибки, вызываемые случайными причинами: например, неправильностью измерительных приборов, невнимательностью регистраторов и др.
Данные статистических исследований всё чаще намеренно искажают или неправильно интерпретируют, выбирая только те данные, которые являются благоприятными для ведущего конкретное исследование. Неправильное использование статистических данных может быть как случайным, так и преднамеренным. В книге Huff, Darrell (1954) How to Lie With Statistics излагается ряд соображений по поводу использования и неправильного применения статистических данных. Некоторые авторы также проводят обзор статистических методов, используемых в определённых областях. Способы, позволяющие избежать неправильного толкования статистических данных включают в себя использование надлежащей схемы и исключение предвзятости при проведении исследований. Злоупотребление происходит тогда, когда такие выводы «заказываются» определёнными структурами, которые намеренно или бессознательно выводят на отбор предвзятых данных или проб. При этом гистограммы, как самый простой для использования и понимания (восприятия) вид диаграммы, могут быть сделаны либо с применением обычных программ для компьютера или просто нарисованы. К сожалению, большинство людей не делают попыток искать ошибки или заблуждаются сами, поэтому и не видят ошибок. Таким образом, по мнению авторов, статистические данные, чтобы быть правдой, должны быть «не причёсаны» (то есть достоверные данные не должны выглядеть идеальными). Для того, чтобы полученные статистические данные оказались правдоподобными и точными, проба должна быть репрезентативной в целом.
Систематическая ошибки репрезентативности может возникнуть вследствие нарушения принципов случайного отбора единиц не сплошного наблюдения. Размеры систематической ошибки репрезентативности не поддаются оценке. Для выявления и устранения (при возможности) допущенных ошибок наблюдения проводится ряд мер.
Всякий статистический документ, прежде чем поступить для обработки, должен быть тщательно проверен. Сначала документ проверяется с точки зрения полноты поступления статистических сведений (все ли отчетные единицы представили материал обследования, все ли реквизиты и признаки в документах отражены.) Затем осуществляется синтаксический, логический и арифметический контроль.
Синтаксический контроль предусматривает проверку правильности структуры документов, наличие необходимых реквизитов, наличие ответов на все вопросы программы (полнота заполнения строк).
При логическом контроле выявляются несоответствия значений признаков наиболее вероятным их значениям и отсутствие необходимых взаимосвязей между показателями. С помощью арифметического контроля проверяются итоги в отчетных документах путем сравнения с предварительно рассчитанными контрольными суммами по строкам или графам.
Ошибки наблюдения могут быть вызваны различными причинами. В статистической отчетности ошибки могут быть вызваны недостатками учета на предприятиях. Органы госстатистики проводят систематический контроль за организацией отчетности и первичного учета. В специальных статистических исследованиях ошибки наблюдения могут быть вызваны недостатками в составлении программы, нечеткостью определения объекта или единицы совокупности (наблюдения), плохой подготовленностью кадров, описками регистров. Изучение причин ошибок наблюдения и реализация эффективных мер позволяют избежать ошибок или свести их к минимуму.
Литература
1. Huff, Darrell, How to Lie With Statistics, WW Norton & Company, Inc. New York, NY, 1954. ISBN 0-393-31072-8
2. Никитина Е.П., Фрейдлина В.Д., Ярхо А.В. Коллекция определений термина «статистика». — Москва: МГУ, 1972.
3. Warne, R. Lazo, M., Ramos, T. and Ritter, N. (2012). Statistical Methods Used in Gifted Education Journals, 2006—2010. Gifted Child Quarterly, 56(3) 134—149.