Международный экономический форум 2010

Щетинина Е.К., Падова И.Г. Донецкий национальный университет экономики и торговли имени Михаила Туган-Барановского, Украина

Проблемы оценивания параметров распределения в задачах надежности

В настоящее время внимание многих авторов сконцентрировано на особенностях и проблемах статистического анализа в задачах надежности. Это в первую очередь касается оценки степени изученности вопросов применения критериев согласия (при проверке сложных гипотез и цензурировании данных), предложения резко ограничить число моделей законов распределения, используемых в задачах надежности, возможности различения законов распределения при цензурированных наблюдениях.

Весьма удобным для применения на практике является замечательный вариант критерия типа , предложенный М.С. Никулиным. И хоть статистика этого критерия требует несколько большего объема вычислений, зато при проверке сложных гипотез и использовании оценок максимального правдоподобия по исходным несгруппированным наблюдениям при любом числе оцененных параметров она подчиняется –распределению с числом степеней свободы , где – число интервалов группирования.

Целый ряд факторов, определяющих “сложность” гипотезы, влияет на законы распределения статистик: вид наблюдаемого закона распределения , соответствующего истинной гипотезе ; тип оцениваемого параметра и количество оцениваемых параметров; в некоторых ситуациях конкретное значение параметра; используемый метод оценивания параметров.

Математическая модель должна быть адекватной конкретной задаче исследования надежности, а используемые математические методы должны быть корректны по отношению к виду математической модели. Специфика задач надежности должна учитываться математической моделью. Методы статистического анализа определяются математической моделью, структурой наблюдений, априорной информацией и достигнутым уровнем развития математического аппарата.

После предположения о характере вероятностной модели на основе имеющихся наблюдений решают два вида задач статистического анализа:

1) стараются оценить параметры этой модели таким образом, чтобы она с наибольшей точностью описывала соответствующее явление.

2) с использованием некоторого критерия проверяют адекватность модели данному явлению. Если эта модель представляет собой закон распределения, то проверка осуществляется с использованием некоторого критерия согласия.

На этапе такой проверки с минимальными вероятностями ошибок гипотеза об адекватности модели должна быть принята, если это действительно так, или отклонена в пользу другой модели, более подходящей. Возможно с позиций реальных сроков жизни невосстанавливаемых изделий поздние отказы за пределами обычных сроков эксплуатации, вызываемые какими-либо процессами деградации, имеют достаточно малый вес в общем количестве отказов. Но если рассматривать моменты отказов как случайную величину, то модель закона распределения, если мы ее используем, должна адекватно описывать эти отказы на всей области определения.

Иногда невозможно различить близкие законы при цензурированных наблюдениях, но это не является серьезным основанием для отказа от применения множества моделей в пользу только одной. Поскольку при цензурировании происходят потери информации (потери информации Фишера), то это отражается на способности различать законы распределения с использованием критериев согласия и на точности оценивания параметров рассматриваемых законов.

В целях наилучшего различения законов следует осуществлять проверку сложных гипотез, оценивая по выборке параметры закона, соответствующего проверяемой гипотезе. А на этом пути следует преодолеть два препятствия:

) следует на основании имеющейся информации найти по возможности наиболее точные оценки параметров;

) найти распределения статистик критериев согласия, соответствующие данному методу оценивания.

Возможная точность оценок максимального правдоподобия ограничивается снизу асимптотической дисперсией , где – объем выборки. Информационное количество Фишера по цензурированной выборке определяется соотношением

, (1)

где – вероятность попадания в область цензурирования слева, ? вероятность попадания в область цензурирования справа, а наблюдаемая область лежит в пределах от до . Если выборка цензурирована только справа, то в выражении (1) исчезает левое слагаемое, если только слева – правое слагаемое. Равенство (1) позволяет судить о потерях информации, о параметре распределения в зависимости от степени цензурирования слева или справа и возможной точности оценивания. Чем больше потери информации, тем меньше возможная точность оценивания.

Возникают принципиальные сложности, связанные со смещенностью оценок параметров, вычисляемых по цензурированным выборкам. К тому же, при сильном цензурировании распределения оценок максимального правдоподобия параметров очень медленно сходятся к асимптотическому нормальному закону, а при ограниченных объемах выборок эти распределения оказываются существенно асимметричными. Однако обе эти проблемы можно преодолеть методами статистического моделирования с помощью построения для вычисляемых оценок поправок на смещение в виде функций от объема выборки и степени цензурирования. Такие поправки, нейтрализующие смещение, позволят находить несмещенные оценки параметров. А возможность построения несмещенных оценок параметров по цензурированным выборкам, позволяет исследовать распределения статистик критериев согласия, и, следовательно, корректно проверять сложные гипотезы относительно законов распределения.

Построение поправок на смещение и исследование распределений статистик критериев согласия в каждом конкретном случае являются достаточно трудоемкими задачами. Поэтому выбор конкретного перечня моделей законов распределений, перспективных с точки зрения использования при исследовании надежности, для которых целесообразно построить зависимости для поправок и модели предельных распределений статистик, должен определяться специалистами, вплотную занимающимися проблемами надежности.

Таким образом, в работе обозначен круг задач, обусловленных спецификой регистрации данных в задачах надежности, решение которых требует совершенствования методов статистического анализа, необходимости разработки соответствующего программного обеспечения и последующей коррекции регламентирующих документов.