Грешки от първи и от втори род
| Тази статия се нуждае от подобрение. Необходимо е: форматиране. Ако желаете да помогнете на Уикипедия, използвайте опцията редактиране в горното меню над статията, за да нанесете нужните корекции. |
Грешките от първи род (на английски: type I errors, α errors, false positives) и грешките от втори род (на английски: type II errors, β errors, false negatives) в математическа статистика — са ключови понятия на задачите за проверка на статистическите хипотези. Все пак, тези понятия често се ползват и в други области, когато става въпрос за вземане на «бинарно» решение (да или не) на базата на някакъв критерий (тест, проверка, измерване), който с някаква вероятност може да даде фалшив резултат.
Определения[редактиране]
Нека е дадена извадка
от неизвестно съвместно разпределение
, и е поставена бинарна задача за проверка (тест) на статистическите хипотези:
където
— нулева хипотеза, а
— алтернативна хипотеза. Да предположим, че е даден статистически критерий
,
съпоставящ на всяка реализация на извадката
една от наличните хипотези. Тогава са възможни следните четири случая:
- Разпределението на
извадката
съответства на хипотезата
, и тя е точно определена от статистическия критерий, то ест
. - Разпределението на
извадката
съответства на хипотезата
, но тя е невярно отхвърлена от статистическия критерий, то ест
. - Разпределението на
извадката
съответства на хипотезата
, и тя е точно определена от статистическия критерий, то ест
. - Разпределението на
извадката
съответства на хипотезата
, но тя е невярно отхвърлена от статистическия критерий, то ест
.
Във втория и в четвъртия случаи се казва, че е възникнала статистическа грешка, която се нарича съответно грешка от първи и от грешка от втори род.
| Вярна е хипотезата | |||
|---|---|---|---|
|
|
||
| Резултат от прилагане на критерия |
|
е приета правилно |
е приета неправилно (Грешка от втори род) |
|
е отхвърлена неправилно ( Грешка от първи род) |
е отхвърлена правилно |
|
За смисъла на грешките от първи и от втори род[редактиране]
Както се вижда от приведеното по горе определение, грешките от първи и от втори род взаимно са симетрични, то ест ако се сменят местата на хипотезите
и
, то грешките от първи род ще се превърнат в грешки от втори род и обратно. Но все пак, в повечето ситуации от практиката объркване не възниква, тъй като се приема да се счита, че нулева хипотеза
ще съответства на състояние «по подразбиране» (нормалното, най-очакваното състояние) — например, че изследвания пациент е здрав, или че пътника преминаващ през рамката на металдетектора не притежава забранени метални предмети. Съответно, алтернативната хипотеза
означава противоположната ситуация, която обикновено се тълкува като по-малко вероятна, необичайна, или изискваща някаква реакция. В този смисъл грешки от първи род често биват наричани фалшива аларма или лъжлива тревога, лъжливо сработване или Лъжливо-положителен резултат — например, анализа на кръвта е показал наличие на заболяване, но всъщност човека си е здрав, или металдетектора е подал сигнал тревога, породена от металната тока на колан. Поради възможността за лъжливи сработвания борбата с много видове заплахи не може да се автоматизира напълно. Като правило, вероятността за лъжливо сработване корелира с вероятността за пропускане на събитието (грешки от втори род). То ест, колкото една система е по-чувствителна, толкова тя открива повече опасни събития и, следователно, предотвратява. Но при увеличаване на чувствителността неизбежно нараства и вероятността за лъжливо сработвания. Затова прекалено чувствително (параноично) настроена система за защита може да се изроди в свота противоположност и да доведе до това, че страничната вреда от нея ще бъде по-голяма от ползата.
Съответно, грешката от втори род понякога се нарича пропускане на събитието или лъжливоотрицателно сработване – напр. човек е болен, но анализа на кръвта не го показал, или пътник притежава хладно оръжие, но рамката на металдетектора не го е открила (например, поради това, че чувствителността на рамката е настроена да открива само масивни метални предмети). Думата «отрицателен» в конкретния случай няма отношение към желатлно ил нежелателно е самото събитие. Терминът широко се използва в медицината. Например, тестовете, предназначени за диагностика на заболявания понякога дават отрицателен резултат (т. е. показват отсъстствие на заболяване на пациента), докато всъщност пациента страда от това заболяване. Такъв резултат се нарича лъжливоотрицателен. При други области, традиционно, използват словосъчетания с подобен смисъл, например, «пропуск на събитие», и т. н. В информационните технологии често се използва без превoд английския термин false negative. Степента на чувствителност на системата за охрана трябва да представлява именно компромис между вероятността за грешки от първи и за грешки от втори род. Къде всъщност е точката на баланс, зависи от оценката на риска и за двата вида грешки.
Вероятност за грешка (ниво на значимост и мощност)[редактиране]
- Виж още ниво на значимост

,
съответства на хипотезата
.
.