Статистически модел

от Уикипедия, свободната енциклопедия
Направо към навигацията Направо към търсенето

Статистическият модел е вид математически модел, в който се съдържат набор от предположения относно генерирането на представителни данни, извадка от по-голяма популация. Често в значително идеализиран вид, статистическият модел представлява процес по генериране на данни.

Предположенията, съдържащи се в статистическия модел, описват множество от вероятностни разпределения, някои от които се предполага адекватно да апроксиримират разпределението, от което определени данни се взимат като извадка. Вероятностните разпределения, свойствени на статистическите модели, са това, което отличава статистическите от други – нестатистически – математически модели.

Три са целите, с които се правят статистически модели: прогнозиране, извличане на информация и описание на стохастични структури.[1]

Формална дефиниция[редактиране | редактиране на кода]

Статистическият модел формално се дефинира като наредената двойка (), където е множеството от възможните наблюдения, т.е. пространството на извадката, а е множеството от вероятностни разпределения над .[2]

Интуицията зад това определение е следната. Смята се, че има „същинско“ вероятностно разпределение, породено от процеса, с който естествено се генерират наблюдаваните данни. Избираме да представлява множеството (от разпределения), което съдържа такова разпределение, което адекватно апроксимира истинското. За отбелязване е, че не изискваме да съдържа същинското разпределение и това в редки случаи е възможно на практика. В действителност, „моделът е опростяване или апроксимиране на реалността и следователно не отразява цялата реалност“[3] – откъдето идва и разпространеният афоризъм в статистиката (приписван на статистѝка Джордж Бокс) „всички модели са грешни“.

Множеството е почти винаги параметризирано: . Множеството дефинира статистическите параметри на модела. Параметризацията като цяло изисква различните стойности на параметрите да пораждат различни разпределения, т.е. трябва да е в сила (инективна функция). Параметризация, която отговаря на това изискване, се нарича идентифицируема.[2]

Източници[редактиране | редактиране на кода]

  1. Konishi, S.; Kitagawa, G. (2008), Information Criteria and Statistical Modeling, Springer.
  2. а б McCullagh, P. (2002), "What is a statistical model?" (PDF), Annals of Statistics, 30: 1225 – 1310, doi:10.1214/aos/1035844977.
  3. Burnham, K. P.; Anderson, D. R. (2002), Model Selection and Multimodel Inference (2nd ed.), Springer-Verlag, ISBN 0-387-95364-7.
Криейтив Комънс - Признание - Споделяне на споделеното Лиценз за свободна документация на ГНУ Тази страница частично или изцяло представлява превод на страницата „Statistical model“ в Уикипедия на английски. Оригиналният текст, както и този превод, са защитени от Лиценза „Криейтив Комънс - Признание - Споделяне на споделеното“, а за съдържание, създадено преди юни 2009 година — от Лиценза за свободна документация на ГНУ. Прегледайте историята на редакциите на оригиналната страница, както и на преводната страница. Вижте източниците на оригиналната статия, състоянието ѝ при превода, и списъка на съавторите.