Статистически модел

Статистическият модел е вид математически модел, в който се съдържат набор от предположения относно генерирането на представителни данни, извадка от по-голяма популация. Често в значително идеализиран вид, статистическият модел представлява процес по генериране на данни.

Предположенията, съдържащи се в статистическия модел, описват множество от вероятностни разпределения, някои от които се предполага адекватно да апроксиримират разпределението, от което определени данни се взимат като извадка. Вероятностните разпределения, свойствени на статистическите модели, са това, което отличава статистическите от други – нестатистически – математически модели.

Три са целите, с които се правят статистически модели: прогнозиране, извличане на информация и описание на стохастични структури.^[1]

Identifiabilité в статистиката и иконометрията, тоест идентификацията (уникалността и уникалната идентифируемост), е свойство на статистически модел.

Разглеждаме статистическия модел : $\left((X_{1},\ldots ,X_{n})\in \chi ^{n},\mathbb {P} _{\theta }^{\otimes n},\theta \in \Theta \right)$

Формална дефиниция[редактиране | редактиране на кода]

Статистическият модел формално се дефинира като наредената двойка ( $S,{\mathcal {P}}$ ), където $S$ е множеството от възможните наблюдения, т.е. пространството на извадката, а ${\mathcal {P}}$ е множеството от вероятностни разпределения над $S$ .^[2]

Интуицията зад това определение е следната. Смята се, че има „същинско“ вероятностно разпределение, породено от процеса, с който естествено се генерират наблюдаваните данни. Избираме ${\mathcal {P}}$ да представлява множеството (от разпределения), което съдържа такова разпределение, което адекватно апроксимира истинското. За отбелязване е, че не изискваме ${\mathcal {P}}$ да съдържа същинското разпределение и това в редки случаи е възможно на практика. В действителност, „моделът е опростяване или апроксимиране на реалността и следователно не отразява цялата реалност“^[3] – откъдето идва и разпространеният афоризъм в статистиката (приписван на статистѝка Джордж Бокс) „всички модели са грешни“.

Множеството ${\mathcal {P}}$ е почти винаги параметризирано: ${\mathcal {P}}=\{P_{\theta }:\theta \in \Theta \}$ . Множеството $\Theta$ дефинира статистическите параметри на модела. Параметризацията като цяло изисква различните стойности на параметрите да пораждат различни разпределения, т.е. трябва да е в сила $P_{\theta _{1}}=P_{\theta _{2}}\Rightarrow \theta _{1}=\theta _{2}$ (инективна функция). Параметризация, която отговаря на това изискване, се нарича идентифицируема.^[2]

Виж още[редактиране | редактиране на кода]

Статистически методи

Източници[редактиране | редактиране на кода]

↑ Konishi, S.; Kitagawa, G. (2008), Information Criteria and Statistical Modeling, Springer.
↑ ^а ^б McCullagh, P. (2002), "What is a statistical model?" (PDF), Annals of Statistics, 30: 1225 – 1310, doi:10.1214/aos/1035844977.
↑ Burnham, K. P.; Anderson, D. R. (2002), Model Selection and Multimodel Inference (2nd ed.), Springer-Verlag, ISBN 0-387-95364-7.

Тази страница частично или изцяло представлява превод на страницата Statistical model в Уикипедия на английски. Оригиналният текст, както и този превод, са защитени от Лиценза „Криейтив Комънс – Признание – Споделяне на споделеното“, а за съдържание, създадено преди юни 2009 година – от Лиценза за свободна документация на ГНУ. Прегледайте историята на редакциите на оригиналната страница, както и на преводната страница, за да видите списъка на съавторите.

ВАЖНО: Този шаблон се отнася единствено до авторските права върху съдържанието на статията. Добавянето му не отменя изискването да се посочват конкретни източници на твърденията, които да бъдат благонадеждни.

[1] Konishi, S.; Kitagawa, G. (2008), Information Criteria and Statistical Modeling, Springer.

[McCullagh-2] а ^б McCullagh, P. (2002), "What is a statistical model?" (PDF), Annals of Statistics, 30: 1225 – 1310, doi:10.1214/aos/1035844977.

[3] Burnham, K. P.; Anderson, D. R. (2002), Model Selection and Multimodel Inference (2nd ed.), Springer-Verlag, ISBN 0-387-95364-7.

[1]

[2]

[3]