Качество на данните

от Уикипедия, свободната енциклопедия
Направо към навигацията Направо към търсенето

Качество на данните (на английски: data quality) е термин, с който се описва състоянието на даден набор от стойностите на качествени и количествени променливи величини. Съществуват много дефиниции на понятието „качество на данните“, но като цяло данните се смятат за качествени, ако „отговарят на целта, за която са предназначени за опериране, вземане на решения и планиране“.[1] Алтернативно, данните се смятат за качествени, ако коректно представят конструктите от реалния свят, за които се отнасят.

Наред с тенденцията обемите от данни да стават все по-големи, на преден план излиза и въпросът за вътрешната съгласуваност на данните (data consistency), без значение дали тези данни отговарят на нуждите на каквато и да е конкретна външна цел. Различните потребители могат да имат различни виждания за качеството на данните, дори когато става въпрос за един и същ набор от данни, използвани за една и съща цел. За осигуряване на качество на данните може да е необходима допълнителна процедура по пречистване на данните (data cleansing).[2]

Източници[редактиране | редактиране на кода]

Криейтив Комънс - Признание - Споделяне на споделеното Лиценз за свободна документация на ГНУ Тази страница частично или изцяло представлява превод на страницата „Data quality“ в Уикипедия на английски. Оригиналният текст, както и този превод, са защитени от Лиценза „Криейтив Комънс - Признание - Споделяне на споделеното“, а за съдържание, създадено преди юни 2009 година — от Лиценза за свободна документация на ГНУ. Прегледайте историята на редакциите на оригиналната страница, както и на преводната страница. Вижте източниците на оригиналната статия, състоянието ѝ при превода, и списъка на съавторите.