Статистическа семантика

от Уикипедия, свободната енциклопедия
Направо към: навигация, търсене


Статистическата семантика изучава "как статистическите модели на употребата на думи в човешките езици може да бъде използвано да се разбере, какво хората имат предвид, поне до степен, достатъчна за достъп до информация" (Фърнас:2006). Как разбираме какво думите значат просто гледайки в моделите на думи в големи колекции текст? Какви са границите на този подход за разбиране на думите?

История[редактиране | edit source]

Терминът статистическа семантика е първо използван от Уивър (1955) в неговия известен доклад за машинния превод. Там той твърди, че поясняването и разграничаването на значението на думата в машинния превод, трябва да се базира на съответствие на честотата на употреба на контекстуалните думи близки до дадената целева дума. Предположението, което имаме тук е, че "думата се характеризира от компанията, която поддържа", нещо, което е защитавано като теза от Дж.Р. Фърт (1957). Това приемане е познато в лингвистиката като Дистрибуционна хипотеза. Делавени (1960) дефинира статистическата семантика като "статистическо изучаване а значенията на думите и тяхната честота и ред на повтаряемост".

Източници[редактиране | edit source]

  • Делавени: Delavenay, E. (1960). An Introduction to Machine Translation, New York, NY: Thames and Hudson.
  • Уивър: Weaver, W. (1955). Translation. In W.N. Locke and D.A. Booth (eds.), Machine Translation of Languages, Cambridge, MA: MIT Press. ISBN 0-8371-8434-7
  • Фърнас: Furnas, G.W. (2006). Faculty Profile: George Furnas, University of Michigan, School of Information, URL от 2 октомври 2006.
  • Фърт: Firth, J.R. (1957). A synopsis of linguistic theory 1930-1955. In Studies in Linguistic Analysis, pp. 1-32. Oxford: Philological Society. Reprinted in F.R. Palmer (ed.), Selected Papers of J.R. Firth 1952-1959, London: Longman (1968).
Криейтив Комънс - Признание - Споделяне на споделеното Лиценз за свободна документация на ГНУ Тази страница частично или изцяло представлява превод на страницата „Statistical semantics“ в Уикипедия на английски. Оригиналният текст, както и този превод, са защитени от Лиценза „Криейтив Комънс - Признание - Споделяне на споделеното“, а за съдържание, създадено преди юни 2009 година — от Лиценза за свободна документация на ГНУ. Прегледайте историята на редакциите на оригиналната страница, както и на преводната страница, за да видите списъка на съавторите.