Статистическа семантика

от Уикипедия, свободната енциклопедия

Статистическата семантика изучава „как статистическите модели на употребата на думи в човешките езици може да бъде използвано да се разбере, какво хората имат предвид, поне до степен, достатъчна за достъп до информация“ (Фърнас:2006). Как разбираме какво думите значат просто гледайки в моделите на думи в големи колекции текст? Какви са границите на този подход за разбиране на думите?

История[редактиране | редактиране на кода]

Терминът статистическа семантика е първо използван от Уивър (1955) в неговия известен доклад за машинния превод. Там той твърди, че поясняването и разграничаването на значението на думата в машинния превод, трябва да се базира на съответствие на честотата на употреба на контекстуалните думи близки до дадената целева дума. Предположението, което имаме тук, е, че „думата се характеризира от компанията, която поддържа“, нещо, което е защитавано като теза от Дж. Р. Фърт (1957). Това приемане е познато в лингвистиката като Дистрибуционна хипотеза. Делавени (1960) дефинира статистическата семантика като „статистическо изучаване а значенията на думите и тяхната честота и ред на повтаряемост“.

Източници[редактиране | редактиране на кода]

  • Делавени: Delavenay, E. (1960). An Introduction to Machine Translation, New York, NY: Thames and Hudson.
  • Уивър: Weaver, W. (1955). Translation. In W.N. Locke and D.A. Booth (eds.), Machine Translation of Languages, Cambridge, MA: MIT Press. ISBN 0-8371-8434-7
  • Фърнас: Furnas, G.W. (2006). Faculty Profile: George Furnas Архив на оригинала от 2010-06-07 в Wayback Machine., University of Michigan, School of Information, 2 октомври 2006.
  • Фърт: Firth, J.R. (1957). A synopsis of linguistic theory 1930 – 1955. In Studies in Linguistic Analysis, pp. 1 – 32. Oxford: Philological Society. Reprinted in F.R. Palmer (ed.), Selected Papers of J.R. Firth 1952 – 1959, London: Longman (1968).
  Тази страница частично или изцяло представлява превод на страницата Statistical semantics в Уикипедия на английски. Оригиналният текст, както и този превод, са защитени от Лиценза „Криейтив Комънс – Признание – Споделяне на споделеното“, а за съдържание, създадено преди юни 2009 година – от Лиценза за свободна документация на ГНУ. Прегледайте историята на редакциите на оригиналната страница, както и на преводната страница, за да видите списъка на съавторите. ​

ВАЖНО: Този шаблон се отнася единствено до авторските права върху съдържанието на статията. Добавянето му не отменя изискването да се посочват конкретни източници на твърденията, които да бъдат благонадеждни.​