Публикации
Турдаков Д.
Устранение лексической многозначности терминов Википедии на основе скрытой модели Маркова
// Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды XI Всероссийской научной конференции RCDL'2009. Петрозаводск: КарНЦ РАН, 2009. C. 267-275
В статье описывается способ автоматического устранения лексической многозначности терминов естественного языка, использующий открытую энциклопедию Википедию. Рассматриваются проблемы применения существующих алгоритмов, и предлагается собственный метод, основанный на скрытой модели Маркова, параметры которой вычисляются на основе словаря и ссылочной структуры Википедии. Также, предлагается эвристика для ускорения описанного алгоритма, и приводятся экспериментальные оценки точности на различных тестовых корпусах.
Устранение лексической многозначности терминов Википедии на основе скрытой модели Маркова (225 Kb, скачиваний: 174)
Последние изменения: 16 октября 2009