Создание русского WordNet на основе конвертации данных тезауруса РуТез



Скачать 28,12 Kb.
страница2/6
Дата21.07.2022
Размер28,12 Kb.
#187596
1   2   3   4   5   6
Связанные:
Создание русского WordNet на основе конвертации данных тезауруса РуТез
Реферат (Матковская), Рецензия на реферат (Матковская) - копия
2. Связанные работы
Самый простой подход к разработке WordNet-подобных ресурсов с нуля является трудной задачей, которая обычно занимает годы работы. Подход закрепить создание национального WordNet является перевод Princeton WordNet на целевом языке (Фоссен, 1998). WordNet подобные ресурсы, полученные с автоматическим перевод может быть сгенерирован достаточно быстро, но и требует много усилий, чтобы быть вручную пересмотрены. Промежуточный подход между вышеуказанных конечных точек, которые можно рассматривать как совершенно обычно, чтобы перевести верхние 5000 концепций Принстон WordNet (ядро WordNet), а затем распространить эту иерархию вручную, используя локальные словари. Такой подход был принят в развитии EuroWordNet (Воссен, 1998) и датский WordNet-DanNet (Pedersen, 2010). Анализируя предыдущие подходы к разработке национальных WordNet, авторы из FinnishWordNet (FiWN) решил использовать ручной перевод Princeton WordNet synsets профессиональными переводчиками. Подход прямой перевод был основан на предположении, что большинство synsets в PWN представляют собой независимый от языка RealWorld концепции. Таким образом, также предполагалось, что семантические отношения между synsets в основном зависит от языка, поэтому структура PWN может быть использован повторно, а также. Таким образом, финский WordNet, FinnWordNet (FiWN), была создана путем перевода более 200000 слов чувства в английском Princeton WordNet (PWN) 3.0 в 100 дней. Браславский и др (2014) предполагают, чтобы создать русский WordNet (ПРЯЖА) с использованием Русский и Wiktionary краудсорсинга. Wiktionary является Crowdsourced словарь и тезаурус, который существует для многих языков. Викисловарь страницы, связанные с определенным словом может содержать много полезной информации о смыслах слов, в том числе список лексических смыслов, определения и примеры для лексическом смысле, лексические отношения (синонимы, антонимы, гипонимов, hypernyms), которые представлены в виде ссылок на страницы Викисловаря. Тем не менее, есть также некоторые проблемы в слове чувствуется описание, которое может помешать созданию WordNet-подобный ресурс особенно для неопытных crowdsourcers:
• лексический ссылка ведет не к определенному смысле, а ко всей странице слова,
• синонимов может быть описана как частичные синонимы, это очень расплывчатое понятие: гейзер, фонтан [gayser, фонтан].
• лексические отношения не являются симметричными. Например, слово w1 обозначается как синоним для слова w2, но слово w2, не указывается как синоним слова w1. В других примеры, слово w1 обозначается как синоним слова w2, но слово w2 указывается как hypernym к слову w1.



Скачать 28,12 Kb.

Поделитесь с Вашими друзьями:
1   2   3   4   5   6




База данных защищена авторским правом ©psihdocs.ru 2022
обратиться к администрации

    Главная страница