Найдено научных статей и публикаций: 4, для научной тематики: Вычислительная лингвистика
1.
Крижановский А.А., Смирнов А.В., Круглов В.М., Крижановская Н.Б., Кипяткова И.С.
- Труды СПИИРАН , 2014
Разработана методология извлечения словарных помет из интернет-словарей. В соответствие с этой методологией экспертами построено отображение (соответствие один к одному) системы словарных помет Русского Викисловаря (385 помет) и системы словарных помет Английского Викисловаря (1001 помета). Таким об...
Разработана методология извлечения словарных помет из интернет-словарей. В соответствие с этой методологией экспертами построено отображение (соответствие один к одному) системы словарных помет Русского Викисловаря (385 помет) и системы словарных помет Английского Викисловаря (1001 помета). Таким образом, построена интегральная система словарных помет (1096 помет), включающая пометы обоих словарей. Разработан синтаксический анализатор (парсер), который распознаёт и извлекает известные и новые словарные пометы, сокращения и пояснения, указанные в начале текста значений слов в словарных статьях Викисловаря. Следует отметить наличие в парсере большого количества словарных помет известных заранее (385 словарных помет для Русского Викисловаря). С помощью парсера на основе данных Русского Викисловаря была построена база данных машиночитаемого Викисловаря, включающая информацию о словарных пометах. В работе приводятся численные параметры словарных помет в Русском Викисловаре, а именно: с помощью разработанной программы было подсчитано, что в базе данных машиночитаемого Викисловаря к 133 тыс. значений слов приписаны пометы и пояснения; для полутора тысяч значений слов был указан регион употребления слова, подсчитано число словарных помет для разных предметных областей. Вкладом данной работы в компьютерную лексикографию является оценка численных параметров словарных помет в больших словарях (пятьсот тысяч словарных статей).
Крижановский А.А., Смирнов А.В., Круглов В.М., Крижановская Н.Б., Кипяткова И.С. Автоматическое извлечение словарных помет из Русского Викисловаря // Труды СПИИРАН. 2014. Вып. 2(33). С. 164-185
2.
Смирнов А.В., Круглов В.М., Крижановский А.А., Луговая Н.Б., Карпов А.А., Кипяткова И.С.
- Труды СПИИРАН , 2012
В работе выполнен количественный анализ лексики русского языка по данным тезауруса Русский WordNet и двух электронных словарей (Русский Викисловарь и Английский Викисловарь). Сравнивается объём словарей и распределение слов русского языка по частям речи. Приводится соотношение многозначных слов и сл...
В работе выполнен количественный анализ лексики русского языка по данным тезауруса Русский WordNet и двух электронных словарей (Русский Викисловарь и Английский Викисловарь). Сравнивается объём словарей и распределение слов русского языка по частям речи. Приводится соотношение многозначных слов и слов с одним значением, а также распределение русских слов по числу значений. Анализ распределения числа значений выявил проблему Английского Викисловаря – отсутствие или недостаточная проработка многозначных русских слов с числом значений больше четырёх (по сравнению со словами Русского Викисловаря). Эксперименты показывают, что лингвистические ресурсы, созданные энтузиастами, демонстрируют те же закономерности, что и традиционные словари.
Смирнов А.В., Круглов В.М., Крижановский А.А., Луговая Н.Б., Карпов А.А., Кипяткова И.С. Количественный анализ лексики русского WordNet и викисловарей // Труды СПИИРАН. 2012. Вып. 23. С. 231–253.
3.
А.А. Крижановский, А.В. Смирнов
- Известия РАН. Теория и системы управления , 2013
Предложен подход и рассмотрена архитектура системы автоматизированного построения общецелевой лексической онтологии. В качестве онлайн-словаря был выбран викисловарь, поскольку он имеет большую базу данных из слов с переводами на многие языки. На примере Русского Викисловаря рассмотрена структура сл...
Предложен подход и рассмотрена архитектура системы автоматизированного построения общецелевой лексической онтологии. В качестве онлайн-словаря был выбран викисловарь, поскольку он имеет большую базу данных из слов с переводами на многие языки. На примере Русского Викисловаря рассмотрена структура словарной статьи, на основе которой спроектирована база данных для хранения извлечённой информации. В системах управления знаниями важной составляющей частью являются онтологии, для работы с которыми требуется разработка подходов и алгоритмов для их построения. В результате построены лексические онтологии и выполнено сравнение основных показателей двух баз данных онтологий, созданных на основе Русского и Английского Викисловарей. Выполнен анализ динамики изменения численных параметров Викисловарей и построенных авторами на их основе общецелевых лексических онтологий за 2010-2012 гг.
Крижановский А.А., Смирнов А.В. Подход к автоматизированному построению общецелевой лексической онтологии на основе данных викисловаря // Известия РАН. Теория и системы управления. N2, 2013, С. 53-63.
4.
Крижановский А.А.
- Труды СПИИРАН , 2011
В работе выполнен количественный анализ лексики английского языка по данным трёх электронных словарей: Английского Викисловаря, WordNet и Русского Викисловаря. Сравнивается объём словарей и распределение слов английского языка по частям речи. Приводится соотношение многозначных слов и слов с одним з...
В работе выполнен количественный анализ лексики английского языка по данным трёх электронных словарей: Английского Викисловаря, WordNet и Русского Викисловаря. Сравнивается объём словарей и распределение слов английского языка по частям речи. Приводится соотношение многозначных слов и слов с одним значением, а также распределение английских слов по числу значений. Эксперименты показывают, что лингвистические ресурсы, созданные как экспертами, так и энтузиастами, подчиняются общим законам.
Крижановский А.А. Количественный анализ лексики английского языка в викисловарях и Wordnet // Труды СПИИРАН. 2011. Вып. 19. С. 87–101.