
Авторский коллектив в состав которого входят научные сотрудники лаборатории прикладной математики КНИИ РАН опубликовал в журнале «Big Data and Cognitive Computing» научную статью.
Разрешение неоднозначности в синтезе речи является одной из главных задач преобразования текста в речь. Методы машинного обучения и искусственные нейронные сети успешно применялись для решения этой проблемы в системах синтеза английского, испанского и других распространенных языков. Для языков с ограниченными ресурсами имеющихся данных недостаточно для обучения искусственных нейронных сетей, поэтому следует использовать эвристические методы для анализа контекста и выбора правильного омонима для многозначных слов. Цель данного исследования — разработать метод разрешения неоднозначности значений слов (WSD) для чеченского языка с ограниченными ресурсами и внедрить его в систему синтеза речи. В исследовании представлен разработанный метод и три алгоритма: AWEN (на основе евклидова расстояния), AWA (взвешенное среднее) и AWN (взвешенное нормализованное расстояние) для разрешения неоднозначности значений слов.
Был составлен корпус чеченских текстов CheWSData, содержащий 15 035 предложений, отобранных вручную из 5 миллионов аннотированных слов и отражающих естественную частоту многозначности в различных грамматических категориях. Результаты экспериментов показывают, что предложенный метод AWN достигает наилучших результатов с показателем F1, равным 0,78, и точностью 0,80, превосходя AWA (F1: 0,74) и AWEN (F1: 0,40). Для конкретных частей речи AWN достигает показателей F1, равных 0,82 для существительных, 0,83 для глаголов и 0,85 для наречий. Сравнительный анализ с существующими методами WSD для языков с ограниченными ресурсами (кашмирский, хауса, ассамский, урду и вьетнамский) показывает, что AWN является конкурентоспособным, занимая второе место после ViConBERT (F1: 0,87) и опережая XLM-R для языка хауса (F1: 0,79). Разработанный программный модуль для распознавания омонимов был интегрирован в чеченскую систему синтеза речи, что способствовало созданию более естественной синтезированной речи. https://doi.org/10.3390/bdcc10060181 (Scopus, Q1)
Big Data and Cognitive Computing —международный рецензируемый ежемесячный журнал открытого доступа, посвященный большим данным и когнитивным вычислениям (Базель, Швейцария). Индексируется в Scopus, ESCI (Web of Science), dblp, Inspec, Ei Compendex и других базах данных. Рейтинг журнала: JCR — Q1 (Информатика, теория и методы) / CiteScore — Q1 (Прикладные науки в информатике).