
Лектор ознакомила слушателей с процессом создания системы синтеза чеченской речи Yesha, основу которой составляют аудио и текстовые базы данных. Подготовленные базы были использованы для машинного обучения с целью получения модели, соответствующей естественным характеристикам речи. Также Элиса Израилова рассказала о разработке различных программных модулей синтезатора чеченской речи, таких как: фонетический транскриптор Elp-Az, разработанный с учётом проблематики графемно-фонемных преобразований чеченского языка; программа нормализации (расшифровки) числительных и аббревиатур Terah-Yoza; программа сбора предложений с омонимами. В докладе также была представлена информация о процессе машинного обучения системы, настройке оборудования и параметров нейронной сети, о результатах эксперимента по обучению системы синтеза речи.
Элиса рассказала, что после создания синтезатора речи была проведена экспериментальная оценка качества озвученных программой текстов. Таким образом, выявлена проблема чтения синтезатором слов-омографов, в которых программа не всегда правильно читает долгие и краткие звуки. Проведенные исследования показали, что данная задача актуальна для всех языков мира, а особенно для малоресурсных языков, к которым относится и чеченский.
Для решения поставленной задачи, которая в научной среде называется WSD (word sense disambugation) – устранение лексической многозначности, сотрудники сектора искусственного интеллекта за последние два-три года разработали три алгоритма распознавания омонимов в текстах на чеченском языке. Были показаны результаты оценки точности распознавания омонимов программой по созданным алгоритмам, которые не уступают классическим алгоритмам и методам. Программа распознавания омонимов будет встроена в качестве модуля в систему синтеза речи, что позволит улучшить чтение программой слов-омографов.
Выступление вызвало живой интерес у аудитории, что выразилось в большом количестве вопросов, на которые докладчиком были даны развернутые и полные ответы. Коллектив КНИИ РАН выразил Э. Израиловой благодарность за содержательный и глубокий доклад.