Двухуровневый морфофонемный префиксный граф для декодирования русской слитной речи
Аннотация
Описан новый способ компактного хранения словаря слов и их транскрипций в виде фонемного графа, учитывающего дифференциальные морфологические признаки слов. Сокращение словаря особенно актуально для флективных языков, где богатая морфология сильно затрудняет анализ текста и речи. Для повышения производительности декодера русской речи с большим словарем предлагается использовать двухуровневый морфофонемный префиксный граф. Выделение одинаковых основ и окончаний в различных словах существенно сокращает пространство поиска гипотез распознавания. Использованная статистическая модель языка учитывает встречаемость комбинаций основ, а не целых слов, что уменьшает сложность декодирования слитной речи и требует для обучения значительно меньшего объема текстовых ресурсов. По сравнению с базовыми моделями фонетического представления словаря сложность топологии предложенного графа оказалась в 17 раз меньше.Литература
Зализняк A. А. Грамматический словарь русского языка. М.: Русские словари, 2003. 800 с.
Kurimo M., Creutz M., Varjokallio M., Arisoy E., Saraclar M. Unsupervised segmentation of words into morphemes — Morpho challenge 2005 application to automatic speech recognition // Proc. Interspeech 2006. Pittsburgh, USA, 2006. P. 1021–1024.
Kneissler J., Klakow D. Speech recognition for huge vocabularies by using optimized subword units // Proc. Eurospeech 2001. Aalborg, Denmark, 2001. P. 69–72.
Szarvas M., Furui S. Finite-state transducer based modeling of morphosyntax with applications to Hungarian LVCSR // Proc. ICASSP’2003. Hong Kong, China, 2003. Vol. 1. P. 368–371.
Карпов А. А., Ронжин А. Л., Ли И. В. SIRIUS — cистема дикторонезависимого распознавания слитной русской речи // Известия ТРТУ. 2005. № 10. С. 44–53.
Pražák A., Psutka J., Hoidekr J., Kanis J., Müller L., Psutka, J. Adaptive language model in automatic online subtitling // Proc. 2nd IASTED International Conference on Computational Intelligence CI 2006. San Francisco, California, USA, 2006. P. 479–483.
Demuynck K., Duchateau J., Van Compernolle D., Wambacq P. An efficient search space representation for large vocabulary continuous speech recognition // Speech Communication. 2000. Vol. 30, no. 1. P. 37–53.
Carki K., Geutner P., Schultz T. Turkish LVCSR: Towards better speech recognition for agglutinative languages // Proc. ICASSP-2000. Istanbul, Turkey, 2000. Vol. 3. P. 1563–1566.
Nedevschi S., Patra R., Brewer E. Hardware speech recognition on low-cost and low-power
Сокирко А. В. Морфологические модули на сайте www.aot.ru // Диалог-2004. Компьютерная лингвистка и интеллектуальные технологии: Труды междунар. конф. М.: Наука, 2004. 559 с.
Gelbukh A., Sidorov G. Approach to construction of automatic morphological analysis systems for inflective languages with little effort //. Proc. of CICLing-2003. Lecture Notes in Computer Science. 2003. No. 2588. P. 215–220.
Гойхман О. Я., Надеина Т. М. Речевая коммуникация. М.: Инфра-М, 2006. 272 c.
Kurimo M., Creutz M., Varjokallio M., Arisoy E., Saraclar M. Unsupervised segmentation of words into morphemes — Morpho challenge 2005 application to automatic speech recognition // Proc. Interspeech 2006. Pittsburgh, USA, 2006. P. 1021–1024.
Kneissler J., Klakow D. Speech recognition for huge vocabularies by using optimized subword units // Proc. Eurospeech 2001. Aalborg, Denmark, 2001. P. 69–72.
Szarvas M., Furui S. Finite-state transducer based modeling of morphosyntax with applications to Hungarian LVCSR // Proc. ICASSP’2003. Hong Kong, China, 2003. Vol. 1. P. 368–371.
Карпов А. А., Ронжин А. Л., Ли И. В. SIRIUS — cистема дикторонезависимого распознавания слитной русской речи // Известия ТРТУ. 2005. № 10. С. 44–53.
Pražák A., Psutka J., Hoidekr J., Kanis J., Müller L., Psutka, J. Adaptive language model in automatic online subtitling // Proc. 2nd IASTED International Conference on Computational Intelligence CI 2006. San Francisco, California, USA, 2006. P. 479–483.
Demuynck K., Duchateau J., Van Compernolle D., Wambacq P. An efficient search space representation for large vocabulary continuous speech recognition // Speech Communication. 2000. Vol. 30, no. 1. P. 37–53.
Carki K., Geutner P., Schultz T. Turkish LVCSR: Towards better speech recognition for agglutinative languages // Proc. ICASSP-2000. Istanbul, Turkey, 2000. Vol. 3. P. 1563–1566.
Nedevschi S., Patra R., Brewer E. Hardware speech recognition on low-cost and low-power
Сокирко А. В. Морфологические модули на сайте www.aot.ru // Диалог-2004. Компьютерная лингвистка и интеллектуальные технологии: Труды междунар. конф. М.: Наука, 2004. 559 с.
Gelbukh A., Sidorov G. Approach to construction of automatic morphological analysis systems for inflective languages with little effort //. Proc. of CICLing-2003. Lecture Notes in Computer Science. 2003. No. 2588. P. 215–220.
Гойхман О. Я., Надеина Т. М. Речевая коммуникация. М.: Инфра-М, 2006. 272 c.
Опубликован
2007-08-01
Как цитировать
Ронжин, Леонтьева, Кагиров, & Леонтьева,. (2007). Двухуровневый морфофонемный префиксный граф для декодирования русской слитной речи. Труды СПИИРАН, (4), 388-404. https://doi.org/10.15622/sp.4.29
Выпуск
Раздел
Статьи
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями:
Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале.
Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале.
Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).