Аналитический обзор систем распознавания русской речи с большим словарем
Ключевые слова:
системы распознавания речи, сверхбольшой словарьАннотация
Использование большого словаря необходимо для задачи стенографирования флективных языков, поскольку эти языки характеризуются наличием множества словоформ, образующих парадигму слова. В статье представлен обзор существующих систем распознавания речи, использующих большой и сверхбольшой словари, описаны методы и модели, применяемые в этих системах, приведены данные об их точности распознавания.Литература
Викторов А.Б., Грамницкий С.Г., Гордеев С.С., Ескевич М.В. и др. Универсальная методика подготовки компонентов обучения систем распознавания речи // Речевые тех- нологии. Народное образование. 2009. № 2. С. 39–55.
Карпов А.А., Ронжин А.Л., Ли И.В. SIRIUS — система дикторонезависимого рас- познавания слитной русской речи // Известия ТРТУ. 2005.№ 10. С. 44–53.
Кибкало А.А., Лотков М.М., Рогожкин И.Г., Туровец А.А. Разработка системы распознавания русской речи // Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов. 2003. Вып. 3. С. 8–20.
Пилипенко В.В. Распознавание дискретной и слитной речи из сверхбольших слова- рей на основе выборки информации из баз данных // Искусственный интеллект. 2006. № 3. С. 548–557.
Пилипенко В.В., Робейко В.В. Автоматизированный стенограф украинской речи // Искусственный интеллект. 2008. № 4. С. 768–775.
Ронжин А.Л. Топологические особенности морфофонемного способа представления словаря для распознавания русской речи // Вестник компьютерных и информационных технологий. 2008.№ 9. С. 12–19.
Arisoy E., Dutagaci H., Arslan L.M. A unified language model for large vocabulary continuous speech recognition of Turkish // Signal Processing. 2006. Vol. 86, № 10. P. 2844– 2862.
Bolotova O., Gusev M., Smirnov V. Speech Recognition System for the Russian Speech // Proc. of 12th Intern. Conf. on Speech and Computer SPECOM. Moscow. Russia. 2007. P. 475–480.
Kanevsky D., Monkowski M., Sedivy J. Large Vocabulary Speaker-Independent Continuous Speech recognition in Russian Language // Proc. Intern. Workshop SPECOM’96. St.Petersburg. Russia. 1996. P. 117–121.
Kurimo M., Hirsimäki T., Turunen V.T., Virpioja S. et al. Unsupervised decomposition of words for speech recognition and retrieval // Proc. of 13th Intern. Conf. «Speech and Computer », SPECOM'2009. St. Petersburg. 2009. P. 23–28.
Nouza J., Silovsky J. Adapting Lexical and Language models for Transcription of Highly Spontaneous Spoken Czech / Eds. P. Sojka et al. // TSD 2010. LNAI 6231. Berlin-Heidelberg, 2010. P. 377–385.
Oparin I, Talanov A. Stem-Based Approach to Pronunciation Vocabulary Construction and Language Modeling for Russian // Proc. of 10th Intern. Conf. SPECOM, Patras, Greece, 2005. P. 575–578.
Psutka J., Ircing P., Psutka J.V., Hajič J. et al. Automatic Transcription of Czech, Russian, and Slovak Spontaneous Speech in the MALACH Project // Proc. of Eurospeech. Lisboa. Portugal. Sept. 4–8. 2005. P. 1349–1352.
Ragni A. Initial Experiments with Estonian Speech Recognition // Proc. of the 16th Nordic Conf. of Computational Linguistics NODALIDA-2007. Nivre J. et al. (Eds). Tartu. 2007. P. 249–252.
Stuker S., Schultz T. A grapheme Based Speech Recognition System for Russian // Proc. Intern. Conf. SPECOM'2004. St.Petersburg. Russia. 2004 P. 297–303.
Tarjan B., Mihajlik P. On Morph-Based LVCSR Improvements // Proc. of 2nd Intern. Workshop on Spoken Languages Technologies for Under-resourced Languages (SLTU-10). 2010. P. 10–16.
Whittaker E.W.D. Statistical Language Modelling for Automatic Speech Recognition of Russian and English. PhD thesis. Cambridge University. 2000, 140 p.
Карпов А.А., Ронжин А.Л., Ли И.В. SIRIUS — система дикторонезависимого рас- познавания слитной русской речи // Известия ТРТУ. 2005.№ 10. С. 44–53.
Кибкало А.А., Лотков М.М., Рогожкин И.Г., Туровец А.А. Разработка системы распознавания русской речи // Вопросы атомной науки и техники. Сер. Математическое моделирование физических процессов. 2003. Вып. 3. С. 8–20.
Пилипенко В.В. Распознавание дискретной и слитной речи из сверхбольших слова- рей на основе выборки информации из баз данных // Искусственный интеллект. 2006. № 3. С. 548–557.
Пилипенко В.В., Робейко В.В. Автоматизированный стенограф украинской речи // Искусственный интеллект. 2008. № 4. С. 768–775.
Ронжин А.Л. Топологические особенности морфофонемного способа представления словаря для распознавания русской речи // Вестник компьютерных и информационных технологий. 2008.№ 9. С. 12–19.
Arisoy E., Dutagaci H., Arslan L.M. A unified language model for large vocabulary continuous speech recognition of Turkish // Signal Processing. 2006. Vol. 86, № 10. P. 2844– 2862.
Bolotova O., Gusev M., Smirnov V. Speech Recognition System for the Russian Speech // Proc. of 12th Intern. Conf. on Speech and Computer SPECOM. Moscow. Russia. 2007. P. 475–480.
Kanevsky D., Monkowski M., Sedivy J. Large Vocabulary Speaker-Independent Continuous Speech recognition in Russian Language // Proc. Intern. Workshop SPECOM’96. St.Petersburg. Russia. 1996. P. 117–121.
Kurimo M., Hirsimäki T., Turunen V.T., Virpioja S. et al. Unsupervised decomposition of words for speech recognition and retrieval // Proc. of 13th Intern. Conf. «Speech and Computer », SPECOM'2009. St. Petersburg. 2009. P. 23–28.
Nouza J., Silovsky J. Adapting Lexical and Language models for Transcription of Highly Spontaneous Spoken Czech / Eds. P. Sojka et al. // TSD 2010. LNAI 6231. Berlin-Heidelberg, 2010. P. 377–385.
Oparin I, Talanov A. Stem-Based Approach to Pronunciation Vocabulary Construction and Language Modeling for Russian // Proc. of 10th Intern. Conf. SPECOM, Patras, Greece, 2005. P. 575–578.
Psutka J., Ircing P., Psutka J.V., Hajič J. et al. Automatic Transcription of Czech, Russian, and Slovak Spontaneous Speech in the MALACH Project // Proc. of Eurospeech. Lisboa. Portugal. Sept. 4–8. 2005. P. 1349–1352.
Ragni A. Initial Experiments with Estonian Speech Recognition // Proc. of the 16th Nordic Conf. of Computational Linguistics NODALIDA-2007. Nivre J. et al. (Eds). Tartu. 2007. P. 249–252.
Stuker S., Schultz T. A grapheme Based Speech Recognition System for Russian // Proc. Intern. Conf. SPECOM'2004. St.Petersburg. Russia. 2004 P. 297–303.
Tarjan B., Mihajlik P. On Morph-Based LVCSR Improvements // Proc. of 2nd Intern. Workshop on Spoken Languages Technologies for Under-resourced Languages (SLTU-10). 2010. P. 10–16.
Whittaker E.W.D. Statistical Language Modelling for Automatic Speech Recognition of Russian and English. PhD thesis. Cambridge University. 2000, 140 p.
Опубликован
2010-03-01
Как цитировать
Кипяткова, И. С., & Карпов, А. А. (2010). Аналитический обзор систем распознавания русской речи с большим словарем. Труды СПИИРАН, 1(12), 7-20. https://doi.org/10.15622/sp.12.1
Раздел
Статьи
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями:
Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале.
Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале.
Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).