Применение лингвистических признаков для автоматического определения интонационно выделенных слов в русскоязычном тексте
Ключевые слова:
интонационное выделение, просодия, лексический анализ, синтаксический анализ, байесовский классификатор, метод максимальной энтропии, условные случайные поля, русский языкАннотация
В данной статье предлагается метод автоматического предсказания интонационно выделенных слов, то есть наиболее важной информации в высказывании. Метод опирается на использование лексических, грамматических и синтаксических маркеров интонационного выделения, что делает возможным его применение в системах синтеза речи по тексту, где реализация интонационного выделения может повысить естественность звучания синтезированной речи. В качестве методов классификации независимо друг от друга использовалось несколько различных моделей: наивная байесовская модель, модель максимальной энтропии и условные случайные поля. Сопоставление результатов, полученных в ходе нескольких экспериментов, показало, что использовавшиеся дискриминативные модели демонстрируют сбалансированные и примерно равные значения метрик качества, в то время как генеративная модель потенциально более пригодна для поиска интонационно выделенных слов в речевом сигнале. Результаты, представленные в статье, сравнимы и в некоторых случаях превосходят аналогичные системы, разработанные для других языков.Литература
1. Strom V. et al. Modelling Prominence and Emphasis Improves Unit-Selection Synthesis // Proceedings of Interspeech 2008. 2008.
2. Brenier J., Cer D., Jurafsky D. The detection of emphatic words using acoustic and lexical features // Ninth European Conference on Speech Communication and Technology (ICSLP’2005). 2005.
3. Nakajima H., Mizuno H., Sakauchi S. Emphasized Accent Phrase Prediction from Text for Advertisement Text-To-Speech Synthesis // 28th Pacific Asia Conference on Language, Information and Computation (PACLIC’2014). 2014. pp. 170–177.
4. Hovy D. et al. Analysis and Modeling of “Focus” in Context // Proceedings of Interspeech 2013. 2013. pp. 402–406.
5. Mishra T., Sridhar V.K.R., Conkie A. Word Prominence Detection using Robust yet Simple Prosodic Features // Proceedings of Interspeech 2012. 2012.
6. Cernak M., Honnet P.E. An empirical model of emphatic word detection // Proceedings of Interspeech 2015. 2015. pp. 573–577.
7. Tamburini F. Automatic detection of prosodic prominence by means of acoustic analyses // Lingue e linguaggio. 2015. vol. 14. no. 1. pp. 131–148.
8. Johnson D.O., Kang O. Automatic prominent syllable detection with machine learning classifiers // International Journal of Speech Technology. 2015. vol. 18. no. 4. pp. 583–592.
9. Suni A., Aalto D., Vainio M. Hierarchical representation of prosody for statistical speech synthesis // Computer Speech and Language Journal. 2017. vol. 45. pp. 123–136.
10. Heckmann M. Audio-visual word prominence detection from clean and noisy speech // Computer Speech & Language. 2018. vol. 48. pp. 15–30.
11. Николаева Т.М. Семантика акцентного выделения // М.: Наука. 1982. 106 с.
12. Кодзасов С.В. Законы фразовой акцентуации // Просодический строй русской речи. М.: Институт русского языка РАН. 1996. С. 181–206.
13. Ковтунова И.И. Современный русский язык. Порядок слов и актуальное членение предложения // М.: Едиториал УРСС. 2002. 240 с.
14. Слюсарь Н.А. На стыке теорий. Грамматика и информационная структура в русском и других языках // Либроком. 2009. 416 с.
15. Luchkina T., Ionin T. The effect of prosody on availability of inverse scope in Russian // Formal Approaches to Slavic Linguistics. 2015. vol. 23. pp. 418-437.
16. Andor D. et al. Globally normalized transition-based neural networks // Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics. 2016. vol. 1. pp. 2442–2452.
17. Alberti C. et al. SyntaxNet Models for the CoNLL 2017 Shared Task // arXiv preprint arXiv: 1703.04929. 2017.
18. Nivre J., Boguslavsky I., Iomdin L. Parsing the SynTagRus Treebank of Russian // Proceedings of the 22nd International Conference on Computational Linguistics (CoLING’2008). 2008. vol. 2. pp. 641–648.
19. Nivre J.et al. Universal Dependencies v1: A multilingual treebank collection // Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC’2016). 2016.
20. Korobov M. Morphological Analyzer and Generator for Russian and Ukrainian Languages // International Conference on Analysis of Images, Social Networks and Texts (AIST’2015). 2015. pp. 320–332.
21. McCallum A., Nigam K. A comparison of event models for Naive Bayes text classification // Proceedings of AAAI/ICML Workshop on Learning for Text Categorization. 1998. pp. 41–48.
22. Bird S., Klein E., Loper E. Natural Language Processing with Python // O'Reilly Media, Inc. 2009. 504 p.
23. Berger A., Pietra V., Pietra S. A Maximum Entropy Approach to Natural Language Processing // Computational Linguistics. 1996. vol. 22. no. 1. pp. 39–71.
24. Collobert R. et al. Natural language processing (almost) from scratch // Journal of Machine Learning Research. 2011. vol. 12. no. Aug. pp. 2493–2537.
25. Kudo T. CRF++: Yet Another CRF Toolkit. 2013. URL: https://taku910.github.io/crfpp (дата обращения: 15.09.2017).
26. Skrelin P. et al. CORPRES - Corpus of Russian Professionally Read Speech // 13th International Conference Text, Speech and Dialogue (TSD’2010). 2010. pp. 392–399.
2. Brenier J., Cer D., Jurafsky D. The detection of emphatic words using acoustic and lexical features // Ninth European Conference on Speech Communication and Technology (ICSLP’2005). 2005.
3. Nakajima H., Mizuno H., Sakauchi S. Emphasized Accent Phrase Prediction from Text for Advertisement Text-To-Speech Synthesis // 28th Pacific Asia Conference on Language, Information and Computation (PACLIC’2014). 2014. pp. 170–177.
4. Hovy D. et al. Analysis and Modeling of “Focus” in Context // Proceedings of Interspeech 2013. 2013. pp. 402–406.
5. Mishra T., Sridhar V.K.R., Conkie A. Word Prominence Detection using Robust yet Simple Prosodic Features // Proceedings of Interspeech 2012. 2012.
6. Cernak M., Honnet P.E. An empirical model of emphatic word detection // Proceedings of Interspeech 2015. 2015. pp. 573–577.
7. Tamburini F. Automatic detection of prosodic prominence by means of acoustic analyses // Lingue e linguaggio. 2015. vol. 14. no. 1. pp. 131–148.
8. Johnson D.O., Kang O. Automatic prominent syllable detection with machine learning classifiers // International Journal of Speech Technology. 2015. vol. 18. no. 4. pp. 583–592.
9. Suni A., Aalto D., Vainio M. Hierarchical representation of prosody for statistical speech synthesis // Computer Speech and Language Journal. 2017. vol. 45. pp. 123–136.
10. Heckmann M. Audio-visual word prominence detection from clean and noisy speech // Computer Speech & Language. 2018. vol. 48. pp. 15–30.
11. Николаева Т.М. Семантика акцентного выделения // М.: Наука. 1982. 106 с.
12. Кодзасов С.В. Законы фразовой акцентуации // Просодический строй русской речи. М.: Институт русского языка РАН. 1996. С. 181–206.
13. Ковтунова И.И. Современный русский язык. Порядок слов и актуальное членение предложения // М.: Едиториал УРСС. 2002. 240 с.
14. Слюсарь Н.А. На стыке теорий. Грамматика и информационная структура в русском и других языках // Либроком. 2009. 416 с.
15. Luchkina T., Ionin T. The effect of prosody on availability of inverse scope in Russian // Formal Approaches to Slavic Linguistics. 2015. vol. 23. pp. 418-437.
16. Andor D. et al. Globally normalized transition-based neural networks // Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics. 2016. vol. 1. pp. 2442–2452.
17. Alberti C. et al. SyntaxNet Models for the CoNLL 2017 Shared Task // arXiv preprint arXiv: 1703.04929. 2017.
18. Nivre J., Boguslavsky I., Iomdin L. Parsing the SynTagRus Treebank of Russian // Proceedings of the 22nd International Conference on Computational Linguistics (CoLING’2008). 2008. vol. 2. pp. 641–648.
19. Nivre J.et al. Universal Dependencies v1: A multilingual treebank collection // Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC’2016). 2016.
20. Korobov M. Morphological Analyzer and Generator for Russian and Ukrainian Languages // International Conference on Analysis of Images, Social Networks and Texts (AIST’2015). 2015. pp. 320–332.
21. McCallum A., Nigam K. A comparison of event models for Naive Bayes text classification // Proceedings of AAAI/ICML Workshop on Learning for Text Categorization. 1998. pp. 41–48.
22. Bird S., Klein E., Loper E. Natural Language Processing with Python // O'Reilly Media, Inc. 2009. 504 p.
23. Berger A., Pietra V., Pietra S. A Maximum Entropy Approach to Natural Language Processing // Computational Linguistics. 1996. vol. 22. no. 1. pp. 39–71.
24. Collobert R. et al. Natural language processing (almost) from scratch // Journal of Machine Learning Research. 2011. vol. 12. no. Aug. pp. 2493–2537.
25. Kudo T. CRF++: Yet Another CRF Toolkit. 2013. URL: https://taku910.github.io/crfpp (дата обращения: 15.09.2017).
26. Skrelin P. et al. CORPRES - Corpus of Russian Professionally Read Speech // 13th International Conference Text, Speech and Dialogue (TSD’2010). 2010. pp. 392–399.
Опубликован
2017-12-04
Как цитировать
Кочаров, Д. А., & Меньшикова, А. П. (2017). Применение лингвистических признаков для автоматического определения интонационно выделенных слов в русскоязычном тексте. Труды СПИИРАН, 6(55), 216-236. https://doi.org/10.15622/sp.55.9
Раздел
Алгоритмы и программные средства
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями:
Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале.
Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале.
Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).