Проектирование систем речевого диалога
Аннотация
Проектирование диалоговых систем охватывает ряд сложных проблем, таких как обработка речевого сигнала, семантический анализ, понимание смысла речи, управление диалогом, синтез речи и другие. Особое место среди них занимает проблема оптимизации управления диалогом, поскольку в свою очередь включает в себя комплекс задач, связанных с выбором модели диалога, разработкой методов управления диалогом и их обучением. В данной статье рассматриваются основные проблемы проектирования диалоговых систем, а также представлен краткий обзор современных систем речевого диалога.Литература
Ронжин А Л, Карпов А. А. Многомодальные интерфейсы: основные принципы и когнитивные аспекты // Труды СПИИРАН. Вып. 3, т. 1. СПб.: Наука, 2006. [В этом же томе].
Bengios S. Multimodal Speech Processing Using Asynchronous Hidden Markov Models // Information Fusion. 2004. P.81–89.
Pietquin O. A Framework for Unsupervised Learning of Dialogue Strategies. UCL presses, 2004. 246 p.
Levin E., Pieraccini R. A Stochastic Model of Computer-Human Interaction for Learning Dialogue Strategies // Proc. of the 5 European Conference on Speech Technologies (Eurospeech’ 97). Rhodes, Greece, 1997. P. 1883–1886.
Smith R , Hipp R, and Alan W. Biermann. A Dialog Control Algorithm and Its Performance / Bates, Madeleine and Oliviero Stock (eds.) // Third Conference on Applied Natural Language Processing, 31 March -3 April 1992. P. 9–16.
Mclnnes F., Nairn I., Attwater D., Edgington M., Jack M. A Comparison of Confirmation Strategies for Fluent Telephone Dialogues // Proceedings of the 17th International Symposium on Human Factors in Telecommunication (HFT’99). 1999. P. 81–89.
Williams G., Renals S. Confidence Measures for Hybrid HMM/ANN Speech Recognition // Proceedings of the 5th European Conference on Speech Technology, (Eurospeech’97) Rhodes, 1997. P. 1955–1958.
Komatani K., Kawahara T. Generating Effective Confirmation and Guidance Using Two-level Confidence Measures for Dialogue Systems // Proceedings of the 8th International Conference on Spoken Language Processing (ICSLP’00). 2000. Vol.2. P. 648–651.
Bouwman G., Sturm J., Boves L. Incorporating Confidence Measures in the Dutch Train Timetable Information System Developed in the ARISE project // Proceedings of the International Conference on Avoustics, Speech and Signal Processing (ICASSP), 1999. Vol.1. P. 493–496.
Rabiner L. R. Applications of Speech Recognition in the Area of Telecommunications // 1997 IEEE Workshop on Automatic Speech Recognition and Understanding Proceedings, 1997. P. 501–510.
Иванова Т. И. Компьютерные технологии в телефонии. М: Эко-Трендз, 2002. 300 c.
Крестьянинов С. В. Интеллектуальные сети и компьютерная телефония. М.: Радио и связь, 2001. 238 c.
Pedersen C. F., et. al. Analysis and Design of a PN based Health Care Service for Diabetics // Proceedings of workshop on "My Personal Adaptive Global NET: Visions and beyond", Shanghai China November, 2004. Compact disc proceedings.
Gemo M., Kitney R. Medical applications. Similar Dreams. Multimodal Interfaces in Our Future Life. presses universitaires de Louvan, 2005. P.63–75.
Hardy H., Strzalkowski T. and Wu M. Dialogue Management for an Automated Multilingual Call Center // Proceedings of HLT-NAACL 2003 Workshop: Research Directions in Dialogue Processing, Edmonton, Canada, June 2003. P. 10–12.
Seneff S. and Polifroni J. Dialogue Management in the MERCURY Flight Reservation System // Proc. ANLP-NAACL 2000 Satellite Workshop, Seattle, May 2000. P. 1–6.
Bengios S. Multimodal Speech Processing Using Asynchronous Hidden Markov Models // Information Fusion. 2004. P.81–89.
Pietquin O. A Framework for Unsupervised Learning of Dialogue Strategies. UCL presses, 2004. 246 p.
Levin E., Pieraccini R. A Stochastic Model of Computer-Human Interaction for Learning Dialogue Strategies // Proc. of the 5 European Conference on Speech Technologies (Eurospeech’ 97). Rhodes, Greece, 1997. P. 1883–1886.
Smith R , Hipp R, and Alan W. Biermann. A Dialog Control Algorithm and Its Performance / Bates, Madeleine and Oliviero Stock (eds.) // Third Conference on Applied Natural Language Processing, 31 March -3 April 1992. P. 9–16.
Mclnnes F., Nairn I., Attwater D., Edgington M., Jack M. A Comparison of Confirmation Strategies for Fluent Telephone Dialogues // Proceedings of the 17th International Symposium on Human Factors in Telecommunication (HFT’99). 1999. P. 81–89.
Williams G., Renals S. Confidence Measures for Hybrid HMM/ANN Speech Recognition // Proceedings of the 5th European Conference on Speech Technology, (Eurospeech’97) Rhodes, 1997. P. 1955–1958.
Komatani K., Kawahara T. Generating Effective Confirmation and Guidance Using Two-level Confidence Measures for Dialogue Systems // Proceedings of the 8th International Conference on Spoken Language Processing (ICSLP’00). 2000. Vol.2. P. 648–651.
Bouwman G., Sturm J., Boves L. Incorporating Confidence Measures in the Dutch Train Timetable Information System Developed in the ARISE project // Proceedings of the International Conference on Avoustics, Speech and Signal Processing (ICASSP), 1999. Vol.1. P. 493–496.
Rabiner L. R. Applications of Speech Recognition in the Area of Telecommunications // 1997 IEEE Workshop on Automatic Speech Recognition and Understanding Proceedings, 1997. P. 501–510.
Иванова Т. И. Компьютерные технологии в телефонии. М: Эко-Трендз, 2002. 300 c.
Крестьянинов С. В. Интеллектуальные сети и компьютерная телефония. М.: Радио и связь, 2001. 238 c.
Pedersen C. F., et. al. Analysis and Design of a PN based Health Care Service for Diabetics // Proceedings of workshop on "My Personal Adaptive Global NET: Visions and beyond", Shanghai China November, 2004. Compact disc proceedings.
Gemo M., Kitney R. Medical applications. Similar Dreams. Multimodal Interfaces in Our Future Life. presses universitaires de Louvan, 2005. P.63–75.
Hardy H., Strzalkowski T. and Wu M. Dialogue Management for an Automated Multilingual Call Center // Proceedings of HLT-NAACL 2003 Workshop: Research Directions in Dialogue Processing, Edmonton, Canada, June 2003. P. 10–12.
Seneff S. and Polifroni J. Dialogue Management in the MERCURY Flight Reservation System // Proc. ANLP-NAACL 2000 Satellite Workshop, Seattle, May 2000. P. 1–6.
Опубликован
2006-02-01
Как цитировать
Ли, & Ронжин,. (2006). Проектирование систем речевого диалога. Труды СПИИРАН, 1(3), 320-338. https://doi.org/10.15622/sp.3.19
Раздел
Статьи
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями:
Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале.
Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале.
Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).