Комплексный алгоритм объективной оценки качества декодированного речевого сигнала при действии акустических помех
Ключевые слова:
оценка качества речи, низкоскоростное кодирование, канал связи, акустическая помехаАннотация
Рассматриваются алгоритмы объективной оценки качества речи, основанные на измерении динамических и статических характеристик речевых сигналов на выходе кодека источника. Обоснована функциональная схема проведения экспериментальных исследований. Приведены результаты анализа корреляции объективной и субъективной оценки качества речи. Предложены модификации показателя объективной оценки качества на основе корреляции возбуждения спектра MESC и модификации показателя на основе вычисления функции ощущения спектральной динамики MFOSD. Предложен алгоритм формирования кривых регрессии, позволяющий выполнить преобразование объективной оценки к шкале субъективной оценки качества речи. На основании использования наиболее точных модификаций показателей оценки качества речи для восстановленных речевых сигналов предложен комплексный алгоритм объективной аппаратурной оценки качества речи при воздействии на микрофон широкополосных и низкочастотных стационарных и нестационарных акустических помех. Показано, что применение комплексного алгоритма позволяет получить объективную оценку качества речи согласно ГОСТ Р 50840-95 со средней ошибкой не более 0,35 балла при отношениях сигнал-шум от 30 дБ до -10 дБ.Литература
1. ГОСТ Р 50840-95. Передача речи по трактам связи // М.: Госстандарт России. 1995. 202 с.
2. ГОСТ Р 51061-97 «Системы низкоскоростной передачи речи по цифровым каналам // М.: Госстандарт России. 1997. 24 с.
3. Кропотов Ю.А., Ермолаев В.А. Моделирование и методы исследований акустических сигналов, шумов и помех в системах телекоммуникаций: монография // М. Берлин: Директ-Медиа. 2016. 251 с.
4. Цыбулин М.К., Бочаров М.О. Анализ методов оценки качества передачи речевой информации по каналам связи различной структуры // Электросвязь. 2008. № 11. С. 46–48.
5. Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи / под ред. О.И. Шелухина // М.: Радио и связь. 2000. 456 с.
6. Афанасьев А.А., Ильюшин М.В. Использование психоакустической модели слуха при разработке вокодеров с линейным предсказанием // Цифровая обработка сигналов. 2011. № 1. С. 49–52.
7. Мурадова А. А. Методы оценки качества передачи речевых пакетов при исследовании надежности сети NGN // Молодой ученый. 2013. № 10. С. 162–168.
8. Павловец А.Н., Петровский А.А. Использование закономерностей психоакустики в процедуре квантования параметров гармонической модели речевого сигнала // Речевые технологии. 2008. № 4. С. 55–60.
9. Yang W. Enhanced Modified Bark Spectral Distortion (EMBSD): An Objective Speech Quality Measure Based On Audible Distortion And Cognition Model // Temple University. 1999. 164 p.
10. Ozer H., Avcibas I., Sankur B., Memon N. Steganalysis of audio based on audio quality metrics, in: SPIE Electronic Imaging Conf. on Security and Watermarking of Multimedia Contents // Proceedings of SPIE. 2003. vol. 5020. pp. 55–66.
11. Liu W.M. et al. Assessment of objective quality measures for speech intelligibility estimation // 2006 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2006). 2006. vol. 1. pp. 699–702.
12. Соломенник А.И. и др. Оценка качества синтезированной речи: проблемы и решения // Изв. Вузов. Приборостроение. 2013. Т. 56. № 2. С. 38–42.
13. Столбов М.Б. Алгоритм оценки отношения сигнал/шум речевых сигналов // Научно-технический вестник информационных технологий, механики, оптики. 2012. № 6(82). С. 67–72.
14. Lee M-K, Kang H-G, Speech quality estimation of voice over internet protocol codec using a packet loss impairment model // J. Acoust. Soc. Am. 2013. vol. 134(5). pp. 438–444.
15. Beerends J.G. et al. Perceptual objective listening quality assessment (POLQA), the third generation ITU-T standard for end-to-end speech quality measurement part I—Temporal alignment // Journal of the Audio Engineering Society. 2013. vol. 61(6). pp. 366–384.
16. Hines A. et al. Robustness of speech quality metrics to background noise and network degradations: Comparing ViSQOL, PESQ and POLQA // 2013 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). 2013. pp. 3697–3701.
17. Möller S, Heusdens R, Objective estimation of speech quality for communication systems // Proc. of the IEEE. 2013. vol. 101(9). pp. 1955–1967.
18. Терехов А.Н., Рысин Ю.С. Алгоритм определения факторов, влияющих на качество восприятия телефонных услуг связи // Электросвязь. 2016. № 3. С. 65–68.
19. Počta P., Melvin H., Hines A. An analysis of the impact of playout delay adjustments introduced by voip jitter buffers on listening speech quality // Acta Acustica united with Acustica. 2015. no. 101(3). pp. 616–631.
20. Пирогов А. А. Вокодерная телефония // М.: Связь.1974. 536 с.
21. Соболев В.Н. Информационные технологии в синтетической акустике // М.: ИРИАС. 2007. 360 с.
22. Кириллов С.Н., Ромашкин Ю.Н., Картавенко Я.О., Дмитриев В.Т. Аналитическая оценки качества речи на выходе систем низкоскоростного кодирования при воздействии акустических помех // Речевые технологии. 2012. № 4. С. 16–23.
23. Кириллов С.Н., Дмитриев В.Т., Картавенко Я.О. Алгоритм объективной оценки качества декодированного речевого сигнала на основе изменения спектральной динамики критических полос спектра // Вестник РГРТУ. 2011. № 3(37). С. 3–7.
24. Илюшин М.В., Дмитриев В.Т., Басов О.О., Тарусов В.А. Качество передачи речи и его оценка: учебное пособие / под общ. ред. С.Н. Кириллова // Орел: Академия ФСО России. 2015. 104 с.
25. Цвикер Э., Фельдкеллер Р. Ухо как приемник информации: 2-е изд., перераб. и доп. // М.: Связь. 1971. 255 с.
2. ГОСТ Р 51061-97 «Системы низкоскоростной передачи речи по цифровым каналам // М.: Госстандарт России. 1997. 24 с.
3. Кропотов Ю.А., Ермолаев В.А. Моделирование и методы исследований акустических сигналов, шумов и помех в системах телекоммуникаций: монография // М. Берлин: Директ-Медиа. 2016. 251 с.
4. Цыбулин М.К., Бочаров М.О. Анализ методов оценки качества передачи речевой информации по каналам связи различной структуры // Электросвязь. 2008. № 11. С. 46–48.
5. Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи / под ред. О.И. Шелухина // М.: Радио и связь. 2000. 456 с.
6. Афанасьев А.А., Ильюшин М.В. Использование психоакустической модели слуха при разработке вокодеров с линейным предсказанием // Цифровая обработка сигналов. 2011. № 1. С. 49–52.
7. Мурадова А. А. Методы оценки качества передачи речевых пакетов при исследовании надежности сети NGN // Молодой ученый. 2013. № 10. С. 162–168.
8. Павловец А.Н., Петровский А.А. Использование закономерностей психоакустики в процедуре квантования параметров гармонической модели речевого сигнала // Речевые технологии. 2008. № 4. С. 55–60.
9. Yang W. Enhanced Modified Bark Spectral Distortion (EMBSD): An Objective Speech Quality Measure Based On Audible Distortion And Cognition Model // Temple University. 1999. 164 p.
10. Ozer H., Avcibas I., Sankur B., Memon N. Steganalysis of audio based on audio quality metrics, in: SPIE Electronic Imaging Conf. on Security and Watermarking of Multimedia Contents // Proceedings of SPIE. 2003. vol. 5020. pp. 55–66.
11. Liu W.M. et al. Assessment of objective quality measures for speech intelligibility estimation // 2006 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2006). 2006. vol. 1. pp. 699–702.
12. Соломенник А.И. и др. Оценка качества синтезированной речи: проблемы и решения // Изв. Вузов. Приборостроение. 2013. Т. 56. № 2. С. 38–42.
13. Столбов М.Б. Алгоритм оценки отношения сигнал/шум речевых сигналов // Научно-технический вестник информационных технологий, механики, оптики. 2012. № 6(82). С. 67–72.
14. Lee M-K, Kang H-G, Speech quality estimation of voice over internet protocol codec using a packet loss impairment model // J. Acoust. Soc. Am. 2013. vol. 134(5). pp. 438–444.
15. Beerends J.G. et al. Perceptual objective listening quality assessment (POLQA), the third generation ITU-T standard for end-to-end speech quality measurement part I—Temporal alignment // Journal of the Audio Engineering Society. 2013. vol. 61(6). pp. 366–384.
16. Hines A. et al. Robustness of speech quality metrics to background noise and network degradations: Comparing ViSQOL, PESQ and POLQA // 2013 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). 2013. pp. 3697–3701.
17. Möller S, Heusdens R, Objective estimation of speech quality for communication systems // Proc. of the IEEE. 2013. vol. 101(9). pp. 1955–1967.
18. Терехов А.Н., Рысин Ю.С. Алгоритм определения факторов, влияющих на качество восприятия телефонных услуг связи // Электросвязь. 2016. № 3. С. 65–68.
19. Počta P., Melvin H., Hines A. An analysis of the impact of playout delay adjustments introduced by voip jitter buffers on listening speech quality // Acta Acustica united with Acustica. 2015. no. 101(3). pp. 616–631.
20. Пирогов А. А. Вокодерная телефония // М.: Связь.1974. 536 с.
21. Соболев В.Н. Информационные технологии в синтетической акустике // М.: ИРИАС. 2007. 360 с.
22. Кириллов С.Н., Ромашкин Ю.Н., Картавенко Я.О., Дмитриев В.Т. Аналитическая оценки качества речи на выходе систем низкоскоростного кодирования при воздействии акустических помех // Речевые технологии. 2012. № 4. С. 16–23.
23. Кириллов С.Н., Дмитриев В.Т., Картавенко Я.О. Алгоритм объективной оценки качества декодированного речевого сигнала на основе изменения спектральной динамики критических полос спектра // Вестник РГРТУ. 2011. № 3(37). С. 3–7.
24. Илюшин М.В., Дмитриев В.Т., Басов О.О., Тарусов В.А. Качество передачи речи и его оценка: учебное пособие / под общ. ред. С.Н. Кириллова // Орел: Академия ФСО России. 2015. 104 с.
25. Цвикер Э., Фельдкеллер Р. Ухо как приемник информации: 2-е изд., перераб. и доп. // М.: Связь. 1971. 255 с.
Опубликован
2018-02-02
Как цитировать
Кириллов, С. Н., & Дмитриев, В. Т. (2018). Комплексный алгоритм объективной оценки качества декодированного речевого сигнала при действии акустических помех. Труды СПИИРАН, 1(56), 34-55. https://doi.org/10.15622/sp.56.2
Раздел
Искусственный интеллект, инженерия данных и знаний
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями:
Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале.
Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале.
Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).