Системы query-by-humming: обзор подходов и схема платформы для экспериментов
Аннотация
В работе даётся обзор существующих систем query-by-humming (поиска музыкальных композиций по напетому пользователем фрагменту), использующих извлечение признаков. Кроме того, даётся полное описание наиболее популярных методов извлечения признаков (CENS и MFCC), а также предлагается схема системы для проведения экспериментов, направленных на сравнение разных наборов признаков, методов построения словаря, индексации и поиска.Литература
Abramowitz M., Stegun I. A. Handbook of Mathematical Functions. Dover Publications, 1972.
Beranek L. L. Acoustics. Acoustical Society of America, 1993.
Bosma M., Veltkamp R. C., Wiering F. A framework for the comparison of Music Information Retrieval methods // Proceedings of the ICMPC. 2006. P. 1297–1303.
Burns E. M. Intervals, Scales, and Tuning // The Psychology of Music / Ed. by D. Deutsch. Academic Press, 1999. P. 215-264.
Clausen M., Kurth F. A Unified Approach to Content-Based and Fault Tolerant Music Identification // CW '02: Proceedings of the First International Symposium on Cyber Worlds (CW'02). Washington, DC, USA: IEEE Computer Society, 2002. P. 56.
Crawford T., Iliopoulus C. S., Raman R. String-Matching Techniques for Musical Similarity and Melodic Recognition // Computing in Musicology. 1998. Vol. 11. P. 73–100.
Dannenberg R. B., Birmingham W. P., Tzanetakis G. P., Meek C. P., Hu N. P., Pardo B. P. The MUSART Testbed for Query-by-Humming Evaluation // Computer Music Journal. 2004. Vol. 28, N. 2. P. 34–48.
Deller J. R., Proakis J. G., Hansen J. H. L. Discrete-time processing of speech signals. IEEE Computer Society Press, 1999.
Doraisamy S., Ruger S. Robust Polyphonic Music Retrieval with N-grams // Journal of Intelligent Information Systems. 2003. Vol. 21, N. 1. P. 53–70.
Downie J. S. Evaluating a Simple Approach to Music Information Retrieval: Conceiving Melodic NGrams as Text: Ph.D. thesis / University of Western Ontario. Canada, 1999.
Ghias A., Logan J., Chamberlin D., Smith B. C. Query by humming: musical information retrieval in an audio database // MULTIMEDIA '95: Proceedings of the third ACM international conference on Multimedia. New York, NY, USA: ACM, 1995. P. 231–236.
Gustafsson F. Determining the initial states in forward-backward filtering // IEEE Transactions on Signal Processing. 1996. Vol. 46. P. 988–992.
Hanna P., Robine M., Ferraro P., Allali J. Improvements of Alignment Algorithms for Polyphonic Music Retrieval // Computer Music Modeling and Retrieval 2008. Copenhagen, Denmark: 2008. P. 244–251.
Huang X., Acero A., Hon H.-W. Spoken Language Processing: a guide to theory, algorithm, and system development. Prentice Hall, 2001. 980 p.
Kurth F., Muller M. Efficient Index-Based Audio Matching // IEEE Transactions on Audio, Speech, and Language Processing. February 2008. Vol. 16, N. 2. P. 382–395.
Lau E., Ding A., Calvin, J. MusicDB: A Query by Humming System. Final Project Report, Massachusetts Institute of Technology. 2005.
Linde Y., Buzo A., Gray R. An Algorithm for Vector Quantizer Design // IEEE Transactions on Communications. 1980. Vol. 28. P. 84–94.
Muller M. Information Retrieval for Music and Motion. Springer-Verlag, 2007.
Orfanidis S. J. Lecture notes on elliptic filter design. http://www.ece.rutgers.edu/ orfanidi/ece521/. 2007.
Parsons D. The Directory of Tunes and Musical Themes. S. Brown, 1975.
Pauws S. CubyHum: a fully operational ``query by humming'' system // Proceedings of the 3rd International Conference on Music Information Retrieval (ISMIR'02). 2002.
Pickens J., Crawford T. Harmonic models for polyphonic music retrieval // CIKM '02: Proceedings of the eleventh international conference on Information and knowledge management. New York, NY, USA: ACM, 2002. P. 430–437.
Proakis J. G., Manolakis D. G. Signal Processing: Principles, Algorithms, and Applications. Prentice Hall, 1995.
Robine M., Hanna P., Ferraro P. Music Similarity: Improvements of Edit-based Algorithms by Considering Music Theory // Proceedings of the ACM SIGMM International Workshop on Multimedia Information Retrieval (MIR). Augsburg, Germany: 2007. P. 135–141.
Typke R. Music Retrieval based on Melodic Similarity. Rainer Typke, 2007.
Typke R., Wiering F., Veltkamp R. C. A survey on music information retrieval systems // Proceedings of the International Conference on Music Information Retrieval. 2005. P. 153–160.
Uitdenbogerd A. L., Zobel J. Manipulation of music for melody matching // MULTIMEDIA '98: Proceedings of the sixth ACM international conference on Multimedia. New York, NY, USA: ACM, 1998. P. 235–240.
Wolfson H., Rigoutsos I. Geometric hashing: An overview // IEEE Transactions on Computational Science and Engineering. 1997. Vol. 4, N. 4. P. 10–21.
Zhu Y., Shasha D. Query by humming: a time series database approach // Proceedings of the ACM SIGMOD/PODS. 2003.
Zwislocki J. J. Sensory Neuroscience: Four Laws of Psychophysics. Springer, 2009. 174 p.
Beranek L. L. Acoustics. Acoustical Society of America, 1993.
Bosma M., Veltkamp R. C., Wiering F. A framework for the comparison of Music Information Retrieval methods // Proceedings of the ICMPC. 2006. P. 1297–1303.
Burns E. M. Intervals, Scales, and Tuning // The Psychology of Music / Ed. by D. Deutsch. Academic Press, 1999. P. 215-264.
Clausen M., Kurth F. A Unified Approach to Content-Based and Fault Tolerant Music Identification // CW '02: Proceedings of the First International Symposium on Cyber Worlds (CW'02). Washington, DC, USA: IEEE Computer Society, 2002. P. 56.
Crawford T., Iliopoulus C. S., Raman R. String-Matching Techniques for Musical Similarity and Melodic Recognition // Computing in Musicology. 1998. Vol. 11. P. 73–100.
Dannenberg R. B., Birmingham W. P., Tzanetakis G. P., Meek C. P., Hu N. P., Pardo B. P. The MUSART Testbed for Query-by-Humming Evaluation // Computer Music Journal. 2004. Vol. 28, N. 2. P. 34–48.
Deller J. R., Proakis J. G., Hansen J. H. L. Discrete-time processing of speech signals. IEEE Computer Society Press, 1999.
Doraisamy S., Ruger S. Robust Polyphonic Music Retrieval with N-grams // Journal of Intelligent Information Systems. 2003. Vol. 21, N. 1. P. 53–70.
Downie J. S. Evaluating a Simple Approach to Music Information Retrieval: Conceiving Melodic NGrams as Text: Ph.D. thesis / University of Western Ontario. Canada, 1999.
Ghias A., Logan J., Chamberlin D., Smith B. C. Query by humming: musical information retrieval in an audio database // MULTIMEDIA '95: Proceedings of the third ACM international conference on Multimedia. New York, NY, USA: ACM, 1995. P. 231–236.
Gustafsson F. Determining the initial states in forward-backward filtering // IEEE Transactions on Signal Processing. 1996. Vol. 46. P. 988–992.
Hanna P., Robine M., Ferraro P., Allali J. Improvements of Alignment Algorithms for Polyphonic Music Retrieval // Computer Music Modeling and Retrieval 2008. Copenhagen, Denmark: 2008. P. 244–251.
Huang X., Acero A., Hon H.-W. Spoken Language Processing: a guide to theory, algorithm, and system development. Prentice Hall, 2001. 980 p.
Kurth F., Muller M. Efficient Index-Based Audio Matching // IEEE Transactions on Audio, Speech, and Language Processing. February 2008. Vol. 16, N. 2. P. 382–395.
Lau E., Ding A., Calvin, J. MusicDB: A Query by Humming System. Final Project Report, Massachusetts Institute of Technology. 2005.
Linde Y., Buzo A., Gray R. An Algorithm for Vector Quantizer Design // IEEE Transactions on Communications. 1980. Vol. 28. P. 84–94.
Muller M. Information Retrieval for Music and Motion. Springer-Verlag, 2007.
Orfanidis S. J. Lecture notes on elliptic filter design. http://www.ece.rutgers.edu/ orfanidi/ece521/. 2007.
Parsons D. The Directory of Tunes and Musical Themes. S. Brown, 1975.
Pauws S. CubyHum: a fully operational ``query by humming'' system // Proceedings of the 3rd International Conference on Music Information Retrieval (ISMIR'02). 2002.
Pickens J., Crawford T. Harmonic models for polyphonic music retrieval // CIKM '02: Proceedings of the eleventh international conference on Information and knowledge management. New York, NY, USA: ACM, 2002. P. 430–437.
Proakis J. G., Manolakis D. G. Signal Processing: Principles, Algorithms, and Applications. Prentice Hall, 1995.
Robine M., Hanna P., Ferraro P. Music Similarity: Improvements of Edit-based Algorithms by Considering Music Theory // Proceedings of the ACM SIGMM International Workshop on Multimedia Information Retrieval (MIR). Augsburg, Germany: 2007. P. 135–141.
Typke R. Music Retrieval based on Melodic Similarity. Rainer Typke, 2007.
Typke R., Wiering F., Veltkamp R. C. A survey on music information retrieval systems // Proceedings of the International Conference on Music Information Retrieval. 2005. P. 153–160.
Uitdenbogerd A. L., Zobel J. Manipulation of music for melody matching // MULTIMEDIA '98: Proceedings of the sixth ACM international conference on Multimedia. New York, NY, USA: ACM, 1998. P. 235–240.
Wolfson H., Rigoutsos I. Geometric hashing: An overview // IEEE Transactions on Computational Science and Engineering. 1997. Vol. 4, N. 4. P. 10–21.
Zhu Y., Shasha D. Query by humming: a time series database approach // Proceedings of the ACM SIGMOD/PODS. 2003.
Zwislocki J. J. Sensory Neuroscience: Four Laws of Psychophysics. Springer, 2009. 174 p.
Опубликован
2008-04-01
Как цитировать
Балтийский, & Николенко,. (2008). Системы query-by-humming: обзор подходов и схема платформы для экспериментов. Труды СПИИРАН, (7), 75-92. https://doi.org/10.15622/sp.7.8
Выпуск
Раздел
Статьи
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями:
Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале.
Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале.
Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).