Графическая вероятностная модель для оценки схожести гармонии музыкальных произведений
Ключевые слова:
информационный поиск музыки, рекомендательные системы, гармония, оценка схожести, графические модели, вероятностные моделиАннотация
Методы оценки схожести музыкальных произведений позволяют реализовать полностью автоматическую рекомендательную систему для музыки, ориентированную на содержание (наподобие Pandora, но без ручного труда экспертов-музыковедов). В статье предлагается новый метод оценки схожести гармонии композиций на основе оригинальной графической вероятностной модели. Модель включает в себя информацию об аккорде и ладе для некоторого момента времени звучания композиции; мы вводим скрытую переменную, стиль, от которой зависит вероятность использования определенного аккорда в контексте определенного лада, и предлагаем сравнивать композиции как векторы-параметры распределений для стилей. По аналогии с некоторыми методами извлечения аккордов рассматриваемая модель не включает ни ритмическую информацию, ни зависимости между соседними аккордами. Описывается реализация модели в системе Infer.NET и осуществляется проверка модели на искусственных данных. Результат работы на реальных данных отрицателен, что свидетельствует о том, что простые модели не подходят для задачи оценки схожести.Литература
Allan H., Mullensiefen D., Wiggins G. Methodological Considerations In Studies Of Musical Similarity // Proceedings of the International Conference on Music Information Retrieval (ISMIR 2007) (Vienna, Austria, September 23–27, 2007) URL: http://ismir2007.ismir.net/proceedings/ISMIR2007_p473_allan.pdf
Anderson C. The Long Tail: Why the Future of Business Is Selling Less of More. New York: Hyperion, 2006. 256 pp.
Bas de Haas W., Veltkamp R., Wiering F. Tonal Pitch Step Distance: a Similarity Measure for Chord Progressions // Proceedings of the Ninth International Conference on Music Information Retrieval (ISMIR 2008) (Philadelphia, Pennsylvania, September 14–18, 2008) Pp. 51–56.
Bishop C. Pattern Recognition and Machine Learning. Springer, 2006. 738 pp.
Cano P., Koppenberger M., Wack N. Content-based music audio recommendation // Proceedingsof the 13th annual ACM international conference on Multimedia (MULTIMEDIA’ 05) (Singapore, November 6–11, 2005). Pp. 211–212.
Castelluccio M. The Music Genome Project // Strategic Finance. 2006. № 88 (6). Pp. 57–58.
Fink, D. A Compendium of Conjugate Priors. URL: http://www.johndcook.com/CompendiumOfConjugatePriors.pdf.
Harte C., Sandler M., Abdalla, S., Gomez E. Symbolic Representation of Musical Chords: A Proposed Syntax for Text Annotations // In J. Reiss & G. Wiggins (Eds.), Proceedings of the Sixth International Conference on Music Information Retrieval (ISMIR 2005) (London, UK, September 11–15, 2005). London, UK: University of London, 2005. Pp. 312–319.
Amazon.com: Online Shopping for Electronics, Apparel, Computers, Books, DVDs & more. URL: http://amazon.com
List of The Beatles songs // Википедия. [2011—2011]. Дата обновления: 11.11.2011. URL: http://en.wikipedia.org/w/index.php?title=List_of_The_Beatles_songs&oldid=460172268
Reference Annotations: The Beatles. URL: http://isophonics.net/content/referenceannotations-beatles
Million Song Dataset. URL: http://labrosa.ee.columbia.edu/millionsong/
Last.fm - Listen to internet radio and the largest music catalogue online. URL: http://last.fm
Pandora Radio — Listen to Free Internet Audio, Find New Music.URL: http://pandora.com
Apple - iTunes - Everything you need to be entertained. URL: http://www.apple.com/itunes/
Secrets of The Beatles // SeeChord. URL: http://www.seechord.co.uk/song-writing/secretsof-the-beatles/
Anderson C. The Long Tail // Журнал Wired: [сайт]. URL: http://www.wired.com/wired/archive/12.10/tail.html
Netflix - Watch TV Shows Online, Watch Movies Online. URL: https://www.netflix.com/
Joyce J. Pandora and the Music Genome Project / Scientific Computing. 2006. № 23 (10). Pp. 14, 40–41.
Krumhansl C. Cognitive Foundations of Musical Pitch. New York: Oxford University Press, 1990. 318 pp.
Krumhansl C., Shepard R. Quantification of the hierarchy of tonal functions within a diatonic context // Journal of Experimental Psychology: Human Perception and Performance. 1979. № 5. Pp. 579–594.
Minka T. Expectation propagation for approximate Bayesian inference // In Breese, Jack S. And Koller, Daphne (eds.), Proceedings of the 17th Conference on Uncertainty in Artificial Intelligence (Seattle, WA, August 2–5, 2001). Massachusetts: Morgan Kaufmann, 2001. Pp. 362–369.
Minka T., Winn J., Guiver J., Knowles D. Infer.NET 2.4, Microsoft Research Cambridge, 2010. URL: http://research.microsoft.com/infernet
Muller M. Information Retrieval for Music and Motion. Berlin: Springer-Verlag, 2007. 334 pp.
Pickens J., Crawford T. Harmonic Models for Polyphonic Music Retrieval // Proceedings of International Conference on Information and Knowledge Management (CIKM 2002) (McLean, VA, November 4–9, 2002). Pp. 430–437.
Pollack A.W. Notes on … Series, 1989–2000 [Электронный ресурс]. The 'Official' rec.music.beatles Home Page: [сайт]. URL: http://www.recmusicbeatles.com.
Scaringella N., Zoia G., Mlynek D. Automatic genre classification of music content: a survey // IEEE Signal Processing Magazine. 2006. Vol. 23, № 2. Pp. 133-141.
The HDF Group. Hierarchical data format version 5, 2000-2010. URL: http://www.hdfgroup.org/HDF5.
Bertin-Mahieux T., Ellis D.P.W., Whitman B., Lamere P. The million song dataset // In Proceedings of the 12th International Society for Music Information Retrieval Conference (ISMIR 2011), (Miami, Florida, October 24–28, 2011). URL: http://ismir2011.ismir.net/papers/OS6-1.pdf
Yoshii K., Goto M., Komatani K., Ogata T., Okuno H.G. Hybrid collaborative and contentbased music recommendation using probabilistic model with latent user preferences // Proceedings of the 7th International Conference on Music Information Retrieval (ISMIR 2006) (Victoria, Canada, October 8–12, 2006). URL: http://ismir2006.ismir.net/PAPERS/ISMIR0647_Paper.pdf.
Абызова Е.А. Гармония: Учебник. М.: Музыка, 2008, 383с.
Балтийский И.А. Сравнение методов вычисления признаков для задачи поиска музыки по голосу. Бакалаврская работа, СПбГУ ИТМО, 2009.
Балтийский И.А., Николенко С.И. Обзор графических вероятностных моделей гармонии для анализа музыкальных произведений. // Труды СПИИРАН. СПб.: Наука, 2011.
Балтийский И.А., Николенко С.И. Системы query-by-humming: обзор подходов и схема платформы для экспериментов // Труды СПИИРАН. СПб.: Наука, 2008. Вып. 7. С. 75–92.
Тулупьев А.Л, Николенко С.И., Сироткин А.В. Байесовские сети доверия: логико- вероятностный вывод в ациклических направленных графах. СПб.: Изд-во С.-Петерб. Ун-та, 2009, 400 с.
Тулупьев А.Л., Николенко С. И., Сироткин А. В. Байесовские сети: логико-вероятностный подход. СПб.: Наука, 2006. 608 с.
Тулупьев А.Л. Алгебраические байесовские сети: реализация логико-вероятностного вывода в комплексе java-программ // Труды СПИИРАН. СПб.: Наука, 2009. Вып. 8. С. 191–232.
Тулупьев А.Л. Задача локального автоматического обучения в алгебраических байесовских сетях: логико-вероятностный подход // Труды СПИИРАН. 2008. Вып. 7. СПб.: Наука, 2008. С. 11–25.
Фильченков А.А., Тулупьев А.Л. Структурный анализ систем минимальных графов смежности // Труды СПИИРАН. 2009. Вып. 11. С. 104–127.
Anderson C. The Long Tail: Why the Future of Business Is Selling Less of More. New York: Hyperion, 2006. 256 pp.
Bas de Haas W., Veltkamp R., Wiering F. Tonal Pitch Step Distance: a Similarity Measure for Chord Progressions // Proceedings of the Ninth International Conference on Music Information Retrieval (ISMIR 2008) (Philadelphia, Pennsylvania, September 14–18, 2008) Pp. 51–56.
Bishop C. Pattern Recognition and Machine Learning. Springer, 2006. 738 pp.
Cano P., Koppenberger M., Wack N. Content-based music audio recommendation // Proceedingsof the 13th annual ACM international conference on Multimedia (MULTIMEDIA’ 05) (Singapore, November 6–11, 2005). Pp. 211–212.
Castelluccio M. The Music Genome Project // Strategic Finance. 2006. № 88 (6). Pp. 57–58.
Fink, D. A Compendium of Conjugate Priors. URL: http://www.johndcook.com/CompendiumOfConjugatePriors.pdf.
Harte C., Sandler M., Abdalla, S., Gomez E. Symbolic Representation of Musical Chords: A Proposed Syntax for Text Annotations // In J. Reiss & G. Wiggins (Eds.), Proceedings of the Sixth International Conference on Music Information Retrieval (ISMIR 2005) (London, UK, September 11–15, 2005). London, UK: University of London, 2005. Pp. 312–319.
Amazon.com: Online Shopping for Electronics, Apparel, Computers, Books, DVDs & more. URL: http://amazon.com
List of The Beatles songs // Википедия. [2011—2011]. Дата обновления: 11.11.2011. URL: http://en.wikipedia.org/w/index.php?title=List_of_The_Beatles_songs&oldid=460172268
Reference Annotations: The Beatles. URL: http://isophonics.net/content/referenceannotations-beatles
Million Song Dataset. URL: http://labrosa.ee.columbia.edu/millionsong/
Last.fm - Listen to internet radio and the largest music catalogue online. URL: http://last.fm
Pandora Radio — Listen to Free Internet Audio, Find New Music.URL: http://pandora.com
Apple - iTunes - Everything you need to be entertained. URL: http://www.apple.com/itunes/
Secrets of The Beatles // SeeChord. URL: http://www.seechord.co.uk/song-writing/secretsof-the-beatles/
Anderson C. The Long Tail // Журнал Wired: [сайт]. URL: http://www.wired.com/wired/archive/12.10/tail.html
Netflix - Watch TV Shows Online, Watch Movies Online. URL: https://www.netflix.com/
Joyce J. Pandora and the Music Genome Project / Scientific Computing. 2006. № 23 (10). Pp. 14, 40–41.
Krumhansl C. Cognitive Foundations of Musical Pitch. New York: Oxford University Press, 1990. 318 pp.
Krumhansl C., Shepard R. Quantification of the hierarchy of tonal functions within a diatonic context // Journal of Experimental Psychology: Human Perception and Performance. 1979. № 5. Pp. 579–594.
Minka T. Expectation propagation for approximate Bayesian inference // In Breese, Jack S. And Koller, Daphne (eds.), Proceedings of the 17th Conference on Uncertainty in Artificial Intelligence (Seattle, WA, August 2–5, 2001). Massachusetts: Morgan Kaufmann, 2001. Pp. 362–369.
Minka T., Winn J., Guiver J., Knowles D. Infer.NET 2.4, Microsoft Research Cambridge, 2010. URL: http://research.microsoft.com/infernet
Muller M. Information Retrieval for Music and Motion. Berlin: Springer-Verlag, 2007. 334 pp.
Pickens J., Crawford T. Harmonic Models for Polyphonic Music Retrieval // Proceedings of International Conference on Information and Knowledge Management (CIKM 2002) (McLean, VA, November 4–9, 2002). Pp. 430–437.
Pollack A.W. Notes on … Series, 1989–2000 [Электронный ресурс]. The 'Official' rec.music.beatles Home Page: [сайт]. URL: http://www.recmusicbeatles.com.
Scaringella N., Zoia G., Mlynek D. Automatic genre classification of music content: a survey // IEEE Signal Processing Magazine. 2006. Vol. 23, № 2. Pp. 133-141.
The HDF Group. Hierarchical data format version 5, 2000-2010. URL: http://www.hdfgroup.org/HDF5.
Bertin-Mahieux T., Ellis D.P.W., Whitman B., Lamere P. The million song dataset // In Proceedings of the 12th International Society for Music Information Retrieval Conference (ISMIR 2011), (Miami, Florida, October 24–28, 2011). URL: http://ismir2011.ismir.net/papers/OS6-1.pdf
Yoshii K., Goto M., Komatani K., Ogata T., Okuno H.G. Hybrid collaborative and contentbased music recommendation using probabilistic model with latent user preferences // Proceedings of the 7th International Conference on Music Information Retrieval (ISMIR 2006) (Victoria, Canada, October 8–12, 2006). URL: http://ismir2006.ismir.net/PAPERS/ISMIR0647_Paper.pdf.
Абызова Е.А. Гармония: Учебник. М.: Музыка, 2008, 383с.
Балтийский И.А. Сравнение методов вычисления признаков для задачи поиска музыки по голосу. Бакалаврская работа, СПбГУ ИТМО, 2009.
Балтийский И.А., Николенко С.И. Обзор графических вероятностных моделей гармонии для анализа музыкальных произведений. // Труды СПИИРАН. СПб.: Наука, 2011.
Балтийский И.А., Николенко С.И. Системы query-by-humming: обзор подходов и схема платформы для экспериментов // Труды СПИИРАН. СПб.: Наука, 2008. Вып. 7. С. 75–92.
Тулупьев А.Л, Николенко С.И., Сироткин А.В. Байесовские сети доверия: логико- вероятностный вывод в ациклических направленных графах. СПб.: Изд-во С.-Петерб. Ун-та, 2009, 400 с.
Тулупьев А.Л., Николенко С. И., Сироткин А. В. Байесовские сети: логико-вероятностный подход. СПб.: Наука, 2006. 608 с.
Тулупьев А.Л. Алгебраические байесовские сети: реализация логико-вероятностного вывода в комплексе java-программ // Труды СПИИРАН. СПб.: Наука, 2009. Вып. 8. С. 191–232.
Тулупьев А.Л. Задача локального автоматического обучения в алгебраических байесовских сетях: логико-вероятностный подход // Труды СПИИРАН. 2008. Вып. 7. СПб.: Наука, 2008. С. 11–25.
Фильченков А.А., Тулупьев А.Л. Структурный анализ систем минимальных графов смежности // Труды СПИИРАН. 2009. Вып. 11. С. 104–127.
Опубликован
2011-09-01
Как цитировать
Балтийский, И. А., & Николенко, С. И. (2011). Графическая вероятностная модель для оценки схожести гармонии музыкальных произведений. Труды СПИИРАН, 3(18), 136-163. https://doi.org/10.15622/sp.18.6
Раздел
Статьи
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями:
Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале.
Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале.
Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).