Ассоциативная классификация: аналитический обзор. Часть 2
Ключевые слова:
большие данные, ассоциативное правило, ассоциативная классификация, паттерн, эмерджентный паттернАннотация
В работе продолжается рассмотрение основных результатов, моделей и методов, разработанных в области ассоциативной классификации, ориентированных на обработку данных большого объема. Дается анализ подходов, методов и алгоритмов, разработанных в области ассоциативной классификации к настоящему времени. В заключении формулируются достоинства и недостатки ассоциативной классификации как модели машинного обучения, а также дается оценка перспектив ее использования в интеллектуальном анализе больших данных.
Литература
1. Городецкий В.И., Тушканова О.Н. Ассоциативная классификация: аналитический обзор. Часть 1 // Труды СПИИРАН. 2015. №1. C. 183–203.
2. Городецкий В.И., Самойлов В.В. Ассоциативный и причинный анализ и ассоциативные байесовские сети// Труды СПИИРАН. 2009. №9. C. 13–65.
3. Adamo J.-M. Data Mining for Association Rules and Sequential Patterns // Springer. 2000.
4. Dong G., Li J. Efficient Mining of Emerging Patterns: Discovering Trends and Differences // Proc. of the KDD'99. 1999. pp. 43–52.
5. Dong G., Zhang X., Wong L., Li J. CAEP: Classification by Aggregating Emerging Patterns // Proc. of the DS'99. 1999. pp. 30–42.
6. Fan H., Ramamohanarao K. Fast Discovery and the Generalization of Strong Jumping Emerging Patterns for Building Compact and Accurate Classifiers // IEEE Trans. Knowl. Data Eng. 2006. vol. 18(6). pp. 721–737.
7. Li J., Dong G., Ramamohanarao K. Making use of the most expressive jumping emerging patterns for classification // Proc. of the Fourth Pacific-Asia Conference on Knowledge Discovery and Data Mining, Kyoto, Japan. 2000. pp. 220–232.
8. Bayardo Jr. R.J. Efficiently Mining Long Patterns from Databases // Proc. of the SIGMOD Conference. 1998. pp. 85–93.
9. Agrawal R., Sricant R. Fast Algorithm for Mining Association rules // Proc. of the 20th Intern. Conference on Very Large Databases. Santiago, Chile. 1994. pp. 68–77.
10. Condorcet N.C. Essaisur l'application de l’analyse a la probabilite des decisions rendues a la pluralité des voix. Paris: Imprimerie Royale. 1785.
11. Condorcet's jury theorem. Wikipedia.org: the free encyclopedia // URL: http://en.wikipedia.org/wiki/Condorcet's_jury_theorem (дата обращения 20.06.2014).
12. Michalski R.S. On the Quasi-Minimal Solution of the General Covering Problem// Proc. of the V International Symposium on Information Processing (FCIP-69), Bled, Yugoslavia. 1969. vol. A3. pp .125–128.
13. Michalski R.S. A Theory and Methodology of Inductive Learning. Machine Learning, vol.1 // Eds. Carbone J.G., Michalski R.S., Mitchel T.M. Tigoda. Palo Alto. 1983. pp. 83–134.
14. Gorodetsky V., Karsaev O., Samoilov V. Direct Mining of Rules from Data with Missing Values // Studies in Computational Intelligence. Chapter in book T.Y.Lin, S.Ohsuga, C.J. Liau, X.T.Hu, S.Tsumoto (Eds.). Foundation of Data Mining and Knowledge Discovery. Springer. 2005. vol. 6. pp. 233–264.
15. Милль Дж.Ст. Система логики силлогистической и индуктивной: Изложение принципов доказательства в связи с методами научного исследования Пер. с англ. // Изд. 5, испр. и доп. М.: ЛЕНАНД, 2011.
16. Пять канонов Джона Милля. Vikent.ru: информ.-справочный портал // URL: http://vikent.ru/enc/834/ (дата обращения 20.06 2014).
17. Kobyliński L., Walczak K. Efficient Mining of Jumping Emerging Patterns with Occurrence Counts for Classification // Transactions on Rough Sets XIII. LNCS 6499. 2011. pp. 73–88.
18. Sherhod R., Judson P.N., et al. Emerging Pattern Mining To Aid Toxicological Knowledge Discovery // Journal of Chemical Information Modeling. 2014. no. 54 (7). pp 1864–1879.
19. Han J., Pei J., Yin Y. Mining frequent patterns without candidate generation // Proc. of the ACM SIGMOD Intern. Conf. on Management of Data. 2000. pp. 1–12.
20. Blake C.L., Murphy P.M. UCI Repository of machine learning database. University of California, Department of Information and Computer Science. Irvine, CA. 1998 // URL: http://www.cs.uci.edu/mleam/mlrepository.html (дата обращения 20.06.2014).
21. Городецкий В.И., Серебряков С.В. Методы и алгоритмы коллективного распознавания // Автоматика и Телемеханика. 2008. № 11. C. 3–40.
22. Gorodetsky V., Samoylov V., Serebryakov S. Ontology–based Context–dependent Personalization Technology // Proc. of the WI/IAT 2010. Toronto. 2010. pp. 278–283.
2. Городецкий В.И., Самойлов В.В. Ассоциативный и причинный анализ и ассоциативные байесовские сети// Труды СПИИРАН. 2009. №9. C. 13–65.
3. Adamo J.-M. Data Mining for Association Rules and Sequential Patterns // Springer. 2000.
4. Dong G., Li J. Efficient Mining of Emerging Patterns: Discovering Trends and Differences // Proc. of the KDD'99. 1999. pp. 43–52.
5. Dong G., Zhang X., Wong L., Li J. CAEP: Classification by Aggregating Emerging Patterns // Proc. of the DS'99. 1999. pp. 30–42.
6. Fan H., Ramamohanarao K. Fast Discovery and the Generalization of Strong Jumping Emerging Patterns for Building Compact and Accurate Classifiers // IEEE Trans. Knowl. Data Eng. 2006. vol. 18(6). pp. 721–737.
7. Li J., Dong G., Ramamohanarao K. Making use of the most expressive jumping emerging patterns for classification // Proc. of the Fourth Pacific-Asia Conference on Knowledge Discovery and Data Mining, Kyoto, Japan. 2000. pp. 220–232.
8. Bayardo Jr. R.J. Efficiently Mining Long Patterns from Databases // Proc. of the SIGMOD Conference. 1998. pp. 85–93.
9. Agrawal R., Sricant R. Fast Algorithm for Mining Association rules // Proc. of the 20th Intern. Conference on Very Large Databases. Santiago, Chile. 1994. pp. 68–77.
10. Condorcet N.C. Essaisur l'application de l’analyse a la probabilite des decisions rendues a la pluralité des voix. Paris: Imprimerie Royale. 1785.
11. Condorcet's jury theorem. Wikipedia.org: the free encyclopedia // URL: http://en.wikipedia.org/wiki/Condorcet's_jury_theorem (дата обращения 20.06.2014).
12. Michalski R.S. On the Quasi-Minimal Solution of the General Covering Problem// Proc. of the V International Symposium on Information Processing (FCIP-69), Bled, Yugoslavia. 1969. vol. A3. pp .125–128.
13. Michalski R.S. A Theory and Methodology of Inductive Learning. Machine Learning, vol.1 // Eds. Carbone J.G., Michalski R.S., Mitchel T.M. Tigoda. Palo Alto. 1983. pp. 83–134.
14. Gorodetsky V., Karsaev O., Samoilov V. Direct Mining of Rules from Data with Missing Values // Studies in Computational Intelligence. Chapter in book T.Y.Lin, S.Ohsuga, C.J. Liau, X.T.Hu, S.Tsumoto (Eds.). Foundation of Data Mining and Knowledge Discovery. Springer. 2005. vol. 6. pp. 233–264.
15. Милль Дж.Ст. Система логики силлогистической и индуктивной: Изложение принципов доказательства в связи с методами научного исследования Пер. с англ. // Изд. 5, испр. и доп. М.: ЛЕНАНД, 2011.
16. Пять канонов Джона Милля. Vikent.ru: информ.-справочный портал // URL: http://vikent.ru/enc/834/ (дата обращения 20.06 2014).
17. Kobyliński L., Walczak K. Efficient Mining of Jumping Emerging Patterns with Occurrence Counts for Classification // Transactions on Rough Sets XIII. LNCS 6499. 2011. pp. 73–88.
18. Sherhod R., Judson P.N., et al. Emerging Pattern Mining To Aid Toxicological Knowledge Discovery // Journal of Chemical Information Modeling. 2014. no. 54 (7). pp 1864–1879.
19. Han J., Pei J., Yin Y. Mining frequent patterns without candidate generation // Proc. of the ACM SIGMOD Intern. Conf. on Management of Data. 2000. pp. 1–12.
20. Blake C.L., Murphy P.M. UCI Repository of machine learning database. University of California, Department of Information and Computer Science. Irvine, CA. 1998 // URL: http://www.cs.uci.edu/mleam/mlrepository.html (дата обращения 20.06.2014).
21. Городецкий В.И., Серебряков С.В. Методы и алгоритмы коллективного распознавания // Автоматика и Телемеханика. 2008. № 11. C. 3–40.
22. Gorodetsky V., Samoylov V., Serebryakov S. Ontology–based Context–dependent Personalization Technology // Proc. of the WI/IAT 2010. Toronto. 2010. pp. 278–283.
Опубликован
2015-04-16
Как цитировать
Тушканова, О. Н., & Городецкий, В. И. (2015). Ассоциативная классификация: аналитический обзор. Часть 2. Труды СПИИРАН, 2(39), 212-240. https://doi.org/10.15622/sp.39.13
Раздел
Статьи
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями:
Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале.
Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале.
Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).