Predictor Mining: применение методов интеллектуального анализа данных в задачах социального компьютинга
Ключевые слова:
интеллектуальный анализ данных, интеллектуальный поиск маркеров, социальный компьютинг, информатикаАннотация
В работе предложено новое направление исследований — интеллектуальный поиск маркеров (Predictor Mining), возникшее на пересечении интеллектуального анализа данных (Data Mining) и социального компьютинга (Social Computing). Сущность предлагаемого подхода состоит в автоматизированном формировании банка маркеров, характеризующих исследуемую предметную область, а затем интерпретировании полученных показателей с помощью методов социального компьютинга. В качестве примеров областей исследований, где может быть применен интеллектуальный поиск маркеров, рассмотрены задачи выявления особенностей формирования протестных настроений пользователей Интернет, вычисления количественных характеристик социально-значимого поведения, а также изучение специфики формирования ценностей и стратегий поведения пользователей крупнейших социальных сетей.Литература
1-я Международная конференция «Социальный компьютинг: Основы, Технологии развития, Социально-гуманитарные эффекты» / Конференции.RU. URL: http://konferencii.ru/info/88360 (дата обращения: 10.03.2013)
Азаров А.А., Ванюшичева О.Ю. Синтез агрегированных оценок вероятности реакций пользователя в ответ на социо-инженерное атакующее действие // VI Международная научно-техническая конференция молодых специалистов, аспирантов и студентов «Математическое и компьютерное моделирование естественнонаучных и социальных проблем» (МК-70-912) (Пенза, 21-24 мая 2012 г.). П: Приволжский Дом Знаний. 2012. С. 117-120
Бродовская Е.В. «Марш против подлецов»: образ протеста в пространстве интернет // Модернизационные процессы в обществе: проблемы теории и практики. Материалы Международной научно-практической конференции. Тверь: «СФК-офис», 2013. С. 33–44
Бродовская Е.В. Формирование образа протестного поведения в Рунете: опыт прикладного исследования // Дни науки философского факультета – 2013: Международная научная конференция (Киев, 2013). Киевский национальный университет им. Т. Шевченко, 2013. С. 16–18
Давыдов А.А. Системная социология: social computing. Электронный ресурс. URL: http://www.isras.ru/index.php?page_id=1016 (доступ 12.03.2013)
Делез Ж., Гватари Ф. Тысяча плато: Капитализм и шизофрения. У-Фактория. Астрель. 2010
Долгоруков А.М. е-Этнометодология: от «social computing» к «computable sociology» // Social Computing. Scientific journal. Выпуск 2, 2013
Долгоруков А.М. е-Этнометодология – новая социологическая перспектива? // Материалы Первой Международной научно – практической конференции «Социальный компьютинг: основы, технологии развития, социально-гуманитарные эффекты» (IISC-12): 11 статей и тезисов. М.: Изд-во МГГУ им. М.А. Шолохова, 2012. Стр. 115–120
Долгоруков А.М. Социальный дизайн: создание жизнеспособных систем. М.: РИЦ МГГУ им. М.А. Шолохова, 2012
Календарь Р.Н., Глазко В.И. Типы молекулярно-генетических маркеров и их применение // Физиология и биохимия культурных растений. 2002. № 34 (4). С. 141-156
Материалы Первой Международной научно-практической конференции «Социальный компьютинг: основы, технологии развития, социально-гуманитарные эффекты» (IISC-12): 11 статей и тезисов. М.: МГГУ, 2012. 248 с.
Молодежь Москвы: ценностные приоритеты, стратегии поведения и перспективы развития: 11 информационно-аналитических материалов/ под редакцией доктора политических наук В.Д. Нечаева. Москва, 2012
Риск передачи ВИЧ // STOP СПИД. URL: http://www.stopspid.ru/info/risk_transmission/ (дата обращения: 03.03.2013)
Степанов Д.В., Мусина В.Ф., Суворова А.В., Тулупьев А.Л., Сироткин А.В., Тулупьева Т.В. Функция правдоподобия с гетерогенными аргументами в идентифи-кации пуассоновской модели рискованного поведения в случае информационного дефицита // Труды СПИИРАН. 2012. Вып. 23. С. 157–184
Суворова А.В., Тулупьев А.Л., Пащенко А.Е., Тулупьева Т.В., Красносельских Т.В. Анализ гранулярных данных и знаний в задачах исследования социально значимых видов поведения // Компьютерные инструменты в образовании. №4. 2010. С. 30–38
Суворова А.В., Тулупьева Т.В., Тулупьев А.Л., Сироткин А.В., Пащенко А.Е. Вероятностные графические модели социально-значимого поведения индивида, учитывающие неполноту информации // Труды СПИИРАН. 2012. Вып. 22. С. 101–112
Тулупьев А.Л., Суворова А.В., Пащенко А.Е. Программа для расчёта нечётких оценок интенсивности угрозообразующего поведения и риска, с ним связанного, Fuzzy Risk-&-Rate Calculator, Version 2(F.R.-&-R.C. v.2) // Роспатент. Свид. о гос. рег. прогр. для ЭВМ № 2010614267 от 30.06.2010
Тулупьев А.Л., Суворова А.В., Пащенко А.Е. Программа для учёта неточных сведений об угрозообразующем поведении Fuzzy Data Register for Risky Behavior, Version 1 (F.D.R.R.B. v. 1) // Роспатент. Свид. о гос. рег. прогр. для ЭВМ № 2010613161 от 14.05.2010
Тулупьев А.Л., Тулупьева Т.В., Азаров А.А., Григорьева О.Ю. Психологические особенности персонала, предрасполагающие к успешной реализации социо-инженерных атак // Научные труды Северо-Западного института управления РАНХиГС. 2012. Т. 3, вып. 3(7). С. 256--266
Тулупьева Т.В., Пащенко А.Е., Тулупьев А.Л., Красносельских Т.В., Казакова О.С. Модели ВИЧ-социально-значимого поведения в контексте психологической защиты и других адаптивных стилей. СПб.: Наука, 2008. 140 с.
Blei D.M., Ng A.Y., Jordan M.I. Latent Dirichlet Allocation // Journal of machine Learning Research. 2003. N.3, P. 993–1022
Capra L., Quercia D. Middleware for social computing: a roadmap // Journal of Internet Services and Applications. 2012. Vol. 3, No 1. Pp. 117–125
Data Mining от Oracle: настоящее и будущее. URL: http://citforum.ru/database/oracle/data_mining_solutions/ (дата обращения: 10.03.2013)
Han J., Kamber M., Pei J. Data mining: concepts and techniques. Morgan Kaufmann, 2006. 743 p.
Eco U. A Theory of semiotics. Indiana University Press, 1979
Francis D., Hester S. An Invitation to Ethnomethodology. SAGE Publications, 2004
Kadushin Ch. Understanding Social Networks: theories, concepts and findings. Oxford University Press, 2012
Krippendorff K. Content analysis: An introduction to its methodology. SAGE Publications, Incorporated, 2004. 413 p.
Kwai Fun IP R., Wagner C. Weblogging: A study of social computing and its impact on organizations //Decision Support Systems. 2008. Vol. 45, No 2. P. 242–250
Leetaru K. Data Mining Methods for the Content Analyst: An Introduction to the Computational Analysis of Content (Routledge Communication Series)
Liu H., Salerno J., Young M. Social Computing and Behavioral Modeling. Springer, 2009. 280 p.
Messinger P. R., Stroulia E., Lyons, K., Bone M., Niu R. H., Smirnov K., Perelgut S. Virtual worlds—past, present, and future: New directions in social computing // Decision Support Systems. 2009. 47(3). P 204–228
Neuendorf K. A. The content analysis guidebook. SAGE Publications, Incorporated, 2002. 301 p.
Parameswaran M., Whinston A. B. Research issues in social computing // Journal of the Association for Information Systems. 2007. Vol. 8, No 6. P. 336–350
Parameswaran M., Whinston A. B. Social Computing: an Overview //Communications of the Association for Information Systems. 2007. Vol.19. 762–780
Plant S. Zeros and Ones. L.: Fourth Estate, 1997
Southern E.M. Detection of specific sequences among DNA fragments separated by gel electrophoresis // Journal of Molecular Biology. 1974. Vol. 98 (3). P. 503--517
Typical features of Internet activity of Russian people // European Applied Studies: modern approaches in scientific researches, 2nd International scientific conference. (February 18–19, 2013, Stuttgart, Germany). Volume 1. Stuttgart: ORT Publishing, 2013. P. 189-191
Tuzhilin A. Social Recommender Systems: Combining Recommender Systems and Social Computing into an Integrated Platform // Материалы Первой Международной научно-практической конференции «Социальный компьютинг: основы, технологии развития, социально-гуманитарные эффекты» (IISC-12): 11 статей и тезисов. Москва: Изд-во МГГУ им. М.А. Шолохова, 2012. С. 14
Velickov S., Solomatine D. Predictive Data Mining: Practical Examples // Artificial Intelligence in Civil Engineering. Proc. 2nd Joint Workshop, March 2000, Cottbus, Germany
Villanueva E., Maciel C.D. Modeling associations between genetic markers using Bayesian networks // Bioinformatics. 2010. Vol. 26, Issue 18. P. i632–i637
Wang F. Y., Carley K. M., Zeng D., Mao W. Social computing: From social informatics to social intelligence // Intelligent Systems, IEEE. 2007. 22(2). P. 79–83
Wash R., Rader E. Public bookmarks and private benefits: An analysis of incentives in social computing //Proceedings of the American Society for Information Science and Technology. 2007. Vol. 44, No 1. P. 1–13
Weber R.P. Basic content analysis. Sage Publications, Incorporated, 1990. Issue 49. 96 p.
Witten I. H., Frank E. Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann, 2005. 525 p.
Азаров А.А., Ванюшичева О.Ю. Синтез агрегированных оценок вероятности реакций пользователя в ответ на социо-инженерное атакующее действие // VI Международная научно-техническая конференция молодых специалистов, аспирантов и студентов «Математическое и компьютерное моделирование естественнонаучных и социальных проблем» (МК-70-912) (Пенза, 21-24 мая 2012 г.). П: Приволжский Дом Знаний. 2012. С. 117-120
Бродовская Е.В. «Марш против подлецов»: образ протеста в пространстве интернет // Модернизационные процессы в обществе: проблемы теории и практики. Материалы Международной научно-практической конференции. Тверь: «СФК-офис», 2013. С. 33–44
Бродовская Е.В. Формирование образа протестного поведения в Рунете: опыт прикладного исследования // Дни науки философского факультета – 2013: Международная научная конференция (Киев, 2013). Киевский национальный университет им. Т. Шевченко, 2013. С. 16–18
Давыдов А.А. Системная социология: social computing. Электронный ресурс. URL: http://www.isras.ru/index.php?page_id=1016 (доступ 12.03.2013)
Делез Ж., Гватари Ф. Тысяча плато: Капитализм и шизофрения. У-Фактория. Астрель. 2010
Долгоруков А.М. е-Этнометодология: от «social computing» к «computable sociology» // Social Computing. Scientific journal. Выпуск 2, 2013
Долгоруков А.М. е-Этнометодология – новая социологическая перспектива? // Материалы Первой Международной научно – практической конференции «Социальный компьютинг: основы, технологии развития, социально-гуманитарные эффекты» (IISC-12): 11 статей и тезисов. М.: Изд-во МГГУ им. М.А. Шолохова, 2012. Стр. 115–120
Долгоруков А.М. Социальный дизайн: создание жизнеспособных систем. М.: РИЦ МГГУ им. М.А. Шолохова, 2012
Календарь Р.Н., Глазко В.И. Типы молекулярно-генетических маркеров и их применение // Физиология и биохимия культурных растений. 2002. № 34 (4). С. 141-156
Материалы Первой Международной научно-практической конференции «Социальный компьютинг: основы, технологии развития, социально-гуманитарные эффекты» (IISC-12): 11 статей и тезисов. М.: МГГУ, 2012. 248 с.
Молодежь Москвы: ценностные приоритеты, стратегии поведения и перспективы развития: 11 информационно-аналитических материалов/ под редакцией доктора политических наук В.Д. Нечаева. Москва, 2012
Риск передачи ВИЧ // STOP СПИД. URL: http://www.stopspid.ru/info/risk_transmission/ (дата обращения: 03.03.2013)
Степанов Д.В., Мусина В.Ф., Суворова А.В., Тулупьев А.Л., Сироткин А.В., Тулупьева Т.В. Функция правдоподобия с гетерогенными аргументами в идентифи-кации пуассоновской модели рискованного поведения в случае информационного дефицита // Труды СПИИРАН. 2012. Вып. 23. С. 157–184
Суворова А.В., Тулупьев А.Л., Пащенко А.Е., Тулупьева Т.В., Красносельских Т.В. Анализ гранулярных данных и знаний в задачах исследования социально значимых видов поведения // Компьютерные инструменты в образовании. №4. 2010. С. 30–38
Суворова А.В., Тулупьева Т.В., Тулупьев А.Л., Сироткин А.В., Пащенко А.Е. Вероятностные графические модели социально-значимого поведения индивида, учитывающие неполноту информации // Труды СПИИРАН. 2012. Вып. 22. С. 101–112
Тулупьев А.Л., Суворова А.В., Пащенко А.Е. Программа для расчёта нечётких оценок интенсивности угрозообразующего поведения и риска, с ним связанного, Fuzzy Risk-&-Rate Calculator, Version 2(F.R.-&-R.C. v.2) // Роспатент. Свид. о гос. рег. прогр. для ЭВМ № 2010614267 от 30.06.2010
Тулупьев А.Л., Суворова А.В., Пащенко А.Е. Программа для учёта неточных сведений об угрозообразующем поведении Fuzzy Data Register for Risky Behavior, Version 1 (F.D.R.R.B. v. 1) // Роспатент. Свид. о гос. рег. прогр. для ЭВМ № 2010613161 от 14.05.2010
Тулупьев А.Л., Тулупьева Т.В., Азаров А.А., Григорьева О.Ю. Психологические особенности персонала, предрасполагающие к успешной реализации социо-инженерных атак // Научные труды Северо-Западного института управления РАНХиГС. 2012. Т. 3, вып. 3(7). С. 256--266
Тулупьева Т.В., Пащенко А.Е., Тулупьев А.Л., Красносельских Т.В., Казакова О.С. Модели ВИЧ-социально-значимого поведения в контексте психологической защиты и других адаптивных стилей. СПб.: Наука, 2008. 140 с.
Blei D.M., Ng A.Y., Jordan M.I. Latent Dirichlet Allocation // Journal of machine Learning Research. 2003. N.3, P. 993–1022
Capra L., Quercia D. Middleware for social computing: a roadmap // Journal of Internet Services and Applications. 2012. Vol. 3, No 1. Pp. 117–125
Data Mining от Oracle: настоящее и будущее. URL: http://citforum.ru/database/oracle/data_mining_solutions/ (дата обращения: 10.03.2013)
Han J., Kamber M., Pei J. Data mining: concepts and techniques. Morgan Kaufmann, 2006. 743 p.
Eco U. A Theory of semiotics. Indiana University Press, 1979
Francis D., Hester S. An Invitation to Ethnomethodology. SAGE Publications, 2004
Kadushin Ch. Understanding Social Networks: theories, concepts and findings. Oxford University Press, 2012
Krippendorff K. Content analysis: An introduction to its methodology. SAGE Publications, Incorporated, 2004. 413 p.
Kwai Fun IP R., Wagner C. Weblogging: A study of social computing and its impact on organizations //Decision Support Systems. 2008. Vol. 45, No 2. P. 242–250
Leetaru K. Data Mining Methods for the Content Analyst: An Introduction to the Computational Analysis of Content (Routledge Communication Series)
Liu H., Salerno J., Young M. Social Computing and Behavioral Modeling. Springer, 2009. 280 p.
Messinger P. R., Stroulia E., Lyons, K., Bone M., Niu R. H., Smirnov K., Perelgut S. Virtual worlds—past, present, and future: New directions in social computing // Decision Support Systems. 2009. 47(3). P 204–228
Neuendorf K. A. The content analysis guidebook. SAGE Publications, Incorporated, 2002. 301 p.
Parameswaran M., Whinston A. B. Research issues in social computing // Journal of the Association for Information Systems. 2007. Vol. 8, No 6. P. 336–350
Parameswaran M., Whinston A. B. Social Computing: an Overview //Communications of the Association for Information Systems. 2007. Vol.19. 762–780
Plant S. Zeros and Ones. L.: Fourth Estate, 1997
Southern E.M. Detection of specific sequences among DNA fragments separated by gel electrophoresis // Journal of Molecular Biology. 1974. Vol. 98 (3). P. 503--517
Typical features of Internet activity of Russian people // European Applied Studies: modern approaches in scientific researches, 2nd International scientific conference. (February 18–19, 2013, Stuttgart, Germany). Volume 1. Stuttgart: ORT Publishing, 2013. P. 189-191
Tuzhilin A. Social Recommender Systems: Combining Recommender Systems and Social Computing into an Integrated Platform // Материалы Первой Международной научно-практической конференции «Социальный компьютинг: основы, технологии развития, социально-гуманитарные эффекты» (IISC-12): 11 статей и тезисов. Москва: Изд-во МГГУ им. М.А. Шолохова, 2012. С. 14
Velickov S., Solomatine D. Predictive Data Mining: Practical Examples // Artificial Intelligence in Civil Engineering. Proc. 2nd Joint Workshop, March 2000, Cottbus, Germany
Villanueva E., Maciel C.D. Modeling associations between genetic markers using Bayesian networks // Bioinformatics. 2010. Vol. 26, Issue 18. P. i632–i637
Wang F. Y., Carley K. M., Zeng D., Mao W. Social computing: From social informatics to social intelligence // Intelligent Systems, IEEE. 2007. 22(2). P. 79–83
Wash R., Rader E. Public bookmarks and private benefits: An analysis of incentives in social computing //Proceedings of the American Society for Information Science and Technology. 2007. Vol. 44, No 1. P. 1–13
Weber R.P. Basic content analysis. Sage Publications, Incorporated, 1990. Issue 49. 96 p.
Witten I. H., Frank E. Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann, 2005. 525 p.
Опубликован
2013-06-01
Как цитировать
Азаров, А. А., Бродовская, Е. В., Бубнов, А. Ю., Гибадулин, Р. Я., Глазков, А. А., Дмитриева, О. В., Долгоруков, А. М., Жданов, Р. И., Мусина, В. Ф., Нечаев, В. Д., Огнев, А. С., Сироткин, А. В., Суворова, А. В., Титов, В. В., Тулупьев, А. Л., Тулупьева, Т. В., Фильченков, А. А., & Юсупов, Р. М. (2013). Predictor Mining: применение методов интеллектуального анализа данных в задачах социального компьютинга. Труды СПИИРАН, 3(26), 136-161. https://doi.org/10.15622/sp.26.11
Раздел
Статьи
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями:
Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале.
Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале.
Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).