Подходы к оцениванию кумулятивных характеристик поведения в группах разнородных индивидов: точность и применимость в условиях ограниченных наблюдений
Ключевые слова:
последние эпизоды, рискованное поведение, байесовские сети доверия, гибридные байесовские сети доверия, копулаАннотация
В ряде социоориентированных областей знаний возникает задача оценки кумулятивных характеристик поведения индивидов, таких как частота, которые реализуются в группах индивидов, причем поступающие данные сопряжены с неопределенностью. Нередки ситуации ограниченных данных, когда для небольшого числа наблюдаемых объектов известны лишь несколько эпизодов. Существуют несколько подходов, позволяющих строить оценки искомой кумулятивной характеристики в условиях ограниченных ресурсов: классический подход регрессии Кокса, оценка параметра копулы, апостериорный вывод в байесовских сетях доверия, классических и гибридных, однако до сих пор не были проанализированы возможности применимости имеющихся методов. Целью работы является анализ особенностей применения существующих методов косвенного оценивания интенсивности рискованного поведения индивидов на основе ограниченных данных об эпизодах для определения рекомендаций по их применению: определение точности оценок, получаемых с помощью перечисленных подходов, на основе расстояния Канторовича–Рубинштейна от истинного распределения искомой частоты, а также выявление требований к данным, которые предъявляются для построения оценок. Было показано, что подход на основе копул дает самые точные оценки и обладает наименьшими требованиями к количеству наблюдаемых объектов, однако не может учитывать внешние факторы, которые могут оказывать влияние на реализацию эпизодов поведения. Среди моделей, позволяющих учитывать коварианты процесса, наибольшей точностью обладают оценки, опирающиеся на апостериорный вывод в гибридных байесовских сетях доверия. Полученные результаты являются новыми, они нацелены на применение в автоматизированных системах обработки информации о поведении индивидов. Практической значимостью обладают рекомендации по применению имеющихся подходов в зависимости от имеющихся данных.
Литература
2. Hendrieckx C., Ivory N., Singh H., Frier B.M., Speight J. Impact of severe hypoglycaemia on psychological outcomes in adults with type 2 diabetes: a systematic review // Diabetic Medicine. 2019. vol. 36. no. 9. pp. 1082–1091.
3. Пащенко А.Е., Тулупьев А.Л., Тулупьева Т.В., Красносельских Т.В., Соколовский Е.В. Косвенная оценка вероятности заражения ВИЧ-инфекцией на основе данных о последних эпизодах рискованного поведения // Здравоохранение Российской Федерации. 2010. № 2. С. 32–35.
4. Wojciechowski T.W. Major depressive disorder as a moderator of the relationship between heavy-episodic drinking and anxiety symptoms // Journal of mental health. 2023. pp. 1–8. DOI: 10.1080/09638237.2023.2245889.
5. Lewer D., Freer J., King E., Larney S., Degenhardt L., Tweed E.J., Hope V., Harris M., Millar T., Hayward A., Ciccarone D., Morley K. Frequency of health-care utilization by adults who use illicit drugs: a systematic review and meta-analysis // Addiction. 2020. vol. 115. no. 6. pp. 1011–1023.
6. Feldhege J., Moessner M., Bauer S. Who says what? Content and participation characteristics in an online depression community // Journal of Affective Disorders. 2020. vol. 263. pp. 521–527.
7. Jiotsa B., Naccache B., Duval M., Rocher B., Grall-Bronnec M. Social media use and body image disorders: Association between frequency of comparing one’s own physical appearance to that of people being followed on social media and body dissatisfaction and drive for thinness // International journal of environmental research and public health. 2021. vol. 18. no. 6. DOI: 10.3390/ijerph18062880.
8. Олисеенко В.Д., Хлобыстова А.О., Корепанова А.А., Тулупьева Т.В. Автоматизация оценки темперамента пользователей онлайн социальной сети // Доклады Российской академии наук. Математика, информатика, процессы управления. 2023. Т. 514. № 2. С. 235–241. DOI: 10.31857/S2686954323601471.
9. Khlobystova A.O., Abramov M.V., Tulupyev A.L. Soft estimates for social engineering attack propagation probabilities depending on interaction rates among instagram users // Intelligent Distributed Computing XIII. Springer International Publishing, 2020. pp. 272–277.
10. Grandell J. Mixed Poisson Processes. Monographs on Statistics and Applied Probability. Chapman and Hall/CRC. 1997. 280 p.
11. Cook R.J., Lawless J.F. The statistical analysis of recurrent events. Springer New York, 2007. 404 p.
12. Stoliarova V.F., Tulupyev A.L., Cox regression in the problem of risky behavior parameter estimation based on the last episodes’ data // St. Petersburg Polytechnical State University Journal. Physics and Mathematics. 2021. vol. 14(4). pp. 202–217. DOI: 10.18721/JPM.14415.
13. Rahgozar M., Faghihzadeh S., Babaee Rouchi G., Peng Y. The power of testing a semi-parametric shared gamma frailty parameter in failure time data // Statistics in medicine. 2008. vol. 27. no. 21. pp. 4328–4339.
14. Balan T.A., Putter H. A tutorial on frailty models // Statistical methods in medical research. 2020. vol. 29. no. 11. pp. 3424–3454.
15. Czado C. Analyzing dependent data with vine copulas // Lecture Notes in Statistics, Springer. 2019. 242 p.
16. Nelsen R.B. An introduction to copulas (Springer Series in Statistics). Springer, 2006. 286 p.
17. Столярова В.Ф. Копулы и моделирование зависимости: косвенные оценки интенсивности рискованного поведения // Компьютерные инструменты в образовании. 2018. № 3. С. 22–37.
18. Kojadinovic I., Yan J. Comparison of three semiparametric methods for estimating dependence parameters in copula models // Insurance: Mathematics and Economics. 2010. vol. 47. no. 1. pp. 52–63.
19. Qian L., Zhao Y., Yang J., Li H., Wang H., Bai C. A new estimation method for copula parameters for multivariate hydrological frequency analysis with small sample sizes // Water Resources Management. 2022. vol. 36. no. 4. pp. 1141–1157.
20. Суворова А.В., Тулупьев А.Л., Пащенко А.Е., Тулупьева Т.В., Красносельских Т.В. Анализ гранулярных данных и знаний в задачах исследования социально значимых видов поведения // Компьютерные инструменты в образовании. 2010. № 4. С. 30–38.
21. Suvorova A., Tulupyev A. Learning Bayesian network structure for risky behavior modelling // Proceedings of the Third International Scientific Conference “Intelligent Information Technologies for Industry” (IITI’18). Springer International Publishing, 2019. pp. 58–65.
22. Суворова А.В., Тулупьев А.Л., Сироткин А.В. Байесовские сети доверия в задачах оценивания интенсивности рискованного поведения // Нечеткие системы и мягкие вычисления. 2014. Т. 9. № 2. С. 115–129.
23. Тулупьев А.Л., Николенко С.И., Сироткин А.В. Основы теории байесовских сетей. СПб: СПбГУ, 2019. 399 с.
24. Koller D., Friedman N. Probabilistic graphical models: principles and techniques. MIT press, 2009. 1230 p.
25. Langseth H., Nielsen T.D., Rumı R., Salmeron A. Mixtures of truncated basis functions // International Journal of Approximate Reasoning. 2012. vol. 53. no. 2. pp. 212–227.
26. Perez-Bernabe I., Maldonado A.D., Nielsen T.D., Salmeron A. Hybrid Bayesian Networks Using Mixtures of Truncated Basis Functions // R Journal. 2020. vol. 12. no. 2. pp. 321–341.
27. Scutari M., Denis J.-B. Bayesian Networks with Examples in R. 2nd edition. Chapman and Hall, Boca Raton. 2021. 274 p.
28. Czado C., Nagler T. Vine copula based modeling // Annual Review of Statistics and Its Application. 2022. vol. 9. no. 1. pp. 453–477.
29. Kolouri S., Kolouri S., Park S.R., Thorpe M., Slepcev D., Rohde G.K. Optimal mass transport: Signal processing and machine-learning applications // IEEE signal processing magazine. 2017. vol. 34. no. 4. pp. 43–59.
30. Hanea A.M., Hemming V., Nane G.F. Uncertainty quantification with experts: present status and research needs // Risk Analysis. 2022. vol. 42. no. 2. pp. 254–263.
Опубликован
Как цитировать
Раздел
Copyright (c) Валерия Фуатовна Столярова, Татьяна Валентиновна Тулупьева, Артем Андреевич Вяткин
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями: Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале. Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале. Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).