Улучшенная повторная идентификация людей в системах видеонаблюдения с использованием глубокого обучения: структура для реальных приложений
Ключевые слова:
повторная идентификация людей (ReID), видеонаблюдение, глубокое обучение, сверточные нейронные сети (CNNs), реальные приложенияАннотация
Повторная идентификация людей (ReID) играет ключевую роль в современном видеонаблюдении, обеспечивая непрерывное отслеживание людей по различным камерам видеонаблюдения и повышая эффективность систем общественной безопасности. Однако повторная идентификация людей на реальных записях камер видеонаблюдения сопряжена с определенными трудностями, включая изменения углов обзора камеры, вариации освещения, частичные окклюзии и схожий внешний вид людей. В этой статье мы предлагаем надежную структуру глубокого обучения, которая использует сверточные нейронные сети (CNNs) с настраиваемой функцией потери триплетов для преодоления этих препятствий и повышения точности повторной идентификации. Система разработана таким образом, чтобы генерировать уникальные векторные представления признаков для отдельных людей, что позволяет точно различать их даже в сложных условиях окружающей среды. Чтобы подтвердить правильность нашего подхода, мы проводим обширные оценки на эталонных наборах данных ReID, достигая передовых результатов как по точности, так и по скорости обработки. Эффективность нашей модели оценивается с использованием ключевых метрик, включая кумулятивную характеристику соответствия (CMC) и среднюю точность (mAP), что демонстрирует ее надежность в различных сценариях наблюдения. По сравнению с существующими методами, наш подход неизменно превосходит их как по точности, так и по масштабируемости, что делает его пригодным для интеграции в крупномасштабные системы видеонаблюдения. Кроме того, мы обсуждаем практические аспекты по внедрению моделей ReID на основе ИИ в инфраструктуру видеонаблюдения, включая масштабируемость системы, возможности работы в режиме реального времени и вопросы конфиденциальности. Совершенствуя методы повторной идентификации людей, эта работа не только вносит вклад в область интеллектуального наблюдения, но и обеспечивает основу для повышения общественной безопасности в реальных приложениях с помощью автоматизированных и надежных возможностей отслеживания.
Литература
2. Guo J., Yuan Y., Huang L., Zhang C., Yao J.-G., Han K. Beyond Human Parts: Dual Part-Aligned Representations for Person Re-Identification. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV). IEEE, 2019. pp. 3641–3650. DOI: 10.1109/ICCV.2019.00374.
3. Liao W., Yang M.Y., Zhan N., Rosenhahn B. Triplet-Based Deep Similarity Learning for Person Re-Identification. Proceedings of the IEEE International Conference on Computer Vision Workshops (ICCVW). IEEE, 2017. pp. 385–393. DOI: 10.1109/ICCVW.2017.52.
4. Chen Y., Zhu X., Gong S. Person Re-identification by Deep Learning Multi-scale Representations. Proceedings of the IEEE International Conference on Computer Vision Workshops (ICCVW). IEEE, 2017. pp. 2590–2600. DOI: 10.1109/ICCVW.2017.304.
5. Aldoseri A., Al-Khalifa K.N., Hamouda A.M. AI-Powered Innovation in Digital Transformation: Key Pillars and Industry Impact. Sustainability. 2024. vol. 16. no. 5. DOI: 10.3390/su16051790.
6. Ming Z., Zhu M., Wang X., Zhu J., Cheng J., Gao C., Yang Y., Wei X. Deep learning-based person re-identification methods: A survey and outlook of recent works. 2022. arXiv preprint arXiv:2110.04764.
7. Chen H., Wang Y., Lagadec B., Dantcheva A., Bremond F. Learning Invariance from Generated Variance for Unsupervised Person Re-identification. 2023. arXiv preprint arXiv:2301.00725.
8. Xu J., Zhao R., Zhu F., Wang H., Ouyang W. Attention-Aware Compositional Network for Person Re-identification. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. IEEE, 2018. pp. 2119–2128. DOI: 10.1109/CVPR.2018.00226.
9. Tene O. Privacy: The new generations. International Data Privacy Law. 2011. vol. 1. no. 1. pp. 15–27. DOI: 10.1093/idpl/ipq003.
10. Zheng L., Shen L., Tian L., Wang S., Wang J., Tian Q. Scalable Person Re-identification: A Benchmark. Proceedings of the IEEE International Conference on Computer Vision (ICCV). IEEE, 2015. pp. 1116–1124. DOI: 10.1109/ICCV.2015.133.
11. Ristani E., Solera F., Zou R.S., Cucchiara R., Tomasi C. Performance Measures and a Data Set for Multi-Target, Multi-Camera Tracking. 2016. arXiv preprint arXiv:1609.01775.
12. Uc-Cetina V., Alvarez-Gonzalez L., Martin-Gonzalez A. A Review on Generative Adversarial Networks for Data Augmentation in Person Re-Identification Systems. 2023. arXiv preprint arXiv:2302.09119.
13. Zhang L., Jiang N., Diao Q., Zhou Z., Wu W. Person Re-identification with pose variation aware data augmentation. Neural Computing and Applications. 2022. vol. 34. pp. 11817–11830. DOI: 10.1007/s00521-022-07071-1.
14. Li Y., Zhang T., Duan L., Xu C. A Unified Generative Adversarial Framework for Image Generation and Person Re-identification. Proceedings of the 26th ACM international conference on Multimedia. Seoul Republic of Korea: ACM, 2018. pp. 163–172. DOI: 10.1145/3240508.3240573.
15. Liu Z., Mu X., Lu Y., Zhang T., Tian Y. Learning transformer-based attention region with multiple scales for occluded person re-identification. Computer Vision and Image Understanding. 2023. vol. 229. DOI: 10.1016/j.cviu.2023.103652.
16. Wang T., Liu H., Song P., Guo T., Shi W. Pose-Guided Feature Disentangling for Occluded Person Re-identification Based on Transformer. Proceedings of the AAAI Conference on Artificial Intelligence. 2022. vol. 36. no. 3. pp. 2540–2549. DOI: 10.1609/aaai.v36i3.20155.
17. Ghosh A., Shanmugalingam K., Lin W.-Y. Relation Preserving Triplet Mining for Stabilising the Triplet Loss in Re-identification Systems. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV). Waikoloa, HI, USA: IEEE. 2023. pp. 4829–4838. DOI: 10.1109/WACV56688.2023.00482.
18. Cheng D., Zhou J., Wang N., Gao X. Hybrid Dynamic Contrast and Probability Distillation for Unsupervised Person Re-Id. 2021. arXiv preprint arXiv:2109.14157.
19. Tang Z., Huang J. Harmonious Multi-branch Network for Person Re-identification with Harder Triplet Loss. ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM). vol. 18. no. 4. pp. 1–21. 2022. DOI: 10.1145/3501405.
20. Li J., Yang X. A Cyclical Learning Rate Method in Deep Learning Training. Proceedings of the International Conference on Computer, Information and Telecommunication Systems (CITS). IEEE, 2020. pp. 1–5. DOI: 10.1109/CITS49457.2020.9232482.
21. Xiao T., Li H., Ouyang W., Wang X. Learning Deep Feature Representations with Domain Guided Dropout for Person Re-identification. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2016. pp. 1249–1258. DOI: 10.1109/CVPR.2016.140.
22. Shi J., et al. Dual Pseudo-Labels Interactive Self-Training for Semi-Supervised Visible-Infrared Person Re-Identification. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV). IEEE. 2023. pp. 11184–11194. DOI: 10.1109/ICCV51070.2023.01030.
23. Borlinghaus P., Tausch F., Rettenberger L. A Purely Visual Re-ID Approach for Bumblebees (Bombus terrestris). Smart Agricultural Technology. 2023. vol. 3. DOI: 10.1016/j.atech.2022.100135.
24. Gorlo N., Blomqvist K., Milano F., Siegwart R. ISAR: A Benchmark for Single- and Few-Shot Object Instance Segmentation and Re-Identification. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV). IEEE, 2024. pp. 4372–4384. DOI: 10.1109/WACV57701.2024.00433.
25. Ahmad S., Scarpellini G., Morerio P., Bue A.D. Event-driven Re-Id: A New Benchmark and Method Towards Privacy-Preserving Person Re-Identification. Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision Workshops (WACVW). IEEE, 2022. pp. 459–468. DOI: 10.1109/WACVW54805.2022.00052.
26. Maximov M., Meinhardt T., Elezi I., Papakipos Z., Hazirbas C., Ferrer C.C., Leal-Taixé L. Data-Driven but Privacy-Conscious: Pedestrian Dataset De-identification via Full-Body Person Synthesis. 2023. arXiv preprint arXiv:2306.11710.
27. Hermans A., Beyer L., Leibe B. In Defense of the Triplet Loss for Person Re-Identification. 2017. arXiv preprint arXiv:1703.07737.
28. Li D., Chen X., Zhang Z., Huang K. Learning Deep Context-Aware Features over Body and Latent Parts for Person Re-identification. IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2017. pp. 7398–7407. DOI: 10.1109/CVPR.2017.782.
29. Luo H., Wang P., Xu Y., Ding F., Zhou Y., Wang F., Li H., Jin R. Self-Supervised Pre-Training for Transformer-Based Person Re-Identification. 2021. arXiv preprint arXiv:2111.12084.
Опубликован
Как цитировать
Раздел
Copyright (c) MOSSAAB IDRISSI ALAMI, Unknown, Unknown

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями: Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале. Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале. Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).