Категоризация сцен на основе расширенных цветовых дескрипторов

Маргарита Николаевна Фаворская; Александр Викторович Проскурин

doi:10.15622/sp.40.13

Маргарита Николаевна Фаворская заведующий кафедрой информатики и вычислительной техники Институт информатики и телекоммуникаций Сибирского государственного аэрокосмического университета имени академика М.Ф. Решетнева (СибГАУ)
Александр Викторович Проскурин аспирант кафедры информатики и вычислительной техники Институт информатики и телекоммуникаций Сибирского государственного аэрокосмического университета имени академика М.Ф. Решетнева (СибГАУ)

DOI:

https://doi.org/10.15622/sp.40.13

Ключевые слова:

автоматическое аннотирование изображений, категоризация сцен, метод опорных векторов, цветовые дескрипторы

Аннотация

Категоризация сцен при автоматическом аннотировании изображений предполагает обязательный этап извлечения дескрипторов для построения гистограмм визуальных слов. Изучено семейство новых цветовых дескрипторов на основе точечных особенностей, инвариантных не только к геометрическим преобразованиям, но к изменениям освещенности. Особенностью дальнейшего алгоритма является предварительная цветовая и текстурная сегментация на основе алгоритма J-SEG с ранжированием полученных регионов по площади. Для построения визуальных слов и категоризации по методу опорных векторов используются расширенные цветовые дескрипторы, рассчитанные в 5–7 регионах с наибольшей площадью. Представлены сравнительные результаты экспериментальных оценок точности категоризации изображений из тестового набора 2688 изображений с применением расширенных цветовых дескрипторов.

Литература

1. Zhang D., Islam Md.M., Lu G. A Review on Automatic Image Annotation Techniques // Pattern Recognition. 2012. vol. 45. no. 1. pp. 346–362.

2. Qin C., Bao X., Choudhury R.R., Nelakuditi S. TagSense: a Smartphone-based Approach to Automatic Image Tagging // Proceedings of the 9th International Conference on Mobile Systems, Applications, and Services (MobiSys’11). 2011. pp. 1–14.

3. Modeling the Shape of the Scene: a Holistic Representation of the Spatial Envelope. URL: http://people.csail.mit.edu/torralba/code/spatialenvelope (дата обращения: 11.05.2015).

4. Lowe D.G. Distinctive Image Features from Scale-Invariant Keypoints // International Journal of Computer Vision. 2004. vol. 60. no. 2. pp. 91–110.

5. Bay H., Ess A., Tuytelaars T., Gool L.V. Speeded-Up Robust Features (SURF) // Computer Vision and Image Understanding. 2008. vol. 110. no. 3. pp. 346–359.

6. Favorskaya M., Jain L.C., Buryachenko V. Digital Video Stabilization in Static and Dynamic Scenes. Computer Vision in Control Systems-1 // ISRL. Springer Cham Heidelberg New York Dordrecht London: Springer International Publishing Switzerland. 2015. vol. 73. pp. 261–309.

7. Jain L.C., Favorskaya M., Novikov D. Panorama Construction from Multi-view Cameras in Outdoor Scenes. Computer Vision in Control Systems-2 // ISRL. Springer Cham Heidelberg New York Dordrecht London: Springer International Publishing Switzerland. 2015. vol. 75. pp. 71–108.

8. Alcantarilla P.F., Bergasa L.M., Davison A.J. Gauge-SURF Descriptors // Image and Vision Computing. 2013. vol. 31. no. 1. pp. 103–116.

9. Gevers T., van de Weijer J., Stokman H. Color Feature Detection: an Overview. Color Image Processing: Methods and Applications / edited by R. Lukac, K.N. Plataniotis. University of Toronto. Ontario, Canada: CRC Press. 2006. pp. 203–226.

10. Van de Weijer J., Gevers T., Bagdanov A. Boosting Color Saliency in Image Feature Detection // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2006. vol. 28. no. 1. pp. 150–156.

11. Van de Sande K.E.A., Gevers T., Snoek C.G.M. Evaluating Color Descriptors for Object and Scene Recognition // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2009. vol. 32. no. 9. pp. 1582–1596.

12. Csurka G., Dance C.R., Fan L., Willamowski J., Bray C. Visual Categorization with Bags of Keypoints // Proceedings of Workshop on Statistical Learning in Computer Vision (ECCV’2004). 2004. pp. 1–22.

13. Vapnik V.N. Statistical Learning Theory. New York: Wiley. 1998. 768 p.

14. Deng Y., Manjunath B. S. Unsupervised Segmentation of Color-Texture Regions in Images and Videos // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2001. vol. 23. no. 8. pp. 800–810.

15. LIBSVM – a Library for Support Vector Machines. URL: http://www.csie.ntu.edu.tw/~cjlin/libsvm (дата обращения: 11.05.2015).

16. Battiato S., Farinella G.M., Guarnera M., Ravi D., Tomaselli V. Instant Scene Recognition on Mobile Platform // Computer Vision (ECCV 2012). Workshops and Demonstrations. Lecture Notes in Computer Science. 2012. vol. 7585. pp. 655–658.

17. Gazolli K., Salles E. A Contextual Image Descriptor for Scene Classification // Trends in Innovative Computing. 2012. pp. 66–71.

18. Проскурин А. В. Формирование визуальных слов для автоматического аннотирования изображений на основе самоорганизующейся нейронной сети // Цифровая обработка сигналов и ее применение (ДСПА’2014). Сб. научн. тр. 16-й Международной конференции. Москва: ИПУ РАН. 2014. Т. 2. С. 487–491.

19. Jiang Y.G., Ngo C., Yang J. Towards Optimal Bag-of-Features for Object Categorization and Semantic Video Retrieval // Proceedings of International Conference on Image and Video Retrieval (CIVR ‘2007). 2007. pp. 494–501.

20. Lazebnik S., Schmid C., Ponce J. Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories // Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. 2006. vol. 2. pp. 2169–2178.

Просмотры	1702
Скачивания	1205

Статьи

Категоризация сцен на основе расширенных цветовых дескрипторов

DOI:

Ключевые слова:

Аннотация

Литература

Опубликован

Статистика

Как цитировать

Выпуск

Раздел

Импакт-фактор

Разделы

Мы в сети

Обратная связь