Методы сегментации OCR-систем в задачах автоматической обработки архивных документов
Ключевые слова:
оптическое распознавание, методы сегментации, OCR-системы, структурный анализ документа, оцифровка архивных документовАннотация
Настоящая статья описывает сравнение современных систем оптического распознавания, проводимого с целью определить системы, наиболее точно выполняющих сегментацию документов по заранее заданным критериям; а также возможности систем по выделению различных типов областей. Анализируются результаты работы методов сегментации OCR-систем, оценивается эффективность сегментации. На основе результатов исследования и сделанных наблюдений составлен список рекомендаций по выбору OCR-систем и методов для обработки различных типов документов.Литература
Antonacopoulos A., Bridson D. Performance Analysis Framework for Layout Analysis Methods // Proc. of the 9th Intern. Conf. on Document Analysis and Recognition (ICDAR2007). Curitiba, Brazil, September 2007. С. 1258–1262.
Chaudhuri B. B. Digital Document Processing: Major Directions and Recent Advances. L.: Springer, 2007.
Berkner K., Likforman-Sulem L. Special issue on document recognition and retrieval 2009 // Intern. J. on Document Analysis and Recognition. 2010. № 2. С. 77–78.
Chaudhuri B. B. Digital Document Processing: Major Directions and Recent Advances. L.: Springer, 2007.
Berkner K., Likforman-Sulem L. Special issue on document recognition and retrieval 2009 // Intern. J. on Document Analysis and Recognition. 2010. № 2. С. 77–78.
Опубликован
2011-03-01
Как цитировать
Кулешов, С. В., & Смирнов, С. В. (2011). Методы сегментации OCR-систем в задачах автоматической обработки архивных документов. Труды СПИИРАН, 1(16), 110-122. https://doi.org/10.15622/sp.16.3
Раздел
Статьи
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями:
Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале.
Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале.
Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).