Минимальная структура базы для хранения данных о биологическом разнообразии организмов
Ключевые слова:
компоненты данных, данные об организме, географическая точка, таксономическое название, библиографическая запись, биологическая коллекция, коллекционный экземпляр, метаданныеАннотация
К настоящему времени накоплено огромное количество данных о разнообразии организмов. Сохранить и использовать эти данные для решения научных задач помогают базы данных. В литературе описано несколько десятков баз, предназначенных для хранения данных о биоразнообразии. Каждая имеет оригинальную структуру, которая плохо согласуется со структурами других баз, что, в свою очередь, затрудняет обмен данными и формирование массивов больших данных о биоразнообразии.
Причиной сложившейся ситуации является отсутствие формальных определений универсальных компонент, из которых можно построить базу с любыми данными о разнообразии организмов. Анализ литературы и исследования авторов показывают, что универсальные компоненты есть в характеристиках любых организмов. Например, таксономическое название организма и место его поимки. Таких компонент шесть, и они отвечают на один из шести вопросов: что, где, когда, кто, откуда и куда. Первые три компоненты – что, где, когда – являются фундаментальными. Они составляют минимальную основу, которая описывает экземпляр таксона в пространственно-временных координатах. Каждой компоненте соответствует отдельная таблица базы данных. Эти таблицы связаны с таблицей данных об организме (особи) и не связаны между собой. Атрибуты связей между особью и таблицами компонент хранятся в промежуточных таблицах.
Процесс создания любой базы о разнообразии живых существ начинается с определения таблицы экземпляров организмов. Ее необходимо использовать, даже если нет явных данных об организмах. Тогда следует ввести виртуальные организмы и связать с ними остальные компоненты при помощи промежуточных таблиц. Последние состыковываются с прочими данными. Минимальные структуры всех таблиц, связи между ними и примеры построения баз данных описаны в настоящей работе.
Литература
2. Шитиков В.К., Розенберг Г.С. Оценка биоразнообразия: попытка формального обобщения // Количественные методы экологии и гидробиологиию 2005. С. 91–129.
3. Скарлато О.А., Старобогатов Я.И., Лобанов А.Л., Смирнов И.С. Биоразнообразие и возможности его анализа с применением компьютерных банков данных // Биоразнообразие: Степень таксономической изученности. 1994. С. 20–43.
4. Запевалин А.А. Компьютерные структуры данных для решения проблем биоранообразия // Экология моря. 2001. Вып. 57. С. 103–108.
5. Seregin A.P. The largest digital herbarium in Russia is now available online! // Taxon. 2018. vol. 67. no. 2. pp. 465–467.
6. Pugachev O. et al. Creation of information retrieval system on the unique research collections of the Zoological Institute RAS // Information Technologies in the Research of Biodiversity. Springer Proceedings in Earth and Environmental Sciences. 2019. pp. 57–65.
7. Костина Н.В. Информационная система REGION: 25 лет развития и практического применения // Известия Самарского научного центра Российской академии наук. 2015. Т. 17. № 4-1. С. 15–24.
8. Лашин С.А. и др. Информационная система по биоресурсным коллекциям институтов ФАНО России // Вавиловский журнал генетики и селекции. 2018. № 22(3). С. 386–393.
9. Шашков М.П., Чадин И.Ф., Иванова Н.В. Методические рекомендации по стандартизации данных для публикации через глобальный портал gbif.org и подготовке статьи о данных // Труды Кольского научного центра РАН. 2017. № 6-5(8). C. 22–35.
10. Wieczorek J. et al. Darwin core: an evolving community-developed biodiversity data standard // PLoS One. 2012. vol. 7. e29715.
11. Jones K.E. et al. PanTHERIA: a species-level database of life history, ecology, and geography of extant and recently extinct mammals // Ecology. 2009. vol. 90. no. 9. pp. 2648.
12. Дмитриева Е.В. др. Электронная коллекция паразитов рыб Мирового океана Института морских биологических исследований им. А.О. Ковалевского // Морской биологический журнал. 2016. Т. 1. № 3. С. 27–31.
13. Гребенников К.А. Изучение биоразнообразия заповедников России в цифровой эпохе: опыт и перспективы // Nature Conservation Research. Заповедная наука. 2016. Т. 1. № 2. С. 1–10.
14. Лях А.М. Структура базы данных для виртуальных биологических коллекций // Системы контроля окружающей среды. 2019. № 3 (37). С. 29–34
15. Schneider F.D. et al. Towards an ecological trait-data standard // Methods in Ecology and Evolution. 2019. vol. 10. pp. 2006–2019.
16. Specht A. et al. A story of data won, data lost and data re-found: the realities of ecological data preservation // Biodiversity Data Journal. 2018. vol. 6. e28073.
17. Blair J. et al. Towards a catalogue of biodiversity databases: An ontological case study // Biodiversity Data Journal. 2020. vol. 8. e32765.
18. Parr C.S., Guralnik R., Cellinese N., Page R.D.M. Evolutionary informatics: unifying knowledge about the diversity of life // Trends in Ecology and Evolution. 2012. vol. 27. no. 2. pp. 94–103.
19. La J.S., Williams K.J., Moritz C. Biodiversity analysis in the digital era // Philosophical transactions of the Royal Society of London. Series B, Biological sciences. 2016. vol. 371. no. 1702. pp. 2150337.
20. Лях А.М., Лелеков С.Г. Модульная структура таксономической базы данных // Электронные информационные системы. 2018. № 2. С. 59–70.
21. Лобанов А.Л. и др. Эволюция стандарта ZOOCOD – концепция отражения зоологических иерархических классификаций в плоских таблицах реляционных баз данных // Труды 10-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» – RCDL’2008. С. 326–332.
22. Jackson J.B.C., Johnson K.G. Measuring past biodiversity // Science. 2001. 293. pp. 2401–2404.
23. Каменский П.А., Сазонов А.Э., Федянин А.А., Садовничий В.А. Биологические коллекции: стремление к идеалу // Acta Naturae. 2016. Т. 8. № 2(29). С. 6–10.
24. Чеченкина Т.В, Сотникова М.В. Можно ли оценить бесценное? К вопросу о сравнении стоимости научных коллекций // Управление наукой и наукометрия. 2019. Т. 14. № 4. 17 p.
25. Sabaj M.H. Standard symbolic codes for institutional resource collections in herpetology and ichthyology: an Online Reference. Version 6.5. URL: asih.org/sites/default/files/documents/symbolic_codes_for_collections_v6.5_2016.pdf (дата обращения: 22.06.2020).
26. Лях А.М. Уникальные семантические номера экземпляров биологических коллекций // Системы контроля окружающей среды. 2019. № 2(36). С. 43–50.
27. Guntsch A. et al. Actionable, long-term stable and semantic web compatible identifiers for access to biological collection objects // Database. 2017. vol. 2017. 9 p.
28. Касаткин М.В., Иванов А.П. Коллекция костей стеллеровой коровы Hydrodamalis gigas в Государственном биологическом музее имени К.А. Тимирязева // Зоологические исследования. 2018. № 20. С. 60–66.
29. Michener W.K. Meta-information concepts for ecological data management // Ecological Informatics. 2006. vol. 1. no. 1. pp. 3–7.
30. Berendsohn W.G., Seltman P. Using geographical and taxonomic metadata to set priorities in specimen digitization // Biodiversity Informatics. 2010. vol. 7. no. 2. pp. 120–129.
Опубликован
Как цитировать
Раздел
Copyright (c) Антон Михайлович Лях
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями: Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале. Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале. Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).