Retrieving biodiversity data from multiple sources: making secondary data standardised and accessible

Nubia Marques; Carla Danielle de Melo Soares; Daniel de Melo Casali; Erick Cristofore Guimarães; Fernanda Guimarães Fava; João Marcelo da Silva Abreu; Ligiane Martins Moras; Letícia Gomes da Silva; Raphael Matias; Rafael Leandro de Assis; Rafael Fraga; Sara Miranda Almeida; Vanessa Guimarães Lopes; Verônica Oliveira; Rafaela Missagia; Eduardo Costa Carvalho; Nikolas Jorge Carneiro; Ronnie Alves; Pedro Souza-Filho; Guilherme Oliveira; Margarida Miranda; Valéria da Cunha Tavares

doi:10.3897/BDJ.12.e133775

Retrieving biodiversity data from multiple sources: making secondary data standardised and accessible

Biodivers Data J. 2024 Sep 20:12:e133775. doi: 10.3897/BDJ.12.e133775. eCollection 2024.

Authors

Nubia Marques¹, Carla Danielle de Melo Soares¹, Daniel de Melo Casali¹, Erick Cristofore Guimarães¹, Fernanda Guimarães Fava¹, João Marcelo da Silva Abreu^{1

2}, Ligiane Martins Moras¹, Letícia Gomes da Silva¹, Raphael Matias^{1

3}, Rafael Leandro de Assis¹, Rafael Fraga¹, Sara Miranda Almeida¹, Vanessa Guimarães Lopes¹, Verônica Oliveira¹, Rafaela Missagia¹, Eduardo Costa Carvalho¹, Nikolas Jorge Carneiro¹, Ronnie Alves¹, Pedro Souza-Filho^{1

4}, Guilherme Oliveira¹, Margarida Miranda¹, Valéria da Cunha Tavares^{1

5

6}

Affiliations

¹ Vale Institute of Technology, Belém, Brazil Vale Institute of Technology Belém Brazil.
² Universidade Estadual do Maranhão, São Luís, Brazil Universidade Estadual do Maranhão São Luís Brazil.
³ Federal University of Jataí, Jataí, Brazil Federal University of Jataí Jataí Brazil.
⁴ Instituto de Geociências, Universidade Federal do Pará, Pará, Brazil Instituto de Geociências, Universidade Federal do Pará Pará Brazil.
⁵ Museu Paraense Emílio Goeldi, MPEG, Pós-graduação em Biodiversidade e Evolução, Belém, Brazil Museu Paraense Emílio Goeldi, MPEG, Pós-graduação em Biodiversidade e Evolução Belém Brazil.
⁶ Pós-Graduação em Zoologia & Laboratório de Mamíferos, Departamento de Sistemática e Ecologia, Universidade Federal da Paraíba, João Pessoa, Brazil Pós-Graduação em Zoologia & Laboratório de Mamíferos, Departamento de Sistemática e Ecologia, Universidade Federal da Paraíba João Pessoa Brazil.

Abstract

Biodiversity data, particularly species occurrence and abundance, are indispensable for testing empirical hypothesis in natural sciences. However, datasets built for research programmes do not often meet FAIR (findable, accessible, interoperable and reusable) principles, which raises questions about data quality, accuracy and availability. The 21^st century has markedly been a new era for data science and analytics and every effort to aggregate, standardise, filter and share biodiversity data from multiple sources have become increasingly necessary. In this study, we propose a framework for refining and conforming secondary biodiversity data to FAIR standards to make them available for use such as macroecological modelling and other studies. We relied on a Darwin Core base model to standardise and further facilitate the curation and validation of data related including the occurrence and abundance of multiple taxa of a region that encompasses estuarine ecosystems in an ecotonal area bordering the easternmost Amazonia. We further discuss the significance of feeding standardised public data repositories to advance scientific progress and highlight their role in contributing to the biodiversity management and conservation.

Keywords: Darwin Core standard; FAIR data; Golfão Maranhense; secondary data.

Nubia Marques, Carla Danielle de Melo Soares, Daniel de Melo Casali, Erick Cristofore Guimarães, Fernanda Guimarães Fava, João Marcelo da Silva Abreu, Ligiane Martins Moras, Letícia Gomes da Silva, Raphael Matias, Rafael Leandro de Assis, Rafael Fraga, Sara Miranda Almeida, Vanessa Guimarães Lopes, Verônica Oliveira, Rafaela Missagia, Eduardo Costa Carvalho, Nikolas Jorge Carneiro, Ronnie Alves, Pedro Souza-Filho, Guilherme Oliveira, Margarida Miranda, Valéria da Cunha Tavares.