Mardi 03 Décembre 2024

Aidez-nous à identifier les lacunes

  • Imprimer cette rubrique
  • Agrandir la taille du texte
  • Réduire la taille du texte

Un nouvel outil vise à soutenir les efforts permanents de la communauté GBIF pour identifier et remplir les lacunes et les biais dans les données accessibles via le GBIF.

Capture d’écran de quelques jeux de données ajoutés à la liste via l’outil Suggest a Dataset.

 

Un instantané de certains ensembles de données ajoutés au référentiel d'évaluation via l'outil Suggérer un jeu de données.

 

Malgré les 800 millions d’enregistrements d’occurrences mis à disposition, nous ne faisons pas mystère des lacunes géographiques et technologiques existantes parmi les données mobilisées dans le réseau GBIF.

Le Défi Ebbe-Nielsen de l’an dernier était consacré à ce problème et récemment, un article de Julien Troudet et al. paru dans Scientific Reports a mis en lumière certaines des causes liées aux biais entraînant des lacunes taxonomiques.

Avec la mise en place du nouveau site GBIF.org, et l’établissement de nouvelles priorités de mobilisation des données, le GBIF est prêt à mener un effort d’identification et de comblement des lacunes de données sur le long-terme. C’est pourquoi nous souhaitons présenter un nouvel outil pour faciliter cet effort.

 

Parfois, les lacunes existent car il n’y a pas de données.

Mais dans d’autres cas, les chercheurs publient des données importantes (liées à des articles parus dans des revues à comité de lecture) sous forme d’images ou dans des formats propriétaires, ou encore dans des entrepôts aux thématiques diverses dans lesquels elles sont peu accessibles et réutilisables. Et c’est à ce sujet que nous avons besoin de votre aide.

 

C’est pourquoi nous vous présentons l’outil Suggest a dataset : il s’agit d’un outil simple, facile à prendre en main et disponible sur Internet, qui vous permet de signaler des données importantes que vous souhaiteriez voir apparaître sur le site GBIF.org. Si vous avez connaissance de jeux de données de ce genre, nous vous demandons de fournir au moins les quelques informations suivantes :

  • Titre : le nom du jeu de données
  • Lien : endroit (URL) où nous pouvons trouver les données
  • Couverture géographique : par exemple Amérique du Sud, Bornéo, Antarctique
  • Couverture taxonomique : par exemple amphibiens, chauve-souris, Gastropoda

 

Vous pouvez bien sûr fournir d’autres détails, comme le type de jeu de données, la licence associée ou encore pourquoi vous pensez qu’il est particulièrement important d’inclure ces données sur le site GBIF.org.

 

Tous les jeux de données proposés via Suggest a dataset seront entrés dans un entrepôt GitHub créé spécifiquement pour permettre leur suivi. A partir de cet entrepôt, le Secrétariat du GBIF évaluera les propositions et prendra les mesures adéquates pour inciter les points nodaux et éditeurs de données concernés à travailler de concert avec les détenteurs de données pour partager ces jeux de données à plus grande échelle. Cet entrepôt GitHub étant accessible de façon publique, vous pourrez suivre vous-mêmes l’évolution de la prise en charge des jeux de données que vous avez recommandés.

 

Ne perdez pas de temps, découvrez Suggest a dataset et aidez la communauté GBIF à combler les lacunes de données !

 

Vous pouvez trouvez l'article original (en anglais) ici

Revenir en haut