Il s’agit de préciser ici quelques règles, voulues améliorées, destinées à permettre et de mieux fonder le respect nécessaire de la Paternité, tout comme la confidentialité éventuelle, des données naturalistes. Ce n’est pas ici une invention de ma part, mais de la valorisation des principes qui me paraissent les plus pertinents faisant suite à une importante expérience en termes de gestion de données naturalistes1.
Quelques principes importants
- Une donnée doit rester authentique même si elle est diffusée sous contexte de respect du RGPD ou de confidentialité (à la demande des auteurs ou pour des raisons de conservation des espèces), des localités, des propriétés ou des habitats.
- Une donnée ne se vend pas (nc !), une donnée ne se dégrade pas (nd !), elle ne doit jamais être séparée de son auteur (paternité) ou de sa source (by !), elle peut être confidentielle un temps (©) (pas plus de 20 ans), éventuellement le temps nécessaire à la sécurisation du contexte nécessaire à la bonne conservation des espèces et des habitats.
- Une donnée anonyme, anonymisée, présentée avec un pseudonyme perd une part importante de sa valeur scientifique et ceci doit être évité par tous les moyens possibles. La dispersion de telles données sera propre à ajouter un désordre à venir dans la lisibilité des connaissances et altère gravement leur fondement ou leur validité.
- Noter que certains naturalistes « sérieux » préfèrent de plus en plus conserver leurs données dans leurs carnets et leurs tiroirs, plutôt que de les partager avec des plateformes ou des gestionnaires ne respectant pas l’authenticité des observations ! Elles sont perdues à jamais, peut-être !
Nous sommes dans un contexte où on a pu constater récemment quelques pas en arrière2 de la part de certaines structures naturalistes, en particulier dans le cadre d’un respect « à la lettre » du RGPD (Règlement Général sur la Protection des Données ➚). Si tout tend progressivement vers l’amélioration, les concepts pour y répondre ne sont pas encore tous mis en place et le plus grave est que nombre de données altérées ont désormais fuité et tendent à polluer la qualité d’un ensemble fondamentalement meilleurs s’il restait authentique.
Sur la base de la méthode du GBIF ➚, spécialiste mondial de la question des données naturalistes, je résume ici quelques préconisations qui sont conformes à la règlementation et l’acceptation de la « publication » des données naturalistes par chacun.
Commentaires et explications…
En France, les études naturalistes réalisées sur des fonds publiques sont du domaine publique dans la mesure où les sources sont respectées. A celles-ci s’apposent la grande majorité des données naturalistes qui sont rassemblées, étudiées et validées par des observateurs amateurs ou professionnels, de manière participative, volontaire et très régulièrement publiées désormais sur des plateformes Internet (Faune France, Biodiv’, Kollect, Cettia, GBIF, OpenObs, INPN, etc.). Les publications sont parfois éphémères (à ce sujet il convient de dire que « publié un jour est publié pour toujours » !) ou plus permanentes, tantôt intégrales, tantôt simplifiées… mais aussi dégradées ou floutées et même anonymisées. Ces trois dernières options sont absolument à proscrire dans la mesure où celles-ci sont à même de conduire à un fort désordre, et, une désorganisation de la validité scientifique des informations naturalistes. Des effets de la trop grande complexité et de la désorganisation conduisent désormais certains auteurs à complètement effacer la Paternité des observations ce qui prive celles-ci de tout fondement scientifique sérieux. Le principe du GBIF ➚, mais aussi appliqué sur des bases importantes comme celle sur les Odonates de l’Afrique ➚ par exemple, consiste à associer une licence à chacune des données. Cette licence est de l’ordre du ©opyright, mais aussi libre, avec certains droits réservés, sur la base des licences ©réactives ©ommons ➚. Par ailleurs, la confidentialité des données, ou leur libération est préconisée selon un pas de temps de 20 ans (à éventuellement adapter), sur la base des préconisations pratiquées depuis des décennies par le CSCF ➚ (Centre Suisse de Cartographie de la Faune, désormais info fauna) qui a une expérience beaucoup plus longue en la matière que le Muséum et l’INPN ➚ (Inventaire National du Patrimoine Naturel).
Je résume les contextes et les options de licences ci-dessous (accompagnés de crochets explicitant les éléments clés utiles), qui me semblent acceptables pour la France et applicables lors de la diffusion mondialisée des données sur Internet :
- 1. Étude publique, financée sur des fonds de la collectivité : ©© bync [Etude publique]
- 2. Autres données naturalistes :
- 2A. Données sans licence ou non confidentielles (généralement à publication au moins éphémères) :
- 2Aa. Autorisation (éventuel formulaire en ligne !) et demande explicite des naturalistes à ce que leurs données restent authentiques (Paternité exigée) : ©© byncnd [Altération interdite]
- 2Ab. Sans précisions ou demande explicite : données de moins de 20 ans : © [RGPD pendant 20 ans] et au-delà de 20 ans : ©© byncsa
- 2B. Données confidentielles (à la demande des observateurs, ou, cas § 2C) : données de moins de 20 ans : © [Confidentielle pendant 20 ans], c’est alors une obligation, de plus de 20 ans, levée de la confidentialité : ©© byncsa [Libérée]. Si de telles données peuvent se trouver résumées, elles ne doivent pas être dégradées pour autant.
- 2C. Données naturalistes sensibles, masquées (ou floutées – mauvaise option, on doit préférer des versions résumées et annoncées comme telles) : non diffusées, autrement que de manière résumées, ces données restent des informations et des repères, mais en aucun cas des données naturalistes proprement dites. Elles peuvent être présentées comme des méta-données, associées à un contexte. Elles peuvent participer à la conservation des espèces et des habitats dans un cadre de diffusion confidentiel. Et, elles devraient être traités selon les modalités de données confidentielles (voir § 2B ci-dessous) et la levée de confidentialité doit cesser dès que les modalités de sécurisation des sites et des informations deviennent efficients et efficaces : © [Confidentielle] aussi longtemps que nécessaire… et pas plus !
- 2A. Données sans licence ou non confidentielles (généralement à publication au moins éphémères) :
Les cas nouveaux de données robotisées, réalisées à partir d’appareils ou caméras automatiques, obtenues par des satellites, objets des analyses génétiques environnementales… ne sont pas discutées ici, celles-si généralement fiables à très fiables (pas toujours !), relèvent d’une association avec l’analyste, les équipes de chercheurs ou les observateurs des résultats qui les mettent en forme… mais ici intervient désormais les nouveautés de l’intelligence artificielle (qui intervient ?). Données fiables, certes… mais il convient d’asseoir les sources, les origines, les analystes afin de leur donner un valeur scientifique pérenne. Il s’agit de savoir d’où proviennent ces données naturalistes.
- Je participe à la gestion de données naturalistes dans divers domaines depuis de nombreuses années, par exemple dans le cadre d’activités de coordinations de projets importants comme çà a été le cas avec feue, la Société française d’Odonatologie en Provence ou le Groupe Sympetrum pour les Odonates (mise en place et coordination des projets, ZNIEFF seconde génération, atlas rhônalpin en 2008, atlas départementaux comme en Savoie, Isère, Loire ou Drôme…, listes rouges pour les départements de Rhône-Alpes et les Hautes-Alpes ou en Provence, éléments de fondation de l’atlas provençal…) mais aussi pour la préparation de Listes rouges départementales ou régionales sur les Amphibiens et Reptiles, les Vertébrés terrestres ou les Poissons (Isère, ) avec le Centre Ornithologique Rhône-Alpes ou la Ligue de Protection des Oiseaux, avec des expérimentations dans le domaine des priorités de connaissance ou de conservation pour les Vertébrés de l’Isère avec David Loose. Il a été même l’objet de la rédaction d’un ouvrage à partir d’une base de donnée, sur la Flore de l’Isle Crémieu avec mes amis de Lo Parvi. Mes activités se concentrent actuellement sur la poursuite de la dynamique Entre Amis en particulier sur le département de l’Isère, recentré désormais aussi sur les Hautes-Alpes, et en accompagnement avec celle-ci par la Drôme avec Jean-Michel Faton, qui a établi les fondements de cette dynamique naturaliste conviviale et constructive. Dans ce contexte le réseau d’informateurs de la base Entre Amis a régulièrement fourni des données, tant sur la flore que sur la faune qui sortent de ces départements. Tout ceci participe de la logique de valorisation des connaissances que je mène depuis longue date avec quelques collaborateurs éphémères dans le cadre des Histoires Naturelles. ↩︎
- L’histoire des données scientifiques est le fruit d’un très long et complexe débat qui a été entamé dès la fin du XIXe siècle et qui a eu un âge d’or au début du XXe siècle dans la communauté scientifique. En ce qui concerne les données naturalistes en France, elles furent l’objets d’échanges complexes avec le Secrétariat Faune Flore et le Muséum National d’Histoire Naturelles, dans les années 1970-1980, qui furent un frein à la diffusion partagée des connaissances conduisant à des phénomènes de rétention conservatoire des données. Le cadre d’études d’oiseaux comme les Faucons pèlerins, ou, les Hiboux Grand-Duc est bien connu et le phénomène de protection par rétention des informations perdure encore. Depuis le début des années 2010 on est passé à une aire de plus grand partage et de meilleure diffusion, avec, tous les ajustements que cela comporte. Il est désormais devenu assez facile, pour qui s’en donne les moyens, d’accéder à de très importantes masses d’observations naturalistes… mais leur analyse correcte demande à ce que les données diffusées restent authentiques et non dégradées. On a vu par exemple très récemment une Synthèse sur les Odonates du Monde effaçant toutes les sources, les auteurs et quasiment l’origine des informations. Ce type de synthèse est utile, mais ne répond plus aux fondements d’une véritable Science ou le savoir est établi sur des fondations solides ou consolidées. On lira régulièrement en ligne des Atlas ou des synthèses dont les fondations et la validité des données ne sont pas complètement fondés. Ce sont des objets d’illustration et d’information générales qu’il est souvent délicat d’utiliser à des fins de « réelle » connaissance ou de conservation effective des espèces et des habitats. ↩︎