Loading...
DĂšs le dĂ©but de vos recherches, vous allez collecter, produire et exploiter des donnĂ©es. La gestion des donnĂ©es (Research Data Management - RDM) fait partie du processus de recherche. Elle concerne l'ensemble des opĂ©rations de collecte, description, stockage, traitement, analyse, archivage et mise en accĂšs des donnĂ©es. (extrait de : Passeport pour la Science Ouverte. Guide pratique pour les doctorants ) "La science ouverte est la diffusion sans entrave des publications et des donnĂ©es de la recherche. Elle s’appuie sur l’opportunitĂ© que reprĂ©sente la mutation numĂ©rique pour dĂ©velopper l’accĂšs ouvert aux publications et – autant que possible – aux donnĂ©es de la recherche. "Les donnĂ©es de la recherche sont la matiĂšre premiĂšre de la connaissance. Les partager, c'est ouvrir de nouvelles perspectives scientifiques" Source : Plan national pour la Science ouverte - MinistĂšre ESR - Juillet 2018 Source image : https://bibliotheques.univ-tlse3.fr/file/composantes-science-ouverte Cette page est une introduction Ă  la gestion des donnĂ©es de recherche. Elle prĂ©sente quelques concepts et Ă©tapes clĂ©s pour vous engager dans cette dĂ©marche. Consultez les liens pour approfondir vos connaissances. ‱ What are data ? DĂ©finition des donnĂ©es de recherche de l’OCDE (2007) « Enregistrements factuels (chiffres, textes, images, sons) utilisĂ©s comme source principale pour la recherche scientifique et gĂ©nĂ©ralement reconnus par la communautĂ© scientifique comme nĂ©cessaires pour valider les rĂ©sultats de la recherche. Un ensemble de donnĂ©es de recherche constitue une reprĂ©sentation systĂ©matique et partielle du sujet faisant l’objet de la recherche ». Exemples ‱ les images d’une ville prĂ©historique deviennent des donnĂ©es pour un chercheur qui Ă©tudie l’histoire de cette ville; ‱ les « donnĂ©es » d’un linguiste peuvent ĂȘtre des Ă©crits ou des discours, des enregistrements de locuteurs ; ‱ les « donnĂ©es » d’un mĂ©diĂ©viste sont des sources archivistiques, archĂ©ologiques, Ă©pigraphiques, iconographiques, littĂ©raires ; ‱ les « donnĂ©es » d’un gĂ©ologue rassemblent des coupes et observations de terrain consignĂ©es sur un carnet, des rĂ©sultats de carottage, des analyses d’échantillons, des donnĂ©es sismographiques
 ‱ ‱ Pourquoi partager ses donnĂ©es ? "La science ouverte vise Ă  construire un Ă©cosystĂšme dans lequel la science est plus cumulative, plus fortement Ă©tayĂ©e par des donnĂ©es, plus transparente, plus rapide et d’accĂšs plus universel.La science ouverte favorise Ă©galement les avancĂ©es scientifiques, particuliĂšrement les avancĂ©es imprĂ©vues, ainsi que l’innovation, les progrĂšs Ă©conomiques et sociaux, en France, dans les pays dĂ©veloppĂ©s et dans les pays en dĂ©veloppement. Enfin, la science ouverte constitue un levier pour l’intĂ©gritĂ© scientifique et favorise la confiance des citoyens dans la science. Elle constitue un progrĂšs scientifique et un progrĂšs de sociĂ©tĂ©." Source : Plan national pour la Science Ouverte (2018) Les enjeux de l'Open Data ‱ enjeux patrimoniaux o preuve et mĂ©moire (Ă©viter les pertes de donnĂ©es) ‱ enjeux Ă©conomiques o valeur Ă©conomique de la donnĂ©e o rĂ©utilisation gratuite ou payante des donnĂ©es, exploitation des rĂ©sultats de recherches antĂ©rieures (Ă©viter de refaire ce qui a dĂ©jĂ  Ă©tĂ© validĂ©), o accĂ©lĂ©ration de l'innovation et le retour sur investissement dans la R&D ‱ enjeux scientifiques o de "hypothesis-driven" Ă  "data-driven" o plus de visibilitĂ© pour le scientifique ‱ enjeux sociĂ©taux o participation des citoyens et de la sociĂ©tĂ© civile : "Citizen science" o confiance en la recherche Pour aller plus loin ‱ Site Doranum : https://doranum.fr/enjeux-benefices/fiche-synthetique/ ‱ Adopter de bonnes pratiques tout au long du cycle de vie des donnĂ©es De bonnes pratiques de gestion Ă  toutes les Ă©tapes du cycle de vie de la donnĂ©e sont un prĂ©alable indispensable Ă  l’ouverture des donnĂ©es et Ă  leur rĂ©utilisation. ‱ Rechercher des donnĂ©es Pour identifier des jeux de donnĂ©es (datasets) pertinents pour votre thĂšse, des outils de recherche sont disponibles. Suivez ces liens pour les dĂ©couvrir : ‱ Site Doranum : https://doranum.fr/acces-visualisation/rechercher-donnees/ ‱ Site DataCC - Vos besoins, trouver des donnĂ©es : https://www.datacc.org/vos-besoins/trouver-des-donnees/ ‱ Fiche CoopIST : Trouver des jeux de donnĂ©es via des bases pluridisciplinaires et des moteurs de recherche Pensez-aussi Ă  consulter l'entrepĂŽt institutionnel Data INRAE Page de prĂ©sentation du portail ‱ Choisir les bons formats et bien organiser vos donnĂ©es  Choisir des formats de fichier : https://www6.inrae.fr/datapartage/Gerer/Choisir-des-formats-de-fichier  Nommer et organiser vos fichiers de donnĂ©es : https://www6.inrae.fr/datapartage/Gerer/Nommer-et-organiser-ses-fichiers-de-donnees Pour aller plus loin ‱ Jaouen, G.- GĂ©rer ses donnĂ©es. Pourquoi, Comment ? SĂ©minaire - Guadeloupe, du 25 au 27 Novembre 2019 – CRAG INRA ‱ Bien dĂ©crire et documenter ses donnĂ©es La description d’un jeu de donnĂ©es se fait Ă  l’aide de mĂ©tadonnĂ©es (*) qui doivent apporter suffisamment d'Ă©lĂ©ments (sur la collecte des donnĂ©es, les unitĂ©s de mesure employĂ©es...) pour chercher et trouver le jeu de donnĂ©es, juger de sa qualitĂ©/fiabilitĂ©, et pouvoir le comprendre ou le rĂ©utiliser dans un autre contexte. (*) DĂ©finition des mĂ©tadonnĂ©es : Ensemble d’informations structurĂ©es qui dĂ©crit, explicite, localise une ressource informationnelle, dans le but d’en faciliter la recherche, l’usage, et la gestion. Source : NISO. Understanding Metadata. 2004. Quelques liens utiles : ‱ Site Doranum : https://doranum.fr/metadonnees-standards-formats/ ‱ DataCC : https://www.datacc.org/vos-besoins/documenter-ses-donnees/metadonnees/ ‱ Site DataPartage INRAE : https://www6.inrae.fr/datapartage/Gerer/Documenter-les-donnees En complĂ©ment des mĂ©tadonnĂ©es, la rĂ©daction d'un fichier READ ME.txt est Ă©galement recommandĂ©e. ‱ Stocker, sĂ©curiser, prĂ©server ses donnĂ©es Bien diffĂ©rencier les notions de stockage et d'archivage. Anticiper pour dĂ©terminer les donnĂ©es Ă  Ă©liminer et celles qui doivent ĂȘtre prĂ©servĂ©es Ă  long terme. ‱ Dans l'environnement INRAE : https://www6.inrae.fr/datapartage/Gerer/Stocker-les-donnees ‱ Site Doranum : https://doranum.fr/stockage-archivage/ ‱ Site DataCC : https://www.datacc.org/vos-besoins/conserver-ses-donnees/ ‱ Partager, ne pas partager ses donnĂ©es ? Dans le cadre de la Science Ouverte, il y a de plus en plus d'incitations voire d'exigences pour rendre accessibles les donnĂ©es, en particulier les donnĂ©es liĂ©es aux publications : ‱ de l'Ă©dition scientifique : de plus en plus de revues adoptent une "data policy" (Ă  consulter dans les instructions aux auteurs) et exigent des auteurs qu'ils fournissent les donnĂ©es associĂ©es aux publications, ‱ des organismes de financement (ANR, Commission EuropĂ©enne ...), ‱ des politiques nationale (Plan national pour la Science ouverte - MinistĂšre ESR - Juillet 2018) et institutionnelle. Mais attention, toutes les donnĂ©es ne sont pas partageables : assurez-vous que vos donnĂ©es sont bien diffusables au regard du droit et des conditions d'exercice de votre thĂšse et de son mode de financement (se reporter Ă  votre contrat de thĂšse). Les donnĂ©es produites dans les organismes de recherche publics sont communicables Ă  tous si elles n'entrent pas dans le cadre d'exceptions lĂ©gales (sĂ©curitĂ© dĂ©fense, sĂ©curitĂ© des populations, patrimoine scientifique et technique, donnĂ©es personnelles, donnĂ©es liĂ©es au secret, statistique, etc.) Liens utiles : ‱ sur le site Data Partage, la page Partager-Publier ou la page : "DonnĂ©es de la recherche : qui a les droits, qui doit partager ?" ‱ le site INRAE dĂ©diĂ© Ă  la protection des donnĂ©es personnelles et l'application du RGPD (RĂšglement gĂ©nĂ©ral sur la protection des donnĂ©es) : https://intranet.inrae.fr/cil-dpo ‱ Valoriser ses donnĂ©es Voici les principales voies de diffusion ‱  Partager ses donnĂ©es en les dĂ©posant dans un entrepĂŽt  Choisir un entrepĂŽt  DĂ©poser dans Data INRAE  Partager ses donnĂ©es comme matĂ©riel supplĂ©mentaire d'un article (Ă  la demande de l'Ă©diteur)  Publier un Data Paper (article de donnĂ©es) : la meilleure voie en terme de visibilitĂ© des donnĂ©es, et pour faciliter leur rĂ©utilisation. Pour aller plus loin ‱ Site Doranum o DĂ©pĂŽts et entrepĂŽts. Comment et oĂč dĂ©poser mes donnĂ©es ? o Data papers et Data journals. Comment publier mes donnĂ©es comme un article scientifique ? ‱ Site DataCC o Valoriser ses donnĂ©es ‱ Site CoopIST o DĂ©poser des donnĂ©es de recherche dans un entrepĂŽt o RĂ©diger et publier un data paper dans une revue scientifique A tĂ©lĂ©charger : SynthĂšse du processus de rĂ©daction d'un article avec des donnĂ©es associĂ©es ‱ Pourquoi ne pas rĂ©diger un plan de gestion de donnĂ©es (PGD) pour votre thĂšse ? La thĂšse peut ĂȘtre assimilĂ©e Ă  un projet et certaines universitĂ©s au Royaume Uni, aux Pays-Bas et plus rĂ©cemment en France prĂ©conisent la rĂ©daction d'un plan de gestion associĂ© Ă  la thĂšse. Le PGD (ou DMP = Data Management Plan) est un outil de planification qui peut vous aider Ă  anticiper et bien gĂ©rer toutes les Ă©tapes du cycle de vie de vos donnĂ©es, Ă  limiter les risques de perte ou corruption de donnĂ©es, Ă  adopter de bonnes pratiques de gestion, pour in fine produire des donnĂ©es respectueuses des principes FAIR, adoptĂ©s aujourd'hui par l'ensemble des acteurs de la recherche. Il est dĂ©sormais exigĂ© par la plupart des financeurs de la recherche (Commission EuropĂ©enne et ANR ...) dans le cadre de projets financĂ©s. RĂ©diger un PGD pour votre thĂšse, peut ĂȘtre un bon exercice pour vous prĂ©parer Ă  la future rĂ©daction de rĂ©ponses Ă  des appels d'offre. Comment faire en pratique ? ‱ Site DataPartage : Pourquoi et comment rĂ©diger un plan de gestion de donnĂ©es ? ‱ Site Doranum : https://doranum.fr/plan-gestion-donnees-dmp/, La minute vidĂ©o PGD ‱ Site DataCC : https://www.datacc.org/bonnes-pratiques/adopter-un-plan-de-gestion-des-donnees/ ‱ Suivre une classe virtuelle INRAE : Open Class "RĂ©daction d'un PGD" ‱ Produire des donnĂ©es FAIR ! Favoriser la production de donnĂ©es FAIR (Findable - Accessible - Interoperable - Reusable) est aujourd'hui un objectif soutenu par l'ensemble des acteurs de la recherche. Source : https://open-science-training-handbook.gitbook.io/book/ Si vous suivez les conseils et recommandations de cette page, vous avez toutes les chances d'avoir produit des donnĂ©es de qualitĂ©. Si vous prĂ©fĂ©rez une version illustrĂ©e : "Pensez FAIR" - https://datapartage.inrae.fr/Gerer/Cycle-de-la-donnee Affiche cycle de vie des donnĂ©es rĂ©alisĂ©e dans le cadre des Missions QualiNous & RGPD, INRAE-ACT Vous pouvez tester le niveau de "Fairification" de vos donnĂ©es grĂące Ă  ces outils :  ARDC : https://ardc.edu.au/resources/working-with-data/fair-data/fair-self-assessment-tool ‱ D'autres ressources pour se former ou s'autoformer En interne INRAE ‱ Formation Ă  la science ouverte OSCAR - Module "Gestion et partage des donnĂ©es" ‱ Le site "Gestion et partage des donnĂ©es" ‱ Des classes virtuelles d'environ 2h (Open Class) sont rĂ©guliĂšrement proposĂ©es sur : o la rĂ©daction des plans de gestion de donnĂ©es, o le dĂ©pĂŽt et la description d'un jeu de donnĂ©es dans Data INRAE, o la rĂ©daction et la publication de data papers, Sites externes ‱ Le site DORANUM (DonnĂ©es de la Recherche : Apprentissage NUMĂ©rique Ă  la gestion et au partage) propose un dispositif de formation Ă  distance intĂ©grant de nombreuses ressources d’auto-formation dĂ©clinĂ©es sur diffĂ©rents supports (textes, infographies, vidĂ©os) et sur 9 thĂ©matiques. o Parcours interactif sur la gestion des donnĂ©es de la recherche (2020) o ‱ Le site DataCC. Accompagnement Ă  la gestion des donnĂ©es de recherche en physique et en chimie : https://www.datacc.org/ o Data Stories : https://www.datacc.org/reseau-datacc/data-stories/ o ‱ Le dossier "Open Access & Open Data" rĂ©alisĂ© par l'Ecole des Ponts - ParisTech ‱ ‱ The Open Science Training Handbook : https://www.ouvrirlascience.fr/the-open-science-training-handbook/ | Quizalize