
DĂšs le dĂ©but de vos recherches, vous allez collecter, produire et exploiter des donnĂ©es. La gestion des donnĂ©es (Research Data Management - RDM) fait partie du processus de recherche. Elle concerne l'ensemble des opĂ©rations de collecte, description, stockage, traitement, analyse, archivage et mise en accĂšs des donnĂ©es. (extrait de : Passeport pour la Science Ouverte. Guide pratique pour les doctorants ) "La science ouverte est la diffusion sans entrave des publications et des donnĂ©es de la recherche. Elle sâappuie sur lâopportunitĂ© que reprĂ©sente la mutation numĂ©rique pour dĂ©velopper lâaccĂšs ouvert aux publications et â autant que possible â aux donnĂ©es de la recherche. "Les donnĂ©es de la recherche sont la matiĂšre premiĂšre de la connaissance. Les partager, c'est ouvrir de nouvelles perspectives scientifiques" Source : Plan national pour la Science ouverte - MinistĂšre ESR - Juillet 2018 Source image : https://bibliotheques.univ-tlse3.fr/file/composantes-science-ouverte Cette page est une introduction Ă la gestion des donnĂ©es de recherche. Elle prĂ©sente quelques concepts et Ă©tapes clĂ©s pour vous engager dans cette dĂ©marche. Consultez les liens pour approfondir vos connaissances. âą What are data ? DĂ©finition des donnĂ©es de recherche de lâOCDE (2007) « Enregistrements factuels (chiffres, textes, images, sons) utilisĂ©s comme source principale pour la recherche scientifique et gĂ©nĂ©ralement reconnus par la communautĂ© scientifique comme nĂ©cessaires pour valider les rĂ©sultats de la recherche. Un ensemble de donnĂ©es de recherche constitue une reprĂ©sentation systĂ©matique et partielle du sujet faisant lâobjet de la recherche ». Exemples âą les images dâune ville prĂ©historique deviennent des donnĂ©es pour un chercheur qui Ă©tudie lâhistoire de cette ville; âą les « donnĂ©es » dâun linguiste peuvent ĂȘtre des Ă©crits ou des discours, des enregistrements de locuteurs ; âą les « donnĂ©es » dâun mĂ©diĂ©viste sont des sources archivistiques, archĂ©ologiques, Ă©pigraphiques, iconographiques, littĂ©raires ; âą les « donnĂ©es » dâun gĂ©ologue rassemblent des coupes et observations de terrain consignĂ©es sur un carnet, des rĂ©sultats de carottage, des analyses dâĂ©chantillons, des donnĂ©es sismographiques⊠⹠⹠Pourquoi partager ses donnĂ©es ? "La science ouverte vise Ă construire un Ă©cosystĂšme dans lequel la science est plus cumulative, plus fortement Ă©tayĂ©e par des donnĂ©es, plus transparente, plus rapide et dâaccĂšs plus universel.La science ouverte favorise Ă©galement les avancĂ©es scientifiques, particuliĂšrement les avancĂ©es imprĂ©vues, ainsi que lâinnovation, les progrĂšs Ă©conomiques et sociaux, en France, dans les pays dĂ©veloppĂ©s et dans les pays en dĂ©veloppement. Enfin, la science ouverte constitue un levier pour lâintĂ©gritĂ© scientifique et favorise la confiance des citoyens dans la science. Elle constitue un progrĂšs scientifique et un progrĂšs de sociĂ©tĂ©." Source : Plan national pour la Science Ouverte (2018) Les enjeux de l'Open Data âą enjeux patrimoniaux o preuve et mĂ©moire (Ă©viter les pertes de donnĂ©es) âą enjeux Ă©conomiques o valeur Ă©conomique de la donnĂ©e o rĂ©utilisation gratuite ou payante des donnĂ©es, exploitation des rĂ©sultats de recherches antĂ©rieures (Ă©viter de refaire ce qui a dĂ©jĂ Ă©tĂ© validĂ©), o accĂ©lĂ©ration de l'innovation et le retour sur investissement dans la R&D âą enjeux scientifiques o de "hypothesis-driven" Ă "data-driven" o plus de visibilitĂ© pour le scientifique âą enjeux sociĂ©taux o participation des citoyens et de la sociĂ©tĂ© civile : "Citizen science" o confiance en la recherche Pour aller plus loin âą Site Doranum : https://doranum.fr/enjeux-benefices/fiche-synthetique/ âą Adopter de bonnes pratiques tout au long du cycle de vie des donnĂ©es De bonnes pratiques de gestion Ă toutes les Ă©tapes du cycle de vie de la donnĂ©e sont un prĂ©alable indispensable Ă lâouverture des donnĂ©es et Ă leur rĂ©utilisation. âą Rechercher des donnĂ©es Pour identifier des jeux de donnĂ©es (datasets) pertinents pour votre thĂšse, des outils de recherche sont disponibles. Suivez ces liens pour les dĂ©couvrir : âą Site Doranum : https://doranum.fr/acces-visualisation/rechercher-donnees/ âą Site DataCC - Vos besoins, trouver des donnĂ©es : https://www.datacc.org/vos-besoins/trouver-des-donnees/ âą Fiche CoopIST : Trouver des jeux de donnĂ©es via des bases pluridisciplinaires et des moteurs de recherche Pensez-aussi Ă consulter l'entrepĂŽt institutionnel Data INRAE Page de prĂ©sentation du portail âą Choisir les bons formats et bien organiser vos donnĂ©es ï§ Choisir des formats de fichier : https://www6.inrae.fr/datapartage/Gerer/Choisir-des-formats-de-fichier ï§ Nommer et organiser vos fichiers de donnĂ©es : https://www6.inrae.fr/datapartage/Gerer/Nommer-et-organiser-ses-fichiers-de-donnees Pour aller plus loin âą Jaouen, G.- GĂ©rer ses donnĂ©es. Pourquoi, Comment ? SĂ©minaire - Guadeloupe, du 25 au 27 Novembre 2019 â CRAG INRA âą Bien dĂ©crire et documenter ses donnĂ©es La description dâun jeu de donnĂ©es se fait Ă lâaide de mĂ©tadonnĂ©es (*) qui doivent apporter suffisamment d'Ă©lĂ©ments (sur la collecte des donnĂ©es, les unitĂ©s de mesure employĂ©es...) pour chercher et trouver le jeu de donnĂ©es, juger de sa qualitĂ©/fiabilitĂ©, et pouvoir le comprendre ou le rĂ©utiliser dans un autre contexte. (*) DĂ©finition des mĂ©tadonnĂ©es : Ensemble dâinformations structurĂ©es qui dĂ©crit, explicite, localise une ressource informationnelle, dans le but dâen faciliter la recherche, lâusage, et la gestion. Source : NISO. Understanding Metadata. 2004. Quelques liens utiles : âą Site Doranum : https://doranum.fr/metadonnees-standards-formats/ âą DataCC : https://www.datacc.org/vos-besoins/documenter-ses-donnees/metadonnees/ âą Site DataPartage INRAE : https://www6.inrae.fr/datapartage/Gerer/Documenter-les-donnees En complĂ©ment des mĂ©tadonnĂ©es, la rĂ©daction d'un fichier READ ME.txt est Ă©galement recommandĂ©e. âą Stocker, sĂ©curiser, prĂ©server ses donnĂ©es Bien diffĂ©rencier les notions de stockage et d'archivage. Anticiper pour dĂ©terminer les donnĂ©es Ă Ă©liminer et celles qui doivent ĂȘtre prĂ©servĂ©es Ă long terme. âą Dans l'environnement INRAE : https://www6.inrae.fr/datapartage/Gerer/Stocker-les-donnees âą Site Doranum : https://doranum.fr/stockage-archivage/ âą Site DataCC : https://www.datacc.org/vos-besoins/conserver-ses-donnees/ âą Partager, ne pas partager ses donnĂ©es ? Dans le cadre de la Science Ouverte, il y a de plus en plus d'incitations voire d'exigences pour rendre accessibles les donnĂ©es, en particulier les donnĂ©es liĂ©es aux publications : âą de l'Ă©dition scientifique : de plus en plus de revues adoptent une "data policy" (Ă consulter dans les instructions aux auteurs) et exigent des auteurs qu'ils fournissent les donnĂ©es associĂ©es aux publications, âą des organismes de financement (ANR, Commission EuropĂ©enne ...), âą des politiques nationale (Plan national pour la Science ouverte - MinistĂšre ESR - Juillet 2018) et institutionnelle. Mais attention, toutes les donnĂ©es ne sont pas partageables : assurez-vous que vos donnĂ©es sont bien diffusables au regard du droit et des conditions d'exercice de votre thĂšse et de son mode de financement (se reporter Ă votre contrat de thĂšse). Les donnĂ©es produites dans les organismes de recherche publics sont communicables Ă tous si elles n'entrent pas dans le cadre d'exceptions lĂ©gales (sĂ©curitĂ© dĂ©fense, sĂ©curitĂ© des populations, patrimoine scientifique et technique, donnĂ©es personnelles, donnĂ©es liĂ©es au secret, statistique, etc.) Liens utiles : âą sur le site Data Partage, la page Partager-Publier ou la page : "DonnĂ©es de la recherche : qui a les droits, qui doit partager ?" âą le site INRAE dĂ©diĂ© Ă la protection des donnĂ©es personnelles et l'application du RGPD (RĂšglement gĂ©nĂ©ral sur la protection des donnĂ©es) : https://intranet.inrae.fr/cil-dpo âą Valoriser ses donnĂ©es Voici les principales voies de diffusion âą ï§ Partager ses donnĂ©es en les dĂ©posant dans un entrepĂŽt ï§ Choisir un entrepĂŽt ï§ DĂ©poser dans Data INRAE ï§ Partager ses donnĂ©es comme matĂ©riel supplĂ©mentaire d'un article (Ă la demande de l'Ă©diteur) ï§ Publier un Data Paper (article de donnĂ©es) : la meilleure voie en terme de visibilitĂ© des donnĂ©es, et pour faciliter leur rĂ©utilisation. Pour aller plus loin âą Site Doranum o DĂ©pĂŽts et entrepĂŽts. Comment et oĂč dĂ©poser mes donnĂ©es ? o Data papers et Data journals. Comment publier mes donnĂ©es comme un article scientifique ? âą Site DataCC o Valoriser ses donnĂ©es âą Site CoopIST o DĂ©poser des donnĂ©es de recherche dans un entrepĂŽt o RĂ©diger et publier un data paper dans une revue scientifique A tĂ©lĂ©charger : SynthĂšse du processus de rĂ©daction d'un article avec des donnĂ©es associĂ©es âą Pourquoi ne pas rĂ©diger un plan de gestion de donnĂ©es (PGD) pour votre thĂšse ? La thĂšse peut ĂȘtre assimilĂ©e Ă un projet et certaines universitĂ©s au Royaume Uni, aux Pays-Bas et plus rĂ©cemment en France prĂ©conisent la rĂ©daction d'un plan de gestion associĂ© Ă la thĂšse. Le PGD (ou DMP = Data Management Plan) est un outil de planification qui peut vous aider Ă anticiper et bien gĂ©rer toutes les Ă©tapes du cycle de vie de vos donnĂ©es, Ă limiter les risques de perte ou corruption de donnĂ©es, Ă adopter de bonnes pratiques de gestion, pour in fine produire des donnĂ©es respectueuses des principes FAIR, adoptĂ©s aujourd'hui par l'ensemble des acteurs de la recherche. Il est dĂ©sormais exigĂ© par la plupart des financeurs de la recherche (Commission EuropĂ©enne et ANR ...) dans le cadre de projets financĂ©s. RĂ©diger un PGD pour votre thĂšse, peut ĂȘtre un bon exercice pour vous prĂ©parer Ă la future rĂ©daction de rĂ©ponses Ă des appels d'offre. Comment faire en pratique ? âą Site DataPartage : Pourquoi et comment rĂ©diger un plan de gestion de donnĂ©es ? âą Site Doranum : https://doranum.fr/plan-gestion-donnees-dmp/, La minute vidĂ©o PGD âą Site DataCC : https://www.datacc.org/bonnes-pratiques/adopter-un-plan-de-gestion-des-donnees/ âą Suivre une classe virtuelle INRAE : Open Class "RĂ©daction d'un PGD" âą Produire des donnĂ©es FAIR ! Favoriser la production de donnĂ©es FAIR (Findable - Accessible - Interoperable - Reusable) est aujourd'hui un objectif soutenu par l'ensemble des acteurs de la recherche. Source : https://open-science-training-handbook.gitbook.io/book/ Si vous suivez les conseils et recommandations de cette page, vous avez toutes les chances d'avoir produit des donnĂ©es de qualitĂ©. Si vous prĂ©fĂ©rez une version illustrĂ©e : "Pensez FAIR" - https://datapartage.inrae.fr/Gerer/Cycle-de-la-donnee Affiche cycle de vie des donnĂ©es rĂ©alisĂ©e dans le cadre des Missions QualiNous & RGPD, INRAE-ACT Vous pouvez tester le niveau de "Fairification" de vos donnĂ©es grĂące Ă ces outils : ï§ ARDC : https://ardc.edu.au/resources/working-with-data/fair-data/fair-self-assessment-tool âą D'autres ressources pour se former ou s'autoformer En interne INRAE âą Formation Ă la science ouverte OSCAR - Module "Gestion et partage des donnĂ©es" âą Le site "Gestion et partage des donnĂ©es" âą Des classes virtuelles d'environ 2h (Open Class) sont rĂ©guliĂšrement proposĂ©es sur : o la rĂ©daction des plans de gestion de donnĂ©es, o le dĂ©pĂŽt et la description d'un jeu de donnĂ©es dans Data INRAE, o la rĂ©daction et la publication de data papers, Sites externes âą Le site DORANUM (DonnĂ©es de la Recherche : Apprentissage NUMĂ©rique Ă la gestion et au partage) propose un dispositif de formation Ă distance intĂ©grant de nombreuses ressources dâauto-formation dĂ©clinĂ©es sur diffĂ©rents supports (textes, infographies, vidĂ©os) et sur 9 thĂ©matiques. o Parcours interactif sur la gestion des donnĂ©es de la recherche (2020) o âą Le site DataCC. Accompagnement Ă la gestion des donnĂ©es de recherche en physique et en chimie : https://www.datacc.org/ o Data Stories : https://www.datacc.org/reseau-datacc/data-stories/ o âą Le dossier "Open Access & Open Data" rĂ©alisĂ© par l'Ecole des Ponts - ParisTech âą âą The Open Science Training Handbook : https://www.ouvrirlascience.fr/the-open-science-training-handbook/
Quiz by mery
Tag the questions with any skills you have. Your dashboard will track each student's mastery of each skill.