Transcript www.zef.de
GLOWA Volta Project Data Management and Application of GIS and Remote Sensing in Natural Resources Management Training Workshop Wednesday, December 12 – Friday, December 14, 2007 DGRE, Ouagadougou, Burkina Faso Gestion des données dans le projet GLOWA-Volta Antonio Rogmann (Center for Development Research University of Bonn) Antonio Rogmann (ZEFc), Universität Bonn 1 Gestion de Données Table des matières 1. Gestion de données Problèmes, solutions et défis 2. Gestion de données flux de travaux (Workflow) 3. Conception de l‘infrastructure de la gestion de données Éléments et interfaces 4. Systèmes d’Information Géographique Qu‘est-ce qu’un SIG? Besoin et applications du SIG Bases Antonio Rogmann (ZEFc), Universität Bonn 2 Gestion de Données: problèmes Sondage avec les institutions partenaires et parties prenantes du GLOWA Volta lors du „PARTNERS’ CAPACITY NEEDS ASSESSMENT WORKSHOP” (31.05.-01.06.2007, Accra, Ghana) Pour la compréhension Cohérence entre les institutions en terme d’échange / flux des données relatives au management de l’eau Environnement des données : software/modèles utilisés, stockage des données et facilités d’accès, hardware Ensemble défini de problème dans la gestion (l’accès) des données Comme condition pour L’ajustement de système de gestion des données du GLOWA Volta au besoin des partenaires Offrir aux partenaires des solutions pour améliorer la qualité de la gestion de données Antonio Rogmann (ZEFc), Universität Bonn 3 Gestion de Données: problèmes Institutions participants au sondage: Coalition of NGO's in Water and Sanitation (CONIWAS) Kwame Nkrumah University of Science and Technology, Kumasi (KNUST) Soil Research Institute, Council for Scientific and Industrial Research (SRI) Water Research Institute, Council for Scientific and Industrial Research (WRI) Hydrological Service Department (HSD) Water Resources Commission (WRC) (2 participants) Hydrological Service Department (HSD) Ghana Irrigation Development Authority (GIDA) Water Research Institute, Council for Scientific and Industrial Research (WRI) Ghana Water Company Ltd, Head Office (GWCL) Dept. of Agriculture Economy & Agriculture Business. College of Agric. and Consumer service Environmental Protection Agency (EPA) Centre for Environmental Impacts Analysis (CEIA) Volta Basin Development Foundation (VBDF) Training, Research Network for Development (TREND) UDS: Faculty of Integrated Development Studies Savannah Agricultural Research Institute (SARI) Volta River Authority (VRA) Antonio Rogmann (ZEFc), Universität Bonn 4 Gestion de Données: problèmes Résultats Manque d‘information sur les données = données à propos des données = méta données Votes Problémes pour obtenir des informations à propos des données concernat basé sur le questionnaire participants = 19. Choix multiple 10 9 8 7 6 5 4 3 2 1 0 Pourvoyeur des Données Antonio Rogmann (ZEFc), Universität Bonn Qualité des Donées Contenu / Format des Données Droits de untilization Softw are utilisé pour le compilation / prix des données 5 Gestion de Données: problèmes Résultats Documentation des données principalement interne sur catalogues digital (ex: Tables Excel), sur papier ou sans aucune documentation Meta base de données basées sur le web comme exception Documentation des donées obtenues sur basé sure les organisations representées dans le questionnaire participants. N = 19. Choix multiple 7 6 Votes 5 4 3 2 1 0 Méta bases de données Antonio Rogmann (ZEFc), Universität Bonn Catalogue digital Catalogue sur papier Sans documentation 6 Gestion de Données: problèmes Résultats Transfert de données copieux et long L’envoi de données par e-mail pose des problèmes de volume et de temps de transfert Votes Transfert des données aux partenaires par basé sure les organisations représentées dans le questionnaire participants. N = 19. Choix multiple 11 10 9 8 7 6 5 4 3 2 1 0 Email Antonio Rogmann (ZEFc), Universität Bonn CD /DVD par poste Téléchargement sur le w eb Collecté personellement Autres moyens 7 Gestion de Données: problèmes Questions courantes lors de la recherche de données: Institution Quelles données existantes serviront ma recherche/mes décisions/mes besoins en information ? Où trouver ces données ? Dans quels formats ? Sont-ils compatibles avec mes applications/ modèles ? Quelles sont les caractéristiques des données (ex : unités de temps et autres unités) données ? Usager des données Département de Service données Organisation A qui appartiennent ces données ? Faut-il les payer ? données Antonio Rogmann (ZEFc), Universität Bonn 8 Solution: Gestion de Données Nous aimerions vous offrir une solution en fournissant : Une base de données centrale donnant accès aux stocks de données du GVP la possibilité d’étendre le stock de données avec vos propres données ?? Web données Une méta-base de données centrale des réponses sur les besoins en données des références sur les pourvoyeurs de données Géo-portail Un géo portail informant sur les projets en relation avec la gestion hydraulique dans le bassin du Volta et leurs données en visualisation spatiale Antonio Rogmann (ZEFc), Universität Bonn Meta Données !! Serveur de plans Banque de données Serveur de Données Banque de métadonnées données Département de Service données données 9 Données in the GVP Données du projet: que peux fournir le GVP? Données hydrologiques : décharge d’eau, nappes phréatiques (série chronologique) Données climatologiques : précipitations, températures, humidité de l’air, évapotranspiration, flux de chaleur (série chronologique et prédictions) Données sur l’utilisation d’eau : agriculture (irrigation) / nationale / industrielle (énergie hydraulique) / réservoirs Données sur l’utilisation des sols / la couverture des sols : agriculture, urbanisation, sols, géologie, végétation Données topographiques / infrastructurelles / administratives : réseaux des rivières, lacs, élévation des routes, agglomérations, électricité, frontières Données socio-économiques : démographie, recensement, activités économiques (marchés), sondages En différents formats : vecteur / trame (télédétection), tables, documents, formats spécifiques au modèle Antonio Rogmann (ZEFc), Universität Bonn 10 Données du projet: utilisées comme Inputs pour modèles. Dans le GVP: MM5-ETH: WaSIM: GAMS: LUDAS: Mike Basin: Antonio Rogmann (ZEFc), Universität Bonn 11 Solution: Gestion de Données La gestion de données est la toile de fond sur laquelle les facilités d’accès viennent se superposer La gestion des données dans une organisation est basées sur un ensemble de méthodes pour La description des données (métadonnées) Assurance de la qualité des données Distribution et accès des données Sécurité Antonio Rogmann (ZEFc), Universität Bonn 12 Solution: Gestion de Données La gestion pratique de données dans une organisation est basée sur : Des normes Des normes standards, par exemple pour les métadonnées, l’identification des ressources, les formats, … Des normes internes en fonction du consensus interne a l’organisation, par exemple pour les modèles de base de données, noms de fichiers, règles de données… Déroulement des opérations / Étapes du procédé / responsabilités Technologie : hardware, software, interfaces… infrastructure des données Antonio Rogmann (ZEFc), Universität Bonn 13 Gestion de Données : Metadonnées Règles concernant l’information à propos des données Métadonnées Plusieurs standards développés par des organisations, tels que l’ ISO 15119 pour données géo du Federal Geographic Data Committee Enregistrés auprès de l’International Organization for Standardization (IOS) Consistent en une variété d’éléments / champs pour décrire les ressources (données, software, services) Métadonnées standards consistant partiellement de plusieurs centaines d’éléments Antonio Rogmann (ZEFc), Universität Bonn 14 Gestion de Données : Metadonnées Métadonnées dans le cadre du GVP : Dublin Core Metadata Standard noyau de 15 éléments, étendus par certains éléments spéciaux pour données géo tus les éléments, exceptes les titres et identificateurs, sont optionnels une description des éléments compréhensible chaque type de ressource (données, software, modèle,…) peut être décrit Éléments « rechargeables » des métadonnées comme Sujet : le sujet sera décrit par des mots-clefs, phrases-clefs, ou code de classification Publieur : une entité (personne, institution) responsable pour pourvoir les données Format : le format des fichiers, les mediums physiques ou dimensions des ressources go to manual Antonio Rogmann (ZEFc), Universität Bonn 15 Gestion de Données : Metadonnées Créer des métadonnées Les métadonnées doivent être stockées dans la banque de métadonnées Conservées dans un lieu central Offrant un accès web et des interfaces de recherche pour les données et la description des ressources Les métadonnées peuvent être créées de deux manières : En-ligne : entrée directe des métadonnées dans l banque centrale de métadonnées un utilisant un browser Internet, java script, php Hors-ligne : en utilisant un browser Internet et un script java, stockant chaque ensemble de métadonnées localement et proche de la description de l’objet dans le fichier XML Si les fichiers de métadonnées XML ont été créés hors-ligne : ► Un collecteur de métadonnées peut automatiquement rassembler et insérer les fichiers locaux dans la banque de métadonnées sur un serveur ► Les fichiers XML peuvent être téléchargés sur la banque de métadonnées Antonio Rogmann (ZEFc), Universität Bonn 16 Gestion de Données : Metadonnées Champ d‘entrée des éléments de métadonnées Champ d‘entrée* pour Créer les métadonnées sous forme de XML fichier Entrée des métadonnées dans la banque du métadonnées (web / réseau local) * Développé comme prototype par Dr. Marcel Endejan, Deputive Executive Officer, GWSP in Dissertation Antonio Rogmann (ZEFc), Universität Bonn éléments obligatoires des métadonnées ouvre un masque URN champ d‘entrée des éléments de métadonnées 17 Gestion de Données : Metadonnées Champ d‘entrée des éléments de métadonnées éléments de métadonnée bouton d‘insertion Antonio Rogmann (ZEFc), Universität Bonn 18 Gestion de Données : Métadonnées Description interne des fichiers pour les données structurées (ex : mesures) En-tête de fichiers de données informant sur le contenu, les unités utilisées, l’instrumentation, la qualités de valeurs, la localisation, … Indépendamment des métadonnées, toute information importante est proposée à l’utilisateur / receveur Multiples fichiers/ensemble de données similaires peuvent être décrits dans ► La première fiche (ex : dans un fichier excel) ► Le premier fichier d’un ensemble de fichiers (référencés par d’autres) ► Un fichier texte séparés et stockes proche des fichiers Antonio Rogmann (ZEFc), Universität Bonn 19 Data Management: Nomenclature Détermination de base des catégories de données Données qualitative : données riche en détails et précisions, souvent sous forme de texte, format narratif, par exemple : études de cas, revues de documents, ….. Données quantitatives : donnes numériques. Donnes qui sont mesurées soit sur le rapport ou sur l’échelle de mesures, ex : température, niveaux des eaux, … Nomenclature des données (recommandé particulièrement pour les données quantitatives) devrait refléter : Discipline (Exemple:) Sujet Site Laps de temps Version hyd_waterlevel_ghana-kaburi_020101-020630_v1.xls Mais : il n’est pas nécessaire de stopper le système de nomenclature actuel, par contre il est nécessaire … Antonio Rogmann (ZEFc), Universität Bonn 20 Data Management: Identification Identification des ressources comme fichiers de données, documents, plans … un identificateur unique pour chaque ressource comme élément d’une métadonnées centrale. Nous utilisons un « Uniform Resource Name » (URN). Quasi-standard pour l’identification des ressources dans un système d’information. Exemple : ISBN Peut être utilisé comme nom pour une ressource (ex : nom de fichier) Doit suivre une syntaxe standard URN dans le GVP seront facilement générés en utilisant un générateur de nom de ressources (en utilisant un browser Internet) Antonio Rogmann (ZEFc), Universität Bonn 21 Data Management: Identification Identification: URN syntaxe standardisée : NID ‚urn:‘<NID>‘:‘<NSS> = Namespace Identifier représente un organisation, projet, réseau, personne urn:x-gvp:uid:<NSS> urn x gvp uid = uniform resource name = experimental, not officially registered = glowa volta project = user identification Antonio Rogmann (ZEFc), Universität Bonn 22 Data Management: Identification standardized syntax: ‚urn:‘<NID>‘:‘<NSS> NSS = Namespace Specific String codifìe le „type“, „l‘utilísation“ et le „moyen de stockage“ de la ressource / des données urn:<NID>:<resType>-<resSubType>.<sTitel>.v<verNr>.<for>.<med> <resType> = type of resource, e.g. dataset, document, software <resSubType> = subtype o.r., e.g. primary / secondary data, model input <sTitel> = short titel, name <verNr> = versionsnumber <for> = format <med> = medium on which resource / data file is stored Antonio Rogmann (ZEFc), Universität Bonn 23 Data Management: Identification Exemple: urn:x-gvp:HD12:ds-pd.waterlevel_gh-kab_020101-020630-V1.0.xls.cd gvp HD12 = = ds = pd = waterlevel ... 30 = V1.0 = xls CD = = GLOWA Volta Project Institution par exemple „Hydro Service“, person en charge e.g. 12 = personne xy enregistrement données primaire titre en bref p.ex. abréviation pour „hyd_waterlevel_ghanakaburi_020101-020630” version du enregistrement, ex. données brutes en premier version (incontrôlé) MS Excel dans CD Antonio Rogmann (ZEFc), Universität Bonn 24 Data Management: Identification Créer un URN Utilisation du « Resource Name Generator » Crée un URN en utilisant une application JavaScript à partir d’un exploreur Internet Existe actuellement comme prototype * Développé comme prototype par Dr. Marcel Endejan, Deputive Executive Officer, GWSP in Dissertation Antonio Rogmann (ZEFc), Universität Bonn 25 Data Management: Identification Resource Name Generator (= générateur de nom de ressource) Intègre les codes spéciaux pour les types de ressources a l’intérieur d’un réseau qui partage les données Les types de ressources doivent être identifiés et intégrés dans le script Sous-Type de ressource Type de ressource Antonio Rogmann (ZEFc), Universität Bonn 26 Data Management: Identification Resource Name Generator Version, format et moyen de stockage peuvent être sélectionnés Copier et coller URN dans les noms de l’ensemble de données (si requis) et l’entrer dans la métadonnées Les URN seront ajustés individuellement avec la banque de données centrale, dans laquelle les données seront enregistrées et décrites Numéro de version Medium de mémoire informatique Antonio Rogmann (ZEFc), Universität Bonn Format URN éviter de duplicata 27 Data Management: Formats Formats Les données peuvent être stockées en format « propriétaire » ou « non- propriétaire » Le format propriétaire codifies les données d’une manière spécifique, le fichier ne peut être ouvert que par le programme dans lequel il a été créé Les formats « non propriétaire peuvent être utilises par une vaste gamme d’applications (surtout en utilisant les fonctions d’import) Les données doivent être stockées pour de longues périodes de temps et il n’est pas sur quels programmes seront disponibles dans 10 ans Autant que possible, l’inter-operablitité entre les différents programmes et applications doit être garantie Antonio Rogmann (ZEFc), Universität Bonn 28 Data Management: Formats Standards internationaux certifiés comme l’ISO « Open Document Format for Office Applications » (ODF) “HTML”, “XML” or OGC’s “GML” (Geographic Markup Language - Open Geospatial Consortium) Certains formats sont des de facto-standards (comme MS Excel) parce que les programmes propriétaire qui les génèrent sont appliqués par de nombreux utilisateurs Les software de traitement utilises couramment par les membres d‘un réseau d‘échange de données ont des exigences en matière de format d‘input Antonio Rogmann (ZEFc), Universität Bonn 29 Data Management: Formats Conclusion : essayer d’ utiliser des formats d’échange non-propriétaire autant que possible, et considérer les exigences de format du software utilisés Exemples: Microsoft Word (.doc) Rich Text Format (.rtf), Open Document Text (.odt) MS Excel (.xls) Comma Separate Value (.csv), Extensible Markup Language (.xml) ESRI shape Geographic Markup Language (GML) Recommandations: Utiliser un software bureau ouvert comme OpenOffice.org Dans ses fonctionnalités, similaire à Microsoft Office (incl. Excel, Access, etc.) Le format est ISO-Standard depuis 2006 (ODF - ISO/IEC 26300)! Pas de coûts! Antonio Rogmann (ZEFc), Universität Bonn 30 Data Management: Securité Sécurité Garantie contre les accès et applications des données et ressources non-autorisés Utiliser les facilités des sécurités informatiques telles que : Authentification Control List (ACL) Canaux d’accès sécurisés comme la technologie Secure Shell (SSH) Antonio Rogmann (ZEFc), Universität Bonn 31 Data Management: Contrôle de l‘accès Contrôle de l‘accès aux données Les données peuvent avoir généré des couts lors de la création, ne sont pas dans le domaine publique, pas encore publiées, …. Le contrôle de l‘accès aux données est base sur un arrangement des la communauté (scientifique) de producteurs, utilisateurs et fournisseurs de données, en terme de règles d’accès aux données Signifie: Qui (groupe utilisateur) est autorise a utiliser (obtenir) quelles données et sous quelles conditions (droits d’auteur, paiement) Comment organiser le processus d’identification schématiquement groupes d’utilisateurs avec droits d’accès graduels Comment mettre en place le processus d’identification sur le plan technique Antonio Rogmann (ZEFc), Universität Bonn 32 Gestion des données: Qualité Qualité des données signifie Données sont complètes, valides, consistantes, suivent un ordre chronologique et précises, ce qui rend les données appropriées pour un usage spécifique avec un système informatique Vue complète fournie par la gestion de données Les méthodes basées sur le software sont liées aux disciplines scientifiques spécifiques Doivent être transparentes et compréhensibles Devraient être déclarées/recommandées a l’intérieur d’un réseau administratif ou scientifique Le niveau de qualité doit être décrit dans le fichier de données, dans les métadonnées Antonio Rogmann (ZEFc), Universität Bonn 33 Data Management: Qualité Garantie de qualité ds donnes dans le GVP Faites par les scientifiques dans leur propre discipline sous leur responsabilité Testes par diagrammes, si les données sont fiables Comparaisons avec d’autres sources de données Calibrage de routines des instruments Vérification des limites du programme Statistiques de base Antonio Rogmann (ZEFc), Universität Bonn 34 Gestion des données : challenges Récolter les bénéfices de la gestion de données requiert les efforts de tous les participants La gestion de données (GD) a besoin d’accords fermes en matière de : Standards Sélection des utilisateurs des données et de leur droit d’accès et d’utilisation L’environnement technique tel que software (-interfaces), protocoles de réseau, etc. Responsabilité personnelle et/ou institutionnelle dans le cadre du… … déroulement des opérations de la gestion de données : production des données > contrôle de qualité > nomenclature, identification > description > transfert auprès de l’hôte des données > livraison depuis l’hôte des données La GD requiert la volonté d’investir du temps et de se tenir aux standards ! Antonio Rogmann (ZEFc), Universität Bonn 35 Data Management Workflow Prochains diapos font partie d’un manuel et documentation GVP- data-management-workflow digitaux Sera fini et publie début 2008 Base pour la prochaine session d’entrainement pour gestion web de données et administration de banque de (géo) données Manuel de déroulement des opérations sera offert dans un design similaire mais dans d’autres formats (PDF, HTML), ainsi pouvant être fourni et publie sur le web Sert comme référence de bonne pratique pour GVP, mais doit être étendu pour inclure d’autres exigences dans le système du cote des parties prenantes – après le GVP!!! Antonio Rogmann (ZEFc), Universität Bonn 36 Data Management Workflow 1 2 3 4 7 6 transfer 1 workflow steps 5 (linked) Antonio Rogmann (ZEFc), Universität Bonn 37 Data Management: Etapes Workflow Sous forme de note Recommandations … Étape 1: Récolte données Prendre notes dans le journal Instrument de mesure : nom, fabricant, numéro de série Date : quand les données ont-elles été récoltées Nom : de la personne qui a récolte les données sur le terrain Qu’est-ce qui a été fait : maintenance, réglage Particularités : quelque chose de spécial a été observé ? Procédés - Sondage - Télécharger registre données - Sonder et cartographier Lieu - Terrain - Site Processeur - Scientifique - Planificateur - Récolteur de données Software / Interfaces - Explorer fichier - Interface téléchargement - Pistage-GPS - Software traitement données - Imprimé Hardware - Registre données - Lap Top - GPS GPS measurements and mappings Choisir le système de coordonnées approprié pour l’espace de travail Pour le Ghana Coordinate System WGS1984 projected in UTM (Zones 30/31N), (Burkina Faso 30/31P) Back to overview Antonio Rogmann (ZEFc), Universität Bonn 38 Data Management: Etapes Workflow Sous forme de note Étape 2: Contrôle qualité Procédés - Chercher des trous, anomalies, fichier endommages - Effacer erreurs de données - Remplir des trous - documenter Lieu - Terrain - Site - Bureau Recommandations ... Plus sur le sujet Documentation Quelles incertitudes restent Qu’est-ce qui a été entrepris pour le contrôle de qualité Algorithme et software spécifiques utilisés Prendre note dans le métadonnées Prendre note dans la table des en-têtes Processeur - Scientifique - Récolteur de données Software / Interfaces - Méthodes statistiques (algorithme) - Programme traitement données (e.g. HYDAT) Hardware - Lap Top - PC Back to overview Antonio Rogmann (ZEFc), Universität Bonn 39 Data Management Etapes Workflow Sous forme de note Étape 3: Nommer, URN Procédés - Créer une syntaxe appropriée - Nommer ressources - Créer les URN A considérer …. Le nom des données reflète : Le sujet du contenu La couverture spatiale et temporelle Le statut de traitement (version) Le partage local de données (ex : réseau bureau) Lieu - Bureau Trouver un accord pour la syntaxe de nomenclature des fichiers standard GVP ? Identifier les types de ressources/ données pour définir une syntaxe URN standard GVP? Processeur - scientifique - Planificateur - Administrateur banque données Software / Interfaces - Explorer fichier - Internet Explorer - html, Java Script Hardware - Lap Top - PC Back to overview Plus sur le sujet Assigner un nom de ressource unifie Utiliser le « Resource Name Generator » pour créer un URN Enregistrer le URN dans les données Enregistrer le URN dans catalogue de données Enregistrer le URN dans métadonnées Antonio Rogmann (ZEFc), Universität Bonn 40 Data Management Etapes Workflow Sous forme de note Étape 4: organisation données Procédés - Créer uns structure stockage appropriée (annuaire) sur système fichier Recommandations ... Structure du répertoire spécialement important ► Quand les données et ressources sont partagées dans une communauté-bureau ► Dans un petit Local Area Networks (LAN) ► Dans un peer-to-peer network Peut être conçue en focalisant sur ► Dans le cadre de traitement de données (modèles etc.) ► Structure du projet (sous-projets hiérarchie du projet) ► contenu spatial, temporel ou thématique du stock de données (ex:. par régions, thèmes..) Devrait être répliqué sur disque local par tous les participants au réseau - ajusté aux points focaux personnels dans le travail plus facile de trouver les ressources Lieu - Bureau Processeur - Scientifique - Planificateur - Administrateur réseau Software / Interfaces - File explorer / manager Hardware - Lap Top - PC - LAN (Server) Plus sur le sujet Back to overview Antonio Rogmann (ZEFc), Universität Bonn 41 Data Management Etapes Workflow Sous forme de note Étape 4: organisation données Procédés - Insérer information sur données dans dictionnaire de données Lieu - Terrain - Site - Bureau Processeur - Scientifique - Planificateur Software / Interfaces - Excel - OpenOffice Calc Hardware - Lap Top - PC Back to overview Recommandations ... Plus sur le sujet Catalogue Données Petite table fichier avec enregistrement de données, scriptes, etc. personnels sur disque local donne vue d’ensemble et gagne du temps éléments minimum devraient être: ► Uniform Ressource Name (URN) ► Titre / Nom ► Courte Description ► Format ► Lieu de stockage (chemin) Antonio Rogmann (ZEFc), Universität Bonn Exemple du GVP 42 Data Management Etapes Workflow Sous forme de note Étape 4: organisation données Procédés - insérer ensemble de données directement dans ou proche du fichier Lieu - Terrain - Site - Bureau Processeur - Scientifique - Planificateur Software / Interfaces - Software de traitement - Explorer fichier Hardware - Lap Top - PC Recommendations ... Plus sur le sujet En-tête de table détaillé pour : Unified Resource Name: [‚urn:‘<NID>‘:‘<NSS>] Données fournies par : [nom, prénom, adresse email, institution] Lieu : [nom du lieu, coordonnées UTM (X,Y)] Altitude : [mètres au-dessus du niveau de la mere] Style des mesures : [description des méthodes appliquées] Preneur de mesure : [nom, (projet, institution)] Période de mesure : [jjjjmmdd-jjjjmmdd, incréments de temps (jours/h/m/s)] Valeurs manquantes : [-9999.9] Qualité : [description des méthodes de garantie de qualité] Notes : [remarques] En-tête de table avec description des paramètres utilisés Expliquer le sens des abréviations/codes Déclarer les unités utilisées pour les paramètres si non-évidentes Utiliser les informations du journal de récolte des données Back to overview En rouge = éléments métadonnées (si les fichiers de métadonnées Antonio Rogmann (ZEFc), Universität Bonn sont juste crées, ces points ne sont pas nécessaires!) 43 Data Management Etapes Workflow En-tête de fichier données: example Plus sur le sujet Back to overview Antonio Rogmann (ZEFc), Universität Bonn 44 Data Management Etapes Workflow Sous forme de note Étape 5: description, créer les métadonnées Procédés - Description des données/ ressources selon le standard pour métadonnées Lieu - Bureau Processeur - Scientifique - Producteur des données - Planificateur A faire … Plus sur le sujet Métadonnées Au minimum si les données vont être publiées, elles devraient être décrites en entrant les métadonnées Utiliser l’interface browser internet (comme décrit ici) pour entrer les métadonnées Remplir autant d’éléments que possible L’utilisation appropriée de mots-clefs dans l’élément “sujet et mots-clefs” est très importante La plupart des questions aux métadonnées concernent “sujet et mots-clefs” ainsi que “couverture spatiale” Software / Interfaces - Internet browser - html, java script Équipement - Lap top - PC - bureau Back to overview Antonio Rogmann (ZEFc), Universität Bonn 45 Data Management Etapes Workflow Sous forme de note Étape 5: créer les métadonnées Procédés - Description des données/ ressources selon le standard pour métadonnées Lieu - Bureau Processeur - Producteur des données - Scientifique - Planificateur à considérer …. Métadonnées Ne pas oublier de donner l’information sur l’accès aux données / ressources ► Emplacement actuel : où les données peuvent être obtenues ► Modalités d’accès : (coûts, droits d’utilisations, moyens techniques, etc.) ► Si les données ne sont pas transmises à un hôte central : nom du contact local Fichiers de stockage pour métadonnées Software / Interfaces - Internet browser - html, java script Équipement - PC Plus sur le sujet Si la saisie directe dans la banque de métadonnées n’est pas possible (pas de connexion Internet) : les fichiers de métadonnées XML doivent être envoyés à l’administration de la banque de métadonnées centrale, par exemple sur CD par poste Données et métadonnées Les métadonnées doivent seulement être crées si l’utilisation ultérieure des ressources par d’autres est prévue Back to overview Antonio Rogmann (ZEFc), Universität Bonn 46 Data Management Etapes Workflow Sous forme de note Étape 6: (préparation du) transfert Procédés - Prise de décision pour la publication des données les contraintes d’accès (l’utilisateur) le transfert á la banque de données centrale Lieu - Institution collective - Bureaux locaux à faire …. Plus sur le sujet Prendre une décision Si les ensembles de données ou ressource (software, modèles) doivent être partagés Qui – personnes, institutions, partenaires- devraient avoir accès aux données Si l’accès aux données doit être payant Ou les données accessibles doivent être stockées : localement ou sur un serveur central ? Qui est la personne responsable pour contrôler la transmission a une banque de données centrale. Cette personne responsable doit contrôler si Processeur - Utilisateur des données - Administrateur de la banque de données Software / Interfaces Hardware Back to overview Antonio Rogmann (ZEFc), Universität Bonn ► Les ressources / ensembles de données satisfont le standard de gestion de données de la communauté ► Particulièrement si les données contiennent des métadonnées avec une définition claire des droits d’utilisation ( donner a l’administrateur de la banque de données une liste des utilisateurs potentiels) 47 Data Management Etapes Workflow Sous forme de note Étape 7: transfert Procédés - Formatage - Téléchargement sur la banque de données centrale Lieu - Bureau local - Hôte de la banque de données centrale Processeur - Producteur de données - Administrateur de la banque de données centrale à faire …. Plus sur le sujet Préparer le transfert Reformater les données si nécessaire Informer l’administrateur de la banque de données centrale ► Quels ensembles de données seront télécharger sur la banque centrale et pourquoi ► Que les métadonnées sont entrées directement dans la banque de métadonnées par une interface web ► Que les fichiers de métadonnées sont transmis ensemble avec les ensembles de données Faire le transfert Télécharger les données dans un catalogue de transfert sur le serveur Software / Interfaces principal - Software de traitement Utiliser un software de téléchargement basé sur le ftp (file transfer de données - html, java script protocole) or SFTP (Secure Shell – File Transfer Protocol) si les - SSH (e.g. winscp) facilites sont fournies Hardware Le GVP utilise SFTP pour les transferts des données sur le serveur de - PC données - Serveur Back to overview Si le téléchargement n’est pas possible en raison d’une connexion 48 Antonio Rogmann (ZEFc), Universität Bonn Internet trop lente, envoyer les données par poste sur CD/DVD GLOWA Volta HP MetadataInterface GVP – Infrastructure des données xml/xsl request to download Internetzone Intranetzone Webserver (VM) Datenserver (+RAID) File System Apache JavaScript Mapbender inkl. PostgreSQL (Samba) PHP (CGI) File MapServer CGI Catalog-Manager PHP, DOM MySQL/ Postgres: ADODB :1521 Meta-DB Portal-DB ESRIGeodatabase Meta.dc.xml describes inkl. phpMyAdmin JDBC :1521 SMB lokal/offline SMB SMB, JDBC Tomcat Portal ArcGIS Client Antonio Rogmann (ZEFc), Universität Bonn SMB JSP/ Java Java-based Client (COBIDS) ESRI ArcGIS Clients 49 GVP – Infrastructure des données Ne soyez pas choqués, c’est du langage technique, regardons maintenant du point de vue de l’utilisateur Antonio Rogmann (ZEFc), Universität Bonn 50 GVP – Infrastructure des données Récolter les fruits: D a t a u s e r Une banque de données centralisée Donne accès au stock de données du GVP Avec la possibilité d’étendre le stock de données avec vos propres données Web Une banque de métadonnées centralisée qui fournit Des réponses a propos des données requises Des références sur les fournisseurs de données Géo-portail Meta Données données Un géo-portail qui informe Sur les projets en relation avec la gestion des eaux dans le bassin du Volta Et leurs données : dans une visualisation spatiale Antonio Rogmann (ZEFc), Universität Bonn Département de Service Serveur de plans Banque de données Serveur de Données Banque de métadonnées Département de Service données données 51 GVP – Infrastructure des données Vue sur l’arrière-plan: Interfaces d‘utilisateur Interfaces d’utilisateur Géo-portail Exploreur Internet avec interfaces pour banques de données Web Banques de données Portail-banque de données Banque de métadonnées System de fichier Banque de « géo-portail » Géo-portail Meta Données données Serveur de plans Serveur d. databases Données Technologies web Pas le sujet d’aujourd’hui! Banques de données Antonio Rogmann (ZEFc), Universität Bonn Département de Service Banque de données Banque de méta-données Département de Service données données 52 Infrastructure des données: vue des utilisateurs web 1. Comment obtenir les données Via le géo-portail 1. Le géo-portail cherche dans la banque de métadonnées 2. Le software Catalogue Manager sur le serveur fournit une liste des résultats 3. Les géo-données trouvées peuvent être demandées comme… 4. … cartes interactives, fournies au browser Internet comme WebMapService généré par UMNMapServer 1 2 Data Server Meta data 3 4 GVP data 5 ACL-List 5. Ou pour téléchargement des fichiers de données originaux (et autres données) si permis Antonio Rogmann (ZEFc), Universität Bonn 53 Infrastructure des données: vue des utilisateurs web 2. Comment obtenir les données Via le catalogue de ressources / données 1 1. L’interface du browser Internet (sur la homepage) cherche dans la banque de métadonnées 2 2. Le software Catalogue Manager sur le serveur fournit une liste des résultats 3 3. Les géo-données trouvées peuvent être demandées comme… 4. … cartes interactives, fournies au browser Internet comme WebMapService généré par UMNMapServer 4 Data Server Meta data GVP data 5 ACL-List 5. Ou pour téléchargement des fichiers de données originaux (et autres données) si permis Antonio Rogmann (ZEFc), Universität Bonn 54 Infrastructure des données: Géo-portail Éléments du géoportail Vue d‘ensemble Outils cartes: zoom, pan, selection WebMapService est OGC-standard Mapbender est un software gratuit pour client pour serveur-carte Mapserver est gratuit et couramment utilisé comme software de serveur-carte Couche UMN Le Geoportal Interface Software est en ce moment développé par L. Laubach (Institute for Computer Sciences III Uni Bonn) Antonio Rogmann (ZEFc), Universität Bonn Caractéristique des info (sélectionné) : table d’attributs avec propriétés et lieus vers le documents / graphiques / adresses web 55 Infrastructure des données: Interfaces web intranet File Explorer SSH Client File System (Samba) (only authorized direct access) Internet Browser Data Server (Linux) GeodataBase (ESRI) GIS-Client Antonio Rogmann (ZEFc), Universität Bonn 56 GVP – Infrastructure des données intranet User System view on data server file system Data user Data user User Group 1 Data user User Group 2 Data user Antonio Rogmann (ZEFc), Universität Bonn 57 GVP – Infrastructure des données: banque des géo-données „Geodatabase“ = Base de géo-données, format par ESRI Base de données « relationnelle » Toutes données ( entités=objets=couche) organisées en table Les tables peuvent être liées entre elles ► En utilisant des clefs ► Basées sur des cardinalités (relations 1 :1, 1 :n, m :n) Formats GIS courants (shape, couverture Arcinfo, …) sont organisés en plusieurs fichiers simples représentant une classe d’objet ► Par géométrie ► Par attribut ► Pour liaison géométrie <->attributs ► Etc. Antonio Rogmann (ZEFc), Universität Bonn 58 GVP – Infrastructure des données: banque des géo-données Une base de données « relationnelle » est gérée par un système de gestion de base de données (Par exemple MS Access, DB2, Oralce, MySQL) Une base de géo-données ESRI est gérée par l’application ArcGIS « ArcCatalog » Antonio Rogmann (ZEFc), Universität Bonn 59 GVP – Infrastructure des données: banque des géo-données Une base de géo-données fournit les facilités complètes pour Le stockage d’une collection de géo-données de types différents sur une place centrale L’imposition de relations et règles sophistiquées sur les données La modélisation de comportement spatiaux complexes (topologie, réseaux géométriques,…) Maintenance de l’intégrité des données Échelonnage facile du stockage des données Définition d’objets courants Antonio Rogmann (ZEFc), Universität Bonn 60 GVP – Infrastructure des données: banque des géo-données Base de géo-données (« relationnelle ») dans le GVP Seulement prototypes Format pas encore utilisé dans le GVP Etablissement d’une base de géo-données dans le GVP est encore en discussion Avantages d’une base de géo-données Géo-données bien organisées Haut niveau d’information (modélisation) Facilités de banque de données pour garantir l’intégrité (-qualité) des données Désavantages d’une base de géo-données Licences pour l’amélioration du Software ArcView Client (coûts) Gros effort pour la création de la base de données Antonio Rogmann (ZEFc), Universität Bonn 61 GVP – Infrastructure des données: banque des géo-données Alternatives pour le stockage des géo-données dans le GVP Les géo-données sont enregistrées dans un format GIS commun (shape, …) dans un système de fichier, ainsi que maintenant « Open Source » (gratuites) Bases de Géo-données (PostgreSQL/PostGIS) Pas de coûts de licence pour installation, mais pour support Pas facile à administrer Mauvaises connections entre ESRI et Postgres Mais l’utilisation de bases de géo-données ouvertes et libre-accès devrait être considéré dans les futures développements du Projet GLOWA Volta et de ses partenaires Antonio Rogmann (ZEFc), Universität Bonn 62 Merci pour votre prévenance!! Antonio Rogmann (ZEFc), Universität Bonn 63