BeginnersGuide (French)
Traduction: Franck Theeten
Musée Royal de l'Afrique Centrale de Tervuren
Pour le projet CABIN (Central African Biodiversity Information Network)
Contents
Qu'est ce que le Logiciel Fournisseur de données BioCASe?
Le logiciel fournisseur de données BioCASe (abrégé BPS pour BioCASe Provider Software' en anglais ) est un middleware, c'est à dire un logiciel situéà une position intermédiaire entre une base de données et une interface graphique. Il produit des données en XML, afin de les publier sur un réseau d'information scientifique. Après l'installation de BioCASe et sa configuration pour un type de base de données particulier, l'information publiée sera accessible sous la forme d'un web service de type BioCASe. Cela veut dire que l'information pourra être interrogée et recherchée avec des requêtes au format BioCASe, car BioCASe désigne également un protocole XML pour envoyer des messages à un web service. L'intérêt de ce type de logiciel est qu'il est "agnostique" par rapport au modèle de données de la base de données d'origine, c'est à dire que les requêtes envoyées au web services n'ont pas besoin de connaître la structure de la base de données pour fonctionner. Il peut être également utilisé avec n'importe quel type de schéma conceptuel de données en XML.
Le BPS est un ensemble d'outils qui doivent être installée sur un serveur Web installé chez le fournisseur de données. Son composant central est le PyWrapper, une interface XML/CGI, écrite en Python, pour se connecter à des bases de données . Il permet un accès standardisé (c'est à dire via des procédures uniformes qui peuvent être ainsi partagée par tous les acteurs d'un réseau d'information) à une large gamme de systèmes de base de données dont la structure est arbitraire (c'est à dire définie par le fournisseur de données seul). Un certain nombre d'outils est réuni autour du BPS pour configurer, tester et débugger une installation ou un web service BioCASe.
Même si BioCASe peut être utilisé avec n'importe quel schéma conceptuel défini en XML, son domaine de prédilection est la publication de données d'occurrence provenant de bases de données contenant des spécimens ou des observations sur des réseaux d'information primaire sur la biodiversité, comme le réseau BioCASe et le GBIF (Global Biodiversity Information Facility).
Prérequis pour utiliser le BPS
Avant d'utiliser le logiciel fournisseur de données BioCASe, trois conditions doivent être vérifiées:
- D'une part, les données à publier doivent être stockées dans une système gestionnaires de base de données relationnelles (parfois abrégé SGBDR ou RDBMS en anglais) compatible avec le langage SQL. Son modèle de données doit être bien documenté, ou, au minimum, présent à l'esprit d'un gestionnaire de données. Les bases de données non compatibles avec SQL ne sont pas supportées par BioCASe. Actuellement, le logiciel peut se connecter au bases de données suivantes: Microsoft Access, Microsoft SQL Server, MySQL, Postgres, Oracle, Foxpro, Sybase, 4D, DB2, Firebird.
- Pour installer BioCASe, vous devez avoir un logiciel de serveur Web (Apache ou Microsoft IIS) accessible en permanence depuis l'Internet. Cela peut être le serveur d'une institution académique ou scientifique, ou un service d'hébergement. Il est parfois pénible dans ce second cas d'obtenir les droits d'installation auprès d'un service d'hébergement. Une connexion commutée peer to peer ou 'Dial-up' ne fonctionnera pas. Notez qu'il est tout à fait possible d'installer un serveur Internet sur votre propre machine, isolé du reste de l'Internet, et de faire fonctionner BioCASe dessus à des fins d'entraînement, de formation ou de développement. Il sera alors accessible localement pour l'ordinateur seul (via le nom http://localhost ou l'adresse IP réservée 127.0.0.1)
- Vous devez avoir la possibilité d'installer Python sur le serveur web en question (si jamais ce n'est pas le cas) ainsi que des librairies ou paquets complémentaires Python. Cela peut être effectué relativement facilement par un informaticien ou quelqu'un ayant de bonnes connaissances techniques, mais assurez vous que cela ne pose pas problèmes par rapport aux procédures et règles techniques qui pourraient être en vigueur dans votre institution.
Etapes
Une fois que vous vous êtes assurez que le BioCASe Provider Software est un choix pertinent pour vos besoins (contactez l'équipe BioCASe si vous souhaitez plus d'information avant de prendre une décision), vous devez exécuter les étapes suivantes:
- Pensez à l'information que vous souhaitez publier sur le réseau. Cela implique d'avoir réfléchi et répondu à la question de la propriété des données et des termes d'utilisation, licences, copyright et restrictions dans l'utilisation qui s'appliquent à leur publication. Vous devriez aussi vous demander si certaines information ne devraient pas être publiées car cela pourrait avoir une conséquence sur des espèces menacées. une solution possible est de soustraire certaines occurrence du jeu de données publier, ou de rendre moins précise une information exacte sur la localité d'observation.
- Préparez la base de données comme décrit dans le tutoriel Preparation. C'est à cette étape que doit être prise la décision de publier soit directement la base de données principale qui est utilisée pour les mises à jour, soit un 'snapshot' (c'est à dire une copie de tout ou une partie des données prise à un moment précis), de créer une table de métadonnées (informations sur la base de données elle-même) et, dans certains cas, de transformer la présentation des données.
- Suivez le tutoriel d'Installation pour installer le Fournisseur de données BioCASe.
- Configurez un jeu de données BioCASe viale logiciel et connectez-le à votre base de données. Configurez alors le jeu de données comme décrit dans le tutoriel DatasourceSetup.
- Suivez le tutoriel ABCD2Mapping (pour l'instant en anglais) pour créer un mapping (un mapping est une correspondance entre la structure de votre bases de données et un schéma XML) pour le schéma de données (par exemple DarwinCore ou ABCD) que vous voulez utiliser.
- Testez et débuggez votre web service BioCASe. Lisez le tutoriel Debugging pour plus d'informations à ce sujet.
- Quand vous avez terminé avec l'installation et la configuration du BioCASE Provider Software, vous pouvez enregistrer le web service BioCASe auprès du réseau sur lequel vous souhaitez publier vos données, par exemple le GBIF. Nous vous recommandons de contacter l'équipe BioCASe pour vérifier au préalable votre web service. Ils pourront alors diagnostiquer lors de cette étape préalable des problèmes éventuels qui seraient plus compliqués à résoudre après l'enregistrement à un réseau.
Support
En cas de difficultés lors de l'installation et de la configuration, vous devriez:
- jeter un œil sur le FAQ qui contient peut-être une réponse à votre question
- demander l'aide au staff technique d'un projet lié à BioCASe (comme CABIN ou OpenUp!)
- demander l'aide d'autres utilisateurs de BioCASe
- contacter l'équipe BioCASe(qui est plutôt anglophone mais peut si nécessaire transmettre des questions en français à des techniciens francophones).
Décrivez le plus précisément possible votre environnement (système d'exploitation et système de bases de données utlisés), l'étape où le problème apparaît, et tous les messages d'erreurs ou informations techniques retourné par le logiciel. Il est recommandé d'envoyer des copies d'écran à vos interlocuteurs pour faciliter l'identification du problème.