BeginnersGuide (French)
Traduction: Franck Theeten
Musée Royal de l'Afrique Centrale de Tervuren
Pour le projet CABIN (Central African Biodiversity Information Network)
Contents
Qu'est ce que le Logiciel Fournisseur de données BioCASe?
Le logiciel fournisseur de données BioCASe (abrégé BPS pour BioCASe Provider Software' en anglais ) est un middleware, c'est à dire un logiciel situéà une position intermédiaire entre une base de données et une interface graphique. Il produit des données en XML, afin de les publier sur un réseau d'information scientifique. Après l'installation de BioCASe et sa configuration pour un type de base de données particulier, l'information publiée sera accessible sous la forme d'un web service de type BioCASe. Cela veut dire que l'information pourra être interrogée et recherchée avec des requêtes au format BioCASe, car BioCASe désigne également un protocole XML pour envoyer des messages à un web service. L'intérêt de ce type de logiciel est qu'il est "agnostique" par rapport au modèle de données de la base de données d'origine, c'est à dire que les requêtes envoyées au web services n'ont pas besoin de connaître la structure de la base de données pour fonctionner. Il peut être également utilisé avec n'importe quel type de schéma conceptuel de données en XML.
Le BPS est un ensemble d'outils qui doivent être installée sur un serveur Web installé chez le fournisseur de données. Son composant central est le PyWrapper, une interface XML/CGI, écrite en Python, pour se connecter à des bases de données . Il permet un accès standardisé (c'est à dire via des procédures uniformes qui peuvent être ainsi partagée par tous les acteurs d'un réseau d'information) à une large gamme de systèmes de base de données dont la structure est arbitraire (c'est à dire définie par le fournisseur de données seul). Un certain nombre d'outils est réuni autour du BPS pour configurer, tester et débugger une installation ou un web service BioCASe.
Même si BioCASe peut être utilisé avec n'importe quel schéma conceptuel défini en XML, son domaine de prédilection est la publication de données d'occurrence provenant de bases de données contenant des spécimens ou des observations sur des réseaux d'information primaire sur la biodiversité, comme le réseau BioCASe et le GBIF (Global Biodiversity Information Facility).
Prérequis pour utiliser le BPS
Avant d'utiliser le logiciel fournisseur de données BioCASe, trois conditions doivent être vérifiées:
- D'une part, les données à publier doivent être stockées dans une système gestionnaires de base de données relationnelles (parfois abrégé SGBDR ou RDBMS en anglais) compatible avec le langage SQL. Son modèle de données doit être bien documenté, ou, au minimum, présent à l'esprit d'un gestionnaire de données. Les bases de données non compatibles avec SQL ne sont pas supportées par BioCASe. Actuellement, le logiciel peut se connecter au bases de données suivantes: Microsoft Access, Microsoft SQL Server, MySQL, Postgres, Oracle, Foxpro, Sybase, 4D, DB2, Firebird.
- Pour installer BioCASe, vous devez avoir un logiciel de serveur Web (Apache ou Microsoft IIS) accessible en permanence depuis l'Internet. Cela peut être le serveur d'une institution académique ou scientifique, ou un service d'hébergement (il est parfois pénible dans le second cas d'obtenir les droits d'installation auprès d'un service d'hébergement). Une connexion commutée (peer to peer ou 'Dial-up') ne fonctionnera pas. Notez qu'il est tout à fait possible d'installer un serveur Internet sur votre propre machine, isolé du reste de l'Internet, et de faire fonctionner BioCASe dessus à des fins d'entraînement, de formation ou de développement, . Il sera alors accessible localement pour l'ordinateur seul (via le nom http://localhost ou l'adresse IP réservée 127.0.0.1)
- Vous devez avoir la possibilité d'installer Python sur le serveur web en question (si jamais ce n'est pas le cas) ainsi que des librairies ou paquets complémentaires Python. Cela peut être effectué relativement facilement par un informaticien ou quelqu'un ayant de bonnes connaissances techniques, mais assurez vous que cela ne pose pas problèmes par rapport aux procédures et règles techniques qui pourraient être en vigueur dans votre institution.
Etapes
Une fois que vous vous êtes assurez que le BioCASe Provider Software est un choix pertinent pour vos besoins (contactez l'équipe BioCASe si vous avez encore besoin d'information avant de prendre une décicion), vous devez exécutez les étapes suivantes:
- Pensez à l'information que vous souhaitez publier sur le réseau. Cela implique d'avoir une réponse à la question de la propriété des données et des termes d'utlsiation, licences, copyright et restrictions dans l'utlisation qui valent pour les données publiées. Vous devriez aussi vous demander si certaines information ne devraient pas être publiées car cela pourrait avoir une conséquence sur des espèces menacées (une solution possible est de soustraire certaines occurrence du jeu de données publier ou de rendre moins précise une information exacte sur la localité d'observation).
- Préparez la base de données comme décrit dand le tutoriel Preparation. Il faut alors décider de publier soit directement la base de données principale qui est utlisée pour les mises à jour, soit un 'snapshot' (une copie de tout ou une partie des données prise à un moment précis), de créer uen table de métadonnées (informations sur la base de donénes elle-même) et, dans certains cas, de transformer la présentation des données.
- Suivez le tutoriel d'Installation pour installer le Fournisseur de données BioCASe.
- Configurez un jeu de données BioCASe dans le logiciel et connectez-le à votre base de données. Configuez alors le jeu de données comme décrit dans le tutoriel DatasourceSetup.
- Suiviez le tutoriel ABCD2Mapping pour créer un mapping pour le schéma de données (par exemple DarwinCore ou ABCD) que vous voulez utiliser.
- Testez et debuggez votre web service BioCASe. Lisez le tutoriel Debugging pour plus d'informations à ce sujet.
- Quand vous avez terminé avec l'installation et la configuration du BioCASE Provider Software, vous pouvez enregistrer le wen service BioCASe auprès du réseau sur lequel vous souhaitez publiser vos données, par exemple le GBIF. Nous vous recommandons de contacter l'équipe BioCASe pour vérifier au préalable votre web service nous pourrons alors diagnistiquer des problèmes plus compliqué à résoudre après cet enregistrement.
Support
En cas de difficultés lors de l'installation et de la configuration, sous devriez:
- jeter un oeil sur le FAQ qui contient peut-être une réponse à votre question
- demander l'aide au staff technique d'un projet lié à BioCASe (comme CABIN ou OpenUp!)
- demander l'aide d'autres utilisateurs de BioCASe
- contacter l'BioCASe team, qui est plutôt anglophone.
Décrivez le plus précisément possible votre environnement (système d'exploitation et système de bases de données utlisés), l'étape où le problème apparaît, et tous les messages d'erreurs ou informations techniques retourné par le logiciel. Il est recommendé d'envoyer des copies d'écran à vos interlocuteurs pour ce type de problème.