BeginnersGuide (French)

From BioCASe Provider Software
Revision as of 17:16, 10 April 2012 by FranckTheeten (talk | contribs)
Jump to: navigation, search

Qu'est ce que le Logiciel Fournisseur de données BioCASe?

Le logiciel fournisseur de données BioCASe (abrégé BPS pour BioCASe Provider Software' en anglais ) est un middleware (c'est à direlogiciel placé à une position intermédiaire entre une base de données et une interface graphique) produisant des données en XML, afin de le publier sur un réseau d'information scientifique. Après avoir installé BioCASe et l'avoir configuré pour un type de base de données particulier, l'information publiée sera accessible sous la forme d'un web service de type BioCASe. Cela veut dire que l'information pourra être interrogée et recherchée avec des requêtes au format BioCASe, car BioCASe est avant tout un protocole XML pour envoyer des messages à un web service. L'intérêt de ce type de logiciel est qu'il est "agnostique" par rapport au modèle de données de la base de données d'origine, c'est à dire que les requêtes envoyées au web servcies n'ont pas besoind e connaître la strucutre de la base de données pour fonctionner. Il peut être aussi utilisé avec n'importe quel type de schéma conceptuel de données au niveau XML.

Le BPS est un ensemble d'outils qui doivent être installée sur un serveur Web installé chez le fournisseur de données. Son composant central est le PyWrapper, une interface XML/CGI pour se connecter à des bases de données écrite en Python. Il petmet un accès standardisé (c'est à dire via des procédures uniformes qui peuevnt être ainsi partagée par tous els acturs d'unr éseau d'information) à une large gamme de systèmes de base de données dont la structure est arbitraire (c'est à dire définie par le fournisseur de données seul). Un certain nombre d'outils est réuni autour du BPS pour configurer, tester et débugger une installation ou un web service BioCASe.

Même si BioCASe peut être utilisé avec n'importe quel schéma conceptuel défini en XML, son domaine de prédilection est la publication de données d'occurrence provenant de bases de données content des spécimen ou des observations sur des réseaux d'information primaire sur la biodiversité, comme le réseau BioCASe et le GBIF (Global Biodiversity Information Facility).

Prérequis pour utiliser le BPS

Avant d'utliser le logiciel fournisseur de données BioCASe, trois conditions doivent être vérifiées:

  • D'une part, les données à publier doivent être stockées dans une système gestionnaires de base de données relationnelle (parfois abrégé SGBDR ou RDBMS en anglais) compatible avec le langage SQL, et dont le modèle de données est bien documenté, ou, au minimum, présent à l'esprit d'un gestionnaire de données. Les bases de donénes non compatibles avec SQL ne sont pas supportées par BioCASe. Actuellement, le logiciel peut se connecter au bases de données suivantes: Microsoft Access, Microsoft SQL Server, MySQL, Postgres, Oracle, Foxpro, Sybase, 4D, DB2, Firebird.
  • Pour installer BioCASe, vous devez avoir un logiciel de serveur Web (Apache ou Microsoft IIS) accessible en permenante depuis l'Internet. Cela peut être le serveur d'une institution académique ou scientifique, ou un service d'hébérgement (même s'il est parfois pénible dans le second cas d'obtenir les droits d'installation auprès d'un service d'hébergement. Une connection commutée (peer to peer ou 'Dial-up') ne fonctionnera pas. Notez qu'il est tout à fait possuble à des fins d'entraînement, de formation ou de développment, d'installer un serveur Internet sur votre propre machine, isolé du reste de l'Internet, et de faire fonctionner BiocASe dessus. Il sera alors accessible localement pour l'ordinateur seum (via le nom http://localhost ou l'adresse IP réservée 127.0.0.1)
  • Vous devez avoir la possibilité d'installer Python sur le serveur web en question (si jamais ce n'est pas le cas) ainsi que des libraires ou paquets complémentaires Python. Cela peut être fait par un informaticien ou quelqu'un ayant de bonnes connaissances techniques, mais assurez vous que cela ne pose pas problèmes par rapport aux procédures et règles techniques qui pourraient être en vigeur dans votre institution.

Etapes

Une fois que vous vous êtes assurez que le BioCASe Provider Software est un choix pertinent pour vos besoins (contactez l'équipe BioCASe si vous avez encore besoin d'information avant de prendre une décicion), vous devez exécutez les étapes suivantes:

  1. Pensez à l'information que vous souhaitez publier sur le réseau. Cela implique d'avoir une réponse à la question de la propriété des données et des termes d'utlsiation, licences, copyright et restrictions dans l'utlisation qui valent pour les données publiées. Vous devriez aussi vous demander si certaines information ne devraient pas être publiées car cela pourrait avoir une conséquence sur des espèces menacées (une solution possible est de soustraire certaines occurrence du jeu de données publier ou de rendre moins précise une information exacte sur la localité d'observation).
  2. Préparez la base de données comme décrit dand le tutoriel Preparation. Il faut alors décider de publier soit directement la base de données principale qui est utlisée pour les mises à jour, soit un 'snapshot' (une copie de tout ou une partie des données prise à un moment précis), de créer uen table de métadonnées (informations sur la base de donénes elle-même) et, dans certains cas, de transformer la présentation des données.
  3. Suivez le tutoriel d'Installation pour installer le Fournisseur de données BioCASe.
  4. Configurez un jeu de données BioCASe dans le logiciel et connectez-le à votre base de données. Configuez alors le jeu de données comme décrit dans le tutoriel DatasourceSetup.
  5. Suiviez le tutoriel ABCD2Mapping pour créer un mapping pour le schéma de données (par exemple DarwinCore ou ABCD) que vous voulez utiliser.
  6. Testez et debuggez votre web service BioCASe. Lisez le tutoriel Debugging pour plus d'informations à ce sujet.
  7. Quand vous avez terminé avec l'installation et la configuration du BioCASE Provider Software, vous pouvez enregistrer le wen service BioCASe auprès du réseau sur lequel vous souhaitez publiser vos données, par exemple le GBIF. Nous vous recommandons de contacter l'équipe BioCASe pour vérifier au préalable votre web service nous pourrons alors diagnistiquer des problèmes plus compliqué à résoudre après cet enregistrement.

Support

En cas de difficultés lors de l'installation et de la configuration, sous devriez:

  • jeter un oeil sur le FAQ qui contient peut-être une réponse à votre question
  • demander l'aide au staff technique d'un projet lié à BioCASe (comme CABIN ou OpenUp!)
  • demander l'aide d'autres utilisateurs de BioCASe
  • contacter l'BioCASe team, qui est plutôt anglophone.

Décrivez le plus précisément possible votre environnement (système d'exploitation et système de bases de données utlisés), l'étape où le problème apparaît, et tous les messages d'erreurs ou informations techniques retourné par le logiciel. Il est recommendé d'envoyer des copies d'écran à vos interlocuteurs pour ce type de problème.