BeginnersGuide de

From BioCASe Provider Software
Revision as of 16:05, 19 January 2015 by JoergHoletschek (talk | contribs)
Jump to: navigation, search

[This page in English]

Was ist die BioCASe Provider Software?

Die BioCASe Provider Software ist eine Middleware, also eine Software, die den Datenaustausch zwischen zwei voneinander entfernten Systemen erlaubt. Sie ermöglicht, Daten aus einem relationalen Datenbanksystem (z.B. einem Sammlungsverwaltungssystem) in ein Datennetzwerk einzuspeisen. Nach der Installation und Konfiguration von BioCASe sind die Daten als BioCASe Webservice im Internet verfügbar und können mittels BioCASe-Protokollanfragen abgerufen werden. Die Provider Software ist nicht abhängig von einem bestimmten Datenstandard und lässt sich mit einem beliebigen Datenschema verwenden.

Die Provider Software muss auf einem Webserver des Datenlieferanten installiert werden. Kern ist der sogenannte PyWrapper, eine in Python entwickelte XML/CGI-Datenschnittstelle, die einen standardisierten Zugriff auf eine Vielzahl von Datenbankmanagementsystemen mit beliebigen Datenmodellen ermöglicht. Um diese Schnittstelle herum existieren verschiedene Tools, die die Einrichtung, Konfiguration und den Test der BioCASe-Installation und –Webservices vereinfachen.

Obwohl BioCASe prinzipiell mit jedem XML-Datenschema verwendet werden kann, ist das Haupteinsatzfeld die Anbindung von biologischen Beleg- und Beobachtungsdaten an Primärdatennetzwerke zur Artenvielfalt wie dem BioCASe Netzwerk und der Global Biodiversity Information Facility.

Voraussetzungen für den Einsatz der BioCASe Provider Software

Vor dem Einsatz der Provider Software sollte ein potentieller Datenlieferant drei Voraussetzungen prüfen:

  • Die zu veröffentlichenden Sammlungs- oder Beobachtungsdaten müssen in einem SQL-fähigen relationalen Datenbankmanagementsystem vorhanden sein oder in einem Format, zu dem ein Zugang über ODBC (Open Database Connectivity) möglich ist, wie z.B. Microsoft Excel. Nicht-relationale Datenbankmanagementsysteme werden nicht unterstützt. Derzeit kann sich die Provider Software mit den folgenden Datenbanksystemen verbinden: Microsoft Access, Microsoft SQL Server, MySQL, PostgreSQL, Oracle, Foxpro, Sybase, 4D, DB2, Firebird, Microsoft Excel.
  • Zur Installation der Provider Software muss ein dauerhaft mit dem Internet verbundener Webserver vorhanden sein (Apache oder Microsoft IIS). Dies kann ein Server des Datenproviders oder eines kommerziellen Hosting-Dienstes sein. Eine Veröffentlichung über eine Dial-up-Verbindung ist nicht möglich.
  • Auf diesem Webserver muss die Installation von Python (insofern es noch nicht installiert ist, was z.B. bei vielen gängigen Linux-Installationen der Fall ist) sowie zusätzlicher Python-Pakete möglich sein. Dies ist für Mitarbeiter der IT üblicherweise keine Hürde, solange dem keine institutionellen Richtlinien entgegenstehen. Für die optionale Erzeugung von DarwinCore-Archiven ist zusätzlich eine Java Runtime Environment nötig.

Vorgehensweise

Sollte die Wahl auf die BioCASe Provider Software fallen (bei der Entscheidungsfindung hilft das BioCASe Team gerne weiter), umfasst eine Anbindung von Daten üblicherweise die folgenden Schritte:

  1. Entscheiden, welche Daten an das Netzwerk angebunden werden sollen. Dazu gehören die Klärung der Frage, wem die Daten eigentlich gehören, sowie die Festlegung der Nutzungsbedingungen/-beschränkungen und einer Lizenz. Darüber hinaus sollte geprüft werden, welche Daten nicht veröffentlicht werden sollen, weil sie gefährdete Arten betreffen. In diesem Fall können bestimmte Datensätze komplett von der Veröffentlichung ausgeschlossen werden oder bestimmte Teile davon – z.B. die Koordinaten des Fundortes – gezielt verunschärft werden.
  2. Vorbereitung der Datenbank auf die Veröffentlichung. Dabei müssen die Entscheidung getroffen werden, ob die Live-Datenbank oder ein regelmäßig erzeugter Snapshot angebunden werden soll, und die Tabelle für die Metadaten angelegt und befüllt werden. In einigen Fällen sind weitere Datentransformationen nötig, siehe Tutorial.
  3. Installation der Provider Software, siehe Tutorial.
  4. Anlegen einer BioCASe Datenquelle, Verbinden mit der Datenbank und Definition der Datenbankstruktur, siehe Tutorial.
  5. Anlegen eines ABCD2 Mappings.
  6. Testen und Debuggen des BioCASe Webservices, siehe Tutorial.
  7. Nach Abschluss der Konfiguration kann der neue BioCASe-Webservice im Wunsch-Datennetzwerk angemeldet werden, z.B. bei GBIF. Wir empfehlen jedoch, davor kurz das BioCASe-Team zu kontaktieren, das einen Blick auf den neuen Webservice werfen und auf Richtigkeit prüfen kann. Falsche Mappings lassen sich umso leichter korrigieren, je früher sie entdeckt werden.

Support

Bei Problemen während Installation und Konfiguration empfehlen wir

  • In den FAQ nachzuschlagen, ob das Problem und eine Lösung dort beschrieben sind,
  • Befreundete Nutzer der BioCASe Provider Software um Rat zu fragen, oder
  • Kontakt mit dem BioCASe Team aufzunehmen. Bitte dabei genau das verwendete System (verwendetes BioCASe-Version sowie Betriebs/Datenbankmanagementsystem), Fehlermeldungen und die Schritte, die dazu führten, beschreiben. Screenshots sind dabei immer von Vorteil.