2. Treffen, 1.u.2.Juli 2017: Difference between revisions

← Older edit

Latest revision as of 12:27, 6 February 2018

Treffen der projektbegleitenden Arbeitsgruppe zum StanDAP-Herb Projekt

Teilnehmer/innen

- Stefan Dressler, Frankfurt, Senckenberg Forschungsinstitut und Naturmuseum Frankfurt

- Hans-Joachim Esser, München, Botanische Staatssammlung München

- Markus Oppermann, Gatersleben, Leibnitz Institut für Pflanzengenetik und Kulturpflanzenforschung

- Heimo Rainer, Wien, Naturhistorisches Museum Wien

- Albert Dieter Stevens, Berlin, Botanischer Garten und Botanisches Museum Berlin

StanDAP-Herb Projekt:

- Eduard Santamaria, Karlsruhe, Fraunhofer-Institut für Optronik, Systemtechnik und Bildauswertung (IOSB)

- Walter Berendsohn, Berlin, Botanischer Garten und Botanisches Museum Berlin

- Anton Güntsch, Berlin, Botanischer Garten und Botanisches Museum Berlin

- Agnes Kirchhoff, Berlin, Botanischer Garten und Botanisches Museum Berlin

- Dominik Röpert, Berlin, Botanischer Garten und Botanisches Museum Berlin

- Fabian Reimeier, Berlin, Botanischer Garten und Botanisches Museum Berlin

Tagesordnung

Donnerstag 01. Juni 2017 (13.00 – 17.00 Uhr)

1. Begrüßung, Vorstellung der Teilnehmer, Tagesordnung

2. Kurze Übersicht über das StanDAP-Herb Projekt

3. Demonstration von bestehenden Entwicklungen und Diskussion

• Entwicklungen in der Objekterkennung

• Kooperation mit ‚Herbardrop‘

• Services zur Extraktion von Metadaten aus Texten

• ‚Open Refine‘ als Datenmanagement-Tool für StanDAP-Herb

• Integration von JACQ

Freitag 02. Juni 2017 (9.00-12.00)

4. Diskussion

5. Andere Initiativen

• Schriftproben (Autographen)

• Annosys (Annotationssystem)

• Identifier (Stable Identifier)

• Herbonauten (Citizen Science)

6. Ausblick

Präsentationen / Links

Präsentationen

StanDAP-Herb Einleitung, Empfehlungen der Arbeitsgruppe: File:StanDAPHerb Projektinformationen.pdf

Textbased Information Extraction Services: File:Textbased Information Extraction Services IOSB.PDF

Stable Identifiers: File:Stable Identifiers Guentsch 2016.PDF

Objekterkennung:File:Objekterkennung.pdf

Open Refine: File:OpenRefine.pdf

Links

Autographen: Autographensammlung des Botanischen Gartens und Botanischen Museums Berlin

Herbonauten: Die Herbonauten - ein Citizen Science Projekt zur Erschließung von Herbarbelegen am BGBM

Annosys: Annosys - ein Annotationssystem für Biodiversitätsdaten

Empfehlungen / Diskussion

Schwerpunkt des Systems: Datenanalyse, Datenbereinigung, Vorsortierung zur weiteren Bearbeitung

• Wird ein Workflow Management-System verwendet? Für unsere Ziele zu wenig variabel, die Vorgehensweise wird zu stark festgelegt

• Best Practise: Workflow in einer Abbildung darstellen (liegt bereits vor)

• Kombination von Datenquellen/Services: Kann man im Prozess schon eine Rückkopplung machen? Das würde die Effektivität erhöhen.

• Gibt es Algorithmen, die auf Basis von Trainingssets Regular Expressions selbst entwickeln?

• Bestehende Systeme für Schrifterkennung einbinden; Es gibt an der Uni Innsbruck Trainingsdatensätze für NNs, die man nutzen könnte.

• Besteht eine Verbindung zu institutionellen Datenbanken, in denen die Daten endgültig gespeichert werden sollen? Keine direkte Speicherung, Mapping beispielhaft für JACQ

• In welchem Repository ist das System zu finden? OpenRefine in Github

• Automatisierte Skripte?

• Empfehlung: Direkte Anbindung an Datenbanken wünschenswert

• Empfehlung: Benutzung vereinfachen

• Empfehlung: Bekanntmachung von StanDAP-Herb beim nächsten Treffen der Herbarkustoden

• Empfehlung: bei Personennamen lokale für die jeweilige Institution relevante Listen einbinden

• Empfehlung weitere Entwicklungen: Kombination von Lebensdaten von Personen mit Sammeldatum

• Empfehlung: Skalierbarkeit, System auf große Datenmengen vorbereiten

• Empfehlung: Mitspeicherung der statistischen Inferenz

• Empfehlung: alle Präsentationen und Links ins Wiki stellen

Kommentare zu weiteren Initiativen

Herbonauten

Empfehlung Antrag (z.B. DFG LIS) für mehrere Institutionen stellen: Wien, Frankfurt, München unterstützen die Initiative

Annosys

Lokale Bearbeitung

Empfehlung: JSTOR Einbindung wichtig

Dubletten

Identifier

Wallich-Link

Wie wird mit Änderungen bei IDs umgegangen? IDs direkt mit Specimen verknüpft

Wie sollen die URI generiert werden? Z.B. aus Barcodes

DOIs bei Genbanken

Autographen

Wie sind die Dokumente lizensiert?

Personennamen referenzieren nach Viaf (bereits referenziert nach GND und HUH)

Autographen mit Europeana verlinken

LIDO Standard berücksichtigen

Weiterentwicklung: Autographensammlungen anderer Institute einbinden

Antrag für ein Autographenprojekt stellen

Einbindung in KALIOPE Autographensammlung

2. Treffen, 1.u.2.Juli 2017: Difference between revisions

Latest revision as of 12:27, 6 February 2018

Contents

Treffen der projektbegleitenden Arbeitsgruppe zum StanDAP-Herb Projekt

Teilnehmer/innen

Tagesordnung

Präsentationen / Links

Empfehlungen / Diskussion

Navigation menu

Page actions

Page actions

Personal tools

Navigation

Search

Tools

@@ Line 1: / Line 1: @@
-'''Teilnehmer'''
+=== Treffen der projektbegleitenden Arbeitsgruppe zum StanDAP-Herb Projekt ===
+== Teilnehmer/innen ==
 - Stefan Dressler, Frankfurt, Senckenberg Forschungsinstitut und Naturmuseum Frankfurt
@@ Line 14: / Line 17: @@
 StanDAP-Herb Projekt:
-- Eduard Santamaria, Karlsruhe, IOSB Fraunhofer Institut
+- Eduard Santamaria, Karlsruhe, Fraunhofer-Institut für Optronik, Systemtechnik und Bildauswertung (IOSB)
 - Walter Berendsohn, Berlin, Botanischer Garten und Botanisches Museum Berlin
@@ Line 27: / Line 30: @@
-'''Tagesordnung'''
+== Tagesordnung ==
-'Donnerstag 01. Juni 2017 (13.00 – 17.00 Uhr)'
+'''Donnerstag 01. Juni 2017 (13.00 – 17.00 Uhr)'''
 . Begrüßung, Vorstellung der Teilnehmer, Tagesordnung
@@ Line 48: / Line 50: @@
 • Integration von JACQ
+'''Freitag 02. Juni 2017 (9.00-12.00)'''
-'Freitag 02. Juni 2017 (9.00-12.00)'
 . Diskussion
@@ Line 56: / Line 56: @@
 . Andere Initiativen
-• Schriftproben
+• Schriftproben (Autographen)
-• Annosys
+• Annosys (Annotationssystem)
-• Identifier
+• Identifier (Stable Identifier)
-• Herbonauten
+• Herbonauten (Citizen Science)
 . Ausblick
+== Präsentationen / Links ==
+''Präsentationen''
+* StanDAP-Herb Einleitung, Empfehlungen der Arbeitsgruppe: [[File: StanDAPHerb_Projektinformationen.pdf]]
+* Textbased Information Extraction Services: [[File: Textbased_Information_Extraction_Services_IOSB.PDF]]
+* Stable Identifiers: [[File: Stable_Identifiers_Guentsch_2016.PDF]]
+* Objekterkennung:[[File: Objekterkennung.pdf]]
+* Open Refine: [[File: OpenRefine.pdf]]
+''Links''
+* Autographen: [http://ww2.bgbm.org/herbarium/autographen.cfm Autographensammlung des Botanischen Gartens und Botanischen Museums Berlin]
+* Herbonauten: [https://www.herbonauten.de/ Die Herbonauten - ein Citizen Science Projekt zur Erschließung von Herbarbelegen am BGBM]
+* Annosys: [https://annosys.bgbm.fu-berlin.de/ Annosys - ein Annotationssystem für Biodiversitätsdaten]
+== Empfehlungen / Diskussion ==
+Schwerpunkt des Systems: Datenanalyse, Datenbereinigung, Vorsortierung zur weiteren Bearbeitung
+•	Wird ein Workflow Management-System verwendet? Für unsere Ziele zu wenig variabel, die Vorgehensweise wird zu stark festgelegt
+•	Best Practise: Workflow in einer Abbildung darstellen (liegt bereits vor)
+•	Kombination von Datenquellen/Services: Kann man im Prozess schon eine Rückkopplung machen? Das würde die Effektivität erhöhen.
+•	Gibt es Algorithmen, die auf Basis von Trainingssets Regular Expressions selbst entwickeln?
+•	Bestehende Systeme für Schrifterkennung einbinden; Es gibt an der Uni Innsbruck Trainingsdatensätze für NNs, die man nutzen könnte.
+•	Besteht eine Verbindung zu institutionellen Datenbanken, in denen die Daten endgültig gespeichert werden sollen? Keine direkte Speicherung, Mapping beispielhaft für JACQ
+•	In welchem Repository ist das System zu finden? OpenRefine in Github
+•	Automatisierte Skripte?
+•	Empfehlung: Direkte Anbindung an Datenbanken wünschenswert
+•	Empfehlung: Benutzung vereinfachen
+•	Empfehlung: Bekanntmachung von StanDAP-Herb beim nächsten Treffen der Herbarkustoden
+•	Empfehlung: bei Personennamen lokale für die jeweilige Institution relevante Listen einbinden
+•	Empfehlung weitere Entwicklungen: Kombination von Lebensdaten von Personen mit Sammeldatum
+•	Empfehlung:  Skalierbarkeit, System auf große Datenmengen vorbereiten
+•	Empfehlung: Mitspeicherung der statistischen Inferenz
+•	Empfehlung: alle Präsentationen und Links ins Wiki stellen
+'''Kommentare zu weiteren  Initiativen'''
+''Herbonauten''
+Empfehlung Antrag (z.B. DFG LIS) für mehrere Institutionen stellen: Wien, Frankfurt, München unterstützen die Initiative
+''Annosys''
+Lokale Bearbeitung
+Empfehlung: JSTOR Einbindung wichtig
+Dubletten
+''Identifier''
+Wallich-Link
+Wie wird mit Änderungen bei IDs umgegangen? IDs direkt mit Specimen verknüpft
+Wie sollen die URI generiert werden? Z.B. aus Barcodes
+DOIs bei Genbanken
+''Autographen''
+Wie sind die Dokumente lizensiert?
+Personennamen referenzieren nach Viaf (bereits referenziert nach GND und HUH)
+Autographen mit Europeana verlinken
+LIDO Standard berücksichtigen
+Weiterentwicklung: Autographensammlungen anderer Institute einbinden
+Antrag für ein Autographenprojekt stellen
+Einbindung in KALIOPE Autographensammlung