Difference between revisions of "Arbeitspaket 1: Analyse bestehender Lösungen und Komponenten (Monat 1-6),Federf.: BGBM"

From StandAPHerb
Jump to: navigation, search
 
(3 intermediate revisions by the same user not shown)
Line 1: Line 1:
===Arbeitspaket 1 (Beschreibung aus dem Arbeitsprogramm im Projektantrag)===  
+
===Arbeitspaket 1===  
  
 
Das zu entwickelnde Verfahren wird bereits bestehende Softwarekomponenten nutzen und in das System integrieren. Die vorhandenen eigenen Entwicklungen der Antragsteller, sowie andere Arbeiten wurden oben in Punkt 2 Stand der Forschung ausgeführt. In der ersten Projektphase werden eigene  Softwarelösungen parallel in den Themenfeldern Objekterkennung, Schrifterkennung und Text Mining in Kombination mit vorhandener Software für offene Software-Architekturen zusammengestellt und analysiert. Die im Projekt „Herbar Digital“ entwickelten Softwarelösungen im Bereich Objekt- und Schrifterkennung wurden bereits zielgerichtet für die Optimierung der Herbardigitalisierung entwickelt, während Text-Mining Komponenten in Bezug auf ihre Nutzung für den Herbardigitalisierungs- und Erschließungsworkflow hin überprüft werden müssen. Für die Überführung von Texten in eine strukturierte Form nutzt Text Mining Software Hintergrundwissen bzw.  themenspezifisches Wissen. Hierfür wird zunächst nach Informationssystemen mit themenspezifischem Wissen recherchiert, die für das Verfahren relevant sind, und anschließend geprüft. Ein Ausgangspunkt kann hier die Studie über Services für „semantic enrichment“ aus dem OpenUp! Projekt sein . Relevant sind beispielsweise  Systeme, die Informationen zu den wissenschaftlichen Namen auf den  Belegen, zu den Ortsangaben (z.B. in Form von Geothesauri) oder zur Zuordnung von Personen zu Handschriften liefern.
 
Das zu entwickelnde Verfahren wird bereits bestehende Softwarekomponenten nutzen und in das System integrieren. Die vorhandenen eigenen Entwicklungen der Antragsteller, sowie andere Arbeiten wurden oben in Punkt 2 Stand der Forschung ausgeführt. In der ersten Projektphase werden eigene  Softwarelösungen parallel in den Themenfeldern Objekterkennung, Schrifterkennung und Text Mining in Kombination mit vorhandener Software für offene Software-Architekturen zusammengestellt und analysiert. Die im Projekt „Herbar Digital“ entwickelten Softwarelösungen im Bereich Objekt- und Schrifterkennung wurden bereits zielgerichtet für die Optimierung der Herbardigitalisierung entwickelt, während Text-Mining Komponenten in Bezug auf ihre Nutzung für den Herbardigitalisierungs- und Erschließungsworkflow hin überprüft werden müssen. Für die Überführung von Texten in eine strukturierte Form nutzt Text Mining Software Hintergrundwissen bzw.  themenspezifisches Wissen. Hierfür wird zunächst nach Informationssystemen mit themenspezifischem Wissen recherchiert, die für das Verfahren relevant sind, und anschließend geprüft. Ein Ausgangspunkt kann hier die Studie über Services für „semantic enrichment“ aus dem OpenUp! Projekt sein . Relevant sind beispielsweise  Systeme, die Informationen zu den wissenschaftlichen Namen auf den  Belegen, zu den Ortsangaben (z.B. in Form von Geothesauri) oder zur Zuordnung von Personen zu Handschriften liefern.
Line 10: Line 10:
 
*'''[[Entwicklungen zur Objekterkennung, Schrifterkennung - HSH]]'''
 
*'''[[Entwicklungen zur Objekterkennung, Schrifterkennung - HSH]]'''
  
*'''[[Entwicklungen Text Mining, themenspezifisches Wissen, Systemarchitekturen (vorläufige Überschrift) - IOSB]]'''
+
*'''[[Entwicklungen Text Mining, themenspezifisches Wissen, Systemarchitekturen - IOSB]]'''
  
 
*'''[[Zusammenfassung / Summary]]'''
 
*'''[[Zusammenfassung / Summary]]'''

Latest revision as of 13:48, 2 November 2016

Arbeitspaket 1

Das zu entwickelnde Verfahren wird bereits bestehende Softwarekomponenten nutzen und in das System integrieren. Die vorhandenen eigenen Entwicklungen der Antragsteller, sowie andere Arbeiten wurden oben in Punkt 2 Stand der Forschung ausgeführt. In der ersten Projektphase werden eigene Softwarelösungen parallel in den Themenfeldern Objekterkennung, Schrifterkennung und Text Mining in Kombination mit vorhandener Software für offene Software-Architekturen zusammengestellt und analysiert. Die im Projekt „Herbar Digital“ entwickelten Softwarelösungen im Bereich Objekt- und Schrifterkennung wurden bereits zielgerichtet für die Optimierung der Herbardigitalisierung entwickelt, während Text-Mining Komponenten in Bezug auf ihre Nutzung für den Herbardigitalisierungs- und Erschließungsworkflow hin überprüft werden müssen. Für die Überführung von Texten in eine strukturierte Form nutzt Text Mining Software Hintergrundwissen bzw. themenspezifisches Wissen. Hierfür wird zunächst nach Informationssystemen mit themenspezifischem Wissen recherchiert, die für das Verfahren relevant sind, und anschließend geprüft. Ein Ausgangspunkt kann hier die Studie über Services für „semantic enrichment“ aus dem OpenUp! Projekt sein . Relevant sind beispielsweise Systeme, die Informationen zu den wissenschaftlichen Namen auf den Belegen, zu den Ortsangaben (z.B. in Form von Geothesauri) oder zur Zuordnung von Personen zu Handschriften liefern. Entwicklungen anderer Einrichtungen werden ebenfalls berücksichtigt, im Hinblick auf den aktuellen Stand recherchiert und ihre Verwendungsmöglichkeit für das Standardverfahren untersucht.

bestehende Lösungen und Komponenten