Allgemeine Anpassung zur Bereitstellung einer Schnittstelle
Bei der Bereitstellung einer Schnittstelle, die einen schnellen und unkomplizierten Import von Daten externer Systeme nach Recorder ermöglicht, gibt es einige "recorderspezifische" Dinge zu beachten.
Um die Beobachtung einer Pflanze oder eines Tieres festzuhalten, wird ein Mindeststandard vorausgesetzt. Die 5 W - Fragen WER, WAS, WANN, WO und WIE werden allgemein als Minimalkonsens für valide Artbeobachtungen betrachtet. Anhand dieser Fragen soll im Folgenden eine minimalistische Recorder Schnittstelle für Artenbeobachtungen aus Fremdsystemen beschrieben werden. Informationen zum Import von Inhalten, welche über die hier für die Minimalschnittstelle beschriebenen hinaus gehen, finden sich unter Import-Wizard.
Inhaltsverzeichnis
Allgemeines
Dateiformat
Recorder verfügt mit dem Import Assistenten über eine gute Importschnittstelle für Flache Tabellen, auch als „Flat Table“ bzw. „Flat File Database“ bezeichnet. Dafür müssen die Daten so strukturiert sein, dass jede Reihe genau eine Beobachtung repräsentiert. Auch hierarchische Zusammenhänge können bei speziellen Inhalten innerhalb dieser „flachen Tabellen“ dargestellt werden. Recorder unterstützt beim Import zahlreiche Quellformate, u.a. Excel-Arbeitsblätter, Access Datenbanken, CSV-Dateien oder dBase-Dateien.
Für die Minimal-Schnittstelle bietet sich das CSV-Dateiformat als Austauschformat an. Die Dateien müssen im ANSI-Textformat (siehe auch Windows-1252) vorliegen. Für das Format der CSV-Datei gilt zu beachten:
- Als Trennung von Datensätzen sollte die bei dem Betriebssystem Windows übliche Zeichenfolge Zeilenvorschub + Wagenrücklauf (CRLF; Dezimal-Zeichencode 10, 13) genutzt werden
- Zur Trennung von Datenfeldern (Spalten) innerhalb der Datensätze sollte ein Komma eingesetzt werden.
- Das Feldbegrenzerzeichen (auch: Textbegrenzungszeichen) ist das doppelte Anführungszeichen ". Alle Datenfelder sollten vom Feldbegrenzerzeichen eingeschlossen werden. Wenn der Feldbegrenzer selbst in den Daten enthalten ist, muss dieser im Datenfeld verdoppelt werden.
Die zum Format der CSV-Datei genannten Vorgaben sind nicht zwingend notwendig, erleichtern aber dem Nutzer den Import.
Spaltennamen und Reihenfolge
Der erste Datensatz sollte ein Kopfdatensatz sein, der die Spaltennamen definiert. Dies ist nicht zwingend, aber erleichtert den Import. Im Folgenden wird eine Bezeichnug für die Spalten vorgeschlagen, die beim Import automatisch erkannt wird, so dass die Inhalte der Importdaten gleich korrekt zugeordnet werden.
Die Reihenfolge der Spalten ist frei wählbar.
Wer
Eine textliche Auflistung der Namen der Personen, die für die Beobachtung zuständig sind, also eines Erfassers oder mehrerer Erfasser (Kartierer) (Observer),
Mehrere Personen werden durch eines der Zeichen , ; / \ „und“ & + getrennt, der Hauptsammler oder Beobachter sollte an erster Stelle stehen.
Obwohl Recorder den Import sehr unterschiedlicher Zusammensetzungen von Kartierernamen korrekt ausführen kann, gibt es immer wieder Fälle, in denen die Namen nicht korrekt erkannt werden. Am sichersten ist es, alle Beobachter mit Vor- und Zunamen und per Semikolon getrennt aufzulisten:
Donald Duck; Dagobert Duck; Tick Duck
Vorgeschlagene Bezeichnung: Recorder
Was
Die wissenschaftliche Bezeichnung der beobachteten Art oder Sippe, optional mit dem Autorennamen.
Beispiel:
Poa annua L.
Vorgeschlagene Bezeichnung: Taxon
Wann
Das Datum der Beobachtung.
Hier sollte für einen reibungslosen Import die landesspezifische Einstellung des Datumformates genutzt werden. Für Daten aus Deutschland wäre das: tt.mm.jjjj
Beispiel:
26.03.2014
Vorgeschlagene Bezeichnung: Date
Wo
Recorder erwartet beim Import zumindest die Angabe einer Raumreferenz (also einer Koordinate). Es werden zahlreiche Raumreferenzsysteme unterstützt. Für moblie Erfassungssysteme, die mit GPS-Daten arbeiten, bietet sich die Bereitstellung der Original WGS84-Daten (EPSG:4326) an.
Recorder benötigt die Raumreferenz in einer Spalte. Für Geographische Koordinaten (Breite und Länge) gilt Folgendes:
- die Reihenfolge der Koordinaten in der Importspalte muss zuerst Breite und dann Länge sein.
- die Koordinaten müssen jeweils mit einer Richtungsangabe ergänzt sein (N,S bei Breitengraden, W,E bei Längengraden), negative Werte werden nicht akzeptiert.
- Es werden sowohl Dezimalkomma als auch Dezimalpunkt akzeptiert. Wenn ein Komma gewählt wurde, darf das Listentrennzeichen nicht ebenfalls ein Komma sein (unabhängig von der Voreinstellung und (?) auch der landesspezifischen Einstellung).
- Als Listentrennzeichen werden viele Zeichen, sofern sie keine Ziffern sind, akzeptiert (unabhängig von der Vorgabe im Template).
- Die maximale Anzahl an akzeptierten Nachkommastellen ist 5.
In einer weiteren Spalte sollte Recorder das Raumbezugssystem mitgeteilt werden. Das Kürzel für Breiten- und Längenwerte (WGS84) lautet LTLN.
Beispiele Länge und Breite:
Werte | gültig |
49,49527;6,55943 | nein |
49,49527N 6,55943E | ja |
49,49527N,6,55943E | nein |
49,49527N;6,55943E | ja |
49,49527 6,55943 | nein |
49.49527N 6.55943E | ja |
49.49527N;6.55943E | ja |
49.49527NI6.55943E | nein |
49.49527N$6.55943E | ja |
Vorgeschlagene Bezeichnung: Spatial Reference (für die Raumreferenz), Spatial Reference System (für das Raumreferenzsystem)
Wie
Angabe über die Art und Weise, wie eine Beobachtung erhoben wurde. Diese Angabe ist jedoch fakultativ. Es sollte aber zumindest der Begriff "Feldbeobachtung" eingesetzt werden.
Vorgeschlagene Bezeichnung: Sample Type
Beispiel einer validen CSV-Datei
Recorder,Date,Taxon,Spatial Reference,Spatial Reference System,Sample Type "Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Agrostis capillaris L.","49,65821N;7,09442E","LTLN","Feldbeobachtung" "Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Cirsium arvense (L.) Scop.","49,65824N;7,09427E","LTLN","Feldbeobachtung" "Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Teucrium scorodonia L.","49,65824N;7,09427E","LTLN","Feldbeobachtung" "Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Galium aparine L.","49,65824N;7,09427E","LTLN","Feldbeobachtung" "Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Vicia sepium L.","49,65824N;7,09427E","LTLN","Feldbeobachtung" "Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Stellaria holostea L.","49,65826N;7,09433E","LTLN","Feldbeobachtung" "Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Festuca filiformis Pourr.","49,65830N;7,09431E","LTLN","Feldbeobachtung" "Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Bellis perennis L.","49,65782N;7,09447E","LTLN","Feldbeobachtung" "Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Carex nigra (L.) Reichard","49,65788N;7,09471E","LTLN","Feldbeobachtung" "Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Thesium pyrenaicum Pourr. subsp. pyrenaicum","49,65803N;7,09450E","LTLN","Feldbeobachtung" "Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Ranunculus bulbosus L.","49,65799N;7,09448E","LTLN","Feldbeobachtung" "Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Leucanthemum vulgare agg.","49,65799N;7,09448E","LTLN","Feldbeobachtung"
Der Einschluss der Felder in Feldbegrenzer ist nur für das Feld Spatial Reference zwingend notwendig, da hier Kommata als Dezimaltrennzeichen auftreten, die gleichzeitig als Trennung der Datensätze eingesetzt sind.