Allgemeine Anpassung zur Bereitstellung einer Schnittstelle

Aus Recorder-Wiki
Wechseln zu: Navigation, Suche

Bei der Bereitstellung einer Schnittstelle, die einen schnellen und unkomplizierten Import von Daten externer Systeme nach Recorder ermöglicht, gibt es einige "recorderspezifische" Dinge zu beachten.

Um die Beobachtung einer Pflanze oder eines Tieres festzuhalten, wird ein Mindeststandard vorausgesetzt. Die 5 W - Fragen WER, WAS, WANN, WO und WIE werden allgemein als Minimalkonsens für valide Artbeobachtungen betrachtet. Anhand dieser Fragen soll im Folgenden eine minimalistische Recorder Schnittstelle für Artenbeobachtungen aus Fremdsystemen beschrieben werden. Informationen zum Import von Inhalten, welche über die hier für die Minimalschnittstelle beschriebenen hinaus gehen, finden sich unter Import-Wizard.


Allgemeines

Dateiformat

Recorder verfügt mit dem Import Assistenten über eine gute Importschnittstelle für Flache Tabellen, auch als „Flat Table“ bzw. „Flat File Database“ bezeichnet. Dafür müssen die Daten so strukturiert sein, dass jede Reihe genau eine Beobachtung repräsentiert. Auch hierarchische Zusammenhänge können bei speziellen Inhalten innerhalb dieser „flachen Tabellen“ dargestellt werden. Recorder unterstützt beim Import zahlreiche Quellformate, u.a. Excel-Arbeitsblätter, Access Datenbanken, CSV-Dateien oder dBase-Dateien.

Für die Minimal-Schnittstelle bietet sich das CSV-Dateiformat als Austauschformat an. Die Dateien müssen im ANSI-Textformat (siehe auch Windows-1252) vorliegen. Für das Format der CSV-Datei gilt zu beachten:

  • Als Trennung von Datensätzen sollte die bei dem Betriebssystem Windows übliche Zeichenfolge Zeilenvorschub + Wagenrücklauf (CRLF; Dezimal-Zeichencode 10, 13) genutzt werden
  • Zur Trennung von Datenfeldern (Spalten) innerhalb der Datensätze sollte ein Komma eingesetzt werden.
  • Das Feldbegrenzerzeichen (auch: Textbegrenzungszeichen) ist das doppelte Anführungszeichen ". Alle Datenfelder sollten vom Feldbegrenzerzeichen eingeschlossen werden. Wenn der Feldbegrenzer selbst in den Daten enthalten ist, muss dieser im Datenfeld verdoppelt werden.

Die zum Format der CSV-Datei genannten Vorgaben sind nicht zwingend notwendig, erleichtern aber dem Nutzer den Import.

Spaltennamen und Reihenfolge

Der erste Datensatz sollte ein Kopfdatensatz sein, der die Spaltennamen definiert. Dies ist nicht zwingend, aber erleichtert den Import. Im Folgenden wird eine Bezeichnug für die Spalten vorgeschlagen, die beim Import automatisch erkannt wird, so dass die Inhalte der Importdaten gleich korrekt zugeordnet werden.

Die Reihenfolge der Spalten ist frei wählbar.

Wer

Eine textliche Auflistung der Namen der Personen, die für die Beobachtung zuständig sind, also eines Erfassers oder mehrerer Erfasser (Kartierer) (Observer),

Mehrere Personen werden durch eines der Zeichen , ; / \ „und“ & + getrennt, der Hauptsammler oder Beobachter sollte an erster Stelle stehen.

Obwohl Recorder den Import sehr unterschiedlicher Zusammensetzungen von Kartierernamen korrekt ausführen kann, gibt es immer wieder Fälle, in denen die Namen nicht korrekt erkannt werden. Am sichersten ist es, alle Beobachter mit Vor- und Zunamen und per Semikolon getrennt aufzulisten:

Donald Duck; Dagobert Duck; Tick Duck

Vorgeschlagene Bezeichnung: Recorder


Was

Die wissenschaftliche Bezeichnung der beobachteten Art oder Sippe, optional mit dem Autorennamen.

Beispiel:

Poa annua L.

Vorgeschlagene Bezeichnung: Taxon


Wann

Das Datum der Beobachtung.

Hier sollte für einen reibungslosen Import die landesspezifische Einstellung des Datumformates genutzt werden. Für Daten aus Deutschland wäre das: tt.mm.jjjj

Beispiel:

26.03.2014

Vorgeschlagene Bezeichnung: Date

Wo

Recorder erwartet beim Import zumindest die Angabe einer Raumreferenz (also einer Koordinate). Es werden zahlreiche Raumreferenzsysteme unterstützt. Für moblie Erfassungssysteme, die mit GPS-Daten arbeiten, bietet sich die Bereitstellung der Original WGS84-Daten (EPSG:4326) an.


Recorder benötigt die Raumreferenz in einer Spalte. Für Geographische Koordinaten (Breite und Länge) gilt Folgendes:

  • die Reihenfolge der Koordinaten in der Importspalte muss zuerst Breite und dann Länge sein.
  • die Koordinaten müssen jeweils mit einer Richtungsangabe ergänzt sein (N,S bei Breitengraden, W,E bei Längengraden), negative Werte werden nicht akzeptiert.
  • Es werden sowohl Dezimalkomma als auch Dezimalpunkt akzeptiert. Wenn ein Komma gewählt wurde, darf das Listentrennzeichen nicht ebenfalls ein Komma sein (unabhängig von der Voreinstellung und (?) auch der landesspezifischen Einstellung).
  • Als Listentrennzeichen werden viele Zeichen, sofern sie keine Ziffern sind, akzeptiert (unabhängig von der Vorgabe im Template).
  • Die maximale Anzahl an akzeptierten Nachkommastellen ist 5.

In einer weiteren Spalte sollte Recorder das Raumbezugssystem mitgeteilt werden. Das Kürzel für Breiten- und Längenwerte (WGS84) lautet LTLN.


Beispiele Länge und Breite:

Werte gültig
49,49527;6,55943 nein
49,49527N 6,55943E ja
49,49527N,6,55943E nein
49,49527N;6,55943E ja
49,49527 6,55943 nein
49.49527N 6.55943E ja
49.49527N;6.55943E ja
49.49527NI6.55943E nein
49.49527N$6.55943E ja


Vorgeschlagene Bezeichnung: Spatial Reference (für die Raumreferenz), Spatial Reference System (für das Raumreferenzsystem)

Wie

Angabe über die Art und Weise, wie eine Beobachtung erhoben wurde. Diese Angabe ist jedoch fakultativ. Es sollte aber zumindest der Begriff "Feldbeobachtung" eingesetzt werden.

Vorgeschlagene Bezeichnung: Sample Type


Beispiel einer validen CSV-Datei

Recorder,Date,Taxon,Spatial Reference,Spatial Reference System,Sample Type
"Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Agrostis capillaris L.","49,65821N;7,09442E","LTLN","Feldbeobachtung"
"Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Cirsium arvense (L.) Scop.","49,65824N;7,09427E","LTLN","Feldbeobachtung"
"Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Teucrium scorodonia L.","49,65824N;7,09427E","LTLN","Feldbeobachtung"
"Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Galium aparine L.","49,65824N;7,09427E","LTLN","Feldbeobachtung"
"Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Vicia sepium L.","49,65824N;7,09427E","LTLN","Feldbeobachtung"
"Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Stellaria holostea L.","49,65826N;7,09433E","LTLN","Feldbeobachtung"
"Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Festuca filiformis Pourr.","49,65830N;7,09431E","LTLN","Feldbeobachtung"
"Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Bellis perennis L.","49,65782N;7,09447E","LTLN","Feldbeobachtung"
"Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Carex nigra (L.) Reichard","49,65788N;7,09471E","LTLN","Feldbeobachtung"
"Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Thesium pyrenaicum Pourr. subsp. pyrenaicum","49,65803N;7,09450E","LTLN","Feldbeobachtung"
"Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Ranunculus bulbosus L.","49,65799N;7,09448E","LTLN","Feldbeobachtung"
"Donald Duck; Dagobert Duck; Trick Duck","30.05.2014","Leucanthemum vulgare agg.","49,65799N;7,09448E","LTLN","Feldbeobachtung"


Der Einschluss der Felder in Feldbegrenzer ist nur für das Feld Spatial Reference zwingend notwendig, da hier Kommata als Dezimaltrennzeichen auftreten, die gleichzeitig als Trennung der Datensätze eingesetzt sind.