Die nestor-Ratgeber

Kostenlose Ratgeber: Digitale Langzeitarchivierung

Archivierung von Rohdaten

Der vollständige Titel der nestor-materialien 6 lautet „Studie zum Stand vorhandener Forschungsdaten und Rohdaten aus wissenschaftlichen Tätigkeiten: Erfordernisse und Eignung zur Archivierung beziehungsweise Zurverfügungstellung in Deutschland (Primärdaten)“.

Die Studie basiert auf einer Umfrage unter verschiedenen Forschungseinrichtungen. Sie zeigt, warum und wie wissenschaftliche Primärdaten, etwa Messdaten oder Resultate von Befragungen, an Forschungseinrichtungen gespeichert werden. Da dabei bundesweit jährlich mindestens 1000 bis 2000 TByte Datenvolumen (Stand 2004) mit stark wachsender Tendenz anfallen, werden ähnliche Strategien zur Langzeitarchivierung eingesetzt wie in Großunternehmen.

nestor-materialien 6: Langzeitarchivierung von Rohdaten.
nestor-materialien 6: Langzeitarchivierung von Rohdaten.

Interessant ist dabei, dass nach den Richtlinien der DFG und den Förderbedingungen des BMBF eine Speicherung der unbearbeitet erfassten Daten für zehn Jahre verlangt wird. Es gelten also vergleichbare Bedingungen, wie bei der Speicherung von geschäftsrelevanten Daten in der Wirtschaft. Allerdings gibt es auch Institutionen wie die DASA, für deren Daten bis zu 30 Jahre Archivierungsdauer vorgeschrieben sind. Im Verbund der Welt-Daten-Zentren (WDC) unter Führung des International Council of Science werden Daten sogar seit 1958 elektronisch verfügbar gehalten. Dazu werden sie in mit Metadaten verknüpften Formaten in Datenbanken gespeichert, die regelmäßig auf aktuelle Systeme migriert werden.

Einen interessanten Ansatz um WDC-Daten zitierfähig zu machen, verfolgt das DFG-Projekt „Publication and citation of Scientific Primary Data“. Dazu werden Persistent Identifier (DOI und URN) für Primärdaten vergeben, die so zusammen mit Literatur in bibliothekarischen Nachweisdiensten recherchierbar werden.