Datenbankarchivierung
Datenbankarchivierung bezeichnet in der Informatik Verfahren zur Gewährleistung einer auch längerfristigen Verfügbarkeit der erforderlichen Daten bezogen auf Datenbanksysteme.
Dies beinhaltet zum einen einfache Backup/Recovery-Verfahren, die durch die meisten Datenbankmanagementsysteme bereitgestellt werden. Zum anderen beinhaltet das aber auch eine anwendungsorientierte Datenbankarchivierung.
Eine anwendungsorientierte Datenbankarchivierung weist dabei folgende charakteristischen Eigenschaften auf:[1]
- Archivierung logischer Datengranulate: Auf Grundlage des jeweiligen Datenmodells können die zur archivierenden Datenausschnitte einzeln ausgewählt werden.
- Benutzerveranlassung: Ein Archivierungsvorgang kann ereignisgesteuert oder durch einen Benutzer explizit veranlasst werden.
- Datenauslagerung: Die operativen Daten sind physisch von den archivierten Daten getrennt.
- Archivzugriff: Der Zugriff auf die archivierten Daten muss bei Bedarf explizit angefordert werden. Dann werden die Daten wieder in die ursprüngliche Datenbank zurückgeführt.
Wichtige Aspekte der Datenbankarchivierung sind auch der Schutz der Datenintegrität (besonders wichtig im Hinblick auf gesetzliche Vorgaben), die Erhaltung der Information zur Datenherkunft und Datenautoren (Authentizität) sowie die Bewahrung des Lesbarkeit und Verständlichkeit der archivierten Daten. Letzterer Aspekt ist bei der Archivierung von Datenbanken besonders kritisch, da die Primärdaten selbst atomisiert, d. h. in kleinstmögliche, nicht-redundante Einheiten aufgetrennt, in verschiedenen Tabellen vorliegen. Diese Tabellen sind bei relationalen Datenbanken durch Schlüsselfelder miteinander verbunden. Gehen diese Relationen zwischen Tabellen verloren, führt dies zu Informationsverlust, da z. B. für codierte Felder dann die Verbindung zu der Tabelle mit den Codes und deren Bedeutung verloren geht. Dadurch unterscheidet sich die Archivierung von Datenbanken auch erheblich von der Archivierung anderer digitaler Objekte.[2][3]
Abgrenzung zwischen Backup und Archivierung
Der Begriff Datenbankarchivierung beinhaltet nicht bei allen Autoren die Backup/Recovery-Verfahren.[4][5] Manche Autoren unterscheiden zudem zwischen der Erstellung von Backups, der Archivierung zur Datenauslagerung und der langfristigen Archivierung von Datenbanken.[6] Bei der langfristigen Archivierung ist die Zielsetzung gegenüber dem Backup komplett verschieden. Beim Backup einer Datenbank steht die kurzfristige und schnelle Verfügbarkeit von aktuellen Daten im Falle einer Fehlfunktion oder eines Datenverlustes aus einem aktuell operablen System im Vordergrund. Die Archivierung zur Datenauslagerung soll inaktive Daten aus einem aktuell operablen Datenbanksystem auslagern, um somit Abfragen und Sicherungsprozesse zu beschleunigen. Beides setzt eine aktiv betriebene Datenbank voraus und in beiden Fällen wird lediglich eine Kopie der Daten erstellt (und bei der Auslagerung die Originaldaten gelöscht). Sowohl Erstellung als auch Re-Import der Daten sind dabei eng an die jeweilige Datenbankmanagementsoftware gebunden. Dagegen zielt die langfristige Datenbankarchivierung auf eine langfristige, die Datenintegrität garantierende und herstellerunabhängige Aufbewahrung von strukturierten Daten. Für eine herstellerunabhängige Aufbewahrungsform ist eine Loslösung der Daten von proprietären oder software-spezifischen Datenformaten notwendig (Normalisierung).[2]
Literatur
- Axel Herbst: Anwendungsorientiertes DB-Archivieren. Springer, Berlin 1997, ISBN 3-540-63209-3
- Ralf Schaarschmidt: Archivierung in Datenbanksystemen. Teubner, Stuttgart 2001, ISBN 3-519-00325-2
- Stefan Brandl, Dr. Peter Keller-Marxer: Long-term Archiving of Relational Databases with Chronos (PDF-Datei; 454 kB). Edinburgh 2007
- Andrew Lindley, Database Preservation Evaluation Report. SIARD vs. CHRONOS. Database Preservation Evaluation Report. SIARD vs. CHRONOS. Preserving Complex Structures as Databases Through a Record Centric Approach. In: Preserving Transactional Data. Briefing Day. Joint Workshop of the Digital Preservation Coalition and UK Data Service. London 2016. ?
Einzelnachweise
- Herbst 1997, Seite 34, siehe Literatur
- Stephan Heuscher, Stephan Jaermann, Peter Keller-Marx, Frank Moehle: Providing Authentic Long-term Archival Access to Complex Relational Data. In: Proceedings PV-2004: Ensuring the Long-Term Preservation and Adding Value to the Scientific and Technical Data, 5-7 October 2004 , ESA/ESRIN, Frascati, Italy, (ESA WPP-232). arXiv preprint cs/0408054, 2004, S. 241–261.
- Stefan Brand, Peter Keller-Marxer: Long-Term Archiving of Relational Databases with Chronos. Hrsg.: First International Workshop on Database Preservation (PresDB'07). 23 March 2007, at the UK Digital Curation Centre and the Database Group in the School of Informatics, University of Edinburgh. Edinburgh 2007 (researchgate.net [PDF]).
- Schaarschmidt 2001, Seite 33
- Axel Herbst: Archivierungskonzepte in Verbindung mit DBS. In: Axel Herbst (Hrsg.): Anwendungsorientiertes DB-Archivieren. Springer, Berlin, Heidelberg, ISBN 978-3-642-64591-4, S. 24–52, doi:10.1007/978-3-642-60863-6_3.
- Klaus Küspert, Ralf Schaarschmidt: Archivierung in Datenbanksystemen. In: Informatik Spektrum. Band 21, Nr. 5, ISSN 0170-6012, S. 277–278, doi:10.1007/s002870050106 (springer.com [PDF]).