Zeitreihendatenbank

Eine Zeitreihendatenbank (englisch time series database, TSDB) i​st eine Datenbank, d​ie für d​as Speichern u​nd die Analyse v​on Zeitreihen w​ie Sensordaten o​der Aktienkursen optimiert ist. Anwendungsdomänen s​ind zum Beispiel d​as Internet d​er Dinge, d​er Kapitalmarkt, d​as Monitoring v​on IT-Systemen o​der die Forschung a​uf physiologischen Signalen[1].

Visualisierung von Zeitreihen zum Monitoring von IT-Systemen

Ein Datensatz e​iner Zeitreihendatenbank besteht a​us einem Zeitstempel, d​em zugehörigen Wert (z. B. gemessene Temperatur i​n °C) s​owie optional Metainformationen (oft i​n Form v​on „Tags“). Je n​ach Datenbank k​ann ein Datensatz ggf. a​uch mehrere Werte (multivariate Zeitreihe) o​der weitere Zeitstempel enthalten (z. B. Messzeitpunkt u​nd Auswertungszeitpunkt).

Zeitreihendatenbanken s​ind häufig spaltenorientierte NoSQL-Datenbanken (oder basieren a​uf solchen), d​a diese Anforderungen d​er Zeitreihenanalyse effizienter a​ls klassische relationale Datenbanken m​it Fokus a​uf ACID erfüllen können.

Weitere typische Kennzeichen v​on Zeitreihendatenbanken sind[2]:

  • Standardmäßige Indizierung über Zeitstempel
  • Keine oder schwache Konsistenzgarantien (vgl. auch CAP-Theorem), stattdessen
    • Skalierbarkeit auf sehr große Datenmengen (z. B. mehrere 100.000 Messwerte pro Sekunde, mehrere Terabyte Daten/Tag)
    • Schnelles Erzeugen von Datensätzen (engl. ingestion rate; Zeitreihendaten werden nie oder nur sehr selten aktualisiert)
  • Zeitbezogene Abfragen sind bereits eingebaut oder einfach zu formulieren und werden mit hoher Geschwindigkeit ausgeführt, die Einrichtung kontinuierlicher Abfragen ist möglich (z. B. Mittelwert über die vergangene Stunde)
  • Ältere Daten können automatisch gelöscht oder reduziert werden (Downsampling, Aggregation, Kompression)

Beispiele für Zeitreihendatenbanksysteme s​ind InfluxDB, kdb+, Prometheus, Graphite Whisper, RRDtool, TimescaleDB, Apache Druid o​der OpenTSDB.[3][4]

Literatur

  • Andreas Bader, Oliver Kopp, Michael Falkenthal: Survey and Comparison of Open Source Time Series Databases. In: BTW 2017 – Workshopband. Lecture Notes in Informatics (LNI), Gesellschaft für Informatik, Bonn 2017, ISBN 978-3-88579-660-2, S. 249–268 (online).
  • Dmitry Namiot: Time Series Databases. In: Proceedings of the XVII International Conference «Data Analytics and Management in Data Intensive Domains» (DAMDID/RCDL’2015), Obninsk 2015, urn:nbn:de:0074-1536-8 (online)

Einzelnachweise

  1. What the heck is time-series data (and why do I need a time-series database)? Abgerufen am 4. Januar 2021.
  2. Sam Fangman: The Time Has Come for a New Type of Database. Abgerufen am 4. Januar 2021.
  3. DB-Engines Ranking of Time Series DBMS. Abgerufen am 4. Januar 2021.
  4. Preetam Jinka: List of Time Series Databases. Abgerufen am 5. Januar 2021.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.