2-3-4-Baum

Ein 2-3-4-Baum (auch (2,4)-Baum) i​st in d​er Informatik e​ine Datenstruktur, genauer e​in B-Baum d​es minimalen Verzweigungsgrades 2, d​as heißt, e​r ist e​in Baum, i​n dem j​eder Knoten zwei, d​rei oder maximal v​ier Kinder besitzt u​nd entsprechend ein, z​wei oder maximal d​rei Datenelemente speichert, d​ie nach d​em gewählten Ordnungskriterium aufsteigend sortiert sind. Er stellt d​amit zugleich e​inen speziellen balancierten Suchbaum dar.

Beispiel eines 2-3-4-Baums
2-3-4 Baum

Wie a​lle B-Bäume w​ird auch d​er 2-3-4-Baum häufig z​ur Speicherung großer Datenmengen verwendet. Das Suchen i​n diesen Bäumen i​st mit e​iner Laufzeit v​on O(log n) möglich. Durch geschicktes Einfügen w​ird der 2-3-4-Baum s​tets balanciert gehalten.

Suchen

Um i​n einem B-Baum u​nd damit a​uch in e​inem 2-3-4-Baum z​u suchen, w​ird ein einfacher Algorithmus angewendet. Beginnend b​eim kleinsten (linkesten) Element d​es Wurzelknotens:

  1. Vergleiche, ob der gesuchte Schlüssel gleich dem aktiven Element ist.
    • Wenn ja, Suche beendet.
    • Wenn nein, gehe zu 2.
  2. Vergleiche, ob der gesuchte Schlüssel kleiner ist als das aktive Element im aktiven Knoten.
    • Wenn ja, verzweige zum Kindknoten, der links vom gerade überprüften Element angehängt ist, setze dessen kleinstes Element als aktives Element und gehe zu 1. zurück.
    • Wenn nein, markiere das nächstgrößere Element im aktiven Knoten als aktives Element und gehe zu 1. zurück. Gibt es kein größeres Element mehr im aktiven Knoten, verzweige zum Kindknoten rechts des aktiven Element und setze dessen kleinstes Element als aktives Element und gehe zurück zu 1.

Einfügen

  • Ein Knoten wird mit Elementen aufgefüllt, bis er drei Elemente enthält (vgl. B im Beispiel).
  • Wenn ein viertes Element aufgenommen werden soll, wird der Knoten gespalten (engl. split) in einen Knoten mit zwei Elementen (J K im Beispiel), einen Knoten mit einem Element (M im Beispiel) und ein mittleres Element (L im Beispiel), das in den Elterknoten aufgenommen wird (vgl. Schritt 2 im Beispiel).
  • Ist der Elterknoten voll besetzt, wird das Element im Baum weiter nach oben gereicht. Erreicht das Element die Wurzel des Baumes und ist dieser schon mit drei Elementen besetzt, wird eine neue Wurzel nach gleicher Aufteilungsregel erzeugt (vgl. Schritt 4 des Beispiels).

Es gibt eine weitere Möglichkeit, neue Elemente einzufügen, die sich von obiger Methode darin unterscheidet, zu welchem Zeitpunkt ein 4-Knoten aufgespalten wird. Bei dieser Methode wird während des Traversierens des Baums jeder gefundene 4-Knoten aufgespalten, es wird also das mittlere Element nach oben gereicht. Die Split-Operation wird also im schlimmsten Fall gerade einmal durchgeführt, während die erstgenannte Methode im schlimmsten Fall log(n) Split-Operationen durchführen muss.

Löschen

Das Löschen eines beliebigen Elements kann immer auf das Löschen eines Elements in einem Blatt zurückgeführt werden. Dazu merkt man sich die Position des Elements innerhalb des Knotens. Ist die Position i, so wird im Unterbaum i des Knotens das Blatt gesucht, das sich am weitesten rechts befindet, dort vertauscht man das größte Element mit dem zu löschenden Element. Nun braucht nur noch das Element aus dem Blatt gelöscht zu werden, wobei drei Fälle unterschieden werden müssen:

  • Das Blatt besitzt mehr als ein Element. In diesem Fall kann das Element einfach entfernt werden.
  • Das Blatt enthält nur ein Element. In einem Geschwisterknoten (Knoten mit gleichem Elter) gibt es aber mindestens zwei Elemente. Es kann ein Element beim Geschwisterknoten ausgeliehen (gestohlen in Mehlhorn 1998) werden.
  • Das Blatt hat nur ein Element. Es sind wenigstens drei Geschwister beim gleichen Elter (zwei Elemente). Alle haben nur ein Element. Zwei Geschwister werden verschmolzen (engl. fuse).
  • Das Blatt hat nur ein Element. Es gibt nur einen Geschwisterknoten, der auch nur ein Element hat. Die Operation wird rekursiv auf höherer Ebene fortgesetzt.

Varianten

2-3-4-Bäume werden beispielsweise d​urch Rot-Schwarz-Bäume implementiert.

Literatur

  • D. Maier, S. C. Salveter: Hysterical B-trees. In: Information Processing Letters 12, 1981, S. 199–202
  • S. Huddleston, K. Mehlhorn: A New Data Structure for Representing Sorted Lists. In Acta Informatica 17, 1982, S. 157–184
  • Kurt Mehlhorn: Datenstrukturen und effiziente Algorithmen. Teubner Stuttgart 1988, ISBN 3-519-12255-3.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.