Lowest Common Ancestor
Als Lowest Common Ancestor (LCA) oder „letzter gemeinsamer Vorfahre“ wird in der Informatik und Graphentheorie ein Ermittlungskonzept bezeichnet, das einen gegebenen gewurzelten Baum von Datenstrukturen effizient vorverarbeitet, sodass anschließend Anfragen nach dem letzten gemeinsamen Vorfahren für beliebige Knotenpaare in konstanter Zeit beantwortet werden können.
Bäume gehören zu den fundamentalen Datenstrukturen der Informatik. Sie werden häufig verwendet, um Daten in einer hierarchischen oder geschachtelten Struktur darzustellen. Zwei klassische Beispiele sind Such- und Entscheidungsbäume. Algorithmische Standardfragen für Bäume sind zum Beispiel die Pre-, Post- und Inordertraversierung. Ein in diesem Kontext weniger bekanntes algorithmisches Problem ist die Suche nach dem letzten gemeinsamen Vorfahren (LCA).[1]
Definition des LCA
Gegeben sei ein Baum mit einem Wurzelknoten , insgesamt Knoten und einer Höhe . Der Lowest Common Ancestor (LCA) zweier Knoten und ist derjenige Knoten, der ein Elternknoten von sowohl als auch ist und am weitesten von der Wurzel entfernt liegt, also die größtmögliche Tiefe besitzt.
Ziel ist es, einen gegebenen Baum effizient so vorzuverarbeiten, dass LCA Anfragen möglichst schnell beantwortet werden können.
Anwendungsgebiete
Die LCA-Ermittlung kann angewendet werden, um den LCA von Gen-Bäumen (Bioinformatik) zu ermitteln.[2]
Entwicklung (Geschichte)
Das LCA-Problem wurde 1973 erstmals von Alfred Aho, John Hopcroft und Jeffrey Ullman definiert.
Im Jahre 1984 entwickelten Dov Harel und Robert Tarjan die erste effiziente Datenstruktur zur Lösung des LCA-Problems. Dabei wird der Eingabebaum in (siehe Landau-Symbole) vorverarbeitet, so dass die Abfragen in konstanter Zeit, beantwortet werden können. Allerdings gilt die Datenstruktur als sehr komplex und schwierig zu implementieren. Tarjan fand später einen einfacheren, wenn auch weniger effizienten Algorithmus, der auf der Union-Find-Struktur basiert und den LCA aus einer vorher berechneten Menge von Knotenpaaren ermittelt (Tarjan’s Offline Least Common Ancestor Algorithm (TOLCA)). Im Jahre 1988 vereinfachten Baruch Schieber und Uzi Vishkin diese Datenstruktur, so dass diese implementierbar wurde und dennoch einen Vorverarbeitungsaufwand von Zeit und einen Abfrageaufwand von aufweist.
1993 entdeckten Omer Berkman und Uzi Vishkin einen neuen Weg, das LCA-Problem mit Hilfe von Reduktion und Range Minimum Query (RMQ) zu lösen. Der Zeitaufwand hat auch hier lineare Vorverarbeitungszeit und konstante Abfragezeit . Dieser Lösungsansatz wurde 2000 von Michael Bender und Martin Farach-Colton vereinfacht.[3]
Einzelnachweise
- Effiziente Berechnung vom letzten gemeinsamen Vorfahren und Anwendungen – FU Berlin umingo.de – abgerufen am 10. März 2013
- lowest common ancestor retrieval und weitere Anwendungen – Universität Münster (PDF, 221 kB) uni-muenster.de – abgerufen am 10. März 2013
- Algorithmen zum Ermitteln des Lowest Common Ancestor (LCA) – FU Berlin (PDF, 638 kB) fu-berlin.de – abgerufen am 10. März 2013