Topologische Sortierung

Topologische Sortierung bezeichnet in der Mathematik eine Reihenfolge von Dingen, bei der vorgegebene Abhängigkeiten erfüllt sind.

Anstehende Tätigkeiten einer Person etwa unterliegen einer Halbordnung: es existieren Bedingungen wie „Tätigkeit A muss vor Tätigkeit B erledigt werden“. Eine Reihenfolge, welche alle Bedingungen erfüllt, nennt man topologische Sortierung der Menge anstehender Tätigkeiten. Im Gegensatz zur Sortierung einer Totalordnung ist die Reihenfolge nicht eindeutig, sondern es kann mehrere Möglichkeiten geben. Wenn gegenseitige Abhängigkeiten bestehen, ist eine topologische Sortierung unmöglich.

Aus mengentheoretischer Sicht handelt es sich bei der topologischen Sortierung um eine lineare Erweiterung einer partiellen Ordnung. 1930 zeigte Edward Szpilrajn, dass aus dem Auswahlaxiom folgt, dass sich jede partielle Ordnung zu einer linearen Ordnung erweitern lässt.[1]

Die topologische Sortierung für endliche Mengen (hier wird das Auswahlaxiom nicht gebraucht) ist bei vielen Anwendungen der Informatik ein wichtiges Konzept. Bereits 1961 wurde von Daniel J. Lasser ein Algorithmus entwickelt, mit dem eine topologische Sortierung ganz allgemein erstellt werden kann. Zuvor waren allerdings schon Algorithmen für spezielle Anwendungen bekannt.

Des Weiteren spielt die topologische Sortierung in der Graphentheorie bei der Untersuchung von gerichteten Graphen auf Zyklenfreiheit eine große Rolle.

Das Problem

Verschiedene Objekte können nach messbaren Größen, zum Beispiel Städte nach Einwohnerzahlen, Schuhe nach Schuhgrößen, aber auch alphabetisch nach Namen eindeutig sortiert werden. Oft gelingt dies jedoch nicht mehr, wenn nur Beziehungen der Form Vorgänger/Nachfolger angegeben werden und solche Beziehungen nicht für jedes Paar von Objekten vorhanden sind. Gegenseitige Abhängigkeiten können darüber hinaus eine Sortierung unmöglich machen (etwa beim Schachspiel: Anton gewinnt gegen Bernd, Bernd gewinnt gegen Clemens und Clemens gewinnt gegen Anton). Gelingt es, die Objekte in eine Reihenfolge zu bringen, bei der Vorgänger stets vor Nachfolgern auftreten, so ist diese Reihenfolge eine topologische Sortierung der Objekte.

Je nach Art der Beziehungen kann es keine, nur eine oder mehrere verschiedene topologische Sortierungen geben. Wenn gegenseitige (zyklische) Abhängigkeiten bestehen, ist eine topologische Sortierung nicht möglich. In der Tat ist ein Anwendungsgebiet der topologischen Sortierung die Überprüfung, ob zyklische Abhängigkeiten bestehen.

Beispiel: Anziehreihenfolge von Kleidungsstücken

Beim Anziehen von Kleidungsstücken müssen manche Teile unbedingt vor anderen angezogen werden. So muss ein Pullover vor einem Mantel angezogen werden. Hat man zum Beispiel eine Hose, ein Unterhemd, Pullover, Mantel, Socken, eine Unterhose und ein Paar Schuhe, so kann man die folgenden Beziehungen für das Anziehen angeben.

Das Unterhemd vor dem Pullover
Die Unterhose vor der Hose
Den Pullover vor dem Mantel
Die Hose vor dem Mantel
Die Hose vor den Schuhen
Die Socken vor den Schuhen

Um eine sinnvolle Reihenfolge zu bestimmen, können die sieben Kleidungsstücke topologisch sortiert werden, also etwa

Erst die Unterhose, dann die Socken, Hose, Unterhemd, Pullover, Mantel, Schuhe.

Aber auch

Erst das Unterhemd, dann die Unterhose, dann Pullover, Socken, Hose, Schuhe, Mantel.

Jedoch nicht

Erst den Pullover,

da das Unterhemd vorher angezogen werden muss.

Die zu sortierende Menge

Die zu sortierenden Objekte müssen bezüglich der Beziehung teilweise angeordnet werden können, damit sie topologisch sortierbar sind. Mathematisch bilden die Objekte die Elemente einer Menge $M$ , die bezüglich einer Relation (Beziehung) $R$ die folgenden Eigenschaften hat:

Für jeweils beliebige Elemente $a,b,c$ der Menge $M$ und der Relation $R$ gilt:

Irreflexivität: $\neg (a\,R\,a)$ ( $a$ steht nicht mit $a$ in Relation)
Transitivität: Wenn $a\,R\,b$ und $b\,R\,c$ , dann gilt $a\,R\,c$ .

Übersetzt heißt dies:

Ich kann die Hose nicht vor der Hose anziehen.
Wenn ich das Unterhemd vor dem Pullover anziehen muss und den Pullover vor dem Mantel, so folgt daraus, dass ich das Unterhemd vor dem Mantel anziehen muss.

Die Menge $M$ bildet dann bezüglich der Relation $R$ eine strenge Halbordnung. Oft schreibt man statt $R$ auch einfach $<$ , weil die Relation ähnliche Eigenschaften hat wie die Kleiner-Relation für Zahlen. (Allerdings hat die Kleiner-Relation noch einige weitere Eigenschaften, die man hier nicht unbedingt hat. So kann man bei der Kleiner-Relation von zwei verschiedenen Zahlen immer entscheiden, welche der beiden kleiner ist. Hier ist dies nicht verlangt. Im Beispiel wäre dies der Vergleich von Socken und Unterhemd: Man kann nicht sagen, dass eines davon zuerst angezogen werden muss.)

Üblicherweise wird jedoch nicht die ganze Relation $R$ angegeben, sondern nur eine ausreichende Teilmenge von direkten Vorgänger-Nachfolger-Paaren. Die Relation $R$ ist dann über den transitiven Abschluss der durch die übergebenen Paare definierten Relation gegeben. Beispielsweise besagt die komplette Relation $R$ für das Beispielproblem auch, dass das Unterhemd vor dem Mantel angezogen werden muss (wegen „Unterhemd vor Pullover“ und „Pullover vor Mantel“ folgt aus der Transitivität auch „Unterhemd vor Mantel“). Der transitive Abschluss besteht nun darin, diese Paare der Relation $R$ hinzuzufügen. Bei der Implementierung eines entsprechenden Sortieralgorithmus wird allerdings die vollständige Relation nicht explizit generiert.

Die topologisch sortierte Menge

Eine bestimmte Reihenfolge hingegen wird mathematisch durch eine strenge Totalordnung definiert: Für je zwei verschiedene Elemente $a,b$ aus $M$ ist festgelegt, ob $a$ vor $b$ oder $b$ vor $a$ kommt (Es steht z. B. fest, ob ich heute Morgen zuerst die Unterhose oder zuerst das Unterhemd angezogen habe). Die strenge Totalordnung ist also mathematisch definiert durch das zusätzliche Axiom der

Trichotomie: Für beliebige Elemente $a,b$ aus $M$ gilt entweder $a\,R\,b$ oder $a=b$ oder $b\,R\,a$ .

Die Aufgabe des topologischen Sortierens ist nun, zu einer gegebenen strengen Halbordnung $R$ eine Totalordnung ${\tilde {R}}$ zu finden, so dass für alle $a,b$ mit $a\,R\,b$ auch gilt $a\,{\tilde {R}}\,b$ .

Definition der topologischen Sortierung

Motiviert durch die Untersuchungen der beiden vorhergehenden Abschnitte kann man nun den mathematischen Begriff einer topologischen Sortierung einführen:

Sei $M$ eine Menge und $R\subseteq M\times M$ . Eine Menge $T\subseteq M\times M$ heißt genau dann eine topologische Sortierung von $M$ für $R$ , wenn $T$ eine strenge Totalordnung auf $M$ ist und $R\subseteq T$ gilt.

Diese Definition beschränkt den Begriff einer topologischen Sortierung ausdrücklich nicht auf endliche Mengen, obwohl im Zusammenhang mit einer algorithmischen Untersuchung eine solche Beschränkung sinnvoll ist.

Azyklische Graphen und topologische Sortierungen

Den bereits erwähnten Zusammenhang von topologischen Sortierungen und azyklischen Graphen kann man in folgendem Satz zusammenfassen:

Sei $M$ eine Menge und $R\subseteq M\times M$ . Dann sind äquivalent:

Es gibt eine topologische Sortierung $T$ von $M$ für $R$
$(M,R)$ ist ein azyklischer Digraph

Darstellung als gerichteter Graph

Stellt man eine Beziehung als Pfeil zwischen zwei Elementen dar, entsteht ein gerichteter Graph. Ein solcher gerichteter Graph besitzt eine topologische Sortierung genau dann wenn er azyklisch ist, es also keine geschlossene Kantenrundreise gibt.

Die Kleidungsstücke kann man topologisch sortieren, indem man sie linear anordnet und darauf achtet, dass alle Pfeile nur von links nach rechts weisen:

So erhält man eine weitere Charakterisierung einer topologischen Sortierung, die auch als Definition verwendet werden kann. Zu einem gerichteten Graphen $G$ , mit Knoten- und Kantenmenge $V,A$ , ist demnach eine topologische Sortierung eine bijektive Abbildung, die $\Phi$ heiße, von den Knoten in eine Teilmenge der natürlichen Zahlen (mit anderen Worten eine Eins-zu-eins-Identifikation: Jeder Knoten bekommt genau eine Zahl). Dabei soll gelten, dass für jede Kante $a=(v,w)\in A\Rightarrow \Phi (v)<\Phi (w)$ erfüllt ist.

Im Beispiel hätte man die Abbildung

$\Phi \colon V\to \mathbb {N} .{\begin{cases}{\mbox{Unterhose}}&\mapsto 1\\{\mbox{Socke}}&\mapsto 2\\\dots \\{\mbox{Schuhe}}&\mapsto 7\end{cases}}$

Solche Abbildungen sind niemals eindeutig. Erhöht man den Bildwert knotenweise um eine beliebige Konstante, erhält man eine weitere Sortierung $\Phi '$ mit $\forall v\in V:\Phi '(v)=\Phi (v)+c,c\in \mathbb {N}$ . Beschränkt man sich auf Abbildungen in eine elementweise kleinste Teilmenge natürlicher Zahlen, hängt die Eindeutigkeit von der Graphenstruktur ab. Gerichtete Pfade sind dann eindeutig sortierbar, „echte“ gerichtete Bäume können mehrere Sortierungen haben.

Sortierbare Graphen

Graph 1

Graph 1 ist topologisch sortierbar. Es existieren mehrere Lösungen (zum Beispiel A B C G D E F). Dabei spielt es keine Rolle, dass mehrere Elemente ohne Vorgänger existieren (A und G), dass manche Elemente mehrere Nachfolger haben (B hat zum Beispiel drei Nachfolger) und manche mehrere Vorgänger (D und E).

Graph 2

Graph 2 ist ebenfalls topologisch sortierbar (zum Beispiel A C B D E), obwohl er nicht zusammenhängend ist.

Alle Graphen, die keine Zyklen enthalten (so genannte azyklische Graphen, siehe auch Baum), sind topologisch sortierbar.

Nicht sortierbare Graphen

Graph 3
Graph 4
Graph 5

Graph 3 ist nicht topologisch sortierbar, da er einen Zyklus, also eine gegenseitige Abhängigkeit enthält (Elemente B, C, E und D).

Auch wenn wie in Graph 4 nur zwei Elemente gegenseitig voneinander abhängen, ist eine topologische Sortierung unmöglich. Allgemein sind genau alle Graphen, die einen Kreis enthalten nicht topologisch sortierbar. Topologische Sortierbarkeit ist logisch gleichwertig zur Azyklizität.

Graph 5 hat auch keine topologische Sortierung, nicht aber weil er einen „Kreis“ enthält, sondern weil er gegen die geforderte Irreflexivität verstößt. Knoten A steht mit sich selbst in Relation. Graph 5 ist also ein minimaler nicht topologisch sortierbarer Graph.

Algorithmus

Entfernung von Elementen ohne Vorgänger

Der Algorithmus geht von einem gerichteten Graphen aus. Er entfernt solange Elemente ohne Vorgänger aus dem Graphen, bis keine Elemente mehr übrig sind.

Zunächst werden alle Elemente mit der Vorgängerzahl, also der Anzahl von Pfeilspitzen, die zum jeweiligen Element führen, versehen:

Elemente mit Vorgängerzahl 0 (blau markiert) haben keine anderen Vorgänger. Sie werden aus dem Graph entfernt. Hier können also die Socken, die Unterhose und das Unterhemd mit den zugehörigen Pfeilen entfernt werden. Dadurch ändern sich auch die Vorgängerzahlen von anderen Elementen:

Entfernte Elemente:

Socken Unterhose Unterhemd

Jetzt haben der Pullover und die Hose keine Vorgänger mehr, sie können also entfernt werden:

Entfernte Elemente:

Socken Unterhose Unterhemd Hose Pullover

Nun bleiben nur noch Mantel und Schuhe übrig, die ebenfalls entfernt werden. Die Topologische Sortierung ist fertig, wenn alle Elemente entfernt werden konnten:

Topologische Sortierung:

Socken Unterhose Unterhemd Hose Pullover Mantel Schuhe

Repräsentation im Rechner

Die Objekte (Elemente) selbst werden normalerweise in die

Datenstruktur einer Liste mit Objektattributen (Name, Index, …)

eingetragen. Um die Beziehungen darzustellen, genügt für jedes Element jeweils eine zusätzliche

Liste mit Verweisen (Referenzen oder Zeiger) auf die Nachfolger eines Objekts. Die Objekte enthalten einen Verweis auf ihre jeweilige Nachfolgerliste.

Für den Sortieralgorithmus wird Platz für weitere Daten benötigt, die vom Algorithmus beschrieben und verwendet werden:

Für jedes Objekt Platz für eine Zahl, die die Anzahl der Vorgänger aufnimmt.
Optional eine Hilfsliste, die Objekte ohne Vorgänger aufnimmt.

Beispiel:

Für das Ankleidebeispiel weiter oben sähe die Objektliste z. B. folgendermaßen aus:

Hose
Mantel
Pullover
Schuhe
Socken
Unterhemd
Unterhose

Die Nachfolgerlisten sähen dann folgendermaßen aus:

2, 4
(leere Liste)
2
(leere Liste)
4
3
1

Dabei besagt die erste Liste (für die Hose), dass Mantel (Objekt 2) und Schuhe (Objekt 4) erst nach der Hose angezogen werden können. Die zweite Liste (für den Mantel) besagt, dass es kein Kleidungsstück gibt, das erst nach dem Mantel angezogen werden kann.

Die Liste der Vorgängerzahlen hat 7 Elemente (eins pro Objekt), anfänglich sind alle Einträge 0.

Einfache Version mit Markierung von Elementen

Der Sortieralgorithmus benötigt die Information, wie viele Vorgänger ein Element enthält (Vorgängeranzahl). Bereits gefundene Elemente müssen aus der Liste entfernt oder markiert werden. Man kann Elemente dadurch markieren, indem man die Vorgängeranzahl auf −1 setzt.

1. Berechne die Vorgängeranzahl:

Setze die Vorgängeranzahl aller Elemente auf 0.
Für alle Elemente durchlaufe die Nachfolgerliste und erhöhe die Vorgängeranzahl jedes dieser Elemente um 1.
(Jetzt sind alle Vorgängerzahlen berechnet)

Im Beispiel hat z. B. die Hose (Element 1) nur einen Vorgänger (die Unterhose), daher taucht die 1 nur einmal in den Nachfolgerlisten auf. Der Mantel (Element 2) hat hingegen 2 Vorgänger (Pullover und Hose), weshalb die 2 zweimal in den Nachfolgerlisten auftaucht. Insgesamt ergibt sich also für die Vorgängerliste:

1
2
1
2
0
0
0

2. Solange (nicht markierte) Elemente in der Liste sind:

Suche ein Element mit Vorgängeranzahl 0.
Falls kein solches Element gefunden wird, ist eine topologische Sortierung nicht möglich, da gegenseitige Abhängigkeiten (Zyklen) bestehen. Der Algorithmus bricht mit einem Fehler ab.
Gib das gefundene Element aus und entferne es aus der Liste oder markiere es (Setze zum Beispiel die Vorgängeranzahl gleich –1 als Markierung)
Gehe die Liste der Nachfolger des gefundenen Elements durch und verringere die Vorgängeranzahl um 1. Das Element ist jetzt effektiv aus der Elementliste entfernt. Durch die Verringerung der Vorgängeranzahl können neue Elemente ohne Vorgänger entstehen.

Sind alle Elemente ausgegeben bzw. markiert, so war die topologische Sortierung erfolgreich.

Im Beispiel ist Element 5 (Socken) ein solches vorgängerloses Element. Daher wird dieses Element ausgegeben und mit –1 markiert (wir hätten aber genauso gut mit Element 6 oder 7 anfangen können). Einziges Nachfolgerobjekt der Socken sind die Schuhe (Element 4), daher wird die Vorgängeranzahl von Element 4 verringert. Nach diesem Schritt lautet die Vorgängeranzahlliste also

1
2
1
1
–1
0
0

und die bisherige Ausgabe lautet: Socken

Im nächsten Schritt stellen wir fest, dass auch Element 6 (Unterhemd) keine Vorgänger hat. Wiederum gibt es nur ein einziges Nachfolgerelement, den Pullover (Nummer 3). Somit lautet die Vorgängerzahlliste nach dem zweiten Schritt:

1
2
0
1
–1
–1
0

und die Ausgabe bis hierhin lautet: Socken, Unterhemd

Durch die Verringerung um 1 wurde die Vorgängerzahl des Pullovers (Element 3) zu 0. Nehmen wir also als Nächstes den Pullover, so finden wir in seiner Nachfolgerliste nur Element 2 (den Mantel), dessen Vorgängerzahl wir somit ebenfalls verringern müssen, so dass die Liste nun

1
1
–1
1
–1
–1
0

lautet, und die bisherige Ausgabe: Socken, Unterhemd, Pullover.

Jetzt haben wir zum ersten Mal keine Wahl mehr über das nächste Element: Nur die Unterhose hat jetzt die Vorgängerzahl 0. Deren Entfernung führt dann im nächsten Schritt zu einer 0 bei der Hose (Element 1), und deren Entfernung führt schließlich dazu, dass sowohl Element 2 (Mantel) als auch Element 4 (Schuhe) keine Vorgänger mehr haben. Wählen wir nun den Mantel vor den Schuhen, so ergibt sich insgesamt die Sortierung

Socken, Unterhemd, Pullover, Unterhose, Hose, Mantel, Schuhe,

die unschwer als korrekte topologische Sortierung dieser Elemente erkannt werden kann.

Erweiterte Version mit einer zusätzlichen Hilfsliste

Um Elemente ohne Vorgänger schnell zu finden, kann eine zusätzliche Hilfsliste erzeugt werden. Diese wird nach der Berechnung der Vorgängerzahlen mit allen anfangs vorgängerlosen Elementen, also mit Vorgängerzahl gleich Null, gefüllt. In Phase 2 wird anstatt der Suche eines Elements mit Vorgängeranzahl Null einfach eines aus der Hilfsliste entnommen. Wird die Vorgängerzahl eines Elements während der Phase 2 bei der Verringerung um 1 gleich Null, so wird es in die Hilfsliste eingefügt. Der Algorithmus endet, wenn keine Elemente mehr in der Hilfsliste sind. Auf die Markierung kann dann ebenfalls verzichtet werden.

Zeitverhalten (Komplexität)

Die Komplexität des Algorithmus beschreibt das zeitliche Verhalten bei großen Datenmengen, genauer das Verhältnis der Ausführungsdauern bei Vergrößerung der Eingabedaten. Braucht ein Algorithmus also z. B. für eine Menge $N$ mit Datensätze $\vert N\vert ^{2}+10000$ Schritte, so ist die Komplexität ${\mathcal {O}}(\vert N\vert ^{2})$ , da für hinreichend große Datenmengen die 10000 zusätzlichen Schritte nicht mehr ins Gewicht fallen, siehe Landau-Symbole.

Average und Worst Case

Beim topologischen Sortieren mit n Elementen und m Beziehungen zwischen diesen gilt für „normale“ (Average Case) Probleme ${\mathcal {O}}(m)={\mathcal {O}}(n)$ , da jedes Element im Schnitt nur eine konstante Zahl von Beziehungen hat. Im Extremfall (Worst Case) können in einem gerichteten azyklischen Graphen jedoch $m=\sum _{i=1}^{n}(i-1)={\frac {n\cdot (n+1)}{2}}-n={\frac {n^{2}-n}{2}}={\mathcal {O}}(n^{2})$ Beziehungen auftreten.

Erste Phase: Aufbau der Vorgängerzahlen

Die erste Phase setzt die Vorgängerzahlen auf 0 und benötigt n Schleifendurchläufe ( ${\mathcal {O}}(n)$ ). Für das Durchlaufen der m Nachfolger benötigt sie eine Zeit der Größenordnung ${\mathcal {O}}(n)$ (Average Case) oder ${\mathcal {O}}(n^{2})$ (Worst Case).

Hilfsliste für vorgängerlose Elemente

Vor der zweiten Phase wird eine Hilfsliste aufgebaut, die alle vorgängerlosen Elemente enthält ( ${\mathcal {O}}(n)$ ). Danach werden nur noch neue vorgängerlose in die Hilfsliste eingefügt ( ${\mathcal {O}}(1)$ ) und entnommen ( ${\mathcal {O}}(1)$ ). Die Suche nach vorgängerlosen Elementen beeinflusst das Zeitverhalten nicht. Gleiches kann man erreichen, indem man gefundene vorgängerlose Elemente „nach vorne“ verlagert (mit ${\mathcal {O}}(1)$ möglich).

Zweite Phase: Entnahme von vorgängerlosen Elementen

Die zweite Phase behandelt im Erfolgsfall alle n Elemente und verringert die Vorgängerzahl von im Schnitt ${\frac {m}{n}}$ Nachfolgern, das Zeitverhalten ist also ${\mathcal {O}}(n)\cdot {\mathcal {O}}\left({\frac {m}{n}}\right)$ .

Gesamtverhalten

	Beziehungen m und Objekte n	Zeitverhalten (mit Hilfsliste)
Average-Case	${\mathcal {O}}(m)={\mathcal {O}}(n)$	${\mathcal {O}}(n)$
Worst-Case	${\mathcal {O}}(m)={\mathcal {O}}(n^{2})$	${\mathcal {O}}(n^{2})$

Ungünstiger Aufbau der Listen

Der Algorithmus in Niklaus Wirths Buch (siehe Literatur) enthält eine Einlesephase, in der er die Beziehungspaare in eine Liste einfügt, die wiederum Listen für die Nachfolger enthalten. Die jeweilige Nachfolgerliste ermittelt er durch eine lineare Suche ( ${\mathcal {O}}(n)$ ), die für jedes eingelesene Paar ( ${\mathcal {O}}(m)$ ) durchgeführt wird, insgesamt also ${\mathcal {O}}(n)\cdot {\mathcal {O}}(m)$ (quadratisch). Dies verschlechtert das gesamte Zeitverhalten. Der Aufbau der Listen könnte zum Beispiel über einen Bucketsort-Algorithmus aber auch in linearer Zeit ${\mathcal {O}}(m)$ bewerkstelligt werden.

Programm in der Programmiersprache Perl

In der Programmiersprache Perl können Listen besonders einfach mit Hilfe von dynamisch wachsenden Feldern (zum Beispiel @Elemente) implementiert werden. Das angegebene Programm liest zunächst Beziehungspaare der Form Vorgänger Nachfolger, jeweils in einer Zeile und mit Leerzeichen getrennt, ein:

Katze Hund
Hahn Katze
Hund Esel

Als Ausgabe erhält man

Hahn
Katze
Hund
Esel

Beim Einlesen der Beziehungspaare dient ein Perl-Hash zum Auffinden des numerischen Indexes von bestehenden Elementen. Elemente ohne Index werden erzeugt. Dazu wird ein neuer Index vergeben, der Name gespeichert und eine leere Nachfolgerliste angelegt. Diese Liste nimmt dann die Indizes der Nachfolgerelemente für die jeweiligen Vorgänger auf.

Der Algorithmus verwendet nur noch Indizes und läuft wie oben beschrieben. Erst bei der Ausgabe wird der unter dem Index gespeicherte Name wieder verwendet.

Das Perlskript sieht folgendermaßen aus:

#!/usr/bin/perl
# Topologisches Sortierprogramm in Perl
# Lizenzstatus: GNU FDL, für Wikipedia
#
# =================================================================
# Unterprogramm zum Finden bzw. Neuanlegen eines Elements
# =================================================================
sub finde_oder_erzeuge_element
{       my ($str)=@_;
        my ($idx)=$hashindex{$str};
        if (!defined($idx)) { # Neues Element ...
                $idx=$objektzahl++;
                $hashindex{$str}=$idx;
                $name[$idx]=$str;
            @{$nachfolgerliste[$idx]}=();
        }
        return $idx;
}
# =================================================================
# Einlesen, Aufbau der Elementliste und der Nachfolgerlisten
# =================================================================
$objektzahl=0;
%hashindex=();
while (<>)
{       chomp;
        /^\s*(\S+)\s*(\S+)\s*$/ ||
          die "Bitte \"Vorgänger Nachfolger\" eingeben\n";
        ($vorgaenger,$nachfolger)=($1,$2);
        $v=finde_oder_erzeuge_element($vorgaenger);
        $n=finde_oder_erzeuge_element($nachfolger);
        push @{$nachfolgerliste[$v]},$n;
}
# =================================================================
# Topsort 1: Berechne Vorgängerzahlen
# =================================================================
for $n (0..$objektzahl-1) {
        $vorgaengerzahl[$n]=0;
}
for $v (0..$objektzahl-1) {
        for $n (@{$nachfolgerliste[$v]}) {
                ++$vorgaengerzahl[$n];
        }
}
# =================================================================
# Erzeuge die Hilfsliste für die Elemente mit Vorgängerzahl 0
# =================================================================
@hilfsliste=();
for $n (0..$objektzahl-1) {
        push(@hilfsliste,$n) if ($vorgaengerzahl[$n]==0)
}
# =================================================================
# Topsort 2: Gib solange möglich ein Element der Hilfsliste aus
#            Verringere Vorgängerzahl der Nachfolger des Elements
#            Neue Elemente mit Vorgängerzahl 0 in die Hilfsliste
# =================================================================
$ausgabe=0;
while (defined($v=pop(@hilfsliste))) {
        print "$name[$v]\n";
        ++$ausgabe;
        for $n (@{$nachfolgerliste[$v]}) {
                --$vorgaengerzahl[$n];
                push(@hilfsliste,$n) if ($vorgaengerzahl[$n]==0);
        }
}
die "Zyklen gefunden\n" if $ausgabe<$objektzahl;

Beispiele

Unterprogrammaufrufe und Rekursion

In Computerprogrammen können Unterprogramme weitere Unterprogramme aufrufen. Falls keine gegenseitigen Aufrufe oder Selbstaufrufe auftreten, kann eine total geordnete Reihenfolge mit Hilfe der topologischen Sortierung ermittelt werden. Andernfalls rufen sich Unterprogramme rekursiv auf.

Unterprogramme mit Rekursion

Unterprogramme ohne Rekursion

Prozedur a()
{ Aufruf von b()
  Aufruf von c()
}
Prozedur b()
{ Aufruf von c()
}
Prozedur c()
{ Aufruf von b()
  Aufruf von d()
}

Prozedur a()
{ Aufruf von b()
  Aufruf von c()
}
Prozedur b()
{ Aufruf von d()
}
Prozedur c()
{ Aufruf von b()
  Aufruf von d()
}

Topologisches Sortieren nicht möglich, da Prozedur b die Prozedur c aufruft und Prozedur c die Prozedur b (Zyklus).

Topologische Sortierung: a c b d

Hauptkategorien und Unterkategorien

Manche Kategoriensysteme sind hierarchisch angeordnet. Die oberste Ebene enthält die Hauptkategorien, die wiederum Unterkategorien enthalten. Unterkategorien können weitere Unterkategorien enthalten, bis zu einer beliebigen Tiefe. Normalerweise fügt man eine neue Kategorie in eine bestehende ein, wenn die Anzahl der Objekte in einer Kategorie eine bestimmte Grenze überschreitet. Andere, bereits bestehende Kategorien werden je nach Angemessenheit in die neue Kategorie verschoben. Dabei kann versehentlich eine übergeordnete Kategorie oder eine Kategorie aus einer anderen Hauptkategorie in die neue Kategorie eingeordnet werden, wodurch gegenseitige Abhängigkeiten entstehen und die Hierarchie des Systems zerstört wird. Ein Benutzer, der durch den (vermeintlichen) Kategoriebaum navigiert, kann sich unter Umständen ewig „im Kreis“ drehen, was durch die geforderte Hierarchie ja verhindert werden soll.

Durch topologisches Sortieren des Kategorienbaums kann man nachweisen, dass keine Zyklen vorhanden sind. Alle Hauptkategorien werden dazu zunächst in einen hypothetischen Wurzelbaum eingeordnet. Die Beziehung ist die Bedingung, dass eine Kategorie direkte Unterkategorie einer anderen Kategorie ist; diese Information ist ohnehin vorhanden. Schlägt der topologische Sortieralgorithmus fehl, sind zyklische Abhängigkeiten vorhanden, und das System ist nicht mehr hierarchisch.

tsort-Kommando unter Unix und Linux

Für Unix-ähnliche Betriebssysteme enthalten die GNU Core Utilities ein Programm namens tsort, das eine topologische Sortierung durchführt. Es war früher nötig, um übersetzte Objektdateien, die voneinander abhängen, in korrekter Reihenfolge in eine Programmbibliothek einzufügen, kann aber auch für andere Zwecke eingesetzt werden:

$ tsort <<Ende
> Unterhemd Pullover
> Unterhose Hose
> Pullover Mantel
> Hose Mantel
> Hose Schuhe
> Socken Schuhe
> Ende
Socken
Unterhemd
Unterhose
Pullover
Hose
Schuhe
Mantel

Eingabe sind die Abhängigkeiten in der Form vor nach. Ausgabe ist eine topologische Sortierung der Elemente.

Siehe auch

Schnittregel
Gentzenscher Hauptsatz
Plankalkül
Anwendungsbeispiel für topologische Sortierung: Einfüge-Reihenfolge bei Tabellen mit referentieller Integrität ermitteln

Literatur

Thomas Ottmann, Peter Widmayer: Algorithmen und Datenstrukturen. 4. Auflage. Spektrum Verlag, Heidelberg 2002, ISBN 3-8274-1029-0.
Niklaus Wirth: Algorithmen und Datenstrukturen, Pascal Version. 4. Auflage. Teubner Verlag, Stuttgart 1995, ISBN 3-519-12250-2.
Donald E. Knuth: The Art of Computer Programming. 3. Auflage. Band 1: Fundamental Algorithms. Addison-Wesley, 1997, ISBN 0-201-89683-4.
Edward Szpilrajn: Sur l’extension de l’ordre partiel. In: Fundamenta Mathematicae. Band 16, 1930, ISSN 0016-2736, S. 386–389.
Daniel J. Lasser: Topological Ordering of a List of Randomly-Numbered Elements of a Network. In: Communications of the ACM. Band 4, 1961, ISSN 0001-0782, S. 167–168.
A. B. Kahn: Topological Sorting of Large Networks. In: Communications of the ACM. 1962, ISSN 0001-0782, S. 558–562.

Weblinks

Niklaus Wirths Implementierung in Pascal

Einzelnachweise

Edward Szpilrajn: Sur l’extension de l’ordre partiel. In: Fundamenta Mathematicae. 16, 1930, S. 386–389.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.

[1] Edward Szpilrajn: Sur l’extension de l’ordre partiel. In: Fundamenta Mathematicae. 16, 1930, S. 386–389.