Algorithmus von Prim

Der Algorithmus von Prim dient der Berechnung eines minimalen Spannbaumes in einem zusammenhängenden, ungerichteten, kantengewichteten Graphen.

Der Algorithmus wurde 1930 vom tschechischen Mathematiker Vojtěch Jarník entwickelt. 1957 wurde er zunächst von Robert C. Prim und dann 1959 von Edsger W. Dijkstra wiederentdeckt. Daher wird der Algorithmus in der Literatur auch gelegentlich unter anderen Namen geführt, so etwa Prim-Dijkstra-Algorithmus oder Algorithmus von Jarnik, Prim und Dijkstra, im englischen Sprachraum auch Jarnik’s algorithm oder DJP algorithm.

Beschreibung

Der Algorithmus beginnt mit einem trivialen Graphen $T$ , der aus einem beliebigen Knoten des gegebenen Graphen besteht. In jedem Schritt wird nun eine Kante mit minimalem Gewicht gesucht, die einen weiteren Knoten mit $T$ verbindet. Diese und der entsprechende Knoten werden zu $T$ hinzugefügt. Das Ganze wird solange wiederholt, bis alle Knoten in $T$ vorhanden sind; dann ist $T$ ein minimaler Spannbaum:

Wähle einen beliebigen Knoten als Startgraph $T$ .
Solange $T$ $\text{[math]}$ noch nicht alle Knoten enthält:
- Wähle eine Kante $e$ mit minimalem Gewicht aus, die einen noch nicht in $T$ enthaltenen Knoten $v$ mit $T$ verbindet.
- Füge $e$ und $v$ dem Graphen $T$ hinzu.

Der skizzierte Algorithmus wird durch folgenden Pseudocode beschrieben:

G: Graph
V_G: Knotenmenge von G
w: Gewichtsfunktion für Kantenlänge
r: Startknoten (r ∈ V_G)
Q: Prioritätswarteschlange
π[u]: Elternknoten von Knoten u im Spannbaum
Adj[u]: Adjazenzliste von u (alle Nachbarknoten)
wert[u]: Abstand von u zum entstehenden Spannbaum

algorithmus_von_prim(G,w,r)
01  Q  $\leftarrow$  V_G   //Initialisierung
02  für alle u ∈ Q
03      wert[u]  $\leftarrow$  ∞
04      π[u]  $\leftarrow$  0
05  wert[r]  $\leftarrow$  0
06  solange Q ≠  $\varnothing$ 
07      u  $\leftarrow$  extract_min(Q)
08      für alle v ∈ Adj[u]
09          wenn v ∈ Q und w(u,v) < wert[v]
10              dann π[v]  $\leftarrow$  u
11                  wert[v]  $\leftarrow$  w(u,v)

Nachdem der Algorithmus endet, ergibt sich der minimale Spannbaum wie folgt:

T=\left(V_{G},\lbrace \left(u,\pi [u]\right)|u\in V_{G}\backslash \lbrace r\rbrace \rbrace \right)

Zum Finden der leichtesten Schnittkante kann eine Prioritätswarteschlange verwendet werden. Dabei werden vom Algorithmus insgesamt $|V|$ extractMin-Operationen und $|E|$ decreaseKey-Operationen ausgeführt. Mit einem Fibonacci-Heap (extractMin in amortisiert $O(log|V|)$ und decreaseKey in amortisiert $O(1)$ ) als Datenstruktur ergibt sich eine Gesamtlaufzeit von $O(|E|+|V|\cdot \log |V|)$ .

Die Schleife ist inhärent sequentiell, da sich die leichteste Kante im Schnitt von $S$ und $V\setminus S$ mit dem Hinzufügen eines neuen Knotens zu $S$ ändern kann. Es ist jedoch für die Korrektheit wichtig, dass immer die aktuell leichteste Kante ausgewählt wird.

Auf einer Parallel Random Access Machine mit insgesamt $O(|V|)$ Prozessoren lässt sich der Zugriff auf die Prioritätswarteschlange zu konstanter Zeit beschleunigen[1], sodass sich eine Gesamtlaufzeit in $O(|E|+|V|)$ ergibt. Insgesamt bieten der Algorithmus von Kruskal und der Algorithmus von Borůvka bessere Parallelisierungsansätze.

Beispiel

In diesem Beispiel wird der Ablauf des Algorithmus von Prim an einem einfachen Graphen gezeigt. Der aktuelle Baum $T$ ist jeweils grün hervorgehoben. Alle Knoten, die im jeweiligen Schritt über eine einzelne Kante mit dem Graphen verbunden werden können, sind zusammen mit der jeweiligen Kante geringsten Gewichts blau hervorgehoben. Der Knoten und die Kante, die hinzugefügt werden, sind hellblau markiert.

	Dies ist der Graph, zu dem der Algorithmus von Prim einen minimalen Spannbaum berechnet. Die Zahlen bei den einzelnen Kanten geben das jeweilige Kantengewicht an.
	Als Startknoten für den Graphen $T$ wird der Knoten $D$ gewählt. (Es könnte auch jeder andere Knoten ausgewählt werden.) Mit dem Startknoten können die Knoten $A$ , $B$ , $E$ und $F$ jeweils unmittelbar durch die Kanten $DA$ , $DB$ , $DE$ und $DF$ verbunden werden. Unter diesen Kanten ist $DA$ diejenige mit dem geringsten Gewicht und wird deshalb zusammen mit dem Knoten $A$ zum Graphen $T$ hinzugefügt.
	Mit dem bestehenden Graphen $T$ kann der Knoten $B$ durch die Kanten $AB$ oder $DB$ , der Knoten $E$ durch die Kante $DE$ und der Knoten $F$ durch die Kante $DF$ verbunden werden. Unter diesen vier Kanten ist $DF$ diejenige mit dem geringsten Gewicht und wird deshalb zusammen mit dem Knoten $F$ zum Graphen $T$ hinzugefügt.
	Mit dem bestehenden Graphen $T$ kann der Knoten $B$ durch die Kanten $AB$ oder $DB$ , der Knoten $E$ durch die Kanten $DE$ oder $FE$ und der Knoten $G$ durch die Kante $FG$ verbunden werden. Unter diesen Kanten ist $AB$ diejenige mit dem geringsten Gewicht und wird deshalb zusammen mit dem Knoten $B$ zum Graphen $T$ hinzugefügt.
	Mit dem bestehenden Graphen $T$ kann der Knoten $C$ durch die Kante $BC$ , der Knoten $E$ durch die Kanten $BE$ , $DE$ oder $FE$ und der Knoten $G$ durch die Kante $FG$ verbunden werden. Unter diesen Kanten ist $BE$ diejenige mit dem geringsten Gewicht und wird deshalb zusammen mit dem Knoten $E$ zum Graphen $T$ hinzugefügt.
	Mit dem bestehenden Graphen $T$ kann der Knoten $C$ durch die Kanten $BC$ oder $EC$ und der Knoten $G$ durch die Kanten $EG$ oder $FG$ verbunden werden. Unter diesen Kanten ist $EC$ diejenige mit dem geringsten Gewicht und wird deshalb zusammen mit dem Knoten $C$ zum Graphen $T$ hinzugefügt.
	Der verbliebene Knoten $G$ kann durch die Kanten $EG$ oder $FG$ mit dem Graphen $T$ verbunden werden. Da $EG$ unter diesen beiden das geringere Gewicht hat, wird sie zusammen mit dem Knoten $G$ zum Graphen $T$ hinzugefügt.
	Der Graph $T$ enthält jetzt alle Knoten des Ausgangsgraphen und ist ein minimaler Spannbaum dieses Ausgangsgraphen.

Effizienz und Laufzeit

Für eine effiziente Implementierung des Algorithmus von Prim muss man möglichst einfach eine Kante finden, die man dem entstehenden Baum $T$ hinzufügen kann. Man benötigt also eine Prioritätswarteschlange, in der alle Knoten gespeichert sind, die noch nicht zu $T$ gehören. Alle Knoten haben einen Wert, der dem der leichtesten Kante entspricht, durch die der Knoten mit $T$ verbunden werden kann. Existiert keine solche Kante, wird dem Knoten der Wert $\infty$ zugewiesen. Die Warteschlange liefert nun immer einen Knoten mit dem kleinsten Wert zurück.

Die Effizienz des Algorithmus hängt infolgedessen von der Implementierung der Warteschlange ab. Bei Verwendung eines Fibonacci-Heaps ergibt sich eine optimale Laufzeit von ${\mathcal {O}}(|E|+|V|\log |V|)$ .

Korrektheitsbeweis

Sei $G$ ein zusammenhängender, kantengewichteter Graph. Bei jeder Iteration des Algorithmus muss eine Kante gefunden werden, die einen Knoten in einem Teilgraphen mit einem Knoten außerhalb des Teilgraphen verbindet. Weil $G$ zusammenhängend ist, gibt es immer einen Pfad zu jedem Knoten. Der resultierende Graph $T$ des Algorithmus ist ein Baum, da die dem Baum hinzugefügte Kante und der Knoten verbunden sind.

Sei $T_{1}$ ein minimaler Spannbaum des Graphen $G$ . Wenn $T_{1}$ gleich $T$ ist, dann ist $T$ ein minimaler Spannbaum.

Andernfalls sei $e$ die erste Kante, die während der Konstruktion des Baums $T$ hinzugefügt wird, die sich nicht im Baum $T_{1}$ befindet, und $V$ sei die Menge der Knoten, die durch die vor der Kante $e$ hinzugefügten Kanten verbunden waren. Dann befindet sich ein Knoten der Kante $e$ in der Menge $V$ der schon verbundenen Knoten und der andere nicht. Weil der Baum $T_{1}$ ein Spannbaum des Graphen $G$ ist, gibt es im Baum $T_{1}$ einen Pfad, der die beiden Endknoten verbindet. Wenn man den Pfad entlang fährt, muss man auf eine Kante $f$ stoßen, die einen Knoten der Menge $V$ mit einem Knoten verbindet, der nicht in der Menge $V$ liegt. Bei der Iteration, in der die Kante $e$ zu Baum $T$ hinzugefügt wurde, könnte nun auch die Kante $f$ hinzugefügt worden sein und sie würde anstelle der Kante $e$ hinzugefügt, wenn ihr Gewicht kleiner als das Gewicht von $e$ wäre, und weil die Kante $f$ nicht hinzugefügt wurde, schließen wir daraus, dass ihr Gewicht mindestens so groß ist wie das Gewicht von $e$ .

Der Baum $T_{2}$ sei der Graph, der aus $T_{1}$ durch Entfernen der Kante $f$ und Hinzufügen der Kante $e$ entsteht. Es ist einfach zu zeigen, dass der Baum $T_{2}$ zusammenhängend ist, die gleiche Anzahl von Kanten wie der Baum $T_{1}$ hat und das Gesamtgewicht seiner Kanten nicht größer als das von Baum $T_{1}$ ist, daher ist $T_{2}$ auch ein minimaler Spannbaum des Graphen $G$ und er enthält die Kante $e$ und alle Kanten, die während der Konstruktion der Menge $V$ hinzugefügt wurden. Wiederholt man die bisherigen Schritte, dann erhält man schließlich einen minimalen Spannbaum des Graphen $G$ , der mit dem Baum $T$ identisch ist. Dies zeigt, dass $T$ ein minimaler Spannbaum ist.

Vergleich mit dem Algorithmus von Kruskal

Wie auch der Algorithmus von Kruskal, der ebenfalls einen minimal spannenden Baum konstruiert, ist Prims Algorithmus ein Greedy-Algorithmus. Beide Algorithmen beginnen mit einem Graphen ohne Kanten und fügen in jedem Schritt eine Kante mit minimalem Gewicht hinzu. Sie unterscheiden sich vor allem darin, wie die Bildung eines Kreises vermieden wird.

Während der Algorithmus von Kruskal global nach möglichen Kanten mit dem kleinsten Gewicht sucht und bei der Aufnahme dieser Kanten in den Lösungsgraph die Kreisbildung aktiv vermeidet, betrachtet der Algorithmus von Prim nur Kanten, die von den Knoten der bisher konstruierten Teilknotenmenge zu Knoten der Komplementärmenge verlaufen. Da aus dieser Kantenmenge eine Kante ausgewählt wird, vermeidet der Algorithmus per Konstruktion das Auftreten von Kreisen.

Ein Vergleich der Laufzeit der beiden Algorithmen ist schwierig, da im Algorithmus von Prim die Knoten die zentrale Komplexitätsschranke bestimmen, während der Algorithmus von Kruskal auf Basis einer sortierten Kantenliste arbeitet und daher dessen Laufzeit von der Anzahl der Kanten dominiert wird.[2]

Parallele Implementierung

Grafische Darstellung der Aufteilung einer Adjazenzmatrix für die Parallelisierung von Prims Algorithmus. In jeder Iteration des Algorithmus wird von jedem Prozessor sein Teil des Kostenvektors

C

aktualisiert. Hierfür wird die Reihe des neu gewählten Knotens in den zugehörigen Spalten des Prozessors betrachtet und anschließend der lokal optimale Knoten bestimmt. Die Ergebnisse aller Prozessoren werden anschließend gesammelt um den nächsten Knoten des Spannbaums zu bestimmen

Der Algorithmus von Prim ist grundlegend sequentieller Natur, da sich die äußere Schleife aufgrund von Datenabhängigkeiten zwischen den Iterationen nicht parallelisieren lässt. Es ist allerdings möglich, die extract_min Operation zu parallelisieren. Hierfür kann zum Beispiel eine parallele Implementierung einer Prioritätswarteschlange verwendet werden. Auf einer Parallel Random Access Machine mit insgesamt $O(|V|)$ Prozessoren lässt sich der Zugriff auf die Prioritätswarteschlange zu konstanter Zeit beschleunigen[3], sodass sich eine Gesamtlaufzeit in $O(|E|+|V|)$ ergibt. Alternativ können die Knoten zwischen mehreren Prozessoren aufgeteilt werden, sodass jeder Prozessor die eingehenden Kanten zu seinem Teil der Knoten verwaltet.[4] Dies wird in folgendem Pseudocode dargestellt.

Weise jedem Prozessor $P_{i}$ einen Teil $V_{i}$ der Knoten, sowie die dazugehörigen (eingehenden) Kanten zu. Bei Verwendung einer Adjazenzmatrix entspricht dies gerade einem Teil der Spalten.
Erstelle auf jedem Prozessor einen Vektor $C$ , welcher die aktuellen Kosten für jeden Knoten in $V_{i}$ enthält. Initialisiere diesen Vektor mit $\infty$
Wiederhole folgende Schritte solange nicht alle Knoten im Spannbaum enthalten sind:
1. Auf jedem Prozessor: bestimme den Knoten $v_{i}$ und dazugehörige Kante $e_{i}$ welcher den minimalen Wert in $C$ besitzt (lokale Lösung).
2. Bestimme aus den lokalen Lösungen den Knoten dessen Verbindung zum aktuellen Spannbaum die geringsten Kosten hat. Dies ist mithilfe einer Minimum-Reduktion über alle Prozessoren möglich.
3. Teile jedem Prozessor den gewählten Knoten mithilfe eines Broadcast mit.
4. Füge den neuen Knoten sowie die dazugehörige Kante (es sei denn es handelt sich um den ersten Knoten) dem Spannbaum hinzu
5. Auf jedem Prozessor: aktualisiere $C$ indem die Kanten des neu eingefügten Knotens zu dem eigenen Knotenset betrachtet werden.

Diese Variation von Prims Algorithmus lässt sich sowohl auf Verteilten Systemen,[4] auf Shared Memory Systemen[5], sowie auf Grafikprozessoren[6] implementieren. Die Laufzeit beträgt dabei $O({\tfrac {|V|^{2}}{|P|}})+O(|V|\log |P|)$ , da in jeder der $|V|$ Iterationen des Algorithmus jeweils ${\tfrac {|V|}{|P|}}$ Einträge betrachtet werden müssen. Zusätzlich wird angenommen, dass sowohl die Minimum-Reduktion als auch der Broadcast in $O(\log |P|)$ Zeit durchgeführt werden können.[4]

Als weitere Alternative für eine parallele Umsetzung von Prims Algorithmus wurde eine Variante präsentiert, in welcher der sequentielle Algorithmus parallel von verschiedenen Startknoten aus ausgeführt wird.[7] Im Allgemeinen eignen sich andere MST Algorithmen, wie beispielsweise der Algorithmus von Borůvka, jedoch besser für eine Parallelisierung.

Programmierung

Das folgende Beispiel in der Programmiersprache C# zeigt die Implementierung des Algorithmus von Prim. Bei der Ausführung des Programms wird die Methode Main verwendet, die die Kanten und die Abstände auf der Konsole ausgibt. Die Matrix für die Abstände wird in einem zweidimensionalen Array vom Datentyp Integer gespeichert.[8]

using System;

class Program
{
	// Diese Methode gibt den Index des Knotens mit dem minimalen Abstand zum Teilgraphen zurück
	static int GetMinimumIndex(int[] distances, bool[] includedNodes)
	{
		int minimumDistance = int.MaxValue;
		int minimumIndex = -1;
		for (int i = 0; i < distances.Length; i++)
		{
			if (!includedNodes[i] && distances[i] < minimumDistance)
			{
				minimumDistance = distances[i];
				minimumIndex = i;
			}
		}
		return minimumIndex;
	}
	
	// Diese Methode verwendet den Algorithmus von Prim und gibt den minimalen Spannbaum zurück
	static void Prim(int[,] distanceMatrix, int numberOfNodes, out int[] parent, out int[] distances)
	{
		parent = new int[numberOfNodes];
		distances = new int[numberOfNodes];
		bool[] includedNodes = new bool[numberOfNodes];
		for (int i = 0; i < numberOfNodes; i++)
		{
			distances[i] = int.MaxValue;
			includedNodes[i] = false;
		}
		distances[0] = 0;
		parent[0] = -1;
		for (int i = 0; i < numberOfNodes - 1; i++)
		{
			int minimumIndex = GetMinimumIndex(distances, includedNodes);
			includedNodes[minimumIndex] = true;
			for (int j = 0; j < numberOfNodes; j++)
			{
				if (distanceMatrix[minimumIndex, j] != 0 && !includedNodes[j] && distanceMatrix[minimumIndex, j] < distances[j])
				{
					parent[j] = minimumIndex;
					distances[j] = distanceMatrix[minimumIndex, j];
				}
			}
		}
	}
	
	// Hauptmethode, die das Programm ausführt
	public static void Main()
	{
		int[, ] distanceMatrix = new int[,] { {0, 2, 0, 6, 0},
			{2, 0, 3, 8, 5},
			{0, 3, 0, 0, 7},
			{6, 8, 0, 0, 9},
			{0, 5, 7, 9, 0} }; // Deklariert und initialisiert die Matrix mit den Abständen zwischen allen Punkten als zweidimensionales Array vom Typ int
		int[] parent;
		int[] distances;
		int numberOfNodes = 5;
		Prim(distanceMatrix, numberOfNodes, out parent, out distances);
		Console.WriteLine("Kante\tAbstand"); // Ausgabe auf der Konsole
		for (int i = 1; i < numberOfNodes; i++)
		{
			Console.WriteLine(parent[i] + " - " + i + "\t" + distanceMatrix[i, parent[i]]); // Ausgabe auf der Konsole
		}
		
		Console.ReadLine();
	}
}

Literatur

Robert C. Prim: Shortest connection networks and some generalisations. In: Bell System Technical Journal, 36, 1957, S. 1389–1401
David Cheriton, Robert Tarjan: Finding minimum spanning trees. In: SIAM Journal on Computing, 5, Dezember 1976, S. 724–741
Ellis Horowitz, Sartaj Sahni: Fundamentals of Computer Algorithms. In: Computer Science Press, 1978, S. 174–183

Weblinks

Commons: Algorithmus von Prim – Sammlung von Bildern, Videos und Audiodateien

Wikibooks: Algorithmus von Prim – Implementierungen in der Algorithmensammlung

Einzelnachweise

Brodal, Jesper Larsson Träff, Christos D. Zaroliagis: A Parallel Priority Queue with Constant Time Operations. In: Journal of Parallel and Distributed Computing. 49, Nr. 1, 1998, S. 4–21.
vgl. dazu etwa Ellis Horowitz, Sartaj Sahni: Fundamentals of Computer Algorithms. (s. Literatur)
Brodal, Jesper Larsson Träff, Christos D. Zaroliagis: A Parallel Priority Queue with Constant Time Operations. In: Journal of Parallel and Distributed Computing. 49, Nr. 1, 1998, S. 4–21.
Ananth Grama, Anshul Gupta, George Karypis, Vipin Kumar: Introduction to Parallel Computing 2003, ISBN 978-0-201-64865-2, S. 444–446.
Michael J. Quinn, Narsingh Deo: Parallel graph algorithms. In: ACM Computing Surveys (CSUR) 16.3. 1984, S. 319–348.
Wei Wang, Yongzhong Huang, Shaozhong Guo: Design and Implementation of GPU-Based Prim’s Algorithm. In: International Journal of Modern Education and Computer Science 3.4. 2011.
Rohit Setia: A new parallel algorithm for minimum spanning tree problem. In: Proc. International Conference on High Performance Computing (HiPC). 2009.
GeeksforGeeks: Prim’s Minimum Spanning Tree (MST)

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.

[1] Brodal, Jesper Larsson Träff, Christos D. Zaroliagis: A Parallel Priority Queue with Constant Time Operations. In: Journal of Parallel and Distributed Computing. 49, Nr. 1, 1998, S. 4–21.

[2] vgl. dazu etwa Ellis Horowitz, Sartaj Sahni: Fundamentals of Computer Algorithms. (s. Literatur)

[3] Brodal, Jesper Larsson Träff, Christos D. Zaroliagis: A Parallel Priority Queue with Constant Time Operations. In: Journal of Parallel and Distributed Computing. 49, Nr. 1, 1998, S. 4–21.

[grama2003-4] Ananth Grama, Anshul Gupta, George Karypis, Vipin Kumar: Introduction to Parallel Computing 2003, ISBN 978-0-201-64865-2, S. 444–446.

[5] Michael J. Quinn, Narsingh Deo: Parallel graph algorithms. In: ACM Computing Surveys (CSUR) 16.3. 1984, S. 319–348.

[6] Wei Wang, Yongzhong Huang, Shaozhong Guo: Design and Implementation of GPU-Based Prim’s Algorithm. In: International Journal of Modern Education and Computer Science 3.4. 2011.

[7] Rohit Setia: A new parallel algorithm for minimum spanning tree problem. In: Proc. International Conference on High Performance Computing (HiPC). 2009.

[8] GeeksforGeeks: Prim’s Minimum Spanning Tree (MST)