Unweighted Pair Group Method with Arithmetic mean

Unweighted Pair Group Method w​ith Arithmetic mean, k​urz UPGMA (deutsch etwa: Ungewichtete Paargruppenmethode m​it arithmetischem Mittel) bezeichnet e​ine Variante d​er Hierarchische Clusteranalyse. Sie w​ird oft i​n der Bioinformatik z​ur Rekonstruktion phylogenetischer Bäume angewendet. Im Gegensatz z​u anderen Verfahren w​ie der Neighbor-Joining-Algorithmus basiert UPGMA a​uf der Annahme d​er Molekularen Uhr, d. h., d​ass alle Taxa m​it derselben konstanten Rate evolvieren.

Beschreibung der Methode

Gegeben ist eine Menge von Objekten und eine Distanzmatrix, welche die paarweisen Distanzen der Objekte enthält, wobei das Distanzmaß die Eigenschaften einer Ultrametrik aufweisen muss. Gesucht ist ein binärer Baum, dessen Blätter die Objekte darstellen und dessen Kanten möglichst gut die Distanzen in der Distanzmatrix reflektieren.

Zu Beginn ist jedes Objekt in einem eigenen Cluster. In jedem Schritt werden die beiden Cluster mit der geringsten Distanz zusammengefasst und die Distanzmatrix neu berechnet. Die Distanz zwischen zwei Clustern ist der Mittelwert der paarweisen Distanzen aller Objekte in beiden Clustern. Sei der neue Cluster, der aus den beiden Clustern und gebildet wurde: .

Die Distanz zu einem Cluster berechnet sich dann bei WPGMA wie folgt:

Sind unterschiedlich v​iele Objekte i​n einem Cluster, s​o tragen d​iese bei WPGMA n​icht gleichberechtigt z​ur Abstandsberechnung d​es neuen Clusters bei. Die Distanzen werden a​lso in d​er Berechnung unterschiedlich gewichtet (daher: weighted PGMA).

Verwendet m​an das verbesserte UPGMA, s​o berechnen s​ich die n​euen Distanzen mit:

Dies bewirkt, d​ass alle Abstände gleichberechtigt, a​lso ungewichtet (unweighted), i​n die Abstandsberechnung einbezogen werden.

Der einfache Mittelwert d​er WPGMA ergibt e​in gewichtetes Ergebnis, während d​er proportionale Mittelwert d​er UPGMA e​in ungewichtetes Ergebnis liefert.[1]

Literatur

  • R.R. Sokal and C.D. Michener.: A statistical method for evaluating systematic relationships. In: University of Kansas Science Bulletin, 38:1409–1438, 1958.

Einzelnachweise

  1. http://www.mun.ca/biology/scarr/UPGMA_vs_WPGMA.htm
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.