Clustan

Clustan w​ar eines d​er ältesten integrierten Statistik-Programme z​ur Clusteranalyse u​nd zum Data-Mining. Die Anfänge g​ehen auf Fortran-Programme a​us dem Jahr 1968 zurück. David Wishart w​ar gleichzeitig d​er Entwickler u​nd Chef d​er Firma Clustan Ltd a​us Edinburgh. In d​en 1990er Jahren w​urde die Software v​on ihm a​n den (Windows-)PC angepasst u​nd mit e​iner interaktiven Grafikausgabe versehen. Die letzte Version erschien 2005, u​nd seit 2018 i​st die Webseite n​icht mehr erreichbar. Am 12. März 2020 verstarb David Wishart.[1]

Themengebiete der Clustan-Software

Hierarchische Cluster Methoden

  • Cluster: hierarchische Clusteranalyse auf Datenmatrizen
  • Hierarchy: hierarchische Clusteranalysen auf Ähnlichkeitsmatrizen
  • Centroid: Schwerpunktbildung in Ähnlichkeitsmatrizen
  • Density: hierarchische Dichteschätzer-Methode
  • Divide: hierarchische Verteilungsclusterbildung auf binäre Variablen

Nicht-hierarchische Cluster Methoden

  • Classify: Identifizierung von neuen Fällen durch Traversierung von Clusterbäumen
  • Normix: Maximum-Likelihood Abschätzung der Maßgrößen von multivariaten Normalverteilungen mit Signifikanztests
  • Invariant: iterative Optimierung von Wilks' Lambda or Hotelling's Trace
  • Mode: Finden „natürlicher“ Cluster durch Schätzung disjunkter Dichteflächen
  • Relocate: iterative Zuordnung zu Clusters (k-means-Algorithmus)
  • Kdend: Suche von Bk-overlapping-clusters (Jardine-Sibson Clustermethode, siehe Voronoi-Interpolation)
  • Dndrite: Teilung von minimal reichenden Bäumen, um die Summe der Fehlerquadrate zu minimieren (Regressionsanalyse)
  • Euclid: fuzzy Clusterung, um Quadratsummen zu minimieren

Sonstige statistische und grafische Hilfsroutinen

  • Read similarity matrix: Lesen von Ähnlichkeitsmatrizen
  • Calculate similarity matrix: Berechnen einer Ähnlichkeitsmatrix mit einer Vielzahl von verschiedenen Koeffizienten
  • Print results: Druck der Clusteranalyse-Ergebnisse
  • Scatter: Zeichnen von Scatter- und Cluster-Diagrammen (Plots)
  • Plink: Zeichnen hierarchischer Cluster-Bäume
  • Rules: Signifikanztests für die beste Aufteilung
  • Compare: Vergleich hierarchischer Klassifikationen

Grafische Darstellungssoftware

  • ClustanGraphics: interaktive Software um die Ergebnisse grafisch anzusehen

Siehe auch

Einzelnachweise

  1. David Wishart. In: Memories.net. 8. August 2020, abgerufen am 25. Januar 2021 (englisch).
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.