Waikato Environment for Knowledge Analysis
Weka (Waikato Environment for Knowledge Analysis) ist eine Software, die verschiedene Techniken aus den Bereichen Maschinelles Lernen und Data-Mining bereitstellt. Das Programm wurde an der University of Waikato entwickelt und ist in Java geschrieben. Es handelt sich um eine frei verfügbare Software, die unter der GNU General Public License steht.
Weka | |
---|---|
Bildschirmfoto von Weka | |
Basisdaten | |
Entwickler | University of Waikato |
Aktuelle Version | 3.8.3[1] (22. Dezember 2017) |
Betriebssystem | Plattformunabhängig |
Programmiersprache | Java |
Kategorie | Maschinelles Lernen |
Lizenz | GPL, proprietär |
deutschsprachig | nein |
cs.waikato.ac.nz/ml/weka |
Die Software ist integraler Bestandteil des Buches Data Mining: Practical Machine Learning Tools and Techniques von Ian H. Witten, Eibe Frank und Mark A. Hall,[2] des englischsprachigen Standardwerkes zum Thema Maschinelles Lernen. Die Software wurde von der Association for Computing Machinery 2005 mit dem „SIGKDD Service Award“ ausgezeichnet[3] für den hohen Beitrag zur Forschung unter anderem durch Bereitstellung der Quelltexte als Open Source.[4]
Weka ist bekannt für seine Vielzahl von Klassifikatoren wie Bayes-Klassifikatoren, künstliche neuronale Netze, Support-Vector-Maschinen, Entscheidungsbäume, ID3-, C4.5- aber auch Meta-Klassifikatoren, Boosting und Ensembles. In anderen Data-Mining-Bereichen wie der Clusteranalyse werden nur die grundlegendsten Verfahren wie der k-Means-Algorithmus und der EM-Algorithmus angeboten.
Beschreibung
Die Workbench von WEKA untergliedert sich in folgende Bereiche:
- Vorverarbeitung:
Erlaubt insbesondere die Auswahl der zu analysierenden Attribute - Klassifikation
- Clusteranalyse
- Assoziationsanalyse
- Attributauswahl:
Ermittelt die zur Klassifikation hilfreichsten Attribute der Daten - Visualisierung
Siehe auch
- ELKI – komplementäre Software mit Schwerpunkt Clusteranalyseverfahren, Ausreißererkennung und Indexstrukturen
- KNIME (Konstanz Information Miner) Projekt der Universität Konstanz zur interaktiven Datenanalyse in Eclipse.
- RapidMiner – kann Weka-Algorithmen verwenden.
- Scikit-learn eine freie Software-Bibliothek zum maschinellen Lernen für die Programmiersprache Python
Einzelnachweise
- www.cs.waikato.ac.nz. (abgerufen am 24. September 2019).
- Ian H. Witten, Eibe Frank, Mark A. Hall: Data Mining: Practical Machine Learning Tools and Techniques. 3. Auflage. Morgan Kaufmann, Burlington MA 2011, ISBN 978-0-12-374856-0 (cs.waikato.ac.nz).
- SIGKDD Service Awards. Association for Computing Machinery, abgerufen am 21. Januar 2016 (englisch).
- KDNuggets News 2005-13. KDnuggets, abgerufen am 15. April 2011 (englisch).