KNIME
KNIME, der „Konstanz Information Miner“, ist eine freie Software für die interaktive Datenanalyse. KNIME ermöglicht durch das modulare Pipelining-Konzept die Integration zahlreicher Verfahren des maschinellen Lernens und des Data-Mining. Die graphische Benutzeroberfläche ermöglicht das einfache und schnelle Aneinandersetzen von Modulen für die Datenvorverarbeitung (ETL: Extraction, Transformation, Loading), der Modellierung und Analyse und der Visualisierung. KNIME ist seit etwa 2006 im Bereich der pharmazeutischen Forschung im Einsatz[3]. KNIME wird aber auch in anderen Bereichen wie Kundenpflege (CRM), Business Intelligence und Finanzdatenanalyse eingesetzt.
KNIME | |
---|---|
Bildschirmfoto von KNIME | |
Basisdaten | |
Aktuelle Version | 4.4.2[1] (21. Oktober 2021) |
Betriebssystem | Linux, Macintosh, Windows |
Programmiersprache | Java[2] |
Kategorie | Mathematik, Statistik, Bioinformatik, Chemoinformatik |
Lizenz | GPL (Freie Software) |
knime.org |
Geschichte
Die Entwicklung von KNIME begann im Frühjahr 2004 – eine Gruppe von Software-Entwicklern aus dem Silicon Valley begann unter der Leitung von Michael Berthold an der Universität Konstanz mit der Konzeption der Plattform. Der Schwerpunkt der Entwicklung lag von vorneherein auf einer professionellen Software-Architektur, die skalierbar und hochgradig modular sein musste. Mitte 2006 erschien die erste öffentliche Version, die insbesondere im Pharmabereich schnell dazu führte, dass zahlreiche kommerzielle Softwareanbieter ihre Werkzeuge ebenfalls in KNIME einbinden.[4][5][6] Nach dem Erscheinen eines Artikels in der c't im Jahr 2006[7] wird KNIME auch in anderen Bereichen[8] zunehmend eingesetzt. Seit Juni 2008 ermöglicht eine in Zürich ansässige Firma (KNIME AG) auch die Bereitstellung von professioneller technischer Unterstützung und Beratungsdiensten für die KNIME-Plattform. KNIME schneidet in Vergleichen von quelloffenen Data-Mining-Systemen überdurchschnittlich gut ab und hebt sich insbesondere durch seine Benutzerfreundlichkeit heraus.[9]
Lizenz
KNIME ist ab Version 2.1 unter GPL erhältlich.
Interna
KNIME wird in Java entwickelt und als Eclipse-Plugin bereitgestellt. Module anderer können leicht als zusätzliche Plugins integriert werden. KNIMEs Core-Version enthält einige hundert Module für die Datenintegration (File I/O, Datenbankoperatoren mit Unterstützung aller gängigen Datenbanken), Datentransformationen (Filter, Konverter, Combiner) sowie die gebräuchlichsten Methoden der Datenanalyse und -visualisierung. Weitere Eigenschaften von KNIME:
- KNIMEs Core-Architektur erlaubt die Verarbeitung von großen Datenmengen, die nur durch den vorhandenen Festplattenplatz eingeschränkt sind (die meisten anderen quelloffenen Datenanalyse-Projekte arbeiten arbeitsspeicherbasiert und limitieren dadurch die verarbeitbaren Datenmengen erheblich). Beispiele sind die Analyse von 300 Millionen Adressdaten, 20 Millionen Zellbildern und 10 Millionen molekularen Strukturen.
- Zusätzliche Plugins ermöglichen die Einbindung von Methoden für Text Mining und Image Mining sowie die Zeitserienanalyse.
- Einbindungen für zahlreiche andere Open-Source-Verfahren existieren, u. a. die Verfahren von WEKA, das statistische R-Projekt sowie LibSVM, JFreeChart und ImageJ.
Weblinks
Einzelnachweise
- www.knime.com. (abgerufen am 19. November 2021).
- The knime Open Source Project on Open Hub: Languages Page. In: Open Hub. (abgerufen am 18. Oktober 2018).
- Abhishek Tiwaria and Arvind K.T. Sekhar: Workflow based framework for life science informatics, Computational Biology and Chemistry, Volume 31, Issues 5–6, Pages 305–319, Elsevier, October 2007.
- Treweren Consultants. Abgerufen am 4. März 2018 (englisch).
- Chemical Computing Group. Abgerufen am 4. März 2018 (englisch).
- Selenium Nodes — Put your web browser to work with KNIME. Abgerufen am 25. Februar 2017 (englisch).
- Datenbank-Mosaik Data Mining oder die Kunst, sich aus Millionen Datensätzen ein Bild zu machen, c't 20/2006, S. 164ff, Heise Verlag.
- Forum auf der KNIME Webseite
- Xiaojun Chen, Yunming Ye, Graham Williams and Xiaofei Xu: A Survey of Open Source Data Mining Systems, Lecture Notes in Computer Science, vol. 4819, pp. 3–14, Springer-Verlag, 2009.