Schlagwortwolke
Eine Schlagwortwolke (auch Wortwolke, Schlagwortmatrix oder Stichwortwolke, selten Etikettenwolke; engl.: tag cloud, word cloud) ist eine Methode zur Informationsvisualisierung, bei der eine Liste aus Schlagwörtern, oft alphabetisch sortiert, flächig angezeigt wird, wobei einzelne unterschiedlich gewichtete Wörter größer oder auf andere Weise hervorgehoben dargestellt werden. Sie kann so zwei Ordnungsdimensionen (die alphabetische Sortierung und die Gewichtung) gleichzeitig darstellen und auf einen Blick erfassbar machen.
Wortwolken werden beim gemeinschaftlichen Indexieren und in Weblogs eingesetzt. Bekannte Anwendungen sind die Darstellung populärer Stichwörter bei Flickr, Technorati und Del.icio.us.
Schlagwortwolken wurden vermutlich zuerst 2002 von Jim Flanagan eingesetzt[1] und zunächst als gewichtete Liste (engl. weighted list) bezeichnet.[2] Um einige Zeit früher – im Jahr 1992 – kam allerdings schon das Buch „Tausend Plateaus. Kapitalismus und Schizophrenie“ von Gilles Deleuze und Félix Guattari heraus[3], auf dessen Einband bereits eine „Begriffswolke“ abgebildet ist.
Erstellung
Prinzipiell wird die Schriftgröße eines Schlagwortes in einer Schlagwortwolke durch dessen Häufigkeit bestimmt. Für eine Wortwolke der Kategorien eines Weblogs entspricht die Benutzungshäufigkeit beispielsweise der Anzahl von Weblogeinträgen, die einer Kategorie zugeordnet sind. Bei kleinen Häufigkeiten genügt es, für jede Anzahl von eins bis zu einem Maximalwert die Schriftgröße direkt anzugeben.[4] Für größere Werte sollte eine Normierung vorgenommen werden. Bei einer linearen Normierung wird das Gewicht eines Deskriptors auf eine Größenskala von bis abgebildet, wobei und den Wertebereich der vorhandenen Gewichte angeben.
- : anzuzeigende Schriftgröße
- : maximale Schriftgröße
- : minimale Schriftgröße
- : Häufigkeit des betreffenden Schlagwortes
- : Häufigkeit, ab der ein Schlagwort angezeigt werden soll
- : Häufigkeit des häufigsten Schlagwortes
Da die Anzahl indexierter Objekte pro Schlagwort üblicherweise nach einem Potenzgesetz verteilt ist[5], ist für größere Wertebereiche eine logarithmische Darstellung sinnvoll.[6] Für flektierende Sprachen wie das Deutsche müssen die Wörter vor dem Zählen zuerst lemmatisiert, also auf ihre Grundform reduziert werden.
Für die Erstellung von Schlagwortwolken verwendet man üblicherweise speziell dafür geeignete Software. So gibt es beispielsweise Software, welche aus Texten oder Webseiten die Schlagworte und deren Häufigkeit automatisch eruieren und die Schlagwortwolke generieren.[7] Andere Programme wiederum benötigen eine Liste an Schlagworten und deren Gewicht, um die Schlagwortwolke generieren zu können.
Wahrnehmung
In einigen empirischen Usability-Tests wurde die Wahrnehmung und Wirkung von Schlagwortwolken untersucht. Dabei wurde festgestellt, dass Schlagwörter, die die folgenden Eigenschaften besitzen, mehr Beachtung erfahren:[8]
- Schlagwörter mit einer großen Schriftgröße (Effekt beeinflusst durch weitere Faktoren, wie Anzahl der Buchstaben oder benachbarte Schlagwörter)
- Schlagwörter in der Mitte der Schlagwortwolke (Effekt beeinflusst durch das jeweilige Layout der Schlagwortwolke)
- Schlagwörter im linken, oberen Quadranten (Effekt beeinflusst durch westliche Lesegewohnheiten)
Benutzerfreundlichkeit
Im Rahmen von Tests hinsichtlich der Benutzerfreundlichkeit ist festgestellt worden, dass wenig erfahrene Nutzer häufig Probleme mit Wortwolken haben: User-Tests und die Nachbefragungen haben ergeben, dass sich Schlagwortwolken vielen Usern offenbar nicht intuitiv erschließen und ihnen unklar ist, warum z. B. manche Begriffe größer als andere dargestellt werden.
Als ein weiterer Mangel in Bezug auf die Benutzerfreundlichkeit wird wahrgenommen, dass die Schlagwortwolken gar nicht oder allenfalls alphabetisch geordnet sind. Eine Studie hat gezeigt, dass Nutzer die Wolken nach semantischen Assoziationen ordnen würden. Das heißt, sie würden Begriffe der Wolke, die sich einem gemeinsamen Thema zuordnen lassen, in Untergruppen zusammenstellen.[9]
Internet-erfahrene Nutzer dagegen können Wortwolken in der Regel problemlos handhaben und sehen in ihnen häufig eine Bereicherung des Nutzererlebnisses.
Weblinks
Quellen
- Jim Flanagan: Search Engine Referrals. In: Everything Burns. 6. September 2002, archiviert vom Original am 6. September 2002; abgerufen am 17. Mai 2006.
- The Spread of Weighted Lists. In: Signal vs Noise. Matthew Linderman, 2. Dezember 2004, abgerufen am 17. Mai 2006.
- Gilles Deleuze, Felix Guattari: Tausend Plateaus. Kapitalismus und Schizophrenie. Berlin 1992, ISBN 978-3-88396-094-4.
- Ed Kohler: How to Make a Tag Cloud for Movable Type Blogs. (Nicht mehr online verfügbar.) In: technologyevangelist.com. 8. März 2006, archiviert vom Original am 28. April 2006; abgerufen am 14. Mai 2006. Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.
- Jakob Voss: Collaborative thesaurus tagging the Wikipedia way. April 2006
- kentbye: Tag Cloud Font Distribution Algorithm. (Nicht mehr online verfügbar.) In: kentbye's blog. 24. Juni 2005, archiviert vom Original am 2. Oktober 2013; abgerufen am 17. Mai 2004. Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.
- Wordle - Beautiful Word Clouds. Abgerufen am 28. August 2017 (englisch).
- Steffen Lohmann, Jürgen Ziegler, Lena Tetzlaff: Comparison of Tag Cloud Layouts: Task-Related Performance and Visual Exploration (Memento des Originals vom 7. Oktober 2009 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis. (PDF; 521 kB), In: T. Gross et al. (Eds.): INTERACT 2009, Part I, LNCS 5726, S. 392–404, 2009.
- Daniela Oelke, Iryna Gurevych: A Study on Human-Generated Tag Structures to Inform Tag Cloud Layout (PDF; 3450 kB), In: Proceedings of the International Working Conference on Advanced Visual Interfaces (AVI 2014), 2014.