Keystroke-Level-Model
Das Keystroke-Level-Model (KLM) erlaubt es, Aussagen darüber zu treffen, wie lange ein Experte für die fehlerfreie Bearbeitung einer Aufgabe mit einem interaktiven Computersystem benötigt.[1] Im Forschungsgebiet der Mensch-Computer-Interaktion zählt das KLM zu den meistverbreiteten Herangehensweisen und wird hauptsächlich auf Textverarbeitungsaufgaben angewandt.[2] Um die benötigte Arbeitszeit vorherzusagen, wird eine Folge von Interaktionsschritten, eine sogenannte Methode, vorgegeben. Die Durchführungszeit ergibt sich dann aus der Summe der Operatoren der einzelnen Arbeitsschritte.[3] Durch Anpassung des Modells an mobile Endgeräte und Touchscreens gilt das KLM auch heute noch als relevant.
Struktur des Keystroke-Level-Models
Das Keystroke-Level-Model umfasst sechs Operatoren, von denen die ersten vier Operatoren als physisch-motorische Operatoren definiert werden. Hinzu kommen ein mentaler Operator und ein Operator, der die Antwortzeit des Systems repräsentiert.[1]
- K (Tastenanschlag oder Mausklick): Dies ist der häufigste Operator. Er beschreibt jedoch nicht nur Buchstaben, sondern jeden einzelnen Tastendruck (bspw. wird ein Tastendruck auf die Hochstelltaste (SHIFT) als einzelne K-Operation gewertet). Die benötigte Zeit hängt von den motorischen Fähigkeiten des Benutzers ab und wird mittels einminütiger Schreibtests bestimmt, wobei die Testzeit durch die Gesamtzahl fehlerfreier Tastenanschläge geteilt wird.
- P (Zielerfassung auf einem Display mit Hilfe einer Maus): Diese Zeit ist abhängig von der Distanz zum Ziel und der Größe des Ziels.[4] Ein Mausklick ist dabei nicht enthalten. Er zählt als separate K-Operation.
- H (Wechsel der Hand oder der Hände zwischen unterschiedlichen Eingabegeräten): Die Zeit für diesen Operator beinhaltet die Bewegung beim Wechsel von Eingabegeräten oder die Feinpositionierung der Hand.
- D (Zeichnen (manuell): nD geradlinige Segmente, die eine Gesamtlänge von D(nD, lD) cm haben): Dabei stellt nD die Anzahl der Liniensegmente und lD die Gesamtlänge der Liniensegmente dar. Dieser Operator ist sehr restriktiv, denn es wird vorausgesetzt, dass mit einer Maus gezeichnet wird, wobei das Zeichensystem den Cursor auf ein 0.56 cm großes Rechteck begrenzt. Die ermittelte Zeit für diesen Operator ist ein Durchschnittswert.
- M (mentale Vorbereitung zur Ausführung physischer Aktionen): Beschreibt die Zeit, die ein Benutzer für Denkprozesse oder für die Entscheidungsfindung benötigt. Die Anzahl von M-Operatoren in einer Methode hängt vom Wissensstand und Können des Benutzers ab. Heuristiken geben Auskunft darüber, an welcher Stelle in einer Methode ein M-Operator gesetzt werden muss. Wird beispielsweise mit der Maus ein Ziel angesteuert, so wird gewöhnlich auch ein Mausklick vorausgesetzt, weshalb kein M-Operator zwischen diesen beiden Operatoren benötigt wird.[1] Punkt 2 erklärt die Heuristiken für das Setzen eines M-Operators.
- R (Antwortzeit des Systems): Die Antwortzeit hängt vom System, dem Kommando und dem Kontext des Kommandos ab. Es wird nur dann benötigt, wenn der Benutzer tatsächlich auf das System warten muss. Bereitet der Benutzer beispielsweise seine nächste physikalische Aktion vor (M), so wird nur der nicht-überlappende Teil der Antwortzeit für R benötigt, da der Benutzer die Antwortzeit für die M-Operation benötigt (zum Beispiel R von 2 Sekunden - M für 1.35 Sekunden = R von .65 Sekunden). Kieras[5] schlägt eine Namensänderung des Operators zu W (Wartezeit) vor, um Verwirrung zu vermeiden. Sauro[6] hingegen bevorzugt einen Test, der die Antwortzeit des Systems vorab bestimmt.
Nachfolgende Tabelle zeigt neben einem Überblick der Zeiten für die erwähnten Operatoren auch Zeiten für weitere von unterschiedlichen Autoren vorgeschlagene Operatoren.
Operator | Zeit (Sekunden) |
---|---|
K | Gesamtzeit des Schreibtests geteilt durch die Gesamtzahl fehlerfreier Tastenanschläge Richtlinien:[1][7] |
P | 1.1[1][7] |
H | 0.4[1][7] |
D | .9nD +. 16 lD[1][7] |
M | 1.35[1][7] |
R | Systemabhängig[1][7] |
Weitere vorgeschlagene Operatoren | |
B (Mausklick oder Loslassen der Maustaste) | 0.1[5] |
Klick auf einen Button / Link | 3.73[6] |
Pull-Down-Liste (Ohne Laden der Seite) | 3.04[6] |
Pull-Down-Liste (Mit Laden der Seite) | 3.96[6] |
Datumsauswahl | 6.81[6] |
Ausschneiden & Einfügen (Tastatur) | 4.51[6] |
Text in ein Textfeld schreiben | 2.32[6] |
Scrolling | 3.96[6] |
Methodik zum Setzen des M-Operators
Beim Setzen des M-Operators wird wie folgt vorgegangen:[1]
Beginne mit einer Methode, die alle physischen Operatoren und Antwortoperationen umfasst. Benutze Regel 0, um ein M-Operatoren zu platzieren. Iteriere für jedes M durch Regel 1 bis 4, um zu sehen, ob es entfernt werden sollte. | |
Regel 0 | Setze Ms vor alle K-Operatoren, die nicht Teil einer durchgehenden Zeichenkette sind (zum Beispiel Texte oder Zahlen). Setze Ms vor alle P-Operatoren, die Befehle wählen (keine Argumente). |
Regel 1 | Wenn ein Operator nach einem M bereits im Operator vor dem M vorausgeahnt werden kann, dann entferne das M (zum Beispiel PMK -> PK). |
Regel 2 | Gehört eine Kette von MKs zu einer kognitiven Einheit, so lösche alle Ms bis auf das erste. |
Regel 3 | Ist ein K ein redundanter Terminator (zum Beispiel das Ende eines Befehls direkt nach dem Ende eines Arguments), dann entferne das M davor. |
Regel 4 | Wenn ein K eine konstante Zeichenkette (beispielsweise einen Befehlsnamen) beendet, so entferne das M davor. Beendet ein K jedoch eine variable Zeichenkette (zum Beispiel ein Argument), so muss das M stehen bleiben. |
Vergleich zu GOMS
Das KLM ist die einfachste Version der GOMS-Technik. Einer der Hauptunterschiede zwischen dem KLM und anderen Modellen der GOMS-Familie ist, dass das KLM die Arbeitsschritte eines Nutzers nicht vorhersieht, sondern diese vorgibt. Daher enthält das KLM im Gegensatz zum GOMS-Modell keine Ziele und Auswahlregeln. Außerdem ist das KLM anders als übrige GOMS-Modelle auf Aufgaben beschränkt, bei denen es keine parallelen Arbeitsschritte, verschachtelte Ziele oder Unterbrechungen gibt.[3]
Vorteile
Das KLM ist ein schnelles und einfaches Modell, das ohne tieferes Wissen über die menschliche Psychologie verwendet werden kann.[1] Des Weiteren können Bearbeitungszeiten ohne die Anfertigung von Prototypen und das Testen mit tatsächlichen Nutzern vorausgesagt werden, was Zeit und Geld spart.[6]
Einschränkungen
Das KLM ist durch mehrere Faktoren eingeschränkt:
- Es wird lediglich die Zeit gemessen[1] und übrige Performancemaße werden nicht erhoben[7].
- Es kann nur Zeiten für Experten voraussagen. Generell unterscheiden sich Nutzer durch ihr Vorwissen und ihre Erfahrungen bezüglich unterschiedlicher Systeme und Aufgaben, durch motorische Fähigkeiten und technisches Können.[1]
- Es werden nur bekannte und routinemäßige Aufgaben betrachtet.[1]
- Die Methode muss schrittweise vorgegeben werden.[1]
- Die Ausführung der Methode muss fehlerfrei sein.[1]
- Der M-Operator umfasst unterschiedliche mentale Operationen und gibt keine genauere Auskunft über die mentalen Operationen des Nutzers. Ist dies erforderlich, muss auf ein GOMS-Modell zurückgegriffen werden.[7]
Allgemein sollte man sich darüber bewusst sein, dass beim Umgang mit Computersystemen auch andere Performancemaße (Fehler, Lernen, Funktionalität, Recall, Konzentration, Müdigkeit sowie Aufgabenangemessenheit) sowie andere Nutzertypen (Anfänger, gelegentliche Nutzer) und nicht routinemäßige Aufgaben eine Rolle spielen.[1] Außerdem benötigt das Anfertigen einer Prognose für Aufgaben, die länger als ein paar Minuten dauern, meist mehrere Stunden.[6] Auch dass Operationen vergessen werden, ist eine häufige Fehlerquelle. Das bedeutet, dass das KLM sich am besten für kurze Aufgaben mit einer nicht allzu hohen Anzahl an Operatoren eignet. Zudem kann das KLM keine wirklich präzise Vorhersage treffen und ist mit einer mittleren quadratischen Abweichung von 21 % oftmals nicht korrekt.[7]
Beispiel
Das folgende Beispiel, eine Adaption einer Berechnung von Kieras, zeigt den praktischen Gebrauch des KLMs. Hierbei werden zwei Möglichkeiten eine Datei zu löschen verglichen, wobei der Auszuführende eine durchschnittliche Schreibkraft ist. Für den M-Operator werden 1.35 Sekunden, wie im KLM[1][7] vorgegeben, anstatt der von Kieras verwendeten 1.2 Sekunden eingesetzt. Der zeitliche Unterschied bleibt in diesem Falle jedoch unverändert.
Design A: Ziehen der Datei in den Papierkorb[5] |
Design B: Verwenden des Shortcuts “control + T”[5] |
---|---|
Methoden Enkodierung: Befehlskette[5] | Methoden Enkodierung: Befehlskette[5] |
|
|
Benötigte Zeit | Benötigte Zeit |
3P + 2B + 2M = 3*1.1 sek + 2*.1 sek + 2*1.35 sek = 6.2 Sekunden | P + 2B + 2H + 2K + 2M = 1.1 sek + 2*.1 sek + 2*.4 sek + 2*.2 sek + 2*1.35 sek = 5.2 Sekunden |
Dies zeigt, dass Design B schneller ist, obwohl es mehr Operationen beinhaltet.
Anpassung
Die sechs Operatoren des KLM können weiter reduziert werden, was jedoch die Präzision des Models verringert. Für grobe Berechnungen ist das aber durchaus praktikabel.[7]
Da das bestehende KLM an Desktop Computer angepasst ist, trifft es nur beschränkt auf mobile Endgeräte zu.[8] So geben Dunlop und Cross[9] zu bedenken, dass das KLM für den mobilen Kontext nicht mehr korrekt ist. Es gibt einige Versuche das Model zu erweitern, sodass es auch für mobile Endgeräte und Touch-Oberflächen verwendet werden kann.
Ein signifikanter Beitrag zu dieser Forschungsfrage stammt von Holleis et al.[10], die die existierenden Operatoren beibehalten und nur die Zeitspannen dieser verändern. Des Weiteren führen sie weitere neue Operatoren ein: Ablenkung (X), Geste (G) und anfängliche Handlung (IA). Während sich Holleis et al.[10] und Li et al.[8] darüber einig sind, dass das KLM auch für mobile Geräte verwendet werden kann, schlagen Li et al. eine weitere Adaption des Modells vor. So stellen sie ein neues Konzept, die Operator-Blocks, vor. Dabei handelt es sich um „eine oft wiederkehrende Reihenfolge von Operatoren des erweiterten Models“. Darüber hinaus verwerfen Li et al. die ursprünglichen Operatoren und definieren fünf neue mentale und neun neue physische Operatoren, wobei vier der physischen Operatoren stiftbasiert sind.
Rice und Lartigue[11] entwerfen das Touch Level Model. Dafür passen sie nicht nur die bereits bestehenden Operatoren an, sondern schlagen auch mehrere Operatoren für Touchgeräte vor. Sie behalten die Operatoren Keystroke (K), Homing (H), Mental Act (M) sowie Response Time (R(t)) bei und schlagen neue auf den Berechnungen von Holleis et al.[10] basierende touch-spezifische Operatoren vor:
- Distraction: Ein multiplikativer Operator, der Zeit zu anderen Operatoren hinzufügt.
- Pinch: Eine Geste zum heraus-zoomen, die mit zwei Fingern oder mehr ausgeführt wird.
- Zoom: Eine Geste zum hinein-zoomen, die mit zwei Fingern oder mehr ausgeführt wird.
- Initial Act: Die Schritte, die nötig sind das System auf die Benutzung vorzubereiten (zum Beispiel Entsperren des Geräts, Drücken eines Icons, Eingabe eines Passworts).
- Tap: Antippen des Bildschirms, um eine Aktion zu beginnen oder eine Veränderung zu erreichen.
- Swipe: Eine Geste, bei der ein oder mehrere Finger auf dem Bildschirm platziert und dann wiederholt für eine bestimmte Zeit in eine Richtung bewegt werden.
- Tilt: Neigen oder Rotieren des Endgeräts um d Grad.
- Rotate: Eine Geste, bei der zwei oder mehr Finger auf dem Bildschirm platziert und dann um d Grad um eine Achse rotiert werden.
- Drag: Eine Geste, bei der ein oder mehrere Finger auf dem Bildschirm platziert und dann, häufig in einer geraden Linie, zu einem anderen Punkt bewegt werden.
Weblinks
- GOMS-Artikel von Lorin Hochstein
- KLM-Übung von Christoph Erhardt
- Simple KLM calculator (free, downloadable Windows app)
Einzelnachweise
- Stuart K. Card, Thomas P. Moran, Newell Allen: The keystroke-level model for user performance time with interactive systems. In: Communications of the ACM. Vol. 23, Nr. 7, 1980, doi:10.1145/358886.358895.
- Peter Haunold: Analyse manueller Digitalisierungsabläufe mit dem Keystroke-Level Modell. In: Angewandte geographische Informationsverarbeitung. Vol. 26, 1997 (PDF). PDF (Memento des Originals vom 4. März 2016 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.
- Bonnie E. John, David E. Kieras: The GOMS Family of User Interface Analysis Techniques:Comparison and Contrast. In: ACM Transactions on Computer-Human Interaction (TOCHI). Vol. 3, Nr. 4, 1996, doi:10.1145/358886.358895.
- Paul M. Fitts: The information capacity of the human motor system in controlling the amplitude of movement. In: Journal of Experimental Psychology: General. Vol. 121, Nr. 3, 1992, doi:10.1037/h0055392.
- David Kieras: Using the Keystroke-Level Model to Estimate Execution Times.
- Jeff Sauro, Julie A. Jacko (Editor): Estimating productivity: Composite operators for keystroke level modeling. In: Human-Computer Interaction. New Trends: Proceedings of the 13th International Conference (LNCS). Vol. 5610. Springer-Verlag, Berlin Heidelberg 2009, doi:10.1007/978-3-642-02574-7_40.
- Stuart K. Card, Thomas P. Moran, Allen Newell: The Psychology of Human-Computer Interaction. L. Erlbaum Associates Inc, Hillsdale 1983, ISBN 0-89859-243-7.
- Hui Li, Ying Liu, Jun Liu, Xia Wang, Yujiang Li, Pei-Luen Patrick Rau: Extended KLM for mobile phone interaction: a user study result. In: CHI EA '10 CHI '10 Extended Abstracts on Human Factors in Computing Systems. ACM, New York 2010, ISBN 978-1-60558-930-5, doi:10.1145/1753846.1754011.
- M.Dunlop, A. Crossan: Predictive Text Entry Methods for Mobile Phones. In: Personal Technologies. 2000, doi:10.1007/BF01324120.
- P. Holleis, F. Otto, H. Hussmann, A. Schmidt: Keystroke-level model for advanced mobile phone interaction. In: CHI ’07: Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. 2007, doi:10.1145/1240624.1240851.
- A.D. Rice, J. W. Lartigue: Touch-Level Model ( TLM ): Evolving KLM-GOMS for Touchscreen and Mobile Devices Categories and Subject Descriptors. In: ACM SE '14 Proceedings of the 2014 ACM Southeast Regional Conference Article No. 53. 2014, doi:10.1145/2638404.2638532.