Handschrifterkennung
Handschrifterkennung ist eine Form der Mustererkennung, bei der handschriftlich geschriebene Zeichen oder Wörter erkannt werden sollen. Dabei wird zwischen on-line und off-line Handschrifterkennung unterschieden.[1][2] Bei der On-line-Handschrifterkennung kann die Information, wie ein Wort geschrieben wurde, also in welcher Reihenfolge die Striche gezogen wurden, zur Erkennung benutzt werden. Bei der Off-line-Handschrifterkennung liegt dagegen nur das Endprodukt als Bild vor. Daher ist die Off-line-Handschrifterkennung ein Teilgebiet der Texterkennung, die On-line-Handschrifterkennung jedoch nicht.
Allgemeine Funktionsweise
Ein Handschrifterkenner kann verschiedene Schritte zur Schrifterkennung nutzen:
- Vorverarbeitung: Das Entfernen von überflüssigen (zu hohe Auflösung) oder sogar fehlerhaften Informationen (Bildfehler)
- Segmentierung: Das Zerlegen der Eingabe in kleinere Teile, wie z. B. das Zerlegen von Wörter in Buchstaben oder von Zahlen in Ziffern
- Feature-Extraktion bzw. Generierung: Aus den vielen kleinen Informationen werden weniger, wichtigere Informationen generiert. So kann in der on-line Handschrifterkennung aus den vielen Informationen, wo zu welchem Zeitpunkt der Stift war die Information generiert werden, welche Krümmung die Schriftkurve in verschiedenen Punkten hat.
In einem weiteren Schritt werden dann mit Techniken des maschinellen Lernens die Zeichen erkannt.
On-line Handschrifterkennung
On-line Handschrifterkennung benötigt bereits beim Schreiben einen Touchbildschirm oder ein anderes digitales Gerät zum Aufzeichnen der Schrift. Dabei können verschiedenste Eingabegeräte wie Smartphones und Tablets mit Fingern bzw. Eingabestiften oder auch Grafiktabletts zum Einsatz kommen. Diese Eingabegeräte liefern die Information, wo sich der Eingabestift befindet. Manche Geräte liefern diese Information auch dann, wenn sich der Stift nicht auf dem Touchscreen befindet, sondern nur darüber ist. Je nach verwendeter Technologie wird zusätzlich zu den Koordinaten der Eingabe auch noch die Information geliefert, wie viel Druck ausgeübt wurde.
On-line-Handschrifterkennung ist momentan noch deutlich weniger verbreitet als Off-line-Handschrifterkennung.
On-line-Handschrifterkennung wird seit den 1950er Jahren wissenschaftlich untersucht.[3] (1958 wurde mit dem „Stylator“ das erste Gerät vorgestellt, mit dem die Aufnahme von On-line-Informationen bzgl. der Handschrifterkennung möglich war.[4])
Die Vorverarbeitung in der On-line-Handschrifterkennung kann eine Fülle von verschiedenen Schritten beinhalten:[5]
- Das Finden und Eliminieren „wilder Punkte“, also von Punkten die durch Hardwarefehler entstehen.
- Das Interpolieren der gemessenen Punkte sowie damit verbunden das Neuberechnen von Punkten.
- Das Skalieren und Verschieben der Eingabe.
- Das Finden einer Basislinie und gegebenenfalls das Korrigieren der Schrift, sodass sie auf einer geraden Basislinie liegt.
- Das Finden und gegebenenfalls das Korrigieren der Neigung der Buchstaben.
Off-line-Handschrifterkennung
Die Off-line-Handschrifterkennung hat zahlreiche Anwendungsgebiete wie beispielsweise die Schrifterkennung auf Formularen, Überweisungsbelegen und Adressen auf Briefen.
Forschung
Die Handschrifterkennung hat eine aktive Gemeinschaft welche diese studiert. Es gibt verschiedene Konferenzen wie die ICFHR oder die ICDAR, welche dieser dienen.
Siehe auch
Einzelnachweise
- Brakensiek, A. and Kosmala, A. and Willett, D. and Rigoll, G.: Vergleich verschiedener statistischer Modellierungsverfahren für die On- und Off-Line Handschrifterkennung. Springer Berlin Heidelberg, 1999, ISBN 978-3-540-66381-2, S. 70–77.
- Joachim Schenk, Gerhard Rigoll: Mensch-Maschine-Kommunikation. Springer Berlin Heidelberg, 2010, ISBN 978-3-642-05456-3, S. 151–164.
- Tappert, C. C. and Suen, C. Y. and Wakahara, T.: The State of the Art in Online Handwriting Recognition. In: IEEE Trans. Pattern Anal. Mach. Intell. Band 12, Nr. 8, 1990, S. 787--808, doi:10.1109/34.57669.
- T. L. Dimond: Devices for Reading Handwritten Characters. In: Papers and Discussions Presented at the December 9-13, 1957, Eastern Joint Computer Conference: Computers with Deadlines to Meet. 1958, S. 232--237, doi:10.1145/1457720.1457765.
- Martin Thoma: On-line Recognition of Handwritten Mathematical Symbols. 29. November 2015, doi:10.5445/IR/1000048047.