Conditional Random Field

Ein Conditional Random Field (CRF) ist ein Typ von ungerichtetem probabilistischem Modell, der im maschinellen Lernen (einem Teilgebiet der künstlichen Intelligenz) eingesetzt wird. Häufig wird mit dem Begriff auf eine spezielle Form mit linearer Struktur verwiesen, das Linear-Chain Conditional Random Field. Dieses wird typischerweise zur Segmentierung von Sequenzen verwendet. Das bedeutet, das CRF erhält eine Sequenz $X$ als Eingabe und gibt eine gleich lange Sequenz $Y$ aus. Im Unterschied zu Hidden-Markov-Modellen (HMMs; ein anderes, jedoch gerichtetes Modell für sequentielle Daten) kann ein CRF an jeder Stelle auf die komplette Information der Eingabesequenz zugreifen, wohingegen ein HMM nur die aktuelle Eingabe sieht. Hierdurch können komplexe Merkmalsmengen verwendet werden.

Training

Wie alle Modelle des maschinellen Lernens müssen CRFs trainiert werden, d. h., ihre Parameter müssen aus Daten abgeschätzt werden. Hierfür existieren verschiedene Lernverfahren, etwa das Gradientenverfahren oder das Quasi-Newton-Verfahren. Dabei werden einige Sequenzen vorgegeben, von denen sowohl die Eingabe als auch die gewünschte Ausgabe bekannt ist (es handelt sich also um überwachtes Lernen). Das Lernverfahren versucht dann die Parameter im CRF so anzupassen, dass für möglichst viele Sequenzen in den Trainingsdaten die richtige Ausgabesequenz vorhergesagt wird.

Anwendungen

CRFs wurden erfolgreich auf verschiedene Probleme angewandt, wie zum Beispiel:

Informationsextraktion von natürlichsprachigen Texten
Morphologische Analyse
Klassifikation von Proteinen
Vorhersage der Sekundärstruktur von DNA und Proteinen
Bilderkennung und Bildrestauration

Siehe auch

Markov Random Field

Literatur

J. Lafferty, A. McCallum, F. Pereira: Conditional random fields: Probabilistic models for segmenting and labeling sequence data. In: Proc. 18th International Conf. on Machine Learning. Morgan Kaufmann, San Francisco, CA 2001, S. 282–289.
A. McCallum: Efficiently inducing features of conditional random fields. In: Proc. 19th Conference on Uncertainty in Artificial Intelligence. 2003.
F. Sha, F. Pereira,: Shallow parsing with conditional random fields. University of Pennsylvania, 2003 (Technical Report MS-CIS-02-35).
H. M. Wallach: Conditional random fields: An introduction. University of Pennsylvania, 2004 (Technical Report MS-CIS-04-21).
C. Sutton, A. McCallum: An Introduction to Conditional Random Fields for Relational Learning. In: Lise Getoor, Ben Taskar (Hrsg.): Introduction to Statistical Relational Learning. MIT Press, 2006.
R. Klinger, K. Tomanek: Classical Probabilistic Models and Conditional Random Fields. Dortmund University of Technology, Dezember 2007, ISSN 1864-4503 (uni-dortmund.de [PDF] Algorithm Engineering Report TR07-2-013).
T. Kudo, K. Yamamoto, Y. Matsumoto: Applying Conditional Random Fields to Japanese Morphological Analysis. 2004 (chasen.org [PDF]).

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.