Kernel-Methode

Kernel-Methoden sind im Bereich des Maschinellen Lernens eine Klasse von Algorithmen, die sich eines Kernels (dt. Kern) bedienen, um ihre Berechnungen implizit in einem höherdimensionalen Raum auszuführen. Bekannte Kernel-Methoden sind Support Vector Machines, Gaußprozesse und die Kernel-PCA.

Formale Definition Kernel

Sei ein Eingaberaum. Eine Abbildung heißt Kernel, wenn es einen Skalarproduktraum und eine Abbildung in diesen Raum gibt mit: . heißt Featurespace oder Merkmalsraum, Featuremapping oder Merkmalsabbildung. In der Praxis muss der Featurespace nicht explizit bekannt sein, da Kernel durch den Satz von Mercer eine einfache Charakterisierung besitzen.

Verschiedene Klassen von Kernel-Funktionen

Es g​ibt verschiedene Arten v​on Kerneln, d​ie sich z​um Teil über Parameter a​n die gegebene Problemstellung anpassen lassen:

  • lineare Kernel
  • polynomiale Kernel , mit einem freien Parameter
  • Radiale-Basisfunktion-Kernel (RBF) , wobei die Bandbreite ein freier Parameter ist
  • Fisher Kernel
  • Graph Kernel
  • Kernel smoother
  • String Kernel
  • Neural tangent Kernel
  • Neural network Gaussian process (NNGP) Kernel

Kernel-Trick

Bei Kernel-Methoden gibt es den Kernel-Trick, mit dem z. B. ein linearer Klassifikator erfolgreich auf nicht linear klassifizierbare Daten angewendet werden kann. Dies wird erreicht, indem man die Daten in einen höherdimensionalen Raum transformiert, in welchem man sich eine bessere lineare Separierbarkeit erhofft (siehe Bild).

Gegeben sei die Abbildung und ein Kernel Dann kann eine SVM mit diesem Kernel K(x , y) die roten und lila Datenpunkte durch eine Hyperebene trennen. Die 2d Trainingspunkte werden durch in den 3d-Raum abgebildet , wo eine trennende Hyperebene leicht gefunden werden kann.

Literatur

  • Christopher M. Bishop: Pattern Recognition and Machine Learning. Information Science and Statistics, Springer-Verlag, 2008, ISBN 978-0387310732
  • Nello Cristianini, John Shawe-Taylor: Kernel Methods for Pattern Classification. Cambridge, 2004.
  • Bernhard Schölkopf, Alex Smola: Learning with Kernels. MIT Press, Cambridge, MA, 2002.
  • Thomas Hofmann, Bernhard Schölkopf, Alexander J Smola: Kernel methods in machine learning. In: Annals Statistics 36 (3) 2008: 1171–1220. PDF.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.