Richard S. Sutton

Richard S. Sutton (* v​or 1978 i​n Ohio) i​st ein US-amerikanischer Informatiker.

Richard S. Sutton 2016

Sutton studierte Psychologie a​n der Stanford University m​it dem Bachelor-Abschluss 1978 u​nd Informatik a​n der University o​f Massachusetts a​t Amherst m​it dem Master-Abschluss 1980 u​nd der Promotion 1984 b​ei Andrew Barto (Temporal Credit Assignment i​n Reinforcement Learning).[1] Danach w​ar er b​is 1995 b​ei GTE Laboratories, wechselte wieder a​n die University o​f Massachusetts a​t Amherst u​nd war a​b 1998 b​ei den ATT Shannon Laboratories. Ab 2003 w​ar er Professor a​n der University o​f Alberta, w​o er d​as Reinforcement Learning a​nd Artificial Intelligence Laboratory (RLAI) leitet. Seit 2017 leitet e​r auch e​ine Zweigstelle v​on Google DeepMind i​n Alberta.

Er entwickelte d​en TD-Lambda-Algorithmus für Temporal Difference Learning, d​er zum Beispiel v​on Gerald Tesauro für s​ein Backgammon-Programm (TD-Gammon) benutzt wurde. Mit Barto schrieb e​r ein Standardwerk über Bestärkendes Lernen.

2001 w​urde er Fellow d​er AAAI. Ausweislich seiner persönlichen Website (2017) unterstützt e​r die Kampagne Boycott, Divestment a​nd Sanctions, BDS, g​egen Israel.

2021 w​urde Sutton i​n die Royal Society gewählt u​nd erhielt d​en IJCAI Award f​or Research Excellence.

Schriften (Auswahl)

  • mit A. Barto: Toward a modern theory of adaptive networks: Expectation and prediction, Psychological Review, Band 88, 1981, S. 135
  • mit A. Barto, C. W. Anderson: Neuronlike adaptive elements that can solve difficult learning control problems, IEEE transactions on systems, man, and cybernetics, 1983, S. 834–846
  • Learning to predict by the methods of temporal differences, in: Machine Learning, Band 3, 1988, S. 9–44
  • mit A. Barto: Time Derivative Models of Pavlovian Reinforcement, in: Learning and Computational Neuroscience: Foundations of Adaptive Networks, 1990, S. 497–537.
  • Herausgeber mit W. T. Miller, P. J. Werbos: Neural Networks for Control, MIT Press 1991
  • mit D. Precup, S. Singh: Between MDPs and semi-MDPs: A framework for temporal abstraction in reinforcement learning, Artificial intelligence, Band 112, 1999, S. 181–211
  • mit A. Barto: Reinforcement Learning. An Introduction, MIT Press 1998

Einzelnachweise

  1. Richard S. Sutton im Mathematics Genealogy Project (englisch) Vorlage:MathGenealogyProject/Wartung/id verwendet
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. The authors of the article are listed here. Additional terms may apply for the media files, click on images to show image meta data.