Zufallsmatrix
In der Wahrscheinlichkeitstheorie und Statistik ist eine Zufallsmatrix eine matrixwertige Zufallsvariable (englisch Random Matrix). Die Verteilung einer Zufallsmatrix wird zur Abgrenzung von den multivariaten Verteilungen eine matrixvariate Wahrscheinlichkeitsverteilung genannt.
Zufallsmatrizen spielen eine wichtige Rolle in der theoretischen sowie mathematischen Physik, insbesondere in der statistischen Mechanik.
Des Weiteren sind sie in der multivariaten Statistik von Interesse, insbesondere im Zusammenhang mit hoch-dimensionalen Daten und spektralstatistischen Verfahren wie der Hauptkomponentenanalyse (PCA).
Haarsches Maß und Weylsche Integralformel
Auf jeder Lie-Gruppe existiert ein eindeutiges, links-invariantes Maß , d. h. für jedes und jede Borel-messbare Menge gilt . Dieses Maß nennt man linkes Haarsches Maß und es ist eindeutig bis auf Multiplikation mit einer Konstanten.
Betrachtet man nun eine kompakte Lie-Gruppe , so existiert ein eindeutiges, linkes Haarsches Maß , welches zu gleich auch rechts-invariant und normalisiert ist, genannt das Haarsche Wahrscheinlichkeitsmaß auf . Das heisst für jedes und jede Borel-messbare Menge gilt .
Für kompakte Lie-Gruppen lässt sich mit Hilfe der Integralformel von Weyl eine Formel für die Wahrscheinlichkeitsdichte bezüglich der Eigenwerte finden. Als Beispiel sei die unitäre Gruppe, die Eigenwerte sind von der Form mit . Weiter sei eine Klassenfunktion und der maximale Torus aller Diagonalmatrizen von , bezeichnet die adjungierte Darstellung und bezeichne das Wurzelsystem, dann gilt:[1]
- ,
und somit kriegt man mit Hilfe von Weyl's Integralformel ein Integral über den maximalen Torus
- .
Definition
Eine formale mathematische Definition lautet:[2]
- Sei der Raum der -Matrizen über dem Körper mit σ-Algebra und ein Wahrscheinlichkeitsraum. Eine -messbare Funktion heißt Zufallsmatrix.
Eine Zufallsmatrix ist somit das matrixwertige Analogon zu einer Zufallsvariable.
Partitionsfunktion
Sei ein Matrix-Raum (z. B. der hermiteschen -Matrizen ) und sei ein komplexes Maß auf diesem Raum, welches in der Regel nicht normalisiert ist. Dann nennt man das Integral
Partitionsfunktion und man erhält einen Erwartungswert zur Funktion
Wignersche Matrix
Seien und i.i.d Zufallsvariablen mit gleichem Erwartungswert sowie und . Man nennt eine Zufallsmatrix eine (komplexe) Wignersche-Matrix wenn sie hermitesch ist und folgendes gilt .
Die Matrix wird oft mit skaliert. Manche Autoren definieren sie aber auch ohne Skalierung.
Sie ist ein wichtiger Typ von Zufallsmatrizen und benannt nach Eugen Wigner.
Das GUE erhält man wenn zusätzlich gilt und die Einträge normalverteilt sind. Das GOE erhält man wenn alle Einträge reell und normalverteilt sind und zusätzlich gilt.
Invariante Ensembles
Zentrale Studienobjekte sind die invarianten Ensembles, welche durch die folgenden Maße auf dem entsprechenden Raum der Matrizen induziert werden:
wobei der Dyson-Index ist und das Potential. Man erhält für
- das orthogonale Ensemble (OE) auf dem Raum der reellen symmetrischen Matrizen.
- das unitäre Ensemble (UE) auf dem Raum der hermiteschen Matrizen
- das symplektische Ensemble (SE) auf dem Raum der hermiteschen quaternionen Matrizen.
Gaußsche Ensembles
Wichtige Spezialfälle der invariante Ensembles sind die Gaußschen Ensembles, welche durch das Potential und die folgenden Gaußschen Maße erzeugt werden
Man erhält für
- das Gaußsches Orthogonales Ensemble (GOE) auf dem Raum der reellen symmetrischen Matrizen.
- das Gaußsches Unitäres Ensemble (GUE) auf dem Raum der hermiteschen Matrizen.
- das Gaußsches Symplektisches Ensemble (GSE) auf dem Raum der hermiteschen quaternionen Matrizen.
Die Bezeichnung orthogonal/unitär/symplektisch bezeichnet, unter welcher Matrix Konjugation die Verteilung invariant ist.
Beispielsweise gilt für eine Matrix aus dem GOE und einer Matrix aus der orthogonalen Gruppe , dass .
Das kanonische (unnormalisierte) Haarsche Maß auf der entsprechenden kompakten Lie-Gruppe oder lässt folgende Darstellung zu
wobei das Lebesgue-Maß der Eigenwerte ist. Für skalierte Einträge des Gaußschen Ensembles erhält man eine geschlossene Form des Wahrscheinlichkeitsmaßes über der Weyl-Kammer mit
Das Wahrscheinlichkeitsmaß enthält den Boltzman-Faktor wobei die totale potentielle Energie bezeichnet
Die Konstante lässt sich mit Hilfe des Selberg-Integrals berechnen.
In der Quantenmechanik werden sie verwendet um Hamiltonoperatoren zu modellieren.
-Ensembles und Dysons "Threefolded Way"
Man spricht von Dysons -ensemble, da Freeman Dyson in seiner wissenschaftlichen Schrift The Threefolded Way[3] diese Klassifizierungen der Zufallsmatrizen herleitete, basierend auf physikalisch möglichen Zeitumkehr-Eigenschaften der Quantenmechanik (orthogonal, unitär, symplektisch). Der Fall ist aufgrund des Satzes von Frobenius nicht möglich. Neben den Gaußschen Ensembles spielen auch die -Wishart-Laguerre-Ensembles und die -Jacobi-Manova-Ensembles eine zentrale Rolle in der Theorie der Zufallsmatrizen.
Es ist üblich nur von Laguerre-Ensembles bzw. Jacobi-Ensembles zu sprechen, statt von Wishart- bzw. Manova-Ensembles
Allgemeine spielen in der klassischen Theorie der Zufallsmatrizen eine untergeordnete Rolle.
Theorie der Zufallsmatrizen
Die Theorie der Zufallsmatrizen befasst sich weniger mit einer konkreten Zufallsmatrix, sondern mit dem Matrizenraum dahinter. Konkret geht es um Wahrscheinlichkeitsmaße auf Matrixräumen und Lie-Gruppen, dies erklärt den Begriff Ensembles. Ein klassisches Problem der Theorie der Zufallsmatrizen ist das Finden einer multivariaten Wahrscheinlichkeitsdichte für die Eigenwerte unterschiedlicher Matrix-Ensembles. Eine der frühsten Arbeiten stammt von Dyson, welcher eine geschlossene Form für eine große Menge von Matrizen fand, abhängig von der zugrundeliegenden Symmetrie der Matrizen und Wahrscheinlichkeitsverteilung.
Die Spektraleigenschaften von großen Zufallsmatrizen haben universelle Eigenschaften und man kann beim Studium komplizierter deterministischer Operatoren, wie zum Beispiel dem Dirac-Operator aus der Physik, diese Operatoren mit Zufallsmatrizen ersetzen und die Theorie der Zufallsmatrizen anwenden.
Beim Studium von Integralen über Matrix-Räume verwendet man zum Teil Resultate aus der Theorie der Lie-Gruppen und Lie-Algebren. Auch die freie Wahrscheinlichkeitstheorie von Voiculescu ist von Relevanz für große Zufallsmatrizen.
Generell untersucht man Matrizen mit bestimmten Symmetrie-Eigenschaften (z. B. hermitesche) und hat bestimmte stochastische Anforderungen an die Wahrscheinlichkeitsverteilung auf den Raum jener Matrizen (z. B. obere Dreiecksmatrix unabhängig). Des Weiteren interessiert man sich vor allem für die Spektraltheorie und dessen asymptotisches Verhalten, wenn die Dimension . Die Spektraltheorie ist engverbunden mit der Theorie der Punktprozesse, da die Eigenwerte einen (zufälligen) Punktprozess formen. Bei vielen Ensembles taucht in der gleichen Region derselbe Punktprozess in unendlicher Dimension auf (Universalität). Matrix-wertige Funktionen wie die Determinante oder die Spur können nicht einfach auf unendlich-dimensionale Matrizen übertragen werden. Für bestimmte Operatoren lässt sich aber mit der abstrakten Fredholmtheorie eine Erweiterung auf unendlich-dimensionale separable Hilberträume über die äußere Algebra finden. Es lassen sich Determinanten für Operatoren aus den Schatten-von Neumann-Klassen definieren.
Definiert man die Einträge der Matrix als Brownsche Bewegungen, so lässt sich auch das matrixwertige Analogon eines stochastischen Prozess bilden und die Theorie der stochastischen Analysis und die Martingal-Theorie ist anwendbar, siehe Dysons brownsche Bewegung und Wishart-Prozess.
Spektraltheorie der Zufallsmatrizen
Sind die Einträge einer hermiteschen Zufallsmatrix von der Größe , so konvergiert das empirische Spektralmaß , wobei das Dirac-Delta bezeichnet.
Da die zufälligen Ensembles Punktprozesse sind, kann man die -Punkt Korrelationsfunktion für die Eigenwerte herleiten. Sei eine Testfunktion und definiere das Funktional
Dann ist die -Punkt Korrelationsfunktion die Funktionalableitung
Mit dem Darstellungssatz von Fréchet-Riesz lässt sich Konvergenz im Erwartungswert für definieren
Globale Situation
Eines der wichtigsten Ergebnisse ist das sogenannte Wignersche Halbkreisgesetz (siehe Eugen Wigner): Es besagt, dass das (skalierte) empirische Spektralmaß einer Wignerischen Zufallsmatrix (in der Physik bekannt als die sogenannte Zustandsdichte) einer charakteristischen Halbkreis-Verteilung genügt.
Allgemeiner definiere den Maßraum
und betrachte das Funktional der Variationsrechnung
dann wird ein eindeutiges Equilibrium-Maß durch die Euler-Lagrange-Variationsbedingung für eine reelle Konstante
definiert, wobei der Träger des Maßes ist und ein Polynom.
Im Fall des GUE konvergiert das zufällige Maß schwach in Wahrscheinlichkeit gegen die deterministische Verteilung
Es gilt für eine Funktion und
Der Satz kann mit Mitteln der Kombinatorik und der Momentmethode bewiesen werden. Für eine Zufallsvariable gilt, dass wobei die Catalan-Zahlen sind.
Durch die Equilibrium-Maß Methode der statistischen Mechanik gibt es eine Verbindung zur Theorie der großen Abweichungen. Einen analytischen konstruktiven Beweis ergibt sich über die Stieltjes-Transformation.
Für Wishart- bzw. Laguerre-Matrizen konvergiert das empirische Spektralmaß gegen die Martschenko-Pastur-Verteilung und für MANOVA bzw. Jacobi-Matrizen gegen die Kesten-Mckey-Verteilung.
Für quadratische Zufallsmatrizen mit i.i.d. komplexen Einträgen mit und gilt das Kreisgesetz (Tao-Vu[4]) welches besagt, dass gegen
konvergiert.
Man spricht von Universalität, weil die Sätze unabhängig von der zugrundeliegenden Verteilung sind.
Lokale Situation
Limitverhalten
Lokal ergibt sich bei Skalierung ein Punktprozess für die Eigenwerte. Der Fall von hermiteschen Matrizen ist signifikant einfacher. Man kann mittels der Theorie der orthogonale Polynome eine determinantale Form für die Korrelationsfunktion finden, welche dann zu Fredholm-Determinanten von Integraloperatoren führen. Die Fälle und lassen sich mit Quaternionen-Determinanten und schief-orthogonalen Polynome lösen.[5]
Es gilt für die -Punkt Korrelationsfunktion
wobei die multivariate Dichte der Eigenwerte ist.
Für das GUE erhält man einen determinantal point process, ein einfacher Punktprozess mit Kern bezüglich eines Maßes , dessen existiert, so dass für alle gilt
- .
Skalierten man den Integralkern konvergiert dieser entweder zu dem Sinus- oder Airy-Kern. Die benötigten asymptotischen Entwicklungen können mittels der nicht-trivialen Methode des steilsten Anstiegs gezeigt werden (asymptotische Entwicklungen vom Plancherel-Rotach-Typ).
Die Wahrscheinlichkeit das eine kompakte Menge keine (unskalierte) Eigenwerte enthält lässt sich als Fredholm-Determinante formulieren (Gaudin-Mehta)
- .
Universalität im Hauptteil
2010 zeigten Erdős-Ramírez-Schlein-Tao-Vu-Yau für wignerische Matrizen mit subexponentialer Abnahme Universalität des Sinus-Kern.[6]
Rand
Betrachtet man den Rand des Spektrums, so erhält man einen Airy-Prozess und bekommt die Tracy-Widom-Verteilung mit Kern
wobei die Airy-Funktion bezeichnet.
Für das GSE und GOE erhält man eine Verallgemeinerung, ein sogenannter pfaffian point processes.
Im Falle des Laguerre-Ensembles ergibt sich bei dem hard edge (harten Rand) ein Bessel-Prozess und bei dem soft edge (weichen Rand) ein Airy/-Prozess.
Geschichte
Bereits 1928 untersuchte John Wishart als einer der ersten, die Zufallsmatrizen die bei einer standard multivariaten normalverteilten Stichprobe entstehen (die Kovarianzmatrix). Dies führte zu der Wishart-Verteilung, die matrixvariate Verallgemeinerung der χ2-Verteilung bzw. Gamma-Verteilung.
In den 1950er untersuchte Eugene Wigner die Verteilung zwischen benachbarten Energieniveau von schweren Atomkerne. Das Energieniveau wird durch die Eigenwerte des Hamiltonian der (zeitunabhängigen) Schrödingergleichung beschrieben
Für schwere Atomkerne ist dieses Problem zu komplex um es theoretisch zu lösen, deshalb kam Wigner auf die Idee, dieses Problem als "statistisches" zu lösen und stattdessen die Spektraldichte von großen endlichen Zufallsmatrizen zu untersuchen. Weiter zeigten empirische Daten, dass das Energieniveau korreliert war, da sonst eine Poisson-Verteilung zugrunde liegen sollte, was auch das Phänomen erklärte, dass sich die Energieniveaus gegenseitig abstiessen. Wigner entdeckte, dass die Verteilung von der Form
ist, wobei Konstanten sind, die von abhängen (und ist abhängig von der zugrundeliegenden Symmetrie). Er postulierte, dass die Abstände zwischen den Linien des Spektrums den Abständen der Eigenwerte einer Zufallsmatrix gleichen.
Die traditionelle Ausgangslage der Statistik hat eine (kleine) fixe Anzahl von Parametern und Observationen. Die Theorie der Zufallsmatrizen hat sich aus der Situation entwickelt, wenn sehr groß ist und man interessiert sich auch für die Fälle wenn .
Anwendungen
Statistik
- In der Multivariaten Statistik, insbesondere die Wishart-Verteilung ist zentraler Untersuchungsgegenstand.
- Bei der Analyse von hoch-dimensionalen Daten, bei der Auswahl von statistischen Modellen, der Hauptkomponentenanalyse (PCA). Untersuchungsgegenstand sind somit insbesondere Probleme der multivariaten Statistik bei großen Daten mit vielen Parametern.
- Im Maschinellen Lernen und Deep Learning gibt es auch Anwendungen.[7] Neue Forschungsergebnisse haben Equilibriumsmaße für einige künstliche neuronale Netze gezeigt, welche für die Beschleunigung von neuronalen Netzwerken genützt werden können.
Physik
- Im Fall eines ungeordneten physikalischen Systems (z. B. bei sog. amorphem Material) sind die betreffenden Matrix-Elemente Zufallsgrößen. Die Physik dieser Systeme kann im Wesentlichen durch die Kenngrößen der jeweiligen Matrizen erfasst werden, z. B. durch Mittelwert und Schwankung der jeweiligen Größe. Beispielsweise kann die Wärmeleitfähigkeit eines kristallinen Festkörpers direkt aus der sogenannten dynamischen Matrix der Teilchen-Teilchen-Wechselwirkung des Kristallgitters berechnet werden.
- Anwendungen u. a. bei magnetischen Systemen, z. B. bei Multilagensystemen magnetischer Dünnschicht-Systeme,[8] dem Quanten-Hall-Effekt,[9][10] sogenannter Quanten-Dots[11] und bei Supraleitern.[12]
- Anwendungen in der Kernphysik betreffen u. a. das oben erwähnte Gauß’sche orthogonale, das unitäre und das symplektische Ensemble: Energiespektrum und Wirkungsquerschnitt eines Atomkerns sind zwar extrem komplex, aber gerade deshalb der Theorie des sogenannten chaotischen Verhaltens zugänglich.
- sowie das sogenannte Quantenchaos und die mesoskopische Physik.[13]
- Ferner gibt es Anwendungen in der sogenannten Quantengravitation bei zweidimensionalen Systemen.[14]
Weitere Anwendungen
- In der Mathematik: die L-Funktionen von Dirichlet und andere. Ferner gibt es zahlreiche Anwendungen in der analytischen Zahlentheorie, in der Operatoralgebra,[15] und in der sogenannten freien Wahrscheinlichkeitstheorie.[16] Insbesondere liefert es durch Montgomerys Paar-Korrelation-Vermutung einen neuen Zugang zur Riemannschen Vermutung. Des Weiteren gibt es auch Anwendungen in der Graphentheorie und der Knotentheorie.
- In der Portfoliotheorie bei der Analyse der Kovarianzmatrix von Portfolio Renditen.[17]
- In der Signalverarbeitung und für drahtlose Netzwerke,[18]
- In der Genetik zur Klassifizierung von RNA Strukturen wie den Pseudoknoten.
- Aus aktuellen Untersuchungen ergibt sich als Vermutung, dass die Theorie der Zufallsmatrizen zu Verbesserungen bei Suchmaschinen im Web führen könnte.[19]
Literatur
- Greg Anderson, Alice Guionnet, Ofer Zeitouni: An Introduction to Random Matrices. Cambridge University Press, 2010.
- Alice Guionnet: Large Random Matrices: Lectures on Macroscopic Asymptotics. Springer Verlag, 2009.
- Persi Diaconis: Patterns in Eigenvalues: The 70th Josiah Willard Gibbs Lecture. In: American Mathematical Society. Bulletin. New Series, 2003, S. 155–178, doi:10.1090/S0273-0979-03-00975-3.
- Persi Diaconis: What Is … a Random Matrix? In: Notices of the American Mathematical Society, 2005, S. 1348–1349, ISSN 0002-9920.
- M. L. Mehta: Random matrices. 3. Auflage. In: Pure and Applied Mathematics, 142. Elsevier/Academic Press, Amsterdam 2004. xviii+688 S.
- Guhr, Müller-Groening, Weidenmüller: Random Matrix Theories in Quantum Physics: Common Concepts. In: Physics Reports, Band 299, 1998, S. 189–425, arxiv:cond-mat/9707301.
- Alan Edelman, N. Raj Rao: Random Matrix Theory. (PDF) In: Acta Numerica, Band 14, 2005, S. 233–297.
- Terence Tao: Topics in Random Matrix Theory. American Mathematical Society, 2012
Weblinks
- Random Matrix at MathWorld
- RMTool A MATLAB based Random Matrix Calculator
- Vorlesung von Terence Tao
- Kriecherbauer: Eine kurze und selektive Einführung in die Theorie der Zufallsmatrizen (PDF; 402 kB), Uni Bochum 2008.
Einzelnachweise und Anmerkungen
- Elizabeth Meckes: The Random Matrix Theory of the Classical Compact Groups. 1. Auflage. Cambridge University Press, 2019, ISBN 978-1-108-41952-9, doi:10.1017/9781108303453.
- Greg W. Anderson, Alice Guionnet, Ofer Zeitouni: An Introduction to Random Matrices. Cambridge University Press, 2009.
- Freeman Dyson: The Threefold Way. Algebraic Structure of Symmetry Groups and Ensembles in Quantum Mechanics. Abgerufen am 23. Mai 2021.
- 2010 gezeigt durch Terence Tao und Van H. Vu
- G. Mahoux und M.L. Mehta: A method of integration over matrix variables IV. In: EDP Sciences, (Hrsg.): Journal de Physique I. Nr. 1, 1991, S. 1093–1108.
- Laszlo Erdos, Jose Ramirez and Benjamin Schlein and Terence Tao and Van Vu and Horng-Tzer Yau: Bulk universality for Wigner hermitian matrices with subexponential decay. arxiv:0906.4400 [math].
- https://tel.archives-ouvertes.fr/tel-02397287/document
- VS Rychkov, S Borlenghi, H Jaffres, A Fert, X Waintal: Spin Torque and Waviness in Magnetic Multilayers: A Bridge Between Valet-Fert Theory and Quantum Approaches. In: Phys. Rev. Lett.. 103, Nr. 6, August 2009, S. 066602. doi:10.1103/PhysRevLett.103.066602. PMID 19792592.
- DJE Callaway: Random Matrices, Fractional Statistics, and the Quantum Hall Effect. In: Phys. Rev., B Condens. Matter. 43, Nr. 10, April 1991, S. 8641–8643. doi:10.1103/PhysRevB.43.8641. PMID 9996505.
- M Janssen, K Pracz: Correlated Random Band Matrices: Localization-delocalization Transitions. In: Phys Rev E Stat Phys Plasmas Fluids Relat Interdiscip Topics. 61, Nr. 6 Pt A, Juni 2000, S. 6278–86. doi:10.1103/PhysRevE.61.6278. PMID 11088301.
- DM Zumbühl, JB Miller, CM Marcus, K Campman, AC Gossard: Spin-orbit Coupling, Antilocalization, and Parallel Magnetic Fields in Quantum Dots. In: Phys. Rev. Lett.. 89, Nr. 27, Dezember 2002, S. 276803. doi:10.1103/PhysRevLett.89.276803. PMID 12513231.
- SR Bahcall: Random Matrix Model for Superconductors in a Magnetic Field. In: Phys. Rev. Lett.. 77, Nr. 26, Dezember 1996, S. 5276–5279. doi:10.1103/PhysRevLett.77.5276. PMID 10062760.
- D Sánchez, M Büttiker: Magnetic-field Asymmetry of Nonlinear Mesoscopic Transport. In: Phys. Rev. Lett.. 93, Nr. 10, September 2004, S. 106802. doi:10.1103/PhysRevLett.93.106802. PMID 15447435.
- F Franchini, VE Kravtsov: Horizon in Random Matrix Theory, the Hawking Radiation, and Flow of Cold Atoms. In: Phys. Rev. Lett.. 103, Nr. 16, Oktober 2009, S. 166401. doi:10.1103/PhysRevLett.103.166401. PMID 19905710.
- arxiv:math.OA/0412545
- arxiv:math.OA/0501238
- http://web.mit.edu/sea06/agenda/talks/Harding.pdf
- Antonia M. Tulino, Sergio Verdú: Random Matrix Theory and Wireless Communications. Now, 2004.
- newscientist.com