Cantorsche Paarungsfunktion
Die Cantorsche Paarungsfunktion (manchmal auch Nummerierungsfunktion) ist eine unter anderem in der theoretischen Informatik verwendete Abbildung, die auf dem Diagonalargument von Cantor basiert.
Mit ihr kann man ein beliebiges Paar natürlicher Zahlen durch eine einzige natürliche Zahl darstellen. Man nummeriert damit alle Zahlenpaare. Diese Nummerierung ist sogar eindeutig umkehrbar. Das heißt, man kann aus der Zahl das ursprüngliche Zahlenpaar wieder ermitteln. Mathematisch gesprochen heißt das: Die Cantorsche Paarungsfunktion ist eine bijektive totale Funktion .
Die Idee der diagonalen Abzählung der Menge aller Paare natürlicher Zahlen geht auf Georg Cantor zurück. Die Verallgemeinerung der Cantorschen Paarungsfunktion von Paaren auf Tupel wird als Cantorsche Tupelfunktion bezeichnet.
Motivation
In der theoretischen Informatik wird die Cantorsche Paarungsfunktion bzw. Tupelfunktion benutzt, um Funktionen, die mehr als einen Parameter haben, auf Funktionen zurückzuführen, die nur genau einen Parameter haben, was viele Beweise deutlich erleichtert.
Die Zurückführung eines Problems auf ein (eventuell einfacheres) bereits bekanntes Problem ist eine bewährte Beweistechnik, die man als Reduktion bezeichnet.
Mit der Cantorschen Paarungsfunktion bzw. Tupelfunktion lässt sich die Berechenbarkeit von -stelligen Zahlenfunktionen auf die Berechenbarkeit von einstelligen Zahlenfunktionen reduzieren. Das heißt, man kann sich bei der Untersuchung der Berechenbarkeit von Zahlenfunktionen auf die Untersuchung von Einstelligen beschränken und weiß, dass die gewonnenen Ergebnisse für alle (also auch für die mehrstelligen) Zahlenfunktionen gelten.
Grundsätzliches
Es ist vielleicht nicht unmittelbar einsichtig, dass es möglich ist, alle beliebigen Kombinationen von zwei Zahlen durch eine Zahl zu kodieren: Die Menge aller Zahlenpaare scheint viel größer zu sein als die Menge aller Zahlen .
^ | . . . . . . . . . . . . . x x x x x x x x x x x x . x x x x x x x x x x x x . x x x x x x x x x x x x . ~ x-x-x-x-x-x-x-x-x-x-x-x-. --> = x-x-x-x-x-x-x-x-x-x-x-x-. -->
als zweidimensionales Gitter als Menge von Punkten auf dem Zahlenstrahl
Die Cantorsche Paarungsfunktion zeigt jedoch, dass beide Mengen gleich groß sind, denn sie stellt eine 1:1-Beziehung her. Sie ist eine Bijektion.
Eine Menge, die man bijektiv auf die natürlichen Zahlen abbilden kann, nennt man abzählbar unendlich; insbesondere haben die natürlichen Zahlen selbst diese Eigenschaft. Die Cantorsche Paarungsfunktion zeigt dann, dass auch die Menge der Paare natürlicher Zahlen abzählbar unendlich ist.
Definition
Die Cantorsche Paarungsfunktion definiert man als
- ,
wobei man die natürlichen Zahlen bei 0 beginnen lässt.
Kurzschreibweise:
kodiert das Paar
Hier ist eine Skizze der Diagonal-Abzählung:
Auf den Achsen sind die beiden Werte aufgetragen, wie in einer Entfernungstabelle schlägt man den Wert der Cantorschen Paarungsfunktion im Schnittpunkt nach, zum Beispiel .
Die Nummerierung ist denkbar einfach: Man zählt diagonal mit Null beginnend die Paare ab: (0,0), (1,0), (0,1), (2,0), (1,1), (0,2) usw.
Man kann das obige Bildungsgesetz direkt ablesen, wenn man sich die Summation jeweils über eine Spalte verdeutlicht.
Erweiterung auf k-Tupel
Durch mehrfache Anwendung lassen sich auch -Tupel eindeutig nummerieren. Man definiert induktiv für die Funktionen
mit Hilfe der Paarungsfunktion durch:
und
Die Funktionen bezeichnet man als Cantorsche Tupelfunktionen.
Kurzschreibweise:
Umkehrfunktion
Die Cantorsche Paarungsfunktion besitzt als Umkehrfunktion die Dreieckswurzel. Die Umkehrung ist eindeutig und berechenbar. Letzteres ist für die Anwendung in der theoretischen Informatik wichtig, da die Berechenbarkeit der Funktion und der Umkehrfunktion Bedingung ist, um ohne Probleme alle berechenbaren Funktionen durch einstellige Funktionen darzustellen.
Umkehrbar heißt, man kann aus einer Zahl auf die beiden Zahlen und schließen, für die gilt. Die Umkehrfunktion setzt sich aus zwei Hilfsfunktionen und zusammen:
Formale Definition
Man schreibt ihre Inverse komponentenweise als , wobei gilt:
vermöge der Projektion
- ,
welche die -te Komponente aus einem Tupel der Länge auswählt.
Bei Paaren (der Fall ) schreibt man kurz und , sodass man die Inverse der Paarungsfunktion als schreiben kann.
Mit den Hilfsfunktionen (Dreieckszahl)
und
oder (abgerundete Dreieckswurzel)
kann man und wie folgt für berechnen:
Beispiel
Welches Zahlenpaar repräsentiert die Zahl 17?
Dazu bestimmt man zunächst die größte natürliche Zahl , für die gilt. Das lässt sich entweder durch Ausprobieren ermitteln (dabei hilft die Wertetabelle von ):
j
0 1 2 3 4 5 6
f(j) 0 1 3 6 10 15 21oder über die abgerundete Formel der Dreieckswurzel:
Nun kann man einsetzen:
Also gilt Das lässt sich einfach anhand der Skizze oben verifizieren.
Computerimplementierungen
Implementierung der Berechnungen in Java
Bei großen Werten von steigt der Zeitbedarf durch die WHILE-Schleife enorm, daher wurde darauf verzichtet, Schleifen zu verwenden, und stattdessen die Variante mit der Dreieckswurzel implementiert:
public class Cantor {
public static long compute(long x, long y) {
return (x+y)*(x+y+1)/2 + y;
}
public static long computeX(long z) {
long j = (long) Math.floor(Math.sqrt(0.25 + 2*z) - 0.5);
return j - (z - j*(j+1)/2);
}
public static long computeY(long z) {
long j = (long) Math.floor(Math.sqrt(0.25 + 2*z) - 0.5);
return z - j*(j+1)/2;
}
}
Die Methode compute berechnet die dem übergebenen Zahlenpaar (x y) zugeordnete Zahl, computeX und computeY sind die Umkehrfunktionen von compute.
Pascal-Programm zur Berechnung der Umkehrung
Das folgende Pascal-Programm berechnet die Umkehrfunktion :
procedure CantorPair(I : Integer; Var X,Y : Integer);
{ Gibt das i-te Paar (X,Y) in Diagonalabzaehlung zurueck }
var
J : Integer;
function F(Z : Integer) : Integer;
begin
F := (Z * (Z + 1)) div 2
end;
function Q(Z : Integer) : Integer;
var
V : Integer;
begin
V := 0;
while F(V) <= Z do
V := V + 1;
Q := V - 1
end;
begin
J := Q(I);
Y := I - F(J);
X := J - Y;
end;
Hinweis: Wird das Pascal-Programm auf realen Rechnern übersetzt, muss es mit den Einschränkungen realer Rechner leben. Das heißt, dass bei großen Werten von Integer-Überläufe das Ergebnis verfälschen. Für die Anschauung ist ein Pascal-Programm jedoch verständlicher als eine Registermaschine.
Berechenbarkeit
Die Cantorsche Paarungsfunktion ist eine totale, bijektive, berechenbare (sogar primitiv-rekursive) Funktion, daher ist auch ihre Umkehrung berechenbar.
Beweis der Berechenbarkeit der Cantorschen Paarungsfunktion
Eine Methode zu beweisen, dass eine Funktion berechenbar ist, ist, eine Registermaschine anzugeben, welche die Funktion berechnet.
Dieser Maschine muss man im Register den Funktionsparameter und im Register übergeben. Man erhält dann im Ausgaberegister den Wert von an der Stelle .
Die folgende zweistellige Maschine berechnet die Cantorsche Paarungsfunktion :
R4 = R1 + R2 R5 = R4 + 1 R4 = R4 * R5 R4 = R4 / 2 R0 = R4 + R2
Auf einen formalen Beweis, dass die Registermaschine tatsächlich die Funktion berechnet, wird verzichtet: Das ist offensichtlich erkennbar, wenn man die Funktionsvorschrift zur Berechnung der Cantorschen Paarungsfunktion mit der Maschine vergleicht.
Diese Registermaschine nutzt jedoch Befehle, die die einfache Registermaschine nicht kennt. Die einfache Registermaschine kennt nur die Operationen , und den einfachen Test.
Durch Verfeinerung lässt sich diese Registermaschine aber auf eine einfache Registermaschine zurückführen.
Damit gibt es eine Registermaschine, die die Cantorsche Paarungsfunktion berechnet. Somit ist die Cantorsche Paarungsfunktion berechenbar.
Beweis der Berechenbarkeit der Umkehrfunktion
Für den Beweis der Umkehrfunktion bietet es sich an, eine andere Definition der Berechenbarkeit zu nutzen:
Eine Funktion ist genau dann berechenbar, wenn ein WHILE-Programm existiert, das diese Funktion berechnet.
Das oben angegebene Pascal-Programm lässt sich zu einem WHILE-Programm verfeinern. Also gibt es ein WHILE-Programm, das die Umkehrfunktion berechnet. Somit ist auch die Umkehrung berechenbar.
Anwendung der Berechenbarkeit
Aus der Berechenbarkeit der Cantorsche Paarungsfunktion und ihrer Umkehrung folgt, dass es für die Theorie der Berechenbarkeit ausreichend ist, sich mit einstelligen Funktionen von zu befassen. Für Funktionen von folgt die Berechenbarkeit dann durch die Anwendung der Cantorschen Paarungsfunktion und ihrer Umkehrfunktion:
- ist berechenbar
genau dann, wenn es eine berechenbare Funktion gibt mit
Man kann zum Beispiel zeigen, dass sich alle rationalen Zahlen durch ein geordnetes Tripel natürlicher Zahlen darstellen lassen. Damit kann man die Berechenbarkeit leicht von den natürlichen Zahlen auf die Menge der rationalen Zahlen erweitern.
Herkunft
Die Idee stammt aus der Mengenlehre von Georg Cantor. Er hatte die Idee, die Größe einer Menge (Mächtigkeit, Kardinalität) mit der Größe einer anderen Menge zu vergleichen, indem man versucht, eine 1:1-Abbildung (Bijektion) dieser Menge mit der anderen Menge zu finden. Jedem Element der ersten Menge soll genau ein Element der zweiten Menge zugeordnet werden und umgekehrt. Das erscheint kompliziert, findet aber seine Berechtigung, wenn es um Mengen mit unendlich vielen Elementen geht. Siehe auch Galileis Paradoxon.
Mit einer Diagonal-Abzählung (wie oben angedeutet) zeigt man leicht, dass bei einer abzählbaren Menge das kartesische Produkt gleichmächtig ist zu , was vielleicht gegen die Intuition spricht, da hier Tupel verschiedener Dimension auftreten.
Alternativen
Für zwei benachbarte Punkte und auf der Trajektorie der Umkehrfunktion kann beliebig groß werden, was bei der Anwendung der Abzählung unerwünscht sein kann. Daher betrachtet man auch eine Variante der Cantorschen Abzählung, bei der stets gilt und die in diesem Sinn stetig ist. Diese Form wird die boustrophedonische Cantor-Abzählung genannt, da hier der Pfad nicht von der -Achse zur -Achse springt (wie in der Skizze oben dargestellt), sondern an den Achsen wendet. Sie ist auf OEIS als A319571 beschrieben.
Es gibt viele andere Möglichkeiten, Paare natürlicher Zahlen bijektiv durch eine natürliche Zahl zu kodieren, z. B. kann man mit der Formel spiralförmig abzählen:[1]
r\c | 0 | 1 | 2 | 3 | 4 |
---|---|---|---|---|---|
0 | 0 | 1 | 8 | 9 | . |
1 | 3 | 2 | 7 | 10 | . |
2 | 4 | 5 | 6 | 11 | . |
3 | 15 | 14 | 13 | 12 | . |
4 | . | . | . | . | . |
Auch die einfache Formel liefert eine Bijektion zwischen und :
| 0 1 2 3 4 y
--+----------------------->
0 | 1 3 5 7 .
1 | 2 6 10 14 .
2 | 4 12 20 28 .
3 | 8 24 40 56 .
4 | . . . . .
|
x v
Beweis der Umkehrbarkeit: ist die größte natürliche Zahl so, dass ein Teiler von ist, also die Anzahl der Faktoren in der Primfaktorzerlegung von . Sei . Dann ist .
Die Primfaktorzerlegung gibt eine Möglichkeit an, beliebige endliche Tupel natürlicher Zahlen durch natürliche Zahlen zu kodieren:
Beispiel:
Literatur
- Klaus Weihrauch: Computability. Springer, Berlin u. a. 1987, ISBN 3-540-13721-1 (EATCS monographs on theoretical computer science 9).
- Eric W. Weisstein: Pairing Function. In: MathWorld (englisch).
- Katrin Erk, Lutz Priese: Theoretische Informatik. Eine umfassende Einführung. 2. erweiterte Auflage. Springer, Berlin u. a. 2002, ISBN 3-540-42624-8, S. 263 f. (Springer-Lehrbuch).
- Uwe Schöning: Theoretische Informatik – kurzgefasst. 4. Auflage. Korrigierter Nachdruck. Spektrum, Heidelberg u. a. 2003, ISBN 3-8274-1099-1, S. 111 f. (Hochschultaschenbuch).
Einzelnachweise
- Christoph Michel: Enumerating a Grid in Spiral Order. In: cmichel.io Blog. 7. September 2016, abgerufen am 7. September 2016 (englisch).