TIA: Primitive Rekursion/LOOP Berechenbarkeit (2. Update)
Wichtig: lasst euch von der mathematischen Definition nicht einschüchtern. Ich versuche in jedem Satz immer die Definition noch zu erklären. Ansonsten: wer grobe Schnitzer findet: bitte melden!
Zwei wichtige Themen aus der 2. Kurseinheit behandeln die primitive und die -Rekursion. Aus der Definition im Kurstext erschließt sich mir ihre (und von vielem anderen auch) Bedeutung jedoch nicht sofort. Aber vielleicht stehe ich auch einfach auf dem Schlauch bei diesen Themen. Beide Rekursionen dienen dazu das Repertoire der berechenbaren Funktionen zu vergrößern.
In Kurseinheit 1 gab es ja bereits eine Liste an berechenbaren Funktionen. All' diese konnten mit einer einfachen Registermaschine, welche nur die Grundoperationen (Arithmetische Differenz zu 1, Addition von 1 und Test auf 0) abgebildet werden. Das ist zwar alles schön und gut, aber reicht uns natürlich nicht. Also erweitern wir das Feld der berechenbaren Funktionen mit der Rekursion, denn der Definition nach sind alle primitiv- und -rekursiven Funktionen berechenbar.
Grundoperationen, Komposition, Rekursion
Was ist also die primitive Rekursion? Die primitiv rekursiven Funktionen entstehen aus den Grundoperationen (die stelle ich gleich vor) und werden mittels Komposition (Hintereinanderausführung) und/oder der primitiven Rekursion gebildet. Als Grundoperationen haben wir:
Die konstante Funktion: mit und .
Oder manchmal auch die Nullfunktion mit
Erklärung: bedeutet nichts weiter als dass der Definitionsbereich (und damit die Argumente der Funktion) der Bereich der natürlichen Zahlen (eben ) ist. bedeutet Stelligkeit (also die Anzahl der Argumente der Funktion, die Argumente selbst sind mit angegeben). Das Ergebnis der Funktion ist jedoch nur einstellig. Z.B. wäre mit so eine Funktion (nicht für eine konstante Funktion), die drei Argumente entgegen nimmt, aber nur einen Funktionswert (sogenannter Wertebereich) ausgibt.
Die konstante Funktion macht noch viel weniger. Egal wieviel Argumente Du ihr gibst, sie gibt immer nur einen Wert zurück. Die Konstante c, welche auch aus dem Bereich kommt. Also z.B. mit . Egal, was die Funktion an Argumenten bekommt, es kommt immer 5 heraus.
Die konstante Nullfunktion, welche häufig in den Definitionen für die primitive Rekursion verwendet wird ist auch nur eine konstante Funktion. Nur ist hier immer einfach nur 0. Mehr nicht. Also nicht verwirren lassen.
Die Projektion auf ein Argument: mit
Hier ist die Erklärung offensichtlich. Also überspringen wir sie mal. Nein, Scherz. Das muss ich oft genug im Skript lesen und denke mir nur: "Bitte?!". Manche Dinge sind derart einfach, dass man nicht glaubt sie verstanden zu haben weil man von den ganzen griechischen Buchstaben erschlagen wurde.
Diese Funktion tut nur eines: sie gibt das Argument aus ihrer -stelligen Argumentliste zurück. Das wars. Wirklich. Aber eine Kleinigkeit ist noch hilfreich: Es gibt die einstellige Projektion mit . Diese nennt man die Identitätsfunktion . Konkretes Beispiel für beide? Bitte sehr. Projektion: . Identitätsfunktion: .
Die Nachfolgefunktion: mit
Geht kaum einfacher. Was macht die Funktion? Sie gibt zu dem ihr gegebenen Argument einfach nur den Nachfolger zurück. Beispiel: . Das war's.
Was haben die Basis-Funktionen nun mit primitiver Rekursion zu tun? Alle Funktionen, die aus diesen Basisoperationen mittels Komposition (oder Substitution) und Rekursion gebildet werden können, werden rekursive Funktionen genannt und sind berechenbar. Diese liegen in , dem Bereich der total-rekursiven Funktionen, denn sie decken den vollständigen Definitionsbereich ab (jedem Wert aus dem Definitionsbereich wird ein Funktionswert zugeordnet, kein Argument bleibt ohne Funktionswert). Zu den partiell-rekursiven Funktionen kommen wir noch.
Beispiel: Wollen wir mal einen Versuch wagen und eine Komposition der Grundoperationen aufstellen und ausrechnen?
Konstante Funktion: mit .
Projektion mit
Nachfolgefunktion: mit
Wir bilden nun aus diesen drei Funktionen eine Komposition: . D.h. eine Hintereinanderausführung der Funktionen. Es gilt (bitte beim Wikipedia-Link nachschauen) bei der Komposition: . Für unsere Funktionen bedeutet es also: . Wir setzen unsere Variablen willkürlich: , und . Damit haben wir dann auch gleich etwas, womit wir rechnen können: . Wir beginnen also von Innen nach Außen:
(unsere Nachfolgefunktion)
(unsere konstante Funktion)
(unsere Projektion)
Damit ist .
Nun ist jede Funktion, die wir mit den drei Basisoperationen von oben mittels Komposition (Substitution) und Rekursion abbilden können ebenfalls primitiv-rekursiv und damit berechenbar.
Rekursionsschema
Bitte nicht drüber hinwegweg lesen. Diese Ausführung wird bei jeder Definition der primitiven Rekursion verwendet (manchmal in umgekehrter Reihenfolge, aber der Sinn und Zweck sind gleich). Erst wenn man die Funktion in das Rekursionsschema hat überführen können, ist sie wirklich primitiv rekursiv. Wir werden also mit folgenden Dingen gequält:
1. Komposition/Einsetzung/Substitution formal: haben wir hier z.B. eine Funktion (k-stellig mit ) und mehrere Funktionen (alle n-stellig mit ) und sind diese primitiv-rekursiv, so ist auch primitiv-rekursiv.
Das bedeutet: nichts weiter als eine Einsetzung. Zunächst haben wir in der Funktion genau Parameter (Stelligkeit, siehe oben) aus dem Bereich der natürlichen Zahlen . Und dann noch Funktionen (es können auch mehr sein, aber wir brauchen nur ), die selbst Parameter verwenden, welche oben mit beschrieben sind. Nun möchten wir die (nicht beschriebenen) Parameter der Funktion einfach durch ausgerechnete Funktionswerte der Funktionen ersetzen. Das ist alles, was die Substitution macht.
Beispiel:
Funktion: mit
Funktion: mit
Wir führen nun die Substitution der Parameter von mit den Funktionswerten von durch: . Wir setzen willkürlich und haben somit: . Ausrechnen von Innen nach Außen: . That's it!
2. Rekursionsschema formal: dieser Teil wird dazu verwendet um zu garantieren, dass auch die neue Funktion, welche durch primitive Rekursion gebildet wurde bzgl. primitiver Rekursion abgeschlossen und ist nicht aus dem Rahmen fällt. Es besagt, dass eine Funktion nach dem Schema der primitiven Rekursion aufgebaut ist, wen sie folgende Form besitzt:
Was bedeutet das nun für uns? Wir haben hier zwei Fallunterscheidungen: einmal wenn ein Parameter = 0 (m=0) ist, so bedarf es keiner Rekursion und wird durch eine Funktion abgehandelt. Ist jedoch , müssen wir einen zweiten Fall betrachten. Hier erfolgt die Rekursion, welche die Funktion einfach nur mit dem nächst-kleineren Parameter aufruft. Am Ende wird und wir können unser für diesen Fall verwenden und schließen die Rekursion damit ab.
Häufig wird auch folgende Definition verwendet:
(R1)
Bedeutet nichts anderes, als unser von oben. Nur dass das etwas allgemeiner formuliert und die Parameterbeschränkung abgehoben wurde.
(R2)
Auch das ist nicht weit weg von unserer Fallunterscheidung. Unsere Funktion beginnt mit dem Parameter , das ist das was eig. unsere Schleifenvariable ist. Diese wird dann im nächsten Durchlauf dekrementiert und die Funktion ruft sich mit diesem dekrementierten Wert so lange selbst auf, bis ist und wir unser oben definiertes verwenden können. In manchen Definitionen wird einfach nur in verwendet und in steht dann .
Hier wäre ein Beispiel nicht schlecht, oder? Versuchen wir es doch mal mit der Addition und schauen ob sie aus der Klasse der primitiv-rekursiven Funktionen ist. Also los geht's:
Ist die Addidtion primitiv rekursiv?
Um zu beweisen, dass eine Funktion primitiv rekursiv ist muss man diese mit den obigen Grundoperationen definieren und in das Rekursionsschema pressen können. Und zwar für alle Fälle aus den natürlichen Zahlen. Hier sei die 0 vor allem zu beachten, denn die wird gerne mal vergessen. Im Endeffekt ist die Addition ja nur . Um zu zeigen, dass sie primitiv rekursiv ist müssen wir sie nun mit den oben definierten Grundoperationen abbilden und sie ins Rekursionsschema pressen. Probieren wir es einfach.
1. Fall: Addition von 0 + n. Bedeutet: . Das bilden wir ab mit der Projektion: mit . Aufgeschrieben bedeutet dies: . Damit wir unser aus dem Rekursionsschema von oben schon erschlagen:
Allgemein ausgedrückt (wir wollen uns ja an die Definitionen aus dem Skript halten) pressen wir das nun in unsere Definition von aus (R1):
Und somit
(R1)
Passt also in den ersten Teil des Schemas.
2. Fall: Addition von m + n: Bedeutet: . Das ist etwas schwieriger. Hier bedienen wir uns der primitiven Rekursion und der Nachfolgefunktion : (Achtung: die Funktion ist noch nicht in der geforderten Form für den 2. Fall um die Übersicht zu wahren). Noch nicht so ganz einleuchtend, oder? Vor allem nicht, wie wir drauf gekommen sind. Nehmen wir einen ganz einfachen Fall mit echten Zahlen.
Wollen wir z.B. 1 + 5 addieren, so fällt uns schnell ein, dass wir uns doch einfach einmal der Nachfolgefunktion bedienen können: (nun haben wir Innen den 1. Fall von oben, wo die 0 addiert wird und wir verwenden die dort für diesen Fall definierte Projektion, unser auf das zweite Argument) . Schnell sollte einleuchten, dass wir uns einfach beliebig oft der Nachfolgefunktion bedienen dürfen, abhängig davon was wir addieren. Wir können hier aber zunächst nur die 1 addieren. Um auch mehr als die 1 addieren zu können, müssen wir die Funktion so definieren, dass sie am Ende auf unser Innen zurückgeführt, welches dann mit ausgerechnet werden kann. Wie würde unser denn aussehen? So: . Lösen wir das auf: . Und ? Genau! .
Das ist aber noch nicht die Rekursion, denn eine Rekursion ist der Aufruf einer Funktion durch sich selbst. Und vor allem ist das ja auch noch nicht in der streng geforderten Form! Wir können ja nicht für jeden aus tausende von angeben. Also muss unser rekursiv durch sich selbst definiert werden (was ja am Ende sowieso auf ein einzelnes zurückführt). Probieren wir also das Beispiel mit den Zahlen von oben und arbeiten mit Rekursion statt nur mit tausenden von :
Damit entspricht das genau dem, was wir mit bereits rekursiv definiert haben. Für die einfache Fallunterscheidung nehmen wir dann , was ja das Selbe ist. Für die allgemeinere Definition aus (R2) ist unsere Definition jedoch goldrichtig.
Ab damit in die Fallunterscheidung und wir haben unser gefunden:
Wie versprochen werden wir auch hier allgemeiner und pressen das in unsere Definition der Rekursion für (R2):
(R2)
Und somit
(R2)
Und das passt auch in den zweiten Teil des Schemas.
Nehmen wir Papier und Stift und rechnen damit ein konkretes Beispiel durch:
Beispiel:
Mit unserer Definition der Addition von oben können wir das nun rekursiv auflösen:
Damit haben wir die Addition primitiv rekursiv definiert, die Addition ist also ein Teil der primitiv-rekursiven Funktionen und damit berechenbar. Sicher wollt ihr den ganzen Spaß auch mit der Multiplikation machen. Probiert es mal. Ihr werden sehen, dass es schnell unübersichtlich wird wenn ihr nur die 3 Grundoperationen von oben benutzt. Irgendwas stimmt hier aber noch nicht ganz, oder? Euch schwirrt bestimmt noch etwas aus der 1. Kurseinheit im Kopf rum, was wir gemacht haben. Genau! Erinnert ihr euch zufällig noch an die normalen und verallgemeinerten Registermaschinen aus der 1. Kurseinheit?
Alle Operationen, die wir mit normalen Registermaschinen abbilden und damit ihre Berechenbarkeit beweisen konnten, konnten wir fortan in unseren verallgemeinerten Registermaschinen ohne Beweis benutzen! Das Gleiche können wir hier auch tun. Wir können jetzt die Multiplikation primitiv-rekursiv definieren und hierfür die Addition verwenden, deren Berechenbarkeit wir soeben nachgewiesen haben. Weil wir dann damit nach dem Rekursionsschema die Multiplikation mittels der Addition definieren konnten, die Addition durch die 3 Grundoperationen definiert wurde folgt daraus, dass die Multiplikation auch berechenbar ist.
Gerne kann ich den Lösungsweg für die Multiplikation dann auch posten wenn gewünscht. Versucht es aber erstmal selbst.
Ackermann-Funktion
Aber auch die primitive Rekursion hat ihre Grenzen. Genau für diese wurde die Ackermann-Funktion erfunden. Man vermutete vor einiger Zeit, dass man mit der Klasse der primitiv Rekursiven Funktionen alle berechenbaren Funktionen erschlagen hätte. Das wurde jedoch von der Ackermann-Funktion, die eigens dafür entwickelt wurde, widerlegt. Das Repertoire an Grundoperationen war schlicht und ergreifend nicht mächtig genug um diese berechenbare, aber nicht primitiv rekursive Funktion abzubilden.
Erst mit der Einführung des -Operators und der sogenannten -Rekursion hat man diese Klasse so erweitern können, dass die Ackermann-Funktion da hinein fällt. Man geht in der Church'schen These davon aus, dass sich mit der -Rekursion nun alle berechenbaren Funktionen abbilden lassen, die (Turing-)berechenbar sind. Aber da kümmern wir uns dann im nächsten Beitrag im Rahmen der -Rekursion drum.
Loop Berechenbarkeit
Eine wichtige Eigenschaft der rekursiven Funktionen ist derer Zusammenhang mit der LOOP-Berechenbarkeit. Jedes LOOP-Programm lässt sich primitiv rekursiv darstellen und umgekehrt. Im Gegensatz zu GOTO (Registermaschinen) und WHILE (unsere -Rekursion) terminieren LOOP-Programme immer. Und ja, Ihr habt es euch vielleicht gedacht: die Ackermann-Funktion ist nicht primitiv rekursiv und damit auch nicht LOOP-berechenbar.
Aber hier steht schon zu viel Text. Vielleicht sind WHILE und LOOP-Berechenbarkeit ja einen eigenen Beitrag wert 🙂
Update
Gesagt, getan: der neue Beitrag behandelt die -Rekursion und die WHILE-berechenbarkeit. Auch wenn ich das bereits etwas vorweg nehme, ein wichtiger Merksatz um es auf den Punkt zu bringen:
Merksatz: jedes LOOP-Programm lässt sich durch primitive Rekursion ausdrücken un jede primitiv rekursive Funktion durch ein LOOP-Programm. Ebenso lässt sich ein LOOP-Programm durch ein WHILE-Programm ersetzen. Damit ist auch jede primitiv rekursive Funktion WHILE-Berechenbar. Jedoch gilt das nicht umgekehrt: WHILE-Schleifen lassen sich nicht durch LOOP-Schleifen ersetzen (es ist z.B. im Voraus nicht bekannt wie häufig die Schleife durchlaufen wird), siehe Ackermann-Funktion. Erst durch die können wir das WHILE-Konstrukt mathemathisch greifbar machen.
Oktober 22nd, 2012 21:23
Sehr schöne und verständliche Zusammenfassung des eigentlich einfachen Inhalts. Vielen dank für deine Beispiele. 🙂
Oktober 23rd, 2012 10:14
Kleine Anmerkung zur Additionsfunktion:
add(m,n) = suc(π(add(m−1,n),m,n)) ---> suc(π(add(m−1,n),m-1,n))
Oktober 23rd, 2012 11:51
Hallo Martin,
Danke. Ist gefixt. Ich versuche bis heute Abend auch noch was zur Mue-Rekursion zu schreiben. Das ist vielleicht etwas spannender. Vor allem der Bezug zu LOOP und WHILE, der im Skript viel zu kurz kommt wie ich finde, aber wesentlich zum Verständnis beiträgt. Für mich zumindest 🙂
Oktober 23rd, 2012 12:08
Vielleicht würde auch die Cantorsche Tupelfunktion mit Umkehrfunktion ganz gut zur Projektion passen :). π1,2(1,2,3) und π1,2() kommen ja zu unterschiedlichen Ergebnissen.
Oktober 23rd, 2012 12:09
π3,2 meinte ich natürlich
August 2nd, 2015 12:43
Vielen Dank für die sehr guten Erläuterungen, ich konnte dadurch schon einige Verständnislücken schließen.
Eine Anmerkung zum Beispiel mit der Addition:
Das add(5,3) vor dem Wort "Genau!" müsste nach meinem Verständnis add(3,5) lauten um zu der nachfolgenden Umformung zu passen.
Im nachfolgenden Absatz müssten ebenfalls die Parameter vertauscht werden um zu den vorherigen Definition zu passen.
Falls ich mich irre, bin ich über Feedback sehr dankbar.
November 12th, 2015 20:55
Hallo,
super Homepage. Hilft mir unglaublich viel. Vielleicht hab ich einen Fehler gefunden:
Wir bilden nun aus diesen drei Funktionen eine Komposition:
π21(x, y )∘(c(x,y)∘suc(x))
müsste eigentlich lauten...
Wir bilden nun aus diesen drei Funktionen eine Komposition:
π21(x, z )∘(c(x,y)∘suc(x))
, oder nicht?