TIA: smn-Theorem, Rekursions- und Äquivalenzsatz (Lernziele KE5, 3/3)
Update: Formulierungen etwas verständlicher gemacht. Wenn euch das smn-Theorem noch nicht ganz klar, war bitte den Beitrag nochmal lesen.
Update: aus zwei macht drei. Das ist nun hoffentlich der letzte Teil zu KE5 mit einem riesen Beispiel zum smn-Theorem.
Noch einmal die Wiederholung der zwei Anforderungen an vernünftige Programmiersprachen:
- (U) Es soll einen Computer geben, der zu jedem Programm und jedem möglichen Eingabewert das Resultat berechnet und nicht hält wenn nicht existiert.
- (S) Zu je zwei Programmen und möchte man ein Programm für die Komposition konstruieren können, d.h. es soll eine berechenbare Funktion geben, so dass .
Während wir (U) mit dem utm-Theorem gut behandeln konnten, schauen wir uns jetzt (S) an:
Lernziel 5
Erklärung und Anwendung des smn-Theorems
Kommen wir nun zum smn-Theorem, unserem Übersetzungslemma. Formal ausgedrückt:
, dann gibt es eine total-rekursive Funktion mit:
für alle .
Ehm, ja. Was macht das Ding nun?
Im wesentlichen geht es darum, dass sich berechenbare Funktionen kombinieren lassen. Durch die Hintereinanderausführung lassen sich neue Funktionen und somit auch neue Programme (und damit selbstverständlich auch neue Maschinen) mit eigenen Gödelnummern erschaffen.
Dazu werden die Funktionen einfach hintereinander ausgeführt und die Variable als Eingabe immer wieder von Maschine zu Maschine "mitgenommen". Da bei diesem Vorgang, abhängig von der konkreten Belegung der Variable eine neue Maschine erschaffen wird, gibt uns unsere Funktion diese neue Gödelnummer preis. In dieser Maschine ist die Variable konkret belegt und fixiert. Variable nimmt sie jedoch ganz normal an.
Dadurch ist es möglich aus Funktionen mit mehreren Argumenten Funktionen mit nur einem Argument zu erstellen, die jedoch das selbe berechnen (Currying genannt). Wir "fixieren" sozusagen Argumente und codieren sie in unsere neuen Maschinen ein. Am Beispiel unten wird es etwas deutlicher.
Zunächst: sind die berechenbaren, totalen, einstelligen Funktionen (sie sind überall in definiert). Die Funktionen in müssen nicht überall definiert sein. Im Skript ist das in menschlicher Sprache beschrieben:
"Jedes Programm der Programmiersprache für Zahlenfunktionen mit berechenbarer, universeller Funktion kann mit der Funktion in die Programmiersprache übersetzt werden"
Das trifft es eig. ganz gut. Das ist jedoch nicht direkt die Formalisierung unseres , der Zusammenhang kommt aber gleich noch.
In der Wikipedia steht zum smn-Theorem auch noch folgender Satz (den ich leicht modifiziert habe damit er besser zu uns passt):
"Die smn - Eigenschaft besagt, dass es zu einem Code , der mit den Parametern und ausgeführt wird (bzw. ausgeführt werden kann), ein Transformationsprogramm gibt, das aus , und ein Programm berechnet, welches bei der Eingabe von das gleiche berechnet, wie bei der Eingabe von und "
Ja, macht Sinn. Formal ausgedrückt:
(Hier sind und Argumente, und die Gödelnummer der Ursprungsmaschine, ist dann die Gödelnummer der Maschine mit dem festgesetzten ).
Auch ist es nicht das eig. smn-Theorem, welches sonst überall verwendet wird und die Stelligkeit nutzt, sondern eine abgewandelte Form davon (wie vieles andere im Skript auch), damit es für den Leser nicht zu einfach wird und er Zusatzliteratur heranziehen kann. Wo kämen wir denn hin?!
Als Beweis im Skript wird folgende Idee angebracht:
Zunächst machen wir uns klar, was wir suchen. Wir brauchen eine Maschine für unsere Funktion aus der Definition.
Wir wir oben sehen, bekommt (also im Endeffekt die Maschine ) zwei Parameter übergeben: und . Dabei geht hin und berechnet die Funktion (welche auch immer) mit ihren zwei Argumenten und . Was passiert, wenn wir im ersten Schritt nun in unserer neuen Maschine festsetzen?
Beispiel:
Um diese Funktion zu berechnen brauchen wir eine Maschine , die wir wie folgt definieren:
Die Eingabecodierung ist:
Konkretes Beispiel für : . Auf dem Eingabeband stehen also die Eingabeparameter und getrennt nebeneinander rechts vom Lesekopf.
Das dazugehörige Flussdiagramm wäre:
Ausgeschrieben sieht das Flussdiagramm also so aus, nennen wir es mal :
(Bitte nagelt mich nicht auf das Alphabet und den korrekten Aufbau der Befehle fest, mir geht es hier nur um das Verständnis)
Was tut es? Es geht Band von Anfang bis Ende durch: findet es eine , so schreibt es auch eine auf das Ausgabeband . Findet es ein erstes (unser Trennzeichen zwischen dem Parameter und ) auf dem Eingabeband , geht es auf dem Band nach rechts und schaut ob da der zweite Parameter steht. Bis zum nächsten , d.h. dem Ende des zweiten Parameters wird nun in jedem Schritt eine weitere auf das Ausgabeband geschrieben.
PS: Ihr erinnert euch an das utm-Theorem und unsere -Funktion? Wir können das ausgeschriebene Programm (bzw. seine Gödelnummer ) und seine Eingaben auf Bänder unserer universellen Turingmaschine schreiben und es einfach simulieren. Behaltet das mal im Hinterkopf.
Am Ende haben wir also die Ausgabe
Konkretes Beispiel:
Und jetzt kommen wir zum Problem, das wir lösen wollen: wie schaffen wir es eine Maschine anzugeben, die nur einen Parameter hat und dennoch das gleiche Resultat berechnet?
Wie können wir denn berechnen wenn wir gar kein als Eingabeparameter haben?!
Ganz einfach: wir schreiben den Parameter auf das Eingabeband, links neben und rechnen dann wie weiter. Nehmen wir wieder als konkrete Belegung und lassen unser variabel, was uns zu einer neuen Maschine mit dem Flussdiagramm führt:
Der grüne Teil ist der zusätzliche Part, ich nenne ihn mal (abhängig von ). Schreiben wir dieses komplette Flussdiagramm aus, so haben wir (Achtung, die Marken habe ich aus Faulheit nicht umbenannt. In Wirklichkeit müsste man sie umbenennen, so dass das neue Flussdiagramm auch mit Marke beginnt. Ich habe für die Marken vor Marke einfach Buchstaben genommen) als Bandprogramm:
Nachdem der grüne Teil des Flussdiagramms ausgeführt wurde haben wir auf dem Eingabeband folgende Belegung:
.
Und, oh Wunder, das sieht ja genauso aus wir unsere Eingabecodierung für . Und schwupp, können wir ganz normal wie die ursprüngliche Maschine (der weiße Teil im Flussdiagramm) weiterrechnen.
Wir Ihr euch leicht vorstellen könnt, können wir auch das für jedes beliebige machen, indem wir den grünen Part einfach abhängig von zu verlängern. Am Ende haben wir damit eine "Quasi-Eingangsbelegung" von:
Abhängig von haben wir somit immer eine neues Programm mit der Maschine inkl. - selbstverständlich - auch immer einer neuen Gödelnummer .
(Wiederholung: zur Funktion , welche uns zu einer Gödelnummer das Bandprogramm gibt, ist die Umkehrfunktion . Diese gibt uns zu einem Bandprogramm die zugehörige Gödelnummer ).
Wir haben mit unserem Verfahren also das innerhalb einer Maschine quasi "fixiert". Mit der neuen Gödelnummer können wir eine universelle Turingmaschine zu füttern und sie mit nur einem Parameter simulieren, so dass gilt:
für alle bzw.
Und das Problem? Tja... wir brauchen ein Verfahren, dass uns dieses Flussdiagramm und damit auch das Bandprogramm automatisch erzeugt und somit die Gödelnummer abhängig von einem berechnet. Dazu gehen wir wie folgt vor:
- Wir basteln uns eine Maschine , welche auf Band den Parameter hat
- schreibt das komplette, initiale Programm auf Band
- Nun schreibt den grünen Part, also das Teilprogramm (nennen wir es mal , abhängig vom auf Band
- Nun kopiert das initiale Programm von Band neben das Teilprogramm auf Band und benennt die Marken so um, dass die erste Marke des Teilprogramms zuerst ausgeführt wird und anschließend in die erste Marke vom initialen Programm mündet.
Also praktisch genau das, was wir mit gemacht haben, nur eben nicht so faul wie ich, sondern tatsächlich mit natürlichen Zahlen. Da das initiale Programm auch mit der Marke anfängt, müssen diese beim Kopiervorgang selbstverständlich auch umbenannt werden. - Am Ende steht auf Band also ein komplett neues Programm , dass wir interpretieren können.
- Der Vollständigkeit halber: da wir nicht den Code, sondern die Gödelnummer interpretieren, müssen wir noch in die Gödelnummer umwandeln:
Damit gilt und wir haben unser gefunden:
PS: und
Schon wieder diese Iotas! Wollen wir das an dem obigen Beispiel mal durchspielen? Klar doch.
Beispiel: für
Wir nutzen wieder unser inkl. Flussdiagramm von oben für die Berechnung der zweistelligen Funktion , sowie auch das ausgeschriebene Programm davon.
- Mit der Maschine und dem Programm der initialen, zweistelligen Maschine bekommen wir für die Gödelnummer von .
- wäre dann:
- Damit haben wir zu einem die Gödelnummer einer Maschine, die uns zu jedem die korrekte Funktion berechnet.
Konkretes Beispiel? Aber sicher!
Konkretes Beispiel: für
Die Gödelnummern halte ich willkürlich, da die konkrete Berechnung ja nicht unbedingt wichtig ist. Tun wir also einfach so, als wäre die von errechnete Gödelnummer von einfach
- startet also mit auf Band , schreibt das initiale Programm auf Band und das Teilprogramm (grün) auf Band . Die Bänder von sehen nun so aus (ich habe der Übersichtlichkeit halber (okay, ich gebe es zu, ich war wieder zu faul) nicht die ganzen Programme und auf die Bänder gepackt):
- Jetzt geht hin und kopiert das initiale Programm von Band links neben auf Band und benennt die Marken um (in unserem Beispiel sind die schon umbenannt - statt in Zahlen in Buchstaben, aber dennoch umbenannt -; normal würde das Teilprogramm auch mit statt starten usw.). Band sieht dann so aus:
Leider ist die Grafik etwas klein geraten, Sorry. Am Ende steht also unser komplettes Programm auf Band mit umbenannten Marken, bereit zur Ausführung. Naja, fast bereit. Denn das Programm selbst ist ja nicht ausführbar, sondern nur seine Gödelnummer.
- Und die bekommen wir, indem wir zum Programm nun seine Gödelnummer (nicht vergessen, ist die willkürliche Gödelnummer für , die wir uns ausgedacht haben) berechnen. Wir wissen ja, dass wir durch die Ordnungsfunktion auf dem Alphabet unserer Bandprogramme auch eine Standardnummerierung haben.
Die Funktion ist, wie wir im Beitrag zur Standardnummerierung gezeigt haben, berechenbar. Ich gebe hier also nicht extra ein Flussdiagramm einer Maschine an, dass uns zu den Zeichen des Programms auf Band anhand der Ordnungsfunktion die Gödelnummer berechnet. Wir könnten es aber problemlos.
Damit gilt letztendlich: . Nur noch die mit unseren Iotas () in Dezimaldarstellung umwandeln und wir sind fertig:
Füttern wir die Maschine mit der Gödelnummer nun mit unserem , so bekommen wir , was genau das gleiche ist wie , das Ergebnis unserer Ursprungsmaschine mit zwei Parametern.
Fertig.
Münzen wir das beispiel konkret auf das smn-Theorem, so bedeutet es:
für und bzw.
PS: nicht vergessen: ist dabei unser Ursprungsprogramm , dass für natürlich fest vorgegeben ist. Es ändert sich nicht, egal welches oder wir haben, daher können wir es für alle Eingaben fest vorgeben.
Und wenn Ihr nach oben, in die Definition vom smn-Theorem schaut, ist es genau die Definition, nur mit unseren Werten für und gefüllt.
Rekapitulieren wir: alles, was unser Programm bzw. die Maschine macht, ist uns ein festes Argument zusammen mit dem Quellcode des Urspungsprogramms in eine neue Maschine zu codieren und uns dazu die zugehörige Gödelnummer anzugeben. Mit unserer universellen Turingmaschine (utm-Theorem) können wir diese neue Maschine mit den verbliebenen, nicht fixierten Argumenten interpretieren. Nur der Zusammenhang zu ist euch wahrscheinlich noch nicht klar. Aber darum kümmern wir uns jetzt.
Die Eigenschaft (d.h. die effektive Komposition) gefordert wird. Wenn man also zwei Programme einer Sprache komponieren kann, ist das smn-Theorem erfüllt und umgekehrt. Das liegt an einer Kleinigkeit, unserer Funktion aus dem smn-Theorem.
Zusammenhang zwischen effektiver Komposition und dem smn-Theorem
Wir schauen uns nochmal die Forderung (S) an, welche an Programmiersprachen gestellt wird:
- (S) Zu je zwei Programmen und möchte man ein Programm für die Komposition konstruieren können, d.h. es soll eine berechenbare Funktion geben, so dass .
Während die Funktion in ihrer ursprünglichen Form, mit einen Index/Gödelnummer für eine neue Maschine ausgibt, damit gilt, gibt uns die gleiche Funktion, jedoch mit dem Definitionsbereich , d.h. (die Funktion bekommt also zwei Parameter aus übergeben) auch nur einen Index einer Maschine. Dieses Mal jedoch den Index/Gödelnummer einer Maschine, die zwei Ursprungsmaschinen mit den Indizes und zusammenschaltet, so dass gilt: . That's it.
Funktionieren tut das genauso wie beim Beispiel zum smn-Theorem:
(Danke an Herbert für seinen Beitrag zum Thema in der NG)
- Dazu werden die Marken aus dem Flussdiagramm der Maschine erhöht/umbenannt. Und zwar um den Wert der größten Marke aus dem Flussdiagramm der Maschine damit es in der neuen Maschine keine gleichen Marken gibt, denn es könnte aus beiden Maschinen Marken mit der gleichen Nummer geben.
- Dann wird aus der -Marke von Maschine in die Startmarke der Maschine und wir haben eine Zusammenschaltung und nur eine einzige Maschine aus zwei gebaut.
- Das können wir natürlich beliebig kombinieren, so dass unser wie folgt definiert wird: . Die "Übersetzungsleistung" besteht hier nicht von einer Sprache in die andere, sondern in einer Zusammenschaltung von zwei Maschinen in eine durch Umbenennung der Marken und Verknüpfen der Flussdiagramme, so dass wir am Ende aus zwei Flussdiagrammen nur noch eines haben.
Wir können im Endeffekt also eine beliebige Anzahl () von Maschinen zusammenschalten, so dass wir am Ende nur eine Maschine haben. Jetzt können wir uns auch die übliche Definition der Funktion herleiten, die normal heißt:
mit
Und hier verstehen wir auch warum sich das Theorem eben smn-Theorem nennt. Die Funktion besagt nichts anderes, als dass wir Maschinen zusammenschalten und somit in eine überführen/transformieren können, die mit Argumenten gefüttert werden kann und das selbe Ergebnis hat wie die ursprüngliche Maschine. Und das ist ja genau unser Wunsch nach einer Komposition aus Forderung .
Klar geworden? Damit haben wir nun auch unser abgehakt.
Antwort zum Lernziel: mit dem smn-Theorem ist es uns nicht nur möglich Eingabeparameter einer Maschine fest zu codieren und zur neu erzeugten Maschine eine Gödelnummer anzugeben, die um einen Eingabeparameter (den fest codierten) weniger benötigt und dennoch das gleiche Ergebnis berechnet (um Currying zu unterstützen), sondern wir können mit dem smn-Theorem auch Funktionen, d.h. Maschinen zusammenschalten um eine Forderung an gute Programmiersprachen zu erfüllen: (S) die Forderung nach einer effektiven Komposition.
Das funktioniert durch ein Zusammenfügen der Flussdiagramme, bzw. Befehle der Maschinen bei gleichzeitiger Umbenennung der Marken, so dass z.B. die -Marke einer Maschine statt zu halten nun auf die Anfangsmarke der anderen Maschine verweist.
Zusammen mit dem utm-Theorem bilden sie das Grundgerüst für gute Programmiersprachen: (S) und (U).
Lernziel 6
Erläuterung des Äquivalenzsatzes für Nummerierungen (Rogers)
Wir machen uns zunächst klar, dass wir mit eine eigene Programmiersprache entwickelt haben. Wir konnten mit dieser alle Funktionen aus nummerieren und diese auf unseren universellen Turingmaschinen ausführen.
Zwar haben wir die Syntax und die Notation dieser Bandbefehle willkürlich gewählt. Das ist aber gar nicht tragisch, denn die Nummerierung im Skript ist genauso gut wie jede andere. Vorausgesetzt sie erfüllt das utm- (universelle Turingmaschine) und das smn- (Übersetzungslemma) Theorem. Dann sind die Nummerierungen nämlich äquivalent zueinander, da sie ineinander überführbar sind.
Der Äquivalenzsatz von Rogers besagt formal:
Sei eine Nummerierung von , dann sind folgende Eigenschaften äquivalent:
1.
2. erfüllt das utm- (universelle Funktion von ist berechenbar) und das smn- (Berechnung der Nummer eines Programms und damit z.B. die Übersetzung in eine andere Programmiersprache) Theorem.
Damit lassen sich alle Programme, die beide Theoreme erfüllen durch "Übersetzer" ineinander übersetzen. D.h. soviel wie:
und
.
Wir können uns daher auf eine Nummerierung beschränken wenn sie die beiden Theoreme erfüllt. Unser ist somit genauso gut wie jede andere Nummerierung (die natürlich auch das utm- und das smn-Theorem erfüllen muss).
Antwort zum Lernziel: nach dem Äquivalenzsatz von Rogers sind alle Programmiersprachen/Nummerierungen äquivalent wenn sie das utm- und das smn-Theorem erfüllen.
Hat man also eine andere Programmiersprache/Nummerierung , die beide Theoreme erfüllt, so sind diese äquivalent, d.h. und können mit "Übersetzern" ineinander überführt werden.
Lernziel 7
Formulieren des Rekursionssatzes
Dieser Satz wird auch Fixpunktsatz von Kleene genannt. Ich fand es persönlich einfacher von der anderen Seite an diesen Satz heranzugehen, die Skripte der HU Berlin gehen einen ähnlichen weg. Aber fangen wir mal an: ein schönes Beispiel für den Rekursionssatz ist die Selbstreproduktion. Wir wollen also ein Programm, dass bei einer beliebigen Eingabe sich selbst ausgibt. Dazu ist der Rekursionssatz hilfreich.
Formal ausgedrückt:
Zu jeder Funktion gibt es eine Zahl mit .
Was bedeutet das nun genau und was ist ? ist die Gödelnummer einer Maschine, also quasi unser in natürliche Zahlen codierter Programmcode (kennt Ihr schon, Thema Standardnummerierung). Unsere Programmtransformationsfunktion bekommt als Eingabe diese Gödelnummer , rechnet darauf rum und gibt uns als Ausgabe eine Gödelnummer aus.
Wenn wir nun die Maschine mit der Gödelnummer und dem Parameter starten (), so bekommen wie die gleiche Ausgabe, die unser Programm mit der Gödelnummer und dem Parameter gehabt hätte (), d.h.
Umgangssprachlich gesprochen: Wir können als eine "Programmumschreibefunktion" betrachten. Nach diesem Satz gibt es Programme, die in ihrer Funktion von unserer Programmtransformationsfunktion nicht verändert werden. Aber Achtung: nur in der Funktion, d.h. es könnten Programmteile abgeändert oder hinzugefügt werden, die nicht zur Ausführung kommen. Die korrekte und gleiche Funktion/Ausgabe des Programms ist damit dennoch gegeben.
wird deswegen auch der semantische Fixpunkt der Modifikationsfunktion genannt.
Damit ist es uns z.B. erlaubt Maschinen zu erstellen, welche eine Beschreibung von sich selbst berechnen und benutzen können. Das ist keineswegs selbstverständlich! Denn lange Zeit galt diese sog. Selbstreproduktion, d.h. Maschinen, die sich selbst nachbauen ohne sich selbst zu enthalten als unmöglich.
Alle Erfindungen, die andere Dinge herstellten wie z.B. eine Autofabrik oder Werkzeughersteller sind komplexer als das erzeugte Produkt und brauchen eine Beschreibung des herzustellenden Produktes. Damit wäre die Selbstreproduktion aber unmöglich, denn um einfache Produkte zu bauen, braucht man komplexe.
Und genau das ist der Trugschluss, den von Neumann 1966 aufgezeigt hat, indem er theoretisch eine einfache Maschine konstruierte, die sich selbst reproduzieren kann:
Diese Maschine besteht aus drei Teilen:
- dem Konstrukteur
Der Konstrukteur bekommt die Beschreibung einer Maschine (mathematisch gesehen also z.B. unsere Gödelnummer ) und setzt diese dann mit den Bauteilen zusammen, so dass wir eine Maschine mit bekommen. - dem Kopierer
Der Kopierer kann den Bandinhalt von einem Band auf ein anderes kopieren, so dass am Ende zwei Bänder mit dem selben Inhalt als Ausgabe ausgegeben werden. - der Steuerung
Die Steuerung kümmert such um Konstrukteur und Kopierer und versorgt beide mit Eingaben.
Was wir also brauchen ist, eine Maschine , die bei der Eingabe von sich selbst, sich selbst reproduziert. Und so sieht dann die Maschine aus:
Wir geben den Bauplan in die Steuerung, diese gibt sie an den Kopierer, welcher den Bauplan verdoppelt. Eine Kopie wird an den Konstrukteur übergeben, der daraus eine neue Maschine baut. Und eben diese neue Maschine (der "Sohn") bekommt dann von seinem "Vater" den Bauplan ausgehändigt und baut dann den "Enkel", eine exakte Kopie von sich selbst usw.
Und nun wieder zurück zur theoretischen Informatik:
Wir haben damit eine Möglichkeit zur Selbstreproduktion und können Maschinen angeben, die sich selbst ausgeben können. Mit dem Rekursionssatz ist es also sichergestellt, dass es ein Programm gibt, welches bei allen möglichen Eingaben sich selbst ausgibt. Eine Anwendung sind z.B. die Quines, denn sie geben bei jeder Ausgabe sich selbst aus, damit gilt der Satz über Selbstreproduktion:
Es gibt eine Zahl , so dass für alle .
Wer könnte denn an sowas interessiert sein? Außer Skynet. Viren zu Beispiel.
Just als ich den Beitrag getippt habe, fliegt mir ein Satz Folien um die Ohren, die ich euch nicht vorenthalten will: Folien zur Selbstreproduktion der Uni Potsdam.
Antwort zum Lernziel: Der Rekursionssatz von Kleene besagt, dass man zu einem gegebenen Modifikationsprogramm immer einen Quelltext finden kann, der trotz Modifikation seine Aufgabe weiterhin erfüllt. Da sich die Semantik des Programms somit nicht ändert wird dieser Quelltext (das ) auch semantischer Fixpunkt von genannt.
Ein Anwendungsbereich dieses Satzes ist die Selbstreproduktion, so dass die Ausgabe von sich selbst der Fixpunkt ist (das Programm gibt sich selbst aus) und es gelten muss: , egal was man als eingibt.
Puh, das war ein Haufen arbeit. Wie immer gilt: sollten sich Fehler eingeschlichen haben: bitte wieder Bescheid geben. Danke auch an die Kollegen aus der NG, die so manche einleuchtende Erklärung eingeworfen und zu diesem Text beigetragen haben. Schade, dass die NG jedes Semester gelöscht wird. So verwindet manch eine schöne Erläuterung im digitalen Papierkorb. Vielleicht trägt der Blog ja etwas dazu bei, dass einige Erläuterungen über das Haltbarkeitsdatum der NG bestehen bleiben.