TIA: Berechenbarkeit auf anderen Mengen (Lernziele KE7, 2/2)
Update: Kleine Korrektur nach Einwand von Phil in den Kommentaren.
Update: es hat sich ein Fehler eingeschlichen bei der Definition der Dualnotation. Sollte nun behoben sein. Danke Thomas.
Update: das ist nun der letzte Beitrag, der auf die Lernziele gemünzt wird. Irgendwie verlässt mich immer kurz vor Schluss die Lust mich durch die quälenden Definitionen zu... ähm... nunja... quälen.
Da ich im Moment mit KE4 von 1658 (TIB) nicht weiterkomme, bin ich mal der Bitte von Marco nachgekommen und habe die Zusammenfassung von KE7/1657 fertig gemacht. Hoffentlich hilft sie euch etwas.
Lernziel 3
Erklärung der Reduzierbarkeit und Äquivalenz von Nummerierungen
Die Reduzierbarkeit haben wir bereits im Beitrag zu KE6 gehabt. Ähnlich verhält es sich hier.
Wir machen es uns am liebsten leicht: wozu die Berechenbarkeitsmodelle aller Nummerierungen durchgehen wenn wir sie aufeinander reduzieren und so ihre Äquivalenz nachweisen können? So können wir uns einfach, wie im Falle der Standardnummerierung , unter bestimmten Bedingungen auf eine Nummerierung festlegen wenn wir zeigen können, dass die anderen Nummerierungen zu dieser äquivalent sind oder auf unsere reduziert werden können.
Da jede Menge mit mind. zwei Elementen sehr viele Nummerierungen hat, die Berechenbarkeitskonzepte (siehe vorheriger Beitrag) auf diesen Mengen festlegen, brauchen wir was um diese zu vergleichen. Das Konzept der Reduzierbarkeit erscheint noch etwas willkürlich, wir werden es aber im Teil B der theoretischen Informatik im Rahmen der Komplexitätstheorie wieder treffen und anwenden. Also am besten nicht überspringen.
Beispiel:
Wir wollen hier zeigen, dass wir auf reduzieren können, d.h. wir brauchen eine Funktion die als Definitionsbereich und als Bildbereich hat. Dazu müssen wir nur eine einstellige und totale Funktionen aus wählen, die das für uns erledigt. Selbstverständlich muss sie auch berechenbar sein.
Wir rekapitulieren nochmal die zwei Nummerierungen :
für alle
Identitätsfunktion also. Wir bilden eine Zahl aus auf sich selbst ab, z.B. . That's it. Wie man sieht ist die Nummerierung total (für jedes Element aus der Definitionsmenge haben wir ein Element aus der Bildmenge) und bijektiv (das Bild ist sogar eindeutig, d.h. wir können auch eine Inverse draus basteln).
für alle
Wir bilden eine Zahl aus auf eine Zahl auf ab, z.B. (falls bei euch nun wieder Fragezeichen über euren Köpfen auftauchen, erinnert euch bitte an die Inverse der Cantorschen Tupelfunktion).
Wie man sieht ist die Nummerierung auch total (für jedes Element aus der Definitionsmenge haben wir ein Element aus der Bildmenge), aber nicht bijektiv, wie man leicht am folgenden Beispiel sieht:
Damit würden die Zahlen und aus dem Definitionsbereich auf die gleiche Zahl im Bildbereich unserer "Übersetzungsfunktion" abgebildet, eine Inverse können wir so zwar nicht angeben, ist aber nicht schlimm. Die brauchen wir hier ja auch nicht.
Besorgen wir uns also eine Funktion .
Es gilt also und : zu jedem Element der einen Nummerierung gibt es ein Element aus der anderen Nummerierung. Eine Möglichkeit für die Übersetzungsfunktion wäre z.B. . Versuchen wir es doch einfach mal:
Sieht gut aus. Damit ist . In Worten: ist reduzierbar auf .
Diese Nummerierungen haben einige wichtige Eigenschaften, die wir hier festhalten wollen:
und
und
Die beiden Eigenschaften der Reduzierbarkeit und Äquivalenz der Nummerierungen basieren auf der Transitivität. Also nichts neues.
Was vielleicht noch erwähnenswert ist: Bei der Übersetzung durch die totale Übersetzungsfunktion gehen Berechenbarkeitsinformationen verloren geht. Damit ist die überführte Nummerierung "reichhaltiger", die Ziel-Nummerierung "ärmer".
Erst wenn wir zwei Nummerierungen haben, die Äquivalent sind, so induzieren Sie das selbe Berechenbarkeitskonzept. Wir erinnern uns nochmal an die Definition aus Kurseinheit 5:
Es seien und Nummerierungen.
1. ( ist reduzierbar/übersetzbar auf ) genau dann wenn es ein gibt mit für alle
2. ( ist äquivalent zu ), genau dann wenn und .
Unsere Nummerierungen sind also Äquivalent wenn sie ineinander übersetzbar sind. Wir haben damit beide Mengen vollständig nummeriert und kein Element aus ihnen ausgelassen.
Das führt uns zur Kernaussage des Lernziels:
Zwei Nummerierungen einer Menge induzieren auf dasselbe Berechenbarkeitskonzept wenn sie äquivalent sind.
Antwort zum Lernziel: Eine Nummerierung ist auf eine andere reduzierbar wenn wir sie durch einen totale, berechenbare Funktion in die andere "übersetzen" können. Leider gehen bei diesem Vorgang evtl. Berechenbarkeitsinformationen verloren, da wir nur noch auf den Nummern der Elemente arbeiten.
Können zwei Nummerierungen gegenseitig aufeinander reduziert werden, so sind diese Äquivalent und induzieren auf der nummerierten Menge dasselbe Berechenbarkeitskonzept
Lernziel 4
Konstruktion einer reellen Zahl einer Funktion , die nicht im Bild von liegt
Kommen wir nun zur zentralen Aussage dieser Kurseinheit. Genau darum drehte sich unsere ganze Vorarbeit in den Lernzielen Eins bis Drei.
Die Aussage ist:
Reelle Zahlen können wir nicht nummerieren, da es davon überabzählbar viele gibt.
Ihr erinnert euch sicher an den Überabzählbarkeitsbeweis von mittels Diagonalisierung? Wenn nicht, schaut bitte nochmal im Beitrag zu KE4 im Abschnitt "zweites Diagonalisierungsargument von Cantor" nach. Die Menge der reellen Zahlen nicht mehr abzählbar (sie ist mächtiger als ) und kann deswegen durch diese auch nicht nummeriert werden, was wir auf reelle Funktionen übertragen können. Die obige Aussage, formal dargestellt, bedeutet:
Es sei . Dann gibt es eine reelle Zahl mit .
Wenn wir also die reellen Zahlen nummerieren wollen, so gelingt uns das nicht und wir haben immer noch eine reelle Zahl, die nicht nummeriert ist. Der Beweis mittels Diagonalisierung ist im verlinkten Beitrag zu KE4 zu finden.
Ich habe mir das Leben etwas einfacher gemacht und einfach auf das zweite Diagonalisierungsargument verwiesen. Gefragt wurde aber nach einer expliziten Funktion , für die ein zu konstruieren ist, welches nicht im liegt. Machen wir das doch.
Konstruktion einer Zahl , die nicht im Bild von liegt
Wir nehmen das gleiche Verfahren, wie im Diagonalisierungsargument und nehmen an, dass alle Zahlen im geschlossenen, reellen Intervall zwischen und nummeriert.
Das ist etwas komisch dargestellt und sicherlich keinesfalls mathematisch korrekt. Aber da die Zahlen unendlich lang sind, kann ich sie natürlich nicht ausschreiben. Das sollte nur verdeutlichen was wir nummerieren.
Wir tun also einfach mal so, als hätten wir alle Zahlen aus dem Intervall nummeriert.
Nun basteln wir uns eine Funktion , die alle natürlichen Zahlen durchgeht, die nummerierten Elemente nimmt und die -te Stelle nach dem Komma dieses Elements um eines hochzählt und so daraus eine neue Zahl bastelt.
Offensichtlich ist diese Zahl mit an jeder Stelle von der Stelle eines jeden verschieden. Wir haben also tatsächlich eine neue Zahl gefunden, die wir nicht nummeriert haben. Obwohl wir von der Vollständigkeit unserer Nummerierung ausgegangen sind (daher das in ).
Antwort zum Lernziel: Aufgrund der Überabzählbarkeit der reellen Zahlen ist es uns nicht möglich diese durch die natürlichen Zahlen zu nummerieren. Das führt uns selbstverständlich zu einem kleinen Problem: wir haben unser Berechenbarkeitskonzept durch Registermaschinen nur auf den natürlichen Zahlen und durch Turingmaschinen auf den Wortfunktionen aufgebaut.
Was wir dagegen tun können, steht im nächsten Lernziel.
Lernziel 5
Definition berechenbarer Funktionen
Um was geht es hier? Um Funktionen, die mittels "real RAMs" berechnet werden können. Diese Maschinen haben, im Gegensatz zu unseren Registermaschinen auf natürlichen Zahlen, reelle Zahlen im Speicher.
Leider können wir sie physikalisch nicht realisieren (wir können keine reellen Zahlen in Registern speichern), da wir nur auf und arbeiten und die Menge der reellen Zahlen -wie wir oben gesehen haben- nicht nummerieren können. Was tun?
Kümmern wir uns zunächst um das Berechenbarkeitskonzept von Grzegorczyk und Lacombe aus 1955. Im Prinzip ist das nichts anderes als die Erweiterung unserer Turing-Maschine, so dass sie statt auf natürlichen Zahlen nun auf reellen arbeitet. Aber das geht doch nicht! Haben wir das nicht gerade gesagt? Doch, haben wir. Aber es gibt da eine Möglichkeit die Menge der reellen Zahlen doch zu nummerieren, so dass wir auf ihnen rechnen können.
Zunächst brauchen wir ein genügend großes Alphabet . Dann werden mit unendliche Folgen definiert (im Gegensatz zum Skript, hätte ich hier direkt mit Cauchy angefangen... aber ist nun egal, welche als Namen für unsere reellen Zahlen dienen). Diese unendlichen Folgen sind unsere "Namen" für die reellen Zahlen.
Nachdem wir nun unsere Eingabewerte, die reellen Zahlen durch eine unendliche Folge von Symbolen über nummeriert haben haben, brauchen wir noch eine Maschine, die darauf rumrechnen kann.
Dazu nutzen wir eine sog. Typ-2-Maschine, wie sie im Skript genannt wird und definieren die Eingabebänder als unendlich (logisch, denn eine reelle Zahl in Dezimaldarstellung ist unendlich).
Auf diesen stehen dann die Namen der reellen Zahlen, eben Elemente aus der Menge . Zu den Eingabebändern für unsere Worte hat die Maschine auch noch weitere, unendliche Arbeitsbänder, wie viele ist uns egal. Und natürlich besitzt sie auch ein Ausgabeband, wo am Ende die Ausgabe auftaucht, man diese jedoch nicht mehr verändern kann wenn man ein Zeichen der Ausgabe auf dem Band platziert hat (das ist eine wichtige Einschränkung, bitte merken!).
Wenn wir nun einen unendlichen Dezimalbruch z.B. durch 3 dividieren, werden in jedem Schritt eine Zahl der Eingabe gelesen und ggf. eine Zahl der Ausgabe geschrieben. Da die Berechnung unendlich ist, nähren wir uns so dem idealen Ergebnis (d.h. wir runden nicht) beliebig nah an.
Und diese Maschinen sind realisierbar! Das sin nämlich nichts anderes als unsere Computer.
Probleme bekommen wir, wenn wir multiplizieren wollen. Denn wenn wir als Eingabe z.B. haben, so wurde auf das Eingabeband bereits eine geschrieben. Wenn dann die hinter dem Komma zur Berechnung eingelesen wird, kann die Maschine auf dem Ausgabeband aber nicht mehr zurück um die (fälschlicherweise bereits geschriebene) durch eine ersetzen. Damit haben wir ein massives Problem.
Wir brauchen hier also unbedingt eine Lösung, denn ohne können wir z.B. nicht auf oder rechnen (wobei man auch anders approximieren kann). Um diese kümmern wir uns im nächsten Lernziel.
Antwort zum Lernziel: Wir definieren diese berechenbaren Funktionen über einer unendlichen Folge von Zeichen aus einem Alphabet . Diese unendlichen Folgen dienen uns als Namen für die Elemente einer Menge, auf der wir tatsächlich rechnen wollen, aber mangels passender Darstellung nicht können!
Diese Funktion wird von einer Turingmaschine, einer sog. Typ-2-Maschine berechnet, die auf unendlichen Eingabebändern für die unendlichen Symbolfolgen unserer Eingabewerte rechnet und am Ende die Ausgabe auf ein unendliches Ausgabeband schreibt, auf dem die Schränkung gilt, dass man auf diesem nicht wieder nach links laufen und seine Ausgabe im Nachhinein korrigieren kann (Einweg-Ausgabe).
Lernziel 6
Definition der Cauchy-Darstellung der reellen Zahlen
Diese Berechenbarkeit können wir auf andere Mengen ausweiten wenn wir eine Funktion haben, die die Elemente dieser Menge quasi nummeriert, d. h. ihnen Namen gibt wie wir das mit getan haben.
Und genau das haben Grzegorczyk und Lacombe unabhängig von einander getan. Aber nicht mit einem Alphabet , sondern mit sog. Cauchy-Folgen. Diese haben sie verwendet um die reellen Zahlen (aber Achtung: nicht alle reellen Zahlen sind effektiv berechenbar, aber dazu gleich mehr) zu repräsentieren und umgingen so das oben angesprochene Problem mit der Multiplikation.
Die Typ-2-Maschine gibt bei der Eingabe einer nach konvergierenden Cauchy-Folge ebenfalls eine nach konvergierende Cauchy-Folge aus.
Die Darstellung dieser Cauhy-Folge selbst ist wie folgt definiert:
:
es gibt , so dass , und
Klopper! Macht nichts.
Zunächst: ist die Darstellung (Dualnotation) der natürlichen Zahlen in Form von:
Beispiel: in Dual ist . Das, eingesetzt in die Formel ist: .
Und damit ist .
Ganz einfach. Ist also nichts weiter als die duale Darstellung einer natürlichen Zahl, bzw. die Nummerierung einer dualen.
ist die (rationale) Darstellung der rationalen Zahlen in Form von:
.
Beispiel: mit . Das, eingesetzt in die Formel bedeutet schlicht und ergreifend:
Auch nicht viel schwerer. Nachdem wir das haben ist die Definition oben ein Stück deutlicher geworden.
Fragen wir uns zunächst, warum Cauchy?! Das Problem ist, dass diese Folge, auf der wir rumrechnen wollen eine Eigenschaft haben muss, die für uns unverzichtbar ist. Und zwar, dass sie schnell gegen unser gesuchtes konvergiert. Mit jedem Folgeglied kommen wir näher und näher an heran.
Suchen wir uns dazu eine Folge, die nicht schnell konvergiert, so haben wir nicht schnell genug Informationen zu unserem , so dass wir evtl. in Probleme laufen, wie wir das mit der Multiplikation gesehen haben.
Aber Achtung, ist nicht injektiv, so dass es viele Cauchy-Darstellungen einer reellen Zahl gibt, d. h. jede reelle Zahl hat viele "-Namen". Für uns ist nur wichtig, dass die gewählten Darstellungen das Cauchy-Kriterium erfüllen.
Dass es solche langsamen Folgen gibt, hat uns Hr. Specker in seinem Satz gesagt:
Es gibt eine wachsende, berechenbare Folge rationaler Zahlen, die nicht schnell konvergiert.
Wir brauchen also nicht nur eine Folge, sondern eine schnell konvergierende Folge. Und genau dazu ist das Cauchy-Kriterium da. Reden wir also zunächst über Cauchy bevor wir fortfahren.
Viele hatten das bereits in 1141, Grundlagen der Mathematik. Aber eine Wiederholung schadet sicher nicht:
Kommen da Erinnerungen hoch? Das bedeutet, dass für jedes ein Index existiert, so dass für alle anderen Indizes, die größer als sind gilt, dass der Abstand zwischen den Gliedern der Folge und kleiner ist als . Die Glieder der Folge liegen also beliebig dicht. Das beliebig dicht ist das Zauberwort.
Sehr Ihr dieses hübsche ? Und nun schaut mal in die Definition unserer Cauchy-Darstellung: wir fordern dort, dass der Abstand zwischen unserem und einem Glied der Folge mit einer bestimmten Geschwindigkeit immer kleiner wird, eben unser mit . Das ist unsere Konvergenzgeschwindigkeit, die wir min. benötigen um genügend schnell genug Informationen zu unserem zu bekommen.
Die Cauchy-Darstellung einer Zahl ist also der "Name" dieser Zahl, die wir zum Rechnen benutzen. Die Glieder konvergieren so schnell gegen , dass wir schon nach kurzer Zeit genug Informationen zu der Zahl haben, dass uns z.B. das Multiplikations-Problem von oben nicht passieren kann.
Und das ist auch der Satz von Prof. Weihrauch, der auch in der Literatur zitiert wird. Es geht aber nicht mehr um Zahlen, sondern um Funktionen auf reellen Zahlen:
Eine Funktion ist berechenbar, wenn es eine Typ-2-Turingmaschine gibt, die jeden Namen von (unsere Cauchy-Folge, die gegen konvergiert) in einen Namen von (unsere Cauchy-Folge, die gegen konvergiert) überführt.
Wir rechnen also ab jetzt auf Gliedern einer Folge und brauchen dazu eine Typ-2-Turingmaschine, die uns zu einer reellen Zahl eine Cauchy-Folge ausgibt, darauf herumreitet und uns die Cauchy-Folge zum Ergebnis ausspuckt. Ich wiederhole mich, oder
Dieser Satz ist im Skript auch in Prosa beschrieben:
Die reelle Funktion ist dann berechenbar wenn wir ein Verfahren angeben können, dass eine gegen aus der Definitionsmenge von konvergierende Folge (d.h. unser Name für ) in eine schnell gegen konvergierende Folge überführt, die ein Name für unser Ergebnis ist.
Also genau das, was wir gerade bereits gesagt haben.
Man macht sich leicht klar, dass die Folgen nichts anderes sind als die (unendliche) Darstellung unseres Parameter, mit dem wir die Funktion füttern und unseres Ergebnisses. Sie können nie größer sein als das Ergebnis oder der Parameter (die sind unsere Limes) und nähren sich diesen beliebig (unendlich) nah an. Und das auch noch so schnell, dass wir garantiert kein Falschergebnis bekommen wie z.B. bei bei der Multiplikation von oben.
Aber Moment mal: wir brauchen eine Typ-2-Turingmaschine, die uns eine Cauchy-Folge für eine reelle Zahl berechnet? Fällt euch jetzt schon das Problem auf? Wir haben nur eine abzählbare Anzahl an Turingmaschinen und damit auch eine abzählbare Anzahl an Typ-2-Maschinen. Aber eine überabzählbare Anzahl an reellen Zahlen. Was folgt daraus? Ein etwas beängstigender Satz:
Es gibt reelle Zahlen, die nicht berechenbar sind.
Diese berechenbaren Zahlen bilden also einen Teilkörper (in der Literatur wird er - effectively computable - genannt) der reellen Zahlen.
Bleiben wir auf dem mathematischen Boden, so sind folgend einige Beispiele von reellen, berechenbaren Funktionen aus dem Skript:
Wichtig: der fundamentale Stetigkeitssatz besagt, dass Stetigkeit eine notwendige Voraussetzung für -Berechenbarkeit ist. Die Funktion darf also keine Sprungstellen haben. Eine Heaviside-Funktion (Sprungfunktion) ist damit also z.B. nicht -berechenbar.
Antwort zum Lernziel: Um uns die Möglichkeit zu verschaffen mit reellen Zahlen zu rechnen, was wir offenbar tun und müssen, ist es notwendig diese in einer bestimmten Form darzustellen (da wir in Registern keine reellen Zahlen speichern können) und sie auf ein Berechenbarkeitsmodell zurückzuführen. Basis dieses Modell ist die bereits erwähnte Typ-2-Maschine.
Jedoch haben wir mit der Darstellung der reellen Zahlen als Dezimalzahlen ein Problem (siehe Multiplikation), dass wir nur lösen können wenn wir diese so codieren, ihnen also Namen geben, die uns die notwendigen Informationen der Dezimalstellen der reellen Zahlen so schnell wie möglich liefern.
Wir haben die Möglichkeit die reellen Zahlen als Folgen zu codieren, die gegen diese Zahlen konvergieren. Aber nicht als irgendwelche Folgen, sondern als Folgen mit einem bestimmten Geschwindigkeitskriterium: der Cauchy-Eigenschaft um uns so schnell wie möglich mit den notwendigen Informationen versorgen damit wir nicht in Probleme wie mit der Multiplikation laufen.
Dieses so schnell wie möglich wird mit dem Faktor für jedes Glied der Folge spezifiziert, es bezeichnet den Abstand zwischen der abgebildeten, reellen Zahl und dem Glied der Folge . Solange dieses Kriterium gilt, können wir uns mit eine beliebige Folgen-Darstellung einer reellen Zahl aussuchen. Denn durch die Nicht-injektivität von kann eine reelle Zahl mit mehreren Cauchy-Folgen dargestellt werden.
Lernziel 7
Zeigen, dass z.B. -berechenbar ist
Was tun wir, wenn wir die Berechenbarkeit einer Funktion zeigen wollen? Wir verweisen auf die obigen Beispiele Und wenn wir dazu gezwungen werden, das selbst zu tun? Dann versuchen wir es doch:
Um zu zeigen, dass -berechenbar ist, müssen wir eine "Typ-2-Maschine" angeben, die als Eingabe das codierte Wort , d.h. die Cauchyfolge (Eingabeparameter ) als Darstellung der reellen Eingabe annimmt und in eine Folge (reelles Ergebnis ) umwandelt, so dass gilt:
.
Die können wir auch mit auf das Eingabeband schreiben, getrennt durch von , der Folge für .
Ebenfalls muss es möglich sein, die durch eine Cauchy-Folge zu codieren und dann ausgeben zu lassen. Aber ihr habt den Ansatz nachvollziehen können, hoffe ich.
Die gesuchte Maschine gibt dann die Worte aus, so dass gilt.
Um das Cauchy-Kriterium, die geforderte Konvergenzgeschwindigkeit zu erfüllen, gilt:
Wir wollen ja, dass die Glieder unserer Folge gegen der Eingabe gegen konvergieren.
Und auch die Glieder der Folge unseres Ergebnisses sollen gegen das Ergebnis konvergieren.
Damit ist -berechenbar. Oder zumindest wäre das auf die Schnelle der Ansatz, den ich fahren würde.
Eventuell trage ich eine ausführliche Darstellung im Rahmen der Prüfungsvorbereitung hier nach.
Antwort zum Lernziel: Um zu zeigen, dass eine Funktion -berechenbar ist, muss man die reellen Eingabeparameter mittels einer Folge codieren, deren Glieder das Cauchy-Kriterium mit der Konvergenzgeschwindigkeit erfüllen. Das gilt ebenfalls für die Glieder der Ausgabe .
Erfüllen diese das Kriterium und ist die Funktion selbst berechenbar, so ist die Funktion ebenfalls -berechenbar.
Wer Fehler findet (vor allem im letzten Abschnitt), ASAP in die Kommentare damit ich das schnell berichtigen kann.