TIB: Maschinenmodelle und Komplexitätsklassen (Lernziele KE1, Update 4)
Update 6: Große Fehlerkorrektur. Finde ich super, dass Ihr euch die Mühe macht, die Fehler aufzuschreiben. Das hilft dem nachfolgenden Leser ungemein! Danke Walter.
Update 5: Fehlende Marke 4 im Flussdiagramm hinzugefügt. Die Berechnung musste daher geringfügig geändert werden (Danke, Alex).
Update 4: Tippfehler beseitigt in Lernziel 3 nach Kommentar von Carina.
Update 3: Nach dem Einwand von Philipp habe ich das Flussdiagramm abgeändert. Im Skript wird als Ausgabeband 0 verwendet, Band 1 ist das Eingabeband und der Rest sind Arbeitsbänder. Ich habe mich hier nicht so ganz daran gehalten, da es für das Beispiel unwesentlich ist.
Ist aber natürlich nicht schön wenn ich mich nah am Skript bewegen und Details vernachlässige, die das Verständnis erschweren. Daher: Danke für das aufmerksame Lesen 😉 Band 0 ist nun das Ausgabeband.
Update: Mittlerweile ist KE7 von TIA bereits fertig.
Update: Hier habe ich bei der Überarbeitung einige Fehler entfernt, die evtl. zu Verständnisproblemen geführt hätten.
Lernziel 1
Definition der Komplexitätsmaße Zeit und Band für Turing-Maschinen
Bevor wir die Komplexitätsmaße definieren können, müssen wir zunächst wissen was Komplexität ist. Hierzu ist im Skript ein schönes Beispiel gegeben: mit der Schrittzahlfunktion haben wir die Güte einer Maschine, bzw. eines konkreten Programms. Wir haben jedoch ein gesteigertes Interesse an der Komplexität des effizientesten Programms für einen Algorithmus. D.h. wir suchen obere (jede Schranke, die über der Schranke eines bereits bekannten Programms für unseren Algorithmus liegt) und untere Schranken (die minimalste Schranke für alle Programme zu unserem Algorithmus).
Zusätzlich dazu wird im Skript der Begriff Sprache definiert:
Sei eine über dem Ein-/Ausgabealphaber . Dann ist
die von erkannte Sprache.
Ist total, so sagen wir: entscheidet die Sprache .
Wie wir wissen beinhaltet alle Wörter über dem Eingabealphabet . Hält die Maschine in einem Endzustand wenn ein Wort aus in diese eingegeben wird, so wird das Wort von der Maschine akzeptiert. Alle von akzeptierten Worte aus werden die von akzeptierte Sprache genannt.
Erkannte/Akzeptierte Sprachen sind die rekursiv aufzählbaren Sprachen, d.h. sie terminieren ggf. nicht für jede aber in jedem Fall für jede akzeptierte Eingabe. Wir haben also eine Positiv- oder Negativentscheidung für eine akzeptierte Eingabe (aber nicht beides). D. h. die Maschine hält nur bei akzeptierten Eingaben. Bei anderen Eingaben läuft sie ewig weiter. Das Problem dabei ist, dass wir letztendlich nicht wissen, ob eine Eingabe nun tatsächlich erkannt / akzeptiert wird. Evtl. rechnet die Maschine ja noch für die Eingabe...
Die entscheidbaren Sprachen - also bei den Eingaben, wo die Maschine in jedem Fall mit einer Positiv- oder Negativentscheidung terminiert, ist als überall definiert, d.h. total - nennen wir rekursiv. Hier haben wir für jede Eingabe (irgendwann) einen finalen Zustand der Maschine, der uns für eine EIngabe die Entscheidung mitteilt.
Was sind aber nun Komplexitätsmaße Zeit/Band für ? Eine ist ein abstraktes Modell eines Rechners. Mit der Schrittzahlfunktion haben wir unsere Rechenzeit für die Maschine , d.h. ist unsere Zeitkomplexität. Der Bandbedarf ist unser , d.h. unsere Bandkomplexität. Sie gibt an wie viele der Felder beim erreichen der Endkonfiguration (d.h. das Ergebnis steht auf dem Ausgabeband) auf den Arbeitsbändern benutzt wurden. Durch die im Skript gemachten Einschränkungen des Befehlssatzes (Ein- und Ausgabeband kann nicht als Arbeitsband missbraucht werden) für die Maschine, brauchen Ein- und Ausgabeband nicht in die Berechnung einbezogen zu werden. Versuchen wir es an einem einfachen Beispiel zur Verdeutlichung.
Beispiel für Band- und Zeitkomplexität
Wir nehmen eine simple Maschine , die uns ausgibt.
Funktionsweise: die Maschine tut nichts anderes als die Eingabe von Band 1 (Eingabeband) auf Band 2 (Arbeitsband) zu schreiben, eine 1 hinzuzufügen, dann den Lesekopf wieder an den Anfang von Band 2 zu setzen und seinen Inhalt auf Band 0 (Ausgabeband) zu schreiben. Beachtet: ist das Anfangs- und $ das Endzeichen. So können wir auf den Bändern von Wortanfang bis Wortende navigieren. Nachdem wir ein Zeichen auf ein Band geschrieben haben müssen wir den Schreibkopf auf Band auch nicht eine Stelle weiter rücken, da wir im Skript die dahingehend erweitert haben, dass das automatisch passiert.
Analysieren wir zunächst die Zeit und nehmen als Eingabe ein . Nehmt euch am besten Stift und Paper und spielt die Maschine nach. Wir gehen davon aus, dass sich der Lesekopf zu Beginn auf Band 0 bei befindet, bei Band 1 und 2 jedoch direkt auf dem ersten leeren Feld nach dem Anfangszeichen . Am Ende sollten die Folge der besuchten Marken so aussehen:
0,1,2,3,4,1,2,3,4,1,5,6,7,6,7,6,7,6,8,9,10,11,9,10,11,9,10,11,9,12.
Wenn ich mich nicht verzählt habe sind es genau 30 besuchte Marken.
Fangen wir also mit der Abschätzung an:
- Marke 0 wird immer 1x besucht (1)
- Marken 1, 2, 3 und 4 werden genau mal besucht und zum Abschluss noch einmal Marke 1 um dann zu Marke 5 zu kommen
- Marke 5 wird immer 1x besucht (1)
- Marken 6 und 7 werden besucht. Wir haben am Ende unseren Lesekopf auf dem Anfangszeichen bei Band , wo ja am Ende "$" steht. Also laufen wir insgesamt 3 Mal zurück bis wir wieder auf dem Anfangsmarker landen. Anschließend wird noch einmal Marke 6 abgefragt und wir kommen auf Schritte
- Marke 8 wird immer 1x besucht (1)
- Marken 9, 10, und 11 werden Mal besucht, da wir uns ja auf dem Band 2 3 Mal nach vorne bewegen müssen um den Endmarker $ zu erreichen. Dann wird Marke 9 noch einmal abgefragt und wir sind bei Schritten
- Marke 12 ist die Abschlussmarke, welche natürlich nur Mal besucht wird.
Insgesamt sind wir dann also bei 32 Marken, was unserem manuellen Durchlauf entspricht. Hier sieht man direkt ein, dass die Schleifendurchläufe von der Eingabe abhängen. Ersetzen wir unsere nun mit , so kommen wir auf die Gleichung:
.
Das ist unsere - aufgrund der Einfachheit der Maschine ziemlich genaue - Abschätzung der Zeitkomplexität: .
Da uns aber in der Laufzeitberechnung die Konstanten kaum interessieren (sie hängen nicht von der Eingabe, sondern nur von der Rechengeschwindigkeit ab), können wir sie streichen. Für uns spielt nur die Komplexität eine Rolle, die von der Eingabe abhängt (zwar bei beliebigen Rechenleistungen vielleicht schneller ist, aber trotzdem gleiche von der Eingabe abhängige Wachstum hat), so dass die Laufzeit unseres einfachen Programmes in die Komplexitätsklasse fällt und damit ein lineares Wachstum aufweist.
Was ist aber nun mit der Bandkomplexität? Die ist noch einfacher abzuschätzen. Wie sieht denn die bei der Eingabe von erreichte Endkonfiguration aus? Die Anfangskonfiguration wäre z. B. bei der Eingabe von : . Die von da aus erreiche Endkonfiguration wäre: . Da wir uns um das Ein- und Ausgabeband nicht kümmern, sondern nur die Arbeitsbänder (davon haben wir nur eines: Band 2) zählen, landen wir bei einem Speicherplatzverbrauch von . , was unsere Bandkomplexität in die selbe Komplexitätsklasse befördert wie unsere Laufzeit: .
Fertig!
Antwort zum Lernziel: bei den Komplexitätsmaßen für Turing-Maschinen unterscheiden wir zwischen Band- und Zeitkomplexität. Ersteres ist der Bandverbrauch, der mit bezeichnet wird und die Auslastung der Arbeitsbänder (Eingabe- und Ausgabeband begutachten wir nicht) angibt. Letzteres ist und gibt die Anzahl der Schritte an, die bei der Eingabe von zur Endkonfiguration führt.
Lernziel 2
Definition der Komplxitätsklassen
Damit sind wir auch schon bei den Klassen angekommen. Oben haben wir die konkrete Komplexität einer Maschine berechnet. Aber was ist wenn wir noch ein paar unsinnige Schleifen in die obige Maschine einbauen, die von der Eingabe abhängen ? Wir könnten die Berechnung der simplen Funktion durch diese Schleifen dann so verlangsamen, dass die Berechnung erst in exponentieller Zeit abgeschlossen wäre. Selbst wenn es totaler Unfug ist.
Ihr ahnt es wahrscheinlich schon: wir haben keinerlei Interesse an der Komplexität einer konkreten Maschine, die unsere Funktion berechnet. Denn davon kann es viele geben. Für uns ist diese Aussage nur in Bezug auf die Funktion selbst spannend: wie komplex (schnell) ist der schnellste Algorithmus, der unsere Funktion berechnet?
Ein Beispiel gefällig? Gerne: Rucksack-Problem
Eine rekursive Implementierung des Algorithmus hat eine Zeitkomplexität aus der Klasse (polynomielles Wachstum) und den Speicherplatzverbrauch von (lineares Wachstum). Mittels dynamische Programmierung ist es jedoch möglich die Laufzeit auf zu drücken (hierzu bitte den Wikipedia-Artikel studieren, ggf. schreibe ich später auch mal was dazu). Zunächst hatte also unsere Funktion die Komplexität . Dann haben wir es geschafft einen Algorithmus (anhand einer Maschine) zu entwerfen, die unsere Funktion in die Komplexitätsklasse brachte. Und wenn wir keinen anderen, effizienteren Algorithmus finden, bleibt sie auch erstmal dort.
Ist nun klar warum wir uns für die maximale/minimale Komplexität der Algorithmen und nicht konkreter Maschinen interessieren?
Antwort zum Lernziel: die Komplexitätsklassen geben an, welche obere Schranke für einen Algorithmus zu erwarten ist und nicht von der konkreten Maschine, vom der der Algorithmus umgesetzt wird. Es interessiert uns also nur der Worst Case. Dieser wird mittels Landau-Notation, auch O-Notation genannt ausgedrückt. In den meisten Fällen ist die Zeit- von höherem Interesse als die Bandkomplexität.
Durch diese Abgrenzung können wir eine Hierarchie auf den Komplexitätsklassen bilden.
Lernziel 3
Zusammenhang zwischen Band- und Zeitkomplexität
Das im Skript beschriebene Phänomen ist der Space Time Trade off. In der technischen Informatik durften wir mit Assembler programmieren und konnten so den Speicher- und Rechenzeitverbrauch unserer Programme konkret nachvollziehen. Der Zusammenhang müsste den meisten daher klar sein: um Speicherplatz zu sparen kann ich z. B. Schleifen ausschreiben. Der Code wird größer aber das Sprungziel der Schleife muss nicht gespeichert werden. Ebenso ergeht es uns mit komprimierten Daten (angelehnt an den Artikel aus der Wikipedia): wir sparen Speicherplatz, vergeuden aber zum Packen und Entpacken Rechenzeit.
Im Skript sind einige Zusammenhänge zwischen Rechenzeit und Speicherbedarf aufgestellt. Es gibt ein Mindestmaß an Speicherplatz, was ein Algorithmus verbraucht und auch ein Maximum.
Da wir Eingabe- und Ausgabeband nicht berücksichtigen ist der Bandbedarf bei der Eingabecodierung festgelegt. Er beträgt die Anzahl der Bänder . Damit ist der Speicherplatzbedarf , der Anfangskonfiguration genau gleich . Auch kann er sich in einem Schritt maximal um eines erhöhen, denn wir können ja nur etwas anfügen. Damit sagt der obere Satz nichts weiter aus als: "Der Bandbedarf bei der Eingabe von ist der Anzahl der Schritte bei der Eingabe von plus , eben der Anzahl der Bänder.
"Die Anzahl der Schritte bis zur Endkonfiguration bei der Eingabe von ist der Länge der Eingabe + 1 ". Wie kommen wir auf ? Hier müssen wir etwas ausholen:
- ist die Anzahl der Zustände der Maschine, die Größe des Arbeitsalphabets + 1. Da wir Marker haben, haben wir Zustände.
- Auf dem Eingabeband kann es Werte für die Kopfposition haben (Länge des Eingabewortes plus Anfangs- und Endmarker und $).
- Auf einem Arbeitsband ist die Länge des darauf stehenden Wortes sicher , d.h. definitiv kleiner/gleich dem kompletten Speicherplatzbedarf am Ende der Berechnung. Damit kann es maximal Felder auf dem Arbeitsband geben und damit auch Kopfpositionen. Jedes der Felder kann entweder beschriftet sein oder nicht (wir schauen nach oben: ist die Größe des Arbeitsalphabets). Diese sind damit durch beschränkt.
- Die Möglichkeiten für die Belegung aller Arbeitsbänder ist daher höchstens: .
Und damit haben wir maximal Äquivalenzklassen, was uns zu der obigen Abschätzung bringt: .
Hier muss ich erstmal passen. Der Beweis erschließt sich mir nicht auf Anhieb. Sobald ich die Zusammenfassung von TIA, KE7 fertig habe werde ich hier nochmal reinschauen. Wer jedoch bis dahin den 3. Teil des Zusammenhangs in klaren Worten ausdrücken kann, kann es bitte in die Kommentare schreiben. Ich pflege das dann sofort ein.
Antwort zum Lernziel: der Zusammenhang zwischen Zweit- und Bandkomplexität begründet sich in dem sog. Time-Space-Tradeoff. Häufig gelingt es uns einen Algorithmus schneller ausführen zu können, was jedoch oft zum Nachteil des Speicherplatzverbrauchs geschieht. Anders herum können wir mit einen höheren Speicherplatzverbrauch durchaus Geschwindigkeitsvorteile erzielen.
Ein prominentes Beispiel ist z.B. der Einsatz von Packern, die Daten komprimieren um Speicherplatz zu sparen, aber Rechenzeit aufwenden, da diese Daten wieder entkomprimiert werden müssen.
Auch gibt es Untergrenzen, z.B. für die Geschwindigkeit: um eine Eingabe der Länge zu lesen, brauchen wir mindestens Rechenschritte. Ebenso ergeht es uns mit dem Speicherplatz, denn wir können in jedem Schritt nur ein Feld auf dem Band schreiben. D.h. wir können bei Schritten bis zur Endkonfiguration nicht mehr als Felder des Bandes beschrieben haben.
Lernziel 4
Darstellung der Aussage der Bandreduktionssätze und Beweisidee
Bei der Normierung werden (ähnlich wie beim Entfernen der Hilfssymbole) die alten Befehle durch Befehlsfolgen ersetzt. Dabei werden auch die Worte wie gehabt verschlüsselt. Ebenso erhöht sich der Bandbedarf (er wird durch die Mächtigkeit des Arbeitsalphabets der ursprünglichen Maschine bestimmt). Ähnlich verhält es sich mit den Arbeitsbändern: wir können durch Erhöhung des Bandbedarfs die Arbeitsbänder auf Eines reduzieren indem wir die Kopfpositionen durch Markierungen auf dem Band (Spuren) simulieren.
Der Zeit- und Bandbedarf der neuen Maschine kann dann abgeschätzt werden durch:
Eine Effizienzsteigerung im Bereich Zeit erzielt man hier nur noch mit zwei Arbeitsbändern statt nur einem zur Simulation von Arbeitsbändern
Antwort zum Lernziel: Bei der Normierung einer Turing-Maschine, so dass diese nur ein Arbeitsband hat werden alle anderen Arbeitsbänder auf das einzig verbliebene Arbeitsband codiert. Das geschieht in ähnlicher Weise wie bei den Hilfssymbolen: die Symbole aus dem Arbeitsalphabet werden durch Worte verschlüsselt. Bei den Kopfpositionen arbeiten wir mit und auf dem Band. Das bringt uns zur oberen Abschätzung wenn wir nur ein Arbeitsband verwenden.
Verwenden wir zwei Arbeitsbänder können wir zumindest im Bereich Zeit die Effizient erhöhen und kommen so zur unteren Abschätzung. Hier werden zusätzlich Teile der Spuren mit dem zweiten Arbeitsband so verschoben, dass die Kopfmarkierungen auf den versch. Spuren stets an der selben Position sind (im Skript ist dazu kein detaillierter Beweis angegeben).
Die Band- und Zeitkomplexität wird durch die Normierung nur durch eine Konstante erhöht, so dass sie nicht groß ins Gewicht fällt.
Buchempfehlung
August 19th, 2013 12:40
Sag mal, im ersten Beispiel:
Ausgabeband ist doch Band 0 und das Eingabeband Band 1!
Gruß
Philipp
August 19th, 2013 15:54
Hast Recht, ist geändert 😉
April 4th, 2014 09:22
Hallo, kann es sein, dass da im Lernziel 3 zu Punkt 2 ein Tippfehler ist? Du schreibst: c := 21 * (2g)^k. Nicht, dass ich wirklich verstehen würde, was da passiert, aber im Script steht c:=2q * (2g)^k.
Gruss, Carina
April 4th, 2014 13:03
Du hast Recht, ist gefixt.
April 3rd, 2015 11:38
Hallo, kann es sein das bei deinem Flussdiagramm in der Markenfolge 1 - 2 - 3 noch eine weiter Marke mit 2:R fehlt ? Die Maschine schreibt zwar fleißig eine 1 auf das Arbeitsband, bewegt sich aber nie nach rechts womit das Feld - für mein Verständnis - immer wieder überschrieben wird. Gruß Alex
April 7th, 2015 11:40
Alex, hattest recht. Danke.
Mai 7th, 2015 00:06
Hallo Anton, ich glaube da gibt es noch ein paar Fehler auf Grund von bisherigen Updates.
1. Lernziel 1: Erkannte Akzeptierte Sprachen, 4. Absatz
IST:
Wir haben also eine Positiv- oder Negativetnscheidung.
Denke sollte sein:
Wir haben also eine Positiv- oder vielleicht ein Negativentscheidung (kann aber auch nicht halten.)
2. 1. Beispiel Band- und Zeitkomplexität, 1. Absatz
IST:
Nachdem wir ein Zeichen auf ein Band geschrieben haben müssen wir den Schreibkopf auch nicht eine Stelle weiter rücken, da wir im Skript die (TM) dahingehend erweitert haben, dass das automatisch passiert.
Denke sollte sein (Flussdiagramm schon mit Update 4 behoben):
Nachdem wir ein Zeichen auf ein Band geschrieben haben müssen wir den Schreibkopf bei Band 0 auch nicht eine Stelle weiter rücken, da wir im Skript die (TM) dahingehend erweitert haben, dass das automatisch passiert.
3. Analyse der Laufzeit:
IST - Marken:
0,1,2,3,4,1,2,3,4,1,5,6,7,6,7,6,7,6,7,6,8,9,10,11,9,10,11,9,10,11,9,12.
Denke das einmal 6,7 zuviel drin ist, kommt vermutlich noch daher, dass mal angenommen wurde, jeder Schreibbefehl bewegt den Kopf eins weiter. Es ist aber nur bei Band 0 so.
Somit sind es also nur 30 besuchte Marken.
4. Berechnung der Marken 6 und 7:
IST:
Marken 6 und 7 werden 2∗(2+2)=8 besucht. Wir haben am Ende unseren Lesekopf auf dem Anfangszeichen c bei Band 2, wo ja am Ende "c111 $" steht. Also laufen wir insgesamt 8 Mal zurück bis wir wieder auf dem Anfangsmarker c landen. Anschließend wird noch einmal Marke 6 abgefragt und wir kommen auf 9 Schritte
Denke es müsste sein:
Marken 6 und 7 werden 2∗(2+1)=6 besucht. Wir haben am Ende unseren Lesekopf auf dem Anfangszeichen c bei Band 2, wo ja am Ende "c111$" steht. Also laufen wir insgesamt 3 Mal zurück bis wir wieder auf dem Anfangsmarker c landen. Anschließend wird noch einmal Marke 6 abgefragt und wir kommen auf 7 Schritte
5. Die Gleichung:
IST:
1+4n+1+1+2(n+2)+1+1+3(n+1)+1+1=9n+14.
tM(n)=9n+14.
Denke sollte sein:
1+4n+1+1+2(n+1)+1+1+3(n+1)+1+1=9n+12.
tM(n)=9n+12.
6. Bandkomplexität: Konfigurationen:
IST:
bei der Eingabe von n=2=11: (0,(c11$,c,c)). Die von da aus erreiche Endkonfiguration wäre: (11,(c11$,c111$,c111$)).
Denke sollte sein (da ja Band 0 und 1 getauscht wurden:
bei der Eingabe von n=2=11: (0,(c,c11$,c)). Die von da aus erreiche Endkonfiguration wäre: (12,(c111$,c11$,c111$)).
Danke dir herzlich für deine tolle Arbeit.
Gruß
Walter
Mai 7th, 2015 09:17
Ist berichtigt. Danke!