TIB: Kontextfreie Sprachen und Kellerautomaten (Lernziele KE7 3/3, Update 1)
Update: Fehler im Automaten behoben.
Letzter Beitrag zum Thema... ich tippe besonders langsam, versprochen
Lernziel 5
Was sind determinierte Kellerautomaten?
Wir könnten zwar mit nichtdeterministischen Kellerautomaten leben und würden es sogar. Aber es gibt da ein Problem: wir können sie technisch nicht realisieren.
Den determinierten Kellerautomaten hatten wir im vorherigen Beitrag auch bereits definiert. Uns interessiert deshalb nicht was sie sind, sondern vielmehr wie sie sich von nichtdeterministischen Kellerautomaten unterscheiden und was das für Auswirkungen auf die erkannte Sprachklasse hat.
Eine echte Teilmenge der von nichtdeterminierten Kellerautomaten erkannten, kontextfreien Sprachen ist die deterministische kontextfreie Sprache:
Deterministisch kontextfrei
Eine Sprache ist deterministisch kontextfrei wenn es einen determinierten Kellerautomaten gibt, der sie erkennt.
Das Erkennen bedeutet folgendes:
Wenn eine deterministisch kontextfreie Sprache ist, dann gibt es einen Kellerautomaten mit einem Zustand , so dass für alle Worte gilt:
Das Wort ist Teil der deterministisch kontextfreien Sprache wenn es eine Überführungsfolge im Automaten gibt, die ausgehend vom Anfangszustand in einen akzeptierenden Endzustand mündet und die Eingabe zu Ende gelesen wurde, wobei der Keller leer ist.
Das Wort ist nicht Teil der deterministisch kontextfreien Sprache wenn es eine Überführungsfolge im Automaten gibt, die ausgehend vom Anfangszustand in einen nicht-akzeptierenden Endzustand mündet und die Eingabe zu Ende gelesen wurde, wobei der Keller leer ist.
Sie ist zudem auch noch eindeutig:
Jede deterministisch erkannte Sprache ist eindeutig*.
* erinnert Ihr euch noch an die Eindeutigkeit? Fall nicht: jedes abgeleitete Wort einer eindeutigen Sprache/Grammatik hat nur einen einzigen Ableitungsbaum.
Wir zeigen gleich, dass die deterministischen Automaten weniger leistungsfähig sind. Folgende Überlegungen sind notwendig:
1. ein deterministischer Kellerautomat akzeptiert nur Worte, die er zu Ende liest. Wir müssen daher unseren deterministischen Automaten entsprechen ummodellieren und die Szenarien vermeiden, wo der Automat nicht weiterlesen kann:
a) Keller leer bevor Eingabe zu Ende.
Lösung: neues Keller-Leerheits-Zeichen, dass nie gelöscht wird.
b) keine Folgekonfiguration für aktuelle Konfiguration vorhanden
Lösung: Vervollständigen von , so dass wir zu jeder Möglichkeit einen Folgezustand haben
c) das Erreichen eines Zyklus, wo der Kopf nicht bewegt wird
Lösung: Erkennen und vermeiden des Zyklus.
2. Wir haben einen ausgezeichneten, positiven Endzustand: entweder er akzeptiert das Wort und wir landen in oder nicht und wir landen in .
Mit der Vorarbeit aus dem letzten Beitrag, ist es nicht schwer diese weiteren Einschränkungen nachzuvollziehen.
Der Beweis für die Komplementbildung gelingt durch simples Vertauschen der Zustände und , so dass wir diese Eigenschaft zusammenfasen können:
Sei deterministisch kontextfrei, so ist es auch .
Antwort zum Lernziel: Kellerautomaten (PDAs) sind endliche Automaten, die durch einen Kellerspeicher erweitert wurden. Bei einem Kellerautomaten wird ein Wort dann erkannt wenn der Keller leer ist oder der Automat in einem Endzustand landet (oder beides gleichzeitig).
Für einen determinierten Kellerautomaten gilt zudem, dass es für jedes Eingabezeichen und jedes oberste Kellerzeichen nur einen Zustandsübergang gibt, so dass der Kellerautomat den Berechnungsweg nicht zufällig wählen kann. Ist das nicht der Fall und gibt es zu einem Eingabezeichen und einem obersten Kellerzeichen mehrere mögliche Folgezustände, so ist der Kellerautomat nichtdeterministisch.
Für eine deterministisch kontextfreie Sprache bedeutet es, dass wir in jedem Fall für ein Wort nach endlich vielen Schritten die Endkonfiguration (ausgewiesener Endzustand, Ende der Eingabe, leerer Keller) oder für ein Wort (beliebiger Zustand aus , Ende der Eingabe, leerer Keller) erreichen.
Lernziel 6
Ist jede kontextfreie Sprache deterministisch? Mit Begründung!
Ein (für mich) etwas verständlicheres Beispiel habe ich in den Folien der HU-Berlin gefunden und würde das hier gerne anbringen. Nehmen wir zwei deterministisch kontextfreie Sprachen (DCFL), die von einem determinierten Automaten erkannt wird, z.B.
sowie
.
Beide Sprachen sind deterministisch kontextfrei. Wir können also einen deterministischen Kellerautomaten angeben, der sie erkennt.
Um zu entscheiden, können wir uns z.B. darauf beschränken die einzulesen, in den Keller zu schreiben und anschließend die einzulesen und die aus dem Keller zu entfernen. Es sind drei Fälle zu unterscheiden:
1. Gab es weniger als , so haben wir noch auf dem Eingabeband, während der Keller bereits leer ist und alles ist gut.
2. Gab es mehr als , so haben wir keine auf dem Eingabeband, während noch im Keller sind und alles ist immernoch gut.
3. Gab es die gleiche Anzahl und , so haben wir einen leeren Keller just in dem Moment, wo wir keine auf dem Eingabeband haben und das Wort wird abgelehnt.
Das gleiche Verfahren klappt auch mit (nur mit und statt mit und ).
Schauen wir uns doch eine weitere Sprache an:
oder .
Wie man sieht, ist das eine Vereinigung der beiden Sprachen und . Um das etwas anschaulicher zu machen, schauen wir uns die Mengen doch einmal mit an:
Während wir für für und die Vereinigung der beiden Sprachen sogar einen endlichen Automaten angeben können, der sie erkennt (wir erinnern uns: das ist genau der Grund warum alle endlichen Sprachen sogar regulär sind, ein akzeptierender Zustand pro Wort reicht im endlichen Automaten aus um die Sprachen zu erkennen), gelingt es uns bei nur für sowie einen Kellerautomaten anzugeben, der die Sprache erkennt (wir müssen die Anzahl der Buchstaben beobachen können und können das nur mindestens mit einem Kellerautomaten. Mindestens weil Turingmaschinen als stärkstes Berechnungsmodell selbstverständlich auch gehen, denn sie können ja selbst Typ-0-Sprachen erkennen).
Weit mehr Probleme macht uns die Vereinigung! Das Problem mit ihr ist: sie ist zwar kontextfrei, aber nicht deterministisch kontextfrei. Denn dafür können wir keine deterministische Kellermaschine angeben, sie sie erkennt.
Woran liegt das? Wie wir oben gesehen haben, beobachten wir mit dem Keller nur eine Variable (die Anzahl unserer ersten, eingelesenen Buchstaben) und können so eine andere abhängig von dieser entscheiden. Das ist bei den Sprachen und ja kein Problem. Bei haben wir jedoch drei Variablen, die von einander abhängig sind. Denn wir müssen in Abhängigkeit von und in Abhängigkeit von prüfen. Das war's also mit dem Determinismus, denn wir haben mehrere Wege, die wir beschreiten müssen um am Ende einen zu finden, der funktioniert.
Die kontextfreie Grammatik für ist:
Und daraus können wir den zugehörigen Automaten nach dem Schema aus dem vorherigen Beitrag bauen:
Download: AiBjCk_NPDA_JFLAP-Datei
Damit haben wir auch eine wesentliche Aussage für das nächste Lernziel herausgearbeitet: dass wir keinen deterministischen Automaten für angeben können liegt daran, das die deterministisch kontextfreien Sprachen zwar abgeschlossen sind bzgl. Schnitt und Komplement, aber nicht gegen Vereinigung, Durchschnitt, Spiegelung und Konkatenation! Und das obere Beispiel war die Vereinigung. Beispiele für Durchschnitt, Spiegelung und Konkatenation überlasse ich erstmal euch
Zusammengefasst: Wir haben mit dem deterministischen Kellerautomaten, welche die Sprache erkennt, tatsächlich eine Beschneidung der Möglichkeiten, die uns ein nichtdeterministischer Kellerautomat bietet: wir können nicht mehr zwischen Berechnungspfaden wählen und sind an unsere Wahl "gebunden". War sie falsch, so landen wir in einer Sackgasse und damit war es das. Bei einem nichtdeterministischen Automaten haben wir währenddessen (durch mehrere Folgekonfigurationen für eine Konfiguration) bereits andere Wege parallel beschritten, wo uns einer (wenn wir einen korrekten Automaten angegeben haben) schon zur Lösung führen wird. War eine Berechnung falsch, so landen wir auf diesem einen Weg in einer Sackgasse und ... es ist uns egal. Wir haben ja noch genug andere Wege, die wir parallel beschreiten.
Hauptsache wir können beweisen, dass min. einer dieser Wege zu einem Ergebnis führt und entscheidet ob ein Wort sich in der Sprache befindet. Tut es das nicht, kann der nichtdeterministische Automat von uns aus solange weiterrechnen, bis er schwarz wird.
Ein Blick aus einer anderen Brille: Um bei der Sprache entscheiden zu können ob ein Wort tatsächlich zur Sprache gehört oder nicht, ist der Algorithmus wirklich einfach: Wir zählen die , und , speichern die Anzahl auf dem Hilfsband und vergleichen die drei Variablen nachdem wir die Eingabe vollständig eingelesen haben miteinander. Ihr habt sicher schon eine TM im Kopf, die das macht. Während wir das also mit einer DTM problemlos machen können, schaffen wir das mit einem PDA durch die Einschränkungen leider nicht.
Antwort zum Lernziel: Nicht jede kontextfreie Sprache ist deterministisch. Es gibt kontextfreie Sprachen, die aufgrund ihrer Struktur nicht von einem PDA erkannt werden können weil ihr Aufbau von mehreren Variablen abhängt, diese jedoch nicht durch einen einzigen Kellerspeicher deterministisch abgebildet werden können. Erst durch das Beschreiten mehrerer Berechnungspfade ist es möglich auch mehrere Variablen in die Betrachtung einzubeziehen und aus der so generierten Vielzahl an Pfaden die Aussage zu treffen, dass einer in jedem Fall zum Ziel führt wenn das Wort sich in der Sprache befindet.
Eine solche kontextfreie, aber nicht deterministische Sprache lässt sich durch Vereinigung, Konkatenation, Durchschnitt oder Spiegelung einer oder mit mehreren deterministisch kontextfreien Sprachen erzeugen, da die Sprachklasse der deterministisch kontextfreien Sprachen nicht abgeschlossen gegen diese Operationen ist.
Lernziel 7
Sind die kontextfreien bzw. deterministisch kontextfreien Sprachen abgeschlossen unter Vereinigung, Durchschnitt, Komplement und Schnitt mit regulären Mengen?
Was soll ich hier schreiben? Reicht die Tabelle aus dem Skript? Ihr solltet euch noch einmal vor Augen führen, wie die Sprachklassen zusammenhängen und die Beziehungen zwischen Unter- und Oberklasse sind. Dann wird euch auch deutlich warum diese gegen gewisse Operationen nicht abgeschlossen sein können. Vielleicht schreibe ich später noch ein paar Sätze dazu, aber bis dahin:
Antwort zum Lernziel:
kontextfrei | deterministisch | |
Vereinigung | + | - |
Durchschnitt | - | - |
Komplement | - | + |
Konkatenation | + | - |
Stern | + | - |
Schnitt mit regulären Mengen | + | + |
Lernziel 8
Welche der folgenden Probleme sind für kontextfreie Grammatiken entscheidbar/unentscheidbar? Wortproblem, Endlichkeitsproblem, Leerheitsproblem?
Hier sollten wir einige Probleme auf den Mengen entscheiden können, diese sind:
- Wortproblem: ob sich ein Wort in der Sprache befindet (oder nicht).
- Inklusion: ob die Worte einer Sprache in einer anderen Sprache enthalten sind
- Äquivalenz: ob die Sprache die gleiche Sprache wie ist.
- Leerheit: ob die Sprache leer ist, d.h. wir können mir der Grammatik, die die Sprache erzeugt keine Wörter erzeugen. Achtung: jede leere Sprache ist regulär.
- Endlichkeit: ob die Sprache endlich ist (endliche Sprache = reguläre Sprache = endlicher Automat)
- Universalität: ob die Sprache alle Kombinationen der Elemente aus dem Alphabet umfasst
- Eindeutigkeit: ob es für ein Wort nur einen Ableitungsbaum gibt.
- Determiniertheit: es gibt einen deterministischen Kellerautomaten, der entscheidet ob zur Sprache gehört oder nicht.
Antwort zum Lernziel:
kontextfrei | deterministisch | |
Wortproblem | + | + |
Inklusion | - | - |
Äquivalenz | - | + |
Leerheit | + | + |
Endlichkeit | + | + |
Universalität | - | + |
Eindeutigkeit | - | + |
Determiniertheit | - | + |
Damit haben wir auch die letzte Kurseinheit durch. Hoffentlich konntet Ihr etwas mit den Zusammenfassungen anfangen und es haben sich keine Fehler eingeschlichen. Wenn doch: ab damit in die Kommentare!