P-NP-Problem und das Problem des Handlungsreisenden
Bei dem -Problem geht es um die Frage wie die beiden Komplexitätsklassen zueinander stehen. Das Skript fasst sich nur sehr kurz, was  dieses Thema angeht, so dass ich beschlossen habe es hier noch einmal im Detail aufzuarbeiten.
Das -Problem gehört zu den Millenium-Problemen, d.h. es winken eine Million USD wenn es gelöst wird. Aber eine Million USD sind im Vergleich zu den Folgen, die z.B. (beide Komplexitätsklassen sind gleich) auslösen würde keine Erwähnung wert. Es wäre uns auf einen Schlag möglich für jedes Problem in einen effizienten Algorithmus anzugeben.
Als Beispiel nehmen wir das Faktorisierungsverfahren, auf dem sehr viele kryptographische Algorithmen (u.a. RSA oder das Verfahren von Diffie-Hellmann zum Schlüsselaustausch) basieren. Diese Algorithmen gehen davon aus, dass das Faktorisierungsproblem nicht effizient zu lösen ist. Es wäre das blanke Chaos, würde sich herausstellen, dass . wäre hingegen nicht so schlimm.
Machen wir uns einmal klar, was und denn nun wirklich sind. Dazu betrachten wir zunächst eine etwas größere Klasse.
Klassifizierung
In liegen Probleme, die auf einer deterministischen Turingmaschine in , d.h. in exponentieller Zeit, entschieden werden können. Hier ist die Eingabelänge.
Es ist nicht schwer zu sehen, dass man hier nur für sehr kleine Probleminstanzen effizient nach einer Lösung suchen kann. Für größere Eingabelängen wird die Suche ungleich schwerer.
Was wäre so ein Problem, dass deterministisch in exponentieller Zeit lösbar wäre? Na klar, das Problem des Handlungsreisenden (auch TSP, travelling salesman, genannt). Der folgende Abschnitt basiert mehrheitlich auf dem Artikel aus der Wikipedia.
Beispiel TSP
Das TSP gehört zur der Klasse der Optimierungsprobleme. Bei diesem Problem geht es darum für eine gegebene Anzahl Städte und einer Entfernung zwischen diesen den kürzesten Weg für einen Rundkurs zu finden.
Diese Problem hat eine Vielzahl an Anwendungsmöglichkeiten (Logistik, Design von Mikrochips, etc.), so dass eine optimale Lösung durchaus wünschenswert erscheint.
Leider haben wir hier, in Abhängigkeit der Anzahl der zu besuchenden Punkte, nur dann eine optimale Lösung wenn wir jeden Punkt prüfen. Das Wachstum ist also exponentiell und zweifellos gehört TSP zur Klasse , zumindest bei seinem deterministischen Lösungsansatz.
Auch wenn mittlerweile für mehrere Tausend Punkte optimale Lösungen durch heuristische und exakte Verfahren gefunden wurden, so bleibt das Problem gleich: mit wachsendem (der Anzahl der Punkte) steigt unser Aufwand immer noch exponentiell.
Graphisch ausgedrückt (geklaut aus der Wikipedia):
Frage: Wie ist der kürzeste Weg von nach über alle Punkte?
Während das bei Punkten noch einfach ist, wird es für Punkte schon deutlich schwerer.
Es sind derzeit nur effiziente, heuristische Algorithmen bekannt, die die Lösung approximieren. Z.B. der Algorithmus von Christofides, der in polynomieller Laufzeit eine Lösung approximieren kann, die maximal Mal so lang ist wie die optimale Lösung.
Für exakte Lösungen gilt: jede Rundreise muss berechnet und die kürzeste ausgewählt werden. Bei Städten haben wir Mrd. Möglichkeiten. Hat man einen Rechner, der die Lösung für Städte in einer Stunde berechnet, dann braucht dieser für zwei zusätzliche Städte annähernd die tausendfache Zeit; das sind mehr als Tage.
Die Folien der RWTH Aachen zeigen eine schöne Tabelle, die ich hier Snapshotten möchte:
Das Beispiel führt vor Augen, dass uns sehr daran gelegen, dass wir Probleme nicht in Exponentialzeit lösen müssen.
Nachdem wir die Optimierungsvariante haben, kommen wir zum Bindeglied des zu der Klasse : uns geht es zunächst nicht um Optimierung, sondern um eine Entscheidung.
Die Entscheidungsvariante des ist:
Gibt es eine Tour mit Kosten ?
Und hier beginnt unsere Reise: während wir hier wieder alle Wege durchprobieren und so in der Klasse der Exponentialzeit-Algorithmen landen, können wir uns das Leben deutlich einfacher machen. Aber dazu gleich mehr.
Ich gehe auf das nun nicht weiter ein, da es mir nur um geht und die Ausführungen bis hierhin für diese Betrachtung ausreichen.
Kleiner Exkurs zum Schluss: Durch die Hierarchiesätze können wir z.B. zeigen, dass ist. Damit gibt es in Probleme, die nicht in liegen.
Klassifizierung
Ein Problem in bedeutet, dass es effizient lösbar ist. Effizient heißt: die deterministische Turingmaschine, die das Problem löst ist nach oben durch ein Polynom beschränkt, wobei die Länge der Eingabe ist. Wichtig hieran ist: ist zwar beliebig, aber absolut unabhängig von unserer Eingabe!
Ein Beispiel für ein Problem in der Komplexitätsklasse ist das .
Beispiel
Hier ist die Frage ob eine Zahl eine Primzahl ist oder nicht.
Die Antwort auf diese Frage ist ziemlich simpel: wir testen einfach aus ob alle Zahlen von bis unsere Zahl ohne Rest teilen können. Wenn das nicht der Fall ist, ist die Zahl eine Primzahl.
Mit dem AKS-Algorithmus gibt es sogar einen, der das in Polynomzeit entscheiden kann. Damit gehört tatsächlich zur Komplexitätsklasse .
Nach dem der Urvater der AKS-Algorithmen gefunden wurde, wurden weitere ersonnen, die die Laufzeit noch ein Stück nach unten korrigierten. Der schnellste bekannte Algorithmus aus der AKS-Familie terminiert in .
Kommen wir nun zur Komplexitätsklasse, die uns so brennend interessiert.
Klassifizierung
Ist ein Problem in , so bedeutet es, dass es effizient prüfbar ist. In diesem Fall heißt effizient ebenfalls: die deterministische Turingmaschine, die prüft ob das Zertifikat zum Problem (ein Zertifikat ist ein Lösungsvorschlag für ein Problem), ist nach oben durch ein Polynom beschränkt, wobei die Länge der Eingabe ist.
Gemerkt, was der Unterschied zwischen und ist? Es ist ein Unterschied ob wir ein Problem lösen oder "nur" einen Lösungsvorschlag prüfen.
Was bedeutet es für unser ?
Beispiel -Instanz
Nehmen wir unsere Punkte aus dem obigen Beispiel und stellen uns die Frage:
Gibt es einen Weg von nach mit Länge ?
Das ist ein Entscheidungsproblem. Und hier müssten wir im schlimmsten Fall nun alle Wege durchprobieren bis wir einen Weg finden, der kürzer als/gleich ist. Was bei vielen Punkten schon eine beträchtliche Zeit in Anspruch nehmen kann, wie wir gesehen haben. Dieses "Durchprobieren" ist genau unser aus . Das Orakeln einer Lösung.
Lassen wir das Orakeln weg und geben eine Lösung vor, bleibt nur noch : die Prüfung einer gegebenen Lösung auf ihre Korrektheit. Und das können wir ziemlich zackig bewerkstelligen:
Wir prüfen die Kanten zwischen den Knoten und rechnen sie einfach zusammen:
Nope, das war nichts. Versuchen wir es mit:
Bingo!
Man sieht leicht, dass wir zur Prüfung einer vorgegebenen Lösung auf einer deterministischen Turingmaschine deutlich weniger Zeit benötigen als alle Wege durchzuprobieren.
Und nun holen wir uns unser aus , indem wir orakeln. Wir raten einfach alle Kombinationen und prüfen sie polynomiell durch unsere deterministische "Kontrollturingmaschine".
Im Schlimmsten Fall haben wir zwar immer noch einen exponentiellen Aufwand, aber vielleicht raten wir so gut, dass die Kombination  die erste geratene Möglichkeit ist und wir schon nach dem ersten Orakeln eine Lösung gefunden haben.
Und genau das bedeutet : raten und prüfen. Oder ganz, ganz frei interpretiert: Orakel und rüfen.
Codieren wir den Graphen als Turingmaschine, so hat z.B. der Zustand drei mögliche Folgezustände (wir können zu , oder reisen). Es existieren also drei mögliche Zustandsübergänge, von denen wir einen wählen können. Genau hier beginnt das Raten/Orakeln, unser aus . Anschließend haben wir zwei Möglichkeiten zur Auswahl, usw.
So geht dann unsere für das vor und rät eine Rundreise. Wir brechen ab wenn die Kosten höher sind als oder wir bei unserem Ausgangsknoten landen ohne alle Knoten besucht zu haben.
Zusammenfassend lässt sich sagen: bedeutet orakeln und prüfen. Und das Prüfen geschieht in maximal polynomieller Zeit.
Habt Ihr nun ein Gefühl dafür, was bedeutet? Gut.
Nachdem wir nun alle notwendigen Komplexitätsklassen , und besprochen haben, sollte euch klar sein wie der Zusammenhang zwischen und ist.
Jetzt können wir auch die Frage stellen, die das -Problem beschreibt:
Gilt oder ?
In Worten:
Sind die Klassen und gleich oder nicht,
bzw.
kann jede Sprache, die nicht-deterministisch in Polynomzeit entschieden werden kann auch deterministisch in Polynomzeit entschieden werden?
Derzeit gehen alle die meisten von letzterem aus. Die Folgen wären, wie gesagt, übersichtlich wenn das stimmt. Dafür müssten wir nur zeigen, dass es in Probleme gibt, die definitiv nicht deterministisch polynomiell lösbar, also nicht in sind.
Graphisch aufgearbeitet sieht die hier beleuchtete, problematische Beziehung zwischen und so aus:
Entnommen aus den Folien der TUM.
Und welche Möglichkeiten haben wir nun um oder zu beweisen?
- Konstruktiver Beweis
Wir finden einen polynomiellen Algorithmus, der ein -Vollständiges Problem polynomiell löst. Die Vollständigkeit ist wichtig, so dass wir diesen Algorithmus auch auf alle anderen aus reduzieren können müssen um die Klasse komplett abzudecken.
Schaffen wir es also z.B. deterministisch polynomiell zu lösen, haben wir - da eben -vollständig ist, nichts geringeres als bewiesen. - Nicht-konstruktiver Beweis
Nicht-konstruktiv bedeutet, dass man keine konkrete Lösung angibt, aber eindeutig auf die Existenz einer Lösung schließen kann.
Man kann hier auch einen indirekten Beweis führen, indem man annimmt, es gäbe keine Lösung und diesen Satz zu einem Widerspruch führt. Daraus kann man dann schließen, dass es eine Lösung geben muss. Aber welche das ist, wird nicht genannt.
Also an die Arbeit
Ich hoffe, ich konnte euch die Beziehung zwischen und in diesem Beitrag etwas deutlicher machen.
Wie immer: Bei Ungenauigkeiten, ab in die Kommentare.