Theo

Teil 1: Formale Sprachen

1. Grundbegriffe:

Alphabet
$Σ$ : Endliche Menge
Wort / String über
$Σ$ : endliche Folge von Zeichen aus
$Σ$
|w|: Länge des Wortes w
Leeres Wort:
$ϵ$
u, v: wörter -> uv: Konkatenation
w: wort, wⁿ definiert durch: w⁰ =
$ϵ$ , wⁿ⁺¹ = wwⁿ
$Σ^{*}$ : Menge aller Wörter über
$Σ$
Teilmenge
$L \subseteq Σ^{*}$ : (formale) Sprache

Operationen auf Sprachen

Seien

A, B \subseteq Σ^{*}

Konkatenation: AB =
${u v | u \in A \land v \in B}$
Merke: {ab,b}
$\times$ {a,bb} = {(ab,a),(ab,bb),(b,a),(b,bb)}
$A^{n}$ =
${w_{1} \dots w_{n} | w_{1}, \dots, w_{n} \in A}$ =
$A \dots A$
$A^{*}$ =
${w_{1} \dots w_{n} | n \geq 0 \land w_{1}, \dots, w_{n} \in A$ } =
$⋃_{n \in N} A^{n}$
$A^{+}$ =
$A A^{*}$ =
$⋃_{n \geq 1} A^{n}$
Achtung: für alle A:
$ϵ \in A^{*}$ ,
$\emptyset^{*} = {ϵ}$

Einige Rechenregeln

$\emptyset A = \emptyset$
${ϵ} A = A$
$A (B \cup C) = A B \cup A C$
$(A \cup B) C = A C \cup B C$
$A^{*} A^{*} = A^{*}$
Achtung: i.A. gilt
$A (B \cap C) = A B \cap A C$ nicht.

1.1 Grammatiken

Eine Grammatik ist ein 4-Tupel G = (V,

Σ

, P, S), wobei:

V: endliche Menge von Nichtterminalen
$Σ$ : endliche Menge von Terminalen, disjunkt von V, auch Alphabet genannt
$P \subseteq (V \cup Σ)^{*} \times (V \cup Σ)^{*}$ : Endliche Menge von Produktionen
S
$\in$ V: Startsymbol

Eine Grammatik G = (V,

Σ

, P, S) induziert eine Ableitungsrelation

\to_{G}

auf Wörtern über V

\cup Σ

α \to_{G} α^{'} ⟺ \exists

eine Regel

β \to β^{'}

in P und Wörter

α_{1}, α_{2}

, sodass:

α = α_{1} β α_{2}

und

α^{'} = α_{1} β^{'} α_{2}

Eine Sequenz

α_{1} \to_{G} \dots \to_{G} α_{n}

ist eine Ableitung von

α_{n}

aus

α_{1}

Wenn

α_{1} = S

und

α_{n} \in Σ^{*}

, dann erzeugt G das wort

α_{n}

Sprache von G: L(G): Menge aller wörter, die von G erzeugt werden

1.2 Chomsky-Hierarchie

Eine Grammatik G ist vom
Typ 0: Immer
Typ 1: falls für jede Produktion

α \to β

außer

S \to ϵ

gilt:

| α | \leq | β |

Typ 2: falls G vom Typ 1 ist und für jede Produktion

α \to β

gilt:

α \in V

Typ 3: falls G vom Typ 2 ist und für jede Produktion

α \to β

außer

S \to ϵ

gilt:

β \in Σ \cup Σ V

Offensichtlich: Typ 3

\subset

Typ 2

\subset

Typ 1

\subset

Typ 0

Grammatiken und Sprachklassen:
Typ 3: Rechtslineare Grammatik: Reguläre Sprachen
Typ 2: Kontextfreie Grammatik: Kontextfreie Sprachen
Typ 1: Kontextsensitive Grammatik: Kontextsens. Sprachen
Typ 0: Phasenstrukturgrammatik: Rekursiv aufzählbare Sprachen

L(Typ 3)

\subset

L(Typ 2)

\subset

L(Typ 1)

\subset

L(Typ 0)

2. Reguläre Sprachen

2.1 Deterministische endliche Automaten (DFAs)

Ein DFA

M = (Q, Σ, δ, q_{0}, F)

besteht aus:

einer endlichen Menge an Zuständen Q
einem (endlichen) Eingabealphabet
$Σ$
einer (totalen) Übergangsfunktion
$δ : Q \times Σ \to Q$
einem Startzustand
$q_{0} \in Q$
einer Menge
$F \subseteq Q$ von Endzuständen
TODO: carlos camino DFA
Eine Sprache ist regulär gdw. sie von einem DFA akzeptiert wird

2.2 Nichtdeterministische endliche Automaten (NFAs)

Ein NFA ist ein 5-Tupel

N = (Q, Σ, δ, q_{0}, F)

, so dass:

$Q, Σ, q_{0}$ und
$F$ sind wie bei einem DFA
$δ : Q \times Σ \to P (Q)$

$P (Q)$ = Menge aller Teilmengen von
$Q = 2^{Q}$
Alternative: Relation
$δ \subseteq Q \times Σ \times Q$
TODO: carlos camino NFA

2.3 Äquivalenz von NFA und DFA

Für jeden NFA N gibt es einen DFA M mit L(N) = L(M)
Für einen NFA mit n Zuständen kann der entsprechende DFA bis zu 2ⁿ Zustände haben

2.4 NFAs mit
$ϵ$ -Übergängen

Diese Erweiterung von NFAs macht sie nicht mächtiger
Aber man kann manche Sprachen einfacher beschreiben als nur mit NFAs

Ein NFA mit

ϵ

-Übergängen auch

ϵ

-NFA ist ein NFA mit einem speziellen Symbol

ϵ \notin Σ

und mit

δ : Q \times (Σ \cup {ϵ}) \to P (Q)

Ein

ϵ

-Übergang darf ausgeführt werden, ohne dass ein Eingabezeichen gelesen wird
Formal:

ϵ

-NFA

N = (Q, Σ, δ, q_{0}, F)

als kompakte Repräsentation eines

ϵ

-freien NFA

N^{'} = (Q, Σ, δ^{'}, q_{0}, F^{'})

Per Definition: Jeder

ϵ

-NFA ist äquivalent zu einem NFA

TODO: carlos camino EDFA

Fazit: Die Automatentypen

DFA
NFA
$ϵ$ -NFA

sind gleich mächtig

2.5 Rechtslineare Grammatiken

rechtslineare Grammatiken haben nur Produktionen der Form

A \to a, A \to a B

und

S \to ϵ

Für jeden DFA M gibt es eine rechtslineare Grammatik G mit

L (M) = L (G)

Für jede rechtslineare Grammatik G gibt es einen NFA M mit

L (G) = L (M)

\to

das bedeutet auch: für jede rechtslineare Grammatik G gibt es einen DFA M mit

L (G) = L (M)

TODO: carlos camino RLG

2.6 Reguläre Ausdrücke

Reguläre Ausdrücke sind eine weitere Notation für die Definition von formalen Sprachen, und sind induktiv definiert:

$\emptyset$ ist ein RE
$ϵ$ ist ein RE
für jedes
$a \in Σ$ ist a ein regulärer Ausdruck
Wenn
$α$ und
$β$ reguläre ausdrücke sind, dann auch:
- $α β$
- $α | β$ , (oft
  $α + β$ geschrieben)
- $α^{*}$

Nichts sonst ist ein regulärer Ausdruck
Notation:

Reguläre Ausdrücke können bzw. müssen geklammert werden
Bindungsstärke: * stärker als Konkatenation stärker als |
$a b^{*} = a (b^{*}) \neq (a b)^{*}$
$a b | c = (a b) | c \neq a (b | c)$

Sprache

L (γ)

eines regulären Ausdrucks

γ

ist rekursiv definiert:

$L (\emptyset) = \emptyset$
$L (ϵ) = {ϵ}$
$L (a) = {a}$
$L (α β) = L (α) L (β)$
$L (α | β) = L (α) \cup L (β)$
$L (α^{*}) = L (α)^{*}$

Satz von Kleene: Eine Sprache

L \subseteq Σ^{*}

ist genau dann durch einen regulären Ausdruck darstellbar, wenn sie regulär ist.

TODO: NFA Konstruktion, Carlos Camino Cleene

Konversionen auf einen Blick:

$ϵ$ -NFA
$\to$ NFA: Q ~> Q
NFA
$\to$ DFA: n Zustände ~> O(2ⁿ) Zustände
NFA / DFA
$\to$ RE: n Zustände ~> RE der Länge O(n4ⁿ)
RE
$\to$
$ϵ$ -NFA: RE der Länge n ~> O(n) Zustände

2.7 Abschlusseigenschaften regulärer Sprachen

Seien

R, R_{1}, R_{2} \subseteq Σ^{*}

Reguläre Sprachen. Dann sind auch:

$R_{1} R_{2}$
$R_{1} \cup R_{2}$
$R^{*}$
$\overset{―}{R}$
$(:= Σ^{*} ∖ R)))$
$R_{1} \cap R_{2}$
$R_{1} ∖ R_{2}$

Reguläre Sprachen.
Bemerkung: Komplementierung

(\overset{―}{R})

durch vertauschen von Endzuständen und Nicht-Endzuständen funktioniert nur bei DFAs, nicht bei NFAs!

Produkt-Konstruktion: Durchschnitt direkt auf DFAs, ohne Umweg via de Morgan. Beide DFAs laufen synchron parallel, Wort wird akzeptiert wenn beide DFAs akzeptieren.
Parallelismus = Kreuzprodukt der Zustandsräume

Die Umkehrung (Spiegelung) von

w = a_{1} \dots a_{n}

ist

w^{R} := a_{n} \dots a_{1}

Die Umkehrung einer Sprache

A

ist

A^{R} := {w^{R} | w \in A}

Ist

A

eine reguläre Sprache, dann auch

A^{R}

2.8 Rechnen mit regulären Ausdrücken

Zwei reguläre Ausdrücke sind äquivalent gdw. sie die gleiche Sprache darstellen:

α \equiv β : ⟺ L (α) = L (β)

Null und Eins

$\emptyset | α \equiv α | \emptyset \equiv α$
$\emptyset α \equiv α \emptyset \equiv \emptyset$
$ϵ α \equiv α ϵ \equiv α$
$\emptyset^{*} \equiv ϵ$
$ϵ^{*} \equiv ϵ$

Assoziativität:

$(α | β) | γ \equiv α | (β | γ)$
$(α β) γ \equiv α (β γ)$

Kommutativität

$α | β \equiv β | α$

Distributivität

$α (β | γ) \equiv α β | α γ$
$(α | β) γ \equiv α γ | β γ$

Idempotenz:

$α | α \equiv α$

Stern:

$ϵ | α α^{*} \equiv α^{*}$
$α^{*} α \equiv α α^{*}$
$(α^{*})^{*} \equiv α^{*}$

Satz von Redko: Es gibt keine endliche Menge von gültigen Äquivalenzen aus denen sich alle gültigen Äquivalenzen herleiten lassen.

2.9 Pumping Lemma für Reguläre Sprachen

AKA: Wie zeigt man, dass eine Sprache nicht regulär ist?

Sei

R \subseteq Σ^{*}

regulär. Dann gibt es ein n > 0, so dass sich jedes

z \in R

mit

| z | \geq n

so in

z = u v w

zerlegen lässt, dass:

$v \neq ϵ$
$| u v | \leq n$
$\forall i \geq 0. u v^{i} w \in R$
TODO: understand pumping lemma, carlos camino pumping lemma

Bemerkung:
Es gibt nicht-reguläre Sprachen, für die das Pumping-Lemma gilt!

⟹

Pumping-Lemma hinreichend aber nicht notwendig um Nicht-Regularität zu zeigen
regulär
$\subset$ Pumping-Lemma gilt
$\subset$ alle Sprachen

2.10 Entscheidungsverfahren

Entscheidungsprobleme für reguläre Sprachen, d.h. Probleme der Gestalt

Eingabe: Ein oder mehrere Objekte, die reguläre Sprachen beschreiben (DFA, NFA, RE, Typ 3 Grammatik, etc.)
Frage: Haben diese Objekte die Eigenschaft X?

Ein (Entscheidungs)Problem ist entscheidbar, wenn es einen Algorithmus gibt, der bei jeder Eingabe in endlicher Zeit die richtige Antwort gibt.
Nicht alle Entscheidungsprobleme für Grammatiken sind entscheidbar

Sei D ein DFA, NFA, RE, rechtslineare Grammatik, etc.

Wortproblem: Gegeben w und D, gilt
$w \in L (D)$ ?
- Entscheidbar in
  $O (| w | + | M |)$ für Wort w und DFA M
- Entscheidbar in
  $O (| Q |^{2} | w | + | N |)$ für Wort w und NFA N
Leerheitsproblem: Gegeben D, gilt
$L (D) = \emptyset$ ?
- Entscheidbar in
  $O (| Q | | Σ |) / O (| Q^{2} | | Σ |)$ für DFAs/NFAs
Endlichkeitsproblem: Gegeben D, ist L(D) Endlich?
- Entscheidbar für DFAs oder NFAs
Äquivalenzproblem: Gegeben
$D_{1}, D_{2}$ , gilt
$L (D_{1}) = L (D_{2})$ ?
- Entscheidbar für DFAs in Zeit
  $O (| Q_{1} | | Q_{2} | | Σ |)$
- Entscheidbar für NFAs in Zeit
  $O (2^{| Q + 1 | + | Q_{2} |})$ , bei fixem $\Sigma
- Entscheidbar für reguläre Ausdrücke

Fazit: Die Kodierung der Eingabe (DFA, NFA, RE, etc.) kann entscheidend für die Komplexität eines Problems sein

2.11 Automaten und Gleichungssysteme

Ardens Lemma:
Sind

A, B

und

X

Sprachen mit

ϵ \notin A

, so gilt

X = A X \cup B ⟹ X = A^{*} B

Korollar
Sind

α, β

und

X

reguläre Ausdrücke mit

ϵ \notin L (α)

, so gilt

X \equiv α X | β ⟹ X \equiv α^{*} β

Bemerkungen:

$X = ϵ X \cup B$ hat keine eindeutige Lösung: jede Sprache
$X \supseteq B$ ist Lösung
$X \equiv a X b | ϵ$ hat keine reguläre Lösung

2.12 Minimierung endlicher Automaten

Jede reguläre Sprache hat einen einzigen minimalen DFA

Algorithmus zur Minimierung eines DFA

Entferne alle von
$q_{0}$ aus nicht erreichbaren Zustände
Berechne die äquivalenten Zustände des Automaten
Kollabiere den Automaten durch Zusammenfassung aller äquivalenten Zustände

Zustäde p und q sind unterscheidbar wenn es

w \in Σ^{⋆}

gibt mit

\hat{δ} (p, w) \in F

und

\hat{δ} (q, w) \notin F

Zustände sind äquivalent wenn sie nicht unterscheidbar sind, d.h. wenn für alle

w \in Σ^{*}

gilt:

\hat{δ} (p, w) \in F ⟺ \hat{δ} (q, w) \in F

gilt
$p \in F$ und
$q \notin F$ , dann sind p und q unterscheidbar
sind
$δ (p, a)$ und
$δ (q, a)$ unterscheidbar, dann auch p und q

$⟹$ unterscheidbarkeit pflanzt sich rückwärts fort
Todo: Folie 107 tabellendings grafik erstellen, einsetzen, algorithmus U

Eine weitere Anwendung: Äquivalenztest von DFAs

Gegeben DFAs A und B, bilde disjunkte Vereinigung. ("Male A und B nebeneinander")
Berechne Menge der äquivalenten Zustände
L(A) = L(B) gdw. die beiden Startzustände äquivalent sind

Formale Definition des "kollabierten Automaten"

Eine Relation

\approx\subseteq A \times A

ist eine Äquivalenzrelation falls

Reflexivität:
$\forall a \in A . a \approx a$
Symmetrie:
$\forall a, b \in A . a \approx b ⟹ b \approx a$
Transitivität:
$\forall a, b, c \in A . a \approx b \land b \approx c ⟹ a \approx c$

Äquivalenzklasse:

[a]_{\approx} := {b | a \approx b}

Es gilt:

[a]_{\approx} = [b]_{\approx} ⟺ a \approx b

Quotientenmenge:

A / \approx := {[a]_{\approx} | a \in A}

Äquivalenz von Zuständen

Intuition: Zwei Zustände sind äquivalent gwd. sie dieselbe sprache erkennen.
Wir schreiben

\equiv

statt

\equiv_{M}

wenn M klar ist
Einfache Fakten:

$\equiv_{M}$ ist eine Äquivalenzrelation
$p \equiv_{M} q ⟹ δ (p, a) \equiv_{M} δ (q, a)$
Algorithmus U liefert die unterscheidbaren Zustände, also
$≢$ .

In der weiteren Analyse wird direkt auf

\equiv

bezogen, nicht mehr auf den Algorithmus

Die "Kollabierung" von M bzgl.

\equiv

ist der Quotientenautomat:

M / \equiv := (Q / \equiv, Σ, δ^{'}, [q_{0}]_{\equiv}, F / \equiv) δ^{'} ([p]_{\equiv}, a) := [δ (p, a)]_{\equiv}

Die Definition von

δ^{'}

ist wohlgeformt da unabhängig von der Wahl des Repräsentanten p:

[p]_{\equiv} = [p^{'}]_{\equiv} ⟹ p \equiv p^{'} ⟹ δ (p, a) \equiv δ (p^{'}, a) ⟹ [δ (p, a)]_{\equiv} = [δ (p^{'}, a)]_{\equiv}

Lemma:

L (M / \equiv) = L (M)

Minimalität des Quotientenautomaten

Jede Sprache

L \subseteq Σ^{*}

induziert eine Äquivalenzrelation

\equiv_{L} \subseteq Σ^{*} \times Σ^{*}

\hat{δ} (q_{0}, u) \equiv_{M} \hat{δ} (q_{0}, v) ⟺ u \equiv_{L (M)} v

Achtung:

$p \equiv_{M} q$ ist eine Relation auf Zuständen von M
$u \equiv_{L} v$ ist eine Relation auf Wörtern

Ist M ein DFA ohne unerreichbare Zustände, so ist der von Algorithmus U berechnete Quotientenautomat

M / \equiv

ein minimaler DFA für L(M)

Alle Quotientenautomaten

M / \equiv_{M}

für die gleiche Sprache L(M) haben die gleiche Struktur, d.h. sie unterscheiden sich nur durch eine Umbenennung der Zustände.

Daher werden die Zustände des kanonischen Minimalautomaten für eine Sprache L mit

\equiv_{L}

Äquivalenzklassen beschriftet.

Satz von Myhill-Nerode

Eine Sprache

L \subseteq Σ^{*}

ist genau dann regulär, wenn

\equiv_{L}

endlich viele Äquivalenzklassen hat.

Vollständige Methode um Nichtregularität von L zu zeigen:
Gib unendliche Menge

w_{1}, w_{2} \dots

an, mit

w_{i} ≢_{L} w_{j}

falls

i \neq j

Bemerkung: Eindeutigkeit des minimalen Automaten (modulo Umbenennung der Zustände) gilt nur bei DFAs, nicht bei NFAs!

3. Kontextfreie Sprachen

3.1 Kontextfreie Grammatiken

(folie 126 maybe)
Eine Kontextfreie Grammatik

G = (V, Σ, P, S)

ist ein 4-Tupel:

V

: endliche Menge, Nichtterminale

Σ

: Alphabet, Terminale, disjunkt von V

P \subseteq V \times (V \cup Σ)^{*}

: Endliche Menge, Produktionen

S \in V

: Startsymbol

Eine Kontextfreie Grammatik

G = (V, Σ, P, S)

induziert eine Ableitungsrelation

\to_{G}

auf wörtern über

V \cup Σ

α \to_{G} β

gdw es eine Regel

A \to γ

in P gibt, und Wörter

α_{1}, α_{2}

, sodass

α = α_{1} A α_{2}

und

β = α_{1} γ α_{2}

α_{1} \to_{G} α_{2} \to_{G} \dots \to_{G} α_{n}

wird als eine Linksableitung bezeichnet, gdw. in jedem Schritt das linkeste Nichtterminal ersetzt wird

Kontextfreie Sprache

Eine kontextfreie Grammatik

G = (V, Σ, P, S)

erzeugt die Sprache

L (G) := {w \in Σ^{*} | S \to_{G}^{*} w}

Eine Sprache

L \subseteq Σ^{*}

ist kontextfrei gdw. es eine kontextfreie Grammatik G gibt mit L = L(G)

Abkürzungen:

CFG: Kontextfreie Grammatik (context-free grammar)
CFL: Kontextfreie Sprache (context-free language)

Konvention:
Ist G aus dem Kontext eindeutig ersichtlich, so schreibt man auch nur

α \to β

statt

α \to_{G} β

Linearität:

Eine CFG ist rechtslinear gdw. jede Produktion der Form
$A \to a B$ oder
$A \to ϵ$ ist
Eine CFG ist linkslinear gdw. jede Produktion der Form
$A \to B a$ oder
$A \to ϵ$ ist
Die rechtslinearen und linkslinearen Grammatiken erzeugen jeweils genau die regulären Sprachen.
-> Die regulären Sprachen sind somit eine echte Teilklasse der kontextfreien Sprachen

Todo:

TODO: Dekompositionslemma folie 134

3.2 Induktive Definitionen, Syntaxbäume und Ableitungen

Produktionen (
$\to$ ) erzeugen Wörter top-down: von einem Nichtterminal zu einem Wort hin
Induktive Definitionen (
$⟹$ ) erzeugen Wörter bottom-up: von kleineren Wörtern zu größeren
Induktive Definition betrachtet nur Wörter aus
$Σ^{*}$

Definitionen:

Präfix:
$u ⪯ w : ⟺ \exists v . u v = w$
Anzahl der Vorkommen:
$#_{a} (w) :=$ Anzahl der Vorkommen von a in w

Beweisvarianten:

"
$w \in L_{G} (S) ⟹ P (w)$ " wird immer schematisch mit Induktion über die Erzeugung von w
"
$P (w) ⟹ w \in L_{G} (S)$ " wird oft mit Induktion über
$| w |$ bewiesen, erfordert meist Kreativität

TODOs:

TODO: Folie 146 idk

Syntaxbaum

Ein Syntaxbaum für eine Ableitung mit einer Grammatik G ist ein Baum, sodass:

jedes Blatt mit einem Zeichen aus
$Σ \cup {ϵ}$ beschriftet ist
jeder innere Knoten mit einem
$A \in V$ beschriftet ist, und falls die Nachfolger (von links nach rechts) mit
$X_{1}, \dots, X_{n} \in V \cup Σ \cup {ϵ}$ , dann ist
$A \to X_{1} \dots X_{n}$ eine Produktion in P
ein Blatt
$ϵ$ der einzige Nachfolger seines Vorgängers ist

Für eine CFG und ein

w \in Σ^{*}

sind folgende Bedingungen äquivalent:

$A \to_{G}^{*} w$
$w \in L_{G} (A)$ (gemäß induktiver Definition)
Es gibt einen Syntaxbaum mit Wurzel A dessen Rand das wort W ist (Rand = Blätter von links nach rechts gelesen)

Mehrdeutigkeit:

Ein CFG G ist mehrdeutig gdw. es ein
$w \in L (G)$ gibt, das zwei verschiedene Syntaxbäume hat, also zwei verschiedene Syntaxbäume mit Wurzel S und Rand w
Eine CFL L heißt inhärent mehrdeutig gdw jede CFG G mit
$L (G) = L$ mehrdeutig ist

3.3 Die Chomsky-Normalform

Eine kontextfreie Grammatik G ist in Chomsky-Normalform gdw. alle Produktionen eine der Formen

A \to a

oder

A \to B C

haben.

Zu jeder CFG G kann man eine CFG G' in Chomsky-Normalform konstruieren mit

L (G^{'}) = L (G) ∖ {ϵ}

Wer auf

ϵ \in L (G^{'})

nicht verzichten möchte: Füge am Ende wieder

S \to ϵ

hinzu.

A \to ϵ

wird auch als

ϵ

-Produktion bezeichnet

Zu jeder CFG

G = (V, Σ, P, S)

kann man eine CFG G' konstruieren, die keine

ϵ

-Produktionen enthält, sodass gilt:

L (G^{'}) = L (G) ∖ {ϵ}

A \to B

wird Kettenproduktion genannt

Zu jeder CFG

G = (V, Σ, P, S)

kann man eine CFG G' konstruieren, die keine Kettenproduktionen enthält, sodass gilt

L (G^{'}) = L (G)

Konstruktion einer Chomsky-Normalform

Eingabe: Eine kontextfreie Grammatik

G = (V, Σ, P, S)

Füge für jedes
$a \in Σ$ das in einer rechten Seite der Länge
$\geq$ 2 vorkommt ein neues Nichtterminal
$A_{a}$ zu V hinzu, ersetze a in allen rechten Seiten der Länge
$\geq$ 2 durch
$A_{a}$ und füge
$A_{a} \to a$ zu P hinzu
Ersetze jede Produktion der Form

$A \to B_{1} B_{2} \dots B_{k} (k \geq 3)$
durch

$A \to B_{1} C_{2}, C_{2} \to B_{2} C_{3}, \dots, C_{k - 1} \to B_{k - 1} B_{k}$
wobei
$C_{2}, \dots, C_{k - 1}$ neue Nichtterminale sind
Eliminiere alle
$ϵ$ -Produktionen
Eliminiere alle Kettenproduktionen

Greibach-Normalform

Eine CFG ist in Greibach-Normalform falls jede Produktion von der Form

A \to a A_{1} \dots A_{n}

ist

Zu jeder CFG G gibt es eine CFG G' in Greibach-Normalform mit

L (G^{'}) = L (G) ∖ {ϵ}

3.4 Das Pumping-Lemma für kontextfreie Sprachen

Für jede kontextfreie Sprache L gibt es ein n

\geq

1, so dass sich jedes Wort

z \in L

mit

| z | \geq n

zerlegen lässt in

z = u v w x y

mit

$v x \neq ϵ$
$| v w x | \leq n$
$\forall i \in N . u v^{i} w x^{i} y \in L$

Siehe Folie 164

3.5 Algorithmen für kontextfreie Grammatiken

G = (V, Σ, P, S)

ist eine CFG
Ein Symbol

X \in V \cup Σ

ist:

Nützlich gdw es eine Ableitung
$S \to_{G}^{*} w \in Σ^{*}$ gibt, in der
$X$ vorkommt
erzeugend gdw es eine Ableitung
$X \to_{G}^{*} w \in Σ^{*}$ gibt.
erreichbar gdw es eine Ableitung
$S \to_{G}^{*} α X β$ gibt.

Nützlich: Nützliche Symbole sind erzeugend und erreichbar, aber nicht notwendigerweise umgekehrt.
Folgliches Ziel: Elimination der unnützen Symbole und der Produktionen, in denen sie vorkommen

Eliminiert man aus einer Grammatik

G

alle nicht erzeugenden Symbole, mit Resultat
$G_{1}$ und
aus
$G_{1}$ alle unerreichbaren Symbole, mit Resultat
$G_{2}$ , dann enthält
$G_{2}$ nur noch nützliche Symbole und
$L (G_{2}) = L (G)$

Die Menge der erzeugenden Symbole einer CFG ist berechenbar
Die Menge der erreichbaren Symbole einer CFG ist berechenbar
Das Wortproblem (

w \in L (G) ?

) ist für eine CFG G entscheidbar

3.6 Der Cocke-Younger-Kasami-Algorithmus (CYK)

Der CYK-Algorithmus entscheidet das Wortproblem für kontextfreie Grammatiken in Chomsky-Normalform.

Eingabe: Grammatik

G = (V, Σ, P, S)

in Chomsky-Normalform,

w = a_{1} \dots a_{n} \in Σ^{*}

V_{i j} := {A \in V | A \to_{G}^{*} a_{i} \dots a_{j}}

für

i \leq j

Damit gilt:

w \in L (G) ⟺ S \in V_{1 n}

Der CYK-Algorithmus berechnet die

V_{i j}

rekursiv nach wachsendem

j - i

V_{i i} = {A \in V | (A \to a_{i}) \in P} V_{i j} = {A \in V | \exists i \leq k \leq j, B \in V_{i k}, C \in V_{k + 1, j} . (A \to B C) \in P}

für

i < j

Der CYK-Algorithmus entscheidet das Wortproblem

w \in L (G)

für eine fixe CFG G in Chomsky-Normalform in Zeit

O (| w |^{3})

Erweiterung: Der CYK-Algorithmus kann so erweitert werden, dass er nicht nur das Wortproblem entscheidet, sondern auch die Menge der Syntaxbäume für die Eingabe berechnet.
Realisierung:

$V_{i j}$ ist die Menge der Syntaxbäume mit Rand
$a_{i} \dots a_{j}$
Statt A enthält
$V_{i j}$ die Syntaxbäume, dessen Wurzel mit A beschriftet ist.

Vorschau:
Für CFGs sind folgende Probleme nicht entscheidbar:

Äquivalenz
Schnittproblem
Regularität
Mehrdeutigkeit

3.7 Abschlusseigenschaften

Seien kontextfreie Grammatiken

G_{1} = (V_{1}, Σ_{1}, P_{1}, S_{1})

und

G_{2} = (V_{2}, Σ_{2}, P_{2}, S_{2})

gegeben. Dann kann man in linearer Zeit CFGs für

$L (G_{1}) \cup L (G_{2})$
$L (G_{1}) L (G_{2})$
$(L (G_{1}))^{*}$
$(L (G_{1}))^{R}$
konstruieren. Die Klasse der kontextfreien Sprachen ist also unter Vereinigung, Konkatenation, Stern und Spiegelung abgeschlossen.

⟹

Verallgemeinerte kontextfreie Grammatiken mit Produktionen der Gestalt

X \to r

, wobei r ein regulärer Ausdruck über

(V \cup T)

ist, erzeugen kontextfreie Sprachen.

Die Menge der kontextfreien Sprachen ist nicht abgeschlossen unter Durchschnitt oder Komplement
Wegen de Morgan können die CFLs daher auch nicht unter Komplement abgeschlossen sein.

3.8 Kellerautomaten

Anwendungsgebiete:

Syntaxanalyse von Programmiersprachen
Analyse von Programmen mit Rekursion

Definition

Ein (nichtdeterministischer) Kellerautomat (PDA = Pushdown Automaton)

M = (Q, Σ, Γ, q_{0}, Z_{0}, δ, F)

besteht aus:

Q: Endliche Menge von Zuständen
$Σ$ endliches Eingabealphabet
$Γ$ endliches Kelleralphabet
$q_{0} \in Q$ Anfangszustand
$Z_{0} \in Γ$ initialer Kellerinhalt
$δ$ : Übergangsfunktion:
$δ : Q \times (Σ \cup {ϵ}) \times Γ \to P_{e} (Q \times Γ^{*})$ ,
$P_{e}$ = mente aller endlichen Teilmengen
$F \subseteq Q$ Endzustände

Intuitive Bedeutung von

(q^{'}, α) \in δ (q, a, Z)

:
Wenn sich M in Zustand q befindet, das Eingabezeichen a liest und Z das oberste Kellerzeichen ist, so kann M im nächsten Schritt in q' übergehen und Z durch

α

ersetzen

Achtung:

$α$ kann die Länge 0, 1 und mehr haben
Falls a =
$ϵ$ : kein Eingabezeichen wird gelesen

Eine Konfiguration eines Kellerautomaten M ist ein Tripel

(q, w, α)

mit

q \in Q, w \in Σ^{*}

und

α \in Γ^{*}

.
Die Anfangskonfiguration von M für die Eingabe

w \in Σ^{*}

ist

(q_{0}, w, Z_{0})

Intuitiv stellt eine Konfiguration

(q, w, α)

eine "Momentaufnahme" des Kellerautomaten dar:

Der momentane Zustand ist q
Der noch zu lesende Teil der Eingabe ist w
Der aktuelle Kellerinhalt ist
$α$ (das oberste Kellerzeichen ganz links stehend)

Die Transitionsrelation

\to_{M}

zwischen Konfigurationen:

$(q, a q, Z α) \to_{M} (q^{'}, w, β α)$ falls
$(q^{'}, β) \in δ (q, a, Z)$
$(q, w, Z α) \to_{M} (q^{'}, w, β α)$ falls
$(q^{'}, β) \in δ (q, ϵ, Z)$

Intuitive Bedeuting von

(q, w, α) \to_{M} (q^{'}, w^{'}, α^{'})

:
Wenn M sich in der Konfiguration

(q, w, α)

befindet, dann kann er in einen Schritt in die Nachfolgerkonfiguration

(q^{'}, w^{'}, α^{'})

übergehen.
Achtung: Eine Konfiguration kann mehrere Nachfolger haben (Nichtdeterminisumus)

Akzeptanz

Ein PDA M akzeptiert

w \in Σ^{*}

mit Endzustand gdw

$(q_{0}, w, Z_{0}) \to_{M}^{*} (f, ϵ, γ)$ für ein
$f \in F, γ \in Γ^{*}$
$L_{F} (M) := {w | \exists f \in F, γ \in Γ^{*} . (q_{0}, w, Z_{0}) \to_{M}^{*} (f, ϵ, γ)}$

Ein PDA M akzeptiert

w \in Σ^{*}

nit leeren Keller gdw

$(q_{0}, w, Z_{0}) \to_{M}^{*} (q, ϵ, ϵ)$ für ein
$q \in Q$
$L_{ϵ} (M) := {w | \exists q \in Q . (q_{0}, w, Z_{0}) \to_{M}^{*} (q, ϵ, ϵ)}$

Konvention:
Die F-Komponente von M wird ausgeblendet, wenn nur

L_{ϵ} (M)

von interesse ist.

Bemerkungen: PDAs und das Wortproblem

Mit einem NFA A kann man
$w \in L (A)$ durch pararllele Verfolgung aller Berechnungspfade entscheiden, da sie alle endlich sind.
Bei einem PDA kann es wegen
$ϵ$ -Übergängen auch unendliche Berechnungen
$\to_{M}$ geben, z.B.
$δ (q, ϵ, Z) = (q, Z Z) :$

$(q, w, Z) \to_{M} (q, w, Z Z) \to_{M} (q, w, Z Z Z) \to_{M} \dots$
Diese sind wegen des möglicherweise wachsenden oder pulsierenden Kellers nicht einfach zu eliminieren.
Daher ist es a priori unklar, wie man mit einem PDA das Wortproblem entscheidet.

Ziel: Akzeptanz durch Endzustände und leeren Keller gleich mächtig
Endzustand

\to

Leerer Keller:
Zu jedem PDA

M = (Q, Σ, Γ, q_{0}, Z_{0}, δ, F)

kann man in linearer Zeit einen PDA

M^{'} = (Q^{'}, Σ, Γ^{'}, q_{0}^{'}, Z_{0}^{'}, δ^{'})

konstruieren mit

L_{F} (M) = L_{ϵ} (M^{'})

(q_{0}, w, Z_{0}) \to_{M}^{*} (f, ϵ, γ) ⟺ (q_{0}^{'}, w, Z_{0}^{'}) \to_{M^{'}}^{*} (q, ϵ, ϵ)

Leerer Keller

\to

Endzustand
Zu jedem PDA

M = (Q, Σ, Γ, q_{0}, Z_{0}, δ)

kann man in linearer Zeit einen PDA

M^{'} = (Q^{'}, Σ, Γ^{'}, q_{0}^{'}, Z_{0}^{'}, δ^{'}, F)

konstruieren mit

L_{ϵ} (M) = L_{F} (M^{'})

beweishilfen:

Erweiterungslemma:

(q, u, α) \to_{M}^{n} (q^{'}, u^{'}, α^{'}) ⟹ (q, u v, α β) \to_{M}^{n} (q^{'}, u^{'} v, α^{'} β)

Zerlegungssatz:
Wenn

(q, w, Z_{1 \dots k}) \to_{M}^{n} (q^{'}, ϵ, ϵ)

, dann gibt es

u_{i}, p_{i}, n_{i}

, so dass:

(p_{i - 1}, u_{i}, Z_{i}) \to_{M}^{n_{i}} (p_{i}, ϵ, ϵ) (i = 1, \dots, k)

und

w = u_{1} \dots u_{k}, p_{0} = q, p_{k} = q^{'}, \sum n_{i} = n

3.9: Äquivalenz von PDAs und CFGs

CFG
$\to$ PDA

Zu jeder CFG G kann man einen PDA M konstruieren, der mit leerem Keller akzeptiert, so dass

L_{ϵ} (M) = L (G)

Konstruktion:
Zuerst werden alle Produktionen G in die Form

A \to b B_{1} \dots B_{k}

gebracht, wobei

b \in Σ \cup {ϵ}

Methode: Für jedes

a \in Σ

füge ein neues
$A_{a}$ zu V hinzu
ersetze a rechts in P durch
$A_{a}$ (außer am Kopfende)
füge eine neue Produktion
$A_{a} \to a$ hinzu

Alle Produktionen in

G = (V, Σ, P, S)

haben jetzt die Form

A \to b B_{1} \dots B_{k}

Der PDA wird wie folgt definiert:

M := (q, Σ, V, q, S, Δ)

wobei

(A \to b β) \in P ⟹ δ (q, b, A) ∋ (q, β)

also für alle

b \in Σ \cup {ϵ}

und

A \in V

δ (q, b, A) := {(q, β) | (A \to b β) \in P}

Jetzt gilt:

Für alle
$u, v \in Σ^{*}$ und
$γ \in V^{*}$ und
$A \in V$ gilt:
$A \to_{G}^{n} u γ$ mit Linksableitung gdw
$(q, u v, A) \to_{M}^{n} (q, v, γ)$
$L (G) = L_{ϵ} (M)$

PDA
$\to$ CFG

Zu jedem PDA

M = (Q, Σ, Γ, q_{0}, Z_{0}, δ, F)

, der mit leerem Keller akzeptiert, kann man eine CFG G konstruieren mit

L (G) = L_{ϵ} (M)

Konstruktion:

G := (V, Σ, P, S)

mit

V := Q \times Γ \times Q \cup {S}

, wobei die Tripel mit [., ., .] notiert werden und P die folgenden Produktionene enthält:

$S \to [q_{0}, Z_{0}, q]$ für alle
$q \in Q$
Für alle
$δ (q, b, Z) ∋ (r_{0}, Z_{1} \dots Z_{k})$ und für alle
$r_{1}, \dots, r_{k} \in Q$ :

$[q, Z, r_{k}] \to b [r_{0}, Z_{1}, r_{1}] [r 1, Z_{2}, r_{2}] \dots [r_{k} - 1, Z_{k}, r_{k}]$

idee:

[q, Z, r_{k}] \to_{G}^{*} w

gdw.

(q, w, Z) \to_{M}^{*} (r_{k}, ϵ, ϵ)

Die

r_{1} \dots r_{k}

sind potenzielle Zwischenzustände beim Akzeptieren der Teilwörter von

b u_{1} \dots u_{k} = w

, die zu

Z_{1} \dots Z_{k}

gehören. (Zerlegungssatz)

Lemma:

[q, Z, p] \to_{G}^{n} w

gdw

(q, w, Z) \to_{M}^{n} (p, ϵ, ϵ)

Eine Sprache ist kontextfrei gdw. sie von einem Kellerautomaten akzeptiert wird.

3.10 Deterministische Kellerautomaten

Ein PDA ist deterministisch (DPDA) gdw. für alle

q \in Q, a \in Σ

und

Z \in Γ

| δ (q, a, Z) | + | δ (q, ϵ, Z) | \leq 1

Eine CFL ist deterministisch (DCFL) gdw. sie von einem DPDA akzeptiert wird.
Man kann zeigen: Die CFL

{w w^{R} | w \in {0, 1}^{*}}

ist nicht deterministisch, da man jeden DFA leicht mit einem DPDA simulieren kann:
fakt: jede reguläre Sprache ist eine DCFL

Eine Sprache erfüllt die Präfix-Bedingung gdw sie keine zwei Wörter enthält, so dass eine ein echtes präfix eines anderen ist.

Lemma:

\exists D P D A M . L = L_{ϵ} (M) ⟺ \exists D P D A M . L = L_{F} (M)

und L erfüllt die präfix-bedingung

Weitere Eigenschaften

Die Klasse der DCFLs ist unter Komplement abgeschlossen.
-> Da die CFLs nicht unter Komplement abgeschlossen sind sind DCFLs eine echte Teilklasse der CFLs
Die Klasse der DCFLs ist weder unter Schnitt noch unter Vereinigung abgeschlossen.
Jede DCFL ist nicht inhärent mehrdeutig, d.h. sie wird von einer nicht-mehrdeutigen Grammatik erzeugt.
Das Wortproblem ist für DCFLs in linearer Zeit lösbar.

3.11 Tabellarischer überblick

Abschlusseigenschaften

	Schnitt	Vereinigung	Komplement	Produkt	Stern
Regulär	ja	ja	ja	ja	ja
DCFL	nein	nein	ja	nein	nein
CFL	nein	ja	nein	ja	ja

Entscheidbarkeit

	Wortproblem	Leerheit	Äquivalenz	Column 3
DFA	$O (n)$	ja	ja	ja
DPDA	$O (n)$	ja	ja	nein $(*)$
CFG	$O (n^{3})$	ja	nein $(*)$	nein $(*)$

Teil 2: Berechenbarkeit, Entscheidbarkeit, Komplexität

4. Berechenbarkeit, Entscheidbarkeit

Überblick:

Was kann man berechnen?
- Welche Funktionen kann man in endlicher Zeit berechnen?
- Welche Eigenschaften von Objekten können in endlicher Zeit entschieden werden?
Mit welchen Sprachen / Maschinen?
Was kann man in polynomieller Zeit berechnen?

4.1 Der Begriff der Berechenbarkeit

Eine Funktion

f : N^{k} \to N

ist intuitiv berechenbar, wenn es einen Algorithmus gibt, der bei Eingabe

(n_{1}, \dots, n_{k}) \in N^{k}

nach endlich vielen Schritten mit Ergebnis
$f (n_{1}, \dots, n_{k})$ hält, falls
$f (n_{1}, \dots, n_{k})$ definiert ist,
und nicht terminiert, falls
$f (n_{1}, \dots, n_{k})$ nicht definiert ist.

Achtung: Berechenbarkeit setzt zwei verschiedene Dinge in Beziehung:

Algorithmen, d.h. endliche Wörter
Mathematische Funktionen, d.h. Mengen von Paaren.

Terminologie: Eine Funktion

f : A \to B

ist

Total gdw.
$f (a)$ für alle
$a \in A$ definiert ist.
partiell gdw.
$f (a)$ auch undefiniert sein kann
echt partiell gdw
$f (a)$ nicht total ist

Es gibt nicht-berechenbare Funktionen

N \to {0, 1}

Erinnerung: Eine Menge

M

ist abzählbar, falls es eine injektive Funktion

M \to N

gibt.
Äquivalente Definitionen:

Entweder gibt es eine Bijektion
$M \to {0, \dots, n}$ für ein
$n \in N$ , oder eine Bijektion
$M \to N$
Es gibt eine Nummerierung der Elemente von M.

Eine Menge ist Überabzählbar wenn sie nicht abzählbar ist

Abzählbarkeiten:

$Σ^{*}$ ist abzählbar, falls
$Σ$ endlich ist.
Die Menge der Algorithmen ist Abzählbar
Die Menge aller Funktionen
$N \to {0, 1}$ ist überabzählbar
Wenn Algorithmen als endliche Wörter kodiert werden können, dann gibt es nicht-berechenbare Funktionen
$N \to {0, 1}$

Church-Turing-These

Der formale Begriff der Berechenbarkeit mit Turing-Maschinen (bzw.

λ

-Kalkül, etc.) stimmt mit dem intuitiven Berechenbarkeitsbegriff überein.
Dies ist keine formale Aussage und nicht beweisbar, wird aber allgemein akzeptiert.

4.2 Turingmaschinen

Definition

Eine Turingmaschine ™ ist ein 7-Tupel

M = (Q, Σ, Γ, δ, q_{0}, ◻, F)

mit:

$Q$ : Endliche Menge an Zuständen
$Σ$ : Endliche menge des Eingabealphabets
$Γ$ : Endliche Menge des Bandalphabets mit
$Σ \subset Γ$
$δ : Q \times Γ \to Q \times Γ \times {L, R, N}$ ist die Übergangsfunktion.
$δ$ darf partiell sein.
$q_{0} \in Q$ ist der Startzustand
$◻ \in Γ ∖ Σ$ ist das Leerzeichen
$F \subseteq Q$ ist die Menge der akzeptierenden oder endzustände

Annahme:

δ (q, a)

ist nicht definiert für alle

q \in F

und

a \in Γ

Eine nichtdeterministische Turingmaschine hat eine Übergangsfunktion

δ : Q \times Γ \to P (Q \times Γ \times {L, R, N})

Intuitive Bedeutung:

δ (q, a) = (q^{'}, b, D)

Wenn sich M im Zustand q befindet
und auf dem Band a liest
so geht M im nächsten Schritt in den Zustand q' über
überschreibt a mit b
und bewegt danach den Schreib-/Lesekopf nach rechts (falls D = R), nach links (falls D = L) oder nicht (falls D = N)

Konfiguration:

Eine Konfiguration einer Turingmaschine ist ein Tripel

(α, q, β) \in Γ^{*} \times Q \times Γ^{*}

, welches modelliert:

Bandinhalt:
$\dots ◻ α β ◻ \dots$
Zustand: q
Kopf auf dem ersten Zeichen von
$β ◻$

Die Startkonfiguration der Turingmaschine bei Eingabe

w \in Σ^{*}

ist

(ϵ, q_{0}, w)

TODO: slide 232???

Akzeptanz

Eine Turingmaschine M akzeptiert die Sprache

L (M) = {w \in Σ^{*} | \exists q \in F, α, β \in Γ^{*} . (ϵ, q_{0}, w) \to_{M}^{*} (α, q, β)}

Eine Funktion

f : Σ^{*} \to Σ^{*}

ist Turing-berechenbar gdw es eine Turingmaschine M gibt, so dass für alle

u, v \in Σ^{*}

gilt

f (u) = v ⟺ \exists r \in F . (ϵ, q_{0}, u) \to_{M}^{*} (◻ \dots ◻, r, v ◻ \dots ◻)

Eine Funktion

f : N^{k} \to N

ist Turing-berechenbar gdw. es eine Turingmaschine M gibt, so dass für alle

n_{1}, \dots, n_{k}, m \in N

gilt

f (n_{1}, \dots, n_{k}) = m ⟺ \exists r \in F . (ϵ, q_{0}, b i n (n_{1}) # b i n (n_{2}) # \dots # b i n (n_{k})) \to_{M}^{*} (◻ \dots ◻, r, b i n (m) ◻ \dots ◻)

wobei bin(n) die binärdarstellung der Zahl n ist.

Satz:
Die von Turingmaschinen akzeptierten Sprachen sind genau die Typ-0-Sprachen der Chomsky-Hierarchie.

Halten/Terminieren

Eine TM hält wenn sie eine Konfiguration

(α, q, α β)

erreicht und

δ (q, a)

nicht definiert oder (bei einer nichtdeterministischen TM)

δ (q, a) = \emptyset

.
Nach Annahme hält eine TM immer, wenn sie einen Endzustand erreicht. Damit ist die von einer TM berechnete Funktion wohldefiniert.
Eine TM kann auch halten, bevor sie einen Endzustand erreicht.

Weiteres

Nichtdeterministische TMs
Zu jeder nichtdeterministischen TM N gibt es eine deterministische TM M mit

L (N) = L (M)

Mehrband-TMs / K-Band-TMs
Jede k-Band-TM kann effektiv durch eine 1-Band-TM simuliert werden

4.3 Programmieren mit Turingmaschinen

Die folgenden Basismaschinen sind leicht programmierbar:

Band i := Band i+1
Band i := Band i-1
Band i = 0
Band i = Band j

Seien

M_{i} = (Q_{i}, Σ, Γ_{i}, δ_{i}, q_{i}, ◻, F_{i}), i = 1, 2

Die sequentielle Komposition (hintereinanderschaltung) von

M_{1}

und

M_{2}

wird wie folgt bezeichnet

\to M_{1} \to M_{2} \to

Sie ist wie folgt definiert:

M := (Q_{1} \cup Q_{2}, Σ, Γ_{1} \cup Γ_{2}, δ, q_{1}, ◻, F_{2})

wobei (oE)

Q_{1} \cap Q_{2} = \emptyset

und

δ := δ_{1} \cup δ_{2} \cup {(f_{1}, a) \mapsto (q_{2}, a, N) | f_{1} \in F_{1}, a \in Γ_{1}}

Fallunterscheidung
Sind

f_{1}

und

f_{2}

Endzustände von M so bezeichnet

eine Fallunterscheidung, d.h. eine TM, die vom Endzustand

f_{1}

von

M

nach

M_{1}

übergeht, und von

f_{2}

aus nach

M_{2}

"Band = 0?"
Die Folgende TM wird "Band=0?" bzw. "Band i = 0?" genannt:

δ (q_{0}, 0) = (q_{0}, 0, R) δ (q_{0}, ◻) = (j a, ◻, L) δ (q_{0}, a) = (n e i n, a, N) f ü r a \neq 0

wobei ja und nein Endzustände sind.

Schleife
Analog zur Fallunterscheidung kann man auch eine TM für eine Schleife konstruieren

die sich wie while Band

i \neq 0

do

M

verhält.

Fazit:
Mit TM kann man imperativ programmieren:

:=
;
if
while

4.4 WHILE- und GOTO-Berechenbarkeit

WHILE

\equiv

strukturierte Programme mit while-Schleifen
GOTO

\equiv

Assembler

WHILE- und GOTO-Berechenbarkeit werden definiert und dessen Äquivalenz mit Turing-berechenbarkeit wird gezeigt.

WHILE-Programme:

Syntax von WHILE-Programmen:

wobei

X

eine der Variablen

x_{0}, x_{1}, \dots

und C eine der Konstanten

0, 1, \dots

sein kann.

Die modifizierte Differenz ist

m \dot{-} n := {\begin{cases} m - n & falls m \geq n \\ 0 & sonst \end{cases}

Semantik von WHILE-Programmen (informell):

$x_{i} := x_{j} + n$ : Neuer Wert von
$x_{i}$ ist
$x_{j} + n$
$x_{i} := x_{j} - n$ : Neuer Wert von
$x_{i}$ ist
$x_{j} \dot{-} n$
$P_{1}; P_{2}$ : Führe zuerst
$P_{1}$ und dann
$P_{2}$ aus
WHILE
$x_{i} \neq 0$ DO
$P$ END: Führe
$P$ aus bis die Variable
$x_{i}$ (wenn je) den Wert 0 annimmt.

Syntaktische Abkürzungen:

$x_{i} := x_{j} \equiv x_{i} := x_{j} + 0$
$x_{i} := n \equiv x_{i} := x_{j} + n$ (wobei
$x_{j}$ nirgends zugewiesen wird)
TODO: finish

While-Berechenbarkeit

Eine Funktion

f : N^{k} \to N

ist WHILE-berechenbar gdw. es ein WHILE-Programm P gibt, sodass für alle

n_{1}, \dots, n_{k} \in N

:
P, gestartet mit

n_{1}, \dots, n_{k}

x_{1}, \dots, x_{k}

(0 in den anderen Variablen)

Terminiert mit
$f (n_{1}, \dots, n_{k})$ in
$x_{0}$ , falls
$f (n_{1}, \dots, n_{k})$ definiert ist,
terminiert nicht, falls
$f (n_{1}, \dots, n_{k})$ undefiniert ist.

Turingmaschinen können WHILE-Programme simulieren:

WHILE
$\to$ TM

Jede WHILE-berechenbare Funktion ist auch Turing-berechenbar, da:

jede Programmvariable auf 1 Band speichern
alle Konstrukte der WHILE-Sprache sind von Mehrband-TMs simulierbar
Mehrband-TMs sind von einband-TMs simulierbar.

GOTO-Programme:

Ein GOTO-Programm ist eine Sequenz von markierten Anweisungen:

M_{1} : A_{1}; M_{2} : A_{2}; \dots; M_{k} : A_{k}

(wobei alle Marken verschieden und Optional sind)

Mögliche Anweisungen

A_{i}

sind:

$x_{i} := x_{j} + n$
$x_{i} := x_{j} - n$
GOTO
$M_{i}$
IF
$x_{i} = n$ GOTO
$M_{j}$
HALT

Die Semantik ist wie erwartet.

WHILE
$\to$ GOTO

Jedes WHILE-Programm kann durch ein GOTO-Programm simuliert werden.

GOTO
$\to$ WHILE

Jedes GOTO-Programm kann durch ein WHILE-Programm simuliert werden.
Für beweis: siehe Slide 253

Korollar:
WHILE- und GOTO-Berechenbarkeit sind äquivalent
Kleensche Normalform:
Jedes WHILE-Programm ist zu einem WHILE-Programm mit genau einer WHILE-Schleife äquivalent

TM
$\to$ GOTO

Jede TM kann durch ein GOTO-Programm simuliert werden.
Übersetzung siehe Folien 256,257

LOOP-Berechenbarkeit / LOOP-Programme

Statt while-Schleifen werden nun for-Schleifen betrachtet.
LOOP-Programme haben die gleiche Syntax wie WHILE-Programme, aber statt der WHILE-Schleifen gibt es nur LOOP-Schleifen mit folgender Syntax:

LOOP X DO P END

Semantik: Führe P genau n mal aus, wobei n der Anfangswert von X ist.
Zuweisungin an X in P ändern die Anzahl n der Schleifendurchläufe nicht.

Loop-berechenbarkeit

Eine Funktion

f : N^{k} \to N

ist LOOP-berechenbar gdw. es ein LOOP-Programm P gibt, so dass für alle

n_{1}, \dots, n_{k} \in N

:
P, gestartet mit

n_{1}, \dots, n_{k}

x_{1}, \dots, x_{k}

(0 in den anderen Variablen) terminiert mit

f (n_{1}, \dots, n_{k})

x_{0}

Alle LOOP-berechenbaren Funktionen sind total, beweis via Induktion über die Syntax der LOOP-Programme.

FAKT: WHILE-Schleifen können LOOP-Schleifen simulieren, aber LOOP-Schleifen können WHILE-Schleifen nicht simulieren

4.5 Unentscheidbarkeit des Halteproblems

Ziel: Es ist unentscheidbar, ob ein Programm terminiert.

Definition:

Eine Menge

A (\subseteq N oder Σ^{*})

ist entscheidbar gdw ihre charakteristische Funktion

χ_{A} (x) := {\begin{cases} 1 & falls x \in A \\ 0 & falls x \notin A \end{cases}

berechenbar ist.

Eine Eigenschaft/Problem P(x) ist entscheidbar gdw.

{x | P (x)}

entscheidbar ist.

Komplement:
Die entscheidbaren Mengen sind abgeschlossen unter Komplement: Ist

A

entscheidbar, so auch

\overset{―}{A}

Kodierung einer TM als Wort über

$Σ = {0, 1}$ :
Siehe Folie 300

Nicht jedes Wort über

{0, 1}^{*}

kodiert eine TM.
Sei

\hat{M}

eine beliebige feste TM:
Die zu einem Wort

w \in {0, 1}^{*}

gehörige TM

M_{w}

ist

M_{w} := {\begin{cases} M & falls w Kodierung von M ist \\ \hat{M} & sonst \end{cases}

Die Kondierung von syntaktischen Objekten (Programmen, Formeln, etc.) als Zahlen wird Gödelisierung genannt. Die Zahlen werden als Gödelnummern bezeichnet.

Definitionen:

$M [w]$ ist abgekürzt für "Maschine
$M$ mit Eingabe
$w$ "
$M [w] ↓$ bedeutet, dass
$M [w]$ terminiert/hält

Spezielles Halteproblem

Gegeben: Ein Wort

w \in {0, 1}^{*}

Problem: Hält

M_{w}

bei Eingabe w?
Als Menge:

K := {w \in {0, 1}^{*} | M_{w} [w] ↓}

Das Spezielle Halteproblem K ist nicht entscheidbar.
Beweis: Folie 303, 304

(Allgemeines) Halteproblem

Gegeben: Wörter

w, x \in {0, 1}^{*}

Problem: Hält

M_{w}

bei Eingabe x?
Als Menge:

H := {w # x | M_{w} [x] ↓}

Das Halteproblem H ist nicht entscheidbar.
Beweis: Wäre H entscheidbar, dann trivialerweise auch K:

χ_{K} (w) = χ_{H} (w, w)

Reduktion

Eine Menge

A \subseteq Σ^{*}

ist reduzierbar auf eine Menge

B \subseteq Γ^{*}

gdw. es eine totale und berechenbare Funktion

f : Σ^{*} \to Γ^{*}

gibt mit

\forall w \in Σ^{*} . w \in A ⟺ f (w) \in B

Es wird dann

A \leq B

geschrieben
Intuition:

$B$ ist mindestens so schwer zu lösen wie
$A$ .
ist
$A$ unlösbar, dann auch
$B$ .
Ist
$B$ lösbar, dann erst recht A.

Lemma:
Falls

A \leq B

und

B

ist entscheidbar, so ist auch

A

entscheidbar.
Falls

A \leq B

und

A

ist unentscheidbar, so ist

B

auch unentscheidbar.

Halteproblem auf leerem Band

Das Halteproblem auf leerem Band,

H_{0}

, ist unentscheidbar.

H_{0} := {w \in {0, 1}^{*} | M_{w} [ϵ]}

Fazit:

Es gibt keine allgemeine algorithmische Methode, um zu entscheiden, ob ein Programm terminiert.
Die Unentscheidbarkeit vieler Fragen über die Ausführung von Programmen folgt durch Reduktion des Halteproblems:

Kann ein WHILE-Programm mit einer bestimmten Eingabe einen bestimmten Programmpunkt erreichen?
Der Spezialfall Programmpunkt = Programmende ist das Halteproblem
Kann Variable
$x_{7}$ bei einer bestimmten Eingabe je den Wert
$2^{32}$ erreichen?
Redunktion: Ein Programm P hält gdw während der ausführung von

$P; x_{7} := 2^{32}$
Variable
$x_{7}$ den Wert
$2^{32}$ erreicht.
(OE:
$x_{7}$ kommt in P nicht vor)

Hilberts 10. Problem:
Es ist unentscheidbar, ob ein Polynom in n Variablen mit ganzzahligen Koeffizienten eine ganzzahlige Nullstelle hat

(\in Z^{n})

Beweis:

H \leq H_{10}

-> Es müssen nicht immer TMs sein

Bemerkungen

Nicht alle unentscheidbaren Probleme sind gleich schwer
Z.B. gilt: Das Äquivalenzproblem

$E_{q} := {u # v | M_{u} berechnet die gleiche Funktion wie M_{v}}$
ist schwerer als das Halteproblem:

4.6 Semi-Entscheidbarkeit

Definition

Eine Menge

A (\subseteq N oder Σ^{*})

ist semi-entscheidbar (s-e) gdw.

χ_{a}^{'} (x) := {\begin{cases} 1 & falls x \in A \\ ⊥ & falls x \notin A \end{cases}

berechenbar ist.

Entscheidbarkeit:
Eine Menge

A

ist entscheidbar gdw. sowohl

A

als auch

\overset{―}{A}

s-e sind.

Rekursiv Aufzählbar

Eine Menge A ist rekursiv aufzählbar (recursively enumerable) gdw.

A = \emptyset

oder es eine berechenbare totale Funktion

f : N \to A

gibt, so dass

A = {f (0), f (1), f (2), \dots}

Bemerkung:

Es dürfen Elemente doppelt auftreten
$(f (i) = f (j) für i \neq j)$
Die Reihenfolge ist beliebig

Warnung:

Rekursiv aufzählbar
$\neq$ Abzählbar
Aber: Rekursiv aufzählbar
$⟹$ abzählbar
Aber nicht umgekehrt: Jede Sprache ist abzählbar, aber nicht jede Sprache ist rekursiv aufzählbar (siehe unten)

Lemma:
Eine Menge

A

ist rekursiv aufzählbar gdw. sie semi-entscheidbar ist.
Beweis: 317, 318

Äquivalente Aussagen

$A$ ist Semi-entscheidbar
$A$ ist rekursiv aufzählbar
$χ_{A}^{'}$ ist berechenbar
$A = L (M)$ für eine TM
$M$
$A$ ist Definitionsbereich einer berechenbaren Funktion
$A$ ist Wertebereich einer berechenbaren Funktion

K ist Semi-entscheidbar
Die Menge

K = {w | M_{w} [w] ↓}

ist semi-entscheidbar.
Beweis:
Die funktion

χ_{k}^{'}

ist wie folgt Turing-berechenbar:
Bei Eingabe w simuliere die Ausführung von

M_{w} [w]

; gib 1 aus

Komplement

\overset{―}{K}

ist nicht semi-entscheidbar.
Semi-entscheidbarkeit ist nicht abgeschlossen unter Komplement

4.7: Die Sätze von Rice und Shapiro

Die von der TM

M_{w}

berechnete Funktion wird als

φ_{w}

bezeichnet.
Es werden implizit nur einstellige Funktionen betrachtet.

Der Satz von Rice

Sei F eine Menge berechenbarer Funktionen.
Es gelte weder

F = \emptyset

noch

F = alle berechenbaren Funktionen

("F nicht trivial")
Dann ist unentscheidbar, ob die von einer gegebenen TM

M_{w}

berechnete Funktion Element F ist, d.h. ob

φ_{w} \in F

Alle nicht-trivialen semantischen Eigenschaften von Programmen sind unentscheidbar.

Warnung:
Im Satz von Rice geht es um die von einem Programm berechnete Funktion (Semantik), nicht um den Programmtext (Syntax). Beispielsweise ist es entscheidbar, ob ein Programm

länger als 5 Zeilen ist
Eine Zuweisung an die Variable
$x_{17}$ enthält.

Der Satz von Rice-Shapiro

Sei

F

eine Menge berechenbarer Funktionen.
Ist

C_{F} := w | φ_{w} \in F

semi-entscheidbar,
so gilt für alle berechenbaren

f

f \in F ⟺

es gibt eine endliche Teilfunktion

g \subseteq f

mit

g \in f

Terminierend:

Ein Programm ist terminierend gdw. es für alle eingaben hält.

Die Menge der terminierenden Programme ist nicht semi-entscheidbar
Die Menge der nicht-terminierenden Programme ist nicht semi-entscheidbar

Grenzen automatischer Terminationsanalyse von Programmen

Termination ist unentscheidbar (Rice): Klare Ja/Nein Antwort unmöglich.
Termination ist nicht semi-entscheidbar (Rice-Shapiro) Es gibt kein Zertifizierungs-programm das alle terminierenden Programme erkennt.
Nicht-Termination ist nicht semi-entscheidbar (Rice-Shapiro): Es gibt keinen perfekten bug finder der alle nicht-terminierenden Programme erkennt.

Aber es gibt mächtige heuristische Verfahren, die für relativ viele Programme aus der Praxis (Gerätetreiber)

Termination beweisen können, oder
Gegenbeispiele finden können.

4.8: Das Postsche Korrespondenzproblem

Definition

Postsche Korrespondenzproblem, Post's Correspondence Problem, PCP:
Gegeben: Eine endliche Folge

(x_{1}, y_{1}), \dots, (x_{k}, y_{k})

, wobei

x_{i}, y_{i} \in Σ^{+}

Problem: Gibt es eine Folge von Indizes

i_{i}, \dots, i_{n} \in {1, \dots, k}

n > 0

, mit

x_{i_{1}} \dots x_{i_{n}} = y_{i_{1}} \dots y_{i_{n}}

?
Dann wird

i_{1}, \dots, i_{n}

als eine Lösung der Instanz

(x_{1}, y_{1}), \dots, (x_{k}, y_{k})

des PCP Problems bezeichnet.

Entscheidbarkeit des PCP

Das PCP ist semi-entscheidbar
Beweis:
Die möglichen Lösungen werden der Länge nach aufgezählt und auf korrektheit überprüft.

Modifiziertes PCP, MPCP

Gegeben: wie beim PCP
Problem: Gibt es eine Lösung

i_{1}, \dots, i_{n}

mit

i_{1} = 1

Reduzierbarkeit des MPCP

M P C P \leq P C P

H \leq M P C P

Unentscheidbarkeit des PCP
Aus

H \leq P C P

folgt direkt, dass das PCP unentscheidbar ist
Das PCP ist auch für

Σ = {0, 1}

unentscheidbar.

Weitere bemerkungen:

Das PCP ist entscheidbar falls
$| Σ | = 1$
Das PCP ist entscheidbar falls
$k \leq 2$
Das PCP ist unentscheidbar falls
$k \geq 5$
Für
$k = 3, 4$ ist noch offen, ob das PCP unentscheidbar ist.

4.9 Unentscheidbare CFG-Probleme

Für DFAs ist fast alles entscheidbar:
$L (A) = \emptyset, L (A) = L (B), \dots$
Für TMs ist fast nichts entscheidbar:
$L (M) = \emptyset, L (M_{1}) = L (M_{2}), \dots$
Für CFGs ist manches entscheidbar
$(L (G) = \emptyset, w \in L (G))$ , und manches unentscheidbar

Unentscheidbare Probleme:

Für CFGs

G_{1}, G_{2}

sind folgende Probleme unentscheidbar:

$P_{1}$ : ist
$L (G_{1}) \cap L (G_{2}) = \emptyset$ ? -> Beweis: Folie 340
$P_{2}$ : ist
$| L (G_{1}) \cap L (G_{2}) | = \infty$ ? -> Beweis: Folie 343
$P_{3}$ : ist
$L (G_{1}) \cap L (G_{2})$ kontextfrei? -> Beweis: Folie 343
$P_{4}$ : ist
$L (G_{1}) \subseteq L (G_{2})$ ? -> Beweis: Folie 344
$P_{5}$ : ist
$L (G_{1}) = L (G_{2})$ ? -> Beweis: Folie 344

L (G_{1})

und

L (G_{2})

aus dem Beweis zu

P_{1}

DCFL sind, gilt sogar, dass die Probleme

P_{1}

bis

P_{4}

bereits für DCFLs unentscheidbar sind.

Für zwei DPDAs

M_{1}

und

M_{2}

ist

L (M_{1}) = L (M_{2})

jedoch entscheidbar.

Weitere unentscheidbare Probleme:

Für eine CFG

G

sind folgende Probleme unentscheidbar:

Ist
$G$ mehrdeutig?
Ist
$L (G)$ regulär?
Ist
$L (G)$ deterministisch (DCFL)?

Für eine CFG

G

und einen RE

α

ist

L (G) = L (α)

unentscheidbar

4.10 Primitiv Rekursive Funktionen

Es werden Funktionen

N^{k} \to N, k \geq 0

betrachtet.

N^{0} \to N

wird mit

N

identifiziert,

c ()

mit

c

.
Definition der primitiv rekursiven Funktionen

Fixe Basisfunktion: z.B.
$s (x) = x + 1$
Funktionskomposition: z.B.
$f (x, y) = g (x, h (x, y))$
Fixe Art der Rekursion: z.B.
$f (0) = 1 f (n + 1) = n * f (n)$

Basisfunktionen

Die konstante Funktion 0
Die Nachfolgerfunktion
$s (n) = n + 1$
Die Projektionsfunktionen
$π_{i}^{k} : N^{k} \to N, 1 \leq i \leq k :$

$π_{i}^{k} (x_{1}, \dots, x_{k}) = x_{i}$

Komposition

Die Komposition von

g

und

h_{1}, \dots, h_{k}

erzeugt die Funktion

f

f (\bar{x}) = g (h_{1} (\bar{x}), \dots, h_{k} (\bar{x}))

wobei

\bar{x} = (x_{1}, \dots, x_{n})

und

f : N^{n} \to N g : N^{k} \to N h_{i} : N^{n} \to N (i = 1, \dots, k)

Primitive Rekursion

Das Schema der primitiven Rekursion erzeugt aus

g

und

h

die Funktion

f

f (0, \bar{x}) = g (\bar{x}) f (m + 1, \bar{x}) = h (f (m, \bar{x}), m, \bar{x})

wobei

\bar{x} = (x_{1}, \dots, x_{n})

und

f : N^{n + 1} \to N g : N^{n} \to N h : N^{n + 2} \to N

Primitiv Rekursive Funktionen

Die Menge PR der primitiv rekursiven Funktionen ist die folgende induktiv definierte Teilmenge aller Funktionen

N^{k} \to N, k \geq 0

Die Basisfunktinen 0,
$s$ , und
$π_{i}^{k}$ sind primitiv rekursiv
Sind
$g$ und
$h_{i}$ primitiv rekursiv, dann auch ihre Komposition

$f (\bar{x}) = g (h_{1} (\bar{x}), \dots, h_{k} (\bar{x}))$
Sind
$g$ und
$h$ primitiv rekursiv, dann auch die mit primitver Rekursion definierte Funktion

$f (0, \bar{x}) = g (\bar{x}) f (m + 1, \bar{x}) = h (f (m, \bar{x}), m, \bar{x})$

Jede primitiv-rekursive Funktion ist total

Erweiterte Komposition

f

ist eine erweiterte Komposition der Funktionen

g_{1}, \dots, g_{k}

falls

f (x_{1}, \dots, x_{n}) = t

so dass

t

ein Ausdruck ist, der nur aus den Funktionen

g_{1}, \dots, g_{k}

und den Variablen

x_{1}, \dots, x_{n}

besteht.
Eine erweiterte Komposition von PR Funktionen ist wieder PR

Das erweiterte Schema der primitiven Rekursion erlaubt

f (0, \bar{x}) = t_{0} f (m + 1, \bar{x}) = t

wobei

$t_{0}$ enthält nur PR Funktionen und die
$x_{i}$
$t$ enthält nur
$f (m, \bar{x})$ , PR Funktionen,
$m$ und die
$x_{i}$

Das erweiterte Schema der primitiven Rekursion führt nicht aus PR hinaus.

Moral:
Primitive Rekursion erlaubt

f (m + 1, \bar{x}) = \dots f (m, \bar{x}) \dots

Prädikate

Sei

P (x)

ein Prädikat, d.h. ein logischer Ausdruck, der in Abhängigkeit von

x \in N_{0}

den Wert true oder false liefert.
Dann kann P in natürlicher Weise eine Funktion

\hat{P} : N \to {0, 1}

zugeordnet werden:

\hat{P} (x) = 1

gdw.

P (x) =

true

P

ist primitiv rekursiv genau dann, wenn

\hat{P}

primitiv rekursiv ist.

Ist

P

primitiv rekursiv, dann auch der beschränkte max-Operator

max {x \geq n | P (x)} =: q (n)

wobei

max \emptyset := 0

Ist

P

primitiv rekursiv, dann auch der beschränkte Existenzquantor

\exists x \leq n . P (x) =: Q (x)

4.11 PR = LOOP

Hauptproblem bei LOOP

\to

PR:
Kodierung aller Variablen eines LOOP-Programms in einer Zahl

Cantorsche Paarungsfunktion

Die Cantorsche Paarungsfunktion

c (x, y) := (\binom{x + y + 1}{2}) + x = (x + y) (x + y + 1) / 2 + x

ist eine Bijektion zwischen

N^{2}

und

N

Die funktion

x \mapsto (\binom{x}{2})

ist PR:

(\binom{0}{2}) = 0 (\binom{n + 1}{2}) = (\binom{n}{2}) + n

Mit Komposition ist auch

c

PR:

c (x, y) = (\binom{x + y + 1}{2}) + x

Mit

c

kodiert man

k + 1

Tupel:

⟨ n_{0}, n_{1}, \dots, n_{k} ⟩ := c (n_{0}, c (n_{1}, \dots, c (n_{k}, 0) \dots))

Die umkehrfunktionen

p_{1}

und

p_{2}

von c werden gebraucht:

p_{1} (c (x, y)) = x p_{2} (c (x, y)) = y

Damit können Projektionsfunktionen auf Tupeln definiert werden

d_{0} (n) := p_{1} (n) d_{1} (n) := p_{1} (p_{2} (n)) ⋮ d_{k} (n) := p_{1} (p_{2} \dots p_{2} (n) \dots), k-mal p_{2}

Sind

p_{1}, p_{2}

PR, so auch

d_{0}, \dots, d_{k}

Die Umkehrfunktionen von

c

sind PR definierbar:

p_{1} (n) = max {x \leq n | \exists y \leq n . c (x, y) = n} p_{2} (n) = max {y \leq n | \exists x \leq n . c (x, y) = n}

PR = LOOP:
Die Primitiv rekursiven sind genau die LOOP-berechenbaren Funktionen.

Reversible Kodierung von Zahlenfolgen als Zahlen

${0, \dots, k}^{*}$ : Kodiere
$(i_{1}, \dots, i_{n})$ als Zahl
$i_{1} \dots i_{n}$ zur Basis
$k + 1$
$N^{n}$ : Mit iterierter Paarfunktion
$c : ⟨ i_{1}, \dots, i_{n} ⟩$
NB: n muss beim Dekodieren bekannt sein, denn z.B.
$1 = c (0, 1) = c (0, c (0, 1))$
$N^{*}$ : Auch mit
$⟨ \dots ⟩$ reversibel kodierbar
$N^{*}$ : Kodiere
$(i_{1}, \dots, i_{n})$ als
$2^{i_{1}} 3^{i_{2}} \dots p_{n}^{i_{n}}$ , wobei
$p_{n}$ die n-te Primzahl ist. Dekodierung = Primzahlzerlegung

4.12 Die
$μ$ -rekursiven Funktionen

Mit PR kann man nur beschränkt suchen:
$n, \dots, 0$
Die unbeschränkte Suche
$0, \dots$ erfordert so etwas wie

$f (n) = \dots f (n + 1) \dots$
Der
$μ$ -Operator formalisiert diese Art der Suche
Damit erhält man alle berechenbaren Funktionen
Andere Such- byw. Rekursionsschemata sind (im Prinzip!) nicht notwendig.

Notation:

f (n) = ⊥

bedeutet "

f (n)

ist undefiniert"

$μ$ -Operator

Sei

f : N^{k} + 1 \to N

eine (nicht notwendigerweise totale) Funktion. Die durch Anwendung des

μ

-Operators entstehende Funktion

μ f : N^{k} \to N

ist definiert durch:

\overset{―}{x} \mapsto {\begin{cases} min {n \in N | f (n, \overset{―}{x}) = 0 & falls ein solches n existiert und f (m, \overset{―}{x}) \neq ⊥ für alle m \leq n \\ ⊥ & sonst \end{cases}

Intuitiv:

μ f (\overset{―}{x}) = f i n d (0, \overset{―}{x}) f i n d (n, \overset{―}{x}) = if f (n, \overset{―}{x}) = 0 then n else f i n d (n + 1, \overset{―}{x})

$μ$ -rekursiv

Die Menge der

μ

-rekursiven Funktionen ist induktiv wie folgt definiert:

Die Basisfunktionen
$0, + 1, π_{i}^{k}$ sind
$μ$ -rekursiv/
Wenn eine Funktion durch Komposition, primitive Rekursion oder den
$μ$ -Operator aus
$μ$ -rekursiven Funktionen definiert werden kann, ist sie
$μ$ -rekursiv

$μ$ R=WHILE

Die

μ

-rekursiven sind genau die WHILE-berechenbaren Funktionen.

Kleene:
Für jede n-stellige

μ

-rekursive Funktion

f

gibt es zwei

n + 1

-stellige PR Funktionen

h

und

h^{'}

, so dass

f (\overset{―}{x}) = h (μ h^{'} (\overset{―}{x}), \overset{―}{x})

4.12 Die Ackermann-Funktion

a (0, n) = n + 1 a (m + 1, 0) = a (m, 1) a (m + 1, n + 1) = a (m, a (m + 1, n))

Dies ist keine PR Definition
Aber:
$⇏ a$ ist nicht PR
Ziel: a ist berechenbar, total, aber nicht PR

Fakt:
Die Ackermann-Funktion ist (OCaml-)berechenbar.

Lemma:
Die Ackermann-Funktion ist total.

Lexikographische Ordnung

(m, n) > (m^{'}, n^{'}) :\Leftrightarrow m > m^{'} \lor (m = m^{'} \land n > n^{'})

Die lexikographische Ordnung auf

N \times N

terminiert

Warnung: Kein Beweise der Totalität einer rekursiven Funktion:
"denn in jedem rekursiven Aufruf wird eines der Argumente kleiner"

Lemma:
Für jede PR-Funktion

f : N^{k} \to N

gibt es ein

t \in N

, so dass

\forall \overset{―}{x} \in N^{k} . f (\overset{―}{x}) < a (t, max \overset{―}{x})

Satz:
Die Ackermann-Funktion ist nicht PR

Oberflächlich intuitiv: Die Ackermann-Funktion wächst schneller als alle PR-Funktionen
Genauer: Die Funktion

n \mapsto a (n, n)

wächst schneller als alle PR funktionen
Intuitiver Grund:

Für fixes
$t$ ist
$n \mapsto a (t, n)$ PR, denn dies ist
$A_{t}$
$A_{t}$ bracht aber eien PR Definition der Länge
$O (t)$
Um
$n \mapsto a (n, n)$ PR zu berechnen, müsste die Länge der PR Definition dynamisch mit der Eingabe wachsen

Da die Ackermann-Funktion total, berechenbar und nicht PR ist wurde gezeigt, dass die PR Funktionen eine echte Teilklasse der berechenbaren totalen funktionen ist.

5. Komplexitätstheorie

Was ist mit beschränkten Mitteln (zeit & platz) berechenbar?
Wieviel Zeit&Platz braucht man, um ein bestimmtes Problem / Sprache zu entscheiden?
Komplexität eines Problems, nicht eines Algorithmus

Zentrale Frage:
Für welche Probleme gibt es / gibt es keine polynomielle Algorithmen?

Komplexitätsklasse P:
P = die von DTM in polynomieller Zeit lösbaren Probleme, = die "leichten" Probleme (feasible problems)

$A \in P$ wird durch Angabe eines Algorithmus bewiesen, z.B. CYK beweist:

${(G, w) | G \in CFG, w \in L (G)} \in P$
$A \notin P$ zu zeigen ist viel schwieriger! Für sehr viele Probleme ist es nicht bekannt, ob sie zu P gehören oder nicht.

Viele der wichtigsten Probleme der Informatik sind der Gestalt:

Gegeben X, gibt es Y mit R (X, Y) ?

SAT:
$X$ = Boole'sche Formel,
$Y$ = Belegung der Variablen von
$X$ ,
$R (X, Y) := "Y erfüllt X"$
HAMILTONKREIS:
$X$ = Graph,
$Y$ = Kreis von
$X$ ,
$R (X, Y) := "Y besucht alle Knoten von X genau einmal"$
EULERKREIS:
$X$ = Graph,
$Y$ = Kreis von
$X$ ,
$R (X, Y) := "Y besucht alle Kanten von X genau einmal"$

Die

Y

sind "Lösungskandidaten". In allen diesen Problemen:

Prüfen ob ein Kandidat tatsächlich eine Lösung ist, ist in P.
Es gibt jedoche exponentiell viele Kandidaten.
Deshalb hat ein naiver Suchalgorithmus, der alle Kandidaten aufzählt und prüft, exponentielle Laufzeit.

Für kein solches Problem ist es bewiesen worden, dass es nicht in P liegt.
Die Frage, ob alle solche Probleme in P liegen, ist die wichtigste offene Frage der Informatik.

Äquivalente Formulierung
Diese Probleme können nichtdeterministisch in polynomieller Zeit gelöst werden: Wähle einen Kandidaten und prüfe, ob er eine Lösung ist.

Komplexitätsklasse NP:
NP = die von NTM in polynomieller Zeit lösbaren Probleme

Zentrale Frage:
P = NP ?

5.1 Die Komplexitätsklasse P

Berechnungsmodell:
DTM: deterministische Mehrband-TM

Definition:

t i m e_{M} (w) :=

Anzahl der Schritte bis die DTM

M [w]

hält

\in N \cup {\infty}

Sei

f : N \to N

eine totale Funktion.
Klasse in der Zeit

f (n)

entscheidbaren Sprachen:

T I M E (f (n)) := {A \subseteq Σ^{*} | \exists DTM M . A = L (M) \land \forall w \in Σ^{*} . {time}_{M} (w) \leq f (| w |)}

Merke:

$n$ ist implizit die Länge der Eingabe
Die DTM entscheidet die Sprache
$A$ in
$\leq f (n)$ Schritten

Es werden nun Polynome mit Koeffizienten

a_{k}, \dots, a_{0} \in N

betrachtet:

p (n) = a_{k} n^{k} + \dots + a_{1} n + a_{0}

Definition:

P := ⋃_{p P o l y n o m} T I M E (p (n))

Damit gilt auch

P = ⋃_{k \geq 0} T I M E (O (n^{k}))

wobei

T I M E (O (f)) := ⋃_{g \in O (f)} T I M E (g)

Bemerkungen

$O (n \log n) \subset O (n^{2})$
$n^{\log n}, 2^{n} \notin O (n^{k})$ für alle
$k$

Analog zu Sprachen nennen wir eine Funktion

f : N \to N

in polynomieller Zeit berechenbar, gdw. es eine DTM

M

gibt, die

f

berechnet und

t i m e_{m} (w) \leq p (| w |)

für ein Polynom

p

Warum P und nicht (z.B.)
$O (n^{17})$ ?
Um robust bzgl. Maschinenmodell zu sein:
1-Band DTM braucht
$O (t^{2})$ Schritte um t schritte einer k-Band DTM zu simulieren.
fast alle bekannten "vernünftigen" Maschinenmodelle lassen sich von einer DTM in polynomieller Zeit simulieren.
Offen: Quantencomputer
Warum TM?
Historisch. Ebenfalls möglich: (z.B.) WHILE.
Aber zwei mögliche Kostenmodelle:
- Uniform:
  $x_{i} := x_{j} + n$ kostet 1 Zeiteinheit
- Logarithmisch:
  $x_{i} := x_{j} + n$ kostet
  $\log x_{j}$ Zeiteinheiten

5.2 Die Komplexitätsklasse NP

Berechnungsmodell:
NTM = nichtdeterministische Mehrband-TM

NP ist die Klasse der Sprachen, die von einer NTM in polynomieller Zeit akzeptiert werden
D.h. Eine Sprache A liegt in NP gdw. es ein Polynom
$p (n)$ und eine NTM M gibt sodass:
- $L (M) = A$ und
- für alle
  $w \in A$ kann
  $M [w]$ in
  $\leq p (| w |)$ Schritten akzeptieren, d.h. einen Endzustand erreichen.

Definition

n t i m e_{m} (w) := {\begin{cases} minimale Anzahl der Schritte bis NTM M [w] akzeptiert & falls w \in L (M) \\ 0 & falls w \notin L (M) \end{cases}

Sei

f : N \to N

eine totale Funktion

N T I M E (f (n)) := {A \subseteq Σ^{*} | \exists NTM M . A = L (M) \land \forall w \in Σ^{*} . n t i m e_{M} (w) \leq f (| w |)} N P := ⋃_{p P o l y n o m} N T I M E (p (n))

bemerkungen:

$P \subseteq N P$
Seit etwa 1970 ist offen ob P = NP.

Weitere Bemerkungen zur Definition von NP:
Akzeptierende NTM

M

braucht für
$w \notin L (M)$ nicht zu halten
kann für
$w \in L (M)$ auch beliebig lange berechnungsfolgen haben.

Äquivalente Definition NP' von NP
Die NTM

M [w]

muss nach maximal

p (| w |)

schritten halten.
NP'

\subseteq

NP: Klar
NP

\subseteq

NP': falls

A \in

NP mit Polynom

p

und NTM

M

, so kann ein NTM

M^{'}

konstruiert werden mit

L (M^{'}) = A

, so dass

M^{'} [w]

immer innerhalb von polynomieller Zeit hält.

Eingabe
$w$
Schreibe
$p (| w |)$ auf ein getrenntes Band ("timer")
Simuliere
$M [w]$ , aber dekrementiere timer nach jedem Schritt
Wird timer = 0, ohne dass
$M$ gehalten hat, halte in einem nicht-Endzustand ("timeout")

Erinnerung:
Viele Probleme sind von der Art, dass

schwer ist, zu entscheiden, ob sie lösbar sind,
leicht ist, zu entscheiden, ob ein Lösungsvorschlag eine Lösung ist.

Formalisierung:
Definition:
Sei

M

eine DTM mit

L (M) \subseteq {w # c | w \in Σ^{*}, c \in Δ^{*}}

Falls
$w # c \in L (M)$ , so heißt
$c$ Zertifikat für
$w$
$M$ ist ein polynomiell beschränkter Verifikator für die Sprache
${w \in Σ^{*} | \exists c \in Δ^{*} . w # c \in L (M)}$ falls es ein Polynom
$p$ gibt, so dass
$t i m e_{M} (w # c) \leq p (| w |)$

NB (merke):
In Zeit

p (n)

kann M maximal die ersten p(n) Zeichen von

c

lesen. Daher genügt für

w

ein Zertifikat der Länge

\leq p (w)

Satz:

A \in

NP gdw. es einen polynomiell beschränkten Verifikator für A gibt

Fazit:

P sind die Sprachen, bei denen
$w \in L$ schnell entschieden werden kann
NP sind die Sprachen, bei denen ein Zertifikat für
$w \in L$ schnell verifiziert/überprüft werden kann.

Intuition:
Es ist leichter, eine Lösung zu verifizieren als zu finden.
Aber:
Noch wurde von keiner Sprache bewiesen, dass sie in NP\P liegt

5.3 NP-Vollständigkeit

Polynomielle Reduzierbarkeit
$\leq_{p}$
NP-vollständige Probleme = härteste Probleme in NP, alle anderen Probleme in NP darauf polznomiell reduzierbar
SAT ist NP-vollständig

Definition

Sei

A \subseteq Σ^{*}

und

B \subseteq Γ^{*}

Dann ist

A

polynomiell reduzierbar auf

B

A \leq_{p} B

, gdw. es eine totale und von einer DTM in polynomieller Zeit berechenbare Funktion

f : Σ^{*} \to Γ^{*}

gibt, so dass für alle

w \in Σ^{*}

w \in A ⟺ f (w) \in B

Die Relation

\leq_{p}

ist transitiv, da $p_2(p_1(n)) ein Polynom ist falls

p_{1}

und

p_{2}

polynome sind.

Die Klassen P und NP sind unter polynomieller Reduzierbarkeit nach unten abgeschlossen:

A \leq_{p} B \in P / N P ⟹ A \in P / N P

NP-Schwer:
Ein Problem ist NP-Schwer, wenn es mindestens so schwer wie alles in NP ist:

Eine Sprache
$L$ ist NP-Schwer gdw.
$A \leq_{p} L$ für alle
$A \in N P$
Eine Sprache
$L$ ist NP-Vollständig gdw.
$L$ NP-schwer ist und
$L \in N P$
NP-Vollständige Probleme sind die schwierigsten Probleme in NP: alle Probleme in NP sind polynomiell auf sie reduzierbar

Lemma:
Es gilt P=NP gdw. ein NP-vollständiges Problem in P liegt.

Starke vermutung:

P
$\neq$ NP
d.h. kein NP-vollständiges Problem ist in P

Aussagenlogik

Syntax der Aussagenlogik:

Variablen:
$X \to x | y | z | \dots$
Formeln:
$F \to X | \neg F | (F \land F) | (F \lor F) | X$

Man darf einige Klammern weglassen:

Äußerste Klammern:
$(x \lor y) \land z$ statt
$((x \lor y) \land z)$
Assoziativität:
$(x \lor y \lor z) \land \neg x$ statt
$((x \lor y) \lor z) \land \neg x$

Abkürzungen

$F_{1} \to F_{2} \equiv \neg F_{1} \lor F_{2}$
$⋀_{i = 1}^{n} F_{i} \equiv F_{1} \land \dots \land F_{n}$

Semantik der Aussagenlogik:

Eine Belegung ist eine Funktion von Variablen auf
${0, 1}$ .
Bsp:
$σ = {x \mapsto 0, y \mapsto 1, z \mapsto 0, \dots}$
Belegungen werden mittels Wahrheitstabellen auf Formeln erweitert.
Bsp:
$σ ((\neg x \land y) \lor (x \land \neg z)) = 1$
Eine Formel F ist erfüllbar gdw. es eine Belegung
$σ$ gibt mit
$σ (F) = 1$

SAT

Gegeben: Eine aussagenlogische Formel F
Problem: ist F erfüllbar?

Lemma:
SAT

\in

Satz: (Cook, 1971)
SAT ist NP-vollständig

Von der Lösbarkeit zur Lösung

Die Berechnung einer erfüllenden Belegung kann auf SAT "reduziert" werden.
Sei

F

eine Formel mit den Variablen

x_{1}, \dots, x_{k}

:

wobei

F [x := b] = F

mit

x

ersetzt durch

b

Entscheidung von SAT in Zeit

O (f (n))

⟹

Berechnung einer erf. Bel. in Zeit

O (n * (f (n) + n))

, falls es eine gibt.

f (n) polynomiell ⟹ n * (f (n) + n) polynomiell f (n) exponentiell ⟹ n * (f (n) + n) exponentiell

Bemerkungen:

Die Redunktion der Lösungsberechnung auf SAT ist eine rein theoretische Konstruktion
Sie zeigt, dass man sich auf SAT beschränken kann, wenn man nur an polynomiell/exponentiell interessiert ist
Alle bekannten Entscheidungsverfahren für SAT berechnen auch eine Lösung

Von NP-schwer zu "NP-leicht"

Bis vor ca. 20 Jahren: NP-vollständig -> Todesurteil
in den letzten 15 jahren: Spektakuläre fortschritte bei der implementierung von SAT-Lösern
Stand der Kunst: Erfüllbar bis 10⁵ variablen, Unerfüllbar bis 10³ variablen
Jetzt: NP-vollständig -> Hoffnung durch SAT
Paradigma: SAT (Logik!) als universelle Sprache zur Kodierung kombinatorischer Probleme
Reduktion auf SAT manchmal schneller als problemspezifische Löser, und fast immer einfacher.

doc todos

TODO: Folien 98-103 verstehen
vorherige TODOs machen
TODO: Folie 97: keine reguläre Lösung???
TODO: bei Problemen nochmal die Beweise anschauen
TODO: Pumping-Lemma again
TODO: 261-299: Primitiv-Rekursive Funktionen bis Ackerman-Funktion

Theo

Teil 1: Formale Sprachen

1. Grundbegriffe:

Operationen auf Sprachen

Einige Rechenregeln

1.1 Grammatiken

1.2 Chomsky-Hierarchie

2. Reguläre Sprachen

2.1 Deterministische endliche Automaten (DFAs)

2.2 Nichtdeterministische endliche Automaten (NFAs)

2.3 Äquivalenz von NFA und DFA

2.4 NFAs mit ϵ-Übergängen

2.5 Rechtslineare Grammatiken

2.6 Reguläre Ausdrücke

2.7 Abschlusseigenschaften regulärer Sprachen

2.8 Rechnen mit regulären Ausdrücken

Null und Eins

Assoziativität:

Kommutativität

Distributivität

Idempotenz:

Stern:

2.9 Pumping Lemma für Reguläre Sprachen

2.10 Entscheidungsverfahren

2.11 Automaten und Gleichungssysteme

2.12 Minimierung endlicher Automaten

Algorithmus zur Minimierung eines DFA

Formale Definition des "kollabierten Automaten"

Äquivalenz von Zuständen

Minimalität des Quotientenautomaten

Satz von Myhill-Nerode

3. Kontextfreie Sprachen

3.1 Kontextfreie Grammatiken

Kontextfreie Sprache

3.2 Induktive Definitionen, Syntaxbäume und Ableitungen

Syntaxbaum

3.3 Die Chomsky-Normalform

Konstruktion einer Chomsky-Normalform

Greibach-Normalform

3.4 Das Pumping-Lemma für kontextfreie Sprachen

3.5 Algorithmen für kontextfreie Grammatiken

3.6 Der Cocke-Younger-Kasami-Algorithmus (CYK)

3.7 Abschlusseigenschaften

3.8 Kellerautomaten

Definition

Akzeptanz

beweishilfen:

3.9: Äquivalenz von PDAs und CFGs

CFG→PDA

PDA → CFG

3.10 Deterministische Kellerautomaten

3.11 Tabellarischer überblick

Abschlusseigenschaften

Entscheidbarkeit

Teil 2: Berechenbarkeit, Entscheidbarkeit, Komplexität

4. Berechenbarkeit, Entscheidbarkeit

4.1 Der Begriff der Berechenbarkeit

Church-Turing-These

4.2 Turingmaschinen

Definition

Konfiguration:

Akzeptanz

Halten/Terminieren

Weiteres

4.3 Programmieren mit Turingmaschinen

4.4 WHILE- und GOTO-Berechenbarkeit

WHILE-Programme:

While-Berechenbarkeit

WHILE → TM

GOTO-Programme:

WHILE → GOTO

GOTO → WHILE

TM → GOTO

LOOP-Berechenbarkeit / LOOP-Programme

Loop-berechenbarkeit

4.5 Unentscheidbarkeit des Halteproblems

Definition:

Spezielles Halteproblem

(Allgemeines) Halteproblem

Reduktion

2.4 NFAs mit
$ϵ$ -Übergängen

CFG
$\to$ PDA

PDA
$\to$ CFG

WHILE
$\to$ TM

WHILE
$\to$ GOTO

GOTO
$\to$ WHILE

TM
$\to$ GOTO

4.12 Die
$μ$ -rekursiven Funktionen

$μ$ -Operator

$μ$ -rekursiv

$μ$ R=WHILE

tags: `Theo`