Template

Sabtu, 12 Februari 2011

Teori Bahasa

BAHAN AJAR





TEORI BAHASA DAN OTOMATA














BAB I
PENDAHULUAN


Teori Bahasa
• Teori bahasa membicarakan bahasa formal (formal language), terutama untuk kepentingan perancangan kompilator (compiler) dan pemroses naskah (text processor).
• Bahasa formal adalah kumpulan kalimat. Semua kalimat dalam sebuah bahasa dibangkitkan oleh sebuah tata bahasa (grammar) yang sama.
• Sebuah bahasa formal bisa dibangkitkan oleh dua atau lebih tata bahasa berbeda.
• Dikatakan bahasa formal karena grammar diciptakan mendahului pembangkitan setiap kalimatnya.
• Bahasa Natural/manusia bersifat sebaliknya; grammar diciptakan untuk meresmikan kata-kata yang hidup di masyarakat. Dalam pembicaraan selanjutnya ‘bahasa formal’ akan disebut ‘bahasa’ saja.
Otomata (Automata)
• Otomata adalah mesin abstrak yang dapat mengenali (recognize), menerima (accept), atau membangkitkan (generate) sebuah kalimat dalam bahasa tertentu.


Beberapa Pengertian Dasar :

• Simbol adalah sebuah entitas abstrak (seperti halnya pengertian titik dalam geometri). Sebuah huruf atau sebuah angka adalah contoh simbol.
• String adalah deretan terbatas (finite) simbol-simbol. Sebagai contoh, jika a, b, dan c adalah tiga buah simbol maka abcb adalah sebuah string yang dibangun dari ketiga simbol tersebut.
• Jika w adalah sebuah string maka panjang string dinyatakan sebagai w dan didefinisikan sebagai cacahan (banyaknya) simbol yang menyusun string tersebut. Sebagai contoh, jika w = abcb maka w= 4.
• String hampa adalah sebuah string dengan nol buah simbol. String hampa dinyatakan dengan simbol  (atau ^) sehingga = 0. String hampa dapat dipandang sebagai simbol hampa karena keduanya tersusun dari nol buah simbol.
• Alfabet adalah hinpunan hingga (finite set) simbol-simbol
Operasi Dasar String
Diberikan dua string : x = abc, dan y = 123
• Prefik string w adalah string yang dihasilkan dari string w dengan menghilangkan nol atau lebih simbol-simbol paling belakang dari string w tersebut.
Contoh : abc, ab, a, dan  adalah semua Prefix(x)
• ProperPrefix string w adalah string yang dihasilkan dari string w dengan menghilangkan satu atau lebih simbol-simbol paling belakang dari string w tersebut.
Contoh : ab, a, dan  adalah semua ProperPrefix(x)
• Postfix (atau Sufix) string w adalah string yang dihasilkan dari string w dengan menghilangkan nol atau lebih simbol-simbol paling depan dari string w tersebut.
Contoh : abc, bc, c, dan  adalah semua Postfix(x)
• ProperPostfix (atau PoperSufix) string w adalah string yang dihasilkan dari string w dengan menghilangkan satu atau lebih simbol-simbol paling depan dari string w tersebut.
Contoh : bc, c, dan  adalah semua ProperPostfix(x)
• Head string w adalah simbol paling depan dari string w.
Contoh : a adalah Head(x)

• Tail string w adalah string yang dihasilkan dari string w dengan menghilangkan simbol paling depan dari string w tersebut.
Contoh : bc adalah Tail(x)
• Substring string w adalah string yang dihasilkan dari string w dengan menghilangkan nol atau lebih simbol-simbol paling depan dan/atau simbol-simbol paling belakang dari string w tersebut.
Contoh : abc, ab, bc, a, b, c, dan  adalah semua Substring(x)
• ProperSubstring string w adalah string yang dihasilkan dari string w dengan menghilangkan satu atau lebih simbol-simbol paling depan dan/atau simbol-simbol paling belakang dari string w tersebut.
Contoh : ab, bc, a, b, c, dan  adalah semua Substring(x)
• Subsequence string w adalah string yang dihasilkan dari string w dengan menghilangkan nol atau lebih simbol-simbol dari string w tersebut.
Contoh : abc, ab, bc, ac, a, b, c, dan  adalah semua Subsequence(x)
• ProperSubsequence string w adalah string yang dihasilkan dari string w dengan menghilangkan satu atau lebih simbol-simbol dari string w tersebut.
Contoh : ab, bc, ac, a, b, c, dan  adalah semua Subsequence(x)
• Concatenation adalah penyambungan dua buah string. Operator concatenation adalah concate atau tanpa lambang apapun.
Contoh : concate(xy) = xy = abc123
• Alternation adalah pilihan satu di antara dua buah string. Operator alternation adalah alternate atau .
Contoh : alternate(xy) = xy = abc atau 123
• Kleene Closure : x* = xxxxxx… = xx x …
• Positive Closure : x = xxxxxx… = xx x …
Beberapa Sifat Operasi
• Tidak selalu berlaku : x = Prefix(x)Postfix(x)
• Selalu berlaku : x = Head(x)Tail(x)
• Tidak selalu berlaku : Prefix(x) = Postfix(x) atau Prefix(x)  Postfix(x)
• Selalu berlaku : ProperPrefix(x)  ProperPostfix(x)
• Selalu berlaku : Head(x)  Tail(x)
• Setiap Prefix(x), ProperPrefix(x), Postfix(x), ProperPostfix(x), Head(x), dan Tail(x) adalah Substring(x), tetapi tidak sebaliknya
• Setiap Substring(x) adalah Subsequence(x), tetapi tidak sebaliknya
• Dua sifat aljabar concatenation :
• Operasi concatenation bersifat asosiatif : x(yz) = (xy)z
• Elemen identitas operasi concatenation adalah  : x = x = x
• Tiga sifat aljabar alternation :
• Operasi alternation bersifat komutatif : xy = yx
• Operasi alternation bersifat asosiatif : x(yz) = (xy)z
• Elemen identitas operasi alternation adalah dirinya sendiri : xx = x
• Sifat distributif concatenation terhadap alternation : x (yz) = xyxz
• Beberapa kesamaan :
• Kesamaan ke-1 : (x*)* = x*
• Kesamaan ke-2 : x = x  = x*
• Kesamaan ke-3 : (xy)* = xyxxyyxyyx… = semua string yang merupakan concatenation dari nol atau lebih x, y, atau keduanya.


BAB II
GRAMMAR DAN BAHASA

Konsep Dasar

• Anggota alfabet dinamakan simbol terminal.

• Kalimat adalah deretan hingga simbol-simbol terminal.

• Bahasa adalah himpunan kalimat-kalimat. Anggota bahasa bisa tak hingga kalimat.

• Simbol-simbol berikut adalah simbol terminal :
 huruf kecil, misalnya : a, b, c
 simbol operator, misalnya : +, , dan 
 simbol tanda baca, misalnya : (, ), dan ;
 string yang tercetak tebal, misalnya : if, then, dan else.

• Simbol-simbol berikut adalah simbol non terminal /Variabel :
 huruf besar, misalnya : A, B, C
 huruf S sebagai simbol awal
 string yang tercetak miring, misalnya : expr

• Huruf yunani melambangkan string yang tersusun atas simbol-simbol terminal atau simbol-simbol non terminal atau campuran keduanya, misalnya : , , dan .

• Sebuah produksi dilambangkan sebagai   , artinya : dalam sebuah derivasi dapat dilakukan penggantian simbol  dengan simbol .

• Derivasi adalah proses pembentukan sebuah kalimat atau sentensial. Sebuah derivasi dilambangkan sebagai :   .

• Sentensial adalah string yang tersusun atas simbol-simbol terminal atau simbol-simbol non terminal atau campuran keduanya.

• Kalimat adalah string yang tersusun atas simbol-simbol terminal. Kalimat adalah merupakan sentensial, sebaliknya belum tentu..
Grammar :

Grammar G didefinisikan sebagai pasangan 4 tuple : V , V , S, dan P, dan dituliskan sebagai G(V , V , S, P), dimana :

V : himpunan simbol-simbol terminal (alfabet) kamus
V : himpunan simbol-simbol non terminal
SV : simbol awal (atau simbol start)
P : himpunan produksi

Contoh :

1. G1 : VT = {I, Love, Miss, You}, V = {S,A,B,C},
P = {S  ABC, A I, B Love | Miss, C You}

S  ABC
 IloveYou

L(G1)={IloveYou,IMissYou}

2. . G2 : VT = {a}, V = {S}, P = {S  aSa}

S  aS
 aaS
 aaa L(G2) ={an  n ≥ 1}

L(G2)={a, aa, aaa, aaaa,…}


Klasifikasi Chomsky

Berdasarkan komposisi bentuk ruas kiri dan ruas kanan produksinya (  ), Noam Chomsky mengklasifikasikan 4 tipe grammar :

1. Grammar tipe ke-0 : Unrestricted Grammar (UG)
Ciri : ,   (V V )*, > 0
2. Grammar tipe ke-1 : Context Sensitive Grammar (CSG)
Ciri : ,   (V V ) *, 0 <   
3. Grammar tipe ke-2 : Context Free Grammar (CFG)
Ciri :   V ,   (V V )*
4. Grammar tipe ke-3 : Regular Grammar (RG)
Ciri :   V ,   {V , V V } atau   V ,   {V , V V }

Tipe sebuah grammar (atau bahasa) ditentukan dengan aturan sebagai berikut :

A language is said to be type-i (i = 0, 1, 2, 3) language if it can be specified by a type-i grammar but can’t be specified any type-(i+1) grammar.

Contoh Analisa Penentuan Type Grammar

1. Grammar G dengan P = {S  aB, B  bB, B  b}.

Ruas kiri semua produksinya terdiri dari sebuah V maka G kemungkinan tipe CFG atau RG. Selanjutnya karena semua ruas kanannya terdiri dari sebuah V atau string V V maka G adalah RG(3).

2. Grammar G dengan P = {S  Ba, B  Bb, B  b}.

Ruas kiri semua produksinya terdiri dari sebuah V maka G kemungkinan tipe CFG atau RG. Selanjutnya karena semua ruas kanannya terdiri dari sebuah V atau string V V maka G adalah RG(3).

3. Grammar G dengan P = {S  Ba, B  bB, B  b}.


Ruas kiri semua produksinya terdiri dari sebuah V maka G kemungkinan tipe CFG atau RG. Selanjutnya karena ruas kanannya mengandung string V V (yaitu bB) dan juga string V V (Ba) maka G bukan RG, dengan kata lain G adalah CFG(2).

4. Grammar G dengan P = {S  aAb, B  aB}.

Ruas kiri semua produksinya terdiri dari sebuah V maka G kemungkinan tipe CFG atau RG. Selanjutnya karena ruas kanannya mengandung string yang panjangnya lebih dari 2 (yaitu aAb) maka G bukan RG, dengan kata lain G adalah CFG.

5. Grammar G dengan P = {S  aA, S  aB, aAb  aBCb}.

Ruas kirinya mengandung string yang panjangnya lebih dari 1 (yaitu aAb) maka G kemungkinan tipe CSG atau UG. Selanjutnya karena semua ruas kirinya lebih pendek atau sama dengan ruas kananya maka G adalah CSG.


6. Grammar G dengan P = {aS  ab, SAc  bc}. Ruas kirinya mengandung string yang panjangnya lebih dari 1 maka G kemungkinan tipe CSG atau UG. Selanjutnya karena terdapat ruas kirinya yang lebih panjang daripada ruas kananya (yaitu SAc) maka G adalah UG.

Derivasi Kalimat dan Penentuan Bahasa

Tentukan bahasa dari masing-masing gramar berikut :

1. G dengan P = {1. S  aAa, 2. A  aAa, 3. A  b}.
Jawab :
Derivasi kalimat terpendek : Derivasi kalimat umum :
S  aAa (1) S  aAa (1)
 aba (3)  aaAaa (2)

 a Aa (2)
 a ba (3)

Dari pola kedua kalimat disimpulkan : L (G ) = { a ba  n  1}

2. G dengan
P = {1. S  aS, 2. S  aB, 3. B  bC, 4. C  aC, 5. C  a}.

Jawab :
Derivasi kalimat terpendek : Derivasi kalimat umum :
S  aB (2) S  aS (1)
 abC (3) 
 aba (5)  a S (1)
 a B (2)
 a bC (3)
 a baC (4)

 a ba C (4)
 a ba (5)

Dari pola kedua kalimat disimpulkan : L (G )={a ba n 1, m1}


3. G dengan
P = {1. S  aSBC, 2. S  abC, 3. bB  bb,
4. bC  bc, 5. CB  BC, 6. cC  cc}.
Jawab :
Derivasi kalimat terpendek 1: Derivasi kalimat terpendek 3 :
S  abC (2) S  aSBC (1)
 abc (4)  aaSBCBC (1)
Derivasi kalimat terpendek 2 :  aaabCBCBC (2)
S  aSBC (1)  aaabBCCBC (5)
 aabCBC (2)  aaabBCBCC (5)
 aabBCC (5)  aaabBBCCC (5)
 aabbCC (3)  aaabbBCCC (3)
 aabbcC (4)  aaabbbCCC (3)
 aabbcc (6)  aaabbbcCC (4)
 aaabbbccC (6)
 aaabbbccc (6)

Dari pola ketiga kalimat disimpulkan : L (G ) = { a b c  n  1}


Menentukan Grammar Sebuah Bahasa


1. Tentukan sebuah gramar regular untuk bahasa L = { a  n  1}

Jawab :

P (L ) = {S  aSa}

2. Tentukan sebuah gramar bebas konteks untuk bahasa :
L : himpunan bilangan bulat non negatif ganjil

Jawab :

Langkah kunci : digit terakhir bilangan harus ganjil.
Buat dua buah himpunan bilangan terpisah : genap (G) dan ganjil (J)
P (L ) = {S  JGSJS, G  02468, J  13579}


3. Tentukan sebuah gramar bebas konteks untuk bahasa :
L = himpunan semua identifier yang sah menurut bahasa pemrograman Pascal dengan batasan : terdiri dari simbol huruf kecil dan angka, panjang identifier boleh lebih dari 8 karakter

Jawab :

Langkah kunci : karakter pertama identifier harus huruf.
Buat dua himpunan bilangan terpisah : huruf (H) dan angka (A)
P (L ) = {S  HHT, T  ATHTHA, H  abc…, A  012…}

4. Tentukan gramar bebas konteks untuk bahasa
L (G ) = {a b n,m  1, n  m}

Jawab :

Langkah kunci : sulit untuk mendefinisikan L (G ) secara langsung. Jalan keluarnya adalah dengan mengingat bahwa x  y berarti x > y atau x < y.
L = L  L , L ={a b n > m  1}, L = {a b 1  n < m}.
P (L ) = {A  aAaC, C  aCbab}, Q(L ) = {B  BbDb, D aDbab}
P (L ) = {S AB, A  aAaC, C  aCbab, B  BbDb, D aDbab}

5. Tentukan sebuah gramar bebas konteks untuk bahasa :
L = bilangan bulat non negatif genap. Jika bilangan tersebut terdiri dari dua digit atau lebih maka nol tidak boleh muncul sebagai digit pertama.

Jawab :

Langkah kunci : Digit terakhir bilangan harus genap. Digit pertama tidak boleh nol. Buat tiga himpunan terpisah : bilangan genap tanpa nol (G), bilangan genap dengan nol (N), serta bilangan ganjil (J).
P (L ) = {S  NGAJA, A  NNAJA, G 2468, N 02468, J  13579}





BAB III
MESIN PENGENAL BAHASA

Untuk setiap kelas bahasa Chomsky, terdapat sebuah mesin pengenal bahasa. Masing-masing mesin tersebut adalah :

Kelas Bahasa Mesin Pengenal Bahasa
Unrestricted Grammar (UG) Mesin Turing (Turing Machine), TM
Context Sensitive Grammar (CSG) Linear Bounded Automaton, LBA
Context Free Gammar (CFG) Pushdown Automata, PDA
Regular Grammar, RG Finite State Automata, FSA

FINITE STATE AUTOMATA (FSA)


• FSA didefinisikan sebagai pasangan 5 tupel : (Q, ∑, δ, S, F).

Q : himpunan hingga state
∑ : himpunan hingga simbol input (alfabet)
δ : fungsi transisi, menggambarkan transisi state FSA akibat pembacaan simbol input.
Fungsi transisi ini biasanya diberikan dalam bentuk tabel.
S  Q : state AWAL
F  Q : himpunan state AKHIR

Contoh : FSA untuk mengecek parity ganjil
Q ={Gnp, Gjl} diagram transisi
∑ = {0,1}

tabel transisi
δ 0 1
Gnp Gnp Gjl
Gjl Gjl Gnp

S = Gnp, F = {Gjl}




• Ada dua jenis FSA :

• Deterministic finite automata (DFA)
• Non deterministik finite automata.(NFA)

- DFA : transisi state FSA akibat pembacaan sebuah simbol bersifat tertentu.
δ : Q  ∑ Q
- NFA : transisi state FSA akibat pembacaan sebuah simbol bersifat tak tentu.
δ : Q  ∑  2Q

DFA :

Q = {q0, q1, q2}
δ diberikan dalam tabel berikut :

∑= {a, b} δ a b
S = q0 q0 q0 q1
F = {q0, q1} q1 q0 q2
q2 q2 q2


a b a


q0 q1 q2 b


a b

Kalimat yang diterima oleh DFA : a, b, aa, ab, ba, aba, bab, abab, baba
Kalimat yang dittolak oleh DFA : bb, abb, abba

DFA ini menerima semua kalimat yang tersusun dari simbol a dan b yang tidak mengandung substring bb.

Contoh :

Telusurilah, apakah kalimat-kalimat berikut diterima DFA di atas :

abababaa  diterima
aaaabab  diterima
aaabbaba  ditolak

Jawab :

i) δ (q0,abababaa)  δ (q0,bababaa)  δ (q1,ababaa) 
δ (q0,babaa)  δ (q1,abaa)  δ (q0,baa)  δ (q1,aa) 
δ (q0,a)  q0
Tracing berakhir di q0 (state AKHIR)  kalimat abababaa diterima

ii) δ (q0, aaaabab) δ (q0,aaabab) δ (q0,aabab) 
δ (q0,abab)  δ (q0,bab)  δ (q1,ab)  δ (q0,b)  q1
Tracing berakhir di q1 (state AKHIR)  kalimat aaaababa diterima

iii) δ (q0, aaabbaba)  δ (q0, aabbaba)  δ (q0, abbaba) 
δ (q0, bbaba)  δ (q1,baba)  δ (q2,aba)  δ (q2,ba)  δ (q2,a) q2
Tracing berakhir di q2 (bukan state AKHIR)  kalimat aaabbaba ditolak


Kesimpulan :

sebuah kalimat diterima oleh DFA di atas jika tracingnya berakhir di salah satu state AKHIR.


NFA :

Berikut ini sebuah contoh NFA (Q, ∑, δ, S, F). dimana :
Q = {q , q , q ,q , q } δ diberikan dalam tabel berikut :
∑= {a, b,c} δ a b c
S = q
Q
{q , q }
{q , q }
{q , q }

F = {q }
q
{q , q }
{q }
{q }

q
{q }
{q , q }
{q }

q
{q }
{q }
{q , q }

q
  

Ilustrasi graf untuk NFA adalah sebagai berikut :

a, b, c a, b, c

a
q q

c b a

b
q q q


a, b, c a, b, c


c

kalimat yang diterima NFA di atas : aa, bb, cc, aaa, abb, bcc, cbb
kalimat yang tidak diterima NFA di atas : a, b, c, ab, ba, ac, bc


Sebuah kalimat di terima NFA jika :

• salah satu tracing-nya berakhir di state AKHIR, atau
• himpunan state setelah membaca string tersebut mengandung state AKHIR

Contoh :

Telusurilah, apakah kalimat-kalimat berikut diterima NFA di atas :
ab, abc, aabc, aabb

Jawab :

1. δ(q ,ab)  δ(q ,b)  δ(q ,b)  {q , q }  {q } = {q , q , q }
Himpunan state TIDAK mengandung state AKHIR  kalimat ab tidak diterima

2. δ(q ,abc)  δ(q ,bc)  δ(q ,bc)  { δ(q ,c)  δ(q ,c)}δ(q , c)
{{ q , q }{ q }}{ q } = {q , q , q ,q }
Himpunan state TIDAK mengandung state AKHIR  kalimat abc tidak diterima

3. δ(q ,aabc)  δ(q ,abc)  δ(q ,abc){ δ(q ,bc)  δ(q ,bc)} 
δ (q ,bc) {{ δ(q , c)  δ(q ,c)}  δ(q , c)}  δ(q , c) 
{{{ q , q } { q }}  {q }}  {q } = {q , q , q ,q }
Himpunan state TIDAK mengandung state AKHIR  kalimat aabc tidak diterima

4. δ(q ,aabb)  δ(q ,abb)  δ(q ,abb)
 { δ(q ,bb)  δ(q ,bb)}  δ (q ,bb)
{{ δ(q , b)  δ(q ,b)}  δ(q , b)}  δ(q , b)
{{{ q , q } { q , q }}  {q }}  {q } = {q , q , q , q }
Himpunan state mengandung state AKHIR  kalimat aabb diterima




EKUIVALENSI NFA-DFA

• Ada apa dengan NFA ? konsep yang sulit diimplemen-tasikan. Komputer sepenuhnya deterministic.
• Kenapa dipelajari ? Lebih dekat ke sistem nyata
• Contoh : permainan catur, banyak alternatif pada suatu posisi tertentu -> nondeterministic
Algoritma :
1. Buat semua state yang merupakan subset dari state semula. jumlah state menjadi 2Q
2. Telusuri transisi state–state yang baru terbentuk, dari diagram transisi.
3. Tentukan state awal : {q0}
4. Tentukan state akhir adalah state yang elemennya mengandung state akhir.
5. Reduksi state yang tak tercapai oleh state awal.

Contoh Ubahlah NFA berikut menjadi DFA

M={{q0,q1}, {0,1}, , q0,{q1}} dengan tabel transisi

 0 1
q0 {q0,q1} {q1}
q1 {} {q0,q1}





1. State yang akan dibentuk : {}, {q0} {q1},{q0,q1}
2. Telusuri state

0 1
{} {} {}
{q0} {q0,q1} {q1¬}
{q1} {} {q0,q1}
{q0,q1} {q0,q1} {q0,q1}




Contoh : Ubahlah NFA berikut menjadi DFA

M={{q0,q1 ,q2}, {p,r}, , q0,{q1}} dengan tabel transisi

 p r
q0 {q1,q2} {}
q1 {} {q2}
q2 {q1} {q1}


1. State yang akan dibentuk : {}, {q0} {q1},{q2}, {q0,q1}, {q0,q2}, {q1,q2}, {q0,q1,q2}

2. Telusuri state:

 p r
{} {} {}
{q0} {q1,q2} {}
{q1} {} {q2}
{q2} {q1} {q1}
{q0,q1} {q1,q2} {q2}
{q0,q2} {q1,q2} {q1}
{q1,q2} {q1} {q1,q2}
{q0,q1,q2 } {q1,q2} {q1,q2}


3. State awal : {q0}
4. State akhir yang mengandung q1, yaitu {q1},{q1,q2}
5. Reduksi {q0,q1}{q0,q2}{q0,q1,q2 } sehingga FSA menjadi




Ekspresi Reguler

• Bahasa regular dapat dinyatakan sebagai ekspresi regular dengan menggunakan 3 operator : concate, alternate, dan closure.
• Dua buah ekspresi regular adalah ekuivalen jika keduanya menyatakan bahasa yang sama

Contoh ekspresi reguler

• (0|1)* : himpunan seluruh string yang dapat dibentuk dari simbol ‘0’ atau ‘1’
• (0|1)*00(0|1)* : himpunan string biner yang mengandung paling sedikit satu substring ‘00’
• (0|1)*00 : himpunan string biner yang diakhiri dengan ‘00’

Bahasa Reguler :

Apabila r adalah ER, maka L(r) adalah bahasa reguler yang dibentuk menggunakan ekspressi reguler r.

Contoh

L = {a ba  n  1, m  1}  er = a b a
L = {a ba  n  0, m  0}  er = a* b a*
Perhatikan bahwa kita tidak bisa membuat ekspresi regular dari bahasa
L = {a ba  n  1} atau L = {a ba  n  0}, karena keduanya tidak dihasilkan dari grammar regular.

Tentukan bahasa reguler yang dibentuk oleh r=(aa)*
Jawab
L(r) = L( (aa)* )
= { , aa, aaaa, aaaaaa, ... }
= { a2n | n  0 }
menyatakan himpunan string a dengan jumlah genap

Tentukan bahasa reguler yang dibentuk oleh r=(aa*)(bb)*b
Jawab
L(r) = L( (aa)* (bb)*b )
= { a2n b2m+1 | n,m  0 }

Tentukan ekspresi reguler pembentuk bahasa pada  = {0,1}, yaitu
L(r) = { w  * | w memiliki substring ‘00’ }
Jawab
r = (0|1)*00(0|1)*

Tentukan ekspresi reguler pembentuk bahasa pada  = {a,b}, yaitu

L(r) = { abnw | n 3 , w  {a , b}+ }
Jawab
r = abbb(a|b)(a|b)*

Latihan :

1. Carilah seluruh string pada L((a|b)*b(a|ab)*) dengan panjang string kurang dari 4.

2. Tentukan ekspresi reguler pembentuk bahasa pada  = {a,b,c}, yaitu
a. L(r) = { w  * | w memiliki tepat sebuah simbol ‘a’ }
b. L(r) = { w  * | w mengandung tepat 3 buah simbol ‘a’}
c. L(r) = { w  * | w mengandung kemunculan masing masing simbol minimal satu kali}

3. Tentukan ekspresi reguler pembentuk bahasa pada  = {0,1}, yaitu
a. L(r) = { w  * | w diakhiri dengan string 01 }
b. L(r) ={ w  * | w tidak diakhiri dengan string 01 }
c. L(r) ={ w  * | w mengandung simbol ‘0’ sebanyak genap }
d. L(r) ={ w  * | kemunculan string ’00’ pada w sebanyak kelipatan 3 }

4. Tentukan ekspresi reguler pembentuk bahasa pada  = {a,b}, yaitu L(r) = { w  * | |w| mod 3 = 0 }

Kesamaan 2 ekspresi regular :
(a b)* a = a (b a)*
Bukti :
(a b)* a = ((ab)(abab)…) a = ( a(aba)(ababa)…) = (a(aba)(ababa)…)
= a ((ba)(baba)…) = a (b a)*

Latihan 2. Buktikan kesamaan ekspresi regular berikut :
1. (a*b)* = (ab)*
2. (ab*)* = (ab)*
3. (a* b)* a* = a* (b a*)*
4. (a a*)(a) = a*



• ER -> NFA -> DFA


BAB IV

PENYEDERHANAAN
TATA BAHASA BEBAS KONTEKS

Tujuan :

Melakukan pembatasan sehingga tidak menghasilkan pohon penurunan yang memiliki kerumitan yang tidak perlu atau aturan produksi yang tidak berarti.
Contoh 1:
S  AB | a
Aa
• Aturan produksi S  AB tidak berarti karena B tidak memiliki penurunan

Contoh 2 : SA
AB
BC
CD
D  a | A

• Memiliki kelemahan terlalu panjang jalannya padahal berujung pada S  a,
• produksi D  A juga menyebabkan kerumitan.

Cara Penyederhanaan:

1. Penghilangan produksi useless ( tidak berguna )
2. Penghilangan produksi unit
3. Penghilangan produksi ε

Penghilangan Produksi Useless

Di sini produksi useless didefinisikan sebagai :

• Produksi yang memuat symbol variabel yang tidak memiliki penurunan yang akan menghasilkan terminal-terminal seluruhnya.
• Produksi yang tidak akan pernah dicapai dengan penurunan apapun dari simbol awal, sehingga produksi itu redundan ( berlebih )



Contoh :
S  aSa | Abd | Bde
A  Ada
B BBB | a

Maka :

1) Simbol variabel A tidak memiliki penurunan yang menuju terminal, sehingga bisa dihilangkan
2) Konsekuensi no (1), aturan produksi S  Abd tidak memiliki penurunan

Penyederhanaan menjadi:

SaSa | Bde
B BBB | a

Contoh :
S Aa | B
Aab | D
B b | E
C bb
E aEa

Maka :
1) Aturan produksi A  D, simbol variabel D tidak memiliki penurunan.
2) Aturan produksi C  bb, Penurunan dari simbol S, dengan jalan manapun tidak akan pernah mencapai C
3) Simbol variabel E tidak memiliki aturan produksi yang menuju terminal
4) Konsekuensi no (3) Aturan produksi B  E, simbol variabel E tidak memiliki penurunan.

maka produksi yang useless:

A  D
C  bb
E  aEa
B  E
Penyederhanaannya menjadi:

S  Aa | B
A  ab
B  b



Contoh :
S  aAb | cEB
A  dBE | eeC
B  ff
C  ae
D  h
Analisa :
1) Aturan produksi S  cEB, A  dBE dapat dihilangkan ( E tidak memiliki penurunan)
2) Aturan produksi D  h, redundan
Sisa aturan produksi
S  aAb
A  eeC
B  ff
C  ae
Analisis lagi
B  ff juga redundan,
Hasil penyederhanaan menjadi:
S  aAb
A  eeC
C  ae

Contoh lain lagi :
S  aB
A  bcD | dAC
B  e | Ab
C  bCb | adF | ab
F  cFB
Analisis
1) Aturan produksi A  bcD, variabel D tidak memiliki penurunan
2) Konsekuensi no (1), simbol variabel A tidak memiliki penurunan yang menuju terminal (tinggal A  dAC)
3) Konsekuensi no (2), B  Ab tidak memiliki penurunan
4) Simbol variabel F tidak memiliki penurunan yang menuju terminal
5) Konsekuensi no (4), C  adF tidak memiliki penurunan


Setelah disederhanakan menjadi:

S  aB
B  e
C  bCb | ab

Contoh lain lagi :
S  aBD
B  cD | Ab
D  ef
A  Ed
F  dc

Analisa
1) Aturan produksi A  Ed, E tidak memiliki penurunan
2) Aturan produksi F  dc, redundan
Sisa aturan produksi:
S  aBD
B  cD | Ab
D  ef
Analisa lagi
B  Ab, A tidak memiliki penurunan.
Hasil penyederhanaan:
S  aBD
B  cD
D  ef
Contoh lagi:
S  Abc | ab
A  AAA | ε
Aturan produksi setelah disederhanakan:
S  Abc | ab
A  AAA | ε

Ingat A  ε juga harus diperhitungkan

PRINSIP :

Setiap kali melakukan penyederhanaan diperiksa lagi aturan produksi yang tersisa, apakah semua produksi yang useless sudah hilang.

Penghilangan Produksi Unit

• Produksi dimana ruas kiri dan kanan aturan produksi hanya berupa satu simbol variabel, misalkan: A  B, C  D.
• Keberadaannya membuat tata bahasa memiliki kerumitan yang tak perlu.
• Penyederhanaan dilakukan dengan melakukan penggantian aturan produksi unit.



Contoh:
S  Sb
S  C
C  D
C  ef
D  dd
Dilakukan penggantian berturutan mulai dari aturan produksi yang paling dekat menuju ke penurunan terminal-terminal (‘=>’ dibaca ‘menjadi’):
• C  D => C  dd
• S  C => S  dd | ef
Sehingga aturan produksi setelah penyederhanaan:
S  Sb
S  dd | ef
C  dd | ef

Contoh lain:
S  A
S  Aa
A  B
B  C
B  b
C  D
C  ab
D  b
Penggantian yang dilakukan :
• C  D => C  b
• B  C => B  b | ab, karena B  b sudah ada, maka cukup dituliskan B  ab
• A  B => A  ab | b
• S  A => ab | b
Sehingga aturan produksi setelah penyederhanaan:
S  ab | b
S  Aa
A  ab | b
B  ab
B  b
C  b
C  ab
D  b
Contoh lagi:
S  Cba | D
A  bbC
B  Sc | ddd
C  eAn | f | C

Penggantian yang dilakukan:
• D  E menjadi D  gh
• C  C , kita hapus
• S  D menjadi S  gh | SABC

Sehingga aturan produksi setelah penyederhanaan:
S  Cba | gh | SABC
A  bbC
B  Sc | ddd
C  eA | f
D  gh | SABC
E  gh

Penghilangan Produksi ε

Produksi ε adalah produksi dalam bentuk
α  ε

atau bisa dianggap sebagai produksi kosong ( empty ). Penghilangan produksi ε dilakukan dengan melakukan penggantian produksi yang memuat variabel yang bisa menuju produksi ε, atau biasa disebut nullable.

Prinsip penggantiannya bisa dilihat kasus berikut:
S  bcAd
A  ε
A nullable serta A  ε satu-satunya produksi dari A, maka variabel A bisa ditiadakan, hasil penyederhanaan tata bahasa bebas konteks menjadi:

S  bcd


Tetapi bila kasusnya:
S  bcAd
A  bd | ε
A nullable, tapi A  ε bukan satu-satunya produksi dari A, maka hasil penyederhanaan:
S  bcAd | bcd
A  bd
Contoh lagi, terdapat tata bahasa bebas konteks:
S  Ab | Cd
A  d
C  ε
Variabel yang nullable adalah variabel C. Karena penurunan C  ε merupakan penurunan satu-satunya dari C, maka kita ganti S  Cd menjadi S  d. Kemudian produksi C  ε kita hapus.
Setelah penyederhanaan menjadi:
S  Ab | d
A  d
Contoh lain lagi:
S  dA | Bd
A  bc
A  ε
B  c
Variabel yang nullable adalah variabel A. A  ε bukan penurunan satu-satunya dari A ( terdapat A  bc ), maka kita ganti S  dA menjadi S  dA | d.A  ε kita hapus.
Setelah penyederhanaan :
S  dA | d | Bd
A  bc
B  c
Contoh tata bahasa bebas konteks:
S  AaCD
A  CD | AB
B  b | ε
C  d | ε
D  ε
Variabel yang nullable adalah variabel B, C, D. Kemudian dari A  CD, maka variabel A juga nullable ( A  ε ). Karena D hanya memilki penurunan D  ε, maka kita sederhanakan dulu:

• S  AaCD => S  AaC
• A  CD => A  C
• D  ε kita hapus

Selanjutnya kita lihat variabel B dan C memiliki penurunan ε, meskipun bukan satu-satunya penurunan, maka dilakukan penggantian:
• A  AB => A  AB | A | B
• S  AaC => S  AaC | aC | Aa | a
• B  ε dan C  ε kita hapus
Setelah penyederhanaan:
S  AaC | aC | Aa | a
A  C | AB | A | B
B  b
C  ε

Variabel yang nullable adalah A, B, C. Dari S  AB, maka S juga nullable. Kita lakukan penggantian:

• A  aCa => A  aa
• B  bA => B  bA | b
• B  BB => B  BB | B
• A  abB => A  abB | ab
• S  AB => S  AB | A | B | ε
• C  ε, B  ε, A  ε dihapus

*Perhatikan untuk penggantian S  AB kita tetap mempertahankan S  ε, karena S merupakan simbol awal. Ini merupakan satu-satunya perkecualian produksi ε yang tidak dihapus, yaitu produksi ε yang dihasilkan oleh simbol awal.
Hasil akhir dari penyederhanaan:
S  AB | A | B | ε
A  abB | ab | aa
B  bA | b | BB | B

Contoh tata bahasa bebas konteks:
S  aAb
A  aAb | ε
Hasil penyederhanaan:
S  aAb | ab
A  aAb | ab

Contoh tata bahasa bebas konteks:
S  ABaC
A  BC
B  b | ε
C  D | ε
D  d
Hasil penyederhanaan:
S  ABaC | BaC | AaC | ABa | aC | Aa | Ba | a
A  B | C | BC
B  b
C  D
D  d

Prakteknya ketiga penyederhanaan tersebut dilakukan bersama pada suatu tata bahasa bebas konteks, yang nantinya menyiapkan tata bahasa bebas konteks tersebut untuk diubah kedalam suatu bentuk normal Chomsky.
Urutan penghapusan aturan produksi :
1) Hilangkan produksi ε
2) Hilangkan produksi unit
3) Hilangkan produksi useless

Contoh :
S  AA | C | bd
A  Bb | ε
B  AB | d
C  de

Hilangkan produksi ε, sehingga menjadi:
S  A | AA | C | bd
A  Bb
B  B | AB | d
C  de

Selanjutnya penghilangan produksi unit menjadi:
S  Bb | AA | de | bd
A  Bb
B  AB | d
C  de

Penghilangan produksi unit bisa menghasilkan produksi useless.
Terakhir dilakukan penghilangan produksi useless:
S  Bb | AA | de | bd
A  Bb
B  AB | d

Hasil akhir aturan produksi tidak lagi memiliki produksi ε, produksi unit, maupun produksi useless.

BENTUK NORMAL CHOMSKY


Pengertian Bentuk Normal Chomsky

Bentuk normal Chomsky / Chomsky Normal Form (CNF) merupakan salah satu bentuk normal yang sangat berguna untuk tata bahasa bebas konteks ( CFG ). Bentuk normal Chomsky dapat dibuat dari sebuah tata bahasa bebas konteks yang telah mengalami penyederhanaan yaitu penghilangan produksi useless, unit, dan ε. Dengan kata lain, suatu tata bahasa bebas konteks dapat dibuat menjadi bentuk normal Chomsky dengan syarat tata bahasa bebas kontesk tersebut:

• Tidak memiliki produksi useless
• Tidak memiliki produksi unit
• Tidak memiliki produksi ε

Bentuk normal Chomsky (Chomsky Normal Form, CNF) adalah grammar bebas konteks (CFG) dengan setiap produksinya berbentuk :
A  BC atau A  a.

• Transformasi CFG ke CNF adalah trnasformasi berikut :


A  ß , dimana : A  BC, atau
ß  (V V )* A  a


Aturan produksi dalam bentuk normal Chomsky ruas kanannya tepat berupa sebuah terminal atau dua variabel.


Misalkan:

A  BC
A  b
B  a
C  BA | d

Pembentukan Bentuk Normal Chomsky

Langkah-langkah pembentukan bentuk normal Chomsky secara umum sebagai berikut:
• Biarkan aturan produksi yang sudah dalam bentuk normal Chomsky
• Lakukan penggantian aturan produksi yang ruas kanannya memuat simbol terminal dan panjang ruas kanan > 1
• Lakukan penggantian aturan produksi yang ruas kanannya memuat > 2 simbol variabel
• Penggantian-penggantian tersebut bisa dilakukan berkali-kali sampai akhirnya semua aturan produksi dalam bentuk normal Chomsky
• Selama dilakukan penggantian, kemungkinan kita akan memperoleh aturan-aturan produksi baru, dan juga memunculkan simbol-simbol variabel baru



Bisa dilihat tahapan-tahapan tersebut pada gambar 10.1























Tahapan-tahapan pembentukan bentuk normal Chomsky

Contoh, tata bahasa bebas konteks ( kita anggap tata bahasa bebas konteks pada bab ini sudah mengalami penyederhanaan ):

S  bA | aB
A  bAA | aS | a
B  aBB | bS | b

Aturan produksi yang sudah dalam bentuk normal Chomsky:

A  a
B  b

Dilakukan penggantian aturan produksi yang belum bentuk normal Chomsky (‘=>’ bisa dibaca berubah menjadi):


S  bA => S  P1A
S  aB => S  P2B
A  bAA => S  P1AA => A  P1P3
A  aS => A  P2S
B  aBB => B  P2BB => B  P2P4
B  bS => B  P1S
Terbentuk aturan produksi dan simbol variabel baru:
P1  b
P2  a
P3  AA
P4  BB
Hasil akhir aturan produksi dalam bentuk normal Chomsky :

A  a
B  b
S  P1A
S  P2B
A  P1P3
A  P2S
B  P2P4
B  P1S
P1  b
P2  a
P3  AA
P4  BB

Contoh, tata bahasa bebas konteks:

S  aB | CA
A  a | bc
B  BC | Ab
C  aB | b

Aturan produksi yang sudah dalam bentuk normal Chomsky :

S  CA
A  a
B  BC
C  b

Penggantian aturan produksi yang belum dalam bentuk normal Chomsky:

S  aB => S  P1B
A  bc => A  P2P3
B  Ab => B  A P2
C  aB => C  P1B

Terbentuk aturan produksi dan simbol variabel baru:

P1  a
P2  b
P3  c

Hasil akhir aturan produksi dalam bentuk normal Chomsky :

S  CA
A  a
B  BC
C  b
S  P1B
S  P2P3
B  A P2
C  P1B
P1  a
P2  b
P3  c

Contoh, tata bahasa bebas konteks :

S  aAB | ch | CD
A  dbE | eEC
B  ff | DD
C  ADB | aS
D  i
E  jD

Aturan produksi yang sudah dalam bentuk normal Chomsky :

S  CD
B  DD
D  i

Penggantian aturan produksi:

S  aAB => S  P1P2
S  ch => S  P3P4
A  dbE => A  P5P6
A  eEC => A  P8P9
B  ff => B  P10P10
C  ADB => C  AP11
C  aS => C  P1S
E  jD => E  P12D

Terbentuk aturan produksi baru:

P1  a
P2  AB
P3  c
P4  h
P5  d
P6  P7E
P7  b
P8  e
P9  EC
P10  f
P11  DB
P12  j

Hasil akhir dalam bentuk normal Chomsky:

S  CD
B  DD
D  i
S  P1P2
S  P3P4
A  P5P6
A  P8P9
B  P10P10
C  AP11
C  P1S
E  P12D
P1  a
P2  AB
P3  c
P4  h
P5  d
P6  P7E
P7  b
P8  e
P9  EC
P10  f
P11  DB
P12  j

Algoritma CYK untuk Tata Bahasa Bebas Konteks

Algoritma CYK merupakan algoritma parsing dan keanggotaan ( membership) untuk tata bahasa bebas konteks. Algortima ini diciptakan oleh J. Cocke, DH. Younger, dan T. Kasami. Syarat untuk penggunaan algortima ini adalah tata bahasa harus berada dalam bentuk normal Chomsky . Obyektif dari algortima ini adalah untuk menunjukkan apakah suatu string dapat diperoleh dari suatu tata bahasa.

BAB V

PushDown Automata(PDA)

• Definisi : PDA adalah pasangan 7 tuple
M = (Q, , , q , Z , , F), dimana :

Q : himpunan hingga state,
 : alfabet input,
 : alfabet stack,
q  Q : state awal,
Z   : simbol awal stack,
F  Q : himpunan state penerima,

fungsi transisi  : Q  (  {})    2 (himpunan bagian dari Q  *)

• Untuk state q  Q, simbol input a  , dan simbol stack X , (q, a, X) = (p, ) berarti : PDA bertransisi ke state p dan mengganti X pada stack dengan string .

• Konfigurasi PDA pada suatu saat dinyatakan sebagai triple (q, x, ), dimana :
q  Q : state pada saat tersebut, x  * : bagian string input yang belum dibaca, dan   * : string yang menyatakan isi stack dengan karakter terkiri menyatakan top of stack.

• Misalkan (p, ay, X) adalah sebuah konfigurasi, dimana : a  , y  *, X  , dan   *. Misalkan pula (p, a, X) = (q, ) untuk q  Q dan   *. Dapat kita tuliskan bahwa : (p, ay, X)  (q, y, ).







Contoh (PDA Deterministik):
PDA : M = (Q, , , q , Z , , F)
pengenal palindrome L = {xcx x  (ab)*}, dimana x adalah cermin(x), mempunyai tuple :
Q = {q , q , q }, F = { q },  = {a, b, c},  = {A, B, Z }, dan fungsi transisi  terdefinisi melalui tabel berikut :

No. State Input TopStack Hasil No. State Input TopStack Hasil
1 q a Z (q , AZ ) 7 q c Z (q , Z )
2 q b Z (q , BZ ) 8 q c A (q , A)
3 q a A (q , AA) 9 q c B (q , B)
4 q b A (q , BA) 10 q a A (q , )
5 q a B (q , AB) 11 q b B (q , )
6 q b B (q , BB) 12 q  Z (q , Z )

Sebagai contoh, perhatikan bahwa fungsi transisi No. 1 dapat dinyatakan sebagai : (q , a, Z ) = (q , aZ ). Pada tabel transisi tersebut terlihat bahwa pada state q PDA akan melakukan PUSH jika mendapat input a atau b dan melakukan transisi state ke state q jika mendapat input c. Pada state q PDA akan melakukan POP.

Berikut ini pengenalan dua string oleh PDA di atas :
1. abcba : (q , abcba, Z )  (q , bcba, AZ ) (1)
 (q , cba, BAZ ) (4)
 (q , ba, BAZ ) (9)
 (q , a, AZ ) (11)
 (q , , Z ) (10)
 (q , , Z ) (12) (diterima)
2. acb : (q , acb, Z ) (q , cb, AZ ) (1)
 (q , b, AZ ) (8), (crash  ditolak)
3. ab : (q , ab, Z )  (q , b, AZ ) (1)
 (q , , BAZ ) (4) (crash  ditolak)
Penerimaan dan penolakan tiga string di atas dapat dijelaskan sebagai berikut :
1. string abcba diterima karena tracing sampai di state penerima (q ) dan string “abcba” selesai dibaca (string yang belum dibaca = )
2. string acb ditolak karena konfigurasi akhir (q , b, a Z ) sedangkan fungsi transisi (q , b, a) tidak terdefinsi
3. string ab ditolak karena konfigurasi akhir (q , , baZ ) sedangkan fungsi transisi (q , , b) tidak terdefinsi

Ilustrasi graf fungsi transisi PDA di atas ditunjukkan melalui gambar berikut :

b, Z /BZ a, A/

a, Z /AZ a, A/AA
c, A/A
c, B/B
q c, Z / Z q , Z / Z q



a, B/AB b, B/BB
b, A/BA b, B/


• Notasi (p, ay, X)  (q, y, ) dapat diperluas menjadi :
(p, x, ) * (q, y, ), yang berarti konfigurasi (q, y, ) di capai melalui sejumlah (0 atau lebih) transisi.
• Ada dua cara penerimaan sebuah kalimat oleh PDA, yang masing-masing terlihat dari konfigurasi akhir, sebagaimana penjelasan berikut :
Jika M = (Q, , , q , Z , , F) adalah PDA dan x *, maka x diterima dengan state akhir (accepted by final state) oleh PDA M jika : (q , x, Z ) * (q, , ) untuk    * dan q  A. x diterima dengan stack hampa (accepted by empty stack) oleh PDA M jika : (q , x, Z ) * (q, , ) untuk q  Q.


Contoh (PDA Non-Deterministik):
PDA M = (Q, , , q , Z , , F) pengenal palindrome L = {xx x  (ab)*} mempunyai komponen tuple berikut :
Q = {q , q , q }, F = { q },  = {a, b},  = {a, b, Z }, dan fungsi transisi  terdefinisi melalui tabel berikut :

No. St. In. TS Hasil No. St. In. TS Hasil
1 q a Z (q , aZ ),(q , Z ) 7 q  Z (q , Z )
2 q b Z (q , bZ ),(q , Z ) 8 q  a (q , a)
3 q a a (q , aa),(q , a) 9 q  b (q , b)
4 q b a (q , ba),(q , a) 10 q a a (q , )
5 q a b (q , ab),(q , b) 11 q b b (q , )
6 q b b (q , bb),(q , b) 12 q  Z (q , )

Pada tabel transisi tersebut terlihat bahwa pada state q PDA akan melakukan PUSH jika mendapat input a atau b dan melakukan transisi state ke state q jika mendapat input . Pada state q PDA akan melakukan POP. Kedua Contoh di atas menunjukkan bahwa PDA dapat dinyatakan sebagai mesin PUSH-POP.
Berikut ini pengenalan string “baab” oleh PDA di atas :
1. (q , baab, Z )  (q , aab, bZ ) (2 kiri)
 (q , ab, abZ ) (5 kiri)
 (q , ab, abZ ) (3 kanan)
 (q , b, bZ ) (11)
 (q , , Z ) (10)
 (q , , Z ) (12) (diterima)

2. (q , baab, Z )  (q , baab, Z ) (2 kanan) (crash  ditolak)

3. (q , baab, Z )  (q , aab, bZ ) (2 kiri)
 (q , ab, abZ ) (5 kiri)
 (q , b, aabZ ) (3 kiri)
 (q , b, aabZ ) (4 kanan) (crash  ditolak)

4. (q , baab, Z )  (q , aab, bZ ) (2 kiri)
 (q , ab, abZ ) (5 kiri)
 (q , b, aabZ ) (3 kiri)
 (q , , baabZ ) (4 kiri)
 (q , , baabZ ) (9) (crash  ditolak)

q0,aba,z = q0,ba,az = q1, a, az = q1, , z =q2, ,


BAB VI
MESIN TURING

Sebuah mesim Turing dinyatakan dalam 7 tupel :

M = (Q, , S, , F, , Ь), dimana :

Q : himpunan hingga state,
 : alfabet input,
 : alfabet Pita ,   
S Q : state awal,
Ь   : simbol pita kosong (blank)
F  Q : himpunan state akhir/penerima,

fungsi transisi  : Q    (Q    (R,L))
(q0, 0) = (q1, 1, R)

Ilustrasi TM sebagai sebuah ‘mesin’:
Pita TM. Setiap sel berisi sebuah karakter dari
kalimat yang akan dikenali. Di kanan kiri kalimat terdapat tak hingga
simbol hampa.
Head : membaca dan menulisi sel pita TM, bisa bergerak ke kiri atau ke kanan


Finite State FSC : otak dari TM, diimplementasikan dari algoritma pengenalan
Control (FSC) kalimat.

Ilustrasi TM sebagai sebuah graf berarah :
1. Sebagaimana graf, TM terdiri dari beberapa node dan beberapa edge. Dari satu node mungkin terdapat satu atau lebih edge yang menuju node lainnya atau dirinya sendiri.
2. Sebuah node menyatakan sebuah stata (state). Dua stata penting adalah stata awal S (start) dan stata penerima H (halt). Sesaat sebelum proses pengenalan sebuah kalimat, TM berada pada stata S. Jika kalimat tersebut dikenali maka, setelah selesai membaca kalimat tersebut, TM akan akan berhenti pada stata H.
3. Sebuah edge mempunyai ‘bobot’ yang dinotasikan sebagai triple : (a, b, d). a adalah karakter acuan bagi karakter dalam sel pita TM yang sedang dibaca head. Jika yang dibaca head adalah karakter a maka a akan di-overwrite dengan karakter b dan head akan berpindah satu sel ke arah d (kanan atau kiri).
4. Kondisi crash akan terjadi jika ditemui keadaan sebagai berikut :



j1
(a1, b1, c1)
TM sedang berada pada stata i. Jika TM sedang
(a2, b2, c2) membaca simbol ax  a1  a2  …  an maka
i j2 TM tidak mungkin beranjak dari stata i. Jadi
pada kasus ini penelusuran (tracing) TM ber-
(an, bn, cn) akhir pada stata i.
jn
Contoh :
Rancanglah sebuah mesin turing pengenal bahasa L = {a b  n  0).
Jawab :
L tersebut terdiri dari 2 kelompok kalimat yaitu  dan non-. Kelompok non- adalah : ab, aabb, aaabbb, dan seterusnya. Untuk dapat menerima kalimat  TM harus mempunyai edge dari S ke H dengan bobot ( , , R). TM menerima kalimat-kalimat : ab, aabb, aaabbb, dan seterusnya, dengan algoritma sebagai berikut :
1. Mulai dari S, head membaca simbol a.
2. Head membaca simbol a. Tandai simbol a yang sudah dibaca tersebut, head bergerak ke kanan mencari simbol b pasangannya.
3. Head membaca simbol b. Tandai simbol b yang sudah dibaca tersebut, head bergerak ke kiri mencari simbol a baru yang belum dibaca/ditandai.
4. Ulangi langkah 2 dan 3.
5. Head sampai ke H hanya jika semua simbol a dan simbol b dalam kalimat a b selesai dibaca.
Algoritma di atas lebih diperinci lagi sebagai berikut :
1. Mulai dari S, head membaca simbol a.
2. Overwrite a tersebut dengan suatu simbol (misalkan A) untuk menandakan bahwa a tersebut sudah dibaca. Selanjutnya head harus bergerak ke kanan untuk mencari sebuah b sebagai pasangan a yang sudah dibaca tersebut.
i) Jika yang ditemukan adalah simbol a maka a tersebut harus dilewati (tidak boleh dioverwrite), dengan kata lain a dioverwrite dengan a juga dan head bergerak ke kanan.
ii) Jika TM pernah membaca simbol b ada kemungkinan ditemukan simbol B. Simbol B tersebut harus dilewati (tidak boleh dioverwrite), artinya B diover-write dengan B juga dan head bergerak ke kanan.
3. Head membaca simbol b, maka b tersebut harus dioverwrite dengan simbol lain (misalnya B) untuk menandakan bahwa b tersebut (sebagai pasangan dari a) telah dibaca, dan head bergerak ke kiri untuk mencari simbol A.
i) Jika ditemukan B maka B tersebut harus dilewati (tidak boleh dioverwrite), dengan kata lain B dioverwrite dengan B juga dan head bergerak ke kiri.
ii) Jika ditemukan a maka a tersebut harus dilewati (tidak boleh dioverwrite), dengan kata lain a dioverwrite dengan a juga dan head bergerak ke kiri.
4. Head membaca simbol A, maka A tersebut harus dilewati (tidak boleh dioverwrite), dengan kata lain A dioverwrite dengan A juga dan head bergerak ke kanan.
5. Head membaca simbol a, ulangi langkah 2 dan 3.
6. (Setelah langkah 3) head membaca simbol A, maka A tersebut harus dilewati (tidak boleh dioverwrite), dengan kata lain A dioverwrite dengan A juga dan head bergerak ke kanan.
7. Head membaca simbol B, maka B tersebut harus dilewati (tidak boleh dioverwrite), dengan kata lain B dioverwrite dengan A juga dan head bergerak ke kanan.
8. Head membaca simbol , maka  dioverwrite dengan  dan head bergerak ke kanan menuju stata H.













Skema graf Mesin Turing di atas adalah :

(, , R)



(B, B, R) (B, B, L) (B, B, R)

(a, A, R) (b, B, L) (A, A, R) (, , R)
S 1 2 4 H

(a, a, R)
(a, a, L)
(A, A, R)

3
(a, a, L)

Contoh :
Lakukan tracing dengan mesin turing di atas untuk kalimat-kalimat : aabb, aab.
Jawab :
i) (S,aabb)  (1,Aabb)  (1,Aabb)  (2,AaBb)  (3,AaBb)  (S,AaBb)
 (1,AABb)  (1,AABb)  (2,AABB)  (2,AABB)  (4,AABB)
 (4,AABB)  (4,AABB)  (H,AABB)
ii) (S,aab)  (1,Aab)  (1,Aab)  (2,AaB)  (3,AaB)  (S,AaB)  (1,AAB)
 (1,AAb)  crash, karena dari node 1 tidak ada edge dengan bobot
komponen pertamanya hampa ()


Contoh Soal Ujian Sisipan :

MATA UJIAN : TEORI BAHASA DAN OTOMATA
WAKTU : 60 MENIT
DOSEN : DRS. JANOE HENDARTO MKOM
SIFAT : OPEN BOOKS

1. Jelaskan hubungan antara tata bahasa (grammar), bahasa dan otomata?

2. Diketahui grammar G(V , V , S, P) dimana :
V = {a,i,u,e,o,b,k,l,p,s}
V = {S, H, M, T}
S  V
P = {S  MT; T  HHMT ; H  aiueo ; M  bklps }

ba
babi
kokiku
papisukasusu
kakikukaku
bakso
L={x/x adalah string yang yg terdiri dari selang seling huruf mati hidup diawali dgn huruf mati dgn panjang genap>=2}

a. G termasuk grammar tipe berapa? 2 Berikan alasannya.,
ada berapa produksi grammar diatas? 13

b. Buatlah 5 kalimat dengan panjang berbeda yang dapat diturunkan dari grammar G.
Bi, Kaki, kakiku, kakibabi, sususapiku, papisukasusubabi, kokikulisebukukukukuki




b. Tentukan bahasa dari grammar G.

L(G)={x/x adalah string yg diawali huruf mati(b,k,l,p,s) dan selang seling dgn huruf
Hidup dgn panjang genap }



3. Diketahui sebuah NFA (Q, ∑, δ, S, F). dimana :
Q = {q0, q1, q2, q3, q4} δ diberikan dalam tabel transisi berikut :
∑= {0, 1} Δ 0 1
S = q0 q0 { q0, q3} { q0, q1}
F = {q2, q4} q
 {q2}
q2 {q2} {q2}
q3 {q4} 
q4 {q4} {q4}

a. Gambarlah diagram transisi (graf) dari NFA di atas.
b. Tentukan apakah kalimat/string berikut diterima atau ditolak oleh NFA di atas.
• 001
• 10010
• 111000

Contoh Soal Ujian Akhir :
MATA UJIAN : TEORI BAHASA DAN OTOMATA
WAKTU : 75 MENIT
DOSEN : DRS. JANOE HENDARTO MKOM
SIFAT : OPEN BOOKS
TANGGAL : 27 JANUARI 2007

2. Buatlah suatu Deterministic Finite Automata (DFA) yang menerima bahasa yang kalimatnya berupa semua string yang simbol pertamanya ‘1’ dan simbol terakhirnya ‘0’ (∑= {0, 1}).
Contoh string yang diterima : 10, 110, 100, 1010100
Contoh string yang ditolak : 101, 011, 0110, 100001

2. a. Ubahlah aturan produksi berikut dalam bentuk normal Chomsky (CNF)

S → aABB  aAA
A → aBB a
B → bBB A b

b. Diketahui Push Down Automata (PDA) (Q, S, , T, Z, F, ) dengan :

Q = {q , q }, S = q ,  = {0, 1}, T = {X, Z}, F = Ø dan
fungsi transisi  sebagai berikut :

1. (q0, 1, Z) = (q0, XZ)
2. (q0, 1, X) = (q0, XX)
3. (q0, 0, X) = (q1, X)
4. (q0, ε, Z) = (q0, ε)
5. (q1, 1, X) = (q1, ε)
6. (q1, 0, Z) = (q0, Z)

Periksalah apakah string 101, 101011101110, 110101, 111011, 11111011111010101110111

diterima atau ditolak.

3. Diketahui sebuah mesin Turing (TM) (Q, S, , P, Ь (blank), F, ) dengan :

Q = {q0, q1, q2, q3, q4}, S = q ,  = {0, 1}, P = {0, 1, Ь }, F = { q4 } dan
fungsi transisi  sebagai berikut :

(q0, 1) = (q0, 1, R)
(q0, 0) = (q1, 1, R)
(q1, 1) = (q1, 1, R)
(q1, Ь) = (q2, Ь, L)
(q2, 1) = (q3, 0, L)
(q3, 1) = (q3, 1, L)
(q3, Ь) = (q4, Ь, R)

Periksalah apakah string 110111, 1001, 1011 diterima atau ditolak. Kemudian jika diterima tulis keadaan pita terakhir (output).

टोरी bahasa

Ekspresi Regular
• Bahasa regular dapat dinyatakan sebagai ekspresi regular dengan menggunakan 3 operator : concate, alternate, dan closure.
• Dua buah ekspresi regular adalah ekuivalen jika keduanya menyatakan bahasa yang sama

































Ekspresi Regular
• Bahasa regular dapat dinyatakan sebagai ekspresi regular dengan menggunakan 3 operator : concate, alternate, dan closure.
• Dua buah ekspresi regular adalah ekuivalen jika keduanya menyatakan bahasa yang sama