Grammars: 두 판 사이의 차이

2025년 10월 18일 (토) 02:06 판

개요

Grammar는 DFA나 NFA처럼 문자열을 소비하며 “인식(recognize)”하는 것이 아닌, 문자열을 생성(generate) 하는 시스템이다. 즉, grammar는 어떤 언어에 속하는 모든 문자열을 만들어내는 규칙들의 모음이다.

Definition of Grammars

Grammar는 아래와 같은 4-튜플( $V, Σ, R, S$ )을 통해서 정의된다:

V: 비단말기(nonterminal symbols)의 유한 집합
- 예: ${S, A, B}$
- 실제 문자열에 직접 등장하지는 않지만, 생성 과정에서 사용된다.
Σ: 단말기(terminal symbols) 의 유한 집합
- 예: ${a, b, 0, 1}$
- 실제 언어의 문자열을 구성하는 기호들이며, $V$ 와 겹치지 않는다.
R: 규칙(rule)의 유한 집합
- 각 규칙은 $l \to r$ 형태이고, $l, r \in (V \cup Σ) *$
- $l$ 은 최소 하나의 비단말을 포함해야 하며, 규칙은 단말을 단말이나 다른 비단말로 치환하는 역할을 한다.
$S \in V$ : 시작 기호(start symbol)

이때 두 집합 $V, Σ$ 의 모든 기호를 섞어서 만들 수 있는 문자열 전체는 $(V \cup Σ) *$ 이다. 이는 sentential form이라고 불리며, 문법(Grammar)으로 문자열을 생성하는 과정에서 만들어지는 모든 문자열을 의미한다.

Derivations

문법을 사용해서 문자열을 생성하는 과정(derivation)은 아래와 같다:

u⇒v: “u가 v를 한 단계 유도한다.”
- 즉, 어떤 규칙 $l \to r$ 을 적용하여
  $u = w_{1} l w_{2}$ 인 문자열에서 $l$ 을 $r$ 로 바꾸면 $v = w_{1} r w_{2}$ 가 된다.
- 즉, $u$ 안의 한 비단말기를 규칙에 따라 다른 형태로 치환하여 $v$ 를 얻는 것이다.

또한, 주어진 규칙 내에서 여러번 규칙을 적용하여 문자열 $v$ 를 얻을 수 있는데, 이를 기호로 나타내면 $u \Rightarrow * v$ 이다. 예를 들어, $u \Rightarrow u_{1} \Rightarrow u_{2} \Rightarrow \dots \Rightarrow v$ 와 같은 방식이다. 이를 통해 문법 G가 생성하는 언어 $L (G)$ 는 아래와 같이 정의된다:

 $L (G) = {w \in Σ * | S \Rightarrow * w}$

Classes of Grammars

문법은 아래와 같이 네가지로 구분된다:

Unrestricted Grammar: 아무 제약이 없는 일반적인 형태
Context-sensitive Grammar: 각 규칙에서 |l|≤|r|이다.
- 이는 규칙을 적용하는 과정에서 문자열의 길이가 줄어들지 않음을 의미한다.
Context-free Grammar(CFG): 모든 규칙의 왼쪽이 단 하나의 비단말기라는 것을 의미한다.(l∈V)
- 문맥과 상관없이 하나의 비단말기만 보고 규칙을 적용할 수 있다.
- PDA(푸시다운 오토마톤)과 동일한 계산 능력을 가진다.
Regular Grammar: CFG보다 더욱 단순한 형태이다.
- 각 규칙은 $r = w$ 또는 $r = w B$ 꼴이며, 오른쪽 끝에 비단말기가 올 수 있다.
- 이는 이름에서 짐작할 수 있듯이 정규언어와 정확히 동일한 클래스이다.

예를 들어, 아래와 같은 CFG $G = (V, Σ, R, S)$ 가 주어졌다고 가정하자:

$V = {S}$
$V = {0, 1}$
$R = {S \to ϵ, S \to 0 S 1}$

위와 같은 grammar에서 문자열은 아래와 같이 유도된다:

 $S \Rightarrow 0 S 1 \Rightarrow 00 S 11 \Rightarrow 000 S 1111 \Rightarrow 000111$

즉, 같은 개수의 0과 1로 이루어진 문자열을 만들며, 이를 수식으로 표현하면 아래와 같다:

 $L (G) = {0^{n} 1^{n} | n \geq 0}$

각주

@@ 33번째 줄: / 33번째 줄: @@
 # Context-sensitive Grammar: 각 규칙에서 <math>|l| \le |r|</math>이다.
 #* 이는 규칙을 적용하는 과정에서 문자열의 길이가 줄어들지 않음을 의미한다.
-# Context-free Grammar: 모든 규칙의 왼쪽이 단 하나의 비단말기라는 것을 의미한다.(<math>l \in V</math>)
+# Context-free Grammar(CFG): 모든 규칙의 왼쪽이 단 하나의 비단말기라는 것을 의미한다.(<math>l \in V</math>)
 #* 문맥과 상관없이 하나의 비단말기만 보고 규칙을 적용할 수 있다.
 #* PDA(푸시다운 오토마톤)과 동일한 계산 능력을 가진다.
-# Regular Grammar: Context-free Grammar보다 더욱 단순한 형태이다.
+# Regular Grammar: CFG보다 더욱 단순한 형태이다.
 #* 각 규칙은 <math>r = w</math>또는 <math>r = wB</math>꼴이며, 오른쪽 끝에 비단말기가 올 수 있다.
 #* 이는 이름에서 짐작할 수 있듯이 정규언어와 정확히 동일한 클래스이다.
-<math></math>
+예를 들어, 아래와 같은 CFG <math>G = (V, \Sigma, R, S)</math>가 주어졌다고 가정하자:
-<math></math>
+* <math>V =\{S\}</math>
-<math></math>
+* <math>V = \{0,1\}</math>
-<math></math>
+* <math>R = \{S\rightarrow \epsilon, S \rightarrow 0S1\}</math>
-<math></math>
+위와 같은 grammar에서 문자열은 아래와 같이 유도된다:
+ <math>S \Rightarrow 0S1 \Rightarrow 00S11 \Rightarrow 000S1111 \Rightarrow 000111</math>
+즉, 같은 개수의 0과 1로 이루어진 문자열을 만들며, 이를 수식으로 표현하면 아래와 같다:
+ <math>L(G) = \{0^n1^n|n\ge 0\}</math>
 <math></math>
 <math></math>

익명 사용자

검색

Grammars: 두 판 사이의 차이

이름공간

더 보기

문서 행위

2025년 10월 18일 (토) 02:06 판

목차

개요

Definition of Grammars

Derivations

Classes of Grammars

각주

둘러보기

둘러보기

위키 도구

위키 도구

익명 사용자

검색

Grammars: 두 판 사이의 차이

2025년 10월 18일 (토) 02:06 판

개요

Definition of Grammars

Derivations

Classes of Grammars

각주

둘러보기

위키 도구

문서 도구

분류 목록