Regular Languages: 두 판 사이의 차이

2025년 9월 16일 (화) 04:40 판

개요

해당 문서에서는 유한 오토마타(FA)를 통해 검증 가능한 언어를 의미하는 정규 언어에 대해 다룬다.

Definition of Regular Languages

어떤 언어 R이 정규 언어(regular language) 라고 불리려면, 어떤 유한 오토마타(FA) M이 R을 인식해야 한다. 이는 아래와 같다:

 $\exists M . M = F A \land M r e c o g n i z e s R$

이때 이를 증명하기 위해서는 아래와 같은 절차를 걸친다:

특정한 FA $M = (Q, Σ, δ, q_{0}, F)$ 를 정의한다.
M이 FA임을 보인다.(이는 M이 FA의 정의에 맞게 잘 구성되었는지를 확인하는 방식이다.)
M이 언어 R을 인식(recognize)하는 것을 보인다. 즉,
- a) 모든 문자열 $w \in Σ^{*}$ 에 대해, $w \in R \Rightarrow M$ 이 $w$ 를 수용(accept)
- b) 모든 문자열 $w \in Σ^{*}$ 에 대해, M이 $w$ 를 수용 $\Rightarrow w \in R$
- (a), (b)를 모두 만족해야 정확히 $L (M) = R$ ^[1]임을 보일 수 있다.

Figure 1, 2는 각각 3(a), 3(b)를 증명하는 과정이다. 먼저, figure 1은 아래와 같은 과정을 설명하는 fitch-stlye 증명이다:

목표) $\forall w \in Σ^{*} . (w \in R \Rightarrow M a c c e p t s w)$
w∈Σ*이고, w∈R이라고 가정.
- 상태열 $r_{0}, r_{1}, \dots, r_{n}$ 을 정의:
  $r_{0} = q_{0}$
  $r_{i + 1} = δ (r_{i}, w_{i + 1}), i = 0, 1, \dots, n - 1$
- 귀납법을 이용해 $r_{n} \in F$ 임을 입증
Figure 2. Proof of 3(b)
따라서 M이 $w$ 를 수용한다.

Figure 2는 아래와 같은 과정을 설명하는 fitch-stlye 증명이다:

목표) $\forall w \in Σ^{*} . (M a c c e p t s w \Rightarrow w \in R)$
w∈Σ*와, Macceptsw를 가정.
- 상태열 $r_{0}, r_{1}, \dots, r_{n}$ 을 얻는(obtain)다. 이때 상태열 $r$ 는 아래와 같다:
  $r_{0} = q_{0}$
  $r_{i + 1} = δ (r_{i}, w_{i + 1}), i = 0, 1, \dots, n - 1$
- 이로부터 $r_{n} \in F$ 임을 입증
(귀납법을 통해) $r_{n} \Rightarrow F$ 일 때, 곧 $w \in R$ 임을 보인다.

귀납법을 이용해 $r_{n} \in F$ 임을 입증

Example Problem

위에 대해 이해하기 위해, figure 3를 참고하여 아래와 같은 문제를 풀어보자:

Consider the example FA,
 $M = ({Q_{1}, Q_{2}}, {0, 1}, δ, Q_{1}, {Q_{1}}),$ 
where  $δ$  is given by the transition diagram figure 3.
Let  $L = {w \in {0, 1}^{*} . w h a s a n e v e n n u m b e r o f 0^{'} s}$ 
Show: The language recognized by  $M$  is  $L$ .

이를 해결하기 위한 핵심적인 아이디어는 모든 정수 $n \geq 0$ 에 대해 아래와 같은 명제 P(n)을 만드들고 증명하는 것이다:

P(n): For all  $w = w_{1} w_{2} \dots w_{n}$ 과  $r = r_{1} r_{2} \dots r_{n}$ 에 대해: 
*  $r_{0} = Q_{1}$ 
*  $r_{i + 1} = δ {r_{i}, w_{i + 1}}$ 
을 만족할 때,  $r_{n} \in {Q_{1}} \leftrightarrow w$ 에 포함된 0의 개수가 짝수

즉, “길이 n짜리 문자열을 처리했을 때, Q1에 도달하는 것 ↔ 0의 개수가 짝수”이라는 명제를 모든 n에 대해 성립함을 보이면 된다. 먼저, base case를 먼저 보자:

n = 0이면 입력이 빈 문자열이므로, 상태열은 $r_{0} = Q_{1}$ 이다.
이때 0의 개수는 0개이므로, 짝수개이다. 따라서 P(0)는 성립한다.

이제 귀납단계는 아래와 같다.

P(n)이 임의의 자연수 n에 대해 성립한다고 가정하자.
- 길이 n+1인 문자열 $w_{1} w_{2} \dots w_{n} w_{n + 1}$ 에 대해 P(n+1)이 성립함을 보여야 한다.
- 경우를 나누어 분석
  - $r_{n} \in Q_{1}, w_{n + 1} = 0 \to r_{n + 1} = Q_{2} .$ 따라서 0의 개수가 홀수
  - $r_{n} \in Q_{1}, w_{n + 1} = 1 \to r_{n + 1} = Q_{1} .$ 따라서 0의 개수가 짝수
  - $r_{n} \in Q_{2}, w_{n + 1} = 0 \to r_{n + 1} = Q_{1} .$ 따라서 0의 개수가 짝수
  - $r_{n} \in Q_{2}, w_{n + 1} = 1 \to r_{n + 1} = Q_{2} .$ 따라서 0의 개수가 홀수
- 따라서 모든 경우에서 $r_{n + 1} \in Q_{1}$ 이면 0의 개수가 짝수이다.

The Regular Operations

정규 연산(The Regular Operations)은 정규 언어를 다루는 기본적인 세가지 연산이다. 이는 아래와 같다:

Union: A∪B={x|x∈A∨x∈B}
- 즉, 언어 A 또는 언어 B 중 하나에 속하는 모든 문자열을 의미한다.
Concatenation: A∘B={xy|x∈∧y∈B}
- 즉, A의 원소와 B의 원소를 이어붙인 문자열만을 포함하는 집합이다.
- 더욱 엄밀히 기술하면, $A \circ B = {w | \exists x, y . w = x y \land x \in A \land y \in B}$
Kleene Star: A*={x1x2⋯xk|k≥0,xi∈A}
- 즉, A의 원소들을 0번 이상 반복해서 이어붙인 문자열들의 집합을 의미한다.
- 더욱 엄밀히 기술하면 $A * = ⋃_{i \geq 0} A^{i}$ 이며, 이는 $A^{0}, A^{1}, A^{2}, . . .$ 전부 합친 집합이다. 이때,
  $A^{0} = {ϵ}$
  $A^{i + 1} = A^{i} \circ A$ (귀납적으로 정의됨 → i번 이어붙인 것에 추가로 A를 붙인 것)
- 따라서 $A *$ 는 "A를 반복적으로(concatenation) 이어붙인 결과"라고 할 수 있다.

이 세 연산들 만으로 정규 언어 전체를 기술할 수 있다. 이때 kleene star에 대한 중요한 정리가 존재한다:

 $A * \circ A \subseteq A *$

즉, $A *$ 의 원소 하나와 A의 원소 하나를 이어붙여도 여전히 $A *$ 안에 포함된다. 또한, 정규 언어의 합집합(union)에 대한 폐쇄성(closure)에 대한 정리가 존재한다.

 $\forall A_{1}, A_{2} . (A_{1} r e g u l a r \land A_{2} r e g u l a r) \Rightarrow (A_{1} \cup A_{2} r e g u l a r)$

즉, 두 정규 언어 $A_{1} A_{2}$ 가 있으면 $A_{1} \cup A_{2}$ 도 정규 언어라는 의미이다. 이때 중요한 것은 앞에서 다룬 $A *$ 에 대한 정리는 "한 언어 안에서"의 성질이지만, 위의 정리는 “정규 언어 전체(class)”라는 집합에 대한 성질이다. 이 정리는 알파벳이 고정되어 있지 않아도 항상 성립한다. 즉, 정규 언어들은 서로 합집합을 취해도 여전히 정규 언어라는 사실을 보장한다.
이 외에도, 정규 언어의 집합은 Concatenation(연접) 연산에 대해 닫혀 있다. 이는 아래와 같이 표현된다:

 $\forall A_{1}, A_{2} . (A_{1} r e g u l a r \land A_{2} r e g u l a r) \Rightarrow (A_{1} \circ A_{2} r e g u l a r)$

이는 두 정규 언어 $A_{1}, A_{2}$ 가 있으면 $A_{1}$ 에 속하는 문자열과 $A_{2}$ 에 속하는 문자열을 붙여 만든 새로운 언어 $A_{1} \circ A_{2}$ 역시 정규 언어이다.

각주

↑ $L (M)$ 은 M이 인식하는 문자열의 집합을 의미한다.

[1] $L (M)$ 은 M이 인식하는 문자열의 집합을 의미한다.

[1]

@@ 76번째 줄: / 76번째 줄: @@
 이 외에도, 정규 언어의 집합은 Concatenation(연접) 연산에 대해 닫혀 있다. 이는 아래와 같이 표현된다:
   <math>\forall A_1, A_2.\,\, (A_1\,\, regular \land A_2\,\, regular) \Rightarrow (A_1 \circ A_2\,\, regular)</math>
-이는 두 정규 언어 <math>A_1,\,\, A_2</math>가 있으면 <math>A_1</math>에 속하는 문자열과 <math>A_2</math>에 속하는 문자열을 붙여 만든 새로운 언어 <math>A_1 \circ \A_2</math> 역시 정규 언어이다.
+이는 두 정규 언어 <math>A_1,\,\, A_2</math>가 있으면 <math>A_1</math>에 속하는 문자열과 <math>A_2</math>에 속하는 문자열을 붙여 만든 새로운 언어 <math>A_1 \circ A_2</math> 역시 정규 언어이다.
 <math></math>
 <math></math>

익명 사용자

검색

Regular Languages: 두 판 사이의 차이

이름공간

더 보기

문서 행위

2025년 9월 16일 (화) 04:40 판

목차

개요

Definition of Regular Languages

Example Problem

The Regular Operations

각주

둘러보기

둘러보기

위키 도구

위키 도구

익명 사용자

검색

Regular Languages: 두 판 사이의 차이

2025년 9월 16일 (화) 04:40 판

개요

Definition of Regular Languages

Example Problem

The Regular Operations

각주

둘러보기

위키 도구

문서 도구

분류 목록