Turing Machines: 두 판 사이의 차이

youngwiki
107번째 줄: 107번째 줄:
스크래치 영역은 마치 호출 스택(call stack)과 같이 활용될 수도 있다. 현재 상태(복귀할 위치)를 스택에 저장하고, 서브루틴의 첫 상태로 점프한 후 끝나면 스택에 저장된 복귀할 위치로 돌아오는 구조를 만들면 된다.<br>
스크래치 영역은 마치 호출 스택(call stack)과 같이 활용될 수도 있다. 현재 상태(복귀할 위치)를 스택에 저장하고, 서브루틴의 첫 상태로 점프한 후 끝나면 스택에 저장된 복귀할 위치로 돌아오는 구조를 만들면 된다.<br>
또한 스크래치 영역의 일부를 레지스터 처럼 사용하여 입력의 일부 값을 복사해서 저장하거나, 연산 중간 결과를 보관할 수도 있다.
또한 스크래치 영역의 일부를 레지스터 처럼 사용하여 입력의 일부 값을 복사해서 저장하거나, 연산 중간 결과를 보관할 수도 있다.
==Turing Machine Variants==
튜링 머신은 다양한 확장 버전이 존재한다. 이는 아래와 같다:
# Multi-track tape: 표준 TM 테이프의 각 칸이 하나의 기호만 저장한다면, 멀티트랙 TM 테이프는 각 칸이 여러 기호 묶음을 저장한다.
# Two-way infinite tape: 테이프가 오른쪽뿐만 아니라 왼쪽 방향으로도 무한히 뻗어 있다.
# Multiple tapes with independent heads: 테이프 여러 개이며 각각에 대한 헤드가 따로 존재하여 움직인다.
# Nondeterminism: 여러 선택지를 동시에 탐색하는 튜링 머신이다.
이때 중요한 것은 튜링머신을 여러 방식으로 강화(멀티트랙, 양방향 테이프, 여러 테이프, 비결정성)해도 ‘어떤 언어를 인식할 수 있는가 / 결정할 수 있는가’라는 능력은 변화하지 않는다는 것이다. 단지 시간과 공간적인 측면에서의 효율성만 달라진다.
==TMs as Language Enumerators==


==각주==
==각주==

2025년 11월 20일 (목) 00:37 판

상위 문서: 계산 이론 개론

개요

튜링 머신(Turing Machine)은 계산의 본질을 단순한 모델로 표현한 이론적 컴퓨터 모델이다. 튜링 머신은 모든 계산 가능한 것을 정의하는 최초의 이론적 모델로서 현대 컴퓨터의 이론적 토대를 마련했다. 또한 , 튜링 머신을 통해 계산 가능성의 한계를 증명하고, 어떤 언어의 능력을 평가하는 '튜링 완전성' 개념의 기반이 되었다.

Basic Concepts of Turing Machines

튜링 머신의 핵심적인 구성요소는 Control unit, Tape, Read/Write Head이다:

  1. Control unit: Control unit은 유한한 상태 집합 Q 중 하나의 상태에 머물며 작동한다.
    • 현재 상태를 기억하고 다음 동작을 결정하는 역할을 한다.
  2. Tape: 무한히 긴 1차원 테이프이며, 칸에는 하나의 기호(symbol)를 쓸 수 있다.
    • 이때 사용할 수 있는 기호들의 집합을 테이프 알파벳(Γ)이라고 한다.
  3. Read/Write Head: 한 번에 한 칸씩 왼쪽(L) 또는 오른쪽(R)으로 이동하면서, 현재 칸의 기호를 읽거나 바꾼다.

튜링 머신은 위의 구성 요소를 바탕으로 유한한 개수의 명령(전이 함수, transition function)을 따라서 작동한다.

Mathematical Formalization

튜링 머신은 아래와 같은 7-튜플(Q,Σ,,Γ,δ,q0,qaccept,qreject)을 통해서 정의된다:

  1. Q: 상태들의 유한 집합(states)
  2. Σ: 입력 알파벳 (input alphabet)[1]
  3. Γ: 테이프 알파벳 (tape alphabet), ΣΓ,Γ[2]
  4. δ: 전이 함수(transition function)이며, 아래와 같은 형식이다:
    δ:Q×ΓQ×Γ×{L,R}
  5. q0: 시작 상태(start state)
  6. qaccept: 받아들이는 상태(accept state)
  7. qreject: 거부 상태(reject state)[3]

튜링 머신의 전이 함수를 풀어 설명하면, 아래와 같은 형태이다:

“만약 현재 상태가 q이고, 테이프에서 기호 a를 읽었다면,

이를 기호 b로 바꾸고, 머리를 L 또는 R로 한 칸 이동한 뒤, 상태를 r로 바꿔라.” 즉, 명령은 (q, a) → (r, b, L/R)과 같이 정의된다고 할 수 있다.

튜링 기계의 형식적 정의는 사람마다 약간씩 다를 수 있다. 예를 들어, reject 상태를 따로 두지 않고 accept 상태 만을 정의하고 나머지는 자동으로 reject로 간주하기도 한다. 또한 테이프의 왼쪽 끝 표시(left-end marker)를 따로 두어 기계가 더 이상 왼쪽으로 이동하지 않도록 제한하기도 하기도 한다. 해당 위키에서 참조하는 Michael Sipser의 『Introduction to the Theory of Computation, Third Edition』에서도 아래와 같이 추가적인 정의를 추가한다:

"어떤 구성 (u,q,v)에서 q{qaccept,qreject}일 때, 반드시 하나의 후속 구성(successor configuration)을 가진다."

이는 모호하지 않은(결정적) 동작을 보장하여 결정적 튜링 머신(Deterministic Turing Machine)을 전제로 하기 위한 것이다.

Configurations of Turing Machines

튜링 머신에서의 구성(Configuration)이란 튜링 머신의 현재 상태 전체를 나타내는 한 단위 상태이다. 이는 아래와 같이 정의된다:

(u,q,v)

이때 qQ는 현재 튜링 머신이 위치한 상태를 나타낸다. 또한 uΓ*는 헤드의 왼쪽에 있는 테이프 내용을, vΓ+는 헤드의 오른쪽에 있는 테이프 내용을 의미한다. 예를 들어 (u,q,v)=(101,q3,0)와 같이 구성이 주어지면, 현재 상태는 q3이며, 테이프 왼쪽에는 "101"이, 오른쪽에는 "0"과 공백이 있다는 것을 의미한다. 이때 공백은 테이프 위에서 아무것도 적혀 있지 않은 칸을 의미하며, 입력 이외의 칸을 나타내기 위해 사용하는 심볼이다. 이때 중요한 것은 오른쪽 끝의 공백은 몇 개가 있든 동일한 구성으로 간주한다. 이는 아래와 같이 나타낼 수 있다:

(u,q,vn)=(u,q,vm)forn,m0

이는 튜링 기계가 “무한히 많은 빈 칸”을 상정하므로, 불필요한 공백 개수는 의미가 없기 때문이다.

아래 표는 튜링 머신이 계산을 시작하거나 끝내는 특수 상태들을 열거한 것이다:

구성 유형 형태
시작 구성 (Start configuration) q0w
Accept 구성 (Accepting) uqacceptv
Reject 구성 (Rejecting) uqrejectv

이때 어떤 튜링 머신 M이 w를 accept한다고 하는 것은 아래 조건들을 만족하는 구성열(sequence)이 존재할 때이다:

  1. C1=q0w
  2. 중간의 Ci들은 accept/reject가 아닌 일반 상태
  3. CiCi+1을 yield함
  4. 마지막 Ck는 accepting configuration

즉, C1C2Ck이고, Ck가 accept 상태에 도달하면 문자열 w는 accept된다.

The Yields Relation

튜링 머신이 한 단계에서 다음 단계로 이동하는 규칙은 δ와, 해당 튜링머신의 구성을 통해 정의된다. 예를 들어,

Configuration C1 yields C2

는 주어진 튜링 머신의 상태가 단 한번의 동작으로 C1에서 C2로 바뀐다는 것을 의미한다. 이때, 이 yield 관계(relation)는 전이함수 δ에 의해서 결정된다. 이때 yield 관계는 아래와 같이 구분된다:

  1. 왼쪽으로 이동 (Move Left)
    • qibv yields qjcv,ifδ(qi,b)=(qj,c,L)[4]: 단순히 머리 위치를 그대로 두고, 공백을 유지한다.
    • uaqibv yields uqjacv,ifδ(qi,b)=(qj,c,L): bc로 바꾸고 왼쪽으로 이동하여 왼쪽 기호 a 위로 헤드를 옮긴다.
  2. 오른쪽으로 이동 (Move Right)
    • uaqib yields uacqj,ifδ(qi,b)=(qj,c,R)[5]: 공백(blank)을 새로 하나 추가해야 한다.
    • uaqibv yields uacqjv,ifδ(qi,b)=(qj,c,R): bc로 바꾸고, 한 칸 오른쪽으로 이동한다.

Deciders and Languages

어떤 튜링 머신 M이 decider라고 불리기 위해서는 입력 문자열에서 출발했을 때, 영원히 멈추지 않고 돌기만 하는 경우가 없어야 한다. 즉, 어떤 입력 w에 대해서도 반드시 Accepting 혹은 Rejecting 구성에 도달해야 한다. 이때 모든 튜링 기계가 Decider인 것은 아니며, 어떤 기계는 특정 입력에서 무한 루프에 빠질 수도 있다. 이러한 경우를 recognizer라고 부른다. 이에 따라 튜링 기계가 인식(recognize)하거나 결정(decide)할 수 있는지 여부에 따라 언어(Language)의 종류를 구분할 수 있다. 아래는 이를 정리한 표이다:

구분 정의 특징
Turing-recognizable 어떤 튜링 기계 M이 있어서,

L=L(M) 일 때

입력이 언어에 속하면 Accept,

속하지 않으면 멈추지 않고 무한 루프 가능

Turing-decidable 어떤 Decider M이 있어서,

L=L(M) 일 때

모든 입력에 대해 반드시 멈추며,

Accept 또는 Reject 중 하나 출력

이때 모든 Decidable 언어는 Recognizable 언어이지만, 그 반대(Recognizable → Decidable)는 성립하지 않는다. 이때 중요한 것은, "모든 정규 언어가 튜링 기계로 결정 가능하다(decidable)"하다는 것이다. 언어를 입력받을 때, 해당 입력이 끝나는 것은 공백(blank symbol)을 통해 판단한다. 즉, 입력을 다 읽고 처음 만나는 blank가 입력의 끝이다.

Turing Machine Hacking

튜링 머신은 프로그래밍 언어처럼 다룰 수 있으며, 해당 문단에서는 튜링 머신을 활용한 여러 테크닉에 대해 설명한다. 튜링 머신도 프로그래밍 언어처럼 패턴과 관용구(idiom)가 존재하며, 입력의 끝을 찾거나, 테이프의 처음으로 돌아가거나, 특정 영역을 표시하는 등의 “기본 동작”들을 잘 다루면 복잡한 계산을 구현할 수 있다.

먼저, 입력의 오른쪽 끝을 찾기 위해서는 처음으로 등장하는 를 찾으면 된다. 그 이유는 이 입력 알파벳에는 포함되지 않지만, 튜링 머신의 테이프 알파벳에는 포함되기 때문이다. 이로 인해 튜링 머신의 테이프에는 입력 문자열이 적혀 있고, 테이프의 끝은 으로 채워져 있다.
반대로 테이프의 맨 왼쪽으로 돌아가기 위해서는 첫 단계에서 현재 보고 있는 기호를 기억(finite control)하고, 그 자리를 특별한 마커(symbol)로 바꾼다. 이후 왼쪽으로 계속 이동하다가 그 마커를 만나면 “출발점”을 찾을 수 있다.

테이프의 칸을 “표시(mark)”하는 방법을 확장하면, 테이프 알파벳의 각 기호마다 표시(mark) 여부에 따라 어떤 셀을 “방문했음” 혹은 “처리했음”으로 표시할 때 활용할 수 있다.

이 외에도 표시(mark)를 활용하는 방법으로는 스크래치 영역(scratch) 영역을 임의로 만드는 것이 있다. 예를 들어 프로그래밍에서의 “임시 변수 메모리 영역”을 튜링 머신에서도 활용하기 위해서는 입력의 오른쪽 끝을 찾은 뒤, 그 옆에 특별한 마커를 써서 임시 작업 공간을 확보할 수 있다. 이러한 임시 작업 공간은 필요시 가장 오른쪽으로 가서 해당 마커를 찾아 사용될 수 있다.
스크래치 영역은 마치 호출 스택(call stack)과 같이 활용될 수도 있다. 현재 상태(복귀할 위치)를 스택에 저장하고, 서브루틴의 첫 상태로 점프한 후 끝나면 스택에 저장된 복귀할 위치로 돌아오는 구조를 만들면 된다.
또한 스크래치 영역의 일부를 레지스터 처럼 사용하여 입력의 일부 값을 복사해서 저장하거나, 연산 중간 결과를 보관할 수도 있다.

Turing Machine Variants

튜링 머신은 다양한 확장 버전이 존재한다. 이는 아래와 같다:

  1. Multi-track tape: 표준 TM 테이프의 각 칸이 하나의 기호만 저장한다면, 멀티트랙 TM 테이프는 각 칸이 여러 기호 묶음을 저장한다.
  2. Two-way infinite tape: 테이프가 오른쪽뿐만 아니라 왼쪽 방향으로도 무한히 뻗어 있다.
  3. Multiple tapes with independent heads: 테이프 여러 개이며 각각에 대한 헤드가 따로 존재하여 움직인다.
  4. Nondeterminism: 여러 선택지를 동시에 탐색하는 튜링 머신이다.

이때 중요한 것은 튜링머신을 여러 방식으로 강화(멀티트랙, 양방향 테이프, 여러 테이프, 비결정성)해도 ‘어떤 언어를 인식할 수 있는가 / 결정할 수 있는가’라는 능력은 변화하지 않는다는 것이다. 단지 시간과 공간적인 측면에서의 효율성만 달라진다.

TMs as Language Enumerators

각주

  1. 이때 공백 문자는 포함하지 않는나.
  2. 는 공백 문자를 의미한다.
  3. 단, qacceptqreject를 만족한다.
  4. 테이프의 맨 왼쪽에서 왼쪽으로 가려는 경우(즉, 왼쪽이 없음)를 의미한다.
  5. 오른쪽으로 이동했는데, 오른쪽에 아무것도 없는 경우(끝까지 간 경우)를 의미한다.