Process Control
개요
해당 문서는 Process(프로세스)를 fork()함수를 통해 생성하고 관리하는 방법에 대해서 서술한다.
Process ID
Process ID(PID)란 각각의 프로세스가 가지는 고유한 음수가 아닌 숫자를 의미한다. PID를 얻는 방법은 다음 두가지가 있다.
- pid_t getpid(void);: 현재 실행 중인 프로세스의 PID를 반환
- pid_t getppid(void); 현재 실행 중인 프로세스를 생성한 부모 프로세스의 PID를 반환
pid_t 자료형은 정수로 저장되고 PID를 저장하는 특수한 자료형이다.
Process의 세가지 상태
프로세스를 다음 세가지 상태 중 하나로 구분할 수 있다.
- Running: CPU에 의해 실행되고 있거나 실행되기를 기다리고 있는 상태이며 결국 커널에 의해서 스케쥴링 된다.
- Stopped: 프로세스의 실행이 suspend 되었으며 추가적인 시그널을 받기 전까지 스케쥴링되지 않음
- Terminated: 프로세스가 영구적으로 정리되어 리소스의 정리가 필요함
- 다음 세가지 이유 중 하나로 종료됨
- default action이 terminate인 signal을 받았을 때
- main 루틴에서 return을 할 때 -> main에서 0을 반환하여 명시적으로 종료
- exit(): terminate 상태로 프로세스를 종료
- 정상적인 종료 상태는 0이며, 에러가 일어나면 0이 아니다.
- 다음 세가지 이유 중 하나로 종료됨
Creating Process
parent 프로세스는 fork() 함수를 호출하여 새롭게 실행하는 child 프로세스를 생성할 수 있다.[1]
- pid_t fork(void): 자식 프로세스에는 0을 반환하고, 부모 프로세스에는 child의 PID를 반환한다.
- fork() 함수는 한 번 호출되지만 각각의 프로세스에서 따로 반환하므로 두번 반환된다.
- child 프로세스는 parent 프로세스의 가상 메모리 공간의 복사본을 복사한다. 이를 통해서 부모 프로세스가 fork를 호출할 당시 열려있던 파일에 동일하게 접근 가능하다.
이때 부모 자식 프로세스의 실행은 커널에 의해 진행되므로 명령어의 실제적인 실행은 섞일 수 있다. 따라서 프로그래머들은 서로 다른 프로세스에서 명령어들이 어떤 순서로 실행될 지에 대해서 확신할 수 없다. 아래는 프로세스를 만드는 프로그램의 예시와 이를 쉘에서 실행한 결과이다.
int main() {
pid_t pid;
int x = 1;
pid = Fork();
if (pid == 0) { /* Child */
printf("child : x=%d\n", ++x);
exit(0);
}
/* Parent */
printf("parent: x=%d\n", --x);
exit(0);
}
linux> ./fork parent: x=0 child : x=2
이를 통해서 다음과 같은 사실들을 도출할 수 있다.
- Call Once, Return Twice: pid의 반환값이 부모 프로세스와 자식 프로세스가 다르므로 서로 다른 실행과정을 거친다
- Duplicate but seperate address spaces: 변수 x의 값은 처음에는 같으나 독립적으로 존재하여 최종적으로는 달라진다.
- Shared files: 두 프로세스 모두 실행 결과가 screen에 표시되며, 이는 자식 프로세스가 부모의 파일에 접근 가능하기 때문이다.(stdout이 동일함)
Process Graph
Process Graph는 concurrent한 프로그램에서의 statements의 partial ordering을 나타내는 유용한 도구이다. Process Graph의 규칙은 다음과 같다.
- 각각의 vertex는 statement의 실행을 의미함
- a -> b는 b전에 a가 발생했음을 의미함
- edge는 변수의 현재 상태를 나타낼 수 있음
- printf vertex의 경우 해당 출력값을 나타낼 수 있음
Single CPU 기준으로 해당 process graph의 모든 정점에 대한 모든 위상 정렬[2]은 프로그램 문장들의 실행 가능한 전체 순서를 의미한다.
Reaping Child Processes
프로세스가 terminate(종료)될 때 해당 프로세스는 이후에도 여전히 system resource를 소모한다. 이때 해당 프로세스가 처리되지 않으며 이를 zombie라고 한다. 이런 상태는 부모 프로세스가 이를 처리하기 전까지 유지된다. 이는 다음과 같은 과정으로 진행된다.
- 부모가 종료된 자식을 wait()이나 waitpid()함수를 이용하여 처리한다.
- 커널은 자식 프로세스의 종료 상태[3]를 부모 프로세스에게 전달한다.
- 커널은 해당 프로세스를 시스템에서 삭제해 해당 zombie는 없어진다.
혹은 자식 프로세스가 종료하기 전에 부모 프로세스가 먼저 종료될 때가 있다. 이러한 자식 프로세스를 orphaned child라고 한다. 이 경우에는 커널이 init 프로세스로 하여금 orphaned child를 처리하게 한다. init 프로세스의 PID는 1이며, 이는 init 프로세스가 모든 프로세스의 부모 프로세스임을 의미한다.
따라서 종료되지 않는 프로세스의 자식 프로세스가 좀비 상태가 된다면, 부모 프로세스는 종료되지 않으므로 해당 좀비 프로세스는 삭제되지 않는다. 따라서 쉘이나 서버와 같은 장기 실행 프로세스의 경우는 항상 자신의 좀비 프로세스를 처리해야 한다.