TCP Congestion Control

youngwiki

상위 문서: Principles of congestion control, TCP

개요

본 문서의 상위 문서인 Principles of congestion control에서는 congestion의 문제 상황이 무엇을 의미하고 어떠한 문제를 야기하는지, TCP에서는 본 문서에서 사용할 여러 개념에 대해서 다루었다. 본 문서에서는 상위 문서에서 다룬 개념을 바탕으로 TCP가 어떻게 congestion을 조절하는지에 대해 설명할 것이다.

TCP congestion의 기본 배경

Send Rate and Congestion Window

TCP이 congestion에 취하는 기본적인 접근 방식은 송신자가 감지한 네트워크 congestion의 정도에 따라 자신이 해당 연결에 대해 보내는 트래픽의 전송 속도를 조절하는 것이다. 즉, 송신자가 자신과 목적지 사이의 경로에 congestion이 거의 없다고 판단되면 send rate를 증가시키고, 반대로 congestion이 있다고 판단되면 send rate를 줄인다. 이때, TCP는 송신자의 send rate를 조절하기 위해 cwnd(congestion window)라는 추가적인 변수를 활용한다. 이때 cwnd는 TCP 송신자가 네트워크로 트래픽을 보낼 수 있는 속도를 제한하는 제약 조건을 제공한다. 이 제약 조건은 송신자의 바이트 스트림(byte stream)에서 미확인된(unackowledged) 바이트의 양은 cwnd와 rwnd(receive window) 중 작은 값보다 클 수 없다는 것이다. 즉 다음과 같은 공식을 만족한다.

LastByteSent − LastByteAcked ≤ min{cwnd, rwnd}

이때 rwnd의 값이 충분히 크다면, 송신자의 미확인 바이트의 양은 오직 cwnd에 의해서 제한되며, 이를 통해 send rate를 간접적으로 제한할 수 있다. 이를 이해 하기 위해 패킷 손실과 transmission delay가 무시할 수 있을 정도로 작다고 가정한 연결을 생각해 보자. 이 경우, 매 RTT의 시작에서 송신자는 cwnd 바이트의 데이터를 연결로 보낼 수 있고, RTT가 끝날 때쯤 송신자는 해당 데이터에 대한 확인 응답을 받는다. 따라서 send rate는 약 cwnd/RTT bytes/sec이다. 즉 송신자는 swnd 값을 조절하여 send rate를 조절할 수 있다.

How to detect Congestion

TCP 송신자가 경로 상에 congestion이 있다고 인식하는 방법은 패킷이 손실되는 상황(loss event)를 탐지하는 것이다. Congestion이 증가한 경우, 경로 상의 라우터 버퍼 중 하나가 overflow되어 datagram이 손실되며, 호스트는 이를 감지하여 경로 상에 congestion이 있다고 간주한다. 이때 호스트는 timeout이 발생하거나, 수신자로부터 3개의 중복(duplicate) ACK를 수신할 때 패킷이 손실되었다고 인식한다.

Additive Increase Multiplicative Decrease

만약 congestion이 없다면 데이터의 송수신에는 이상이 없으므로 호스트는 send rate(transmission rate)를 높이고자 할 것이다. 이를 위해서 TCP는 이전에 전송한 세그먼트에 대한 ACK를 모든 것이 잘 되고 있다는 신호로 받아들이며, cnwd(send rate)를 증가시키기 위해 사용한다. 이때 ACK가 비교적 느리게 도착한다면 swnd도 느리게 증가하며, ACK가 빠르게 도착한다면 cnwd는 더욱 빠르게 증가한다. 이처럼 TCP는 ACK를 시계(clock)처럼 사용하여 cwnd를 증가시키므로 self-clocking 방식이라고 불린다. 이때, TCP가 cwnd(send rate)를 조절하는 구체적인 메커니즘을 AIMD(Additive Increase Multiplicative Decrease)라고 부른다. 이는 다음과 같은 기본 원칙을 따른다:

  1. 손실된 세그먼트는 혼잡을 의미하므로 send rate를 줄여야 한다.
  2. 확인된 세그먼트는 네트워크가 세그먼트를 성공적으로 전달하고 있음을 의미하므로 send rate를 증가시킬 수 있다.
  3. bandwidth probing: ACK가 오면 send rate를 점점 높이고 패킷이 손실되며 send rate를 낮춘다. 이후 다시 속도를 높히며 이를 반복한다.

이를 구현하기 위해, AIMD는 slow start, congestion avoidance, fast recovery라는 세 가지 주요 state로 이루어진다.

Slow Start

Slow start는 AIMD의 시작 부분으로, 초기 cwnd가 증가하는 state에 해당한다. TCP 연결을 시작하면 cwnd = 1 MSS로 설정되어 있다. 그리고 이에 대한 ACK가 오면 cwnd를 MSS만큼 증가시키며, 결과적으로 매 RTT마다 cwnd가 2배로 증가한다. 이때 항상 지수적으로 증가하는 cwnd는 문제를 일으키기 쉽기 때문에 어떤 변수 ssthresh를 사용하여 cwnd < ssthresh가 성립할 때에만 cwnd의 크기를 지수적으로 증가시킨다. 만약 cwnd ≥ ssthresh이 참이 되면 congestion avoidance로 전환한다. 또는 그 전에(slow start 단계일 때) 패킷 손실 이벤트가 발생하면 congestion이 발생하고 있다는 뜻이므로 cwnd = 1 MSS로 줄이고, ssthresh = cwnd / 2로 설정하고, slow start를 처음부터 재개한다.

Congestion Avoidance

Congestion avoidance는 cwnd가 ssthresh 값과 같거나 더 커진 경우, cwnd를 선형적으로 증가시키는 state이다. 이를 통해 ACK를 수신할 때 마다 두배로 증가했던 slow start 단계와는 달리, congestion를 피하면서도 더욱 빠른 송신을 위해서 cwnd를 선형적으로 증가시키는 것이다. 이때, 패킷 손실 이벤트가 발생하면 congestion이 발생하고 있다는 뜻이므로 cwnd = 1 MSS로 줄이고, ssthresh = cwnd / 2로 설정하고, slow start를 처음부터 재개한다.

Fast Recovery

각주