Computer Network CH3 Transport Layer

Transport Layer: Overview

Goal

understanding principle of transport layer servics
- multiplexing, demultiplexing
- reliable data transfer
- flow control
- congestion control
learn about internet transport layer protocols
- UDP
- TCP
- TCP congestion control

Transport-Layer services

Transport services and protocols

provide logical communication between application processes running on different hosts
transport protocols actions in end systems:
- sender: application messages into segments, passes to network layer
- receiver: reassembles segments into messages, passes to application layer

Transport vs. network layer services and protocols

transport layer:

communication between processes
- relies on, enhances, network layer services
process與process之間的溝通

network layer:

communication between hosts
host與host之間的溝通

alt text

Actions

Sender
alt text
Receiver

Two principal Internet transport protocols

TCP: Transmission Control Protocol

reliable, in-order delivery
congestion control
flow control
connection setup

UDP: User Datagram Protocol

unreliable, unordered delivery
no-frills extension of “best-effort” IP

services not available:

delay guarantees
bandwidth guarantees

Multiplexing and demultiplexing

sender

reciver

How demultiplexing works

host receives IP datagrams

each datagram has source IP address, destination IP address
each datagram carries one transport-layer segment

each segment has source, destination port number

host uses IP addresses & port numbers to direct segment to appropriate socket

host uses IP addresses & port numbers to direct segment to appropriate socket

使用IP address和port numbers

Connectionless demultiplexing

Recall:

when creating socket, must specify host-local port #:

DatagramSocket mySocket1 = new DatagramSocket(12534);

when creating datagram to send into UDP socket, must specify

destination IP address
destination port #

when receiving host receives UDP segment:

checks destination port # in segment
directs UDP segment to socket with that port #

只要目標port numbers一樣，不同來源的datagrams也會被送到同樣的socket

Connection-oriented demultiplexing

TCP socket identified by 4-tuple:

source IP address
source port number
dest IP address
dest port number

demux: receiver uses all four values (4-tuple) to direct segment to appropriate socket

server may support many simultaneous TCP sockets:

each socket identified by its own 4-tuple
each socket associated with a different connecting client
不只是看des port, 考慮整個4-tuple的內容

Summary

Multiplexing, demultiplexing: based on segment, datagram header field values
UDP: demultiplexing using destination port number (only)
TCP: demultiplexing using 4-tuple
- source and destination IP addresses
- … port numbers
Multiplexing/demultiplexing happen at all layers

Connectionless transport: UDP

UDP

“no frills,” “bare bones” Internet transport protocol
“best effort” service, UDP segments may be:
- lost
- delivered out-of-order to app
connectionless:
- no handshaking between UDP sender, receiver
- each UDP segment handled independently of others

UDP use:

streaming multimedia apps (loss tolerant, rate sensitive)
DNS
SNMP
HTTP/3

RFC 768

if reliable transfer needed over UDP (e.g., HTTP/3):

add needed reliability at application layer
add congestion control at application layer

Actions

Sender

receiver

UDP segment header

alt text

Checksum

alt text

Internet checksum

sender:

treat contents of UDP segment (including UDP header fields and IP addresses) as sequence of 16-bit integers
checksum: addition (one’s complement sum) of segment content
checksum value put into UDP checksum field

receiver:

compute checksum of received segment
check if computed checksum equals checksum field value:
- not equal - error detected
- equal - no error detected.
  - But maybe errors nonetheless? More later ….

Ex.

檢查的例子

仍有可能發生錯誤

Summary

“no frills” protocol:

segments may be lost, delivered out of order
best effort service: “send and hope for the best”

UDP has its plusses:

no setup/handshaking needed (no RTT incurred)
can function when network service is compromised
helps with reliability (checksum)

build additional functionality on top of UDP in application layer (e.g., HTTP/3)

Principles of reliable data transfer(RDT)

Principles of reliable data transfer

網路通道不能確定是否信賴

使用可信賴的protocal

複雜度取決於使用的unreliable channel

傳送端與接收端不知道彼此的狀態

除非接收端回覆

protocol interface

sender:

application layer呼叫rdt_send
transport layer呼叫udt_send
- 將packet經過unreliable的通道給receiver

receiver:

封包進來呼叫rdt_rcv
rdt_rcv呼叫deliver_data

雙向頻道

Reliable data transfer: getting started

了解版本差異
為什麼要發展下一個版本

using FSM(finite state machine)

上面是event
下面是action

rdt1.0: reliable transfer over a reliable channel(不考)

進行在underlying channel(正在進行的)

underlying channel perfectly reliable

no bit errors
no loss of packet

receiver wait for call from below(等待封包傳送到)

rdt2.0: channel with bit errors

存在bit error

using checksum to detect bit error

如何recover error?

receiver 回覆
- acknowledgements (ACKs) 接收端回覆是否收到封包
- NAKs 接收端回覆收到了，但訊息怪怪的
  - receiver explicitly tells sender that pkt had errors
如果傳送端接收到NAKs -> 重送
- 不管是什麼問題
- 第二次以上傳送封包
上述過程稱之為stop and wait

FSM

2.0的特色要加入checksum
sender 多一個狀態 wait for ACK or NAK

因為需要通過ACK, NAK來了解接收端的狀態

故需要protocol

has a fatal error

如果ACK, NAK也是corrupt?
不能就一直重傳
- 可能造成duplicate

handling duplicate

sender add sequence number to each pkt
收到重複就拋棄
即rdt2.1

rdt2.1: sender, handling garbled ACK/NAKs

sender多傳送一個sequence number

讓receiver知道這是pkt 0

sender

如果corrupt or NAK不斷重傳
直到not corrupt and ACK

receiver

sndpkt包含ACK和checksum(2.0也有)
ACK中會有sequence number
- 回傳給sender

discussion

sender
- seq # added to pkt
- 0, 1 is enough, if stop and wait
  - pipeline 就不行
- 必須記錄0, 1
receiver
- check if duplicate
- can not known its last ACK/NAK received OK at sender
- thus 2.2 created

rdt2.2: a NAK-free protocol

using ACK only

must explictly include seq # of pkt being ACKed

duplicate ACK at sender = NAKs

retransmit

receiver

sequence # 放進ACK
回傳ACK, checksum

As we will see, TCP uses this approach to be NAK-free

alt text

rdt3.0: channels with errors and loss

new channel assumption

lose packet(data, ACKs)
- previous skill, but not enough
loss就什麼都收不到了

Approach

add timer
- sender waits “reasonable” amount of time for ACK
- retransmit if no ACK
if pkt just delay?(just on the way)
- duplicate is solved by seq #

多了一個計時器

如果ACK的seq # 不對，就不做事直到timeout

In action

no loss
packet loss
ACK loss
- after sender resent, receiver detect duplicate
premature timeout/delayed ACK(太早)
- receive ACK the same -> ignore

performance

alt text

operation

blue part is

using many time to sent little bit data, caused big RTT

is too small

using pipeline!

sender allows multiple, “in-flight”, yet-to-be-acknowledge pkt

range of seq # must be increased
buffering at sender and/or receiver

increased utilization(看過就好)

Go-Back-N: sender

Sender

sender window of up to N, consecuive transmitted but unACKed pkts
- k-bit seq # in pkt header
- sender base
cumulative ACK:一次回應多個ACK
timer從最早的pkt開始算
如果沒收到，回到最前面的重傳

Reciver

回傳ACK根據最高的seq # in order
- only remember rcv_base
- may duplicate ACKs
out-of-order pkt
- can discard or buffer
- re-ACK pkt with highest in-order seq #

in action

太蠢了，因為一個loss重傳一大堆

Selective repeat

維持timer for specific pkt

重傳time out的那個

sender

reciver

多了一個expected, not yet recived

p3.77看過就好

in action

不連續的pkt會被buffer，等到補齊後一次deliver上去

dilemma!

if seq # is too close to window size

Connection-oriented transport: TCP

overview

point-to-point:

one sender, one receiver

reliable, in-order byte steam:

no “message boundaries”

full duplex data:

bi-directional data flow in same connection
MSS: maximum segment size

cumulative ACKs

pipelining:

TCP congestion and flow control set window size

connection-oriented:

handshaking (exchange of control messages) initializes sender, receiver state before data exchange

flow controlled:

sender will not overwhelm receiver

TCP segment structure

alt text

sequence numbers, ACKs

alt text

Ex.
alt text

Round trip time, timeout

estimate RTT

下面那個SampleRTT應該是estimateRTT

EWMA

過去的RTT影響會指數遞減

Real timeout interval

會用estimateRTT + safety margin

TCP Sender

event: data received from application

create segment with seq #
seq # is byte-stream number of first data byte in segment
start timer if not already running
- think of timer as for oldest unACKed segment
- expiration interval: TimeOutInterval

event: timeout