網路編程之TCP/IP各層詳解

2019 年 10 月 3 日
筆記

網路編程之TCP/IP各層詳解

我們將應用層，表示層，會話層並作應用層，從TCP/IP五層協議的角度來闡述每層的由來與功能，搞清楚了每層的主要協議，就理解了整個物聯網通訊的原理。

首先，用戶感知到的只是最上面一層——應用層，自上而下每層都依賴於下一層，所以我們從最下層開始切入，比較好理解。

每層都運行特定的協議，越往上越靠近用戶，越往下越靠近硬體。

一、物理層

由來：孤立的電腦之間要一起「玩耍」，就必須接入Internet，即電腦之間必須完成組網。

物理層功能：主要是基於電器特性發送高低電壓（電訊號），高電壓對應數字1，低電壓對應數字0。

二、數據鏈路層

由來：單純的電訊號0和1沒有任何意義，必須規定電訊號多少位一組，每組什麼意思。

數據鏈路層功能：定義了電訊號的分組方式。

乙太網協議：

早期的時候各個公司都有自己的分組方式，後來形成了統一的標準，即乙太網協議Ethernet。

Ethernet規定：

一組電訊號構成一個數據包，叫做「幀」
每一數據幀分成：報頭head和數據data兩部分。

head包含：（固定18個位元組）

發送者/源地址，6個位元組
接收者/目標地址，6個位元組
數據類型，6個位元組

data包含：（最短46位元組，最長1500位元組）

數據包的具體內容

head長度+data長度 = 最短64位元組或樁長1518位元組，超過最大限制就分片發送。

MAC地址：

head中包含的源和目標地址由來：ethernet規定接入internet的設備都必須具備網卡，發送端和接收端的地址便是指網卡的地址，即mac地址。

mac地址：每塊網卡出廠時都被燒制上一個世界唯一的mac地址，長度為48位2進位，通常由12位16進位數表示（前六位是廠商編號，後六位是流水線號）。

廣播：

有了mac地址，同一網路內的兩台主機就可以通訊了（一台主機通過arp協議獲取另外一台主機的mac地址）。

ethernet採用最原始的方式，廣播的方式進行通訊，即電腦通訊基本靠吼。

三、網路層

網路層由來：有了ethernet、mac地址、廣播的發送方式，世界上的電腦就可以彼此通訊了，問題是世界範圍的互聯網是由一個個彼此隔離的小的區域網組成的，那麼如果所有的通訊都採用乙太網的廣播方式，那麼一台機器發送的包全世界都會收到，這就不僅僅是效率低的問題了，這會是一種災難。

上圖結論：必須找出一種方法來區分哪些電腦屬於同一廣播域，哪些不是，如果是就採用廣播的方式發送，如果不是，就採用路由的方式（向不同廣播域／子網分發數據包），mac地址是無法區分的，它只跟廠商有關。

網路層功能：引入一套新的地址用來區分不同的廣播域／子網，這套地址即網路地址。

1、IP協議：

規定網路地址的協議叫ip協議，它定義的地址稱之為ip地址，廣泛採用的v4版本即ipv4，它規定網路地址由32位2進位表示。
範圍0.0.0.0-255.255.255.255
一個ip地址通常寫成四段十進位數，例：172.16.10.1

2、子網掩碼：

所謂」子網掩碼」，就是表示子網路特徵的一個參數。它在形式上等同於IP地址，也是一個32位二進位數字，它的網路部分全部為1，主機部分全部為0。比如，IP地址172.16.10.1，如果已知網路部分是前24位，主機部分是後8位，那麼子網路掩碼就是11111111.11111111.11111111.00000000，寫成十進位就是255.255.255.0。

子網掩碼是用來標識一個IP地址的哪些位是代表網路位，以及哪些位是代表主機位。子網掩碼不能單獨存在，它必須結合IP地址一起使用。子網掩碼只有一個作用，就是將某個IP地址劃分成網路地址和主機地址兩部分。

為什麼要區分網路位和主機位？

這就像寄信，你給你的南方姑娘寄信，她肉身在廈門，詳細地址是廈門鼓浪嶼三街27號，那網路位就相當於城市，詳細地址就是主機位，網路位幫你定位到城市，主機位幫你找到你的南方姑娘。路由器通過子網掩碼來確定哪些是網路位，哪些是主機位。

區分網路位和主機位是為了劃分子網，就是把一個大網路分成多個小網路，為什麼要分子網呢?

廣播風暴：6萬台主機在一個網段里，通訊基本靠吼，任何一個人要吼一嗓子，6萬多個人必須被動聽著，一會你的網路就癱瘓啦。
地址浪費：運營商在公網上有很多級聯的路由器，有時候2個路由器之間只會用掉幾個IP,如果不進行子網劃分，那同網段的其它主機也就都不能用了。舉例兩個級聯路由器的介面ip分別為222.34.24.12/24,222.34.24.13/24, 此可承載255個主機的網段只用了2個IP,那其它的就全浪費了，因為不能再分配給別人。

劃分子網本質上就是借主機位到給網路位，每借一位主機位，這個網段的可分配主機就會越少，比如192.168.1.0/24可用主機255個，借一位變成192.168.1.0/25，那可用主機就從255-128=127個了（從最大的值開始借），再借一位192.168.1.0/26,那可用主機數就變成了255-(128+64)=63個啦。

3、IP地址分類：

IP地址根據網路ID的不同分為5種類型，A類地址、B類地址、C類地址、D類地址和E類地址。

1、A類IP地址：一個A類IP地址由1位元組的網路地址和3位元組主機地址組成，網路地址的最高位必須是「0」，地址範圍從1.0.0.0 到126.0.0.0。可用的A類網路有126個，每個網路能容納1億多個主機。

2、B類IP地址：一個B類IP地址由2個位元組的網路地址和2個位元組的主機地址組成，網路地址的最高位必須是「10」，地址範圍從128.0.0.0到191.255.255.255。可用的B類網路有16382個，每個網路能容納6萬多個主機。

3、C類IP地址：一個C類IP地址由3位元組的網路地址和1位元組的主機地址組成，網路地址的最高位必須是「110」。範圍從192.0.0.0到223.255.255.255。C類網路可達209萬餘個，每個網路能容納254個主機。

4、D類地址用於多點廣播（Multicast）： D類IP地址第一個位元組以「lll0」開始，它是一個專門保留的地址。它並不指向特定的網路，目前這一類地址被用在多點廣播（Multicast）中。多點廣播地址用來一次定址一組電腦，它標識共享同一協議的一組電腦。

5、E類IP地址以「llll0」開始，為將來使用保留。

全零（「0．0．0．0」）地址對應於當前主機。全「1」的IP地址（「255．255．255．255」）是當前子網的廣播地址。

迴環地址(127.0.0.1) 又稱為本機地址，那它跟0.0.0.0是什麼區別呢？那得先了解迴環介面

環回介面（loopback）。平時我們用127.0.0.1來嘗試自己的機器伺服器好使不好使。走的就是這個loopback介面。對於環回介面，有如下三點值得注意:

傳給環回地址（一般是127.0.0.1）的任何數據均作為IP輸入。
傳給廣播地址或多播地址的數據報複製一份傳給環回介面，然後送到乙太網上。這是因為廣播傳送和多播傳送的定義包含主機本身。
任何傳給該主機IP地址的數據均送到環回介面。

4、IP報文：

IP協議是TCP/IP協議的核心，所有的TCP，UDP，IMCP，IGCP的數據都以IP數據格式傳輸，要注意的是，IP不是可靠的協議，這是說，IP協議沒有提供一種數據未傳達以後的處理機制－－這被認為是上層協議－－TCP或UDP要做的事情。所以這也就出現了TCP是一個可靠的協議，而UDP就沒有那麼可靠的區別。這是後話，暫且不提。

IP協議頭

挨個解釋它是教科書的活，我們感興趣的只是那八位的TTL欄位，還記得這個欄位是做什麼的么？這個欄位規定該數據包在穿過多少個路由之後才會被拋棄(這裡就體現出來IP協議包的不可靠性，它不保證數據被送達)，某個ip數據包每穿過一個路由器，該數據包的TTL數值就會減少1，當該數據包的TTL成為零，它就會被自動拋棄。這個欄位的最大值也就是255，也就是說一個協議包也就在路由器裡面穿行255次就會被拋棄了，根據系統的不同，這個數字也不一樣，一般是32或者是64。

5、ARP協議

ARP協議由來：電腦通訊基本靠吼，即廣播的方式，所有上層的包到最後都要封裝上乙太網頭，然後通過乙太網協議發送，在談及乙太網協議時候，我門了解到通訊是基於mac的廣播方式實現，電腦在發包時，獲取自身的mac是容易的，如何獲取目標主機的mac，就需要通過arp協議。

ARP協議功能：播的方式發送數據包，獲取目標主機的mac地址。

協議工作方式：每台主機ip都是已知的。

例如：主機172.16.10.10/24訪問172.16.10.11/24。

1、首先，通過ip地址和子網掩碼區分出自己所處的子網。

場景	數據包地址
同一子網	目標主機mac，目標主機ip
不同子網	網關mac，目標主機ip

2、分析172.16.10.10/24與172.16.10.11/24處於同一網路(如果不是同一網路，那麼下表中目標ip為172.16.10.1,通過arp獲取的是網關的mac)。

	源mac	目標mac	源ip	目標ip	數據部分
發送端主機	發送端mac	FF:FF:FF:FF:FF:FF	172.16.10.10/24	172.16.10.11/24	數據

3、這個包會以廣播的方式在發送端所處的子網內傳輸，所有主機接收後拆開包，發現目標ip為自己的，就響應，返回自己的mac。

查看本機arp表的命令（在終端窗口中輸入）：arp -a

6、ICMP協議

前面講到了，IP協議並不是一個可靠的協議，它不保證數據被送達，那麼，自然的，保證數據送達的工作應該由其他的模組來完成。其中一個重要的模組就是ICMP(網路控制報文)協議。

當傳送IP數據包發生錯誤－－比如主機不可達，路由不可達等等，ICMP協議將會把錯誤資訊封包，然後傳送回給主機。給主機一個處理錯誤的機會。

我們一般主要用ICMP協議檢測網路是否通暢，基於ICMP協議的工具主要有ping 和traceroute。

ping

ping這個單詞源自聲納定位，而這個程式的作用也確實如此，它利用ICMP協議包來偵測另一個主機是否可達。原理是用類型碼為0的ICMP發請求，受到請求的主機則用類型碼為8的ICMP回應。ping程式來計算間隔時間，並計算有多少個包被送達。用戶就可以判斷網路大致的情況。我們可以看到， ping給出來了傳送的時間和TTL的數據。

traceroute（Linux後者mac os）或者 tracert（windows系統）

用來查看從當前主機到某地址一共經過多少條路由。

四、傳輸層

傳輸層的由來：網路層的ip幫我們區分子網，乙太網層的mac幫我們找到主機，然後大家使用的都是應用程式，你的電腦上可能同時開啟qq，暴風影音，迅雷等多個應用程式，那麼我們通過ip和mac找到了一台特定的主機，如何標識這台主機上的應用程式呢？答案就是埠，埠即應用程式與網卡關聯的編號。

傳輸層功能：建立埠到埠的通訊。

補充：埠範圍0-65535，0-1023為系統佔用埠。

傳輸層有兩種協議，TCP和UDP，見下圖。

1、TCP協議

可靠傳輸，TCP數據包沒有長度限制，理論上可以無限長，但是為了保證網路的效率，通常TCP數據包的長度不會超過IP數據包的長度，以確保單個TCP數據包不必再分割。

為什麼tcp是可靠的數據傳輸？

最可靠的方式就是只要不得到確認，就重新發送數據報，直到得到對方的確認為止。

TCP報文

TCP的3次握手和4次揮手：

2、UDP協議

不可靠傳輸，」報頭」部分一共只有8個位元組，總長度不超過65,535位元組，正好放進一個IP數據包。

3、總結

TCP協議雖然安全性很高，但是網路開銷大，而UDP協議雖然沒有提供安全機制，但是網路開銷小，在現在這個網路安全已經相對較高的情況下，為了保證傳輸的速率，我們一般還是會優先考慮UDP協議！

五、應用層

1、應用層簡介

應用層直接和應用程式介面並提供常見的網路應用服務。它是開放系統的最高層，是直接位應用程式提供服務的。其作用是在實現多個系統應用進程相互通訊的同時，完成一系列業務處理所需的服務。其服務元素分為兩類：公共應用服務元素CASE和特定應用服務元素SASE。

位於電腦網路體系結構的最上層，前面四層做的所有事情就是為了他服務，他也是設計和建立電腦網路的最終目的，通俗的講，就是我們開發的應用軟體，就處於這一層，比如，QQ，瀏覽器訪問網頁，等等你看得到的應用軟體都是在這一層，但是這些軟體在運行的過程中，也需要依靠一些特定的協議才能完成相應的功能，比如瀏覽器通過網址訪問網頁，其中是如何做到的，這就是我們所要學習的東西。

2、應用層中的兩種應用軟體：客戶/伺服器和P2P體系結構

（1）客戶/伺服器

這種類型，就是我們很熟悉的客戶端，伺服器模型，客戶端請求伺服器，伺服器響應客戶端這樣的一種方式進行「交流」。

（2）P2P

也稱為對等體系結構。P2P相當於每個人的電腦度可以當伺服器，也可以當客戶端，不單單限制於只能客戶端訪問伺服器，你自己的電腦可以去訪問別人的電腦上的內容，別的同樣可以訪問你電腦上的內容，這樣達到一種共享的狀態。

3、DNS協議

（1）DNS概述

Domain Name System 域名系統。也可以叫做域名解析協議。在我們在瀏覽器訪問網頁的時候，通常度是用我們所熟悉的一連串有意義的英文字元標識，比如www.baidu.com、www.sohu.com等。

但是我們學了前面的知識，電腦並不是通過這些字元串去找到對應的電腦，而是通過32位的二進位，也就是我們的IP地址來找。所以就有了DNS協議。他的作用就是將域名解析成對應的IP地址。

因為讓我們人去記那些IP地址，很難記得住，所以就想辦法讓IP地址轉變為了現在的域名，在進行訪問的時候，只需要將域名解析為對應的IP地址就行了，這個域名也很有講究，其中分為好多層域名，是獨一無二的。這裡不細講這個，只要我們知道，域名通過DNS能找到對應的IP地址就行了。

（2）DNS協議工作過程

1）通過域名訪問網頁

2）電腦會先將域名發送到一個解析域名的伺服器上

2.1）在其伺服器上有很多伺服器，能解析各種各樣的域名，比如有專門解析.org的，解析.com的，解析.net的。等等，最主要的有一個根域名伺服器

2.2）域名解析(在伺服器上查找IP地址)的過程有兩種演算法，迭代查詢，遞歸查詢。一般是兩種查詢的結合

2.3）本機電腦找到其中一台解析域名的伺服器(可能是.com)，如果沒有找到對應的IP地址，那麼就會去找根域名伺服器，根域名伺服器知道所有的子伺服器，所以他肯定知道該域名所對應的IP地址在那個子伺服器中，所以告訴第一次查詢的伺服器要他去另一台伺服器上找，找到了，就將其返回給電腦，以後在有另一台電腦也通過這個域名訪問，那麼第一台伺服器會有原來的域名IP地址的快取，就不用去找根伺服器了。

3）找到了，就能找到我們要訪問的伺服器了。

4、HTTP協議

（1）HTTP簡介

1）超文本傳輸協議（HTTP，HyperText Transfer Protocol)是互聯網上應用最為廣泛的一種網路協議。所有的WWW文件都必須遵守這個標準。

2）HTTP是一個客戶端和伺服器端請求和應答的標準（TCP）。客戶端是終端用戶，伺服器端是網站。通過使用Web瀏覽器、網路爬蟲或者其它的工具，客戶端發起一個到伺服器上指定埠（默認埠為80）的HTTP請求。（我們稱這個客戶端）叫用戶代理（user agent）。應答的伺服器上存儲著（一些）資源，比如HTML文件和影像。（我們稱）這個應答伺服器為源伺服器（origin server）。在用戶代理和源伺服器中間可能存在多個中間層，比如代理，網關，或者隧道（tunnels）。儘管TCP/IP協議是互聯網上最流行的應用，HTTP協議並沒有規定必須使用它和（基於）它支援的層。事實上，HTTP可以在任何其他互聯網協議上，或者在其他網路上實現。

3）通常，由HTTP客戶端發起一個請求，建立一個到伺服器指定埠（默認是80埠）的TCP連接。HTTP伺服器則在那個埠監聽客戶端發送過來的請求。一旦收到請求，伺服器（向客戶端）發回一個狀態行，比如"HTTP/1.1 200 OK"，和（響應的）消息，消息的消息體可能是請求的文件、錯誤消息、或者其它一些資訊。HTTP使用TCP而不是UDP的原因在於（打開）一個網頁必須傳送很多數據，而TCP協議提供傳輸控制，按順序組織數據，和錯誤糾正。

4）通過HTTP或者HTTPS協議請求的資源由統一資源標示符（Uniform Resource Identifiers）（或者，更準確一些，URLs）來標識。

（2）統一資源定位符URL

URL:統一資源定位符，通過下面格式，可以看出，就是用來定位我們所需要資源在伺服器上的位置。

格式：<協議>://<主機>:<埠>/<路徑>

協議：http

主機：域名/IP地址，原理度一樣，到頭來還是會轉換為IP地址，通過這個才能找到目標伺服器

埠: 在傳輸層需要使用的，訪問目的主機的哪個埠號。　

路徑：精準的定位我們所需要的資源位置、　　　　

平常會省略協議和埠號，因為這些都是默認的，在訪問主頁時，路徑也會省略。比如www.baidu.com這個默認進入百度的主頁完整寫法 http://www.baidu.com:80/index.html 。

（3）超文本傳輸協議

作用：怎樣向伺服器請求文檔、伺服器怎麼把文檔傳送給瀏覽器，通俗點講，就是我們想伺服器訪問網頁資源時，伺服器如何把網頁上的東西傳給我們。

客戶端向伺服器：請求報文　　　　伺服器向客戶端：響應報文

其實就是：在通過URL訪問你伺服器時，就會發送一個請求報文，告訴伺服器需要哪些東西，伺服器知道後，返回一個響應報文給客戶端，其中就會帶有一些網頁資訊。就是通過這個來達到傳送網頁資源的目的，現在來具體看看，請求報文和響應報文的格式。

（4）請求和響應報文的格式

可參見我的另一篇博文https://www.cnblogs.com/Kwan-C/p/11459247.html

（5）HTTP協議的功能

　HTTP協議（HyperText Transfer Protocol，超文本傳輸協議）是用於從WWW伺服器傳輸超文本到本地瀏覽器的傳輸協議。它可以使瀏覽器更加高效，使網路傳輸減少。它不僅保證電腦正確快速地傳輸超文本文檔，還確定傳輸文檔中的哪一部分，以及哪部分內容首先顯示(如文本先於圖形)等。

　HTTP是客戶端瀏覽器或其他程式與Web伺服器之間的應用層通訊協議。在Internet上的Web伺服器上存放的都是超文本資訊，客戶機需要通過HTTP協議傳輸所要訪問的超文本資訊。HTTP包含命令和傳輸資訊，僅可用於Web訪問，也可以用於其他網際網路/內聯網應用系統之間的通訊，從而實現各類應用資源超媒體訪問的集成。

　我們在瀏覽器的地址欄里輸入的網站地址叫做URL (Uniform Resource Locator，統一資源定位符)。就像每家每戶都有一個門牌地址一樣，每個網頁也都有一個Internet地址。當你在瀏覽器的地址框中輸入一個URL或是單擊一個超級鏈接時，URL就確定了要瀏覽的地址。瀏覽器通過超文本傳輸協議(HTTP)，將Web伺服器上站點的網頁程式碼提取出來，並翻譯成漂亮的網頁。