TCP/IP,http,RPC、SOA、長連接短連接

  • 2019 年 11 月 22 日
  • 筆記

TCP/IP

  • 建立TCP需要三次握手才能建立(客戶端發起SYN,服務端SYN+ACK,客戶端ACK),
  • 斷開連接則需要四次握手(客戶端和服務端都可以發起,FIN-ACK-FIN-ACK)。

為什麼連接的時候是三次握手,關閉的時候卻是四次握手?

因為當Server端收到Client端的SYN連接請求報文後,可以直接發送SYN+ACK報文。其中ACK報文是用來應答的,SYN報文是用來同步的。

但是關閉連接時,當Server端收到FIN報文時,很可能並不會立即關閉SOCKET,所以只能先回復一個ACK報文,告訴Client端,"你發的FIN報文我收到了"。只有等到Server端所有的報文都發送完了,我才能發送FIN報文,因此不能一起發送。故需要四步握手。

SYN攻擊:發送大量的SYN,導致服務端無法識別哪些是有效的

RPC

RPC是指遠程調用,兩服務器A、B,A要調用B上的一個方法,由於不在一個內存空間,不能直接調用,需要通過網絡來表達調用的語義和傳達調用的數據

  1. 通訊問題:在客戶端和服務端建立TCP連接,遠程調用的所有交換數據都在這個連接里傳輸。
  2. 解決尋址問題:IP及端口尋址,方法名
  3. 序列化(Serialize):發生遠程調用時,方法的參數需要通過底層的網絡協議如TCP傳送到服務器,由於網絡協議是基於二進制的,內存中的參數值需要序列化成二進制的形式,通過尋址和傳輸序列化的二進制發送給服務器。
  4. 服務器反序列化:服務器收到請求後需要反序列化,恢復內存中的表達方式,然後找到對應的方法(尋址的一部分),進行本地調用。
  5. 返回值發送給客戶端,這個部分也需要序列化和反序列化。

SOA

採用一組服務的方式來構建一個應用,服務(hedwig、jsf、RESTful)獨立部署在不同的進程中,不同服務通過一些輕量級交互機制來通信,例如RPC、HTTP等。服務可獨立擴展伸縮,每個服務定義了明確的邊界,不同的服務甚至可以採用不同的編程語言來實現,由獨立的團隊來維護。

RPC 的實現是基於SOA這樣的一個架構 C/S模式 遠程調用的通訊使用TCP 然後hedwig restful jsf這些就是不同的服務形式

http 協議和 tcp/ip 協議的關係

(1) http 是應用層協議,tcp 協議是傳輸層協議,ip 協議是網絡協議。

(2) ip 協議主要解決網絡路由和尋址問題

(3) tcp 協議主要解決在 ip 層協議之上,如何可靠的傳輸數據,即接收端收到的數據包的大小和順序,和發送端保持一致。tcp 協議是可靠的面相連接的。

  1. http協議是無狀態的,指的是http協議對於事務處理沒有記憶功能,客戶端向服務端請求完數據之後,服務端不知道客戶端是什麼狀態。
  2. http的長連接和短連接,本質上是tcp層的長連接和短連接: http 1.0 默認使用短連接, http 1.1 默認使用長連接,在使用的http協議,在響應頭會加上 Connection:keep-alive
  3. RPC 比 http 請求快的原因:http 使用 http 協議,rpc 使用 tcp 協議,比 http 少了應用層,表示層,會話層,這3層,rpc使用長連接,而長連接比短連接更節省資源,效率更高(每個連接的建立和釋放都是需要資源和時間的)。

TCP/IP

是個協議組,可分為三個層次:網絡層、傳輸層和應用層

在網絡層有IP 協議、ICMP 協議、ARP 協議、RARP 協議和 BOOTP 協議。

在傳輸層中有TCP協議與UDP協議。

在應用層有: TCP 包括 FTP、HTTP、TELNET、SMTP 等協議

UDP 包括 DNS、TFTP 等協議

當網絡通信時採用TCP協議時,在真正的讀寫操作之前,server與client之間必須建立一個連接,當讀寫操作完成後,雙方不再需要這個連接時它們可以釋放這個連接,連接的建立是需要三次握手的,而釋放則需要4次握手,所以說每個連接的建立都是需要資源消耗和時間消耗的。

通信過程:

主機 A 的應用程序要能和主機 B 的應用程序通信,必須通過 Socket 建立連接,而建立 Socket 連接必須需要底層 TCP/IP 協議來建立 TCP 連接。建立 TCP 連接需要底層 IP 協議來尋址網絡中的主機。我們知道網絡層使用的 IP 協議可以幫助我們根據 IP 地址來找到目標主機,但是一台主機上可能運行着多個應用程序,如何才能與指定的應用程序通信就要通過 TCP 或 UPD 的地址也就是端口號來指定。這樣就可以通過一個 Socket 實例唯一代表一個主機上的一個應用程序的通信鏈路了。

建立通信鏈路:

當客戶端要與服務端通信,客戶端首先要創建一個 Socket 實例,操作系統將為這個 Socket 實例分配一個沒有被使用的本地端口號,並創建一個包含本地和遠程地址和端口號的套接字數據結構,這個數據結構將一直保存在系統中直到這個連接關閉。在創建 Socket 實例的構造函數正確返回之前,將要進行 TCP 的三次握手協議,TCP 握手協議完成後,Socket 實例對象將創建完成,否則將拋出 IOException 錯誤。

與之對應的服務端將創建一個 ServerSocket 實例,ServerSocket 創建比較簡單只要指定的端口號沒有被佔用,一般實例創建都會成功,同時操作系統也會為 ServerSocket 實例創建一個底層數據結構,這個數據結構中包含指定監聽的端口號和包含監聽地址的通配符,通常情況下都是「*」即監聽所有地址。之後當調用 accept() 方法時,將進入阻塞狀態,等待客戶端的請求。當一個新的請求到來時,將為這個連接創建一個新的套接字數據結構,該套接字數據的信息包含的地址和端口信息正是請求源地址和端口。這個新創建的數據結構將會關聯到 ServerSocket 實例的一個未完成的連接數據結構列表中,注意這時服務端與之對應的 Socket 實例並沒有完成創建,而要等到與客戶端的三次握手完成後,這個服務端的Socket 實例才會返回,並將這個 Socket 實例對應的數據結構從未完成列表中移到已完成列表中。所以 ServerSocket 所關聯的列表中每個數據結構,都代表與一個客戶端的建立的TCP 連接。

TCP短連接

TCP短連接,client向server發起連接請求,server接到請求,然後雙方建立連接。client向server 發送消息,server回應client,然後一次讀寫就完成了,這時候雙方任何一個都可以發起close操作,不過一般都是client先發起 close操作。因為一般的server不會回復完client後立即關閉連接的,當然不排除有特殊的情況。從上面的描述看,短連接一般只會在client/server間傳遞一次讀寫操作。短連接的優點是:管理起來比較簡單,存在的連接都是有用的連接,不需要額外的控制手段。

TCP長連接

長連接,client向server發起連接,server接受client連接,雙方建立連接。Client與server完成一次讀寫之後,它們之間的連接並不會主動關閉,後續的讀寫操作會繼續使用這個連接。

TCP保活功能,保活功能主要為服務器應用提供,服務器應用希望知道客戶主機是否崩潰,從而可以代表客戶使用資源。如果客戶已經消失,使得服務器上保留一個半開放的連接,而服務器又在等待來自客戶端的數據,則服務器將應遠等待客戶端的數據,保活功能就是試圖在服務器端檢測到這種半開放的連接。如果一個給定的連接在兩小時內沒有任何的動作,則服務器就向客戶發一個探測報文段。客戶主機必須處於以下4個狀態之一:

  1. 客戶主機依然正常運行,並從服務器可達。客戶的TCP響應正常,而服務器也知道對方是正常的,服務器在兩小時後將保活定時器複位。
  2. 客戶主機已經崩潰,並且關閉或者正在重新啟動。在任何一種情況下,客戶的TCP都沒有響應。服務端將不能收到對探測的響應,並在75秒後超時。服務器總共發送10個這樣的探測 ,每個間隔75秒。如果服務器沒有收到一個響應,它就認為客戶主機已經關閉並終止連接。
  3. 客戶主機崩潰並已經重新啟動。服務器將收到一個對其保活探測的響應,這個響應是一個複位,使得服務器終止這個連接。
  4. 客戶機正常運行,但是服務器不可達,這種情況與2類似,TCP能發現的就是沒有收到探查的響應。

從上面可以看出,TCP保活功能主要為探測長連接的存活狀況,不過這裡存在一個問題,存活功能的探測周期太長,還有就是它只是探測TCP連接的存活,屬於比較斯文的做法,遇到惡意的連接時,保活功能就不夠使了。

在長連接的應用場景下,client端一般不會主動關閉它們之間的連接,Client與server之間的連接如果一直不關閉的話,會存在一個問題,隨着客戶端連接越來越多,server早晚有扛不住的時候,這時候server端需要採取一些策略,如關閉一些長時間沒有讀寫事件發生的連接,這樣可以避免一些惡意連接導致server端服務受損;如果條件再允許就可以以客戶端機器為顆粒度,限制每個客戶端的最大長連接數,這樣可以完全避免某個蛋疼的客戶端連累後端服務。

長連接和短連接的產生在於client和server採取的關閉策略,具體的應用場景採用具體的策略,沒有十全十美的選擇,只有合適的選擇。

HTTP長連接與短連接

長連接:client方與server方先建立連接,連接建立後不斷開,然後再進行報文發送和接收。

這種方式下由於通訊連接一直存在。此種方式常用於P2P通信。

短連接:Client方與server每進行一次報文收發交易時才進行通訊連接,交易完畢後立即斷開連接。

此方式常用於一點對多點通訊。C/S通信。

長連接和短連接異同

長連接:長連接多用於操作頻繁,點對點的通訊,而且連接數不能太多的情況。

每個TCP連接的建立都需要三次握手,每個TCP連接的斷開要四次握手。

如果每次操作都要建立連接然後再操作的話處理速度會降低,所以每次操作後,下次操作時直接發送數據就可以了,不用再建立TCP連接。例如:數據庫的連接用長連接,如果用短連接頻繁的通信會造成socket錯誤,頻繁的socket創建也是對資源的浪費。

短連接:web網站的http服務一般都用短連接。因為長連接對於服務器來說要耗費一定的資源。像web網站這麼頻繁的成千上萬甚至上億客戶端的連接用短連接更省一些資源。試想如果都用長連接,而且同時用成千上萬的用戶,每個用戶都佔有一個連接的話,可想而知服務器的壓力有多大。所以並發量大,但是每個用戶又不需頻繁操作的情況下需要短連接

發送接收方式

  • 異步:報文發送和接收是分開的,相互獨立,互不影響的。這種方式又分兩種情況: 異步雙工:接收和發送在同一個程序中,有兩個不同的子進程分別負責發送和接送。 異步單工:接送和發送使用兩個不同的程序來完成。
  • 同步:報文發送和接收是同步進行,即報文發送後等待接送返回報文。同步方式一般需要考慮超時問題,試想我們發送報文以後也不能無限等待啊,所以我們要設定一個等待時候。超過等待時間發送方不再等待讀返回報文。直接通知超時返回。

阻塞與非阻塞方式

  • 非阻塞方式:讀函數不停的進行讀動作,如果沒有報文接收到,等待一段時間後超時返回,這種情況一般需要指定超時時間。
  • 阻塞方式:如果沒有接收到報文,則讀函數一直處於等待狀態,知道報文到達。

及時通信與遊戲的長短連接

實際場合究竟需要使用短連接還是長連接,主要看實時性要求、數據流向和並發量這三個問題。

長連接優點:節約TCP握手時間,可以保證高實時性,數據流向可以採用服務器端的主動推模式。

長連接缺點:並發量不宜太高,持續佔用服務端口(相對消耗資源)。

長連接、長輪詢一般應用與WebIM、ChatRoom和一些需要及時交互的網站應用中。其真實案例有:WebQQ、Hi網頁版、Facebook IM等。

1.現在遊戲中的玩家與玩家之間的聊天無法實現實時性,而且系統有郵件或信息時也不能及時的通知玩家

—— 如果涉及到聊天的話,一般來說還是用長連接會更合適,否則大量時間浪費到握手上了;

—— 但是手機的網絡長連接網絡質量可能會比較撮,你需要嚴重考慮容錯和重鏈機制。

2.客戶端每隔幾秒就會發送一個請求,這樣服務器的壓力豈不是很大?

—— 壓力會比較大,關鍵是聊天往往對時間的要求很高,如果是團戰的話,1秒內沒看到信息,可能就會覺得完全受不了了;當然也看你聊天的場景如何,是群聊還是單聊,以後會不會發展為語音啥的;

NIO沒有任何問題,大規模長連接處理的主流都是用NIO;而且也不是Java發明的,本身就是藉助了操作系統的網絡管理能力。

http keep-alive與tcp keep-alive,不是同一回事,意圖不一樣。http keep-alive是為了讓tcp活得更久一點,以便在同一個連接上傳送多個http,提高socket的效率。而tcp keep-alive是TCP的一種檢測TCP連接狀況的保鮮機制