它的使命就是幹掉RX 6900 XT！RTX 3080 Ti首發評測

2021 年 6 月 2 日
資訊
GPU, NVIDIA, RTX 3080 Ti, 安培, 顯卡

一、前言：它的使命就是幹掉RX 6900 XT！

RTX 3080 Ti誕生所經歷的曲折可謂一言難盡！在NVIDIA最初的計劃中，RTX 3080 Ti擁有20GB的大容量GDDR6X顯存，顯存位寬和帶寬與RTX 3080相同。不過誰也不曾料到AMD的RDNA2構架的強悍遠超出NVIDIA以及所有完全的事先預料。

特別是RX 6900 XT的性能與NVIDIA頂級的RTX 3090相差無幾，但是售價僅有7999元，而後者則是11999元。

很顯然，按照原定計劃，顯存帶寬被大量閹割的RTX 3080 Ti對上RX 6900 XT時並無必勝的把握。為此，NVIDIA重新設計了RTX 3080 Ti核心，雖然顯存容量減少到了12GB，但是完整的384Bit位寬得到了保留，顯存帶寬遠超RTX 3080。

NVIDIA賦予RTX 3080 Ti的使命就是幹掉RX 6900 XT！

GA102-225-A1構架圖

完整的GA102共有7組GPC，每組GPC有6組TPC加16組ROP單元，總計是42組TPC、共計10752個流處理器、112個ROP單元、

同樣的完整的GA102核心的每個TPC有2組SM單元、2個RT Core、8個Tensor Core、8個紋理單元。

而RTX 3080 Ti所使用的GA102-225-A1核心依舊保持了7組GPC，完整的112個ROP得以保存。不過NVIDIA在其中的2組GPC中分別屏蔽掉了一組TPC。

因此它只有40組TPC、算下來就是10240個流處理器、320個紋理單元、320個Tensor Core。

RTX 3080 Ti GPU-Z參數

RTX 3080 Ti的詳細規格如下：

關於安培GPU的構架此前我們已經有過詳細的介紹，在這裡我們化繁為簡，將其做了簡單的歸納如下：

1、整合INT32與FP32單元

圖靈的INT32單元只能做整數運算，閑置率很高。為了解決這個問題，提升INT32單元的利用率，NVIDIA改進了INT32單元，使之不僅可以運行整數運算，也能進行單精度浮點運算，相當於整合了INT32和FP32單元，因而使得以FP32單元計數的GPU流處理器數量直接翻倍，單精度浮點性能也同樣翻倍。

2、RTX IO技術

這項技術可以讓遊戲在加載時完全規避CPU，直接將遊戲數據包從SSD寫入到GPU的顯存中，由GPU替代CPU進行數據解包。GPU的整數/浮點性能數十倍於CPU，可以瞬間完成數據的解包工作。

不過這項技術需要微軟DirectStorage API的支持，預計2022年會正式開始應用。

3、NVIDIA DLSS：

從遊戲內的物理和動畫模擬到實時渲染和AI增強的直播功能，AI正在引發一場遊戲革命。藉助GeForce RTX GPU的專用AI處理器Tensor Cores，NVIDIA DLSS在提升幀率的同時，生成精美、清晰的遊戲圖像，為玩家提供更大的性能空間，以最大限度地提高光線追蹤設置並提高輸出分辨率。現在已有超25款遊戲支持DLSS，並且數量還在逐月遞增。

4、NVIDIA Reflex：降低輸入延遲

NVIDIA Reflex技術可以降低系統延遲(或稱輸入延遲)，使遊戲的響應速度更快，使玩家在多人競技遊戲中佔據優勢。

在傳統的PC體系中，雖然強力的顯卡可以輕鬆渲染出足夠高的幀率，但這些遊戲畫面都需要CPU進行調度分配，不合理的調度會使得CPU手忙腳亂，玩家鼠標發出的指令其實無法第一時間到達遊戲世界，這個過程我們稱之為延遲。

為了降低系統延遲，幫助GPU渲染的圖像能夠第一時間迅速呈現在屏幕，NVIDIA Reflex技術也隨着RTX 30系列的發佈而登場。NVIDIA Re flex SDK被直接植入到了遊戲，

NVIDIA Reflex SDK能夠更好的控制CPU的運行速度，允許及時向GPU提交例如點擊鼠標的關鍵動作，同時還確保GPU沒有間斷運行，保證畫面的流暢輸出。

而最新發佈的360Hz刷新率的電競G-Sync顯示器還內建了延遲分析器，可以讓你更系統化的量化電競遊戲中的延遲數據。 NVIDIA Reflex技術是職業電競選手和精英玩家唯一專業的選擇。

5、第二代RT Core

光線追蹤是一種在計算機世界中完美再現真實世界的渲染技術，它的算法符合物理規律，不會像傳統光柵化渲染那樣容易產生各種問題。比如一個典型的例子就是光柵化算法無法正確處理焦散這種光學現象，炎熱的夏天陽光透過游泳池在水底投射得斑紋光影就是典型焦散，傳統光柵化算法使用的是動態貼圖，看起來雖然也像那麼回事，但是無法和玩家互動，例如當角色進入泳池游泳就無法進行正確處理渲染，畫面往往出現不合理渲染效果，或者遊戲中的陽光位置變化，天氣變化對泳池光影的影響也無法正確表現。而光線追蹤技術可以實時自動的演算焦散效果，讓畫面更加真實。

但是光線追蹤最大的問題是需要消耗巨大的計算資源，顯示器就像一塊窗子，虛擬的每一條光線都會穿過屏幕像素直達場景，並從存儲器中查找會被擊中的三角形，而且每條射線都要做這個動作，如果希望效果好的話，每像素可能還需要若干條甚至上萬條射線。

如果場景里有幾千萬個三角形，逐個三角形做遍歷求交，就需要消耗大量的高速緩存和總線帶寬，計算單元需要浪費大量時間等待三角形數據傳輸。

RTX 30系列顯卡基於新一代NVIDIA Ampere架構，擁有第二代光線追蹤計算核心，相比於第一代光線追蹤計算核心，RTX 30系列的光線追蹤核心性能足足提高了1.7倍。而且硬件上特別支持對運動模糊場景的光追效果計算。從而帶給玩家更流暢的光線追蹤遊戲視覺體驗。

特別是體驗《賽博朋克2077 》這樣支持光線追蹤技術的新一代遊戲，RTX 30系列能夠輕鬆駕馭賽博朋克的頹廢風格，流暢渲染都市夜晚霓虹燈下，大量的賽車，追逐，打鬥等運動場景。為玩家帶來最極致的視覺體驗。

6、第三代Tensor Core

NVIDIA 自 Volta架構開始，在GPU中增加了針對深度學習加速設計的矩陣運算單元，並稱之為 Tensor Core（張量計算核心）。

在圖靈架構里，NVIDIA 引入了第二代 Tensor Core，而到了RTX 30系列所採用的Ampere架構，則進化到了第三代Tensor Core。

深度學習技術在圖形圖像各個領域都有着價值巨大的應用，而在遊戲體驗中則是被稱為深度學習超採樣的DLSS 技術。最新一代的DLSS 能夠使得遊戲畫質極大提升，細節和銳度媲美、甚至超越原生分辨率。

DLSS 本質是一種圖像重建算法，其加原理其實也很簡單。開啟DLSS後，遊戲引擎中的諸如動態光源、陰影的計算，封閉空間環境遮擋（SSAO）、屏幕空間反射（SSR），甚至實時光線追蹤。都會被降低到1/2甚至1/4像素的低分辨率下運行，GPU的負擔大幅度減輕。渲染得出的最終場景會通過Tensor Core結合DLSS進行高分辨率重建，從而用較低的GPU負載獲得流暢且畫質極佳的遊戲體驗效果。

和圖靈相比，安培的張量性能可以最高達到 2.7 倍。這使得RTX 30系列可以輕鬆使用DLSS技術在4K 甚至8K分辨率下，依然帶給玩家最極致的光線追蹤遊戲體驗效果。

7、GeForce Experience功能

所有NVIDIA GeForce GPU都能從GeForce Experience中獲益，數以千萬計的玩家都在使用該工具來優化遊戲設置、記錄和上傳遊戲、直播遊戲、拍攝屏幕截圖，以及下載和安裝Game Ready驅動。

8、一鍵自動式GPU調校

GeForce Experience現已支持GPU調校，它能使用高級掃描算法自動創建GPU超頻配置文件。

9、增強型遊戲內監控懸浮窗

GeForce Experience強大的遊戲內懸浮窗功能現已能讓玩家查看更多詳細的性能統計信息、溫度和延遲指標，包括 NVIDIA Reflex的延遲分析器統計信息。

文章內容導航

Tags: GPU NVIDIA RTX 3080 Ti 安培顯卡