Xbox Series X系統架構分析 SoC細節一覽

今天是Hot Chips 2020峰會的首個演講日,原本計劃在今天最末尾登場的微軟計劃帶來Xbox Series
X的系統架構演講,現在媒體已經拿到了演講所用的演示稿,可以提前分析這台高性能次世代主機的系統架構了。出乎預料的是,微軟這次給到了非常詳盡的資料,詳細描述了Xbox
Series X上面所用SoC的架構。廢話不多說,我們趕緊來看一下。

Xbox Series X系統架構分析 SoC細節一覽

Xbox Series X系統架構分析 SoC細節一覽

首先官方還是介紹了一番這台主機新支持的諸多特性,諸如DXR、VRS、Mesh着色等等,這些我們大多都爛熟於心,而右邊的某些特性則是首次公開,尤其是在音頻方面,Xbox
Series X支持了許多新特性。

Xbox Series X系統架構分析 SoC細節一覽

對於我們這幫架構愛好者來說,最興奮的莫過於這張Die Shot。這是Xbox Series X上所使用的SoC的Die
Shot,它使用台積電的N7e工藝(與N7P之間有什麼關系有待考察),集成有153億個晶體管,核心面積高達360.4mm2,SoC與AMD合作開發。

Xbox Series X系統架構分析 SoC細節一覽

簡化一下就是上面這張圖,可以看到其整體結構仍然類似於AMD近幾年的APU,不過相比起Renoir,它還是有很大的不同。CPU部分跟Renoir比較相近,同樣是兩組Zen
2 CCX,每組CCX帶有4MB的三級緩存。CPU在關閉超線程的情況下可以跑到3.8 GHz,開啟超線程會降低0.2 GHz的最高頻率。

CPU和SoC的其他部分通過一條可擴展的數據總線進行互聯,推測是基於IF總線。總線上面連接了顯示控制單元、媒體編解碼單元、安全模塊、存儲加密解密解壓縮單元、GPU、IO
Hub和記憶體控制器。

Xbox Series X系統架構分析 SoC細節一覽

GPU部分設計了28組Dual CU單元,其中有兩組被屏蔽,實際會有26組工作的Dual CU,也就是52組CU。由於GPU部分基於RDNA
2架構,我們也由此可以一窺RDNA 2架構的細節。

從圖上看,RDNA 2的架構與RDNA相差並不大,主要還是從硬件層面上支持了很多新出現的圖形特性。

Xbox Series X系統架構分析 SoC細節一覽

從Dual CU單元的組成來看,RDNA 2的基礎單元架構與RDNA沒有太大的區別,比較亮眼的是每個Dual
CU中集成了兩個硬件加速光線追蹤的處理單元,也就是每CU有一個,這也是RDNA 2支持硬件光追的秘訣所在。

Xbox Series X系統架構分析 SoC細節一覽

記憶體控制器方面,因為需要同時滿足CPU和GPU的需求,所以採用了高帶寬的GDDR6記憶體系統,這套記憶體系統的特別之處在於,它採用了交錯記憶體設計,同時將整個記憶體分為兩部分,10GB部分的交錯程度比另外的6GB來的更高,總的記憶體帶寬可以達到560GB/s。

Xbox Series X系統架構分析 SoC細節一覽

I/O部分,這里疑似幻燈片有誤,應該是有8條PCIe 4.0總線,其中2條用於連接內置的1TB SSD,另外有2條用於連接外置的可擴展存儲卡。

演講稿的其他方面則是在講解圖形方面的新特性,像是VRS、采樣器反饋等DirectX 12 Ultimate中新增的特性。

Xbox Series X系統架構分析 SoC細節一覽

VRS的原理是通過改變單次像素着色器操作所處理的像素數量,來改變屏幕不同區域的着色質量。簡單來說,它可以改變同個畫面中不同部分的渲染精細度,它的用處是提高畫面幀數。

Xbox Series X系統架構分析 SoC細節一覽

采樣器反饋是允許遊戲引擎去跟蹤紋理采樣器的使用方式,讓後者向引擎提供反饋,方法是生成「反饋圖(Feedback
Map)」,它會記錄不同紋理區域的不同駐留等級,然後程序可以根據這些反饋信息來做決策——包括該如何使用紋理采樣器和要在顯存中保留哪些資源等。這比原先的流程更為精確,可以更好地分配計算資源。簡單來說它的實際效果就是用更少的顯存渲染更大、更詳細的紋理。

Xbox Series X系統架構分析 SoC細節一覽

微軟還提到利用機器學習推導對遊戲進行加速,這可能預示着Xbox Series X上會有類似於DLSS的技術。

值得一提的是,Xbox Series X對音頻處理方面也進行了加強。

Xbox Series X系統架構分析 SoC細節一覽

這枚SoC上還有幾個由微軟研發的硬件單元,包括音頻單元、安全模塊和存儲處理器。其中,音頻單元的單精度浮點(SPFP)性能直接能夠超過Xbox One
X上面的8核CPU。MSP,也就是存儲處理器能夠提供總計大於5GB/s的硬件加密性能,另外還有兩個通用材質解壓縮引擎,能夠提供6GB/s的等效傳輸速率。

來源:3DMGAME