Get Amped! 在今晚的GTC大會之前,我們為你梳理了Ampere架構的傳聞

今天晚上9點,NVIDIA將會放出CEO黃仁勛為主講人的GTC 2020主題演講,經過官方的多次預熱和暗示,我們很有可能會看到新一代的Ampere架構,還有基於新架構的GPU、新的Tesla計算卡和DGX計算伺服器產品。在今晚揭曉謎底之前,我們整合了截至目前的多條流言和傳聞,嘗試為各位讀者構建出一個盡量接近最終成品的Ampere架構。

Get Amped! 在今晚的GTC大會之前,我們為你梳理了Ampere架構的傳聞
傳說中的GA102核心圖,來自於@Ragdoll_Kitties

我們首先從製程工藝開始講起。

製程工藝:台積電7nm還是三星8nm?

Ampere GPU將使用誰家的哪種製程工藝可以說是目前最為撲朔迷離的一個問題。要搞清楚這個問題,我們需要回顧一系列的新聞事實。

最早的傳聞出現在去年的6月份,當時有媒體報導NVIDIA將會選擇三星的7nm EUV工藝來生產新一代的Ampere GPU而不是用老夥伴台積電的7nm工藝。

這則消息隨後被NVIDIA韓國的頭頭確認了,隨後又被NVIDIA官方發言人和VP改正為他們將在下代GPU上同時使用兩家的工藝」。之後很長時間,我們都以這個官方確認為准,但同時用兩家代工廠肯定會帶來一個新的問題:哪家多哪家少?

於是在去年於蘇州舉辦的GTC 2019中國大會上面,有媒體直接向CEO黃仁勛詢問了這個問題。當時黃仁勛確實給出了回答,原話是怎麼樣的現在已經不可知,目前能夠找到的相關報導的引源都是來自於這段話:

NVIDIA創始人黃仁勛日前接受媒體訪問時澄清,未來還是會將大多數7納米製程產品訂單交由台積電生產,三星只會獲得少量訂單。

通過CEO的澄清,我們似乎可以確定台積電在新一代產品中仍然將作為主要的代工廠。但之後不久,又出現了NVIDIA將會使用三星的8nm製程製造遊戲GPU的傳聞。

但其實細看的話,兩者之間並不衝突,「會將大多數7納米製程產品訂單交由台積電生產」這句話中提到的產品是「7納米製程產品訂單」,而如果遊戲GPU直接不使用7納米製程,那它根本就不算是「7納米製程產品訂單」的成分,那麼傳聞和已經被確認的事實之間就不存在衝突了。

基於以上的判斷,我們可以提出如下的猜測:核心面積巨大、面向專業計算市場的GA100可能會交由台積電進行生產,而面積更小,諸如GA104等遊戲GPU將會交由三星進行生產,並且使用8nm製程。

由於三星的8nm工藝實質是10nm節點工藝的改良版本,其密度提升不大,所以是比較適合用來「攤大餅」以降低先進位程工藝帶來的積熱效應,在遊戲卡上面可以用更低的成本來控制好核心溫度。

架構優化升級

從Kepler架構開始,NVIDIA就著重於提升GPU的能效比,Ampere架構肯定也會伴隨著一定的能效比提升,這其中部分是來自於製程工藝的升級,部分是來自於自身的架構優化升級。

從這幾代NVIDIA GPU架構的變化來看,有幾個趨勢是比較明顯的,一是單個SM中的CUDA Core數量在變少,而SM數量在不斷變多;二是緩存系統在不斷地變大,尤其是共享的L2緩存,在不斷地變大;三是將整數與浮點計算解耦,對不同的數據類型進行並行化處理。

Turing是一代改變較大的架構,就算是與它的前輩Volta比,改變也堪稱巨大。首先它引入了RT Core,支持對光線追蹤進行硬體加速計算,並成功地將Tensor Cores應用在遊戲卡上面。另外它獨立設置了處理INT16的單元,讓整數與浮點走兩條並行的處理管線。總的來說,它打好了NVIDIA未來圖形架構的基礎,Ampere將會在它的基礎上進行優化升級。目前的傳言中,對於Ampere架構的猜測主要有如加大L2緩存,增加Tensor Cores的數量,RT Cores的效率改進等等。

先來說說Turing核心中被玩家們叫成是「電爐絲」的Tensor Cores和RT Cores。

Tensor Cores的更多用處:幫助壓縮顯存?

Get Amped! 在今晚的GTC大會之前,我們為你梳理了Ampere架構的傳聞

有傳言稱Ampere將會把單個SM中的Tensor Cores給加倍,以提供更強勁的FP16運算能力,那麼會用在何處呢?

Get Amped! 在今晚的GTC大會之前,我們為你梳理了Ampere架構的傳聞

想必各位還是比較認同DLSS 2.0在圖像質量和性能上面的優化改進的,傳言中稱,一個兼容性更好(能兼容TAA算法,目前不行)的DLSS 3.0已經在路上了,它會提供比DLSS 2.0更強的表現。那麼數量加倍的Tensor Cores想必能夠在AI相關的應用中提供好不少的性能,DLSS就是一大重點用途。當然,對於計算市場,加倍的Tensor Cores在計算能力方面也將會有出色的表現。

Get Amped! 在今晚的GTC大會之前,我們為你梳理了Ampere架構的傳聞

另外,傳言中還說,Tensor Cores可能將會幫助GPU進行顯存的壓縮,以增加GPU與顯存之間的帶寬,這對當前的GDDR6顯存是一個友好的補充。

RT Core改進:4倍光追性能?

再來看RT Core相關的內容,Turing GPU在處理實時光追效果時,會有不小的性能損失。Ampere的每個SM仍然只會有一個RT Cores,但它會在效率上可能會有很大的提升。

Get Amped! 在今晚的GTC大會之前,我們為你梳理了Ampere架構的傳聞

效率的提升會讓GPU在處理實時光追時更為得心應手,至少不會像Turing那樣,在碰到大量應用光線追蹤特效時出現大幅度的幀數下降這種情況了。

L2緩存加大:提升IPC性能

緩存設計是現代GPU設計中重要的一環,非常影響最終的性能表現。從Kepler一路看過來,你可以發現NVIDIA一直都在加大GPU的緩存,Turing的L1緩存架構還被重新設計了一番。

Get Amped! 在今晚的GTC大會之前,我們為你梳理了Ampere架構的傳聞

目前的傳聞中,Ampere將會把L2緩存給加倍,這也是得益於製程工藝的提升。這也會讓架構的IPC得到一定的提升。配合上新工藝帶來的頻率提升,可以預見的是,Ampere在普通應用中(沒有光追和DLSS)相比Turing也會有較大的提升。

I/O、顯示接口升級:PCIe 4.0板上釘釘,DP 2.0、HDMI 2.1可以有

Ampere架構是未來一到兩年中NVIDIA方面主打的GPU架構,那麼在I/O部分自然也要有相當的前瞻性以滿足後面幾年的需求才行。從Turing到現在過去已經快有兩年的時間了,I/O接口有了不少的升級,比如說HDMI推出了2.1版本,DisplayPort也推出了2.0版本,而PCIe 4.0也已經進入實用領域,競爭對手的最新GPU中已經升級到了PCIe 4.0,那麼NVIDIA自然是不會落後,支持PCIe 4.0總線可以說是板上釘釘的事情。

為了面向未來的8K甚至更高的解析度,對顯示接口進行升級也基本上是可以肯定的事情。我們很有可能會看到它支持HDMI 2.1和DisplayPort 2.0,原來的USB-C支持也將保留。

總結

好了,以上就是對今晚即將要發布的Ampere GPU的一些傳聞的匯總,我們拋去了傳聞中針對遊戲卡的部分,只保留了架構的變動,由於Ampere很明顯將會是一代同時面向計算和遊戲的通用型架構,我們從今晚的主題演講中應該會得知關於它的很多信息,敬請等待今晚九點之後的專題報導。

來源:超能網