Get Amped! 在今晚的GTC大會之前，我們為你梳理了Ampere架構的傳聞

今天晚上9點，NVIDIA將會放出CEO黃仁勛為主講人的GTC 2020主題演講，經過官方的多次預熱和暗示，我們很有可能會看到新一代的Ampere架構，還有基於新架構的GPU、新的Tesla計算卡和DGX計算伺服器產品。在今晚揭曉謎底之前，我們整合了截至目前的多條流言和傳聞，嘗試為各位讀者構建出一個盡量接近最終成品的Ampere架構。

傳說中的GA102核心圖，來自於@Ragdoll_Kitties

我們首先從製程工藝開始講起。

製程工藝：台積電7nm還是三星8nm？

Ampere GPU將使用誰家的哪種製程工藝可以說是目前最為撲朔迷離的一個問題。要搞清楚這個問題，我們需要回顧一系列的新聞事實。

最早的傳聞出現在去年的6月份，當時有媒體報導NVIDIA將會選擇三星的7nm EUV工藝來生產新一代的Ampere GPU而不是用老夥伴台積電的7nm工藝。

這則消息隨後被NVIDIA韓國的頭頭確認了，隨後又被NVIDIA官方發言人和VP改正為他們將在下代GPU上同時使用兩家的工藝」。之後很長時間，我們都以這個官方確認為准，但同時用兩家代工廠肯定會帶來一個新的問題：哪家多哪家少？

於是在去年於蘇州舉辦的GTC 2019中國大會上面，有媒體直接向CEO黃仁勛詢問了這個問題。當時黃仁勛確實給出了回答，原話是怎麼樣的現在已經不可知，目前能夠找到的相關報導的引源都是來自於這段話：

NVIDIA創始人黃仁勛日前接受媒體訪問時澄清，未來還是會將大多數7納米製程產品訂單交由台積電生產，三星只會獲得少量訂單。

通過CEO的澄清，我們似乎可以確定台積電在新一代產品中仍然將作為主要的代工廠。但之後不久，又出現了NVIDIA將會使用三星的8nm製程製造遊戲GPU的傳聞。

但其實細看的話，兩者之間並不衝突，「會將大多數7納米製程產品訂單交由台積電生產」這句話中提到的產品是「7納米製程產品訂單」，而如果遊戲GPU直接不使用7納米製程，那它根本就不算是「7納米製程產品訂單」的成分，那麼傳聞和已經被確認的事實之間就不存在衝突了。

基於以上的判斷，我們可以提出如下的猜測：核心面積巨大、面向專業計算市場的GA100可能會交由台積電進行生產，而面積更小，諸如GA104等遊戲GPU將會交由三星進行生產，並且使用8nm製程。

由於三星的8nm工藝實質是10nm節點工藝的改良版本，其密度提升不大，所以是比較適合用來「攤大餅」以降低先進位程工藝帶來的積熱效應，在遊戲卡上面可以用更低的成本來控制好核心溫度。

架構優化升級

從Kepler架構開始，NVIDIA就著重於提升GPU的能效比，Ampere架構肯定也會伴隨著一定的能效比提升，這其中部分是來自於製程工藝的升級，部分是來自於自身的架構優化升級。

從這幾代NVIDIA GPU架構的變化來看，有幾個趨勢是比較明顯的，一是單個SM中的CUDA Core數量在變少，而SM數量在不斷變多；二是緩存系統在不斷地變大，尤其是共享的L2緩存，在不斷地變大；三是將整數與浮點計算解耦，對不同的數據類型進行並行化處理。

Turing是一代改變較大的架構，就算是與它的前輩Volta比，改變也堪稱巨大。首先它引入了RT Core，支持對光線追蹤進行硬體加速計算，並成功地將Tensor Cores應用在遊戲卡上面。另外它獨立設置了處理INT16的單元，讓整數與浮點走兩條並行的處理管線。總的來說，它打好了NVIDIA未來圖形架構的基礎，Ampere將會在它的基礎上進行優化升級。目前的傳言中，對於Ampere架構的猜測主要有如加大L2緩存，增加Tensor Cores的數量，RT Cores的效率改進等等。

先來說說Turing核心中被玩家們叫成是「電爐絲」的Tensor Cores和RT Cores。

Tensor Cores的更多用處：幫助壓縮顯存？

有傳言稱Ampere將會把單個SM中的Tensor Cores給加倍，以提供更強勁的FP16運算能力，那麼會用在何處呢？

想必各位還是比較認同DLSS 2.0在圖像質量和性能上面的優化改進的，傳言中稱，一個兼容性更好（能兼容TAA算法，目前不行）的DLSS 3.0已經在路上了，它會提供比DLSS 2.0更強的表現。那麼數量加倍的Tensor Cores想必能夠在AI相關的應用中提供好不少的性能，DLSS就是一大重點用途。當然，對於計算市場，加倍的Tensor Cores在計算能力方面也將會有出色的表現。

另外，傳言中還說，Tensor Cores可能將會幫助GPU進行顯存的壓縮，以增加GPU與顯存之間的帶寬，這對當前的GDDR6顯存是一個友好的補充。

RT Core改進：4倍光追性能？

再來看RT Core相關的內容，Turing GPU在處理實時光追效果時，會有不小的性能損失。Ampere的每個SM仍然只會有一個RT Cores，但它會在效率上可能會有很大的提升。

效率的提升會讓GPU在處理實時光追時更為得心應手，至少不會像Turing那樣，在碰到大量應用光線追蹤特效時出現大幅度的幀數下降這種情況了。

L2緩存加大：提升IPC性能

緩存設計是現代GPU設計中重要的一環，非常影響最終的性能表現。從Kepler一路看過來，你可以發現NVIDIA一直都在加大GPU的緩存，Turing的L1緩存架構還被重新設計了一番。

目前的傳聞中，Ampere將會把L2緩存給加倍，這也是得益於製程工藝的提升。這也會讓架構的IPC得到一定的提升。配合上新工藝帶來的頻率提升，可以預見的是，Ampere在普通應用中（沒有光追和DLSS）相比Turing也會有較大的提升。

I/O、顯示接口升級：PCIe 4.0板上釘釘，DP 2.0、HDMI 2.1可以有

Ampere架構是未來一到兩年中NVIDIA方面主打的GPU架構，那麼在I/O部分自然也要有相當的前瞻性以滿足後面幾年的需求才行。從Turing到現在過去已經快有兩年的時間了，I/O接口有了不少的升級，比如說HDMI推出了2.1版本，DisplayPort也推出了2.0版本，而PCIe 4.0也已經進入實用領域，競爭對手的最新GPU中已經升級到了PCIe 4.0，那麼NVIDIA自然是不會落後，支持PCIe 4.0總線可以說是板上釘釘的事情。

為了面向未來的8K甚至更高的解析度，對顯示接口進行升級也基本上是可以肯定的事情。我們很有可能會看到它支持HDMI 2.1和DisplayPort 2.0，原來的USB-C支持也將保留。

總結

好了，以上就是對今晚即將要發布的Ampere GPU的一些傳聞的匯總，我們拋去了傳聞中針對遊戲卡的部分，只保留了架構的變動，由於Ampere很明顯將會是一代同時面向計算和遊戲的通用型架構，我們從今晚的主題演講中應該會得知關於它的很多信息，敬請等待今晚九點之後的專題報導。

來源：超能網

Get Amped! 在今晚的GTC大會之前，我們為你梳理了Ampere架構的傳聞

製程工藝：台積電7nm還是三星8nm？

架構優化升級

Tensor Cores的更多用處：幫助壓縮顯存？

RT Core改進：4倍光追性能？

L2緩存加大：提升IPC性能

I/O、顯示接口升級：PCIe 4.0板上釘釘，DP 2.0、HDMI 2.1可以有

總結

《鹽與避難所》暗門和隱蔽點位置分享

壽屋: 1/144 ADF-01 展圖

《洛克人Zero/ZX遺產合集》角色預告：英雄來了洛克人Zero/ZX遺產合集

Ella生產過程影片曝光，深情表白家人

《海綿寶寶：宇宙搖擺》IGN13分鍾實機遊玩演示

開發者稱贊PS5主機3D音效改變了遊戲的開發方式

《鋼之崛起》新手入門怎麼玩？新手入門玩法攻略

GSC: 22年2月粘土人格溫侍

《大俠立志傳》華青青的入隊劇情是什麼

專訪李晨、王千源 | 合作三次了，現在沒事我們倆就會聚一聚

《死亡擱淺：導剪版》榮譽宣傳片賞明天掌握在你手里

她曾是馮鞏最喜歡的徒弟，搞笑幽默的她，通過演小品被大家熟知