萬字回顧AMD激盪五十年

AMD 是最古老的大型微處理器設計者之一,也是近 50 年來技術愛好者之間兩極分化爭論的主題注意。

它的故事構成了一個激動人心的故事——充滿了英雄般的成功、魯莽的錯誤,以及千鈞一發的慘敗。

在其他半導體公司來去匆匆的地方,AMD 在董事會、法庭中經受了許多風暴,並進行了無數次戰鬥。

在本問中,我們回顧了該公司的過去,審視了通往現在的道路上的曲折,並想知道這家矽谷資深企業的未來。

名利雙收的崛起

要開始AMD的故事,我們需要倒退歲月,前往美國和 20 世紀 50 年代後期——二戰的艱難歲月之後蓬勃發展。如果您想體驗技術創新的前沿,那麼這里就是您的最佳時間和地點。

當時,貝爾實驗室、德州儀器和仙童半導體等公司聘請了最優秀的工程師,創造了無數個第一:雙極結型電晶體、集成電路和 MOSFET(金屬氧化物半導體場效應電晶體)。

萬字回顧AMD激盪五十年

Fairchild 工程師,大約 1960 年——戈登摩爾在最左邊,羅伯特諾伊斯在中間前方

這些年輕的技術人員想要研究和開發更多令人興奮的產品,但由於謹慎的高級管理人員注意到世界充滿恐懼和不穩定的時代,工程師們的挫敗感讓他們滋生了單打獨鬥的願望。

因此,1968 年,仙童半導體公司的兩名員工羅伯特·諾伊斯 (Robert Noyce) 和戈登·摩爾 (Gordon Moore) 離開了公司,開創了自己的道路。NM Electronics 於當年夏天開業,幾周後更名為Integrated Electronics,簡稱英特爾。

其他人也紛紛效仿,不到一年後,又有 8 人離開,他們一起成立了自己的電子設計和製造公司:Advanced Micro Devices(自然是 AMD)。

該小組由 Fairchild 前營銷總監 Jerry Sanders 領導,他們首先重新設計 Fairchild 和 National Semiconductor 的部件,而不是試圖與英特爾、摩托羅拉和 IBM 等公司在新集成電路上的開發直接競爭,後者在研究和開發上投入了大量資金。

從這些不起眼的開始,總部位於矽谷的AMD 提供的產品在幾個月內就提高了效率、壓力承受能力和速度。這些微晶片的設計符合美國軍用質量標準,事實證明,這在可靠性和生產一致性差異很大的還很年輕的計算機行業中具有相當大的優勢。

AMD 的第一個山寨 CPU——Am9080

2 MHz 8 位的 Am9080

到英特爾在1974年發布他們的第一個 8 位微處理器(8008)時,AMD也然是一家擁有 200 多種產品組合的上市公司——其中四分之一是他們自己設計的,包括 RAM 晶片、邏輯計數器(logic counters)和位變速杆(bit shifters)。

第二年出現了大量新型號:他們自己的 Am2900 集成電路 (IC) 系列和 2 MHz 8 位Am9080,這是英特爾 8008 後繼產品的逆向工程副本。

前者是現在的組件集合完全集成在 CPU 和 GPU 中,但 35 年前,算術邏輯單元和記憶體控制器都是獨立的晶片。

以今天的標準來看,英特爾的設計被公然剽竊似乎有些令人震驚,但在微晶片剛剛起步的日子里,這是司空見慣的事情。

在 AMD 和英特爾於 1976 年簽署交叉許可協議後,這個克隆的CPU 最終更名為 8080A。您可以想像這將花費一兩美分,但它僅為 325,000 美元(按今天的美元計算為 165 萬美元)。

這筆交易讓 AMD 和英特爾用利潤高得離譜的晶片去占領市場,零售價剛剛超過 350 美元,是“軍用”采購價格的兩倍。8085 (3 MHz) 處理器緊隨其後於 1977 年問世,很快又加入了 8086 (8 MHz)。

1979 年,AMD 在德克薩斯州奧斯汀的工廠也開始生產。

當 IBM 於 1982 年開始從大型機系統轉向所謂的個人計算機 (PC) 時,該公司決定外包部件而不是自行開發處理器。Intel 的8086是有史以來第一個 x86 處理器,被選中時明確規定 AMD 作為次要來源以保證為 IBM 的 PC/AT 提供持續供應。

萬字回顧AMD激盪五十年

1981 年的 IBM 5150 PC

AMD 和英特爾於當年 2 月簽署了一份合同,前者生產 8086、8088、80186 和 80188 處理器——不僅為 IBM,而且為許多激增的 IBM 克隆產品(康柏只是其中之一) . AMD 還於 1982 年底開始製造標記為 Am286 的 16 位英特爾 80286。

這將成為第一個真正重要的台式 PC 處理器,而英特爾的型號通常在 6 到 10 MHz 之間,而 AMD 的型號從 8 MHz 開始,最高可達 20 MHz。

這無疑標志著矽谷兩大巨頭之間 CPU 霸主之爭的開始;英特爾設計的東西,AMD 只是想做得更好。

Am286, Am386… Am5x86

這一時期代表了剛剛起步的 PC 市場的巨大增長,並且注意到 AMD 提供的 Am286 與 80286 相比具有顯著的速度提升,英特爾試圖阻止 AMD 的發展。這是通過排除他們獲得下一代 386 處理器的許可來實現的。

AMD 提起訴訟,但仲裁耗時四年半才完成,雖然判決認定英特爾沒有義務將所有新產品轉讓給 AMD,但確定這家較大的晶片製造商違反了默示的誠信契約。

英特爾的許可拒絕發生在一個關鍵時期,當時 IBM PC 的市場份額從 55% 膨脹到 84%。由於無法獲得新的處理器規格,AMD 用了五年多的時間將 80386 逆向工程為Am386。

一旦完成,它再次被證明不僅僅是英特爾模型的匹配。最初的 386 於 1985 年首次亮相,頻率僅為 12 MHz,後來成功達到 33 MHz,而 Am386DX 的高端版本於 1989 年以 40 MHz 推出。

萬字回顧AMD激盪五十年

緊隨著Am386 的成功,AMD在1993 年推出了極具競爭力的 40 MHz Am486,它以相同的價格提供比 Intel 的 33 MHz i486 高出大約 20% 的性能。

這將在整個 486 系列中得到復制,而英特爾的 486DX 最高頻率為 100 MHz,而 AMD 提供(在這個階段有點可預見的)更快的 120 MHz 選項。

為了更好地說明 AMD 在此期間的好運,該公司的收入翻了一番,從 1990 年的略高於 10 億美元增長到 1994 年的 20 億美元以上。

1995 年,AMD 推出了Am5x86處理器作為 486 的後繼處理器,將其作為舊計算機的直接升級。

Am5x86 P75+ 擁有 150 Mhz 的頻率,“P75”指的是與英特爾奔騰 75 相似的性能。“+”表示 AMD 晶片在整數運算方面比競爭對手略快。

為了解決這個問題,英特爾改變了它的命名約定,以使其與競爭對手和其他供應商的產品保持距離。Am5x86 為 AMD 帶來了可觀的收入,包括新銷售和 486 機器的升級。

與 Am286、386 和 486 一樣,AMD 通過將它們作為嵌入式解決方案提供,繼續擴展這些部件的市場范圍。

1996 年 3 月,AMD推出了第一款完全由自己的工程師開發的處理器:5k86,後來更名為 K5。

該晶片旨在與 Intel Pentium 和 Cyrix 6×86 競爭,該項目的強大執行力對 AMD 至關重要——該晶片預計將具有比 Cyrix 更強大的浮點單元,大約相當於 Pentium 100,而整數性能針對的是奔騰200。

萬字回顧AMD激盪五十年

K5 die的假彩色圖像

最終,這是一個錯失的機會,因為該項目受到設計和製造問題的困擾。這些導致 CPU 無法滿足頻率和性能目標,而且上市時間較晚,導致銷售不佳。

AMD K6 和 3DNow!時代

到那時,AMD 已經花費 8.57 億美元購買了NexGen,這是一家小型無晶圓廠晶片(僅設計)公司,其處理器由 IBM 製造。

AMD 的 K5 和開發中的 K6 在更高的時鍾速度(~150 MHz 及以上)下存在縮放問題,而 NexGen 的 Nx686 已經展示了 180 MHz 的核心速度。買斷後,Nx686 成為AMD 的 K6,原始晶片的開發被送往廢料場。

AMD 的崛起反映了英特爾的衰落,從 K6 架構的早期開始,K6 架構與英特爾的奔騰、奔騰II 和(大部分重新貼牌的)奔騰 III 競爭。

K6 加速了 AMD 的成功,這要歸功於前英特爾員工 Vinod Dham(又名“奔騰之父”),他於 1995 年離開英特爾前往 NexGen 工作。

當 K6 於 1997 年上市時,它代表了 Pentium MMX 的可行替代品。K6 不斷壯大——從初始版本的 233 MHz 提升到 1998 年 1 月“Little Foot”修訂版的 300 MHz,1998 年 5 月“Chomper” K6-2的 350 MHz,以及1998 年 9 月的 550 MHz驚人速度的修訂版。

K6-2 引入了 AMD 的 3DNow!SIMD(單指令,多數據)指令集。與 Intel 的 SSE 基本相同,它提供了一種更簡單的途徑來訪問 CPU 的浮點功能;這樣做的缺點是程式設計師需要將新指令合並到任何新代碼中,此外還需要重寫修正檔和編譯器以利用該功能。

與最初的 K6 一樣,K6-2 代表了比競爭產品更好的價值,其成本通常是英特爾奔騰晶片的一半。K6 的最終疊代版本K6-III是一個更復雜的 CPU,電晶體數量達到 2140 萬個——高於第一代 K6 的 880 萬個和 K6-II 的 940 萬個。

它結合了 AMD 的 PowerNow!,可根據工作負載動態改變時鍾速度。隨著時鍾速度最終達到 570MHz,K6-III 的生產成本相當高,並且由於 K7 的到來縮短了相對較短的壽命,K7 更適合與奔騰 III 及更高版本競爭。

第一個黃金時代:速龍

從 500 MHz 開始,Athlon CPU 使用新的 Slot A (EV6) 和從 DEC 獲得許可的新內部系統總線,運行頻率為 200MHz,超過了當時英特爾提供的 133MHz。

2000 年 6 月推出了Athlon Thunderbird,這是一款因其超頻能力而受到許多人喜愛的 CPU,它包含 DDR RAM 支持和全速 2 級片上緩存。

萬字回顧AMD激盪五十年

2 GHz 的 64 位 CPU 優點

Thunderbird 及其繼任者(Palomino、Thoroughbred、Barton 和 Thorton)在千禧年的前五年與Intel 的 Pentium 4 競爭,通常價格較低,但性能始終較好。Athlon 於 2003 年 9 月升級為 K8(代號 ClawHammer),更廣為人知的名稱是Athlon 64,因為它向 x86 指令集添加了 64 位擴展。

這一事件通常被認為是 AMD 的決定性時刻。英特爾 Netburst 架構的不惜一切代價提升 MHz的方法在風起雲涌的同時,也被暴露為發展死胡同的典型例子。

對於這樣一家相對較小的公司來說,收入和營業收入都非常出色。雖然沒有達到英特爾的收入水平,但 AMD 卻洋洋得意並渴望獲得更多。但是,當您站在最高山峰的最高峰時,需要盡一切努力才能留在那里——否則,只有前路可走。

失樂園:AMD 暴跌

沒有任何一件事件導致 AMD 從其高出跌落。全球經濟危機、內部管理不善、糟糕的財務預測、自身成功的犧牲品、英特爾的命運和不當行為——這些都以某種方式發揮了作用。

但是,讓我們開始了解 2006 年初的情況。CPU 市場對 AMD 和 Intel 的產品感到滿意,但前者擁有基於 K8 的出色 Athlon 64 FX 系列。FX-60 是雙核 2.6 GHz,而 FX-57 是單核,但運行頻率為 2.8 GHz。

正如當時的評論所示,兩者都領先於其他任何東西。它們非常昂貴,FX-60 的零售價超過 1,000 美元,但英特爾的頂級產品 3.46 GHz Pentium Extreme Edition 955也是如此。

AMD 似乎在工作站/伺服器市場也占據上風,Opteron 晶片的性能優於英特爾的 Xeon 處理器。

英特爾的問題在於他們的 Netburst 架構——超深流水線結構需要非常高的時鍾速度才能具有競爭力,這反過來又增加了功耗和熱量輸出。

設計已經達到了極限,不再符合要求,因此英特爾放棄了它的開發,轉而使用他們較舊的 Pentium Pro/Pentium M CPU 架構來構建 Pentium 4 的後繼產品。

萬字回顧AMD激盪五十年

2006 年 8 月,該計劃首先推出了用於移動平台的 Yonah 設計,然後是用於台式機的雙核 Conroe架構。英特爾為了挽回面子,將 Pentium 名稱降級為低端預算型號,並用Core取而代之- – 13年的品牌霸主地位瞬間一掃而光。

轉向低功耗、高吞吐量晶片設計最終非常適合眾多不斷發展的市場,幾乎在一夜之間,英特爾在主流和發燒友領域奪得了性能桂冠。到 2006 年底,AMD 已被穩穩地趕出 CPU 頂峰,但災難性的管理決策將他們推下了斜坡。

英特爾的Core和 AMD 收購 ATI

在英特爾推出 Core 2 Duo 前三天,AMD 公開了一項舉措,並得到了當時的 CEO Hector Ruiz(桑德斯已於 4 年前退休)的完全認可。

2006 年 7 月 24 日,AMD 宣布有意收購顯卡製造商ATI Technologies,交易價值 54 億美元(包括 43 億美元的現金和貸款,以及從 5800 萬股中籌集的 11 億美元)。

這筆交易是一場巨大的金融賭博,占 AMD 當時市值的 50%,雖然收購有意義,但價格絕對不合理。

ATI 被嚴重高估了,因為它沒有(Nvidia 也沒有)獲得接近這種收入的任何東西。ATI 也沒有生產工廠——它的價值幾乎完全基於智慧財產權。由於高估了 ATI 的商譽估值,AMD 在吸收了 26.5 億美元的減記時最終承認了這個錯誤。

更糟糕的是,ATI 的移動圖形部門Imageon以 6500 萬美元的微不足道的價格被賣給了高通公司,這加劇了管理遠見的缺乏。該部門後來被命名為 Adreno,是“Radeon”的變位詞,是 Snapdragon 移動 SoC的重要組成部分。

Xilleon是一款用於數位電視和有線電視機頂盒的 32 位 SoC,以 1.928 億美元的價格賣給了 Broadcom。

萬字回顧AMD激盪五十年

硬體錯誤:TLB

除了燒錢之外,AMD 對英特爾更新的架構的最終反應顯然平淡無奇。Core 2 發布兩周後,AMD 總裁兼營運長 Dirk Meyer 宣布 AMD 新的K10 Barcelona處理器的最終定型。

這將是他們在伺服器市場的決定性舉措,因為它是一個成熟的四核 CPU,而當時英特爾只生產雙核 Xeon 晶片。

新的 Opteron 晶片於 2007 年 9 月出現,大張旗鼓,但並沒有搶走英特爾的風頭,而是因為發現了一個錯誤而正式停止,該錯誤在極少數情況下可能會在涉及嵌套緩存寫入時導致鎖定。

不管罕見與否,TLB 錯誤阻止了 AMD 的 K10 生產;與此同時,解決即將推出的處理器問題的 BIOS 修正檔會以大約 10% 的性能損失為代價。到修改後的“B3 步進”CPU 在 6 個月後發貨時,銷售和聲譽方面的損害已經造成。

一年後,也就是 2007 年底,AMD 將四核 K10 設計帶到了台式機市場。那時,英特爾正在奮力前行,發布了現在著名的Core 2 Quad Q6600。

從理論上講,K10 是卓越的設計——所有四個內核都在同一個晶片中,這與 Q6600 在同一封裝上使用兩個獨立的晶片不同。然而,AMD 難以達到預期的時鍾速度,而新 CPU 的最佳版本僅為 2.3 GHz。它比 Q6600 慢了 100 MHz,但也有點貴。

萬字回顧AMD激盪五十年

但最令人費解的方面是 AMD 決定推出一個新型號名稱:Phenom。英特爾轉向酷睿,是因為奔騰已經成為價格過高、性能過高、性能相對較差的代名詞。

另一方面,Athlon 是計算愛好者非常熟悉的名字,它的速度與其聲譽相匹配。Phenom 的第一個版本實際上並不壞——它只是不如 Core 2 Quad Q6600 好,Core 2 Quad Q6600 是一款已經很容易買到的產品,而且英特爾在市場上也有更快的產品。

奇怪的是,AMD 似乎有意識地避免做廣告。他們在軟體方面的業務也為零;一種非常奇怪的經營企業的方式,更不用說在半導體行業中的戰鬥了。

但是,如果不考慮英特爾的反競爭行為,那麼對 AMD 歷史上這個時代的回顧將是不完整的。在這個節骨眼上,AMD 不僅要與英特爾的晶片作鬥爭,還要與該公司的壟斷活動作鬥爭,其中包括向 OEM 支付大筆資金——總計數十億美元——以確保他們把AMD CPU 用於新電腦中。

2007 年第一季度,英特爾向戴爾支付了 7.23 億美元,以保持其處理器和晶片組的唯一供應商地位——占公司總營業收入 9.49 億美元的 76%。

AMD 後來在此事中贏得了 12.5 億美元的和解金,從表面上看,這個數字低得驚人,但在英特爾惡作劇時,AMD 本身實際上無法為其現有客戶提供足夠的 CPU,這可能加劇了這一事實。

並不是說英特爾需要做任何這些。與 AMD 不同,他們有嚴格的長期目標設定,以及更大的產品和 IP 多樣性。他們還擁有無與倫比的現金儲備:到新千年的第一個十年末,英特爾的收入超過 400 億美元,營業收入超過 150 億美元。

這為市場營銷、研究和軟體開發以及專門為其產品和時間表量身定製的晶圓廠提供了巨額預算。僅這些因素就確保了 AMD 為爭奪市場份額而苦苦掙扎。

為 ATI 多付數十億美元和隨之而來的貸款利息,令人失望的 K8 繼任者,以及有問題的晶片上市晚,這些都是難以下咽的苦果。但事情即將變得更糟。

向前一步,向旁邊一步,向後任意步

到 2010 年,全球經濟正在努力從2008 年的金融危機中復蘇。幾年前,AMD 退出了其快閃記憶體部分,連同其所有晶片製造代工廠——它們最終成為了GlobalFoundries,AMD 仍將其用於某些產品。

大約 10% 的員工被裁掉,所有的節省和現金注入意味著 AMD 可以下定決心並完全專注於處理器設計。

AMD 沒有改進 K10 的設計,而是重新開始採用新的結構,並在 2011 年底推出了Bulldozer架構。K8 和 K10 是真正的多核、同步多線程 (SMT) 處理器,新布局被歸類為“集群多線程”。

萬字回顧AMD激盪五十年

推土機四模塊設計

AMD 在 Bulldozer 中採用了共享的模塊化方法——每個集群(或模塊)包含兩個整數處理核心,但它們並非完全獨立。它們共享 L1 指令和 L2 數據緩存、提取/解碼和浮點單元。AMD 甚至放棄了 Phenom 名稱,並通過簡單地將第一個 Bulldozer CPU 命名為AMD FX來重溫 Athlon FX 的輝煌歲月。

所有這些變化背後的想法是減小晶片的整體尺寸並提高它們的能效。更小的晶片將提高製造良率,從而帶來更好的利潤率,而效率的提高將有助於提高時鍾速度。可擴展的設計也將使其適用於更廣泛的市場。

2011 年 10 月推出的最佳型號FX-8510 配備4 個集群,但作為 8 核、8 線程 CPU 進行銷售。

在這個時代,處理器具有多種時鍾速度,FX-8150 的基本頻率為 3.6 GHz,Turbo時鍾為 4.2 GHz。不過,這顆晶片的尺寸為315平方毫米,峰值功耗超過125W。

英特爾已經發布了酷睿i7-2600K:這是一款傳統的4核8線程CPU,運行頻率高達3.8GHz。它比新的 AMD 晶片小得多,為 216 平方毫米,功耗降低了 30 瓦。

從理論上講,新的 FX 應該占據主導地位,但它的性能有些平庸——有時,處理大量線程的能力會大放異彩,但單線程性能通常並不比它要取代的 Phenom 系列好,盡管時鍾速度優越。

在為 Bulldozer 的研發投入了數百萬美元後,AMD 肯定不會放棄設計,收購 ATI 現在開始見效。

在過去的十年中,AMD 首次嘗試將 CPU 和 GPU 組合在一起,稱為 Fusion,但上市時間較晚且表現不佳,令人失望。

但該項目為 AMD 提供了應對其他市場的手段。2011 年初,發布了另一種新架構,稱為Bobcat。

萬字回顧AMD激盪五十年

AMD 在 PlayStation 4 中的定製 CPU+GPU 晶片

針對低功耗應用,如嵌入式系統、平板電腦和筆記本電腦;它的設計也與 Bulldozer 截然相反:只有幾條pipeline,除此之外別無其他。

幾年後,Bobcat 收到了急需的更新,進入Jaguar架構,並於 2013 年被微軟和索尼選中為 Xbox One 和 PlayStation 4 提供動力。

為遊戲機“賦能”

盡管由於遊戲機通常以盡可能低的價格製造,利潤率相對微薄,但這兩個平台的銷量都達到了數百萬,這凸顯了 AMD 創建定製 SoC 的能力。

多年來,AMD 不斷修改 Bulldozer 的設計——Piledriver 最先出現並給了我們FX-9550(220 W,5 GHz 的怪獸),但 Steamroller 和最終版本 Excavator(2011 年推出,產品使用了 4 年,更專注於降低功耗,而不是提供任何特別新的東西。

到那時,至少可以說,CPU 的命名結構已經變得混亂。Phenom 早已被載入史冊,而 FX 的名聲也有些糟糕。AMD 放棄了這個命名法,只是將他們的 Excavator 台式機 CPU 標記為A 系列。

該公司的圖形部門負責 Radeon 產品,同樣喜憂參半。AMD 保留 ATI 品牌名稱直到 2010 年,將其換成自己的品牌名稱。

隨著 Graphics Core Next (GCN) 的發布,他們還完全重寫了 ATI 在 2011 年底創建的 GPU 架構。

這種設計持續了將近 8 年,並在主機、台式 PC、工作站和伺服器中找到了出路;它今天仍在用作 AMD 所謂的 APU 處理器中的集成 GPU。

萬字回顧AMD激盪五十年

Graphics Core Next首次亮相——Radeon HD 7970

GCN 處理器逐漸具有巨大的計算性能,但這種結構並不是最容易充分利用它的。AMD 有史以來最強大的版本,Radeon VII 中的 Vega 20 GPU,擁有 13.4 TFLOPs 的處理能力和 1024 GB/ 的帶寬——但在遊戲中,它無法達到與 Nvidia 最好產品的相同的高度.

Radeon 產品通常以發熱、嘈雜和非常耗電而著稱。為HD 7970供電的 GCN 的初始疊代在滿載時需要超過 200 W 的功率——但它是在一個相對較大的工藝節點上製造的,即 TSMC 的 28nm。

當 GCN 以 Vega 10 的形式完全成熟時,這些晶片是由 GlobalFoundries 在其 14nm 節點上製造的,但是 Radeon RX Vega 64 之類的晶片的能源需求並沒有更好,最多消耗近 300 W功率。

盡管 AMD 的產品選擇不錯,但它們並沒有達到應有的水平,而且它們很難賺到足夠的錢。

萬字回顧AMD激盪五十年

到 2016 年底,該公司的資產負債表已連續 4 年虧損(2012 年的財務狀況因 GlobalFoundries 最終注銷 7 億美元而遭受重創)。債務仍然很高,即使出售了其代工廠和其他分支機構,也沒有為 Xbox 和 PlayStation 中系統封裝的成功提供足夠的幫助。

從表面上看,AMD 似乎陷入了大麻煩。

新星a-Ryzen

由於沒有任何東西可以出售,也沒有任何大筆投資來挽救它們的跡象,AMD 只能做一件事:加倍下注和重組。2012 年,他們挑選了兩個人,他們將在這家半導體公司的復興中發揮重要作用。

K8 系列的前任首席架構師 Jim Keller 在闊別 13 年後回歸,並著手領導兩個項目:一個是針對伺服器市場的Arm 系列晶片;另一個是標準的 x86 架構系列。公司還招攬了Mike Clark(Bulldozer 的設計負責人)擔任總架構師。

還有一位是 Lisa Su,她曾在飛思卡爾半導體擔任高級副總裁兼總經理。她在 AMD 擔任過同樣的職位,並與當時的總裁 Rory Read 一起被普遍認為是公司進軍 PC 以外市場,尤其是遊戲機市場的幕後推手。

萬字回顧AMD激盪五十年

Lisa Su(中)和 Jim Keller(最右邊)

在 Keller 恢復在 AMD 研發部門的兩年後,執行長 Rory Read 下台,高級副總裁/總經理Lisa Su升職。

憑借麻省理工學院的電子工程博士學位以及對 SOI(絕緣體上矽)MOSFET 的研究,Lisa Su擁有讓 AMD 重現輝煌的學術背景和行業經驗。但是在大規模處理器的世界里,沒有什麼是一蹴而就的——晶片設計也需要幾年時間才能上市。在此類計劃實現之前,AMD 將不得不渡過難關。

在 AMD 繼續掙扎的同時,英特爾不斷壯大。核心架構和製造工藝節點已經成熟,2016 年底,他們公布的收入接近 600 億美元。

多年來,英特爾一直遵循處理器開發的“tick-tock'”升級慣例:“tick”表示新架構,而“tock”表示製程改進改進,通常以較小節點的形式出現.

然而,盡管利潤豐厚且幾乎完全占據市場主導地位,但並非所有人都在幕後。2012 年,英特爾預計將在 3 年內發布採用尖端 10 納米節點的 CPU。那個特別的滴答聲從來沒有發生過——事實上,時鍾也從來沒有真正滴答過。他們的第一個 14nm CPU,使用Broadwell 架構,出現在 2015 年,在這個節點和基礎設計上,他們又多走了五年。

晶片巨頭的晶圓廠工程師多次遇到 10nm 的良率問題,這迫使英特爾每年都改進舊工藝和架構。時鍾速度和功耗不斷攀升,但沒有新的設計問世;也許是他們 Netburst 時代的回聲。

PC 客戶面臨令人沮喪的選擇:從功能強大的 Core 系列中選擇一些產品,但要付出高昂的代價,或者選擇功能較弱且更便宜的 FX/A 系列。

但 AMD 一直在悄悄打造一套制勝法寶,並在 2016 年 2 月的年度 E3 盛會上大顯身手。使用期待已久的 Doom 重啟作為公告平台,向公眾展示了全新的Zen 架構。

除了“同步多線程”、“高帶寬緩存”和“節能 finFET 設計”等短語外,很少有人提及新設計。Computex 2016 期間提供了更多詳細信息,包括比 Excavator 架構改進 40% 的目標。

說這是雄心勃勃的是輕描淡寫。

說這是雄心勃勃的說法是輕描淡寫——尤其是考慮到 AMD 最多隻能在 Bulldozer 設計的每次修訂中實現 10% 的適度增長。他們又過了 12 個月才讓晶片真正出現,但當它出現時,AMD 醞釀已久的計劃終於明朗了。

萬字回顧AMD激盪五十年

任何新的硬體設計都需要合適的軟體來銷售,但多線程 CPU 面臨著一場艱苦的戰鬥。盡管遊戲機配備了 8 核 CPU,但大多數遊戲只有 4 核仍然非常好。

主要原因是英特爾的市場主導地位以及 AMD 在 Xbox One 和 PlayStation 4 中的晶片設計。前者在2010 年已經發布了他們的第一個 6 核 CPU ,但它非常昂貴(近 1,100 美元)。

其他處理器迅速出現,但又過了七年,英特爾才提供真正實惠的六核處理器,Core i5-8400,價格不到 200 美元。

遊戲機處理器的問題在於 CPU 布局由同一晶片中的兩個 4 核 CPU 組成,並且晶片的兩個部分之間存在高延遲。因此,遊戲開發人員傾向於將引擎的線程保持在其中一個部分,而僅將另一個用於一般後台進程。只有在工作站和伺服器領域才需要真正的多線程 CPU——直到 AMD 另有決定。

2017 年 3 月,普通桌面用戶可以使用兩個 8 核 16 線程 CPU 之一升級他們的系統。一個全新的架構顯然值得一個新名稱,AMD 擺脫了 Phenom 和 FX,為我們提供了Ryzen。

這兩款CPU 都不是特別便宜:3.6 GHz(4 GHz 提升)Ryzen 7 1800X零售價為 500 美元,慢0.2 GHz 的1700X售價低 100 美元。在某種程度上,AMD 熱衷於阻止人們認為它是預算選擇,但這主要是因為英特爾為其 8 核產品Core i7-6900K收取超過 1,000 美元的費用。

Zen 從所有以前的設計中汲取了最好的東西,並將它們融合到一個專注於保持pipeline盡可能繁忙的結構中;為此,需要對pipeline和緩存系統進行重大改進。

新設計放棄了 Bulldozer 中使用的 L1/L2 緩存共享,每個內核現在完全獨立,具有更多pipeline、更好的分支預測和更大的緩存帶寬。

這讓人想起為微軟和索尼遊戲機提供動力的晶片,Ryzen CPU 也是一個片上系統;它唯一缺少的是 GPU(後來的低成本 Ryzen 型號包括 GCN 處理器)。

晶片被分成兩個所謂的 CPU 復合體 (CCX),每個都是 4 核 8 線程。晶片中還裝有一個南橋處理器——該 CPU 為 PCI Express、SATA 和 USB 提供控制器和連結。

這意味著從理論上講,主板可以在沒有 SB 的情況下製造,但幾乎所有主板都有,只是為了擴大可能的設備連接數量。

如果 Ryzen 無法發揮作用,所有這一切都將毫無意義,而 AMD 在多年充當英特爾的副手之後,在這一領域還有很多需要證明的地方。1800X 和 1700X並不完美:與英特爾為專業應用程式提供的任何產品一樣好,但在遊戲中速度較慢。

但 AMD 還有其他牌可打:第一批 Ryzen CPU 上市一個月後,6 核和 4 核Ryzen 5 型號問世,兩個月後又推出了 4 核Ryzen 3晶片。他們以與他們的哥哥相同的方式與英特爾的產品進行比較,但它們的成本效益要高得多。

然後是王牌——16 核、32 線程的Ryzen Threadripper 1950X(要價 1,000 美元)和用於伺服器的 32 核、64 線程 EPYC 處理器。這些龐然大物在同一封裝中分別包含兩個和四個 Ryzen 7 1800X 晶片,利用新的 Infinity Fabric 互連系統在晶片之間轉移數據。

萬字回顧AMD激盪五十年

在六個月的時間里,AMD 表明他們有效地瞄準了所有可能的 x86 台式機市場,並採用了一種通用的設計。

一年後,該架構更新為 Zen+,其中包括緩存系統的調整以及從 GlobalFoundries 久負盛名的 14LPP 工藝(三星旗下的一個節點)切換到更新的、更密集的 12LP 系統。

CPU 晶片尺寸保持不變,但新的製造方法允許處理器以更高的時鍾速度運行。

Ryzen 進化和小晶片

又過了12個月,2019年夏天,AMD推出了Zen 2。這一次變化更為顯著,chiplet一詞風靡一時。工程師們沒有遵循單片結構,即 CPU 的每個部分都在同一塊矽片中(Zen 和 Zen+ 就是這樣做的),而是將核心復合體與輸入/輸出 (I/O) 系統分開。

前者由台積電製造,使用他們的 N7 工藝,成為完全裸片——因此得名Core Complex Die (CCD)。I/O 處理器由 GlobalFoundries 製造,台式機 Ryzen 型號使用 12LP 晶片,而 Threadripper 和 EPYC 則採用更大的 14 nm 版本。

萬字回顧AMD激盪五十年

Zen 2 Ryzen 和 EPYC 的紅外圖像。CCD 晶片與 I/O 晶片明顯分開。

在2020 年底發布的下一個版本 Zen 3上,AMD保留並改進了小晶片設計。改進的一個主要目標是每個 CCD 中的 CCX 結構。在 Zen 2 中,後者包含兩個 CCX,每個都有 4 個內核和 16MB 的 L3 緩存。

由於 L3 緩存可供 CPU 內的所有內核訪問,來自另一個 CCX 或 CCD 的內核將不得不通過 I/O 晶片請求數據讀寫。盡管將所有東西連接在一起的 Infinity Fabric 系統速度快且延遲低,但晶片到晶片的緩存延遲並不是很好。

對於 Zen 3,設計師保留了相同的 8 核整體 CCD 結構,但將它們全部組合成一個 CCX。現在,I/O 晶片必須管理的唯一 L3 緩存事務是在單獨的 CCD 之間,從而大大改善了每個 CCD 內的數據流。

萬字回顧AMD激盪五十年

Zen 2 和 Zen 3 之間的變化看起來很簡單,但意義重大。

隨著 IPC 的顯著改進以及緩存系統、處理器內核和後端的多項更改,Zen 架構日趨成熟。事實證明,AMD 的 Ryzen 5000 和 6000 系列處理器均採用 Zen 3 小晶片或單片設計,非常受歡迎。

其中一些可以歸因於產品的整體物有所值和每瓦性能,例如Ryzen 5 5600X之類的產品,但主要原因是 AM4 平台。首次與原始 Zen 晶片一起推出,三年後仍支持新型號。

並不是說一切都一帆風順。AMD在推出高端 5000 系列 CPU 時犯了一個明顯的失禮,最初聲明只有配備新 500 系列晶片組的主板才能支持它們;使用舊系統(例如 B350 或 X470)的用戶可能會倒霉。

在媒體和發燒友社區的強烈反對之後,該決定最終被推翻,但它及時提醒人們,AMD 並不具備強制進行此類更改的市場主導地位。

但值得評估一下 AMD 在 Zen 方面取得的成就。在 10 年的時間里,該架構從一張白紙變成了一個全面的產品組合,包括 100 美元的 6 核 12 線程預算產品到 12,000 美元以上的 96 核 192 線程伺服器 CPU。

在此期間,AMD 的財務狀況也發生了翻天覆地的變化:從虧損和債務高達數十億美元,到清算貸款,2021 年營業收入超過 36 億美元,並完成了對 FPGA 製造商 Xilinx 的350 億美元收購。

雖然 Zen 可能不是公司財務復興的唯一因素,但它提供了巨大的幫助。

萬字回顧AMD激盪五十年

AMD 的圖形部門也經歷了類似的命運變化——2015 年它獲得了完全獨立,成為Radeon Technologies Group (RTG)。他們的工程師最重要的發展是 RDNA 的形式,這是對 GCN 的重大改造。緩存結構的變化,以及計算單元大小和分組的調整,將架構的重點直接轉移到了遊戲上。

使用這種新架構的第一批型號Radeon RX 5700 系列出現在 2019 年年中,展示了該設計的巨大潛力。微軟和索尼並沒有錯過,因為他們都選擇了 Zen 2 和即將更新的 RDNA 2 來為其Xbox Series X/和PlayStation 5遊戲機提供動力。

在 RX 5000 系列推出僅 14 個月後,在經濟和製造挑戰期間,AMD 發布了另一款 Radeon 系列產品,新 GPU 中採用了 Zen 架構的技術。

RDNA 2 基於伺服器 CPU 中使用的相同設計以及其 Infinity Fabric 互連系統的修改版本,擁有大量的 3 級緩存,總共高達 128MB。

RTG 還引入了一種獨特的硬體加速設計,用於光線追蹤的某些元素,雖然與 Nvidia 相比,Radeon RX 6000 顯卡在此類渲染方面的表現不佳,但整體表現非常出色。

盡管 Radeon Group 沒有像 CPU 部門那樣在財務上取得成功,而且他們的顯卡有時可能仍被視為“價值選擇”,但 AMD 可以量化地回到了 Athlon 64 天的水平架構開發和技術創新方面。他們登頂,失寵,又像神話中的野獸,浴火重生。

前方的路

在 Bulldozer 架構時代,AMD 玩的是一種非常保守的遊戲,盡管設計有些激進。這不是現在可以對公司說的批評。它的 CPU 短期路線圖清楚地證明了這一點……

萬字回顧AMD激盪五十年

在 Ryzen 7 5800X3D 中引入垂直堆疊緩存管芯(又名 3D V-Cache)對遊戲非常有利,並且會一次又一次地出現。AMD 在小晶片和高速互連系統方面的進步通過 RDNA 3 進入顯卡,並可能在不久的將來成為大型 GPU 製造的標準方法。

伺服器和工作站可以配備比以往任何時候都多的內核和緩存(EPYC 9654 高達 96 和 384MB)的單處理器,甚至可以找到配備 6 核處理器的廉價台式機。

AMD 在 CPU 技術和並行處理性能方面取得的所有進步無疑迫使英特爾加速其自己的異構計算設計,而現在消費者在選擇新處理器時有些無所適從。

就所有意圖和目的而言,AMD 似乎與其任何競爭對手一樣強大。然而,問一個簡單的問題是完全合理的:它會回到產品慘淡、沒有錢的黑暗時代嗎?

簡單看一下最近的財務報表就可以看出這是有可能的,但機率並不高。

萬字回顧AMD激盪五十年

2021 年是AMD 有史以來收入和淨收入最好的一年,利潤率為 19%。2022 年的收入已經超過了這一點,最後一個季度仍未結束,盡管淨收入會更低。

2022 年,他們推出了兩種用於 CPU 和 GPU 的新架構——Zen 4 帶來了一系列變化(僅 DDR5 記憶體、新的 AM5 平台、集成 GPU)和採用全新設計晶片的全新 7000 系列台式機 CPU 表明:AMD 的工程師沒有表現出達到任何架構限制的跡象。

但發布的時機再糟糕不過了,且這是完全不可避免的。半導體製造供應鏈仍在努力滿足需求,隨著全球價格各地都在上漲,DDR5 和 AM5 主板的高價格意味著最初的銷售不如Zen 3強勁。

萬字回顧AMD激盪五十年

盡管 2021 年取得了成功,但 164 億美元的收入仍然使他們落後於英偉達(大致同期為 269 億美元),與英特爾(790 億美元)相差很遠。

後者當然擁有更大的產品組合,還有自己的代工廠,但 Nvidia 的收入幾乎完全依賴於圖形處理器。

同樣值得注意的是,另一家無晶圓廠處理器公司高通的收入為 336 億美元,而 IBM 的收入為 574 億美元,盡管後者確實在多個不同的領域開展業務。

幾年的健康淨收入不足以完全穩定 AMD 的未來,而且很明顯,為了增長,收入需要從英特爾和 Nvidia 獲得,並擴展到新市場。

AMD 的大部分收入來自他們所謂的計算和圖形部分,即 Ryzen 和 Radeon 的銷售。毫無疑問,這將繼續改善,因為 Ryzen 具有充分的競爭力,RDNA 2 和 3 架構將為遊戲提供一個通用平台,在 PC 上和在遊戲機上運行一樣好,因為 AMD 為當前和前幾代硬體提供動力。

萬字回顧AMD激盪五十年

收購 Xilinx 將為他們提供新市場,因為與英特爾相比,這家著名的 FPGA 公司在該領域占有更大的份額,並提供可以集成到新產品當前設計中的新 IP。前幾年,AMD 的企業、嵌入式半定製 (EESC) 細分市場相當薄弱,但已大幅改善——從 2020 年第一季度收入的不到 20% 增加到去年的 43%。

但他們的道路上仍然存在重大挑戰。

雖然英特爾在絕對性能方面不再主導台式機市場,但它們仍然占據所有領域的最大市場份額,尤其是在企業行業。沒有人會運行一個價值數百萬美元的數據中心,只是因為有一個驚人的新 CPU 可用,無論它有多好。英特爾現在也在圖形卡行業競爭,盡管取得了微弱的成功。

但該領域繼續被 Nvidia 牢牢掌控,其強大的 AD102嚴重提高了 GPU 性能標準。盡管它大幅提高了新 GPU 的價格,並相應地導致銷量下滑,但總會有消費者總是以負面的眼光看待更便宜的產品,無論它們實際上有多好。

萬字回顧AMD激盪五十年

AMD 為 PS5 開發的 APU(CPU+GPU)

PlayStation 5 和 Xbox Series X/ 都非常受歡迎,估計總出貨量超過4000 萬台——每台都搭載 AMD 統一處理器。這些晶片的銷售對EESC收入的增長起到了不小的作用。

然而,雖然 AMD 可以在他們的 EPYC 伺服器處理器上賺取可觀的利潤,但微軟和索尼虧本銷售遊戲機,通過遊戲的許可費來收回這筆錢。因此,這些機器中晶片的利潤將小得多。

也可以說 AMD 在其感知形象方面仍然存在問題。“Intel Inside”標語和順口溜30 多年來無處不在,雖然 AMD 顯然花錢推廣 Ryzen 和 Radeon 品牌,但他們最終需要戴爾、惠普和聯想等系統製造商銷售更多採用相同光線和規格的處理器,因為他們做英特爾的。

萬字回顧AMD激盪五十年

Covid 大流行期間加密貨幣的繁榮和對計算設備的需求為 Nvidia 的股價和市值(目前達到驚人的 4280 億美元)創造了奇跡,而 AMD 股東則獲得了更多未公開的收益。

總而言之,AMD 目前處於 51 年來最強大的地位。其市值目前僅比英特爾低 5%,雖然 PC 銷量下滑影響了幾乎所有半導體股價,但 AMD 比英特爾更好地經受住了這場風暴。

雄心勃勃的 Zen 項目沒有任何跡象表明很快就會達到任何極限,無論以何種標準衡量,該公司鳳凰般的重生都取得了巨大的成功。他們還沒有到達山頂,但也許這是為了更好——正如我們所見,迅速崛起永遠不會持續下去。

都說歷史總是在重演,但願這不會發生。一個健康且有競爭力的AMD,完全有能力與英特爾和英偉達正面交鋒,只會給大家帶來好處。

來源:快科技