NVIDIA也研究RISC-V,並採用它設計了一款深度神經網絡加速器

最近RISC-V指令集架構非常受關注,這種新的開源指令集可以讓處理器開發人員方便地開發出各種類型的晶片。NVIDIA很早之前就加入了RISI-V基金會,並做了很多研究。近日NVIDIA的研究人員在2019年VLSI電路研討會上發布了一篇採用RISC-V指令集開發了一款多晶片模塊式的可擴展深度神經網絡加速器的論文,並在官網公布了摘要。

NVIDIA也研究RISC-V,並採用它設計了一款深度神經網絡加速器
圖片來自NVIDIA

NVIDIA稱深度神經網絡需要高性能、運算準確以及一定的功耗要求,構建一款深度神經網絡加速器通常比較難而且製造成本高。所以他們通過使用低功耗、高帶寬的晶片互聯技術將單個具有各種計算能力的推理加速器晶片連接起來。NVIDIA在一個晶片中集成了16個通過晶片內部網絡連接的用於深度學習運算的處理元件(Processing
Elements,PE)以及一個採用RISC-V指令集的控制器,而單個晶片最高可以提供4.01TOPS(每秒萬億操作),而NVIDIA的研究人員通過晶片間網絡連接最高36個晶片,最高提供128TOPS的算力。

NVIDIA也研究RISC-V,並採用它設計了一款深度神經網絡加速器
圖片來自NVIDIA

除了NVIDIA公布的晶片算力外,其研究人員在論文中還提供了晶片的面積等信息。在採用台積電16nm工藝的情況下,單晶片累積核心面積為3.1平方毫米,而累積Die面積為6平方毫米,核心功耗在0.03W到4W。而36晶片(6×6規格)累積核心面積為111.6平方毫米,Die累積面積為216平方毫米,核心功耗在5W到100W之間(跨度有些大)。

NVIDIA也研究RISC-V,並採用它設計了一款深度神經網絡加速器
圖片來自NVIDIA

不過即便其多晶片互聯功耗比較高,但根據NVIDIA論文中的表述,其36晶片互聯最高效率達到了1.15TOPS每平方毫米,表現非常出色。但遺憾的是,NVIDIA應該沒有打算推出這款晶片,僅僅是作為展示其高效能晶片設計,將來NVIDIA可能其中的設計思路融入其產品中。

來源:超能網