Raja Koduri采訪 GPU計算夙願在英特爾實現 oneAPI一統異構運算

除了i740曇花一現的獨顯之外,英特爾似乎並不是GPU市場的主角,但在GPU計算歷史上,英特爾一直不曾缺席,現在英特爾終於站到舞台中央了。

在前幾天的SC 19大會上,英特爾高級副總裁、首席架構師以及架構、圖形與軟件部門總經理Raja Koduri正式宣布了面向HPC高性能計算的英特爾的Xe架構GPU——Ponte Vecchio,這是英特爾首款7nm芯片,也會用上Foveros 3D、EMIB(嵌入式多芯片互連橋接)等先進封裝技術,是英特爾HPC產品的集大成者。

在這個產品背後,英特爾及Raja Koduri到底有着怎樣的野心?美國ZDNET網站日前刊發了對Raja Koduri的一篇介紹,談到了英特爾在GPU計算上的宏偉願景。

以下是ZDNET全文內容:

我們正處於高性能計算的轉折點——Raja Koduri

Raja Koduri采訪 GPU計算夙願在英特爾實現 oneAPI一統異構運算

十四年前,Raja Koduri幫助開啟了GPU計算時代,這比NVIDIA創始人黃仁勛談論(GPU計算)甚至還要早一年,這個想法就是——GPU不僅可以用於完成流暢的視頻遊戲渲染,還可以處理科學問題

如今這個願景已經成為現實,因為GPU成為了AI人工智能及越來越多的高性能計算的主力軍。

Raja Koduri當時在AMD公司工作,如今他成為了英特爾的首席架構師,他坐下來跟ZDNET一起討論了GPU計算是如何不斷革命的。

Raja Koduri說,「我們正處於高性能計算的轉折點上。「 二十年前,HPC高性能計算被垂直集成的架構所主導,但是之後,商業化的X86處理器在開源軟件及各種庫文件擴展接管了HPC計算,現在不只是HPC,所有集群都變成了X86及大量軟件主導。

Raja Koduri表示這種軟件運動正在主導新的計算時代,它可以被重新編程,像超級計算機一樣強大。

「在AI及異構驅動非線性增長的情況下,我們將看到下一次周期。」

在Raja Koduri作出如上表態的同時,英特爾在周日宣布了新的GPU,它專門為HPC高性能計算而設計,代號為Ponte Vecchio。盡管還有一年多才能量產,但它可以說是一個時代的標志,是專為深度學習優化的機器。

或許比全新架構更重要的是,英特爾周日還宣布提供用於測試高性能計算的軟件工具包oneAPI的beta版,該API簡化了跨處理器及系統的類似超算那樣的編程。

Raja Koduri采訪 GPU計算夙願在英特爾實現 oneAPI一統異構運算

這兩個公告都是在美國科羅拉多州博爾德舉行的第31屆高性能計算、網絡、存儲及分析國際大會上宣布的。

有人指出oneAPI某種意義上是Raja Koduri多年來完成的工作的一種延續,Raja Koduri對此表示贊同,他說AMD擁有首個用於通用計算的GPU硬件——它被稱為GPGPU,這比NVIDIA還早了兩年,但「我們那時候不是從軟件開始的「,這讓NVIDIA的CUDA編程工具包有了席捲整個行業的機會。

相比之下,在英特爾公司,「我說我們這次使用完全不同的方式,首先從軟件開始。」

Raja Koduri指出,「在過去的18個月中,我們已經有1000多名工程師付出了巨大的努力。「

當然,對英特爾來說,(oneAPI的)挑戰在於它不像NVIDIA那樣只出售一種GPU芯片,英特爾有着各種不一樣的處理器,包括至強、Ponte Vecchio及未來的GPU、Mobileye自駕芯片、Movidius視覺計算芯片、Agilex FPGA芯片及Nervana神經網絡芯片。

Raja Koduri之前在AMD工作時,他講過一個比喻,廠商提供的芯片好比餐廳,英特爾提供的實際上是自助餐,種類繁多,但所有人需要的就是漢堡、奶昔這樣的簡單產品,後者正是NVIDAI提供的。

Raja Koduri表示要為英特爾的客戶提供便利依然面臨着同樣的挑戰,Raja Koduri稱「我們的客戶不想跟(復雜的)異構運算打交道」,「這就是為什麼oneAPI可以在運行在抽象層的原因「,CPU是英特爾歷史上唯一一種大規模通用平台架構,oneAPI旨在成為橋梁,以同樣的方式實現大規模的異構運算。

當被問到英特爾是否對客戶可以充分利用oneAPI及所有芯片充滿信心時,Raja Koduri表示「這是一個好問題。」

「我們提供分析事物的工具,甚至在客戶移植代碼之前就能告訴他們這些代碼是否會在GPU上高效運行,這些工具可以使得人們更容易部署硬件,是否對他們的數據中心有益也能很快想到結果。「

Raja Koduri稱Ponte Vecchio GPU芯片將採用英特爾的7nm工藝生產,距離量產還有一年多的時間。

Ponte Vecchio將成為美國Aurora極光超算的一部分,這是一套價值50億美元的超算,預計會安裝在美國伊利諾伊州的阿貢國家實驗室,由美國超算廠商Cray及其他供應商一起建造。

Raja Koduri拒絕透露有關此GPU與其他廠商的GPU架構的不同細節,他強調說「該架構有多種運行模式,與當前其他架構的GPU相比更具靈活性,可以映射更多的工作負載,同時在這個新架構上英特爾還有全新的矢量處理方法。」

Raja Koduri稱目前還沒有公布一些細節,簡單來說就是英特爾在這個GPU芯片的晶體管上針對HPC做了優化。當被問到是否在Ponte Vecchio GPU上取消了傳統GPU的一些單元,比如着色器、記憶體一致,Raja Koduri表示英特爾的選擇是優化支持現有軟件,以便維護現已安裝的GPU編程的價值,但是英特爾也作出了選擇,刪除那些HPC運算不需要的東西。

  • 文章糾錯

作者:憲瑞
來源:快科技