芯片圈變天了!英偉達推出首個CPU,狂捧Arm生态

2021-04-13

芯東西(ID:aichip001)

作者 | 心緣

編輯 | 漠影

芯東西4月13日報道(dào),今日淩晨,一年一度影響人工智能(néng)及高性能(néng)計算技術盛會NVIDIA GTC如期而至,這(zhè)是GTC大會繼去年後(hòu)第二次在線上舉行。

NVIDIA(英偉達)創始人黃仁勳依然穿着拉風的皮衣,在自家廚房舉辦發(fā)布會。可以明顯看到,老黃的頭發(fā)更白了,也更長(cháng)了。


去年NVIDIA重磅發(fā)布旗艦A100 GPU以及一系列服務器、集群、超算,轟動整個人工智能(néng)領域,如今,老黃帶着一系列軟硬件新品高調回歸。

萬萬沒(méi)想到,這(zhè)一次,全球GPU霸主NVIDIA推出了一款基于Arm的數據中心CPU!

在宣布400億美元收購Arm的6個月後(hòu),NVIDIA連發(fā)三款基于Arm IP打造的處理器,包括全球首款專爲TB級加速計算而設計的CPU NVIDIA Grace、全新BlueField-3 DPU,以及業界首款1000TOPS算力的自動駕駛汽車SoC。

“我們每年都(dōu)會發(fā)布激動人心的新品。三類芯片,逐年飛躍,一個架構。”黃仁勳說,數據中心路線圖包括CPU、GPU和DPU這(zhè)三類芯片,而Grace和BlueField是其中必不可少的關鍵組成(chéng)部分。每個芯片架構曆經(jīng)兩(liǎng)年的打磨周期(周期内可能(néng)出現轉變),一年專注于x86平台,另一年專注于 Arm 平台。


此外,NVIDIA還(hái)公布了與亞馬遜AWS、Ampere Computing、聯發(fā)科和Marvell等基于Arm的CPU平台的合作夥伴關系。

在軟件方面(miàn),超大規模語言模型訓練與推理問答引擎Megatron、實時對(duì)話式AI平台Jarvis、AI網絡安全框架Morpheus、Omniverse企業版、由GPU加速的量子電路模拟框架CuQuantum等一系列最新進(jìn)展首次揭曉。

顯然,面(miàn)向(xiàng)數據中心異構計算的新天地,NVIDIA正集合軟硬件技術優勢,打出高調的組合拳。

一、3款自研Arm芯:首顆數據中心CPU落地全球最快AI超算

此次發(fā)布會令人最印象深刻的,就是NVIDIA在助推Arm生态方面(miàn)不遺餘力,從自研CPU、DPU、自動駕駛處理器到GPU的合作夥伴,從雲、高性能(néng)計算、邊緣計算到PC,無處不Arm。

先來看下這(zhè)次發(fā)布的五款硬件新品:

1、首顆數據中心CPU:落地全球最快AI超算

黃仁勳宣布的第一個重磅新品,是一款專爲大規模人工智能(néng)和高性能(néng)計算應用而設計的CPU——NVIDIA Grace。

絕大多數的數據中心仍將(jiāng)繼續使用現有的CPU,而Grace主要將(jiāng)用于計算領域的細分市場,預計將(jiāng)于2023年可供貨。

由于超大規模的模型很難完全放進(jìn)GPU内存,如果存儲在系統内存,訪問速度則會大大受限,這(zhè)款CPU的問世主要即是爲了解決這(zhè)一瓶頸。


NVIDIA Grace以發(fā)明了世界上第一個編譯器、被稱爲“計算機軟件工程第一夫人”的先驅計算機科學(xué)家Grace Hopper命名,具體有3點創新進(jìn)步:

(1)内置下一代Arm Neoverse内核,每個CPU能(néng)在SPECrate2017_int_base基準測試中單位時間運行超過(guò)300個實例;

(2)采用第四代NVIDIA NVLink,從CPU到GPU連接速度超過(guò)900GB/s,達到相當于目前服務器14倍的帶寬;從CPU到CPU的速度超過(guò)600GB/s。

(3)擁有最高的内存帶寬,采用的新内存LPDDR5x技術,帶寬是LPDDR4的兩(liǎng)倍,能(néng)源效率提高了10倍,能(néng)提供更多計算能(néng)力。

明年將(jiāng)有兩(liǎng)台性能(néng)強大的AI超級計算機面(miàn)世,都(dōu)將(jiāng)采用NVIDIA Grace,據稱其與NVIDIA GPU緊密結合,性能(néng)將(jiāng)比目前最先進(jìn)的NVIDIA DGX系統(在x86 CPU上運行)高出10倍。

這(zhè)兩(liǎng)台AI超算中,瑞士國(guó)家計算中心(CSCS)正在打造一個算力可達20Exaflops的系統,美國(guó)洛斯阿拉莫斯國(guó)家實驗室(Los Alamos National Laboratory)也將(jiāng)爲其研究人員配備新AI超算。

2、Bluefield-3 DPU:220億晶體管

在黃仁勳看來,負責在數據中心傳輸和處理數據的數據處理單元(DPU),正與CPU、GPU共同組成(chéng)“未來計算的三大支柱”。

NVIDIA全新BlueField-3 DPU包含220億個晶體管,采用16個Arm A78 CPU核心、18M IOPs彈性塊存儲,加密速度是上一代的4倍,并完全向(xiàng)下兼容BlueField-2。

BlueField-2能(néng)夠卸載相當于30個CPU核的工作負載,而BlueField-3實現了10倍的加速計算性能(néng)提升,能(néng)夠替代300個CPU核,以400Gbps的速率,對(duì)網絡流量進(jìn)行保護、卸載和加速。該處理器也是首款支持第五代PCIe總線并提供數據中心時間同步加速的DPU。


BlueField-3通過(guò)NVIDIA DOCA(集數據中心于芯片的架構)軟件開(kāi)發(fā)包爲開(kāi)發(fā)者提供一個完整、開(kāi)放的軟件平台,開(kāi)發(fā)在BlueField DPU上開(kāi)發(fā)軟件定義和硬件加速的網絡、存儲、安全和管理等應用。DOCA已于今日發(fā)布并提供下載。

新一代BlueField-3 DPU預計將(jiāng)于2022年第一季度發(fā)布樣品,第四代BlueFieldDPU將(jiāng)包含640個晶體管,算力達1000TOPS,網絡速率達800Gbps。


3、車輪上的數據中心:業界率先達成(chéng)1000TOPS

NVIDIA DRIVE Atlan是新一代AI自動駕駛汽車處理器,算力將(jiāng)達到1000TOPS,約是上一代Orin處理器的4倍,超過(guò)了絕大多數現有無人駕駛出租車的子女計算能(néng)力。


這(zhè)是DRIVE平台首次集成(chéng)DPU,通過(guò)Arm核爲自動駕駛汽車帶來數據中心級的網絡,緻力于應用到2025年的車型。

該SoC采用下一代GPU的體系結構、新型Arm CPU内核、新深度學(xué)習和計算機視覺加速器,并内置爲先進(jìn)的網絡、存儲和安全服務的BlueField DPU,網絡速度可達400Gbps。


黃仁勳誇贊說:“Atlan集NVIDIA在AI、汽車、機器人、安全和BlueField安全數據中心領域的所有技術之大成(chéng),堪稱一項技術奇迹。”

4、便捷式AI數據中心和DGX SuperPod雙升級

黃仁勳還(hái)宣布升級NVIDIA專爲工作組打造的“便攜式AI數據中心”NVIDIADGX Station,以及NVIDIA專爲密集型AI研發(fā)打造的AI數據中心産品NVIDIA DGX SuperPod。

全新DGX Station 320G借助320GB超快速HBM2e連接至4個NVIDIA A100 GPU,内存帶寬達到每秒8TB。然而,僅需將(jiāng)其插入普通的壁裝電源插座即可使用,耗電量隻有1500W。

黃仁勳說,達到這(zhè)種(zhǒng)性能(néng)的CPU集群成(chéng)本約爲100萬美元,而DGX Station僅需14.9萬美元。


DGX SuperPOD使用全新80GB NVIDIA A100,將(jiāng)其HBM2e内存提升至90TB,實現2.2EB/s的總帶寬。要實現如此的帶寬,需要11000台CPU服務器,大約相當于有250個機櫃的數據中心,比SuperPOD多15倍。

目前它已經(jīng)升級至采用NVIDIA BlueField-2,且NVIDIA如今還(hái)爲該産品提供配套的NVIDIA Base Command DGX管理和編排工具。

5、Aerial A100:5G+AI的新型邊緣計算平台

黃仁勳還(hái)提到了NVIDIA的AI-on-5G計算平台,這(zhè)是一款專爲邊緣設計、將(jiāng)5G和AI相結合的新型計算平台。該平台將(jiāng)采用NVIDIA Aerial軟件開(kāi)發(fā)套件與NVIDIA BlueField-2 A100,將(jiāng)GPU和CPU組合成(chéng)“有史以來最先進(jìn)的PCIE卡。”

富士通、谷歌雲、Mavenir、Radisys和Wind River等合作夥伴都(dōu)在開(kāi)發(fā)适用于NVIDIA AI-on-5G平台的解決方案。


二、協作亞馬遜自研CPU支持雲服務,打造Arm+GPU新PC

除了推出基于Arm的CPU外,NVIDIA還(hái)宣布一系列與Arm處理器設計商的合作進(jìn)展,包括將(jiāng)爲亞馬遜AWSGraviton2 CPU提供GPU加速、爲科學(xué)和AI應用開(kāi)發(fā)提供支持的全新HPC開(kāi)發(fā)者套件、提升邊緣視頻分析和安全功能(néng)、打造新一類基于Arm并搭載NVIDIA RTX GPU的新款PC等。

這(zhè)些舉動反映出無論是市場還(hái)是NVIDIA自身,對(duì)基于Arm的解決方案的興趣已經(jīng)超出移動領域。

1、NVIDIA GPU搭配亞馬遜自研CPU賦能(néng)雲服務

2021年下半年,基于亞馬遜雲科學(xué)(AWS)自研服務器處理器AWS Graviton2的Amazon EC2實例將(jiāng)與NVIDIA GPU相結合,在雲端部署。

這(zhè)一新組合將(jiāng)實現降低成(chéng)本、支持更豐富的遊戲串流體驗、優化雲上安卓遊戲和人工智能(néng)推理、以更低成(chéng)本提供更高的AI推理性能(néng)等優勢。

黃仁勳說:“我們緻力于將(jiāng)Arm生态系統擴展到移動和嵌入式系統以外的市場,而今日宣布的新合作夥伴,正是我們邁出的第一步。”


2、新HPC開(kāi)發(fā)者套件,支持科學(xué)和AI應用開(kāi)發(fā)

爲了更好(hǎo)地支持科學(xué)和AI應用開(kāi)發(fā),面(miàn)向(xiàng)高性能(néng)計算領域,NVIDIA推出了全新HPC開(kāi)發(fā)者套件。

NVIDIA全新HPC開(kāi)發(fā)者套件爲超級計算機提供了一個高性能(néng)、高能(néng)效的平台,該平台結合了1個Ampere Altra CPU(包含80個Arm Neoverse核,運行頻率高達3.3GHz)、雙NVIDIA A100 GPU(每個GPU可提供312TFLOPS的FP16深度學(xué)習性能(néng))、兩(liǎng)個用于加速網絡、存儲和安全的NVIDIA BlueField-2 DPU。

該開(kāi)發(fā)者套件包含一套NVIDIA編譯器、庫和工具,可用于創建HPC和AI應用,以及將(jiāng)其遷移到GPU加速的Arm計算系統中,將(jiāng)于2021年第三季度上市,多家頂尖研究機構已率先展開(kāi)部署。


3、加速邊緣安全功能(néng),打造由GPU驅動的新PC

今天NVIDIA還(hái)宣布了提升邊緣視頻分析和安全功能(néng)、打造新一類基于Arm并搭載NVIDIA RTX GPU的新款PC等進(jìn)展。

在邊緣計算領域,NVIDIA正擴大與Marvell的合作,將(jiāng)基于Arm的OCTEON DPU與GPU相結合,加速AI工作負載,實現網絡優化和安全。

在PC領域,NVIDIA與全球最大的基于Arm的SoC供應商之一聯發(fā)科合作,共同打造一個采用Arm核與NVIDIA顯卡、支持Chromium、Linux和NVIDIA SDK的參考平台,將(jiāng)GPU的性能(néng)及先進(jìn)的AI、光線追蹤圖形等技術帶入Arm PC平台。

此外,NVIDIA也正與富士通、SiPearl等其他合作夥伴共同緻力于擴展Arm生态系統。

三、更多AI平台落地,首秀量子電路模拟框架

NVIDIA在去年推出了一個機架比肩AI數據中心的AI系統DGX A100、AI算力高達700 PFLOPS的集群DGX SuperPOD、千萬億級工作組服務器DGX Station A100。

面(miàn)向(xiàng)AI應用需求,NVIDIA已經(jīng)提供Megatron、Jarvis、Merlin、Maxine、Isaac、Metropolis、Clara和DRIVE、以及各種(zhǒng)可使用TAO進(jìn)行定制化的預訓練模型。

今天,NVIDIA進(jìn)一步強化企業計算服務,不僅推出大型語言模型訓練與推理問答引擎、宣布對(duì)話式AI平台最新落地進(jìn)展,還(hái)展示了其量子電路模拟框架。

1、NVIDIA EGX:擴大認證服務器生态系統

爲進(jìn)一步實現AI民主化,黃仁勳發(fā)布了來自頂尖制造商的新系列NVIDIA認證系統,即大容量企業級服務器,現已通過(guò)認證。

這(zhè)一系統可運行NVIDIA AI Enterprise軟件套件,該套件得到了全球應用最廣泛的計算虛拟化平台——VMware vSphere 7的獨家認證。


NVIDIA今日推出多款新系統,以擴大NVIDIA認證服務器生态系統。這(zhè)些新系統配備用于主流AI和數據分析的NVIDIA A30 GPU,以及用于AI圖形、虛拟工作站以及混合計算和圖形工作負載的NVIDIA A10 GPU。

2、Megatron:超大型語言模型訓練與推理

黃仁勳發(fā)布了用于訓練Transformers的超大語言模型的NVIDIA Megatron Triton推理服務器。

Transformers已幫助開(kāi)發(fā)者在自然語言處理領域取得了突破性進(jìn)展,能(néng)夠生成(chéng)文檔摘要、將(jiāng)電子郵件中的短語補充完整、對(duì)測驗進(jìn)行評分、生成(chéng)體育賽事(shì)現場評論、甚至生成(chéng)代碼。


使用Megatron Triton的DGX A100能(néng)在1秒内做出響應,可同時支持16項查詢,而雙插座CPU服務器支持1條問詢就超過(guò)了1分鍾。

3、Jarvis:實時對(duì)話式AI平台現可使用

Jarvis是一個基于NVIDIA GPU提供實時性能(néng)的靈活、多模态對(duì)話式AI服務應用框架,可幫助開(kāi)發(fā)者輕松實現實時語音識别、轉錄、摘要、翻譯、封閉式字幕、虛拟助手、聊天機器人等功能(néng)。

現在,NVIDIA已經(jīng)是一個生産就緒、現已可用的端到端對(duì)話式AI模型,企業可基于自身數據和特定需求對(duì)模型做進(jìn)一步的微調,并使用NGC實現在雲或邊緣快速部署定制化語言型AI服務。


爲幫助客戶將(jiāng)自身專業知識應用于AI領域,黃仁勳還(hái)宣布推出NVIDIA TAO,其可以運用客戶和合作夥伴的數據,對(duì)NVIDIA預訓練模型進(jìn)行微調和适配,同時保護數據隐私。

4、Morpheus:AI網絡安全應用框架

爲了保障現代化數據中心的安全,黃仁勳宣布推出基于NVIDIA GPU、BlueField DPU、Net-Q網絡遙測軟件和EGX的新型AI框架而構建的NVIDIA Morpheus數據中心安全平台,能(néng)夠對(duì)完整的數據包進(jìn)行實時檢測、預防安全威脅,現可搶先試用。

作爲一個基于AI的雲原生網絡安全框架,NVIDIA Morpheus通過(guò)在邊緣和AI技術的結合,利用實時的遙測、策略執行及操作,可以在不犧牲成(chéng)本和性能(néng)的情況下分析更多的安全數據,識别、捕捉和應對(duì)以往無法識别的威脅和異常情況,如未加密敏感數據的洩露、網絡釣魚攻擊和惡意軟件。


Morpheus與BlueField DPU相結合,使網絡中的每個計算節點都(dōu)成(chéng)爲邊緣網絡防禦傳感器,企業無需複制數據,也能(néng)夠以線速分析每個數據包。相比之下,傳統的AI安全工具通常隻能(néng)采樣5%左右的網絡流量數據,因此威脅檢測算法并非基于完整的模型。

同步推出的BlueField-3可爲NVIDIA Morpheus提供實時的網絡可視化、網絡威脅的檢測與響應、以及監控、遙測和代理服務。開(kāi)發(fā)者還(hái)能(néng)夠在現有IP投資的基礎上,使用深度學(xué)習模型來創建自己的Morpheus AI功能(néng)。

5、CuQuantum:量子電路模拟框架

爲加快有賴于量子位(或量子比特,能(néng)作爲單個的0或1存在,也可以同時作爲二者存在)的量子計算研究,黃仁勳推出了cuQuantum,爲量子電路模拟器提供加速。

這(zhè)是專爲模拟量子電路而設計的加速庫,适用于張量網絡求解器和狀态向(xiàng)量求解器,經(jīng)過(guò)優化後(hòu),可以擴展到大GPU顯存、多個GPU和多個DGX節點。


運行cuQuantum基準測試時,狀态向(xiàng)量模拟在雙CPU服務器上需要10天,但在DGX A100上隻需2小時,DGX上的cuQuantum可以高效模拟10倍的量子位,從而助力研究人員設計出更完善的量子計算機。

四、公布自動駕駛新平台,擴大與沃爾沃合作

自動駕駛汽車(AV,Autonomous vehicles)是NVIDIA近年來極其重視的賽道(dào)之一。除了前文提及的1000TOPS自動駕駛處理器外,此次黃仁勳還(hái)推出了Hyperion 8 AV平台,并宣布沃爾沃汽車擴大與NVIDIA的合作。

NVIDIA Hyperion 8 AV平台是一個先進(jìn)的數據采集、開(kāi)發(fā)和測試平台,包含參考傳感器、自動駕駛汽車和中央計算機、3D地面(miàn)真實數據記錄儀、網絡以及所有必要的軟件。


沃爾沃汽車從2016年開(kāi)始借助高性能(néng)且高能(néng)效的NVIDIA DRIVE的算力,基于NVIDIA DRIVE Xavier,爲新車型開(kāi)發(fā)AI輔助駕駛功能(néng),軟件則由沃爾沃汽車旗下的自動駕駛軟件開(kāi)發(fā)公司Zenseact自主研發(fā)。

黃仁勳說,將(jiāng)于2022年投産的NVIDIA自動駕駛汽車計算系統級芯片NVIDIA DRIVE Orin,旨在成(chéng)爲汽車的中央電腦。


而沃爾沃汽車將(jiāng)爲新一代汽車的自動駕駛計算機配備NVIDIA DRIVE Orin。

這(zhè)意味着兩(liǎng)家公司的合作深入到更多軟件定義車型,首發(fā)就是將(jiāng)于2022年發(fā)布的新一代XC90。

五、推出英偉達Omniverse企業版,賦能(néng)Drive SIM 2.0

黃仁勳強調說,NVIDIA是一家軟件平台公司,并大力發(fā)展NVIDIA AI和將(jiāng)3D世界連接至共享虛拟世界的NVIDIA Omniverse。

NVIDIA Omniverse是一款多GPU可擴展的雲原生平台,支持建模、布局、着色、合成(chéng)、渲染、動畫等一系列構建3D虛拟建模所需的功能(néng),用于仿真、協作和自主機器訓練。

其特點還(hái)包括:具有高物理精度、能(néng)夠充分運用RTX實時路徑追蹤和DLSS、可以使用NVIDIA MDL模拟材料、可以使用NVIDIA PhysX模拟物理學(xué)并且與NVIDIA AI完全集成(chéng)。

黃仁勳提到:“Omniverse旨在創建共享虛拟3D世界,就像尼爾·斯蒂芬森在1990年代早期的小說《雪崩》中所描述的科幻虛拟空間那樣。”

去年12月,NVIDIA推出了Omniverse公測版本。自公測版發(fā)布以來,建築、遊戲以及大型廣告公司等合作夥伴都(dōu)將(jiāng)Omniverse運用到其工作中。

從今年夏季開(kāi)始,NVIDIA將(jiāng)提供Omniverse企業授權許可。


黃仁勳還(hái)宣布DRIVE Sim將(jiāng)于今年夏季開(kāi)放供業界使用。他提到Omniverse中的DRIVE數字孿生是能(néng)夠與車隊中每一位工程師和每一輛車互聯的虛拟空間。

正如Omniverse能(néng)夠構建汽車生産工廠的數字孿生一樣,DRIVE Sim也可用于創建自動駕駛汽車的數字孿生,并將(jiāng)其用于自動駕駛汽車的開(kāi)發(fā)。

此外,NVIDIA正與寶馬合作打造一個完全采用數字化設計的未來工廠,自始至終在Omniverse中進(jìn)行模拟,創建數字孿生,并讓機器人與人類協同工作開(kāi)展運營。


結語:NVIDIA集齊“未來計算的三大支柱”

總體來看,NVIDIA今日公布的多項成(chéng)果與進(jìn)展,爲基于Arm的解決方案帶來更多可能(néng)性,NVIDIA這(zhè)又打造硬件又優化軟件的勢頭,更加彰顯了其主導數據中心領域AI和HPC市場的決心,也爲頗負盛名的GTC大會打出了響亮的頭炮。

此次GTC線上大會共超過(guò)10萬人注冊參會,共計將(jiāng)舉行1600多場技術演講。在接下來的5天内,3位圖靈獎得主、12位戈登-貝爾獎得主、10位奧斯卡獎得主,以及來自微軟、Arm、奧迪汽車、亞馬遜、通用電氣、微軟等企業的領導人均將(jiāng)在此次科技盛會上發(fā)表演講。

從最新一系列努力來看,NVIDIA身上早已貼上遠多于GPU巨頭的更多标簽,成(chéng)爲全棧計算平台。首款數據中心CPU的發(fā)布,也宣告着NVIDIA的異構計算布局再添新的關鍵元件,數據中心産品線集齊CPU、GPU、DPU這(zhè)“未來計算的三大支柱”。

NVIDIA正卯足了勁兒推進(jìn)將(jiāng)GPU與Arm系CPU相結合的生态發(fā)展,這(zhè)一切顯然還(hái)隻是開(kāi)始。


——END——

  更多網站設計、網頁設計等相關内容,歡迎您咨詢中山網訊科技!
  
責任編輯:中山網站建設
     【網訊網絡】國(guó)家高新技術企業》十二年專注軟件開(kāi)發(fā),網站建設,網頁設計,APP開(kāi)發(fā),小程序,微信公衆号開(kāi)發(fā),定制各類企業管理軟件(OA、CRM、ERP、OMS訂單管理系統、WMS進(jìn)銷存管理軟件等)!服務熱線:0760-88610046、13924923903,http://www.wansion.net

您的項目需求咨詢熱線:0760-88610046(國(guó)家高新技術企業)

*請認真填寫需求,我們會在24小時内與您取得聯系。