來源:中國電子報(bào) 發(fā)布時間:2022-7-25 9:26
從今年3月的GTC大會到6月的Computex展會,英偉達(dá)出場的主角都是Grace CPU和Hopper GPU,這意味著,從現(xiàn)在到未來,這兩者都將是英偉達(dá)在數(shù)據(jù)中心市場的絕對主角。英偉達(dá)希望通過命名自計(jì)算機(jī)編程界先驅(qū)Grace Hopper的最新GPU架構(gòu)Hopper重新定義數(shù)據(jù)中心,搶占人工智能(AI)、高性能計(jì)算(HPC)和數(shù)據(jù)分析等需求市場,成為這波需求紅利的頭茬收割者。
人工智能、高性能計(jì)算和數(shù)據(jù)分析等市場,被鵬城實(shí)驗(yàn)室研究員陳春章概括為“量子計(jì)算大規(guī)模流行之前的平行計(jì)算市場”。而筆者更愿意將其簡縮為“前量子計(jì)算市場”——量子計(jì)算機(jī)可能還需要10年到20年成熟,但對”量子級”的海量算力需求已經(jīng)存在,一向以市場嗅覺敏銳著稱的英偉達(dá)CEO黃仁勛,已經(jīng)“磨刀霍霍”了。
數(shù)據(jù)中心將變成AI工廠
不管品種繁多的消費(fèi)電子產(chǎn)品市場如何消長,后端數(shù)據(jù)中心市場的增長從來不會放緩,這是為什么英偉達(dá)、英特爾、AMD等半導(dǎo)體廠商都把數(shù)據(jù)中心視為“兵家必爭之地”的原因。
目前這三家企業(yè)都把CPU+GPU超級混合芯片作為數(shù)據(jù)中心市場的最新“聯(lián)合作戰(zhàn)方案”,基于這樣的組合思路,原來沒有GPU的補(bǔ)GPU,沒有CPU的補(bǔ)CPU。在基本完成“補(bǔ)短板”行動之后,最近,英特爾宣布推出Falcon Shores XPU芯片,AMD推出Instinct MI300芯片,英偉達(dá)則推出Grace,這幾款“CPU+GPU”的混合芯片將在2023年、2024年陸續(xù)登場。
如何在同一市場塑造差異化,從來都是CEO們必須思考的關(guān)鍵問題,正是基于差異化思路,黃仁勛今年頻繁在各個場合釋放“未來的數(shù)據(jù)中心將變成AI工廠”的論調(diào),并下大注推動GPU代次更迭。因?yàn)樵贏I市場,英偉達(dá)的GPU優(yōu)勢無人撼動,如果未來的數(shù)據(jù)中心都向AI工廠轉(zhuǎn)型,那么英偉達(dá)將是這一轉(zhuǎn)型的最大獲利者。
未來的數(shù)據(jù)中心、云計(jì)算數(shù)據(jù)中心會越來越凸顯AI特征嗎?未來的數(shù)據(jù)中心會變成所謂“AI工廠”嗎?Gartner2020年發(fā)布的《云AI開發(fā)者服務(wù)關(guān)鍵能力報(bào)告》顯示,AI與云的結(jié)合將越來越緊密,AI云服務(wù)的能力也將成為AI產(chǎn)業(yè)的重要指標(biāo),到2025年,70%的新應(yīng)用程序?qū)⒓葾I模型。中國工程院院士王恩東同樣表示,當(dāng)前人工智能計(jì)算需求正呈指數(shù)級增長,未來在社會總計(jì)算需求中將占80%以上,承載這種需求的就是AI算力中心。
這印證了英偉達(dá)CEO黃仁勛的判斷。英偉達(dá)認(rèn)為AI人工智能計(jì)算的發(fā)展正經(jīng)歷第五次浪潮。AI計(jì)算的第一次浪潮始于深度神經(jīng)網(wǎng)絡(luò)的發(fā)現(xiàn)。第二次浪潮是因?yàn)樵疲ㄟ^云AI計(jì)算迎來第二次浪潮。AI計(jì)算的第三次浪潮是因?yàn)锳I工具的開發(fā),使得AI獲得更為容易,大型企業(yè)使用AI工具提高工作流程的質(zhì)量、安全和效率。第四次浪潮是AI從云或數(shù)據(jù)中心推向邊緣,比如工廠、醫(yī)院、機(jī)場、商店、餐廳和電網(wǎng)等地方。AI的第五次浪潮是自主性的增長——即AI在沒有人類干預(yù)的情況下自主操控移動機(jī)械,如汽車、卡車、船舶、飛機(jī)、無人機(jī)等。
“自AI大爆炸以來,該行業(yè)已取得了迅速發(fā)展并引發(fā)了后來的計(jì)算浪潮,包括云服務(wù)、企業(yè)AI、邊緣AI和自主機(jī)器。”黃仁勛表示,“下一個機(jī)會就藏在AI工廠、云AI和邊緣AI之中。”
眼下,AI正以前所未有的速度向各行各業(yè)滲透,各個IT巨頭正在奮力突破AI加速滲透的最后瓶頸,大模型的“軍備競賽”是這場突圍的信號之一。咨詢公司IDC認(rèn)為,人工智能的落地已經(jīng)發(fā)展到一定階段,向前一步的瓶頸在于某一廠商往往不具備足夠的可用于模型訓(xùn)練的數(shù)據(jù)資源,且缺乏充足的算力,很難將偏通用的AI模型落地到企業(yè)場景中。
模型算法、數(shù)據(jù)、算力是推動人工智能發(fā)展的三大要素,其中算力被視為人工智能走向規(guī)模化應(yīng)用的“發(fā)動機(jī)”。關(guān)于這個“發(fā)動機(jī)”有多重要,AI又多能“吃”算力,AI大模型訓(xùn)練對算力消耗是一個參照:阿里用了480塊GPU來訓(xùn)練其千億參數(shù)模型,英偉達(dá)用3072塊GPU訓(xùn)練萬億參數(shù)模型,谷歌則用2046塊TPU訓(xùn)練16萬億參數(shù)的模型。所以加快提升“發(fā)動機(jī)”的能力,進(jìn)一步降低算力成本,成為推動人工智能加速規(guī)模化落地的關(guān)鍵。
應(yīng)對人工智能發(fā)展所需要的“指數(shù)級算力”增長,要想成為下一輪“AI工廠”競爭的頭牌,英偉達(dá)必須將GPU的算力再次推向極致。
Hopper帶來GPU代際飛躍
一直以來英偉達(dá)在GPU市場擁有絕對優(yōu)勢,但AI等市場對于算力的無窮訴求,加上英特爾推出獨(dú)立GPU,以及AMD的步步緊逼,英偉達(dá)必須革新架構(gòu),進(jìn)一步加寬其護(hù)城河。
兩年前,英偉達(dá)推出的GPU架構(gòu)是Ampere(安培),英偉達(dá)最新的GPU新架構(gòu)以美國計(jì)算機(jī)編程界先驅(qū)Grace Hopper命名,足見其希望新架構(gòu)引領(lǐng)未來計(jì)算的企圖。
Hopper是英偉達(dá)最新的GPU架構(gòu),基于Hopper架構(gòu)的GPU H100實(shí)現(xiàn)的性能提升,有人用“新核彈”來形容其代際飛躍。目前,基于Hopper架構(gòu),英偉達(dá)推出了面向數(shù)據(jù)中心的GPU H100,“用20塊H100 GPU,可以承托全球互聯(lián)網(wǎng)的流量”,這是黃仁勛的原話。
具體來看,H100 GPU芯片由800億個晶體管構(gòu)建而成,采用了專為英偉達(dá)加速計(jì)算需求而優(yōu)化的TSMC 4N工藝,單個H100最大支持40TB/s的IO帶寬。H100同時還集多項(xiàng)“首個”于一身,包括首款支持PCIe 5.0的GPU、首款采用HBM3標(biāo)準(zhǔn)的GPU,以及全球首款具有機(jī)密計(jì)算功能的GPU。
盡管GPU H100將于2023年上半年才正式供貨,但自從今年曝光以來,已在業(yè)界引發(fā)諸多震蕩。
賽迪顧問集成電路產(chǎn)業(yè)研究中心分析師池憲念認(rèn)為,相比于上一代的安培架構(gòu),Hopper架構(gòu)在工藝、張量核心、性能方面均實(shí)現(xiàn)了飛躍,H100還具有機(jī)密計(jì)算功能,可保護(hù)AI模型和正在處理的客戶數(shù)據(jù)。
業(yè)內(nèi)資深人士認(rèn)為,Hopper架構(gòu)的性能提升和主要變化體現(xiàn)在新型線程塊集群技術(shù)和新一代的流式多處理器。英偉達(dá)在Hopper中引入了新的線程塊集群機(jī)制,可實(shí)現(xiàn)跨單元進(jìn)行協(xié)同計(jì)算。
池憲念認(rèn)為,基于Hopper的GPU H100可以作為加速計(jì)算卡來助力超級計(jì)算機(jī)的發(fā)展,極大推進(jìn)了數(shù)據(jù)中心、AI超級計(jì)算產(chǎn)業(yè)的發(fā)展。此外,它對產(chǎn)業(yè)界還有以下幾點(diǎn)促進(jìn):一是Hopper架構(gòu)的GPU產(chǎn)品可以應(yīng)用于服務(wù)器,為AI訓(xùn)練和推理以及數(shù)據(jù)分析提供更高應(yīng)用性能。二是H100 PCIe規(guī)格便于集成到現(xiàn)有的數(shù)據(jù)中心基礎(chǔ)設(shè)施中,有效提高算力和減小能耗。三是H100可助力開發(fā)者和企業(yè)構(gòu)建并加速AI、HPC等一系列應(yīng)用,使企業(yè)可用它來加速由AI驅(qū)動的業(yè)務(wù)。
如果再加上英偉達(dá)的連接技術(shù),那么Hopper還可以像搭積木一樣進(jìn)一步拓展處理器性能。比如今年GTC大會上,英偉達(dá)推出了AI計(jì)算系統(tǒng)DGX H100,借助 NVLink 連接,DGX 使8塊H100成為了一個巨型GPU:擁有6400億個晶體管,具備32 PetaFLOPS的AI性能,具有640GB HBM3顯存以及24TB/s的顯存帶寬。
就像黃仁勛所宣稱的那樣,作為一家計(jì)算機(jī)平臺廠商,而非芯片企業(yè),英偉達(dá)從來都不僅僅提供芯片,而是圍繞AI建立全棧的能力,其中芯片是關(guān)鍵基石,此外還有平臺、工具,并建立“樣板房”“樣板工廠”“樣板模型”。
目前英偉達(dá)正在構(gòu)建首個AI工廠的 “樣板房”EOS。據(jù)介紹,該EOS搭載18 個DGX POD、576臺DGX H100、4608個H100 GPU。在傳統(tǒng)的科學(xué)計(jì)算領(lǐng)域,EOS的速度是275 PetaFLOPS,比 A100 驅(qū)動的美國速度最快的超級計(jì)算機(jī)Summit還快1.4倍。在AI方面,EOS的AI處理速度是18.4 ExaFLOPS,比全球最大的超級計(jì)算機(jī)——日本的Fugaku快4倍。
大模型也是近年英偉達(dá)大力投入的又一個維度。除了與微軟聯(lián)手研發(fā)大模型,最近,英偉達(dá)又聯(lián)手包括加州理工學(xué)院、伯克利實(shí)驗(yàn)室在內(nèi)的多家科研機(jī)構(gòu)合作開發(fā)FourCastNet天氣預(yù)報(bào)AI模型。“傳統(tǒng)的數(shù)值模擬需要一年的時間,而現(xiàn)在只需要幾分鐘。”黃仁勛稱,它能夠預(yù)測颶風(fēng)、極端降水等天氣事件。
布局“前量子計(jì)算”市場?
英偉達(dá)下狠心研發(fā)海量算力的GPU,H100將GPU的性能做到目前全球的頂配,陳春章認(rèn)為其真正意圖正是搶占量子計(jì)算大規(guī)模流行前的需求市場,即“前量子計(jì)算市場”。目前看量子計(jì)算產(chǎn)業(yè)發(fā)展尚在早期,產(chǎn)業(yè)成熟或許還需5~10年,但市場需求已經(jīng)存在。英特爾、IBM、谷歌、微軟等IT巨頭都在緊鑼密鼓進(jìn)行量子計(jì)算的研究,布局未來計(jì)算的下一站。
具體來看,H100的技術(shù)性能能解決哪些重大問題?有哪些典型的應(yīng)用場景?“第一是AI,第二是HPC。”陳春章表示。在AI方面,英偉達(dá)已經(jīng)給出了它在訓(xùn)練大模型方面的能效比,不再做討論,而HPC的典型場景包括基因序列、病毒的動態(tài)病理學(xué)研究,還包括自動駕駛、AR/VR、天氣預(yù)報(bào)、大飛機(jī)制造等。量子計(jì)算主要用在哪些場景?以IBM的量子計(jì)算為例,IBM將之用于計(jì)算化學(xué)、分子化學(xué)研究,解決藥物合成問題。H100的目標(biāo)市場與量子計(jì)算市場高度重合。
本源量子公司總經(jīng)理張輝說:“量子計(jì)算擅長兩類問題,一類是處理海量數(shù)據(jù)并行運(yùn)算,另一類擅長模擬微觀體系下電子、原子、分子的運(yùn)動規(guī)律。”張輝進(jìn)一步表示,比如未來的新藥研制很可能不需要通過經(jīng)驗(yàn)合成,不用進(jìn)行小白鼠、大型動物和人體一期、二期、三期的實(shí)驗(yàn)并花費(fèi)幾十年的研制周期,量子計(jì)算機(jī)模擬后可快速得出最優(yōu)解決方案,極大地加速了新藥研制過程。
量子計(jì)算所擅長的場景與H100描述的典型應(yīng)用場景高度一致。陳春章的判斷果然沒錯——7月12日,英偉達(dá)發(fā)布統(tǒng)一計(jì)算平臺NVIDIA量子優(yōu)化設(shè)備架構(gòu)(QODA)。英偉達(dá)稱,該平臺將加快人工智能、高性能計(jì)算、醫(yī)療、金融和其他學(xué)科的量子研發(fā)突破。
據(jù)介紹,QODA通過創(chuàng)建相干的混合量子經(jīng)典編程模型,使量子計(jì)算更容易使用。QODA 是開放的、統(tǒng)一的環(huán)境,適用于當(dāng)今一些最強(qiáng)大的計(jì)算機(jī)和量子處理器,提高了科學(xué)生產(chǎn)力,并使量子研究具有更大的規(guī)模。具體來看,HPC和AI領(lǐng)域的專家使用QODA能夠輕松地將量子計(jì)算添加至現(xiàn)有應(yīng)用中。
此前,英偉達(dá)通過CUDA平臺+ NVIDIA GPU收割了AI市場第一茬紅利;現(xiàn)在英偉達(dá)希望通過QODA平臺+ NVIDIA GPU收割量子計(jì)算應(yīng)用市場紅利。張輝說,量子計(jì)算機(jī)有可能還需要10年到20年才成熟,但這對于英偉達(dá)來說更是機(jī)會,“在用戶享用到量子計(jì)算之前,現(xiàn)在可以通過QODA平臺+NVIDIA GPU來滿足需求”。
英偉達(dá)高性能計(jì)算和量子計(jì)算產(chǎn)品總監(jiān)Tim Costa說: “在短期內(nèi), 結(jié)合經(jīng)典計(jì)算和量子計(jì)算的混合解決方案可能為科學(xué)研究帶來突破。”7月13日,英偉達(dá)在東京Q2B大會上透露,目前已經(jīng)與量子硬件供應(yīng)商、量子軟件供應(yīng)商,以及一些國家的計(jì)算中心和實(shí)驗(yàn)室就 QODA展開合作。
陳春章分析說:“英偉達(dá)公司收購Arm沒成,又沒有FPGA,果然,現(xiàn)在走了另外一條路線。”