站在中國臺北國際電腦展(COMPUTEX)舞臺上的黃仁勛像個超級銷售員。
他一會兒跑下臺,把一塊名為“Blackwell”的芯片搬到舞臺上,介紹它如何通過NVLink交換器把兩個裸晶(Die)連接在一起創(chuàng)造更大算力,說它是“世界上有史以來最復(fù)雜、性能最高的芯片”,能夠支持兆級參數(shù)規(guī)模的生成式AI;
一會兒,他又跑到舞臺左邊,站在一個貨柜一樣的東西旁,開始推薦一個叫“DGX Blackwell”的設(shè)備,它的算力更加龐大,甚至可以滿足一家AI公司的需求,因為它通過NVSwitch連接了72個Blackwell芯片;
之后,他來到舞臺右邊,那里已經(jīng)為他準備好一個長方形鐵架,他費勁地把它扛到舞臺中央,宣布它就是那個能連接一切的“脊柱”,其中有5000條連接線,加起來有兩英里長。他聲稱,如果把多臺“DGX Blackwell”再連接起來,就能構(gòu)成一個龐大的數(shù)據(jù)中心——黃仁勛稱之為“AI工廠”。
黃仁勛6月2日的這場演講長達兩個小時,其中大部分內(nèi)容都是在今年3月的英偉達GTC(GPU Technology Conference)大會上所講內(nèi)容的翻版,那場大會同樣長達兩個小時。當(dāng)分析師還為英偉達的邊界到底在哪而想破腦筋時——要知道,這家公司的市值在過去一年已經(jīng)瘋漲了快2萬億美元——CEO黃仁勛用發(fā)布會告訴所有人:他全都要。
除了一再強調(diào)其數(shù)字孿生服務(wù)Omniverse在AI工廠中的價值,黃仁勛又一次介紹了Blackwell系列芯片、可以讓開發(fā)者基于英偉達芯片開發(fā)和部署生成式AI助手的NIM(NVIDIA Inference Microservice)服務(wù)、專為“物理AI”(即機器人)開發(fā)的芯片Jetson Thor,以及可以充當(dāng)機器人大腦的基礎(chǔ)模型Project GR00T,它們使得英偉達的業(yè)務(wù)范圍從數(shù)據(jù)中心、游戲和自動駕駛,橫向擴展到了人形機器人這一新終端,還自下而上地從芯片層向上伸展到了云計算、大模型和應(yīng)用服務(wù)等軟件領(lǐng)域。
Blackwell是英偉達目前最新款的AI芯片,它以數(shù)學(xué)家、博弈論家、概率論家David Blackwell的名字命名,推理能力(即預(yù)測出下一個token的速度)號稱是上一代Hopper芯片的30倍,能夠更高效地訓(xùn)練像GPT-4那樣的萬億級參數(shù)模型。黃仁勛不斷舉的一個例子就是:“訓(xùn)練一個1.8萬億參數(shù)的GPT模型,如果用Hopper做,可能需要8000個芯片,但如果你用Blackwell,只需要2000個就夠了。”
不過,6月2日的這場演講仍然有一些東西是全新的:其一,Blackwell已經(jīng)是黃仁勛口中“世界上有史以來最強大的芯片”,但更強大的芯片發(fā)布已經(jīng)排上了日程,兩年后,即2026年,英偉達將發(fā)布下一代芯片Rubin。這個名字來自美國天文學(xué)家Vera Rubin,延續(xù)了英偉達以科學(xué)家名字命名芯片的傳統(tǒng)。而在此之前,2025年,英偉達會推出Blackwell的加強版Blackwell Ultra,Rubin的加強版Rubin Ultra則計劃在2027年發(fā)布。其二,便是AI PC。
如果說3月的GTC大會彰顯了英偉達的技術(shù)和業(yè)務(wù)擴張野心,那么6月COMPUTEX上的賣力推銷則顯示了黃仁勛在努力證明公司市值的增長神話并非泡沫。
從訓(xùn)練到推理,還有巨大算力需求未被滿足
5月的最后一周,英偉達的股價再度飆升,總市值達到2.82萬億美元,成為全球市值排名第三的上市公司,僅次于微軟(3.19萬億美元)和蘋果(2.92萬億美元)。市值從1萬億增長到2萬億,英偉達僅用了9個月的時間,而從2萬億增至2.8萬億,它用了不到3個月,照這種速度,其市值突破3萬億美元——超越蘋果,只需要再增長7%就可以了(截至6月6日,其市值已超越蘋果)。
這家市值坐著火箭飛升的公司在兌現(xiàn)利潤方面也有火箭般的速度,但它能在規(guī)模上吃掉多少由生產(chǎn)式AI創(chuàng)造的市場還是個未知數(shù)。
我們對這個問題做了以下的簡單計算:
首先,在全球模型數(shù)量上,我們以GPT-3.5、GPT-4、即將推出的GPT-5、Midjourney和Sora作為行業(yè)內(nèi)大語言模型、文生圖模型、文生視頻模型的標桿,并假設(shè)最終市場上會訓(xùn)練出100個GPT-3.5級別、50個GPT-4級別、10個GPT-5級別的大語言模型,和10個Midjourney級別的圖像生成模型,以及20個Sora級別的視頻生成模型。
按照“所需H100數(shù)量=(訓(xùn)練階段每token浮點運算次數(shù)×訓(xùn)練數(shù)據(jù)集token數(shù)×模型參數(shù)量)÷(訓(xùn)練時間×H100峰值算力×H100利用率)”的公式粗略計算,要訓(xùn)練完上述規(guī)模和數(shù)量的大模型,全球需要消耗大約630萬枚H100芯片。
而推理環(huán)節(jié)需要消耗的算力更高,彈性也更大——這種彈性主要來自視頻的生成,因為每生成一次視頻產(chǎn)生的token量幾乎是生成一次文字的token量的1000倍。以Sora為例,假如每人每月僅生成一條視頻,同時假設(shè)市場上最終只有20個相似模型提供服務(wù),并且市場上共有2億用戶在使用這種服務(wù),那么市場需要的H100數(shù)量約為320萬枚;但如果視頻生成技術(shù)成熟,并普及到有數(shù)十億人使用,且每個用戶每天都會用它生成視頻,甚至不止生成一條,那相應(yīng)的算力消耗會增加至少兩個數(shù)量級。
保守地按照每人每月僅生成一條視頻來算的話,全球在大模型推理方面的算力需求相當(dāng)于1040萬枚H100芯片,是模型訓(xùn)練的兩倍。而如果視頻生成技術(shù)和市場更成熟,推理的算力消耗會飆升到訓(xùn)練需求的數(shù)十倍甚至百倍。
根據(jù)市場跟蹤公司Omdia的統(tǒng)計數(shù)據(jù),截至2023年年底,英偉達H100的總出貨量達到了120萬枚。在截至2024年4月28日的4個季度里,英偉達通過數(shù)據(jù)中心業(yè)務(wù)(即AI芯片銷售)獲得的收入達到658億美元。按照每一枚H100售價4萬美元計算,英偉達過去4個季度銷售的H100數(shù)量約為164.5萬枚。
這個數(shù)字大約只相當(dāng)于整體模型訓(xùn)練市場(即假設(shè)全球訓(xùn)練出了100個GPT-3.5級別、50個GPT-4級別、10個GPT-5級別的大語言模型,和10個Midjourney級別的圖像生成模型,以及20個Sora級別的視頻生成模型)的1/4.而且,這還只是模型訓(xùn)練的市場需求,推理是更大數(shù)量級、且尚未真正開啟的市場。
然而,這些市場中的不少份額還不屬于英偉達,尤其是在端側(cè)
如果按訓(xùn)練和推理來劃分,英偉達也許可以相對穩(wěn)定地吃掉大模型訓(xùn)練的市場,不過別忘記,像視頻生成這樣的推理市場占比更大——它與文字生成存在的算力差異是數(shù)量級的。而視頻生成如果要像短視頻那樣普及,就得能夠進入個人電腦、智能手機等個人終端,而不能遠遠躲在云端。
英偉達已經(jīng)在規(guī)劃推出更多適用于端側(cè)的芯片。3月GTC大會上發(fā)布的Jetson Thor機器人芯片可以視作這一戰(zhàn)略的行動之一,按黃仁勛的說法,“未來一切運動的東西都將是機器人式的”。沒有人懷疑人形機器人作為一種新型終端的增長前景,不過眼下最成熟的兩個終端——個人電腦和智能手機,才是各大芯片廠商的競爭重點。
個人電腦和智能手機中的芯片霸主是英特爾和高通,過去,英偉達僅在對畫面和算力要求更高的游戲電腦市場占據(jù)一席之地,從未能將厚重的GPU塞進輕薄的筆記本中,更別說體積更小的智能手機。
6月2日的COMPUTEX舞臺上,黃仁勛展示了他對進入個人電腦領(lǐng)域的興趣,推出面向AI PC市場的GeForce RTX芯片,并預(yù)告華碩和微星電腦將推出基于RTX芯片的AI PC,配備微軟不久前才上線的Copilot Plus功能。AI PC是一個規(guī)模在1億臺左右的大市場,相應(yīng)的AI功能可能引發(fā)市場換機潮。
在一篇博文中,NVIDIA表示,“這些Windows 11 AI PC在可用時將獲得Copilot+PC體驗的免費更新。這表明微軟可能還沒準備好在AMD芯片上推出Recall和由其他AI驅(qū)動的Windows功能,或者說6月18日推出的搭載Arm高通處理器的Windows硬件可能會有一段時間的獨占期?!卑凳驹贏I PC市場,Arm雖然會擁有先機,英偉達也不算落后,而首批搭載AMD處理器的Copilot Plus PC可能不會在發(fā)布時獲得微軟的人工智能功能。
新增市場是私有云?
英偉達對云計算市場的爭奪已經(jīng)是公開的秘密。早在去年3月,英偉達就推出了一個名為“DGX Cloud”的云計算服務(wù),其搭載的是一度奇貨可居的英偉達Hopper系列芯片(H100等)。英偉達稱,這是一個價值3000億美元的機會,不過,要獲得這個機會,它需要與微軟、Google、亞馬遜等云計算服務(wù)巨頭直接競爭。
相較于“DGX Cloud”這樣的公有云市場,英偉達還指出了一個叫“AI工廠”的增量市場,它更像是一種私有云,目標客戶是富士康那樣的高端制造業(yè)。3月的GTC大會和6月2日的COMPUTEX演講中,黃仁勛一再舉的例子是,對于富士康這樣生產(chǎn)工藝復(fù)雜的公司,英偉達的數(shù)字孿生服務(wù)Omniverse可以快速幫助工廠建立相應(yīng)的數(shù)字版,這些3D建模出來的數(shù)字工廠不僅記錄了生產(chǎn)流程各個環(huán)節(jié)產(chǎn)生的數(shù)據(jù),還能更好地理解這些數(shù)據(jù)、形成更好的算法。黃仁勛稱,“在未來,每個公司、每個行業(yè)都會有AI工廠”。
去年10月,英偉達就與富士康簽訂了合建“AI工廠”的協(xié)議,6月2日的COMPUTEX演講顯示,更多制造業(yè)公司比如西門子等正準備加入其中。這些制造業(yè)公司過去10年來的重要業(yè)務(wù)之一,就是自建并向第三方客戶輸出“數(shù)字工廠”“無人工廠”之類的“智能制造”解決方案。借助“AI工廠”,英偉達也加入了這一鏈條,在這一市場,模型訓(xùn)練與推理的分野沒有端側(cè)那么巨大,換句話說,這或許是個英偉達更擅長的市場。
當(dāng)然,一切的前提都是GPT-5和Sora等模型能夠取得如業(yè)界預(yù)想的成功。更多股票資訊,關(guān)注財經(jīng)365!