還記得六月黃仁勳跑完台北電腦展後,一個月內出手投資三家AI新創公司:Cohere、Inflection AI、Runway,現在創投圈又傳出更勁爆的新聞,2017年創立的CoreWeave原本是做虛擬貨幣,2018年決定擴展GPU加速業務,截至2022年底營收2500萬美元,結果撞上了今年生成式AI熱潮,預計年營收有望超過六億美元,翻了足足二十四倍,為什麼呢?因為黃仁勳義氣相挺!微軟跟馬斯克都放話,要自己研發AI晶片,不讓輝達寡占GPU市場,好,既然如此,那就不是同路人,CoreWeave追著要卡,輝達就大量供應,微軟、亞馬遜、馬斯克就限量供應,哈!黃仁勳不愧是有刺青的男人,man!
根據The Information消息,輝達把缺貨的H100大量新卡分配給了CoreWeave,扶植小弟跟雲計算服務公司微軟對著幹,蓋茲在江湖上也不是白混的,任何潛在性的威脅都嚴陣以待,據傳六月份微軟也與CoreWeave簽訂協定,在未來數年內投資數十億美元,用於雲計算基礎設施建設。
為什麼輝達跟微軟都看上了CoreWeave呢?根據CoreWeave官網宣傳,他們的服務比傳統雲計算廠商便宜80%。至於具體CoreWeave如何辦到的就先跳過這段,重點是輝達也有投資CoreWeave至少一億美元以上,而且獲得了輝達的信任,所以呢,CoreWeave想出了一招空手套白狼的妙招─用手上大量的H100晶片(3.5-4萬塊H100─不是現貨,而是預定的),抵押貸款取得了23億美元融資,然後借到錢的CoreWeave,再跟輝達買更多的H100晶片,哈!夠狠!CoreWeave要這麼多的H100晶片幹什麼呢?年底前再建十個新資料中心!好樣的。
AI熱潮可能創成交量紀錄
矇了,不是才喊說AI泡沫嗎?怎麼上週傳出今年最大違約交割的緯創,在宏碁董事會通過授權賣3.3萬張的利空中,8月7日十點鐘鎖住漲停板,帶動英業達、廣達、技嘉等輝達伺服器概念股也跟進漲停,其他伺服器的零組件股如台光電、台燿、雙鴻、世芯-KY、辛耘等也拉上漲停板,整體電腦周邊相關族群的資金占比盤中超過四成,收盤達36%。毫無疑問的,電腦周邊相關族群已經取代半導體族群成為今年的人氣王,而且有了2021年航海王狂潮的7828億元單日大量的經驗,這次AI熱潮很有機會打破台股歷史新大量的紀錄,原因很簡單,有業績支撐。
輝達的HGX H100 8-GPU SXM是當前最受歡迎的GPU(華碩推出的就是這款),因為在訓練方面,企業關注記憶體頻寬、FLOPS、緩存和緩存延遲、FP8計算等附加功能、計算性能(與Cuda核心數量相關)、互連速度(如InfiniBand)等,H100比A100更受青睞,部分原因是緩存延遲較低和FP8計算等。
這麼缺貨,怎麼不用AMD的呢?據說,很少有企業願意冒著花三億美元買一萬片AMD GPU,等兩個月讓一切正常運作起來,要知道在AI的世界,三至四個月就是一個世代,而且還不知道兩個月過後運作起來的效能跟輝達比起來如何。好吧,那麼到底市場有多缺H100晶片呢?
GPU Utils認為,保守估計,H100的供給缺口達到35.7~43.5萬張,以每片3.5萬美元來計算,這是110-150億美元的生意,目前只有台積電能供應H100晶片,尤其是在美中科技戰的背景,台廠佔據伺服器九成市場,鴻海、廣達、緯創、英業達、技嘉、華碩、神達等來分大餅。
而且在AI的摩爾定律驅動下,未來兩年大模型的升級所需的算力只會有增無減,用二十倍的本益比來看當前的股價當然會覺得AI股有泡沫。不過這也是主力希望的局面,從現在到明年上半年很有可能AI股會淡季不淡,如果演變成誘空、養空的走勢的話,那麼明年股東會前的軋空走勢就不止二十倍本益比了。
誰需要H100晶片?根據GPU Utils估算,OpenAI可能需要五萬張,Inflection要2.2萬張,Meta需要2.5-10萬張,Azure、Google Cloud、AWS、Oracle各三萬張,Anthropic、Helsing、Mistral、Character各一萬張,Lambda和CoreWeave以及其他私有雲可能總共需要十萬張,以上合計就35.7-43.5萬張,而且還不包括中國的四朵雲:百度、華為、騰訊、阿里等需要大量的H800晶片,以及華爾街金融巨頭的數百到數千張H100或A100的需求。更重要的是,雲企業完成基礎建設後,下一步就是消費者端的裝置也要升級到AI PC與AI手機。