自由時報 2023/11/13 輝達(Nvidia�

日公佈其最新高階圖形處理器(GPU)H200。該款GPU旨在訓練並部署在各類驅動生成式AI熱潮的AI模型上。CNBC報導,H200包含141GB的新一代「HBM3」記憶體,以協助其運用AI模型生成文本、圖像或預測,其運算是H100的近兩倍速。
$ \5 @3 i' F) L
J6 z' E6 M0 ]( b" F8 b; d$ [
報導說,輝達該新款GPU是H100升級版,OpenAI公司使用H100晶片訓練其最先進的大型語言模型(LLM)GPT-4。大公司、新創公司與政府單位都在搶奪供應有限的H100晶片。
( X' G/ w7 A7 r9 @/ e
2 ?1 u5 K4 y6 e! K3 @7 y. g: ?金融服務公司「雷蒙.詹姆斯」(Raymond James)估計,H100晶片費用在2.5萬至4萬美元之間,數千個該晶片必須一起運作,才能在所謂「訓練」的過程中創造出最大模型。
0 y, |: m2 b1 |- Y+ M. T- W. v
) Y7 b4 ?; s! Y4 L" l0 X2 W5 z3 t
輝達AI GPU的搶手推升公司股價,今年以來,輝達股價已大漲230%,輝達預期本季營收將年漲170%至160億美元。
3 N* M2 t! f: x' t' G) W* [, ^# M
$ X: [) g; C# S- c
報導說,H200的關鍵改良包含具有141GB的下一代「HBM3」記憶體,以協助H200執行推論(inference)或利用大型模型生產文本、圖像與預測。
/ R- \! N; I. u8 o. ^0 Q5 Z7 t6 s* V/ E& j8 }4 I h6 d$ M9 a z
輝達指出,依據使用Meta的Llama大型語言模型的測試,H200運算是H100近兩倍速。H200將可與超微(AMD)的MI300X GPU匹敵。預計H200將於明年第2季出貨。
( j6 t! t; q: Q9 Y: v5 Q( L" ]2 U# ?. v* V' x" `; \
輝達說,H200與H100相容,這意味已使用H100訓練語言模型的AI公司無須改變伺服器系統或軟體,就可使用H200。