制裁最狠的那年,昇騰市占率從0飆到39.8%,卻仍被逼上二次創業。
大模型訓練現場,華為工程師把CUDA代碼塞進翻譯器,跑完一遍只報錯三次。
百度伙伴當場松口氣,連夜把PyTorch遷移任務改到華為服務器上。
昇騰910C不是普通芯片,它藏著三組密碼:
384顆芯片連出一個超節點,峰值算力把GB200甩開70%,
一張卡能跑1萬億參數,耗電量卻比同檔GPU省出一整層樓電費。
以前最怕缺軟件,現在華為干脆讓老代碼繼續用。
把CUDA指令翻譯成自家指令,一行都不用改,編譯時間從幾十小時縮到十分鐘,
百度、訊飛、字節三家人已經拿到駐場團隊,兩周內跑通50萬行祖傳代碼。
有人擔心這只是過渡,可華為把整條GPU流水線拉了出來:
自己做EDA,美國依賴砍到15%不到;自己做高速互聯,單機帶寬拉到TB級。
一張圖顯示,2019年華為買Synopsys授權一年燒12億人民幣,現在降到1.8億。
專用芯片的痛點只有做AI的人清楚:
