國產芯片迅速進化。僅GPU賽道,一周內接連傳來重磅融資消息。
先有摩爾線程成立百天完成數十億元融資,深創投、紅杉資本中國基金、GGV聯合領投,招商局創投、字節跳動、小馬智行、融匯資本、海松資本、聞名投資、第一創業、五源資本、和而泰、明浩等聯合參投,簡直就是向豪華投資天團吹響集結號。
四天后,天數智芯宣布完成12億元人民幣C輪融資,由沄柏資本和大鉦資本聯合領投,粵民投資管及聯通資本跟投。天數智芯號稱中國第一家GPGPU高端芯片及高性能算力系統提供商,7納米旗艦級通用并行(GPGPU)云端計算芯片BI,于去年12月點亮。
回望2020年,半導體板塊一路高歌,創下了不少記錄,中芯國際融資532.3億,刷新科創板記錄,斯達半導體漲停34天,位列A股漲停板榜首,卓勝微以570.54元的收盤價,進入高價股Top 5……天眼查數據顯示,截至12月,2020年全國新增超6萬家芯片相關企業……
風口上的芯片股,今年開年被GPU拉開大幕。穿透紅紅火火的資本市場背后,是什么讓國產GPU飛速進化?國產GPU究竟實力幾何?
GPU因何坐上云霄飛車?
我國芯片企業近年來主要有兩大驅動力:一是舉國體制,包括國產替代、科創板與注冊制等;二是產業升級和新興產業應用的涌現,對芯片產生了巨大的需求。
那么為什么GPU屢屢受到重視?
GPU作為計算機顯卡的核心,承擔著圖像處理和輸出顯示的任務。隨著市場需求的發展,GPU不止用于處理圖形圖像,其技術原理決定了它適用于大批量處理特定類型信息,且并行計算能力和能效遠遠超過CPU,所以逐漸衍生出了通用計算GPU(GPGPU),即利用圖形處理器進行非圖形渲染的高性能計算。超算、大數據處理、人工智能等對算力要求非常高的應用場景中,算力大都采用CPU+GPGPU或搭配專用加速芯片的構建方式。
目前在集成GPU市場,英特爾、英偉達、AMD三分天下;獨立GPU領域,幾乎是英偉達和AMD的天下,前者市場份額甚至超出2/3。
去年,英偉達市值首次超過英特爾,成為半導體業界的標志性事件,雖然不論營收還是利潤,英特爾依然是英偉達的好幾倍,但也足以說明,英偉達憑借多年來圍繞GPU軟硬件生態的耕耘、核心定位于數據中心+AI的方向得到了資本界的認可,也進一步論證了GPU平臺的潛力。
作為橫跨視覺計算和人工智能計算的通用平臺,GPU擁有巨大的市場空間。特別是因人工智能技術的發展,GPU作為核心算力基礎,在科學計算、自動駕駛、智能分析、密碼破解、圖像識別、大數據、金融交易等云端計算及邊緣計算領域有著海量的應用空間。也正是如此,GPU發展駛入快車道。
據東吳證券測算,GPU領域國產替代的市場空間超過50億美元。除了既有的游戲市場,在工業、醫療、軍事航天等方向都有進一步的發揮空間。偌大的蛋糕,究竟誰能切下一角?
國產GPU最新進展如何?
我國GPU技術領域起步較晚,廠商數量并不多,既有面向云端市場、人工智能的廠商,也有在圖形GPU領域尋求突破的創業者。第一類廠商目前走在最前沿,也獲得了資本市場更多的關注。粗略梳理,以下廠商發展值得關注:
天數智芯
旗艦7nm GPGPU云端芯片點亮
天數智芯1月15日宣布,旗艦7nm GPGPU云端計算芯片BI成功“點亮”,該公司表示這是國內第一款全自研、真正基于GPU架構的7納米制程GPGPU訓練芯片,量產后將廣泛應用于AI訓練、高性能計算(HPC)等場景。
圖源 | 天數智芯官網
BI芯片使用7nm制程及2.5DCoWoS封裝技術,容納240億晶體管,支持 FP32, FP/BF16, INT32/16/8 等多精度數據混合訓練,支持高速片間互聯,單芯每秒可進行 147 萬億次 FP16 計算(147TFLOPS@FP16),每秒可完成上百路攝像頭視頻通道的AI處理,性能達市場主流產品的兩倍。
據其官方介紹,BI 云端訓練芯片具備高性能、通用性、靈活性,將通過標準化的軟硬件生態接口為應用行業解決產品使用難、開發平臺遷移成本大等操作層面的實際痛點。
登臨科技
首款GPU+產品送樣, 并完成A+輪融資
登臨科技產品路線主打GPU+,即軟件定義的片內異構通用人工智能處理器,目前首款產品已回片通過測試,開始客戶送樣。前不久剛完成了由元禾璞華、元生資本聯合領投的A+ 輪融資,這是繼光遠資本、張江浩珩、張江高科領投的A輪后的又一輪融資,包括北極光在內的老股東持續在本輪加碼跟進。
登臨選擇是云端推理及端側高性能計算方向,產品化方向(Goldwasser) 基于Minsky異構架構。據登臨官方發布,Goldwasser GPU+ 產品在現有市場主流的 GPU 架構上,采用軟硬件協同的異構設計。經過超半年的帕拉丁仿真,市場需要的主流框架、模型、算子及兼容性和性能均得到了充分驗證。
景嘉微
下一代GPU后端設計中
號稱是A股唯一GPU芯片設計公司景嘉微,目前其第三代JM9系列GPU 研發已處于后端設計階段,官方發布預計性能將大幅提升,目標進入國內信創以及人工智能、云計算等中高端應用領域。
景嘉微GPU目前有JM5、JM7兩個系列,其中JM5400系列已經在國產軍用飛機上應用,替代了AMD/ATI的產品;JM7200系列采用了28nm工藝,據稱性能跟英偉達GT640(這是英偉達2012年的主流顯卡)相近,不過整體功耗不足10W,低于后者的50W TDP,目前該系列已獲得部分訂單。
根據官方所列規格,第三代產品JM9231 的性能可達到2016年中低端產品水平;JM9271 核心頻率不低于1.8GHz,支持PCIe 4.0 x16,搭配16GB HBM顯存,帶寬512GB/s,浮點性能可達8TFLOPS,性能不低于GTX 1080的水平,可達到2017年底的高端顯卡的水平。
芯動科技
布局移動、桌面、云端市場
圖源 | The Korea Bizwire
芯動科技針對國內信創市場推出了風華系列芯片,內置國產物理不可克隆iUnique Security PUF信息安全加密技術,提升數據安全和算力抗攻擊性,支持新基建桌面電腦和數據中心GPU計算自主可控生態。此外,16Gbps GDDR6高速顯存技術、HDMI2.1 8K顯示技術和Cache一致性Innolink Chiplet技術等,都將應用于風華GPU中。
去年10月,芯動科技與Imagination達成授權合作,采用多晶粒芯片(chiplet)和GDDR6高速顯存等SoC創新,芯動科技將全球首發全新頂配BXT多核架構, 推出桌面和數據中心的高性能圖形處理器GPU獨立顯卡芯片。
壁仞、沐曦
正在高速融資
除了上述企業,壁仞、沐曦都是當前被業界和資本關注的重點。
成立不到一年,壁仞科技已經累計融資近20億元人民幣。A輪由啟明創投、IDG資本及華登國際中國基金領投11億元人民幣;Pre-B輪由高瓴創投領投,云九資本、高榕資本、金浦科技基金、基石資本、海創母基金等投資機構跟投,現有投資方松禾資本、IDG資本、云暉資本、珠海大橫琴集團繼續追加投資。
壁仞致力于開發通用計算體系,在智能計算領域提供一體化解決方案。首先聚焦于云端通用智能計算,逐步在人工智能訓練和推理、圖形渲染、高性能通用計算等多個領域趕超現有解決方案,實現國產高端通用智能計算芯片的突破。
沐曦集成電路同樣走在高速融資的快車道上,成立不足半年,此前已獲得和利資本領投的億元級別天使輪融資;今年1月又完成了數億元Pre A輪融資,由紅杉資本領投,真格基金跟投,老股東和利資本及天津泰達等繼續加碼。其研發方向擬采用業界最先進的5nm工藝技術,研發全兼容CUDA及ROCm生態的國產高性能GPU芯片。
國產GPU熱賽道下的冷思考
我國發展高端GPU有一定的緊迫性和必要性:
其一,在GPU當前應用最為突出的人工智能領域,已經進入大規模落地階段,我國大部分AI芯片創業公司都在推理市場進行布局。一個重要拐點可能在2022年出現,屆時云端推理市場規模將超過云端訓練。
在國內企業喜迎推理市場大爆發之時,有一個基本點值得重視:進行推理應用的AI模型首先是在算力更強勁的云端被訓練出來的。如果訓練端被英偉達這樣的巨頭所壟斷,那么下游推理的落地、創新,是否會受到限制?
其二,英偉達收購Arm的消息從去年開始一直受到全球范圍內的關注,如果這樁交易成功,意味著一家幾乎“全能型”的算力企業的誕生:無論是高端通用算力,還是移動計算、物聯網,都將處于一家全面占據市場壟斷地位的美國企業掌握中,對全球乃至中國市場的影響是什么?
在種種技術趨勢和大國競爭的背景下,國產GPU不論是產品規劃還是資本介入,都已進入白熱化階段。但越是花團錦簇,越要警惕亂花迷眼,適當的“冷”思考有益身心:
第一,沒有實際產品卻被資本高度重視,“高配”創業團隊是當前的核心優勢,摩爾線程、壁仞、沐曦……都在演繹著創始成員名字撐起高估值的創富故事。
但是長遠來看,芯片技術最終還是需要經年累月的迭代和優化。巨大的研發費用和資本開支是必需,但是下游產業鏈長期、持續的利潤支撐才是芯片跨代發展的強力驅動。也就是說,芯片的成功和成熟需要大量的驗證和出貨,而找到可持續的落地場景才是長期發展的關鍵驅動力。
我國在高端GPU領域缺席多年,目前如景嘉微等,正處于從軍用向信創、民用市場的拓展階段,高端GPU業務從戰略布局成長為核心支柱還有漫長的征途。
第二,天數智芯、登臨等宣布產品“點亮”,固然是國產GPU的一大喜事,但也需要保持清醒,“點亮”只是研發成功,最重要的還要批量生產、落地,離最終的成功還有十萬八千里路。
一位業內人士表示,國產GPU要在云端訓練這個英偉達處于絕對壟斷的主戰場進行對抗,面臨的挑戰非常艱巨,幾大公有云廠商包括浪潮等基本都是采用英偉達的產品,服務器需要系統級的穩定性,不是光搞個加速卡就可以大規模上量的,服務器廠商不會輕易切換新硬件,因為風險太大了。
第三,在GPU領域,英偉達耕耘多年的CUDA開發者生態,也是英偉達生態的核心,很多深度學習的加速庫都是基于CUDA,并且是和英偉達的硬件深度綁定的,這是創業公司難以撼動的壁壘。
國產GPU如天數智芯、登臨等,在產品路線上選擇兼容CUDA。在與一位GPU方向的從業者交流時,他認為:“短期來看,國產GPU兼容CUDA更容易發展,畢竟寫算子是人力密集型行業,用戶遷移的話是需要100%遷移、整套代碼都要在你的片上跑,如果代碼量很小,需要的算子不那么多,難度就比較低。但是長期來看,還是要擺脫兼容思路,發展自有的核心技術。”不過他隨后打趣,“短期和長期的界定不是很好區分,有可能像凱恩斯說的‘長遠來看,我們都死了’,先活下來是硬道理。”
GPU只是半導體產業高歌猛進的一個縮影。在與一位投資人談起芯片領域的融資進度和規模時,他不無感慨地說道,“芯片投融資今年可能會更多,以往融資還有個PPT,接下來可能有些連PPT都沒有。”
先不說有沒有實際產品,最重要的是未來的軟件和開發者生態,這才是大規模商用的前提。國產GPU何時能夠真正突圍成功?值得關注和期待。