《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > DeepSeek繞過英偉達CUDA積極適配國產GPU

DeepSeek繞過英偉達CUDA積極適配國產GPU

2025-02-06
來源:電子工程專輯

如果DeepSeek成功改用國產GPU,英偉達在人工智能領域的壟斷地位將被打破……

DeepSeek自上線以來便以迅猛的速度在全球范圍內獲得了廣泛關注,其日活用戶數在短時間內突破2000萬,成為全球增速最快的AI應用之一。作為一家中國人工智能初創企業,外部算力(主要是GPU)限制逐漸成為制約其進一步發展的瓶頸,如今他們正致力于通過優化其大模型技術的硬件兼容性來應對潛在的外部算力限制。

0.png

DeepSeek與ChatGPT日活用戶增長趨勢對比(來源:AI產品榜)

近期,有報道指出DeepSeek正在繞過英偉達的CUDA(Compute Unified Device Architecture,軟硬體統一計算架構)編程框架,直接使用底層硬件指令集(PTX),為未來適配中國國產圖形處理器(GPU)做準備。這一舉措不僅標志著中國AI技術在硬件兼容性上的重大突破,也為全球AI產業的發展帶來了新的啟示。

0.png

(來源:DeepSeek)

繞開CUDA,直接采用PTX實現更高效的訓練

據多家媒體報道,DeepSeek在研發大型語言模型時,選擇了直接使用英偉達的中間指令集框架Parallel Thread Execution (PTX),而不是常用的CUDA編程框架。這種方法不僅能夠更高效地利用硬件資源,提供更加細粒度的操作控制,還能避免由于CUDA的通用性導致的訓練靈活性損失。

分析表明,這種做法相當于繞過了硬件對訓練速度的限制,使得DeepSeek能夠在五天內完成其他模型需要十天才能完成的訓練任務,極大地提高了效率和靈活性。

韓國未來資產證券(Mirae Asset Securities Research)在對DeepSeek技術論文進行分析時發現,該模型的硬件效率之所以能比Meta等高出10倍,正是因為DeepSeek選擇了從頭開始重建一切。

0.png

(來源:X)

據Tom’s Hardware報道,DeepSeek內部擁有一些擅長寫PTX語言的內部開發者,這使得其在硬體適配方面更加得心應手。只要了解這些硬件驅動提供的一些基本函數接口,就可以仿照英偉達GPU硬件的編程接口去寫相關的代碼,從而讓自家大模型更加容易適配國產硬件。

CUDA是英偉達開發的軟硬體整合技術,是一種高級語言,它允許開發者利用英偉達的圖形處理器(GPU)進行計算。開發者只需要專注于程序和算法最相關的運行邏輯,而不太需要考慮具體的程序是如何在 GPU 等硬件上具體如何執行計算的,從而能夠降低開發難度。

舉例來說,假如一個人會寫匯編語言,雖然能非常高效地操作計算機,但是,匯編語言對于非專業出身的人員難度非常高,哪怕執行一個給變量賦值操作都需要好幾條命令,并且還要了解寄存器、內存等計算機基礎概念。而由于CUDA大大降低了研發大模型的難度,因此全球大模型開發商都傾向選擇使用英偉達的CUDA技術,可以說CUDA 便是為了方便開發基于 GPU 的算法設計的。

然而,DeepSeek卻選擇了另辟蹊徑,從頭開始重建模型,這一做法雖然復雜且難以維護,但卻為其未來適配中國國產GPU打下了堅實的基礎。

適配國產GPU,提升硬件兼容性和自主可控性

DeepSeek這一策略的背后,是對未來可能面臨的算力供應問題的深思熟慮。據報道,DeepSeek擁有一批擅長編寫PTX語言的內部開發者,這將使其在未來適配中國國產GPU時更加得心應手。
例如,摩爾線程智能科技公司在2025年2月宣布成功部署DeepSeek蒸餾模型推理服務,驗證了其自研全功能GPU在復雜AI任務中的支持能力。摩爾線程還計劃開放自主設計的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸餾模型的分布式部署。

0.png

同樣在2月,華為昇騰與潞晨科技聯合發布了基于國產昇騰910B芯片的DeepSeek-R1系列推理API。這一合作通過自研推理引擎深度適配優化昇騰算力,使得DeepSeek-R1的推理性能能夠比肩高端GPU。DeepSeek-R1系列還支持NV H800等常見算力,進一步釋放了異構集群的潛力,滿足不同場景下的推理需求。

0.png

此外,沐曦2月2日聯合中國開源大模型平臺Gitee AI發布了全套DeepSeek-R1千問蒸餾模型;天數智芯在2月4日宣布完成與DeepSeek-R1模型的適配工作,并上線多個大模型服務。
國外芯片企業也紛紛表態,1月25日,AMD宣布將DeepSeek-V3模型集成到其Instinct MI300X GPU上;1月31日,英偉達官宣其NVIDIA NIM微服務預覽版支持DeepSeek-R1模型;1月31日,英偉達宣布DeepSeek能夠在英特爾產品上運行,包括搭載英特爾處理器的AI PC。

0.png

推動國產AI生態建設

DeepSeek開源模型在多語言理解和復雜推理任務中展現了卓越性能,其貢獻不僅在于技術上的領先,更在于持續支持和賦能開源社區。通過與國產GPU廠商的深度合作,DeepSeek為國內AI開發者提供了更強大的硬件支持和更靈活的開發環境。開發者可以基于國產GPU和DeepSeek模型,更高效地進行AI應用開發,推動AI技術在更多領域的落地應用。

通過DeepSeek提供的蒸餾模型,大規模模型的能力可以遷移至更小、更高效的版本,在國產GPU上實現高性能推理。此舉不僅驗證了國產全功能GPU對復雜AI任務的支持能力,也為通用人工智能(AGI)技術的普及化提供了可行路徑。

0.png

國內又有更多云巨頭加入到支持行列中。昨天下午,阿里云和百度智能云先后官宣了對DeepSeek-V3、DeepSeek-R1模型的支持。百度智能云更是直接公布了模型的輸入和輸出價格。加之此前的華為云、騰訊云,目前國內四大云巨頭都已正式支持DeepSeek。此前海外的AWS、微軟智能云等云巨頭已官宣支持。

0.png



Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:[email protected]
主站蜘蛛池模板: 欧美黄视频在线观看 | 特级淫片国产免费高清视频 | 国产欧美综合一区二区 | 免费黄色一级网站 | 国产三级做爰高清在线 | 久久国产精品免费 | 在线播放成人高清免费视频 | 日本欧美一区二区三区高清 | 中文三级视频 | 亚洲精品国产精品国自产观看 | 狠狠色丁香婷婷综合久久片 | 一区二区三区欧美视频 | 91久久国产露脸精品免费 | 韩国一级永久免费观看网址 | 国产成人精品日本亚洲网站 | 久草视频免费 | 久久―日本道色综合久久 | 亚洲黄色片网站 | 手机看片久久高清国产日韩 | 91久久综合九色综合欧美98 | 韩国一级特黄清高免费大片 | 久久综合一区二区三区 | 欧美久久久久久 | 夜色毛片永久免费 | 久久香蕉精品视频 | 亚洲国产日韩欧美一区二区三区 | 日本一级爽毛片在线看 | 国产一区二区三区日韩 | 夜间福利在线观看 | 99久久精品免费观看国产 | 久久三级毛片 | 香蕉超级碰碰碰97视频在线观看 | 国产精品99r8免费视频2022 | 在线视频 亚洲 | 国产精品成人不卡在线观看 | 国产精品欧美一区二区三区 | 国产一级第一级毛片 | 欧美日本一区二区三区 | 久久黄色影片 | 美女视频黄.免费网址 | 手机看片福利视频 |