《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > AI大模型時代,存算一體開啟智算未來

AI大模型時代,存算一體開啟智算未來

2023-09-07
來源:集微網
關鍵詞: AI 大模型 ChatGPT

  ChatGPT一經發布便引起國內外強烈反響,成為史上用戶數增長最快的消費者應用,也讓人工智能再次回到大眾關注的焦點。然而,高昂的部署成本已然是人工智能進入市場的主要障礙:從小模型到大模型,過去10年內AI算法對算力的需求提升了40萬倍;大模型開發和訓練一次的成本便需1200萬美元。各大公司為籌建數據中心斥巨資搶購GPU的新聞不時見諸報端,越來越多的人希望尋找一種新方案,扭轉這種高投入低效率的現狀。

  存算一體作為新一代計算技術,在數據運算和存儲過程中實現了一體化設計,旨在突破“存儲墻”實現超低功耗和更強的并行計算能力,被認為是后摩爾時代最重要的發展方向之一。目前,存算一體技術在國內外企業的不懈努力下已經實現初步的商業化應用。或許數年之后,存算一體芯片就將進入千行百業,為人工智能的大規模應用提供不竭的算力支撐。

  AI潮開啟,算力面臨瓶頸

  自1956年美國達特茅斯學院首次提出人工智能的概念以來,AI技術不斷獲得突破和快速發展,對算力的需求也在不斷增加。2006年以前,AI算法尚未出現突破性進展,AI的訓練數據多以小數據為主,這一階段AI對算力的需求主要由CPU提供。2006年之后,隨著AI算法在深度學習上獲得突破,特別是谷歌旗下DeepMind團隊開發的AI系統AlphaGo戰勝韓國棋手李世石,引發全球AI熱潮,AI領域對于算力的需求就在不斷增加。研究人員發現,相比于CPU,GPU具備并行計算特性,在深度學習等人工智能先進算法所需的“暴力計算”場景中更為高效,使得研究機構和AI公司開始廣泛采用GPU進行人工智能領域的研究和應用。

  2022年11月,OpenAI公司推出AI大模型ChatGPT,再次引發全球AI大模型發展浪潮。這一趨勢進一步加大了AI領域對算力的需求。目前,英偉達集成H100的計算卡已經達到一卡難求地步,人們預測GPT-4可能在10000到25000張A100上進行訓練,Meta、特斯拉、Stability AI等都投入到對高性能GPU的搶購之中。這一形勢推動了AI芯片的投資和發展。

  不過,當前主流AI芯片在為大模型提供算力支持時的表現并不完美,尚存很多不足之處。者采訪北京大學集成電路學院院長蔡一茂時,他便指出,AIGC等人工智能新興技術的發展離不開算力,算力的基礎是人工智能芯片。當前人工智能技術的快速更新迭代對硬件部署提出了多個挑戰。

  首先是算力規模與算力密度上的需求。大模型的出現促使AI對大規模芯片算力的需求更加強烈,按照傳統技術路線簡單堆砌芯片無法實現期待的算力規模增長,需要從提高算力密度和算力集成度等多個角度同時解決問題。其次是芯片能效問題變得更加突出。芯片高功耗導致的散熱等問題,不僅是芯片算力提升的主要障礙,也導致了大模型訓練與推理的成本巨大。當前AI芯片能效依然低下,大模型每次訓練和推斷的電費成本昂貴,導致當前大模型的應用經濟性較低。

  第三是AI芯片在執行計算密集型任務時面臨的“內存墻”問題。這導致計算芯片的功耗和性能都受限于處理器和存儲器之間的數據搬運,嚴重限制了AI芯片在計算規模、密度、效率等方面的提升。此外,AI芯片的通用性和可編程性趨勢也值得關注。目前大模型技術算法有趨同的發展趨勢,以Transformer為代表的網絡模型正在成為主流。定制化的AI芯片將難以滿足AI產業的發展,芯片的通用性和可編程性十分重要。

  性能優勢明顯,存算一體將成解決方案

  其實,GPU并非AI大模型部署的唯一算力擔當。廣義而言,AI芯片指的是專門用于處理人工智能應用中大量計算任務的模塊,也就是說面向人工智能領域的芯片均被稱為AI芯片。從技術架構來看,目前用于AI處理的主流芯片主要包括GPU、FPGA、ASIC,以及存算一體芯片等。其中,GPU目前被運用的最為廣泛,如圖像渲染、特效制作等,在數據中心、超級計算機等大型計算設施中均在采用。FPGA是一種靈活可編程的硬件平臺,具備較高的計算性能和可定制性等優點,在AI推理應用中表現較為出色。但這兩種芯片也存在上面所述的問題。ASIC是針對用戶對特定電子系統的需求而設計的專用集成電路,是固定算法最優化設計的產物。在大模型技術算法趨同的情況下,定制化AI芯片整體市場規模有可能受到限制。

  存算一體芯片被認為是下一代芯片,雖然目前還受限于成熟度,應用范圍不夠廣泛,但未來卻有著極大的發展空間。對此,蔡一茂便指出,新興的存算一體和近存計算技術直接在存儲器內部或附近進行計算,通過將計算和存儲功能融合在一起提高數據處理和計算的效率和成本。在大模型時代,存算一體技術有望大幅度提升AI芯片的計算密度和能效,緩解AI 芯片性能與功耗之間的矛盾,提升大模型部署的經濟性。特別是針對大模型的推理,存算一體保持權重的特點與大模型中大規模的參數部署需求相匹配,可能是存算一體技術最先服務大模型應用的場景之一。

  知存科技創始人、CEO王紹迪在接受記者采訪時也表示,傳統芯片是先把數據從存儲系統中讀取出來,放到乘、加法器當中做計算,然后再把計算結果傳回到存儲系統當中。這種大規模的數據遷移導致了帶寬瓶頸和功耗浪費。存算一體則從計算架框的根本上避免了這種情況發生,同時帶來一系列性能優勢。

  首先是運算的性能更高。存算一體芯片的計算能力取決于存儲器的容量規模。所有電子設備當中都會集成存儲器,存儲與計算相伴而行,有運算的地方就需要對數據進行存儲,比如可穿戴手環中可能會集成2M的SD卡,筆記本電腦中會安裝1TB的NAND Flash,數據中心的閃存芯片可能會達到256TB。如果采用存算一體芯片,隨著存儲容量規模的提高,其運算能力也會隨之提高。

  其次是功耗更低。同樣,由于數據傳輸路徑的優化,存算一體技術在提高傳輸效率的同時,節省了數據傳輸的損耗,帶來更好的能效比、低功耗,在相同算力下,AI部分能效比將有2-3個數量級的提升,更低散熱成本,更高可靠性。

  第三是成本更低。單位算力成本遠低于傳統計算芯片。同時,存算一體可以采用更成熟的制造工藝,大算力芯片往往需要采用先進工藝,這使存算一體芯片的晶圓成本低得多。再考慮到配套的外圍芯片、元器件等因素,整個系統成本將有5倍左右降低。正是因為這些基于基礎架構革新所帶來的性能提升,存算一體技術有望在很大程度上解決AI大模型面臨的算力挑戰。隨著存算一體芯片逐漸進入市場,其將為人工智能的大規模應用奠定基礎。

  從終端到云端,未來發展讓人期待

  現在的AIGC不僅是云端,在終端側也有很多企業推動其應用發展。云端方面,越來越多大模型產品問世,僅我國10億級參數規模以上大模型已超80個,其中不乏科技巨頭發布的產品,如百度的“文心一言”、阿里云的“通義千問”、華為的“盤古大模型”等;終端方面,邊緣計算實現了計算資源和服務的下沉,能夠有效降低交互延遲、緩解數據傳輸帶寬壓力,目前高通推出混合式AI的概念、蘋果也在開發“AppleGPT”AI模型,未來將呈現AIGC技術從云端向邊緣延伸的趨勢。

  在這樣的大背景下,存算一體也將沿著云端與終端雙向并行的路徑持續發展。王紹迪強調,存算一體芯片的適用領域其實十分寬廣。如果按終端和云端兩個領域劃分的話,從終端側的可穿戴設備、智能手機、無人機、安防,到規模更大的邊緣服務器、自動駕駛,再到云端的AIGC大模型應用,存算一體芯片都可以去做。

  2022年,知存科技率先量產全球首顆存算一體SoC芯片WTM2101。一年左右時間,WTM2101已在TWS耳機、助聽器、AR眼鏡、智能家居控制等終端設備中實現商用,提供語音、輕量級視頻等AI處理。

  在終端應用中,AI計算需要高算力下的低功耗。WTM-2系列就定位于小功率的電池供電場景,但可以提供一定強度的AI算力。在極低功耗下,傳統芯片技術很難滿足深度學習模型的運算需求,存算一體卻在一定程度上可以提供上算力支持。

  今年知存科技將推出具有更高算力的WTM-8系列芯片。該系列芯片將主要面向移動智能終端如手機、XR、無人機等,覆蓋2D(1080P-8K)與3D視頻處理場景。與WTM2101相比,WTM-8系列芯片采用了第二代3D存內計算架構,能夠提供算力至少24Tops,計算精度達12-bit,目前已經完成投片,預計今年下半年或明年年初就可以推向市場。

  云端市場也是存算一體的發展方向。王紹迪透露,知存科技除上述兩個系列的產品之外,還在規劃具備更高的性能的芯片系列,可用于AI服務器,應對大模型市場的發展需求。一旦該系列芯片發布,知存科技的產品線布局將變得更加厚實且合理,從低性能到高性能,從終端側到云端計算,都有著相應的產品覆蓋。

  目前,全球范圍內無論學術界還是工業界均對存算一體投入大量資源進行開發。不過蔡一茂也指出,在大模型到來之前,存算一體研究多數以零散的技術攻關為主,缺乏面向大算力方向的整體布局,也缺乏主導的應用需求牽引,因此距離大規模進入市場還有一定距離。但大模型是值得期待的存算一體應用場景,其對算力能效和密度的強烈需求正是存算一體的優勢所在。面向大模型部署,從業者需要對存算一體進行體系化布局,從算法、框架、編譯器、工具鏈、指令集、架構、電路等跨層次協同設計,形成全棧式體系、工具鏈及生態鏈。大模型的到來必將極大推動存算一體的技術落地,其未來應用潛力和部署規模都讓人期待。


 更多精彩內容歡迎點擊==>>電子技術應用-AET<<

  微信圖片_20210517164139.jpg


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:[email protected]
主站蜘蛛池模板: 七七国产福利在线二区 | 在线亚洲精品自拍 | fulidown国产精品合集 | 国产精品一一在线观看 | 亚洲欧美视频网站 | 一本色道久久88亚洲精品综合 | 亚洲精品成人网 | 国产欧美日韩综合二区三区 | 夜色www国产精品资源站 | 在线亚洲精品自拍 | 亚洲国产精品aaa一区 | 亚洲欧美成人综合久久久 | 日韩午夜三级 | 日韩中文在线观看 | 亚洲精品国产第一区二区多人 | 欧美一级毛片特黄大 | 失禁h啪肉尿出来高h健身房 | 国产三级精品三级国产 | 久久精品片 | 国产毛片精品 | 日本久久久久久久久久 | 免费手机黄色网址 | 日韩理论在线 | 免费人成在线观看网站视频 | 亚洲精品中文字幕在线 | 国产日本在线 | 欧美a大片| 国产男女乱淫真视频全程播放 | 日韩在线专区 | 欧美一级棒 | 亚洲日本欧美在线 | 久久久久欧美精品网站 | 欧美大胆一级视频 | 成人欧美一区二区三区在线观看 | 久久综合精品国产一区二区三区 | 男女免费爽爽爽在线视频 | 久草免费在线播放 | 日本亚洲成高清一区二区三区 | 91av福利视频| 久久久久久免费视频 | 久草视频新 |