哪些系統設計要求SoC復雜性進行飛躍式發展?正確答案絕不僅僅是大家首先想到的大數據中心人工智能(AI)芯片,同時還包括無人駕駛汽車等場景,例如汽車、卡車以及無人機。此外,能夠自主著陸的可重復利用火箭,以及可以進行遠程診斷的醫療設備,也都是這類芯片的需求主力。
目前,很多片上系統(SoC)的設計復雜性已經令人難以想象。例如,今年HotChips研討會上展示的針對邊緣與數據中心等場景的各類全新SoC設計,就令人大開眼界,甚至進一步拓展了我們對于“大”芯片的定義范圍。那么,到底哪些系統設計要求SoC復雜性進行飛躍式發展?正確答案絕不僅僅是大家首先想到的大數據中心人工智能(AI)芯片,同時還包括無人駕駛汽車等場景,例如汽車、卡車以及無人機。此外,能夠自主著陸的可重復利用火箭,可以進行遠程診斷的醫療設備,以及用于支持智能制造的聯網機床控制器,也都是這類芯片的需求主力。
憑借著夸張的尺寸與復雜性,這些芯片開始被人們稱為“怪獸級芯片”。在今天的文章中,我們將共同了解這些怪異芯片設計方案興起背后的驅動因素。簡而言之,此類特殊設計主要是為了實現互聯網連接,這種連接能力不僅可以帶來大數據信息,同時還能實現有助于決策的分布式處理機制。這些與互聯網連接的系統,往往需要通過每秒處理超過萬億次運算的方式自行做出一部分甚至所有決策,而這也進一步推動了又一輪硬件與軟件創新熱潮,并最終令芯片的復雜度邁向前所未有的高度。
圖一:無人駕駛、機器學習以及區塊鏈處理等場景對復雜性的嚴苛要求,帶來了新一代SoC設計方案。
沒錯,也有一部分應用僅負責信息報告,但這類應用通常數量非常有限,而且代表著低價值市場上只能產生較低利潤率的產品門類。為了真正實現價值,聯網系統必須有能力自主做出決策,而這就帶來了獨特的軟件與硬件開發挑戰。
首先,為了能夠做出決策,這些系統需要建立起一整套包含多種類型傳感器,以及由復雜軟件算法驅動的高性能數據處理體系。可以肯定的是,硬件由軟件需求進行驅動,而設備本身也需要支持能夠使系統與現實世界進行交互的其它算法。
沒錯,大家可以在軟件與硬件之間旋轉幾個中間件層,但這會犧牲性能表現,并給多種關鍵任務應用帶來額外的執行成本。
怪獸級芯片中的緩存一致性
怪獸級芯片的時代,要求系統能夠基于復雜的硬件與軟件構建單元實現自主決策。此外,新時代還推動著IP核與EDA設計工具技術的進一步發展,用以確保對這類復雜項目進行妥善管理,同時又不會破壞設計人員在合理時間與成本范圍之內拿出最終方案的可行性。
以怪獸級芯片中的多處理器緩存一致性問題為例,它屬于計算機上的一套子系統,已被應用于部分SoC當中,旨在簡化輔助處理子系統(例如視覺加速器以及其他圖像處理器)的編程流程。
除了主CPU子系統之外,這些怪獸級芯片還具備用于處理特殊數據以及實現有效控制的處理器層級結構。再有,為了進一步增加處理能力,其中包含的處理器數量也在不斷增加,這就要求芯片本身支持數十個緩存一致性端口,并在這些端口上運行異構緩存一致性協議。
圖二:大型SoC設計中的緩存一致性工作原理示意圖。
由于使用多級片上緩存,導致片上調整緩存存儲器多達四級。調整緩存的這套層級結構負責改善內存帶寬,并最大程度減少因片外內存訪問帶來的延遲。事實證明,隨著設計人員不斷尋求對內存性能的提升,高帶寬內存接口的應用也變得越來越普遍。
網格狀芯片
由于各個處理子系統會不斷生成大量數據,這些數據當然需要在整個SoC設備當中進行傳輸。以高級駕駛輔助系統(ADAS)應用中的現有汽車SoC為例,其每天可生成超過20GB數據。因此,在怪獸級芯片當中,多節點網格部分將用于實現片上深度學習處理,旨在將數據轉換為可以操作的對象。
如今,邊緣設備子系統中通常包含20個網格節點,而未來這一數字可能會在高端AI應用當中進一步增長至上百個。舉例來說,用于機器學習的卷積神經網絡(CNN)中的網格節點數量正在快速增加,以便更好地支持訓練與推理任務。此外,芯片設計中的挑戰不僅在于如何實現CNN節點內部的數據轉換,同時也要求我們想辦法在節點之間實現數據移動。
圖三:關于在汽車SoC中實現機器學習與神經網絡架構的示例。
再有,功率與頻域數字也在增加,用以管理這些怪獸級芯片的功耗水平。接下來,怪獸級芯片極高的復雜性也給設計生產率帶來壓力。而且,這種復雜性要求引入IP核與EDA工具,它們負責將手動優化能力與為用戶管理非增值復雜性因素的自動化方案結合起來。
怪獸級芯片的神經系統
用于ADAS與無人駕駛汽車的SoC正是怪獸級芯片中的經典范例。無人駕駛汽車是一種由軟件驅動的應用方案,可能需要多達1億行代碼才能與真實的交通世界順暢交互。因此,能夠支持這種龐大軟件的硬件(即汽車SoC)必須具有高性能、低功耗、經濟高效且功能安全等特點。
因此可以想見,相關的處理與存儲子系統必然在復雜度方面日益提升,并要求利用新一代互連IP以實現巨大的數據傳輸帶寬、低延遲以及更高的能源利用率。換句話說,怪獸級芯片正在給互連技術施加壓力,敦促其盡快發展成合格的SoC神經系統。
是的,處理器是系統當中最核心的IP,而內存帶寬則是決定一切的基礎;但現在,如何利用高級互連IP將SoC中的各個部件組裝起來,則直接決定著SoC設計方案的整體可行性。總結來講,互連IP對于SoC的性能、成本以及發展進度,都將產生極為重大的影響。