·恩智浦展示了應用于 MCU 的 Glow 神經網絡編譯器為基于視覺和語音的機器學習應用帶來的諸多優勢。恩智浦也是首家針對 MCU 實現相較于標準版 Glow 2 至 3 倍性能的半導體供應商
· 開源 Glow 編譯器最初由 Facebook 開發,恩智浦現在將其集成到 eIQ?機器學習軟件開發環境中,為旗下 i.MX RT 系列跨界 MCU 提供高性能推理
· 恩智浦的 Glow 實施面向 Arm? Cortex?-M 內核和 Cadence? Tensilica? HiFi 4 DSP,為 i.MX RT 系列跨界 MCU 提供特定平臺的優化
荷蘭埃因霍溫——2020 年 8 月 5 日——恩智浦半導體 NXP Semiconductors N.V.今日發布了 eIQ機器學習(ML) 軟件對 Glow神經網絡(NN) 編譯器的支持功能,針對恩智浦的 i.MXRT 跨界 MCU,帶來業界首個實現以較低存儲器占用提供更高性能的神經網絡編譯器應用。 Glow 編譯器由 Facebook開發,能夠集成特定于目標的優化,恩智浦利用這種能力,使用適用于 Arm Cortex-M內核和 Cadence Tensilica HiFi 4 DSP 的神經網絡算子庫,最大程度地提升 i.MX RT685 以及 i.MX RT1050和 RT1060 的推理性能。此外,此功能已集成到恩智浦的 eIQ 機器學習軟件開發環境中,在恩智浦的MCUXpresso SDK 中免費提供。
使用 Glow 充分發揮 MCU 架構特性的優勢
2018 年 5 月,率先開發 PyTorch 的 Facebook 推出了開源社區項目 Glow(Graph Lowering 神經網絡編譯器),其目的是提供優化,提高一系列硬件平臺上的神經網絡性能。作為一種神經網絡編譯器, Glow基于未優化的神經網絡生成高度優化的代碼。這個特點有別于典型的神經網絡模型處理,后者采用即時編譯,因而需要更高的性能,還會增加存儲器開銷。像 Glow這樣直接運行優化代碼可以顯著降低處理和存儲器要求。恩智浦也在 Glow 開源社區中扮演著積極角色,幫助推廣和普及 Glow 的新功能。
Facebook 軟件工程經理 Dwarak Rajagopal表示:“GitHub 中提供的標準版 Glow 可以直接在任何設備上運行,讓用戶能夠靈活地針對感興趣的基礎架構編譯神經網絡模型,包括 Arm Cortex-A 和 Cortex-M 內核以及 RISC-V 架構。恩智浦使用充分利用 MCU 計算元件的專用軟件庫,實現了 2-3 倍的性能提升,展示了從基于云的高端機器到低成本的嵌入式平臺的廣泛范圍內,將 Glow 神經網絡編譯器用于機器學習應用的諸多優勢。”
優化機器學習框架以增強競爭優勢
未來幾年內,對機器學習應用的需求預期將會大幅增加。據 TIRIAS Research預測,到 2025年, 98%的邊緣設備將使用某種形式的機器學習/人工智能。根據市場預測,到 2025 年,預計將有 180 億至 250 億部設備包含機器學習功能,盡管它們可能并沒有專用的機器學習加速器。消費型設備制造商和嵌入式物聯網開發人員將需要優化機器學習框架,以便實現使用 MCU 的低功耗邊緣嵌入式應用。
恩智浦半導體資深副總裁兼邊緣處理業務總經理 Ron Martino 表示:“借助 eIQ 機器學習軟件框架,利用高度集成的 i.MX 應用處理器和高性能 i.MX RT 跨界 MCU 的強大功能,恩智浦正在推動機器學習功能在邊緣設備上的實現。隨著 i.MX RT 系列跨界 MCU 增加對 Glow 的支持,我們的客戶能夠編譯深度神經網絡模型,為他們的應用帶來競爭優勢。”
恩智浦的面向機器學習的邊緣智能環境解決方案是一個全面的工具包,提供開發人員需要的構建模塊,幫助他們高效地在邊緣設備中實施機器學習。 Glow 整合到 eIQ 軟件后,機器學習開發人員將擁有全面的高性能框架,可在包括 i.MX RT 跨界 MCU 和 i.MX 8 應用處理器的恩智浦邊緣處理解決方案上進行擴展。客戶擁有了更強大的工具,能夠在 i.MX RT MCU和 i.MX應用處理器上開發機器學習語音應用、對象識別、人臉識別等應用。
利用恩智浦的 Glow 神經網絡實施來提高性能
eIQ 現在包含對 Glow 和 TensorFlow Lite 的推理支持,對于這些實施,恩智浦通常會執行基準測試以衡量其性能。 MCU 基準測試包括標準神經網絡模型,例如 CIFAR-10。以 CIFAR-10 模型為例,恩智浦采集的基準測試數據表明了如何利用 i.MX RT1060 器件(采用 600MHz Arm Cortex-M7)、 i.MX RT1170器件(采用 1GHz Arm Cortex-M7)和 i.MX RT685 器件(采用 600 MHz Cadence Tensilica HiFi 4 DSP)的性能優勢。
恩智浦對 Glow 的支持離不開 Cadence 為 Tensilica HiFi 4 DSP 提供的神經網絡庫(NNLib),該 DSP 提供了 4.8GMAC 性能。同樣以 CIFAR-10 為例,恩智浦的 Glow 實施使用這一 DSP 來加快神經網絡運算,實現了 25 倍的性能提升。
Cadence Tensilica IP 企業副總裁 Sanjive Agarwala 表示:“Tensilica HiFi 4 DSP 最初集成在 i.MX RT600跨界 MCU 中,目的是提高各種不同的音頻和語音處理應用的速度。但是,當有越來越多機器學習推理應用瞄準了低成本、低功耗的 MCU 級應用時, HiFi 4 DSP 憑借固有的 DSP 計算性能,成為加快這些神經網絡模型的理想選擇。隨著恩智浦在 eIQ 機器學習軟件中實施 Glow, i.MX RT600 MCU 的客戶能夠利用該 DSP 來滿足多種機器學習應用的需求,包括關鍵詞檢索(KWS) 、語音識別、降噪和異常檢測。”
Arm 公司機器學習營銷副總裁 Dennis Laudick 表示:“恩智浦將 Arm CMSIS-NN 軟件庫包括在 elQ 中,目的是最大程度地提升性能,減少 Arm Cortex-M 內核上的神經網絡存儲器占用。以 CIFAR-10 神經網絡模型為例,恩智浦能夠利用 CMSIS-NN 實現 1.8倍的性能提升。其他神經網絡模型應該能夠產生相似的結果,這清晰地展示了這款高級編譯器和我們的優化神經網絡算子庫的優勢。”
上市時間
恩智浦的集成 Glow 神經網絡編譯器的 eIQ 軟件現已上市,通過 i.MX RT600 跨界 MCU、 i.MX RT1050和 i.MX RT1060 跨界 MCU 的 MCUXpresso SDK 提供。未來將會推出適用于恩智浦其他 MCU 的集成Glow 神經網絡編譯器的 eIQ 軟件。
關于 i.MX RT 系列跨界 MCU
i.MX RT 系列是業內首個跨界 MCU 產品組合,以經濟的價格,提供高性能的 Arm Cortex-M 內核、實時功能和 MCU 可用性。該系列代表了低功耗應用處理器與高性能微控制器的融合。 i.MX RT 系列填補了傳統 MCU 和 i.MX 應用處理器之間的空白,為 MCU 客戶提供了顯著提高性能和改進集成的方法,一如既往地簡單易用。