《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 基于HLS工具的CNN加速器的設計與優化方法研究
基于HLS工具的CNN加速器的設計與優化方法研究
2021年電子技術應用第3期
程佳風,王紅亮
中北大學 電子測量技術國家重點實驗室,山西 太原030051
摘要: 基于軟硬件協同設計的思想,利用HLS工具,在PYNQ-Z2平臺上設計并實現了一個卷積神經網絡加速器,對卷積運算采用矩陣切割的優化方法,均衡了資源消耗和計算資源,使得加速器的性能達到了最優。利用MNIST數據集對加速器IP核進行性能測試,實驗結果表明:對單張圖片的測試,該加速器相對于ARM平臺實現了5.785的加速效果,對于1 000張圖片的測試則可達到9.72的加速效果,隨著測試圖片數量的不斷增加,加速器的性能也將越來越優。
中圖分類號: TN108.1
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200841
中文引用格式: 程佳風,王紅亮. 基于HLS工具的CNN加速器的設計與優化方法研究[J].電子技術應用,2021,47(3):18-21,26.
英文引用格式: Cheng Jiafeng,Wang Hongliang. Research on the design and optimization method of CNN accelerator based on HLS tools[J]. Application of Electronic Technique,2021,47(3):18-21,26.
Research on the design and optimization method of CNN accelerator based on HLS tools
Cheng Jiafeng,Wang Hongliang
National Key Laboratory for Electronic Measurement Technology,North University of China,Taiyuan 030051,China
Abstract: Based on the idea of software and hardware co-design, this article uses HLS tools to design and implement a convolutional neural network accelerator on the PYNQ-Z2 platform, and uses the matrix cutting optimization method for convolution operations to balance resource consumption and computing resources , so that the performance of the accelerator is optimized. This article uses the MNIST data set to test the performance of the accelerator IP core. The experimental results show that: for a single image test, the accelerator achieves an acceleration effect of 5.785 compared with the ARM platform, and an acceleration of 9.72 for a 1000 image test. As a result, as the number of test images continues to increase, the performance of the accelerator will become better and better.
Key words : convolutional neural network(CNN);PYNQ-Z2;HLS tool;accelerator

0 引言

    近年來,卷積神經網絡的應用范圍越來越廣泛,其應用場景也日益復雜,卷積神經網絡的計算密集和存儲密集特征日益凸顯,成為快速高效實現卷積神經網絡的限制。于是基于GPU[1]、ASIC[2]、FPGA[3]的不同的加速器平臺被相繼提出以提升CNN的設計性能。GPU的電力消耗巨大,硬件結構固定,限制了卷積神經網絡在嵌入式設備的應用;ASIC開發成本極高,靈活性低,不適合搭載復雜多變的卷積神經網絡;FPGA具有功耗低、性能高、靈活性好的特點,因此更加適用于卷積神經網絡硬件加速的開發研究,但由于Verilog HDL開發門檻高,開發周期相對較長,影響了FPGA在卷積神經網絡應用的普及[4-5]

    本文基于軟硬件協同的思想,利用HLS工具,在PYNQ-Z2上實現了一個卷積神經網絡加速器,并采用矩陣切割的設計方法對卷積核運算進行優化。




本文詳細內容請下載:http://www.rjjo.cn/resource/share/2000003402




作者信息:

程佳風,王紅亮

(中北大學 電子測量技術國家重點實驗室,山西 太原030051)

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 亚洲国产第一区二区香蕉日日 | 国产美女主播一级成人毛片 | 亚洲国产精久久久久久久 | 中文字幕在线观看网址 | 韩国三级日本三级香港三级黄 | 精品国产理论在线观看不卡 | 一级做a爰片久久毛片欧美 一级做a爰片久久毛片人呢 | 玖玖这里只有精品 | 黄www片 | 日本免费人做人一区在线观看 | 男女扒开双腿猛进入爽爽视频 | 欧美毛片a级毛片免费观 | 一个人免费观看日本www视频 | 一级毛片视频免费 | 国产成人网 | 99热久久国产精品一区 | 97视频在线播放 | 久草网首页 | 亚洲高清综合 | 欧美成人性色区 | 国产免费久久 | 99久久精品免费看国产高清 | 五月色婷婷琪琪综合伊人 | 久久综合给会久久狠狠狠 | 日韩欧美成末人一区二区三区 | 国产在线精品一区二区不卡 | 日韩国产毛片 | 亚洲一区二区三区欧美 | 成年人毛片 | 99re热视频这里只精品 | 真实国产乱人伦在线视频播放 | 国产成人久久精品推最新 | 国产三级精品美女三级 | 黄色一级网址 | 五月激情丁香婷婷综合第九 | 成人欧美精品久久久久影院 | 国产精品亚欧美一区二区三区 | 精品国产一区二区三区不卡蜜臂 | 国产精品在线观看 | 欧美成人综合在线观看视频 | 丝袜精品 欧美 亚洲 自拍 |