《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 業界動態 > 谷歌開源 GPipe 庫,主要用于大規模深度學習模型的快速訓練

谷歌開源 GPipe 庫,主要用于大規模深度學習模型的快速訓練

2019-04-26

  谷歌 人工智能部門 最近開源了 GPipe ,這是一個用于快速訓練大規模深度學習模型的 TensorFlow 類庫。

  深層神經網絡(DNN)主要用于解決自然語言處理和視覺目標識別等人工智能任務。以視覺識別為例,該領域的最新方法通常以 ImageNet 挑戰賽 的獲勝方案為基準。每一屆冠軍的成績都優于前一屆;當然,模型的復雜度也會相應增加。2014 年的冠軍 GoogLeNet 通過使用 400 萬個模型參數達到了 74.8% 的 top-1 準確率,而 2017 年的冠軍 Squeeze-and-Excitation Networks 則使用了 1.458 億個參數并達到了 82.7% 的 top-1 準確率。

20130219_122824_907.jpg

  在訓練神經網絡的時候,模型大小的增加通常會引起問題。為了在合理的時間內完成訓練,我們把大部分的計算任務委托給了加速器:諸如 GPU 和 TPU 之類的專用硬件。但是這些設備的內存有限,這也就限制了訓練模型的大小。我們可以通過一些方法來減少模型對內存的依賴,比如將數據從加速器內存中置換出去,但這會大大減慢訓練速度。另一種解決方案則是模型分區,這可以讓模型同時在多個加速器中并行執行。對順序性 DNN 來說,最好的策略是按層劃分模型,然后由不同的加速器來訓練不同的層。但是由于 DNN 的順序性本質,有些時候可能只有一個加速器在工作,別的加速器則因為需要等待其它層的訓練結果而閑置下來。

  GPipe 通過進一步細化訓練任務解決了這個問題,它將批量任務分解為更細小的“微批量”任務,并在每一層中管道化執行這些“微批量”任務。這樣,下一層的加速器就可以優先處理上一層已完成的“微批量”任務結果,而不需要等待整個訓練過程的結束。

  通過使用 GPipe 以及 8 個 TPUv2(第二代 TPU 芯片),谷歌研究人員能夠用 18 億個參數來訓練視覺目標識別模型:在使用 GPipe 的情況下,單個 TPUv2 可訓練的參數量增加了 5.6 倍。通過此次訓練的大規模模型,ImageNet 數據驗證的準確率達到了 84.7%,超過了 2017 年奪冠時的 82.7%。

  GPipe 的模型分區除了能支持更大的模型以外,它也允許多個加速器并行訓練所指定的模型。研究報告稱,使用 4 倍以上的加速器可以達到 3.5 倍的加速效果。

  Gpipe 目前是 Lingvo 框架 的一部分,該框架主要用來在 TensorFlow 中構建順序神經網絡模型。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:[email protected]
主站蜘蛛池模板: 国产精品揄拍一区二区久久 | 免费欧洲毛片a级视频无风险 | 国产一区在线播放 | 亚洲精品大片 | 久久久精品2018免费观看 | 国产精品99久久99久久久看片 | 一个人看的www片免费视频中文 | 在线观看一二三区 | 国产一级真人毛爱做毛片 | 日本69色视频在线观看 | 日本精品一区二区三区视频 | 免费看香港一级毛片 | 午夜a毛片 | 日产一区2区三区有限公司 日产一区两区三区 | 澳门毛片免费观看 | 最新主播福利视频在线观看 | 国产精品久久久久久久久久影院 | 亚洲精品久久九九精品 | 国产自在自线午夜精品视频在 | 中文字幕在线观看不卡视频 | 日韩精品免费一区二区 | 久久精品无遮挡一级毛片 | 欧美午夜影院 | 91香蕉国产在线观看免费永久 | 碰碰久久 | 成人a毛片免费视频观看 | 国产永久高清免费动作片www | 国产99视频在线观看 | 亚洲精品综合在线 | 一级做性色a爰片久久毛片免费 | 美女视频黄a视频美女大全 美女视频黄a视频免费全程 | 怡红院亚洲怡红院首页 | 毛片在线免费播放 | 欧美同性videos在线可播放 | 国产一级毛片午夜福 | 国产波多野结衣中文在线播放 | 免费一级毛片免费播放 | 欧美日韩精品高清一区二区 | 色色视频免费网 | 亚洲国产成a人v在线观看 | 精品视自拍视频在线观看 |