如果AlphaGo采用寒武紀處理器的架構,只需要一臺個人電腦大小的主機,就可以運行起來,而且運行速度應該會更快。
如何能讓一張普通的圖片具有藝術性呢?現在,借助一款應用了人工智能算法的手機修圖軟件 Prisma,你可以將任何照片變成名畫風格(比如梵高、莫奈、畢加索或宮崎駿風格),且極具藝術品質。連俄羅斯總理梅德韋杰夫都忍不住在社交網站上曬出了一張用Prisma處理過的、有著濃郁鉛筆畫風格的風景照——濾鏡里的莫斯科夜晚。
與普通濾鏡不同,Prisma采用深度學習算法,能夠利用復雜的人工神經網絡,抽象出給定繪畫作品里一些高級的隱藏特征,學習畫家的繪畫風格,再把這個風格“智能”地應用到一張新圖片上,是第一款人工智能的平民化應用。不過,美中不足的是,因為人工智能算法計算量極大,用戶需要把照片發送到遠程的服務器,幾十秒后才能看到預覽效果。
人工智能算法運算量到底有多大?想像一下,同樣采用了人工智能算法的AlphaGo,需要用到上千塊傳統處理器(CPU)和上百塊圖形處理器(GPU)。
很顯然,在人工智能迎來新一波復興的今天,傳統處理器正成為阻礙人工智能普及的瓶頸。如果沒有一款專門為神經網絡設計的芯片,既高效、低耗、體積小,還能夠嵌入智能終端設備,我們就無法與人工智能真正“親密接觸”。好消息是,今年3月,一家剛剛成立的芯片設計公司——寒武紀公司(中國科學院計算技術研究所下屬的產業化公司),已經發布了世界上第一款神經網絡處理器指令集(Cambricon),而且正走在商業化的路上。
值得一提的是,寒武紀公司的首席執行官陳天石和首席科學家陳云霽,是一對親兄弟。哥哥陳云霽是計算機體系結構專家,弟弟陳天石是人工智能專家。兄弟兩人的合作始于用人工智能技術支持通用處理器的研發,而后又轉向用處理器技術來支持人工智能的發展。
2014年,陳天石、陳云霽與法國信息與自動化研究所(INRIA)的奧利維耶·泰蒙(Olivier Temam)博士共同發表的學術論文《DianNao:一種小尺度的高吞吐率機器學習加速器》(DianNao: A Small-Footprint High-ThroughputAccelerator for Ubiquitous Machine-Learning ),獲得了ASPLOS(Architectural Support for Programming Languages and Operating Systems ,編程語言和操作系統的體系結構支持)國際會議最佳論文,吸引了國際同行的目光。隨后發表的幾篇論文,更是奠定了他們在神經網絡處理器這個領域的國際領跑地位。
傳統處理器指令集是為進行通用計算發展起來的,基本操作為算術運算和邏輯運算。而深度學習算法,基本操作是對人工神經網絡中的虛擬神經元和突觸進行處理。作為一款神經網絡處理器,寒武紀處理器指令集的一條指令即可完成多個神經元的并行處理,而傳統處理器需要數百甚至上千條指令才能完成一個神經元的處理。這也就解釋了,為什么傳統處理器運行深度學習算法時效率會如此低下。
“如果把深度學習看作切肉,傳統的處理器就是瑞士軍刀,我們的專用神經網絡處理器則相當于菜刀。瑞士軍刀通用性很好,什么都可以干,但干得不快,菜刀是專門用來切菜的,在切肉這件事情上,效率當然更高,”接受《環球科學》采訪時,寒武紀公司首席執行官陳天石形象地比喻,“在運行人工智能算法方面,寒武紀處理器比通用處理器好百倍到千倍,如果AlphaGo采用寒武紀處理器的架構,只需要一臺個人電腦大小的主機,就可以運行起來,而且運行速度應該會更快”。
今年7月,寒武紀公司與中國科學院計算技術研究所又共同發布了國際上首個稀疏深度學習處理器(Cambricon-X),性能更好,功耗更低。在65nm工藝下,Cambricon-X芯片面積僅為6.38平方毫米,最高每秒能進行5000億次神經網絡基本運算,性能是高端GPU的10倍,能耗卻僅為其3.4%。
目前,寒武紀公司正緊鑼密鼓地將自己的芯片推向產業化。陳天石介紹說,“芯片從研發、量產到商用,是一個以年為單位的周期,所以最快明年,大家應該可以在市面上看到使用寒武紀技術的芯片產品,比如在智能終端、智能機器人、手機、安防監控或云端服務器上”。
神經網絡處理器的誕生,或許會將人工智能推到一個全新的高度。“我們要讓人工智能的門檻更低,讓研究人員可以自由地嘗試規模更大、更復雜的算法。這也是我們給公司取名‘寒武紀’的寓意所在”,陳天石說,“像地質年代中的寒武紀迎來生命大爆發一樣,我們希望,寒武紀芯片也能開啟人工智能的新紀元”。