收獲接近16.6萬個Star、見證深度學習崛起的TensorFlow,地位已岌岌可危。并且這次,沖擊不是來自老對手PyTorch,而是自家新秀JAX。最新一波AI圈熱議中,連fast.ai創始人Jeremy Howard都下場表示:JAX正逐漸取代TensorFlow這件事,早已廣為人知了。現在它就在發生(至少在谷歌內部是這樣)。
LeCun表示,當初谷歌的TensorFlow確實比Torch更火。然而Meta的PyTorch出現之后,現在其受歡迎程度已經超過TensorFlow了。現在,包括Google Brain、DeepMind以及不少外部項目,都已經開始用上JAX。
典型例子就是最近爆火的DALL·E Mini,為了充分利用TPU,作者采用了JAX進行編程。有人用過后感嘆:這可比PyTorch快多了。據《商業內幕》透露,預計在未來幾年內,JAX將覆蓋谷歌所有采用機器學習技術的產品。這樣看來,如今大力在內部推廣JAX,更像是谷歌在框架上發起的一場“自救”。
JAX從何而來?
關于JAX,谷歌其實是有備而來。早在2018年的時候,它就由谷歌大腦的一個三人小團隊給搭出來了。研究成果發表在了題為Compiling machine learning programs via high-level tracing的論文中:Jax是一個用于高性能數值計算的Python庫,而深度學習只是其中的功能之一。自誕生以來,它受歡迎的程度就一直在上升。
最大的特點就是快。
一個例子感受一下。比如求矩陣的前三次冪的和,用NumPy實現,計算需要約478毫秒。用JAX就只需要5.54 毫秒,比NumPy快86倍。為什么這么快?原因有很多,包括:
1、NumPy加速器。NumPy的重要性不用多說,用Python搞科學計算和機器學習,沒人離得開它,但它原生一直不支持GPU等硬件加速。
JAX的計算函數API則全部基于NumPy,可以讓模型很輕松在GPU和TPU上運行。這一點就拿捏住了很多人。
2、XLA。XLA(Accelerated Linear Algebra)就是加速線性代數,一個優化編譯器。JAX建立在XLA之上,大幅提高了JAX計算速度的上限。
3、JIT。研究人員可使用XLA將自己的函數轉換為實時編譯(JIT)版本,相當于通過向計算函數添加一個簡單的函數修飾符,就可以將計算速度提高幾個數量級。
除此之外,JAX與Autograd完全兼容,支持自動差分,通過grad、hessian、jacfwd和jacrev等函數轉換,支持反向模式和正向模式微分,并且兩者可以任意順序組成。
當然,JAX也是有一些缺點在身上的。
比如:
1、雖然JAX以加速器著稱,但它并沒有針對CPU計算中的每個操作進行充分優化。
2、JAX還太新,沒有形成像TensorFlow那樣完整的基礎生態。因此它還沒有被谷歌以成型產品的形式推出。
3、debug需要的時間和成本不確定,“副作用”也不完全明確。
4、不支持Windows系統,只能在上面的虛擬環境中運行。
5、沒有數據加載器,得借用TensorFlow或PyTorch的。
6月19日消息 據中央廣播電視總臺中國之聲《新聞超鏈接》報道,近日,話題#谷歌研究員稱人工智能(AI)已具備人格#登上熱搜,引發人工智能業界熱議。
事情起因是一位谷歌程序員和他測試的對話AI系統LaMDA聊了很久,對其能力感到十分驚訝。在其公開的聊天記錄中,LaMDA竟然說出了“我希望每個人都明白,我是一個人”的言論。
于是,這位程序員認為,LaMDA 可能已經具備人格了。馬上,業界就給出了結論:這只是這名程序員的個人觀點,不代表業界看法。同時,谷歌也對這名程序員作出了“行政帶薪放假”的決定。
事情發展到這兒,并無太多變數:人們對人工智能的預期還是原來的預期,對人工智能的擔心也還是原來的擔心,包括業界對相關問題的看法也還是原來的看法。唯一的不同是,事情讓很多原本不太關心人工智能發展的人開始關注起相關領域來,并產生焦慮。
作為一個復雜龐大的系統,人工智能背后的機理究竟是什么?在商業化應用中突出的領域有哪些?我們又是否需要擔心:人工智能具備類似于人類的“意識”和“靈魂”?
人工智能核心?數據才是“C位”
中國信息通信研究院云計算與大數據研究所副總工程師王蘊韜介紹,人類科技產業發展過程中,對于人工智能等系統的建設與分析,已經形成了一套有機方法論。這一方法論被王蘊韜概括為“搭積木原理”,通過層層分級,從復雜的功能表象,逐漸分解出類似積木塊的基礎功能項。
目前通過對人工智能算法的梳理,可以將其底層算法分為三類:回歸、分類和聚類。王蘊韜總結,這三類算法都是為了尋求數據之間的統計關系。其中涉及兩個關鍵詞:數據和統計。相同的算法在不同的數據上可能會產生不同的結果,因此,數據才是人工智能系統的“C位”,而非算法本身。
為什么是尋求統計關系?王蘊韜解釋,探討兩個實體之間的關系主要分為統計關系和因果關系,其區別在于因果關系必然能帶來相關的統計關系,而統計關系并不能反映事物的因果關系。統計關系是兩種事物之間的初步關系,盡管目前人工智能系統已經足夠復雜,但仍主要聚焦于分析數據之間的統計關系。
人工智能的應用領域包括自動駕駛、健康醫療等。有92%的中國受訪者表示他們愿意搭乘無人駕駛汽車;43%的受訪者相信未來5年里,自動駕駛汽車會成為日常生活的一部分,這兩個數據全球的比例分別為71%和28%。
此外,相對于全球受訪者而言,中國受訪者更希望人工智能能夠用來改善健康問題,包括慢病治療,探索健康問題的致病機制,治療癌癥,解決心理和情緒等問題,以及使用數據分析記錄等手段長期跟蹤并改善健康。
不過專家表示,基于人工智能的應用在推廣普及前,首先要考慮解決隱私及合規問題,尤其是對于健康信息等一些敏感數據的收集、分析和處理。
3M公司大中華區研發運營總經理熊海錕向第一財經記者介紹道,3M公司看好人工智能等技術在健康醫療領域的應用前景,因此在全球醫療產品事業群成立了一個新的健康醫療信息系統部門(Health Information System Division,HISD)。
“我們觀察到,在美國和中國都在加強個人隱私的保護,尤其是對于健康信息這類敏感數據。”熊海錕對第一財經記者表示,“未來HISD將會如何在中國開展業務,也正在討論中,我們肯定要先遵守中國當地的監管法規才能落地。”
安永大中華區數字化與新興科技咨詢服務主管合伙人顧卿華對第一財經記者表示:“人工智能在實際應用落地時會涉及很多問題,包括個人隱私、社會倫理、道德情感、權責問題、法律法規的問題等。確保隱私數據的安全,這是第一步,只有在法律法規允許,個人授權的情況下才去存儲、處理、交換、傳輸個人隱私數據。”
去年,科技巨頭谷歌及旗下人工智能公司DeepMind就被指未經同意獲取并處理上百萬名患者的醫療健康病歷數據,凸顯了科技公司在利用技術解決實際應用問題時面臨的挑戰。