AI早起的高通沒蟲吃,後來者麒麟970能掀起波瀾?(转载)
在前不久的IFA2017上,華為如約發布了全球首款AI晶元麒麟970,引起業界波瀾。
在款處理器是8核設計,採用10nm台積電工藝,集成55億顆晶體管。對比之下,驍龍835是31億顆,蘋果A10是33億顆。麒麟970能效提高140%(相對於麒麟960來說),麒麟970的CPU能效提高20%,性能提高20%,功耗減少50%。
麒麟970在繼承過往成果基礎上,加入了業界首個用於神經元計算的獨立處理單元NPU,並且和CPU、GPU、DSP組成HiAI人工智慧移動計算平台。
華為宣稱,麒麟970的AI性能密度大幅優於CPU和GPU。同樣是四個A73 CPU核心,在處理同樣的AI應用任務時,新的異構計算架構擁有大約50倍的能效和25倍的性能優勢。
比如在圖像識別速度上,麒麟970可達到約2000張/分鐘。
然而,事實上第一款ARM陣營的NPU平台是高通驍龍820。
當年發布的驍龍820中最值得期待就是Zeroth神經處理引擎的應用。
在驍龍820的官網中這樣描述:基於驍龍S820的平板電腦,在進行「自學習」后,可以識別這個畫上的物體是什麼屬性的(這個誘人漢堡包被自動識別為「食品」),並且,它還可以將照片集中的「馬」自動檢索出來,當然你也可以檢索出「車」「批薩」等等種類。請注意,這個基於本地的「人工智慧」與百度等搜索引擎基於雲端的「人工智慧」 是不一樣的,它的速度更快,且不需要聯網也可以自學習。
用高通方面给出的解释,简单转化成人话来说:
1)Zeroth平台的处理器可以预测用户的计算需求,提前行动——类似像摩托罗拉的New Moto X那样随时通过传感器保持对用户和周围环境的感知,预测行为;
2)或者,Zeroth平台处理器可以将机器视觉处理物体图像的方式向人类观察和认知物体的方式靠近——比如可以更快捷识别文本、笔记和物体的智能相机;
3)再或者,Zeroth平台处理器可以控制设备永远开启收音、声音识别、自然语言处理——这意味着未来像摩托罗拉那样随时保持对用户声音收听的设备会越来越多,手机可以成为不需要拿起使用的语音助手,随时倾听来提供服务。
然而,兩年過去了,幾乎沒有一個廠家去適配,更別提什麼市場應用了。
有了前車之鑒,這次會是一場賭局嗎?
首先來看一看華為這款NPU的背景。
這裡不得不提華為和中科院計算所的合作。業界多有傳言,華為早已成為中科院計算所的大金主。2011 年,雙方便規劃成立聯合實驗室,具體由先進計算機系統研究中心承擔,該中心主要從事雲計算、操作系統和體系結構的研究。它此前是從高性能計算機研究中心獨立出來的。與華為合作的同年,先進計算機系統研究中心開始掛靠計算機體系結構國家重點實驗室下,於 2014 年成為正式獨立部門。
不過麒麟 970 的 AI 晶元並非來自於這一聯合實驗室,而是它此前曾掛靠的計算機體系結構國家重點實驗室。更確切地說,麒麟 970 的 AI 技術授權來源於該實驗室後來孵化出的全球首個 AI 領域的獨角獸——中科寒武紀科技有限公司,簡稱寒武紀。
寒武紀所採用的推廣方式類似於 ARM,通過授權的方式推廣 AI 指令集,短時內快速推動市場發展。數天前,寒武紀剛剛對外公布了 A 輪一億美元的融資消息,由國投創業(A 輪領投方),阿里巴巴創投、聯想創投、國科投資、中科圖靈、元禾原點(天使輪領投方)、涌鏵投資(天使輪投資方)聯合投資,並稱 2016 年便已盈利,營收規模在 1 億元人民幣。
硬體級AI晶元好處多多
硬體級AI晶元好處不少。許多人都在猜測類似寒武紀NPU是不是只能用來美顏這類操作。當然不會局限於這類基礎計算。其實大家想想現在很多軟體都需要把信息提交伺服器,运算之后再返回结果。如果終端計算能力足夠強,可以分擔一部分工作量,甚至在離線狀態也能完成一些功能。未來如果發展得好,伺服器甚至可以反過來利用終端計算能力,直接調用終端NPU的結果,這樣整體加速行業發展,充分利用計算資源,同時可以讓伺服器可以專註更高端的計算。
就目前來說,就有許多應用已經實現,諸如輸入法、語音識別、圖像識別、視頻識別、語音助手、搜索、地圖……越來越多的應用等著我們。
同時專用 AI 晶元或許可以解決用戶隱私問題。在離線計算能力大漲的情況下,用戶不必再需要上傳自己的隱私數據,這一塊將大有市場。
其他廠商也在不斷嘗試AI在硬體上的創新。
高通有神經處理引擎(NPE),使用Adreno GPU和Hexagon DSP來加速機器學習應用。驍龍835再一次完善了NPE。
苹果新发布A11仿生处理器内置神经处理引擎,双核,每秒600B运算实时处理。
蘋果也有機器學習框架Core ML,使用GPU加速。而且蘋果軟硬體融合能力非常強,短期內的第三方支持,蘋果肯定能領先。
可以看出,各大廠商都積極推進AI的發展,甚至包括類似Facebook這類純互聯網企業都開始嘗試發展出一個自己的AI通用計算平台。
不過,這些夢想中的應用確實離我們還很遠。
NPU目前對於移動終端來說用處不大確是事實。目前就算是PC端的最前沿深度學習也基本都是靠GPU來進行的,Google和Nvidia各自推出專用晶元也就不到半年前的事。我曾經研究過谷歌的TensorFlow以及其推出的TPU,其高昂的硬體成本,以及超前沿的學習成本的確會使很多人望而卻步。
為人工智慧單獨配晶元本來就還是不太成熟的事,再加上移動端深度學習目前成果還不多,雖然通用計算平台搭起來了,開發者也是寥寥無幾。可以預見的是,在未來幾年,可能大多數依然是官方研發的用來提升自帶應用體驗的場景,加上各大廠商加劇競爭,平台的碎片化和不完善的生態,實用的移動端AI體驗依然離我們很遠。
贴主:Fus8800于2017_09_14 21:06:26编辑
|