當所有人的目光都還聚焦在云端那些巨大的數據中心時,一場新的技術革命正在我們身邊悄然發生。這就是邊緣計算與AI的結合,一個正在推動智能設備革新的關鍵力量。在這片蓬勃發展的新藍海里,Arm,這家長期統治我們手機芯片架構的巨頭,扔出了一顆重磅炸彈——Armv9邊緣AI計算平臺。
這個平臺的核心,是全新的Cortex-A320 CPU和Ethos-U85 NPU,專為物聯網應用而生。聽起來有點技術宅?說白了,它的目標就是讓身邊的各種小設備,能夠在本地運行超過10億個參數的AI模型。
真正的AI戰場,在你看不見的地方
你可能沒意識到,邊緣人工智能(Edge AI)這個市場,正在以一種近乎瘋狂的速度增長。根據全球市場洞察(Global Market Insights)的一份報告,2024年全球邊緣AI市場規模已經達到了125億美元。這還只是個開始,報告預計在2025到2034年間,這個數字的復合年增長率將達到驚人的24.8%,到2034年,市場規模會暴漲到1094億美元。
這股熱潮背后,是各行各業對邊緣設備越來越強的依賴,以及對AI技術源源不斷的投資。它已經不是一個PPT上的概念,而是滲透到了我們生活的方方面面。醫療保健行業是沖在最前面的,2024年,它一家就占了整個市場收入的43%。這不難理解,無論是實時病人監控、醫療影像分析,還是AI輔助診斷,這些場景都要求AI能夠快速決策,幫助醫生改善治療結果。除了醫療,制造業、金融、零售、物流,幾乎所有行業都在擁抱邊緣AI。
從技術上看,這個市場由軟件、硬件和服務三部分構成。2024年,軟件是絕對的主角,占了51.7%的收入。畢竟,AI模型優化、實時數據處理、邊緣分析平臺,這些都是軟件的活兒。當企業們爭先恐后地把AI整合進業務,軟件在模型部署、數據安全和系統更新中的作用就變得無可替代。
地域上,北美是當之無愧的領頭羊,2024年占據了全球市場30%以上的份額,其中美國預計到2034年將達到200億美元的規模。而在歐洲,德國因為嚴格的數據隱私規定,也對邊緣計算青睞有加。視線轉回亞太,中國在政府AI戰略和5G、智能基礎設施的大力投資下,市場增長也異常迅猛。
推動這一切的,是幾個關鍵的技術趨勢。首先是TinyML,也就是在超低功耗的微控制器上跑機器學習,讓小小的電池設備也能在本地運行AI,不再依賴云。其次是AI和物聯網(IoT)的融合,催生了海量的AI驅動的物聯網設備。最后,就是邊緣AI硬件本身的飛速發展,各種新的處理器、AI加速器和神經處理單元(NPU)層出不窮,就是為了更高效地處理機器學習任務。
手機霸主Arm,轉身殺入新戰場
說到Arm,大多數人想到的可能還是手機。沒錯,這家全球半導體IP設計的領導者,長期以來都是移動處理器領域的絕對霸主。全球已經有超過1800億顆Arm芯片出貨,這讓它成了移動設備和物聯網系統里事實上的標準。但時代變了,隨著AI和邊緣計算的需求暴增,Arm正積極地把觸角伸向一個更廣闊的天地。
Arm公司CEO Rene Haas在財報電話會議上說得非常直白:「從智能家居傳感器和工廠里的智能傳感器,到世界上最先進的AI超級計算機,AI工作負載正在各地部署。這正在推動對不僅性能強大而且能源高效的計算前所未有的需求?!顾踔劣悬c凡爾賽地強調,Arm提供了「唯一的計算平臺」,開發者可以在上面設計驅動各種應用的芯片。
這話不是吹牛??纯碅rm的收入構成,雖然智能手機處理器依然貢獻了45%的特許權使用費,但剩下的37%已經來自物聯網、汽車芯片、云和網絡等其他領域。和過去一半以上收入都靠手機業務相比,Arm的業務多元化已經卓有成效。
Arm的這次戰略轉型,不是一時興起,而是對市場趨勢的深刻洞察。AI應用從云端向邊緣遷移,已經是大勢所趨。好處是顯而易見的:數據在本地處理,省電;減少對網絡帶寬的依賴;延遲極低,對于自動駕駛、工業自動化這種分秒必爭的應用至關重要;數據不出本地,隱私和安全也更有保障。
正是看透了這一切,Arm近些年才在邊緣AI領域瘋狂下注。Arm扔出了他們的「王炸」——全球首個Armv9邊緣AI計算平臺。這不僅是Arm在邊緣AI領域的重要里程碑,更是給整個行業劃下的一道分水嶺。這個平臺以全新的Arm Cortex-A320 CPU和領先的邊緣AI加速器Arm Ethos-U85 NPU為核心,能支持運行超過10億參數的邊緣AI模型,為邊緣設備的普及提供了強有力的技術支撐。
Arm的看家本領,到底有多強?
Armv9邊緣AI計算平臺,這個聽起來有點拗口的名字,代表了當前邊緣AI技術的頂尖水平。它把全新的超高效率Armv9 CPU——Cortex-A320,和支持Transformer運算的Ethos-U85 NPU整合在了一起,打造出全球首個專門為物聯網優化的Armv9邊緣AI平臺。
先說Cortex-A320。作為Armv9架構的最小實現,它給超高效率的Cortex-A處理器帶來了安全和機器學習的最新創新。和上一代的Cortex-A35 CPU比,它的機器學習性能最高能提升10倍,純粹的標量性能也提升了30%。這背后是Armv9.2-A架構的功勞,它不僅提供了加速機器學習的SVE2(可擴展向量擴展2),還內置了像PAC、BTI和MTE這些聽起來很酷的先進安全功能,就是為了保護你的數據。軟件兼容性也沒得說,它專為Linux這類富操作系統開發,開發者可以繼續用他們熟悉的軟件和工具,大大降低了開發門檻。
再看Ethos-U85 NPU。這是Arm的第三代NPU,專為邊緣AI推理而生。它的性能可以伸縮,乘加器(MAC)單元可以從128個擴展到2048個,在1GHz頻率下能提供從256 GOP/s到4 TOPs的性能,滿足不同應用的需求。能效也比上一代提升了20%,這對于靠電池供電的邊緣設備來說簡直是福音。更重要的是,它原生支持Transformer網絡,這意味著它能高效處理生成式AI模型,讓你的邊緣設備也能擁有強大的AI能力。
光有硬件還不夠,Arm還端出了一道軟件大餐——KleidiAI。這是一個高度優化的軟件函數庫,專門在Arm CPU上加速AI功能。它能和Arm架構的Neon、SVE2等特性協同工作。效果怎么樣?在Llama.cpp上跑微軟的Tiny Stories數據集時,KleidiAI給新的Cortex-A320帶來了高達70%的性能提升。它還無縫整合進了像Llama.cpp和ExecuTorch這些主流的物聯網AI框架里,加速了Meta Llama 3和Phi-3這些關鍵模型的性能,讓開發者用起來得心應手。
強敵環伺,Arm憑什么這么自信?
在邊緣AI芯片這個賽道上,Arm并不是唯一的玩家。開源的RISC-V架構、傳統的x86架構,還有各種專有的AI加速器,都在虎視眈眈。但通過對比,我們能看清Armv9平臺的底氣在哪。
先看和RISC-V的對決。RISC-V作為開源的后起之秀,近年來越來越火。但和它相比,Arm的優勢依然明顯。首先是純性能,Arm處理器還是領先的,比如ARM的Cortex-A76在單線程性能上就略勝于SiFive的P670。更別提ARMv9處理器比上一代性能提高了約30%,能效提高了50%。其次是生態系統,Arm經營多年,擁有一個成熟且龐大的生態,超過1800億塊的出貨量不是開玩笑的。RISC-V雖然發展很快,但生態還比較年輕。最后是能效比,ARM架構天生就注重節能,這是它在移動和嵌入式領域的立身之本。當然,RISC-V的優勢在于定制化和開放性,對于某些特殊應用場景很有吸引力。
再來看和老牌霸主x86的較量。x86在PC和服務器市場是絕對的老大,但到了邊緣AI領域,Arm的優勢就體現出來了。Arm基于RISC(精簡指令集),天生就比CISC(復雜指令集)的x86更省電。在邊緣設備里,功耗往往是決定生死的關鍵。此外,Arm的產品線非常廣,從微控制器到高性能服務器,能滿足各種性能需求。最關鍵的是,Arm這幾年在AI優化上投入巨大,專門的Ethos系列NPU和KleidiAI軟件庫,讓它在處理邊緣AI任務時更加得心應手。
為了看得更清楚,我們把它們放在一張桌子上比一比:
注:數據來源于Arm官方發布及公開技術文檔
從這張表里不難看出,Armv9邊緣AI計算平臺在性能、能效、安全和軟件生態上,特別是在邊緣AI這個特定的應用場景里,確實有它的獨到之處。
不是一個人在戰斗,Arm的朋友圈有多豪華?
一個成功的技術平臺,光靠自己技術牛是不夠的,還得有一幫兄弟撐腰。Arm深諳此道,在推出Armv9平臺的同時,也拉起了一個豪華的邊緣AI生態朋友圈。
Arm擁有全球最大的開發者生態之一,超過2000萬名活躍的Arm開發者,這是創新的源泉。更重要的是,Armv9平臺一發布,就獲得了包括亞馬遜AWS、西門子、瑞薩電子、研華科技和Eurotech在內的多家行業巨頭的力挺。
這些來自不同行業大佬的站臺,無疑給Arm的邊緣AI戰略注入了一針強心劑。
Armv9平臺的推出,正在讓AI應用的可能性遍地開花。它能支持在各種設備上運行大型語言模型(LLM)和小型語言模型(SLM),讓智慧決策更接近數據源頭,不僅延遲更低,隱私也更有保障。
在智能城市里,邊緣AI能實時監控交通,優化信號燈,還能讓智能相機及時發現安全隱患。在工業自動化領域,它能預測設備故障,進行質量控制,讓機器人更聰明。在智能家居里,你的家電會更懂你,語音助手交互更自然。在醫療健康領域,它能實時監測病人體征,輔助醫生診斷,甚至加速新藥研發。
Armv9邊緣AI計算平臺的發布,像是在平靜的湖面上投下了一塊巨石。它不僅是Arm公司戰略轉型的重要一步,更是整個邊緣AI行業發展的催化劑。
參考資料:
https://www.gminsights.com/zh/industry-analysis/edge-ai-market
來源:蒜泥