久久久91-久久久91精品国产一区二区-久久久91精品国产一区二区三区-久久久999国产精品-久久久999久久久精品

最新廣告
關注中國自動化產(chǎn)業(yè)發(fā)展的先行者!
工業(yè)智能邊緣計算2025年會
CAIAC 2025
2025工業(yè)安全大會
OICT公益講堂
當前位置:首頁 >> 資訊 >> 行業(yè)資訊

資訊頻道

端側(cè)AI技術(shù):炬芯科技正在重新定義音頻芯片的未來
  • 點擊數(shù):1073     發(fā)布時間:2025-01-19 10:25:33
  • 分享到:
生成式人工智能正以前所未有的速度發(fā)展,堪比手機和互聯(lián)網(wǎng)的快速演進。如今,人工智能模型的參數(shù)規(guī)模已達到數(shù)十億,甚至數(shù)百億,對計算能力的需求急劇上升。統(tǒng)計數(shù)據(jù)顯示,2015年全球生成的數(shù)據(jù)量約為10艾字節(jié)(EB)。到2025年,預計這一數(shù)字將飆升至175澤字節(jié)(ZB),而到2035年,可能會達到驚人的2432澤字節(jié)。
關鍵詞:

生成式人工智能正以前所未有的速度發(fā)展,堪比手機和互聯(lián)網(wǎng)的快速演進。如今,人工智能模型的參數(shù)規(guī)模已達到數(shù)十億,甚至數(shù)百億,對計算能力的需求急劇上升。統(tǒng)計數(shù)據(jù)顯示,2015年全球生成的數(shù)據(jù)量約為10艾字節(jié)(EB)。到2025年,預計這一數(shù)字將飆升至175澤字節(jié)(ZB),而到2035年,可能會達到驚人的2432澤字節(jié)。

17375994401.png

“依賴云端來處理所有這些數(shù)據(jù)顯然是不現(xiàn)實的,”Actions Technology 董事長兼首席執(zhí)行官周正宇博士表示要使人工智能真正普及并發(fā)揮其全部潛力,計算任務必須在云服務器和邊緣設備(如個人電腦、智能手機、汽車和物聯(lián)網(wǎng)(IoT)設備)之間合理分配,而不是僅依賴云端。

這種云和邊緣人工智能協(xié)同工作的架構(gòu)被稱為混合人工智能。業(yè)界普遍認為,這種架構(gòu)將提供更強大、高效和優(yōu)化的人工智能體驗。換句話說,要使人工智能真正觸手可及并無縫融入日常生活,部署邊緣人工智能至關重要。

17375995191.png

然而,隨著邊緣人工智能的發(fā)展,它面臨著兩大挑戰(zhàn)。首先,我們需要在性能、功耗和成本之間找到平衡。在增強計算能力的同時,如何在不使功耗和成本超出合理范圍的情況下取得最佳結(jié)果,特別是在電池供電的低功耗設備中?其次,構(gòu)建一個穩(wěn)健的生態(tài)系統(tǒng)至關重要。類似于中央處理器(CPU)和圖形處理器(GPU)的發(fā)展,一個統(tǒng)一的生態(tài)系統(tǒng)是必要的,包括工具鏈、語言、兼容性和開發(fā)便捷性,以推動人工智能技術(shù)的普及和大規(guī)模應用。


邊緣人工智能部署的優(yōu)勢

邊緣人工智能將機器學習無縫集成到物聯(lián)網(wǎng)設備中,減少了對云計算能力的依賴。即使在沒有網(wǎng)絡連接或網(wǎng)絡擁堵的情況下,它也能提供低延遲的人工智能體驗。此外,邊緣人工智能還具有顯著的優(yōu)勢,包括低功耗、增強的數(shù)據(jù)隱私和更高的個性化。這些是部署邊緣人工智能的核心優(yōu)勢。

17375995441.png

周正宇博士指出,從邊緣人工智能到生成式人工智能,人工智能應用對計算能力的需求各不相同。許多邊緣人工智能應用是專門化的,并不需要大型模型或大量的計算能力。這在物聯(lián)網(wǎng)人工智能(AIoT)領域尤其如此,如語音交互、音頻處理、預測性維護和健康監(jiān)測。因此,邊緣人工智能對于人工智能的廣泛應用至關重要,而將人工智能集成到電池供電的低能耗物聯(lián)網(wǎng)設備中是實現(xiàn)邊緣人工智能的關鍵。

據(jù)ABI Research預測,邊緣人工智能市場正在迅速擴張。到2028年,基于中小型模型的邊緣人工智能設備數(shù)量預計將達到40億臺,年復合增長率(CAGR)為32%。到2030年,預計75%的這些物聯(lián)網(wǎng)人工智能設備將使用高能效的專用硬件。

例如,主流的可穿戴產(chǎn)品,如耳機和智能手表,以及其他便攜式音頻設備,如藍牙音箱,平均功耗范圍從十幾毫瓦到幾十毫瓦不等,存儲容量低于10兆字節(jié)(MB)。這定義了低功耗邊緣人工智能,特別是在可穿戴設備中的資源預算。

17375995571.png

為此,Actions Technology 最近推出了其“Actions Intelligence”戰(zhàn)略,以推動電池供電的低功耗音頻邊緣人工智能應用的發(fā)展,這些應用的模型參數(shù)低于1000萬個(10M)。該公司的目標是為低功耗物聯(lián)網(wǎng)人工智能設備提供0.1-1萬億次操作每秒(TOPS)的通用人工智能計算能力,且功耗預算范圍在10毫瓦至100毫瓦之間。

這意味著,作為一家致力于以毫瓦級功耗提供TOPS級人工智能計算能力的公司,以滿足物聯(lián)網(wǎng)設備的低功耗和高能效需求,Actions Technology 旨在通過其“Actions Intelligence”戰(zhàn)略實現(xiàn)10 TOPS/W至100 TOPS/W的人工智能計算效率。


克服馮·諾依曼架構(gòu)中的瓶頸

現(xiàn)有的通用中央處理器(CPU)和數(shù)字信號處理器(DSP)在算法方面具有很大的靈活性,但它們的計算能力和能效不足以滿足既定目標。根本原因在于傳統(tǒng)的馮·諾依曼架構(gòu)將內(nèi)存和計算單元分離,導致了“內(nèi)存墻”和“功耗墻”瓶頸,阻礙了計算能力和能效的提升。

“內(nèi)存墻”指的是在馮·諾依曼架構(gòu)中,計算單元必須先從內(nèi)存中提取數(shù)據(jù),然后在計算完成后再將結(jié)果寫入內(nèi)存。然而,由于處理器和內(nèi)存的設計工藝、封裝和要求不同,內(nèi)存訪問速度無法跟上處理器的處理速度。結(jié)果,數(shù)據(jù)流受到限制,就像水流過狹窄的漏斗一樣。無論處理器發(fā)送多少數(shù)據(jù),內(nèi)存一次只能處理少量數(shù)據(jù)。這種狹窄的數(shù)據(jù)交換路徑和由此產(chǎn)生的高能耗在存儲和計算之間形成了“內(nèi)存墻”。

17375995871.png

此外,在傳統(tǒng)架構(gòu)中,將數(shù)據(jù)從內(nèi)存?zhèn)鬏數(shù)接嬎銌卧璧哪芰窟h高于計算本身所需的能量。這意味著大部分能量和時間都消耗在數(shù)據(jù)傳輸上,而不是計算本身。內(nèi)存和處理器之間頻繁的數(shù)據(jù)遷移導致了顯著的功耗,這被稱為“功耗墻”。例如,測試結(jié)果顯示,英特爾7nm的CPU大約有63%的功耗用于數(shù)據(jù)傳輸,而不是計算。

Arm和Cadence的公開數(shù)據(jù)顯示,使用28/22nm工藝的ARM A7 CPU,運行頻率為1.2 GHz,其理論計算能力為0.01 TOPS,但功耗為100 mW,理想能效僅為0.1 TOPS/W。類似地,運行頻率為600 MHz的HiFi4 DSP,其理論計算能力為0.01 TOPS,但功耗為40 mW,理想能效為0.25 TOPS/W。即使是Arm中國專門的神經(jīng)處理單元(NPU)系列“周易”在能效方面也取得了顯著的改進,但其能效仍然只有2 TOPS/W。

17375996001.png

周正宇博士認為,“解決‘內(nèi)存墻’和‘功耗墻’的最佳方法是采用基于靜態(tài)隨機存取存儲器(SRAM)的內(nèi)存計算(CIM)架構(gòu)。”CIM的核心思想是將計算(部分或全部)轉(zhuǎn)移到內(nèi)存中,以便內(nèi)存單元可以直接執(zhí)行計算。這消除了對單獨計算單元的需求,并使內(nèi)存單元能夠同時處理存儲和計算,從而降低數(shù)據(jù)訪問和存儲延遲以及功耗。本質(zhì)上,CIM集成了內(nèi)存和計算。通過完全依賴內(nèi)存進行計算,CIM能夠?qū)崿F(xiàn)更細粒度的并行處理,從而顯著提高性能,尤其是在能效方面。

雖然實現(xiàn)“內(nèi)存-計算集成”并非易事,但人工智能本質(zhì)上是神經(jīng)網(wǎng)絡,由無數(shù)個神經(jīng)元協(xié)同工作形成復雜的計算模式。機器學習算法嚴重依賴矩陣運算,而矩陣運算非常適合分布式并行處理。因此,CIM是人工智能應用的理想解決方案。


知易行難。“邊緣AI部署需要創(chuàng)新。”

將計算集成到內(nèi)存中,根本上取決于選擇合適的存儲介質(zhì),這對于成本和成功都至關重要。周正宇博士指出,公司旨在將低功耗邊緣AI和其他片上系統(tǒng)(SoC)模塊的計算能力集成到單個芯片中。這種方法排除了使用需要特殊工藝的DDR RAM和Flash。相反,采用互補金屬氧化物半導體(CMOS)工藝的SRAM,以及新興的非易失性隨機存取存儲器(NVRAM)技術(shù),如電阻式隨機存取存儲器(RRAM)和磁阻式隨機存取存儲器(MRAM),更適合。

采用成熟工藝的SRAM可以進行升級以保持與先進工藝的兼容性。它具有快速的讀/寫速度、高能效和無限的讀/寫周期。其唯一的限制是內(nèi)存密度低,但這足以滿足大多數(shù)邊緣AI應用的計算能力需求。短期內(nèi),SRAM是實現(xiàn)低功耗邊緣AI設備高能效的最佳解決方案。它確保快速部署,沒有大規(guī)模生產(chǎn)風險。

17375996181.png

長期來看,諸如RRAM之類的NVRAM新興技術(shù)(其密度高于SRAM,讀功耗更低)可以集成到SoC中,為CIM架構(gòu)開辟新的可能性。然而,RRAM技術(shù)仍處于早期階段,大規(guī)模生產(chǎn)存在風險,目前最先進的制造工藝僅限于22nm。此外,一個顯著的缺點是其寫入周期有限,超過此限制可能會造成永久性損壞。因此,周正宇博士設想了一種將SRAM和RRAM結(jié)合的混合技術(shù),作為RRAM完全開發(fā)后的最佳解決方案。在這個方案中,基于SRAM的CIM將處理需要頻繁寫入的AI計算,而基于RRAM的CIM將用于寫入較少或不太頻繁的任務。這種混合解決方案有望提供更大的計算能力和更高的能效。

目前,業(yè)界實現(xiàn)基于SRAM的CIM電路主要有兩種方法。方法一使用數(shù)字電路在盡可能靠近SRAM的地方執(zhí)行計算。然而,由于計算單元實際上不是SRAM陣列的一部分,因此該方法本質(zhì)上是一種近內(nèi)存技術(shù)。方法二需要利用SRAM介質(zhì)中某些模擬器件的特性來執(zhí)行模擬計算。雖然這種方法實現(xiàn)了真正的CIM,但它有很大的缺點。模擬計算的精度受到影響,一致性和可制造性可能無法保證。這意味著同一芯片在不同時間、不同條件下可能會產(chǎn)生不一致的結(jié)果。此外,這種方法需要模數(shù)轉(zhuǎn)換器(ADC)和數(shù)模轉(zhuǎn)換器(DAC)來交換基于模擬計算的CIM和其他數(shù)字模塊之間的數(shù)據(jù)。這限制了數(shù)據(jù)流管理和接口交互設計,阻礙了運行效率的提高。

為了解決這些問題,Actions Technology推出了其混合模式SRAM基CIM (MMSCIM)技術(shù),該技術(shù)在SRAM介質(zhì)中使用定制的模擬設計來實現(xiàn)數(shù)字計算電路。這一突破實現(xiàn)了真正的CIM,同時保持了計算精度,并確保了大規(guī)模生產(chǎn)的一致性。

周正宇博士強調(diào)了MMSCIM的幾個優(yōu)點。首先,MMSCIM比純數(shù)字解決方案具有更高的能效,幾乎與全模擬系統(tǒng)的能效相匹配。其次,MMSCIM消除了對ADC/DAC的需求,確保了數(shù)字精度、高可靠性和大規(guī)模生產(chǎn)的一致性,這是數(shù)字技術(shù)的固有優(yōu)勢。第三,MMSCIM能夠適應工藝升級,并且可以輕松地轉(zhuǎn)移到不同的半導體制造廠(FAB)。第四,MMSCIM可以輕松提高速度并優(yōu)化性能、功耗和面積(PPA)。最后,MMSCIM對稀疏矩陣的適應性進一步提高了能效并降低了功耗。

17375996331.png

對于高質(zhì)量的音頻處理和語音應用,MMSCIM是未來低功耗邊緣AI音頻技術(shù)的最佳架構(gòu)。通過消除內(nèi)存和存儲之間數(shù)據(jù)傳輸?shù)男枰琈MSCIM顯著降低了延遲,提高了性能,并最大限度地減少了功耗和熱量產(chǎn)生。對于需要最大能效的電池供電的物聯(lián)網(wǎng)設備,Actions Technology的MMSCIM技術(shù)為將邊緣AI變?yōu)楝F(xiàn)實提供了理想的解決方案,在這些設備中,每一毫瓦都至關重要,用于優(yōu)化AI計算能力。

17375996531.png

根據(jù)Actions Technology公布的首個MMSCIM路線圖,GEN1 MMSCIM于2024年推出。GEN1 MMSCIM基于22nm工藝構(gòu)建,每個內(nèi)核的性能為100 GOPS,能效達到6.4 TOPS/W @INT8。由于其能夠適應稀疏矩陣,因此對于具有合理稀疏性的模型(即某些參數(shù)為零時),可以進一步優(yōu)化能效。根據(jù)稀疏程度的不同,能效可能超過10 TOPS/W。

2025年,Actions Technology計劃發(fā)布GEN2 MMSCIM,同樣基于22nm工藝構(gòu)建,性能比GEN1提高三倍。GEN2 MMSCIM的每個內(nèi)核將提供300 GOPS的計算能力,支持transformer模型,并實現(xiàn)7.8 TOPS/W @INT8的能效。到2026年,將推出使用12nm工藝的GEN3 MMSCIM,每個內(nèi)核將提供1 TOPS的計算能力,支持transformer模型,并實現(xiàn)高達15.6 TOPS/W @INT8的能效。

每一代MMSCIM技術(shù)都通過內(nèi)核疊加來提高總計算能力。例如,每個內(nèi)核具有300 GOPS的GEN2 MMSCIM,通過組合四個內(nèi)核可以實現(xiàn)超過1 TOPS的計算能力。


下一代邊緣AI音頻芯片為何如此強大?

炬芯科技推出的基于MMSCIM的下一代邊緣AI音頻芯片包含三個系列:ATS323X系列專注于實現(xiàn)低延遲私有無線音頻傳輸,ATS286X系列則面向藍牙AI音頻應用領域,而ATS362X系列則致力于滿足AI DSP應用需求。

每個系列均采用異構(gòu)架構(gòu)設計,巧妙融合了CPU(ARM)、DSP(HiFi5)和NPU(MMSCIM)。炬芯科技通過創(chuàng)新技術(shù),將MMSCIM與先進的HiFi5 DSP整合為“炬芯智能NPU(AI-NPU)”架構(gòu),這一架構(gòu)通過協(xié)同計算,實現(xiàn)了高靈活性與高效能的完美結(jié)合。在此架構(gòu)中,MMSCIM負責處理基礎且通用的AI算子,以低功耗提供強勁的計算能力。而隨著新興AI模型和算子的不斷涌現(xiàn),HiFi5 DSP則補充支持MMSCIM未涵蓋的特殊算子,確保系統(tǒng)的全面性和前瞻性。

這些邊緣AI芯片支持最多達一百萬參數(shù)的片上AI模型,并可通過外部偽靜態(tài)隨機存取存儲器(PSRAM)輕松擴展至八百萬參數(shù),滿足更廣泛的應用需求。此外,炬芯科技還開發(fā)了“ANDT”(Actions NPU Development Tools,炬芯NPU開發(fā)工具),這是一款專為AI-NPU架構(gòu)量身打造的AI開發(fā)工具。該工具全面支持TensorFlow、HDF5、PyTorch和ONNX等標準AI開發(fā)工作流,讓開發(fā)者能夠更便捷地進行AI算法的開發(fā)和部署。ANDT能夠智能地在CIM和HiFi5 DSP之間分配AI算法任務,實現(xiàn)低功耗與高效能的平衡,助力低功耗邊緣音頻AI生態(tài)系統(tǒng)的快速發(fā)展。

周振宇博士分享了GEN1 MMSCIM與HiFi5 DSP的能效測試結(jié)果。在500兆赫茲頻率下,使用717K參數(shù)的卷積神經(jīng)網(wǎng)絡(CNN)模型進行環(huán)境噪聲消除測試時,MMSCIM相比HiFi5 DSP降低了近98%的功耗,能效顯著提升了44倍。在另一項使用935K參數(shù)CNN模型進行語音識別的測試中,MMSCIM同樣表現(xiàn)出色,降低了93%的功耗,能效提升了14倍。

此外,在使用更復雜的網(wǎng)絡模型進行環(huán)境噪聲消除的測試中,GEN1 MMSCIM也展現(xiàn)出了卓越的性能。在運行深度循環(huán)神經(jīng)網(wǎng)絡時,相比HiFi5 DSP降低了89%的功耗;在運行卷積循環(huán)神經(jīng)網(wǎng)絡時,降低了88%的功耗;在運行卷積深度循環(huán)神經(jīng)網(wǎng)絡時,降低了76%的功耗。在相同條件下,運行特定CNN-Con2D算子模型時,GEN1 MMSCIM的AI計算能力更是達到了HiFi5 DSP的16.1倍,充分展示了其強大的計算能力和能效優(yōu)勢。


通往高質(zhì)量音頻的道路

音頻處理既復雜又系統(tǒng)化。高質(zhì)量音頻不僅僅依賴于硬件信號鏈(包括前置放大器、ADC/DAC、音頻處理、編解碼器和模擬放大器),還需要每個處理過程都滿足可量化的客觀指標,例如高信噪比、低噪聲底限、寬動態(tài)范圍和高線性度。同樣重要的是理解人類的聽覺偏好,并將電子科學和聲學無縫地融入設計中。

周正宇博士指出:“是的,尤其是在主觀方面。悅耳的聲音沒有普遍的定義;每個人都有自己的偏好,每個品牌都有自己的標志性風格。”憑借在音頻行業(yè)超過20年的經(jīng)驗,周正宇博士將 Actions Technology 作為領先的國際品牌的主觀和客觀認可歸因于其“深厚的專業(yè)知識和豐富的經(jīng)驗”。這使得公司研發(fā)團隊能夠理解什么是自然、清晰和悅耳的聲音,并進行必要的調(diào)整,將芯片、算法和聲學完美融合。

17375997631.png

另一個關鍵趨勢是人工智能的快速發(fā)展,它為人工智能與音頻的集成開辟了新的可能性。人工智能正在通過語音識別、噪聲控制、語音翻譯、關鍵詞識別、語音增強和語音分離方面的創(chuàng)新來改變音頻行業(yè)。這些進步正在推動音頻設備和系統(tǒng)的創(chuàng)新和改進,為消費者提供更豐富、更個性化的體驗,無論是在家中、個人音樂欣賞還是商業(yè)應用中。

周正宇博士將人工智能視為一種新型計算,它使用基于神經(jīng)網(wǎng)絡的深度學習計算來替代音頻領域的傳統(tǒng)符號邏輯計算,從而極大地增強了用戶體驗。他解釋說:“在我看來,每種音頻產(chǎn)品都應該使用人工智能進行改進,尤其是在與專業(yè)、低功耗、高效的硬件相結(jié)合時。這可以顯著提高模型效率。”

目前,無線家庭影院系統(tǒng)、游戲耳機和麥克風等低延遲、高質(zhì)量音頻產(chǎn)品市場占據(jù)主導地位。周正宇博士預測,未來將涌現(xiàn)更多利基市場,例如更專業(yè)的直播麥克風和其他需要超低延遲的無線設備。對優(yōu)先考慮完全沉浸式體驗的 7.1.4 聲道(即 12 聲道)環(huán)繞聲系統(tǒng)的需求將挑戰(zhàn)無線傳輸帶寬、采樣率和延遲。這將推動對高帶寬私有無線技術(shù)、人工智能音頻處理和新編解碼器技術(shù)的需求,以滿足對超低延遲和卓越音質(zhì)的需求。

根據(jù)QYResearch的數(shù)據(jù),全球無線音頻設備市場(包括條形音箱、耳機、麥克風和無線揚聲器)在2023年達到1996.28億元人民幣,其中中國市場占654.38億元人民幣。預計到2029年,這一數(shù)字將增長到5820.85億元人民幣,復合年增長率約為19.25%。主要市場包括商業(yè)、汽車、消費和家庭應用。

17375997751.png

以智能眼鏡、智能耳機、智能手表和智能手環(huán)等產(chǎn)品為主導的可穿戴設備市場也顯示出巨大的潛力。IDC預測,2024年全球可穿戴設備出貨量將同比增長6.1%,達到5.379億臺,其中可聽戴設備占總量的57.7%。Canalys還報告稱,2024年第二季度,全球智能個人音頻出貨量達到1.1億臺,創(chuàng)下歷史最高第二季度出貨量,同比增長10.6%。

在這種情況下,人工智能技術(shù)的探索和應用無疑將成為各行業(yè)的熱門話題,釋放人工智能技術(shù)增強用戶體驗的巨大潛力。對于公司而言,從單一產(chǎn)品供應商轉(zhuǎn)變?yōu)樘峁┫到y(tǒng)解決方案將成為常態(tài)。企業(yè)將越來越需要通過開放平臺和工具構(gòu)建獨特的AI生態(tài)系統(tǒng),使客戶能夠基于基礎組件開發(fā)差異化解決方案,同時平衡性能、成本和功耗。


結(jié)論

從ChatGPT到Sora,從文本到文本、文本到圖像再到文本到視頻、圖像到文本以及視頻到文本的技術(shù),基于云的大型模型不斷突破人工智能能力的邊界。然而,人工智能的發(fā)展之路仍然漫長。從云端向邊緣計算的轉(zhuǎn)變正成為一大趨勢。邊緣人工智能憑借其低延遲、個性化服務和增強的數(shù)據(jù)隱私等優(yōu)勢,將在物聯(lián)網(wǎng)設備中發(fā)揮越來越重要的作用,為制造業(yè)、汽車業(yè)和消費品等行業(yè)帶來激動人心的新機遇。


來源: Filmsound.cn電影聲音網(wǎng) 


熱點新聞

推薦產(chǎn)品

x
  • 在線反饋
1.我有以下需求:



2.詳細的需求:
姓名:
單位:
電話:
郵件:
主站蜘蛛池模板: 久久99综合久久爱伊人| 国产免费网址| 一区二区国产在线观看| 无码一区二区三区视频| 久久机热综合久久国产| 夜色成人免费观看| 小明看看永久视频| 亚欧中文字幕| 污片在线观看免费| 国产一区亚洲二区| 国产精品杨幂va在线观看| 91精品国产91久久久久久| 国产在线视频资源| 青草草在线观看免费视频| 永久免费影院| 一区二区视频在线观看高清视频在线 | 黄色大片免费看| 国产chinese在线视频| 九九色播| 一级中文字幕| 日韩巨乳在线| 亚洲一级毛片中文字幕| 伦理亚洲| 免费看成人国产一区二区三区| 国产欧美日韩在线一区二区不卡| 黄色片网站在线| 蜜桃视频一区二区在线看| 国产欧美视频在线| 日本美女毛片| 国产真实偷乱视频在线观看| 韩日欧美| 精品一级毛片| 日本亚洲中午字幕乱码| 亚洲美女亚洲精品久久久久| 91精选在线观看| 亚洲国产精品67194成人| 玖玖精品在线观看| 免费超爽大片黄网站| 欧美成人h精品网站| 国产97在线观看| 国产一区二区三区在线观看视频|