中國信息通信研究院付韜,張恒升,王哲
1 背景
隨著國家對數(shù)字化、信息化領(lǐng)域基礎(chǔ)設(shè)施的不斷投入,我國形成了以5G、SD-WAN等為代表的高質(zhì)量工廠外網(wǎng),以確定性網(wǎng)絡(luò)、工業(yè)以太網(wǎng)等為代表的高質(zhì)量工廠內(nèi)網(wǎng)。大帶寬、低時延的網(wǎng)絡(luò)能夠更好地支撐工廠中各業(yè)務(wù)間的協(xié)同與優(yōu)化,能夠更加統(tǒng)一地整合資源,形成生產(chǎn)任務(wù)的全流程精細管控能力。在此過程中,隨著工業(yè)應(yīng)用種類增多、協(xié)同過程復(fù)雜度上升、數(shù)據(jù)處理和交換密度增大,工業(yè)算力與網(wǎng)絡(luò)的密切程度不斷提升,促進整個工廠的算力架構(gòu)呈現(xiàn)出新的發(fā)展趨勢。
算力的存在呈現(xiàn)出多種形態(tài),既有面向公司生產(chǎn)業(yè)務(wù)的工業(yè)云算力,也有實現(xiàn)車間級賦能的邊緣算力,還有工業(yè)終端上不斷提升的本地算力。以生產(chǎn)應(yīng)用的業(yè)務(wù)流為紐帶,算網(wǎng)一體化管控正逐步形成系統(tǒng)性的解決方案。然而,現(xiàn)有工業(yè)算力存在算力描述、算力計價、確定性等方面的不足,給IT網(wǎng)絡(luò)和OT網(wǎng)絡(luò)融合帶來了一定阻礙。本文梳理了工業(yè)互聯(lián)網(wǎng)背景下的工業(yè)算力發(fā)展現(xiàn)狀和工業(yè)算力架構(gòu),分析了國內(nèi)工業(yè)算力的發(fā)展趨勢和方向。
2 工業(yè)算力的發(fā)展現(xiàn)狀
2.1 工業(yè)算力的概念
工業(yè)算力是計算機設(shè)備或計算/數(shù)據(jù)中心處理工業(yè)計算需求的能力,是指在工廠生產(chǎn)環(huán)境中計算能力的總和,它支撐工廠各級信息系統(tǒng)完成數(shù)據(jù)采集、數(shù)據(jù)分析、控制信息等活動。工業(yè)算力以計算機技術(shù)、網(wǎng)絡(luò)技術(shù)、大數(shù)據(jù)技術(shù)等多種途徑實現(xiàn)生產(chǎn)過程的數(shù)字化、智能化和高效化,全面賦能工廠全流程環(huán)節(jié)。工業(yè)算力并不是算力在工廠場景中的簡單應(yīng)用,它需要結(jié)合工廠生產(chǎn)任務(wù)的高度實時性需求進行精確資源調(diào)度,在算力部署、算力分配、算網(wǎng)融合、算力計費等方面存在差別。近年來,國內(nèi)工業(yè)算力蓬勃發(fā)展,呈現(xiàn)出“算力穩(wěn)步提升、聯(lián)系尚不密切”的特征。目前,工業(yè)算力由“云-邊-端”三級構(gòu)成,企業(yè)級工業(yè)云主要進行數(shù)據(jù)規(guī)模大的離線運算,優(yōu)化生產(chǎn)流程和工藝參數(shù)。工業(yè)云進行工業(yè)大數(shù)據(jù)分析,挖掘生產(chǎn)過程中的瓶頸和問題,提高生產(chǎn)效率和產(chǎn)品質(zhì)量。車間級邊緣計算主要進行數(shù)據(jù)密度大的實時處理,通過復(fù)雜算法實現(xiàn)智能生產(chǎn)、檢測、智能控制、智能維護等工作。工業(yè)終端主要是數(shù)據(jù)的產(chǎn)生者和執(zhí)行者,近些年來本地算力也獲得了一定增長,可以實現(xiàn)智能算法并有限度地共享算力。以下是國內(nèi)工業(yè)算力發(fā)展的幾個關(guān)鍵特征:
(1)工業(yè)算力規(guī)模持續(xù)增長:隨著數(shù)字化轉(zhuǎn)型的深入推進,國內(nèi)企業(yè)對算力的需求持續(xù)增長。各類企業(yè)紛紛加大投入,通過建設(shè)企業(yè)內(nèi)數(shù)據(jù)中心提升算力規(guī)模,以滿足日益復(fù)雜和精細化的生產(chǎn)需求。(2)算力分布分散、聚合度較弱:與移動通信運營商的算力網(wǎng)絡(luò)資源池不同,工業(yè)算力呈現(xiàn)出分層、分域的部署現(xiàn)狀,算力協(xié)同主要發(fā)生在臨級算力設(shè)施之間。這主要是由于缺乏通用的算力開放機制,無法跨層、跨域地精確度量、評估和調(diào)用算力資源。受限于工廠生產(chǎn)活動的實時性要求,跨域算力借用往往存在不穩(wěn)定性和較低的效能。
(3)工業(yè)算力不具備確定性:工業(yè)算力已廣泛應(yīng)用于智能制造、智慧能源、智能交通等領(lǐng)域,很多企業(yè)嘗試通過應(yīng)用工業(yè)算力技術(shù),實現(xiàn)對生產(chǎn)過程的實時監(jiān)控和優(yōu)化,提高生產(chǎn)效率和產(chǎn)品質(zhì)量。但是,邊緣計算和云計算都不能夠依據(jù)嚴格的確定性指標進行調(diào)度,導(dǎo)致IT服務(wù)實時性和OT生產(chǎn)應(yīng)用實時性存在巨大差距,嚴重阻礙了工業(yè)算力的應(yīng)用與推廣。
(4)應(yīng)用通用性較差:目前很多廠商的應(yīng)用與終端設(shè)備依賴性過強,導(dǎo)致只能劃分專用資源給應(yīng)用。這一方面降低了算力的利用率,另一方面維護起來更加復(fù)雜,導(dǎo)致算力的開放能力降低。
2.2 我國工業(yè)算力典型模式
邊緣算力:多個計算能力較弱的工業(yè)終端,將計算任務(wù)或數(shù)據(jù)遷移到鄰近的邊緣計算設(shè)備,實現(xiàn)數(shù)采、分析、檢測、控制等功能。其具體形式包括兩種,一種是工廠本地邊緣計算設(shè)備如邊緣一體機、服務(wù)器、網(wǎng)關(guān)等,另一種是運營商租借給工廠的移動邊緣計算節(jié)點(MEC)。
云化服務(wù):云化服務(wù)是將云資源池以容器或虛機的形式劃分出來,遠程為工業(yè)產(chǎn)線提供應(yīng)用服務(wù)。它的優(yōu)勢在于靈活重新配置、成本較低和軟件故障恢復(fù)快。
群智算力:是指在缺乏邊緣計算和云計算資源時,利用多個生產(chǎn)設(shè)備的本地計算能力,通常在存在計算依賴或數(shù)據(jù)依賴的若干個設(shè)備之間,調(diào)整任務(wù)分配,使得整個設(shè)備集群的計算任務(wù)都能夠在實時性要求的范圍內(nèi)完成。
算力協(xié)同:該模式充分利用了邊緣計算的實時性和云計算的大量資源,可以逐級部署計算任務(wù),在計算能力和實時性之間取得折中。
2.3 工業(yè)算力挑戰(zhàn)
工業(yè)算力在發(fā)展過程中遇到了多方面的挑戰(zhàn),性能方面主要是受工業(yè)生產(chǎn)活動實時性制約,功能方面主要是受算力設(shè)備通用性的影響,主要包括以下幾個方面:
(1)缺乏統(tǒng)一標準化的算力描述:算力描述本身是當(dāng)前的熱點研究方向,在算力網(wǎng)絡(luò)、云計算等場景中都需要對算力進行抽象。在多個數(shù)據(jù)中心形成資源池的背景下,算力的度量、類型、分配狀態(tài)等情況十分復(fù)雜,由CPU、GPU、TPU、DPU等聚合而成的異構(gòu)性算力需要統(tǒng)一的結(jié)構(gòu)化描述語言。工業(yè)算力描述與外網(wǎng)算力描述具有一定的共性部分,但還要考慮設(shè)備類型和部署位置,需要擴展算力描述數(shù)據(jù)結(jié)構(gòu),形成面向行業(yè)和網(wǎng)絡(luò)結(jié)構(gòu)的工業(yè)算力描述[1]。
(2)缺乏工業(yè)專用的算力計價:一是運營商租用算力的精確計費,以MEC節(jié)點算力為代表,費用由邊緣計算基站數(shù)量、性能、服務(wù)和使用時長決定。二是面向中小企業(yè)的公共算力計費,在該場景下多個企業(yè)共用園區(qū)的云邊算力,需要精確測算各企業(yè)提交的任務(wù)所使用的算力。
(3)算力開放能力較弱:算力供給粒度從大到小可以分為專用設(shè)備、容器/虛擬機、任務(wù)、時間片,從充分利用算力資源的角度,應(yīng)該盡可能進行小粒度的調(diào)度。使用專用設(shè)備來保障某些工業(yè)任務(wù),其他任務(wù)無法共用處理能力,就會造成最大的浪費。目前最常見的方式是為邊緣任務(wù)分配專用的容器,這也是由于現(xiàn)有方案的終端應(yīng)用和邊緣應(yīng)用都和廠商緊密耦合,資源在被大粒度分配后,就無法再給其他任務(wù)開發(fā)算力。未來為了實現(xiàn)確定性計算,必須要實現(xiàn)任務(wù)和時間片粒度的算力開放,需要形成細粒度的算力調(diào)用協(xié)議和接口。設(shè)計并研發(fā)通用算力服務(wù),形成面向行業(yè)的、可復(fù)用共享的通用算力應(yīng)用。各級工業(yè)智能終端可依據(jù)標準化參數(shù)調(diào)用工業(yè)算力設(shè)施的算力服務(wù)。
(4)算網(wǎng)確定性:在很多應(yīng)用與網(wǎng)絡(luò)協(xié)同研究中,算力與網(wǎng)絡(luò)正在聯(lián)系得越來越緊密。目前國內(nèi)眾多研究機構(gòu)對面向應(yīng)用的確定性技術(shù)開展了研究,如中國信息通信研究院提出了面向應(yīng)用的確定性(AoD)研究[2],該研究針對工廠網(wǎng)絡(luò)或園區(qū)網(wǎng)絡(luò)實現(xiàn)離散資源的統(tǒng)一調(diào)度,編排具有一系列確定性執(zhí)行環(huán)節(jié)的確定性服務(wù),滿足用戶的頂層需求;北京交通大學(xué)提出了廣義確定性的概念,從理論角度分析了在多要素、網(wǎng)絡(luò)異構(gòu)、復(fù)雜數(shù)據(jù)流場景下的確定性保障問題,該工作更側(cè)重于理論研究與模型設(shè)計;網(wǎng)絡(luò)通信與安全紫金山實驗室則提出了算網(wǎng)操作系統(tǒng)的概念,提出了算力網(wǎng)絡(luò)中的多應(yīng)用協(xié)同調(diào)度問題的解決方法,不過該方案對于算力僅實現(xiàn)盡力而為的調(diào)度,更適用于數(shù)據(jù)中心的非實時計算任務(wù)。確定性算力網(wǎng)絡(luò)是使用確定性網(wǎng)絡(luò)的算力系統(tǒng),缺乏對算力確定性調(diào)度,因此本報告認為其本質(zhì)是“算力+確定性網(wǎng)絡(luò)”,更適合運營商的服務(wù)場景,不強調(diào)算力提供過程的確定性,追求盡可能高的服務(wù)性能。國外方面,IETF成立了CATS(Computing-Aware Traffic Steering)工作組,旨在研究網(wǎng)絡(luò)主動感知服務(wù)客戶端和服務(wù)站點并提供端到端路由。為了實現(xiàn)基于計算感知和網(wǎng)絡(luò)感知的路由決策,需要全面感知網(wǎng)邊端信息。目前CATS工作組在計算和網(wǎng)絡(luò)信息的分類和感知方面已經(jīng)做了一些工作,包括架構(gòu)、場景、協(xié)議、路由機制等。隨著CATS工作的進一步開展,將通過算網(wǎng)一體化的確定性實現(xiàn)應(yīng)用服務(wù)鏈的精確執(zhí)行。
(5)多資源協(xié)同能力:工業(yè)算力架構(gòu)中,各種資源依據(jù)算法進行調(diào)度,需要對算力、網(wǎng)絡(luò)、存儲、能耗等綜合決策,以適應(yīng)工業(yè)生產(chǎn)在高效、節(jié)能、服務(wù)質(zhì)量方面的多目標優(yōu)化。為了克服這些挑戰(zhàn),需要多方共同努力,打通工業(yè)算力的業(yè)務(wù)、數(shù)據(jù),加強算力開放協(xié)議設(shè)計、工業(yè)算力標準制定等方面的工作,形成滿足工業(yè)需求的算力供給能力。
3 工業(yè)算力架構(gòu)
工業(yè)算力架構(gòu)由決策層、管控層和執(zhí)行層構(gòu)成,如圖1所示。在目前的應(yīng)用場景中,其主要實現(xiàn)了邊端精密協(xié)同和云邊精密協(xié)同。
決策層算力是集中式的算力資源中心,一般以工業(yè)云的形式存在,目前運行在工業(yè)云的計算任務(wù)實時性相對較弱。工業(yè)云具有大數(shù)據(jù)分析與決策能力,輸入輸出的數(shù)據(jù)密度與價值極大。在很多制造業(yè)企業(yè)中,工業(yè)云運行工業(yè)模型訓(xùn)練、確定性全局管控、流程優(yōu)化等計算密集型應(yīng)用,一般以較長的周期將訓(xùn)練好的模型更新到邊緣計算設(shè)施。工業(yè)算力綜合管控平臺將實現(xiàn)算網(wǎng)一體化管控,通過統(tǒng)一信息模型打通各類設(shè)備的監(jiān)測接口和管控接口,通過對確定性服務(wù)的維護,確保生產(chǎn)流程中算網(wǎng)控制的閉環(huán)。
管控層算力是由靠近生產(chǎn)線的智能計算設(shè)備組成,實時性能夠滿足工業(yè)應(yīng)用需求。這些設(shè)備具有推理與決策的計算能力,數(shù)據(jù)密度與價值較高,可以實現(xiàn)計算能力開放、數(shù)據(jù)挖掘、虛擬化、任務(wù)遷移等功能。目前邊緣側(cè)的算力開放程度主要受限于應(yīng)用和工業(yè)終端的綁定,通過實現(xiàn)通用服務(wù)和標準化的算法,可以進一步提升邊緣計算的通用性和利用率。
執(zhí)行層算力是工業(yè)現(xiàn)場的本地算力,實時性最強,計算能力相對較弱,數(shù)據(jù)密度與價值較低,可以實現(xiàn)數(shù)據(jù)采集、控制邏輯、本地訓(xùn)練等任務(wù)。傳統(tǒng)工業(yè)設(shè)備如傳感器只能執(zhí)行簡單的任務(wù),未來能夠?qū)崿F(xiàn)算力協(xié)同的主要是具有一定自有算力的智能終端,相對較少的計算能力用于產(chǎn)生數(shù)據(jù)、任務(wù)遷移、數(shù)據(jù)保護等方面。
邊端精密協(xié)同主要是工業(yè)邊緣算力為各種智能終端處理專用計算任務(wù),實現(xiàn)多維數(shù)據(jù)處理、圖像識別、定位信息處理、控制決策等功能,兩者通過滿足工業(yè)高性能通信需求的確定性網(wǎng)絡(luò)互聯(lián)。
云邊協(xié)同主要是針對云平臺和邊緣計算的特點,將計算任務(wù)進行差異化部署,在分布式訓(xùn)練中,可以將匯總的模型部署在工業(yè)云平臺,在工業(yè)邊緣算力部署局部模型。兩者在更新頻率、預(yù)測精度、工業(yè)算法等方面都可以按需配置。
圖1 工業(yè)算力架構(gòu)
4 工業(yè)算力發(fā)展趨勢
(1)算力伴隨業(yè)務(wù)自由聚合傳統(tǒng)工業(yè)網(wǎng)絡(luò)中的數(shù)據(jù)主要是監(jiān)測數(shù)據(jù)和控制數(shù)據(jù),監(jiān)測數(shù)據(jù)是通過攝像頭、傳感器、工控機等產(chǎn)生的原始生產(chǎn)數(shù)據(jù),控制數(shù)據(jù)是控制產(chǎn)線設(shè)備生產(chǎn)的操作數(shù)據(jù)。工業(yè)互聯(lián)網(wǎng)設(shè)施在“端-邊-云”架構(gòu)中逐級處理這兩類數(shù)據(jù)。
隨著行業(yè)需求和工業(yè)應(yīng)用的種類越來越多,在工業(yè)智能終端之間、工廠算力設(shè)施和運營商MEC之間都會發(fā)生算力的聚合,來提供因地制宜的算力服務(wù)。這主要是在礦山、港口、供熱等領(lǐng)域,除了企業(yè)生產(chǎn)園區(qū)之外,還有大量的移動設(shè)備活動區(qū)域。這就需要設(shè)備就近組成集群,實現(xiàn)更快的任務(wù)分發(fā)和結(jié)果匯聚。
(2)確定性算力保障
在工業(yè)場景中,工業(yè)邊緣算力與工業(yè)云平臺的計算過程也會影響工業(yè)終端的執(zhí)行,所以如果想讓IT設(shè)施深度參與OT生產(chǎn)過程,就必須保障算力的確定性。算力的確定性與前文提到的算力粒度相關(guān),針對時間敏感計算任務(wù)進行強制保障的算力粒度越細小,則計算任務(wù)的確定性越強,當(dāng)給每個確定性任務(wù)隔離出充足的計算單元時間片時,其計算時延和抖動就是精確可控的。在保障算力的確定性后,就可以針對確定性任務(wù)的需求指標,分解成算、網(wǎng)指標,從而保障任務(wù)全流程確定性。
(3)分布式訓(xùn)練的應(yīng)用
工業(yè)中數(shù)據(jù)采集和設(shè)備控制的算力開銷是基本穩(wěn)定的資源開銷,未來大部分動態(tài)變化的工業(yè)算力是用于工業(yè)模型訓(xùn)練和優(yōu)化。分布式訓(xùn)練將工業(yè)模型分割,按照規(guī)模和實時性需求部署在工業(yè)算力架構(gòu)各層,需要根據(jù)算力部署拓撲、算力規(guī)模、模型分割等因素決定分布式訓(xùn)練的中心節(jié)點、更新頻率、機器學(xué)習(xí)算法等配置。目前很多企業(yè)只是在集團側(cè)進行模型優(yōu)化,在邊緣側(cè)進行模型部署,隨著機器學(xué)習(xí)應(yīng)用越來越多,可以形成工業(yè)模型分割更加靈活的方案,使得整個企業(yè)中算力可以針對工業(yè)模型的細粒度高靈活動態(tài)部署與優(yōu)化。
(4)群體智能算力
邊緣計算是工業(yè)終端算力不足時的必要補充,隨著芯片成本進一步下降,工業(yè)智能終端的計算、存儲性能都將進一步提升。在作業(yè)范圍比較大的行業(yè),例如礦山、港口、供熱等行業(yè),整個網(wǎng)絡(luò)中既有企業(yè)內(nèi)部網(wǎng)絡(luò),也有擴散到有線網(wǎng)之外的作業(yè)區(qū)。此時,就需要工業(yè)智能終端就近組成算力集群,通過群體智能算力進行跟生產(chǎn)活動強相關(guān)的計算任務(wù),并通過對計算任務(wù)拆分、子任務(wù)遷移、計算結(jié)果匯總的過程,得到預(yù)期的決策結(jié)果。
(5)基于MEC的智能園區(qū)
工業(yè)算力是實現(xiàn)智能生產(chǎn)的重要支撐,它已經(jīng)描繪了美好的愿景。然而,這也導(dǎo)致了建設(shè)工業(yè)算力體系的成本不是中小企業(yè)能夠負擔(dān)的昂貴開支。從國家發(fā)展的角度來看,可以將工業(yè)算力中的決策層設(shè)到工業(yè)園區(qū),由政府出資建設(shè)并形成服務(wù)能力。由運營商將MEC基站租賃給企業(yè),中小企業(yè)只需要采購智能工業(yè)終端即可。該方案具有三大優(yōu)勢:一是增強了工業(yè)算力的共享,提升了算力基礎(chǔ)設(shè)施的利用率;二是形成了可復(fù)用的工業(yè)模型,有利于優(yōu)秀解決方案的推廣;三是降低了中小企業(yè)應(yīng)用新技術(shù)的工業(yè)算力設(shè)施建設(shè)和運維成本。
5 總結(jié)
我國工業(yè)算力已經(jīng)有了長足發(fā)展,但還存在相對松散、標準化程度低等問題,本文在總結(jié)工業(yè)算力架構(gòu)及挑戰(zhàn)的基礎(chǔ)上,提出了未來工業(yè)算力發(fā)展的重點方向。下一步我們將以標準化工作為重點,在工業(yè)算力描述、調(diào)用接口、工業(yè)算力南北向協(xié)議等方面凝聚產(chǎn)業(yè)界共識,最終通過工業(yè)算力的進步促進算網(wǎng)一體化與扁平化發(fā)展。
作者簡介:
付 韜,博士,中國信息通信研究院高級工程師,主要從事工業(yè)互聯(lián)網(wǎng)、確定性網(wǎng)絡(luò)的技術(shù)研究。已發(fā)表期刊及國際會議論文10余篇,其中SCI檢索3篇,EI檢索2篇,申請發(fā)明專利7項。
張恒升,中國信息通信研究院正高級工程師,技術(shù)與標準研究所產(chǎn)業(yè)互聯(lián)網(wǎng)研究部副主任,主要研究方向為工業(yè)互聯(lián)網(wǎng)網(wǎng)絡(luò)。
王 哲,博士,中國信息通信研究院高級工程師,主要從事工業(yè)互聯(lián)網(wǎng)、邊緣計算領(lǐng)域政策、技術(shù)標準,產(chǎn)業(yè)發(fā)展等方面研究,長期支撐工業(yè)和信息化部、國家發(fā)改委等部委的工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)政策制定、重大專項指南編制等工作。目前擔(dān)任CCSA邊緣計算技術(shù)標準及產(chǎn)業(yè)發(fā)展推進委員會技術(shù)促進組組長,同時擔(dān)任IEEETransactionsonVehicularTechnology,IEEEAccess等國際期刊審稿人,已發(fā)表期刊及國際會議論文10余篇,其中SCI檢索5篇,申請發(fā)明專利及軟件著作權(quán)4項,主持并參與起草10余項行業(yè)標準制定工作。(本文通訊作者)
參考文獻:
[1] 劉鵬, 陸璐, 李志強. 工業(yè)互聯(lián)網(wǎng)技術(shù)發(fā)展分析及算網(wǎng)融合的趨勢思考[J]. 自動化博覽, 2023, 40 (2) : 29 - 31.
[2] 施巍松, 等. 邊緣計算: 現(xiàn)狀與展望[J]. 計算機研究與發(fā)展, 2019, 56 (1) : 21.
[3] Ordonez-Lucena, J. and F. Dsouza. Pathways towards network-as-a-service: the CAMARA project. in Proceedings of the ACM SIGCOMM Workshop on Network-Application Integration[C]. 2022. Amsterdam, Netherlands: Association for Computing Machinery.
[4] 馬華東, 等. 一種新型群智感知系統(tǒng)架構(gòu)模型和實現(xiàn)方法[J]. 中國科學(xué): 信息科學(xué), 2023. 53 (7) : 1262 - 1280.
[5] 楊冬, 程宗榮, 田偉康, 王洪超, 張宏科. 廣義確定性標識網(wǎng)絡(luò)[J]. 電子學(xué)報, 2024. 1 (52) : 1 - 18.
[6] Fu, T. and H. Zhang, The System Architecture and Decision Mechanism of the Deterministic Application Layer in the Industrial Internet, 2023.
[7] 張晨, 等. 算網(wǎng)操作系統(tǒng)白皮書[R]. 2023.
[8] 網(wǎng)絡(luò)通信與安全紫金山實驗室, 等. 確定性算力網(wǎng)絡(luò)白皮書[R]. 2022.
摘自《自動化博覽》2024年第二期暨《邊緣計算2024專輯》