就應用的普遍而言,當今工業自動化是唯一一個仍然使用專用計算機、PLC和DCS控制系統,而不是在系統邊緣使用標準計算平臺進行本地控制、優化、分析和數據提煉的行業。從OT領域的發展歷程來看,經典的PLC/DCS(特別是大型DCS)除了具備數據采集、實時控制和完成確定性任務, 以及一定的網絡通信功能外,也具備一定的數據庫、數據過濾、數據分析的功能。不過數據采集的范圍還是局限于原先設定的控制對象, 充其量只能就地進行數據分析、過濾和局部優化,不可能從生產的全局視野去安排決策控制的目標。這是因為當時互聯網技術還沒有成熟到向工業生產推廣的程度, 計算技術也不曾發展到云計算時代。然而云計算雖有算力強勁的優勢, 卻又有受限于通信能力(特別是廣域通信) 所造成的針對大規模實時數據采集的劣勢。顯然,讓處于嚴苛工業環境下的PLC/DCS大幅提高算力和存儲, 并不是一種合理的成本安排和技術解決方案。由此可以得出如下的結論: 邊緣計算的應運而生是隨著工業互聯網的時代來臨, 與此同時制造業又正在經歷著一場前所未有的變革這兩種形勢的積極推動所致。工業互聯網、智能制造、工業4.0的實現,都有待制造裝備在高水平上提供數字化、信息化與智能化的基礎, 有待IT/OT的實質性融合。正如Gartner所預測的,“邊緣計算對基礎設施和運營領導者的意義在于, 到2025年75%的數據將在傳統的集中數據中心或云之外創建和處理”。從技術基礎上說, 隨著芯片、通訊與儲存技術的不斷提升, 工業現場設備的硬軟件能力取得了極大的提高。為了充分利用現場設備的數據資源, 產生了對邊緣計算功能的迫切需求, 也使得過去難以實現的智能變成可能。就發展的順序而言,先有云計算和互聯網,然后才有云-邊-端的架構生成。在工業互聯網的推進過程中,OT與IT融合難的問題越發明顯,一邊是以IT企業領銜的工業互聯網平臺試圖向工業應用大規模挺進,另一邊是以OT企業領銜的制造系統設備信息化水平不斷提升,但工業互聯網平臺始終無法與制造系統雙向互通,實現智能算法與模型的真正落地。可以預料,邊緣計算的出現和快速推廣運用,將成為OT與IT融合的紐帶、工業互聯網落地的實際載體。
1 工業邊緣計算的概述和參考架構
1980年美國普渡大學工業工程系提出計算機集成制造系統的參考模型,被國際工業和學術界奉為經典,后來發展成為ISA 95企業信息系統集成標準的基礎;企業信息系統集成國際標準IEC/ISO 62264脫胎于ISA 95。迄今為止ISA 95的參考架構仍然是工業企業進行數字化轉型的基礎參考架構,因而在開創工業邊緣計算的技術方向時,從總體視角來看它依然是基本的參考架構。圖1完整地表述了將ISA 95的參考模型映射到工業云-邊-端所對應的架構。從工廠的信息集成發展到企業的信息集成, 原有的5層模型增加到6層模型, 也即從企業內部的管理擴展到把企業經營活動的上下游(涵蓋供應鏈、產品全生命周期等)都包羅進來,目的是保證企業生產和管理的全局優化。對應由頂層向底層的各個層級,它們的數據流量和時間尺度分別是:管理層為百萬字節/天(Megabytes/days),運營操作層為兆字節/小時(Mbytes/hours),監控/協調層為千字節/分(Kilobytes/minutes),直接控制層為字節/秒(Bytes/seconds),設備和過程層為位/微秒(bits/microseconds)。按照對實時性能的要求可以大致將這些層級劃分為兩類: L4層的ERP和L3層MES劃分為實時性要求低或較低、數據量大的一類,對應于工業云-邊-端的架構,這一類可以遷移到云端。而L2層的SCADA和HMI、L1層的PLC/DCS以及L0層的傳感器和執行器,實時性要求高、數據量低,對應于工業云-邊-端的架構,這一類必須保留在生產現場,它們都是屬于邊緣計算節點(ECN)。
圖1 ISA 95參考架構對云-邊-端的映射
圖2是一個典型的工業云和邊緣計算架構,分為三層。頂層是工業云平臺,提供涵蓋設計、制造、管理和維護的各種應用程序。為了降低部署和運營成本,傳統的ERP、MES、產品生命周期管理(PLM)和客戶關系管理(CRM)系統都可以遷移到工業云。此外,通過邊緣計算設備采集的實時數據,可以增強設備運行分析、供應鏈分析、能耗優化等工業云創新應用。這些服務甚至可以由第三方提供,并運行在本地云/本地數據中心上,而不是公共云上。中間層為工業邊緣網關,負責算法部署、計算、組網、存儲資源均衡,管理各ECN的數據集流程。邊緣網關保證了快速開發以及通過模型驅動的模塊化服務編排的敏捷部署,負責監控客戶端、終端、物聯網和云服務器之間的所有網絡數據包交換事務,還可以通過修改這些數據包提供附加功能,例如當本地網絡檢測到新設備使用未識別的網絡協議時,邊緣網關需要自動配置該新協議,或者更新安全策略以保護ECN。如果發現來自底層物聯網系統的攻擊,邊緣網關應檢測并阻止其訪問;反之,來自外部IT系統的攻擊也應該由邊緣網關來阻止。底層包含一系列分布式ECN。ECN可以執行一項或多項功能,包括具有協議轉換的網絡交換機、實時閉環可編程控制器、用于大數據分析的本地云和低成本傳感器。這些功能可根據閉環反饋數據實時動態分配到任意ECN的組合。
在圖2所示的參考模型中,工業邊緣計算可以通過多種方式與工業云進行協同。這表現在:(1)工業邊緣計算可以實時(毫秒級)提供本地計算、存儲、網絡和虛擬化資源的自我管理和平衡;還可以分發和執行工業云制定的策略,包括管理設備、資源和連接。(2)從數據角度來看,ECN主要用于數據采集,并根據預定義的規則進行初步的數據處理和分析;工業云提供從多個ECN收集的海量數據的存儲、分析和挖掘。通過云與邊緣之間的高效數據流動,可以降低數據驅動的產品質量跟蹤和數據挖掘的成本。(3)在應用領域中,工業邊緣提供執行環境、執行部署計劃并監控部署的邊緣應用程序的生命周期。例如,機器學習模型在工業云上訓練后,再部署到ECN進行推理。對于工業云上的典型應用,如開發、測試、數字孿生等,ECN則對這些靈活、可互操作、基于組件設計和微服務化的模塊進行實例化。
圖2 典型的工業云和邊緣計算架構
表1給出描述邊緣計算和云計算范式的維度,著重揭示了將邊緣計算方法應用于制造過程所面臨的機遇和挑戰。
表1 邊緣和云的特點比較維度
作為工業云的補充,工業邊緣計算提供了互操作性、實時數據處理和自優化,而這些都不是工業云的主要關注點。互操作性確保了系統到系統級數據遷移以及設備到設備級數據交換的垂直和水平集成。通過ECN的全面互操作性,可以將柔性和分布式協同運行引入產品設計、生產、管理、供應鏈等制造過程的整個周期。此外,通過將云邊協同模式應用到新的業務中,可以實現資源的最大利用。邊緣實時數據處理將減少工業云的工作量,數據采集、預處理、校準、轉換可在邊緣設備上實時完成,無需向工業云發送海量數據。通過工業云和 邊緣計算資源的協同,可以將數據驅動優化擴展到邊緣節點。采用來自工業云和分布式推理的預先訓練的機器學習模型,可以滿足實時約束和提升數據處理的效率。
圖3是研華公司的云-邊-端架構示意圖,將這三層的功能都具體化了。
圖3 研華公司的云-邊-端三層架構及其功能表述
2 從三個視角分析工業邊緣計算
在制造背景下的工業邊緣計算可以理解為:這是一類常駐在臨近數據物理源頭的分布式邊緣節點構成的系統。這些邊緣節點必須運行在任意一種容器內,并且受到集中的管理。邊緣節點既要與云端層級連接,又要與生產資產層級連接,還要與其它的邊緣節點連接,而且邊緣節點可以暫時性地離線運行。
從概念上講,邊緣計算是通過云中心平臺采用分布式的方法去處理、管理和運行數據的。工業邊緣計算意義上的數據處理,并不等同于就地或現場的數據處理,它還應該有如下兩個特征:邊緣是對中心而言,有邊緣就一定有中心,因此邊緣計算盡管是在離數據生成點盡可能近的地方進行數據處理,但它一定是為中心進一步的全局數據處理服務的;邊緣計算采用虛擬化的軟件技術,主要是容器化技術(例如Docker)。
下面從基礎架構、應用和操作運行三個不同的視角來分析邊緣計算節點。
(1)基礎架構視角
一般邊緣計算節點由一個計算節點和一個客體系統兩部分組成,如圖4所示。計算節點包括物理硬件、操作系統和系統管理程序;在邊緣計算節點中允許運行獨立的客體系統。客體系統由容器的運行時(runtime)
以及容器化軟件本身組成。
圖4 邊緣計算節點的基礎架構框圖
從基礎架構的視角看,邊緣計算節點有兩個必須具備的特性:其一是具有運行和管理容器化軟件的能力,為邊緣容器的運行提供輕量級的虛擬化,而不是像虛擬機那樣還必須帶有自己的操作系統;其二是具有上連云層級、下連生產資產層級的雙向連接能力,這意味著一個符合要求的邊緣基礎架構需要經由各種可用的網絡提供與云端直接或間接的連接性,而且還要能處理暫時的離線運行狀態。與云端連接必須有足夠的信息安全保證,不能簡單地依賴嚴格的網絡隔離措施,因為云平臺需要與更多的構成制造系統的重要部分如用戶、數據、服務和設備等進行連接。
通常邊緣計算節點有兩種實現方案,一種是在工廠數據中心以虛擬化的方式建立的邊緣計算節點;還有就是在生產現場部署的物理邊緣計算節點,近些年發展迅速的邊緣可編程工業控制器、輕量級的嵌入式設備都屬于這一類。利用容器的編排技術在數據中心部署邊緣計算節點具有以下優點:高可用性、良好的可擴展性、降低運行成本以及沒有附加的硬件和接線要求。在以下場景建議采用物理邊緣計算節點:在生產單元中由于要為網絡減負,進行諸如數據過濾和數據聚合等處理;為降低延遲,運行基于人工智能的控制回路;要求連接附加的外部設備;將不安全的協議轉換為具有信息安全的協議。
(2)應用視角
從應用的視角描述部署在邊緣節點上滿足OT和IT要求的應用功能組件,而且這些功能組件作為容器化的軟件需要與云-邊-端的體系結構和基礎架構相匹配。這就是說功能組件需要解決下面這些典型的問題:在分布式邊緣環境中支持和管理標準化通信;對不同的數據源進行標準化和轉換,從而將整個解決方案推向一個通用的語義建模方法;將客戶的業務邏輯組件用標準化的連接模塊集成;管理分布式邊緣節點之間的數據存儲;確定邊緣節點的業務邏輯,并在邊緣和云環境之間管理業務邏輯。
因此,應用程序視圖需要包含多個具有一系列不同功能的組件,包括:云連接,生產資產連通性,用于邊緣節點內部和分布式邊緣節點之間通信的組件,數據處理和預處理,數據聚合,語義富集(semanticenrichment),具有特定業務邏輯的組件(例如邊緣分析、機器學習)等。
從應用的視角來看,邊緣節點上連云端,下連資產,如圖5所示,為了執行其特定的應用功能需要在其內部通過消息代理/API網關對若干功能組件(如圖中的數據處理功能組件、語義富集功能組件和其它邊緣應用的功能組件)進行集成。功能組件的功能性一般隨所使用的工業互聯網或智能制造系統的規模和復雜程度(即隨數據源的數量和類型、數據的容量以及應用功能和應用點的多少)而變化。
圖5 從應用視角分析邊緣節點舉例
為了解決上述邊緣節點的典型要求,需要考慮以下幾點:
?在邊緣應用程序和邊緣節點之間創建松散耦合架構的消息代理或API網關;
?按用例的要求選擇同步或者異步通信模式;
?用于遠程數據采集和下達命令數據所定義的、柔性的有效載荷格式;
?用于語義富集的信息模型;
?離線場景和數據緩沖能力;
?訓練復雜的機器學習模型,其中在云端訓練的是算力要求高、有足夠可資利用的數據流存取水平的模型,在邊緣訓練的主要是考慮帶寬約束限制、有一定實時要求的模型。
圖6為一個參考用例,生產資產連接器從PLC采集能源數據并將其轉發給消息代理。消息代理確保了不 同邊緣應用程序和連接器之間的消息交換。能量分析組件實現一個按用戶要求定制的業務邏輯,從采集到的數據中識別異常。因此,應用程序從消息代理接收能量數據、執行分析,并將結果發布到消息代理上。云連接器將分析結果傳輸到企業總線。這個參考用例還描述了云連接器和生產資產連接器通過消息代理將新的參數從企業總線傳輸到PLC,并在PLC中更改了一個運行參數。
圖6 一個參考用例(從應用視角分析)
(3)運行視角
由于制造業的應用在穩定性和自動化方面有特殊的要求,邊緣節點的綜合操作方法是必不可少的。這里重點討論在邊緣節點的整個生命周期中對其進行管理的重要功能。
邊緣節點會經歷從規劃、硬軟件準備、組態、運行直到退役的生命周期各個階段。每個階段的成功執行都有特定需求。這些需求通常可以通過附加的云服務來滿足。主要的云服務支持有:邊緣節點管理和編排服務、監控服務、安全服務和邊緣節點參數同步。
管理和編排服務: 一般來說,這種云服務的任務是獲取所連接邊緣節點的當前狀態或設置所需狀態。
在硬軟件準備階段,該服務對新的邊緣節點進行編排引導。第一步是創建數字標識,數字標識可以源自現有的資產管理系統。然后提供一個端點,邊緣節點在此發起連接。為此,必須執行邊緣節點的基本設置,示例操作包括安裝操作系統、提供代理和提供安全憑據。該服務還可以保存和管理邊緣節點的目標組態。
初始連接完成后,邊緣節點提供基本的自描述特征(狀態)。將節點狀態與服務中的目標配置進行比較,如果發生偏差,狀態更新被發送到邊緣節點。狀態更新可以是安全或策略更新、組態和應用程序版本更改。在圖6的參考用例中,組態參數是識別異常能源消費模式的閾值。
對于每個特定的用例都要為所裝的應用程序配置一定的參數。這些參數在組態階段被推送到邊緣節點用于應用程序。例如將一個組態文件加載到存儲器,并在啟 動時由容器獲取。在操作階段發生刷新時也是如此。
最后一個階段是退役。在物理邊緣節點上,退役是由硬件故障或升級周期引起的;這時需要更換硬件,并將退役節點的識別號及其狀態轉移到新設備;為了減少生產場景中的停機時間,這種重新定位必須由服務盡可能無縫地自動完成。在虛擬邊緣節點上,故障失效將導致啟動一個新的邊緣節點和轉移數字識別號。如果邊緣節點可以完全退役,需從邊緣節點管理服務中刪除其識別號。
監控服務: 從邊緣節點收集所有日志以及量測單位和量程信息。
信息既可以來自主機系統,也可以來自運行的容器應用程序。因此,邊緣運行時和應用程序必須支持這種機制。
在硬軟件準備階段,邊緣節點建立與監控服務的連接。通過該服務,可以將報警(例如所分配的內存容量不足)應用于傳入數據的流分析。之后,報警、日志以及測量單位和量程可以在接下來的組態和操作階段使用。它們用于確定系統的健康狀況和執行事件跟蹤。為了獲得有意義的結果,日志消息必須具有定義好的格式。通用組件包括消息來源、嚴重程度、內容、UTC時間戳和相關標識,以確保更好的可跟蹤性。
安全服務: 負責管理邊緣節點及其應用程序的安全。
在硬軟件準備階段,邊緣節點第一次連接到云服務,并互相認證它們的安全措施。在大規模安裝物理邊緣節點的場景下,可以提供對第一次連接有效的默認認證。安全服務的第二個任務是通過比較目標狀態和當前設備狀態執行安全策略。例如更新主機系統和應用程序的安全規則,再比如禁用端口。在組態階段,安全服務通過處理與安全相關的任務(例如安裝證書)連接到第三方服務,從而支持邊緣應用程序組態。此外,邊緣應用程序可以通過該服務以安全的方式管理其中不得泄露的內容。在運行階段,對漏洞數據庫進行持續監控,任何發現都可能導致目標狀態的潛在更新。在退役階段,將撤銷邊緣節點中與安全相關的內容。
邊緣節點參數同步: 參數同步服務的任務是同步云服務和邊緣節點之間的應用程序參數。因此主要用于操作階段。通過設備管理服務以同步方式對云和邊緣的參數刷新。作為先決條件,邊緣容器運行時必須能夠接收這些參數,并向容器應用程序提供。容器應用程序本身需要能夠解釋它們,并根據來自參數同步服務的設定值進行動態刷新。
在圖6的示例中,流程專家程序對云上的可視化數據進行分析,然后在邊緣節點通過參數同步服務設置新值用以減少能源消耗。
3 工業邊緣計算標準化的進程
在新技術和概念的早期發展階段都有標準化的迫切需求,邊緣計算也不例外。不過目前的邊緣計算在相關標準的制定方面已經落后于市場實際需求。工業是典型的需要標準化的領域,因此需要定義標準協議與規范來約束邊緣計算節點的管理、邊緣端數據的處理、邊-云協同機制等關鍵問題。于是有許多官方標準機構包括ISO、IEC、IEEE、歐洲電信標準協會(ETSI)、電信行業協會(TIA)、云原生計算基金會(CNCF)、Linux基金會(LF Edge) 、工業互聯網聯盟(IIC)等都正在從事與邊緣計算相關的標準化工作。ISO、 IEC、IEEE把注意力集中于邊緣計算在智能制造和工 業互聯網中應用的標準化問題,其余那些原本從事通信領域的機構,標準化的重點大部分放在邊緣與云端的通信(如5G)、信息安全等方面。例如IEC/TC 65/WG 23“智能制造框架和系統架構”標準化工作組, 2021年的主要話題和任務就是搞清邊緣計算對智能制造的影響,包括市場的走向和未來的要求、邊緣計算的可用性及影響、智能制造對邊緣計算的要求、工業邊緣計算對物理安全和功能安全的影響,以及工業邊緣計算對信息安全的影響等。這說明IEC已經下決心開發和制定工業邊緣計算的相關標準,但尚處于起步階段。而走在前面的IEEE在3年前就開始制定工業互聯網+邊緣計算體系下節點與節點間的智能管控標準。邊緣計算節點除了承擔計算、儲存、通信功能外,還應具備任務管理、數據管理、數據分析等功能。再加上工業系統對可靠性與安全性的嚴格要求,不能完全依賴基于云計算的決策機制,也就是說即使在與工業云連接斷開的情況下工業現場生產系統也應保證正常生產,因此也更加凸顯邊緣計算在工業互聯網系統中的重要性。在工業互聯網邊緣計算框架下,工業系統可以選擇邊-云協同的模式,包括公有云+邊緣計算系統或者私有云+邊緣計算系統,當然也可以選擇僅由邊緣計算系統來支撐。在任意一種模式下,都需要對現有的設備節點進行管控。
從基礎架構、應用和操作運行三個視角來分析邊緣計算節點所提出的許多問題,都可以通過標準化的方法來解決。IEEE P2805系列標準可解決相當一部分。IEEE P2805系列標準是IEEE下屬工業電子學會標準化專委會開發的與邊緣計算節點相關的系列標準。目前已經獲得IEEE標準委員會批準立項的共有三個部分:P2805.1邊緣計算節點自我管理協議;P2805.2邊緣計算節點數據采集、過濾與緩存管理協議;P2805.3邊-云協作機器學習協議。三部分協議相輔相成,共同形成完整的邊緣計算智能管控體系。通過為邊緣計算節點定義這些標準,解決了互操作性問題,從而可為工業互聯網應用帶來巨大的利益。
IEEE P2805系列標準旨在解決工業邊緣計算的三個挑戰:(1)在生產現場內存在大量的ECN時, 如何自動管理這些節點是關鍵。IEEE P2805.1標準定義ECN的自我管理協議,包括ECN的識別、資源管理、備份、負載平衡和數據共享。(2)為了定義如何管理每個邊緣計算節點上的數據采集,在IEEE P2805.2標準中規范用于ECN數據采集、濾波和緩沖的協議,包括如何配置數據獲取和驗證數據,如何定義數據預處理規則,以及如何管理ECN上的數據緩沖。(3)在獲得大量可供分析的數據后,需要定義機器學習方法如何在工業云和邊緣計算之間進行協作。IEEE P2805.3標準定義了用于機器學習的云-邊緣協作協議,為在低功耗、低成本的嵌入式設備上應用機器學習算法提供了指導方針。此外,還涵蓋了分布式機器學習模型的部署以及在線優化。如圖7所示。
圖7 IEEE P2805邊緣節點管理標準
4 結束語
工業邊緣計算是邊緣計算應用中最具發展潛力和經濟效益的一個領域,也是面對的應用場景最多、技術最綜合最復雜、對標準化需求最迫切的領域,因此吸引了許多傳統的工業自動化企業和IT企業的重視和推動。僅以IT/OT融合這一熱門話題為例,為了追求這二者的融合而將設計約束引入邊緣計算。通常作為設計和實現的指導,OT和IT解決方案有著不同的約束和要求。OT關注生產過程的安全性、效率、穩定性和連續性,而IT則優先考慮速度、安全性和數據分析。邊緣計算必須融合OT和IT的特性,以最大限度地發揮其潛力。例如,如何利用IT系統的敏捷性,并按OT的指標確保以執行任務為關鍵要求的連續性,以及對時延敏感過程的高可用性。此外,還必須考慮來自不同數據源(分布在車間的各種系統中)的后端數據集成及其語義的挑戰。還要從中選擇那些對業務至關重要、必須在邊緣進行計算的數據。
5G作為新一代的無線通信技術和正在發展中的確定性IP網絡,都是加強工業邊緣計算必不可少的通信工具。一些邊緣網關已經配備了5G模塊,如研華的5G邊緣計算網關UNO-137在滿足穩定的工業控制的同時,可以提供硬件加密以及最新的5G通訊; 搭配Codesys、DAQNavi、VisionNavi、Edgelink等軟件,還可以使傳統的工業控制在邊緣側變得更智能。
工業邊緣計算節點加上智能化軟件,有些人稱之為邊緣智能(Edge AI) 。最近一個在歐洲進行的調查結果預示著邊緣智能市場呈現指數曲線的增長勢頭,而德國無疑是最大的市場, 其從2020年到2025年的增長率達到28%。類似的情況正在其他發達國家出現,我國也出現了蓬勃發展的苗頭。但針對邊緣計算乃至邊緣智能的嚴謹的需求分析、技術研究、產品開發,以及標準化工作都十分缺失,這個問題如果不處理好,必將為整個工業互聯網和智能制造系統的建設帶來很大的困難。畢竟大部分數據來自底層設備,而粗放的設備聯網和數據上云并不能解決最關鍵的那些問題。
作者簡介:
彭 瑜 (1938-),男,湖南長沙人,教授級高級工程師,上海工業自動化儀表研究院教授級高工、顧問,PLCopen中國組織名譽主席。迄今為止, 已經為中國工業自動化技術的發展服務了50多年,涉及流程工業、離散制造業等領域的檢測、控制、生產制造、執行管理等多個方面。
摘自《自動化博覽》2022年2月刊