摘要:文章闡述了多智能體相關概念及背景意義,多智能體協調控制研究現狀,對一致性和包容控制的控制模型及協議進行總結,并闡述了在電力系統中的應用。
關鍵詞:多智能體;協調控制;一致性;包容控制
Abstract:
This paper describes the concept and background significance of
multi-agents, the research status of multi-agent coordination control,
summarizes the control models and protocols of consistency and
containment control, and expounds the application in power systems.
Key words: Multi-agent; Collaborative Control; Consistency; Containment control
1 背景意義及相關概念
智能體目前沒有一個被大家廣泛接受的準確定義,從它的特性出發,研究者Wooldringe和Jennings在文獻[2]中提出智能體強、弱定義。從智能體特性角度說明弱定義是有自主性、社會性、反應性及預動性特性的實體,在強定義中智能體在弱定義基礎上還增加了人的特性。多智能體系統是包含多個智能體的,智能體間存在邏輯關系,可以進行雙向、單向的傳遞狀態信息,集體共同完成一個智能體無法解決的問題。
由于個體能力的有限性,對整體問題的解決不能產生很好的效果這一問題,人類受自然界啟發,在自然界中發現簡單個體利用簡單的規則產生奇妙的現象。比如昆蟲和動物無領導的遷移現象,大雁有組織的飛行,沙丁魚聚集成一團抵御攻擊,螞蟻覓食現象等,多個有限的個體共同協作解決復雜的問題,此現象引起科學家注意,希望能夠運用到生活中,如運輸網絡、傳感器網絡、電力系統、通信系統、醫療等方面,對于科技、經濟的發展產生重要意義,對人們生活產生重要影響。
2 多智能體協調控制研究現狀
在1989年舉辦了第一屆具有國際性意義的有關多智能體的學術會議,從此多智能體開始進入研究者的視野,也成為控制領域的熱點。目前研究主要集中在編隊控制、聚集、群集、一致性控制、包容控制。而對于一致性問題是協同控制的一個基本問題,是研究基于局部信息交換的控制策略,使智能體最終趨于某一共同值。在1987年Reynolds等人[3]模仿自然界動物聚集行為,利用計算機仿真群體生物行為,提出Boid模型,該模型將自然界中生物群體行為描述為三個規則:(1)速度匹配;(2)向中心靠攏;(3)預防產生相互碰撞。在1995年,Vicsek等人[4]提出一種稱為Vicsek模型,此模型利用局部狀態信息的鄰居規則使所有智能體趨同,2003年Jadbabaie等人[5]在沒有噪聲情況下對Vicsek模型做了簡化,為促進一致性發展作出貢獻;2000年后Olfati-Saber等人研究系統的網絡拓撲結構與系統收斂性之間的關系取得了重要成果。在2008年M.Ji在文獻[6]中首先提出包容控制問題,包容控制是多領導者的一種典型情況,實質是一種跟隨者在多領導者領導下,達到由領導者包圍的凸包中。基于Lie代數知識,Xiong等人[7]研討了系統牽制一致性問題。Zhao等人[8]提出了可以加快一致性收斂速度的優化的牽制控制方法。Chen等人[9]關于無向和有向生成樹的有向網絡,研究系統牽制一致性的成果表明當節點間耦合強度很大的時候,牽制一個根節點就可以對整個網絡進行牽制控制。Yu等人[10]研究無向動態網絡指出耦合強度很小的時候值小的節點會優先牽制。Song等人[11]提出了維度比較小時的牽制控制策略,指出入度小于出度時節點要被牽制,此結論和文獻[12]中有關的結論同。Li等人[13]研究了當拓撲結構不同的星型網絡的牽制一致時判據。Nariman等[14]還分別研究了無向以及強連通有向網絡的脈沖控制成本問題,并指出為了減少控制成本,網絡中度值較小的節點需要被選擇牽制。基于虛擬控制,Li等[15]研究了在隨機網絡拓撲和無標度網絡拓撲下多智能體系統的牽制控制問題,并總結出有關全局一致和局部一致的充分條件。Wang等人[16]研究顯示無向網絡可以隨機選擇牽制節點。
3 多智能體協調控制研究熱點
3.1 一致性研究
一致性包含有領導跟隨的一致性研究和虛擬領導的一致性研究。對于領導者跟隨者的問題也是追蹤問題,也就是控制協議令所有跟隨者的狀態與領導者的狀態一致[7、18]。領導者不需要考慮網絡中全部智能體的狀態,只需要將信息傳遞給一部分智能體。虛擬領導是無領導的一致性問題也需要控制協議,令全部智能體信息狀態趨于一個平衡值,但是這個平衡值不能提前設定,并且與全部智能體的初始狀態有關。有關一致性的知識可以參考文獻[19、22]。關于一致性經典模型有以下幾種:
(1)連續時間一階系統一致性模型及協議
(2)二階連續系統一致性模型及協議
典型的二階控制協議為:
(3)高階智能體協議模型
(4)一階離散一致性模型
3.2 包容控制
包容控制就是領導者有多個的一種控制,是一致性控制的特殊情況,本文主要介紹關于通信時延對多智能體包容控制影響的相關模型協議總結。
(1)時延連續包容控制狀態方程為
R,H分別表示領導者集合,跟隨者集合。
滿足固定時延的控制協議為:
(2)時延離散包容控制狀態方程
T>0表示采樣周期,采用如下包容控制協議:
(3)時延非線性包容控制動態方程
當是固定通信時延時,包容控制協議為:
當是時變通信時延時,包容控制協議為:
(4)動態時延線性包容控制動態方程
當是分布式包容控制協議:
K為狀態反饋增益矩陣。
輸出包容控制協議為:
4 多智能體在電力方面的應用
多智能體一致性協調控制多應用于無人機編隊飛行/航空領域。得到研究者的重視,目前已經滲透到很多行業領域。多智能體一致性協調控制在電力系統中也很快得到發展,譬如,有人提出有約束整合項的多智能體協同控制水滴優化方法,完成三相不平衡電網狀態估計[23]。又如,為使微網內部功率平衡實時調節控制,采取協調控制的方法合理對分布式電源出力調節[24]。還有就是,提出孤立微網功率經濟分配方法在多智能體系統中的應用,用下垂控制與一致性有關知識,通過下垂控制使電力系統功率平衡,使用功率控制器控制全部電源出力,并使微網功率經濟合理分配[25]。一種利用多智能體系統研究配電系統管理的方法,模擬配電系統的特性[26]。
5 總結
對于多智能體協同控制問題介紹了相關概念及研究背景,以及發展現狀,并在一致性及包容控制方面進行動態描述和控制協議總結。關于多智能體協同控制的研究還有許多方面,如群聚、編隊,以及將理論與實際相結合等方面。對于多智能體一致性收斂速度問題是一個值得研究的熱點問題。
參考文獻:
[1]
WOOLDRIGE M, JENNINGS N R.Intelligent agents:theory and practice[J].
knowledge Engineering Review, 1995, 10 ( 2 ) : 112 -152.
[2] 李勃,耿華. 實驗多智能體系統的協調控制[M]. 北京: 電子工業出版社, 2018.
[3] REYNOLDS C W. Flock, herds and schools: A distributed behavioral model[J]. ACM Siggraph Computer Graphics, 1987, 21 ( 4 ) : 25- 34.
作者簡介:
李 雙(1991-)女,河南周口人,長春工業大學碩士研究生在讀,從事多智能體協調控制在電力方面的智能控制研究。
摘自《自動化博覽》2020年1月刊