BUILDING A MULTI-ROBOT SYSTEM BASED ON STOCHASTIC SUPER-TWIST EVENT MODE CONTROLLER
Abstract and keywords
Abstract (English):
This article presents the development of a "Super-Twist" controller based on stochastic events to solve the problem of building control in a network multi-agent system in the presence of an external disturbance. The stochasticity in the system is introduced by randomness of network uncertainties i.e. losses and delays of data packets. The proposed controller structure consists of two parts. The first part outputs an event trigger condition for updates to the input control data of each agent in the system. The second part guarantees the desired construction in a finite time by determining the upper limit of the time to reach the specified sliding surface of each agent. The proposed stochastic design is tested on mobile robots. The results show a triple efficiency of the stochastic structure. They are a) retaining the advantages of event-triggering strategy, b) retaining the advantages of super-twisting sliding mode controller, and c) robust towards network uncertainties

Keywords:
stochastic, packet loss, delay, event-trigger, sliding surface, stability
Text
Publication text (PDF): Read Download

Введение. Консенсус в мультироботизированной системе (МС) привлек большое внимание исследователей в разных областях из-за её применения в различных областях. Подход, основанный на событиях, является эффективным решением для задачи управления МС. К настоящему времени выполнено несколько работ по событийному управлению МС на основе неориентированной топологии [1], коммутационной топологии [2], последовательно связной топологии [3], направленной топологии [4]. Различные схемы управления на основе событий, относящиеся к консенсусу в МС, включают протокол консенсуса [1], кооперативное управление [5], адаптивное управление [6], децентрализованное управление [2], пиннинг-управление (pinning-управление) [7], управление на основе выборочных данных [4], распределенное управление [8] и так далее. Для всех вышеперечисленных работ требуется идеальная связь между агентами, что не всегда возможно в режиме реального времени. Обмен информацией между агентами может быть подвержен сетевым неопределенностям. Методы управления, запускаемые событиями, позволяют обрабатывать сетевые неопределенности индивидуально [9], или одновременно несколькими агентами [10]. Результаты в [9] основаны только на предположении, что задержки в сети передачи короче временных интервалов между каждым набором триггеров событий. На практике это может быть нереально.

Управление скользящим режимом (SMC) улучшает работу системы при наличии неопределенностей. Это хорошо известный надежный и эффективный метод регулирования. SMC второго порядка (SOSMC) и SMC высшего порядка (HOSMC) очень эффективно выполняют эту задачу. Одним из таких контроллеров является «Супер-твист» SMC (STSMC) [11]. Подходы к построению, инициируемые событиями, основанные на консенсусе, для МС первого порядка, подверженного возмущениям, с использованием обычных SMC и интегральных SMC были предложены в [12]. Обе эти работы рассматривали только возмущения. Для обработки изменяющихся во времени задержек и структурных неопределенностей в системе, Вонг и др. [13] предложили интегральный SMC с синхронизацией по времени. Ю и др. [14] предложили управление по событию для многоагентных систем «лидер-последователь» с проблемой потери пакетов и изменяющихся во времени задержек на основе информации о соседях второго порядка с использованием распределенного контроллера динамического отслеживания на основе наблюдателя. Задача событийного управления стохастическими нелинейными системами с запаздыванием экзогенных возмущений и событийный контроллер с обратной связью исследованы в [15]. Новая проблема H∞ управления для стохастической системы с дискретным временем и событийной схемой при наличии потерь пакетов решается в [16]. Сейчас хорошо известно, что в результате конечной частоты дискретизации в системах с дискретным временем траектории состояний не могли оставаться на заранее спроектированной идеальной поверхности скольжения. Вместо этого траектории оставались бы в пограничном слое вокруг заданной поверхности скольжения, называемой полосой квази-скольжения [17]. Та и Ха [18] предложили SMC с дискретным временем для линейной системы с задержкой по времени и помехами детерминированным образом. В [19] рассматривается надежный SMC для дискретной стохастической системы со смешанными временными задержками, неопределенностями и нелинейностью. В [20] было разработано надежное управление в дискретном скользящем режиме (DSMC) для стабилизации сетевой системы с изменяющейся во времени задержкой связи. Ху и др. [21] исследовали проблему робастного SMC для смешанной задержки и потерь пакетов при неопределенной вероятности пропуска. SMC, запускаемый по событию, на основе наблюдателя и SMC с обратной связью по событию, рассматриваются для модели системы с дискретным временем в [22]. Эти методы существенно развиты в данной статье для управления мультироботизированной системой, рассмотренной в [23].

Разработка математической модели Неголономные мобильные роботы в рамках мультироботизированной системы движутся в плоскости X-Y. Каждый агент в группе имеет одинаковый строй и динамику. Кинематическая модель агента i на рис. 1 аналогична [24] и задана формулой

xi=υicos(θi) , yi=υisin(θi) , θi=ωi  (1)

где xi=xiyiT  и θi  представляют вектор положения и угол поворота соответственно, υi и ωi  - линейная и угловая скорости соответственно.

 

Внеосевая точка Q считается рабочей точкой для робота i. Кинематическая модель (1) сначала преобразуется в форму с одним интегратором. Внеосевая точка расположена в точке xiyi , где xi=xi+lcosθi  и yi=yi+lsinθi  с расстоянием l между центром тяжести (c) и Q . Динамика агента на основе внеосевой точки определяется выражением

xi=υicosθi-lωisinθi             

yi=υisinθi+lωicosθi                      (2)

Линейная и угловая скорости определяются как

υi=uixcosθi+uiysinθi

ωi=(-1l)(uixsinθi-uiycosθi)        (3)

где ui=uixuiyT  – управляющий входной вектор, генерирующий эти скорости. Используя (3), (2) можно упростить как

xi=uix  , yi=uiy                         (4)

На движение робота влияют внешние возмущения (dix , diy ). Следовательно, динамика (4) после учета возмущения принимает вид

xi=uix+dix  ,  yi=uiy+diy      (5)

Динамику (5) можно компактно записать в виде модели с одним интегратором как

xi=ui+di                               (6)

где xi=xi,yiT  и di=dix,diyT представляют вектор положения и сосредоточенную неопределенность для внешних возмущений и немоделированной динамики соответственно.

Распределенная структура МС рассматривается для роботов в качестве агентов. Эти агенты имеют динамику с одним интегратором. Они могут взаимодействовать и передавать данные друг другу. Предполагается, что топология связи между ними - ориентированный и взвешенный граф, лишенный петель, G = (V, E, A). V, E  и A  - это набор узлов, набор ребер и матрица смежности соответственно. aij  - это компонента A , имеющая значение 1, если (Vi, Vj) ∈ E , в противном случае - 0. L  и B  - матрица лапласовской и взвешенной связи между лидером и последователями соответственно.

Обозначения: Для любого вектора ε = [ε1, ε2, ..., εn]T , a) sgn (ε) = [sign (ε1), sgn (ε2), ..., sgn ( εn)]T , b) | ε |η  =| ε1 |η, ..., | εn |η ]T , и в) | ε |η  sgn (ε) = [| ε1 |η sgn (ε1), ..., | εn |η sgn (εn)]T , где параметр ηR . В статье используется норма, которая определяется как ε = εTε.

Системная динамика и управление. Динамика ведущего и ведомого роботов, подверженных сетевой неопределенности и внешним возмущениям в рамках МС определяются как

 

 

Последователь: xit=ρiuuit-δiu+di(t) , i=1…p                                           

Лидер:   x0t=ρ0uu0t-δ0u                                                     (7)

 

 

где xitRn, uitRnи di(t)∈Rn представляют положение, управляющий вход и вход ограниченного возмущения соответственно для i-го ведомого робота, x0tRn  и u0tRn – вектор положения и управляющий вход соответственно робота-лидера,  ρiu  и ρ0u  – случайные коэффициенты потери пакетов для управляющего входа ведомого и ведущего роботов соответственно, δiu  и δ0u  – случайные задержки ведомого и ведущего робота соответственно. Аналогично ρix  и ρ0x  являются коэффициентами случайной потери пакетов, а δix  и δ0x  – это случайные задержки состояний ведомого и ведущего роботов соответственно.

Простая дискретная форма динамики лидер-последователь (7) имеет вид

 

Последователь: xik+1=xiδi,ρik+ΔTuik+di(k)                               

Лидер:x0k+1=x0δ0,ρ0k+ΔTu0k                                              (8)

 

 

где состояния xiδi,ρi  и x0δ0,ρ0  являются результатами их предыдущих состояний и входных данных управления. Они представлены как

 

xiδ,ρk=ρixxik,ρixxik-1,…,ρixxik-δix,ρiuuik-1,ρiuuik-2,…,ρiuuik-δiu

x0δ,ρk=ρ0xx0k,ρ0xx0k-1,…,ρ0xx0k-δ0x,ρ0uu0k-1,ρ 0uu0k-2,…,ρ0uu0k-δ0u  (9)

 

 

Ниже приводится определение стохастической модели для (8) с учетом ожидаемого значения состояний из-за сетевых неопределенностей.

Eδi,ρixi,k+1=Eδi,ρixi,k+ΔTui,k+di,k

Eδ0,ρ0x0,k+1=Eδ0,ρ0x0,k+ΔTu0,k         (10)

где εxi,k  представляет ожидаемое значение xi , Т  – интервал выборки системы. Пусть Eδi,ρixi,k=Eδi,ρixi,k-Eδ0,ρ0x0,k+Гi  и ui,k=ui,k-u0,k  –т отклонение в позиции и вход управления робота-последователя от робота-лидера, Гi  – желаемое отклонение позиции ведомого от лидера. Относительную динамику с использованием (10) можно записать как

Eδi,ρixi,k+1=Eδi,ρixi,k+ΔTui,k+di,k    (11)

Следующая поверхность скользящего режима определена для ведомого агента i  в структуре МС.

Si,k=Eδi,ρixi,k-Eδiρiqi,ka , i=1…n    (12)

где Si,k=[s1,k,s2,ksn,k]T  С началом фазы скольжения Si,k=0 . Для достижения желаемого консенсуса мы рассмотрели закон управления сверхкручением, приведенный ниже

 

ui,k=Eδi,ρiqi,ka-K1Eδi,ρi|Si,k|12sgn(Si,k)+Eδi,ρiϱi,k

Eδi,ρiϱi,k+1=Eδi,ρiϱi,k-ΔTK2Eδi,ρisgn(Si,k)                                                (13)

гдеEδi,ρiqi,k=-γipi+1jpaij(Eδi,ρixi,k-Eδ0,ρ0x0,k+Гi)-(Eδj,ρjxj,k-Eδ0,ρ0x0,k+Гj)+biEδi,ρixi,k-Eδ0,ρ0x0,k+Гi=-γipi+1jpaijEδi,ρixi,k-Eδj,ρjxj,k+biEδi,ρixi,k                                             (14)

 

 

qi  – консенсусный компонент, определенный на основе ошибки отслеживания i-го ведомого и соседних агентов.

В (14) γi>0, α∈(0,1)  и pi(1 ≤pi<p) – количество агентов, соседних с i -м членом. Матрицы усиления K1=diagk11,k12,..k1n  и K2=diagk21,k22,..k2n и с каждым из их элементов - положительные выигрыши.

Экспериментальные исследования. Эксперименты в реальном времени проводились с использованием трех мобильных роботов. Они оснащены датчиком сонара и датчиком положения.

Коммуникационный орграф G  показан на рис. 2. Предполагается, что вес коммуникации между агентами равен 1. Консенсусные параметры графа: L = [0 0; -1 1] и B = [1 0; 0 1].

 

Робот-лидер может свободно перемещаться в любом направлении. Для достижения консенсуса при построении последователи должны следовать траектории лидера.

Начальная позиция лидера x0 = [0; 0] , тогда как последователи изначально находятся в x1 = [-2; 0,5]  и x2 = [-2; -0,5] . Параметры системы следующие: l = 0,21 m, K 1= diag {21, 21}, K2= diag {7, 7}, Γ 1= (0,75 m, -0,75 m), Γ2 = (0,75 m, 0,75 m). , а α = 5/7. Время выборки, учитываемое для экспериментов, составляет 0,01 с. Значение границы помехи Ω  равно 1. Данные, передаваемые от роботов, подвержены задержкам и потерям пакетов. Во время реализации, предположим, что изменяющаяся во времени задержка δix  удовлетворяет условию 0 ≤ δix ≤ 2 . Потери пакетов смоделированы с использованием распределения Бернулли с вероятностью p = 0,15.  

Анализ без потерь пакетов и задержек показан на рис. 3–4. Траектории лидера и ведомого показаны на рис. 3a, а относительное расстояние показано на рис. 3б. Из рисунков видно, что расстояние между агентами остается неизменным с течением времени. Это означает, что агенты могут достичь желаемого построения за конечное время. Линейная (v ) и угловая (ω ) скорости показаны на рис. 4.

Устойчивость предложенного подхода была проверена для случая, когда учитываются потери пакетов и задержки для входных данных состояния и управления ведущего и ведомого роботов. Рис. 7 гарантирует построение даже при наличии сетевых неопределенностей. Их влияние может быть визуализировано с помощью графиков линейной и угловой скоростей на рис. 7. Скорости робота изменяются, когда происходят потери пакетов, задержки или и то, и другое.

Приведенные выше эксперименты подтверждают эффективность предложенного подхода. Консенсус достигается примерно за 3–4 секунды.  Предлагаемый подход является достойным выбором для решения проблемы построения на основе консенсуса при наличии помех и сетевых неопределенностей, то есть потерь пакетов и задержек.

Выводы. В этой статье разработано STSMC управление, запускаемое стохастическими событиями, с конечным временем для достижения консенсусного построения для МС при наличии сетевых неопределенностей (потеря и задержка пакетов) и внешних возмущений. Поверхность скольжения с дискретным временем была разработана для получения условия запуска события для каждого агента. Закон управления на основе событий, устойчивый к сетевым неопределенностям и возмущениям, гарантирует временную стабильность каждого агента во время желаемого построения. Критерии допустимости, удовлетворяемые обновлением управления каждым агентом, позволяют избежать эффекта Зенона во время построения. Эксперименты в реальном времени с использованием трех роботов для желаемого построения подтверждают теоретические разработки, изложенные в статье. Полученные результаты подтверждают, что эффективность предлагаемого подхода не уступает традиционным подходам, запускаемым по времени, и лучше, чем другие существующие подходы, основанные на событиях. Меньшее количество событий значительно уменьшает количество обновлений управления, что еще больше снижает действия исполнительного механизма, необходимые для достижения построения на основе консенсуса. Это обеспечивает экономию вычислительных и коммуникационных ресурсов, доступных во время работы.

Источник финансирования. Работа выполнена при финансовой поддержке РФФИ и ДНТ в рамках научного проекта № 18-57-45014 ИНД_а.

References

1. Zhu Y., Guan X., Luo X., Li S. Finite-Time Consensus of Multi-Agent System via Nonlinear Event-Triggered Control Strategy. IET Control Theory Applications. 2015. Vol. 9. No. 17. Pp. 2548–2552.

2. Cheng T.-H., Kan Z., Klotz J. R., Shea J. M., Dixon W. E. Event-Triggered Control of Multiagent Systems for Fixed and Time-Varying Network Topologies. IEEE Transactions on Automatic Control. 2017. Vol. 62. No. 10, Pp. 5365–5371.

3. Cui Y., Liu Y., Zhang W., Alsaadi F. E. Event-Based Consensus for a Class of Nonlinear Multi-Agent Systems With Sequentially Connected Topology. IEEE Transactions on Circuits and Systems I: Regular Papers. 2018. Vol. 65. No. 10. Pp. 3506–3518.

4. Peng C., Zhang J., Han Q.-L. Consensus of Multiagent Systems With Nonlinear Dynamics Using an Integrated Sampled-Data-Based Event-Triggered Communication Scheme. IEEE Transactions on Systems, Man, and Cybernetics: Systems. 2019. Vol. 49. No. 3. Pp. 589–599.

5. Chen X., Hao F., Ma B. Periodic event-triggered cooperative control of multiple non-holonomic wheeled mobile robots. IET Control Theory Applications. 2017. Vol. 11. No. 6. Pp. 890–899.

6. Qian Y.-Y., Liu L., Feng G. Output Consensus of Heterogeneous Linear Multi-Agent Systems with Adaptive Event-Triggered Control. IEEE Transactions on Automatic Control. 2018. Vol. 64. No. 6. Pp. 2606–2613.

7. Adaldo A., Alderisio F., Liuzza D., Shi G., Dimarogonas D. V., Di Bernardo M., Johansson K. H. Event-Triggered Pinning Control of Switching Networks. IEEE Transactions on Neural Networks and Learning Systems. 2015. Vol. 2. No. 2. Pp. 204–213.

8. Du C., Liu X., Ren W., Lu P., Liu H. Finite-Time Consensus for Linear Multi-Agent Systems via Event-Triggered Strategy. IEEE Transactions on Neural Networks and Learning Systems. 2019. Vol 355. No. 3. Pp. 1338–1350.

9. Dolk V., Borgers D. P., Heemels W. Output-Based and Decentralized Dynamic Event-Triggered Control With Guaranteed Lp-Gain Performance and Zeno-Freeness. IEEE Transactions on Automatic Control. 2017. Vol. 62. No. 1. Pp. 34–49.

10. Dolk V., Heemels M. Event-triggered control systems under packet losses. Automatica. 2017. Vol. 80. Pp. 143–155.

11. Keshtkar, S., Poznyak, A.S., Hernandez, E., Oropeza, A. Adaptive sliding-mode controller based on the super-twist state observer for control of the Stewart platform [Adaptivnyj regulyator na skol'zyashchih rezhimah, osnovannyj na “Super-Tvist” nablyudatele sostoyanij s primeneniem k regulirovaniyu platformy Styuarta]. Automation and Remote Control, Vol. 78 No. 7. Pp. 1218–1233.

12. Sinha A., Mishra R. K. Consensus in First Order Nonlinear Heterogeneous Multi-Aagent Systems with Event-Based Sliding Mode Control. International Journal of Control. 2018. Pp. 1–14.

13. Wang S.-G., Bai L., Chen M. Robust sliding mode control of general time-varying delay stochastic systems with structural uncertainties. Control Theory and Technology. 2014. Vol. 12. No. 4. Pp. 357–367.

14. Yu M., Yan C., Xie D., Xie G. Event-triggered Tracking Consensus with Packet Losses and Time-varying Delays. IEEE/CAA Journal of Automatica Sinica. 2016. Vol. 3. No. 2. Pp. 165–173.

15. Zhu Q. Stabilization of Stochastic Nonlinear Delay Systems With Exogenous Disturbances and the Event-Triggered Feedback Control. IEEE Transactions on Automatic Control. 2018. Vol. 64. No. 9. Pp. 3764–3771.

16. Hu Z., Shi P., Zhang J., Deng F. Control of Discrete-Time Stochastic Systems With Packet Loss by Event-Triggered Approach. IEEE Transactions on Systems, Man, and Cybernetics: Systems. 2018. Pp. 1–10.

17. Gao W., Wang Y., Homaifa A. Discrete-Time Variable Structure Control Systems. IEEE Transactions on Industrial Electronics. 1995. Vol. 42. No. 2. Pp. 117–122.

18. That N. D., Ha Q. P. Discrete-time sliding mode control with state bounding for linear systems with time-varying delay and unmatched disturbances. IET Control Theory Applications. 2015. Vol. 9. No. 11. Pp. 1700–1708.

19. Hu J., Wang Z., Gao H., Stergioulas L. K. Robust Sliding Mode Control for Discrete Stochastic Systems With Mixed Time Delays, Randomly Occurring Uncertainties, and Randomly Occurring Nonlinearities. IEEE Transactions on Industrial Electronics. 2012. Vol. 59. No. 7. Pp. 3008–3015.

20. Argha A., Li L., Su S. W., Nguyen H. Discrete-time sliding mode control for networked systems with random communication delays. American Control Conference. 2015. Pp. 6016–6021.

21. Hu J., Zhang H., Yu X., Liu H., Chen D., Design of Sliding-Mode-Based Control for Nonlinear Systems With Mixed-Delays and Packet Losses Under Uncertain Missing Probability. IEEE Transactions on Systems, Man, and Cybernetics: Systems. 2019. Pp. 1–12.

22. Yao D., Zhang B., Li P., Li H. Event-Triggered Sliding Mode Control of Discrete-Time Markov Jump Systems. IEEE Transactions on Systems, Man, and Cybernetics: Systems. 2018. Vol. 49. No. 10. Pp. 2016–2015.

23. Rybak L.A., Behera L., Malyshev D.I., Virabyan L.G. Approximation of the workspace of parallel and serial structure manipulators as part of the multi-robot system [Approksimaciya rabochej oblasti manipulyatorov parallel'noj i posledovatel'noj struktury v sostave mul'tirobotizirovannoj sistemy]. Bulletin of BSTU named after V.G. Shukhov. 2019. No. 8. Pp. 121–128.

24. Ren W., Sorensen N. Distributed coordination architecture for multi-robot formation control. Robotics and Autonomous Systems. 2008. Vol. 56. No. 4. Pp. 324–333.


Login or Create
* Forgot password?