Observation Bias Rectification-based Cascaded Active Disturbance Rejection Tracking Strategy for Unmanned Ground Vehicle
-
摘要: 无人地面车辆(UGV)在复杂外部环境下难以保持其良好的动态性能。为此,本文提出了级联形式的偏差校正自抗扰控制策略,通过提高观测器对扰动的估计精度来增强UGV控制系统的扰动抑制能力。首先,将广义外部扰动与系统内部扰动重构为总扰动,并设置校正项以扩展初级扰动观测器的观测阶次。之后,为提高观测精度,在次级扰动观测器中对未被及时观测出的扰动残余值进行估计。基于反馈线性化理论,设计了包含总扰动估计值的轨迹跟踪控制律,从而提高UGV的轨迹跟踪误差收敛速度和跟踪精度。为了提高控制器对不同UGV模型的适应性,针对控制器关键参数与闭环模型的对应关系设计了参数配置规则。通过理论分析证明了系统的稳定性和抗扰性能,并在多种情况下进行对比实验以测试所提方法的性能。实验结果表明,所提策略可有效改善UGV在不确定环境下的轨迹跟踪效果。Abstract: It is difficult for unmanned ground vehicle (UGV) to maintain good dynamic performance in complex external environments. For this problem, a bias rectification-based cascaded active disturbance rejection control (ADRC) strategy is proposed, which enhances the disturbance suppression performance of UGV control system by improving disturbance estimation accuracy of the observer. Firstly, generalized external disturbance and system internal disturbance are reconstructed as total disturbance, and rectification items are set to expand observation order of the primary disturbance observer. Then, residual disturbance unobserved in time is estimated in the secondary disturbance observer, to improve the observation accuracy. Based on feedback linearization theories, a trajectory tracking control law containing total disturbance estimation is designed, so as to improve the tracking error convergence speed and tracking accuracy of UGV. To improve controller adaptability to different UGV models, a parameter configuration strategy is designed according to correspondence between controller key parameters and the closed-loop model. Stability and anti-disturbance performance of the UGV system are demonstrated by theoretical analysis, and comparative experiments are conducted to test the performance of the proposed control method in various situations. The experimental results show that the proposed strategy can effectively improve the trajectory tracking effect of UGV in uncertain environments.
-
随着传感器和车载计算机的性能提升及自动化技术的不断发展,无人地面车辆(UGV)的高性能自主控制引起了研究人员的广泛关注[1-4]。UGV自主控制的关键技术主要包括车辆定位与建图、路径规划、车辆跟踪控制等[5]。通过视觉传感器可实现车辆定位和建图[6-7],之后进行全局路径和局部轨迹规划,并将规划结果提供给跟踪控制器[8]。UGV轨迹跟踪控制一般分为纵向控制与横向控制[9],纵向控制通过车辆驱动系统使UGV以期望线速度运动[10],横向控制通过车辆前轮转角控制车辆偏航角和横向位移以实现轨迹跟踪[11]。由于车辆模型不确定性、侧向运动约束、外界干扰等因素的影响,设计高精度的UGV轨迹跟踪控制器成为机器人自动控制领域的研究难点[12]。
常规的线性二次型调节器(LQR)能够实现典型场景下UGV的轨迹跟踪[13],但在外部扰动与不确定因素同时存在时难以保证系统的鲁棒性。为此,文[14] 提出了基于LQR的频率整形控制策略,该方法提高了线性UGV模型在参数不确定条件下的系统鲁棒性和跟踪精度。针对非线性UGV模型,Li等[15]提出了一种迭代LQR方法(iLQR)以快速求解最优控制量。基于车辆初步避障运动规划,文[16] 在iLQR控制器的基础上设计了可添加避碰约束的CiLQR(constrained iLQR)控制器,以解决非凸避碰的最优控制问题。
在此基础上,为了提高外部扰动下的轨迹跟踪精度,研究人员对鲁棒控制方式进行了大量研究[17]。文[18] 提出了一种滑模控制(SMC)方法,通过设计合适的滑模面和自适应律实现了UGV控制。与iLQR相比,SMC方法通过降低UGV的动态阶数提高了系统可控性。不过,SMC固有的抖振问题导致UGV在复杂情况下跟踪精度不佳[19]。为了解决抖振问题,文[20] 设计了一种超螺旋滑模控制器,通过使输入量与输出量保持连续来抑制抖振,但这种方式降低了控制器的鲁棒性。此外,结合自适应策略的反步控制器也在UGV控制中得到了广泛应用[21-23]。文[22] 通过设计自适应估计规则解决了参数不确定的问题,并在保证系统稳定性的前提下使跟踪误差收敛至0。不过,参数估计规则较依赖于车辆模型,且其收敛速度较大影响了UGV控制器的暂态性能。
自抗扰控制(ADRC)具有易于实现和鲁棒性强的特点,近年来已应用于UGV控制[24]。一方面,利用预测补偿策略对整体扰动进行预估,例如使用Smith预估补偿算法获得近似无延迟的输出反馈量[25],但该模式在参数整定时需要大量的实验数据。另一方面,对低阶ADRC进行调整能使其适配高阶被控对象,这种ADRC结构简单并易于实际使用。文[26] 设计了两阶段ADRC控制策略,建立切换式纵向-横向半耦合模型,提高了系统抗噪声以及补偿扰动的能力。文[27] 根据微分平坦理论实现了动态模型的线性化,并保证了控制精度。在文[27] 建立的线性化模型基础上,文[28] 使用指数逼近的非奇异终端滑模控制策略来提升系统的动态抗扰性能。上述方法将总扰动视为单一变量扰动进行观测,导致总扰动估计阶次不完整。
为了进一步提高UGV系统的轨迹跟踪精度和鲁棒性,本文基于UGV动态特性和典型线性ADRC(CLADRC),提出了级联观测下偏差校正的UGV轨迹跟踪控制方法。首先针对UGV运行过程中的复杂扰动,设计了级联形式的扩张状态观测器(ESO)。其中根据总扰动特性,在初级ESO中设计校正项并扩展扰动观测阶次,以重构扰动观测结果。之后,将结果输入次级ESO,以高精度地补偿复杂高阶扰动。然后,基于微分前馈策略,设计了具有观测偏差校正的自抗扰控制方法(OBR-ADRC),以提高UGV跟踪给定轨迹时的控制效果。利用李雅普诺夫理论证明了渐近稳定性,并给出稳定域边界。此外,设计了参数整定方法,以增强控制器对于不同UGV模型的适应性。最后开展了多项对比实验,验证了所提OBR-ADRC方法的跟踪精度和鲁棒性。
随着传感器和车载计算机的性能提升及自动化技术的不断发展,无人地面车辆(UGV)的高性能自主控制引起了研究人员的广泛关注[1-4]。UGV自主控制的关键技术主要包括车辆定位与建图、路径规划、车辆跟踪控制等[5]。通过视觉传感器可实现车辆定位和建图[6-7],之后进行全局路径和局部轨迹规划,并将规划结果提供给跟踪控制器[8]。UGV轨迹跟踪控制一般分为纵向控制与横向控制[9],纵向控制通过车辆驱动系统使UGV以期望线速度运动[10],横向控制通过车辆前轮转角控制车辆偏航角和横向位移以实现轨迹跟踪[11]。由于车辆模型不确定性、侧向运动约束、外界干扰等因素的影响,设计高精度的UGV轨迹跟踪控制器成为机器人自动控制领域的研究难点[12]。
常规的线性二次型调节器(LQR)能够实现典型场景下UGV的轨迹跟踪[13],但在外部扰动与不确定因素同时存在时难以保证系统的鲁棒性。为此,文[14] 提出了基于LQR的频率整形控制策略,该方法提高了线性UGV模型在参数不确定条件下的系统鲁棒性和跟踪精度。针对非线性UGV模型,Li等[15]提出了一种迭代LQR方法(iLQR)以快速求解最优控制量。基于车辆初步避障运动规划,文[16] 在iLQR控制器的基础上设计了可添加避碰约束的CiLQR(constrained iLQR)控制器,以解决非凸避碰的最优控制问题。
在此基础上,为了提高外部扰动下的轨迹跟踪精度,研究人员对鲁棒控制方式进行了大量研究[17]。文[18] 提出了一种滑模控制(SMC)方法,通过设计合适的滑模面和自适应律实现了UGV控制。与iLQR相比,SMC方法通过降低UGV的动态阶数提高了系统可控性。不过,SMC固有的抖振问题导致UGV在复杂情况下跟踪精度不佳[19]。为了解决抖振问题,文[20] 设计了一种超螺旋滑模控制器,通过使输入量与输出量保持连续来抑制抖振,但这种方式降低了控制器的鲁棒性。此外,结合自适应策略的反步控制器也在UGV控制中得到了广泛应用[21-23]。文[22] 通过设计自适应估计规则解决了参数不确定的问题,并在保证系统稳定性的前提下使跟踪误差收敛至0。不过,参数估计规则较依赖于车辆模型,且其收敛速度较大影响了UGV控制器的暂态性能。
自抗扰控制(ADRC)具有易于实现和鲁棒性强的特点,近年来已应用于UGV控制[24]。一方面,利用预测补偿策略对整体扰动进行预估,例如使用Smith预估补偿算法获得近似无延迟的输出反馈量[25],但该模式在参数整定时需要大量的实验数据。另一方面,对低阶ADRC进行调整能使其适配高阶被控对象,这种ADRC结构简单并易于实际使用。文[26] 设计了两阶段ADRC控制策略,建立切换式纵向-横向半耦合模型,提高了系统抗噪声以及补偿扰动的能力。文[27] 根据微分平坦理论实现了动态模型的线性化,并保证了控制精度。在文[27] 建立的线性化模型基础上,文[28] 使用指数逼近的非奇异终端滑模控制策略来提升系统的动态抗扰性能。上述方法将总扰动视为单一变量扰动进行观测,导致总扰动估计阶次不完整。
为了进一步提高UGV系统的轨迹跟踪精度和鲁棒性,本文基于UGV动态特性和典型线性ADRC(CLADRC),提出了级联观测下偏差校正的UGV轨迹跟踪控制方法。首先针对UGV运行过程中的复杂扰动,设计了级联形式的扩张状态观测器(ESO)。其中根据总扰动特性,在初级ESO中设计校正项并扩展扰动观测阶次,以重构扰动观测结果。之后,将结果输入次级ESO,以高精度地补偿复杂高阶扰动。然后,基于微分前馈策略,设计了具有观测偏差校正的自抗扰控制方法(OBR-ADRC),以提高UGV跟踪给定轨迹时的控制效果。利用李雅普诺夫理论证明了渐近稳定性,并给出稳定域边界。此外,设计了参数整定方法,以增强控制器对于不同UGV模型的适应性。最后开展了多项对比实验,验证了所提OBR-ADRC方法的跟踪精度和鲁棒性。
1. 车辆模型及典型控制策略(Vehicle model and typical control strategy)
1. 车辆模型及典型控制策略(Vehicle model and typical control strategy)
1.1 UGV运动学模型
在运动学模型中,车辆前后轮分别等效放置于车轴中点。前轮用于调节转向,后轮保持固定,轴间距为$ L $。车辆仅做平面运动且遵循非完整性约束,如图 1所示。后轴中点$ {P}_{\rm c}({x}^{\rm w}(t), {y}^{\rm w}(t)) $表示世界坐标系下的车辆位置,车辆航向角为$ \varphi (t) $。纵向速度和横向速度分别为$ v_{x}(t) $和$ v_{y}(t) $。
横向投影$ {P}_{\rm c} $到参考轨迹上得到参考点$ {P}_{\rm r} $,$ {P}_{\rm r} $处的纵向速度为$ v_{\rm r}(t) $。为了更直观地分析UGV的横向控制效果,将纵向速度$ v_{x}(t) $设为恒值$ v_{\rm r} $。$ {P}_{\rm r} $处的航向角表示为$ \varphi_{\rm r}(t) $,$ {P}_{\rm r} $和$ {P}_{\rm c} $之间的横向偏移误差表示为$ e_{y}(t) $,对其定义求导可得其动态方程:
$$ \begin{align} \dot e_{y}(t)=v_{x}(t)\sin \big(\varphi (t)-\varphi_{\rm r}(t)\big)-v_{y}(t) \end{align} $$ (1) 假设车辆运动时轮胎与地面无滑移角,根据车辆瞬时旋转中心$ \mathscr O' $得到转向半径$ R $,进而得到车辆的前轮转向角$ \delta (t) $和$ R $之间的关系。之后可得航向角$ \varphi (t) $与前轮转向角$ \delta (t) $关系为
$$ \begin{align} \dot \varphi (t)=v_{x}(t)/R=v_{x}(t)\tan \delta (t)/L \end{align} $$ (2) 航向角跟踪误差定义为$ \varphi_{\rm e}(t)=\varphi (t)-\varphi_{\rm r}(t) $。对于较小的$ \varphi (t) $和$ \delta (t) $,存在$ \sin \varphi (t)\approx \varphi (t) $和$ \tan \delta (t)\approx \delta (t) $。结合式(1) 和式(2) 可得车辆模型为
$$ \begin{align} \begin{cases} \dot e_{y}(t)=v_{x}(t)\varphi_{\rm e}(t)-v_{y}(t)\\ \dot \varphi _{\rm e}(t)=v_{x}(t)\delta (t)/L-\dot \varphi _{\rm r}(t) \end{cases} \end{align} $$ (3) $ \dot e_{y}(t) $和$ \dot \varphi _{e}(t) $的实际输出存在滞后,这对$ \delta (t) $的控制带来滞后性影响。为此,引入微分前馈以补偿$ \delta (t) $[29],记补偿后的前轮转向角为$ \bar{\delta}(t) $,则最终的状态方程为
$$ \begin{align} \begin{cases} \dot e_{y}(t)=v_{x}(t)\varphi_{\rm e}(t)-v_{y}(t)\\ \dot \varphi_{\rm e}(t)=v_{x}(t)\delta (t)/L-\dot \varphi _{\rm r}(t)\\ \bar{\delta}(t)=\delta (t)+a\cdot D(\delta) \end{cases} \end{align} $$ (4) 式中$ D(\delta) $为微分前馈补偿函数,$ a $为补偿系数。
1.1 UGV运动学模型
在运动学模型中,车辆前后轮分别等效放置于车轴中点。前轮用于调节转向,后轮保持固定,轴间距为$ L $。车辆仅做平面运动且遵循非完整性约束,如图 1所示。后轴中点$ {P}_{\rm c}({x}^{\rm w}(t), {y}^{\rm w}(t)) $表示世界坐标系下的车辆位置,车辆航向角为$ \varphi (t) $。纵向速度和横向速度分别为$ v_{x}(t) $和$ v_{y}(t) $。
横向投影$ {P}_{\rm c} $到参考轨迹上得到参考点$ {P}_{\rm r} $,$ {P}_{\rm r} $处的纵向速度为$ v_{\rm r}(t) $。为了更直观地分析UGV的横向控制效果,将纵向速度$ v_{x}(t) $设为恒值$ v_{\rm r} $。$ {P}_{\rm r} $处的航向角表示为$ \varphi_{\rm r}(t) $,$ {P}_{\rm r} $和$ {P}_{\rm c} $之间的横向偏移误差表示为$ e_{y}(t) $,对其定义求导可得其动态方程:
$$ \begin{align} \dot e_{y}(t)=v_{x}(t)\sin \big(\varphi (t)-\varphi_{\rm r}(t)\big)-v_{y}(t) \end{align} $$ (1) 假设车辆运动时轮胎与地面无滑移角,根据车辆瞬时旋转中心$ \mathscr O' $得到转向半径$ R $,进而得到车辆的前轮转向角$ \delta (t) $和$ R $之间的关系。之后可得航向角$ \varphi (t) $与前轮转向角$ \delta (t) $关系为
$$ \begin{align} \dot \varphi (t)=v_{x}(t)/R=v_{x}(t)\tan \delta (t)/L \end{align} $$ (2) 航向角跟踪误差定义为$ \varphi_{\rm e}(t)=\varphi (t)-\varphi_{\rm r}(t) $。对于较小的$ \varphi (t) $和$ \delta (t) $,存在$ \sin \varphi (t)\approx \varphi (t) $和$ \tan \delta (t)\approx \delta (t) $。结合式(1) 和式(2) 可得车辆模型为
$$ \begin{align} \begin{cases} \dot e_{y}(t)=v_{x}(t)\varphi_{\rm e}(t)-v_{y}(t)\\ \dot \varphi _{\rm e}(t)=v_{x}(t)\delta (t)/L-\dot \varphi _{\rm r}(t) \end{cases} \end{align} $$ (3) $ \dot e_{y}(t) $和$ \dot \varphi _{e}(t) $的实际输出存在滞后,这对$ \delta (t) $的控制带来滞后性影响。为此,引入微分前馈以补偿$ \delta (t) $[29],记补偿后的前轮转向角为$ \bar{\delta}(t) $,则最终的状态方程为
$$ \begin{align} \begin{cases} \dot e_{y}(t)=v_{x}(t)\varphi_{\rm e}(t)-v_{y}(t)\\ \dot \varphi_{\rm e}(t)=v_{x}(t)\delta (t)/L-\dot \varphi _{\rm r}(t)\\ \bar{\delta}(t)=\delta (t)+a\cdot D(\delta) \end{cases} \end{align} $$ (4) 式中$ D(\delta) $为微分前馈补偿函数,$ a $为补偿系数。
1.2 CLADRC控制策略
在CLADRC框架中,将模型的不准确分量和未考虑的高阶分量引入式(4),从而得到标准被控对象方程:
$$ \begin{align} \ddot y(t)& =g(y(t), \dot y(t), h(t))+b_{0}u(t)+ \\ &\quad(b-b_{0})u(t)-(v_{\rm r}\dot \varphi _{\rm r}(t)+\dot v_{y}(t)) \end{align} $$ (5) 式中$ y(t) $为UGV系统的横向误差输出量,$ u(t) $为系统控制输入量,$ h(t) $为系统外部扰动,积分函数$ g(\cdot) $表示状态变量之间的非线性耦合关系。控制增益表示为$ b $,由于现有观测器无法准确观测扰动,因此只能用已知部分$ b_{0} $对其进行估计。将未知部分$ (b-b_{0})u(t) $视为由系统建模偏差引起的内部扰动。
CLADRC策略将不确定UGV系统变换为确定的2阶积分串联结构,并将高阶分量$ g(\cdot) $视为总扰动的一部分。因此系统中所有非理想分量可定义为总扰动函数$ f(t) $:
$$ \begin{align} f(t)=&g\big(y(t), \dot y(t), h(t)\big)-v_{\rm r}\dot \varphi _{\rm r}(t)-\dot v_{y}(t)+\\ &(b-b_{0})u(t) \end{align} $$ (6) 将式(6) 代入式(5) 可以得到简化后的UGV模型:
$$ \begin{align} \ddot y(t)=f(t)+b_{0}u(t) \end{align} $$ (7) 在CLADRC框架中,为了设计典型线性扩张状态观测器(CLESO),定义系统状态变量为
$$ \begin{align} x_{1}(t)=e_{y}(t)=y(t), \; \; \; x_{2}(t)=v_{x}\varphi_{\rm e}(t)-v_{y}(t) \end{align} $$ (8) 另外将系统广义总扰动$ f(t) $记为扩张的高阶维度$ x_{3}(t) $,且$ f(t) $可导。则针对原2阶系统(7) 可设置如下的扩张状态观测器:
$$ \begin{equation} \begin{aligned} & \underbrace{\begin{bmatrix} \dot{\hat{x}}_{1}(t)\\ \dot{\hat{x}}_{2}(t)\\ \dot{\hat{x}}_{3}(t) \end{bmatrix}}_{\dot{\mathit{\boldsymbol{\hat{x}}}}(t)}=\underbrace{\begin{bmatrix} 0& 1& 0\\ 0& 0& 1\\ 0& 0& 0 \end{bmatrix}}_{\mathit{\boldsymbol{A}}}\underbrace{\begin{bmatrix} \hat{x}_{1}(t)\\ \hat{x}_{2}(t)\\ \hat{x}_{3}(t) \end{bmatrix}}_{\hat{\mathit{\boldsymbol{x}}}(t)}+\underbrace{\begin{bmatrix} 0\\ b_{0}\\ 0 \end{bmatrix}}_{\mathit{\boldsymbol{b}}}u(t)+ \\ &\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\mathit{\boldsymbol{l}}\cdot \big(y(t)-\hat{x}_{1}(t)\big)\\ & y(t)=\underbrace{[1\; \; 0\; \; 0]}_{\mathit{\boldsymbol{c}}}\hat{\boldsymbol{{x}}}(t) \end{aligned} \end{equation} $$ (9) 其中常系数$ b_{0}=v_{x}^{2}/L $,$ \mathit{\boldsymbol{l}}=[l_{1}, l_{2}, l_{3}]^{\rm T} $为观测器的增益向量。控制量$ u(t) $为补偿后的前轮转向角,$ u(t) = \bar{\delta}(t) $。
参考轨迹信号为$ y_{\rm r}(t) $,控制律$ u(t) $可构造为
$$ \begin{align} u(t)=&b_{0}^{-1}\big[\underbrace{k_{\rm p}\big(y_{\rm r}(t)-\hat{x}_{1}(t)\big)}_{u_{\rm p}(t)}+ \\ &\underbrace{k_{\rm d}\big(\dot y_{\rm r}(t)-\hat{x}_{2}(t)\big)}_{u_{\rm d}(t)}-\hat{x}_{3}(t)\big] \end{align} $$ (10) 其中$ u_{\rm p}(t) $和$ u_{\rm d}(t) $分别为比例和微分反馈控制量,$ k_{\rm p} $和$ k_{\rm d} $为控制律增益。因此在CLESO收敛的前提下,由式(5)~(9) 可得
$$ \begin{align} \ddot y(t)=f(t)-\hat{x}_{3}(t)+k_{\rm p}e_{\rm r}(t)+k_{\rm d}\dot e_{\rm r}(t)\approx u_{\rm p}(t)+u_{\rm d}(t) \end{align} $$ (11) 可知对于简单低阶扰动,CLESO依靠观测通道$ \hat{x}_{3}(t) $和控制律实现对总扰动$ f(t) $的观测和补偿。
观测误差记为$ \tilde{\mathit{\boldsymbol{x}}}(t)=\mathit{\boldsymbol{x}}(t)-\hat{\mathit{\boldsymbol{x}}}(t) $,轨迹跟踪误差记为$ e_{\rm r}(t)=y_{\rm r}(t)-x_{1}(t) $,可推得$ e_{\rm r}(t) $的动态方程为
$$ \begin{align} \ddot e_{\rm r}(t)& =\ddot y_{\rm r}(t)+\hat{f}(t)-f(t)-k_{\rm p}\big(e_{\rm r}(t)+\tilde{x}_{1}(t)\big)- \\ &\quad k_{\rm d}\big(\dot e_{\rm r}(t)+\dot{\tilde{x}}_{1}(t)\big) \end{align} $$ (12) 其中$ \hat{f}(t) $为总扰动$ f(t) $的观测量,$ \tilde{x}_{1}(t) $为$ \tilde{\mathit{\boldsymbol{x}}}(t) $中的1阶状态变量。对式(12) 进行拉氏变换,可得$ s $域的轨迹跟踪误差$ E_{\rm r}(s) $为
$$ \begin{align} E_{\rm r}(s)=\frac{s^{2}Y_{\rm r}(s)+\hat{F}(s)-F(s)+(k_{\rm p}+k_{\rm d}s)\tilde{X}_{1}(s)}{s^{2}+k_{\rm d}s+k_{\rm p}} \end{align} $$ (13) 由式(13) 可知,除可控量$ s^{2}+k_{\rm d}s+k_{\rm p} $以外,CLADRC控制器的轨迹跟踪误差中还包含3个不可控分量:参考轨迹的高阶微分量$ s^{2}Y_{\rm r}(s) $、总扰动的观测偏差量$ \hat{F}(s)-F(s) $、不确定的模型偏差量$ (k_{\rm p}+k_{\rm d}s)\tilde{X}_{1}(s) $。因此需要校正其ESO的不可控观测成分,以提升UGV轨迹跟踪精度和鲁棒性。
1.2 CLADRC控制策略
在CLADRC框架中,将模型的不准确分量和未考虑的高阶分量引入式(4),从而得到标准被控对象方程:
$$ \begin{align} \ddot y(t)& =g(y(t), \dot y(t), h(t))+b_{0}u(t)+ \\ &\quad(b-b_{0})u(t)-(v_{\rm r}\dot \varphi _{\rm r}(t)+\dot v_{y}(t)) \end{align} $$ (5) 式中$ y(t) $为UGV系统的横向误差输出量,$ u(t) $为系统控制输入量,$ h(t) $为系统外部扰动,积分函数$ g(\cdot) $表示状态变量之间的非线性耦合关系。控制增益表示为$ b $,由于现有观测器无法准确观测扰动,因此只能用已知部分$ b_{0} $对其进行估计。将未知部分$ (b-b_{0})u(t) $视为由系统建模偏差引起的内部扰动。
CLADRC策略将不确定UGV系统变换为确定的2阶积分串联结构,并将高阶分量$ g(\cdot) $视为总扰动的一部分。因此系统中所有非理想分量可定义为总扰动函数$ f(t) $:
$$ \begin{align} f(t)=&g\big(y(t), \dot y(t), h(t)\big)-v_{\rm r}\dot \varphi _{\rm r}(t)-\dot v_{y}(t)+\\ &(b-b_{0})u(t) \end{align} $$ (6) 将式(6) 代入式(5) 可以得到简化后的UGV模型:
$$ \begin{align} \ddot y(t)=f(t)+b_{0}u(t) \end{align} $$ (7) 在CLADRC框架中,为了设计典型线性扩张状态观测器(CLESO),定义系统状态变量为
$$ \begin{align} x_{1}(t)=e_{y}(t)=y(t), \; \; \; x_{2}(t)=v_{x}\varphi_{\rm e}(t)-v_{y}(t) \end{align} $$ (8) 另外将系统广义总扰动$ f(t) $记为扩张的高阶维度$ x_{3}(t) $,且$ f(t) $可导。则针对原2阶系统(7) 可设置如下的扩张状态观测器:
$$ \begin{equation} \begin{aligned} & \underbrace{\begin{bmatrix} \dot{\hat{x}}_{1}(t)\\ \dot{\hat{x}}_{2}(t)\\ \dot{\hat{x}}_{3}(t) \end{bmatrix}}_{\dot{\mathit{\boldsymbol{\hat{x}}}}(t)}=\underbrace{\begin{bmatrix} 0& 1& 0\\ 0& 0& 1\\ 0& 0& 0 \end{bmatrix}}_{\mathit{\boldsymbol{A}}}\underbrace{\begin{bmatrix} \hat{x}_{1}(t)\\ \hat{x}_{2}(t)\\ \hat{x}_{3}(t) \end{bmatrix}}_{\hat{\mathit{\boldsymbol{x}}}(t)}+\underbrace{\begin{bmatrix} 0\\ b_{0}\\ 0 \end{bmatrix}}_{\mathit{\boldsymbol{b}}}u(t)+ \\ &\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\mathit{\boldsymbol{l}}\cdot \big(y(t)-\hat{x}_{1}(t)\big)\\ & y(t)=\underbrace{[1\; \; 0\; \; 0]}_{\mathit{\boldsymbol{c}}}\hat{\boldsymbol{{x}}}(t) \end{aligned} \end{equation} $$ (9) 其中常系数$ b_{0}=v_{x}^{2}/L $,$ \mathit{\boldsymbol{l}}=[l_{1}, l_{2}, l_{3}]^{\rm T} $为观测器的增益向量。控制量$ u(t) $为补偿后的前轮转向角,$ u(t) = \bar{\delta}(t) $。
参考轨迹信号为$ y_{\rm r}(t) $,控制律$ u(t) $可构造为
$$ \begin{align} u(t)=&b_{0}^{-1}\big[\underbrace{k_{\rm p}\big(y_{\rm r}(t)-\hat{x}_{1}(t)\big)}_{u_{\rm p}(t)}+ \\ &\underbrace{k_{\rm d}\big(\dot y_{\rm r}(t)-\hat{x}_{2}(t)\big)}_{u_{\rm d}(t)}-\hat{x}_{3}(t)\big] \end{align} $$ (10) 其中$ u_{\rm p}(t) $和$ u_{\rm d}(t) $分别为比例和微分反馈控制量,$ k_{\rm p} $和$ k_{\rm d} $为控制律增益。因此在CLESO收敛的前提下,由式(5)~(9) 可得
$$ \begin{align} \ddot y(t)=f(t)-\hat{x}_{3}(t)+k_{\rm p}e_{\rm r}(t)+k_{\rm d}\dot e_{\rm r}(t)\approx u_{\rm p}(t)+u_{\rm d}(t) \end{align} $$ (11) 可知对于简单低阶扰动,CLESO依靠观测通道$ \hat{x}_{3}(t) $和控制律实现对总扰动$ f(t) $的观测和补偿。
观测误差记为$ \tilde{\mathit{\boldsymbol{x}}}(t)=\mathit{\boldsymbol{x}}(t)-\hat{\mathit{\boldsymbol{x}}}(t) $,轨迹跟踪误差记为$ e_{\rm r}(t)=y_{\rm r}(t)-x_{1}(t) $,可推得$ e_{\rm r}(t) $的动态方程为
$$ \begin{align} \ddot e_{\rm r}(t)& =\ddot y_{\rm r}(t)+\hat{f}(t)-f(t)-k_{\rm p}\big(e_{\rm r}(t)+\tilde{x}_{1}(t)\big)- \\ &\quad k_{\rm d}\big(\dot e_{\rm r}(t)+\dot{\tilde{x}}_{1}(t)\big) \end{align} $$ (12) 其中$ \hat{f}(t) $为总扰动$ f(t) $的观测量,$ \tilde{x}_{1}(t) $为$ \tilde{\mathit{\boldsymbol{x}}}(t) $中的1阶状态变量。对式(12) 进行拉氏变换,可得$ s $域的轨迹跟踪误差$ E_{\rm r}(s) $为
$$ \begin{align} E_{\rm r}(s)=\frac{s^{2}Y_{\rm r}(s)+\hat{F}(s)-F(s)+(k_{\rm p}+k_{\rm d}s)\tilde{X}_{1}(s)}{s^{2}+k_{\rm d}s+k_{\rm p}} \end{align} $$ (13) 由式(13) 可知,除可控量$ s^{2}+k_{\rm d}s+k_{\rm p} $以外,CLADRC控制器的轨迹跟踪误差中还包含3个不可控分量:参考轨迹的高阶微分量$ s^{2}Y_{\rm r}(s) $、总扰动的观测偏差量$ \hat{F}(s)-F(s) $、不确定的模型偏差量$ (k_{\rm p}+k_{\rm d}s)\tilde{X}_{1}(s) $。因此需要校正其ESO的不可控观测成分,以提升UGV轨迹跟踪精度和鲁棒性。
2. 观测器和控制器设计(Design of the observer and controller)
2. 观测器和控制器设计(Design of the observer and controller)
2.1 级联ESO的设计
在UGV运动过程中存在多变量耦合的高阶未知扰动,而且低阶CLESO对扰动的观测准确性较低[30]。为此,本文基于两个ESO设计级联型观测器(OBR-ESO),以增强扰动观测能力。具体设计步骤如下:
步骤1:初级观测器ESO1的设计
在CLESO中式(9) 的基础上,设计初级4阶观测器ESO1为
$$ \begin{align} \underbrace{\begin{bmatrix} \dot{\hat{x}}_{1}(t)\\ \dot{\hat{x}}_{2}(t)\\ {\dot{\hat{x}}}'_{3}(t)\\ {\dot{\hat{x}}}'_{4}(t)\end{bmatrix}}_{\dot{\hat{\mathit{\boldsymbol{x}}}}(t)}=[\mathit{\boldsymbol{A}}'-\mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c'}}]\underbrace{ \begin{bmatrix} \hat{x}_{1}(t)\\ \hat{x}_{2}(t)\\ \hat{x}'_{3}(t)\\ \hat{x}'_{4}(t)\end{bmatrix}}_{\hat{\mathit{\boldsymbol{x}}}(t)}+[\mathit{\boldsymbol{b}}'\; \; \mathit{\boldsymbol{l}}_{1}] \begin{bmatrix} u(t)\\ y(t)\end{bmatrix} \end{align} $$ (14) 其中$ \dot{\hat{\mathit{\boldsymbol{x}}}}(t) $和$ \hat{\mathit{\boldsymbol{x}}}(t) $分别为$ \dot{\mathit{\boldsymbol{x}}}(t) $和$ \mathit{\boldsymbol{x}}(t) $的重构向量,增益向量$ \mathit{\boldsymbol{l}}_{1}=[l_{11}\; \; l_{12}\; \; l_{13}\; \; l_{14}]^{\rm T} $,$ \mathit{\boldsymbol{A}}' $为观测矩阵,$ \mathit{\boldsymbol{b}}' $为控制向量,$ \mathit{\boldsymbol{c}}' $为输出向量:
$$ \begin{align*} \mathit{\boldsymbol{A}}'& =\begin{bmatrix} 0& 1& 0& 0\\ 0& 0& 1& 0\\ 0& 0& 0& 0\\ 0& 0& -m/T_{1}& -1/T_{1}\end{bmatrix}\\ \mathit{\boldsymbol{b}}'& =[\mathit{\boldsymbol{b}}^{\rm T}\; \; \; 0]^{\rm T}\\ \mathit{\boldsymbol{c}}'& =[\mathit{\boldsymbol{c}}\; \; \; 0] \end{align*} $$ ESO1在观测矩阵$ \mathit{\boldsymbol{A}}' $中设置了校正项$ -m/T_{1} $和$ -1/T_{1} $,其中$ m $为校正增益,$ T_{1} $为时间常数。与式(9) 中的CLESO相比,本文将1阶扰动观测通道$ \hat{x}_{3}(t) $扩展至2阶$ (\hat{x}'_{3}(t), \hat{x}'_{4}(t)) $,以提高扰动初步观测的准确度。
步骤2:次级观测器ESO2的设计
将ESO1中未能观测到的复杂扰动残余部分由ESO2进行观测。在观测器(14) 的基础上,将总扰动的初始观测值$ \hat{x}'_{4}(t) $作为已知量,输入到次级观测器ESO2中。将ESO1的输出量$ \hat{x}_{1}(t) $设置为ESO2的状态反馈量,以准确观测扰动残余值。将次级3阶观测器ESO2的状态空间表达式设计为
$$ \begin{align} \begin{bmatrix} \dot{\hat{n}}_{1}(t)\\ \dot{\hat{n}}_{2}(t)\\ \dot{\hat{n}}_{3}(t)\end{bmatrix}\!=[\mathit{\boldsymbol{A}}\!-\mathit{\boldsymbol{l}}_{2}\mathit{\boldsymbol{c}}] \begin{bmatrix} \hat{n}_{1}(t)\\ \hat{n}_{2}(t)\\ \hat{n}_{3}(t)\end{bmatrix}+[\mathit{\boldsymbol{b}}\; \; \mathit{\boldsymbol{l}}_{2}] \begin{bmatrix} u(t)\\ \hat{x}_{1}(t)\end{bmatrix}+ \begin{bmatrix} 0\\ \hat{x}'_{4}(t)\\ 0\end{bmatrix} \end{align} $$ (15) 其中$ \hat{n}_{3}(t) $为扰动残余观测值,$ \mathit{\boldsymbol{l}}_{2}=[l_{21}\; \; l_{22}\; \; l_{23}]^{\rm T} $表示增益向量。观测值$ \hat{n}_{3}(t) $与扰动观测初始量$ \hat{x}'_{4}(t) $相加后作为总扰动$ f(t) $的观测值,并输入至后续控制律。根据观测器(14) 和(15) 的性质,可知ESO2输出量$ \hat{n}_{1}(t) $收敛于ESO1输出量$ \hat{x}_{1}(t) $,并进一步收敛于UGV的输出量$ y(t) $。
2.1 级联ESO的设计
在UGV运动过程中存在多变量耦合的高阶未知扰动,而且低阶CLESO对扰动的观测准确性较低[30]。为此,本文基于两个ESO设计级联型观测器(OBR-ESO),以增强扰动观测能力。具体设计步骤如下:
步骤1:初级观测器ESO1的设计
在CLESO中式(9) 的基础上,设计初级4阶观测器ESO1为
$$ \begin{align} \underbrace{\begin{bmatrix} \dot{\hat{x}}_{1}(t)\\ \dot{\hat{x}}_{2}(t)\\ {\dot{\hat{x}}}'_{3}(t)\\ {\dot{\hat{x}}}'_{4}(t)\end{bmatrix}}_{\dot{\hat{\mathit{\boldsymbol{x}}}}(t)}=[\mathit{\boldsymbol{A}}'-\mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c'}}]\underbrace{ \begin{bmatrix} \hat{x}_{1}(t)\\ \hat{x}_{2}(t)\\ \hat{x}'_{3}(t)\\ \hat{x}'_{4}(t)\end{bmatrix}}_{\hat{\mathit{\boldsymbol{x}}}(t)}+[\mathit{\boldsymbol{b}}'\; \; \mathit{\boldsymbol{l}}_{1}] \begin{bmatrix} u(t)\\ y(t)\end{bmatrix} \end{align} $$ (14) 其中$ \dot{\hat{\mathit{\boldsymbol{x}}}}(t) $和$ \hat{\mathit{\boldsymbol{x}}}(t) $分别为$ \dot{\mathit{\boldsymbol{x}}}(t) $和$ \mathit{\boldsymbol{x}}(t) $的重构向量,增益向量$ \mathit{\boldsymbol{l}}_{1}=[l_{11}\; \; l_{12}\; \; l_{13}\; \; l_{14}]^{\rm T} $,$ \mathit{\boldsymbol{A}}' $为观测矩阵,$ \mathit{\boldsymbol{b}}' $为控制向量,$ \mathit{\boldsymbol{c}}' $为输出向量:
$$ \begin{align*} \mathit{\boldsymbol{A}}'& =\begin{bmatrix} 0& 1& 0& 0\\ 0& 0& 1& 0\\ 0& 0& 0& 0\\ 0& 0& -m/T_{1}& -1/T_{1}\end{bmatrix}\\ \mathit{\boldsymbol{b}}'& =[\mathit{\boldsymbol{b}}^{\rm T}\; \; \; 0]^{\rm T}\\ \mathit{\boldsymbol{c}}'& =[\mathit{\boldsymbol{c}}\; \; \; 0] \end{align*} $$ ESO1在观测矩阵$ \mathit{\boldsymbol{A}}' $中设置了校正项$ -m/T_{1} $和$ -1/T_{1} $,其中$ m $为校正增益,$ T_{1} $为时间常数。与式(9) 中的CLESO相比,本文将1阶扰动观测通道$ \hat{x}_{3}(t) $扩展至2阶$ (\hat{x}'_{3}(t), \hat{x}'_{4}(t)) $,以提高扰动初步观测的准确度。
步骤2:次级观测器ESO2的设计
将ESO1中未能观测到的复杂扰动残余部分由ESO2进行观测。在观测器(14) 的基础上,将总扰动的初始观测值$ \hat{x}'_{4}(t) $作为已知量,输入到次级观测器ESO2中。将ESO1的输出量$ \hat{x}_{1}(t) $设置为ESO2的状态反馈量,以准确观测扰动残余值。将次级3阶观测器ESO2的状态空间表达式设计为
$$ \begin{align} \begin{bmatrix} \dot{\hat{n}}_{1}(t)\\ \dot{\hat{n}}_{2}(t)\\ \dot{\hat{n}}_{3}(t)\end{bmatrix}\!=[\mathit{\boldsymbol{A}}\!-\mathit{\boldsymbol{l}}_{2}\mathit{\boldsymbol{c}}] \begin{bmatrix} \hat{n}_{1}(t)\\ \hat{n}_{2}(t)\\ \hat{n}_{3}(t)\end{bmatrix}+[\mathit{\boldsymbol{b}}\; \; \mathit{\boldsymbol{l}}_{2}] \begin{bmatrix} u(t)\\ \hat{x}_{1}(t)\end{bmatrix}+ \begin{bmatrix} 0\\ \hat{x}'_{4}(t)\\ 0\end{bmatrix} \end{align} $$ (15) 其中$ \hat{n}_{3}(t) $为扰动残余观测值,$ \mathit{\boldsymbol{l}}_{2}=[l_{21}\; \; l_{22}\; \; l_{23}]^{\rm T} $表示增益向量。观测值$ \hat{n}_{3}(t) $与扰动观测初始量$ \hat{x}'_{4}(t) $相加后作为总扰动$ f(t) $的观测值,并输入至后续控制律。根据观测器(14) 和(15) 的性质,可知ESO2输出量$ \hat{n}_{1}(t) $收敛于ESO1输出量$ \hat{x}_{1}(t) $,并进一步收敛于UGV的输出量$ y(t) $。
2.2 控制器设计
基于级联观测器的输出,将UGV轨迹跟踪控制律设计为
$$ \begin{align} \begin{cases} u_{0}(t)=k_{\rm p}\big(r(t)-\hat{x}_{1}(t)\big)+k_{\rm d}\big(\dot r(t)-\hat{x}_{2}(t)\big)\\ u(t)=b_{0}^{-1}\big(u_{0}(t)-\hat{x}'_{4}(t)-\hat{n}_{3}(t)\big) \end{cases} \end{align} $$ (16) 本文设计的OBR-ADRC结构如图 2所示,其中式(16) 对应于控制律模块。初级ESO1与次级ESO2模块分别表示了观测器(14) 和(15),并且描述了$ \hat{x}'_{4}(t) $和$ \hat{n}_{3}(t) $重构总扰动的过程。微分跟踪器模块(TD)用于滤波和过渡UGV的期望轨迹。
为了保证式(14) 和(15) 的收敛性,需合理配置增益向量$ \mathit{\boldsymbol{l}}_{1} $和$ \mathit{\boldsymbol{l}}_{2} $,以使$ \mathit{\boldsymbol{A}}'-\mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c}}' $与$ \mathit{\boldsymbol{A}}-\mathit{\boldsymbol{l}}_{2}\mathit{\boldsymbol{c}} $均为Hurwitz矩阵。利用带宽法将级联ESO的闭环极点均配置于观测器带宽$ \omega_{\rm o} $处,配置规则设定为
$$ \begin{equation} \begin{aligned} \big|s\mathit{\boldsymbol{I}}-(\mathit{\boldsymbol{A}}'-\mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c}}')\big|& =(s+\omega_{\rm o})^{4} \\ \big|s\mathit{\boldsymbol{I}}-(\mathit{\boldsymbol{A}}-\mathit{\boldsymbol{l}}_{2}\mathit{\boldsymbol{c}})\big|& =(s+\omega_{\rm o})^{3} \end{aligned} \end{equation} $$ (17) 取$ T_{1}=\omega_{\rm o}^{-1} $,可解得对应参数:
$$ \begin{equation} \begin{aligned} \mathit{\boldsymbol{l}}_{1}& =[l_{11}\; \; l_{12}\; \; l_{13}\; \; l_{14}]^{\rm T}=[3\omega_{\rm o}\; \; 3\omega_{\rm o}^{2}\; \; \omega_{\rm o}^{3}\; \; mT_{2}\omega_{\rm o}^{2}]^{\rm T} \\ \mathit{\boldsymbol{l}}_{2}& =[l_{21}\; \; l_{22}\; \; l_{23}]^{\rm T}=[3\omega_{\rm o}\; \; 3\omega_{\rm o}^{2}\; \; \omega_{\rm o}^{3}]^{\rm T} \end{aligned} \end{equation} $$ (18) 其中$ T_{2} $为时间常数。
将控制器的极点设置于控制器带宽$ \omega_{\rm c} $处,可得控制器增益为
$$ \begin{align} k_{\rm p}=\omega_{\rm c}^{2}, \; \; \; k_{\rm d}=2\xi \omega_{\rm c} \end{align} $$ (19) 为兼顾控制器的阻尼特性和动态性能,式中阻尼比设置为$ \xi =1 $ [30]。因此,控制器的参数配置问题可简化为选取观测器带宽$ \omega_{\rm o} $和控制器带宽$ \omega_{\rm c} $。
2.2 控制器设计
基于级联观测器的输出,将UGV轨迹跟踪控制律设计为
$$ \begin{align} \begin{cases} u_{0}(t)=k_{\rm p}\big(r(t)-\hat{x}_{1}(t)\big)+k_{\rm d}\big(\dot r(t)-\hat{x}_{2}(t)\big)\\ u(t)=b_{0}^{-1}\big(u_{0}(t)-\hat{x}'_{4}(t)-\hat{n}_{3}(t)\big) \end{cases} \end{align} $$ (16) 本文设计的OBR-ADRC结构如图 2所示,其中式(16) 对应于控制律模块。初级ESO1与次级ESO2模块分别表示了观测器(14) 和(15),并且描述了$ \hat{x}'_{4}(t) $和$ \hat{n}_{3}(t) $重构总扰动的过程。微分跟踪器模块(TD)用于滤波和过渡UGV的期望轨迹。
为了保证式(14) 和(15) 的收敛性,需合理配置增益向量$ \mathit{\boldsymbol{l}}_{1} $和$ \mathit{\boldsymbol{l}}_{2} $,以使$ \mathit{\boldsymbol{A}}'-\mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c}}' $与$ \mathit{\boldsymbol{A}}-\mathit{\boldsymbol{l}}_{2}\mathit{\boldsymbol{c}} $均为Hurwitz矩阵。利用带宽法将级联ESO的闭环极点均配置于观测器带宽$ \omega_{\rm o} $处,配置规则设定为
$$ \begin{equation} \begin{aligned} \big|s\mathit{\boldsymbol{I}}-(\mathit{\boldsymbol{A}}'-\mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c}}')\big|& =(s+\omega_{\rm o})^{4} \\ \big|s\mathit{\boldsymbol{I}}-(\mathit{\boldsymbol{A}}-\mathit{\boldsymbol{l}}_{2}\mathit{\boldsymbol{c}})\big|& =(s+\omega_{\rm o})^{3} \end{aligned} \end{equation} $$ (17) 取$ T_{1}=\omega_{\rm o}^{-1} $,可解得对应参数:
$$ \begin{equation} \begin{aligned} \mathit{\boldsymbol{l}}_{1}& =[l_{11}\; \; l_{12}\; \; l_{13}\; \; l_{14}]^{\rm T}=[3\omega_{\rm o}\; \; 3\omega_{\rm o}^{2}\; \; \omega_{\rm o}^{3}\; \; mT_{2}\omega_{\rm o}^{2}]^{\rm T} \\ \mathit{\boldsymbol{l}}_{2}& =[l_{21}\; \; l_{22}\; \; l_{23}]^{\rm T}=[3\omega_{\rm o}\; \; 3\omega_{\rm o}^{2}\; \; \omega_{\rm o}^{3}]^{\rm T} \end{aligned} \end{equation} $$ (18) 其中$ T_{2} $为时间常数。
将控制器的极点设置于控制器带宽$ \omega_{\rm c} $处,可得控制器增益为
$$ \begin{align} k_{\rm p}=\omega_{\rm c}^{2}, \; \; \; k_{\rm d}=2\xi \omega_{\rm c} \end{align} $$ (19) 为兼顾控制器的阻尼特性和动态性能,式中阻尼比设置为$ \xi =1 $ [30]。因此,控制器的参数配置问题可简化为选取观测器带宽$ \omega_{\rm o} $和控制器带宽$ \omega_{\rm c} $。
2.3 观测器偏差动态方程
根据所设计的观测器结构,记ESO1的观测偏差为
$$ \begin{align} \begin{cases} \tilde{x}_{1}(t)=x_{1}(t)-\hat{x}_{1}(t)\\[-1pt] \tilde{x}_{2}(t)=x_{2}(t)-\hat{x}_{2}(t)\\[-1pt] \tilde{x}_{3}(t)=x_{3}(t)-(\hat{x}'_{3}(t)+\hat{x}'_{4}(t)) \end{cases} \end{align} $$ (20) 将式(20) 代入式(14),可得
$$ \begin{align} \begin{cases} \dot{\tilde{x}}_{1}(t)=-l_{11}\tilde{x}_{1}(t)+\tilde{x}_{2}(t)\\[-1pt] \dot{\tilde{x}}_{2}(t)=-l_{12}\tilde{x}_{1}(t)+\tilde{x}_{3}(t)\\[-1pt] \dot{\tilde{x}}_{3}(t)=(l_{14}-l_{13})\tilde{x}_{1}(t)+w(t) \end{cases} \end{align} $$ (21) 其中$ w(t)=\dot f(t)+m\hat{x}'_{3}(t)/T_{1}+\hat{x}'_{4}(t)/T_{1} $为高阶扰动观测值。将设计的参数(18) 代入式(21),可得系统状态偏差的动态方程为
$$ \begin{align} \underbrace{ \begin{bmatrix} \dot{\tilde{x}}_{1}(t)\\[-1pt] \dot{\tilde{x}}_{2}(t)\\[-1pt] \dot{\tilde{x}}_{3}(t)\end{bmatrix}}_{\dot{\tilde{\mathit{\boldsymbol{x}}}}(t)}=\underbrace{ \begin{bmatrix} -3\omega_{\rm o}& 1& 0\\[-1pt] -3\omega_{\rm o}^{2}& 0& 1\\[-1pt] -\omega_{\rm o}^{3}+mT_{2}\omega_{\rm o}^{2}& 0& 0\end{bmatrix}}_{\tilde{\mathit{\boldsymbol{A}}}}\underbrace{ \begin{bmatrix} \tilde{x}_{1}(t)\\[-1pt] \tilde{x}_{2}(t)\\[-1pt] \tilde{x}_{3}(t)\end{bmatrix}}_{\dot{\tilde{\mathit{\boldsymbol{x}}}}(t)}+\underbrace{ \begin{bmatrix} 0\\[-1pt] 0\\[-1pt] 1\end{bmatrix}}_{\mathit{\boldsymbol{b}}_{3}}w(t) \end{align} $$ (22) 通过选择适当的$ \omega_{\rm o} $和$ T_{2} $可使$ \tilde{\mathit{\boldsymbol{A}}} $成为Hurwitz矩阵,进而存在正定矩阵$ \mathit{\boldsymbol{P}} $和$ \mathit{\boldsymbol{Q}} $使得$ \tilde{\mathit{\boldsymbol{A}}}^{\rm T}\mathit{\boldsymbol{P}}+\mathit{\boldsymbol{P}}\tilde{{\mathit{\boldsymbol{A}}}}=-\mathit{\boldsymbol{Q}} $。
以式(20)~(22) 相同的方式对ESO2进行分析,可得ESO2观测偏差的动态方程为
$$ \begin{align} \underbrace{ \begin{bmatrix} \dot{\tilde{n}}_{1}(t)\\[-1pt] \dot{\tilde{n}}_{2}(t)\\[-1pt] \dot{\tilde{n}}_{3}(t)\end{bmatrix}}_{\dot{\tilde{\mathit{\boldsymbol{n}}}}(t)}=\underbrace{ \begin{bmatrix} -3\omega_{\rm o}& 1& 0\\[-1pt] -3\omega_{\rm o}^{2}& 0& 1\\[-1pt] -\omega_{\rm o}^{3}& 0& 0\end{bmatrix}}_{\mathit{\boldsymbol{E}}}\underbrace{ \begin{bmatrix} \tilde{n}_{1}(t)\\[-1pt] \tilde{n}_{2}(t)\\[-1pt] \tilde{n}_{3}(t)\end{bmatrix}+}_{\tilde{\mathit{\boldsymbol{n}}}(t)}\underbrace{ \begin{bmatrix} 0\\[-1pt] 0\\[-1pt] 1\end{bmatrix}}_{\mathit{\boldsymbol{b}}_{3}}w(t) \end{align} $$ (23) 通过选择适当的$ \omega_{\rm o} $可使$ \mathit{\boldsymbol{E}} $成为Hurwitz矩阵,此时存在正定矩阵$ \mathit{\boldsymbol{P}}' $和$ \mathit{\boldsymbol{Q}}' $使$ \mathit{\boldsymbol{E}}^{\rm T}\mathit{\boldsymbol{P}}'+\mathit{\boldsymbol{P}}'\mathit{\boldsymbol{E}}=-\mathit{\boldsymbol{Q}}' $。
2.3 观测器偏差动态方程
根据所设计的观测器结构,记ESO1的观测偏差为
$$ \begin{align} \begin{cases} \tilde{x}_{1}(t)=x_{1}(t)-\hat{x}_{1}(t)\\[-1pt] \tilde{x}_{2}(t)=x_{2}(t)-\hat{x}_{2}(t)\\[-1pt] \tilde{x}_{3}(t)=x_{3}(t)-(\hat{x}'_{3}(t)+\hat{x}'_{4}(t)) \end{cases} \end{align} $$ (20) 将式(20) 代入式(14),可得
$$ \begin{align} \begin{cases} \dot{\tilde{x}}_{1}(t)=-l_{11}\tilde{x}_{1}(t)+\tilde{x}_{2}(t)\\[-1pt] \dot{\tilde{x}}_{2}(t)=-l_{12}\tilde{x}_{1}(t)+\tilde{x}_{3}(t)\\[-1pt] \dot{\tilde{x}}_{3}(t)=(l_{14}-l_{13})\tilde{x}_{1}(t)+w(t) \end{cases} \end{align} $$ (21) 其中$ w(t)=\dot f(t)+m\hat{x}'_{3}(t)/T_{1}+\hat{x}'_{4}(t)/T_{1} $为高阶扰动观测值。将设计的参数(18) 代入式(21),可得系统状态偏差的动态方程为
$$ \begin{align} \underbrace{ \begin{bmatrix} \dot{\tilde{x}}_{1}(t)\\[-1pt] \dot{\tilde{x}}_{2}(t)\\[-1pt] \dot{\tilde{x}}_{3}(t)\end{bmatrix}}_{\dot{\tilde{\mathit{\boldsymbol{x}}}}(t)}=\underbrace{ \begin{bmatrix} -3\omega_{\rm o}& 1& 0\\[-1pt] -3\omega_{\rm o}^{2}& 0& 1\\[-1pt] -\omega_{\rm o}^{3}+mT_{2}\omega_{\rm o}^{2}& 0& 0\end{bmatrix}}_{\tilde{\mathit{\boldsymbol{A}}}}\underbrace{ \begin{bmatrix} \tilde{x}_{1}(t)\\[-1pt] \tilde{x}_{2}(t)\\[-1pt] \tilde{x}_{3}(t)\end{bmatrix}}_{\dot{\tilde{\mathit{\boldsymbol{x}}}}(t)}+\underbrace{ \begin{bmatrix} 0\\[-1pt] 0\\[-1pt] 1\end{bmatrix}}_{\mathit{\boldsymbol{b}}_{3}}w(t) \end{align} $$ (22) 通过选择适当的$ \omega_{\rm o} $和$ T_{2} $可使$ \tilde{\mathit{\boldsymbol{A}}} $成为Hurwitz矩阵,进而存在正定矩阵$ \mathit{\boldsymbol{P}} $和$ \mathit{\boldsymbol{Q}} $使得$ \tilde{\mathit{\boldsymbol{A}}}^{\rm T}\mathit{\boldsymbol{P}}+\mathit{\boldsymbol{P}}\tilde{{\mathit{\boldsymbol{A}}}}=-\mathit{\boldsymbol{Q}} $。
以式(20)~(22) 相同的方式对ESO2进行分析,可得ESO2观测偏差的动态方程为
$$ \begin{align} \underbrace{ \begin{bmatrix} \dot{\tilde{n}}_{1}(t)\\[-1pt] \dot{\tilde{n}}_{2}(t)\\[-1pt] \dot{\tilde{n}}_{3}(t)\end{bmatrix}}_{\dot{\tilde{\mathit{\boldsymbol{n}}}}(t)}=\underbrace{ \begin{bmatrix} -3\omega_{\rm o}& 1& 0\\[-1pt] -3\omega_{\rm o}^{2}& 0& 1\\[-1pt] -\omega_{\rm o}^{3}& 0& 0\end{bmatrix}}_{\mathit{\boldsymbol{E}}}\underbrace{ \begin{bmatrix} \tilde{n}_{1}(t)\\[-1pt] \tilde{n}_{2}(t)\\[-1pt] \tilde{n}_{3}(t)\end{bmatrix}+}_{\tilde{\mathit{\boldsymbol{n}}}(t)}\underbrace{ \begin{bmatrix} 0\\[-1pt] 0\\[-1pt] 1\end{bmatrix}}_{\mathit{\boldsymbol{b}}_{3}}w(t) \end{align} $$ (23) 通过选择适当的$ \omega_{\rm o} $可使$ \mathit{\boldsymbol{E}} $成为Hurwitz矩阵,此时存在正定矩阵$ \mathit{\boldsymbol{P}}' $和$ \mathit{\boldsymbol{Q}}' $使$ \mathit{\boldsymbol{E}}^{\rm T}\mathit{\boldsymbol{P}}'+\mathit{\boldsymbol{P}}'\mathit{\boldsymbol{E}}=-\mathit{\boldsymbol{Q}}' $。
3. 观测器和控制器性能分析(Performance analysis on the observer and controller)
3. 观测器和控制器性能分析(Performance analysis on the observer and controller)
3.1 观测器稳定性分析
定理1 针对观测器(14),存在标量$ \tau_{\mathrm{s1}}=4\bar{w}^{2}\cdot \lambda_{2}^{2} (\mathit{\boldsymbol{P}}) \lambda_{1}^{-2}(\mathit{\boldsymbol{Q}})\mathit{\boldsymbol{b}}_{3}^{\rm T}\mathit{\boldsymbol{P}}\mathit{\boldsymbol{b}}_{3} $和$ \eta_{\mathrm{s1}}>\tau_{\mathrm{s1}} $,使估计误差$ \tilde{\mathit{\boldsymbol{x}}}(t) $属于集合$ \{\tilde{\mathit{\boldsymbol{x}}}(t)\in \mathbb{R}^{n+1}\big|\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)\leqslant \eta_{\mathrm{s1}}\} $,且$ \tilde{\mathit{\boldsymbol{x}}}(t) $最终收敛至不变集$ \varOmega_{1}=\{\tilde{\mathit{\boldsymbol{x}}}(t)\in \mathbb{R}^{n+1}\big| \tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)\leqslant \tau_{\mathrm{s1}}\} $。
证明 在观测器的设计中,使用ESO2对ESO1与UGV模型复合而成的新系统进行扰动观测。为了分析所设计级联结构的可行性,首先证明该复合系统的能控性与能观性。由式(9) 和(14) 可得该复合系统的状态和输出方程:
$$ \begin{align} \begin{cases} \begin{bmatrix} \dot{\mathit{\boldsymbol{x}}}(t)\\ \dot{\hat{\mathit{\boldsymbol{x}}}}(t)\end{bmatrix}=\underbrace{ \begin{bmatrix} \mathit{\boldsymbol{A}}& {\bf 0}_{3\times 4}\\ \mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c}}& \mathit{\boldsymbol{A}}'-\mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c'}}\end{bmatrix}}_{\mathit{\boldsymbol{A}}_{7}} \begin{bmatrix} \mathit{\boldsymbol{x}}(t)\\ \hat{\mathit{\boldsymbol{x}}}(t)\end{bmatrix}+\underbrace{ \begin{bmatrix} \mathit{\boldsymbol{b}}\\ \mathit{\boldsymbol{b}}'\end{bmatrix}}_{\mathit{\boldsymbol{b}}_{7}}u(t)\\ y(t)=\underbrace{[{\bf 0}_{1\times 3}\; \; \mathit{\boldsymbol{c'}}]}_{\mathit{\boldsymbol{c}}_{7}} \begin{bmatrix} \mathit{\boldsymbol{x}}(t)\\ \hat{\mathit{\boldsymbol{x}}}(t)\end{bmatrix} \end{cases}\end{align} $$ (24) 其中$ \mathit{\boldsymbol{A}}_{7} $, $ \mathit{\boldsymbol{b}}_{7} $, $ \mathit{\boldsymbol{c}}_{7} $分别为复合系统的系统矩阵、控制向量、输出向量。
由式(24) 可知,$ \mathit{\boldsymbol{A}}_{7} $的分块维数满足$ n=2 $,因此系统能控性判别矩阵可构造为
$$ \begin{align} \mathit{\boldsymbol{S}}=[\mathit{\boldsymbol{b}}_{7}\; \; \mathit{\boldsymbol{A}}_{7}\mathit{\boldsymbol{b}}_{7}\; \; \cdots \; \; (\mathit{\boldsymbol{A}}_{7})^{n-1}\mathit{\boldsymbol{b}}_{7}] \end{align} $$ (25) 将$ \mathit{\boldsymbol{A}}_{7} $和$ \mathit{\boldsymbol{b}}_{7} $的具体形式代入式(25) 中,可得
$$ \begin{align} \mathrm{rank} \mathit{\boldsymbol{S}}=\mathrm{rank} \begin{bmatrix} \mathit{\boldsymbol{b}}& \mathit{\boldsymbol{Ab}}\\ \mathit{\boldsymbol{b}}'& \mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{cb}}+{\mathit{\boldsymbol{A}}}'\mathit{\boldsymbol{b}}'\end{bmatrix}=n \end{align} $$ (26) 因此可知该复合系统是能控的。由于$ \mathit{\boldsymbol{A}}_{7} $的分块维数为$ n=2 $,系统的能观性判别矩阵可构造为
$$ \begin{align} \mathit{\boldsymbol{M}}=[\mathit{\boldsymbol{c}}_{7}^{\rm T}\; \; \mathit{\boldsymbol{c}}_{7}^{\rm T}\mathit{\boldsymbol{A}}_{7}\; \; \cdots \; \; \mathit{\boldsymbol{c}}_{7}^{\rm T}(\mathit{\boldsymbol{A}}_{7})^{n-1}] \end{align} $$ (27) 之后将$ \mathit{\boldsymbol{A}}_{7} $和$ \mathit{\boldsymbol{c}}_{7} $的具体形式代入可得
$$ \begin{align} \mathrm{rank} \mathit{\boldsymbol{M}}=\mathrm{rank} \begin{bmatrix} {\bf 0}_{1\times 3}& \mathit{\boldsymbol{c}}'\\ \mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c}}& \mathit{\boldsymbol{A}}'-\mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c}}'\end{bmatrix}=n \end{align} $$ (28) 可知该复合系统内所有状态变量均可由输出完全反映。
在该复合系统能控且能观的基础上,设计李雅普诺夫候选函数为$ V(t)=\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t) $,对其关于时间求导并考虑式(22) 可得
$$ \begin{align} \dot V(t)& =\dot{\tilde{\mathit{\boldsymbol{x}}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)+\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\mathit{\boldsymbol{P\dot{\tilde{x}}}}(t) \\ & =\underbrace{-\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{Q}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)}_{\dot V_{1}(t)}+\underbrace{2\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\mathit{\boldsymbol{Pb}}_{3}w(t)}_{\dot V_{2}(t)} \end{align} $$ (29) 以$ \lambda_{1}(\mathit{\boldsymbol{P}}) $, $ \lambda_{2}(\mathit{\boldsymbol{P}}) $, $ \lambda_{1}(\mathit{\boldsymbol{Q}}) $, $ \lambda_{2}(\mathit{\boldsymbol{Q}}) $表示$ \mathit{\boldsymbol{P}} $和$ \mathit{\boldsymbol{Q}} $的特征值,则存在如下性质:
$$ \begin{align} \begin{cases} \lambda_{1}(\mathit{\boldsymbol{P}})\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\tilde{\mathit{\boldsymbol{x}}}(t)\leqslant \tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)\leqslant \lambda_{2}(\mathit{\boldsymbol{P}})\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\tilde{\mathit{\boldsymbol{x}}}(t)\\ \lambda_{1}(\mathit{\boldsymbol{Q}})\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\tilde{\mathit{\boldsymbol{x}}}(t)\leqslant \tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{Q}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)\leqslant \lambda_{2}(\mathit{\boldsymbol{Q}})\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\tilde{\mathit{\boldsymbol{x}}}(t) \end{cases} \end{align} $$ (30) 根据式(30) 可得
$$ \begin{align} \frac{\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)}{\lambda_{2}(\mathit{\boldsymbol{P}})}\leqslant \frac{\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{Q}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)}{\lambda_{1}(\mathit{\boldsymbol{Q}})} \end{align} $$ (31) 因此$ \dot V(t) $的第一部分满足:
$$ \begin{align} \dot V_{1}(t)=-\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{Q}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)\leqslant -V(t)\lambda_{1}(\mathit{\boldsymbol{Q}})/\lambda_{2}(\mathit{\boldsymbol{P}}) \end{align} $$ (32) 对于$ \dot V(t) $的第二部分,易知存在如下关系:
$$ \begin{align} 2\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\mathit{\boldsymbol{Pb}}_{3}w(t)\leqslant 2\bar{w}\sqrt{\mathit{\boldsymbol{b}}_{3}^{\rm T}\mathit{\boldsymbol{Pb}}_{3}}\sqrt{\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)} \end{align} $$ (33) 其中$ \bar{w} $为$ w(t) $最大值。综合式(32) 和式(33),式(29) 满足:
$$ \begin{align} \dot V(t)\leqslant -\frac{\lambda_{1}(\mathit{\boldsymbol{Q}})}{\lambda_{2}(\mathit{\boldsymbol{P}})}V(t)+2\bar{w}(t)\sqrt{\mathit{\boldsymbol{b}}_{3}^{\rm{T}}\mathit{\boldsymbol{Pb}}_{3}}\sqrt{V(t)} \end{align} $$ (34) 由此可得,使$ V(t) $正定且$ \dot V(t) $负定的稳定域为
$$ \begin{align} \sqrt{\tau}-2\bar{w}(t)\frac{\lambda_{2}(\mathit{\boldsymbol{P}})}{\lambda_{1}(\mathit{\boldsymbol{Q}})}\sqrt{\mathit{\boldsymbol{b}}_{3}^{\rm{T}}\mathit{\boldsymbol{Pb}}_{3}}>0 \end{align} $$ (35) 对应的稳定域下界$ \tau_{\mathrm{s1}} $可写为
$$ \begin{align} \tau_{\mathrm{s1}}=4\bar{w}^{2}\lambda_{2}^{2}({\mathit{\boldsymbol{P}}}){\mathit{\boldsymbol{b}}}_{3}^{\rm T}{\mathit{\boldsymbol{P}}}{\mathit{\boldsymbol{b}}}_{3}/\lambda_{1}^{2}({\mathit{\boldsymbol{Q}}}) \end{align} $$ (36) 同理,可求解得ESO2的稳定域下界$ \tau_{\mathrm{s2}} $满足
$$ \begin{align} \tau_{\mathrm{s2}}=4\bar{w}^{2}\lambda_{2}^{2}({\mathit{\boldsymbol{P}}}'){\mathit{\boldsymbol{b}}}_{3}^{\rm T}{\mathit{\boldsymbol{P}}}{\mathit{\boldsymbol{b}}}_{3}/\lambda_{1}^{2}({\mathit{\boldsymbol{Q}}}') \end{align} $$ (37) 综上,当观测误差在$ \varOmega_{1}=\{\tilde{\mathit{\boldsymbol{x}}}(t)\in \mathbb{R}^{n+1}\big| \tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\times {\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)\leqslant \tau_{\mathrm{s1}}\} $和$ \varOmega_{2}=\{\tilde{\mathit{\boldsymbol{n}}}(t)\in \mathbb{R}^{n+1}\big|\tilde{\mathit{\boldsymbol{n}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{n}}}}(t)<\tau_{\mathrm{s2}}\} $的交集内时,可保证OBR-ESO的渐近稳定性。
3.1 观测器稳定性分析
定理1 针对观测器(14),存在标量$ \tau_{\mathrm{s1}}=4\bar{w}^{2}\cdot \lambda_{2}^{2} (\mathit{\boldsymbol{P}}) \lambda_{1}^{-2}(\mathit{\boldsymbol{Q}})\mathit{\boldsymbol{b}}_{3}^{\rm T}\mathit{\boldsymbol{P}}\mathit{\boldsymbol{b}}_{3} $和$ \eta_{\mathrm{s1}}>\tau_{\mathrm{s1}} $,使估计误差$ \tilde{\mathit{\boldsymbol{x}}}(t) $属于集合$ \{\tilde{\mathit{\boldsymbol{x}}}(t)\in \mathbb{R}^{n+1}\big|\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)\leqslant \eta_{\mathrm{s1}}\} $,且$ \tilde{\mathit{\boldsymbol{x}}}(t) $最终收敛至不变集$ \varOmega_{1}=\{\tilde{\mathit{\boldsymbol{x}}}(t)\in \mathbb{R}^{n+1}\big| \tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)\leqslant \tau_{\mathrm{s1}}\} $。
证明 在观测器的设计中,使用ESO2对ESO1与UGV模型复合而成的新系统进行扰动观测。为了分析所设计级联结构的可行性,首先证明该复合系统的能控性与能观性。由式(9) 和(14) 可得该复合系统的状态和输出方程:
$$ \begin{align} \begin{cases} \begin{bmatrix} \dot{\mathit{\boldsymbol{x}}}(t)\\ \dot{\hat{\mathit{\boldsymbol{x}}}}(t)\end{bmatrix}=\underbrace{ \begin{bmatrix} \mathit{\boldsymbol{A}}& {\bf 0}_{3\times 4}\\ \mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c}}& \mathit{\boldsymbol{A}}'-\mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c'}}\end{bmatrix}}_{\mathit{\boldsymbol{A}}_{7}} \begin{bmatrix} \mathit{\boldsymbol{x}}(t)\\ \hat{\mathit{\boldsymbol{x}}}(t)\end{bmatrix}+\underbrace{ \begin{bmatrix} \mathit{\boldsymbol{b}}\\ \mathit{\boldsymbol{b}}'\end{bmatrix}}_{\mathit{\boldsymbol{b}}_{7}}u(t)\\ y(t)=\underbrace{[{\bf 0}_{1\times 3}\; \; \mathit{\boldsymbol{c'}}]}_{\mathit{\boldsymbol{c}}_{7}} \begin{bmatrix} \mathit{\boldsymbol{x}}(t)\\ \hat{\mathit{\boldsymbol{x}}}(t)\end{bmatrix} \end{cases}\end{align} $$ (24) 其中$ \mathit{\boldsymbol{A}}_{7} $, $ \mathit{\boldsymbol{b}}_{7} $, $ \mathit{\boldsymbol{c}}_{7} $分别为复合系统的系统矩阵、控制向量、输出向量。
由式(24) 可知,$ \mathit{\boldsymbol{A}}_{7} $的分块维数满足$ n=2 $,因此系统能控性判别矩阵可构造为
$$ \begin{align} \mathit{\boldsymbol{S}}=[\mathit{\boldsymbol{b}}_{7}\; \; \mathit{\boldsymbol{A}}_{7}\mathit{\boldsymbol{b}}_{7}\; \; \cdots \; \; (\mathit{\boldsymbol{A}}_{7})^{n-1}\mathit{\boldsymbol{b}}_{7}] \end{align} $$ (25) 将$ \mathit{\boldsymbol{A}}_{7} $和$ \mathit{\boldsymbol{b}}_{7} $的具体形式代入式(25) 中,可得
$$ \begin{align} \mathrm{rank} \mathit{\boldsymbol{S}}=\mathrm{rank} \begin{bmatrix} \mathit{\boldsymbol{b}}& \mathit{\boldsymbol{Ab}}\\ \mathit{\boldsymbol{b}}'& \mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{cb}}+{\mathit{\boldsymbol{A}}}'\mathit{\boldsymbol{b}}'\end{bmatrix}=n \end{align} $$ (26) 因此可知该复合系统是能控的。由于$ \mathit{\boldsymbol{A}}_{7} $的分块维数为$ n=2 $,系统的能观性判别矩阵可构造为
$$ \begin{align} \mathit{\boldsymbol{M}}=[\mathit{\boldsymbol{c}}_{7}^{\rm T}\; \; \mathit{\boldsymbol{c}}_{7}^{\rm T}\mathit{\boldsymbol{A}}_{7}\; \; \cdots \; \; \mathit{\boldsymbol{c}}_{7}^{\rm T}(\mathit{\boldsymbol{A}}_{7})^{n-1}] \end{align} $$ (27) 之后将$ \mathit{\boldsymbol{A}}_{7} $和$ \mathit{\boldsymbol{c}}_{7} $的具体形式代入可得
$$ \begin{align} \mathrm{rank} \mathit{\boldsymbol{M}}=\mathrm{rank} \begin{bmatrix} {\bf 0}_{1\times 3}& \mathit{\boldsymbol{c}}'\\ \mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c}}& \mathit{\boldsymbol{A}}'-\mathit{\boldsymbol{l}}_{1}\mathit{\boldsymbol{c}}'\end{bmatrix}=n \end{align} $$ (28) 可知该复合系统内所有状态变量均可由输出完全反映。
在该复合系统能控且能观的基础上,设计李雅普诺夫候选函数为$ V(t)=\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t) $,对其关于时间求导并考虑式(22) 可得
$$ \begin{align} \dot V(t)& =\dot{\tilde{\mathit{\boldsymbol{x}}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)+\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\mathit{\boldsymbol{P\dot{\tilde{x}}}}(t) \\ & =\underbrace{-\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{Q}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)}_{\dot V_{1}(t)}+\underbrace{2\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\mathit{\boldsymbol{Pb}}_{3}w(t)}_{\dot V_{2}(t)} \end{align} $$ (29) 以$ \lambda_{1}(\mathit{\boldsymbol{P}}) $, $ \lambda_{2}(\mathit{\boldsymbol{P}}) $, $ \lambda_{1}(\mathit{\boldsymbol{Q}}) $, $ \lambda_{2}(\mathit{\boldsymbol{Q}}) $表示$ \mathit{\boldsymbol{P}} $和$ \mathit{\boldsymbol{Q}} $的特征值,则存在如下性质:
$$ \begin{align} \begin{cases} \lambda_{1}(\mathit{\boldsymbol{P}})\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\tilde{\mathit{\boldsymbol{x}}}(t)\leqslant \tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)\leqslant \lambda_{2}(\mathit{\boldsymbol{P}})\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\tilde{\mathit{\boldsymbol{x}}}(t)\\ \lambda_{1}(\mathit{\boldsymbol{Q}})\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\tilde{\mathit{\boldsymbol{x}}}(t)\leqslant \tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{Q}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)\leqslant \lambda_{2}(\mathit{\boldsymbol{Q}})\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\tilde{\mathit{\boldsymbol{x}}}(t) \end{cases} \end{align} $$ (30) 根据式(30) 可得
$$ \begin{align} \frac{\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)}{\lambda_{2}(\mathit{\boldsymbol{P}})}\leqslant \frac{\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{Q}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)}{\lambda_{1}(\mathit{\boldsymbol{Q}})} \end{align} $$ (31) 因此$ \dot V(t) $的第一部分满足:
$$ \begin{align} \dot V_{1}(t)=-\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{Q}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)\leqslant -V(t)\lambda_{1}(\mathit{\boldsymbol{Q}})/\lambda_{2}(\mathit{\boldsymbol{P}}) \end{align} $$ (32) 对于$ \dot V(t) $的第二部分,易知存在如下关系:
$$ \begin{align} 2\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\mathit{\boldsymbol{Pb}}_{3}w(t)\leqslant 2\bar{w}\sqrt{\mathit{\boldsymbol{b}}_{3}^{\rm T}\mathit{\boldsymbol{Pb}}_{3}}\sqrt{\tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)} \end{align} $$ (33) 其中$ \bar{w} $为$ w(t) $最大值。综合式(32) 和式(33),式(29) 满足:
$$ \begin{align} \dot V(t)\leqslant -\frac{\lambda_{1}(\mathit{\boldsymbol{Q}})}{\lambda_{2}(\mathit{\boldsymbol{P}})}V(t)+2\bar{w}(t)\sqrt{\mathit{\boldsymbol{b}}_{3}^{\rm{T}}\mathit{\boldsymbol{Pb}}_{3}}\sqrt{V(t)} \end{align} $$ (34) 由此可得,使$ V(t) $正定且$ \dot V(t) $负定的稳定域为
$$ \begin{align} \sqrt{\tau}-2\bar{w}(t)\frac{\lambda_{2}(\mathit{\boldsymbol{P}})}{\lambda_{1}(\mathit{\boldsymbol{Q}})}\sqrt{\mathit{\boldsymbol{b}}_{3}^{\rm{T}}\mathit{\boldsymbol{Pb}}_{3}}>0 \end{align} $$ (35) 对应的稳定域下界$ \tau_{\mathrm{s1}} $可写为
$$ \begin{align} \tau_{\mathrm{s1}}=4\bar{w}^{2}\lambda_{2}^{2}({\mathit{\boldsymbol{P}}}){\mathit{\boldsymbol{b}}}_{3}^{\rm T}{\mathit{\boldsymbol{P}}}{\mathit{\boldsymbol{b}}}_{3}/\lambda_{1}^{2}({\mathit{\boldsymbol{Q}}}) \end{align} $$ (36) 同理,可求解得ESO2的稳定域下界$ \tau_{\mathrm{s2}} $满足
$$ \begin{align} \tau_{\mathrm{s2}}=4\bar{w}^{2}\lambda_{2}^{2}({\mathit{\boldsymbol{P}}}'){\mathit{\boldsymbol{b}}}_{3}^{\rm T}{\mathit{\boldsymbol{P}}}{\mathit{\boldsymbol{b}}}_{3}/\lambda_{1}^{2}({\mathit{\boldsymbol{Q}}}') \end{align} $$ (37) 综上,当观测误差在$ \varOmega_{1}=\{\tilde{\mathit{\boldsymbol{x}}}(t)\in \mathbb{R}^{n+1}\big| \tilde{\mathit{\boldsymbol{x}}}^{\rm T}(t)\times {\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{x}}}}(t)\leqslant \tau_{\mathrm{s1}}\} $和$ \varOmega_{2}=\{\tilde{\mathit{\boldsymbol{n}}}(t)\in \mathbb{R}^{n+1}\big|\tilde{\mathit{\boldsymbol{n}}}^{\rm T}(t){\mathit{\boldsymbol{P}}}\tilde{{\mathit{\boldsymbol{n}}}}(t)<\tau_{\mathrm{s2}}\} $的交集内时,可保证OBR-ESO的渐近稳定性。
3.2 OBR-ESO总扰动观测过程分析
由式(6)~(9) 可知,系统实际总扰动为
$$ \begin{align*} f(t)=g(\cdot)-\ddot y(t)+\dot y(t)+(b-b_{0})u(t)=\ddot y(t)-b_{0}u(t) \end{align*} $$ 对其进行拉氏变换可得
$$ \begin{align} F(s)=s^{2}Y(s)-b_{0}U(s) \end{align} $$ (38) CLESO对总扰动的估计值$ \hat{X}_{3}(s) $可等效由输出量$ Y(s) $和输入量$ U(s) $表示:
$$ \begin{align} \hat{X}_{3}(s)=\omega_{\rm o}^{3}\big(s^{2}Y(s)-b_{0}U(s)\big)/(s+\omega_{\rm o})^{3} \end{align} $$ (39) 由式(14),可解得频域下的ESO1变量为
$$ \begin{align} \begin{cases} \hat{X}_{1}(s)=[(1-s^{3})Y(s)+b_{0}sU(s)]/(s+\omega_{\rm o})^{3}\\ \hat{X}_{2}(s)=\dfrac{(3\omega_{\rm o}^{2}s+\omega_{\rm o}^{3})sY(s)+b_{0}(s+3\omega_{\rm o})sU(s)}{(s+\omega_{\rm o})^{3}}\\ \hat{X}'_{3}(s)=(\omega_{\rm o}^{3}s^{2}Y(s)-b_{0}\omega_{\rm o}^{3}U(s))/(s+\omega_{\rm o})^{3}\\ \hat{X}'_{4}(s)=\dfrac{\omega_{\rm o}^{4}ms^{2}(T_{2}s+1)Y(s)-\omega_{\rm o}^{4}b_{0}m(T_{2}s+1)U(s)}{(s+\omega_{\rm o})^{4}} \end{cases}\end{align} $$ (40) 由式(15) 可解得频域下的ESO2变量为
$$ \begin{align} \begin{cases} \hat{N}_{1}(s)=[(1-s^{3})\hat{X}_{1}(s)+b_{0}sU_{2}(s)]/(s+\omega_{\rm o})^{3}\\ \hat{N}_{2}(s)=\dfrac{(3\omega_{\rm o}^{2}s+\omega_{\rm o}^{3})s\hat{X}_{1}(s)+b_{0}(s+3\omega_{\rm o})sU_{2}(s)}{(s+\omega_{\rm o})^{3}}\\ \hat{N}_{3}(s)=\big(\omega_{\rm o}^{3}s^{2}\hat{X}_{1}(s)-\omega_{\rm o}^{3}b_{0}U_{2}(s)\big)/(s+\omega_{\rm o})^{3} \end{cases}\end{align} $$ (41) 结合式(39)~(41),可分别求得CLESO、级联CLESO以及所提OBR-ESO中的实际扰动值与扰动估计值之间的传递函数$ G_{0}(s) $、$ G_{1}(s) $、$ G_{2}(s) $:
$$ \begin{align} \begin{cases} G_{0}(s)=\dfrac{\hat{X}_{3}(s)}{F(s)}=\dfrac{\omega_{\rm o}^{3}}{(s+\omega_{\rm o})^{3}}\\ G_{1}(s)=\dfrac{\hat{X}_{3}(s)+\hat{N}_{3}(s)}{F(s)}=\dfrac{2\omega_{\rm o}^{3}}{(s+\omega_{\rm o})^{3}}\\ G_{2}(s)=\dfrac{\hat{X}'_{4}(s)+\hat{N}_{3}(s)}{F(s)}=\dfrac{\omega_{\rm o}^{3}(2(s+\omega_{\rm o})^{3}-b_{0}\omega_{\rm o}^{3})}{(s+\omega_{\rm o})^{6}} \end{cases} \end{align} $$ (42) 由式(42) 可看出,在$ \hat{x}_{1}(t) $对$ y(t) $进行跟踪的过程中,级联CLESO可被视为双重CLESO结构,传递函数的增益是CLESO的2倍,因此有着更好的扰动观测效果。而OBR-ESO通过扩展对$ f(t) $的观测阶次,增加了传递函数$ G_{2}(s) $中的固定零点和自由极点,通过合理放置的零点可以改善观测器的收敛效果,并获得预期的动态性能。这保证观测器在满足观测要求的前提下,对内部噪声进行有效抑制。
结合式(42),可绘制出当带宽$ \omega_{\rm o}= $ 10 rad/s时观测器输出侧$ Y(s) $对应的幅相曲线,见图 3。可以看出,级联CLESO的快速性高于CLESO。但是二者的极点位置相同,导致其相频曲线相互重合,所以级联CLESO的抗干扰性能等同于CLESO。
本文的OBR-ESO通过设计新增零极点位置使截止频率更高,进而提高观测器的快速性。同时将相角裕度调节至适中的56$ ^{\circ} $;相较于所对比方法的过大相角裕度71$ ^{\circ} $,可以获得更好的观测快速性,从而提高了观测器的抗扰性能。
3.2 OBR-ESO总扰动观测过程分析
由式(6)~(9) 可知,系统实际总扰动为
$$ \begin{align*} f(t)=g(\cdot)-\ddot y(t)+\dot y(t)+(b-b_{0})u(t)=\ddot y(t)-b_{0}u(t) \end{align*} $$ 对其进行拉氏变换可得
$$ \begin{align} F(s)=s^{2}Y(s)-b_{0}U(s) \end{align} $$ (38) CLESO对总扰动的估计值$ \hat{X}_{3}(s) $可等效由输出量$ Y(s) $和输入量$ U(s) $表示:
$$ \begin{align} \hat{X}_{3}(s)=\omega_{\rm o}^{3}\big(s^{2}Y(s)-b_{0}U(s)\big)/(s+\omega_{\rm o})^{3} \end{align} $$ (39) 由式(14),可解得频域下的ESO1变量为
$$ \begin{align} \begin{cases} \hat{X}_{1}(s)=[(1-s^{3})Y(s)+b_{0}sU(s)]/(s+\omega_{\rm o})^{3}\\ \hat{X}_{2}(s)=\dfrac{(3\omega_{\rm o}^{2}s+\omega_{\rm o}^{3})sY(s)+b_{0}(s+3\omega_{\rm o})sU(s)}{(s+\omega_{\rm o})^{3}}\\ \hat{X}'_{3}(s)=(\omega_{\rm o}^{3}s^{2}Y(s)-b_{0}\omega_{\rm o}^{3}U(s))/(s+\omega_{\rm o})^{3}\\ \hat{X}'_{4}(s)=\dfrac{\omega_{\rm o}^{4}ms^{2}(T_{2}s+1)Y(s)-\omega_{\rm o}^{4}b_{0}m(T_{2}s+1)U(s)}{(s+\omega_{\rm o})^{4}} \end{cases}\end{align} $$ (40) 由式(15) 可解得频域下的ESO2变量为
$$ \begin{align} \begin{cases} \hat{N}_{1}(s)=[(1-s^{3})\hat{X}_{1}(s)+b_{0}sU_{2}(s)]/(s+\omega_{\rm o})^{3}\\ \hat{N}_{2}(s)=\dfrac{(3\omega_{\rm o}^{2}s+\omega_{\rm o}^{3})s\hat{X}_{1}(s)+b_{0}(s+3\omega_{\rm o})sU_{2}(s)}{(s+\omega_{\rm o})^{3}}\\ \hat{N}_{3}(s)=\big(\omega_{\rm o}^{3}s^{2}\hat{X}_{1}(s)-\omega_{\rm o}^{3}b_{0}U_{2}(s)\big)/(s+\omega_{\rm o})^{3} \end{cases}\end{align} $$ (41) 结合式(39)~(41),可分别求得CLESO、级联CLESO以及所提OBR-ESO中的实际扰动值与扰动估计值之间的传递函数$ G_{0}(s) $、$ G_{1}(s) $、$ G_{2}(s) $:
$$ \begin{align} \begin{cases} G_{0}(s)=\dfrac{\hat{X}_{3}(s)}{F(s)}=\dfrac{\omega_{\rm o}^{3}}{(s+\omega_{\rm o})^{3}}\\ G_{1}(s)=\dfrac{\hat{X}_{3}(s)+\hat{N}_{3}(s)}{F(s)}=\dfrac{2\omega_{\rm o}^{3}}{(s+\omega_{\rm o})^{3}}\\ G_{2}(s)=\dfrac{\hat{X}'_{4}(s)+\hat{N}_{3}(s)}{F(s)}=\dfrac{\omega_{\rm o}^{3}(2(s+\omega_{\rm o})^{3}-b_{0}\omega_{\rm o}^{3})}{(s+\omega_{\rm o})^{6}} \end{cases} \end{align} $$ (42) 由式(42) 可看出,在$ \hat{x}_{1}(t) $对$ y(t) $进行跟踪的过程中,级联CLESO可被视为双重CLESO结构,传递函数的增益是CLESO的2倍,因此有着更好的扰动观测效果。而OBR-ESO通过扩展对$ f(t) $的观测阶次,增加了传递函数$ G_{2}(s) $中的固定零点和自由极点,通过合理放置的零点可以改善观测器的收敛效果,并获得预期的动态性能。这保证观测器在满足观测要求的前提下,对内部噪声进行有效抑制。
结合式(42),可绘制出当带宽$ \omega_{\rm o}= $ 10 rad/s时观测器输出侧$ Y(s) $对应的幅相曲线,见图 3。可以看出,级联CLESO的快速性高于CLESO。但是二者的极点位置相同,导致其相频曲线相互重合,所以级联CLESO的抗干扰性能等同于CLESO。
本文的OBR-ESO通过设计新增零极点位置使截止频率更高,进而提高观测器的快速性。同时将相角裕度调节至适中的56$ ^{\circ} $;相较于所对比方法的过大相角裕度71$ ^{\circ} $,可以获得更好的观测快速性,从而提高了观测器的抗扰性能。
3.3 外部扰动观测器鲁棒性分析
由式(42) 可知,CLESO和所提OBR-ESO中用于描述扰动估计偏差的传递函数分别为
$$ \begin{equation} \begin{aligned} E_{1}(s)& =\frac{F(s)-\hat{X}_{3}(s)}{F(s)}=\frac{s^{3}+3\omega_{\rm o}s^{2}+3\omega_{\rm o}^{2}s-2\omega_{\rm o}^{3}}{(s+\omega_{\rm o})^{3}}\\ E_{2}(s)& =[F(s)-(\hat{X}'_{4}(s)+\hat{N}_{3}(s))]/F(s)\\ & =[(s^{3}+3\omega_{\rm o}s^{2}+3\omega_{\rm o}^{2}s-2\omega_{\rm o}^{3})^{2}+b_{0}\omega_{\rm o}^{6}]/ \\ & \quad\;(s+\omega_{\rm o})^{6} \end{aligned} \end{equation} $$ (43) 选取不同外部扰动激励函数$ f(t) $,对CLESO和OBR-ESO进行比较,观测误差表达式如表 1所示。表中$ k $为扰动增益,多项式$ f_{\mathrm{e}n}(t)=k_{\mathrm{e0}}t^{0}+k_{\mathrm{e1}}t^{1}+\cdots +k_{\mathrm{e}n}t^{n} $,$ n\leqslant 5 $,$ k_{\mathrm{e}n} $为解算的参数。
从表 1可知,当外部扰动$ f(t) $为阶跃函数或斜坡函数时,OBR-ESO可以有效观测扰动。而CL-ESO在外部扰动为斜坡函数时,会出现静态误差$ 3k\omega_{\rm o}^{-1} $,导致UGV持续偏离期望轨迹。当$ f(t)=kt^{i} $($ i\geqslant 2 $)时,两种观测器都会在扰动观测过程中出现偏差。但是由于OBR-ESO扩展了高阶扰动观测维度,所以对扰动观测的准确性更高,并且调节观测器带宽$ \omega_{\rm o} $可以减小扰动观测偏差。CLESO的扰动观测阶次为1,无法及时补偿高阶时变扰动,因此在UGV运行过程中CLESO对外部扰动的观测误差持续增大,CLADRC将导致车辆持续偏离期望轨迹。因此在车辆运行过程中,OBR-ESO相较于CLESO对扰动具有更准确的观测结果,有助于使UGV当前轨迹在短时间内与期望轨迹保持一致。
表 1 CLESO和OBR-ESO在不同扰动下的观测误差表达式Table 1. Observation error expression of CLESO and OBR-ESO under different disturbances$ f(t) $ CLESO OBR-ESO $ k $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t) $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t) $ $ kt $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)+3k\omega_{\rm o}^{-1} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t) $ $ kt^{2} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)-12k\omega_{\rm o}^{-2}+6k\omega_{\rm o}^{-1}t $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t)+18 k(1-m)\omega_{\rm o}^{-1} $ $ kt^{3} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)+60k\omega_{\rm o}^{-3} -36k\omega_{\rm o}^{-2}t+9k\omega_{\rm o}^{-1}t^{2} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t)-216k\omega_{\rm o}^{-3} -54k\omega_{\rm o}^{-2}t $ $ kt^{4} $ $ \begin{array}{l} {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)-360k\omega_{\rm o}^{-4} +240k\omega_{\rm o}^{-3}t-72k\omega_{\rm o}^{-2}t^{2} +12k\omega_{\rm o}^{-1}t^{3} \end{array} $ $ \begin{array}{l} {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t)+2304k\omega_{\rm o}^{-4} -864k\omega_{\rm o}^{-3}t+108k\omega_{\rm o}^{-2}t^{2} \end{array} $ $ k\sin \omega_{1}t $ $\begin{aligned} & \mathrm{e}^{-\omega_{\mathrm{o}} t} f_{\mathrm{e} 2}(t)+k\left(2 \omega_{\mathrm{o}}^6+6 \omega_{\mathrm{o}}^4+6 \omega_{\mathrm{o}}^2+2\right)^{-1} \times \\ & {\left[\left(6 \omega_{\mathrm{o}}^5-2 \omega_{\mathrm{o}}^3\right) \cos \omega_1 t+\left(12 \omega_{\mathrm{o}}^4+6 \omega_{\mathrm{o}}^2+2\right) \sin \omega_1 t\right]} \end{aligned}$ $\begin{aligned} & \mathrm{e}^{-\omega_{\mathrm{o}} t} f_{\mathrm{e} 5}(t)+k\left(120 \omega_{\mathrm{o}}^{12}+720 \omega_{\mathrm{o}}^{10}+1800 \omega_{\mathrm{o}}^8+2400 \omega_{\mathrm{o}}^6+\right. \\ & \left.1800 \omega_{\mathrm{o}}^4+720 \omega_{\mathrm{o}}^2+120\right)^{-1}\left[\left(4320 \omega_{\mathrm{o}}^9+720 \omega_{\mathrm{o}}^7-\right.\right. \\ & \left.240 \omega_{\mathrm{o}}^3\right) \cos \omega_1 t-\left(1080 \omega_{\mathrm{o}}^{10}-5040 \omega_{\mathrm{o}}^8-4200 \omega_{\mathrm{o}}^6-\right. \\ & \left.\left.2520 \omega_{\mathrm{o}}^4-720 \omega_{\mathrm{o}}^2-120\right) \sin \omega_1 t\right] \end{aligned}$ 进一步,当扰动函数为$ f(t)=k\sin t $时,对CLESO和OBR-ESO分别在不同观测器带宽$ \omega_{\rm o} $和不同扰动增益$ k $下绘制扰动响应表面,如图 4所示。可以看出,当$ \omega_{\rm o} $增大或$ k $减小时,两种观测器的观测偏差范围会减小,因此可以通过选择合适的$ \omega_{\rm o} $与$ k $来提升观测器的抗扰性能。在$ \omega_{\rm o} $和$ k $保持不变的前提下,OBR-ESO对于扰动观测的响应表面更平坦,即观测偏差更小。以上结果说明,OBR-ESO提高了扰动观测的精度,从而提高了OBR-ADRC控制器的扰动抑制效果。
3.3 外部扰动观测器鲁棒性分析
由式(42) 可知,CLESO和所提OBR-ESO中用于描述扰动估计偏差的传递函数分别为
$$ \begin{equation} \begin{aligned} E_{1}(s)& =\frac{F(s)-\hat{X}_{3}(s)}{F(s)}=\frac{s^{3}+3\omega_{\rm o}s^{2}+3\omega_{\rm o}^{2}s-2\omega_{\rm o}^{3}}{(s+\omega_{\rm o})^{3}}\\ E_{2}(s)& =[F(s)-(\hat{X}'_{4}(s)+\hat{N}_{3}(s))]/F(s)\\ & =[(s^{3}+3\omega_{\rm o}s^{2}+3\omega_{\rm o}^{2}s-2\omega_{\rm o}^{3})^{2}+b_{0}\omega_{\rm o}^{6}]/ \\ & \quad\;(s+\omega_{\rm o})^{6} \end{aligned} \end{equation} $$ (43) 选取不同外部扰动激励函数$ f(t) $,对CLESO和OBR-ESO进行比较,观测误差表达式如表 1所示。表中$ k $为扰动增益,多项式$ f_{\mathrm{e}n}(t)=k_{\mathrm{e0}}t^{0}+k_{\mathrm{e1}}t^{1}+\cdots +k_{\mathrm{e}n}t^{n} $,$ n\leqslant 5 $,$ k_{\mathrm{e}n} $为解算的参数。
从表 1可知,当外部扰动$ f(t) $为阶跃函数或斜坡函数时,OBR-ESO可以有效观测扰动。而CL-ESO在外部扰动为斜坡函数时,会出现静态误差$ 3k\omega_{\rm o}^{-1} $,导致UGV持续偏离期望轨迹。当$ f(t)=kt^{i} $($ i\geqslant 2 $)时,两种观测器都会在扰动观测过程中出现偏差。但是由于OBR-ESO扩展了高阶扰动观测维度,所以对扰动观测的准确性更高,并且调节观测器带宽$ \omega_{\rm o} $可以减小扰动观测偏差。CLESO的扰动观测阶次为1,无法及时补偿高阶时变扰动,因此在UGV运行过程中CLESO对外部扰动的观测误差持续增大,CLADRC将导致车辆持续偏离期望轨迹。因此在车辆运行过程中,OBR-ESO相较于CLESO对扰动具有更准确的观测结果,有助于使UGV当前轨迹在短时间内与期望轨迹保持一致。
表 1 CLESO和OBR-ESO在不同扰动下的观测误差表达式Table 1. Observation error expression of CLESO and OBR-ESO under different disturbances$ f(t) $ CLESO OBR-ESO $ k $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t) $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t) $ $ kt $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)+3k\omega_{\rm o}^{-1} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t) $ $ kt^{2} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)-12k\omega_{\rm o}^{-2}+6k\omega_{\rm o}^{-1}t $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t)+18 k(1-m)\omega_{\rm o}^{-1} $ $ kt^{3} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)+60k\omega_{\rm o}^{-3} -36k\omega_{\rm o}^{-2}t+9k\omega_{\rm o}^{-1}t^{2} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t)-216k\omega_{\rm o}^{-3} -54k\omega_{\rm o}^{-2}t $ $ kt^{4} $ $ \begin{array}{l} {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)-360k\omega_{\rm o}^{-4} +240k\omega_{\rm o}^{-3}t-72k\omega_{\rm o}^{-2}t^{2} +12k\omega_{\rm o}^{-1}t^{3} \end{array} $ $ \begin{array}{l} {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t)+2304k\omega_{\rm o}^{-4} -864k\omega_{\rm o}^{-3}t+108k\omega_{\rm o}^{-2}t^{2} \end{array} $ $ k\sin \omega_{1}t $ $\begin{aligned} & \mathrm{e}^{-\omega_{\mathrm{o}} t} f_{\mathrm{e} 2}(t)+k\left(2 \omega_{\mathrm{o}}^6+6 \omega_{\mathrm{o}}^4+6 \omega_{\mathrm{o}}^2+2\right)^{-1} \times \\ & {\left[\left(6 \omega_{\mathrm{o}}^5-2 \omega_{\mathrm{o}}^3\right) \cos \omega_1 t+\left(12 \omega_{\mathrm{o}}^4+6 \omega_{\mathrm{o}}^2+2\right) \sin \omega_1 t\right]} \end{aligned}$ $\begin{aligned} & \mathrm{e}^{-\omega_{\mathrm{o}} t} f_{\mathrm{e} 5}(t)+k\left(120 \omega_{\mathrm{o}}^{12}+720 \omega_{\mathrm{o}}^{10}+1800 \omega_{\mathrm{o}}^8+2400 \omega_{\mathrm{o}}^6+\right. \\ & \left.1800 \omega_{\mathrm{o}}^4+720 \omega_{\mathrm{o}}^2+120\right)^{-1}\left[\left(4320 \omega_{\mathrm{o}}^9+720 \omega_{\mathrm{o}}^7-\right.\right. \\ & \left.240 \omega_{\mathrm{o}}^3\right) \cos \omega_1 t-\left(1080 \omega_{\mathrm{o}}^{10}-5040 \omega_{\mathrm{o}}^8-4200 \omega_{\mathrm{o}}^6-\right. \\ & \left.\left.2520 \omega_{\mathrm{o}}^4-720 \omega_{\mathrm{o}}^2-120\right) \sin \omega_1 t\right] \end{aligned}$ 进一步,当扰动函数为$ f(t)=k\sin t $时,对CLESO和OBR-ESO分别在不同观测器带宽$ \omega_{\rm o} $和不同扰动增益$ k $下绘制扰动响应表面,如图 4所示。可以看出,当$ \omega_{\rm o} $增大或$ k $减小时,两种观测器的观测偏差范围会减小,因此可以通过选择合适的$ \omega_{\rm o} $与$ k $来提升观测器的抗扰性能。在$ \omega_{\rm o} $和$ k $保持不变的前提下,OBR-ESO对于扰动观测的响应表面更平坦,即观测偏差更小。以上结果说明,OBR-ESO提高了扰动观测的精度,从而提高了OBR-ADRC控制器的扰动抑制效果。
3.4 内部参数变化时控制器的鲁棒性分析
为了分析车辆内部参数变化对控制系统的影响,在式(7) 中设置内部参数变化量$ \Delta c $,此时UGV的模型为$ y(t)+\Delta c\cdot y(t)=b_{0}u(t)+f(t) $。可将其表示如下:
$$ \begin{align} G_{\rm m}(s)=\frac{Y(s)}{b_{0}U(s)+F(s)}=\frac{1}{s^{3}+\Delta c} \end{align} $$ (44) 根据式(10) 和式(44),可求得CLADRC控制器的传递函数为
$$ \begin{align} G_{\rm c}(s)=\frac{Y(s)}{Y_{\rm r}(s)}=\frac{(k_{\rm p}+k_{\rm d}s)G_{\rm p}(s)}{b_{0}G_{\rm u}(s)+G_{\rm p}(s)H(s)} \end{align} $$ (45) 其中控制通道传递函数$ G_{\rm u}(s) $和负反馈通道传递函数$ H(s) $分别为
$$ \begin{align*} G_{\rm u}(s)& =s^{3}+(3\omega_{\rm o}+k_{\rm d})s^{2}+(3\omega_{\rm o}^{2}+3k_{\rm d}\omega_{\rm o}+k_{\rm p})s\\ H(s)& =k_{\rm p}(3\omega_{\rm o}^{2}s^{2}+3\omega_{\rm o}^{2}s+\omega_{\rm o}^{3})+k_{\rm d}(3\omega_{\rm o}s^{2}+\omega_{\rm o}^{3}) \end{align*} $$ 由式(16)(44),可得OBR-ADRC控制器输出$ Y(s) $在输入信号$ Y_{\rm r}(s) $下的动态响应传递函数为
$$ \begin{align} G_{\rm c}'(s)=\frac{Y(s)}{Y_{\rm r}(s)}=\frac{(k_{\rm p}+k_{\rm d}s)G_{\rm p}(s)}{b_{0}G_{\rm u}'(s)+G_{\rm p}(s)H'(s)} \end{align} $$ (46) 其中控制通道函数$ G'_{\rm u}(s) $和负反馈通道函数$ H'(s) $分别为
$$ \begin{align*} G_{\rm u}'(s)& =(s+\omega_{\rm o})^{-3}\big(k_{\rm p}s+k_{\rm d}(s^{2}+3\omega_{\rm o}s)+\notag \\ &\quad\omega_{\rm o}^{3}-\omega_{\rm o}^{7}m(T_{1}+1)\big)\\ H'(s)& =k_{\rm p}(3\omega_{\rm o}s^{2}+3\omega_{\rm o}^{2}s+\omega_{\rm o}^{3})+k_{\rm d}(3\omega_{\rm o}^{2}s+\omega_{\rm o}^{3})-\notag \\ &\quad3\omega_{\rm o}^{3}s^{2}+\omega_{\rm o}^{4}m(T_{1}s^{3}+s^{2})-\omega_{\rm o}^{3}s^{2} \end{align*} $$ 以标称值$ \Delta c=1 $为基准,当$ \Delta c $递增时,根据式(45) 和式(46) 可绘制出零极点分布以及特征根轨迹,如图 5所示。从图 5(a)可以看出,随着$ \Delta c $的增大,CLADRC的非主导极点$ P_{\mathrm{c2}}, P_{\mathrm{c3}} $和OBR-ADRC的非主导极点$ P_{\mathrm{o3}}, P_{\mathrm{o4}}, P_{\mathrm{o7}} $都在逐渐远离虚轴,对应的衰减因子收敛速度也随之加快。
图 5(b)中的特征根轨迹展示了$ \Delta c $对系统稳定性的影响。随着$ \Delta c $的不断增大,CLADRC的极点$ P_{\mathrm{c2}}, P_{\mathrm{c3}} $逐渐逼近单位圆,影响了控制系统对振荡的抑制。OBR-ADRC扩展了扰动观测阶次,因此增加了自由极点$ P_{\mathrm{o5}}, P_{\mathrm{o6}}, P_{\mathrm{o7}}, P_{\mathrm{o8}} $。其中$ P_{\mathrm{o7}} $随着$ \Delta c $的变大向中心点靠近,因此对系统提供了较大阻尼,提高了参数变化条件下的稳定性。
基于以上分析,使用蒙特卡洛法对所提OBR-ADRC策略进行测试,并使UGV沿蛇形轨迹运动。车辆配重在0~$ + $15% 范围内变化,侧偏刚度在$ \pm $5% 范围内变化。所得OBR-ADRC的动态响应性能如图 6所示。由图 6(a)可以看出,在车辆2种参数变化情况下,OBR-ADRC的恢复时间均变化较小。图 6(b)给出了误差平方积分(ISE)指标。对应于大部分情况下的车身质量和侧偏刚度,可以看出ISE指标较为稳定。
3.4 内部参数变化时控制器的鲁棒性分析
为了分析车辆内部参数变化对控制系统的影响,在式(7) 中设置内部参数变化量$ \Delta c $,此时UGV的模型为$ y(t)+\Delta c\cdot y(t)=b_{0}u(t)+f(t) $。可将其表示如下:
$$ \begin{align} G_{\rm m}(s)=\frac{Y(s)}{b_{0}U(s)+F(s)}=\frac{1}{s^{3}+\Delta c} \end{align} $$ (44) 根据式(10) 和式(44),可求得CLADRC控制器的传递函数为
$$ \begin{align} G_{\rm c}(s)=\frac{Y(s)}{Y_{\rm r}(s)}=\frac{(k_{\rm p}+k_{\rm d}s)G_{\rm p}(s)}{b_{0}G_{\rm u}(s)+G_{\rm p}(s)H(s)} \end{align} $$ (45) 其中控制通道传递函数$ G_{\rm u}(s) $和负反馈通道传递函数$ H(s) $分别为
$$ \begin{align*} G_{\rm u}(s)& =s^{3}+(3\omega_{\rm o}+k_{\rm d})s^{2}+(3\omega_{\rm o}^{2}+3k_{\rm d}\omega_{\rm o}+k_{\rm p})s\\ H(s)& =k_{\rm p}(3\omega_{\rm o}^{2}s^{2}+3\omega_{\rm o}^{2}s+\omega_{\rm o}^{3})+k_{\rm d}(3\omega_{\rm o}s^{2}+\omega_{\rm o}^{3}) \end{align*} $$ 由式(16)(44),可得OBR-ADRC控制器输出$ Y(s) $在输入信号$ Y_{\rm r}(s) $下的动态响应传递函数为
$$ \begin{align} G_{\rm c}'(s)=\frac{Y(s)}{Y_{\rm r}(s)}=\frac{(k_{\rm p}+k_{\rm d}s)G_{\rm p}(s)}{b_{0}G_{\rm u}'(s)+G_{\rm p}(s)H'(s)} \end{align} $$ (46) 其中控制通道函数$ G'_{\rm u}(s) $和负反馈通道函数$ H'(s) $分别为
$$ \begin{align*} G_{\rm u}'(s)& =(s+\omega_{\rm o})^{-3}\big(k_{\rm p}s+k_{\rm d}(s^{2}+3\omega_{\rm o}s)+\notag \\ &\quad\omega_{\rm o}^{3}-\omega_{\rm o}^{7}m(T_{1}+1)\big)\\ H'(s)& =k_{\rm p}(3\omega_{\rm o}s^{2}+3\omega_{\rm o}^{2}s+\omega_{\rm o}^{3})+k_{\rm d}(3\omega_{\rm o}^{2}s+\omega_{\rm o}^{3})-\notag \\ &\quad3\omega_{\rm o}^{3}s^{2}+\omega_{\rm o}^{4}m(T_{1}s^{3}+s^{2})-\omega_{\rm o}^{3}s^{2} \end{align*} $$ 以标称值$ \Delta c=1 $为基准,当$ \Delta c $递增时,根据式(45) 和式(46) 可绘制出零极点分布以及特征根轨迹,如图 5所示。从图 5(a)可以看出,随着$ \Delta c $的增大,CLADRC的非主导极点$ P_{\mathrm{c2}}, P_{\mathrm{c3}} $和OBR-ADRC的非主导极点$ P_{\mathrm{o3}}, P_{\mathrm{o4}}, P_{\mathrm{o7}} $都在逐渐远离虚轴,对应的衰减因子收敛速度也随之加快。
图 5(b)中的特征根轨迹展示了$ \Delta c $对系统稳定性的影响。随着$ \Delta c $的不断增大,CLADRC的极点$ P_{\mathrm{c2}}, P_{\mathrm{c3}} $逐渐逼近单位圆,影响了控制系统对振荡的抑制。OBR-ADRC扩展了扰动观测阶次,因此增加了自由极点$ P_{\mathrm{o5}}, P_{\mathrm{o6}}, P_{\mathrm{o7}}, P_{\mathrm{o8}} $。其中$ P_{\mathrm{o7}} $随着$ \Delta c $的变大向中心点靠近,因此对系统提供了较大阻尼,提高了参数变化条件下的稳定性。
基于以上分析,使用蒙特卡洛法对所提OBR-ADRC策略进行测试,并使UGV沿蛇形轨迹运动。车辆配重在0~$ + $15% 范围内变化,侧偏刚度在$ \pm $5% 范围内变化。所得OBR-ADRC的动态响应性能如图 6所示。由图 6(a)可以看出,在车辆2种参数变化情况下,OBR-ADRC的恢复时间均变化较小。图 6(b)给出了误差平方积分(ISE)指标。对应于大部分情况下的车身质量和侧偏刚度,可以看出ISE指标较为稳定。
4. 实验分析(Experimental analysis)
为了进一步验证本文的控制策略,在图 7无人地面车辆TCar实验平台上进行测试。车辆轴距为$ L= $ 0.38 m,由无刷电机驱动,使用编码器和惯性测量单元测量实时速度并记录位姿。车载控制系统上层为NVIDIA Jetson Nano运算平台,下层以STM32运算平台接收车辆传感器的实时数据和上层控制指令。在实验中,控制算法在工作站上的Simulink模块中编写并执行,工作站通过WiFi与车辆进行通信。
实验中首先进行了轨迹跟踪性能测试,之后针对路面突变和不同路面条件进行了鲁棒性测试。实验中与PID、CLADRC控制器和常规MPC(模型预测控制)进行对比。CLADRC控制器与OBR-ADRC控制器均使用带宽法进行参数整定。根据控制系统对观测精度$ \mu_{\tilde{x}_{3}} $和观测时间$ t_{\rm d} $的指标要求,存在不等式约束:
$$ \begin{align} \begin{cases} {\rm e}^{t_{\rm d}\omega_{\rm o}}\omega_{\rm o}^{-2}\geqslant 0.877\big(x_{1}(0)-\hat{x}_{1}(0)\big)/\eta_{\rm sup}\\ \omega_{\rm o}\leqslant 1.14\eta_{\rm sup}\mu_{\tilde{x}_{3}}^{-1} \end{cases} \end{align} $$ (47) 其中$ \eta_{\rm sup} $为扰动集合$ \varepsilon =\{\dot f(t)\big|t\in \mathbb{R}^{+}\} $的上确界,$ x_{1}(0) $为横向轨迹误差$ x_{1}(t) $的初始状态,$ \hat{x}_{1}(0) $为$ x_{1}(t) $的ESO观测初值。通过代入设定的指标要求,控制器极点均应放置于$ \omega_{\rm o}= $ 105 rad/s处,这样CLADRC的3个增益为$ 3\omega_{\rm o}, 3\omega_{\rm o}^{2}, \omega_{\rm o}^{3} $,本文方法增益在式(18) 中给出。通过结合使用临界比例法和试错法,将PID控制器参数调整为$ 3.35, 0.28, 1.47 $。根据文[32],将MPC控制器的预测时域长度设置为15,控制时域长度设置为2。
4. 实验分析(Experimental analysis)
为了进一步验证本文的控制策略,在图 7无人地面车辆TCar实验平台上进行测试。车辆轴距为$ L= $ 0.38 m,由无刷电机驱动,使用编码器和惯性测量单元测量实时速度并记录位姿。车载控制系统上层为NVIDIA Jetson Nano运算平台,下层以STM32运算平台接收车辆传感器的实时数据和上层控制指令。在实验中,控制算法在工作站上的Simulink模块中编写并执行,工作站通过WiFi与车辆进行通信。
实验中首先进行了轨迹跟踪性能测试,之后针对路面突变和不同路面条件进行了鲁棒性测试。实验中与PID、CLADRC控制器和常规MPC(模型预测控制)进行对比。CLADRC控制器与OBR-ADRC控制器均使用带宽法进行参数整定。根据控制系统对观测精度$ \mu_{\tilde{x}_{3}} $和观测时间$ t_{\rm d} $的指标要求,存在不等式约束:
$$ \begin{align} \begin{cases} {\rm e}^{t_{\rm d}\omega_{\rm o}}\omega_{\rm o}^{-2}\geqslant 0.877\big(x_{1}(0)-\hat{x}_{1}(0)\big)/\eta_{\rm sup}\\ \omega_{\rm o}\leqslant 1.14\eta_{\rm sup}\mu_{\tilde{x}_{3}}^{-1} \end{cases} \end{align} $$ (47) 其中$ \eta_{\rm sup} $为扰动集合$ \varepsilon =\{\dot f(t)\big|t\in \mathbb{R}^{+}\} $的上确界,$ x_{1}(0) $为横向轨迹误差$ x_{1}(t) $的初始状态,$ \hat{x}_{1}(0) $为$ x_{1}(t) $的ESO观测初值。通过代入设定的指标要求,控制器极点均应放置于$ \omega_{\rm o}= $ 105 rad/s处,这样CLADRC的3个增益为$ 3\omega_{\rm o}, 3\omega_{\rm o}^{2}, \omega_{\rm o}^{3} $,本文方法增益在式(18) 中给出。通过结合使用临界比例法和试错法,将PID控制器参数调整为$ 3.35, 0.28, 1.47 $。根据文[32],将MPC控制器的预测时域长度设置为15,控制时域长度设置为2。
4.1 轨迹跟踪性能对比
考虑到UGV的应用场景,设计了双移线期望轨迹,并着重测试所设计控制器的横向跟踪性能,轨迹如下:
$$ \begin{align} y_{\rm r}(t) =2.5(1+\tanh (0.5p)) -2.8(1+\tanh (0.5q))-0.3 \end{align} $$ (48) 其中解算量$ p=0.048(v_{\rm r}\cdot t-27.19)-1.2 $,$ q=0.055\cdot(v_{\rm r}\cdot t -56.46)-1.2 $。搭建的实验场景如图 8所示,车辆前进速度为$ v_{\rm r}= $ 0.5 m/s。
对横向位移$ y_{\rm r}(t) $的跟踪结果如图 9所示,4种控制器均能保证跟踪误差收敛。PID、CLADRC和MPC控制器的调节时间$ t_{\rm s} $分别为9.3、8.2、8.1 s,OBR-ADRC控制器的调节时间为7.7 s。表 2给出了最大绝对跟踪误差$ e_{y\max} $与绝对误差积分(IAE)结果。结合图 9(b)及表 2可以看出,3种对比方法在跟踪过程中都出现了较大振荡,OBR-ADRC控制器的$ e_{y\max} $与IAE指标均小于3种对比方法。可知所提方法减小了横向跟踪误差,实现了对$ y_{\rm r}(t) $快速且平滑的跟踪。
表 2 最大绝对跟踪误差与绝对误差积分结果Table 2. Experimental results of dual lane change trajectory tracking Results of maximum absolute tracking error and IAE控制器 $ e_{y\max} $/m IAE/(m$ \cdot $s) OBR-ADRC 0.076 0.318 CLADRC 0.106 0.675 MPC 0.084 0.571 PID 0.277 0.926 4.1 轨迹跟踪性能对比
考虑到UGV的应用场景,设计了双移线期望轨迹,并着重测试所设计控制器的横向跟踪性能,轨迹如下:
$$ \begin{align} y_{\rm r}(t) =2.5(1+\tanh (0.5p)) -2.8(1+\tanh (0.5q))-0.3 \end{align} $$ (48) 其中解算量$ p=0.048(v_{\rm r}\cdot t-27.19)-1.2 $,$ q=0.055\cdot(v_{\rm r}\cdot t -56.46)-1.2 $。搭建的实验场景如图 8所示,车辆前进速度为$ v_{\rm r}= $ 0.5 m/s。
对横向位移$ y_{\rm r}(t) $的跟踪结果如图 9所示,4种控制器均能保证跟踪误差收敛。PID、CLADRC和MPC控制器的调节时间$ t_{\rm s} $分别为9.3、8.2、8.1 s,OBR-ADRC控制器的调节时间为7.7 s。表 2给出了最大绝对跟踪误差$ e_{y\max} $与绝对误差积分(IAE)结果。结合图 9(b)及表 2可以看出,3种对比方法在跟踪过程中都出现了较大振荡,OBR-ADRC控制器的$ e_{y\max} $与IAE指标均小于3种对比方法。可知所提方法减小了横向跟踪误差,实现了对$ y_{\rm r}(t) $快速且平滑的跟踪。
表 2 最大绝对跟踪误差与绝对误差积分结果Table 2. Experimental results of dual lane change trajectory tracking Results of maximum absolute tracking error and IAE控制器 $ e_{y\max} $/m IAE/(m$ \cdot $s) OBR-ADRC 0.076 0.318 CLADRC 0.106 0.675 MPC 0.084 0.571 PID 0.277 0.926 4.2 路面突变测试
考虑到前轮转向角$ \delta (t) $接近饱和时,UGV对扰动更为敏感[31],在圆形运动路径上放置高度为0.02 m、宽度为0.1 m的坡形地面固定障碍以模拟路面突变外部扰动。实验中分别以TCar车的左右两侧驶过地面障碍,如图 10所示。期望轨迹设计为式(49) 所示的圆形轨迹,曲率半径为$ R_{\mathrm{cir}}= $ 1.5 m,车辆角速度为$ \omega_{\mathrm{cir}}= $ 1 rad/s。
$$ \begin{align} \begin{cases} {x}^{\rm w}(t)=R_{\mathrm{cir}}\cos (\omega_{\mathrm{cir}}t+0.2)+0.4\\ {y}^{\rm w}(t)=R_{\mathrm{cir}}\big(1-\sin(\omega_{\mathrm{cir}}t+0.2)\big)-1.2 \end{cases} \end{align} $$ (49) 图 11(a)(b) 为无扰动条件下PID、CLADRC、MPC及OBR-ADRC的轨迹跟踪效果。4种控制器在初始阶段出现了横向跟踪误差,其中OBR-ADRC的误差最小,其最大误差为0.115 m。图 11(c)为添加路面突变后的轨迹跟踪横向误差增量$ \Delta e_{y} $,可知TCar车经过障碍物时横向误差有较大波动。表 3给出了添加路面突变扰动前后的轨迹跟踪性能结果。可知在添加外部扰动之后,OBR-ADRC将$ \Delta e_{y} $控制在0.038 m以内,与PID、CLADRC、MPC方法相比降幅分别为61.62%、46.47%、47.51%,且恢复时间$ t_{\rm r} $缩短至1.2 s。这些结果表明,OBR-ADRC控制策略具有较好的跟踪性能和抗扰性能。
表 3 添加路面突变扰动前后的轨迹跟踪性能结果Table 3. Trajectory tracking performance before and after adding road sudden disturbance控制器 未添加扰动 添加外部扰动 $ e_{y\max} $/m $ t_{\rm s} $/s $ \Delta e_{y\max} $/m $ t_{\rm r} $/s OBR-ADRC 0.115 4.2 0.038 1.2 CLADRC 0.132 5.0 0.071 1.4 MPC 0.146 5.2 0.072 1.5 PID 0.303 5.3 0.099 1.7 4.2 路面突变测试
考虑到前轮转向角$ \delta (t) $接近饱和时,UGV对扰动更为敏感[31],在圆形运动路径上放置高度为0.02 m、宽度为0.1 m的坡形地面固定障碍以模拟路面突变外部扰动。实验中分别以TCar车的左右两侧驶过地面障碍,如图 10所示。期望轨迹设计为式(49) 所示的圆形轨迹,曲率半径为$ R_{\mathrm{cir}}= $ 1.5 m,车辆角速度为$ \omega_{\mathrm{cir}}= $ 1 rad/s。
$$ \begin{align} \begin{cases} {x}^{\rm w}(t)=R_{\mathrm{cir}}\cos (\omega_{\mathrm{cir}}t+0.2)+0.4\\ {y}^{\rm w}(t)=R_{\mathrm{cir}}\big(1-\sin(\omega_{\mathrm{cir}}t+0.2)\big)-1.2 \end{cases} \end{align} $$ (49) 图 11(a)(b) 为无扰动条件下PID、CLADRC、MPC及OBR-ADRC的轨迹跟踪效果。4种控制器在初始阶段出现了横向跟踪误差,其中OBR-ADRC的误差最小,其最大误差为0.115 m。图 11(c)为添加路面突变后的轨迹跟踪横向误差增量$ \Delta e_{y} $,可知TCar车经过障碍物时横向误差有较大波动。表 3给出了添加路面突变扰动前后的轨迹跟踪性能结果。可知在添加外部扰动之后,OBR-ADRC将$ \Delta e_{y} $控制在0.038 m以内,与PID、CLADRC、MPC方法相比降幅分别为61.62%、46.47%、47.51%,且恢复时间$ t_{\rm r} $缩短至1.2 s。这些结果表明,OBR-ADRC控制策略具有较好的跟踪性能和抗扰性能。
表 3 添加路面突变扰动前后的轨迹跟踪性能结果Table 3. Trajectory tracking performance before and after adding road sudden disturbance控制器 未添加扰动 添加外部扰动 $ e_{y\max} $/m $ t_{\rm s} $/s $ \Delta e_{y\max} $/m $ t_{\rm r} $/s OBR-ADRC 0.115 4.2 0.038 1.2 CLADRC 0.132 5.0 0.071 1.4 MPC 0.146 5.2 0.072 1.5 PID 0.303 5.3 0.099 1.7 4.3 不同路面条件下的测试
路面条件的改变会对UGV的行驶带来较大影响,例如路面坡度和摩擦因数的变化。仍采用PID、CLADRC、MPC与OBR-ADRC进行对比,期望的蛇形轨迹设置为
$$ \begin{align} \begin{cases} {x}^{\rm w}(t)=-2.5+2.2\cos (\omega_{\mathrm{ser}}t-0.1)\\ {y}^{\rm w}(t)=0.2+0.8\sin (2\omega_{\mathrm{ser}}t-0.1) \end{cases} \end{align} $$ (50) 其中车辆期望角速度为$ \omega_{\mathrm{ser}}= $ 0.2 rad/s,并设置存在较大初始跟踪误差。首先在路面条件相同情况下进行实验,图 12给出了UGV的轨迹跟踪结果。可见,本文方法在跟踪过程中的横向误差最小。
之后针对不同路面条件下的控制器性能进行了蒙特卡洛检验。实验中保持控制器参数等条件不变,在UGV部分运动路径上添加坡面路段,实验场景如图 13(a)所示。使用高度调节器改变路面坡度,使其在$ \pm $25% 的范围内变化。并选取不同粒度的轮胎附着材料以实现摩擦因数从0.3变化至0.7。
图 13(b)给出了不同坡度、不同摩擦力的路面条件下的实验场景,其中横向对应路面坡度变化,纵向对应不同粒度附着材料的动摩擦力因数,对4种控制器各进行了50次试验。图 13(c)给出了路面坡度为20%、摩擦因数为0.6时的轨迹跟踪实验结果。可以看出CLADRC与MPC控制器在转向时出现了小幅度的误差,PID出现了较大横向跟踪误差并持续振荡,OBR-ADRC做到快速且平稳地跟踪期望轨迹。
为了直观对比4种控制器的鲁棒性,分别计算每次实验相应的ISE指标$ \lambda_{\mathrm{ISE}} $与分布指标$ \gamma_{\mathrm{ISE}} $,计算方法为
$$ \begin{align} \begin{cases} \lambda_{\rm ISE}=\int_0^{t_{s}}(y_{\rm r}(t)-y(t))^{2}{\rm d}t\\[8pt] \gamma_{\rm ISE}=\bigg(1-\dfrac{\lambda_{\rm ISE}\cdot n}{\sum\limits_{j=1}^n\lambda_{\rm ISE}}\bigg)\times 100\% \end{cases} \end{align} $$ (51) 式中实验次数$ n= $ 50。图 14给出了蒙特卡洛检验中的性能分布。可见PID性能分布点的离散程度较大,其分布范围约为$ \pm $9%。CLADRC的ISE指标和分布范围均略小于MPC。OBR-ADRC保持了较小的ISE值,并且性能分布点的范围在$ \pm $4% 以内,因此对复杂外部动态环境具有较强的鲁棒性。
4.3 不同路面条件下的测试
路面条件的改变会对UGV的行驶带来较大影响,例如路面坡度和摩擦因数的变化。仍采用PID、CLADRC、MPC与OBR-ADRC进行对比,期望的蛇形轨迹设置为
$$ \begin{align} \begin{cases} {x}^{\rm w}(t)=-2.5+2.2\cos (\omega_{\mathrm{ser}}t-0.1)\\ {y}^{\rm w}(t)=0.2+0.8\sin (2\omega_{\mathrm{ser}}t-0.1) \end{cases} \end{align} $$ (50) 其中车辆期望角速度为$ \omega_{\mathrm{ser}}= $ 0.2 rad/s,并设置存在较大初始跟踪误差。首先在路面条件相同情况下进行实验,图 12给出了UGV的轨迹跟踪结果。可见,本文方法在跟踪过程中的横向误差最小。
之后针对不同路面条件下的控制器性能进行了蒙特卡洛检验。实验中保持控制器参数等条件不变,在UGV部分运动路径上添加坡面路段,实验场景如图 13(a)所示。使用高度调节器改变路面坡度,使其在$ \pm $25% 的范围内变化。并选取不同粒度的轮胎附着材料以实现摩擦因数从0.3变化至0.7。
图 13(b)给出了不同坡度、不同摩擦力的路面条件下的实验场景,其中横向对应路面坡度变化,纵向对应不同粒度附着材料的动摩擦力因数,对4种控制器各进行了50次试验。图 13(c)给出了路面坡度为20%、摩擦因数为0.6时的轨迹跟踪实验结果。可以看出CLADRC与MPC控制器在转向时出现了小幅度的误差,PID出现了较大横向跟踪误差并持续振荡,OBR-ADRC做到快速且平稳地跟踪期望轨迹。
为了直观对比4种控制器的鲁棒性,分别计算每次实验相应的ISE指标$ \lambda_{\mathrm{ISE}} $与分布指标$ \gamma_{\mathrm{ISE}} $,计算方法为
$$ \begin{align} \begin{cases} \lambda_{\rm ISE}=\int_0^{t_{s}}(y_{\rm r}(t)-y(t))^{2}{\rm d}t\\[8pt] \gamma_{\rm ISE}=\bigg(1-\dfrac{\lambda_{\rm ISE}\cdot n}{\sum\limits_{j=1}^n\lambda_{\rm ISE}}\bigg)\times 100\% \end{cases} \end{align} $$ (51) 式中实验次数$ n= $ 50。图 14给出了蒙特卡洛检验中的性能分布。可见PID性能分布点的离散程度较大,其分布范围约为$ \pm $9%。CLADRC的ISE指标和分布范围均略小于MPC。OBR-ADRC保持了较小的ISE值,并且性能分布点的范围在$ \pm $4% 以内,因此对复杂外部动态环境具有较强的鲁棒性。
5. 结论(Conclusion)
复杂环境和车辆建模偏差影响了UGV横向控制的稳定性,为此,本文提出了基于观测偏差校正的ADRC控制策略。首先在初级ESO中设计偏差校正项并扩展相应的扰动观测阶次,从而提高对扰动初步观测的准确度。之后构造次级ESO,对总扰动的残余值进行观测,进一步提高扰动观测精度与收敛速度。根据级联ESO对总扰动的观测结果,设计了反馈线性化形式的控制律,并给出了参数整定方法。针对OBR-ADRC策略,进行了稳定性、总扰动的观测过程以及鲁棒性的理论分析。开展了多种情况下的UGV实验验证,证明所提策略具有较好的抗扰能力和跟踪精度。较动力学模型而言,运动学模型未能考虑车辆运动过程中的一些细节。为了较好执行高机动和低延迟等控制任务,未来工作中将重点考虑基于动力学和非线性控制的UGV轨迹跟踪策略设计。
5. 结论(Conclusion)
复杂环境和车辆建模偏差影响了UGV横向控制的稳定性,为此,本文提出了基于观测偏差校正的ADRC控制策略。首先在初级ESO中设计偏差校正项并扩展相应的扰动观测阶次,从而提高对扰动初步观测的准确度。之后构造次级ESO,对总扰动的残余值进行观测,进一步提高扰动观测精度与收敛速度。根据级联ESO对总扰动的观测结果,设计了反馈线性化形式的控制律,并给出了参数整定方法。针对OBR-ADRC策略,进行了稳定性、总扰动的观测过程以及鲁棒性的理论分析。开展了多种情况下的UGV实验验证,证明所提策略具有较好的抗扰能力和跟踪精度。较动力学模型而言,运动学模型未能考虑车辆运动过程中的一些细节。为了较好执行高机动和低延迟等控制任务,未来工作中将重点考虑基于动力学和非线性控制的UGV轨迹跟踪策略设计。
-
表 1 CLESO和OBR-ESO在不同扰动下的观测误差表达式
Table 1 Observation error expression of CLESO and OBR-ESO under different disturbances
$ f(t) $ CLESO OBR-ESO $ k $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t) $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t) $ $ kt $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)+3k\omega_{\rm o}^{-1} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t) $ $ kt^{2} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)-12k\omega_{\rm o}^{-2}+6k\omega_{\rm o}^{-1}t $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t)+18 k(1-m)\omega_{\rm o}^{-1} $ $ kt^{3} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)+60k\omega_{\rm o}^{-3} -36k\omega_{\rm o}^{-2}t+9k\omega_{\rm o}^{-1}t^{2} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t)-216k\omega_{\rm o}^{-3} -54k\omega_{\rm o}^{-2}t $ $ kt^{4} $ $ \begin{array}{l} {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)-360k\omega_{\rm o}^{-4} +240k\omega_{\rm o}^{-3}t-72k\omega_{\rm o}^{-2}t^{2} +12k\omega_{\rm o}^{-1}t^{3} \end{array} $ $ \begin{array}{l} {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t)+2304k\omega_{\rm o}^{-4} -864k\omega_{\rm o}^{-3}t+108k\omega_{\rm o}^{-2}t^{2} \end{array} $ $ k\sin \omega_{1}t $ $\begin{aligned} & \mathrm{e}^{-\omega_{\mathrm{o}} t} f_{\mathrm{e} 2}(t)+k\left(2 \omega_{\mathrm{o}}^6+6 \omega_{\mathrm{o}}^4+6 \omega_{\mathrm{o}}^2+2\right)^{-1} \times \\ & {\left[\left(6 \omega_{\mathrm{o}}^5-2 \omega_{\mathrm{o}}^3\right) \cos \omega_1 t+\left(12 \omega_{\mathrm{o}}^4+6 \omega_{\mathrm{o}}^2+2\right) \sin \omega_1 t\right]} \end{aligned}$ $\begin{aligned} & \mathrm{e}^{-\omega_{\mathrm{o}} t} f_{\mathrm{e} 5}(t)+k\left(120 \omega_{\mathrm{o}}^{12}+720 \omega_{\mathrm{o}}^{10}+1800 \omega_{\mathrm{o}}^8+2400 \omega_{\mathrm{o}}^6+\right. \\ & \left.1800 \omega_{\mathrm{o}}^4+720 \omega_{\mathrm{o}}^2+120\right)^{-1}\left[\left(4320 \omega_{\mathrm{o}}^9+720 \omega_{\mathrm{o}}^7-\right.\right. \\ & \left.240 \omega_{\mathrm{o}}^3\right) \cos \omega_1 t-\left(1080 \omega_{\mathrm{o}}^{10}-5040 \omega_{\mathrm{o}}^8-4200 \omega_{\mathrm{o}}^6-\right. \\ & \left.\left.2520 \omega_{\mathrm{o}}^4-720 \omega_{\mathrm{o}}^2-120\right) \sin \omega_1 t\right] \end{aligned}$ 表 1 CLESO和OBR-ESO在不同扰动下的观测误差表达式
Table 1 Observation error expression of CLESO and OBR-ESO under different disturbances
$ f(t) $ CLESO OBR-ESO $ k $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t) $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t) $ $ kt $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)+3k\omega_{\rm o}^{-1} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t) $ $ kt^{2} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)-12k\omega_{\rm o}^{-2}+6k\omega_{\rm o}^{-1}t $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t)+18 k(1-m)\omega_{\rm o}^{-1} $ $ kt^{3} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)+60k\omega_{\rm o}^{-3} -36k\omega_{\rm o}^{-2}t+9k\omega_{\rm o}^{-1}t^{2} $ $ {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t)-216k\omega_{\rm o}^{-3} -54k\omega_{\rm o}^{-2}t $ $ kt^{4} $ $ \begin{array}{l} {\rm e}^{-\omega_{\rm o}t}f_{\rm e2}(t)-360k\omega_{\rm o}^{-4} +240k\omega_{\rm o}^{-3}t-72k\omega_{\rm o}^{-2}t^{2} +12k\omega_{\rm o}^{-1}t^{3} \end{array} $ $ \begin{array}{l} {\rm e}^{-\omega_{\rm o}t}f_{\rm e5}(t)+2304k\omega_{\rm o}^{-4} -864k\omega_{\rm o}^{-3}t+108k\omega_{\rm o}^{-2}t^{2} \end{array} $ $ k\sin \omega_{1}t $ $\begin{aligned} & \mathrm{e}^{-\omega_{\mathrm{o}} t} f_{\mathrm{e} 2}(t)+k\left(2 \omega_{\mathrm{o}}^6+6 \omega_{\mathrm{o}}^4+6 \omega_{\mathrm{o}}^2+2\right)^{-1} \times \\ & {\left[\left(6 \omega_{\mathrm{o}}^5-2 \omega_{\mathrm{o}}^3\right) \cos \omega_1 t+\left(12 \omega_{\mathrm{o}}^4+6 \omega_{\mathrm{o}}^2+2\right) \sin \omega_1 t\right]} \end{aligned}$ $\begin{aligned} & \mathrm{e}^{-\omega_{\mathrm{o}} t} f_{\mathrm{e} 5}(t)+k\left(120 \omega_{\mathrm{o}}^{12}+720 \omega_{\mathrm{o}}^{10}+1800 \omega_{\mathrm{o}}^8+2400 \omega_{\mathrm{o}}^6+\right. \\ & \left.1800 \omega_{\mathrm{o}}^4+720 \omega_{\mathrm{o}}^2+120\right)^{-1}\left[\left(4320 \omega_{\mathrm{o}}^9+720 \omega_{\mathrm{o}}^7-\right.\right. \\ & \left.240 \omega_{\mathrm{o}}^3\right) \cos \omega_1 t-\left(1080 \omega_{\mathrm{o}}^{10}-5040 \omega_{\mathrm{o}}^8-4200 \omega_{\mathrm{o}}^6-\right. \\ & \left.\left.2520 \omega_{\mathrm{o}}^4-720 \omega_{\mathrm{o}}^2-120\right) \sin \omega_1 t\right] \end{aligned}$ 表 2 最大绝对跟踪误差与绝对误差积分结果
Table 2 Experimental results of dual lane change trajectory tracking Results of maximum absolute tracking error and IAE
控制器 $ e_{y\max} $/m IAE/(m$ \cdot $s) OBR-ADRC 0.076 0.318 CLADRC 0.106 0.675 MPC 0.084 0.571 PID 0.277 0.926 表 2 最大绝对跟踪误差与绝对误差积分结果
Table 2 Experimental results of dual lane change trajectory tracking Results of maximum absolute tracking error and IAE
控制器 $ e_{y\max} $/m IAE/(m$ \cdot $s) OBR-ADRC 0.076 0.318 CLADRC 0.106 0.675 MPC 0.084 0.571 PID 0.277 0.926 表 3 添加路面突变扰动前后的轨迹跟踪性能结果
Table 3 Trajectory tracking performance before and after adding road sudden disturbance
控制器 未添加扰动 添加外部扰动 $ e_{y\max} $/m $ t_{\rm s} $/s $ \Delta e_{y\max} $/m $ t_{\rm r} $/s OBR-ADRC 0.115 4.2 0.038 1.2 CLADRC 0.132 5.0 0.071 1.4 MPC 0.146 5.2 0.072 1.5 PID 0.303 5.3 0.099 1.7 表 3 添加路面突变扰动前后的轨迹跟踪性能结果
Table 3 Trajectory tracking performance before and after adding road sudden disturbance
控制器 未添加扰动 添加外部扰动 $ e_{y\max} $/m $ t_{\rm s} $/s $ \Delta e_{y\max} $/m $ t_{\rm r} $/s OBR-ADRC 0.115 4.2 0.038 1.2 CLADRC 0.132 5.0 0.071 1.4 MPC 0.146 5.2 0.072 1.5 PID 0.303 5.3 0.099 1.7 -
[1] KONG S H, JUN S Y. Cooperative positioning technique with decentralized malicious vehicle detection[J]. IEEE Transactions on Intelligent Transportation Systems, 2018, 19(3): 826-838. doi: 10.1109/TITS.2017.2705249
[2] 李月华, 朱世强, 于亦奇. 工厂环境下改进的视觉SLAM算法[J]. 机器人, 2019, 41(1): 95-103. doi: 10.13973/j.cnki.robot.180062 LI Y H, ZHU S Q, YU Y Q. Improved visual SLAM algorithm in factory environment[J]. Robot, 2019, 41(1): 95-103. doi: 10.13973/j.cnki.robot.180062
[3] NIU G C, WU L, GAO Y F, et al. Unmanned aerial vehicle (UAV)-assisted path planning for unmanned ground vehicles (UGVs) via disciplined convex-concave programming[J]. IEEE Transactions on Vehicular Technology, 2022, 71(7): 6996-7007. doi: 10.1109/TVT.2022.3168574
[4] 陈果, 何代钰, 欧阳博, 等. 基于链状结构保持的多AGV系统灵活高效死锁避免控制策略[J]. 机器人, 2023, 45(5): 591-602. doi: 10.13973/j.cnki.robot.220352 CHEN G, HE D Y, OUYANG B, et al. Flexible and efficient deadlock avoidance control strategy for multi-AGV systems based on chain structure preservation[J]. Robot, 2023, 45(5): 591-602. doi: 10.13973/j.cnki.robot.220352
[5] WANG H Y, ZUO Z Q, WANG Y J, et al. Composite nonlinear extended state observer and its application to unmanned ground vehicles[J]. Control Engineering Practice, 2021, 109. doi: 10.1016/j.conengprac.2021.104731
[6] 李宝全, 方勇纯, 张雪波. 基于2D三焦点张量的移动机器人视觉伺服镇定控制[J]. 自动化学报, 2014, 40(12): 2706-2715. doi: 10.3724/SP.J.1004.2014.02706 LI B Q, FANG Y C, ZHANG X B. 2D trifocal tensor based visual servo regulation of nonholonomic mobile robots[J]. Acta Automatica Sinica, 2014, 40(12): 2706-2715. doi: 10.3724/SP.J.1004.2014.02706
[7] 董星亮, 苑晶, 张雪波, 等. 室内环境下基于图像序列拓扑关系的移动机器人全局定位[J]. 机器人, 2019, 41(1): 83-94, 103. doi: 10.13973/j.cnki.robot.180100 DONG X L, YUAN J, ZHANG X B, et al. Mobile robot global localization based on topological relationship between image sequences in indoor environments[J]. Robot, 2019, 41(1): 83-94, 103. doi: 10.13973/j.cnki.robot.180100
[8] ORAL T, POLAT F. MOD* lite: An incremental path planning algorithm taking care of multiple objectives[J]. IEEE Transactions on Cybernetics, 2016, 46(1): 245-257. doi: 10.1109/TCYB.2015.2399616
[9] LIANG Z C, SHEN M Y, ZHAO J, et al. Adaptive sliding mode fault tolerant control for autonomous vehicle with unknown actuator parameters and saturated tire force based on the center of percussion[J]. IEEE Transactions on Intelligent Transportation Systems, 2023, 24(11): 11595-11606. doi: 10.1109/TITS.2023.3289439
[10] ZHANG Y X, GUO L L, GAO B Z, et al. Deterministic promotion reinforcement learning applied to longitudinal velocity control for automated vehicles[J]. IEEE Transactions on Vehicular Technology, 2020, 69(1): 338-348. doi: 10.1109/TVT.2019.2955959
[11] MATA S, ZUBIZARRETA A, PINTO C. Robust tube-based model predictive control for lateral path tracking[J]. IEEE Transactions on Intelligent Vehicles, 2019, 4(4): 569-577. doi: 10.1109/TIV.2019.2938102
[12] HUANG Y W, YONG S Z, CHEN Y. Stability control of autonomous ground vehicles using control-dependent barrier functions[J]. IEEE Transactions on Intelligent Vehicles, 2021, 6(4): 699-710. doi: 10.1109/TIV.2021.3058064
[13] SHEN Q K, SHI P, ZHU J W, et al. Neural networks-based distributed adaptive control of nonlinear multiagent systems[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020, 31(3): 1010-1021. doi: 10.1109/TNNLS.2019.2915376
[14] XU S B, PENG H. Design, analysis, and experiments of preview path tracking control for autonomous vehicles[J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(1): 48-58. doi: 10.1109/TITS.2019.2892926
[15] LI W, TODOROV E. Iterative linear quadratic regulator design for non-linear biological movement systems[C]//1st International Conference on Informatics in Control, Automation and Robotics. Setubal, Portugal: SciTePress, 2004: 222-229. doi: 10.5220/0001143902220229
[16] CHEN J Y, ZHAN W, TOMIZUKA M. Autonomous driving motion planning with constrained iterative LQR[J]. IEEE Transactions on Intelligent Vehicles, 2019, 4(2): 244-254. doi: 10.1109/TIV.2019.2904385
[17] 周博文, 张海峰, 李秦川. 2R1T并联机器人滑模自适应迭代学习控制[J]. 机器人, 2024, 46(3): 317-329. doi: 10.13973/j.cnki.robot.230283 ZHOU B W, ZHANG H F, LI Q C. Adaptive sliding-mode iterative learning control for 2R1T parallel robots[J]. Robot, 2024, 46(3): 317-329. doi: 10.13973/j.cnki.robot.230283
[18] CUI R X, ZHANG X, CUI D. Adaptive sliding-mode attitude control for autonomous underwater vehicles with input nonlinearities[J]. Ocean Engineering, 2016, 123: 45-54. doi: 10.1016/j.oceaneng.2016.06.041
[19] VAN M, GE S S, REN H L. Finite time fault tolerant control for robot manipulators using time delay estimation and continuous nonsingular fast terminal sliding mode control[J]. IEEE Transactions on Cybernetics, 2017, 47(7): 1681-1693. doi: 10.1109/TCYB.2016.2555307
[20] SAIED H, CHEMORI A, BOURI M, et al. Feedforward super-twisting sliding mode control for robotic manipulators: Application to PKMs[J]. IEEE Transactions on Robotics, 2023, 39(4): 3167-3184. doi: 10.1109/TRO.2023.3255586
[21] 刘跃跃, 王浩羽, 张加易, 等. 磁性微型机器人神经自适应轨迹跟踪控制[J]. 机器人, 2023, 45(6): 683-690. doi: 10.13973/j.cnki.robot.230144 LIU Y Y, WANG H Y, ZHANG J Y, et al. Neural adaptive trajectory tracking control for a magnetic microrobot[J]. Robot, 2023, 45(6): 683-690. doi: 10.13973/j.cnki.robot.230144
[22] HU J Q, ZHANG Y M, RAKHEJA S. Adaptive trajectory tracking for car-like vehicles with input constraints[J]. IEEE Transactions on Industrial Electronics, 2022, 69(3): 2801-2810. doi: 10.1109/TIE.2021.3068672
[23] LIAO J F, CHEN Z, YAO B. Model-based coordinated control of four-wheel independently driven skid steer mobile robot with wheel-ground interaction and wheel dynamics[J]. IEEE Transactions on Industrial Informatics, 2018, 15(3): 1742-1752. doi: 10.1109/TII.2018.2869573
[24] CHEN L, LI Y C, HUANG C, et al. Milestones in autonomous driving and intelligent vehicles — Part Ⅰ: Control, computing system design, communication, HD map, testing, and human behaviors[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems. 2023, 53(9): 5831-5847. doi: 10.1109/TSMC.2023.3276218
[25] SUN J K, LIU X Y, YANG J, et al. Predictor-based extended state observer for disturbance rejection control of multirate systems with measurement delay[J]. IEEE Transactions on Industrial Electronics, 2022, 70(3): 3003-3012. doi: 10.1109/TIE.2022.3172756
[26] WANG H Y, ZUO Z Q, XUE W C, et al. Switching longitudinal and lateral semi-decoupled active disturbance rejection control for unmanned ground vehicles[J]. IEEE Transactions on Industrial Electronics, 2024, 71(3): 3034-3043. doi: 10.1109/TIE.2023.3265048
[27] XIA Y Q, PU F, LI S F, et al. Lateral path tracking control of autonomous land vehicle based on ADRC and differential flatness[J]. IEEE Transactions on Industrial Electronics, 2016, 63(5): 3091-3099. doi: 10.1109/TIE.2016.2531021
[28] WU Y, WANG L F, ZHANG J Z, et al. Path following control of autonomous ground vehicle based on nonsingular terminal sliding mode and active disturbance rejection control[J]. IEEE Transactions on Vehicular Technology, 2019, 68(7): 6379-6390. doi: 10.1109/TVT.2019.2916982
[29] WANG H Y, ZUO Z Q, WANG Y J, et al. Estimator-based turning control for unmanned ground vehicles: An anti-peak extended state observer approach[J]. IEEE Transactions on Vehicular Technology, 2022, 71(12): 12489-12498. doi: 10.1109/TVT.2022.3195637
[30] SARIYILDIZ E, OBOE R, OHNISHI K. Disturbance observer-based robust control and its applications: 35th anniversary overview[J]. IEEE Transactions on Industrial Electronics, 2020, 67(3): 2042-2053. doi: 10.1109/TIE.2019.2903752
[31] WANG H Y, ZUO Z Q, WANG Y J, et al. Composite nonlinear path-following control for unmanned ground vehicles with anti-windup ESO[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2022, 52(9): 5865-5876. doi: 10.1109/TSMC.2021.3130981
[32] CHU D F, LI H R, ZHAO C Y, et al. Trajectory tracking of autonomous vehicle based on model predictive control with PID feedback[J]. IEEE Transactions on Intelligent Transportation Systems, 2023, 24(2): 2239-2250. doi: 10.1109/TITS.2022.3150365