<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>heyulong | Robots and Motion Control Algorithms</title><link>https://ck-heyulong.github.io/</link><description>Recent content on heyulong | Robots and Motion Control Algorithms</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sun, 12 Apr 2026 12:00:00 +0800</lastBuildDate><atom:link href="https://ck-heyulong.github.io/index.xml" rel="self" type="application/rss+xml"/><item><title>基于 TD3 强化学习的康复机械臂变阻抗控制</title><link>https://ck-heyulong.github.io/posts/burt-robot/</link><pubDate>Sun, 12 Apr 2026 12:00:00 +0800</pubDate><guid>https://ck-heyulong.github.io/posts/burt-robot/</guid><description>&lt;p&gt;仿真到实机的 Sim-to-Real 是机器人控制的难题。本文目的是复盘如何从零推导底层物理模型，打通实机控制闭环，并最终将 RL 智能体部署到真机上的全过程。&lt;/p&gt;
&lt;h3 id="1-动力学重力前馈"&gt;1. 动力学重力前馈&lt;/h3&gt;
&lt;p&gt;纯 PID 控制在面对随姿态非线性变化的重力矩时，极易产生稳态误差与迟滞。基于 RNE（递归牛顿-欧拉）算法建立了动力学模型，并将计算出的重力项直接作为前馈量引入底层控制器。复合控制律由 &lt;strong&gt;重力项 G(q)&lt;/strong&gt;、&lt;strong&gt;比例项 Kp*e(t)&lt;/strong&gt;、&lt;em&gt;&lt;em&gt;积分项 Ki&lt;/em&gt;∫e(τ)dτ&lt;/em&gt;* 以及 &lt;strong&gt;微分项 Kd*ė(t)&lt;/strong&gt; 共同组成。&lt;/p&gt;
&lt;p&gt;在此架构下，PID 控制器仅需处理动态误差与摩擦力扰动。&lt;/p&gt;
&lt;figure class="align-center "&gt;
&lt;img loading="lazy" src="https://ck-heyulong.github.io/images/fig2-1.png#center"/&gt; &lt;figcaption&gt;
图 1 关节轨迹跟踪与误差分析
&lt;/figcaption&gt;
&lt;/figure&gt;
&lt;!-- raw HTML omitted --&gt;
&lt;h3 id="2-3d-笛卡尔空间控制"&gt;2. 3D 笛卡尔空间控制&lt;/h3&gt;
&lt;p&gt;在执行推拉、画圆等被动康复训练时，笛卡尔空间的轨迹跟踪极易受到多轴耦合的干扰。&lt;/p&gt;
&lt;p&gt;基于 DH 参数的正逆运动学解析解，结合时间序列索引与线性插值，保障了系统底层的绝对实时性。从空间映射数据来看，Z 轴执行大范围运动时，非运动方向（X/Y轴）的交叉耦合微波振荡被有效抑制。&lt;/p&gt;
&lt;figure class="align-center "&gt;
&lt;img loading="lazy" src="https://ck-heyulong.github.io/images/fig2-3.png#center"/&gt; &lt;figcaption&gt;
图 2 空间解耦分析
&lt;/figcaption&gt;
&lt;/figure&gt;
&lt;!-- raw HTML omitted --&gt;
&lt;h3 id="3-sensorless-外力观测与二阶导纳模型"&gt;3. Sensorless 外力观测与二阶导纳模型&lt;/h3&gt;
&lt;p&gt;人机物理交互（pHRI）的核心在于感知与顺应。系统通过电机扭矩反馈与雅可比矩阵 &lt;strong&gt;J(q)&lt;/strong&gt; 实时反向解算末端交互外力 &lt;strong&gt;F_ext&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;在此基础上，系统部署了经典的二阶导纳控制（Admittance Control）模型，通过建立 &lt;strong&gt;惯性 M&lt;/strong&gt;、&lt;strong&gt;阻尼 D&lt;/strong&gt; 与 &lt;strong&gt;刚度 K&lt;/strong&gt; 的动力学平衡，使系统对外部作用力产生位置退让。通过实机单变量特性分析实验，我将系统精准整定至最优临界阻尼状态，有效消除了欠阻尼参数下易引发的弹簧震荡感。&lt;/p&gt;
&lt;figure class="align-center "&gt;
&lt;img loading="lazy" src="https://ck-heyulong.github.io/images/fig3-2.png#center"/&gt; &lt;figcaption&gt;
图 3 阻尼特性对比
&lt;/figcaption&gt;
&lt;/figure&gt;
&lt;!-- raw HTML omitted --&gt;
&lt;h3 id="4-td3-强化学习部署"&gt;4. TD3 强化学习部署&lt;/h3&gt;
&lt;p&gt;传统恒定刚度控制面临着本质的两难困境：设定偏硬（如 400 N/m）会在患者痉挛时导致二次拉伤；设定过软（如 100 N/m）则完全丧失轨迹强制引导的能力。&lt;/p&gt;</description></item></channel></rss>