分类于: Robotics
关键词: 概率机器人

静态二值贝叶斯滤波

机器人技术中的某些问题表达为不随时间变化的二值状态的最优估计间题。如果一个机器人从传感器测量的序列中估计环境的一个固定的二值数,此时这类问题就产生了。例如,一个机器人可能想知道门是开着的还是关着的,并认为在检测期间门的状态不改变。

当状态静止时,置信度就仅是测量的函数:

$$ bel_i(x) =p(x|z_{1:t}, u_{1:t})= p(x|z_{1:t}) $$

这里状态有两个可能值,用 $x$$\bar{x}$ 表示。具体来说,有 $bel_i(\bar{x}) = 1 - bel_i(x)$ 。状态 $x$ 不含时间项反映了状态不会改变的事实。

置信度通常由一个概率比的对数(log odds ratio)来实现。状态 $x$ 的概率(odds)定义为此事件的概率除以该事件不发生的概率:

$$ \frac{p(x)}{p(\bar{x})} = \frac{p(x)}{1-p(x)} $$

概率对数就是这个表达式的对数:

$$ l(x):=log\frac{p(x)}{1-p(x)} $$

概率对数假设值为 $-\infty \sim \infty$ 。用于更新以概率对数表示的置信度的贝叶斯滤波计算很简洁。它避免了概率接近0或1引起的截断间题。

下面给出了基本的更新算法。该二值贝叶斯滤波利用一个反向测最模型 (inverse measurement model) $p(x|z_t)$ 代替熟悉的前向模型 $p(z_t|x)$ 。反向测量模型将关于(二值)状态变量的一个分布指定为测量 $z_t$ 的一个函数。

$$ l_t = l_{t-1} + log\frac{p(x|z_t)}{1-p(x|z_t)} - log\frac{p(x)}{1-p(x)} $$

反向模型经常用于测凰比二值状态更复杂的情况。换旬话说,实现一个反向传感器模型比前向传感器模型更容易。

置信度 $bel_i(x)$ 可以根据概率比对数 $l_t$ 通过下面的方程来求得:

$$ bel_i(x) = 1- \frac{1}{1+exp{ l_t }} $$

$$ l_0(x) = log \frac{p(x)}{1-p(x)} $$