概述
整个暑假都在做Tracking,其中最为重要的核心就是均值漂移了,均值漂移算法指的是一个迭代的步骤,即先算出当前点的漂移均值,移动该点到其漂移均值,然后以此为新的起始点,继续移动,知道满足一定条件结束。所以,均值漂移实际上是一种在一种数据的密度分布中寻找局部极值的稳定的方法。如果分布连续,那么处理则变得非常容易,在这种情况下本质上只需要对数据的密度直方图应用爬山算法。更加准确的说,均值漂移是与核密度估计的规则有关的算法。而所谓“核”,实际上是一个如同高斯分布的局部函数。如果在充足的点处拥有足够合适的带权重和尺度的核,数据的分布则可以完全根据这些核来表示。然而又与核密度的估计不同,均值漂移仅仅估计数据分布的梯度。如果变化为0的地方则表示是这个分布的峰值(当然,也有可能是局部的)。当然在附近或其他尺度上还是有可能有峰值的。
定义
给定d维空间Rd中n个样本点xi,i=1,2,…,n,n在x点的均值漂移向量的基本形式定义为:
Mh(x)=1k∑xi∈Sk(xi−x)
目标模型
均值漂移采用的是特征值的加权概率分布来描述目标模型,属于模式识别中主要描述目标的模型,不同于自动控制理论中采用的状态方程。 目标模型一共具有m个特征值(可以理解为像素的灰度值),于是对于序列q=qn,而u∈1,…,m有
q(u)=Cn∑i=1k(‖Xi−X0H‖2)
其中,X0为窗口中心点向量值(可能为RGB向量或者灰度值),Xi是窗口内第i点向量值。C为归一化常数,保障∑mi=1qi=1 ,H为核函数的带宽向量。M为特征值的个数,对于图像处理可以理解为灰度等级划分的个数,从而特征值u为对应的灰度等级。 δ函数为脉冲函数,保证只具有u特征值的像素才对概率分布作出贡献。从而k函数可以理解为u灰度值的一个加权频数。
匹配对象
同样采用的是特征值加权概率分布:
Pu(Y)=Chnk∑i=1k(‖Xi−YHh‖2)δ(b(Xi)−u)
其中i∈[1,…,nh],Y为匹配对象的中心, Xi是匹配窗口内第i点向量值。 Hh为匹配窗口的核函数带宽向量,Ch为匹配窗口特征向量的归一化常数。
匹配相似
匹配对象与目标模型的相似程度,相似函数采用的是Bhattacharyya函数
ρ(p(Y),q)=m∑u=1√Pu(Y)qu
匹配过程
均值漂移采用梯度下降法,首先ρ(Y)
ρ(Y)≈ρ(Y0)+dρdp(p(Y)−p(Y0))
定义
ρu(Y)=√pu(Y)qu
从而
ρu(Y)=ρu(Y0)+qu2√pu(Y0)qu(pu(Y)−pu(Y0))
即
ρu(Y)=12ρu(Y0)+12√pu(Y)qupu(Y0)
因此
ρ(Y)=12(m∑u=1√pu(Y0)qu+m∑u=1(pu(Y0)√qupu(Y0)))
要使得ρ(Y)向最大值迭代,只要Y的搜索方向与梯度方向一致即可,通过求导得到Y0的梯度方向为:
∇ρ(Y0)=ChH2h[nk∑i=1wig(‖Y0−XiHh‖2)][∑nki=1Xiwig(‖Y0−XiHh‖2)∑nki=1wig(‖Y0−XiHh‖2)−Y0]
其中,
wi=∑u=1m√qupu(Y0)δ(b(Xi)−u)
为权值。设
Y1=∑nki=1Xiwig(‖Y0−XiHh‖2)∑nki=1wig(‖Y0−XiHh‖2)
因此如果如下确定Y1,那么Y1−Y0(此即为均值漂移向量)将于梯度方向一致。
总结
均值漂移跟踪算法的思路很清晰,我们从一个核
K(X−Xi)=ck(‖X−XiH‖2)
和一个近似概率分布
P(x)=1nn∑i=1K(x−xi)
出发,重点关心P(x)的梯度
∇P(x)=1n∇K(x−xi)
令g(x)=−k′(x),并得出了这样的式子:
∇P(x)=cn[n∑i=1gi(‖x−xiH‖2)][∑ni=1xigi(‖x−xiH‖2)∑ni=1gi(‖x−xiH‖2)−x]
对于x向量通过上面的公式得到新的向量为
[∑ni=1xigi(‖x−xiH‖2)∑ni=1gi(‖x−xiH‖2)−x]
而H则是对于以x为心的半径。 矩形核并不随着到中心的距离下降,而是一个突然变成零的突然转换。这个与高斯核的指数衰减不同,与Epanechnikov核的随着到中心的距离的开放衰减也不同。我们用自然语言来描述整个过程:
- 选择搜索域(包括域的初始位置,域的类型[均匀、多项式、指数或者高斯类型],域的形状,域的大小)。
- 计算域(可能是带权重的)的重心。
- 将域的重心设置在计算出的重心处。
- 返回(2),直到域的位置不再变化(通常会,迭代过程由最大迭代次数或者两次迭代中心变化的程度进行限制。虽然如此,迭代过程最后还是会收敛。)
实现
|
|