自动化学报
ACTA AUTOMATICA SINICA
1997年　第23卷　第6期　Vol.23　No.6　1997




基于知识的线状目标的综合理解
沈丽琴　胡栋梁　戚飞虎
　　关键词　线状目标(LFO)，边缘提取，目标中心(OC)，目标中心链(OCC).
KNOWLEDGE-BASED INTEGRATED UNDERSTANDING OF THE
LINE-FEATURED OBJECTS
SHEN LIQIN　　HU DONGLANG　　QI FEIHU
(Institute of Optical Fiber Technology of Shanghai Jiaotong University,Shanghai 200052)
Key words　Line-featured object,edge detection,object center,object center chain.
1　引言
　　近年来，航空图像中LFO(Line-Featured Object)的综合理解得到了广泛的重视和研究，但每一系统都有其各自的缺点和局限性［1］.一般把LFO定义为空间上连续的、几何上光滑的长条状人造目标；OC(Object Center)的灰度为大致均匀或缓慢变化的；目标的边缘特征为局部对应平行的.基于对其形状特征和灰度特征的这些知识，结合主动视觉(active vision)的面向任务和对象的视觉思想，文中构筑了一个对 LFO 进行综合理解的系统.
2　线状目标的识别及定位
　　航空图像一般噪声较大且背景复杂，因此 LFO 的分割是问题的难点.用 Sobel 算子提取边缘，具有抗噪能力强且可方便地获得边缘梯度方向.根据 LFO 几何光滑的特性，保留那些沿边缘梯度方向边缘值为局部最大，沿边缘方向邻域点的边缘梯度方向值相近的点为边缘点，并用区域增长的思想消除其中的孤立和小段的噪声，最后对保留下来的边缘点进行边缘值的直方图统计.此时的直方图有较好的双峰特性，取谷底为门限，对保留下来的边缘点进行边缘值的二值化，得到边缘提取的结果.
　　LFO 的特征用 OCC(Object Center Chain)表达.对边缘图分别进行垂直和水平方向的扫描，在两个近似平行的边缘点的中心形成OC，图像的分辨率决定了这两个边缘点的距离上限.接着按一定的跟踪算法将离散的OC 形成 OCC 以表达目标的轨迹.对水平扫描意义下的OC进行垂直向下的跟踪，每次向下步长为1.由于航空图像中的 LFO 都有较好的局部线性，因此在已获得部分 OC 的基础上，可以用线性预测的方法简便地得到下一个OC最有可能存在的位置(xp,yp).从(xp,yp)开始向两边搜索，跟踪可以更快速有效地进行.而在与当前 OC 相距为 step 的扫描线上，下一个OC 的搜索范围为(xp+step,yp-step)―(xp+step,yp+step)(设垂直向下为X轴)，搜索的最大允许步长为 maxstep.
　　算法严禁穿越边界的跟踪；另外与目标平均宽度相比，新搜索到的OC 所对应的目标宽度也有一个宽度变化的允许比例.这样，一个链必定代表了同一目标.可以看出，算法允许 OC 有一定的不连续(最大允许值为 maxstep),其设计成功而简单地解决了由于边缘提取不连续带来的识别难题.
　　跟踪得到的OCC是否代表了目标轨迹，还需要进一步地确认.首先OCC的长度必须有一个下限LMIN，少数几个点组成的OCC显然不能代表长条状的LFO；另外，OCC中OC的个数必须占OCC总长的一定比例，这是 LFO 空间连续性所要求的.至此，LFO 的初步识别和中心轨迹定位已完成.
3　LFO 的进一步识别及其空间连接关系的理解
　　如果目标上存在障碍物、遮合或桥梁，则在边缘提取时会产生截断同一目标的边缘或目标边缘的畸变，从而导致一个目标被几段 OCC 表达的误识别.但此时这几段 OCC 的某些特征参数必定在多种意义上有很强的相关性.以这些参数为变量定义一个基于模糊集理论的能反映这些相关性的函数，称之为两链属于同一目标的置信函数.该函数包含对以下三个方面的要求：(1)两链灰度和宽度一致性；(2)两链相连后的目标连续性，即两链首尾连处的距离必须在允许范围内，且新链中OC 的个数必须占其总长的一定比例；(3)两链几何光滑性.这一函数的定义有多种方式，相应的门限选择是问题的关键.用训练神经网络的方法获取之，效果很好.两链相连，中间形成一个连接区.
　　航空图像中不同目标间的空间连接有多种形式，如交叉、跨越(如桥梁)等，对这些连接的理解是很重要的.
　　1)交叉关系.若 Chaini,Chainj,∈OCC;Cυ∈Chaini 且 Cυ∈Chainj，但 CυOC,则 Chaini 与 Chainj 在 Cυ 点存在交叉关系.
　　2)跨越关系.跨越关系总是伴随着截断目标的边缘而存在，因此跨越关系必定存在于连接区内.对跨越关系的理解就是在连接区内搜索近似垂直于连接区的两条边缘的过程.
4　实验结果和结论
　　关于 LFO 的知识在系统中表现为一些绝对和相对的限制条件，在不同的处理层次控制图像理解的进行.限制条件中有些门限的取值可用离线训练神经网络(训练样本为多幅图中的 LFO)的方法获取，有的取决于图像的性质或对参数合理性的分析.用由此得到的一组参数对多幅图进行理解，在噪声较大背景复杂的情况下均有很满意的结果，见图1所示.算法的复杂性与初始识别出的OCC 个数成正比.在以i860为高速微处理器的PC机上，理解一幅512×512的航空图像一般需要 2.5―3.5秒的时间.
　　　　　　
(a)　　　　　　　(b)　　　　　　　　　　(c)　　　　　　(d)　　
(a)原始图像，(b)边缘图，
(c)初步识别结果(当背景灰度大于128时，目标轨迹用黑线表示，反之用白线表示.)
(d)综合理解结果(图中深色和浅色的区域块为连接区标记，横跨连接区的线条为桥梁.)
图1
1)　国家攀登计划认知科学重大关键项目及国家自然科学基金资助课题.
作者单位：上海交通大学计算机科学与工程系　上海　200030
参考文献
［1］　Zlotnick A,Carnine P D.Finding road seeds in aerial images.CVGIP:Image Understanding,1993,57:243-260.
收稿日期　1994-09-28
