微型机与应用
WEIXINGJI YU YINGYONG
2000　Vol.19　No.5　P.40-41




邮政图像的预处理
李源陈淑珍
摘要：为实现邮局给据函件的自动抄登及自动化管理，提出了“给据函件投递原迹登单系统”，着重讨论了函件图像的预处理问题。
关键词：给据函件 函件图像 彩色模型 模板
　　邮政是重要的社会基础设施，是大众的信息命脉之一，实现邮政管理信息化和自动化是当务之急。目前我国大多数邮局的业务处理和数据管理还停留在手工水平上，这大大制约了邮件处理的水平和效率。为改善目前邮局人工抄登给据函件，人工管理抄登数据的现状，本项目组开发了“给据函件投递原迹登单系统”。
1 开发背景
　　邮政处理中，每一个邮局都需要处理给据函件。给据函件指挂号信件、邮包、保价函件等在收寄时出具收据、处理时进行登记、投递时要求收件人签收的函件。给据函件的管理较平常函件更严格，操作流程更复杂，责任更重大。给据函件的投递包括以下几个步骤：首先核对需要投递的给据函件的数目是否正确，然后按区域抄登每一封给据函件，抄登过程中需要抄登函件的号码、函件的收寄局、函件的收件人地址和姓名，抄登完毕后将抄登的登单交给投递员进行投递。
　　给据函件的投递部分要解决函件的地址、姓名、条码的抄写问题，这个问题用单片机开发是难以解决的（代码的复杂性和速度都达不到），用微机开发也要解决复杂的图像处理和图像理解问题。现有的系统都没有解决这个问题，它们要么将这个部分空了出来，要么就要求操作员用汉字录入的方式录入地址、姓名、条码，但汉字录入比较慢、容易出错，所以现有系统在给据函件的投递处理上是一个空白。本系统正是针对目前给据函件投递登单需要人工抄登函件的地址、姓名、条码以及查询十分不方便的情况，综合运用图像处理的方法实现给据函件的抄登的自动化处理，提高了登记处理的速度和正确率，极大地改善了人工抄登、人工管理抄登数据的现状。
　　本系统采用彩色摄像机和视频捕获卡作为图像的输入设备，从价格因素考虑，本系统只能采用一般分辨率的摄像机作为图像输入设备，这样会导致图像降质严重，所以本系统需对函件图像进行预处理去除邮编区域对后继图像处理的影响。
2 函件图像中邮政编码的去除
　　挂快函件图像中，邮政编码区域的位置在人眼看来，都呈现红色，我们可以利用这个特征将这些区域辨识并去除。处理步骤如下：
　　（1）RGB到HSV模型的转换
　　用计算机来处理彩色信息，必须能够用定量的方法来描述彩色信息，即建立彩色模型。根据不同的应用场合和侧重角度，可将彩色模型大体分为3类：色度学彩色模型、工业彩色模型、视觉彩色模型。一般来说，色度学彩色模型，如XYZ，UCS彩色模型，偏重于纯理论和计算方面，因而有时称为计算模型。而工业彩色模型，如RGB，CMY，YIQ彩色模型，主要用于电视传输及彩色重现等实际应用场合，侧重于用实际的方法来复现彩色的可行性。而视觉彩色模型，如HSI，HLS，HSV彩色模型，则侧重于用与人的视觉相吻合的亮度、色调和饱和度来描述色彩信息。不同的彩色模型适用于不同的应用场合，这些模型都可以通过数学方法来相互转换。我们采用24位真彩格式将彩色摄像机的输入信号转换为数字信号，这样较易得到图像中每个像素的RGB分量，每个分量占用1个字节。但采用RGB彩色模型不易于将图像中的色彩区分，如由于信封背景色的影响和信封规格的不同，对于不同信封图像上的邮政编码边框，经常呈现橘红、深红等深浅不同的颜色，其RGB分量差别也比效大，且对于黄色信封而言，邮政编码边框的RGB分量与背景的RGB分量十分接近，采用RGB彩色模型，很难直接检测出邮政编码区域。
　　分析原因，RGB彩色模型是从硬件的角度提出的，并不能很好地与人眼的视觉特性相匹配。人眼的色彩知觉主要包括3个要素，即色调、饱和度和亮度。在本应用中，我们用计算机模拟人眼对信封图像进行一定程度的分割与识别，采用视觉彩色模型比较合适。我们选用HSV（Hue，saturation，value）彩色模型，这是一个6棱椎模型，如图1所示。具体的转换关系可参阅文献［1］。

图1 HSV模型示意图
　　将图像数据从RGB空间转化到HSV空间，色调分量H作为1个独立通道信号被提取出来，不再受与色调信号无关分量（如光照强度）的影响。具体检测中，H分量在1个固定的范围内，即0＜H＜32，我们可利用这个特征将邮政编码区域检测出来。
　　（2）在H空间运用模板增强图像
　　模板在图像处理中发挥着灵活多样的作用。随着选择的模板不同，可实现图像去噪、边缘检测、模板匹配、图像增强等多种功能。其中，如何根据实际应用场合选择合适的模板，就成了模板应用的关键。
　　在本系统中，为检测出邮政编码红色边框，需在H参数空间中确定1个阈值，这里我们选定阈值为32，如果H值小于等于32，我们则认为该点色调属于红色区，而对于H值大于32的点，我们则不予考虑，对于图3中的原始信封图像，在末经过模板处理之前，在H空间中以32为阈值，经过二值化后的图像如图4所示。由于字迹中经常含有红色成分，使字迹与邮政编码边框混淆。考虑到邮政编码边框具有水平或垂直的特征，我们构造了如图2所示的归一化模板，此模板将对图像色调在水平和垂直方向上予以增强。

图2 归一化模板
　　（3）连通域分析
　　对于在H空间以32为阈值进行二值化后的图像数据，为进一步将邮政编码边框和单位地址从杂散红色信号中分离，我们采用连通域分析方法。一般来说，邮政编码边框和单位地址对应于区域较大的连通域。邻域采用四连通邻域，即和（x，y）相邻的像素为（x＋1，y）、（x－1，y）、（x，y＋1）和（x，y－1），如果1个像素和它的邻域的灰度相同，则认为它们是属于同一连通区域，而被聚合到1个连通域中，反之则认为是属于另1个区域。将这种聚合过程反复迭代进行，直到图像中的每1个像素都被遍历为止。
　　以这种方法，我们遍历整幅图像，将其分为各个不同的连通域，并标以不同的标号。根据各个连通域的大小、区域范围、前景点的个数的统计，我们可以判别出图像中有无邮政编码及邮政编码的具体位置。一旦发现邮政编码边框和单位地址，我们就将这个区域范围（Mind＜x＜MaxX，Miny＜y＜MaxY）内的图像从原图像中切除，排除了其对后续处理的影响。
3 邮政函件图像处理中的应用
　　以下为上述处理方法在一封函件图像运用的具体示例。原始文件图像如图3。

图3 原始信封图像
　　模板处理后的信封版面如图4。

图4 模板处理后的信封版面
　　去除邮政编码区域和右下角单位地址区域后的信封版面如图5。

图5 去除邮政编码和右下角地址后的信封版面
　　本系统作为面向邮政局日常工作业务的实用邮政给据函件处理系统，己在一些中小邮局试行使用，函件图像预处理效果和速度令人满意。
李源（武汉大学电信学院430072）
陈淑珍（武汉大学电信学院430072）
参考文献
［1］Robinson G．Color edge detection．Opt．Eng．，1997；（16）
［2］Shiozak A．Edge extraction using entropy operator． Computer Vision，Graphics and Image Processing，1986
［3］陈武凡，鲁贤庆．彩色图像边缘检测的新算法-广义模糊 算子法．中国科学，1995；（2）
收稿日期：1999－11－20
