数据分析与知识发现
    主页 > 期刊导读 >

基于的热成像图片数字识别分析系统

前言

石油开采行业从原油开采、脱水处理到达标原油输出,各个环节都具有较大火灾危险性,因此有必要采取有效的组织措施和技术措施来防止电气设备因发热而引发的火灾。红外热成像仪是海上平台使用较为广泛的一种温度检测仪器,该仪器采集设备表面发出的红外辐射信息,通过内部处理单元作进一步分析,获取到设备各点温度,最终以图像形式输出。它具有不接触、实时、快速、直观、方便进行计算机分析等优点,为诊断电气设备运行状态,判断电气设备故障具体部位提供了全面而准确的温度场分布图像,帮助电气人员及时发现隐患并将其消灭在萌芽阶段。

1 技术简介

1.1 图形预处理

图1 某变压器设备热成像采集图像

如图一所示,为该平台某变压器热成像采集图像,以该图为例,需要采集温度数据为最高点温度109.5℃,最低点温度45.3℃,中心点温度64.1 度。由于数字所在区域背景存在的差异可能造成字形畸变,同时图像数据输入matlab 过程中也会产生噪声,因此为了提高数据识别的可靠性和准确性,在进行数据识别过程前,需要对热成像采集图像进行预处理。

1.1.1 二值化

Matlab 图像处理工具箱支持索引图像、灰度图像、二进制图像和RGB 图像四种基本图像类型,通过imread 直接读入的jpg 格式图像为RGB 图像,以三维数组的形式存储,每个维度数值大小依此对应红(Red)、绿(Green)、蓝(Blue)三种颜色的强度。将图像的每个像素点处理为二值(0,1)图像的过程成为二值化。二值化图像具有占用空间小,操作速度快等优点,方便了图像的后续处理。

1.1.2 归一化

在数字识别过程中,无论是手写字符,还是印刷体字符,由于采集数据在大小和形状方面存在比较大的差异,所以,将图像进行归一化处理,是图像预处理中的重要一环。同时,手写数字图的识别和数字特征值的提取都需要在归一化的基础上进行,因此,无论采用哪种处理进行数字识别,都必须先进行归一化处理。归一化分为位置归一化和大小归一化,位置归一化又可分为中心归一化和外框归一化两种,大小归一化同样可以分为两种,分别是线性归一化和非线性归一化。

1.2 数字识别

常用的数据识别算法有模板匹配法,统计决策法,句法结构法,模糊判别法,逻辑推理法,神经网络法。由于我们采集的数据属于印刷体数字,相对手写体数字而言识别率较高,但是,热成像采集图片数据量大,以渤海某平台为例,单月热成像采集图片约1300 张,每张包含单个数字12 个,需要识别统计的数据多达15,600 个。在保证正确率的同时,数据识别耗时的长短也需要考虑。为此,我们采用了运算量较小,识别度较高的逻辑推理法。

1.2.1 样本数据采集

以历年来热成像图像中的数字为数据源,通过样本数据采集单元提取“0”到“9”每个字符100 个,这样一共采集到1000 个样本数据。

1.2.2 识别算法

1.2.2.1 2×2 网格特征识别

预处理后的单个字符图片为25×13 像素的图片,我们把该图片切分为4 个12×6 像素的区块,将采集到的样本数据做同样区块划分后统一对比分析,计算出每个区块中特征行z 的白色像素个数bm,n。

表1 各区块特征行白色色块数量列表数字bm,n 0 1 2 3 4 5 6 7 8 9数字区块区块(1,1) 1 2 0 0 1 2 1 0 1 2区块(1,2) 1 1 1 2 2 0 0 2 1 2区块(2,1) 1 1 2 0 0 0 1 2 2 0区块(2,2) 2 0 0 1 2 2 2 0 1 2

通过对上表分析,特征行是否存在白色色块可以作为数据识别的重要特征之一,即判断bm,n>0 是否为真,为真则cm,n=1,反之则cm,n=0。对各区块判断结果进行二进制编码。

表2 各区块是否存在白色色块列表数字cm,n 0 1 2 3 4 5 6 7 8 9数字区块区块(1,1) 1 1 0 0 1 1 1 0 1 1区块(1,2) 1 0 1 1 1 0 0 1 1 1区块(2,1) 1 1 1 0 0 0 1 1 1 0区块(2,2) 1 0 0 1 1 1 1 0 1 1 dn 15 5 6 10 11 9 13 6 15 11

由表2 看出,“0”和“8”, “2”和“7”, “4”和“9”特征值dn相同,需要进行进一步特征值甄别。

1.2.2.2 “0”和“8”特征识别

对特征值dn=15 的数字进行再次识别,通过比对,“0”和“8”最大的区别点在于中心区域是否有白色像素存在。因此,计算出中心矩形区域的白色像素个数S0|8。

为防止由于噪点对数据判断结果造成干扰,S0|8>1 则判断该字符为8,反之则为0。