数显仪表,就是一种显示数字的仪器,便于人们了解相关信息。目前,数显仪表被广泛的应用于航天、农业、工业等各个行业中,但出于工作条件和成本控制等原因,仍有很多的仪表无法直接获得读数,大多由人工读取。但是人工无法长时间且实时记录,还有些地方工人不方便记录,这些都会对后期工作产生不利影响。
随着科学技术的发展,计算机视觉技术可以通过相机拍摄的图片获取有效信息。数显仪表的识别便可以先通过相机对仪表进行拍摄获取图片,接着对图片进行图像处理操作,然后经过图像识别算法得到数值信息。在汉斯出版社《计算机科学与应用》期刊中,有学者提出提出了一种基于传统图像处理和改进的卷积神经网络的数显仪表识别方法。
基于计算机视觉的仪表识别主要包括三个部分:图像处理、图像分割和图像识别。但图像识别是最关键的部分。传统的图像识别是通过图像的颜色、纹理和形状来提取特征进行识别,是一个非常困难且复杂的工程。目前,随着深度学习技术的发展,基于卷积神经网络的图像识别技术得到了广泛的应用,数显仪表识别的普适性和泛化能力也有了较大提高。视觉注意机制能快速找到图像的显著区域,忽略背景信息,可以提高网络的识别速度与精度。因此,本文提出了一种基于传统图像处理与基于注意机制的卷积神经网络数显仪表识别方法。
数字仪表的识别最初是使用模糊识别方法,利用最大隶属原构造数字识别器,是由张海波等人提出。有学者提出了一种基于模板匹配的最大稳定极值区域定位分割算法TM-MSER,首先利用人工制作模板去匹配定位出原图像中的数显区域,然后再通过二值化、去噪等图像处理方法对数显区域进一步处理,最后利用投影法对每个字符进行分割,并对分割完成的字符进行识别。这种方法比较复杂,匹配过程比较耗时,且正确率不高。有学者提出了一种基于全卷积神经网络的数字仪表识别算法,该算法是通过全卷积神经网络实现了图到图的像素级预测,通过融合加权融合全卷积网络中的多尺度特征和多层级特征,实现数字的识别分类。但是该方法需要海量数据进行训练,前期工作繁琐。
本文提出了一种基于传统图像处理和改进的卷积神经网络的数显仪表识别方法。首先通过传统图像处理分割出待识别的数字,再将数字送进卷积网络模型进行识别。改进的网络模型先通过深度可分离卷积减少模型参数,可以大大减少训练时间,接着采用的注意机制模块通过通道注意和空间注意的融合能够有效地提高网络特征提取能力,提高网络的数字识别率,并在试验中证实了该算法得高效性。