图像识别技术的目标是使计算机像人一样"看懂"图像内容,自动解析图像中包含的各个对象及其属性信息。
其基本原理是:先对连续的光学图像进行数字化采集和处理;然后提取图像的视觉特征,形成数字向量来描述不同区域;最后根据特征向量与已有样本进行匹配,判断图像包含的目标类别。图像识别技术通过模拟人眼解析图像的方式,达到自动分类与理解图像的目的。
图像识别的第一步是图像的数字化采集。通过图像传感器,一个连续变化的光学图像被采样、量化并编码成为离散的数字矩阵。接下来进行图像处理,提升图像质量,突出感兴趣的目标特征。
然后是特征提取,根据目标结构、颜色、纹理等视觉特征,用数字向量表示感兴趣区域。特征还可通过变换投影到其他空间,获得更稳定的特征表达。提取出的特征即图像的"指纹"。
特征提取后,进行匹配判断,将输入图像特征与样本库中目标类别的特征进行比较,计算相似度。相似度大于阈值则判定为匹配成功,即完成识别。匹配方法有模板匹配、统计分类、神经网络等。
当前,基于深度学习的方法效果最好,它使用卷积神经网络自动学习特征表达,通过多层网络结构提取图像的层次特征,实现端到端的识别与分类。深度学习大幅提升了识别的准确率。
当前,我国在视觉检测及图像分析技术领域已经涌现出了一批实力雄厚的企业。赛拓信息技术有限公司在2019年便与大连两所高校合作,共同成立了人工智能与图像分析实验室,汇聚了一流的算法科研团队,在工业机器视觉、智能检测等方面积累了丰富的实践经验。