图像识别技术是如何实现的?越探索越神奇
署名2021-01-18

图像识别技术是如何实现的?

人类能识别事物,那么计算机能识别事物吗?很久之前科学家们就开始思考这个问题。人类好像生来就擅长识别,一个对飞机及其组件细节都不懂的孩子,却能毫不费力的在各种各样的图像、插图中认出飞机。人类是如何做到的呢?

当人类在看图像时,并不是无目的的观察图像,而是下意识的寻找图像特征,也就是在图像轮廓曲度最大或轮廓方向突然改变的地方。眼睛的扫描路线也总是依次从一个特征转到另一个特征上。同时,在大脑里有一个机制负责整合信息,把分阶段获得的信息整理完整,从而辨别图像。

科学家们获得到启发,于是将同样的图像识别原理应用在计算机中,对图像的重要特征进行分类与提取,并且排除无用的多余特征,进而使计算机图像识别技术得以实现。举个例子,当计算机在识别英文大写字母时,L有且只有一个直角,X是两条交叉的线段,这些显著特征成为计算机进行识别的关键。

图像识别基本过程:

1) 信息数据的获取。借助于数字摄像机、扫描仪、数码相机等设备进行图像采集,并且将其存储于计算机的数据库内,用于后续程序的开展,信息数据的获取是图像识别过程的第一步。

2) 信息数据预处理。在获取和传输过程中,图像的质量或多或少会造成一定的退化,此过程主要是对图像进行去噪、变换以及平滑等处理操作,,改变原来图像的亮度、色彩分布、对比度等参数,将图像的特征和重要信息突显。

3) 特征抽取与选择。指在模式识别中,抽取及选择图像特征,正如上文论述的,各种各样的图像都具有对应的特点,计算机采用一定方式进行分离,抽取能区分图像的特征。抽取的特征是否有效决定着图像能否被成功识别。

4) 分类器设计与分类决策。此步骤是图像识别的最后一步,分类器设计是指以有效的程序制定出一个识别规则,这种识别规则能够按照某种规律对图像进行识别,而不是盲目混乱的进行识别,借此识别规律能够将相似的特征种类突显,致使图像识别过程的辨识率更高,之后通过对特殊特征的识别,完成图像的评价和确认。

图像识别技术在探索发展中不断创新

最初的图像识别是非常笨拙的,需要科学家从图像中提取一系列特征(比如边缘,角落,颜色),进行手动编码,进而将大量的编码数据灌输到计算机中,才能形成相应图像的识别程序,并且只有与数据库完全一致的图像才能被成功识别。在这一阶段,计算机的识别与人类眼睛的识别还存在巨大的差异,一方面计算机识别的能力非常有限,另一方面对于某一类特别相似的特征,可能会出现识别错误的现象。

经过漫长的实验探索,科学家们发现神经网络可以很好解决这两个问题。不需要手动编码,而是采用“自动”的方式“学习”原始图像数据中显著特征,并且在神经网络中,被提取和捕捉的图像特征能够加以映射,能更为精确、全面的完成图像识别。但是从计算角度来看,这并不是一个节约的解决办法,一个传统的神经网络在处理一张很小的图片时(假设30*30像素)仍然需要50万个参数以及900个输入神经元。并且一旦图片变大了(例如500*500像素),参数以及输入的数目就会达到非常高的数量级。

人工智能的进程就是不断发现问题、解决问题的过程。于是,科学们为了能简单的处理较大的图像,发明了卷积神经网络(CNNs,Convolutional Neural Networks)。一张图片中,两个距离较近的像素相比于距离较远的像素更为相似,这些靠近且相似的像素通常并不是图像的显著特征,于是卷积神经网络像拥有“过滤器”一样,排除大量的不重要的相似像素,同时每个神经元只需要负责处理一张图像的一个特定部分,从而减少图像处理的计算压力。

虽然还有很多问题有待解决:如何对图像做更深入的理解?图像中物体之间的关系是什么?不能否认的是,图像识别技术发展到现在,得到了非常大的进步,并且给人们的生活带来了多方面的提升。

人工智能有望真正改变我们每一个人的生活,而这样的改变正在发生,为了让人们的生活变得更美好,智视科技的图像识别技术正在加速研发,其基于智视科技的独特算法,具有小样本学习,实时持续学习、硬件资源消耗低三大优势,目前还在不断更新中。