视觉智能发展落地难？视觉智能技术实际发展速度很快

署名2021-03-04

现在在人工智能视觉智能时代，人类的视觉这种能力被“移植”了，让电脑“了解”一切。

视觉智能的第一步是模仿人类。它起源于20世纪50年代计算机视觉的统计模式识别，主要基于二维技术，但其结果远不如人类视觉。在视觉智能的第三阶段，深度学习算法的突破直接推动了神经网络算法的发展。有趣的是，人类大脑皮层中有一半的神经元与视觉有关，这与神经网络算法中的“神经元”类似。神经网络算法一旦从人类的“视觉”系统中学习，直接成为计算机视觉的技术引擎，视觉智能的应用场景也逐渐丰富。

淘系技术.png

利用视觉智能技术大规模生产高精度地图

随着导航、驾驶辅助、自动驾驶等技术的不断发展，对地图的精度提出了更高的要求。所以地图提出了一种利用视觉智能视觉惯性导航技术制作高精度地图的方法。

目前，很多地图例如高德地图已采用激光雷达采集和视觉智能图像视觉惯性导航融合两种方法，完成了全国32万多公里高等级公路的高精度地图数据。通过视觉智能与INS相结合进行数据采集，一方面可以大大降低成本。另一方面，基于图像视觉的高精度地图在识别方面具有一定的优势，可以提高车道级要素的识别效率。

利用视觉智能技术实现图像内容的自动生成

清科研究中心发布的报告指出，在计算机视觉技术中，图像识别主要是基于静态图像的识别、分析和应用。未来技术和应用的重点将转向动态图像技术，即智能视频采集、识别和处理，最终实现图像的智能生成。目前，智慧形象已与娱乐、教育、传媒等行业深度融合，视觉智能形成了切实有效的落地方案，视觉智能体现了较强的商业能力。目前，娱乐业是视觉智能的主导产业，视觉智能特别是在图像光谱技术领域有很多应用。

机器自动化生产的视频内容引擎MAPE基于AI+视频技术的新组合，推出了多个针对特定行业定制的视觉智能AI应用组件，涵盖了智能图像生产技术、平台和行业应用落地的全栈布局。制作引擎将视觉智能与交互式视频技术相结合，提出了包括景深测量与反步技术、亚像素反轨道技术、视频叠加技术、优化计算技术等在内的完整技术框架。它拥有完整的视觉识别（MCVs）、自动构建视频和自动生成视频内容（AIC）三个AI组件，帮助媒体和娱乐公司应用非结构化数据，并对其创建、获取和交付给受众的内容做出更明智的决策。

全面升级视觉智能技术

在视觉智能人脸识别、图像分类等许多任务中，视觉智能可以完成比人类视觉更好的任务。但在其他需要推理的任务中，视觉智能还有很长的路要走，业内专家表示，“人类可以很容易地理解物体之间的关系。当我们看到一幅画时，我们可以编一个故事。但是计算机的理解力和想象力还远远没有达到那种水平，随着计算机视觉智能技术的不断发展，视觉智能技术将带来更多的新发现。视觉智能技术和人工智能都处于发展的初级阶段，还有很多东西需要探索。