什么是AR
AR(Augmented Reality)增强现实,也叫做扩增实境。1990 年提出,是一种实时地计算摄影机影像的位置及角度并加上相应图像的技术,它是在现实上叠加一层虚拟现实,进而扩展人类感官,与现实产生更深刻互动的一项技术。通俗一点,就是让你看到现实中不存在的物体和现实世界融合在一起的图像并与其交互。
AR包含了多媒体、三维建模、实时视频显示及控制、多传感器溶合、实时跟踪及注册、场景融合等新技术与新手段。增强现实提供了在一般情况下,不同于人类可以感知的信息。
AR技术原理
AR技术即增强现实技术,它是一种将真实世界信息和虚拟世界信息“无缝”集成的新技术,是把原本在现实世界的一定时间空间范围内很难体验到的实体信息(视觉信息,声音,味道,触觉等),通过电脑等科学技术,模拟仿真后再叠加,将虚拟的信息应用到真实世界,被人类感官所感知,从而达到超越现实的感官体验。真实的环境和虚拟的物体实时地叠加到了同一个画面或空间同时存在。不仅展现了真实世界的信息,而且将虚拟的信息同时显示出来,两种信息相互补充、叠加。在视觉化的增强现实中,用户利用头盔显示器,把真实世界与电脑图形多重合成在一起,便可以看到真实的世界围绕着它。
值得一提的是,添加到现实的这些虚拟信息、虚拟物件并非静态图片,它们会根据摄像头的移动,地理信息,以及各种现实的因素来不断的改变形态位置,你甚至可以和他们进行触摸、语音等交互。
AR的技术手段和表现形式
1.基于计算机视觉的AR
它是利用计算机视觉方法建立现实世界与屏幕之间的映射关系,使我们想要绘制的图形或是3D模型可以如同依附在现实物体上一般展现在屏幕上。
想要实现这一点,我们就要找到现实场景中的一个依附平面,然后再将这个3维场景下的平面映射到我们2维屏幕上,然后再在这个平面上绘制你想要展现的图形,从技术实现手段上可以分为2类。
第一种,Marker-based AR。事 先制作好的Marker(例如:绘制着一定规格形状的二维码或模板卡片),然后把Marker放到现实中的一个位置上,相当于确定了一个现实场景中的平 面,然后通过摄像头对Marker进行识别和形态评估,并确定其位置,然后将该Marker中心为原点的坐标系称为模板坐标系,我们要做的事情实际上是要 得到一个变换从而使模板坐标系和屏幕坐标系建立映射关系,这样我们根据这个变换在屏幕上画出的图形就可以达到该图形依附在Marker上的效果,理解其原 理需要一点3D射影几何的知识,从模板坐标系变换到真实的屏幕坐标系需要先旋转平移到摄像机坐标系,然后再从摄像机坐标系映射到屏幕坐标系。
第二种,Marker-Less AR。基 本原理与上面的Marker based AR相同,不过它可以用任何具有足够特征点的物体(例如:书的封面,你的桌子)作为平面基准,而不需要事先制作特殊的模板,摆脱了模板对AR应用的束缚。 它的原理是通过一系列算法(如:SURF,ORB,FERN等)对模板物体提取特征点,并记录或者学习这些特征点。当摄像头扫描周围场景,会提取周围场景 的特征点并与记录的模板物体的特征点进行比对,如果扫描到的特征点和模板特征点匹配数量超过阈值,则认为扫描到该模板,然后根据对应的特征点坐标估计Tm 矩阵,之后再根据Tm进行图形绘制。
2.基于地理位置信息的AR
LBS based AR,即基于地理位置信息的AR。其原理是,通过GPS获取用户的地理位置,然后从某些数据源(比如google)等处获取该位置附近物体(如周围的餐馆,银行,学校等)的POI信息(导航地图信息,每个POI包含四方面信息,名称、类别、经度纬度、附近的酒店饭店商铺等信息),再通过移动设备的电子指南针和加速度传感器获取用户手持设备的方向和倾斜角度,通过这些信息建立目标物体在现实场景中的平面基准上。
这种AR技术利用设备的GPS功能及传感器来实现,摆脱了应用对二维码或者模板卡片Marker的依赖,用户体验和性能都比基于计算机视觉的AR更好,也可以更好的应用到移动设备上。
一个典型的AR系统结构
AR的关键技术
1、对现实场景的理解和重构
在增强现实系统中,首先要解决“是什么”的问题,也就是要理解、知道场景中存在什么样的对象和目标。第二要解决“在哪里”的问题,也就是要对场景结构进行分析,实现跟踪定位和场景重构。
物体的检测和识别技术
物体检测和识别
物体检测和识别的目的是发现并找到场景中的目标,这是场景理解中的关键一环。广义的物体检测和识别技术是基于图像的基本信息(各类型特征)和先验知识模型 (物体信息表示),通过相关的算法实现对场景内容分析的过程。在增强现实领域,常见的检测和识别任务有,人脸检测、行人检测、车辆检测、手势识别、生物识别、情感识别、自然场景识别等。
就现阶段而言,识别检测技术的难点之一是技术的碎片化。这一方面是由于每一类对象都会有其独有的特征,而不同特征的提取和处理都需要实现一一对应,这对识别检测是一个巨大的挑战。另一方面,图像本身还受到噪声、尺度、旋转、光照、姿态等因素的影响。近几年来,随着深度学习技术的不断成熟,检测和识别方法也 越来越统一,而性能也在不断提高中。
2.跟踪定位技术
跟踪技术的方法可以分为基于硬件和基于视觉两大类。基于硬件设备的三维跟踪定位方法在实现跟踪定位的过程中使用了一些特殊的测量仪器或设备。常用的设备包 括机械式跟踪器、电磁式跟踪器、超声波跟踪器、惯性跟踪器以及光学跟踪等。光学跟踪和惯性跟踪是比较常用的两种硬件跟踪方式,使用硬件设备构成的跟踪系统大多是开环系统,跟踪精确取决于硬件设备自身的性能,其算法的扩展性要差一些,且成本相对较高。
视觉跟踪方法具备更强的扩展性,其系统多为闭环系统,更依赖于优化算法来解决跟踪精度问题。相 比于上述基于硬件设备的跟踪方法,计算机视觉跟踪方法提供了一种非接触式的、精确的、低成本的解决方法,但是基于视觉的方法受限于图像本身,噪声、尺度、 旋转、光照、姿态变化等因素都会对跟踪精度造成较大的影响,因此更好地处理这些影响因素,研发鲁棒性强的算法就成为下一步AR技术的研究重点。
根据数据的生成方式,视觉跟踪技术的算法可以分为两种,一种是基于模板匹配的方式,预先对需要跟踪的target进行训练,在跟踪阶段通过不断的跟预存训练 数据进行比对解算当前的位姿。这类方法的好处是速度较快、数据量小、系统简单,适用于一些特定的场景,但不适用于大范围的场景。
另外一种是SLAM方法,也就是即时定位和地图构建技术。这类技术不需要预存场景信息,而是在运行阶段完成对于场景的构建以及跟踪。其优点是不需要预存场 景,可以跟踪较大范围,适用面广,在跟踪的同时也可以完成对于场景结构的重建。但目前这类技术计算速度慢、数据量大、算法复杂度高,对于系统的要求也较高。
为了弥补不同跟踪技术的缺点,许多研究者采用硬件和视觉混合跟踪的方法来取长补短,以满足增强现实系统高精度跟踪定位的要求。
3.增强现实的显示技术
目前大多数的AR系统采用透视式头盔显示器实现虚拟环境与真实环境的融合。根据真实环境的表现形式划分,主要有视频透视式头盔显示器和光学透视式头盔显示器两种形式。
视频透视式头盔显示器通过安装在头盔上的微型摄像头获取外部真实环境的图像,也就是通过摄像头来采集真实场景的图像进行传递。计算机通过场景理解和分析将所 要添加的信息和图像信号叠加在摄像机的视频信号上,将计算机生成的虚拟场景与真实场景进行融合,最后通过类似于浸没式头盔显示器的显示系统呈现给用户。
虽然视频透射式头盔在显示上不受强光的干扰,具有比较大的视场,但由于真实环境的数据来自于摄像头,因此会造成显示分辨率较低的不利因素。另一方面,一旦摄 像机与用户视点不能保持完全重合,用户看到的视频景象与真实景象将会存在偏差,因此会造成在某些领域(特别是工业、军事等领域)出现一些安全隐患。
光学原理的透视式头盔显示器的基本原理则是通过安装在眼前的一对半反半透镜融合呈现出真实场景和虚拟场景。与视频透射式不同的是,光学透视式的“实”来自于 真实的光源,经过透视光学系统直接进入眼睛,计算机生成的“虚”则经过光学系统放大后反射进入眼睛,最后两部分信息汇聚到视网膜上从而形成虚实融合的成像 效果。
光学透视式头盔相对来说结构简单,分辨率更高,因其能够直接看到外部,真实感和安全性也更强。其缺点是,在室外强光条件下显示效果会受影响。
不难看出,两种方案各有优缺点,如何选择最优方案,目前来看,还应基于实际应用场景来进行判断。
由于光学透射式头盔跟实际场景结合更紧密,真实感更强,大多数厂家会选择这种方案。对于透射式头盔显示器来说,单纯的强调厚薄或者视场大小并没有任何实际意 义。这是由于厚度和视场是矛盾的,要做得较薄,方便用户使用佩戴,视场就必然变小;想要拥有大视场,则其厚度就必然增大,设备就目前来说也会显得比较笨 重,不易佩戴。因此在目前技术依旧存在障碍的情况下,大家都会采取一些折中的方案。
数字光场显示
随着Magic Leap的宣传视频,数字光场这个概念也变得广为人知。这种不采用屏幕来做载体的显示方式,通过记录并复现光场来完成虚拟物体的显示。通过呈现不同深度的图像,使用户在观察近景或远景时,可以实现主动的对焦,这也是光场显示的一大优点。
同样,光场显示也有不同的显示方案,一种方案是采用多层的显示器,如光场立体镜。如Magic Leap采用的是光导纤维投影仪。这套方案的优势是可以做到很大的视场角,显示更加符合人的真实感受。但这一方案同时也具有比较大的挑战性,光场的显示需 要比较大的计算量,并且需要有相应的手段记录或者生成想要叠加的虚拟对象相应位置的光源信息,同时还要精细地控制投影的内容和位置,目前这些技术还都处于 研究阶段。尽管存在比较多的挑战,光场显示技术仍旧是非常值得期待的一种成像方式。
AR应用领域:
医疗领域
医生可以利用增强现实技术,在虚拟与现实之间轻易地进行手术部位的精确定位。
军事领域
作战队伍可利用增强现实技术,进行方位的识别,获得目前所在地点的地理数据等重要军事数据。
工业领域
通过头盔式显示器将多种辅助信息显示给用户,包括虚拟仪表的面板、被维修设备的内部结构、被维修设备零件图等。
娱乐、游戏领域
增强现实游戏可以让位于全球不同地点的玩家,共同进入一个真实的自然场景,以虚拟替身的形式,进行网络对战。
教育领域
从表现形式上吸引小朋友参与到教学中,提升对事物的兴趣,从而以互动的方式探查、研究更深层次的内容。融入增强现实技术后,以图片、视频、动画等多种方式表现教学内容,更真观更易懂。增强现实特有的互动体验,让小朋友用眼看、用耳听、动手做、用脑想,真正实现多元化教育。
家居行业
传统家庭装修也好,企业装修也罢,在实际装修的时候往往会发现装修出来的效果并没有预想搭配的那样美好。各种不同材质的装修材料和不同风格的家具究竟是否搭配?有了 AR增强现实技术,不需要等到装修后才能知道,你到了一套空旷旷还未装修的房子就能利用AR给你的房子进行装修,你会从你的AR设备中看到你 想要的装修搭配。甚至价格信息,都会一目了然。同样,如果是装修一栋办公楼或者是电影布局,AR在家居布置上的便利性和成本节省方面优势就更明显了。
商业应用
如亚马逊、优衣库以及天猫之前推的虚拟试衣间,其实也算是AR的一种。只不过现在Realmax的高精度面部识别技术和跟踪技术能让用户体验到全方位“立体”感受。
旅游领域
旅游产业AR技术对旅游业来说,同样也是颠覆性的,它在旅游行业的应用可以有无穷无尽的探讨。游客佩戴上AR设备,就能获取当地城市的景点和商场等地方的详细介绍,自动翻译,了解附近购物和餐饮信息只是最基本的功能。
AR的未来
2011年,全球AR营收仅为1.81亿美元,而且当时AR往往被人们视作一种营销噱头:一种还在摸索实用应用的技术。很少有人认识到AR的潜力,开发相关应用大多也是用来快速打响名声,或者这些应用的价值仅限于添加视频效果这样的博眼球之举而已。
然而最新预测指出,到2017年,AR市场将增长至52亿美元,年增长率竟逼近100%。随着大量资金注入AR项目及AR创业公司,尤其是随着 谷歌、佳能、 高通 、 微软 等大公司的入场,我们已经看到第一批消费级AR产品的涌现。随着实际商业利益的出现, AR将成为消费、医疗、移动、汽车以及制造市场中的“下一件大事”。
市场调研公司Digi-Capital给出的一组数据很值得研究:到2020年,AR的市场规模将达到1200亿美元,远高于VR的300亿美元。 所以AR未来发展空间极大。这其中需要仰仗技术、内容和应用场景的有效融合,以及硬件性能的发展和可穿戴设备的崛起。