真亦假时假亦真——增强现实技术解析
技术空间
如果你看过电影《钢铁侠》的话,那么一定还记得,男主角托尼在设计盔甲的时候,在现实中调试盔甲的各种性能,而盔甲所连接的电脑显示屏幕上则立刻显示出盔甲的3D图形,并模拟出很多现实中无法体验到的性能以及相关参数。这类镜头我们经常在各种大片中看到,但是你千万不要以为这只是电影需要而杜撰出的“火星”科技,实际上这种将现实情况反映到虚拟环境并与之互动的技术早已经诞生,这就是我们常说的“增强现实”。

何谓AR增强现实?
增强现实(augmented reality,简称AR),是虚拟现实研究领域里逐渐引起广大学者关注的一个新兴研究方向。所谓虚拟现实(virtual reality,简称VR),是利用计算机生成一种逼真的视、听、力、触和动等感觉的虚拟环境,通过各种传感设备使用户“沉浸”到该环境中,实现用户和环境直接进行自然交互。虚拟现实是将人“沉浸”在计算机中,而现实中常提出这样一种应用,即如何将计算机虚拟的东西与人们所看到的真实物体相结合,形成一种虚、实结合的应用,用虚拟的信息补充真实信息的不足,来满足特殊工作需求。例如:利用图形、图像的虚、实结合提供飞行员精确导航;利用虚、实结合指导脑外科手术等。由此,在虚拟现实基础上,研究将现实、虚拟两种不同信息融合起来,就形成一个新的领域——增强现实。
业界是这样定义增强现实的:虚实结合,实时交互,三维注册增强现实系统,是利用附加的图形或文字信息,对周围真实世界的场景动态地进行增强。可以说增强现实是虚拟现实的一个分支。它一般借助计算机图形技术和可视化技术产生现实环境中不存在的虚拟对象,并通过传感技术将虚拟对象准确“放置”在真实环境中,借助显示设备将虚拟对象与真实环境融为一体,并呈现给使用者一个感官效果真实的新环境。这种增强的信息可以是在真实环境中与真实环境共存的虚拟物体,也可以是关于存在的真实物体的非几何信息。

AR增强现实技术分析
当然,要在实际应用中使用AR技术,还需要由计算机、各种传感器(作为计算机的视觉、触觉及其他感官)和用来输出加工信息的显示屏等组成的AR接口设备。增强现实系统需要通过分析大量的定位数据和场景信息来保证由计算机生成的虚拟物体可以精确地定位到真实场景中,这里面一般包含四个基本步骤:第一步,获取真实场景信息;第二步是对真实场景和相机位置信息进行分析;第三步是生成虚拟景物;第四步是合并视频或直接显示。
这里涉及到三项比较关键的技术:显示技术、跟踪与定位技术和交互技术。一般,真实场景由摄像机录制,摄像机的内部参数(焦距和透镜的失真率)和外部参数(位置和方向)决定了哪一部分三维立体图像被投影到二维平面,同时虚拟物体由计算机图形设备在对象坐标系中建模产生。图像系统需要真实场景中的相关图像信息来控制产生虚拟物体的虚拟摄像机的方向。最后虚拟图像和真实图像融合,就形成了增强现实的图像。增强现实系统可以通过多种设备来显示虚拟物体和真实场景的叠加,通常采用头盔显示系统或空间投影显示系统。前者能实现完全沉浸式的虚拟环境显示,后者支持多用户共享的虚拟环境显示。
由于要实现虚拟和现实物体完美结合,必须将虚拟物体合并到现实世界中的准确位置,这个过程常称为配准(registration),因此增强现实的跟踪定位系统必须能够实时地检测观察者在场景中的位置、观察者头部的角度,甚至是运动的方向,以便用来帮助系统决定显示何种虚拟物体,并按照观察者的视场重建坐标系。在增强现实系统中,最常用的是使用视频检测技术。视频检测就是使用模式识别技术(包括模板匹配、边缘检测等方法)识别视频图像中预先定义好的标记、物体或基准点,然后根据其偏移和转动角度计算坐标转换矩阵。用视频检测方法进行定位最大的优点是不需要其他设备,且定位精确。


AR增强现实应用
虽然增强现实是虚拟现实的一个分支,但由于增强现实是在虚拟现实与真实世界之间的沟壑上架起了一座桥梁,因此增强现实的应用潜力是相当巨大的。现已广泛应用于电影及电视节目等,科幻作品中所描绘的情景将有可能变为现实。例如,通过合成的背景影像使得身在影院的观众看上去就像真的置身于影片中一般。比如某个周末,A先生去电影院观看电影。A先生走到放映厅门口,一边将电影票交给工作人员,一边走过红外线人体扫描仪。工作人员同时将票根上的编号和座位号码,以及人体扫描资料输入到放映设备中。此时电影院正在播放《未来战士》。观众A坐到自己的位置上在座位手把操控设备上点击“参与模式”,A先生的五官被实时地贴到男主角的脸上。A先生在自己的座位上欣赏了自己担任主角的电影……再如普通的一个博物馆,使用增强现实的技术,可以让游览者有别样的体验,游客可以得到二维的信息甚至是三维的动画,而且可以进行交互……
同时许多研究人员还在考虑用户如何与增强现实应用进行交互。目前增强现实交互手段研究有两个趋势:使用不同的设备,取各家之长;通过切实可行的界面,使虚拟对象与自然界成为一个整体。比如采用不同的传感器和输出设备,触觉方面的AR技术已应用于相应产品中,即数码相机的防抖功能。该功能可用于检测用户拍摄时手的振动,并及时对光学镜头及图像进行相应的校正处理。此外,借助AR技术,PC显示器将来有可能具备目前的梳妆镜功能,通过在镜子中的影像上叠加一些加工信息,即可模拟出化妆或试穿某件衣服后的效果,甚至还可以将自己的高尔夫挥杆动作与Tiger Woods的动作进行比较。而手机则是现在最接近普及的AR接口。大多数多功能手机中都已经集成了摄像头、GPS、地磁传感器及加速度传感器等,因此,现在很多厂商都正在开发面向这些功能的软件,用来在位置信息的基础上叠加来自互联网的各种相关信息,并显示到终端屏幕上。比如在手机娱乐方面,西门子推出的“虚拟足球”(KickReal)游戏,玩家用摄像头对着脚,就可以踢动画面上的足球,进行射门练习。另一个设想是,社交软件将在AR应用程序中大展拳脚。例如,在街上行走时,你可以使用手机指向一家餐馆,则在餐馆的图片上会出现顾客的评价和推荐,以及其他相关的用户发布信息。
当然,AR的应用并不单单局限于娱乐、消费领域,诸如尖端武器、飞行器的研制与开发、数据模型的可视化、虚拟训练等领域都可以看到AR的身影。由于AR具有能够对真实环境进行增强显示输出的特性,在医疗研究与解剖训练、精密仪器制造和维修、军用飞机导航、工程设计和远程机器人控制等领域,具有比VR技术更加明显的优势。


结语>>
可以说,增强现实是一个多学科交叉的领域,它包括计算机视觉、计算机图形学、传感学、网络等,它对未来的信息发展趋势的影响将是相当深远的。增强现实的广泛使用还受到技术、用户界面和社会接受度等问题的限制,比如增强现实应用需要大量本地信息提供商的参与,对硬件应用平台也提出了相应的要求,而且对运营商来说,增强现实技术以及各种应用会占用大量的网络带宽资源。但我们相信,随着增强现实研究和应用的日趋成熟,必将在生活领域产生深远的影响。