PNT技术多如牛毛,莫衷一是,那一是又在何方?

PNT技术林林总总,至少有好几十种,简直是多如牛毛,令人莫衷一是,那一是又在何方?如何选择,怎样用极其简约的办法实现泛在而又可信的定位,已经成为业界目前面临的至关重要的难题。实质上,PNT原则上就是个时间和空间的问题,时间的问题是个关键,高精度时间统一系统是国家安全的关键基础保障,北斗时间系统是核心主线,进而形成了高精度授时的骨干网络,这是我国利用社会主义制度的优越性,集中力量办大事,实现无线和有线、授时和守时、纵向和横向相结合的战略战术,在世界上首先构建完成了室内外无缝的高精度授时网络,实现了无障碍时间传递和同步功能,为电信、电网、交通与金融等关键部门和国家关键基础设施的安全保障建构了定海神针。谈到空间,也就是定位,事情要复杂的多,高精度三维定位,在室外可以充分利用北斗等卫星导航资源,但是又有信号微弱的脆弱性软肋威胁,易受电磁干扰和欺骗的攻击,而在室内的定位手段大多只是局域性本地化的技术,对于局地的基础设施有很强的依赖性,覆盖区域有限。实际上,室内外无缝定位,就成为业界下一个必须攻克的重点难题。这就是如何在众多的技术中,精选出切实可行、物美价廉、行之有效的技术,做成高精度、高性能、低成本、低功耗的产品和服务。这里介绍的是一篇《GPS世界》杂志在11月3日发布的文章,题目是:“构建定位的未来:GNSS+IMU 和 VPS 如何协同工作”。在这里我们稍作改编,给予转发。

照片:AerialPerspective Works / E+ / Getty Images

准确的定位是现代移动出行的基础,为从精确的拼车接送和高效送货到增强现实和自动驾驶系统的一切提供原动力。然而,使用商品硬件实现可靠的亚米精度仍然是该领域的核心挑战之一。人们正在探索一系列技术来改进定位,例如实时运动学(RTK)和精确点定位(PPP)校正、第三代合作伙伴项目(3GPP)下标准化的5G方法、同步定位和测绘 (SLAM)、光探测和测距 (Lidar)、惯性测量单元(IMU)和超宽带(UWB),以及WiFi、蓝牙等,差不多用尽了声学、光学、机械学、电学、磁学、重力学和量子力学等等,所有的可用资源。每种技术都在特定环境中发挥作用,但对于日常的大众市场部署,目前看来,只有两种范式主导了话语权,它们就是:视觉定位系统(VPS),它依靠相机和计算机视觉将图像与参考数据库进行匹配,及GNSS加惯性测量单元(GNSS+IMU) 传感器融合,它将卫星定位与数十亿台设备中已经存在的惯性数据集成在一起。当然,还有一种可能性,就是利用低轨卫星的专门用于PNT的信号,或者是它们的机会信号,但是这可能是需要有个非常长的发展过程。

比较现实的方法,就是VPS和(GNSS+IMU)这两种方法,它们还并不相互排斥。VPS 在 GNSS 可能难以识别的密集城市地区工作最佳,而 GNSS+IMU 在 VPS 需要识别的特征较少的开放环境中表现出色。在实践中,VPS 甚至依靠 GNSS 来帮助缩小其可视化数据库中的搜索空间。这使得这两种技术自然互补,它们共同为下一代时空智能提供了基石。

VPS的作用

VPS 使用计算机视觉来确定相对于已知地标的位置。在有利的环境中——尤其是密集、功能丰富的城市环境——它们可以提供令人印象深刻的精度。VPS 已成功应用于 AR 锚定、行人导航,甚至一些室内测绘,提供了可以与单独 GNSS 相提并论的精度水平。与此同时,VPS 面临着限制其作为独立通用解决方案扩展的能力的挑战。维护庞大的参考图像库需要不断收集和刷新,即使对于拥有 Google 街景等资源的公司也是如此。保持摄像头处于活动状态并运行神经网络匹配会消耗功耗和计算能力,当视觉管道启用时,AR 和导航应用程序通常会显示电池快速耗尽。其性能也可能很脆弱,在弱光、恶劣天气或功能有限的环境中(例如开阔的田野或反射扭曲识别的玻璃重走廊)下,精度会下降。由于 VPS 需要连续使用摄像头,因此在 GDPR 等法规下也引起了隐私问题。但 VPS 仍然满足了一个重要的功能集:它在 GNSS 最困难的环境中运行得最好。在视觉特征丰富但多路径干扰较重的密集城市地区,VPS与GNSS+IMU配合使用,提供了增强整体定位性能的互补能力。

GNSS+IMU融合

GNSS 提供全球覆盖范围,智能手机的精度通常在 3m 到 5 m 之间。这对于路线导航来说可能已经足够了,但不能满足车道级引导、行人导航或建筑物入口所需的精度。将GNSS与IMU数据配对,通过添加方向和运动上下文来改变该等式。传感器融合将 GNSS 位置(x、y、z)与 IMU 衍生方向(α、β、γ)相结合,提供六个自由度 (6DoF)。在实践中,这不仅允许设备确定它们的位置,还可以确定它们面向哪个方向,这对于导航和 AR 锚定至关重要。另一个关键优势是,融合还可以在设备上高效运行,使用几乎每部手机中都嵌入的低功耗传感器。它避免了基于视觉的方法的电池消耗和计算开销,在能见度差的情况下保持弹性,并在很大程度上避免了与连续使用相机相关的隐私问题。

GNSS+IMU 和 VPS 共同提供互补的优势:GNSS+IMU 提供可扩展的全球覆盖范围,而 VPS 则在密集的城市或视觉丰富的环境中增加价值。它们协同使用,可以在更广泛的实际场景中扩展可靠的亚米级定位。

现场测试中的表现

独立的现场测试强调了 GNSS+IMU 融合在现实条件下的影响。在科罗拉多州路易斯维尔进行的试验中,仅依赖 GNSS 的标准智能手机平均误差为 1.9 米。当添加协作校正和 IMU 融合时,平均误差下降到 0.55 米——提高了三倍多。为了将定位性能与视觉方法进行比较,我们将 Zephr 基于传感器的方法与 Google 的 VPS 进行航向确定进行了比较,后者被广泛认为是基于视觉的定位领域的行业领导者。使用相同的设备和位置,根据 VPS 输出绘制从 ArPose 和 Zephr 生成的标题。

图1中的结果显示出很强的相关性,平均航向差仅为7.58度,航向相关性为99.52%。这提供了一个有用的基准,表明基于传感器的方法可以实现与基于视觉的系统相当的航向精度,同时避免与连续使用相机相关的数据、计算和隐私负担。

图 1:该图显示出很强的相关性,平均航向差异仅为 7.58°,航向相关性为99.52%。

头对头比较

当平行对比时,VPS 和 GNSS+IMU 显示出不同的优势。VPS 在密集的城市环境中提供高精度,在这些环境中,GNSS 可能会因多径或阻塞而降级。同时,GNSS+IMU 在 VPS 需要识别的功能较少的开放环境中提供一致的全球覆盖和高效性能。它们共同构成了一个互补的工具集,每个工具都解决了对方的差距。

成本和基础设施: VPS 提供详细的视觉定位,但需要持续投资捕获和更新参考图像,这些图像可能会运行 PB 级数据并需要大规模云存储。GNSS+IMU 利用已嵌入智能手机的现有卫星星座和商品传感器,无需额外基础设施即可自然扩展。

电池和计算: VPS 可以实现精确的地标识别,但必须保持摄像机处于活动状态并处理高分辨率帧,这是一个消耗能源和计算的管道。GNSS+IMU 在设备上融合轻量级传感器读数,以最小的功耗维持实时性能。在功率预算允许的情况下,混合系统可以有选择地将 VPS 用于视觉锚点。

环境稳健性:VPS 在地标丰富的密集城市核心区表现出色,但其性能在弱光、恶劣天气或高速公路或空旷田野等功能不佳的环境中可能会下降。GNSS+IMU在大多数室外环境中继续发挥作用,IMU弥合了隧道或城市峡谷中的GNSS短间隙。它们共同在不同条件下扩展了可靠的覆盖范围。

隐私:VPS 提供视觉背景,但依赖于连续的摄像头馈送,这可能会引起 GDPR 和 CCPA 等法规的担忧。GNSS+IMU 仅依赖惯性和卫星数据,这些数据可以在设备上进行匿名处理。注重隐私的应用程序可能会倾向于 GNSS+IMU 作为默认设置,同时在受控上下文中调用 VPS。

可扩展性:VPS 在地图地理区域提供了强大的结果,但受到全球收集和维护视觉数据的成本的限制。GNSS+IMU 随着越来越多的设备配备标准 GNSS 接收器和惯性传感器而扩展,当设备对共享网络进行校正时,精度会进一步提高。结合起来,VPS 可以在高密度城市走廊中增加价值,在这些走廊中,视觉丰富性抵消了其基础设施需求。

超越准确性:无需摄像头的空间智能

GNSS+IMU融合不仅缩小了定位误差,还提供了上下文感知。通过将位置矢量与设备方向相结合,系统不仅可以确定设备的位置,还可以确定其视野内的内容。该上下文层支持地标感知导航和自然的人工智能交互。可以引导用户“在咖啡店入口旁边的蓝色邮箱见面”,而不是模糊的坐标。在 AR 中,数字内容可以锚定到物理世界,而无需基于视觉的方法的开销。对于人工智能界面,助手可以精确地回答空间查询“餐厅”是在我的右边还是左边?虽然 GNSS+IMU 避免了对摄像头的依赖,但 VPS 仍然可以通过在功能丰富的空间中提供视觉锚点来增加互补价值。这两种方法一起使用,可以创建一个更具弹性和适应性的本地化系统,能够支持比单独使用的任何一种更广泛的现实场景。

更清晰的前进道路

事实证明,VPS 在研究、机器人和 AR 演示中很有价值,特别是在密集的城市环境中。但它对图像、大量计算和连续相机使用的依赖使其难以扩展为亚米级精度的通用解决方案。为了解锁从上下文感知助手到沉浸式 AR 的下一代空间智能应用程序,本地化必须既实用又可大规模扩展。这一基础将来自GNSS+IMU传感器融合,并辅以基于视觉的方法,从而增加价值。GNSS+IMU 建立在数十亿台设备中已有的基础设施和传感器之上,提供高效的设备上性能,并避免了基于摄像头的系统的隐私权衡。随着定位成为空间人工智能的支柱,证据表明了一个决定性的结果:未来将是多模态的,但可扩展的骨干将是GNSS+IMU融合,因为它使设备能够可靠地理解世界并与世界交互,无论有没有摄像头。

分享 :