睿诚科技协会

微软Inside-Out技术如何实现精准空间定位?

Inside-Out 追踪是一种无需外部基站、仅依靠头显自身传感器来追踪用户位置和空间环境的技术。 它的“视角”是从头显内部“看”向外部世界,从而确定自己在世界中的位置。

微软Inside-Out技术如何实现精准空间定位?-图1
(图片来源网络,侵删)

核心工作原理:Inside-Out 是如何实现的?

Inside-Out 追踪的“大脑”是头显内置的一套复杂的传感器系统,主要包括:

  1. 立体摄像头

    • 作用:这是 Inside-Out 追踪的“眼睛”,HoloLens 头显前端配备了两个或更多个广角摄像头,类似于人眼,可以捕捉周围环境的立体图像。
    • 原理:通过两个摄像头从不同角度拍摄同一场景,系统可以计算出环境中物体的深度信息(就像我们用双眼判断距离一样),这使得头显能够构建一个三维的、有深度感的空间模型。
  2. 惯性测量单元

    • 作用:IMU 负责追踪头显自身的朝向和运动,它由三个关键部分组成:
      • 陀螺仪:测量头显在三个轴向上的旋转速度(点头、摇头、歪头)。
      • 加速度计:测量头显在三个轴向上的线性加速度(前后、左右、上下移动)。
      • 磁力计:测量地磁场方向,用于确定头显的绝对朝向(类似指南针)。
    • 原理:IMU 提供了非常高频(每秒数百次)的自身运动数据,即使在摄像头暂时无法识别环境(例如快速移动或被遮挡)时,也能让系统大致知道头显的朝向和位置。
  3. 深度传感器

    微软Inside-Out技术如何实现精准空间定位?-图2
    (图片来源网络,侵删)
    • 在 HoloLens 1 中,它使用一个名为“飞行时间”(Time-of-Flight, ToF)的传感器,主动发射红外光并测量其反射回来的时间,从而精确生成周围环境的深度图。
    • 在 HoloLens 2 中,微软放弃了 ToF 传感器,转而完全依赖AI 算法从立体摄像头捕捉的图像中实时计算出深度图,这种方式在复杂光照条件下表现更好,也更节能。

追踪流程(简化版):

  1. 环境扫描:当你戴上 HoloLens 并开机时,系统会通过立体摄像头扫描你周围的环境,寻找特征点,比如墙壁的角、桌子的边缘、窗户框等。
  2. 特征点匹配:系统会创建一个“世界地图”,存储这些特征点的信息,随着你移动,摄像头会不断捕捉新的图像,并与这个“世界地图”进行比对,寻找匹配的特征点。
  3. 位置计算:通过匹配到的特征点在图像中的位置变化,结合 IMU 提供的朝向和加速度数据,系统可以精确计算出头显在三维空间中的位置朝向,这个过程被称为视觉惯性里程计
  4. 空间锚定:一旦系统知道了头显的位置,它就能计算出虚拟物体应该放置在现实世界的哪个具体位置,并“锚定”在那里,即使你走开再回来,虚拟物体依然会在原来的位置。

Inside-Out 技术的优势

与需要外部基站(如 HTC Vive 的 Lighthouse 或 Oculus Rift 的 Constellation)的 Outside-In 追踪相比,Inside-Out 技术有显著优势:

  1. 无外部设备,即插即用

    • 最大优势,用户无需在房间里安装和校准任何外部追踪基站,设备开箱即可使用,这极大地降低了设置门槛,使得混合现实应用更容易进入家庭、办公室等日常环境。
  2. 高度便携和灵活

    由于不依赖固定的基站,用户可以在任何地方使用 HoloLens,无论是会议室、工厂车间还是户外,你不需要为每一次使用都重新布置一个固定的追踪空间。

    微软Inside-Out技术如何实现精准空间定位?-图3
    (图片来源网络,侵删)
  3. 更大的追踪范围

    理论上,只要有足够的环境特征可供识别,追踪范围可以非常大,而 Outside-In 系统的追踪范围通常被基站的覆盖范围所限制。

  4. 天然的移动性

    这项技术为“移动计算”而生,用户可以戴着设备自由地在空间中走动,而不会受到线缆或固定基站的束缚。


Inside-Out 技术的挑战与局限性

  1. 对环境依赖性强

    • 特征不足的环境:在特征稀少的环境中,如纯白墙壁的房间、空旷的室外或完全重复纹理的走廊,系统会难以找到匹配点,导致追踪丢失或精度下降。
    • 光照变化:极端的光照条件(如过暗或过亮,或摄像头被强光直射)会影响摄像头图像的质量,从而影响追踪精度。
  2. 初始设置和校准

    虽然不需要外部基站,但系统首次使用时仍需要一个短暂的“空间映射”过程,来学习你的环境,这个过程通常很快,但环境越复杂,所需时间越长。

  3. 动态物体干扰

    如果环境中有很多移动物体(如走来走去的人、移动的椅子),系统可能会将这些动态物体误认为是环境特征的一部分,导致虚拟物体的位置发生偏移或抖动。

  4. 遮挡问题

    • 如果你的头部快速转动,或者摄像头被手、头发等物体短暂遮挡,系统会暂时失去视野,它会依赖 IMU 进行惯性预测来填补这个空白,但长时间遮挡后可能会导致追踪漂移。

Inside-Out 技术的应用领域

HoloLens 及其 Inside-Out 技术主要瞄准的是企业级和工业级应用,而不是消费级游戏:

  1. 工业制造与维修

    • 远程专家指导:一线工人通过 HoloLens 将第一视角画面传送给后方的专家,专家可以在工人视野中叠加虚拟标记、说明和指示,进行远程指导。
    • 数字孪生与可视化:在工厂的数字孪生模型中,工人可以直观地看到设备布局、管线走向,并进行虚拟规划。
    • 复杂装配:将装配步骤以 3D 动画的形式叠加在真实零件上,指导工人进行高精度装配。
  2. 医疗健康

    • 手术规划与导航:将患者的 CT 或 MRI 扫描数据 3D 模型叠加在身体上,帮助医生进行手术规划。
    • 医学教育:学生可以在虚拟空间中解剖 3D 器官模型,比传统模型更直观。
  3. 教育培训

    • 情景化学习:在真实设备上叠加操作说明和维修手册,让学生在实践中学习。
    • 虚拟实验室:创建安全的虚拟化学或物理实验室,学生可以在其中进行实验而无需担心危险。
  4. 建筑设计

    • 沉浸式审阅:建筑师和客户可以按 1:1 比例“走进”尚未建成的建筑模型中,从内部感受空间布局、光照和材料效果。

与其他追踪技术的对比

特性 Inside-Out (HoloLens) Outside-In (Vive/Oculus)
追踪方式 头显自身传感器(摄像头+IMU) 外部基站/摄像头
设置复杂度 ,即插即用 ,需要安装和校准基站
便携性 ,可随处使用 ,固定空间使用
追踪范围 大,受环境特征限制 有限,受基站覆盖范围限制
最佳应用 企业级、工业级、移动场景 消费级、固定场景的 VR 游戏
核心优势 无需外部设备,移动性强 精度高,延迟低,适合高速运动

微软的 Inside-Out 追踪技术是一项革命性的空间计算技术,它通过将追踪系统集成在头显内部,解放了用户对物理空间的束缚,使得混合现实能够真正走出实验室,走向广阔的商业和工业应用场景,尽管它存在一些对环境的依赖性,但其“无基站、高便携”的核心优势,使其在特定领域(如工业、医疗、教育)的价值远超传统的 VR 追踪方案,成为了微软 HoloLens 区别于其他 VR/AR 设备的核心竞争力。

分享:
扫描分享到社交APP
上一篇
下一篇