近年来,视觉基础模型正在快速改变深度估计、分割、生成等视觉任务,但立体匹配的核心迭代架构却几乎没有发生变化。从经典的 RAFT-Stereo,到 IGEV、Selective-Stereo,再到近期的MonSter与FoundationStereo,尽管方法不断引入单目深度先验、视觉基础特征,但它们的视差优化核心,始终仍是ConvGRU。然而,GRU真的是时代最适合的迭代架构吗?来自华中科技大学的研究者提出了PromptStereo:将Prompt思想引入立体匹配,并设计基于DPT的新型迭代单元PRU,为立体匹配提供了一种全新的迭代范式。PromptStereo在多个数据集上刷新了当前零样本泛化性能,并在KITTI Reflective Leaderboard排名第一。
相关论文:PromptStereo: Zero-Shot Stereo Matching via Structure and Motion Prompts
论文地址:https://arxiv.org/abs/2603.01650
项目代码:https://github.com/Windsrain/PromptStereo
引言:为什么立体匹配的泛化一直很难?
尽管近年来 stereo matching 的精度不断提升,但模型的泛化能力始终是核心难题。尤其是在:无纹理区域、反射表面复杂真实场景中,传统方法仍然容易失效。为了解决这一问题,近期大量工作开始引入单目深度先验,这些方法已经证明:单目几何先验确实能够显著提升零样本泛化。但问题在于:它们的迭代优化核心仍然是传统的ConvGRU。
过去几年,几乎所有方法都默认:迭代更新 = ConvGRU。以前方法虽然不断改进,但其核心迭代形式始终没有改变。然而,PromptStereo作者指出:GRU本身并不是为基础模型设计的。传统GRU的更新方式主要依赖:卷积融合、状态压缩、tanh激活,这会导致外部引导信息在反复迭代过程中不断被压缩与扭曲。换句话说:即使模型已经获得了很强的单目几何先验,这些信息在多轮迭代后也可能逐渐退化。

为了解决这一问题,作者提出:PromptStereo。其核心思想是:不再把所有信息都塞进GRU,
而是将结构信息与运动信息显式建模为“Prompt”。整个方法主要包括三部分:结构提示(Structure Prompt)、运动提示(Motion Prompt)、提示循环单元(PRU)。
方法:把“Prompt”引入立体匹配


1. 结构提示:保留单目几何先验
过去的方法通常会把单目深度特征直接与GRU隐藏态混合。但PromptStereo认为:单目几何信息更适合作为“外部引导”,而不是循环状态本身。因此,作者将单目深度先验重新组织为结构提示用于显式指导视差更新。这种设计能够:更好保留几何结构、避免先验信息在迭代中被破坏、提升复杂场景泛化能力。
2. 运动提示:重新理解代价特征
除了结构信息,作者还重新思考了立体匹配中最核心的代价特征。传统方法通常将相关性特征直接输入GRU。而PromptStereo则将其重新组织为运动提示作为独立引导信号参与更新过程。这意味着:迭代模块专注于状态更新、提示信息专注于外部引导,从而实现更加清晰的信息解耦。
3. 提示循环单元:首次用DPT替代GRU
PromptStereo最核心的创新,在于提出了:提示循环单元(PRU),这是立体匹配中首次提出:基于DPT的迭代更新结构。与传统GRU不同,PRU继承了DPT的多尺度结构能力、更适合利用基础模型先验、能够在迭代过程中保留结构信息。PromptStereo 首次证明:立体匹配的迭代更新模块也可以基于DPT构建。这意味着:视觉基础模型不再只是“特征提取器”,而开始真正参与立体匹配的迭代更新过程。
实验结果:零样本泛化性能大幅提升


作者在多个公开数据集上验证了方法性能。在:KITTI、Middlebury、Booster等数据集上,PromptStereo均取得了当前最强或极具竞争力的零样本泛化性能。尤其是在:复杂场景、反射表面、无纹理区域中的优势尤为明显。

论文还展示了大量真实场景可视化结果。可以看到,在玻璃、镜面反射等传统困难场景中,PromptStereo的结果明显更加稳定。

除了零样本能力之外,作者还进一步进行了微调实验。结果显示:PromptStereo 登顶 KITTI 2012 Reflective Leaderboard。这说明:PromptStereo不仅泛化能力强,在监督训练场景下同样具有极强竞争力。
总结:立体匹配正在从“GRU时代”迈向“基础模型迭代时代”
PromptStereo 的意义不仅在于性能提升,更重要的是:它第一次真正重新思考了立体匹配中的迭代更新结构。过去立体匹配的迭代模块几乎等同于GRU,现在基于DPT的新型迭代结构开始出现,基础模型真正参与迭代推理,这也为未来的立体匹配结构设计提供了新的方向。