StereoAdapter:北大首提自监督,适配水下双目深度估计
水下机器人在复杂环境中导航和建模,需解决深度感知难题。研究人员提出StereoAdapter框架,结合单目和双目视觉,利用自监督学习,在无水下真实深度标签下,高效适配视觉基础模型,实现高精度深度估计,显著提升水下机器人导航和目标检测能力。
水下环境中的深度感知对水下机器人自主导航、目标检测和三维重建等任务至关重要。
相比单目方法,双目视觉可以通过双目相机直接获得具有度量尺度的3D深度,避免了单目深度固有的尺度不确定性。
然而,将现有视觉算法直接应用于水下场景会遇到显著挑战。
水下成像因光学特性差异引入严重的域偏移:水对不同波长光的吸收导致颜色和亮度随距离衰减,水体中的悬浮颗粒会产生前向/后向散射,摄像机与水的界面产生复杂折射。
这些因素违背了陆地视觉中常用的光度一致性假设,使得在水下获得可靠的双目匹配变得更加困难。
在此背景下,目前的方法面临两大挑战:
如何参数高效地将庞大的视觉基础模型(如在海量陆地数据上训练的单目深度编码器)适配到水下域,而不依赖大量有标注的水下数据;
如何将全局一致但存在尺度模糊的单目深度先验与局部精确但光度敏感的双目匹配约束紧密融合,在自监督条件下充分发挥双方优势。
此前一些研究尝试从不同角度结合单目和双目信息,例如TiO-Depth提出了「二合一」的单目-双目联合框架,Stereo Anywhere利用视觉基础模型提供的单目先验来增强双目匹配,实现了在低纹理或反光场景下的零样本泛化能力。
但在水下场景,剧烈的域差异依然使这些方法效果受限。
针对上述难题,北京大学等机构的研究人员提出了全新的StereoAdapter框架,以自监督学习为基础,在不需要水下真实深度标签的情况下,将强大的单目深度基础模型与双目几何有机结合。

特别声明:以上内容(如有图片或视频亦包括在内)为“我要久久发用户上传并发布”,本平台仅提供信息存储服务。
热门文章
- 1024程序员节京东开放“零帧起手”数字人技术
- 四川省第三届网信行业技能竞赛互联网营销师赛项决赛在蓉启动
- 智元办机器人挑战赛:清华&上海AILab夺冠,华南理工亚军
- 硅谷AI研发精英,每周需工作100小时
- 徐工/重汽激烈争冠 北奔暴涨43倍!9月新能源自卸车销量超2500辆
- 今日新车播报:朗逸Pro采用家族最新设计语言,新天籁拥抱鸿蒙座舱
- 全新内饰+超强动力链 汕德卡C9H 2.0牵引车实车评测
- 大空间+低至2L油耗,2026款秦L DM-i上市,9.28万起
- 合资智能化“卷王”,为啥是上汽大众?
- 余承东:鸿蒙智行旗舰9系和新款享界S9将于11月上市
- 火山引擎上线豆包视频生成模型1.0profast:5秒720P仅需10秒完成
- 越疆新款机器人“复活”中华龙鸟:全球首个超仿生具身智能体
- 机构:2025年第三季度中国智能投影市场销量为112.4万台
- 谷歌Gemini推出新功能:输入提示即可生成幻灯片
- 推理效率狂飙60倍:DiDi-Instruct让扩散大模型16步超越千步GPT
- 富士康有意在印度为苹果代工更多AirPods 消息称月产能将翻番
- 元旦前发布!小米17Ultra即将登场,背屏没了!
- 人形机器人价格将迎十倍降幅
- 拆完iPhone Air后,我觉得苹果还有牙膏能挤
- 深圳“85后”干出未来独角兽:用绳子驱动机器人,融资数亿