这是我们2022年的工作,关于雾中的单目自监督深度估计研究:
(资料图)
0.CodeSelf-supervised monocular depth estimation in fog
Bo Tao†, Jiaxin Hu†, Du Jiang, Gongfa Li, Baojia Chen, Xinbo Qian
†These authors contributed equally to this work.
Optical Engineering 2022
我们提供了基于Pytorch的开源代码实现,你可以在此处访问。
1.导读近年来,自监督深度估计方法由于不需要深度标签受到广泛关注,在天气良好的图像测试中取得了显著的效果。然而,在更具挑战的雾天场景中,由于雾的存在导致低对比度与有限可见性,它们的性能受到限制。为了解决这一问题,我们提出一种适用于雾天图像自监督深度估计的端到端的特征分离网络,我们以配对的清晰图和合成雾图为输入,通过正交性损失学习的特征提取器分离干扰信息(光照、雾等)和不变信息(结构、纹理等),并利用不变信息进行深度估计。同时,引入相似性损失,以清晰图像的深度作为伪标签来约束雾天图像深度,并加入基于注意力机制的模块和重建损失细化了输出深度,获得了更好的深度图。然后,我们使用真实世界雾图进行微调,有效地减少了合成与真实数据的域间距。实验表明,我们的方法在合成数据集及Cityscape数据集上产生了先进的结果,证明了我们所提出方法的优越性。
下图(b)展示了雾天图像在Monodepth2上的结果,我们可以看到,由于雾的存在导致低对比度与有限可见性,无法估计深度细节。
2.中心思想我们受这篇paper启发:场景的深度是使用图像中物体的垂直位置来估计获得,而场景中的光照、模糊等起的作用较少。因此,我们提出特征分离框架,将雾天与清晰图像对的信息分为两个互补的集合,集合1包含雾天与清晰图像光照、雾等变化信息,这影响深度估计性能。集合2包含场景结构、纹理等不变信息,利用这些信息来估计深度。由于不配对的雾天与清晰图像包含的信息不一样,会影响自监督深度估计网络,因此参照这篇paper所提出的合成雾方法,将大量不同场景赋予不同浓度的雾建立一个雾天图像数据集,并与清晰图像配对作为网络的输入进行训练,同时考虑到合成与真实的雾天图像之间固有的域偏移,我们接着使用了真实世界的雾图微调我们的网络。具体来说,首先输入配对的连续3帧雾图和清晰图,使用两个特征提取器来提取图像中干扰信息(光照、雾等)和不变信息(结构、纹理等),加入正交损失保证两者尽可能不同,然后对不变信息加入光度损失来估计深度,同时用清晰图估计出的深度图作为伪标签,利用相似性损失实现无监督训练。值得注意的是,我们的网络是直接从合成以及真实的雾图中估计深度信息,是一个端到端的网络。
3.网络结构这是我们的网络结构图,以配对的清晰图像和雾天图像为输入,通过我们设计的特征分离网络结构来消除干扰项的影响
为了增强场景结构感知能力以及突出关键的局部细节信息,我们设计了两个基于注意力机制的模块:通道注意模块、位置注意模块。
4.损失函数我们的总损失函数由光度损失、边缘感知平滑损失、正交损失、相似性损失和重建损失组成,即:其中β1、β2、β3、β4、β5是权重参数,各个损失函数展开为:
5.训练细节我们深度估计网络基于U-Net体系结构,即带跳跃连接的编码器-解码器。首先,使用清晰图像和对应的雾图视为图像对,作为网络的输入来训练模型;之后使用真实世界雾图和用PSD生成的清晰图来微调模型。模型在Pytorch中实现,使用Adam优化器在RTX1080Ti GPU上训练20个epoch,batchsize设为,学习率初始设为le-4,5个epoch后设为1e-5。采用7个指标度量进行测试,包括Abs-Rel、Sq-Rel、RMSE、RMSE-log、&1、&2和&3。
6.实验6.1定量实验这是我们的方法与几个方法之间的定量比较结果。首先在5个能见度(VIZ)合成数据集上评估各个模型的性能,这里,使用的是同一个场景,保证了唯一变量,之后对真实世界中的雾图进行了测试。在上表中,Monodepth2表示使用合成数据集训练和用真实数据集微调的结果,PSD+Monodepth2表示首先去雾,然后估计去雾图像的场景深度,据我们所知,monodepth2是一种对清晰图像很有效的自监督深度估计方法,然而对用雾天图像训练的模型来说,其性能却受限于雾天图像。由于雾天图像整体对比度较低、光照不均匀等等,导致在雾天条件下直接对图像进行深度估计时都会造成不同程度的信息丢失,取得的效果并不好。同时, PSD+Monodepth2可以在一定程度上改善雾天条件下图像的深度估计结果,但由于当前普遍去雾模型都会对去雾后的图像造成不同程度的损伤,又在另一层面影响了图像深度估计结果,其性能也受到限制。如上表所示,本文提出的特征分离框架可以缓解雾模糊带来的影响,在5个能见度和真实的雾图像中,所有的性能指标都可以通过我们的方法得到很大的改善,这证明了我们的方法的优越性。
上表是我们对各个模型测试一张图片所需时间和模型大小进行统计,可见将去雾模型嵌入到深度估计模型前大大增加了模型复杂度,相比之下,我们的模型更加满足实时性。
6.2定性实验雾天图像的定性比较结果如上图所示,其中(a)显示了能见度分别为500m、200m、50m的合成数据集图像以及真实世界雾天图像,(b)为Monodepth2测试的结果,(c)为先用PSD对图像去雾,之后再用Monodepth2测试结果。总的来说,在对清晰图像深度估计取得SOTA的Monodepth2无法生成平滑的深度图,并遗漏了大量的信息。与(b)相比,显然(c)取得了更好的视觉效果,这证明去雾操作对雾天图像深度估计是积极的,但去雾操作会不同程度的损伤图像,使其在深度估计时产生一些奇怪的输出,如(c)中红色框框所示,这在另一层面上影响了深度估计效果。相比之下,我们的方法可以恢复更多的物体轮廓深度细节,获得了更多的视觉效果,更重要的是,在(d)中,我们的模型仍然能够对非常模糊的场景做出合理的预测,这些非常模糊的场景甚至对人眼都是挑战,这证明模型能很好的适应雾天环境。
验证实验为了验证我们的网络的可解释性,我们分别使清晰图像、能见度为200m、50m通过模型,对5个信息量较大的卷积特征图可视化,如上图所示,第一列为对应的输入图像,其余列为特征图。第二、四、六行中的特征图包含明显的结构信息和纹理信息,第一、三、五中的特征图包含的信息是非规则的、平滑的、结构较少的信息,类似于图像的光照、雾等信息,这证明了我们的方法可以有效地分离雾天图像的光照、雾等干扰信息和结构、纹理等不变信息。
消融实验我们进行消融实验,以证明网络各个组件的有效性,结果上表所示。在500m能见度和真实数据集上,正交性损失对提升模型性能表现最好,在两个数据集上分别提升了85.7%和29.5%的Sq Rel,这表明,用于保证干扰特征和不变特征分离的正交性损失可以极大地提升雾天条件下图像的深度估计性能。用于保证干扰和不变特征互补的重建损失、以清晰图像深度作为伪标签来约束雾天图像的相似性损失均进一步改善了雾天图像的深度估计结果。此外,基于注意力机制的通道注意力模块和位置注意力模块获得了更好的场景理解和丰富的特征表示,从而实现了更精确的深度预测。
总结我们提出的端到端的特征分离框架,可以很好的解决雾天图像的深度估计问题,在一些数据集上的测试表明,我们的方法明显由优于其他方法,产生了先进的结果。但在可见度低的场景中,仍然有提高的空间,这将是我们未来的工作。
关键词:
推荐内容
- 个人论文一:关于雾中单目自监督深度估计
- 荒野乱斗值得培养的英雄有哪些
- 马斯克:中国一旦下定决心要做一件事,就
- 台湾省造老银元价格(2023年07月07日)
- 阿斯利康在华三十年:跳出旧逻辑 探索新
- 美国后院起火,南美国家要用人民币还债,
- 杯具熊和熊本士一样吗 杯具熊和熊本熊哪
- 感觉中暑了 “挺一挺”可能会要命
- 公告速递:广发中债农发债总指数基金暂停
- “宝马司机醉驾拖行案”受害者母亲:女儿
- 奔腾M9,带你轻松Get√!
- 7月7日新股提示:精智达申购 海科新源等
- 工地常用木方(工地用的木方规格有哪些)
- 中国工程院院士盖钧镒:国产大豆应向科技
- 卫宁健康董事长遭调查吓跌28%!哪家公募
- 玛雅人十大预言 2012年天突然黑了一下
- 携手为长三角更高质量一体化发展作出更大
- 中信建投首席经济学家黄文涛:中国经济筑
- 莱茵体育:拟资产置换文旅股份部分股份
- 机械密封怎么选购_机械密封怎么选购材质
- 上海网络新消费品牌数量占全国1/5 前50
- 乐普医疗:公司目前已形成基于人工智能技
- 海南半年侦破农村地区赌博、开设赌场刑事
- AI大模型落地产品迭出
- 大北农:1-6月生猪销售收入累计44.13亿元
- 全球今日报丨618 活动期间手机市场份额
- 2023年曲江新区第三届文化艺术行业技能大
- 【世界新视野】《乌鲁木齐市2023年乡村康
- 涛涛车业:7月5日融资净买入129.73万元,
- 飞龙股份预计上半年归母净利同比增长440%
- oppo性价比高的手机推荐(一千五左右性价
- 融资担保机构服务小微企业水平居西部前列
- 筑牢“防汛堤” 安然度汛期_全球观速讯
- 宗申动力(001696.SZ):可提供1kW~18kW的
- 全球球精选!@凯里市民,家门口的蜂糖李
- 古惠南:广汽埃安不惧价格战,昊铂GT在细
- 当前视讯!海王生物07月05日获深股通增持
- 授薪合伙人年收入(授薪合伙人什么意思)
- 黄金收盘:美联储纪要暗示加息降至 黄金
- 全球简讯:让孩子们铭记一生
- 匈牙利:俄罗斯将助扩建保克什核电站
- 今日观点!石首:涉路施工许可在线办,助
- 银轮股份(002126.SZ):拟设立西安全资子
- 【焦点热闻】机构:国内铜供需总体保持良
- 天天短讯!江苏南通500千伏三官殿变电站3
- 世界视点!7月5日蓝星哈尔滨丙酮价格稳定
- 环球聚焦:【金色热线】云南首次!创业扶
- 驰宏锌锗触及涨停_环球热文
- 合景泰富:6月合约预售金额17.3亿元
- 每日资讯:打击整治网络谣言 公安部共侦
- 万州暴雨致一段铁路桥梁部分垮塌,铁路部
- 全球观点:2023年深圳数据交易所招聘高层
- 全球微资讯!阿斯巴甜可能致癌?对甜味剂
- 做强基层 看病不需出远门_世界观速讯
- 天天快报!闹闹女巫 0705十二星座今日运势
- 2024国家公务员考试巧用“这”字解答行测
- 平度法院:能动司法护青苗 学校致谢送锦旗
- win7网页看不了视频怎么回事 电脑网页看
- 世界速看:董事长被留置 医疗信息化龙头
- 7月4日基金净值:广发中证传媒ETF联接A最
- 上海网络新消费品牌数量占全国1/5 前50
- 乐普医疗:公司目前已形成基于人工智能技
- 海南半年侦破农村地区赌博、开设赌场刑事
- AI大模型落地产品迭出
- 大北农:1-6月生猪销售收入累计44.13亿元
- 全球今日报丨618 活动期间手机市场份额
- 2023年曲江新区第三届文化艺术行业技能大
- 【世界新视野】《乌鲁木齐市2023年乡村康
- 涛涛车业:7月5日融资净买入129.73万元,
- 飞龙股份预计上半年归母净利同比增长440%
- oppo性价比高的手机推荐(一千五左右性价
- 融资担保机构服务小微企业水平居西部前列
- 筑牢“防汛堤” 安然度汛期_全球观速讯
- 宗申动力(001696.SZ):可提供1kW~18kW的
- 全球球精选!@凯里市民,家门口的蜂糖李
- 古惠南:广汽埃安不惧价格战,昊铂GT在细
- 当前视讯!海王生物07月05日获深股通增持
- 授薪合伙人年收入(授薪合伙人什么意思)
- 黄金收盘:美联储纪要暗示加息降至 黄金
- 全球简讯:让孩子们铭记一生
- 匈牙利:俄罗斯将助扩建保克什核电站
- 今日观点!石首:涉路施工许可在线办,助
- 银轮股份(002126.SZ):拟设立西安全资子
- 【焦点热闻】机构:国内铜供需总体保持良
- 天天短讯!江苏南通500千伏三官殿变电站3
- 世界视点!7月5日蓝星哈尔滨丙酮价格稳定
- 环球聚焦:【金色热线】云南首次!创业扶
- 驰宏锌锗触及涨停_环球热文
- 合景泰富:6月合约预售金额17.3亿元
- 每日资讯:打击整治网络谣言 公安部共侦
- 万州暴雨致一段铁路桥梁部分垮塌,铁路部
- 全球观点:2023年深圳数据交易所招聘高层
- 全球微资讯!阿斯巴甜可能致癌?对甜味剂
- 做强基层 看病不需出远门_世界观速讯
- 天天快报!闹闹女巫 0705十二星座今日运势
- 2024国家公务员考试巧用“这”字解答行测
- 平度法院:能动司法护青苗 学校致谢送锦旗
- win7网页看不了视频怎么回事 电脑网页看
- 世界速看:董事长被留置 医疗信息化龙头
- 7月4日基金净值:广发中证传媒ETF联接A最
- 500的一倍和两倍_一倍和两倍
- 原创组图 | 海口江东新区快速通道主线
- 独家记忆番外婚后怀孕 独家记忆番外上线
- 世界短讯!甘肃省崇信县锦屏镇文家咀:杏
- 保证是债权吗?_天天快消息
- 国足历任教练照片(国足历任教练)_天天
- 世界聚焦:河北公办大专录取分数线2023
- 暴雨持续!四川有序应对 提前避险转移85
- 以精细举措 打造优实营商|当前速看
- 世界看热讯:兰州轨道交通2号线开通首日
- 松发股份财务总监之女就短线交易致歉 获
- 环球最新:ST宇顺7月4日快速上涨
- 关之琳故作优雅,别人穿短袖短裙她却穿两
- 076期鹰长空双色球预测奖号:区间奇偶012
- 每日热议!韩国外长引用鲁迅名言谈中日韩
- 全球今日讯!ps破解版(ps破解)
- 驻津央企携手地方筑牢“安全堤”|天天亮点
- 【环球速看料】本土品牌西式快餐赛道崛起
- 广州市智能家电问卷调查显示:超一半受访
- 印度炼油厂开始以人民币支付俄罗斯石油款