The archives of L-SY group meeting

2026春季学期

2026.4.29

-刘天泽 MM-OVSeg: Multimodal Optical–SAR Fusion for Open-Vocabulary Segmentation in Remote Sensing [paper][slides]

开放词汇分割能够从开放文本类别中实现像素级识别,可超越固定类别实现泛化。尽管在遥感中极具潜力,但该领域的研究仍高度依赖晴空光学数据,在多云、雾霾等恶劣条件下表现极差。本文提出 MM-OVSeg,一种用于恶劣天气下鲁棒开放词汇分割的光学–SAR 多模态融合框架。MM-OVSeg 充分利用两种模态的互补优势:光学图像提供丰富的光谱语义,而合成孔径雷达(SAR)具备穿透云层的结构信息。为解决跨模态域差异与当前视觉–语言模型稠密预测能力不足的问题,我们提出两项关键设计:用于多传感器特征对齐的跨模态统一流程,以及双编码器融合模块,该模块整合多个视觉基础模型的分层特征,实现文本对齐的多模态分割。大量实验表明,MM-OVSeg 在各类云覆盖条件下均具备优异的鲁棒性与泛化能力。

2026.4.22

2026.3.25

2026.3.18

2026.3.11

过去的合集