抽象的
在本文中,我们提出了用于解决提供初始对象掩码的视频对象分割问题的可差化掩模匹配网络(DMM-Net)。依赖于掩模R-CNN骨干,我们在每帧中提取掩模提案,并在一次步骤中将对象模板和提案之间的匹配作为CNN预测成本矩阵的线性分配问题。我们通过展开投影梯度下降算法来提出可分辨率的匹配层,其中投影利用Dykstra的算法。我们证明,在温和的条件下,匹配得到保证收敛到最佳。在实践中,它在推理期间与匈牙利算法类似地执行。同时,我们可以通过它来播放以学习成本矩阵。匹配后,利用细化头来提高匹配面罩的质量。我们的DMM-Net在最大的视频对象细分数据集YouTube-Vos上实现了竞争结果。在Davis 2017上,DMM-Net在第一帧上没有在线学习的情况下实现了最佳表现。如果没有任何微调,DMM-Net会媲美SEGTRACK V2数据集的最先进方法。 At last, our matching layer is very simple to implement; we attach the PyTorch code (<50 lines) in the supplementary material. Our code is released at这个https url。
作者
小慧曾,雷杰廖,李贵,玉文熊,Sanja Fidler,拉奎尔乌特萨苏
会议
ICCV 2019.
全文
'DMM-NET:视频实例分段的可差异掩模匹配网络'(PDF)
优步阿格
注释