提出了一种高效且稳健的 RGB-D 语义分割方法,该方法使用 NVIDIA TensorRT 进行高度优化,因此非常适合作为复杂系统中用于移动机器人场景分析的常见初始处理步骤。实验表明,RGB-D 分割优于单独处理 RGB 图像,并且如果网络架构经过精心设计,它仍然可以实时执行。我们在常见的室内数据集 NYUv2 和 SUNRGB-D 上评估了我们提出的高效场景分析网络 (ESANet),并表明我们在实现更快推理的同时达到了最先进的性能。此外,我们对户外数据集 Cityscapes 的评估表明,我们的方法也适用于其他应用领域。最后,我们不仅展示了基准测试结果,还展示了我们室内应用场景之一的定性结果。
评论区