2026年06月12日:Perspective+ Unet Enhancing Segmentation with Bi-Path Fusion and Efficient Non-Local Attention for Superior Receptive Fields
- 主页 /
- 通知公告 /
- 通知公告
2026年06月12日:Perspective+ Unet Enhancing Segmentation with Bi-Path Fusion and Efficient Non-Local Attention for Superior Receptive Fields
【报告内容】
汇报人: 陈弘毅
汇报单位:福建理工大学
主题:Perspective+ Unet: Enhancing Segmentation with Bi-Path Fusion and Efficient Non-Local Attention for Superior Receptive Fields
1、Introduction
2、Method
3、Experiments
4、Conclusion
【报告总结】
1.待解决的问题描述
医学图像分割任务需要模型同时具备局部细节识别能力和全局结构建模能力。传统 CNN 方法虽然能够有效提取局部纹理与边界特征,但由于卷积感受野有限,难以充分捕获远距离空间依赖关系;而 Transformer 或非局部注意力机制虽然能够增强全局上下文建模能力,但通常伴随较高的计算复杂度和显存开销。此外,医学图像中不同器官或组织结构存在尺度差异和边界模糊等问题,如何在保持局部细节的同时增强全局感知,是该研究主要希望解决的问题。
2.相关创新方案
本文提出了 Perspective+ Unet,用于提升医学图像分割中的空间感知能力。首先,作者设计了 Bi-Path Residual Block,通过普通卷积和空洞卷积双路径结构同时提取局部细节信息和大感受野上下文信息,从而增强编码器的特征表达能力。其次,文章引入 Efficient Non-Local Transformer Block,其中的 ENLSA 通过核函数映射将传统非局部注意力中的指数核计算转化为更高效的线性形式,降低了全局建模的计算开销。最后,作者提出 Spatial Cross-Scale Integrator,将不同阶段的特征进行跨尺度融合,使模型能够综合利用低层细节信息和高层语义信息,从而提高分割精度和边界质量。
3.实验总结
本文在 Synapse 多器官 CT 数据集和 ACDC 心脏 MRI 数据集上进行了实验验证。在 Synapse 数据集上,Perspective+ Unet 取得了 84.63% 的平均 DSC 和 11.74 的 HD,整体表现优于 U-Net、TransUNet、SwinUNet、MISSFormer 和 MSAANet 等对比方法。在 ACDC 数据集上,该方法取得了 92.54% 的平均 DSC,其中 RV、MYO 和 LV 三个结构的分割结果均表现较好。消融实验表明,BPRB、SCSI 和 ENLTB 三个模块对模型性能具有互补作用,完整模型取得了最佳结果。效率对比实验也说明,ENLSA 相比普通非局部注意力机制具有更低的 FLOPs 和参数量,能够在保证全局建模能力的同时降低计算成本。
4.未来工作
虽然 Perspective+ Unet 在两个医学图像分割数据集上取得了较好的结果,但仍有进一步改进空间。未来可以在更多类型的医学图像任务中验证该方法的泛化能力,例如脑部 MRI、肺部 CT 或病灶分割任务。同时,可以进一步优化 ENLSA 的核函数映射方式,提高全局注意力近似的稳定性和表达能力。此外,当前模型仍以分割精度提升为主要目标,未来可进一步关注模型轻量化、推理速度和临床部署可行性,使其更适合实际医学辅助诊断场景。
报告时间:2026年06月12日19:30
腾讯会议:311-5999-8176
点我下载本讨论课相关文献或PPT吧~(提取码:iipr)