医学图像分割模型产品系统

我要开发同款
min2026年06月05日
5阅读

技术信息

语言技术
Torch
系统类型
算法模型
行业分类
人工智能
参考价格
10000
演示地址
https://github.com/min121101/TP_UNet

作品详情

行业场景

TP-UNet 的应用场景是医学图像分割,特别是那些具有明确扫描顺序(层间顺序)的 3D 医学影像,例如:
腹部 MRI/CT 扫描:对胃、小肠、大肠等消化道器官进行分割。
肝脏 CT 扫描:对肝脏区域进行分割(如 LiTS 2017 数据集)。
其核心创新是利用扫描图像中的时序信息(即器官在扫描序列中出现的先后位置,如胃早出现、大肠晚出现),将这些信息编码为文本提示(temporal prompts),通过跨模态对比学习与图像特征融合,从而引导 UNet 更准确地分割不同器官。
因此,典型的使用场景包括:
临床辅助诊断:自动勾画 MRI/CT 中的消化道或肝脏边界,减轻医生手动标注负担。
手术规划:根据分割结果定位病灶和周边器官。
治疗监测:纵向对比不同时间点的扫描图像中器官形态变化。
需要注意的是,该模型目前针对2D 切片级分割,但利用了切片间的顺序信息(归一化后的切片位置)。它更适合扫描方向相对固定、器官出现概率呈现近似正态分布的影像数据。

功能介绍

1. 项目具体功能模块
时序提示生成模块:自动根据医学影像的扫描层位置(归一化切片索引)生成文本形式的时序提示,例如“This is a CT slice at position 0.78”。
多模态编码模块:分别采用 CLIP 或 Electra 文本编码器对时序提示进行高维嵌入,同时使用 UNet 编码器提取图像特征。
语义对齐模块:基于无监督对比学习,缩小文本提示与图像特征之间的语义差距,确保跨模态信息可兼容。
跨模态融合模块:通过交叉注意力机制将对齐后的文本特征与图像特征进行融合,生成富含时序信息的联合特征图。
解码分割模块:将融合特征输入 UNet 解码器,结合跳连特征图,最终输出像素级的分割掩膜(如胃、小肠、大肠、肝脏等)。

2. 项目主要功能描述
TP-UNet 的核心功能是利用医学影像中的扫描顺序信息(时序信息)来提升器官分割的准确度。在 CT 或 MRI 等层扫影像中,不同器官(如胃、小肠、大肠)在切片序列中出现的位置遵循特定分布(胃偏早、大肠偏晚)。TP-UNet 自动提取每张切片的归一化位置作为时序提示,通过文本编码器将其转化为高维语义向量,再与图像特征进行对比对齐和交叉注意力融合,从而使 UNet 模型能够“知道”当前切片处于扫描序列的哪个阶段,并据此优先分割该阶段最可能出现的器官。实验表明,该方法在 UW-Madison 消化道数据集和 LiTS 肝脏数据集上均达到新的最优性能,尤其对小样本或边界模糊的器官分割改善明显。该功能可直接应用于临床辅助诊断、放疗靶区勾画和手术导航等场景。

项目实现

1. “我”负责哪些具体任务?
模型整体设计与搭建:负责 VDGen 的端到端架构设计,包括 Vision Self‑Equilibration (VSE) 和 Disease Information Distillation (DID) 两个核心模块的算法设计与实现。
对比学习与蒸馏模块开发:实现 VSE 中的实例级对比损失函数,使相似病理图像在特征空间中聚拢;实现 DID 中的双向跨模态蒸馏,以报告文本为教师信号优化视觉特征。
LLM 解码器集成与微调:集成 Llama2‑7B 大语言模型作为报告生成器,并采用 LoRA 进行参数高效微调,设计文本提示模板。
实验与评测:在 MIMIC‑CXR 和 IU‑Xray 数据集上执行训练、验证与测试,实现 BLEU、METEOR、Rouge‑L、CIDEr 等自动评测指标,并完成临床有效性分析(Precision/Recall/F1、RadGraph 等)。
消融与泛化实验:设计并运行 VSE、DID、LoRA 的消融实验,以及不同 LLM 解码器(Mistral、Llama3)的对比实验,分析各模块贡献。

2. 项目使用了哪些技术栈、架构,实现上亮点、难点
技术栈:PyTorch、HuggingFace Transformers、LoRA、Swin Transformer、Llama2‑7B、NVIDIA H100 GPU。
架构:双分支结构——视觉分支使用 Swin Transformer 提取多尺度特征;文本分支使用预训练 LLM 编码报告;VSE 在视觉特征上施加对比学习;DID 实现视觉‑文本双向相似度优化;最终融合特征输入 LoRA 微调的 LLM 生成报告。

实现亮点:
VSE 在不依赖任何手工标签的情况下,通过纯视觉自监督对比学习缓解长尾病灶的特征退化问题。
DID 创新地使用报告文本作为“教

示例图片

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论